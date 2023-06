Tout sauvegarder dans le cloud ? Pour les très gros volumes de données, c’est compliqué. « Dans le passé, on nous a souvent dit que le cloud allait absorber toute notre activité », déclare Bruce Gilpin de Versity. « Mais il s’avère que ce n’est pas le cas. »

Versity est une entreprise américaine qui développe un logiciel pour le stockage à long terme, soit l’archivage, de gros volumes de données. Data News a récemment rencontré son PDG, Bruce Gilpin, dans le cadre de l’IT Press Tour au Dell Solution Centre à Santa Clara. « Les données doivent bien être stockées quelque part », a déclaré Gilpin. « Dell est en mesure de fournir le hardware. » Un autre avantage est bien sûr la possibilité pour Versity de profiter du réseau international de partenaires de Dell. Mais les clients de Versity utilisent également les bibliothèques de bandes de Spectra Logic ou stockent leurs données dans le cloud public.

Cependant, cette dernière solution s’avère souvent compliquée. Les entreprises sont en effet confrontées à des volumes toujours plus importants de données non structurées. L’utilisation de l’IoT, des médias, des applications vidéo et de l’IA enregistre une croissance exponentielle. Sauvegarder et archiver toutes ces données devient alors une mission complexe et coûteuse. En outre, l’extraction des données ainsi archivées prend souvent beaucoup de temps et les coûts sous-jacents explosent. « Archiver de gros volumes de données dans le cloud est cinq à dix fois plus coûteux », explique Gilpin.

Projets de plus d’un exaoctet

Versity a développé un logiciel qui permet d’archiver les données dans des object stores et des tape librairies, capables de traiter d’énormes volumes. Au total, il s’agit de quelque deux exaoctets de données pour Versity, répartis sur un peu moins d’une centaine de clients. Pour mémoire, un exaoctet correspond à mille pétaoctets, un million de téraoctets ou un milliard de gigaoctets. « Nous offrons une solution aux entreprises qui souhaitent conserver leurs données sur le long terme, mais dont les volumes de données sont bien trop importants pour une sauvegarde classique », explique Bruce Gilpin.

Versity constate que le nombre de clients disposant de gros volumes de données, c’est-à-dire de dix pétaoctets et plus, augmente rapidement. « Et, à un tel niveau, l’augmentation ne fait que s’accélérer. » Cette situation est-elle viable à long terme ? « C’est indéniablement compliqué », indique Gilpin. « Jusqu’à récemment, il était impensable qu’une entreprise frappe à notre porte pour un projet d’archivage de plus d’un exaoctet. Mais nous préparons actuellement deux devis pour de tels projets, chacun avec un stockage sur bande. » Le premier projet concerne le secteur de la recherche, le second est un projet gouvernemental avec un volume total de 7,5 exaoctets.

Passerelle vers S3

Versity n’exclut toutefois pas définitivement le cloud. Avec Versity Gateway, la société a lancé au début du mois une solution open source qui permet d’envoyer et de récupérer des données dans un magasin de données Amazon S3. Versity entend donc exploiter le filon qu’avait abandonné MinIO. Il y a deux ans, l’entreprise américaine MinIO a fait passer son logiciel de stockage objet sous la licence GNU Affero General Public License (AGPL), alors qu’il était à l’origine disponible sous la licence open source Apache v2.

Une décision qui a miné sa passerelle S3, affirme Gilpin. « Il fallait une alternative, mais elle n’est pas arrivée. C’est pourquoi nous avons développé le Versitu Gateway. Nous avons délibérément choisi l’open source et nous maintenons notre solution sous Apache v2. » Mais que se passerait-il si Versity, comme MinIO, finissait par changer d’avis ? « Cela n’arrivera pas », affirme résolument Gilpin.

Pas de pilule empoisonnée

« AGPL est une pilule empoisonnée : une poison pill license. C’est ce qui explique pourquoi tant d’entreprises se sont retirées lorsque MinIO est passée à l’AGPL Si une entreprise utilise un logiciel couvert par la licence AGPL dans son produit, elle doit également partager le code source de la solution globale sous la licence AGPL. Ce n’est pas le cas sous Apache v2. « Cette règle peut être contournée en achetant une licence AGPL auprès du fournisseur d’origine du code. » Et souvent, c’est justement ce que les entreprises veulent éviter. C’est une approche qui se heurte trop fortement aux limites de ce que l’open source devrait ou ne devrait pas être.

La passerelle Versity intègre bien entendu aussi ScoutAM, la solution commerciale de Versity pour la gestion de données en cas de stockage massif. Cette combinaison permet donc de stocker, gérer et récupérer de gros volumes de données dans différents systèmes de stockage.