Tout ce que l’homme entreprendra à l’avenir reposera sur des données. C’est ce qu’affirme Arcitecta, une entreprise qui, sans surprise, propose une solution pour gérer ces données à très grande échelle.
Data News a rencontré Arcitecta pour la première fois il y a deux ans lors d’une visite au siège social de Spectra Logic dans le Colorado, une entreprise connue pour ses solutions de stockage avec de grandes bibliothèques de bandes. Récemment, le directeur du marketing produit, Eric Polet, s’est rendu à New York pour faire le point sur Arcitecta, dans le cadre de l’IT Press Tour. Quel est l’objectif d’Arcitecta? Aider les entreprises à tirer le meilleur parti de leurs données. À cet effet, l’entreprise mise notamment sur des coûts réduits, des résultats plus rapides et une meilleure recherche, accessibilité et réutilisabilité des données.
‘Nous sommes essentiellement une société de base de données’, indique Eric Polet. ‘Nous développons notre propre technologie de base de données et notre propre logiciel de gestion des données. Mais cela fait surtout de nous une entreprise de données. Il ne s’agit pas seulement d’héberger des données, mais aussi de ce que l’on peut faire avec ces données.’ Pour ce faire, Arcitecta utilise Mediaflux, une solution qui, pour le décrire en termes simples, virtualise le stockage des données. ‘Et c’est ainsi que nous virtualisons également l’IA’, explique-t-il, ‘car l’IA ne peut exister sans données.’ Parmi les clients d’Arcitecta figurent notamment l’université de Princeton, le MIT et les archives nationales du film et du son d’Australie: toutes ces organisations gèrent d’énormes volumes de données.
La croissance des données se poursuit
Au cours de l’année écoulée, Arcitecta a trouvé un moyen d’au moins doubler la densité des données dans sa base de données. Mais la gestion des données à grande échelle reste un problème complexe. ‘On ne déplace pas des centaines de pétaoctets de données à la légère’, poursuit Eric. ‘Les entreprises sous-estiment souvent cet aspect.’ Dans le même temps, Arcitecta fait valoir qu’il prend en charge un billion de fichiers – mille milliards – dans un seul espace de noms. Aux dires de l’entreprise, elle répond ainsi aux exigences du marché. ‘La croissance exponentielle des données n’est certainement pas terminée.’
‘La croissance exponentielle des données n’est pas encore terminée.’
L’augmentation constante des volumes de données nous confrontera inévitablement à un défi supplémentaire à l’avenir. ‘Il ne s’agit pas seulement de la complexité de la gestion de ces volumes considérables, mais aussi de rendre cette gestion physiquement possible. À l’avenir, la puissance de calcul nécessaire fonctionnera sur les sites où l’énergie et l’eau sont disponibles. Nous devrons donc amener les données vers la puissance de calcul, à l’inverse de ce qu’il se passe aujourd’hui.’
Vers une gestion consciente des données
Même dans le contexte actuel, où la percée de l’IA générative et l’émergence des agents IA ne font que souligner l’importance des données, Arcitecta constate qu’il reste encore beaucoup à faire dans le domaine de la gestion des données. ‘Si vous demandez à une entreprise combien de données elle possède, très souvent, vous n’obtiendrez pas de réponse’, souligne Eric. ‘Quels types de données? Une fois de plus, pas réponse! C’est tout simplement choquant, surtout lorsque vous avez un gestionnaire de données devant vous.’
D’autres entreprises ou organisations sont en revanche à la pointe, montrant la voie à suivre, notamment lorsque les données constituent la principale matière première de leurs activités. ‘Les chercheurs de Princeton, par exemple, veulent pouvoir rechercher, retrouver et utiliser des données même dans un avenir lointain. Ils ont littéralement une politique en matière de données pour les cent prochaines années.’ Il est frappant de constater qu’Arcitecta incite ses clients à gérer leurs données de manière très attentive. Pour utiliser Mediaflux, vous payez en fonction du nombre d’utilisateurs, et non du volume de données. ‘Nous ne nous préoccupons pas du volume’, explique Eric. ‘Nous voulons soutenir les conservateurs de données, pas les accumulateurs de données, les data hoarders.’