
Komprise : détecter les données sensibles pour une meilleure gouvernance de l’IA

C’est une évidence : vous ne voulez pas que des données sensibles quittent votre entreprise par le biais d’une application d’IA et se retrouvent entre de mauvaises mains sans même que vous en ayez conscience. Pour l’éviter, Komprise ajoute de nouvelles capacités de détection à sa solution de gestion des données non structurées.
La création et l’utilisation de données non structurées enregistrent aujourd’hui une croissance exponentielle. Mais ce phénomène n’est pas sans danger : des données sensibles peuvent ainsi se retrouver à des endroits où elles n’ont rien à faire. L’IA générative n’est pas étrangère à l’augmentation de ce risque. Aujourd’hui, les tentatives d’introduire des informations personnelles identifiables (PII) sur des plateformes GenAI représentent déjà plus de la moitié (55%) des événements de sécurité qui se produisent dans le contexte de la prévention des pertes de données. Elles précèdent ainsi l’introduction de documents confidentiels (40%) dans les applications GenAI, selon une étude de Menlo Security.
Tous ces incidents engendrent également des coûts. L’année dernière par exemple, le coût moyen d’une fuite de données a presque atteint la barre des cinq millions de dollars, selon IBM. Mais alors que les gestionnaires de stockage sont de plus en plus (co-)responsables de la gouvernance des données et du respect de la législation en matière de gestion des données, ils manquent encore trop souvent des ressources nécessaires pour s’y attaquer systématiquement au sein de leur environnement de données.
Smart Data Workflow Manager
Le spécialiste de la gestion des données non structurées Komprise veut changer la donne avec son Smart Data Workflow Manager. L’éditeur de logiciels, qui aime également se positionner en moteur de données pour l’IA, aborde le problème à la source : l’ingestion de données non structurées nécessaires pour construire les bases de connaissances sur lesquelles reposent les applications d’IA générative.
« L’IA a besoin de données », explique le CEO Kumar Goswami lors d’une présentation que Data News a suivie au siège de Komprise à Campbell, Silicon Valley, dans le cadre de l’IT Press Tour. « D’énormément de données, qui doivent également être transférées dans le cloud. Mais vous ne voulez pas pour autant que des données sensibles quittent votre entreprise et provoquent des problèmes de compliance par le biais de ce processus d’ingestion. Très souvent, les entreprises n’en sont même pas conscientes. »
Une aiguille dans une botte de foin
Et même quand elles en sont conscientes, cela revient souvent, dans la pratique, à rechercher une aiguille dans une botte de foin. « Un de nos clients avait une centaine de milliers de fichiers qu’il souhaitait exploiter à des fins d’IA », explique Kumar Goswami. « Il s’est avéré que 13 fichiers n’auraient pas dû s’y trouver. Il va sans dire que ce client n’aurait jamais pu trouver les fichiers en question manuellement. Ou en tout cas pas dans un délai raisonnable. » Grâce aux capacités de détection de Komprise, il y est parvenu.
L’intelligence artificielle elle-même offre d’ailleurs de nombreuses possibilités d’améliorer et d’accélérer ce processus de détection. L’histoire de l’Université Duquesne de Pittsburgh, Pennsylvanie, le démontre. « John F. Kennedy s’y est rendu à plusieurs reprises », embraie Kumar Goswami. « L’université a donc eu l’idée de monter une exposition de photos de cette époque. Mais les archives contenaient trois millions de clichés. Un processus de sélection manuel aurait pris un temps fou. Mais avec l’aide de l’IA, l’université est parvenue à réduire ce nombre à dix mille photos potentiellement intéressantes. De plus, neuf d’entre elles avaient déjà été taguées avec JFK. Le processus de recherche a été achevé en moins de deux heures. Et comme il s’agit d’un exercice répétable qui implique également un processus d’apprentissage, il ne prendra probablement que quelques minutes la prochaine fois. »
Vous avez repéré une erreur ou disposez de plus d’infos? Signalez-le ici