Faire plus avec les données grâce à l’IA générative
Les données sont souvent liées aux individus. Voilà pourquoi le GDPR veille à ce que l’on ne fasse pas n’importe quoi avec. L’IA générative esquive ce seuil. La technologie génère des données synthétiques et permet d’agir avec moins de réserve.
L’IA générative est une discipline relativement nouvelle. En termes simples, l’intelligence artificielle génère des données synthétiques à partir de véritables données ‘originales’. Les données synthétiques ont les caractéristiques des données réelles et reflètent la réalité mais elles ne sont pas liées un-sur-un à quelque chose de réel.
La technologie repose sur l’apprentissage profond. Il s’agit en substance d’un algorithme à deux composants. Le premier composant prend les données originales existantes comme point de départ et génère des données synthétiques. Le second composant récupère la distinction entre les données réelles et les données synthétiques pour permettre au premier composant de renforcer la qualité des données synthétiques jusqu’à ne plus différencier les données réelles.
Des individus qui n’existent pas
“L’IA générative permet notamment de créer des images de personnes qui n’existent pas”, déclare Véronique Van Vlasselaer, Analytics & AI Lead chez SAS Institute. “A la source, il y a des véritables photos – les données originales – mais le résultat final est obtenu à partir de données synthétiques.” Le grand avantage est qu’un individu qui n’existe pas ne peut pas s’opposer pas à l’utilisation de la photo.
“Mais il faut rester prudent avec les données réelles”, poursuit Véronique Van Vlasselaer. “Le GDPR protège la vie privée des fournisseurs de données.” Pour les données synthétiques, les restrictions disparaissent, ce qui offre plus d’opportunités aux chercheurs. “Si vous élaborez un trajet d’analyse de données avec un partenaire, vous ne pouvez pas partager de données originales. Si vous prévoyez au préalable des données synthétiques, alors cela devient possible. Le partenaire peut enrichir les données et créer des nouvelles perspectives.” Dans le cadre de certaines réglementations, les données originales ne peuvent pas quitter un territoire. On peut aussi absorber cela en créant des données synthétiques.
Les données synthétiques peuvent représenter une solution lors d’un manque de données originales. “Je pense notamment à la recherche dans les soins de santé. Parfois, les données originales ne sont pas disponibles en suffisance. L’IA générative permet de créer un pool de données plus vaste.” De la même manière, l’IA générative neutralise la sous-représentation de groupes minoritaires dans un ensemble de données par l’ajout de données synthétiques.
De la recherche scientifique aux deepfakes
Le domaine d’application de l’IA générative est vaste. “Cela concerne d’abord les secteurs limités par le GDPR dans ce qu’ils peuvent et veulent faire avec par exemple des données de consommateurs ou de santé”, détaille Véronique Van Vlasselaer. “Un autre exemple est celui du secteur financier où peu de données sont disponibles sur les fraudes. L’IA générative peut fournir des ensembles de données plus larges, ce qui s’avère utile dans la recherche de solutions pour la détection de fraudes.”
L’IA générative permet également à l’industrie cinématographique de créer une version plus ou moins jeune d’un acteur de manière très réaliste. C’est aussi la technologie appliquée aux deepfakes en vue d’une désinformation ou d’une fraude. “Si vous avez des doutes sur la véracité d’une photo ou d’une vidéo, vous pouvez vérifier certains éléments spécifiques”, continue Véronique Van Vlasselaer. “L’IA a notamment des difficultés avec les pupilles et la symétrie des yeux, des oreilles ou des lobes d’oreilles. Bien souvent, une photo ‘synthétique’ n’illustre qu’une seule personne et l’arrière-plan n’est pas très réaliste.”
La législation doit évoluer
L’IA générative semble donc être une solution pour contourner les restrictions liées à la manipulation et au traitement de données dans le cadre du GDPR. “Avec l’IA générative, le partage de données et les perspectives émanant de données devient encore plus possible”, poursuit Véronique Van Vlasselaer. “Et s’il y a une fuite des données synthétiques, c’est moins grave.”
Cependant, le GDPR dans le cadre de l’IA générative n’est pas totalement hors propos car les données originales sont à la source des données synthétiques. Le cadre législatif va donc devoir évoluer pour mieux définir l’IA générative. “L’application de l’IA générative dans un contexte purement professionnel commence à décoller”, conclut Véronique Van Vlasselaer. “Mais la technologie est en soi encore très jeune. Il faudra attendre un certain temps avant de voir des applications métier concrètes.”
Plus d’infos sur www.sas.com/belux
Vous avez repéré une erreur ou disposez de plus d’infos? Signalez-le ici