Le 25 mai 2018, vous vous souvenez ? L'entrée en vigueur du RGPD a mis les entreprises devant leurs responsabilités. Les organisations traitent en effet des masses de données, souvent aussi à caractère personnel ou confidentiel. Et même si le RGPD ne fait plus la une de l'actualité, ce règlement modifie fondamentalement la manière dont les entreprises abordent les données. Une réalité qu'ont bien comprise les sociétés technologiques de la Silicon Valley. Et notamment Waterline Data (Mountain View). "Aux Etats-Unis, il est souvent plus intéressant financièrement de payer une amende que d'implémenter une solution opérationnelle, confesse Alex Gorelik, ex-IBM et CEO de Waterline Data. A cet égard, l'Europe a adopté une approche plus pertinente avec le RGPD. Les amendes prévues sont en effet très élevées, ce qui incite les entreprises à prendre les mesures adéquates." Dès lors, le RGPD représente une réelle opportunité pour une entreprise comme Waterline, dont un tiers du chiffre d'affaires est généré par l'Europe.

Dark data

L'entreprise traite souvent des milliers de jeux de données et des millions de champs de données. Les catégoriser tous afin d'assurer la conformité au RGPD est mission impossible. Waterline Data puise ses racines dans la catégorisation automatique de données. Un domaine qui s'inscrit parfaitement dans le cadre de ce RGPD. En pratique, Waterline Data a mis au point une application qui localise automatiquement les données liées au RGPD et génère des rapports ad hoc. Du coup, l'entreprise est en mesure de prouver qu'elle a pris les mesures qui s'imposent dans le cadre de ce règlement. Pour de nombreuses entreprises, en effet, les 'dark data' constituent un risque non négligeable. Il s'agit en effet de données régies par le RGPD, mais dont l'entreprise ne sait pas qu'elle les traite, ni où elles sont stockées.

L'un des clients de Waterline Data est GlaxoSmithKline (GSK). L'entreprise pharmaceutique gère des données particulièrement confidentielles à caractère privé, notamment dans le cadre de ses recherches scientifiques. Pour pouvoir continuer à utiliser ces données au niveau de la R&D, GSK a mis en place une plate-forme permettant de migrer des données des systèmes opérationnels vers un 'data lake'. Waterline Data génère alors automatiquement des balises sur ces données, ce qui permet à GSK de disposer d'un inventaire de l'ensemble des catégories de données et de répondre ainsi à l'un des défis majeurs du RGPD. Grâce à la solution de Waterline Data, GSK sait parfaitement quelles données se trouvent à quel endroit.

Effort continu

Waterline Data insiste sur le fait qu'elle n'a pas besoin de se conformer au RGPD. En effet, l'entreprise ne stocke ni ne traite aucune donnée, mais n'offre qu'un outil de catégorisation des données. "Le RGPD exige un effort continu, précise Alex Gorelik. Supposez qu'un client demande à une entreprise de supprimer ses données et que cette entreprise y consent. Mais qu'adviendra-t-il si l'entreprise achète par la suite un jeu de données où les données du client figurent à nouveau ? Sur la base d'une 'whitelist', notre application veille à ce que ce client ne se retrouve pas à nouveau dans les systèmes opérationnels." Quant à savoir avec quelle rigueur l'Europe applique le RGPD, Waterline Data estime qu'il est prématuré de répondre. "Il faudra voir les premiers procès en justice", dixit encore Alex Gorelik.