Un algorithme de Yahoo capable de détecter les trolls

Image d'illustration © REUTERS

Yahoo a développé un algorithme capable de déterminer lui-même si des réactions en ligne sont offensantes ou pas. L’algorithme a pu dans 90 pour cent des cas spécifier s’il était question de harcèlement, ce qui est mieux que d’autres logiciels du genre.

Cinq chercheurs de Yahoo ont utilisé pour ce faire une combinaison d’intelligence artificielle et de ‘crowdsourcing’ (production participative). Comme base, ils ont eu recours aux réactions à des messages publiés sur Yahoo News et Yahoo Finance.

La plupart des logiciels tentent de sonder les réactions sur base de mots ou de fragments de phrase malveillants. Si ces mots sont altérés, ce type de logiciel ne fonctionne déjà plus, et plus du tout, lorsque quelqu’un crache son venin, sans utiliser d’injures. Ces logiciels éprouvent aussi des difficultés avec le sarcasme.

L’algorithme de Yahoo, par contre, analyse la longueur des réactions, le nombre de termes offensants et la ponctuation, afin de dresser un portrait de la remarque injurieuse typique. Des personnes formées à identifier le harcèlement, ont aussi donné un score aux commentaires, ce qui a permis à l’algorithme d’en apprendre encore.

L’algorithme n’a pas encore été testé en dehors du gisement de données de Yahoo, mais l’entreprise estime qu’il s’agit d’un ‘énorme pas en avant’ dans le traitement du langage naturel. (ANP)

Vous avez repéré une erreur ou disposez de plus d’infos? Signalez-le ici

Contenu partenaire