Un logiciel qui reconnaît le sarcasme et l’ironie

Des chercheurs de l’institut informatique de l’université hébraïque de Jérusalem ont mis au point un algorithme logiciel capable d’identifier le sarcasme et l’ironie dans un texte.

Des chercheurs de l’institut informatique de l’université hébraïque de Jérusalem ont mis au point un algorithme logiciel capable d’identifier le sarcasme et l’ironie dans un texte.

Selon l’équipe de chercheurs, le logiciel s’avère utile lors de l’élaboration de systèmes d’appréciation automatisés pour des sites de produits. D’une recherche précédente, il apparaît en outre que certains clients accordent leur préférence à des comptes rendus émis par des critiques en ligne aux tendances sarcastiques, et d’autres pas. Grâce à ce logiciel, les deux groupes seront dorénavant servis au doigt et à l’oeil.

Les chercheurs ont examiné 66.000 critiques émises par des visiteurs d’Amazon. Pour chacune d’elles, trois spécialistes notaient le degré de sarcasme de chaque phrase sur une échelle d’un à cinq. Ensuite, les chercheurs déterminaient les combinaisons de mots et les signes de ponctuation correspondant à une haute teneur sarcastique. C’est sur cette base qu’ils ont conçu un système logiciel baptisé Semi-supervised Algorithm for Sarcasm Identification (SASI).

Comme exemples de critiques sarcastiques, les chercheurs citent notamment: ‘parfait si vous souffrez d’insomnie’ (à propos d’un livre), ‘veuillez conserver votre bon d’achat’ (à propos d’un smartphone) et encore ‘quelle merveilleuse idée, il ne reste plus qu’à essayer avec une véritable équipe de conception de produits’ (à propos d’un e-lecteur).

Les chercheurs ont découvert que le sarcasme est plus souvent utilisé dans des critiques de produits qui sont très populaires ou coûteux, ou qui suscitent de fortes attentes en termes de facilité d’emploi. Ils supposent par conséquent que la principale fonction du sarcasme dans les critiques de produits sert à contrebalancer la vogue que certains d’entre eux déclenchent.

Les chercheurs présenteront leurs résultats au cours de la semaine du 24 mai 2010 lors d’une conférence consacrée aux weblogs et aux médias sociaux à Washington, et en juillet lors d’un congrès ayant pour thème l’apprentissage linguistique naturel par l’informatique en Suède.

En collaboration avec Computable

Vous avez repéré une erreur ou disposez de plus d’infos? Signalez-le ici

Contenu partenaire