Knowbel: La sémantique pour personnaliser l’info
Emanation du Cental (Centre de Traitement Automatique du Langage) de l’UCL, Knowbel a préparé son entrée sur le marché de la gestion de connaissances en développant, en liaison avec l’agence Belga, un prototype “capable d’extraire et d’organiser de l’information biographique utilisable dans le cadre du processus de rédaction.”
Emanation du Cental (Centre de Traitement Automatique du Langage) de l’UCL, Knowbel a préparé son entrée sur le marché de la gestion de connaissances en développant, en liaison avec l’agence Belga, un prototype “capable d’extraire et d’organiser de l’information biographique utilisable dans le cadre du processus de rédaction.” Objectif: “développer des logiciels et des services à haute valeur ajoutée visant la production d’informations structurées à partir d’informations textuelles non structurées” (procès-verbaux de réunions, communiqués, courriels, pages Web, etc.). Pour ce faire, l’équipe exploite des techniques non seulement statistiques, mais aussi – et surtout – linguistiques.
Knowbel se présente donc comme prestataire de services d’extraction d’information personnalisés. Premiers secteurs visés: le monde financier et médical. “Nous nous positionnons comme solution complémentaire à des outils tels que Google en visant l’analyse dirigée de pages. La dimension sémantique rend l’information plus précise”, souligne Patrick Watrin, co-fondateur.
Le moteur de recherche Knowbel travaille par regroupement statistique, linguistique et sémantique, déterminant la pertinence des résultats sur base des documents et concepts qui sont importants dans le contexte ou le domaine du client. Rien à voir avec la prétendue pertinence de résultats d’un Google qui se fonde sur la fréquence de recherche de la masse indifférenciée des internautes.
Les outils d’ingénierie linguistique mis en oeuvre analysent les textes, en extraient des éléments d’information pertinents pour le contexte visé (financier, commercial, médical, etc.) et opèrent des corrélations entre “entités” (mots ou ensembles de mots liés entre eux par des relations prédéfinies). Petit exemple: “croissance du chiffre d’affaires” constitue un seul et même concept.
“Les règles linguistiques autorisent une plus grande finesse d’analyse que les seules règles statistiques”, souligne Watrin. Revers de la médaille: un lourd et long travail (manuel) de modélisation de chaque domaine pour développer les référentiels. “Ce n’est pas un problème en soi, souligne-t-il, dans la mesure où la clientèle visée attend un travail de qualité et des résultats robustes.” Au-delà des développements manuels, l’équipe s’appuie sur des techniques d’apprentissage automatique et des algorithmes spécifiques.
La solution Knowbel opère aujourd’hui en français, néerlandais et anglais. 17 autres langues pourraient, au besoin, s’y ajouter.
Passeport Dénomination: Knowbel Siège: Bruxelles (Etterbeek) Année de création: 2012 Effectifs: 5 personnes Financement: fonds propres et financement Innoviris www.knowbel.com (en construction; cf dès lors http://cental.fltr.ucl.ac.be/projects/knowbel/ )
Vous avez repéré une erreur ou disposez de plus d’infos? Signalez-le ici