L'algorithme que les chercheurs ont imaginé, pilote le fauteuil roulant suivant une combinaison de formes de reinforcement learning (apprentissage par renforcement). Avec le principe de l'apprentissage par renforcement classique, l'ordinateur apprend par lui-même de nouvelles choses en procédant à des expérimentations dans son environnement de travail, mais cela nécessite de nombreuses interactions et engendre un processus d'apprentissage de très longue durée. Le nouvel algorithme, lui, réduit sérieusement la durée d'apprentissage.

Sur base de l'approche 'trial-and-error'

'L'apprentissage par renforcement est en fait un système basé sur l'approche 'trial-and-error' (essais et erreurs, ndlr)'', explique le responsable de la recherche Denis Steckelmacher. 'Le fauteuil roulant est 'récompensé', s'il réussit quelque chose, comme par exemple éviter un obstacle. Et s'il effectue une manoeuvre indésirable, il est puni. Notre algorithme combine de manière intelligente plusieurs types d'apprentissage par renforcement, ce qui fait qu'une méthode compense les faiblesses de l'autre. Il en résulte un processus d'apprentissage très rapide si on est suffisamment sûr, mais qui s'ajuste avec prudence en cas d'incertitude'.

Selon Steckelmacher, la nouvelle technologie génère des fauteuils roulants plus sûrs et confortables, susceptibles d'être utilisés directement.

L'algorithme que les chercheurs ont imaginé, pilote le fauteuil roulant suivant une combinaison de formes de reinforcement learning (apprentissage par renforcement). Avec le principe de l'apprentissage par renforcement classique, l'ordinateur apprend par lui-même de nouvelles choses en procédant à des expérimentations dans son environnement de travail, mais cela nécessite de nombreuses interactions et engendre un processus d'apprentissage de très longue durée. Le nouvel algorithme, lui, réduit sérieusement la durée d'apprentissage.'L'apprentissage par renforcement est en fait un système basé sur l'approche 'trial-and-error' (essais et erreurs, ndlr)'', explique le responsable de la recherche Denis Steckelmacher. 'Le fauteuil roulant est 'récompensé', s'il réussit quelque chose, comme par exemple éviter un obstacle. Et s'il effectue une manoeuvre indésirable, il est puni. Notre algorithme combine de manière intelligente plusieurs types d'apprentissage par renforcement, ce qui fait qu'une méthode compense les faiblesses de l'autre. Il en résulte un processus d'apprentissage très rapide si on est suffisamment sûr, mais qui s'ajuste avec prudence en cas d'incertitude'.Selon Steckelmacher, la nouvelle technologie génère des fauteuils roulants plus sûrs et confortables, susceptibles d'être utilisés directement.