Kris Peeters
Les données sont-elles à l’origine de la crise du Corona?
Dans un article paru dans le journal De Tijd, Peter Hinssen fait part de sa déception quant au rôle joué par les données massives (big data) dans la crise du Corona. Le spécialiste data Kris Peeters y distingue plusieurs erreurs de jugement critiques qu’il voit assez souvent réapparaître, y compris dans l’industrie, et qu’il veut aborder ici.
Les gens veulent devenir ‘data driven’
‘Nous voulions tous croire en des paroles magiques. Et rêver d’un monde meilleur vers lequel les données et les algorithmes nous conduiraient.’
Les gens veulent devenir ‘data driven’. Etre pilotés par les données (traduction littérale). Alors que les données ne sont rien de plus qu’un exutoire de processus. Voilà pourquoi nous sommes aussi ‘Data Minded’, mais pas ‘Data Driven’.
Les données doivent être transmises aux personnes ad hoc dans un contexte correct. Les ordinateurs peuvent créer eux-mêmes des aperçus. Mais il n’est pas possible de faire abstraction du côté humain. En cette époque de Covid, pensons à des gens tels Niel Hens, qui utilisent les données comme input pour leur modèle. Afin de finalement communiquer avec énormément d’incertitude (à juste titre) sur les résultats possibles. J’ai du reste eu l’honneur et l’avantage d’interviewer Niel Hens pour Data Science Leuven sur YouTube. Résultat: une vision pleine de nuances sur les données et le Covid.
Les gens sont très mauvais en probabilités
‘Mon CST prouve surtout que j’ai suivi les règles en vigueur, pas que je représente un plus faible risque pour la société.’
Les gens sont très mauvais en probabilités. Ce que Hinssen dit, est tout simplement faux. Un CST prouve que je représente un plus faible risque pour la société. Vous courez moins de risques d’être contaminé, moins de risques de transmettre le virus, moins de risques de finir à l’hôpital, moins de risques d’avoir besoin de ventilation.
Le risque est-il pour autant nul? Non. Omicron accroît-t-il le risque de contamination? Oui. Ce risque est-il encore suffisamment faible pour éviter une implosion du système hospitalier? Absolument. Un autre exemple classique de la façon dont les gens sont mauvais en probabilités, est le problème Monty Hall. Intuitivement, ce n’est pas correct, mais çà l’est sur le plan mathématique.
Les gens ne peuvent accepter d’incertitude dans les données
‘La demande d’un dénouement devient alors aiguë. Nous, les moutons de Panurge, avec notre CST, nous méritons quand même une réponse.’
Une réponse est attendue, toujours. Et plus encore en affaires: ‘Making no decision is often worse than any random decision’ (Une absence de décision est souvent encore pire qu’une décision aléatoire). Nous aspirons tous à un dénouement. Mais nous ignorons comment le virus va encore muter. Nous ignorons la vitesse à laquelle les firmes pharmaceutiques pourront continuer de réagir à ces changements. Nous ignorons quel sera l’impact sur l’économie. Les prévisions à cette échelle s’assimilent souvent à une complète absurdité. Les choix des politiciens doivent donc aussi toujours être conditionnels sur base des informations dont ils disposent. Le dénouement du Corona ne sera amorcé qu’avec… l’accord du virus lui-même.
La maturité des gens dans les données a de quoi décevoir
Pour moi, la conclusion ne réside pas tant dans la déception vis-à-vis des données massives (big data), mais bien dans la désillusion à l’égard de la maturité du citoyen moyen ou du politicien moyen dans les données. Les données ne sont qu’un outil. Ne vous laissez jamais guider par un outil. Ecoutez les experts. Acceptez les incertitudes. Je ne veux ainsi pas affirmer que le monde politique se comporte comme il convient. Mais ce type d’opinion ne nous rapproche pas d’une solution.
Vous avez repéré une erreur ou disposez de plus d’infos? Signalez-le ici