Une erreur dans les chiffres corona britanniques en raison… d’un manque de colonnes dans Excel

. © MS/PVL/Getty Images
Pieterjan Van Leemputten

Les chiffres corona britanniques de début octobre sont plus d’un tiers supérieurs à ce qu’imaginé d’abord. En raison d’une limite dans Excel, tout n’a pas été comptabilisé. En Belgique, pareille situation ne pourrait en principe pas se produire.

Le problème est entre-temps résolu, même si le traçage des contacts a subi du retard à cause de cela. Selon la BBC, l’erreur a fait en sorte que quelque 15.841 personnes testées positivement ne figuraient pas dans les statistiques du 25 septembre au 2 octobre. Depuis le 3 octobre, les choses sont rentrées dans l’ordre. Durant la semaine concernée, la moyenne fut de onze mille tests positifs par jour au lieu de dix-sept mille.

Selon la BBC, l’erreur est due à un problème technique, par lequel certains fichiers de données ont dépassé leur taille maximale. Le tabloïde The Daily Mail est un peu plus explicite et précise que le problème concernait Excel.

Les données des personnes testées positivement sont automatiquement ajoutées au fichier, mais Microsoft Excel ne supporte ‘que’ 16.384 colonnes, soit 2 à la puissance 14. Lorsque le nombre dépasse cette quantité, les données ne sont plus reprises dans les colonnes. Pour le nombre de rangées, ce type de problème se manifeste moins rapidement. Elles vont jusqu’à 1.048.576.

Le problème proprement dit a été découvert dans la nuit du vendredi 2 octobre déjà et n’a pas eu d’impact sur l’information transmise aux personnes infectées. Mais il a eu pour conséquence que les personnes qui sont entrées en contact avec les patients infectés, n’en ont été informées que quelques jours plus tard. Entre-temps, le problème a été résolu en répartissant la base de données sur plusieurs fichiers Excel.

Belgique

Cette situation pourrait-elle se présenter en Belgique aussi? Normalement pas, selon Sciensano. Data News s’est interrogé sur le mode de fonctionnement de cette institution. On y déclare utiliser principalement SAS pour le stockage et la gestion des données. La plupart des laboratoires recourent en outre à des systèmes de gestion de données professionnels, apprend-on encore.

Excel est toutefois utilisé par exemple pour s’échanger facilement des données ouvertes. Mais pour la collecte et le traitement des chiffres, qui déterminent aussi le traçage des contacts comme en Grande-Bretagne, une forte augmentation ne peut en principe pas se traduire par des chiffres manquants.

Vous avez repéré une erreur ou disposez de plus d’infos? Signalez-le ici

Contenu partenaire