Les données numériques en danger!

Frederik Tibau est rédacteur chez Data News.

Même si internet permet à chacun de se faire entendre, la Toile semble provisoirement moins convenir à la conservation de notre patrimoine numérique. “Chaque jour, des milliers de sites et de documents disparaissent”, met en garde Jeremy Keith, évangéliste HTML 5.

Même si internet permet à chacun de se faire entendre, la Toile semble provisoirement moins convenir à la conservation de notre patrimoine numérique. “Chaque jour, des milliers de sites et de documents disparaissent”, met en garde Jeremy Keith, évangéliste HTML 5.

Cet Irlandais habitant Brighton, qui prononça un discours apprécié lors de la Phare Conference de Gand, s’est récemment encore fait nettement remarquer, lorsqu’il protesta contre les économies à réaliser dans la division online de la BBC. La chaîne publique britannique va en effet réduire son budget internet de 25% au cours des deux prochaines années, ce qui fera passer 200 sites web et 360 emplois à la trappe.

“Il est absolument scandaleux que la BBC supprime autant de sites, se plaint Keith. Car c’est l’une des rares entreprises à bien s’en tirer avec l’ancien contenu numérique. Sur les sites web de la BBC, l’on peut souvent revenir jusqu’à dix ans en arrière. A présent, la station va apparemment stocker ses anciens fichiers offline, ce qui représente en fait le coup de grâce pour ce contenu.”

L’un des grands avantages d’internet, c’est le fait que ce soit une photocopieuse. L’on y trouve continuellement des doublons de fichiers, “et plus il y a de copies, plus les chances de survie sont grandes, insiste Keith. Théoriquement, internet est donc un puissant instrument pour la conservation de choses. Mais dans la pratique, c’est provisoirement le contraire qui se passe.”

Le développeur web cible deux éléments: “D’abord, l’on ne peut pas copier tout, car c’est illégal. Ensuite, la disposition des internautes à conserver des choses par eux-mêmes est quasi inexistante. Tout le monde estime en effet que si quelque chose se trouve sur internet, ce sera pour toujours. Mais est-ce bien vrai? Essayez donc de trouver une URL datant de dix ans? Bonne chance!”

Un premier pas dans la bonne direction est d’accepter qu’il y a un problème. “Les gens doivent prendre conscience que s’ils ne font rien pour conserver leurs données, celles-ci disparaîtront à terme. Ce qu’il faut surtout ne pas faire, c’est se fier aux applications de tiers. Si l’on poste un blog ou une vidéo sur Facebook, l’on n’a pas la moindre garantie que ce fichier y restera.”

“Les entreprises font du reste exactement pareil, ajoute Keith. Elles stockent des données toujours plus souvent dans le nuage, ce qui dans 90% des cas est simplement synonyme d’online. Pourquoi? Parce que c’est pratique. Et bon marché. Et qu’on reçoit encore un supplément de services par dessus. Mais ce qu’on ne pourra jamais dire avec certitude, c’est combien de temps les services de tiers dureront.”

Ce qu’on veut savoir alors, c’est comment s’y prendre. “Hébergez vous-même l’original. Et laissez-en une copie sur Facebook, Flickr et YouTube, poursuit Keith. Pour cela, vous devrez changer votre attitude mentale, car il est plutôt étrange d’héberger soi-même un site. Tenez également à l’oeil votre nom de domaine, car vous n’êtes jamais vous-même propriétaire de ce nom, mais vous le louez pour un certain temps. Je n’ai rien contre l’Icann, mais qui dit que cette organisation existera encore dans 10 ans? Le risque est grand qu’il n’y ait d’ici là plus de noms de domaine.”

HTML 5 Jeremy Keith est l’un des grands défenseurs d’HTML 5, et pas sans raison. C’est surtout la vision à long terme derrière le langage de balisage qui lui plaît. “Les formats changent en permanence, mais HTML résiste bien, et nous ne pouvons que nous en réjouir. Ce qui est intéressant, c’est qu’avec la version 5, l’on peut pour la première fois décrire les erreurs et les lacunes dans les documents. Avant, ce n’était pas possible, ce qui fait que les navigateurs éprouvaient souvent des difficultés avec des documents en mauvais état. Et disons-le franchement, la plupart des documents en ligne sont truffés d’erreurs.”

“Le fait qu’HTML 5 reprenne aussi le traitement des erreurs dans le spectre, n’est peut-être pas très excitant, mais c’est par contre super-intéressant. De la sorte, les générations à venir pourront elles-mêmes créer des navigateurs, même si elles n’ont plus accès à IE, Firefox ou Safari. Car elles pourront décoder facilement tous les documents créés avec HTML 5.”

“Dans ce sens, le nouveau standard est un excellent outil de stockage d’informations. L’on pense au long terme, le protocole sera compatible tant en aval qu’en amont, et le langage de balisage pourra être aisément décodé. Il y aura donc bien un format disponible avec lequel nous pourrons conserver notre patrimoine à longue échéance. Il convient à présent encore d’en convaincre les gens.”

Vous avez repéré une erreur ou disposez de plus d’infos? Signalez-le ici

Contenu partenaire