Lundi en soirée, une grande partie du média social mondial disparut d'un seul coup. L'imperium de Facebook, dont le réseau social proprement dit, mais aussi Messenger, Instagram, WhatsApp, Workplace, voire le service VR Oculus, fut inaccessible des heures durant.

Et ce n'est pas trop de l'écrire, car même si les sites étaient toujours bien en place, aucun appareil n'était plus capable de trouver les serveurs. Selon le communiqué officiel de Facebook, le problème résidait dans 'la configuration des serveurs sous-jacents qui coordonnent le trafic réseautique'. A partir de là, les difficultés se sont étendues à la communication des centres de données. Même les outils internes étaient inutilisables. Cette explication est assez vague, mais elle renforce l'impression générée par une mise à jour ratée du 'border gateway protocol' (BGP).

Les indicateurs d'internet

Le BGP est un protocole de base d'internet veillant à ce que les utilisateurs et les appareils soient orientés vers l'emplacement correct de leurs messages de clavardage (chat) ou du message de statut de leur... tonton par exemple. Il fonctionne un peu comme le système de noms de domaine (DNS), qui accompagne les appareils à l'adresse IP correcte, mais à un niveau supérieur. En bref, il explique à autrui comment surfer sur le réseau d'un fournisseur spécifique ou, dans le cas présent, d'un géant technologique.

Car Facebook ne se trouve dans le Telenet local. L'entreprise possède son propre registre de domaine et ses serveurs DNS et utilise son propre 'routing prefix' pour son réseau. Chaque utilisateur qui ouvre une appli Facebook, doit donc être guidé vers le réseau Facebook. Lors d'une mise à jour lundi soir, ces indicateurs auraient cependant été effacés, ce qui fait qu'aucun appareil n'était plus à même de trouver le réseau Facebook. Voilà qui explique pourquoi tant de sites et d'applis ont refusé simultanément tout service. Cloudflare, elle-même spécialisée dans la gestion du trafic web pour sites, signale dans un communiqué posté sur son blog qu'une mise à jour a supprimé tous les trajets BGP vers Facebook, ce qui fait que les serveurs DNS du réseau social sont devenus inaccessibles.

Exclues de leur propre infrastructure

Le fait que la réparation ait pris tant de temps, semble être dû précisément à ce que ces 'outils internes' n'étaient plus accessibles. Des rapports de la journaliste du New York Times, Sheera Frenkel, révèlent que les collaborateurs de Facebook ne pouvaient eux-mêmes plus ni se connecter à leurs propres serveurs de travail ni accéder avec leur badge aux bâtiments physiques, parce que tous les systèmes transitent par ces serveurs... devenus introuvables. Tout semble donc indiquer que les personnes chargées de la réparation étaient plus ou moins exclues de leur propre infrastructure.

Actuellement, il n'y a aucune indication d'une intention malveillante. Ce genre de problème a même un avantage: une fois n'est pas coutume, aucune donnée (supplémentaire) n'a fuité, puisqu'il semble que seuls les serveurs de routage, et donc pas les serveurs data, aient connu des problèmes.

Lundi en soirée, une grande partie du média social mondial disparut d'un seul coup. L'imperium de Facebook, dont le réseau social proprement dit, mais aussi Messenger, Instagram, WhatsApp, Workplace, voire le service VR Oculus, fut inaccessible des heures durant.Et ce n'est pas trop de l'écrire, car même si les sites étaient toujours bien en place, aucun appareil n'était plus capable de trouver les serveurs. Selon le communiqué officiel de Facebook, le problème résidait dans 'la configuration des serveurs sous-jacents qui coordonnent le trafic réseautique'. A partir de là, les difficultés se sont étendues à la communication des centres de données. Même les outils internes étaient inutilisables. Cette explication est assez vague, mais elle renforce l'impression générée par une mise à jour ratée du 'border gateway protocol' (BGP).Les indicateurs d'internetLe BGP est un protocole de base d'internet veillant à ce que les utilisateurs et les appareils soient orientés vers l'emplacement correct de leurs messages de clavardage (chat) ou du message de statut de leur... tonton par exemple. Il fonctionne un peu comme le système de noms de domaine (DNS), qui accompagne les appareils à l'adresse IP correcte, mais à un niveau supérieur. En bref, il explique à autrui comment surfer sur le réseau d'un fournisseur spécifique ou, dans le cas présent, d'un géant technologique.Car Facebook ne se trouve dans le Telenet local. L'entreprise possède son propre registre de domaine et ses serveurs DNS et utilise son propre 'routing prefix' pour son réseau. Chaque utilisateur qui ouvre une appli Facebook, doit donc être guidé vers le réseau Facebook. Lors d'une mise à jour lundi soir, ces indicateurs auraient cependant été effacés, ce qui fait qu'aucun appareil n'était plus à même de trouver le réseau Facebook. Voilà qui explique pourquoi tant de sites et d'applis ont refusé simultanément tout service. Cloudflare, elle-même spécialisée dans la gestion du trafic web pour sites, signale dans un communiqué posté sur son blog qu'une mise à jour a supprimé tous les trajets BGP vers Facebook, ce qui fait que les serveurs DNS du réseau social sont devenus inaccessibles.Exclues de leur propre infrastructure Le fait que la réparation ait pris tant de temps, semble être dû précisément à ce que ces 'outils internes' n'étaient plus accessibles. Des rapports de la journaliste du New York Times, Sheera Frenkel, révèlent que les collaborateurs de Facebook ne pouvaient eux-mêmes plus ni se connecter à leurs propres serveurs de travail ni accéder avec leur badge aux bâtiments physiques, parce que tous les systèmes transitent par ces serveurs... devenus introuvables. Tout semble donc indiquer que les personnes chargées de la réparation étaient plus ou moins exclues de leur propre infrastructure.Actuellement, il n'y a aucune indication d'une intention malveillante. Ce genre de problème a même un avantage: une fois n'est pas coutume, aucune donnée (supplémentaire) n'a fuité, puisqu'il semble que seuls les serveurs de routage, et donc pas les serveurs data, aient connu des problèmes.