Une méga-panne dans un centre de données LCL paralyse de grands noms de l'internet des heures durant

08/04/08 à 12:00 - Mise à jour à 11:59

Source: Datanews

Des entreprises comme Netlog, Combell, Evonet ont connu des problèmes pendant des heures, la semaine dernière, suite à une grave panne de courant dans un centre de données de LCL. "Une méga-panne", déclare-t-on chez les clients concernés.

Des entreprises comme Netlog, Combell, Evonet ont connu des problèmes pendant des heures, la semaine dernière, suite à une grave panne de courant dans un centre de données de LCL. "Une méga-panne", déclare-t-on chez les clients concernés.

Nous en parlions le 31 mars dernier. Dans un centre de données de LCL, un disjoncteur d'alimentation a sauté. Les générateurs de courant de secours sont alors immédiatement entrés en action, comme il se doit. Mais le disjoncteur s'est activé et désactivé plusieurs fois de suite, ce qui a entraîné à chaque fois la mise en marche et l'arrêt des générateurs. Un générateur auquel une grande partie du centre de données en question est connecté, n'y a pas résisté, ce qui a provoqué la plus importante panne dans un centre de données belge de ces dernières années.

Laurens van Reijen, 'managing director' de LCL, déclare que 15 pour cent de ses clients a dû se passer des services du centre données pendant 6 à 8 heures. Mais parmi eux, il y avait, selon d'autres sources, de grands noms de l'hébergement comme Combell, Evonet et Openminds, ainsi que le site web le plus populaire de Belgique, Netlog. Voilà pourquoi, on estime que 40 pour cent des sites web belges auraient éprouvé des problèmes. "C'est exagéré", répond van Reijen de manière laconique.

Chez Combell, on n'a assurément "guère dormi la semaine dernière", selon son CEO, Jonas Dhaenens. "Plus de 90 pour cent de nos serveurs se trouve chez LCL. Pour nous, cette panne a été une immense catastrophe." Dhaenens estime néanmoins que LCL jouissait jusqu'alors au niveau du temps d'exploitation ('uptime') d'une solide réputation. Laurens van Reijen le confirme sans problème. "Il s'agit d'un centre de données Tier 3, ce qui signifie que nous offrons une garantie de 99,98 pour cent. En 6 ans, nous n'avons connu aucune panne dans nos 2 centres de données. Chaque mois, nous effectuons des tests et des contrôles internes. Mais nous ne sommes jamais à l'abri d'impondérables, et les clients doivent en tenir compte. Ils doivent toujours prévoir des solutions de reprise après sinistre ('disaster-recovery') et de continuité d'activités ('business continuity'). Il est par exemple préférable de répartir vos serveurs sur nos 2 centres de données. Cela offre davantage de garanties."

En raison des dégâts subis par le générateur, les clients concernés de LCL ont dû, à leur corps défendant, travailler une semaine durant en se passant de la sécurité de la redondance dans le centre de données. Le disjoncteur a été dans un premier temps remplacé temporairement, puis ce fut, hier, au tour du générateur. Et enfin, aujourd'hui, on procède au remplacement définitif du disjoncteur. Résultat: le centre de données tourne de nouveau de 8 à 12H sur le générateur. En fin d'après-midi, le problème devrait être définitivement résolu.

Pour LCL, il s'agit à présent de regagner la confiance de ses clients, ajoute van Reijen. Il en discutera personnellement avec les clients concernés. "Pour nous, il ne faut plus jamais que cela arrive", réagit Dhaenens. "Nous avons demandé à LCL de pouvoir réaliser nous-mêmes un audit externe pour analyser la cause de la panne et tester leur communication en la matière. Pour nous, cela déterminera notre choix quant à rester chez LCL à l'avenir."

Mais outre la non-fourniture de services, la panne a aussi provoqué des dégâts au matériel: disques durs, commutateurs et alimentations fichus. "Heureusement, nous étions parés - nous avons tout cela en stock -, ce qui nous a permis de les remplacer rapidement", déclare Dhaenens. Il reste vague à propos d'exiger des compensations. "Nous examinerons à cette fin les SLA." Selon van Reijen, ces discussions sont l'apanage des compagnies d'assurance. "Nous n'offrons aucune garantie à 100 pour cent sur le courant, à l'instar d'ailleurs des entreprises de services aux collectivités..."

Van Reijen soupire: "Cette situation n'est pas du tout agréable. Mais cela arrive, nous ne sommes pas les seuls. Voyez Belgacom en 2006, et Level3 qui a également connu des problèmes... Tout le monde a déjà connu ce genre de tuile."

Nos partenaires