Gandi.net Groups

Hébergement Généralités: Incident du 25/04/08 de 14h12

Vous devez être connecté pour poster de nouveaux messages. Créer un compte.

Version "grand public":

Suite à un probleme de configuration de notre côté (erreur humaine
donc), nous avons provoqué l'apparition d'un bug de routage sérieux
sur un équipement réseau, faisant ralentir ou rendant inaccessible le
réseau
de gandi + hébergement pour un quart des fournisseurs d'accès.

Version "expert" : le passage involontaire en switching soft du Cisco
a laissé la moitié des routes cef injoignables, malgré un revert
immédiat de la configuration.

Un reload du routeur à été nécessaire.

Nous vous présentons toutes nos excuses pour cet incident, procéderons
à un remboursement systématique d'une journée pour les personnes
lésées (raison pour laquelle cela reste du déclaratif), et prenons
les mesures pour que cela reste un mauvais souvenir.
Bon, je dois l'avouer, je n'y connais pas grand chose en routeur Cisco.
Je sais ce qu'est un router, j'ai vaguement compris à quoi servait les
routes CEF, et j'imagine certainement de façon déformée ce qu'est un
passage en switching soft.

Mais tout ça me paraît quand même un peu fragile. Une bête erreur de
configuration, et le système s'écroule. Ca fait un peu château de
carte.

Tapez sur le technicien, pourquoi pas, ils ont l'habitude. Il n'y a que
ceux qui bossent qui se font tapez dessus. Ceux qui ne font rien, on
s'en rend jamais compte... Que ceux qui programment, gèrent,
configurent, etc... et qui affirment ne s'être jamais trompé lèvent
la main. Il ne devrait pas y en avoir beaucoup.

Mais qu'un système tombe en rideau pendant 4 heures pour une erreur de
configuration prouve qu'il n'a pas été bien pensé. En une phrase : il
n'a pas été conçu pour être tolérant à la panne. Et ça je trouve
que c'est dommage de la part d'un professionnel de l'hébergement.

Si il y a quelque chose à améliorer, je pense que c'est par là qu'il
faut commencer. Car il ne faut pas rêver, des erreurs, il y en aura
d'autres. Alors autant tout faire pour qu'elles ne se voient pas.

Mais bon, c'est votre métier. Je ne vais tout de même pas vous
l'apprendre ;-)

Bon courage.
PatDef
Le 25 avr 2008 à 19:28 CEST, Stephan (Gandi) a écrit :
Nous [...]
procéderons
à un remboursement systématique d'une journée pour les personnes
lésées (raison pour laquelle cela reste du déclaratif), et prenons
les mesures pour que cela reste un mauvais souvenir.
Mais cela n'est pas automatique ? Que faut-il faire/A qui s'adresser ?
Le 25 avr 2008 à 19:28 CEST, Stephan (Gandi) a écrit :
Version "grand public":

Suite à un probleme de configuration de notre côté (erreur humaine
donc), nous avons provoqué l'apparition d'un bug de routage sérieux
sur un équipement réseau, faisant ralentir ou rendant inaccessible
le
réseau
de gandi + hébergement pour un quart des fournisseurs d'accès.

Version "expert" : le passage involontaire en switching soft du Cisco
a laissé la moitié des routes cef injoignables, malgré un revert
immédiat de la configuration.

Un reload du routeur à été nécessaire.

Nous vous présentons toutes nos excuses pour cet incident,
procéderons
à un remboursement systématique d'une journée pour les personnes
lésées (raison pour laquelle cela reste du déclaratif), et prenons
les mesures pour que cela reste un mauvais souvenir.
 Y aurait-il un problème sur les serveurs de fichiers ?
Mon disque dur de donnée n'est plus monté, malgré de nombreux
reboot... (ticket Ref1299857) (et je peux dire adieu à mon uptime...
:-D )
Bonjour

Et merci pour ces éclaissisements !

Bonne Continuation

W.SIMON


"Stephan (Gandi)" <direction@gandi.net> a écrit dans le message de
news:6dc69c9cd5383b225473b96ccaed1987@grou...
Version "grand public":

Suite a un probleme de configuration de notre cote (erreur humaine
donc), nous avons provoque l'apparition d'un bug de routage serieux
sur un equipement reseau, faisant ralentir ou rendant inaccessible le
reseau
de gandi + hebergement pour un quart des fournisseurs d'acces.

Version "expert" : le passage involontaire en switching soft du Cisco
a laisse la moitie des routes cef injoignables, malgre un revert
immediat de la configuration.

Un reload du routeur a ete necessaire.

Nous vous presentons toutes nos excuses pour cet incident, procederons
a un remboursement systematique d'une journee pour les personnes
lesees (raison pour laquelle cela reste du declaratif), et prenons
les mesures pour que cela reste un mauvais souvenir.
Valérian a écrit :
Mais cela n'est pas automatique ? Que faut-il faire/A qui s'adresser ?
Bonjour Valérian,

Un petit mail au support et nous nous occupons de cela :)
\o/ Jonathan
  Gandi.Net