Gandi.net Groups

Hébergement mode expert: Serveur toujours HS depuis la semaine dernière.

Vous devez être connecté pour poster de nouveaux messages. Créer un compte.

Bonjour,

mon serveur [92.243.6.227 - bmx2.3527trail.com] est toujours HS depuis
la semaine dernière. comprendre: Statut 'OK' dans l'interface, mais
impossible de joindre les services présent sur la machine
(http/https/imap/ssh) et il m'est également impossible de me connecter
avec la console de secours. l'arrêt/redémarrage semble bien
fonctionner. la consolede secours s'arrête toute seule pour une raison
indéterminée (je met 6h, ca marque 'opération en cours', quand je
passe la souris dessus il me dit 'console en cours de démarrage', la je
tente la connection avec ssh sur la console, j'ai le message 'Connected'
et puis plus rien, et la connection ssh se coupe 2 min plus tard. je
retourne sur l'interface, j'ai toujours un 'opération en cours', mais
cette fois il semblerait que la console soit en cours d'arrêt. je
comprends pas, j'ai mis 6H cette fois.)

Bref j'ai déja redémarré plusieurs fois, et ca m'énerve d'avoir un
serveur qui fonctionnait relativement bien malgré quelques latences (1
part) et qui d'un coup ne fonctionne plus après les divers incidents
(RAID,Réseau,etc...) .

Je n'ai pas trop envie de le réinstaller de 0 car cela prend du temps,
et actuellement je n'en ai pas. J'aimerais que l'on m'explique
exactement ce qu'il se passe dessus, j'ai déja écris plusieurs tickets
au support: 
- Ref1291177
- Ref1296014
- Ref1291177
- Ref1306549
- Ref1309297

c'est quand meme pas compliqué d'aller en ssh sur la machine hôte,
d'arrêter la machine virtuelle et ensuite de la relancer avec la
console
xm create -c <domain-id>

tiré du man de xm:
-c  Attache console to the domain as soon as it has started.  This
               is useful for determining issues with crashing domains.

ca m'arrangerai que gandi fasse ca pour moi et m'envoie pourquoi pas les
logs de démarrage de la machine. ou du moins une explication du
problème ou encore de savoir si il faut que je réinstalle. comme je
l'ai déja dit, cette machine me sert de mx principal pour mes 4
domaines perso ainsi que dhébergement perso. Je n'ai donc plus la
possibilité de recevoir de mails sur ces domaines (dieu merci les mails
arrivent sur un mx secondaire fourni par mon fournisseur d'accès).

Je ne sait plus quoi faire, et un peu d'aide serait la bienvenue.

Merci.
hervé.
Précision: j'ai même dit a gandi que j'étais pret a leur fournir le
mot de passe root afin qu'ils se connecte sur la machine directement au
moins pour remettre le SSH.

Cela dit, je ne pense pas que ce soit un problème de configuration car
la machine fonctionnait bien. donc......
92.243.6.227@console.gandi.net's password:
Asking for console, please wait
Connected
Session timed out.


j'ai ca quand je tente d'utiliser la console... 
testé avant, pendant, et après le redémarrage de mon serveur virtuel.
je peux pas faire mieux...
j'avais le message précédent a partir de putty sous windows.

j'ai testé avec un vrai linux (distrib gentoo):

herve@bmx ~ $ ssh 92.243.6.227@console.gandi.net
The authenticity of host 'console.gandi.net (217.70.184.248)' can't be
established.
RSA key fingerprint is 65:04:78:69:ff:a4:c5:5b:74:9e:1a:5d:8e:cb:50:68.
Are you sure you want to continue connecting (yes/no)? yes
Warning: Permanently added 'console.gandi.net,217.70.184.248' (RSA) to
the list of known hosts.
92.243.6.227@console.gandi.net's password:
Asking for console, please wait
Connected

bmx2:~#


la il semblerait que la console fonctionne, mais je vois mes caractères
seulement après 5 minutes de latence. a la premiere commande tapée (ps
ax), j'ai ce type de message en boucle:

xvda1: rw=0, want=6468731304, limit=5012217
EXT3-fs error (device xvda1): ext3_readdir: directory #203841 contains a
hole at offset 43450368
attempt to access beyond end of device
xvda1: rw=0, want=6468731304, limit=5012217
EXT3-fs error (device xvda1): ext3_readdir: directory #203841 contains a
hole at offset 43454464
attempt to access beyond end of device
xvda1: rw=0, want=6468731304, limit=5012217
EXT3-fs error (device xvda1): ext3_readdir: directory #203841 contains a
hole at offset 43458560
ETC.....

que doit je faire avec ca?
xvda1: rw=0, want=6468731304, limit=5012217
EXT3-fs error (device xvda1): ext3_readdir: directory #203841 contains a
hole at offset 343683072
attempt to access beyond end of device
xvda1: rw=0, want=6468731304, limit=5012217
EXT3-fs error (device xvda1): ext3_readdir: directory #203841 contains a
hole at offset 343687168
attempt to access beyond end of device
xvda1: rw=0, want=6468731304, limit=5012217
EXT3-fs error (device xvda1): ext3_readdir: directory #203841 contains a
hole at offset 343691264
attempt to access beyond end of device

bon 6 minutes après ca ne semble pas vouloir s'arréter, je ne sait
vraiment pas quoi faire.

I NEED HELP
Note pour gandi.

Il semblerai que le filesystem de ma machine virtuelle est completement
HS.

J'aimerais que vous arrêtiez ma machine virtuelle
xm shutdown <domain-id>

puis que vous executiez un fsck.ext3 MANUEL sur mon /dev/xvda1.
fsck.ext3 /dev/xvda1 (a remplacer par la partition correspondante dans
la machine hote

et enfin que vous me redémarriez ma machine virtuelle
xm create <domain-id>

Je vous remercie.
bon j'ai laissé mon ssh lancé pendant un moment, et ma connection
s'est terminée. j'ai eu quand meme quelques messages intéressants:

DEBIAN4:                                                                
       Inode 203841 has imagic flag set.

DEBIAN4: UNEXPECTED INCONSISTENCY; RUN fsck MANUALLY.
        (i.e., without -a or -p options)
fsck died with exit status 4
failed (code 4).
* An automatic file system check (fsck) of the root filesystem failed.
A manual fsck must be performed, then the system restarted.
The fsck should be performed in maintenance mode with the
root filesystem mounted in read-only mode.
* The root filesystem is currently mounted in read-only mode.
A maintenance shell will now be started.
After performing system maintenance, press CONTROL-D
to terminate the maintenance shell and restart the system.
Give root password for maintenance
(or type Control-D to continue): Session timed out.
Connection to console.gandi.net closed.


dommage que ca parte en Session Timed out juste au moment ou je pouvais
entrer le mot de passe de maintenance...

j'ai toujours besoin d'aide.
j'ai pu en me reconnectant directement après le session timeout faire
le fsck manuel sur /dev/xvda1

une fois le fsck fait, j'ai eu a nouveau les messages 'attempt to acces
beyond end of device' en boucle.

je tente le redémarrage
cette fois c'est bon, je peux accéder en ssh a mon serveur, le fsck
manuel sur /dev/xvda1 a semble t'il corrigé mon problème.

maintenant, il faut que je comprenne pourquoi ma partition de 5G de
données ne s'est pas montée toute seule comme c'était le cas. dessus
se trouve mon /home et mon /var/www.
bon, j'ai détaché puis réattaché mon disque et tout semble être
revenu dans l'ordre.

j'ai fait ce long thread pour montrer ma détresse et le manque d'aide
que j'ai reçu. et puis ca peux servir a quelqu'un d'autre.

hervé.