Après le
disque dur Hitachi, c'est au tour d'un disque dur Seagate qui est en train de mourir à mon travail.
Le problème a été décelé par un collègue qui a retrouvé la machine plantée. Il a fait moult tentatives de reboot jusqu’à ce que le système reparte. Après mon arrivée : le disque dur fonctionne, pas d'erreur E/S dans les logs système mais il est affreusement lent (visible avec la commande iostat). Un smartctl confirme le verdict de mon collègue : le disque semble bien malade.
Évidemment il s'agit d'une machine desktop (Acer Veriton M4) qui n'a qu'un seul disque donc pas de RAID. Prise de décision de tout stopper les services et de copier le disque en urgence. Il héberge une base Oracle d'ouillage et non métier, donc pas vraiment indispensable et restaurable par ailleurs. Un boot via une distrib Live Linux (PING) sur CD pour faire un dd donne un max d'erreurs et des transferts à 9Mo/s ce qui est un débit largement anormal pour une copie entre 2 disques SATA internes. En fait dd s'attarde sur les timeout de secteurs défecteux de plusieurs secondes à chaque fois et fait plusieurs tentatives. J'aurais du faire un fsck/badblocks avant.
Généralement lorsque l'on rencontre ce genre de message ce n'est clairement pas bon signe... Comme cette semaine je suis en congés, d'autres personnes vont s'occuper le lui et je ne pourrais avoir la suite de l'histoire que dans quelques jours.
MAJ le 15/05
La copie dd avec l'option "conv=noerror" est arrivée à son terme durant le long week-end, avec une moyenne de 56Mo/s (plus vite que prévu). L'opération a donc réussi. Ci-dessous les valeurs de la commande smartctl (sortie tronquée) du nouveau disque pour comparaison.