Bonjour tout le monde,
je rencontre un souci sur un serveur et je ne sais pas trop comment résoudre les choses, je viens donc vous demander conseil:
Le Setup: un raspberrypi avec l'OS installé sur une carte SD et un RAID 1 (logiciel donc) via un boitier USB et 2 disques dedans. Le RAID est fait via mdadm, il y a 3 partitions dessus (LVM). Les partitions sont montées sur /home /tmp et /var. => il n'y a donc aucune écriture sur la carte SD pour tout ce qui est journaux, logs, etc...
Le partitionnement est donc le suivant:
NAME MAJ:MIN RM SIZE RO TYPE MOUNTPOINT
sda 8:0 0 1.8T 0 disk
└─sda1 8:1 0 1.8T 0 part
└─md0 9:0 0 1.8T 0 raid1
├─vg--raid-tmp 253:0 0 10G 0 lvm /tmp
├─vg--raid-home 253:1 0 900G 0 lvm /home
└─vg--raid-var 253:2 0 952.9G 0 lvm /var
sdb 8:16 0 1.8T 0 disk
└─sdb1 8:17 0 1.8T 0 part
└─md0 9:0 0 1.8T 0 raid1
├─vg--raid-tmp 253:0 0 10G 0 lvm /tmp
├─vg--raid-home 253:1 0 900G 0 lvm /home
└─vg--raid-var 253:2 0 952.9G 0 lvm /var
mmcblk0 179:0 0 14.9G 0 disk
├─mmcblk0p1 179:1 0 43.9M 0 part /boot
└─mmcblk0p2 179:2 0 14.8G 0 part /
MDADM me dit globalement que mon RAID est OK:
admin@polochon:~ $ sudo mdadm --detail /dev/md0
/dev/md0:
Version : 1.2
Creation Time : Mon Jun 15 18:35:14 2020
Raid Level : raid1
Array Size : 1953382464 (1862.89 GiB 2000.26 GB)
Used Dev Size : 1953382464 (1862.89 GiB 2000.26 GB)
Raid Devices : 2
Total Devices : 2
Persistence : Superblock is persistent
Intent Bitmap : Internal
Update Time : Wed Mar 10 15:01:19 2021
State : clean
Active Devices : 2
Working Devices : 2
Failed Devices : 0
Spare Devices : 0
Consistency Policy : bitmap
Name : xxxxxxxxx:0 (local to host xxxxxxxxx)
UUID : 5f6fc4d7:74110a6f:c6bd0643:8fa1f3bb
Events : 264890
Number Major Minor RaidDevice State
0 8 1 0 active sync /dev/sda1
1 8 17 1 active sync /dev/sdb1
Le problème
Voici ce que je rencontre dans dmesg
[ 315.369415] EXT4-fs (dm-2): error count since last fsck: 27
[ 315.369440] EXT4-fs (dm-2): initial error at time 1609485436: ext4_dx_find_entry:1525: inode 15597569: block 3
[ 315.369482] EXT4-fs (dm-2): last error at time 1615187739: ext4_validate_block_bitmap:390
[86808.041056] EXT4-fs (dm-2): error count since last fsck: 27
[86808.041128] EXT4-fs (dm-2): initial error at time 1609485436: ext4_dx_find_entry:1525: inode 15597569: block 3
[86808.041212] EXT4-fs (dm-2): last error at time 1615187739: ext4_validate_block_bitmap:390
[173316.092558] EXT4-fs (dm-2): error count since last fsck: 27
[173316.092609] EXT4-fs (dm-2): initial error at time 1609485436: ext4_dx_find_entry:1525: inode 15597569: block 3
[173316.092708] EXT4-fs (dm-2): last error at time 1615187739: ext4_validate_block_bitmap:390
Déjà, je n'ai aucune partition répondant au nom de dm-2. Qu'est ce que ça pourrait bien être?
Ensuite, j'ai fait un fsck sur la carte SD, le résultat est OK.
Enfin, j'ai fait un test de badblock -sv /dev/md0, le résultat est OK et aucun badblock de trouvé.
Du coup, qu'est ce que c'est que cette erreur dans dmesg? J'aimerais bien tenter un fsck sur le raid, mais déjà je ne sais pas si ça fonctionnera vu que c'est du RAID, et en plus je ne peux pas démonter les points de montage vu qu'ils sont busy (logique, le serveur tourne).
Bref, j'ai plus trop de piste là! 🙁
Si quelqu'un en a, je suis preneur! 🙂
Polochon