difficile d'expliquer ce qui ne va pas
j'ai (au moins) deux fichiers que je tiens à jour manuellement via le tableur libre office
pour pouvoir effectuer des grep sur ces fichiers texte
je transforme ces fichiers sous libreoffice en fichiers texte de la façon suivante
Fichier / Enregistrer sous
Tous les formats : je choisis Texte CSV (.csv)
Je coche Editer les paramètres du filtre
Utiliser le format csv
Jeu de caractères : je laisse Unicode (UTF-8)
Séparateur de champ : je choisis ; au lieu de ,
OK
ce que je ne comprends pas c'est pourquoi certains caractères ne sont pas codés de la même façon
exemple
apostrophe est codé 27 dans un fichier et E2 80 99 dans l'autre
quand j'effectue un grep d'apostrophe dans le fichier , dans un cas il trouve et pas dans l'autre
je me suis arraché les cheveux qui me restent avant de m'apercevoir de cette différence de codage
et puis ceci : accrochez-vous !!!
un fichier tout simple
1 A B
2 Col1 Col2
3 il est bête mais il n'est pas méchant
4 c'h C'H
j'enregistre sous essai.ods
puis sous Texte Csv comme indiqué au dessus
j'obtiens le fichier texte essai.csv qui ouvert par gedit me visualise
Col1;Col2
il est bête;mais il n’est pas méchant
c’h;C’H
SAUF que quand je regarde le codage de l'apostrophe j'ai E2 80 99
avec GHEX , je demande la transformation de E2 80 99 en 27
visuellement ça ne change rien (par gedit)
maintenant je ré-ouvre ce fichier via libre office
j'accepte (ou je modifie) les options de séparateur : Point-virgule
libre office me visualise le fichier identiquement à ce que j'avais avant
1 A B
2 Col1 Col2
3 il est bête mais il n'est pas méchant
4 c'h C'H
là ça se corse
je ré-enregistre ce fichier en texte.csv sous essai2.csv
et je regarde le codage de l'apostrophe : 27 !!!!!!!!!!!!!!!!!!!
je résume la manip
fichier
enregistrement sous fichier.csv =====> aspostrophe codée E2 80 AA
modification de E2 80 AA en 27 dans ce fichier
ouverture de fichier.csv via libre office
enregistrement sous fichier2.csv ===> apostrophe codée 27
y-a-t-il une explication ? ET un remède !