Ce site est optimisé pour être consulté depuis un navigateur moderne dans lequel JavaScript est activé.

[Script] pour renommer les fichiers avec problèmes d'accents

Hizoka

Quelle idée à la con de mettre de la couleur sur les différences :p

après 1h30 de test :

#! /bin/bash

# Définition des couleurs pour echo -e
FUSHIA="\033[1;35m"
BLEUFONCE="\033[1;34m"
ROUGE="\033[1;31m"
NOIR="\033[1;0m"


# Utiliser les arguments lu par le script
while getopts ":arfh" Option
do
	case $Option in
		# Si c'est l'option -a (all) alors on vérifie également le nom du dossier dans lequel on se trouve
		a ) arg_a="0" ;;		

		# Pour limiter la recherche uniquement au contenu du dossier et non aux sous dossiers
		r ) arg_r="-maxdepth 1" ;;

		# Si c'est l'option -f alors on ne fait une recherche que sur les fichiers
		f ) arg_f="-type f" ;;
		
		# Si c'est l'option -i alors voila quelques infos
		h ) echo -e "\n${FUSHIA}Options disponibles :
${FUSHIA}-a : ${BLEUFONCE}Permet de traiter également le nom du dossier courant. ${FUSHIA}Inutile avec -f.
${FUSHIA}-r : ${BLEUFONCE}Ne traite pas les sous dossiers, ne traite que les éléments présents dans le dossier courant.
${FUSHIA}-f : ${BLEUFONCE}Permet de ne traiter que les fichiers sans traiter les dossiers. ${FUSHIA}Inutile avec -a.${NOIR}\n" && exit 0 ;;

		# SI l'option n'existe pas, arrêt du script
		* ) echo -e "\n${ROUGE}Option indisponible, arret du script !${NOIR}\n" && exit 1 ;;		
	esac
done
shift $(($OPTIND - 1))

echo -e "${BLEUFONCE}Pour plus d'informations, utilisez l'option ${FUSHIA}-h${NOIR}."

sleep 1

# 1 - Recherche dans le dossier actuel
# 2 - Recherche d'abord les sous-fichiers
# 3 - Verifie arg_a, si indisponible alors cela sera : -mindepth 1
# 4 - Utilise arg_r si activé pour limité la recherche au dossier actuel sans les sous dossiers
# 5 - Utilise arg_f si activé pour limité la recherche aux fichiers
# find "${PWD}" -depth -mindepth -maxdepth -type
find "${PWD}" -depth -mindepth ${arg_a:-1} ${arg_r} ${arg_f} > /tmp/liste_originale.txt


# Iconv test chaque format jusqu'à l'arret par l'utilisateur
for code in "iso-8859-1" "CP437" "iso-8859-2" "iso-8859-3" "iso-8859-4" "iso-8859-5" "iso-8859-6" "iso-8859-7" "iso-8859-8" "iso-8859-9" "iso-8859-10" "iso-8859-11" "iso-8859-13" "iso-8859-14" "iso-8859-15" "iso-8859-16" "cp737" "cp775" "cp850" "cp852" "cp855" "cp856" "cp857" "cp860" "cp861" "cp862" "cp863" "cp864" "cp865" "cp866" "cp869" "cp874" "cp932" "cp936" "cp949" "cp950" "cp1250" "cp1251" "cp1252" "cp1253" "cp1254" "cp1255" "cp1256" "cp1257" "cp1258" 
do
	# Annonce le format utilisé
	echo -e "\n${BLEUFONCE}Test avec pour format original ${FUSHIA}${code}${NOIR}.\n"
	
	# Iconv crée un nouveau fichier avec le nouveau codage
	iconv -f ${code} -t UTF-8 /tmp/liste_originale.txt -o /tmp/liste_corrige.txt 2>/tmp/liste_erreur.txt

	# Si le fichier d'erreur de iconv n'est pas vide, on saute la boucle en cours
	if [[ -s /tmp/liste_erreur.txt ]]
	then
		# Annonce lque ce ne peut être ce format
		echo -e "${ROUGE}Il est certain que ce n'est pas le codage : ${code}.${NOIR}"

		# On saute ce format qui n'est pas le bon"
		continue
	fi
	
	# Compare les 2 fichiers et y supprime les lignes identiques dans les 2 fichiers
	cat /tmp/liste_originale.txt | while read ligne
	do
		fichier="${ligne##*/}"
				
		if [[ -n $(egrep "${fichier}$" /tmp/liste_corrige.txt) ]]
		then
			sed -i "/${fichier}$/d" /tmp/liste_corrige.txt
			sed -i "/${fichier}$/d" /tmp/liste_originale.txt
		fi		
	done
	
	# Suppression du fichier avec les differences couleurs
	if [[ -e /tmp/liste_couleur.txt ]]
	then
		rm /tmp/liste_couleur.txt
	fi
	
	# Calcul du nombre de ligne à faire sinon boucle à l'infinie
	max_ligne=$(wc -l /tmp/liste_originale.txt)
	
	# On boucle sur les lignes afin de les faire 1 à 1
	for (( a=1 ; a <= ${max_ligne%% *} ; a++ ))
	do
		# récupération de la ligne "a" à utiliser pour liste_originale.txt
		ligne_originale=$(sed -n ${a}p /tmp/liste_originale.txt)

		# récupération de la ligne "a" à utiliser pour liste_corrige.txt
		ligne_corigee=$(sed -n ${a}p /tmp/liste_corrige.txt)
		
		# Boucle sur les carac afin de les traiter 1 à 1 avec pour max le nombre de caractere de la ligne originale
		for (( b=0 ; b <= ${#ligne_originale} ; b++ ))
		do
			# Comparaison des caracteres entre eux
			if [[ "${ligne_originale:${b}:1}" == "${ligne_corigee:${b}:1}" ]]
			then
				# S'ils sont identiques on les envoie 1 à 1 dans le fichier /tmp/liste_couleur.txt
				echo -n "${ligne_corigee:${b}:1}" >> /tmp/liste_couleur.txt
			else
				# S'ils sont différent on les envoie 1 à 1 entouré de balise de couleur dans le fichier /tmp/liste_couleur.txt
				echo -n "${BLEUFONCE}${ligne_corigee:${b}:1}${NOIR}" >> /tmp/liste_couleur.txt
			fi	
		done
		
		# On fait un retour entre les lignes sinon tout se suit
		echo >> /tmp/liste_couleur.txt
	done
	
	# On charge les lignes avec cat mais on utilise
	echo -e "$(cat /tmp/liste_couleur.txt)"

	# On demande confirmation du résultat par l'utilisateur
	echo -e "\n${BLEUFONCE}Ce codage est-il le bon ?${NOIR}"
	read -p "[O]ui/[N]on/[E]xit : " codage_ok
	
	# Si l'utilisateur est ok avec le codage, on arrete la boucle
	# Si la variable codage_ok commence par "O" ou "o", c'est bon
	if [[ ${codage_ok} == [Oo]* ]]
	then
		# Arret de la boucle, on passe à la suite
		break

	elif [[ ${codage_ok} == [Ee]* ]]
	then
		# Suppression des fichiers txt
		rm /tmp/liste_originale.txt /tmp/liste_corrige.txt /tmp/liste_erreur.txt /tmp/liste_couleur.txt
		
		# Arret du script
		exit 1
	fi
done


# Si la boucle s'est terminée sans que l'utilisateur accepte l'encodage
if [[ ${codage_ok} != [Oo]* ]]
then
	echo -e "\n${ROUGE}Le script n'a pas réussis à trouver le bon codage original.
Désolé mais le script s'arrete là.${NOIR}\n"
	
	# Suppression des fichiers txt
	rm /tmp/liste_originale.txt /tmp/liste_corrige.txt /tmp/liste_erreur.txt /tmp/liste_couleur.txt
	
	# Arret du script
	exit 1
fi


# Un petit saut de ligne :)
echo

# Traite les adresses complétes origineles 1 par 1
cat /tmp/liste_originale.txt | while read nom
do
	# Récupération de l'adresse du fichier
	adresse_origine=${nom%/*}
	# Récupération du nom du fichier
	nom_origine=${nom##*/}

	# Récupération de l'adresse compléte
	corrige=$(head -1 /tmp/liste_corrige.txt)
	# Récupération du nouveau nom du fichier
	nom_corrige=${corrige##*/}

	# Si les 2 noms sont différents
	if [[ "${nom_origine}" != "${nom_corrige}" ]]
	then
		# Affiche l'ancienne adresse et la nouvelle
		echo -e "${BLEUFONCE}${nom_origine}${NOIR} devient ${FUSHIA}${nom_corrige}${NOIR}."
		
		# Renomme le fichier avec le nouveau nom
		mv "${nom}" "${adresse_origine}"/"${nom_corrige}"
	fi
	
	# On supprime la ligne venant d'être lue, la 1ere
	sed -i "1d" /tmp/liste_corrige.txt
done


# Suppression des fichiers txt
rm /tmp/liste_originale.txt /tmp/liste_corrige.txt /tmp/liste_erreur.txt /tmp/liste_couleur.txt


# Arret du script
exit 0

Screenshot :
Voila comment ça se présente sans option, donc dossiers et fichiers de façon récursif sans le dossier dans le quel on se trouve.

Option -f qui ne montre que les fichiers :

Option -r qui n'est pas récursif :

Options -r et -f, il n'affiche que les fichiers du dossier courant :

Option -a, traite également le dossier courant :

Options -r et -a, traite le dossier courant mais pas les sous-dossiers :

Option -h, une petite aide

Code qui m'a fait réfléchir a 2-3h du mat alors que je suis malade...

	# Calcul du nombre de ligne à faire sinon boucle à l'infinie
	max_ligne=$(wc -l /tmp/liste_originale.txt)
	
	# On boucle sur les lignes afin de les faire 1 à 1
	for (( a=1 ; a <= ${max_ligne%% *} ; a++ ))
	do
		# récupération de la ligne "a" à utiliser pour liste_originale.txt
		ligne_originale=$(sed -n ${a}p /tmp/liste_originale.txt)

		# récupération de la ligne "a" à utiliser pour liste_corrige.txt
		ligne_corigee=$(sed -n ${a}p /tmp/liste_corrige.txt)
		
		# Boucle sur les carac afin de les traiter 1 à 1 avec pour max le nombre de caractere de la ligne originale
		for (( b=0 ; b <= ${#ligne_originale} ; b++ ))
		do
			# Comparaison des caracteres entre eux
			if [[ "${ligne_originale:${b}:1}" == "${ligne_corigee:${b}:1}" ]]
			then
				# S'ils sont identiques on les envoie 1 à 1 dans le fichier /tmp/liste_couleur.txt
				echo -n "${ligne_corigee:${b}:1}" >> /tmp/liste_couleur.txt
			else
				# S'ils sont différent on les envoie 1 à 1 entouré de balise de couleur dans le fichier /tmp/liste_couleur.txt
				echo -n "${BLEUFONCE}${ligne_corigee:${b}:1}${NOIR}" >> /tmp/liste_couleur.txt
			fi	
		done
		
		# On fait un retour entre les lignes sinon tout se suit
		echo >> /tmp/liste_couleur.txt
	done
		
	# On charge les lignes avec cat mais on utilise
	echo -e "$(cat /tmp/liste_couleur.txt)"

je pense que tu devrait pouvoir le réutiliser (pas regarde pour ton script), mais en gros :

- Une boucle qui travaille sur les lignes des listes avec pour maximum le nombre de ligne d'un de ces fichiers (ils ont autant de lignes, car les lignes ne posant pas de problème ont été supprimé avant).

- On récupère les lignes à tester sur chaque liste (même ligne pour les 2)

- On crée une autre boucle qui travaille sur les caractères, 1 à 1

- On compare les caractères l'un par rapport à l'autre, s'ils sont identique, on les envoie comme ça dans un autre fichier, s'ils sont différents on les encadre des fonctions de couleur.

- On lit le nouveau fichier contenant les codes couleurs, je n'ai pas trouvé comment faire avec simplement echo ou cat, j'ai donc fais un mixe des 2.

- Ce fichier n'est utilisé bien évidemment que pour être affiché.

Voilou, si vous avez d'autres idées ou questions 🙂

PS : merci de me signaler les fautes :p

Un bug de vu mais je ne sais pas comment le résoudre en fait : si après modif on repasse le script, il ne sait plus lire les noms qui sont UTF-8...

Lapogne71

hizoka, je pense qu'on se rapproche de la perfection 😉

je vais étudier ton travail, mais un peu de patience 🙂 , bravo pour la modif sur les couleurs, c'est beaucoup plus agréable comme çà.

On va aussi peut-être éviter de poster toutes nos versions sur le forum afin de ne pas le polluer, mais en pensant bien à mettre à jour le post d'origine, c'est celui que tout le monde lit en premier et qui rassemble l'essentiel.

Hizoka

oui il faut mettre le 1er a jour mais je pense qu'il est toujours intéressant de poster nos évolution ca permet de voir des trucs pour les gens qui débute dans le bash.

après on peut toujours ajouter la possibilité de lancer le script avec une adresse autre que le dossier dans le quel on se trouve.

et je me disais en fait, qu'il serait surement plus simple pour le script que de base, il récupère également le nom du dossier courant pour le traité et que pour ne pas qu'il le fasse, ajouter l'option -a, surement mieux.

Hizoka

Hop ! encore des modifs :p

ligne 10 à 56

# Utiliser les arguments lu par le script
while getopts ":arfhe:" Option
do
	case $Option in
		# Si c'est l'option -a (all) alors on ne vérifie pas le nom du dossier dans lequel on se trouve
		a ) arg_a="-mindepth 1" ;;		

		# Pour limiter la recherche uniquement au contenu du dossier et non aux sous dossiers
		r ) arg_r="-maxdepth 1" ;;

		# Si c'est l'option -f alors on ne fait une recherche que sur les fichiers
		f ) arg_f="-type f" ;;
		
		# Si une adresse est donnée, on le verifie et on s'y rend
		e ) if [[ -e "${OPTARG}" ]]
			then
				cd "${OPTARG}"
			else
				echo -e "\n${ROUGE}Adresse invalide, arret du script !${NOIR}\n" && exit 1
			fi ;;
		
		# Si c'est l'option -i alors voila quelques infos
		h ) echo -e "\n${FUSHIA}De base ce script scan tous les fichiers et dossiers du dossier courant ainsi que le nom de ce dernier.

Options disponibles :
${FUSHIA}-a : ${BLEUFONCE}Permet de ne pas traiter le nom du dossier courant. ${FUSHIA}Inutile avec -f.
${FUSHIA}-r : ${BLEUFONCE}Ne traite pas les sous dossiers, ne traite que les éléments présents dans le dossier courant.
${FUSHIA}-f : ${BLEUFONCE}Permet de ne traiter que les fichiers sans traiter les dossiers. ${FUSHIA}Inutile avec -a.${NOIR}\n" && exit 0 ;;

		# SI l'option n'existe pas, arrêt du script
		* ) echo -e "\n${ROUGE}Option indisponible, arret du script !${NOIR}\n" && exit 1 ;;		
	esac
done
shift $(($OPTIND - 1))

echo -e "${BLEUFONCE}Pour plus d'informations, utilisez l'option ${FUSHIA}-h${NOIR}."

sleep 1

# 1 - Recherche dans le dossier actuel
# 2 - Recherche d'abord les sous-fichiers
# 3 - Verifie arg_a, si indisponible alors cela sera : -mindepth 1
# 4 - Utilise arg_r si activé pour limité la recherche au dossier actuel sans les sous dossiers
# 5 - Utilise arg_f si activé pour limité la recherche aux fichiers
# find "${PWD}" -depth -mindepth -maxdepth -type
find "${PWD}" -depth ${arg_a} ${arg_r} ${arg_f} > /tmp/liste_originale.txt

Modification des explications, ajout de la commande -e adresse qui lance le script dans ce dossier s'il existe.
De base il scan tout maintenant mais si on ne veut pas on ajout les limitations (a r f).

Hizoka

j'ai testé sur 500 fichiers, ça met pas mal de temps à afficher le résultat quand même...

EDIT : j'ai modifié mon code pour qu'il ne compare plus que les noms des fichiers et non les adresses pour les differences de caractere mis en couleur.

#!/bin/bash
###########
#
#

FUSHIA="\033[1;35m"
NOIR="\033[1;0m"
BLEUFONCE="\033[1;34m"
VERT="\033[1;32m"
ROUGE="\033[1;31m"
GRAS="\033[1m"

# Utiliser les arguments lu par le script
while getopts ":arfhe:" Option
do
	case $Option in
		# Si c'est l'option -a (all) alors on ne vérifie pas le nom du dossier dans lequel on se trouve
		a ) arg_a="-mindepth 1" ;;		

		# Pour limiter la recherche uniquement au contenu du dossier et non aux sous dossiers
		r ) arg_r="-maxdepth 1" ;;

		# Si c'est l'option -f alors on ne fait une recherche que sur les fichiers
		f ) arg_f="-type f" ;;
		
		# Si une adresse est donnée, on le verifie et on s'y rend
		e ) if [[ -e "${OPTARG}" ]]
			then
				cd "${OPTARG}"
			else
				echo -e "\n${ROUGE}Adresse invalide, arret du script !${NOIR}\n" && exit 1
			fi ;;
		
		# Si c'est l'option -i alors voila quelques infos
		h ) echo -e "\n${FUSHIA}De base ce script scan tous les fichiers et dossiers du dossier courant ainsi que le nom de ce dernier.

Options disponibles :
${FUSHIA}-a : ${BLEUFONCE}Permet de ne pas traiter le nom du dossier courant. ${FUSHIA}Inutile avec -f.
${FUSHIA}-r : ${BLEUFONCE}Ne traite pas les sous dossiers, ne traite que les éléments présents dans le dossier courant.
${FUSHIA}-f : ${BLEUFONCE}Permet de ne traiter que les fichiers sans traiter les dossiers. ${FUSHIA}Inutile avec -a.${NOIR}\n" && exit 0 ;;

		# SI l'option n'existe pas, arrêt du script
		* ) echo -e "\n${ROUGE}Option indisponible, arret du script !${NOIR}\n" && exit 1 ;;		
	esac
done
shift $(($OPTIND - 1))

echo -e "${BLEUFONCE}Pour plus d'informations, utilisez l'option ${FUSHIA}-h${NOIR}."

sleep 1

# 1 - Recherche dans le dossier actuel
# 2 - Recherche d'abord les sous-fichiers
# 3 - Verifie arg_a, si indisponible alors cela sera : -mindepth 1
# 4 - Utilise arg_r si activé pour limité la recherche au dossier actuel sans les sous dossiers
# 5 - Utilise arg_f si activé pour limité la recherche aux fichiers
# find "${PWD}" -depth -mindepth -maxdepth -type
find "${PWD}" -depth ${arg_a} ${arg_r} ${arg_f} > /tmp/liste_originale.txt


# Iconv test chaque format jusqu'à l'arret par l'utilisateur
for code in "iso-8859-1" "CP437" "iso-8859-2" "iso-8859-3" "iso-8859-4" "iso-8859-5" "iso-8859-6" "iso-8859-7" "iso-8859-8" "iso-8859-9" "iso-8859-10" "iso-8859-11" "iso-8859-13" "iso-8859-14" "iso-8859-15" "iso-8859-16" "cp737" "cp775" "cp850" "cp852" "cp855" "cp856" "cp857" "cp860" "cp861" "cp862" "cp863" "cp864" "cp865" "cp866" "cp869" "cp874" "cp932" "cp936" "cp949" "cp950" "cp1250" "cp1251" "cp1252" "cp1253" "cp1254" "cp1255" "cp1256" "cp1257" "cp1258" 
do
	# Annonce le format utilisé
	echo -e "\n${BLEUFONCE}Test avec pour format original ${FUSHIA}${code}${NOIR}.\n"
	
	# Iconv crée un nouveau fichier avec le nouveau codage
	iconv -f ${code} -t UTF-8 /tmp/liste_originale.txt -o /tmp/liste_corrige.txt 2>/tmp/liste_erreur.txt

	# Si le fichier d'erreur de iconv n'est pas vide, on saute la boucle en cours
	if [[ -s /tmp/liste_erreur.txt ]]
	then
		# Annonce lque ce ne peut être ce format
		echo -e "${ROUGE}Il est certain que ce n'est pas le codage : ${code}.${NOIR}"

		# On saute ce format qui n'est pas le bon"
		continue
	fi
	
	# Compare les 2 fichiers et y supprime les lignes identiques dans les 2 fichiers
	cat /tmp/liste_originale.txt | while read ligne
	do
		fichier="${ligne##*/}"
				
		if [[ -n $(egrep "${fichier}$" /tmp/liste_corrige.txt) ]]
		then
			sed -i "/${fichier}$/d" /tmp/liste_corrige.txt /tmp/liste_originale.txt
		fi		
	done
	
	# Suppression du fichier avec les differences couleurs
	if [[ -e /tmp/liste_couleur.txt ]]
	then
		rm /tmp/liste_couleur.txt
	fi
	
	# Calcul du nombre de ligne à faire sinon boucle à l'infinie
	max_ligne=$(wc -l /tmp/liste_originale.txt)
	
	# On boucle sur les lignes afin de les faire 1 à 1
	for (( a=1 ; a <= ${max_ligne%% *} ; a++ ))
	do
		# remplacement des espaces par des @, on met des espaces entre chaque caractére pour la ligne du texte original
		ligne_originale=$(sed -n ${a}p /tmp/liste_originale.txt)
		adresse_originale="${ligne_originale%/*}"
		nom_fichier_original="${ligne_originale##*/}"

		# remplacement des espaces par des @, on met des espaces entre chaque caractére pour la ligne du texte corrigé
		ligne_corigee=$(sed -n ${a}p /tmp/liste_corrige.txt)
		nom_fichier_corigee="${ligne_corigee##*/}"
		
		echo -n "${adresse_originale}/" >> /tmp/liste_couleur.txt
		
		# Boucle sur les carac afin de les traiter 1 à 1 avec pour max le nombre de caractere de la ligne originale
		for (( b=0 ; b <= ${#ligne_originale} ; b++ ))
		do			
			# Comparaison des caracteres entre eux
			if [[ "${nom_fichier_original:${b}:1}" == "${nom_fichier_corigee:${b}:1}" ]]
			then
				# S'ils sont identiques on les envoie 1 à 1 dans le fichier /tmp/liste_couleur.txt
				echo -n "${nom_fichier_corigee:${b}:1}" >> /tmp/liste_couleur.txt
			else
				# S'ils sont différent on les envoie 1 à 1 entouré de balise de couleur dans le fichier /tmp/liste_couleur.txt
				echo -n "${BLEUFONCE}${nom_fichier_corigee:${b}:1}${NOIR}" >> /tmp/liste_couleur.txt
			fi	
		done
		
		# On fait un retour entre les lignes sinon tout se suit
		echo >> /tmp/liste_couleur.txt
	done
	
	# On charge les lignes avec cat mais on utilise
	echo -e "$(cat /tmp/liste_couleur.txt)"

	# On demande confirmation du résultat par l'utilisateur
	echo -e "\n${BLEUFONCE}Ce codage est-il le bon ?${NOIR}"
	read -p "[O]ui/[N]on/[E]xit : " codage_ok
	
	# Si l'utilisateur est ok avec le codage, on arrete la boucle
	# Si la variable codage_ok commence par "O" ou "o", c'est bon
	if [[ ${codage_ok} == [Oo]* ]]
	then
		# Arret de la boucle, on passe à la suite
		break

	elif [[ ${codage_ok} == [Ee]* ]]
	then
		# Suppression des fichiers txt
		rm /tmp/liste_originale.txt /tmp/liste_corrige.txt /tmp/liste_erreur.txt /tmp/liste_couleur.txt
		
		# Arret du script
		exit 1
	fi
done


# Si la boucle s'est terminée sans que l'utilisateur accepte l'encodage
if [[ ${codage_ok} != [Oo]* ]]
then
	echo -e "\n${ROUGE}Le script n'a pas réussis à trouver le bon codage original.
Désolé mais le script s'arrete là.${NOIR}\n"
	
	# Suppression des fichiers txt
	rm /tmp/liste_originale.txt /tmp/liste_corrige.txt /tmp/liste_erreur.txt /tmp/liste_couleur.txt
	
	# Arret du script
	exit 1
fi


# Un petit saut de ligne :)
echo

# Traite les adresses complétes origineles 1 par 1
cat /tmp/liste_originale.txt | while read nom
do
	# Récupération de l'adresse du fichier
	adresse_origine=${nom%/*}
	# Récupération du nom du fichier
	nom_origine=${nom##*/}

	# Récupération de l'adresse compléte
	corrige=$(head -1 /tmp/liste_corrige.txt)
	# Récupération du nouveau nom du fichier
	nom_corrige=${corrige##*/}

	# Affiche l'ancienne adresse et la nouvelle
	echo -e "${BLEUFONCE}${nom_origine}${NOIR} devient ${FUSHIA}${nom_corrige}${NOIR}."
		
	# Renomme le fichier avec le nouveau nom
	mv "${nom}" "${adresse_origine}"/"${nom_corrige}"
	
	# On supprime la ligne venant d'être lue, la 1ere
	sed -i "1d" /tmp/liste_corrige.txt
done


# Suppression des fichiers txt
rm /tmp/liste_originale.txt /tmp/liste_corrige.txt /tmp/liste_erreur.txt /tmp/liste_couleur.txt

Lapogne71

Hizoka a écritj'ai testé sur 500 fichiers, ça met pas mal de temps à afficher le résultat quand même...

Pourrais-tu plutôt mettre en ligne le script complet (un peu comme je l'ai fait 🙂 ) avec éventuellement un fichier zip de tests que tu trouverais plus significatif que le mien...

Sachant que pour moi le but (retrouver les caractères accentués) est quand même largement atteint, avec ton script ou le mien 🙂

Hizoka

le code est juste au dessus.

par contre j'ai quand même un bug...
si on scan des fichiers déjà en UTF8 accentués, il veut nous les transformer en caractères illisibles...

du coup je me dis : je lance un 1er iconv en utf8 pour qu'il supprime directement les lignes identiques mais il me fait un message d'erreur car il y a des caractères (les corrompus) non compatible UTF-8...

du coup ça veut dire qu'il ne faut pas l'utiliser dans un dossier contenant des fautes et des caractères particuliers normaux...

une idée ?

Lapogne71

Hizoka a écritdu coup ça veut dire qu'il ne faut pas l'utiliser dans un dossier contenant des fautes et des caractères particuliers normaux...

une idée ?

C'est ce que je disais dans le post d'origine :

Lapogne71 a écritInconvénients : - l'outil utilisé 'iconv' ne différencie pas les noms de fichiers "valides avec accents" des noms de fichiers "invalides" ==> il modifiera les noms de fichiers avec accents même si ceux-ci sont corrects ==> attention à bien vérifier que votre dossier soit homogène

Au contraire, convmv fait bien la distinction 🙂

"Une idée ? " ==> c'est surement parce que iconv travaille avec un flux de texte (il est au départ fait pour traiter le contenu d'un fichier, et pas son nom), alors que convmv doit travailler (si je ne me trompe pas !) avec le système de fichiers et les noms de fichiers.

Hizoka

mince ça va être difficile alors...

TOXIC

Ok, alors j'avoue ne pas avoir eu le courage de tout lire... Mais...

1/ MERCI oh merci ! Ca m'a déjà bien aidé !
2/ J'ai un petit soucis car j'ai utilisé la version du premier post (le premier lien, car j'ai besoin de récursif) et je ne sais pas si c'est la dernière version et la mieux...
3/ J'ai un soucis : ca fait des erreurs :

perl: warning: Setting locale failed.
perl: warning: Please check that your locale settings:
	LANGUAGE = (unset),
	LC_ALL = (unset),

Alors comme je ne suis pas un crack de PERL, je ne sait pas quoi faire...

Ensuite, comme c'est un truc super utile, j'aimerais vraiment qu'on essaye de tenir le premier post à jour pour proposer les dernières versions... Ou si quelqu'un peut me pointer vers un endroit pour rester à jour... 😉

D'avance merci, et déjà merci pour tout le bien que ce script m'a fait !!!

Edit :

Il semblerait qu'un "banal" export LC_ALL="fr_FR.UTF8" ait suffit a faire disparaitre le message d'erreur... En espérant maintenant que le script qui ne trouve aucun fichier mal codé ne se trompe pas... Je lance la copie, résultat dans 22h pour savoir si le script aurait oublié des fichiers mal codés....

Hizoka

tu peux tester également avec mon script (message 45).

comme ça tu pourra faire un retour 🙂 (il prend le recursif aussi)

Lapogne71

TOXIC a écritOk, alors j'avoue ne pas avoir eu le courage de tout lire... Mais...

3/ J'ai un soucis : ca fait des erreurs :
perl: warning: Setting locale failed.
perl: warning: Please check that your locale settings:
	LANGUAGE = (unset),
	LC_ALL = (unset),
Alors comme je ne suis pas un crack de PERL, je ne sait pas quoi faire...

Edit :

Il semblerait qu'un "banal" export LC_ALL="fr_FR.UTF8" ait suffit a faire disparaitre le message d'erreur... En espérant maintenant que le script qui ne trouve aucun fichier mal codé ne se trompe pas... Je lance la copie, résultat dans 22h pour savoir si le script aurait oublié des fichiers mal codés....

Concernant les erreurs de Perl, c'est certainement comme tu le mentionnes un problème de "locale" : chez moi la commande "locale" (à taper dans un terminal) me retourne que des valeurs = "fr_FR.UTF-8" , sauf LC_ALL qui est vide.

Que utilises l'un ou l'autre script, en récursif, veilles bien à ce que le résultat affiché soit cohérent, c'est à dire que tous les caractères accentués (dans l'affichage de la simulation) soient restitués. Je pense dans tout les cas qu'il faut éviter d'appliquer le programme récursivement sur des dossiers/fichiers provenant de différentes sources (windows, mac, zip , ...)

Exemples : 1) tu récupères sur ubuntu un zip contenant toute une partition windows et tu la décompresses
==> tu peux faire une conversion récursive
2) tu as sur ubuntu un dossier "download" qui accueille tout tes téléchargements (du web, de ton email, de tes vieux CDR archivés...)
==> pas de conversion récursive !!! il risque d'y avoir plusieurs encodages de caractères en jeu !

Hizoka

en effet, dans le 1er cas, je pense que mon script est plus pratique, dans le 2 eme c'est plutot le tien 🙂

Hizoka

bon bah j'ai mixé les 2 scripts...

cela utilise convmv mais affiche les différences :

#!/bin/bash

### Variables ###

VERSION="v0.04"

# Couleurs du texte affiché dans le shell
FUSHIA="\033[1;35m"
NOIR="\033[1;0m"
BLEU="\033[1;34m"
VERT="\033[1;32m"
ROUGE="\033[1;31m"

# Liste des encodages les plus courants
CODES_LIST="iso-8859-1 iso-8859-2 iso-8859-3 iso-8859-4 iso-8859-5 iso-8859-6 iso-8859-7 iso-8859-8 iso-8859-9 iso-8859-10 iso-8859-11 iso-8859-13 iso-8859-14 iso-8859-15 iso-8859-16 cp437 cp737 cp775 cp850 cp852 cp855 cp856 cp857 cp860 cp861 cp862 cp863 cp864 cp865 cp866 cp869 cp874 cp932 cp936 cp949 cp950 cp1250 cp1251 cp1252 cp1253 cp1254 cp1255 cp1256 cp1257 cp1258" 



### Intro ###

echo -e "
----------------------------------------------------------
 ${BLEU}Ce script permet de lancer en boucle l'utilitaire convmv qui 
 permet de convertir les noms de fichiers codés en autre chose 
 que UTF-8 vers UTF-8. Relancer le script avec l'argument
 ALLCODES si jamais aucun résultat n'a été trouvé.
 
 ${FUSHIA}Version ${VERSION}${NOIR}
----------------------------------------------------------"

# Vérification de l'existence de convmv
if [[ -z $(dpkg -l | egrep "^ii  convmv") ]]
then
	echo -e "\n${ROUGE}Le logiciel convmv n'est pas installé, il est nécessaire à ce script, faut-il l'installer ?${NOIR}"

	# Propose l'installation direct du logiciel
	read -p "[O]ui [N]on" confirmation_installation

	# Verifie le choix de l'installation du logiciel
	if [[ ${confirmation_installation} == [OoYy]* ]]
	then
		sudo apt-get -y --force-yes install convmv

	else
		exit
	fi
fi


# Pour boucler sur tous les codepages supportés par convmv, il faut mettre ALLCODES en argument
if [[ "${1}" = "ALLCODES" ]]
then
	# Affecte tous les codages connus de convmv à la variable CODES_LIST
	CODES_LIST=$(convmv --list | tr '\n' ' ')
fi


# Demande de l'utilisation de la récursivité
echo
read -p "Voulez-vous agir de façon recursive (modification des sous dossiers) ? [O]ui [N]on [E]xit : " RECURSIVITE

if [[ ${RECURSIVITE} == [Ee]* ]]
then
	echo -e "\n${ROUGE}Arret du script.${NOIR}\n"
	exit

elif [[ ${RECURSIVITE} == [Oo]* ]]
then
	OPTION_R="-r"
fi



### Boucle principale ###

for CODAGE in ${CODES_LIST}
do
	echo -e "\n${BLEU}Hypothèse du codage : ${FUSHIA}${CODAGE}${NOIR}"

	# Recher des fichiers n'etant pas en UTF-8
	LISTE_FICHIER=$(convmv -f ${CODAGE} -t utf-8 ${OPTION_R} * 2>&1 | egrep "^mv ")

	# Vérifie qu'il y ait bien des fichiers à renommer
	if [[ -z ${LISTE_FICHIER} ]]
	then
		echo -e "\n${ROUGE}Aucun nom de fichier à convertir.${NOIR}\n"
		exit

	else
		# Nombre de fichier à renommer
		NOMBRE_FICHIERS=$(echo "${LISTE_FICHIER}" | wc -l)
		echo -e "\n${FUSHIA}${NOMBRE_FICHIERS}${NOIR} fichiers à convertir."
	fi

	for ((i=1; i<=${NOMBRE_FICHIERS}; i++))
	do
		LIGNE=$(sed -n ${i}p <<< "${LISTE_FICHIER}")

		# Récupération du nom corrompu
		ANCIEN_NOM=$(cut -f2 -d '"' <<< "${LIGNE}")

		# Récupération du nom corrigé
		NOUVEAU_NOM=$(cut -f4 -d '"' <<< "${LIGNE}")

		echo -n -e "\n${VERT}Convertion de ${NOIR}"

		for (( x=0 ; x <= ${#ANCIEN_NOM} ; x++ ))
		do
			LETTRE_ORIGINALE=${ANCIEN_NOM:${x}:1}
			LETTRE_CORRIGEE=${NOUVEAU_NOM:${x}:1}

			# Comparaison des caracteres entre eux
			if [[ "${LETTRE_ORIGINALE}" == "${LETTRE_CORRIGEE}" ]]
			then
				echo -n -e "${LETTRE_ORIGINALE}"
			else
				echo -n -e "${BLEU}${LETTRE_ORIGINALE}${NOIR}"
			fi
		done

		echo -n -e "${VERT} en ${NOIR}"

		for (( x=0 ; x <= ${#ANCIEN_NOM} ; x++ ))
		do
			LETTRE_ORIGINALE=${ANCIEN_NOM:${x}:1}
			LETTRE_CORRIGEE=${NOUVEAU_NOM:${x}:1}

			# Comparaison des caracteres entre eux
			if [[ "${LETTRE_ORIGINALE}" == "${LETTRE_CORRIGEE}" ]]
			then
				echo -n -e "${LETTRE_CORRIGEE}"
			else
				echo -n -e "${FUSHIA}${LETTRE_CORRIGEE}${NOIR}"
			fi
		done

	done

	# Demande de confirmation du codage à utiliser
	echo -e "\n${FUSHIA}${NOMBRE_FICHIERS}${NOIR} fichiers à convertir."

	read -p "Ce codage est-il le bon ? [O]ui [N]on [E]xit : " BON_CODAGE

	if [[ ${BON_CODAGE} == [Ee]* ]]
	then
		echo -e "\n${ROUGE}Arret du script.${NOIR}\n"
		exit

	elif [[ ${BON_CODAGE} == [OoYy]* ]]
	then
		convmv -f ${CODAGE} -t utf-8 ${OPTION_R} * --notest &>/dev/null

		# Vérification de l'abscence de fichier corrompu
		if [[ -z $(convmv -f ${CODAGE} -t utf-8 ${OPTION_R} * 2>&1 | egrep "^mv ") ]]
		then
			echo -e "\n${BLEU}Tous les fichiers ont été renommés.${NOIR}\n"
			exit

		else
			echo -e "\n${ROUGE}Tous les fichiers n'ont pas été renommés.${NOIR}\n"
			exit
		fi
	fi

	# Mise au propre du terminal
	clear
done

y a une certaine différence de temps entre avec et sans les couleurs de différences mais avec un test de 700 fichiers à modifier, l'affichage à durer 30sec...

Lapogne71

Tu as du y passer du temps !

Il faudrait juste apporter une correction à la ligne

if [[ -z $(dpkg -l | egrep "^ii dialog") ]]

et remplacer dialog par convmv (même si je suis pas trop fan des "sudo" dans un script, un plaisantin pourrait inclure des "sudo rm" bien cachés dans le script ... 🙂 )

Ensuite il y a un bug mais çà vient directement de convmv : au moment où tu affiches les différences en couleurs, lorsque 2 dossiers imbriqués ont des caractères invalides, convmv ne propose la correction que sur le 2eme dossier.

Merci d'avoir relevé le défi d'afficher les couleurs, c'est beaucoup plus lisible !

En tout cas félicitations, çà märche sûpèr bîën ! 😉

Hizoka

merci pour la faute,

pour le bug, je l'avais remarqué mais c'est pas franchement gênant 🙂

après quelques test, il en ressort que convmv est bien plus pratique.

voilou, ce fut un plaisir 🙂

On peut peut-être créer une page sur la doc ?

twocats

if [[ -z $(dpkg -l | egrep "^ii  convmv") ]]
then

préfères :

if ! type -p convmv >/dev/null 2>&1
then

plus court et plus portable.

Matthieu20

Merci beaucoup Lapogne71 et hizoka pour la création de ces 2 scripts très utile.

Lapogne71

Matthieu20 a écritMerci beaucoup Lapogne71 et hizoka pour la création de ces 2 scripts très utile.

Je viens de mettre à jour le post d'origine afin de prendre en compte la dernière version du script d'hizoka et les captures d'écran correspondantes.

FreelY

Salut

Merci à vous deux pour ces super scripts bien pratique!

Hizoka il n'y a pas de comparaison avant de d'effectuer les modifications je trouve ça bien dommage/dangereux.
Et c'est pas une critique mais il est vraiment accès pour les unbuteros (je sais c'est un forum ubuntu...).

line 32: dpkg : commande introuvable
Le logiciel convmv n'est pas installé, il est nécessaire à ce script, faut-il l'installer ?  

Non non c'est déjà fait :p

J'adopte donc celui de Lapogne71 mais petite question:

Comment faire pour avoir ceci (afin de vérifier plus simplement les changements car j'ai "énormément" de fichiers à convertir).

Nom du fichier original 
...
Nom du fichier converti
...
Nom du fichier original
... 
Nom du fichier converti
...
ect ect
Codage trouvé ?

Et pas cela:

Noms de fichiers originaux codés
... liste de tout les fichiers originaux   
Noms de fichiers convertis
... liste de tout les fichiers convertis
Codage trouvé ?

D'avance merci 😉

« Page précédente Page suivante »