Avec xsane ca marche pas. Lorsque tu dit "(choisir "Enregistrer" au lieu de "Visionneuse")..." Ca m'enregistre bien un fichier texte .......vide . A partir de cette manip, c'est un simple enregistrement de fichier txt, A quel moment l'ocr intervient?
tesseract intervient entre le moment où tu cliques sur "numériser" et l'enregistrement du fichier txt. Normalement, puisque le moteur de ROC travaille, il faut un peu de temps (5... à 30 secondes ou plus), selon la longueur du texte à reconnaitre). Un détail : le fichier .txt sort très vite, toujours, vide (au départ), mais on voit dans xsane, si l'installation est correcte et fonctionnelle, que ça travaille (la fenêtre principale d'xsane est "figée"; si celle-ci redevient accessible très vite, c'est mauvais signe : la ROC n'a pas fonctionné. Mais j'avais écrit :
"dans l'immédiat, ça ne résoudra pas ton problème". C'est simplement une méthode permettant d'arriver plus vite au but quand la combinaison xsane+xsane2tess+tesseract est fonctionnelle. Pour l'instant, chez toi, elle ne l'est pas encore semble-t-il.
en konsole avec xsane j'ai des mesg d'erreur du genre:
(xsane:7217): Gtk-CRITICAL **: gtk_widget_set_sensitive: assertion `GTK_IS_WIDGET (widget)' failed
mais ca l'empéche pas de marcher
C'est peu être la le probléme??
Peut-être bien. Le problème viendrait de ton installation de xsane, et non de tesseract, ni de xsane2tess. Je viens de faire cet essai avec xsane lancé dans le terminal
- numérisation d'un texte enregistré au format tiff.
Je n'ai aucun message d'erreur dans le terminal.
Puis directement en ligne de commande sur ce fichier .tiff (avec deux "f"), sans manip préalable avec gimp :
- tesseract fichier.tiff resultat -l spa
(oui, c'était un texte en espagnol, donc pas -l fra ;-)
Texte en police 10, de 3/4 d'un A4 environ... tesseract a tourné un peu plus de 15 secondes. Aucun message d'erreur... et le résultat est très correct.
Donc... quand tu écris
"mais ca l'empéche pas de marcher"... c'est sans doute vrai, mais xsane marche chez toi avec quelques dysfonctionnements :
- l'enregistrement au format .tiff n'est pas tout à fait correct,
- la ROC directe via xsane2tess au format txt ne se fait pas.
... ça ne vient pas de ton installation de tesseract, puisque tesseract fonctionne bien en ligne de commande
(avec une petite réserve : est-ce que les bons paquets libtiff sont installés sur ton ordinateur... il se peut que tesseract fonctionne bien chez moi sur les fichiers.tiff produits par xsane parce qu'il dispose de tous les libiff nécessaires.)
Pour essayer de contourner le problème, as-tu testé gscan2pdf ?