Un mois après, j'ai réessayé. Cette fois, je suis sous Ubuntu jaunty. Avec tesseract installé par les dépôts Jaunty.
La fois précédente, j'étais sous Ubuntu intrepid, avec tesseract installé par le deb de b52.
J'ai donc de nouveau suivi la méthode indiquée
ici.
Donc, tesseract étant déjà installé, installation successive (ça prend pas loin d'une heure) de :
- iulib
- Leptonica
- OpenFST
- OCRopus
J'ai bloqué sur l'installation d'OCRopus.
"./configure" ne marche pas... ne produit pas de "make"... donc, impossible de lancer "make".
Il y a un mois, j'avais pu aller au bout. Je crois avoir l'explication :
- le tesseract des dépôts Ubuntu est nommé "tesseract-ocr"...
- alors qu'à l'origine (sur Google), tesseract se nomme seulement "tesseract"... et la compilation d'OCRopus, qui nécessite tesseract le cherche sous ce nom.
- donc, ça marche avec le paquet de b52 dans lequel tesseract est nommé "tesseract".
J'ai donc fait une seconde tentative sous Jaunty :
- suppression du tesseract-ocr des dépôts
- installation du tesseract de b52.
- reprise de l'installation d'OCRopus à partir de
./configure
puis
make
puis
sudo make install
Cette fois-ci, make a pu opérer... et sudo make install aussi... mais avec des erreurs affichées dans le terminal.
Résultat final pire que lors de la première expérience :
bash: ocroscript : commande introuvable
Conclusions :
1/ impossible pour l'instant avec cette méthode d'installer OCRopus sous Ubuntu jaunty si tesseract est installé à l'origine avec le tesseract-ocr des dépôts.
2/ impossible pour l'instant avec cette méthode d'installer OCRopus sous Ubuntu jaunty si tesseract est installé a posteriori avec le tesseract de b52.
3/ il est probable que ça ne marche pas non plus si les choses sont faites dans l'ordre en installant en premier tesseract avec le deb de b52... et en installant ensuite iulib et le reste. (c'est ce que j'avais fait il y a un mois)
4/ il reste à essayer cette solution : désinstaller tout tesseract installé par les dépôts ou par le deb de b52... et reprendre intégralement l'installation en commençant par l'installation de tesseract en le compilant, comme indiqué sur la page en question (dans ce cas, si ça marche, je suppose que ça ne marche que pour des texte en anglais... pour les texte en français, il faut en plus installer le paquet français en le compilant aussi (comme indiqué dans la doc Ubuntu sur tesseract)... et pas par les dépôts...).
A tester... plus tard 😛