Coucou les gens!
Au cas ou ça intéresse quelqu'un, j'ai développé un petit programme en Bash pour piloter
Tesseract et produire des PDF indexables à partir de mes factures et courriers administratifs.
Ça fonctionne plutôt bien donc je l'ai mis sur GitHub avec un petit paquet DEB pour ceux qui veulent tester :
https://github.com/RTDaemons/ocr-sh
Vos remarques et suggestions sont bienvenues! 🙂