Il suffit d'installer tesseract avec les paquets correspondants aux langues que l'on veut reconnaître.
Ensuite on traite l'image que le scanner a donné (jpg, : en noir et blanc, 300pp) par tesseract
tesseract fichier.jpg sortie -l eng
on obtient sortie.txt.
yagf donne une interface graphique à tesseract et permet de choisir une zone à traiter dans l'image.
On peut aussi utiliser cuneiform à la place de tesseract. Parfois le résultat est meilleur, suivant la qualité de l'original.
Cordialement,
Guy