@Sorbus
>>Voici quelques réponses : je scanne avec le logiciel cité plus haut en tiff (ou tif je ne sais plus, en tout cas avec le bon nombre de "f" pour ne pas poser problème 🙂 - j'ai lu la doc ubuntu 🙂
Ensuite j'utilise tesseract avec la ligne de commande (celle de la doc consacrée au package deb) ce qui me crée un fichier texte.
>>à propos de LaTeX, déjà qq mots. Je ne suis qu'un utilisateur lambda. Je me suis fait un gabarit que je modifie en fonction de mes textes. L'intérêt de LaTeX ici est qu'il ne tient pas compte de la mise en page du document texte créé.
Je m'explique: avec l'OCR on obtient des textes avec plein de fins de lignes au milieu de phrases. Avec OpenOffice, il faut les effacer et reconstituer le paragraphe, etc.
LaTeX voit un changement de ligne avec le signe "\" et un changement de paragraphe avec un saut de ligne tout bêtement (il crée lui-même le nouvel aliné, le retrait en tête de paragraphe et même les césures de mots selon les règles françaises et les exceptions).
Alors, quand dans un fichier texte on se retrouve avec plein de lignes coupées, lui ne voit à chaque fois qu'un espace ("une" espace en typographie d'ailleurs).
très pratique.
C'est un traitement de texte à balisage, comme quand on crée une page html (ça y ressemble beaucoup en plus - ex) "il est \textbf{important} de noter cela" indique que le mot "important" doit être en gras. Etc.
J'ai découvert LaTeX avec des cours LaTeX gratuits mis en ligne (avec google c'est facile).
Une fois qu'on a une page type, on copie-colle son texte et on rajoute les balises pour la mise en page.
On passe à la moulinette d'un interpréteur (kile sous ubuntu) son fichier texte rebaptisé .tex et cela sort un fichier *.dvi imprimable, très léger, ou un *.pdf, plus lourd mais aisément échangeable avec autrui.
voilà 🙂