Bonsoir,
Voilà, le fichier Fichier:Le Petit Bourguignon-Arsène Lupin-Test.djvu est finalisé. Comme je l'ai dit, j'ai eu un mal fou à rajouter la couche texte:
- En OCRisant les images du fichier, cela donnait un résultat pitoyable car certaines images sont trop claires, trop foncées, ou ont des lignes noires en haut, à gauche, à droite et cela donnait un peut de tout.
- Du coup, comme on avait le texte déjà là, à peu de choses près, c'est ce texte que j'ai mis dans la couche texte du DjVu
- Comme je ne suis pas du tout perl, mais plutôt python, je me suis réécrit le djvu-ocr.pl en python
- Mais ce script faisant son boulot de A à Z sans interruption, pour pouvoir insérer ma proche couche texte intermédiaire, je l'ai scindé en 2 scripts distincts: l'un DjVu->OCR->FichierTexte et le second Fichier texte-> Insertion->DjVu; et donc j'en ai profité pour faire des retouches à ce fichier intermédiaire.
- Le second script me mangeait des lignes blanches de temps en temps; comme il rajoutait la couche texte par ligne comme ceci :
(page 0 0 1 1
(line 0 0 1 1 "toto")
(line 0 0 1 1 "toto la la")
)
je l'ai transformé pour que la couche texte soit désormais au niveau page:
(page 0 0 1 1
"toto
toto la la")
)
et là c'est beaucoup mieux, en tout cas pour moi.
- J'ai inséré (ai-je le droit ?) une couverture avec uniquement des éléments titre/auteur/nom journal/dates prises dans le journal le petit bourguignon: car c'est plus sympa d'avoir un pdf ou epub avec une couverture
et je crois que j'ai fait le tour de mes déboires... Je vais uploader le fichier sur Commons et faire supprimer celui-là. ~~~~.
Fichier sur Commons ► Fichier:Leblanc_-_Arsène_Lupin_contre_Herlock_Sholmes,_1908.djvu