Sujet sur Discussion utilisateur:SyB~Anicium/Structured Discussions Archive 1

Hsarrazin (discussioncontributions)

Salut,

je me suis attaquée à ce bouquin, issu du partenariat BNF. Comme la plupart de ces bouquins, ils proviennent de microfilms, et les marges blanches sont immenses, réduisant ainsi l'image du texte à un timbre-poste. L'ocr est par ailleurs plutôt bon.

Parmi tes nombreux outils de manipulation, aurais-tu la possibilité de retailler ces images, sans trop de mal, stp ? (et sans démonter le livre du site trop longtemps, vu qu'il fait partie du défi 5000)

Merci pour ton aide, si tu peux... sinon, tant pis, je ferai fonctionner la molette de zoom...

SyB~Anicium (discussioncontributions)
Hsarrazin (discussioncontributions)

ah ouais... les marges alternées droite/gauche ^^ bon courage ! j'ai un utilitaire pdf (Mac) qui permet de faire ce genre de découpage en l'appliquant juste aux pages paires/impaires... mais c'est toujours galère ^^

SyB~Anicium (discussioncontributions)

J'ai trouvé une autre solution : un logiciel de renommage ^^ J'ajoute une lettre avant le nom de chaque page paire, je les déplace dans un dossier. Et ainsi je traite les lots pair et impair séparément, avant de les regrouper à l'étape d'océrisation. Le logiciel c'est LupasRename, c'est pratique !

SyB~Anicium (discussioncontributions)

Fait Je suis heureux de voir que les tomes suivants présentent une marge raisonnable :)

SyB~Anicium (discussioncontributions)

J'ai dû repartir des images d'origines, et donc refaire l'OCR, mais ça m'a l'air très comparable en qualité, tu me diras à l'usage ;)

Hsarrazin (discussioncontributions)

Super ! merci ! déjà le texte est beaucoup plus facile à lire

et effectivement, ton ocr est très bon, et même bien meilleur ! - ma vitesse de relecture s'est considérablement accrue, et c'est un vrai plaisir de corriger ce bouquin !

SyB~Anicium (discussioncontributions)

Ravi d'avoir pu aider :)

Hsarrazin (discussioncontributions)

je rouvre ce sujet, juste pour te confirmer la qualité de ton OCR. Sur le volume 2, où tu n'es pas intervenu car il avait déjà les marges rognées, l'OCR est celui d'origine (de Gallica), et le temps de travail par page n'a rien à voir... c'est une à 2 minutes de plus par page, juste pour corriger les scanilles du type t à la place de l (une bonne douzaine par page, en moyenne)... ça n'est PAS un appel à ré-océriser, juste pour te confirmer la qualité de ton outil d'ocr

Bonne journée !

SyB~Anicium (discussioncontributions)

Merci pour ton commentaire :) Au final, je n'y suis pour rien, c'est Abbyy qui travaille, le plus dur c'est juste de rogner les marges. Cela m'encourage à le rentabiliser ^^ Quoique, il faudrait que je teste le tome 2 avec DjVuToy, peut-être serait-ce un peu mieux... Le seul souci d'Abby c'est qu'il me faut retourner à l'image de départ pour obtenir du bon résultat. Pour le Tome 2, courage, j'ai l'impression que certaines pages sont mieux que d'autres (celle-ci est propre comparée à mes Mémoires et procès-verbaux !)

Hsarrazin (discussioncontributions)
SyB~Anicium (discussioncontributions)

Pour paraphraser Boileau, "ce qui se lit bien se corrige aisément", je pense qu'un fac-similé bien découpé, bien océrisé, et bien installé sur sa page d'Index fait gagner un temps fou :) Et je ne doute pas que la qualité aille en s'améliorant ! La vérification des pages manquantes par exemple est de nature à économiser énormément d'efforts par la suite. N'hésite pas à me dire si tu vois un fac-similé en piteux état, j'essaierai d'y remédier ^^

Répondre à « Livre:Créquy - Souvenirs, tome 1.djvu »