Discussion Livre:Ferrier - Chez l'avocat.djvu

Dernier commentaire : il y a 4 ans par Hsarrazin

Notification Hsarrazin : Bonjour Hélène,

J'ai bien réussi à récupérer le "pdf" depuis Gallica, le transformer en "djvu", l'importer dans Commons, puis créer le livre sur WS… mais… je m'apperçois au final qu'il n'y a pas d'OCR !

Est-ce moi qui ait raté une manip, ou bien il n'y avait vraiment par d'OCR disponible dans Gallica ?

merci d'avance pour ta réponse.

a+ Laurent --Lorlam (d) 21 août 2019 à 22:43 (UTC)Répondre

Notification Hsarrazin : Re-Bonjour Hélène,
En fait, je viens de voir qu'il existait au moins des pages avec OCR chez Hathi Trust, ici : https://babel.hathitrust.org/cgi/pt?id=inu.30000003095340&view=1up&seq=11
C'est toujours mieux que rien... mais je suppose que je vais devoir recopier le contenu page par page... A moins qu'il y ait mieux à faire ???
a+ Laurent --Lorlam (d) 22 août 2019 à 07:31 (UTC)Répondre
Notification Lorlam :
tu peux faire comme ça effectivement... recopier depuis le texte... mais tu peux aussi demander un ocr en mettant le bouquin en Catégorie:Livres sans couche texte et en demandant sur le Scriptorium si quelqu'un peut l'océriser pour toi Clin d'œil --Hélène (dite ''le bot de service'') (d) 22 août 2019 à 07:41 (UTC)Répondre
Notification Hsarrazin : Je pense que je vais faire la recopie "à la main"... par contre, tu me confirme qu'il n'y avait pas d'OCR sur la page Gallica d'origine, ou bien c'est moi qui ai raté quelquechose ??? --Lorlam (d) 22 août 2019 à 07:47 (UTC)Répondre
Notification Lorlam : il n'y a effectivement pas d'OCR sur le scan Gallica (ce qui est facile à vérifier, puisque tu n'as pas l'option "T" dans les formats d'affichage du livre...
autre possibilité : utiliser l'ocr de wikisource, page par page... le résultat est bon sur certains livres, pas sur d'autres... et c'est assez long... mais quand il n'y a pas trop de pages, c'est parfois commode... je viens de tester sur Page:Ferrier - Chez l'avocat.djvu/14 Clin d'œil --Hélène (dite ''le bot de service'') (d) 22 août 2019 à 07:52 (UTC)Répondre
Notification Hsarrazin : Ah... utiliser l'ocr de wikisource... je veux bien essayer car je ne l'ai jamais fait, et que je ne connaissais d'ailleurs pas cette possibilité ! comment ça marche ? c'est l'option "OCR" dans le bandeau en haut des pages en mode édition ? je viens d'essayer de cliquer dessus sur la page 7, mais j'ai une page grisée et rien ne se passe... c'est vraiment très très très long, ou bien il y a une manip particulière pour lancer cet OCR ?
Notification Hsarrazin : Comme je n'y arrive pas, je vais commencer à recopier "à la main" depuis Hathi Trust, mais à l'occasion, je veux bien que tu m'explique comment "marche" l'OCR de WS... merci d'avance, a+ Laurent --Lorlam (d) 22 août 2019 à 09:35 (UTC)Répondre
Notification Lorlam :... tout bête... en mode Edition de la page, tu as un bouton "OCR" sur la première ligne (à côté du Typo et des autres). Tu cliques dessus... la page vide passe en "grisé"... et ça mouline pendant un temps plus ou moins long (parfois quelques secondes, parfois quelques minutes)... (ne touchez à rien tant que le fond de page est gris) puis le texte s'affiche... si le résultat est bon, tu peux corriger directement derrière... s'il est mauvais, il vaut mieux recopier depuis une autre source... - tu peux facilement mettre plusieurs pages à océriser simultanément en les ouvrant dans plusieurs onglets... --Hélène (dite ''le bot de service'') (d) 22 août 2019 à 10:49 (UTC)Répondre
Revenir à la page « Ferrier - Chez l'avocat.djvu ».