Sujet sur Discussion utilisateur:Ernest-Mtl

Hsarrazin (discussioncontributions)

Salut Ernest,

En voulant mettre en place les images, je me suis aperçue qu'il manque un certain nombre de pages d'illustrations dans le fac-simile. J'ai donc cessé de transclure les proverbes avec récit quand j'ai constaté le problème, pour limiter la casse...

En consultant le même livre dans un autre facsimile, on peut retrouver la place des illustrations manquantes : voir Google

Ainsi j’ai repéré les proverbes illustrés qui manquent dans le fac-simile.  La position où devraient se trouver lesdits proverbes est indiquée par cette table. Les images doivent être positionnées juste avant le numéro de page indiqué, avec une page avant.

  • Les loups ne se mangent pas
  • Tel maître tel valet, doit venir après la page 168 puis une page blanche… (donc entre 168 et 169)
  • Chacun prend son plaisir où il le trouve
  • Il n’y a pas de sot métier
  • Bonjour Lunettes, adieu Fillettes
  • Triste maison que celle où le Coq se tait et où la Poule chante
  • La faim chasse le Loup du bois

J’espère que c’est faisable sans trop de difficultés, et surtout que toutes les pages sont bien dans le 2e facsimile.

Malheureusement, comme beaucoup de pages ont déjà été corrigées, cela impliquera un renommage important.

Si tu veux bien t'en occuper quand tu auras le temps, pour mettre les images en place, je veux bien participer au renommage pour t'alléger la galère

Je préviens aussi @Kaviraf, qui fait la correction pour éviter les problèmes en renumérotant.

--Hélène (d) 6 février 2017 à 23:12 (UTC)

Kaviraf (discussioncontributions)

@Hsarrazin @Ernt-Mtl

oui, je me suis aperçue du décalage des illustrations. C'est pour cela que j'avais arrêté le nr. Merci à tous les deux de vous impliquer dans l'élaboration / correction de cet ouvrage.

Newnewlaw (discussioncontributions)
Shev123 (discussioncontributions)

Bonjour,

A partir des indications de Newnewlaw, j'ai importé les pages manquantes et il y a donc pas mal de pages à renommer et le sommaire est à refaire...

Hsarrazin (discussioncontributions)

je veux bien renuméroter les pages, une fois que la pagination du facsimile sera refaite : c'est infernal d'essayer de trouver la bonne page comme ça…

Newnewlaw (discussioncontributions)

Je tente le coup de refaire la pagination. Je vais voir si j'y arrive. Merci à tous pour votre collaboration sur ce travail. C'est du bon boulot.

Newnewlaw (discussioncontributions)

Le fichier corrigé, il reste quelques problèmes (les commentaires suivants concernent le fichier image).

  • Avant les folios 237, 464 il est censé y avoir une feuille blanche. (Pages à ajouter)
  • Les folios 226, 265, 285, 295, 305, 315, 325, 345, 355, 365, 375, 385, 425, 435, 445, 473, 483, 493, 503 sont en trop. (Pages à supprimer)
  • Le folio 335 devrait être remplacé par une feuille blanche. Le folio 366 devrait être remplacé par la gravure ici. Le folio 397 devrait contenir le texte de la page 305 (Pages à remplacer)
Hsarrazin (discussioncontributions)

je ne comprends rien à la double pagination sur la page d'index. La 2e c'est le numéro des pages du djvu, c'est ça ? à quoi ça sert de la mettre là... pour renommer, j'ai besoin du numéro des pages du livre… :/

Newnewlaw (discussioncontributions)

Non, la deuxième version n'est pas terminée, l'objectif était de faire une pagination du fichier texte pour déplacer tous les textes déjà écrit et ne pas être obligé de tout réécrire.

Hsarrazin (discussioncontributions)

Une fois le scan complètement d'aplomb, et la pagination du fs conforme au livre, je me débrouillerai pour repaginer... (je commence à avoir une certaine habitude)...

2 paginations, c'est une de trop... ou alors je n'ai pas compris ce que tu veux dire ^^

Newnewlaw (discussioncontributions)

Tu as raison, si tu t'y colle, je te laisse faire.

Shev123 (discussioncontributions)
Hsarrazin (discussioncontributions)

Merci @Newnewlaw

donc, tu me dis que ça n'est pas la peine que je renomme les pages, vu qu'il va encore falloir faire des modifications (les pages blanches, on peut les ignorer en les passant en gris, mais le reste…) ?

Newnewlaw (discussioncontributions)

Ok, c'est vrai que le message précédent n'était pas très clair. Alors, je tiens compte des commentaires précédents. Pas de références aux feuilles blanches à ajouter ou à des erreurs du fichier sur lesquelles ont peut passer :

  • Modifier photo 366 pour y inclure le texte de la page 281 du livre physique. (je sais pas comment on récupère un texte de google)
  • Modifier photo 397 pour y inclure la page 305.
Hsarrazin (discussioncontributions)

peux-tu me confirmer que ces modifications n'implique aucune insertion de nouvelle image ? je souhaite savoir si je peux commencer à renommer, ou s'il faut que j'attende... vu que renuméroter 2 fois, c'est une de trop :D

Newnewlaw (discussioncontributions)

Je confirme, le fichier ne nécessite aucune nouvelle page en plus. Cependant, il faut modifier 2 pages (cf texte précedent) qui contiennent la mauvaise image.

Shev123 (discussioncontributions)

Désolé mais je ne comprends toujours pas. Pour info, il y a un outil très simple de modification de djvu (DjVuToy) et un tuto a été fait (Scriptorium de novembre).

Newnewlaw (discussioncontributions)

Comme tu peux le voir sur la liste des pages du fichier ici, il reste quelques erreurs.

En dehors de quelques pages en double, de feuilles blanches en moins ou en plus.

Il faudrait :

  • photos 0 à 365 : NE RIEN MODIFIER
  • photo 366 : à REFAIRE pour y inclure la page 281 de ce fichier.
  • photo 367 à 396 : NE RIEN MODIFIER
  • photo 397 : à REFAIRE pour y inclure la page 305 de ce fichier.
  • photo 398 à la fin : NE RIEN MODIFIER.

Merci pour le lien vers le tuto. Je le garde ici.

Hsarrazin (discussioncontributions)

@Newnewlaw : je n'ai pas trop compris la manoeuvre  : la page 281 de Google est déjà et la page 305 de Google est ... ou bien est-ce que @Shev123 a déjà fait le boulot ?

merci de me signaler quand je peux commencer le renommage des pages... ça va prendre un moment... :D

Shev123 (discussioncontributions)

Je n'ai rien fait pour le moment... mais je peux le faire maintenant

Hsarrazin (discussioncontributions)

le problème, c'est que je ne comprends pas ce qu'il y a à faire... :( - pour moi, les images sont en place. Et toi ?

je me demande si @Newnewlaw n'a pas un problème de cache (à vider) qui lui fait voir d'autres images que celles du fichier actuel (les anciennes en l'occurrence...)

j'ai déjà commencé la renumérotation depuis la fin... si tu comprends la modif' vas-y...

Shev123 (discussioncontributions)

Je pense que le plus simple est de faire un lien interne vers les pages à modifier car en fait j'y comprends rien.

Hsarrazin (discussioncontributions)

moi non plus :/

j'ai regardé les pages 281 (Google) et 305 (Google) du facsimile Google indiqué, et elles sont bien en place sur la page 367 (pas 366 qui est une gravure) et la page 397 du livre.

Hsarrazin (discussioncontributions)

Bon, j'ai tout renommé, et ça semble tomber juste... reste à recaler la Tdm (les liens vers les pages doivent être décalés) et terminer la transclusion... à partir de Cent Proverbes/39.

Bonne continuation, et merci !

SyB~Anicium (discussioncontributions)
Shev123 (discussioncontributions)

L'outil DjvuToy est vraiment super et permet de réparer assez facilement des livres. Par contre, je n'ai pas trouvé comment on pouvait refaire une couche d'OCR (à partir d'un fichier djvu) ? Je précise que c'est pour Livre:Vasari - Vies des peintres - t3 t4, 1841.djvu qui a un OCR décalée d'une page.

Hsarrazin (discussioncontributions)

si j'ai bien compris, quand on déplace une page avec DjVuToy, on déplace son texte avec.

Pourquoi l'ocr est-il décalé ? est-ce d'origine ? ou suite à une manip' ?

DjVuToy permet-il de réparer ça @SyB~Anicium ? (sans avoir à refaire tout l'ocr, qui est excellent sur ce livre...)

SyB~Anicium (discussioncontributions)

DjVuToy déplace à la fois la page et le texte associé, donc il n'y aura aucun souci de ce côté-là. L'OCR reste en place. Pour ta question, @Shev123, pour refaire une couche d'OCR il faut aller dans l'onglet « Hidden text », cliquer sur « Remove text », puis toujours dans cet onglet, cliquer sur le bouton « OCR » juste à droite du fichier source. Au contraire, si l'on veut juste refaire l'OCR des pages ajoutées/modifiées, il faut découper la section, l'OCRiser, puis recoller les morceaux (utile dans ce cas-là puisque l'OCR d'origine est en effet très bon).

EDIT : en même temps, l'OCR par DjVuToy paraît équivalente (même nombre d'erreurs, mais à des moments différents) Et je constate qu'il y a une erreur de Pagelist, de là vient le décalage (exemple : page 162 qui est en réalité 161 ; elle est indiquée comme p. 175 sur la page d'index...)

Hsarrazin (discussioncontributions)

l'erreur de pagination est dûe aux illustrations non paginées, qui n'ont pas encore été positionnées dans le pagelist, faute d'avoir corrigé jusque là... et la correction est très compliquée par le décalage de l'ocr...

ça n'est d'ailleurs pas le seul scan dans ce cas... j'ai signalé celui-ci hier soir : importé directement depuis IA... et texte décalé :(

Faut-il refaire tout l'ocr, ou est-il possible de le "recaler" ( phe, Tpt et Yann : qui ont peut-être déjà eu le cas...

Hsarrazin (discussioncontributions)

en principe, une erreur de <pagelist ne devrait avoir aucun effet sur la couche texte par rapport à la couche image, uniquement sur le nombre qui apparaît dans la zone "page" de la page d'index.

J'ai téléchargé le fichier DjVu originel depuis IA, et il n'y a aparemment pas de décalage entre l'image et le texte. Je ne comprends pas d'où vient le problème...

je vais faire des tests.

SyB~Anicium (discussioncontributions)

Je pense qu'il y avait un problème quelque part dans la structure de l'OCR, DjVuToy m'a sorti un .txt partiel, qui s'arrêtait après la page 16. Et un export XML me renvoyait une erreur "de construction". Bref, j'ai vidé la couche texte et en ai remis une, qui n'est pas toujours aussi bonne mais qui se rattrape parfois à des moments inattendus ^^ L'OCR réalisé sur chaque page via le bouton Wikisource donne un résultat un peu supérieur, mais je ne dispose pas des compétences (robot) pour l'appliquer sur tout le bouquin.

Répondre à « pages manquantes dans Livre:Grandville - Cent Proverbes, 1845.djvu »