Cj73
|
Création d’un livre
modifierBonjour,
Je vois que tu as suivi mon conseil et que tu importé le livre. Par contre, je me rends compte qu’il y a un gros problème : il manque 2 pages (pp. 38 et 39). Il faudrait donc trouver ces pages avant de commencer la pagination sur la Wikisource (ou au minimum, modifier le djvu pour intercaler deux pages blanches). Je vais essayer de trouver ces deux pages mais cela semble mal parti. Le livre complet n’est ni sur Internet Archive, ni sur Google Books, ni sur Gallica. Ce livre est apparemment présent dans les Mémoires et documents publiés par la Société savoisienne d'histoire et d'archéologie, T29 de 1890 (disponible sur Gallica ici : [1], à vérifier que cela correspondent bien).
Il y a donc deux possibilités :
- soit prendre tout le livre des Mémoires
- soit prendre les deux pages et les recoller dans ton djvu.
Vu que tu t’intéresse à la Savoie, la première solution te conviendra peut-être mieux. Tiens moi au courant, je t’aiderais. Cdlt, VIGNERON * discut. 17 mai 2010 à 20:06 (UTC)
- Merci beaucoup pour ton aide (bien précieuse). Je vais essayer de trouver les pages manquantes de mon côté et je te tiendrais au courant pour que tu m'aide à intercaler les pages dans le djvu.--Cj73 17 mai 2010 à 20:32 (UTC)
- Pour ajouter les pages, demande Zaran (d · c · b) plutôt (il fera ça mieux et plus vite que moi). Il suffit de lui indiquer le djvu sur Commons, et le lien Gallica et les pages que je t’ai donnés. Cdlt, VIGNERON * discut. 18 mai 2010 à 09:40 (UTC)
- Je passe ici par hasard, et je vois qu'on a besoin de moi . J’ai donc ajouté les deux pages manquantes à partir des Mémoires de la Société savoisienne depuis Gallica. Il s’agit en effet du même texte (même découpage des pages), seule la numérotation des deux pages ajoutées est différente. Comme l’a dit VIGNERON, tu pourrais aussi importer directement le livre des Mémoires, mais rien ne presse, cela peut être fait dans un second temps.
- Par ailleurs, souhaites-tu que j’ajoute une couche texte au document djvu (à moins que tu ne disposes déjà d'une source typographiée). Si j’ajoute une couche texte, les pages seront pré-remplies avec le texte issu de la reconnaissance automatique de caractère. Il ne te restera donc plus qu’à corriger les erreurs de reconnaissance. Cordialement, Zaran (Discuter) 18 mai 2010 à 12:09 (UTC)
- P.S. : je n’ai pas résisté au plaisir de commencer à organiser la page d'index du livre… Zaran (Discuter) 18 mai 2010 à 12:25 (UTC)
- Très sympa d'être passé et merci pour ton aide. Je ne maitrise pas bien l'importation de livre sur wikisource (mais je me soigne !) alors n'hésite pas à faire ce qu'il faut pour que tout soit conforme. Je me permettrais de te solliciter si je bute sur quelque chose. (si tu me le permet !). encore merci --Cj73 18 mai 2010 à 12:39 (UTC)
- Pourrais tu m'expliquer vite fait comment on ajoute une couche texte dans un djvu ? (doit on utiliser OCR page par page ou existe il une autre métode plus rapide ?)
- Je commence par te faire un petit rappel sur le format djvu : les fichiers djvu ont une structure dite « par couches », cela signifie que chaque page peut posséder plusieurs couches, par exemple une couche image qui contient l’image de la page, une couche arrière-plan qui contient l'image d’arrière plan, une couche texte qui peut contenir un texte quelconque… Pour l’instant le livre de Mugnier ne contient pour chaque page qu’une couche image. Ajouter une couche texte signifie, ajouter pour chaque page une couche texte contenant l’OCR de la page.
- Le gros avantage de faire cela, est que wikisource sait utiliser cette couche texte (grâce à ThomasV) : si une page contient une couche texte, au moment de la création de la page dans wikisource, la zone d’édition de la page est automatiquement pré-remplie avec l’OCR de la page. Une fois la couche texte ajoutée sur le fichier djvu, il n’y a donc plus à s’occuper du bouton OCR, il ne reste qu’à corriger. Voici un exemple : le livre de Mugnier ne contient pour l’instant pas de couche texte, donc si tu cliques sur une page qui n’est pas encore crée, par exemple la page 11, tu remarques que la zone d’édition est vide. A l’inverse, si tu vas sur cette page Livre:Huysmans - A Rebours, Crès, 1922.djvu, et que tu cliques sur une page qui n’est pas encore crée, par exemple la page 50, tu remarques que la zone d’édition contient déjà le texte de la page. En effet, ce fichier contient déjà une couche texte qui est automatiquement extraite par wikisource.
- Pour répondre à ta question, comment ajouter une couche texte ? Si tu utilises Linux, tu peux utiliser ce script, c’est celui que j’utilise. Si tu n’utilises pas Linux, tu peux faire le travail par Internet Archive, la procédure à suivre est expliquée ici.
- Dis moi si tu souhaites que j’ajoute la couche texte (ça ne me prend pas de temps, c’est automatique). J’espère avoir été suffisamment clair. N’hésite surtout pas si tu as d’autres questions. Cordialement, Zaran (Discuter) 18 mai 2010 à 13:26 (UTC)
- Voilà, couche texte ajouté. Grand merci pour tes conseils Zaran. Cj73 18 mai 2010 à 20:05 (UTC)
- Félicitations pour avoir ajouter toi-même la couche texte. Par contre, je suis vraiment désolé, mais je t’ai induit en erreur. Le script que je t’ai indiqué ici est prévu pour des textes en anglais. Il faut changer la deuxième ligne :
$lang = "eng";
en$lang = "fra";
. En effet, tu as sans doute remarqué que dans la couche texte actuelle, tous les accents sont manquants. Il faudrait donc que tu refasses la couche texte en modifiant le script au préalable, l’OCR sera bien meilleur. - Par ailleurs, j’ai corrigé deux pages de ce livre. Je précise deux choses :
- Cordialement, Zaran (Discuter) 18 mai 2010 à 23:40 (UTC)
- Félicitations pour avoir ajouter toi-même la couche texte. Par contre, je suis vraiment désolé, mais je t’ai induit en erreur. Le script que je t’ai indiqué ici est prévu pour des textes en anglais. Il faut changer la deuxième ligne :
- Voilà, couche texte ajouté. Grand merci pour tes conseils Zaran. Cj73 18 mai 2010 à 20:05 (UTC)
- Pour ajouter les pages, demande Zaran (d · c · b) plutôt (il fera ça mieux et plus vite que moi). Il suffit de lui indiquer le djvu sur Commons, et le lien Gallica et les pages que je t’ai donnés. Cdlt, VIGNERON * discut. 18 mai 2010 à 09:40 (UTC)