À propos de ce flux de discussion

La discussion précédente a été archivée dans Discussion utilisateur:Cunegonde1/Archive 1 le 2018-11-09.



Le ciel est par dessus le toit (discussioncontributions)

Bonjour,

Pourrais-tu m’importer ces deux fichiers stp, vu le nombres de pages peut-être faudra-t-il "compresser" un peu. Merci.

  • n° 1 à 4 en un seul fichier : gallica
  • n° 5 à 8 en un seul fichier : gallica
Cunegonde1 (discussioncontributions)

Ok, c'est copieux, ça prendra un peu de temps. Quel niveau de qualité ?

Le ciel est par dessus le toit (discussioncontributions)

Excuse-moi, je pense qu'il faut un niveaux 2 (selon ta propre échelle Sujet:Vzs2wprw9gybcyao), car ce sont des textes souvent recherchés. (même si pour moi il ne servent qu'à faire des Match et Split). Prends le temps nécessaire ce n'est pas pressé. Encore Merci

Cunegonde1 (discussioncontributions)

Ok, ça fait 3452 pages... si les djvu sont trop gros je scinderai par numéro, je te préviens quand c'est prêt.

Le ciel est par dessus le toit (discussioncontributions)

ok pas de problème !

Cunegonde1 (discussioncontributions)

En fait les infos de Gallica sont trompeuses le premier fichier fait "seulement" 873 vues et le second 853 vues. Cela devrait passer avec un djvu par fichier.

Le ciel est par dessus le toit (discussioncontributions)

je n'avais pas vu, mais c'est rassurant ;)

Cunegonde1 (discussioncontributions)

Bonsoir @Le ciel est par dessus le toit, après avoir préparé le premier volume, j'ai préparé le second à la fin duquel il y a une liste des auteurs de cette revue. Cette liste comprends 144 auteurs et traducteurs. Parmi ceux-ci seuls 33 sont dans le domaine public alors que 98 sont encore sous droits d'auteur. En outre, il s'agit d'une réimpression datant de 1976 avec une mention de copyright, probablement liée à l'introduction qui n'était pas dans la revue initiale. Bref, sans preuve du contraire, je ne pense pas pouvoir téléverser les fichiers préparés sans violation des droits d'auteur. Ci-dessous la liste des auteurs avec leurs dates :

Ce serait sympa de vérifier cette question à l'avenir pour éviter le travail inutile.

Le ciel est par dessus le toit (discussioncontributions)

Merci pour les précisions, on abandonne.

Répondre à « Bifur »
Le ciel est par dessus le toit (discussioncontributions)

Bonjour,

J'espère que tu vas bien et que la nouvelle année est pleine de promesse pour toi


Pourrais-tu m'importer stp :

*gallica

C'est pour rattacher à un fs donc ne te casses pas trop la tête. Merci

Cunegonde1 (discussioncontributions)

Ok, je m'en occupe. Meilleure année à toi, en tout cas sur WS ça roule fort et y a plein de jeunots (?) très dynamiques, c'est sympa. IRL c'est moins drôle avec cette satanée épidémie qui n'en finit pas.

Cunegonde1 (discussioncontributions)
Le ciel est par dessus le toit (discussioncontributions)

c'est rapide dis-donc. Merci

Répondre à « Mes pontons »
Cantons-de-l'Est (discussioncontributions)

Bonjour,

J'ai terminé la relecture de cet ouvrage. Plusieurs fois je me suis demandé : Comment Cunegonde1 a pu réussir à retranscrire ce truc ? Les lettres sont étranges, le texte est serré et le discours est extraterrestre.

pour cet effort.

Cunegonde1 (discussioncontributions)

Je me suis repris à plusieurs fois, j'ai utilisé Tesseract avec la langue Fraktur, et j’ai fait une première correction de débroussaillage, j'ai laissé reposer quelques semaines puis j'y suis revenu plus sérieusement. Quand au reste... En tout cas merci d'avoir pris le temps de le valider, je ne pensais pas que ça intéresserait quelqu'un. Un point de curiosité as-tu conservé les tilde d’abréviation ?

Cantons-de-l'Est (discussioncontributions)

Pour l'intérêt, moi non plus . Blague à part, j'ai ajouté/supprimé quelques virgules (moins de cinq), je crois avoir ajouté un point, j'ai mis en exposant un mot (pour être au plus près du texte original), j'ai recadré une image (des tâches dans le haut), mais je n'ai pas modifié les tildes d'abréviation (respect du texte original).

Au revoir.

Répondre à « Année galante ou Étrenne à l’amour »
Wuyouyuan (discussioncontributions)
Cunegonde1 (discussioncontributions)

Flûte, je ne m'en suis pas rendu compte. D'habitude sur gallica je contrôle le nombre de pages effectif en fonction du nombre de vues annoncé. Là je n'ai pas pu le faire car rien n'était indiqué. J'ai inséré deux pages d'avertissement à la place des pages manquantes : il faut revoir le pagelist qui est donc décalé sur la fin.

Wuyouyuan (discussioncontributions)

Vous avez réagi plus vite que je pensais. Il y a aussi entre 363 et 364, pages 348 et 349.

Cunegonde1 (discussioncontributions)

Bon j'y retourne immédiatement... comme dit la chanson ! du coup je vérifie toute la pagination !

Cunegonde1 (discussioncontributions)

J'ai ajouté 2 pages d'avertissement pour 348 et 349. Le reste est bon.

Wuyouyuan (discussioncontributions)

Vu. J'insérerai le texte, sans image, après avoir vérifié que je possède bien la même traduction. Le fac-simile est une aventure.

Cunegonde1 (discussioncontributions)

C'est vrai, mais je dois reconnaître qu'on a moins de problèmes avec Gallica, et quand il y en a un, les équipes sont très réactives et envoient par messagerie des photos des images manquantes, quand les pages existent dans le livre matériel.

Wuyouyuan (discussioncontributions)

La BnF vient de m'envoyer un fichier image de "La Lutte des classes", de la même édition que les bourguignons. C'est plutôt moche (PDF des doubles pages livre ouvert à partir d'un microfilm du XXe siècle). J'ai découpé les pages qui nous manquent. Vous pouvez télécharger les 4 pages à partir de https://www.dropbox.com/s/dn4utosjt88qu3x/lutte%20des%20classes%20pages.zip?dl=0 et remonter un fac-simile complet. Je peux aussi paresseusement coller les images en page de discussion et taper le texte, mais je suis sûr que vous préférerez faire un travail propre.

Si vous avez envie de voir l'exemplaire complet de la BnF, je vous le mets en ligne. Poids 275 Mo.

Cunegonde1 (discussioncontributions)

@Wuyouyuan Bonjour, c'est fait, j'ai passé les pages concernées en rouge pour récupérer la couche texte et supprimé le message d'alerte dans le pagelist. Bonne soirée.

Wuyouyuan (discussioncontributions)

Voila, c'est fini, il ne reste plus qu'à valider. Et attendre l'apparition d'une édition commerciale à 2 euros du 18 sur Amazon Kindle, qui manquait. Même chose pour La Lutte des classes, dont les éditions en vente sont médiocres (et d'une autre traduction).

Répondre à « La lutte des classes »
Havang(nl) (discussioncontributions)
Cunegonde1 : Merci. La correction est faite Fait . Comment as-tu fait pour telecharger sans passer par google books. J'avais testé CECI, que je n'ai pas poursuivi, ayant des doutes. Ta methode me semble plus correct. --Havang(nl) (d) 25 décembre 2020 à 12:37 (UTC). Havang(nl) :, 1/ j’ai récupéré le pdf sur google books, 2/ j'en ai extrait les images de pages au format jpg avec finereader 12 sur mac (cette phase plante avec finereader 15 sous win), 3/ j'ai détouré et un peu amélioré les jpg avec scantailor sous linux, puis j'ai récupéré les images au format tiff sur finereader 15 sous windows, j'ai fait l'ocr, une vérification sommaire de celui-ci, puis je l'ai exporté en djvu.--Cunegonde1 (d) 25 décembre 2020 à 14:48 (UTC)
J'ai trouvé comment créer un djvu ; ma première est Sylvin - Jules Ferry, 1883.djvu, que j'ai mis dans la place de File:Sylvin - Jules Ferry, 1883.djvu . Je vais voir l'effet. --Havang(nl) (d) 25 décembre 2020 à 15:48 (UTC)
Cunegonde1 : cela a l'air bien, sauf que pour la page 1, surprise : l'image couverture a été remplacé par une page internetarchive. Donc la procédure appliquée n'est pas parfaite. Et il y a des corrections à faire pour d'éditions antérieures : une série de suppressions de pages déjà créés sur wikisource (à partir de Page:Sylvin - Jules Ferry, 1883.djvu/41) et j'ai demandé un SI pour le pdf déjà telechargé sur commons. Est-ce que je peux télecharger d'autres livres google en djvu ou est-ce que je dois laisser faire des utilisateurs plus expériementes? --Havang(nl) (d) 25 décembre 2020 à 16:34 (UTC)
Cunegonde1 (discussioncontributions)

Pour la page 1 je ne comprends pas le problème que tu évoques. Pour le reste, on ne devient pas expérimenté sans expérimenter donc vas-y sans hésiter. Si tu rencontres des difficultés demande de l'aide. Une seule condition grande prudence sur les fac-similés qui ont commencé à être corrigé. En effet si tu ajoutes une page manquante au milieu du livre toutes les pages suivantes déjà corrigées seront décalées. Il faut donc sauvegarder dans un fichier texte toutes les pages situées après le point d'insertion et les réinsérer là ou il faut. En dehors de ça, si tu rencontres un problème on peut toujours remplacer le fichier défectueux par un fichier réparé. Sinon je ne suis pas fan des scan de google et privilégie toujours quand ce ne sont pas des microfilms les scans de la BNF quand ils sont disponibles.

Havang(nl) (discussioncontributions)

La première page, c'est peut-être que j'ai telechargé le djvu d'essai sans avoir pu regarder. Le pas suivant: je cherche l'app pour ouvrir un djvu sur mon ordinateur.

Cunegonde1 (discussioncontributions)

Sur win je ne sais pas, sur linux et mac DjView et la super suite djvu libre.

Havang(nl) (discussioncontributions)

Je peux ouvrir les djvu ! J'ai terminé la correction de Jules Ferry (Sylvin) , mais j'ai telechachargé la couverture et le portrait directement du web, pas de la djvu. Il y a donc différence entre le fac.sim et l'édit-form. Faudra-t-il signaler ou corriger cela ?

Cunegonde1 (discussioncontributions)

Tu peux le signaler dans la page de discussion du fs, mais à mon avis cela n'a pas d'importance. Pour les bandeaux de début de chapitre, pour éviter d'avoir à les refaire, je réutilise souvent ceux déjà fait pour un ouvrage différents du même éditeur. Pour les illustrations, si elles sont identiques mais de meilleure qualité ça ne pose pas de problème.

Havang(nl) (discussioncontributions)

Oh, les programme soi-disant gratuits, ça demande de l'argent ensuite, sinon la conversion de pdf en djvu se fait avec des erreurs fréquents (pages sans images ou manquantes). Dommage, j'arrête ça.

Cunegonde1 (discussioncontributions)

Sous linux les programmes gratuits sont réellement gratuits, mais demandent la plupart du temps un investissement en temps d'apprentissage : libre office, Gimp, Inkscape, Scantailor, Tesseract (le meilleur OCR pour les livres en ancien français)...

Havang(nl) (discussioncontributions)

J'ai constaté : Pour complèter la série de 40 monographies il n'y a plus que 2 pdf à telecharger (en djvu?) : les deux autres volumes de 10 monographies : en ligne ''Collectif - Célébrités contemporaines, Edition 1884 Vol. I'' et ''Collectif - Célébrités contemporaines, Edition 1884 Vol. II'' Pourrais-tu faire cela pour moi, un de ces jours ? Merci pour l'aide et toute l'info.

Cunegonde1 (discussioncontributions)

Ok, souhaites-tu que je découpe les bouquins pour faire un djvu par Célébrité ou que je maintienne les ouvrages tels qu'ils sont ?

Havang(nl) (discussioncontributions)

Les deux, ou les individuels , peu importe, je te laisse le choix :

  • Choix 2 ;Si tu découpes, tu pourras en sauter 6 déjà télechargé : sauter: Clemenceau, Rochefort, plus Gambetta, Ferry, Naquet, Floquet. Il restent alors 14 à télecharger. En ce cas, tu pourras pour chaque célébrité mentionner l'année de première publication qui est dans la page de titre individuelle, p. e. Jules Grévy 1882.
  • Choix 3 : Mais en ce cas, il y a 6 pdf de célébrités individuelles aussi : Il en resteraient alors seulement 8 à découper des deux collectifs. : Marechal de Mac-Mahon, Duc d'Aumale, De Freycinet, Lesseps et Henri Martin, puis Brisson, Challmel-Lacour, et Spuller . Après (ou avant), les 6 pdf individuelles sont

Un grand merci.

Cunegonde1 (discussioncontributions)

J’ai un doute sur "Freysinet", je connais un Freissinet et un De Freycinet. Je ne trouve aucun des deux dans ceux présent dans la catégorie Catégorie:Les Célébrités contemporaines or tu mentionne qu'il est déjà fait.

Havang(nl) (discussioncontributions)

Bien vu, De Freysinet est encore à faire, le 14-ème dans le compte : 26 sont fait. 14 sont à faire:

Cunegonde1 (discussioncontributions)

Je m'en occupe, cela prendra un peu de temps. Je te préviens quand il sont prêts et en ligne.

Cunegonde1 (discussioncontributions)

@Havang(nl) les fichiers sont prêts.

  • J'ai fait une pré-correction des textes pour éliminer les scanilles les plus courantes ; il subsiste une erreur assez courante sur l'en-tête des pages qui est mal reconnue par mon OCR.
  • J'ai laissé les fautes d'orthographes (au sens de l'époque) telle qu'elle est dans les fac-similé.
  • J'ai élagué les pages inutiles en début et fin de texte.
  • Je propose enfin de mettre un titre du genre : "Célébrités contemporaine - titredelabrochure" pour éviter les confusions possible avec des biographies plus consistantes.
  1. Livre:Delabrousse - Jules Grévy, 1882.djvu
  2. Livre:Depasse - Challemel-Lacour, 1883.djvu
  3. Livre:Depasse - De Freycinet, 1883.djvu
  4. Livre:Depasse - Henri Martin, 1883.djvu
  5. Livre:Depasse - Paul Bert, 1883.djvu
  6. Livre:Depasse - Ranc, 1883.djvu
  7. Livre:Depasse - Spuller, 1883.djvu
  8. Livre:E. Daudet - Jules Simon, 1883.djvu
  9. Livre:E. Daudet - Le Comte de Paris, 1883.djvu
  10. Livre:E. Daudet - Le Duc d’Aumale, 1883.djvu
  11. Livre:E. Daudet - Le Duc de Broglie, 1883.djvu
  12. Livre:E. Daudet - Le Maréchal de Mac-Mahon, 1883.djvu
  13. Livre:Pinard - F. De Lesseps, 1883.djvu
  14. Livre:Stupuy - Henri Brisson, 1883.djvu
Havang(nl) (discussioncontributions)

Merci, ça a l'air excellent. C'est quoi, ce signe ¬ à la fin d'une page ? Faut-il le remplacer par - , ou le laisser tel ? Pour le nom. C'est d'accord. On peut faire pareil pour toutes les titres des 24 monographies déjà édités, mais changer ces titres, est-ce que cela va demander l'adaptation des wikidata? En ce cas, ne changeons pas.

Cunegonde1 (discussioncontributions)

Le signe ¬ est un tiret conditionnel, c'est par erreur qu'il se trouve en fin de page, il faut le remplacer par un - et de toute façon utiliser les modèles {{tiret}} et {{tiret2}} pour qu'il n'y ait pas de rupture dans la transclusion. Pour les noms, c'est juste une suggestion car deux d'entre eux avaient déjà des homonymes. S'il n'y a pas de problème avec les titres déjà créés, on peut bien sûr les laisser tels-quels.

Havang(nl) (discussioncontributions)

J'ai lu que tiret et tiret2 ne sont plus nécessaire, cela se fait maintenant automatiquement. Pour les noms, on peut ajouter l'auteur entre (...); p.e. Jules Grévy (Delabrousse). J'y fera attention au moment de la création.

Puis, je savais que ce mercredi on me porterait du travail à faire à la maison, je ferai la correction en alternance avec cela, donc en moins vite que jusque-là. Mais grâce à toi, la correction est simple : tu as livré du travail bien fait, je ne l'aurais pas pu faire ainsi. --~~~~.

Cunegonde1 (discussioncontributions)
Havang(nl) (discussioncontributions)
Cunegonde1 (discussioncontributions)

Parfait

Havang(nl) (discussioncontributions)

Surprise : [https://fr.wikipedia.org/wiki/Wikip%C3%A9dia:Le_Bistro/31_d%C3%A9cembre_2020#Qui_veut_visiter_la_Biblioth%C3%A8que_historique_%C3%A0_Paris_?]


OH, mais, le résultat est déjà arrivé :


Voici le scan des pages concernées, ainsi que de la page de garde pour vérifier l'édition. <s>J'ai</s> ''''Il a'' utilisé une appli de scan, qui rajoute une version redressée et nettoyée des images.

https://ibb.co/C6q2FSj

https://ibb.co/brjrbYh

https://ibb.co/SddH98F

https://ibb.co/Ln6xKgH

https://ibb.co/725Xkq1

https://ibb.co/bHr0t39

Cunegonde1 (discussioncontributions)

@Havang(nl) Ça y est j’ai rajouté les deux pages dans le djvu, téléversé le fichier dans common et modifié le pagelist. Il faut que tu purges la page du livre sur ton navigateur pour voir la différence. Bonne correction.

Havang(nl) (discussioncontributions)

Déjà fait... Bonne fin d'année.

Répondre à « Telechargements en djvu, suite. »
Le ciel est par dessus le toit (discussioncontributions)

Bonjour Cunegonde,

il me faudrait le n° 4 de cette revue et seulement ce n° qui se trouve ici

par contre chaque page est un fichier jpg, il faut donc tout rassembler en 1 seul fichier djvu.

Il y a 65 pages.

Attention la page 55 est manquante, il faut donc insérer une page blanche, afin de l'insérer quand on la retrouvera

Si c'est trop de travail dis-le moi.

Le niveau 1 d'import suffira.

Merci

Cunegonde1 (discussioncontributions)

Bonjour @Le ciel est par dessus le toit, j’ai récupéré les pages une par une, mais je pense qu'il y a une protection car si je les passe avec scantailor, il ressort des pages totalement illisibles, même par des humains, si je clique sur la page (ce qui la grossit), et que je l'enregistre, elle apparaît bleutée et invisible ; si je fais une capture d'écran, c'est également inutilisable, de même que si j'essaie avec les images que j'ai téléchargé sans aucun traitement. Echec quelque soient les ocr que j'ai essayé (finereader 12 sous macOS, finereader 15 sous windows et tesseract sous Linux. Le seul truc qui fonctionne est la capture d'écran puis traitement de l'image avec the Gimp (en tout environ 5 à 10 mn. par page) avant le traitement normal et l'ocr. Je suis patient mais pas à ce point. C'est dommage car cette revue est sympa.

Le ciel est par dessus le toit (discussioncontributions)

Bon dommage, mais laisse tomber, désolé pour le dérangement. Je crains seulement que cette revue soit introuvable ailleur ;)

Cunegonde1 (discussioncontributions)
Le ciel est par dessus le toit (discussioncontributions)

Oua ! Merci beaucoup, je vais m'occuper de ça en 2021, d'ailleurs en passant, je te souhaite une heureuse nouvelle année.

Cunegonde1 (discussioncontributions)

Bon bout d’an, et meilleure année si possible !

Répondre à « Action Volume 1 n°4 »
Le ciel est par dessus le toit (discussioncontributions)

Bonjour,

Je te le mets maintenant pour ne pas oublier mais c'est pour mardi 22, du coup je ne te demanderai rien avant le 29 décembre selon notre convention d'un import par semaine ;)

voici la référence

Oeuvres de Louis Racine, tome 1

Je n'ai pas besoin des autres tomes

Merci !

(Mon repère: contient poèmes sur la grâce et poèmes sur la religion)

Cunegonde1 (discussioncontributions)

Bonjour @Le ciel est par dessus le toit, c’est ok pour moi, cependant il serait utile que tu me précises le niveau de qualité de l’ocr que tu souhaites en fonction de son usage, le temps de préparation que j'y passe est directement lié à ce choix.

  • niveau 1 : détourage des pages, passage à l'ocr sans vérification des zones de reconnaissance ni pré-correction : env. 1 journée pour 400 pages
  • niveau 2 : détourage des pages, gommage des pétouilles, vérification des zones, sans pré-correction, en fonction de l'état entre 1 journée et 4/5 jours pour 400 pages
  • niveau 3 : détourage des pages, gommage des pétouilles, vérification des zones, avec pré-correction, en fonction de l'état entre 2 journées et x? jours (quelquefois le gommage des pétouilles prend 1 heure par page).

Si tu souhaites juste avec un fs pour lier des textes déjà existants, il n'est peut-être pas utile d'y passer trop de temps. Je précise que pour les fs que je produit pour mes projets personnels j'utilise systématiquement le niveau 3, c'est également ce que j'ai fait pour les ocr des tomes qui en étaient dépourvus des mille nuits et une nuits de Mardrus.

Le ciel est par dessus le toit (discussioncontributions)

Merci pour toutes ces précisions (et je ne pensais pas que c'était un si important travail), je veux juste rattacher les textes déjà existants au fs... fait au plus simple...

Si j'ai besoin d'un livre particulièrement peaufiner je te ferais savoir quel niveaux de qualité il me faut.

Est-ce que ça te convient comme ça ?

Cunegonde1 (discussioncontributions)

Parfait, merci pour ta réponse. J'ai commencé à regarder le f-s qui cumule plusieurs difficultés : multilingue (français, latin, anglais, ??) notes en petits caractères, pas mal de pétouilles sur certaines pages. Je fais au mieux dans le cadre du niveau 1. Le fait que l'on ne voit pas le travail est normal, c'est le but. Beaucoup de métiers comportent ce type de travail invisible. En couture, le plus long c'est la préparation : patron, coupe, assemblage (travail invisible), pas la piqûre à la machine (travail visible).

Le ciel est par dessus le toit (discussioncontributions)

Ok merci.

Cunegonde1 (discussioncontributions)
Le ciel est par dessus le toit (discussioncontributions)

Merci encore.

Répondre à « Louis Racine »
Le ciel est par dessus le toit (discussioncontributions)

bonjour, aujourd'hui c'est celui-là :

Gallica

J'espère que tu vas bien. Merci pour ton travail.

(petit repère pour moi : 917)

Cunegonde1 (discussioncontributions)

Bonjour @Le ciel est par dessus le toit, tout va bien merci. Il s'agit d'un scan de 2007, je ferai au mieux pour l'OCR, je te préviens quand c'est prêt.

Le ciel est par dessus le toit (discussioncontributions)

fais comme tu peux, je m'en débrouillerai. merci

Cunegonde1 (discussioncontributions)
Le ciel est par dessus le toit (discussioncontributions)

Merci beaucoup, bonne journée à toi aussi

Répondre à « Ossian, suivi des Veillées poétiques »
Le ciel est par dessus le toit (discussioncontributions)

Bonjour Cunegonde, j'espère que tu vas bien

pourrais-tu importer cet ouvrage stp :

google book

Merci

Cunegonde1 (discussioncontributions)
Le ciel est par dessus le toit (discussioncontributions)

C'est très bien ainsi. Merci beaucoup !

Répondre à « Lis Isclo d’Or »

Feedback requested on November update for Wikisource ebook export project

1
IFried (WMF) (discussioncontributions)

(apologies for the message in English)

Hello, Cunegonde1! The Community Tech team is requesting your feedback on the recently posted November update for the Wikisource ebook export improvement project. Your feedback is very important to us. We want to know what you think of some work we have recently completed to improve the reliability of WS-Export and font support in various languages. Additionally, we want to know what you think of our proposed mockups to improve the download user experience. In that case, please do check out the updates, if you can, and share your feedback on the project talk page. Thank you! -- IFried_(WMF)

Répondre à « Feedback requested on November update for Wikisource ebook export project »