--*j*jac (d) 18 mars 2018 à 06:42 (UTC)Répondre

La lettre de Leibniz contestée par Maupertuis modifier

Pour mon premier essai, je veux ajouter sur Wikisource la lettre qui causa la brouille entre Voltaire et le roi de Prusse, suivie de son départ précipité de Berlin. Ce document consiste en 8 pages, extraites d'un livre disponible sur Gallica (ici, p. 42 / f172) : Samuel König, Appel au public du jugement de l'Académie Royale de Berlin, sur un fragment de Lettre de Mr. de Leibnitz cité par Mr. Koenig, Leide, Elie Luzac fils, 1752.

J'ai extrait les 8 pages, effectué l'OCR, suis en cours de conversion du pdf en djvu, et vais le téléverser.

Auparavant j'aimerais le conseil d'un usager expérimenté, notamment pour décider s'il est recommandable de faire précéder la lettre de la première page du livre qui la contient.

Cordialement, -- Valp (d) 16 avril 2021 à 07:29 (UTC)Répondre

  Jahl de Vautban : J'ai téléversé le fichier [[File:Samuel Koenig, Appel au public, 1752.djvu|thumb|Appel au public du jugement de l'Académie Royale de Berlin, sur un fragment de lettre de M. de Leibnitz cité par M. König]]
https://commons.wikimedia.org/wiki/File:Samuel_Koenig,_Appel_au_public,_1752.djvu.
Semble sans OCR (mon pdf l'avait mais Any2Djvu semble l'avoir laissé).
Puis-je vous demander de vérifier, et au besoin d'effectuer l'OCR de ce fichier djvu ?
Je n'ai pas su quoi mettre dans la case Catégories.
Je vais maintenant essayer de trouver mon fichier sur Wikisource et commencer à le transcrire.
Cordialement, Valp (d) 16 avril 2021 à 16:57 (UTC)Répondre
  Jahl de Vautban : Suite :
C'est fait. Les pages 165 à 172 sont crées et transcrites.
J'attends votre aide comme convenu pour la suite... Cordialement, Valp (d) 16 avril 2021 à 17:50 (UTC)Répondre
C'est un bon début ! J'ai ajouté quelques catégories sur le fichier Commons, mais je connais assez mal leur fonctionnement. Le plus important est toutefois la licence : je l'ai simplement passée de 70 à 100 ans ou moins après la mort de l’auteur. Quant à l'OCR, mes compétences sont limitées sur djvu (peut-être @Cunegonde1 pourra jeter un coup d'oeil) : vous avez néanmoins un outil OCR intégré à la barre d'outils lorsque vous modifier une page ; si vous souhaitez quelque chose de plus performant (notamment pour identifier les "s longs"), vous pouvez aussi copier-coller dans votre common.js la ligne suivante (point-virgule compris) :
mw.loader.load('//wikisource.org/w/index.php?title=MediaWiki:GoogleOCR.js&action=raw&ctype=text/javascript');
Je vois personnellement la page 170 qui s'affiche, mais elle met effectivement un certain temps (comme plusieurs autres pages, je ne saurais trop dire à c'est dû, le fichier n'a pas l'air spécialement lourd). Si cela vous arrive, essayez de recharger la page : à force elle devrait s'afficher. En revanche je n'y avais pas prêté attention, mais le fichier semble incomplet sur Gallica : le texte s'arrête brusquement à la p. 121, idem à la p. 67 de l'appendice. Je n'ai malheureusement pas réussi à identifier d'autres exemplaires de cette édition.
Pour en venir à votre transcription :
  • 1) Les numéros de pages et autres se mettent dans une section spéciale réservée à l'en-tête. Si vous ne la voyez pas qui s'affiche, naviguez, lorsque vous éditez une page, dans l'onglet "Aide à la relecture", où vous trouverez une icône ressemblant à une tablette, un carré noir encadré par deux rectangles blancs. En cliquant dessus, vous ferez apparaître les champs En-tête et Pied de page. Vous pouvez ensuite le mettre en forme à l'aide du modèle {{nr}}, comme suit {{nr||(41)}}.
  • 2) Le sauts de lignes sont gérés automatiquement par le logiciel dès lors que vous laissez une ligne : plus il y a de lignes, plus l'espace est grand. Préférez cette méthode aux balises <br/>.
  • 3) Il existe plusieurs dizaines de modèles de mise en page pour obtenir certains effets. En regardant rapidement, les plus utiles dans l'immédiat seront {{c}}, pour centrer un texte ; {{d}}, pour le placer à droite ; {{sc}}, pour faire des petites majuscules. J'ai corrigé la première page pour vous en donner un exemple.
  • 4) Il reste dans votre transcription plusieurs petites coquilles difficiles à repérer pour les yeux (par exemple des apostrophes droites au lieu de courbe, des espaces manquants avant les ponctuation, etc.). Pour les corriger rapidement, je vous conseille d'activer trois gadgets bien pratiques, en allant en haut à droite de la page dans vos Préférences, onglet Gadget : le gadget Scanilles, le gadget généraliste et le gadget Typo. Le premier vous permettra de repérer ces erreurs, les deux autres de les corriger en un clic.
  • 5) Pour ce qui est de la transclusion, à laquelle je vois que vous vous êtes exercé, il est important de prendre en compte toute l'architecture du livre. Pour le cas présent, si j'en crois la table des matières que vous avez créé, il est constitué de trois parties parties principales et d'un appendice, lui-même subdivisé en plusieurs documents. Je vous propose de nommer ainsi la lettre : Appel au public (Koenig)/Appendice/Lettres de Mr. de Leibnitz
Voilà pour ce premier page. Si quelque chose n'est pas clair, s'il vous vient d'autres questions, n'hésitez pas ! J'y répondrai autant que je peux   --Jahl de Vautban (d) 16 avril 2021 à 19:55 (UTC)Répondre
  Jahl de Vautban : Merci infiniment. J'ai pris note des modèles que vous avez insérés dans la première page et me suis entraîné jusqu'à la p. 48.
Pourriez-vous me montrer comment on définit deux sections dans cette p. 48, une pour la fin de la lettre, l'autre pour le début de la suivante ?
Cordialement, Valp (d) 16 avril 2021 à 23:11 (UTC)Répondre
Pour les sections, sauf si vous avez activé un gadget express, je vous conseille d'adopter la syntaxe suivante ## Titre de section ## : elle sera automatiquement remplacée par la véritable syntaxe lorsque vous publierez les modifications, mais elle a l'avantage d'être plus intuitive. Je les ai ajouté à la page concerné. Dans la transclusion, il sera important de préciser à l'aide du paramètre tosection (et éventuellement fromsection) où exactement doit s'arrêter le logiciel.
Pour les mots à cheval sur deux pages, je me suis un peu emmêlé les pinceaux hier. Comme ce livre présente la particularité d'annoncer la syllabe de la page suivante, il arrive qu'en fait le mot le mot soit entier sur l'autre page. Je vous propose de n'utiliser {{tiret}} que lorsque le mot coupé est bien sur la dernière ligne complète ; autre chose, {{tiret}} s'utilise toujours conjointement avec {{tiret2}} sur la page suivante (même syntaxe). Si vous avez activez le gadget généraliste, vous devriez pouvoir, en cliquant sur l'icone baguette magique, faire apparaître {{tiret2}} automatiquement.
Il vous reste à utiliser le gadget Typo sur les p. 46 et 47 et vous serez fin prêt pour transclure un premier jet de ce texte ! --Jahl de Vautban (d) 17 avril 2021 à 07:10 (UTC)Répondre
Bonjour   Valp et Jahl de Vautban : Je peux ajouter une couche texte, et téléverser à nouveau le fichier, mais cela prendra un moment (une journée) et je recommande de cesser la correction pendant cette période (risque éventuel de perte) des pages corrigées. je vous ping quand c'est prêt.--Cunegonde1 (d) 17 avril 2021 à 05:28 (UTC)Répondre
  Cunegonde1 : merci ! Ne vous donnez pas trop de peine, le fichier est incomplet et sera probablement à remplacer dans le futur. --Jahl de Vautban (d) 17 avril 2021 à 07:10 (UTC)Répondre
  Valp et Jahl de Vautban : Sur Google il y a un exemplaire de la seconde édition, dont le fac-similé est complet Google, peut-être vaut-il mieux téléverser cette édition et repartir sur une base complète. Si c'est ok, je prépare le fac-similé et le téléverse dès que c'est prêt.--Cunegonde1 (d) 17 avril 2021 à 08:16 (UTC)Répondre
  Cunegonde1 : pour moi c'est ok, la lettre qui intéresse Valp est bien présente à la p. 165 et le fac-similé à l'air complet (excepté un petit coin de page manquant aux p. 15-16). --Jahl de Vautban (d) 17 avril 2021 à 08:50 (UTC)Répondre
  Valp et Jahl de Vautban : C’est Fait  , finalement j'ai trouvé un exemplaire de bonne qualité de la même édition à la bibliothèque de Zurich Zentralbibliothek-Zürich. Je conseille de purger la page livre et si les pages ne se chargent pas au premier coup, les recharger, cela fonctionne.--Cunegonde1 (d) 17 avril 2021 à 10:40 (UTC)Répondre

Lettre sur la question Si l'essence du corps consiste dans l'étendue modifier

Bonjour Jahl de Vautban   : J'ai réussi ce que je voulais faire la dernière fois (ci-dessus), et je viens de créer une autre page : une lettre au Journal des Savants. Pouvez-vous regarder si c'est correct ? J'aimerais passer à la ligne (Journal…) : est-ce possible ? Et comment gérer ce qui est en dessous (précédent - suivant) ? Merci d'avance. -- Valp (d) 5 mai 2021 à 15:55 (UTC)Répondre

Bonjour Valp ! Je pense être parvenu au résultat souhaité sur la page concernée. En bref, j'ai tout d'abord change le type du djvu de "Livre" à "Recueil" et j'ai ensuite rajouté le paramètre recueil pour afficher un titre personnalisé ― les paramètres des djvu "Recueil" sont un peu contre-intuitifs, puisque titre gère le titre du recueil et recueil le titre du chapitre. Les liens vers les chapitres précédent/suivant sont normalement générés automatiquement via les liens existant dans le champ Sommaire du djvu ; on peut toutefois les remplacer à l'aide des paramètres prev et next (il existe aussi current pour le chapitre en cours). Pour le nommage des pages dans l'espace principal (celui où s'effectue la transclusion), il faut se départir du nom du fichier djvu, qui est surtout technique, et utiliser le titre du livre, en l'occurrence Die philosophischen Schriften ; comme dans la retranscription il faut utiliser les apostrophes courbes. Pour ce qui est des sections dans les Page, on les fait en général englober le titre ou la numérotation, de telle sorte qu'il faudrait la placer avec III. Voilà ce que j'ai pu relever (il y aurait à dire sur la transcription, mais vous n'y avez pas touché). --Jahl de Vautban (d) 5 mai 2021 à 18:03 (UTC)Répondre
Merci   Jahl de Vautban : pour votre mise à jour. Peut-on paramétrer le sous-titre ? "Die philosophischen Schriften, 1880 (p. 464-466)" c'est bien, mais faudrait préciser : vol. 4 (ou Band 4) car il y a 7 volumes, l'indication de la page est insuffisante. Ensuite, il serait bien de préciser en dessous "[Journal des Savants, 18 juin 1691]". Est-ce possible ? Cordialement -- Valp (d) 5 mai 2021 à 20:50 (UTC)Répondre
Beaucoup de choses sont possibles, voyez ce que j'ai fait. De manière générale, la page d'aide dédiée à la transclusion récapitule tous les paramètres existant. --Jahl de Vautban (d) 6 mai 2021 à 17:09 (UTC)Répondre

Conversion de pdf en djvu plus OCR modifier

Bonjour Cunegonde1  
Je me permets de revenir vers vous, qui le 17 avril 2021 m'avez paru bien connaître le problème téléversement de pdf + conversion en djvu avec OCR.
J'ai 7 fichiers pdf (Leibniz, Gerhardt's Mathematische Schriften) que j'ai choisis comme les meilleurs de cette collection (6 venant de la Bnf, 1 de GoogleBook).
Qu'est-ce qui est le mieux afin de les convertir en djvu avec OCR ? (sachant que j'ai un OCR mais dont le texte serait perdu par ma conversion en ligne vers djvu) ?
-- Valp (d) 6 juillet 2021 à 14:03 (UTC)Répondre

Bonjour, cela m'est difficile de répondre sans connaître le système d'exploitation que tu utilises (MacOS, Linux Windows) ? Sur Linux, je peux conseiller des solutions gratuites et donner des façons de procéder avec l'utilisation de l'OCR Tesseract. Sur Windows ou Mac des solutions payantes (j'utilise l'OCR finereader). Cunegonde1 (d) 6 juillet 2021 à 16:18 (UTC)Répondre
  Cunegonde1 : Je suis sous Windows et j'ai un OCR FoxitPhantom pour pdf. Mais après ? Valp (d) 6 juillet 2021 à 16:40 (UTC)Répondre
Aïe, je ne connaît rien à windows, j'ai un ordi windows que je n'utilise que pour faire des ocr avec Finereader 15, qui est très bon, mais cher. Sinon je ne connaît rien à windows après windows 3.1. Je crains de ne pas pouvoir te conseiller sur les autres logiciels tournant sous windows, mais tout ce qui est fondé sur des scripts utilisant tesseract doit pouvoir fonctionner. Je connaît et utilise principalement Linux. As-tu regardé les tutoriels d’Anicium ? Tutoriel DjVu, peut-être que cela pourra t’aider. Cunegonde1 (d) 6 juillet 2021 à 17:19 (UTC)Répondre
  Cunegonde1 : Merci pour le lien vers le Anicium:Tutoriel DjVu. Les trois premières étapes me sont familières. Je vais essayer la quatrième !
Cordialement -- Valp (d) 6 juillet 2021 à 22:22 (UTC)Répondre
PS : Grosse différence de qualité entre 'Microsoft Office Document Imaging' et 'FineReader' ?
Désolé encore, mais je ne connais pas MS office document imaging. En revanche je sais que Finereader est reconnu comme un des meilleurs OCR. Dans sa version windows, il permet :
  1. d'améliorer les images du scan (réalignement, rognage des marges, rectification du flou de mouvement sur les images en couleur, gommage des pétouilles, etc ;
  2. de définir automatiquement ou précisément les zones de reconnaissances et éventuellement les langues pour chaque zone.
  3. de faire un OCR très rapidement, y compris en multilangue, et y compris français avec s long (après aprentissage de gabarits) ;
  4. de vérifier et de pré-corriger le résultat de l'OCR facilement, car le logiciel indique les mots pour lesquels il y a un doute sur la reconnaissance. (En plus, les scanilles étant à peu près toujours les mêmes il est facile de faire un rechercher/remplacer sur tout le livre avant export) ;
  5. d'exporter le résultat dans différents formats, dont texte brut, différents pdf et surtout djvu avec des options de niveau de qualité recherché pour le résultat.
Je l'utilise depuis un an et j'en suis globalement satisfait. La version Mac, moins cher, ne permet pas la correction avant export, ni l'export au format djvu. Tu peux voir un exemple du résultat de l'OCR sur un livre que je viens de téléverser : Savoir ! de Le Dantec.
Bonjour Cunegonde1   Sur votre conseil j'ai acquis Finereader 14 qui fait bien le job ! Il y a aussi ce site : any2djvu.djvu.org mais je suis pas sûr qu'il gère les accents… Cordialement et merci encore. -- Valp (d) 8 juillet 2021 à 09:00 (UTC)Répondre

  Cunegonde1 : Encore une question, svp : djvu est-il le format obligatoire ? Ne peut-on pas travailler avec des fichiers pdf qui ont le mérite de pouvoir conserver des index, souvent bien utiles ? (D'autant que j'ai ce problème avec ABBYY, que lorsque je passe par l'éditeur d'OCR, l'indexation disparaît…)
Cordialement, Valp (d) 13 juillet 2021 à 15:06 (UTC)Répondre

Non à ma connaissance, le format djvu n’est pas obligatoire, mais conseillé. Il présente principalement les avantages d’être un format libre, et de peser moins lourd à qualité équivalente, si tu t’interesse à la question tu peux regarder cette discussion Scriptorium/Mars_2016 : Internet Archive arrête les djvu.--~~~~
Cunegonde1 (d) 13 juillet 2021 à 16:37 (UTC)Répondre
Merci. Je passerai donc à pdf, qui est devenu quasi libre. Cordialement. Valp (d) 13 juillet 2021 à 17:08 (UTC)Répondre