Aide:Éditer un Dictionnaire

Niveau débutant
Vous êtes sur une page d'aide qui explique les étapes auxquelles procéder pour éditer un dictionnaire ou une encyclopédie
En résumé En résumé :
L’édition d’un dictionnaire ne se fait pas tout à la main, ce serait trop long et fastidieux.
Pour éditer ses pages, on s’aide de boutons d’OCR, et pour transclure et générer une table des articles, il faut utiliser un bot.
Avant d’éditer un dictionnaire entier sur Wikisource, demandez leur aide précieuse aux contributeurs chevronnés sur Wikisource:Scriptorium.
Aide : Manuel de Wikisource

Grands principes modifier

Les grands principes pour l’édition de dictionnaire sont :

  • correction des pages, en suivant les règles typographiques en vigueur sur Wikisource.
  • pour éditer l'aide sur un dictionnaire en particulier, on peut par exemple s'inspirer de ce qui a été fait dans Aide:Travailler sur le Trévoux
  • caractères spéciaux, alphabets non latins :
    • les termes ne sont pas mis en italiques.
    • Il ne faut pas essayer de retranscrire les alphabets non latins si on ne les connaît pas ; il y a des modèles dédiés pour solliciter l'aide de Wikisourciens capables de le faire sans erreur ({{grec}}, {{hébreu}}, etc. ; voir la catégorie Catégorie:Modèles pour les langues : certains modèles permettent aussi de faire vérifier des textes en langues étrangères dont on n'est pas sûr)
    • Caractères spéciaux inhabituels : cf. Wikisource:Glyphes & caractères
  • en vue de la transclusion, les intitulés du balisage avec des sections ## reprennent exactement les titres que l'on souhaite donner aux articles, ce qui permet ensuite l'automatisation de la création des index (éventuellement, à voir avec les gens compétents) et l'automatisation de la création des articles, à partir des pages corrigées.
  • Pour les titres d'articles, ne pas employer de majuscule et utiliser les catactères accentués. Sinon, cela crée un problème d'accessibilité, comme sur l’article AMES (charge d’) : Dictionnaire de théologie catholique/AMES (Charge d') : je cherche « âmes », je ne risque pas de tomber sur le titre de l’article, l’accent circonflexe manquant m’en empêche. De même, à cause de l'ordre des mots, si je cherche « charge d’âmes » dans le titre d’une page, et je ne tomberai pas dessus.
  • Importer un fac-similé avec le minimum de défauts.

Fac-similés modifier

Pour importer un volume sur Wikisource, vous pouvez faire une recherche libre sur internet. Ces sites sont majeurs dans la publication des volumes :

Comparer les différents fac-similés avant d'en importer sur Wikisource !! Il est crucial d'avoir d'excellents scans pour pouvoir faire travailler efficacement l'OCR automatique.

OCRisation (passer d'un scan au texte) modifier

Utiliser des outils grandement utiles en gain de temps pour l'édition :

  • l’OCR intégré à la fenêtre d’édition [Transcrire le texte], soit Tesseract soit Google ; selon les livres, les résultats fournis peuvent être meilleur pour l'un ou l'autre.
  • d’autres outils "gadgets" peuvent être activer dans "Préférences > Gadget", dans la rubrique "Edition" : Scanilles, comme l'incroyable   permettant la correction partielle d’erreur dans des textes comportant des s longs (ſ) (si jamais ça ne marchait pas, suivre ces instructions), et "Typo"   (qui met automatiquement les apostrophes courbes et autres corrections automatiques). Cela donne accès à de nouveaux boutons dans votre barre d’outils très efficaces pour éditer les pages !
  • Enfin, l'outil "ocr.wmcoud.org" accessible via l'onglet [Transcrire le texte] puis [Options avancés] est bien utile pour sélectionner et transcrire une zone d'un scan, pour une page à plusieurs colonnes ou bien pour prendre en compte d'autres langues comme l'allemand, le grec ou l'hébreux. Voir cet exemple.

Balisage / Sectionnement modifier

Lors de la retranscription d’une page, il est important de sectionner les différentes entrées présentes sur cette dernière. Vous pouvez le faire en même temps que la retranscription, ou bien repasser une fois les retranscription faites. Néanmoins, il est important de ne pas valider une page (la mettre en vert) si elle ne comporte pas cette structure. Une page validée est sensée n’être plus à retravailler.

Cette structure supplémentaire s’exprime avec l’insertion du code suivant en début de chaque entrée :

## TITRE DE L’ARTICLE ##
Titre de l’article mis en forme normalement, bla bla bla…
Contenu de l’article mis en forme normalement, bla bla bla…

En début de page, il est nécessaire de mettre la balise <nowiki/> (le passage à la ligne après la balise est important) :

## TITRE DE L’ARTICLE ##
<nowiki/>

Titre de l’article mis en forme normalement, bla bla bla…
Contenu de l’article mis en forme normalement, bla bla bla…

Pour voir des exemples d’usages de ce code, voyez les liens d’exemples pour l'entrée « Abader (s’) » du dictionnaire : Le Littré de la Grand’Côte :

## ABADER (S’) ##
<nowiki/>

'''ABADER (S’)''', v. pr. — S’ensauver, décaniller, prendre la poudre d’escampette, se pousser de l’air, jouer des flûtes, des canilles, des guibolles, tirer ses grègues, etc. — Du provençal ''{{lang|oc|badar}}'' ouvrir, lui-même du bas latin ''{{lang|la|badare}}''. D’ouvrir, l’idée s’est étendue à sortir.

## ABANDON ##
<nowiki/>

'''ABANDON''', s. m. — « Acte par lequel un [etc. etc.]
<pages index="Le Littré de la Grand'Côte, éd. 1903.pdf" header=1 from=11 to=11 onlysection="ABADER (S’)" next="{{LGC3|Abandon}}" />

[[Catégorie:Articles du Littré de la Grand’Côte/3e éd., 1903|ABADER (S’)]]

Transclusion modifier

Un dictionnaire dispose d’une structure propre qui le différencie des autres types d’ouvrages, aussi il n’est pas difficile de l’harmoniser avec d’autres dictionnaires afin de pouvoir les aligner (notamment sur l’outil Dicothèque). Voici comment s’organise les transclusions d’un dictionnaire dans l’espace principale :

  1. Transclure dans la page au nom du livre :
    1. La page de titre
    2. Un lien vers le texte entier
    3. Un lien vers les différentes parties (introduction, préface, etc…)
    4. Une partie vers la liste des entrées avec une page par lettre (avec le modèle : {{IndexAlpha}})
    5. Une partie vers la liste des entrées avec une liste par lettre (avec le modèle : {{IndexAlpha}})
  2. Transclure les pages par lettre dans une sous-page avec le Titre en forme : « Lettre A », « Lettre B », etc.
  3. Transclure les listes par lettre dans une sous-page avec le Titre en forme : « Index alphabétique - A », « Index alphabétique - B », etc. (titre automatique avec le modèle : {{IndexAlpha}})
  4. Transclure toutes les entrées du dictionnaire dans une sous-page à leur nom. ATTENTION, il est important de développer les titres des entrées lorsqu’elles concernent des adjectifs sous la forme « bleu, -e » en « bleu, bleue », ainsi que les entrées censurées « c… » en « cul ». Sans ce développement, ces entrées deviennent très difficiles à trouver.

Pour les étapes 2 à 4, il est possible de demander l'aide d'un bot, par exemple, une fois que le travail préparatoire (correction du texte, mise en forme, mise en place des sections, utilisation des modèles de titres adéquats) est correctement effectué. Le bot qui fait les transclusions des articles se charge, par la même occasion, de créer l'index des articles, ce qui permet de se concentrer sur la correction, et laisse le travail mécanique à un robot.

  • Généralement, on ne transclut les pages qu’après les avoir corrigées. Il est vrai qu’il n'est pas toujours nécessaire de corriger l'intégralité des pages avant de créer des articles (par exemple le Trévoux), mais il est quand même certainement préférable de procéder dans l'ordre. Quitte à créer manuellement des articles pour des besoins ponctuels, mais en suivant les procédés indiqués ci-dessus et la syntaxe utilisée pour les articles créés automatiquement.
  • Si on doit en transclure malgré le manque de correction, il faut ajouter en haut de page ce bandeau « OCR brut » : {{OCR brut}}.
  • Ne pas publier des pages dont l’OCR n’est pas fidèle à au moins 95% de chaque page. cf. ce sujet sur le Scriptorium

Droits d'auteur modifier

Il existe 3 classifications pour les œuvres, chacune ayant un régime de protection de droit d’auteur spécifique dans le Code de la propriété intellectuelle français (articles mis entre parenthèses)/ Les dictionnaires peuvent être :

  • Une œuvre d’auteur unique (Article L123-1),
  • une œuvre de collaboration à laquelle ont concouru plusieurs personnes physiques, mais sans que l’une d’elles ait organisé ou dirigé la confection de l’ouvrage; par exemple : auteur, traducteur, éditeur scientifique, illustrateur, etc. (Article L123-2; et Article L113-3),
  • ou une œuvre collective c’est-à-dire créée sur l’initiative d’une personne physique ou morale qui l’édite, la publie et la divulgue sous sa direction et son nom, et sur laquelle aucun coauteur ne peut réclamer un droit d’auteur distinct sur l’ensemble (Article L123-3).

Ainsi, voici la durée des droits d'auteur qui s'applique pour chacune de ces catégories :

  • l’œuvre d’auteur : l’œuvre est sous droits d’auteur pendant toute la vie de son auteur et encore toute l’année civile de son décès et les 70 années qui suivent (où les droits sont alors transmis à ses ayants droit). Si l'auteur est décédé il y a plus de 70 ans (donc 2023-70 = 1953), l’œuvre est libre de droits et éditable ici sur Wikisource.
  • l’œuvre de collaboration :
    • L’œuvre de collaboration est la propriété commune des coauteurs. Les coauteurs doivent exercer leurs droits d'un commun accord (c'est un régime de l’indivision.) Cette œuvre tombe dans le domaine public, 70 ans après le décès du dernier des coauteurs. Donc si l’œuvre publiée est traduite, éditée scientifiquement, illustrée, il faut prendre en compte la durée des droits d’auteur du traducteur, de l’éditeur scientifique, de l’illustrateur : elle est donc sous droits jusqu'aux 70 années qui suivent le décès du dernier coauteur.
    • Cas particulier : Cependant, si l’on retrouve la même participation d’un auteur dans une publication séparée, elle revient à être une œuvre d’auteur qui entre donc le domaine public après les 70 ans de mort de l’auteur. (Car la loi prévoit en effet que « lorsque la participation de chacun des coauteurs relève de genres différents » (texte, dessin, traduction, etc.), chacun peut « exploiter séparément sa contribution personnelle », à la condition qu'il n'y ait pas de convention contraire entre coauteurs, et sans toutefois porter préjudice à l’exploitation de l’œuvre commune (Article L113-3).) Par cette même loi, nous devons comprendre que, sans publication faite séparément par un coauteur, nous ne pouvons publier sa contribution sans l’accord de ses coauteurs ; et alors il faudra attendre 70 ans après la mort du dernier coauteur pour que l’œuvre tombe dans le domaine public.
  • l’œuvre collective : Les droits d’une œuvre collective sont détenus par la personne sous le nom de laquelle l’œuvre est divulguée, et non aux auteurs, jusqu’au 1er  janvier suivant les 70 ans de la sa publication (Article L123-3).

Cas particuliers :

  • l’œuvre pseudonyme (l’auteur s’est désigné sous un nom d’emprunt dont on ignore qui il masque) ou anonyme (l’auteur est inconnu) : elle entre dans le domaine public à compter du 1er  janvier de l'année civile suivant les 70 ans de sa publication, sauf si les auteurs se sont fait connaître dans l’intervalle (Article L123-3 du CPI).
  • Dans le cas où une œuvre pseudonyme, anonyme ou collective est publiée de manière échelonnée, le délai court à compter du 1er  janvier de l'année civile qui suit la date à laquelle chaque article a été publié (Article L123-3).
  • Si l’œuvre publiée de manière posthume, pendant la période de 70 ans qui suit le décès d’un auteur, elle entre dans le domaine public au 1er  janvier suivant les 70 ans de la mort de l’auteur (Article L123-4), mais si elle est publiée plus de 70 ans après le décès d’un auteur, elle entre dans le domaine public au 1er  janvier suivant les 25 ans de la publication de l’œuvre (Article L123-4).
  • Si l’auteur est déclaré « mort pour la France », les 70 ans de droits d’auteur suivant sa mort sont prolongés (prorogation de 30 ans par exemple) ; cf. Aide:Auteurs morts pour la France.

Voir aussi modifier