Discussion:Dictionnaire touareg – français
Indentation
modifierEst-il possible d’éviter l’indentation des alinéas dans ce dictionnaire? Dans la plupart du livre, l’auteur n’utilise pas d’indentation; p.ex. p. 708. — Linus (disc) 18 mars 2011 à 00:45 (UTC)
Transition des deux fichiers
modifier
Malheureusement, je n’ai pas trouvé de l’aide pour céer un seul fichier de ce livre-ci, ni ici, ni sur Commons. Je ne sais pas comment on peut réaliser la transclusion de la transition entre les deux fichiers (qui se trouve au milieu d’un alinéa). Dans la section Dictionnaire touareg – français/L, il faut transcluder pp. 971 à 1000 du premier fichier et pp. 1 à 131 du deuxième fichier. Merci pour toute aide! — Linus (disc) 18 mars 2011 à 01:02 (UTC)
- J’ai créé le fichier Livre:Foucauld, Dictionnaire touareg.djvu, donc le problème est resolu. Qu’est-ce que vous pensez, devrait-on garder Livre:Foucauld, Dictionnaire touareg, part 1.djvu et Livre:Foucauld, Dictionnaire touareg, part 2.djvu et tous les redirections, ou supprimer-les? — Linus (disc) 10 avril 2011 à 09:31 (UTC)
- Inutile vu que le nouveau fichier est la simple concaténation des deux anciens. — Phe 14 juin 2011 à 21:05 (UTC)
- Merci! — Linus (disc) 14 juin 2011 à 21:50 (UTC)
Encodement des tifinagh
modifierÉvidemment, ce dictionnaire utilise les caractères tifinagh abondamment. Ça pose des problèmes:
1. La direction d’écriture des tifinaghs dans le dictionnaire est de droite à gauche. Je trouve que c’est important de réproduire cette caractéristique. Pandries pense qu’il est mieux d’écrire les mots en tifinagh de gauche à droite et y mettre une balise bdo. Verdy_p préférait la balise span avec l’attribut dir="rtl". Moi, je ne sais pas. Jusqu’à maintenant, j’ai écrit les tifinagh de droite à gauche (sauf sur page 946, après le conseil de Pandries).
Quoi faire? Quelle direction? Peut-être c’est une bonne idée de créer un modèle pour les tifinagh?
2. Les tifinaghs utilisent des ligatures qui portent de l’information. Pandries a proposé d’utiliser le liant sans chasse, et je l’ai utilisé dans les pages transcrits jusqu’à maintenant. Mais il y existe un Tifinagh Consonant Joiner, exprêt pour encoder les ligatures en tifinagh. Je suis en peu surpris que Pandries, qui est spécialisé dans le tifinagh, n’a pas conseillé d’utiliser çe caractère. Je vais lui contacter. Quoi faire?
— Linus (disc) 18 mars 2011 à 01:52 (UTC)
- Après tout, je pense qu’il est mieux de réspecter le standard Unicode et encoder les tifinaṛ de gauche à droite. Je vais effectuer ce changement bientôt. La balise <bdo> semble fonctionner dans Firefox, mais non dans des autres navigateurs. Peut-être un pourra utiliser-la un jour ou l’autre ; un modèle pour les tifinaṛ me semble une bonne idée en tout cas. — Linus (disc) 30 mars 2013 à 16:24 (UTC)
- Le renversement est fait. — Linus (disc)
Diacritiques doubles
modifierFoucauld utilise le digraphe ou surmonté par brève ou circonflexe, centré sur les deux lettres. Comment encoder ça?
Il y a les caractères Unicode COMBINING DOUBLE CIRCUMFLEX ABOVE et COMBINING DOUBLE BREVE pour représenter (à peu près) ces diacritiques. Malheureusement, peu des polices contiennent ces caractères.
Verdy_p trouve qu’il n’est pas necessaire d’utiliser les diacritiques doubles, et que oû et oŭ suffisent. Je suis d’accord que Oû et Oŭ est mieux (au début des noms propres), mais dans les autres cas je préférait de représenter le texte de manière plus exacte que possible.
Qu’est-ce que vous pensez? — Linus (disc) 21 mars 2011 à 00:31 (UTC)
- Après considération prolongé je pense qu’il serait au mieux de représenter les diacritiques doubles, mais ils ne s’affichent pas très bien. Alors j’ai l’intention de les remplacer par oŭ, oû. Si, un jour ou l’autre, on veut revenir sur les diacritiques doubles, ça devrait être possible, par remplacement automatisé en combination avec le Modèle:Lang. — Linus (disc) 23 mars 2013 à 17:49 (UTC)
suspension temporaire (de ma part) & liste de choses à faire
modifierDans les prochains mois je sera occupé à finalement atteindre mon degré universitaire. Afin de prémunir le projet un peu contre l’abandon, j’ai assemblé une liste de choses à faire. — Linus (disc) 21 janvier 2014 à 21:09 (UTC)
déceler pourquoi mes additions à la barre d’outils ne fonctionnent plus— Linus (disc) 5 avril 2014 à 02:38 (UTC)
- abréviations ({{abréviation}})
- p. 13 et pp. 945–7 sont utilisés comme bac à sable pour l’utilisation du modèle
- établir des règles d’édition pour l’usage du modèle – p. ex. (Ta. 1) ?
- réaliser un javascript pour semi-automatiser l’insertion du modèle
ajouter un bouton pour le modèle à la barre d’outils- récupérer les abréviations dans les pages existantes
- {{abr}} ? {{abbr}} ?
- liens / références ({{liat}})
- p. 13 et pp. 945–7 sont utilisés comme bac à sable pour l’utilisation du modèle
- établir des règles d’édition pour l’usage du modèle : aussi pour les synonymes et autres mots non spécifiquement introduits par v. ?
- récupérer les pages existantes
- ajouter un bouton pour le modèle à la barre d’outils
- liens additionels pour les formes de conjugaison et les verbes utilisés comme types de conjugaison ?
réaliser un javascript pour automatiser l’insertion du modèle {{DctAncre}}— Linus (disc) 24 septembre 2020 à 18:58 (UTC)
réaliser un javascript pour faciliter la transcription des indications de conjugaison, c’est à dire un tel remplacement automatisé :— Linus (disc) 10 avril 2014 à 21:45 (UTC)conj. 99 ;
→{{abréviation|conj.|conjugaison numéro}} {{lia|Appendice|C99|99|2009}} « ''{{lang|thv-Latn|bereġ}}'' » ;
établir une règle d’édition pour les tifinagh – {{lang|thv-Tfng|dir=rtl|…}} ? & réaliser un javascript pour insérer-le automatiquement & récupérer les pages existantes— Linus (disc) 15 septembre 2014 à 21:03 (UTC)
- {{lang|thv-Latn}}
- apparemment, non pas tous les mots sont dans le dialecte de l’Ahaggar (ISO thv)
- baliser tous les mots selon leur langue / dialecte spécifique ? Ça serait très compliqué.
baliser tous les mots lang="ber" ? Est-ce conforme au standard ?Amener les balises spécifiques quand le texte est à complet ?- y a-t-il la possibilité de baliser un mot avec deux langues ??
- Les mots berberes sont maintenant balisé par lang="ber", parce-que "thv" ‹ tamahak › est trop spécifique – tamahak n’est qu’un de à peu près 6 dialectes présent dans le dictionnaire. En plus, il est difficile de attribuer tous les mots à chaque dialecte. Par exemple, sur page 2, le mot tădṛaḳ n’est pas accentué particulièrement – ce n’est que sur page 538 qu’on trouve que ce mot n’est pas une forme tamahak, mais tamacheq et ainsi devrait être balisé "taq". — Linus (disc) 15 septembre 2014 à 21:03 (UTC)
Projet-pilote de reconnaissance optique de caractères – balisage fin de ligne
modifierJ’ai commencé à baliser les fins de lignes afin de pouvoir utiliser les pages déjà transcrites comme matériel d’apprentissage pour le logiciel de reconnaissance optique de caractères Transkribus. Ce balisage est nécessaire pour l’apprentissage d’un réseau de neurones artificiel. Les environs 500 pages promettent d’être une base suffisante pour un bon modèle, ce qui devrait faciliter grandement le reste du travail.
J’utilise les caractères Unicode suivantes pour la balisage :
fin de ligne | Unicode |
---|---|
normal | U+2028 LINE SEPARATOR |
avec césure | U+00AD SOFT HYPHEN |
Il est regrettable que ces caractères soient invisibles. Si quelqu'un a une suggestion alternative pour la balisage, je suis ouvert pour cela ! Quoi qu’il en soit, j’espère que ces modifications s’inscriront dans le cadre de Wikisource et ne seront pas perturbateurs.
Dans le cadre de mon travail dans le domaine des humanités numériques, je prévois de superviser un stage de plusieurs semaines à partir de début octobre, au cours duquel une collègue contribuera à cette balisage. Mes contributions pendant ce stage seront rémunérées et j’utiliserai mon compte d’utilisateur professionnel pendant cette période. La stagiaire – étudiante des humanités numériques – se présentera certainement ici au début de son stage.
— Linus (disc) 24 septembre 2020 à 20:39 (UTC)
- La stage de Ginger FoxB est fini et nous avons préparé 184 pages pour Transkribus. La reconnaissance des caractères par Transkribus a une fidelité de 2,21% (taux d’erreurs de caractère). C’est un résultat très satisfaisant ! Je vais probablement continuer à corriger des pages et préparer-les pour Transkribus – et je vais écrire une petite documentation sur la page Discussion Livre:Foucauld, Dictionnaire touareg.djvu.