Bienvenue sur Wikisource, BigonBot

Tu veux savoir ce qu'est Wikisource ? Lis : Qu'est-ce que Wikisource ?

Tu désires éditer toi aussi des textes ? Consulte le Guide du nouveau contributeur et Introduction à Wikisource pour de premières indications sur la création et l'édition des pages dans Wikisource. Tu peux également faire tes essais dans le bac à sable.

Pour signer tes messages, tu peux taper trois fois le caractère ~. Avec une quatrième tilde, en plus de ta « signature », seront affichées la date et l'heure.

Si tu veux connaître les sigles et les modèles à utiliser pour l'édition des textes : reporte-toi à la page Qualité des textes.

Des questions ? N'hésite surtout pas à me contacter, à les poser au scriptorium ou à venir discuter sur IRC.

Bonne continuation parmi nous !-- BigonBot → (écrire) 3 janvier 2007 à 20:33 (UTC)Répondre

Suggestions

modifier

Mettez ici vos suggestions pour améliorer les fonctionnalités du robot.

Bonjour,
Quelques remarques : je pense qu'il n'y a pas de risque à changer les tirets qui sont en début de ligne en tiret de dialogue (tiret cadratin), ou transformer les doubles tirets (de Project Gutemberg) en tiret cadratin.
Pour l'apostrophe courbe, il faut faire attention aux cas des symboles italique, gras. Notamment lorsque l'italique est "collé" (c'est-à-dire lorsque l'italique est juste à côté d'un des symboles). François 8 janvier 2007 à 21:53 (UTC)Répondre
Merci pour ton aide !
  • Pour les tirets cadratins, en fait je ne m'y connais pas du tout. Je constate que les tirets dans cet essai ne sont pas les mêmes que dans cette poésie. Peut-être sont-ils faux dans l’un ou l’autre des deux textes... Quant aux doubles-tirets du projet Gutenberg, ça a l'air d'être une convention, donc OK.
  • J‘avais commencé à gérer l’italique et le gras mais effectivement je n'avais pas fait attention aux cas d'italique collé... Bigon 8 janvier 2007 à 22:58 (UTC)Répondre
Il n'y a pas réellement de norme concernant les tirets cadratin ou demi-cadratin. Lorsque j'ai écrit le guide typographique, je me suis inspiré tout naturellement de celui de Wikipedia, ainsi que, pour les tirets cadratin, de ce texte. Ce dernier conseille de ne pas mélanger les tirets cadratin et demi-cadratin dans le même document (qui sont pour lui deux formes différentes d'une même chose), et a une préférence pour garder le tiret cadratin. C'est donc ce dernier qui est le plus souvent utilisé su Wikisource, je pense.
Quand je parle "d'italique collé", il y a aussi bien sûr le gras collé, et l'italique gras (cinq apostrophes droites) collés. François 10 janvier 2007 à 22:33 (UTC)Répondre


OK, merci pour ton aide. Cela est utilisable effectivement : je n'avais pas prévu les points 6, 7, 9 et 10 des "Macro" et je vais devoir revoir ma copie pour les "oe" (gestion automatisée des "oeu" et des "oei" seulement). Mais en gros le robot gère déjà les points 1, 2, 3, 4 et 5 de "Macro" et les points 1 et 2 de "A la main", à l'aide d'expressions régulières :
  1. Modifier les caractères spéciaux :
    1. ([^'])'(?!') => \1’ : permet de remplacer tous les (') qui ne sont ni suivis ni précédés d'un autre (') par un ’ (ignore donc les textes en italique ou gras, mais aussi les italiques "collés")
    2. oe => œ
    3. O[Ee] => Œ : cela veut dire qu'à la fois Oe et OE seront remplacés.
    4. "([^"]*)" => «\1» (sans espaces) : permet de gérer les guillemets indifférenciés en les repérant par couples encadrants des caractères.
  2. Gérer les espaces insécables :
    1. (\s*)«(\s*) =>  «  : remplace toute série de caractères "blancs" (à savoir espaces, quel qu'ils soient, tabulations, retours à la ligne...), ou absence de ces caractères, avant et après les «, par une espace normale avant et une espace insécable après. Idem pour » mais dans l'autre sens (insécable avant, normale après).
    2. (\s*)!(\s*) =>  !  : toute série ou absence de caractères "blancs" remplacées par (espace insécable-!-espace normale). Idem pour (?) et (;). Pour (:) je fais pareil, mais sans éliminer les retours à la ligne précédant le signe car cela peut être volontaire (: pour indentation en début de ligne)
    3. (\s*)’(\s*) =>  : enlève les caractères "blancs" avant et après les ’.
Si tu m'expliques les points 3, 5, 6 et 7 de "à la main" (je ne vois pas ce que veux dire "casse respectée", aurais-tu des exemples ?) je pense pouvoir faire ça de façon automatique.
A part ça, la "macro Adrienne", devrait pouvoir se simplifier ainsi (je ne garantis rien) :
{{Requete|Zephyrus|links:[[La Cousine Bette]]|REGEXP|(?<=[a-z])!| !}}, mais ainsi tu rates toujours les é, è, ê, ï qui peuvent aussi terminer un mot. Avec ...REGEXP|(?<=\S)!| !}} cela gérerait peut-être aussi ces accents.
Voilà j'en ai fini avec mon jargon informatique. J'espère que tu as pu comprendre quelquechose quand même. Bigon 9 janvier 2007 à 00:20 (UTC)Répondre
Attention à la ligature œ : oeu peut être transformé en œu, pour oei je n'ai pas vérifié si cela est généralisable (il faut rechercher s'il existe des mots ayant oei sans ligature au milieu d'un mot), mais en tout cas oe tout court ne l'est pas. C'est donc du style [Oo][Ee][ui] (je ne connais pas la syntaxe python, je suis sans doute dans le faux).
Ce que Zephyrus indique "à la main" concerne des opérations qui sont orthographiquement ou grammaticalement dépendantes. On ne peut donc pas les automatiser, à moins d'y mettre un moteur d'analyse grammaticale !!!!
NB : "casse respectée" signifie "majuscule ou minuscule respectée" : c'est une option de la boite de dialogue "rechercher" sous Word (ou sous OO sans doute aussi) François 10 janvier 2007 à 22:47 (UTC)Répondre
Oui, sous OO aussi. --Zephyrus 14 janvier 2007 à 20:09 (UTC)Répondre

Je pense qu'il y a une petite erreur sur le résultat du troisième test :

Au lieu de : ADAM.—Voilà votre frère, mon maître, qui vient.

il faudrait ADAM. — Voilà votre frère, mon maître, qui vient.

c'est-à-dire une espace avant et après le tiret cadratin (à vérifier cependant, je ne suis pas sûr de moi sur ce coup là). François 21 janvier 2007 à 13:26 (UTC)Répondre

De mémoire, il me semble aussi qu'il faudrait une espace, mais également sans certitude et je préfèrerais aussi qu'on vérifie :) --Zephyrus 21 janvier 2007 à 13:29 (UTC)Répondre
Effectivement, je suis d'accord ; j'ai bien essayé de le faire, mais pour l'instant le programme n'y arrive pas... "débogage" en cours... (voir la discussion autour de la requête Comme il vous plaira ci-dessous) Bigon 21 janvier 2007 à 19:11 (UTC)Répondre

Requêtes

modifier

Indiquez ici vos requêtes sous la forme *{{Requete|Pseudo|[[article]]|FORMAT}} :

  • Requête de Zephyrus terminée : FORMAT Amphitryon Date : 14 janv 07. 1 pages modifiées.
 
Glycine

BigonBot, voici des fleurs pour te remercier : tu as très bien travaillé ! --Zephyrus 14 janvier 2007 à 21:07 (UTC)Répondre

Pourquoi ma requête de Comme il vous plaira reste-t-elle en attente ? --Zephyrus 20 janvier 2007 à 22:53 (UTC)Répondre
Pour deux raisons : 1) je ne l'avais pas vue, car je ne me connecte pas assez souvent. 2) J'aimerais traiter le remplacement "—" → " — " par exemple : "ORLANDO.—Je me..." → "ORLANDO. — Je me..." et pour l’instant ça ne fonctionne pas (tests ici). BigonBot 21 janvier 2007 à 12:25 (UTC)Répondre
Le résultat paraît tout à fait acceptable : je proposerais de l'adopter comme convention éditoriale pour l'instant, car il me semble qu'il ne devrait pas être difficile de le modifier éventuellement plus tard, non ? --Zephyrus 21 janvier 2007 à 13:50 (UTC)Répondre
Je pensais garder ce tiret mais en l'encadrant d'espaces, ce qui ne fonctionne pas (informatiquement) pour l'instant. Je ne comprends pas ta proposition : tu veux garder le tiret sans les espaces ? et ceci pour toutes les œuvres de théâtre ? Bigon 21 janvier 2007 à 19:08 (UTC)Répondre