Utilisateur:Sicarov/AWB Regex


1.L'éditeur semi-automatisé AutoWikiBrowser AWB 2.Expression régulière Cherche-Remplace, [1] + aide de ChatGPT si besoin 3.pour faire des clics Actiona 4.Code du bouton T pour typographie + Gadget Caractères spéciaux raccourcis clavier

Mémo des Regex fréquentes regex101.com modifier

  • [abc] Correspond à un caractère a, b ou c ([^abc] = non [abc])
  • [a-z] Correspond à tout caractère entre a et z, en incluant a et z.
  • a|b Matches either what is before the | or what is after it - in this case `a` or `b`.

You can use alternates locally as part of a capturing/non-capturing group. For example: /I love (?:cats|dogs) but hate snakes/

  • \s correspond à un espace, une tabulation ou un caractère "nouvelle-ligne" (\S = non\s)
  • \d Matches any decimal digit. Equivalent à [0-9]. (\D = non \d)
  • a{3,6} Correspond à entre 3 et 6 caractères consécutifs (bornes incluses).
  • ^ Matches the start of a string without consuming any characters. If /m multiline mode is used, this will also match immediately after a newline character.
  • $ Correspond à la fin d'une chaîne sans consommer de caractères. Si le mode multiligne est utilisé, cela correspondra aussi juste avant un caractère d'une nouvelle ligne.
  • \n correspond au caractère nouvelle-ligne
  • (?:...) A non-capturing group allows you to apply quantifiers to part of your regex but does not capture/assign an ID. For example, repeating 1-3 digits and a period 3 times can be done like this: /(?:\d{1,3}\.){3}\d{1,3}/
  • (?=...) Affirme que le sous-modèle donné peut être mis en correspondance ici, sans consommer de caractères /foo(?=bar)/ foobar foobaz
  • (?!...) Starting at the current position in the expression, ensures that the given pattern will not match. Does not consume characters. /foo(?!bar)/ foobar foobaz
  • (?<=...) Garantit que l'expression donnée correspondra, tout en finissant à la position actuelle dans l'expression. Celle-ci doit avoir une longueur fixe. Cela ne consomme aucun caractère. /(?<=foo)bar/ foobar fuubar
  • (?<!...) Garantit que l'expression donnée ne correspondra pas, tout en finissant à la position actuelle dans l'expression. Celle-ci doit avoir une longueur fixe. Cela ne consomme aucun caractère. /(?<!not )foo/ not foo but foo
  • $1 This will return a string with the contents from the first capture group. The number, in this case 1, can be any number as long as it corresponds to a valid capture group

Des formules regex utiliser pour le travail sur des dictionnaires modifier

Pour travail avec AWB (sélection des pages, choix des remplacements) et Actiona (permettant d’automatiser la recherche et le remplacement).

  • description :expression de recherche//expression de remplacement//
  • nettoie les chiffres romains se finissant par m suivi d’une virgule : ([clvix]{0,10})m,// $1iii,//
  • nettoie les chiffres romains finissant par un ou h suivi d’une virgule en excluant les chaines pour le mot "vu,":(?<!ons|est|sera) ([clvix]{0,10})[uhn], // $1ii,//
  • encapsule les chiffres romains propres avec un espace avant, excluant des mots se finissant par une virgule: (?!civil|vil|ici)([clvix]{1,10}),// {{rom|$1}},//
  • encapsule RomMaj : ([CLVXI]{1,10}),// {{rom-maj|$1}},//
  • retrait des césures cad un tiret suivi d’un espace finissant par un saut de ligne :- \n//vide//
  • un espace après une virgule :(?<=[^0-9 {]) *,(?![\s &])(?!<br)//, //
  • un A dans un mots par v :([a-z])A([a-z])//$1v$2//

Remplace les i avant un chiffre par 1 dans une date :i(\d)//1$1//

  • Remplace les i après un chiffre par 1 dans une date :(\d)i//${1}1//
  • Remplace les o dans une date par 0 :(\d)o//${1}0//
  • Supprime les caractères suivant:[■•]//vide//
  • Remplacement très fréquent :celte//cette//
  • conversion en apostrophes courbes des apostrophes droites :([^'])'([^'])//$1’$2//
  • DAC mise en italique des ref.: (Eccli|ibid|Sap|Ad Eph|Mand|Sim|Mach|Dan|Strom|In Ps|P\. G|Epist|Esd|In Joa|In Agg|In Zach|In Jer|Apol|Concil|Dial\. adv\. Pelag|In Dan|P\. L|Cor|Ad Smyrn|Th|Tim|Thess|Jac|Am|Is|Jer|In Ez|Sam|Deut|Reg|Zach|Num|Jud|l\. c|Dict|Hab|Introd|sqq|Compend|Par|Mich|op\. cit|Matt|Ps|Lc|Mt|Mc|Io|Luc|Act|Heb|Ap|In Ioan|Hom|Mal|Jo|Serm|Ignat|Barn|Polyc|Gal|Denz|Vulg|Ib|Ep|homil|Quodlib|De\.princ|loc\.cit|Sent)\.//$1.
  • Encapsule {{nr ||}} 2 lignes NOINCLUDE (chiffre de quatre saut de ligne, caractère majuscule sur une ligne saut de ligne chiffre de quatre et insertion dans le noinclude : <\/noinclude>(\d{1,4})(\n\n)([A-ZÀ-ÖØ-Þ—\- ()Œ\.]{2,})(\n\n)(^\d{1,4})//{{nr|$1|$3|$5}}
  • Encapsule {{nr ||}} 2 lignes NOINCLUDE:<\/noinclude>(\d{1,4})(\n\n)([A-ZÀ-ÖØ-Þ—\- ()]{2,})(\n\n)([A-ZÀ-ÖØ-Þ—\- ()Œ\.]{2,})(\n\n)(^\d{1,4})//{{nr|$1|$3 — $5|$7}}
  • Repérage du grec : û avec des caractère avant ou après et £ avec des caractère avant ou après, ajouter le repère {{grec}}
  • Encapsule DTC {{sc|I. Titre}} titre I. suivi du tiret saut de ligne : ^(I|II|III|IV|V|VI|VII|VIII|IX|X)\. ([A-Za-zÀ-ÖØ-öø-ÿ\- ]+)(\. — )//$1. $2.\n\n
  • Encapsule et section DTC TITRE gras et ## TITRE ## (versionBeta): (\n\n|\n\n\d\. )([A-ZÀ-ÖØ-Þ]{4,}[A-ZÀ-ÖØ-Þ\-’ ()]{2,}[A-ZÀ-ÖØ-Þa-zà-öø-þ()\- ’]{0,})(?=(\.|,))//\n##$2##\n\n$1$2
  • Mise en exposant : Sum. theol Ia IIae : ((I a II »)|(I a II\*)|(I » II »)|(1\*11\*)|(Ia II ae)|(Ia IIae)|(I a II\*)|(I 1 - II")|(I a II »)|(I a II »)|(I » II\*)|(I 1 H")|(I a -I I æ)|(I a -II æ)|(I&-II »)|(I a ll æ)|(F-II\*)|(I\* II »)|(I’II\*)|(I a\.II æ)|(I » ll’\^)|(I » II®)|(I a - II æ)|(l’II"’)|(I a II »|l’II")|(l" II*))//I{{e|a}}-II{{e|æ}}
  • "e remplace c" (les clhqytxvr après n avant sont exclu) ex fonction, manuscrit, turcs, leclercq, hycsos ((?<=regarde si c'est entouré par): (?<=[bdfghjklmpqtvwz])c(?=[b dfgjmnpswz])//e