MediaWiki:Gadget-correct long s data last.js

Note : après avoir enregistré vos modifications, il se peut que vous deviez forcer le rechargement complet du cache de votre navigateur pour voir les changements.

Firefox / Safari : Maintenez la touche Maj (Shift) en cliquant sur le bouton Actualiser ou pressez Ctrl-F5 ou Ctrl-R (⌘-R sur un Mac) ;
Google Chrome : Appuyez sur Ctrl-Maj-R (⌘-Shift-R sur un Mac) ;
Internet Explorer : Maintenez la touche Ctrl en cliquant sur le bouton Actualiser ou pressez Ctrl-F5 ;
Opera : Allez dans Menu → Settings (Opera → Préférences sur un Mac) et ensuite à Confidentialité & sécurité → Effacer les données d'exploration → Images et fichiers en cache.

if ( window.CorrectLongS === undefined ) {
	window.CorrectLongS = {};
}

var char_min = 'a-zéèàùâêîôûŷäëïöüÿçœæſ';
var char_maj = 'A-ZÉÈÀÂÙÊÎÔÛŶÄËÏÖÏŸÇŒÆ';
var char = char_min + char_maj;
 
var bw = '([^' + char + ']|^)';
var ew = '([^' + char + ']|$)';

window.CorrectLongS.typo_def_long_s_last = new Array(
    // Voir  MediaWiki:Gadget-correct long s data 3.js
    "VoXXXXXyez", "Voyez",//Voir plus haut
    " ''Voyez'' ?\n\n", " ''Voyez'' ",
    " [iîïíJl/]er([^cmnpz])", " ser$1",//Trop général pour data_1
    '([^eœ])iî' + ew, '$1it$2',//il possible mais plus rare
    bw + 'sur ?(et|&) ?[aà] ?mesure' + ew, '$1fur $2 à mesure$3',//ailleurs fur→sur

    // pour les eft restant, pas toujours correct mais souvent ok.
    'eft', 'est',
    bw + 'est : ([a-z])', '$1est $2',//erreur ocr plus fréquente q faux positif
    'tce(s|)' + ew, 'tée$1$2',//en dernier à surveiller

    // peut-être une erreur dans d'autre regex mais on trouve parfois L ’axxxx
    bw + "([cCdDjJlLmMnNrRsStTuU]) ’([aeéèhiîouyAEÉÈHIÎOUY])", "$1$2’$3",//si ’ fautif regex moins générale

    "([^\n])☞", "$1\n\n☞",
    "\n☞ ?\n\n", "\n☞ ",
    " ou ?\n\n", " ou ",
    "\n☞ ?\n", "\n☞ ",
    " ou ?\n", " ou ",

    // Dupliquer celle là à la fin au cas ou une des regexp ait supprimé
    // l'espace
    "([^ ])([;:!?])", "$1 $2",
    "([«;:!?])([^ \s…])", "$1 $2",
    " +", " ", // un nombre quelconque d'espaces > 1 → 1seul
    " ([,.])", "$1",//espace avant[,.] à suppr

    //{{Se| restauré en {{Sc|
    '\\{\\{Se\\|', '{{Sc|',

    // Séparé des précédentes sinon "word!»" overlap
    "([^ ])([»])", "$1 $2",

    // Les espaces en début de ligne n'ont aucun sens.
    "(\n|^) +", "$1",

    //rustine pour intitu->instru
    'instru(la|lé|le)', 'intitu$1',

    // Dupliquer aussi celle là
    bw + "&(le|la|les|de|du|des|un|une|qu|qui|que|bien|même|il|ils|dont|on|très|pour|tous|près|dans|en|souvent|par)" + ew, "$1& $2$3",

    bw + "cara&", "$1caract",
    '([a-z])see(s|)' + ew, '$1sée$2$3',

    // Dupliquer. la ligature ct produit souvent des &, essayer de les restaurer au moins dans certains cas.
    "&(ion|ions|ement|eur|eurs|ée|ées)" + ew, "ct$1$2",

    // some tool add a nowiki but some regexp break it, repair it now
    "<nowiki[ ]*l>", "<nowiki />",
    '<br ?l>', '<br/>',//indisp hors Trévoux
  
    //pas espace après ouv parenthèse ni...
    '\\( ', '(',
    ' \\)', ')',

    //pas espace après ouv italique
    //retraite temporaire  bw + '(\\'\\') ([a-zéèàùâêîôûŷäëïöüÿçœæſA-ZÉÈÀÂÙÊÎÔÛŶÄËÏÖÏŸÇŒÆ0-9]*[^\\'])(\\'\\')' + ew, '$1$2$3$4$5',//surveiller

    // Une regexp précédente a pu produire des <espace>\n
    // de + les espaces en fin de ligne n'ont pas d'intérêt
    " (\n|<br)", "$1"   // pas de , pour la dernière def.
);