Discussion utilisateur:ElioPrrl/Scanilles.js

Dernier commentaire : il y a 7 mois par ElioPrrl dans le sujet Quelques bizarreries…

Doublons et activation du gadget modifier

Bonjour @ElioPrrl,

Je rencontre quelques petits soucis avec l'import de ton script, qui peut-être te touchent aussi.

  1. Pour la recherche de doublon, il semble détecter toute répétition de lettres et des cas comme se servant ou Ptolémée et sont surlignés. Est-ce qu'il y aurait moyen, comme il s'agit en général de petits mots en milieu de phrase, d'imposer la présence d'un espace ou mieux peut-être de tout non-word character (\W) avant et après la répétition ?
  2. Le gadget semble parfois ne pas s'activer en mode page : par exemple, ici, trois faux-positifs sont présents, mais au gré des chargements ils ne pas détectés. Pas d'idée d'où cela peut venir, mais il me semble n'avoir jamais rencontrer le problème via le gadget. --Jahl de Vautban (d) 5 juin 2021 à 07:08 (UTC)Répondre
  Jahl de Vautban : Pour la recherche de doublons, mauvais parenthésage (encore cette histoire de precompile_regex), mais c’est maintenant corrigé, Merci   Par contre, pour le deuxième point, en mode Page:, j’avais déjà ce genre de problèmes avant l’implémentation du complément, et je n’ai jamais su d’où cela pouvait provenir, désolé. — ElioPrrl (d) 5 juin 2021 à 10:00 (UTC)Répondre

Mots en double, affinage de la regex modifier

Bonjour @ElioPrrl, J'ai utilisé la regex de détection des mots doubles dans AWB et elle fonctionne très bien. Voici une liste de mots qu'il serait possible d'ajouter pour réduire les faux-positifs :

  • flon → pour l'expression flon flon
  • mieux → pour l'expression à qui mieux mieux
  • leu → pour l'expression à la queue leu leu
  • lui → de nombreuses tournures de phrases provoquent un double lui (mais il est peut-être préférable de garder ce faux-positif)

Si j'en trouve d'autres au fil de mes corrections je viendrai les suggérer ici. Cordialement. M0tty (d) 31 juillet 2021 à 13:56 (UTC)Répondre

  M0tty : C’est fait, sauf pour lui lui (et j’ai ajouté des règles pour repérer ces doublons hors des expressions que vous mentionnez). Merci   ! — ElioPrrl (d) 31 juillet 2021 à 14:10 (UTC)Répondre

Lettres triples modifier

Bonjour @ElioPrrl,

J'ai conçu cette regex pour détecter les lettres triples, elle ignore les lettres utilisées comme chiffres romains, car cela génère trop de faux positifs.

(?<![\|{|\=|#|"|’][\w|\s]{0,8})(?<![br|ps|.])([ABDEFGHJKLMNOPQRSTUWZabdefghjklmnopqrstuwz])\1\1+

Je pense que ça pourrait aider pas mal de monde lors de la relecture car la détection de lettres triples est quelque chose de difficile  . Est-ce que tu penses que ça pourrait être intégré à ton js ? Cordialement, M0tty (d) 10 avril 2022 à 14:40 (UTC)Répondre

  M0tty : Je vais le faire, de toute façon cela n’affectera que moi et ceux qui ont importé ma sous-page dans leur propre js. Je vous laisse vérifier qu’elle marche !  ElioPrrl (d) 10 avril 2022 à 16:56 (UTC)Répondre
Merci, mais hélas ça ne fonctionne pas.
Serait-il possible d’essayer plutôt une version simplifiée comme ceci ?
([ABDEFGHJKLMNOPQRSTUWZabdefghjklmnopqrstuwz])\1\1+
Merci ! M0tty (d) 10 avril 2022 à 20:48 (UTC)Répondre
  M0tty : C’est fait. J’imagine que la première version évitait des faux positifs, mais je ne comprends pas bien le sens des deux conditions ?<!. Ne peut-on pas les fusionner en une ? D’ailleurs, la syntaxe de ces conditions me paraît suspecte : normalement les alternatives séparées par | doivent se trouver entre parenthèses, pas entre crochets ; peut-être vaut-il mieux pas remplacer ce {0,8} par + ; et enfin les caractères # et " étant d’eux-mêmes suspects dans nos textes, peut-être peut-on les enlever. — ElioPrrl (d) 11 avril 2022 à 08:30 (UTC)Répondre
Merci, c'était du code pour éviter les détections dans des balises html, et du coup ça n'a pas de sens ici.
Je te fais complètement confiance sur la façon de l'adapter. Les regex n'emploient pas tout à fait le même code entre AWB et le JS de Mediawiki  . Cordialement, M0tty (d) 11 avril 2022 à 17:01 (UTC)Répondre

Limiter le script à l'espace Page: modifier

Hello @ElioPrrl ! Merci pour toutes les formidables améliorations que tu apportes ces derniers jours à ce script, c'est vraiment très utile. Penses-tu qu'il serait possible de limiter l'exécution de ce script à l'espace Page: (et peut-être l'espace principal également ?) Cela afin de limiter les faux-positifs qui vont être légion ailleurs (dans les noms d'utilisateurs, les listes de suivi, les modèles, etc.). Un tout grand merci en tout cas ! Cordialement, M0tty (d) 5 septembre 2023 à 16:07 (UTC)Répondre

  M0tty : Normalement, c’est le cas : il me semble que c’est limité à l’espace Page:, l’espace Auteur:, l’espace Aide: et l’espace principal. Par exemple, pour l’instant, mon gadget n’est pas appliqué sur cette page. Là c’est juste pour pouvoir tester sur mes pages de brouillon, et cela n’affecte pas le gadget commun. Le but, c’est de proposer de remplacer le gadget commun par ma version, quitte à le modifier ensuite pour enlever les faux positifs les plus nombreux (cf. la dernière discussion sur le scriptorium). — ElioPrrl (d) 5 septembre 2023 à 16:21 (UTC)Répondre
Hello, pendant tes modifications aujourd'hui, le script m'affichait des suggestions d'erreur de typo sur toutes les pages, y compris les pages spéciales  , mais je vois que c'est résolu maintenant. J'utilise directement ta version de l'outil et pas le gadget commun, mais ça serait super de faire passer tout le monde à ta version ! M0tty (d) 5 septembre 2023 à 16:35 (UTC)Répondre
  M0tty : Ça devait être quand je faisais des erreurs  ElioPrrl (d) 5 septembre 2023 à 16:48 (UTC)Répondre

Modèle {{Séparateur de points}} modifier

Excellente initiative ! Et merci pour les améliorations déjà effectuées.

Les faux positifs qui m'ennuient le plus (pour le reste, ça ne me pose pas trop de problème : je préfère avoir des faux positifs, et un maximum d'erreurs signalées), ce sont ceux générés par ce modèle ; je comptais justement t'en toucher un mot un de ces jours. Acélan (d) 10 septembre 2023 à 12:48 (UTC)Répondre

  Acélan : C’est prévu, il suffira de mettre une classe spéciale à ce modèle. C’est déjà le cas pour le modèle {{lang}}, par exemple, et je compte aussi exclure le modèle {{abréviation}} de la vérification. (D’ailleurs, je dois même pouvoir le faire tout de suite.) — ElioPrrl (d) 10 septembre 2023 à 13:35 (UTC)Répondre
Fait  ElioPrrl (d) 10 septembre 2023 à 13:44 (UTC)Répondre
Super, merci ! Acélan (d) 10 septembre 2023 à 14:13 (UTC)Répondre

Questions préliminaires modifier

Bonjour   ElioPrrl :,

Si j'en crois mon common.js, cela fait des mois que j'utilise ton script. Par contre, ce n'est qu'à l'instant que je viens de désactivé le gadget de base (MediaWiki:Gadget-Erreurs-communes.js) dans mes préférences. Du coup, quelle version était active ? (seulement l'un de des deux ? les deux ensembles ? seulement le gadget de base j'ai l'impression, c'est la raison pour laquelle je viens de le désactivé pour être sûr de tester ton script).

Sinon, je vois sur Spécial:GadgetUsage que Gadget-Erreurs-communes.js est activé par 550 personnes dont 70 actives. Après quelques tests de base, cela vaudrait sans doute le coup de faire un bandeau affichée à tous les contributeurs pour recevoir le maximum d'avis (et pourquoi pas l'activé par défaut pour tous ensuite ?).

Cdlt, VIGNERON (d) 10 septembre 2023 à 16:13 (UTC)Répondre

  VIGNERON : Comme mon script utilise le gadget lui-même, il faut donc activer le gadget et importer mon script dans son common.js. Quant au bandeau, je veux bien en rédiger un, mais je ne sais pas où cela se fait. — ElioPrrl (d) 10 septembre 2023 à 16:17 (UTC)Répondre
  ElioPrrl : bizarre, même en désactivant le gadget, cela semble toujours fonctionner... je regarderais ça à tête plus reposée.
Pour le bandeau, vu que cela ne concerne que les contributeurs (et non les lecteurs), il doit falloir demander sur meta (m:CentralNotice). Il n'y a pas d'urgence, là aussi je pourrais regarder et te redire bientôt.
Cdlt, VIGNERON (d) 10 septembre 2023 à 16:35 (UTC)Répondre
  VIGNERON : Dans la ligne 532 du code, je charge le gadget. Je pensais qu’il fallait pour cela l’activer, mais peut-être que non, alors. Je dois dire que je n’ai jamais essayé de le désactiver.
Il y a peut-être un peu plus simple pour les bandeaux, avec Sitenotice. Il faudrait tester. — ElioPrrl (d) 10 septembre 2023 à 17:32 (UTC)Répondre
— EDIT : Fait   pour le bandeau. — ElioPrrl (d) 10 septembre 2023 à 17:55 (UTC)Répondre
  ElioPrrl : visiblement cela fonctionne sans l'activer.
La sitenotice est effectivement une solution mais plus brute que la centralnotice. Le premier s'affiche sans distinction pour tout le monde y compris les lecteurs, alors que le second est plus complexe mais peut être paramétré plus finement. Ceci dit, pour un message aussi simple et pour une courte période de temps (1 semaine dans l’idéal, 2 maximum), la sitenotice fera sans doute très bien l’affaire.
Cdlt, VIGNERON (d) 10 septembre 2023 à 18:11 (UTC)Répondre
  VIGNERON : Si je suis déconnecté, je ne vois pas le bandeau. D’ailleurs, la page d’aide de Wikipédia assure que CentralNotice vise les lecteurs et Sitenotice les contributeurs enregistrés. De toute façon, comme toi, je pense que cela n’a pas beaucoup d’importance. — ElioPrrl (d) 10 septembre 2023 à 18:14 (UTC)Répondre
Parfait dans ce cas. Cdlt, VIGNERON (d) 11 septembre 2023 à 06:11 (UTC)Répondre

Bizarreries sur les pages de Wikipédia modifier

Bonjour   ElioPrrl : Depuis que j'ai intégré le script dans mon fichier common.js (hier soir), je vois des champs cachés bizarres dans les encadrés (colonne de droite) sur toutes les pages de Wikipédia, du genre : « Vérifiez s'il faut ajouter un SCOPE ou transformer en TD (code wiki : |) » dans le bloc Fonction de la colonne de droite. Ou encore : « scope ROW » en en-têtes de ligne du bloc Biographie (toujours colonne de droite). Exemple : [page de Salluste].

Cela apparaît avec Edge mais pas avec Firefox, ni avec les fenêtres de navigation privée. J'utilise l'habillage Vector de WS, avec un PC. Côté Wikisource, tout est OK pour l'instant. Merci pour ce script ! Yland (d) 11 septembre 2023 à 08:21 (UTC)Répondre

  Yland : Cela me paraît bizarre que mon gadget sur Wikisource influe sur Wikipédia, et plus encore que cela dépende du navigateur, puisque rien dans le code ne discrimine un navigateur plutôt qu’un autre. Hier, Lorlam avait des problèmes avec le bouton d’OCR, peut-être qu’il y a eu des mises à jour en même temps que tu as ajouté le script ? Si le problème persiste encore quelques jours, avertis-moi, j’y jetterai un œil plus attentif  ElioPrrl (d) 11 septembre 2023 à 10:30 (UTC)Répondre
  ElioPrrl : oui, il est possible que ce soit une pure coïncidence. Pour autant : vois-tu les mêmes bizarreries que moi sur la page de Wikipédia indiquée dans mon message précédent ? Par avance, merci de tester. Yland (d) 11 septembre 2023 à 10:33 (UTC)Répondre
  Yland : J’ai oublié de le dire, mais, oui, j’ai testé sur Edge en étant connecté à mon compte, et, sur la page Salluste du moins, je ne vois rien. Cela a-t-il lieu seulement quand tu es connecté ? en mode lecture ou en mode édition ? — ElioPrrl (d) 11 septembre 2023 à 10:40 (UTC)Répondre
  ElioPrrl : Oui, seulement quand j'étais connecté à Wikisource.
Je viens de tester à nouveau en désactivant ton script dans mon fichier commons.js, pour voir si l'affichage redevient correct sur Wikipédia, et c'est le cas. J'ai réactivé maintenant le script dans commons.js, et tout est OK. C'est sans doute un coïncidence… et donc une fausse alerte. Merci d'avoir regardé ! ;-) Yland (d) 11 septembre 2023 à 10:45 (UTC)Répondre
  Yland : Tant mieux, ça me rassure. Quand je fais des trucs en tant qu’administrateur d’interface, j’ai toujours peur de casser Wikisource  ElioPrrl (d) 11 septembre 2023 à 10:47 (UTC)Répondre

Faux positifs modifier

Alors déjà merci pour la mise à jour du gadget, je viens de le tester et il m'a permis de corriger une cinquantaine d'erreurs sur un texte de 700 pages. Je suis tombé cependant sur quelques faux positifs un peu curieux :

  • le mot "malin/malins" comme ici n'est pas du tout apprécié et a été signalé pour toutes les fois où il apparaît dans le texte, en regardant le code c'est peut être parce qu'il est placé avant le mot qu'il définit (malin esprit)
  • Clotilde et Clotaire sont vus comme des anomalies, mais je ne vois rien dans le code qui l'explique... Pour la plupart des textes ça n'aura aucune conséquence mais dans un texte sur les Francs ça mettra du rouge partout (en plus des faux positifs déjà existants avec "celte"...)

Ostrea (d) 11 septembre 2023 à 09:20 (UTC)Répondre

  Ostrea : Merci pour ces remarques ! C’est corrigé :
  • il n’y a pas de moyen de discriminer matin et malin en réalité, je surligne donc presque toujours malin, plus souvent fautif que correct. Je n’avais exclu que les locutions pas malin, plus malin, très malin et esprit malin, je rajoute esprits malins et corps malin(s). Si tu as d’autres exemples de locution où matin ne peut pas remplacer malin, tu peux me les donner, je peux en rajouter quelques-unes.
  • cela vient de la règle de surlignage des accents circonflexes manquants (pour *cloture < clôture par exemple) ; j’avais oublié la possibilité de noms propres, je restreins donc la recherche à clôt et aux clôtu-.
ElioPrrl (d) 11 septembre 2023 à 10:26 (UTC)Répondre
Merci pour les corrections ! Si tu trouves qu'il est opportun de les rajouter, j'ai remarqué au fil de mes corrections plusieurs erreurs plus ou moins courantes qui ne sont pas encore détectées par la mise à jour :
  • là au lieu de la
  • diner au lieu de dîner
  • mème au lieu de même
  • conne au lieu de comme
  • le ı turc (au lieu de i) et la lettre ė (e point suscris), qui se repèrent au correcteur orthographique mais très peu visibles à la lecture
  • nue et nu au lieu de une et un
Ostrea (d) 11 septembre 2023 à 13:57 (UTC)Répondre
Merci Ostrea !  je vais essayer d’en rajouter le maximum. — ElioPrrl (d) 11 septembre 2023 à 14:20 (UTC)Répondre

Le grand Coudé et -ment modifier

Bonjour,

Une erreur très courante (je viens d'en corriger plus d'une trentaine, alors que j'avais déjà fait un passage il y a quelque temps) concerne Condé/Coudé. Très peu de faux positifs (un capitaine et un évêque, pas très illustres : 6 occurrences au total dans les pages corrigées, aucune en pages validées).

Il y a aussi un cas très courant (je viens d'en traiter une bonne centaine, et ce n'est pas fini) : la terminaison -ment séparée du radical : puisque très souvent, le mot ainsi coupé n'est pas souligné par le correcteur d'orthographe (fatale ment, exclusive ment, fréquent ment, etc). Une partie des faux positifs peut être éliminée, mais ça en laisse quand même pas mal (ex. : "ce misérable ment"). À toi de voir.

(?<=[aeéimotuû]-?\s+)(?<!\b(et|elle|il|on|[tmsn]e|[lq]ui|homme|femme|fille|bouche|monde)\b)\bment\b(?!-)

Acélan (d) 11 septembre 2023 à 13:21 (UTC)Répondre

Fait   Pour ment, j’ai utilisé mes variables précomposées pour tester si un mot a tout l’air d’un verbe ou pas plutôt. Si tu veux exclure de nouveaux cas, je pourrai faire évoluer ces variables. — ElioPrrl (d) 11 septembre 2023 à 13:44 (UTC)Répondre
Merci ; on verra à l'usage ; pour les cas testés, ça a l'air bon. Acélan (d) 11 septembre 2023 à 13:55 (UTC)Répondre

Une autre erreur, dont je ne sais pas à quel point elle est fréquente (peut-être pas tellement), concerne les participes passés terminés en -è au lieu de -é : curieusement, mon correcteur d'orthographe ne le souligne jamais comme fautif ; j'imagine donc que d'autres sont dans ce cas, et que cela occasionne des erreurs ; si ce n'est pas trop compliqué à repérer, ce serait pas mal de l'ajouter ; je ne vois pas comment faire une interrogation pour corriger cela, ou pour savoir si c'est courant. --Acélan (d) 11 septembre 2023 à 14:30 (UTC)Répondre

En même temps, un è en fin de mot, à part dans les transcriptions du grec (koinè, épistémè), ça ne doit pas courir les rues. Je vais le surligner tous le temps. De même èe et èes. Pour ès, il faut que je consulte un dictionnaire, parce qu’il y a déjà près, très et les mots finissants en -cès. — ElioPrrl (d) 11 septembre 2023 à 14:38 (UTC)Répondre
Au cas où, j’ai aussi surligné les ê/êe/êes/ês en fin de mot. — ElioPrrl (d) 11 septembre 2023 à 14:51 (UTC)Répondre

Parenthèses modifier

Les parenthèses fermantes précédées d'une espace sont surlignées, mais pas les ouvrantes suivies d'une espace. Y a-t-il une raison, ou est-ce un oubli ? Acélan (d) 13 septembre 2023 à 14:33 (UTC)Répondre

  Acélan : Un oubli   je rajoute. — ElioPrrl (d) 13 septembre 2023 à 17:32 (UTC)Répondre

Tiret en fin de page modifier

Bonjour, merci pour tout ton travail. Le gadget Erreurs communes est très utile. Je remarque qu'un tiret en fin de page est noté comme erreur. Voir Page:Féron - L'aveugle de Saint-Eustache, 1924.djvu/29 Merci Viticulum (d) 13 septembre 2023 à 18:05 (UTC)Répondre

  Viticulum : Je pense que c’est corrigé. — ElioPrrl (d) 14 septembre 2023 à 07:30 (UTC)Répondre

À propos de tiret : pourrais-tu faire en sorte qu'il ne soit pas souligné pour des initiales, du type J.-J. Rousseau ? merci (et bravo, c'est de plus en plus efficace !) --Acélan (d) 20 septembre 2023 à 13:44 (UTC)Répondre

  Acélan : Normalement c’est corrigé — ElioPrrl (d) 20 septembre 2023 à 16:22 (UTC)Répondre
merci ! Acélan (d) 20 septembre 2023 à 20:55 (UTC)Répondre

Clans modifier

  Lorlam : Clans est souvent une erreur pour dans. Je le fais souligner sauf s’il est précédé de les/des/aux, etc. As-tu un exemple d’endroits où il est faussement surligné, que je rajoute de nouvelles exceptions à la règle ? — ElioPrrl (d) 20 septembre 2023 à 13:04 (UTC)Répondre

  ElioPrrl : Oui, il y a cette page : Page:Langlois - La decouverte de l'Amerique par les Normands vers l'an 1000. Deux sagas islandaises, 1924.djvu/26 a+ Laurent--Lorlam (d) 20 septembre 2023 à 13:10 (UTC)Répondre
  Lorlam : Merci ! C’est corrigé. — ElioPrrl (d) 20 septembre 2023 à 13:12 (UTC)Répondre
  ElioPrrl : : il y a aussi cette page ci : Page:Langlois - La decouverte de l'Amerique par les Normands vers l'an 1000. Deux sagas islandaises, 1924.djvu/35 a+--Lorlam (d) 22 septembre 2023 à 18:55 (UTC)Répondre
  Lorlam : : J’ai désactivé mon code, et c’est toujours surligné, cela vient donc du gadget non amélioré. Comme je vous fais tester mon amélioration en supplément du gadget non amélioré, je ne peux pas « désurligner » ce que ce dernier surligne. Mais cela devrait disparaître lorsque la version améliorée remplacera l’ancienne. Il faudra revérifier alors. — ElioPrrl (d) 22 septembre 2023 à 19:35 (UTC)Répondre
@ElioPrrlOk   Lorlam (d) 22 septembre 2023 à 20:04 (UTC)Répondre
  ElioPrrl : : encore un autre cas, qui n'est pas précédé des mêmes mots : Page:Langlois - La decouverte de l'Amerique par les Normands vers l'an 1000. Deux sagas islandaises, 1924.djvu/44.--Lorlam (d) 22 septembre 2023 à 21:52 (UTC)Répondre
… et encore un autre ici Page:Langlois - La decouverte de l'Amerique par les Normands vers l'an 1000. Deux sagas islandaises, 1924.djvu/57 => cet ouvrage est un bon cas pratique, car les mots devant "clans" sont souvent différents  --Lorlam (d) 22 septembre 2023 à 23:59 (UTC)Répondre
  Lorlam : Je ne vais pas ajouter ces exceptions : par exemple, sur tout Wikisource, il y a 3 pages avec grands clans, et à peu près 250 avec grands dans ; comme la seconde expression est largement plus fréquente, grands clans a largement plus de chance d’être une erreur qu’une bonne leçon. Pire encore pour entre clans : 6 contre plus de 2500. Par contre, je peux éviter de souligner si clans est suivi d’un ponctuation. (Par contre, cette exception ne sera pas visible tant que l’ancienne version ne sera pas désactivée). — ElioPrrl (d) 23 septembre 2023 à 08:33 (UTC)Répondre

Statu quo modifier

  ElioPrrl : Il me semble que le « quo » de statu quo devrait faire partie du même type d’exception que clans. Raymonde Lanthier (d) 20 septembre 2023 à 15:27 (UTC)Répondre

  Raymonde Lanthier : Effectivement, et c’est prévu ; en fait, le quo est surligné par le gadget dans sa version actuelle, que je n’ai pas désactivée. Normalement la nouvelle version ajoutera l’exception. — ElioPrrl (d) 20 septembre 2023 à 15:34 (UTC)Répondre
  ElioPrrl : Merci   et bravo pour ce travail colossal ! --Raymonde Lanthier (d) 20 septembre 2023 à 15:49 (UTC)Répondre
  Raymonde Lanthier : Oh j’ai pris mon temps, et surtout je ne suis pas parti de rien : il faudrait tout autant remercier Cunegonde1, notamment. — ElioPrrl (d) 20 septembre 2023 à 15:54 (UTC)Répondre
Alors Merci   Cunegonde1, notamment. --Raymonde Lanthier (d) 20 septembre 2023 à 15:56 (UTC)Répondre

Quelques bizarreries… modifier

  ElioPrrl : Merci pour ces détections qui sont bien utiles, mais qui génèrent des faux positifs qui peuvent surprendre – qui s'expliquent sans doute à la lecture du code, mais pourraient être améliorées (personnellement j'aimerais bien une distinction entre erreurs certaines et erreurs probables). Quelques bizarreries que j'ai notées récemment :

  • « au-delà » est bien accepté, mais teinté de rose dans cette page, expression « jusqu’au-delà »
  • le trait-d'union qui sépare des initiales mentionné plus haut (mon exemple est W.-H. Pickering) ; ce tiret ne devrait-il pas être remplacé par un &nbdash; qui interdit une césure à cet endroit ?
  • je suis tombé sur cette page où le premier mot est souligné de rose ; vraisemblablement les composantes contenues dans {{tiret2}} don|nait ne sont pas « recollées » avant d’effectuer le test ?
  • « parle » est également en rose (exemple vers le bas de cette page) ; là encore ce ne devrait pas être en rose, et je doute que « parte » (du verbe partir, au subjonctif) soit plus fréquent que « parle » (du verbe parler, indicatif ou subjontif)
  • « tons » dans cette phrase en fin du deuxième paragraphe de cette page ; là aussi une autre couleur serait préférable (ça pourrait être « tous », mais ça ne l'est pas forcément)
  • j'avais noté que « comparait » (sans accent circonflexe, imparfait du verbe comparer) était annoté en rose, mais ça semble ne plus être le cas aujourd'hui ?
  • j'avais noté également que les terminaisons en « lions » étaient teintées de rose, par exemple : « si nous le voulions bien » ou « ne l’oublions pas » ; cela ne semble plus être le cas aujourd'hui ?

Merci en tout cas pour l'outil, ça m'a permis de découvrir quelques cas où l'OCR avait ajouté un deuxième point sur le i, transformant ainsi la conjonction « mais » en céréale… F0x1 (d) 21 septembre 2023 à 17:17 (UTC)Répondre

Merci F0x1 !  Je réponds rapidement :
  • « au-delà » : je vais ajouter aux exceptions le cas où au-delà est précédé d’une apostrophe.
  • Il vaut mieux garder le trait d’union normal : le tiret insécable est en fait légèrement plus bas, il n’est pas reconnu dans une recherche plein texte par la majorité des navigateurs, et n’est pas reconnu par tous les dispositifs de lecture. On peut toujours utiliser {{nobr}} à la place (c’est ce que je fais personnellement).
  • Il est prévu que je modifie les modèles {{tiret}} et {{tiret2}} pour les exclure de la recherche (comme je l’ai déjà fait pour le modèle {{abréviation}}), mais ils sont protégés, et je devrai donc préalablement demander la permission aux administrateurs. EDIT : J’ai eu l’autorisation aujourd’hui 22 septembre, ce devrait être arrangé.
  • « parle » est plus souvent une coquille pour « par le », plutôt ; je vais ajouter l’exception « parle aussi ».
  • Pour « tons/tous », il est difficile d’être plus précis que je ne le suis, malheureusement. La règle actuellement procède par exceptions (surligner toujours tons, sauf si…) ; il faudrait voir si une règle qui procède positivement (surligner tons seulement si…) fait mieux. Mais elle serait bien plus longue que l’actuelle.
  • « comparait » générait plus de faux positifs que de bonnes détections, je l’ai supprimé.
  • Pour « -lions » à la place de « -tions », effectivement je précise la règle, d’abord trop imprécise, au fur et à mesure de mes relectures.
Je ne suis pas hostile à l’idée de deux listes, mais comme cela nécessiterait pour un certain travail d’écriture, et que jusque là il n’y a à peu près que toi sur la dizaine de contributeurs avec qui j’ai pu échanger qui me la demande (Vigneron a une idée analogue, mais encore plus compliquée, et qui passerait plutôt par AWB sous le contrôle d’administrateurs plutôt que par un déploiement généralisé), je l’ai rétrogradée dans l’ordre de mes priorités. Je m’attellerai avant au moins à l’amélioration du gadget typo (qui bénéficiera des retours du gadget Erreurs communes) et au gadget Caractères spéciaux, qui seront des projets plus faciles, susceptibles d’aboutir rapidement. Surtout que la distinction entre erreur certain et erreur probable est difficile à établir : il suffit de n’importe quel nom propre étranger pour rendre possible une succession de lettres apparemment impossible en français (par exemple pour -cb-, erreur pour -ch-, on a par exemple Ecbatane). — ElioPrrl (d) 21 septembre 2023 à 18:36 (UTC)Répondre
Merci   ElioPrrl : pour cette réponse précise et détaillée ! J'éviterai donc le &nbdash; et suivrai ton conseil (utiliser {{nobr}})
  • Pour « parle » au lieu de « par le » je crois qu'il y a beaucoup de cas où les 2 mots sont exclus : si le mot est suivi d'une ponctuation, si le mot qui suit commence par une voyelle (l'article « le » devient impossible), si ce mot qui suit est un article ou une préposition (de, des, …), ou encore un adverbe (gentiment, doucement, beaucoup, …), etc., ça ne peut pas être « par le ». Et je suis déjà tombé sur l'erreur contraire (l'OCR introduit un blanc dans le mot « parle »)
  • pour tons / tous, il me semble que si le mot est précédé d'un article pluriel (les des aux) ou encore d'un nombre supérieur à 1 (deux, trois…) « tous » est exclus…
Pour ce qui est erreur certaine ou probable, j'avais dans l'idée que l'erreur certaine est indiquée par un vérificateur orthographique, et que la recherche de scanilles se fait sur un texte qui semble correct (du point de vue du vérificateur orthographique). Comment s'articule ce détecteur de scanilles par rapport au vérificateur orthographique ? Je veux dire, une fonction « vérificateur orthographique » est-elle accessible depuis le code ? Si oui, il me semble que ce serait relativement aisé de faire cette distinction… F0x1 (d) 22 septembre 2023 à 11:09 (UTC)Répondre
  F0x1 : Pour parle et tous je raisonne en réalité exactement comme tu le fais, et ces exceptions sont déjà codées (sauf les adverbes très spécifiques que sont gentiment, doucement). Et je ne prétends pas avoir fait une liste exhaustive ! C’est pour ça que j’en ai appelé à vos bonnes volontés  
Hélas non, il n’y a pas de correcteur orthographique, et c’est pourquoi je parle de gros boulot d’écriture. Le correcteur orthographique est une fonctionnalité du navigateur, pas de MediaWiki : il n’y a donc aucun lien entre eux. Si on avait un dictionnaire du français, et j’entends par là non seulement un répertoire des mots possibles, mais un classement de ces mots en catégories grammaticales, ce serait formidable. Il me faut pallier ce manque, et c’est la raison d’être, dans cette amélioration, des variables si_masc/saufsi_masc, si_verb/saufsi_verb, etc. ; toutefois ces tests ne peuvent qu’être approximatifs. Il y a des projets de correcteurs sur MediaWiki (SpellingApi, LanguageTool), mais ils sont tous à l’état de test. — ElioPrrl (d) 22 septembre 2023 à 11:23 (UTC)Répondre
  ElioPrrl : Merci, effectivement ce que je m'étais noté est résolu  . Je ne vois pas de définition d'adverbe dans le code, ce serait sûrement trop compliqué, la terminaison —ment pouvant être une terminaison verbale (clament) ou un substantif désignant une action (claquement)… En tout cas je trouvé le résultat très utile, et j'apprécie aussi beaucoup la méthode (appel à tester préalablement au déploiement) ! F0x1 (d) 23 septembre 2023 à 10:51 (UTC)Répondre
  F0x1 : Tu as tout compris   Pour la méthode, je vais essayer de l’appliquer pour toutes les modifications importantes que j’aurais à faire en tant qu’administrateur d’interface, surtout maintenant que je sais comment m’y prendre pour afficher un bandeau d’avertissement. Je pense que c’est une transparence nécessaire pour pouvoir faire bouger une communauté que j’ai parfois éprouvée assez rétive à des changements mal expliqués ou mal débattus. — ElioPrrl (d) 23 septembre 2023 à 11:08 (UTC)Répondre

Virgules superflues modifier

Bonjour,

Il y a un certain nombre de mots qui ne devraient pas être suivis d'une virgule : dans, en, la (dans ce cas, ce n'est pas la virgule qui est en trop, c'est l'accent qui manque, sauf quand il s'agit de notes, ou de tra la la ; cela donne pas mal de faux positifs, mais l'erreur est assez courante), à, cette, ces, sur (là encore, c'est souvent l'accent qui manque). Acélan (d) 22 septembre 2023 à 12:42 (UTC)Répondre

  Acélan : C’est fait. Par contre, je suis un peu timoré sur le cas des prépositions : il y a le cas des définitions de dictionnaires, des énumérations dans les grammaires, des entrées dans les index ; et puis, une préposition est aussi un lieu commun pour introduire une incise (il devrait arriver à, mettons, dix heures). Sur les 20 premiers résultats de recherche pour sur,, j’obtiens cinq scanilles, une incise tout à fait régulière, et 14 pages de dictionnaires ou apparentés. J’ai peur que cela effraie trop pour être généralisé à tous. Je verrai selon les réactions dans les prochains jours, peut-être que je te le laisserai implémenter dans ta feuille personnelle. — ElioPrrl (d) 22 septembre 2023 à 13:35 (UTC)Répondre
Il y a les énumérations, mais cela concerne peu de pages ; quant aux incises, c'est à cause d'elles que je n'ai cité que quelques prépositions, très rarement suivies d'une incise (dans, en, à, sur - à la différence de avec ou pour). Quant aux possessifs et démonstratifs, je n'ai pas testé ce, qui doit générer quelques faux positifs ; leur également (le leur, la leur) ; et surtout, attention à ton et son, qui ne sont pas uniquement des possessifs  . Acélan (d) 22 septembre 2023 à 13:39 (UTC)Répondre
J’ai copié-collé trop vite, effectivement, merci ! — ElioPrrl (d) 22 septembre 2023 à 13:42 (UTC)Répondre
Sur les résultats de recherche pour "sur," : c'est une correction que j'ai déjà faite, il y a quelque temps, sur la totalité des pages validées et corrigées, me semble-t-il ; il est donc normal que tu ne trouves pas beaucoup de résultats probants. Acélan (d) 22 septembre 2023 à 13:45 (UTC)Répondre
J’ai rajouté quelques pluriels, qui matchent surtout du latin ou de l’ancien français. Si les gens sont consciencieux et utilisent le modèle {{lang}}, ils ne le verront donc pas. — ElioPrrl (d) 22 septembre 2023 à 13:48 (UTC)Répondre
Retour à la page de l’utilisateur « ElioPrrl/Scanilles.js ».