Raccourci [+]
WS:BR
Page annuelle des requêtes aux robots de 2021
En résumé En résumé :
Cette page a pour but de lister les requêtes adressées aux bots.
Pour faire une demande, créez une nouvelle section en y renseignant vos besoins. Un des dresseurs ou dresseuses disponibles prendra en charge votre demande. Les demandes peuvent être discutées sur la présente page, dans la section de la demande.
WikiBot en pleine transcription !
État des requêtes
Requête en cours de traitement En traitement
Traitée
Requête refusée Refusée
Requête en attente de renseignements complémentaires Attente d’infos
Requête démarrée puis mise en instance En pause
Requête classée sans suite Sans suite

Recherche d'homonymes

modifier

Bonjour,

À mesure que le nombre d'œuvres grandit sur Wikisource, on se retrouve avec de plus en plus d'homonymies, mais vu que la manière dont nous nommons les œuvres a également évolué (les œuvres sont souvent placées dans des sous-pages en fonction de l'édition, ou lorsqu'il s'agit de poèmes, dans une sous-page du recueil, etc), les homonymies sont plus difficiles à détecter et à lister dans une page d'homonymie.

Aussi, serait-il possible de lister par ordre alphabétique les pages de l'espace principal qui possèdent un titre court (20 caractères par exemple, sans tenir compte du titre de la page principale lorsque c'est une sous-page, ni de tous les caractères placés entre parenthèses) ? De cette manière, nous pourrions repérer toutes les pages homonymes et nous assurer qu'elles sont bien listées dans une page d'homonymie.

Merci pour votre aide. M0tty (d) 3 février 2021 à 16:46 (UTC)[répondre]

M0tty, Lorsque vous écrivez « les pages de l'espace principal », voulez-vous dire celles listées sur cette page ? — Cantons-de-l'Est discuter 21 juillet 2021 à 09:45 (UTC)[répondre]
Bonjour Cantons-de-l'Est (d · c · b), oui, exactement. Mais dans cette liste il est difficile de retrouver les homonymes parce qu'ils peuvent être cachés dans des sous-pages, ils ne se retrouvent donc pas listés à la suite les uns des autres. Cordialement. M0tty (d) 21 juillet 2021 à 11:49 (UTC)[répondre]
M0tty, Cette liste comprend 557 172 pages. Êtes-vous prêt à analyser une liste avec autant d'éléments ? Par exemple, à raison de 5 secondes par titre, il vous faudra près de 625 heures pour la parcourir au complet.
Par ailleurs, j'ai fait quelques tests qui me laissent penser que la taille de cette liste dépassera 20 Mio, ce qui excède largement la taille autorisée pour une seule page dans Wikisource (elle est de 2 Mio). Je devrai donc créer au moins 11 pages. Chacune sera lourde à charger.
Cantons-de-l'Est discuter 23 juillet 2021 à 21:18 (UTC)[répondre]
Est-ce qu'il serait possible d'une manière ou d'une autre d'exporter cette liste sur un tableur, avec une colonne à chaque fois qu'on descend d'un niveau de sous-page et de manière à aligner à droite les titres (cf. plus bas, ce sera sans doute plus clair avec un exemple), et de faire dans ce document une recherche par doublon ? --Jahl de Vautban (d) 24 juillet 2021 à 10:15 (UTC)[répondre]
A B C
Blablabla
Blebleble/ Blablabla
Bliblibli/ Blebleble/ Blablabla
Bonjour,
Je suis surpris de la taille de la liste après réduction à un certain nombre de caractères. Peut-être faut-il revoir ce chiffre à la baisse ? Combien y a-t-il de pages de l'espace principal de 15 caractères maximum (en décomptant les parenthèses et ce qui se trouve avant le / pour les sous-pages ?
Et pour faire une autre proposition d'affichage qui soit plus clair, serait-il possible de faire en sorte que les liens affichés soient justement listés par ordre alphabétique en supprimant ce qui précède le / ? Merci pour votre aide. M0tty (d) 24 juillet 2021 à 11:07 (UTC)[répondre]
M0tty, J'avais oublié pour la restriction de 15 caractères sur le terme après la dernière barre oblique. En l'appliquant, j'ai déterminé qu'il y a 263 655 pages à analyser. Plus bas, on voit un extrait de tableau que je prévois créer. Les colonnes 2 à 6 sont les sur-pages de la colonne 7. Les rangées seront triées en fonction du terme dans la dernière colonne, qui est aussi un wikilien. Les redirections ne seront pas élaguées (j'ignore comment faire et j'ai d'autres obligations). Quant à la proposition de créer un tableur, ce n'est pas dans mes cordes. Toujours intéressé malgré la longueur du tableau ?
Cantons-de-l'Est discuter 25 juillet 2021 à 14:24 (UTC)[répondre]
No A B C D E F
1 "Daniel Darc"
2 "Mme de Stolz"
3 Œuvres complètes Préface
4 (Verlaine)
5 *
6 ... le Cœur populai Conseils
7 ... le Cœur populai Idylle
8 ... le Cœur populai La Frousse
20 Bordeaux
21 0° cocktail (Recuei 0° cocktail
22 0° cocktail (Recuei Boobs
26 10
27 1453
31 1909
32 1914-1916
33 1914-1916 Commémoration
52 1914-1916 Quand même !
59 1914-1916 À la Belgique
60 1 Sonnet
61 1er janvier
62 2
63 31 octobre
64 350 recettes de cui Avant-propos
65 350 recettes de cui Bagatelle
138 352e DI Allemande - 6 44
139 391 (revue)
140 391 (revue) Articles
141 391 (revue) Auteurs
142 391 (revue) Ressources
143 4
144 813
145 813 01
146 813 02
147 813 03

Retrait des coupures de mots dans le Dictionnaire de théologie catholique

modifier

Je retire régulièrement le tiret qui coupe un mots pour aller à la ligne sur le dictionnaire de théologie catholique.

Par exemple Page:Alfred Vacant - Dictionnaire de théologie catholique, 1908, Tome 12.2.djvu/462

adhse- rere.

devient

adhserere.

J'aimerai retirer "le tiret, l'espace et le saut de ligne" sur les pages du DTC ? Cela vous semble possible. ?

Merci.

  Sicarov :, oui, c'est les boutons "OCR" et "T(ypo)" que je te mentionnais dans ta page de discussion (Petits conseils... d'un novice en OCR !). Non seulement ils opèrent une correction partielle d’erreur dans des textes, mais aussi ils retirent "le tiret, l'espace et le saut de ligne". Bien à toi ! --Éτienne ♄ (d) 25 mars 2023 à 09:11 (UTC)[répondre]

Transclusion des entrées du Petit Dictionnaire libéral

modifier

Bonjour,

J'ai besoin d'un bot pour transclure les entrées du Petit Dictionnaire libéral. Chaque entrée a sa propre section. Les pages sont à ajouter à la Catégorie:Articles du Petit Dictionnaire libéral. Les index alphabétiques sont également à générer.

Merci d'avance --Poslovitch (d) 4 juin 2023 à 16:44 (UTC)[répondre]

Transclusion faite, il reste à générer les index alphabétiques Poslovitch (d) 24 juillet 2023 à 21:24 (UTC)[répondre]

Bonjour,

J'ai besoin d'un bot pour transclure les entrées du Dictionnaire de l’argot des typographes. Chaque entrée a sa propre section. Elles démarrent au feuillet /66 et finissent au feuillet /121 inclus. Les pages sont à ajouter à la Catégorie:Articles du Dictionnaire de l'argot des typographes. Les index alphabétiques sont également à générer.

Merci d'avance --Poslovitch (d) 21 juillet 2023 à 19:29 (UTC)[répondre]

Transclusions faites, il reste à générer les index alphabétiques Poslovitch (d) 24 juillet 2023 à 16:53 (UTC)[répondre]

Bonjour.

Transclure les entrées du Petit dictionnaire des infirmières. Chaque entrée a sa propre section. Elles démarrent au feuillet /4 et finissent au feuillet /27 inclus. Les pages sont à ajouter à la Catégorie:Articles du Petit dictionnaire des infirmières. Les index alphabétiques sont également à générer.

Merci d'avance --Poslovitch (d) 20 mars 2024 à 08:23 (UTC)[répondre]

Transclusions faites, il reste à générer les index alphabétiques. Poslovitch (d) 14 avril 2024 à 10:20 (UTC)[répondre]

Recherche de liens brisés

modifier

Bonjour,

Serait-il possible de dresser une liste de toutes les pages de l'espace principal qui sont soit des redirections soit des pages d'homonymie et qui sont liées à un index de l'espace Livre: ? Je n'ai pas les connaissances techniques pour pouvoir dresser pareille liste.

Cela permettrait ensuite de réparer les index à la main en corrigeant les liens.

Merci pour votre aide ! Cordialement, M0tty (d) 4 avril 2024 à 21:06 (UTC)[répondre]

Salut @M0tty. Je ne suis pas sûr de comprendre en quoi lister les redirections ou les pages d’homonymies permettraient de détecter les liens cassés vers des pages d’index ? À+, Lepticed7 (Viens tcharer ! :D) 5 avril 2024 à 06:52 (UTC)[répondre]
Bonjour. Peut-être que M0tty envisage des cas où dans un index (espace de noms livre) il y a une TDM qui est constituée de liens vers l'espace principal et un de ces liens pointe vers une page d'homonymie ou de redirection ? Мишоко (d) 5 avril 2024 à 09:02 (UTC)[répondre]
Voilà, c'est exactement ça. Quelqu'un créé un index dans un espace Livre avec des liens qui pointent vers l'espace principal. Puis pour une raison ou une autre, une de ces pages de l'espace principal est renommée (pour en faire une redirection ou une page d'homonymie). L'index est donc cassé et la navigation dans le livre est brisée à cette page. Lister toutes les pages d'homonymie et de redirection qui sont liées depuis un index de l'espace livre permettrait d'identifier les index brisés et de les réparer. Merci! M0tty (d) 5 avril 2024 à 10:01 (UTC)[répondre]
Par exemple, sur l'index Livre:Goethe - Poésies, trad. Blaze, 1843.djvu le lien vers Le Roi des Aulnes devrait être vers Le Roi des Aulnes (traduction Blaze). Мишоко (d) 6 avril 2024 à 12:20 (UTC)[répondre]
Hello !
Petite relance concernant cette demande. Quelqu'un aurait-il les compétences pour générer cette liste ? Je peux m'occuper de mettre en place le projet de restauration des index brisés une fois la liste générée.
Merci pour votre aide ! M0tty (d) 12 mai 2024 à 11:12 (UTC)[répondre]
Bonjour. Il me semble me souvenir que quand j'ai regardé, j'ai fini par conclure que ce ne serait pas intéressant car il y aurait trop de faux positifs mais je ne me souviens plus pourquoi. Ma dernière note sur le sujet était : "Le cas j'imagine plus fréquent où la TDM n'est pas dans l'index mais dans l'espace page : Livre:Béranger - Chansons anciennes et posthumes.djvu. Par exemple le lien vers L’Académie et le Caveau est à corriger." Мишоко (d) 12 mai 2024 à 11:32 (UTC)[répondre]
Hello @Мишоко,
Merci pour ta réponse, mais je n'ai pas bien compris ta dernière phrase.
Je n'ai pas l'impression à première vue qu'il y ait tant de faux-positifs que cela. Aurais-tu des exemples ?
D'avance merci ! M0tty (d) 12 mai 2024 à 11:39 (UTC)[répondre]