Wikisource:Bots/Requêtes
En résumé : Cette page a pour but de lister les requêtes adressées aux bots. Pour faire une demande, créez une nouvelle section en y renseignant vos besoins. Un des dresseurs ou dresseuses disponibles prendra en charge votre demande. Les demandes peuvent être discutées sur la présente page, dans la section de la demande. |
État des requêtes |
En traitement |
Traitée |
Refusée |
Attente d’infos |
En pause |
Sans suite |
Recherche d'homonymes
modifierBonjour,
À mesure que le nombre d'œuvres grandit sur Wikisource, on se retrouve avec de plus en plus d'homonymies, mais vu que la manière dont nous nommons les œuvres a également évolué (les œuvres sont souvent placées dans des sous-pages en fonction de l'édition, ou lorsqu'il s'agit de poèmes, dans une sous-page du recueil, etc), les homonymies sont plus difficiles à détecter et à lister dans une page d'homonymie.
Aussi, serait-il possible de lister par ordre alphabétique les pages de l'espace principal qui possèdent un titre court (20 caractères par exemple, sans tenir compte du titre de la page principale lorsque c'est une sous-page, ni de tous les caractères placés entre parenthèses) ? De cette manière, nous pourrions repérer toutes les pages homonymes et nous assurer qu'elles sont bien listées dans une page d'homonymie.
Merci pour votre aide. M0tty (d) 3 février 2021 à 16:46 (UTC)
- M0tty, Lorsque vous écrivez « les pages de l'espace principal », voulez-vous dire celles listées sur cette page ? — Cantons-de-l'Est discuter 21 juillet 2021 à 09:45 (UTC)
- Bonjour Cantons-de-l'Est (d · c · b), oui, exactement. Mais dans cette liste il est difficile de retrouver les homonymes parce qu'ils peuvent être cachés dans des sous-pages, ils ne se retrouvent donc pas listés à la suite les uns des autres. Cordialement. M0tty (d) 21 juillet 2021 à 11:49 (UTC)
- M0tty, Cette liste comprend 557 172 pages. Êtes-vous prêt à analyser une liste avec autant d'éléments ? Par exemple, à raison de 5 secondes par titre, il vous faudra près de 625 heures pour la parcourir au complet.
- Par ailleurs, j'ai fait quelques tests qui me laissent penser que la taille de cette liste dépassera 20 Mio, ce qui excède largement la taille autorisée pour une seule page dans Wikisource (elle est de 2 Mio). Je devrai donc créer au moins 11 pages. Chacune sera lourde à charger.
- — Cantons-de-l'Est discuter 23 juillet 2021 à 21:18 (UTC)
- Est-ce qu'il serait possible d'une manière ou d'une autre d'exporter cette liste sur un tableur, avec une colonne à chaque fois qu'on descend d'un niveau de sous-page et de manière à aligner à droite les titres (cf. plus bas, ce sera sans doute plus clair avec un exemple), et de faire dans ce document une recherche par doublon ? --Jahl de Vautban (d) 24 juillet 2021 à 10:15 (UTC)
- Bonjour Cantons-de-l'Est (d · c · b), oui, exactement. Mais dans cette liste il est difficile de retrouver les homonymes parce qu'ils peuvent être cachés dans des sous-pages, ils ne se retrouvent donc pas listés à la suite les uns des autres. Cordialement. M0tty (d) 21 juillet 2021 à 11:49 (UTC)
A B C Blablabla Blebleble/ Blablabla Bliblibli/ Blebleble/ Blablabla
- Bonjour,
- Je suis surpris de la taille de la liste après réduction à un certain nombre de caractères. Peut-être faut-il revoir ce chiffre à la baisse ? Combien y a-t-il de pages de l'espace principal de 15 caractères maximum (en décomptant les parenthèses et ce qui se trouve avant le / pour les sous-pages ?
- Et pour faire une autre proposition d'affichage qui soit plus clair, serait-il possible de faire en sorte que les liens affichés soient justement listés par ordre alphabétique en supprimant ce qui précède le / ? Merci pour votre aide. M0tty (d) 24 juillet 2021 à 11:07 (UTC)
- M0tty, J'avais oublié pour la restriction de 15 caractères sur le terme après la dernière barre oblique. En l'appliquant, j'ai déterminé qu'il y a 263 655 pages à analyser. Plus bas, on voit un extrait de tableau que je prévois créer. Les colonnes 2 à 6 sont les sur-pages de la colonne 7. Les rangées seront triées en fonction du terme dans la dernière colonne, qui est aussi un wikilien. Les redirections ne seront pas élaguées (j'ignore comment faire et j'ai d'autres obligations). Quant à la proposition de créer un tableur, ce n'est pas dans mes cordes. Toujours intéressé malgré la longueur du tableau ?
- — Cantons-de-l'Est discuter 25 juillet 2021 à 14:24 (UTC)
No | A | B | C | D | E | F |
1 | "Daniel Darc" | |||||
2 | "Mme de Stolz" | |||||
3 | Œuvres complètes | Préface | ||||
4 | (Verlaine) | |||||
5 | * | |||||
6 | ... le Cœur populai | Conseils | ||||
7 | ... le Cœur populai | Idylle | ||||
8 | ... le Cœur populai | La Frousse | ||||
20 | Bordeaux | |||||
21 | 0° cocktail (Recuei | 0° cocktail | ||||
22 | 0° cocktail (Recuei | Boobs | ||||
26 | 10 | |||||
27 | 1453 | |||||
31 | 1909 | |||||
32 | 1914-1916 | |||||
33 | 1914-1916 | Commémoration | ||||
52 | 1914-1916 | Quand même ! | ||||
59 | 1914-1916 | À la Belgique | ||||
60 | 1 Sonnet | |||||
61 | 1er janvier | |||||
62 | 2 | |||||
63 | 31 octobre | |||||
64 | 350 recettes de cui | Avant-propos | ||||
65 | 350 recettes de cui | Bagatelle | ||||
138 | 352e DI Allemande - | 6 | 44 | |||
139 | 391 (revue) | |||||
140 | 391 (revue) | Articles | ||||
141 | 391 (revue) | Auteurs | ||||
142 | 391 (revue) | Ressources | ||||
143 | 4 | |||||
144 | 813 | |||||
145 | 813 | 01 | ||||
146 | 813 | 02 | ||||
147 | 813 | 03 |
Retrait des coupures de mots dans le Dictionnaire de théologie catholique
modifierJe retire régulièrement le tiret qui coupe un mots pour aller à la ligne sur le dictionnaire de théologie catholique.
Par exemple Page:Alfred Vacant - Dictionnaire de théologie catholique, 1908, Tome 12.2.djvu/462
adhse- rere.
devient
adhserere.
J'aimerai retirer "le tiret, l'espace et le saut de ligne" sur les pages du DTC ? Cela vous semble possible. ?
Merci.
- Sicarov :, oui, c'est les boutons "OCR" et "T(ypo)" que je te mentionnais dans ta page de discussion (Petits conseils... d'un novice en OCR !). Non seulement ils opèrent une correction partielle d’erreur dans des textes, mais aussi ils retirent "le tiret, l'espace et le saut de ligne". Bien à toi ! --Éτienne ♄ (d) 25 mars 2023 à 09:11 (UTC)
Transclusion des entrées du Petit Dictionnaire libéral
modifierBonjour,
J'ai besoin d'un bot pour transclure les entrées du Petit Dictionnaire libéral. Chaque entrée a sa propre section. Les pages sont à ajouter à la Catégorie:Articles du Petit Dictionnaire libéral. Les index alphabétiques sont également à générer.
Merci d'avance --Poslovitch (d) 4 juin 2023 à 16:44 (UTC)
- Transclusion faite, il reste à générer les index alphabétiques Poslovitch (d) 24 juillet 2023 à 21:24 (UTC)
Transclusion des entrées du Dictionnaire de l’argot des typographes
modifierBonjour,
J'ai besoin d'un bot pour transclure les entrées du Dictionnaire de l’argot des typographes. Chaque entrée a sa propre section. Elles démarrent au feuillet /66 et finissent au feuillet /121 inclus. Les pages sont à ajouter à la Catégorie:Articles du Dictionnaire de l'argot des typographes. Les index alphabétiques sont également à générer.
Merci d'avance --Poslovitch (d) 21 juillet 2023 à 19:29 (UTC)
- Transclusions faites, il reste à générer les index alphabétiques Poslovitch (d) 24 juillet 2023 à 16:53 (UTC)
Transclusion des entrées du Petit dictionnaire des infirmières
modifierBonjour.
Transclure les entrées du Petit dictionnaire des infirmières. Chaque entrée a sa propre section. Elles démarrent au feuillet /4 et finissent au feuillet /27 inclus. Les pages sont à ajouter à la Catégorie:Articles du Petit dictionnaire des infirmières. Les index alphabétiques sont également à générer.
Merci d'avance --Poslovitch (d) 20 mars 2024 à 08:23 (UTC)
- Transclusions faites, il reste à générer les index alphabétiques. Poslovitch (d) 14 avril 2024 à 10:20 (UTC)
Recherche de liens brisés
modifierBonjour,
Serait-il possible de dresser une liste de toutes les pages de l'espace principal qui sont soit des redirections soit des pages d'homonymie et qui sont liées à un index de l'espace Livre: ? Je n'ai pas les connaissances techniques pour pouvoir dresser pareille liste.
Cela permettrait ensuite de réparer les index à la main en corrigeant les liens.
Merci pour votre aide ! Cordialement, M0tty (d) 4 avril 2024 à 21:06 (UTC)
- Salut @M0tty. Je ne suis pas sûr de comprendre en quoi lister les redirections ou les pages d’homonymies permettraient de détecter les liens cassés vers des pages d’index ? À+, Lepticed7 (Viens tcharer ! :D) 5 avril 2024 à 06:52 (UTC)
- Bonjour. Peut-être que M0tty envisage des cas où dans un index (espace de noms livre) il y a une TDM qui est constituée de liens vers l'espace principal et un de ces liens pointe vers une page d'homonymie ou de redirection ? Мишоко (d) 5 avril 2024 à 09:02 (UTC)
- Voilà, c'est exactement ça. Quelqu'un créé un index dans un espace Livre avec des liens qui pointent vers l'espace principal. Puis pour une raison ou une autre, une de ces pages de l'espace principal est renommée (pour en faire une redirection ou une page d'homonymie). L'index est donc cassé et la navigation dans le livre est brisée à cette page. Lister toutes les pages d'homonymie et de redirection qui sont liées depuis un index de l'espace livre permettrait d'identifier les index brisés et de les réparer. Merci! M0tty (d) 5 avril 2024 à 10:01 (UTC)
- Par exemple, sur l'index Livre:Goethe - Poésies, trad. Blaze, 1843.djvu le lien vers Le Roi des Aulnes devrait être vers Le Roi des Aulnes (traduction Blaze). Мишоко (d) 6 avril 2024 à 12:20 (UTC)
- Hello !
- Petite relance concernant cette demande. Quelqu'un aurait-il les compétences pour générer cette liste ? Je peux m'occuper de mettre en place le projet de restauration des index brisés une fois la liste générée.
- Merci pour votre aide ! M0tty (d) 12 mai 2024 à 11:12 (UTC)
- Bonjour. Il me semble me souvenir que quand j'ai regardé, j'ai fini par conclure que ce ne serait pas intéressant car il y aurait trop de faux positifs mais je ne me souviens plus pourquoi. Ma dernière note sur le sujet était : "Le cas j'imagine plus fréquent où la TDM n'est pas dans l'index mais dans l'espace page : Livre:Béranger - Chansons anciennes et posthumes.djvu. Par exemple le lien vers L’Académie et le Caveau est à corriger." Мишоко (d) 12 mai 2024 à 11:32 (UTC)
- Hello @Мишоко,
- Merci pour ta réponse, mais je n'ai pas bien compris ta dernière phrase.
- Je n'ai pas l'impression à première vue qu'il y ait tant de faux-positifs que cela. Aurais-tu des exemples ?
- D'avance merci ! M0tty (d) 12 mai 2024 à 11:39 (UTC)
- Bonjour. Il me semble me souvenir que quand j'ai regardé, j'ai fini par conclure que ce ne serait pas intéressant car il y aurait trop de faux positifs mais je ne me souviens plus pourquoi. Ma dernière note sur le sujet était : "Le cas j'imagine plus fréquent où la TDM n'est pas dans l'index mais dans l'espace page : Livre:Béranger - Chansons anciennes et posthumes.djvu. Par exemple le lien vers L’Académie et le Caveau est à corriger." Мишоко (d) 12 mai 2024 à 11:32 (UTC)
- Par exemple, sur l'index Livre:Goethe - Poésies, trad. Blaze, 1843.djvu le lien vers Le Roi des Aulnes devrait être vers Le Roi des Aulnes (traduction Blaze). Мишоко (d) 6 avril 2024 à 12:20 (UTC)
- Voilà, c'est exactement ça. Quelqu'un créé un index dans un espace Livre avec des liens qui pointent vers l'espace principal. Puis pour une raison ou une autre, une de ces pages de l'espace principal est renommée (pour en faire une redirection ou une page d'homonymie). L'index est donc cassé et la navigation dans le livre est brisée à cette page. Lister toutes les pages d'homonymie et de redirection qui sont liées depuis un index de l'espace livre permettrait d'identifier les index brisés et de les réparer. Merci! M0tty (d) 5 avril 2024 à 10:01 (UTC)
- Bonjour. Peut-être que M0tty envisage des cas où dans un index (espace de noms livre) il y a une TDM qui est constituée de liens vers l'espace principal et un de ces liens pointe vers une page d'homonymie ou de redirection ? Мишоко (d) 5 avril 2024 à 09:02 (UTC)