« Wikisource:Scriptorium/Mai 2021 » : différence entre les versions

Contenu supprimé Contenu ajouté
Ligne 195 :
 
J'aimerais développer un script python qui crée une table des matières à partir des pages d'un livre corrigé (il y a plus de 160 lettres dans ce [[Livre:Mérimée, Lettres à une inconnue 1,1874.djvu|livre]], et un tome 2 qui suit...); avez-vous déjà entendu parler d'un script de ce genre, ou du moins y a-t-il un script qui parcourt les pages d'un livre, qui pourrait me servir de point de départ ? Merci beaucoup ! [[Utilisateur:Hector|Hector]] ([[Discussion utilisateur:Hector|d]]) 9 mai 2021 à 20:43 (UTC)
:Ca ne répond pas précisément à la question mais quand le script sera prêt tu pourras le mettre dans la partie "Sommaire" de [[Aide:Espace_%C2%AB_Livre_%C2%BB|cette page d'aide]] ? Peut-être que le [https://docs.google.com/spreadsheets/d/1K3QOC17a68VVOYg0dIbHUPUXuoh_TT6AdmUojO_KEyM/edit?usp=sharing fichier tableur partagé] indiqué actuellement sur cette page d'aide peut te faciliter la tâche pour ces 160 lettres.
:J’ai un peu de mal à voir comment par exemple deviner automatiquement le décalage entre le numéro de page du PDF et le numéro de page indiqué dans le sommaire avec un script Python. Mais peut-être que parcourir toutes les pages pour trouver les titres de niveau 2 à 4, puis tenter un alignement automatique avec les numéros de page présents dans le texte océrisé des tables de sommaire permettrait de tenter de trouver automatiquement un décalage qui serait constant. Mais comme il faut parfois prendre en compte les coquilles dans les tables des matières, ou les illustrations non paginées, j’ai des doutes sur la possibilité de faire un script qui marche dans tous les cas : à l'inverse il est facile d'ajuster les formules du fichier tableur partagé (voir par exemple la feuille de calcul ''TDM-chapitresAvecErreurs''). --[[Utilisateur:FreeCorp|FreeCorp]] ([[Discussion utilisateur:FreeCorp|d]]) 9 mai 2021 à 21:07 (UTC)