Contenu supprimé Contenu ajouté
Aucun résumé des modifications
Aucun résumé des modifications
Ligne 10 :
[[Utilisateur:Cunegonde1/common.js|accès common.js]]
 
En cours de développement un outil de modification des ''f'' en ''ſ'' (s long) sur les textes en sortie d'OCR. L'outil s'appuie sur "sed" et un minidictionnaire. La syntaxe à utiliser dans un terminal est : <code>sed 's/mot_initial/mot_changé/g; s/mot_initial2/mot_changé2/g;' mon_texte.txt > mon_texte_modifie.txt</code>. sed 's/ (pour substitute)…/…/g (pour global, qui change le mot dans tout le texte sélectionné). Cela fonctionne sur mac (sans regex) et sur linux (avec regex) avec un minidictionnaire d'environ 500 motifs (reufe, rieufe, ieufe…) ou mots. L'utilité de l'expression régulière est de limiter le changement sur un mot complet (fi, fa, fon…) et ne pas en opérer sur un motif comme dans ''fa''mille, ''fon''taine… Attention la commande ''sed'' est très puissante (et donc potentiellement dangereuse).
 
==Tableau triable des ouvrages de l’enfer de la BNF présents sur Wikisource.==