$ python search_fr.py -show_match_only -namespace:Page -negate_search "-regex:<(b|span|div|poem|center|p|h\d+)\b[^>]*/>" -split

À surveiller

modifier
  • livres dans de multiple catégories de qualité, livres dans de multiple catégories de qualité point commun, le timestamp d'entrée dans les cat date du 10 octobre 2011, les Livre: touché sont dans toutes les catégories à la fois. Pas de modèle utilisé par les Livre: modifié à cette date excepté [1]. Ressemble beaucoup au vieux bug de pagelist qui était montré tel quel dans les Livre:, peut s'expliquer de la même façon si le parser n'interprète pas le switch sur les cats. Un &action=purge ne corrige pas le pb, un dummy edit via un bot le corrige.

En cours

modifier

<pages index="Revue des Deux Mondes - 1 - tome .djvu" from=1 to=1 next="" prev="" header=1 />

<pages index="Revue des Deux Mondes - 1 - tome .djvu" from=1 to=1 next="" prev="" header=1 volume="" annee="" auteur="" />


[[Catégorie:Articles de périodique]]

{{R2Mondes\|(\d+)\|(\d+)\|(\d+)}} —> </poem>\n{{R2Mondes|$1|$2|$3}}\n<poem>
python replace.py "-prefixindex:Page:Cooper - Œuvres complètes, éd Gosselin, tome 29, 1852.djvu" -lang:fr -family:wikisource -regex
\s\s+(<section end=[^/]*/>)<noinclude>
\1<noinclude>
</noinclude>\s+(<section begin=[^/]*/>)
</noinclude>\1

nettoyage ligne vide avant première section et après dernière section
python replace.py "-prefixindex:Page:Scribe - Théâtre, 14.djvu" -lang:fr -family:wikisource -regex
{{[rR]éplique[ ]*\|[ ]*([^}]*)}}{{[Dd]idascalie\|, ([^}]*)}}
{{PersonnageD|\1|c|\2}}
{{[rR]éplique[ ]*\|[ ]*([^}]*)}}
{{Personnage|\1|c}}

Réplique —> Personnage
python replace.py "-prefixindex:Page:Œuvres de Walter Scott, Ménard, traduction Montémont, tome 16, 1838.djvu" -lang:fr -family:wikisource -regex
(?<!\.)\.\.\.(?!\.)
…

... —> …
python replace.py -lang:fr -family:wikisource -regex "(\r\n)+<noinclude>\s*<references/></div></noinclude>" "<noinclude>\n<references/></div></noinclude>" "-file:../botpywi/temp.txt"
python replace.py -lang:fr -family:wikisource "-prefixindex:Page:Buckland - La Géologie et la Minéralogie dans leurs rapports avec la théologie naturelle, 1838, tome 2.djvu" -regex "(a|b|c|d|e|f|g|h)’(\s|')" "\1′\2" "(a|b|c|d|f|g|h)\"(\s|')" "\1″\2" "(a|b|c|d|e|f|g|h)’\"(\s|')" "\1‴\2"
python replace.py -regex -family:wikisource -lang:fr "-prefixindex:Page:Diderot - Encyclopedie 1ere edition tome 1.djvu"
(?<!</noinclude>)<section[ ]?begin=([^/]*)/>(?!<nowiki)
<section begin=\1/><nowiki/>\n\n

Vedettes

(?<!</noinclude>)<section[ ]?begin=([^/]*)/>[*](?!<nowiki)
<section begin=\1/><nowiki/>\n\n*

Vedettes
python replace.py -regex -family:wikisource -lang:fr "-prefixindex:Page:Diderot - Encyclopedie 1ere edition tome"

(\n|\r\n)<blockquote>

(\n|\r\n)</blockquote>

<u>

</u>


typo variées

Recherches de scanilles dans un dump.

find ~/wiki/file/frwikisource/Page -type f -print0 | xargs -0 grep -E -lw "mômes|môme|Môme|Mômes" | xargs -L 1 --delimiter=\\n grep -E -l 'level="3|4"'

time python page_list.py -lang:commons -family:commons "-symetric_difference:Category:DjVu files in French|0|Category:Books by year|1" > temp.txt

python replace.py -lang:fr -family:wikisource -regex "([^0-9A-Zpvcgm°.])[.](\s+)([a-zéèàùâêîôŷäëïöüÿœæï])" "\\1\\2\\3" "-prefixindex:Page:.../"

python replace.py "-prefixindex:File:Anatole France - " -family:commons -lang:commons -regex 
(?ms)Date( *)=([^0-9])([0-9][0-9][0-9][0-9])(.*)$
Date\1=\2\3\4\n[[Category:\3 books]]

(?ms)([^0-9])([0-9][0-9][0-9][0-9])([^0-9].*)$
\1\2\3\n[[Category:\2 books]]

python replace.py -lang:fr -family:wikisource -regex "([A-Za-zéèàêœâ])'([A-Za-zéèàêœâ])" "\\1’\\2" "-prefixindex:..."

recat

python replace.py -lang:fr -family:wikisource "-prefixindex:Page:Revue des Deux Mondes - 1865" -regex "\s*<references/>\s*</div>\s*<noinclude>" "<noinclude>"

{{R2Mondes\|(\d+)\|(\d+)\|(\d+)}} —> ==[[Page:Revue des Deux Mondes - $1 - tome $2.djvu/$3]]==

document.write() —> $('body').append()


<math>\left. \begin{matrix}\ \\ \ \end{matrix} \right\}</math>  

<math>\left\{ \begin{matrix}\ \\ \ \end{matrix} \right.</math>  

{| style="background:transparent;font-size:90%;line-height:140%;border-style:none;text-align:left;" cellspacing="0" cellpadding="2" align="center"
|-

{{x-larger|{{sc|'''

<div style="padding-left:1em;text-indent:-1em;">

<math>\scriptstyle \frac 12</math>  

<math>\overbrace{\quad \quad \quad \quad \quad \quad \quad \quad \quad \quad \quad \quad}</math>  

quote “ ”

prime ′ double prime ″ triple prime ‴

border-style:top right bottom left

<div style="text-indent:-2em;padding-left:2em;">

<div style="text-indent:-2em;padding-left:4em;">

<center>────────</center>

<div style="line-height:50%;text-align:center">*<br />* *</div>
*
* *
{{Astérisme|140%}}
<center>✽<span style="vertical-align:60%">✽</span>✽</center>

Section et dictionnaire dynamique.

python replace.py "-prefixindex:Page:Michaud - Biographie universelle ancienne et moderne - 1843 - Tome 2.djvu/26" -lang:fr -family:wikisource -regex "\s*(<section end=.*/><noinclude>\r\n<references/></div></noinclude>)$" "\\1"

À faire

modifier
  • {{Page}} à changer en <page index= (attendre que les pages soient normalisées)

Gallica et sommaire

modifier

partir de http://gallica.bnf.fr/ark:/12148/bpt6k3191m cliquer sur "detailed information" puis sur "relation" récupérer l'id dans la première boite à droite "Poste d'accès aux ressources électroniques NUMP- 257" et utiliser l'id avec http://visualiseur.bnf.fr/CadresFenetre?O=NUMP-257

Epub source

modifier
([^'])'([^'])
\1’\2
‘
’
([A-Za-zÉÈÇ])—([A-Za-zÉÈÇ])
\1-\2

Local version :

Maintenance des Livre: et Page:

modifier

Wikilocal

modifier

Scripts

modifier

/47077-1/47077-2/47077-3

Dictionnaire et encyclopédie

modifier