« Wikisource:Partenariats/Bibliothèque nationale de France/Discussions » : différence entre les versions

Contenu supprimé Contenu ajouté
Ligne 16 :
== 3. Recenser les pratiques ==
{{tr|Wikisource:Scriptorium/Septembre 2008|11}}
 
Pourquoi devons-nous transformer les pdf en djvu ? Pour faire comprendre le problème, rien de tel qu'un bon exemple, <span class="plainlinks">[http://fr.wikisource.org/w/index.php?title=Au_bonheur_des_dames_-_14&diff=next&oldid=556445 en voici un]</span>. Combien de temps mettra-t-on à confronter à <span class="plainlinks">[http://gallica.bnf.fr/ark:/12148/bpt6k2028627 l'édition originale mise en ligne par Gallica]</span> cette correction d'une IP bien intentionnée ? Retrouver un mot dans un texte est ici extrêment long (plus d'une heure), alors que sur Google books ou Internet Archive, même en mode image c'est rapide. Ce qui est en jeu est la qualité de l'OCR, d'une part, et la lenteur d'affichage des pdf, d'autre part.
 
En effet, dans un premier temps, la recherche de « Find PDF » ne trouve dans le document ni « je le prends » (j minuscule), ni « Je le prends » (j majuscule), et ce, même en recourant à l'outil maximal, la « Full Reader's Search » (Shift + Control+F). J'imagine que c'est dû à la très mauvaise qualité de l'OCR sur laquelle repose cette recherche, est-ce que je me trompe ?
 
Dans un deuxième temps, feuilleter l'œuvre page par page pour retrouver le passage, faites-le et chronométrez, En 2008, je trouve que ce n'est pas acceptable, et donc que la première dépense à faire est l'investissement dans une OCR correcte pour que la recherche en mode texte puisse donner des résultats autres qu'inutilisables, et la deuxième dépense à faire (je n'ai pas dit à prévoir) : investir dans le passage du format pdf au format djvu, où chaque page d'un livre s'affiche à une vitesse comparable à celle du tournage des livres papier, rendant la lecture numérique vraiment possible. Tandis que ces dépenses ne sont pas faites en France, c'est par dizaines de millions que les lecteurs accèdent aux livres mis en ligne par le Wikisource anglais, et n'accèdent pas aux livres qui ne peuvent pas être mis en ligne par le Wikisource français.
 
Comparez aussi l'OCR d'Aristote <span class="plainlinks">[http://en.wikisource.org/w/index.php?title=Page:Aristotelous_peri_psuxes.djvu/127&oldid=746507 ici]</span> et <span class="plainlinks">[http://fr.wikisource.org/w/index.php?title=Page:M%C3%A9taphysique_-_159.png&oldid=255304 ici]</span>. Peut-on croire que les contributeurs français travailleront avec le même entrain que les contributeurs anglais ? La même efficacité ? Qu'ils sont armés pour gagner la course ? Veut-on qu'ils la perdent, cette course ? Et pourquoi le veut-on ? Parce qu'on n'en a pas compris les enjeux ? Hum, je crois que j'exagère un peu :)
 
L'investissement demandé me paraît très faible. Est-ce que je me trompe aussi sur ce point ? - --[[Utilisateur:Zyephyrus|Zyephyrus]] 12 octobre 2008 à 10:25 (UTC)
 
----
<references />
 
== 4. Boîte à idées sur le projet ==