« Wikisource:Gallica » : différence entre les versions

Contenu supprimé Contenu ajouté
Aucun résumé des modifications
 
archivage
Ligne 129 :
:'''Merci, merci et encore merci''' à Coolmicro de m'avoir indiqué le logiciel FineReader, que je ne connaissais pas, et qui va me permettre d'avancer nettement plus vite dans l'OCR ; le précédent logiciel que j'utilisais n'acceptait pas les PDF entiers, et il fallait que je découpe chaque fichier PDF en image (une par page) avec le bouton snapshot d'abobe ; de plus, le logiciel que j'utilisais avait plus de mal à reconnaître les caractères, ce qui rallonge les "corrections". Donc je vais investir quelques dizaines d'euros, c'est sûr ...
:Quand au fond (Gallica), je suis tout à fait d'accord. Je rajouterais que le téléchargement complet d'un PDF image est parfois compliqué, même avec un logiciel FTP avec reprise, et il m'est arrivé de ne pas réussir l'opération, malgré plusieurs tentatives. [[Utilisateur:François|François]] 17 décembre 2005 à 09:03 (UTC)
 
==Gallica (suite)==
 
Bon, je n'ai toujours pas fait de lettre à la bnf, mais j'ai programmé. voici un exemple de page importée: [[Utilisateur:ThomasBot/test]].
Le robot importe un livre (ici en deux volumes), et le divise en pages. ici chaque page contient un conte. si j'applique la même technique à un roman, une division en chapitres s'ensuit. Le template titre est utilisé à la fois pour la page principale et pour les sous-pages: peut-être qu'il vaudrait mieux utiliser le template "Navigation" pour les sous-pages, vu que ca va souvent être des chapitres. [[Utilisateur:ThomasV|ThomasV]] 18 sep 2005 à 17:47 (UTC)
 
PS: je sais, il s'est gouré au niveau de Candide...
:Thomas, concernant Gallica, j'ai contacté l'utilisateur soufron lundi dernier, qui m'a promis d'intervenir prochainement sur notre scriptorium. Je vais le relancer, il a peut-être oublié.[[Utilisateur:François|François]] 18 sep 2005 à 18:55 (UTC)
:<br/>
:Une autre administration publique, le Journal Officiel, fait payer la rediffusion de ses bases de données. On peut consulter les tarifs [http://www.journal-officiel.gouv.fr/jahia/Jahia/pid/41 sur cette page]. Il est précisé que l'administration ne réalise pas de gain financier dans cette opération, puisque ''seuls les frais de mise à disposition sont à la charge du licencié''. On est donc bien dans l'esprit de la directive européenne 2003/98/CE du Parlement européen et du Conseil du 17 novembre 2003 concernant la réutilisation des informations du secteur public [http://europa.eu.int/smartapi/cgi/sga_doc?smartapi!celexapi!prod!CELEXnumdoc&lg=FR&numdoc=32003L0098&model=guichett lien]. Le problème est que cette directive exclut explicitement les ''documents détenus par des établissements culturels, et notamment par des musées, des bibliothèques, des archives, des orchestres, des opéras, des ballets et des théâtres''. Donc même si cette directive est transposée en droit français, le ministère français de la culture peut se permettre de réaliser des gains sur la vente d'informations provenant du secteur public.--[[Utilisateur:Teofilo|Teofilo]] 21 sep 2005 à 16:34 (UTC)