« Aide:Comment numériser » : différence entre les versions
Contenu supprimé Contenu ajouté
→Reconnaissance optique des caractères (OCR) : logiciel libre |
typo |
||
Ligne 15 :
== Photographie (scan) de textes ==
Cette photographie s’effectue à l’aide d’un outil spécialisé appelé
Les photographies effectuées sont alors stockées sous forme d’images (JPEG, ...) ou regroupées dans des
Les scanners individuels sont en général vendus avec un logiciel de paramétrage, permettant de régler plus ou moins finement cette étape photographique.
::'''Note :''' étant donné la résolution des appareils photo numériques actuels, il n'est pas nécessaire de disposer d'un scanner pour numériser un texte.
== Téléchargement à partir du site Gallica ==
Il existe des sites spécialisés qui fournissent déjà des fichiers images de textes. Le plus connu est [http://gallica.bnf.fr/ Gallica], bibliothèque numérique de la Bibliothèque Nationale de France.
Par défaut, Gallica offre l’accès à l’œuvre page par page. Pour obtenir l’œuvre complète — ou un extrait de plusieurs pages —, il faut, lorsqu’une des pages est affichée, demander un
La récupération du fichier (souvent de plusieurs Mo) n’est pas toujours simple. En effet, le lien proposé par Gallica (''Vous pouvez le télécharger en <font size="-1" color="blue">cliquant ici</font>. Utiliser le clic droit et
=== Utilisation du FTP ===
Ligne 39 :
Préalablement, notez les références données par Gallica lorsque le fichier demandé a été généré (bas de la page). Vous aurez quelque chose comme ''chemin du fichier = ftp://ftp.bnf.fr/002/N0022607_PDF_1_484.pdf''. Ici, le fichier que nous recherchons est ''N0022607_PDF_1_484.pdf'' présent dans le répertoire ''002''.
L’utilisation du navigateur implique que celui-ci soit assez récent. Vous pouvez alors taper l’adresse '''ftp.bnf.fr''' (ou ftp://ftp.bnf.fr) qui vous affichera alors la page
Il existe également des logiciels de transfert FTP spécialisés, autorisant des transferts avec reprise en cas d’interruption. Parmi les gratuits, il y a notamment :
Ligne 56 :
== Reconnaissance optique des caractères (OCR)==
En anglais [[w:Reconnaissance optique de caractères|OCR]], cette étape
Certains de ces logiciels sont vendus avec le
Il y a une grande différence de qualité entre ces logiciels, et cette différence aura des conséquences importantes sur la facilité d’utilisation, la qualité du résultat produit et donc le temps que vous passerez lors de cette étape. Voir la [[w:Reconnaissance optique de caractères#Quelques logiciels de reconnaissance optique de caractères|liste sur Wikipédia]]. Ou [http://doc.ubuntu-fr.org/ocr la liste sur la documentation ubuntu] ( pour linux et windows ).
|