Contenu supprimé Contenu ajouté
ThomasV (discussion | contributions)
→‎création des pages d'index : nouvelle section
Ligne 101 :
::D’autre part, j’ai l’impression que tu penses que c’est pour éviter d’afficher de l’ocr de mauvaise qualité que je suis contre. Ce n’est aps la raison principale. La raison principale, c’est qu’on se ferme une porte pour l’avenir. Je répète ce que j’ai écrit plus haut : une fois les pages créées par un robot, il devient impossible d’utiliser une version du fichier dont l’OCR serait meilleure, car la couche texte n’est plus accessible (sauf si on programme un robot sysop pour effacer les pages créées, ce qui est complpiqué, nécessite des droits, et entraînerait la perte des pages corrigées à la main entre temps).
::[[Utilisateur:ThomasV|ThomasV]] ([[Discussion utilisateur:ThomasV|d]]) 22 juillet 2010 à 09:24 (UTC)
:::Malentendu : je sais pas, en tous cas ça fait un bout de temps que je répète que le bot n'ajoute que de la mise en forme, y compris sur cette page (commentaire du 21 juillet 2010 à 17:49 (UTC))
:::Ta raison principale : oui, c'est vrai. Deux objections, une à court terme et une "philosophique".
:::# Il serait possible d'ajouter un petit bout de code dans Proofreadpage pour permettre de relire la couche texte même après la création d'une page, par exemple en ajoutant un paramètre dans l'URL "&action=edit&textlayerPreload", et ajouter un bouton dans la barre d'outil qui appelle cette URL, c'est une proposition ; ou alors (mieux et complémentaire) d'ajouter un bout de code dans l'API MediaWiki permettant d'obtenir la couche texte d'une page, indépendamment du statut "créé ou non" de la page
:::# Quel est la motivation de pouvoir récupérer la couche texte d'un DjVu quand la qualité d'une page est "supérieure" ? Les couches textes sont toujours de qualité inférieure ou égale à celle de la page (surtout étant donné qu'il n'y a pas d'écriture page WS -> couche texte). Je dis ça en ayant en tête les multiples détails qu'on a amélioré dans les DjVuS et qui au final sont quasi-imperceptibles, je veux dire qu'il faut aussi savoir se donner une limite à la qualité : on peut ''toujours'' faire mieux, mais dans ce cas on n'a ''jamais'' fini.<br />Quand à une amélioration sensible de la qualité de l'OCR, je trouve que les échelles de temps sont trop différentes pour devoir tenir compte pleinement de ce paramètre, du moins sur des "petites" échelles en nombre de livres (temps amélioration d'un OCR >> (très supérieur) relecture d'un livre)
:::~ [[Utilisateur:Seb35|Seb35]] [[Discussion utilisateur:Seb35|<small>[^_^]</small>]] 22 juillet 2010 à 10:25 (UTC)
 
----