Jump to content

WikiConvention francophone/2016/Programme/WIKIOCR

From Meta, a Wikimedia project coordination wiki

RECONNAISSANCE OPTIQUE DES CARACTÈRES D'OUVRAGES PHOTONUMÉRISÉS

[edit]

ZELECTRON

[edit]

Type de session (sélectionnez un type de format)

[edit]
  • Discussion / Débat

Résumez votre proposition d'intervention en quelques mots (max. 200 mots)

[edit]

Il y a désormais des centaines de millions d'ouvrages qui sont "numérisés" sur la planète mais voilà, il s'agit plutôt de "photonumérisation" (ou photodigitalisation) pour être précis, un progrès certes par rapports aux microfilms mais pas si sûr.

En fait la tâche est loin d'être achevée, car il s'agirait de continuer ce gigantesque travail en passant tous ces documents par un système OCR  (reconnaissance optique de caractères, en français) afin de pouvoir traduire automatiquement les ouvrages dans toutes les langues, de consulter les livres avec une lisibilité parfaite avec un choix de caractères personnels (en police, en couleur et en taille), d'ajouter des commentaires, des dessins, des photos ... peut-être.

Cette immense tâche ne peut être accomplie que bénévolement avec, sur un même écran, d'un coté le texte original et de l'autre un texte débarrassé de ses imperfections, tout en respectant à la lettre (c'est le cas de le dire) cet original !

Un aspect non négligeable consiste à mettre ces textes à portée des non-voyants sans passer par le braille et d'autre part à un grand nombre de populations analphabètes en les vocalisant.

Les textes multilingues aussi en découleront.

Il me semble que Wikipédia serait le mieux placé en mobilisant ses contributeurs dont personne ne conteste le sérieux pour corriger les fautes qui immanquablement émailleront les pages successivement alphadigitalisées. Chaque ouvrage passant dans plusieurs mains (3?, 4?, 5?) pour assurer l'extrême rigueur de la correction et éviter ainsi les fautes d’inattention, les dérives sectaires ou fantaisistes.

Résultats attendus (max 100 mots)

[edit]

Prise de relais en ce qui concerne ce projet du fait de l'âge que j'ai.

Durée

[edit]

indeterminée

Matériel / Aide nécessaire (précisez)

[edit]

scanner et logiciel d'OCR (ROC en français)

Participants intéressés (inscrivez-vous ci-dessous et posez dès à présent vos questions à l'organisateur de la session)

[edit]

vous pouvez me contacter au  06 41 69 31 68

ou m'adresser un mail : yves.spale(_AT_)gmail.com

très cordialement.

Statut

[edit]

Proposition refusée