See also ebooksgratis.com: no banners, no cookies, totally FREE.

CLASSICISTRANIERI HOME PAGE - YOUTUBE CHANNEL
Privacy Policy Cookie Policy Terms and Conditions
Projet:Bouillet/OCR - Wikipédia

Projet:Bouillet/OCR

Un article de Wikipédia, l'encyclopédie libre.

Le but de ces pages est de coordonner la mise à disposition du dictionnaire Dictionnaire universel d'histoire et de géographie Bouillet Chassang.


Dans un premier temps, il faut :

  • Passer à la reconnaissance automatique de texte (OCR comme Omnipage) le texte disponible en format PDF ou TIFF sur Gallica [1] Fini le 15 juin 2006
  • Transformer le texte obtenu pour que chaque article soit le début d'une entrée de liste (approximativement dans un premier temps puis plus précisément), en ajoutant * à chaque début de ligne.
  • Laisser les indications de pages en les faisant précéder d'un espace. Si les indications de page coupent un article, mettre ces indications à la suite de l'article.
  • Corriger la reconnaissance du texte en s'aidant de la source sur Gallica[2]. Ne pas corriger les erreurs du dictionnaire, mais uniquement les erreurs de la reconnaissance. Il est préférable de laisser tel quel les articles, il n'est pas bon de modifier la source du travail.
  • Wikifier le texte automatiquement
  • Repérer si l'article est présent sur Wikipédia. Si oui, mettre un lien (sans modifier l'entrée du Bouillet). Sinon, ajouter éventuellement l'article et mettre un lien toujours sans modifier l'entrée du Bouillet.

Les buts sont les suivants :

  • Ajouter des informations du Bouillet sur Wikipédia.
  • Transférer le Bouillet une fois reconnu sur Wikisource sur cette page

Avancée du projet :

  • Reconnaissance effectuée sur toutes les pages de A à Z (il ne reste plus que les erreurs de scan ou d'OCR à corriger)
  • /A : en partie reconnue, en partie corrigée, => transférée
  • /B : en grande partie transférée
  • /C : => transférée
  • /D : => transférée
  • /E :
  • /F : => en grande partie transférée (Numérisation après FRA à effectuer)
  • /G :
  • /H :
  • /I
  • /J
  • /K : => transférée
  • /L :
  • /M :
  • /N :
  • /O :
  • /P :
  • /Q : => transférée
  • /R : => transférée
  • /S
  • /T
  • /U :
  • /V :
  • /W :
  • /X : => transférée
  • /Y :
  • /Z : => transférée
La numérisation de cette œuvre fait partie du projet Numérisation.
Ce texte contient encore quelques fautes.
Si vous avez accès à une version de référence de ce texte,
Numérisation en cours.

[modifier] WikiSource et WikiPedia

Wikipedia, en tant qu'encyclopédie, se doit de vérifier la qualité de l'information fournie par le dictionnaire, et la modifier si nécessaire.

Wikisource par contre se doit d'éditer les textes comme ils l'ont été sur ce que nous appelons "l'édition de référence". Par conséquent, il est important, lors des transferts sur Wikisource, de ne prendre que les versions non modifiées, ceci afin de conserver l'oeuvre intacte (même si elle est incomplète ou erronée).


aa - ab - af - ak - als - am - an - ang - ar - arc - as - ast - av - ay - az - ba - bar - bat_smg - bcl - be - be_x_old - bg - bh - bi - bm - bn - bo - bpy - br - bs - bug - bxr - ca - cbk_zam - cdo - ce - ceb - ch - cho - chr - chy - co - cr - crh - cs - csb - cu - cv - cy - da - de - diq - dsb - dv - dz - ee - el - eml - en - eo - es - et - eu - ext - fa - ff - fi - fiu_vro - fj - fo - fr - frp - fur - fy - ga - gan - gd - gl - glk - gn - got - gu - gv - ha - hak - haw - he - hi - hif - ho - hr - hsb - ht - hu - hy - hz - ia - id - ie - ig - ii - ik - ilo - io - is - it - iu - ja - jbo - jv - ka - kaa - kab - kg - ki - kj - kk - kl - km - kn - ko - kr - ks - ksh - ku - kv - kw - ky - la - lad - lb - lbe - lg - li - lij - lmo - ln - lo - lt - lv - map_bms - mdf - mg - mh - mi - mk - ml - mn - mo - mr - mt - mus - my - myv - mzn - na - nah - nap - nds - nds_nl - ne - new - ng - nl - nn - no - nov - nrm - nv - ny - oc - om - or - os - pa - pag - pam - pap - pdc - pi - pih - pl - pms - ps - pt - qu - quality - rm - rmy - rn - ro - roa_rup - roa_tara - ru - rw - sa - sah - sc - scn - sco - sd - se - sg - sh - si - simple - sk - sl - sm - sn - so - sr - srn - ss - st - stq - su - sv - sw - szl - ta - te - tet - tg - th - ti - tk - tl - tlh - tn - to - tpi - tr - ts - tt - tum - tw - ty - udm - ug - uk - ur - uz - ve - vec - vi - vls - vo - wa - war - wo - wuu - xal - xh - yi - yo - za - zea - zh - zh_classical - zh_min_nan - zh_yue - zu -