Optikai karakterfelismerés
A Wikipédiából, a szabad enciklopédiából.
Az optikai karakterfelismerés (rövidítve OCR az angol optical character recognition szavakból) a számítástechnikában azon eljárások módszere, melyek lehetővé teszik a fizikai hordozón (leggyakrabban papíron) szereplő analóg írás, szöveg digitális formába történő alakítását. Az átalakított szöveg ezután könnyen használható, feldolgozható számítógépes környezetben.
A felismerési folyamat részei:
- az írás képének beolvasása (scanning);
- a képen szereplő szövegblokkok, szövegsorok vizsgálata;
- a blokkokban, sorokban szereplő betűk vagy betűpárok felismerése; és
- a felismert szöveg ellenőrzése (például helyesírás- vagy nyelvtani ellenőrzés).
Ezen részek nem mindegyike kell, hogy szerepeljen egy OCR-programban, azonban mellőzésük rontja a felismerés hatékonyságát.