Ce este tehnologia OCR?
Recunoașterea optică a caracterelor (în engleză: Optical Character Recognition, OCR) se referă la procesul de analiză și recunoaștere a fișierelor de imagine ale materialelor text pentru a obține informații despre text și aspect.
Similar cu tehnologia de recunoaștere a imaginii și viziune artificială, procesul de procesare al tehnologiei OCR este, de asemenea, împărțit în proces de intrare, preprocesare, procesare pe termen mediu, post-procesare și proces de ieșire.
introduce
Pentru diferite formate de imagine, există diferite formate de stocare și diferite metode de compresie.În prezent, există OpenCV, CxImage etc.
Preprocesare – binarizare
Majoritatea fotografiilor realizate de camerele digitale de astăzi sunt imagini color, care conțin o cantitate imensă de informații și nu sunt potrivite pentru tehnologia OCR.
Pentru conținutul imaginii, o putem împărți pur și simplu în prim-plan și fundal.Pentru a face computerul mai rapid și pentru a efectua mai bine calculele legate de OCR, trebuie să procesăm mai întâi imaginea color, astfel încât doar informațiile din prim-plan și informațiile de fundal să rămână în imagine.Binarizarea poate fi, de asemenea, pur și simplu înțeleasă ca „alb-negru”.
reducerea zgomotului de imagine
Pentru imagini diferite, definiția zgomotului poate fi diferită, iar procesul de dezgomot în funcție de caracteristicile zgomotului se numește reducere a zgomotului.
corectare a înclinării
Deoarece utilizatorii obișnuiți, atunci când fac fotografii de documente, este dificil să fotografiați complet în conformitate cu alinierea orizontală și verticală, astfel încât fotografiile realizate vor fi inevitabil denaturate, ceea ce necesită un software de procesare a imaginii pentru a fi corectate.
Prelucrare pe termen mediu – analiza aspectului
Procesul de împărțire a imaginilor documentului în paragrafe și ramuri se numește analiză de aspect.Datorită diversității și complexității documentelor reale, acest pas trebuie încă optimizat.
tăierea caracterelor
Datorită limitărilor condițiilor de fotografiere și scriere, caracterele sunt adesea blocate și pixurile sunt sparte.Utilizarea directă a unor astfel de imagini pentru analiza OCR va limita foarte mult performanța OCR.Prin urmare, este necesară segmentarea caracterelor, adică separarea diferitelor caractere.
Recunoașterea caracterelor
În faza incipientă, potrivirea șablonului a fost folosită în principal, iar în etapa ulterioară, extragerea caracteristicilor a fost folosită în principal.Datorită influenței unor factori precum deplasarea textului, grosimea tractului, creionul spart, aderența, rotația etc., dificultatea extragerii caracteristicilor este foarte afectată.
Restaurare aspect
Oamenii speră că textul recunoscut este încă aranjat ca imaginea documentului original, iar paragrafele, pozițiile și ordinea sunt transmise în documente Word, documente PDF etc., iar acest proces se numește restaurare aspect.
post procesare
În funcție de relația dintre contextul specific al limbajului, rezultatul recunoașterii este corectat.
ieșire
Ieșiți caracterele recunoscute ca text într-un anumit format.
Care sunt aplicațiile terminalelor portabile bazate pe tehnologia OCR?
Prin intermediul terminalului portabil PDA încărcat cu software de recunoaștere a caracterelor OCR, pot fi realizate multe aplicații de scenă, cum ar fi: recunoașterea plăcuței de înmatriculare a mașinii, recunoașterea numărului de containere, recunoașterea etichetelor de carne de vită și oaie importată, recunoașterea zonei citibile de mașină de pașaport, recunoașterea citirii contorului electric , bobină de oțel Recunoașterea caracterelor pulverizate.
Ora postării: 16-nov-2022