Hvad er OCR-teknologi?
Optisk tegngenkendelse (engelsk: Optical Character Recognition, OCR) refererer til processen med at analysere og genkende billedfiler af tekstmaterialer for at opnå tekst- og layoutoplysninger.
I lighed med billedgenkendelse og maskinsynsteknologi er OCR-teknologiens behandlingsproces også opdelt i input, forbehandling, midtvejsbehandling, efterbehandling og outputproces.
gå ind
For forskellige billedformater er der forskellige lagringsformater og forskellige komprimeringsmetoder.I øjeblikket er der OpenCV, CxImage osv.
Forbehandling – binarisering
De fleste af de billeder, der tages med digitale kameraer i dag, er farvebilleder, som indeholder en enorm mængde information og ikke egner sig til OCR-teknologi.
For indholdet af billedet kan vi blot opdele det i forgrund og baggrund.For at gøre computeren hurtigere og bedre udføre OCR-relaterede beregninger, skal vi først behandle farvebilledet, så kun forgrundsinformationen og baggrundsinformationen forbliver i billedet.Binarisering kan også simpelthen forstås som "sort og hvid".
billedstøjreduktion
For forskellige billeder kan definitionen af støj være anderledes, og processen med at dæmpe støj i henhold til støjens karakteristika kaldes støjreduktion.
hældningskorrektion
Fordi almindelige brugere, når de tager billeder af dokumenter, er det svært at optage helt på linje med vandret og lodret justering, så de billeder, der tages, vil uundgåeligt blive skæve, hvilket kræver billedbehandlingssoftware for at rette op.
Midtvejsbearbejdning – layoutanalyse
Processen med at opdele dokumentbilleder i afsnit og grene kaldes layoutanalyse.På grund af de faktiske dokumenters mangfoldighed og kompleksitet skal dette trin stadig optimeres.
karakter skæring
På grund af begrænsningerne ved fotografering og skriveforhold sidder tegn ofte fast, og kuglepenne er knækkede.Direkte brug af sådanne billeder til OCR-analyse vil i høj grad begrænse OCR-ydeevnen.Derfor kræves tegnsegmentering, det vil sige at adskille forskellige tegn.
Karaktergenkendelse
I den tidlige fase blev skabelonmatching hovedsageligt brugt, og i den senere fase blev feature-ekstraktion hovedsageligt brugt.På grund af påvirkningen af faktorer som tekstforskydning, slagtykkelse, knækket pen, vedhæftning, rotation osv., er vanskeligheden med at udtrække træk stærkt påvirket.
Layout restaurering
Folk håber, at den genkendte tekst stadig er arrangeret som det originale dokumentbillede, og at afsnittene, positionerne og rækkefølgen udskrives til Word-dokumenter, PDF-dokumenter osv., og denne proces kaldes layoutgendannelse.
efterbehandling
I henhold til forholdet mellem specifik sprogkontekst korrigeres genkendelsesresultatet.
produktion
Udskriv de genkendte tegn som tekst i et bestemt format.
Hvad er anvendelsesområdet for håndholdte terminaler baseret på OCR-teknologi?
Gennem den håndholdte terminal PDA fyldt med OCR-tegngenkendelsessoftware kan mange sceneapplikationer realiseres, såsom: bilnummerpladegenkendelse, containernummergenkendelse, importeret okse- og fårekødsvægtlabelgenkendelse, pas maskinlæsbart områdegenkendelse, elektrisk måleraflæsningsgenkendelse , stålspole Genkendelse af sprøjtede tegn.
Indlægstid: 16-november 2022