+ 86-755-29031883

Hva er applikasjonene til OCR håndholdt terminal PDA-funksjon?

Hva er OCR-teknologi?

Optisk tegngjenkjenning (engelsk: Optical Character Recognition, OCR) refererer til prosessen med å analysere og gjenkjenne bildefiler av tekstmateriale for å få tekst- og layoutinformasjon.

I likhet med bildegjenkjenning og maskinsynsteknologi er prosesseringsprosessen til OCR-teknologi også delt inn i input, pre-prosessering, midtveis prosessering, etterbehandling og utdataprosess.

Tast inn
For forskjellige bildeformater finnes det forskjellige lagringsformater og forskjellige komprimeringsmetoder.For øyeblikket er det OpenCV, CxImage, etc.

Forbehandling – binarisering

De fleste bildene tatt av digitale kameraer i dag er fargebilder, som inneholder en enorm mengde informasjon og ikke egner seg for OCR-teknologi.

For innholdet i bildet kan vi ganske enkelt dele det inn i forgrunn og bakgrunn.For å gjøre datamaskinen raskere og bedre utføre OCR-relaterte beregninger, må vi behandle fargebildet først, slik at bare forgrunnsinformasjonen og bakgrunnsinformasjonen forblir i bildet.Binarisering kan også enkelt forstås som "svart og hvitt".

bildestøyreduksjon
For forskjellige bilder kan definisjonen av støy være forskjellig, og prosessen med å redusere støy i henhold til egenskapene til støy kalles støyreduksjon.

helningskorrigering
Fordi vanlige brukere, når du tar bilder av dokumenter, er det vanskelig å fotografere helt i tråd med horisontal og vertikal justering, så bildene som tas vil uunngåelig bli skjeve, noe som krever bildebehandlingsprogramvare for å korrigere.

Midtveis behandling – layoutanalyse
Prosessen med å dele opp dokumentbilder i avsnitt og grener kalles layoutanalyse.På grunn av mangfoldet og kompleksiteten til faktiske dokumenter, må dette trinnet fortsatt optimaliseres.

karakterkutting
På grunn av begrensningene ved fotografering og skriveforhold, sitter tegn ofte fast og penner er ødelagte.Direkte bruk av slike bilder for OCR-analyse vil i stor grad begrense OCR-ytelsen.Derfor kreves tegnsegmentering, det vil si å skille forskjellige tegn.

Karaktergjenkjenning
I det tidlige stadiet ble malmatching hovedsakelig brukt, og i det senere stadiet ble funksjonsutvinning hovedsakelig brukt.På grunn av påvirkning av faktorer som tekstforskyvning, slagtykkelse, brukket penn, vedheft, rotasjon, etc., påvirkes vanskeligheten med å trekke ut funksjoner sterkt.

Layout restaurering
Folk håper at den gjenkjente teksten fortsatt er ordnet som det originale dokumentbildet, og avsnittene, posisjonene og rekkefølgen sendes ut til Word-dokumenter, PDF-dokumenter, etc., og denne prosessen kalles layoutgjenoppretting.

etterbehandling
I henhold til forholdet til spesifikk språkkontekst blir gjenkjenningsresultatet korrigert.

produksjon
Skriv ut de gjenkjente tegnene som tekst i et bestemt format.

Hva er bruksområdene til håndholdte terminaler basert på OCR-teknologi?

Gjennom den håndholdte terminalen PDA lastet med OCR-tegngjenkjenningsprogramvare, kan mange sceneapplikasjoner realiseres, for eksempel: bilskiltgjenkjenning, containernummergjenkjenning, importert etikettgjenkjenning av storfekjøtt og fårekjøtt, maskinlesbart passområdegjenkjenning, gjenkjenning av elektrisk måleravlesning , stålspole Gjenkjennelse av sprayede tegn.


Innleggstid: 16. november 2022
WhatsApp nettprat!