Vad är OCR-teknik?
Optical Character Recognition (engelska: Optical Character Recognition, OCR) hänvisar till processen att analysera och känna igen bildfiler av textmaterial för att få text- och layoutinformation.
I likhet med bildigenkänning och maskinseendeteknik är OCR-teknikens bearbetning också uppdelad i inmatning, förbearbetning, halvtidsbearbetning, efterbearbetning och utgångsprocess.
stiga på
För olika bildformat finns det olika lagringsformat och olika komprimeringsmetoder.För närvarande finns det OpenCV, CxImage, etc.
Förbearbetning – binarisering
De flesta bilder som tas med digitalkameror idag är färgbilder, som innehåller en enorm mängd information och inte lämpar sig för OCR-teknik.
För innehållet i bilden kan vi helt enkelt dela upp den i förgrund och bakgrund.För att göra datorn snabbare och bättre utföra OCR-relaterade beräkningar måste vi först bearbeta färgbilden så att endast förgrundsinformation och bakgrundsinformation finns kvar i bilden.Binarisering kan också enkelt förstås som "svart och vitt".
bildbrusreducering
För olika bilder kan definitionen av brus vara annorlunda, och processen för brusreducering enligt brusets egenskaper kallas brusreducering.
lutningskorrigering
Eftersom vanliga användare, när man tar bilder av dokument, är det svårt att fotografera helt i linje med horisontell och vertikal justering, så bilderna som tas kommer oundvikligen att bli sneda, vilket kräver bildbehandlingsprogram för att korrigera.
Halvtidsbearbetning – layoutanalys
Processen att dela in dokumentbilder i stycken och grenar kallas layoutanalys.På grund av de faktiska dokumentens mångfald och komplexitet behöver detta steg fortfarande optimeras.
teckenskärning
På grund av begränsningarna i fotograferings- och skrivförhållanden sitter karaktärer ofta fast och pennor är trasiga.Att direkt använda sådana bilder för OCR-analys kommer att avsevärt begränsa OCR-prestanda.Därför krävs teckensegmentering, det vill säga för att separera olika tecken.
Karaktärsigenkänning
I det tidiga skedet användes huvudsakligen mallmatchning och i det senare skedet användes huvudsakligen funktionsextraktion.På grund av påverkan av faktorer som textförskjutning, slagtjocklek, trasig penna, vidhäftning, rotation, etc., påverkas svårigheten att extrahera detaljer i hög grad.
Layout restaurering
Människor hoppas att den igenkända texten fortfarande är ordnad som den ursprungliga dokumentbilden och att styckena, positionerna och ordningen matas ut till Word-dokument, PDF-dokument, etc., och denna process kallas layoutåterställning.
efterbehandling
I enlighet med förhållandet mellan specifik språkkontext korrigeras igenkänningsresultatet.
produktion
Mata ut de igenkända tecknen som text i ett visst format.
Vilka är applikationerna för handhållna terminaler baserade på OCR-teknik?
Genom handterminalen PDA laddad med OCR-programvara för teckenigenkänning kan många scenapplikationer realiseras, såsom: igenkänning av bilnummerskylt, igenkänning av containernummer, importerad nöt- och fårköttsviktsetikett, igenkänning av pass maskinläsbart område, igenkänning av elmätaravläsning , stålspole Igenkänning av sprayade tecken.
Posttid: 2022-nov-16