Wat is OCR-technologie?
Optical Character Recognition (Engels: Optical Character Recognition, OCR) verwijst naar het proces van het analyseren en herkennen van afbeeldingsbestanden van tekstmateriaal om tekst- en lay-outinformatie te verkrijgen.
Net als bij beeldherkenning en machine vision-technologie, is het verwerkingsproces van OCR-technologie ook onderverdeeld in input-, pre-processing, mid-term processing, post-processing en outputproces.
binnenkomen
Voor verschillende afbeeldingsindelingen zijn er verschillende opslagindelingen en verschillende compressiemethoden.Momenteel zijn er OpenCV, CxImage, etc.
Voorbewerking – binarisatie
De meeste foto's die tegenwoordig met digitale camera's worden gemaakt, zijn kleurenafbeeldingen, die een enorme hoeveelheid informatie bevatten en niet geschikt zijn voor OCR-technologie.
Voor de inhoud van de afbeelding kunnen we deze eenvoudig verdelen in voorgrond en achtergrond.Om de computer sneller te maken en OCR-gerelateerde berekeningen beter te laten uitvoeren, moeten we eerst het kleurenbeeld verwerken, zodat alleen de voorgrond- en achtergrondinformatie in beeld blijven.Binarisatie kan ook eenvoudig worden opgevat als "zwart-wit".
beeld ruisonderdrukking
Voor verschillende afbeeldingen kan de definitie van ruis verschillen en het proces van ruisonderdrukking volgens de kenmerken van ruis wordt ruisonderdrukking genoemd.
kantelcorrectie
Omdat het voor gewone gebruikers bij het maken van foto's van documenten moeilijk is om volledig in lijn met de horizontale en verticale uitlijning te fotograferen, dus de gemaakte foto's zullen onvermijdelijk scheef staan, waarvoor beeldverwerkingssoftware nodig is om te corrigeren.
Tussentijdse verwerking – lay-outanalyse
Het proces van het verdelen van documentafbeeldingen in alinea's en takken wordt lay-outanalyse genoemd.Vanwege de diversiteit en complexiteit van feitelijke documenten moet deze stap nog worden geoptimaliseerd.
karakter knippen
Door de beperkingen van fotografie en schrijfomstandigheden blijven karakters vaak vastzitten en zijn pennen kapot.Het rechtstreeks gebruiken van dergelijke afbeeldingen voor OCR-analyse zal de OCR-prestaties aanzienlijk beperken.Daarom is karaktersegmentatie vereist, dat wil zeggen om verschillende karakters te scheiden.
Karakterherkenning
In de beginfase werd vooral gebruik gemaakt van template matching en in de latere fase werd vooral gebruik gemaakt van feature-extractie.Door de invloed van factoren zoals tekstverplaatsing, lijndikte, gebroken pen, adhesie, rotatie, enz., wordt de moeilijkheid van het extraheren van kenmerken sterk beïnvloed.
Lay-out restauratie
Mensen hopen dat de herkende tekst nog steeds is gerangschikt zoals de originele documentafbeelding, en dat de alinea's, posities en volgorde worden uitgevoerd naar Word-documenten, PDF-documenten, enz., en dit proces wordt lay-outherstel genoemd.
nabewerking
Volgens de relatie van de specifieke taalcontext wordt het herkenningsresultaat gecorrigeerd.
uitvoer
Voer de herkende tekens uit als tekst in een bepaald formaat.
Wat zijn de toepassingen van handterminals op basis van OCR-technologie?
Via de handheld terminal PDA geladen met OCR-tekenherkenningssoftware, kunnen veel scènetoepassingen worden gerealiseerd, zoals: kentekenherkenning van auto's, herkenning van containernummers, herkenning van geïmporteerde rundvlees- en schapenvleesgewichtslabels, herkenning van paspoortmachineleesbare gebieden, herkenning van elektrische meterstanden , stalen spoel Herkenning van gespoten karakters.
Posttijd: 16-nov-2022