Wat is OCR-tegnologie?
Optical Character Recognition (Engels: Optical Character Recognition, OCR) verwys na die proses om beeldlêers van teksmateriaal te ontleed en te herken om teks- en uitleginligting te bekom.
Soortgelyk aan beeldherkenning en masjienvisietegnologie, word die verwerkingsproses van OCR-tegnologie ook verdeel in inset, voorverwerking, middeltermynverwerking, naverwerking en uitsetproses.
ingaan
Vir verskillende beeldformate is daar verskillende bergingsformate en verskillende kompressiemetodes.Tans is daar OpenCV, CxImage, ens.
Voorverwerking – binarisering
Die meeste van die foto's wat vandag deur digitale kameras geneem word, is kleurbeelde, wat 'n groot hoeveelheid inligting bevat en nie geskik is vir OCR-tegnologie nie.
Vir die inhoud van die prent kan ons dit eenvoudig in voorgrond en agtergrond verdeel.Om die rekenaar vinniger te maak en OCR-verwante berekeninge beter te laat presteer, moet ons eers die kleurprent verwerk, sodat slegs die voorgrondinligting en agtergrondinligting in die prentjie oorbly.Binarisering kan ook eenvoudig as "swart en wit" verstaan word.
beeld geraas vermindering
Vir verskillende beelde kan die definisie van geraas anders wees, en die proses om ruis te verminder volgens die eienskappe van geraas word geraasvermindering genoem.
kantel korreksie
Omdat gewone gebruikers, wanneer foto's van dokumente geneem word, is dit moeilik om heeltemal in lyn met horisontale en vertikale belyning te skiet, dus sal die foto's wat geneem word, onvermydelik skeef wees, wat beeldverwerkingsagteware vereis om reg te stel.
Middeltermynverwerking – uitlegontleding
Die proses om dokumentprente in paragrawe en takke te verdeel, word uitleganalise genoem.As gevolg van die diversiteit en kompleksiteit van werklike dokumente, moet hierdie stap nog geoptimaliseer word.
karakter sny
As gevolg van die beperkinge van fotografeer- en skryftoestande sit karakters dikwels vas en is penne gebreek.Om sulke beelde direk vir OCR-analise te gebruik, sal OCR-prestasie aansienlik beperk.Daarom word karaktersegmentering vereis, dit wil sê om verskillende karakters te skei.
Karakterherkenning
In die vroeë stadium is sjabloonpassing hoofsaaklik gebruik, en in die latere stadium is hoofsaaklik kenmerkekstraksie gebruik.As gevolg van die invloed van faktore soos teksverplasing, slagdikte, gebreekte pen, adhesie, rotasie, ens., word die moeilikheid van kenmerkonttrekking grootliks beïnvloed.
Uitleg herstel
Mense hoop dat die herkende teks steeds soos die oorspronklike dokumentprent gerangskik is, en die paragrawe, posisies en volgorde word na Word-dokumente, PDF-dokumente, ens. uitgevoer, en hierdie proses word uitlegherstel genoem.
na-verwerking
Volgens die verhouding van spesifieke taalkonteks word die herkenningsresultaat gekorrigeer.
uitset
Voer die herkende karakters as teks in 'n sekere formaat uit.
Wat is die toepassings van handterminale gebaseer op OCR-tegnologie?
Deur die handterminal PDA gelaai met OCR karakter herkenning sagteware, kan baie toneel toepassings gerealiseer word, soos: motor nommerplaat herkenning, houer nommer herkenning, ingevoerde bees- en skaap gewig etiket herkenning, paspoort masjien leesbare area herkenning, elektriese meter lees herkenning , staalspoel Herkenning van gespuite karakters.
Postyd: 16 Nov 2022