Kaj je tehnologija OCR?
Optično prepoznavanje znakov (angleško: Optical Character Recognition, OCR) se nanaša na postopek analiziranja in prepoznavanja slikovnih datotek besedilnih materialov za pridobitev besedila in informacij o postavitvi.
Podobno kot pri prepoznavanju slik in tehnologiji strojnega vida je tudi proces obdelave tehnologije OCR razdeljen na vnos, predprocesiranje, vmesno obdelavo, naknadno obdelavo in izhodni proces.
vstopiti
Za različne formate slik obstajajo različni formati shranjevanja in različni načini stiskanja.Trenutno obstajajo OpenCV, CxImage itd.
Predobdelava – binarizacija
Večina slik, ki jih danes posnamejo digitalni fotoaparati, je barvnih slik, ki vsebujejo ogromno informacij in niso primerne za tehnologijo OCR.
Za vsebino slike lahko preprosto razdelimo na ospredje in ozadje.Da bo računalnik hitrejši in bolje izvajal izračune, povezane z OCR, moramo najprej obdelati barvno sliko, tako da na sliki ostanejo samo informacije v ospredju in informacije v ozadju.Binarizacijo lahko preprosto razumemo tudi kot "črno-belo".
zmanjšanje šuma slike
Za različne slike je lahko definicija šuma različna, postopek odpravljanja šuma glede na značilnosti šuma pa se imenuje zmanjšanje šuma.
korekcija nagiba
Ker je običajnim uporabnikom pri fotografiranju dokumentov težko fotografirati popolnoma v skladu z vodoravno in navpično poravnavo, bodo posnete slike neizogibno poševne, za kar je potrebna programska oprema za obdelavo slik.
Vmesna obdelava – analiza postavitve
Postopek delitve slik dokumenta na odstavke in veje se imenuje analiza postavitve.Zaradi raznolikosti in kompleksnosti dejanskih dokumentov je treba ta korak še optimizirati.
rezanje znakov
Zaradi omejitev pogojev fotografiranja in pisanja se znaki pogosto zataknejo in peresa polomijo.Neposredna uporaba takih slik za analizo OCR bo močno omejila zmogljivost OCR.Zato je potrebna segmentacija znakov, torej ločevanje različnih znakov.
Prepoznavanje znakov
V zgodnji fazi se je v glavnem uporabljalo ujemanje s predlogami, v poznejši fazi pa je bilo uporabljeno predvsem ekstrakcijo funkcij.Zaradi vpliva dejavnikov, kot so premik besedila, debelina črte, zlomljeno pero, oprijem, rotacija itd., je težava ekstrakcije značilnosti močno prizadeta.
Obnova postavitve
Ljudje upajo, da je prepoznano besedilo še vedno urejeno kot izvirna slika dokumenta, odstavki, položaji in vrstni red pa so izpisani v dokumentih Word, dokumentih PDF itd., ta postopek pa se imenuje obnovitev postavitve.
naknadna obdelava
Glede na razmerje specifičnega jezikovnega konteksta se rezultat prepoznavanja popravi.
izhod
Izpis prepoznanih znakov kot besedilo v določenem formatu.
Kakšne so aplikacije ročnih terminalov, ki temeljijo na tehnologiji OCR?
Preko ročnega terminalskega dlančnika, naloženega s programsko opremo za prepoznavanje znakov OCR, je mogoče realizirati številne aplikacije za prizore, kot so: prepoznavanje avtomobilskih registrskih tablic, prepoznavanje številk kontejnerjev, prepoznavanje oznak teže uvožene govedine in ovčjega mesa, prepoznavanje strojno berljivega območja potnega lista, prepoznavanje odčitkov električnega števca , jeklena tuljava Prepoznavanje razpršenih znakov.
Čas objave: 16. nov. 2022