X'inhi t-teknoloġija OCR?
Rikonoxximent tal-Karattri Ottiċi (Ingliż: Optical Character Recognition, OCR) jirreferi għall-proċess ta 'analiżi u rikonoxximent ta' fajls tal-immaġni ta 'materjali tat-test biex tinkiseb informazzjoni ta' test u tqassim.
Simili għar-rikonoxximent tal-immaġni u t-teknoloġija tal-viżjoni tal-magni, il-proċess tal-ipproċessar tat-teknoloġija OCR huwa wkoll maqsum fi proċess ta 'input, proċessar minn qabel, proċessar ta' nofs it-terminu, proċessar ta 'wara u proċess ta' produzzjoni.
jidħol
Għal formati ta 'immaġni differenti, hemm formati ta' ħażna differenti u metodi ta 'kompressjoni differenti.Bħalissa, hemm OpenCV, CxImage, eċċ.
Ipproċessar minn qabel - binarizzazzjoni
Ħafna mill-istampi meħuda minn kameras diġitali llum huma stampi bil-kulur, li fihom ammont kbir ta 'informazzjoni u mhumiex adattati għat-teknoloġija OCR.
Għall-kontenut tal-istampa, nistgħu sempliċement naqsmuha f'tagħrif miksub u sfond.Sabiex il-kompjuter isir aktar mgħaġġel u jwettaq aħjar il-kalkoli relatati mal-OCR, għandna bżonn nipproċessaw l-immaġni bil-kulur l-ewwel, sabiex l-informazzjoni miksub u l-informazzjoni fl-isfond biss jibqgħu fl-istampa.Binarizzazzjoni tista 'wkoll tkun sempliċement mifhuma bħala "iswed u abjad".
tnaqqis tal-istorbju tal-immaġini
Għal stampi differenti, id-definizzjoni tal-istorbju tista 'tkun differenti, u l-proċess ta' denoising skont il-karatteristiċi tal-istorbju jissejjaħ tnaqqis tal-istorbju.
korrezzjoni tal-inklinazzjoni
Minħabba li l-utenti ordinarji, meta jieħdu stampi ta 'dokumenti, huwa diffiċli li jisparaw kompletament f'konformità mal-allinjament orizzontali u vertikali, għalhekk l-istampi meħuda inevitabbilment ikunu distorti, li jeħtieġ softwer tal-ipproċessar tal-immaġni biex jikkoreġi.
Ipproċessar f'nofs it-terminu - analiżi tat-tqassim
Il-proċess tad-diviżjoni tal-istampi tad-dokumenti f'paragrafi u fergħat jissejjaħ analiżi tat-tqassim.Minħabba d-diversità u l-kumplessità tad-dokumenti attwali, dan il-pass għad irid jiġi ottimizzat.
qtugħ tal-karattru
Minħabba l-limitazzjonijiet tal-kundizzjonijiet tar-ritratti u l-kitba, il-karattri ħafna drabi huma mwaħħla u l-pinen jitkissru.L-użu dirett ta 'immaġini bħal dawn għall-analiżi OCR se jillimita ħafna l-prestazzjoni tal-OCR.Għalhekk, is-segmentazzjoni tal-karattri hija meħtieġa, jiġifieri, biex tissepara karattri differenti.
Rikonoxximent tal-karattri
Fl-istadju bikri, it-tqabbil tal-mudelli intuża prinċipalment, u fl-istadju aktar tard, l-estrazzjoni tal-karatteristiċi intużat prinċipalment.Minħabba l-influwenza ta 'fatturi bħall-ispostament tat-test, ħxuna tal-puplesija, pinna miksura, adeżjoni, rotazzjoni, eċċ., Id-diffikultà tal-estrazzjoni tal-karatteristika hija affettwata ħafna.
Restawr ta' tqassim
In-nies jittamaw li t-test rikonoxxut għadu rranġat bħall-istampa tad-dokument oriġinali, u l-paragrafi, il-pożizzjonijiet, u l-ordni huma output għal dokumenti Word, dokumenti PDF, eċċ., U dan il-proċess jissejjaħ restawr tat-tqassim.
post-ipproċessar
Skont ir-relazzjoni tal-kuntest tal-lingwa speċifika, ir-riżultat tar-rikonoxximent jiġi kkoreġut.
output
Oħroġ il-karattri rikonoxxuti bħala test f'ċertu format.
X'inhuma l-applikazzjonijiet tat-terminals li jinżammu fl-idejn ibbażati fuq it-teknoloġija OCR?
Permezz tal-PDA tat-terminal li jinżamm fl-idejn mgħobbi b'softwer ta 'rikonoxximent tal-karattru OCR, jistgħu jiġu realizzati ħafna applikazzjonijiet ta' xena, bħal: rikonoxximent tal-pjanċa tal-liċenzja tal-karozzi, rikonoxximent tan-numru tal-kontenitur, rikonoxximent tat-tikketta tal-piż taċ-ċanga u tal-muntun importati, rikonoxximent taż-żona li tinqara mill-magni tal-passaport, rikonoxximent tal-qari tal-miter elettriku , coil azzar Rikonoxximent ta 'karattri sprejjati.
Ħin tal-post: Nov-16-2022