Ano ang teknolohiya ng OCR?
Ang Optical Character Recognition (Ingles: Optical Character Recognition, OCR) ay tumutukoy sa proseso ng pagsusuri at pagkilala sa mga file ng imahe ng mga materyales sa teksto upang makakuha ng impormasyon ng teksto at layout.
Katulad ng pagkilala sa imahe at teknolohiya ng machine vision, ang proseso ng pagproseso ng teknolohiya ng OCR ay nahahati din sa input, pre-processing, mid-term processing, post-processing at output na proseso.
pumasok
Para sa iba't ibang mga format ng imahe, mayroong iba't ibang mga format ng imbakan at iba't ibang paraan ng compression.Sa kasalukuyan, mayroong OpenCV, CxImage, atbp.
Pre-processing – binarization
Karamihan sa mga larawang kinunan ng mga digital camera ngayon ay mga kulay na imahe, na naglalaman ng malaking halaga ng impormasyon at hindi angkop para sa teknolohiya ng OCR.
Para sa nilalaman ng larawan, maaari lamang nating hatiin ito sa foreground at background.Upang gawing mas mabilis ang computer at mas mahusay na maisagawa ang mga kalkulasyon na nauugnay sa OCR, kailangan muna nating iproseso ang kulay na imahe, upang ang impormasyon sa harapan at background na impormasyon lamang ang mananatili sa larawan.Ang binarization ay maaari ding madaling maunawaan bilang "itim at puti".
pagbawas ng ingay ng imahe
Para sa iba't ibang mga imahe, ang kahulugan ng ingay ay maaaring iba, at ang proseso ng denoising ayon sa mga katangian ng ingay ay tinatawag na pagbabawas ng ingay.
pagwawasto ng ikiling
Dahil ang mga ordinaryong gumagamit, kapag kumukuha ng mga larawan ng mga dokumento, mahirap mag-shoot nang ganap na naaayon sa pahalang at patayong pagkakahanay, kaya't ang mga larawang kinunan ay hindi maiiwasang maging skewed, na nangangailangan ng software sa pagpoproseso ng imahe upang maitama.
Pagproseso sa kalagitnaan ng panahon - pagsusuri ng layout
Ang proseso ng paghahati ng mga larawan ng dokumento sa mga talata at sangay ay tinatawag na layout analysis.Dahil sa pagkakaiba-iba at pagiging kumplikado ng mga aktwal na dokumento, kailangan pa ring i-optimize ang hakbang na ito.
pagputol ng karakter
Dahil sa mga limitasyon ng pagkuha ng litrato at mga kondisyon sa pagsulat, ang mga character ay madalas na natigil at ang mga panulat ay nasira.Ang direktang paggamit ng mga ganitong larawan para sa pagsusuri ng OCR ay lubos na maglilimita sa pagganap ng OCR.Samakatuwid, kinakailangan ang segmentasyon ng character, iyon ay, upang paghiwalayin ang iba't ibang mga character.
Pagkilala sa karakter
Sa maagang yugto, pangunahing ginamit ang pagtutugma ng template, at sa huling yugto, pangunahing ginamit ang pagkuha ng tampok.Dahil sa impluwensya ng mga kadahilanan tulad ng pag-aalis ng teksto, kapal ng stroke, sirang panulat, pagdirikit, pag-ikot, atbp., ang kahirapan ng pagkuha ng tampok ay lubhang naaapektuhan.
Pagpapanumbalik ng layout
Inaasahan ng mga tao na ang kinikilalang teksto ay nakaayos pa rin tulad ng orihinal na larawan ng dokumento, at ang mga talata, posisyon, at pagkakasunud-sunod ay output sa mga dokumento ng Word, PDF na dokumento, atbp., at ang prosesong ito ay tinatawag na layout restoration.
post processing
Ayon sa kaugnayan ng tiyak na konteksto ng wika, ang resulta ng pagkilala ay naitama.
output
I-output ang mga kinikilalang character bilang teksto sa isang tiyak na format.
Ano ang mga aplikasyon ng mga handheld terminal batay sa teknolohiya ng OCR?
Sa pamamagitan ng handheld terminal PDA na puno ng OCR character recognition software, maraming mga application ng eksena ang maaaring maisakatuparan, tulad ng: pagkilala sa plaka ng lisensya ng sasakyan, pagkilala sa numero ng lalagyan, pagkilala sa imported na karne ng baka at mutton weight label, pagkilala sa lugar na nababasa ng makina ng pasaporte, pagkilala sa pagbasa ng metro ng kuryente , steel coil Pagkilala sa mga na-spray na character.
Oras ng post: Nob-16-2022