Kio estas OCR-teknologio?
Optical Character Recognition (angle: Optical Character Recognition, OCR) rilatas al la procezo de analizado kaj rekonado de bilddosieroj de tekstmaterialoj por akiri tekston kaj aranĝajn informojn.
Simile al bildrekono kaj maŝinvida teknologio, la prilaborado de OCR-teknologio ankaŭ estas dividita en enigaĵo, antaŭ-prilaborado, mezperioda prilaborado, post-prilaborado kaj eligo-procezo.
eniru
Por malsamaj bildformatoj, ekzistas malsamaj stokadformatoj kaj malsamaj kunpremaj metodoj.Nuntempe, ekzistas OpenCV, CxImage, ktp.
Antaŭ-prilaborado - binarigo
La plej multaj el la bildoj faritaj per diĝitkameraoj hodiaŭ estas kolorbildoj, kiuj enhavas grandegan kvanton da informoj kaj ne taŭgas por OCR-teknologio.
Por la enhavo de la bildo, ni povas simple dividi ĝin en malfonon kaj fonon.Por igi la komputilon pli rapida kaj pli bone plenumi OCR-rilatajn kalkulojn, ni devas unue prilabori la kolorbildon, tiel ke nur la malfonaj informoj kaj fonaj informoj restu en la bildo.Binarigo ankaŭ povas esti simple komprenita kiel "nigra kaj blanka".
redukto de bruo de bildo
Por malsamaj bildoj, la difino de bruo povas esti malsama, kaj la procezo de senbruo laŭ la trajtoj de bruo estas nomita bruoredukto.
kliniĝa korekto
Ĉar ordinaraj uzantoj, kiam oni prenas bildojn de dokumentoj, estas malfacile pafi tute konforme al horizontala kaj vertikala vicigo, do la bildoj prenitaj neeviteble estos misformitaj, kio postulas bild-prilaboran programaron por korekti.
Mezperioda prilaborado - aranĝa analizo
La procezo de dividi dokumentbildojn en alineojn kaj branĉojn nomiĝas aranĝanalizo.Pro la diverseco kaj komplekseco de realaj dokumentoj, ĉi tiu paŝo ankoraŭ bezonas esti optimumigita.
karaktero tranĉado
Pro la limigoj de fotado kaj skribado de kondiĉoj, karakteroj ofte estas blokitaj kaj skribiloj estas rompitaj.Rekte uzi tiajn bildojn por OCR-analizo multe limigos OCR-efikecon.Tial, signa segmentigo estas postulata, tio estas, por apartigi malsamajn karakterojn.
Karaktero-rekono
En la frua stadio oni ĉefe uzis ŝablonkongruon, kaj en la posta etapo ĉefe uzis eltiro de trajtoj.Pro la influo de faktoroj kiel tekstmovo, streka dikeco, rompita plumo, aliĝo, rotacio, ktp., la malfacileco de eltiro de trajto estas tre tuŝita.
Enpaĝiga restarigo
Homoj esperas, ke la agnoskita teksto daŭre estas aranĝita kiel la originala dokumentbildo, kaj la alineoj, pozicioj kaj ordo estas eligitaj al Word-dokumentoj, PDF-dokumentoj, ktp., kaj ĉi tiu procezo nomiĝas aranĝo-restarigo.
postprilaborado
Laŭ la rilato de specifa lingvokunteksto, la rekonrezulto estas korektita.
eligo
Eligu la agnoskitajn signojn kiel tekston en certa formato.
Kio estas la aplikoj de porteblaj terminaloj bazitaj sur OCR-teknologio?
Per la portebla terminalo PDA ŝarĝita per OCR-karaktera rekono-programaro, multaj scen-aplikoj povas esti realigitaj, kiel ekzemple: rekono de aŭtoj numerplatoj, rekono de numero de ujo, rekono de etikedo de importita bovaĵo kaj ŝafaĵo, rekono de pasporto-maŝinlegebla areo, rekono de elektra mezurilo. , ŝtala bobeno Rekono de ŝprucitaj karakteroj.
Afiŝtempo: Nov-16-2022