Çfarë është teknologjia OCR?
Njohja optike e karaktereve (anglisht: Optical Character Recognition, OCR) i referohet procesit të analizimit dhe njohjes së skedarëve të imazheve të materialeve tekstuale për të marrë informacionin e tekstit dhe paraqitjes.
Ngjashëm me teknologjinë e njohjes së imazhit dhe vizionit të makinës, procesi i përpunimit të teknologjisë OCR ndahet gjithashtu në proceset hyrëse, para-përpunimi, përpunimi afatmesëm, pas-përpunimi dhe procesi i daljes.
hyjnë
Për formate të ndryshme imazhi, ekzistojnë formate të ndryshme ruajtjeje dhe metoda të ndryshme kompresimi.Aktualisht, ka OpenCV, CxImage, etj.
Përpunimi paraprak – binarizimi
Shumica e fotografive të marra nga kamerat dixhitale sot janë imazhe me ngjyra, të cilat përmbajnë një sasi të madhe informacioni dhe nuk janë të përshtatshme për teknologjinë OCR.
Për përmbajtjen e figurës, thjesht mund ta ndajmë atë në plan të parë dhe sfond.Për ta bërë kompjuterin më të shpejtë dhe për të kryer më mirë llogaritjet e lidhura me OCR, së pari duhet të përpunojmë imazhin me ngjyra, në mënyrë që vetëm informacioni në plan të parë dhe informacioni i sfondit të mbeten në foto.Binarizimi gjithashtu mund të kuptohet thjesht si "bardh e zi".
zvogëlimi i zhurmës së imazhit
Për imazhe të ndryshme, përkufizimi i zhurmës mund të jetë i ndryshëm, dhe procesi i denoisimit sipas karakteristikave të zhurmës quhet reduktim i zhurmës.
korrigjimi i animit
Për shkak se përdoruesit e zakonshëm, kur bëjnë fotografi të dokumenteve, është e vështirë të shkrepësh plotësisht në përputhje me shtrirjen horizontale dhe vertikale, kështu që fotografitë e marra në mënyrë të pashmangshme do të anojnë, gjë që kërkon softuer të përpunimit të imazhit për t'u korrigjuar.
Përpunimi afatmesëm – analiza e paraqitjes
Procesi i ndarjes së fotografive të dokumenteve në paragrafë dhe degë quhet analiza e paraqitjes.Për shkak të diversitetit dhe kompleksitetit të dokumenteve aktuale, ky hap duhet ende të optimizohet.
prerje karakteresh
Për shkak të kufizimeve të kushteve të fotografimit dhe shkrimit, personazhet shpesh ngecin dhe stilolapsat thyhen.Përdorimi i drejtpërdrejtë i imazheve të tilla për analizën OCR do të kufizojë shumë performancën OCR.Prandaj, kërkohet segmentimi i karaktereve, domethënë për të ndarë karaktere të ndryshme.
Njohja e personazheve
Në fazën e hershme, kryesisht u përdor përputhja e shablloneve, dhe në fazën e mëvonshme, kryesisht u përdor ekstraktimi i veçorive.Për shkak të ndikimit të faktorëve të tillë si zhvendosja e tekstit, trashësia e goditjes, stilolapsi i thyer, ngjitja, rrotullimi, etj., vështirësia e nxjerrjes së veçorive ndikohet shumë.
Restaurimi i paraqitjes
Njerëzit shpresojnë që teksti i njohur të jetë ende i rregulluar si fotografia origjinale e dokumentit, dhe paragrafët, pozicionet dhe renditja dalin në dokumente Word, dokumente PDF, etj., dhe ky proces quhet restaurimi i paraqitjes.
pas përpunimit
Sipas raportit të kontekstit specifik gjuhësor, rezultati i njohjes korrigjohet.
prodhimit
Nxjerrja e karaktereve të njohura si tekst në një format të caktuar.
Cilat janë aplikimet e terminaleve të dorës bazuar në teknologjinë OCR?
Nëpërmjet terminalit të dorës PDA të ngarkuar me softuer për njohjen e karaktereve OCR, mund të realizohen shumë aplikacione në skenë, si: njohja e targave të makinës, njohja e numrit të kontejnerit, njohja e etiketës së peshës së viçit dhe deles së importuar, njohja e zonës së lexueshme nga makineritë e pasaportës, njohja e leximit të njehsorit elektrik. , mbështjellje çeliku Njohja e karaktereve të spërkatura.
Koha e postimit: Nëntor-16-2022