Teknolojia ya OCR ni nini?
Utambuzi wa Tabia ya Macho (Kiingereza: Optical Character Recognition, OCR) inarejelea mchakato wa kuchambua na kutambua faili za picha za nyenzo za maandishi ili kupata maandishi na maelezo ya mpangilio.
Sawa na utambuzi wa picha na teknolojia ya maono ya mashine, mchakato wa usindikaji wa teknolojia ya OCR pia umegawanywa katika pembejeo, usindikaji wa awali, usindikaji wa kati, baada ya usindikaji na mchakato wa pato.
ingia
Kwa miundo tofauti ya picha, kuna miundo tofauti ya hifadhi na mbinu tofauti za ukandamizaji.Hivi sasa, kuna OpenCV, CxImage, nk.
Usindikaji wa awali - uboreshaji wa mbili
Picha nyingi zilizochukuliwa na kamera za digital leo ni picha za rangi, ambazo zina kiasi kikubwa cha habari na hazifai kwa teknolojia ya OCR.
Kwa yaliyomo kwenye picha, tunaweza kuigawanya kwa mandhari ya mbele na usuli.Ili kufanya kompyuta iwe ya haraka na bora zaidi kufanya mahesabu yanayohusiana na OCR, tunahitaji kuchakata picha ya rangi kwanza, ili tu taarifa ya mbele na maelezo ya usuli yabaki kwenye picha.Binarization pia inaweza kueleweka kwa urahisi kama "nyeusi na nyeupe".
kupunguza kelele ya picha
Kwa picha tofauti, ufafanuzi wa kelele unaweza kuwa tofauti, na mchakato wa kupiga kelele kulingana na sifa za kelele huitwa kupunguza kelele.
urekebishaji wa tilt
Kwa sababu watumiaji wa kawaida, wakati wa kuchukua picha za nyaraka, ni vigumu kupiga picha kabisa kwa kuzingatia usawa na wima, hivyo picha zilizochukuliwa bila shaka zitapigwa, ambayo inahitaji programu ya usindikaji wa picha ili kurekebisha.
Usindikaji wa muda wa kati - uchambuzi wa mpangilio
Mchakato wa kugawanya picha za hati katika aya na matawi huitwa uchambuzi wa mpangilio.Kwa sababu ya utofauti na utata wa hati halisi, hatua hii bado inahitaji kuboreshwa.
kukata tabia
Kutokana na mapungufu ya hali ya kupiga picha na kuandika, wahusika mara nyingi hukwama na kalamu huvunjwa.Kutumia picha kama hizo moja kwa moja kwa uchanganuzi wa OCR kutapunguza sana utendaji wa OCR.Kwa hivyo, mgawanyiko wa wahusika unahitajika, ambayo ni, kutenganisha wahusika tofauti.
Utambuzi wa wahusika
Katika hatua ya awali, ulinganishaji wa template ulitumiwa hasa, na katika hatua ya baadaye, uchimbaji wa kipengele ulitumiwa hasa.Kwa sababu ya ushawishi wa mambo kama vile uhamishaji wa maandishi, unene wa kiharusi, kalamu iliyovunjika, wambiso, mzunguko, n.k., ugumu wa uchimbaji wa kipengele huathiriwa sana.
Marejesho ya mpangilio
Watu wanatumai kuwa maandishi yanayotambulika bado yamepangwa kama picha halisi ya hati, na aya, nafasi, na mpangilio hutolewa kwa hati za Neno, hati za PDF, n.k., na mchakato huu unaitwa urejeshaji wa mpangilio.
usindikaji wa chapisho
Kulingana na uhusiano wa muktadha wa lugha mahususi, matokeo ya utambuzi hurekebishwa.
pato
Toa herufi zinazotambulika kama maandishi katika umbizo fulani.
Je, ni matumizi gani ya vituo vinavyoshikiliwa kwa mkono kulingana na teknolojia ya OCR?
Kupitia kituo cha mkono cha PDA kilichopakiwa na programu ya utambuzi wa herufi ya OCR, maombi mengi ya tukio yanaweza kutekelezwa, kama vile: utambuzi wa sahani ya leseni ya gari, utambuzi wa nambari ya kontena, utambuzi wa lebo ya uzito wa nyama ya ng'ombe na kondoo, utambuzi wa eneo linalosomeka kwa mashine ya pasipoti, utambuzi wa usomaji wa mita ya umeme. , coil ya chuma Utambuzi wa wahusika waliopigwa.
Muda wa kutuma: Nov-16-2022