+86-755-29031883

Beth yw cymwysiadau swyddogaeth PDA terfynell llaw OCR?

Beth yw technoleg OCR?

Mae Cydnabod Cymeriad Optegol (Saesneg: Optical Character Recognition, OCR) yn cyfeirio at y broses o ddadansoddi ac adnabod ffeiliau delwedd o ddeunyddiau testun i gael gwybodaeth am destun a gosodiad.

Yn debyg i dechnoleg adnabod delwedd a gweledigaeth peiriant, mae proses brosesu technoleg OCR hefyd wedi'i rhannu'n broses mewnbwn, cyn-brosesu, prosesu canol tymor, ôl-brosesu ac allbwn.

mynd i mewn
Ar gyfer gwahanol fformatau delwedd, mae yna wahanol fformatau storio a gwahanol ddulliau cywasgu.Ar hyn o bryd, mae OpenCV, CxImage, ac ati.

Cyn-brosesu - binareiddio

Mae'r rhan fwyaf o'r lluniau a dynnir gan gamerâu digidol heddiw yn ddelweddau lliw, sy'n cynnwys llawer iawn o wybodaeth ac nad ydynt yn addas ar gyfer technoleg OCR.

Ar gyfer cynnwys y llun, gallwn ei rannu'n flaendir a chefndir.Er mwyn gwneud y cyfrifiadur yn gyflymach ac yn perfformio cyfrifiadau cysylltiedig â OCR yn well, mae angen i ni brosesu'r ddelwedd lliw yn gyntaf, fel mai dim ond y wybodaeth flaendir a'r wybodaeth gefndir sy'n aros yn y llun.Gall binarization hefyd gael ei ddeall yn syml fel “du a gwyn”.

lleihau sŵn delwedd
Ar gyfer gwahanol ddelweddau, gall y diffiniad o sŵn fod yn wahanol, a gelwir y broses o denoising yn ôl nodweddion sŵn yn lleihau sŵn.

cywiro tilt
Oherwydd bod defnyddwyr cyffredin, wrth gymryd lluniau o ddogfennau, mae'n anodd saethu yn gyfan gwbl yn unol ag aliniad llorweddol a fertigol, felly mae'n anochel y bydd y lluniau a gymerir yn cael eu sgiwio, sy'n gofyn am feddalwedd prosesu delwedd i'w cywiro.

Prosesu tymor canolig – dadansoddi gosodiad
Gelwir y broses o rannu lluniau dogfen yn baragraffau a changhennau yn ddadansoddiad gosodiad.Oherwydd amrywiaeth a chymhlethdod dogfennau gwirioneddol, mae angen optimeiddio'r cam hwn o hyd.

torri cymeriad
Oherwydd cyfyngiadau amodau tynnu lluniau ac ysgrifennu, mae cymeriadau yn aml yn sownd a beiros yn cael eu torri.Bydd defnyddio delweddau o'r fath yn uniongyrchol ar gyfer dadansoddiad OCR yn cyfyngu'n fawr ar berfformiad OCR.Felly, mae angen segmentu nodau, hynny yw, i wahanu gwahanol nodau.

Adnabod cymeriad
Yn y cyfnod cynnar, defnyddiwyd paru templed yn bennaf, ac yn y cam diweddarach, defnyddiwyd echdynnu nodwedd yn bennaf.Oherwydd dylanwad ffactorau megis dadleoli testun, trwch strôc, pen wedi'i dorri, adlyniad, cylchdroi, ac ati, mae anhawster echdynnu nodwedd yn cael ei effeithio'n fawr.

Adfer cynllun
Mae pobl yn gobeithio bod y testun cydnabyddedig yn dal i gael ei drefnu fel llun y ddogfen wreiddiol, ac mae'r paragraffau, y swyddi a'r drefn yn cael eu hallbynnu i ddogfennau Word, dogfennau PDF, ac ati, a gelwir y broses hon yn adfer gosodiad.

ôl-brosesu
Yn ôl perthynas cyd-destun iaith benodol, mae canlyniad yr adnabyddiaeth yn cael ei gywiro.

allbwn
Allbynnu'r nodau cydnabyddedig fel testun mewn fformat penodol.

Beth yw cymwysiadau terfynellau llaw yn seiliedig ar dechnoleg OCR?

Trwy'r derfynell llaw PDA wedi'i llwytho â meddalwedd adnabod cymeriad OCR, gellir gwireddu llawer o gymwysiadau golygfa, megis: cydnabyddiaeth plât trwydded car, adnabod rhif cynhwysydd, cydnabyddiaeth label pwysau cig eidion a chig dafad wedi'i fewnforio, cydnabyddiaeth ardal pasport y gellir ei darllen gan beiriant, cydnabyddiaeth darllen mesurydd trydan , coil dur Cydnabod cymeriadau wedi'u chwistrellu.


Amser postio: Tachwedd-16-2022
Sgwrs WhatsApp Ar-lein!