+ 86-755-29031883

Якія прымянення функцыі кішэннага тэрмінала OCR?

Што такое тэхналогія OCR?

Аптычнае распазнаванне сімвалаў (па-ангельску: Optical Character Recognition, OCR) адносіцца да працэсу аналізу і распазнавання файлаў малюнкаў тэкставых матэрыялаў для атрымання інфармацыі аб тэксце і кампаноўцы.

Падобна тэхналогіі распазнавання малюнкаў і машыннага зроку, працэс апрацоўкі тэхналогіі OCR таксама дзеліцца на ўвод, папярэднюю апрацоўку, прамежкавую апрацоўку, пост-апрацоўку і працэс вываду.

увайсці
Для розных фарматаў малюнкаў існуюць розныя фарматы захоўвання і розныя метады сціску.У цяперашні час ёсць OpenCV, CxImage і г.д.

Папярэдняя апрацоўка - бінарызацыя

Большасць здымкаў, зробленых сёння лічбавымі камерамі, - гэта каляровыя выявы, якія ўтрымліваюць велізарны аб'ём інфармацыі і не падыходзяць для тэхналогіі OCR.

Што тычыцца зместу карцінкі, мы можам проста падзяліць яе на пярэдні план і фон.Каб зрабіць камп'ютар больш хуткім і лепш выконваць разлікі, звязаныя з OCR, нам трэба спачатку апрацаваць каляровы відарыс, каб на малюнку заставалася толькі інфармацыя пярэдняга плана і інфармацыя фону.Бінарызацыю таксама можна проста разумець як "чорнае і белае".

памяншэнне шуму выявы
Для розных відарысаў вызначэнне шуму можа адрознівацца, і працэс знішчэння шуму ў адпаведнасці з характарыстыкамі шуму называецца шумапрыглушэннем.

карэкцыя нахілу
Паколькі звычайным карыстальнікам, фатаграфуючы дакументы, складана рабіць здымкі ў поўнай адпаведнасці з гарызантальным і вертыкальным выраўноўваннем, таму зробленыя здымкі непазбежна будуць скажоныя, для выпраўлення якіх патрабуецца праграмнае забеспячэнне для апрацоўкі малюнкаў.

Прамежкавая апрацоўка – аналіз макета
Працэс падзелу малюнкаў дакумента на абзацы і галіны называецца аналізам макета.З-за разнастайнасці і складанасці фактычных дакументаў гэты этап усё яшчэ патрабуе аптымізацыі.

нарэзка персанажаў
З-за абмежаванняў умоў фатаграфавання і запісу сімвалы часта захрасаюць, а ручкі ламаюцца.Непасрэднае выкарыстанне такіх малюнкаў для OCR-аналізу значна абмяжуе прадукцыйнасць OCR.Такім чынам, патрабуецца сегментацыя знакаў, гэта значыць раздзяленне розных знакаў.

Распазнаванне персанажаў
На ранняй стадыі ў асноўным выкарыстоўвалася супастаўленне шаблонаў, а на больш позняй — выманне функцый.З-за ўплыву такіх фактараў, як зрушэнне тэксту, таўшчыня штрыха, зламанае пяро, адгезія, паварот і г.д., цяжкасці вылучэння асаблівасцей значна парушаюцца.

Аднаўленне макета
Людзі спадзяюцца, што распазнаны тэкст па-ранейшаму размешчаны як арыгінальны малюнак дакумента, а абзацы, пазіцыі і парадак выводзяцца ў дакументы Word, PDF і г.д., і гэты працэс называецца аднаўленнем макета.

пост-апрацоўка
У адпаведнасці з суадносінамі канкрэтнага моўнага кантэксту вынік распазнання карэктуецца.

выхад
Вывесці распазнаныя сімвалы ў выглядзе тэксту ў пэўным фармаце.

Якое прымяненне партатыўных тэрміналаў на аснове тэхналогіі OCR?

З дапамогай партатыўнага тэрмінала КПК, загружанага праграмным забеспячэннем для распазнання знакаў OCR, можна рэалізаваць мноства сцэнічных прыкладанняў, такіх як: распазнаванне аўтамабільных нумароў, распазнаванне нумароў кантэйнераў, распазнаванне этыкетак вагі імпартнай ялавічыны і бараніны, распазнаванне машыначытальнай зоны пашпарта, распазнаванне паказанняў электралічыльнікаў , сталёвая шпулька Распазнаванне распыленых знакаў.


Час публікацыі: 16 лістапада 2022 г
Інтэрнэт-чат WhatsApp!