Што такое тэхналогія OCR?
Аптычнае распазнаванне сімвалаў (па-ангельску: Optical Character Recognition, OCR) адносіцца да працэсу аналізу і распазнавання файлаў малюнкаў тэкставых матэрыялаў для атрымання інфармацыі аб тэксце і кампаноўцы.
Падобна тэхналогіі распазнавання малюнкаў і машыннага зроку, працэс апрацоўкі тэхналогіі OCR таксама дзеліцца на ўвод, папярэднюю апрацоўку, прамежкавую апрацоўку, пост-апрацоўку і працэс вываду.
увайсці
Для розных фарматаў малюнкаў існуюць розныя фарматы захоўвання і розныя метады сціску.У цяперашні час ёсць OpenCV, CxImage і г.д.
Папярэдняя апрацоўка - бінарызацыя
Большасць здымкаў, зробленых сёння лічбавымі камерамі, - гэта каляровыя выявы, якія ўтрымліваюць велізарны аб'ём інфармацыі і не падыходзяць для тэхналогіі OCR.
Што тычыцца зместу карцінкі, мы можам проста падзяліць яе на пярэдні план і фон.Каб зрабіць камп'ютар больш хуткім і лепш выконваць разлікі, звязаныя з OCR, нам трэба спачатку апрацаваць каляровы відарыс, каб на малюнку заставалася толькі інфармацыя пярэдняга плана і інфармацыя фону.Бінарызацыю таксама можна проста разумець як "чорнае і белае".
памяншэнне шуму выявы
Для розных відарысаў вызначэнне шуму можа адрознівацца, і працэс знішчэння шуму ў адпаведнасці з характарыстыкамі шуму называецца шумапрыглушэннем.
карэкцыя нахілу
Паколькі звычайным карыстальнікам, фатаграфуючы дакументы, складана рабіць здымкі ў поўнай адпаведнасці з гарызантальным і вертыкальным выраўноўваннем, таму зробленыя здымкі непазбежна будуць скажоныя, для выпраўлення якіх патрабуецца праграмнае забеспячэнне для апрацоўкі малюнкаў.
Прамежкавая апрацоўка – аналіз макета
Працэс падзелу малюнкаў дакумента на абзацы і галіны называецца аналізам макета.З-за разнастайнасці і складанасці фактычных дакументаў гэты этап усё яшчэ патрабуе аптымізацыі.
нарэзка персанажаў
З-за абмежаванняў умоў фатаграфавання і запісу сімвалы часта захрасаюць, а ручкі ламаюцца.Непасрэднае выкарыстанне такіх малюнкаў для OCR-аналізу значна абмяжуе прадукцыйнасць OCR.Такім чынам, патрабуецца сегментацыя знакаў, гэта значыць раздзяленне розных знакаў.
Распазнаванне персанажаў
На ранняй стадыі ў асноўным выкарыстоўвалася супастаўленне шаблонаў, а на больш позняй — выманне функцый.З-за ўплыву такіх фактараў, як зрушэнне тэксту, таўшчыня штрыха, зламанае пяро, адгезія, паварот і г.д., цяжкасці вылучэння асаблівасцей значна парушаюцца.
Аднаўленне макета
Людзі спадзяюцца, што распазнаны тэкст па-ранейшаму размешчаны як арыгінальны малюнак дакумента, а абзацы, пазіцыі і парадак выводзяцца ў дакументы Word, PDF і г.д., і гэты працэс называецца аднаўленнем макета.
пост-апрацоўка
У адпаведнасці з суадносінамі канкрэтнага моўнага кантэксту вынік распазнання карэктуецца.
выхад
Вывесці распазнаныя сімвалы ў выглядзе тэксту ў пэўным фармаце.
Якое прымяненне партатыўных тэрміналаў на аснове тэхналогіі OCR?
З дапамогай партатыўнага тэрмінала КПК, загружанага праграмным забеспячэннем для распазнання знакаў OCR, можна рэалізаваць мноства сцэнічных прыкладанняў, такіх як: распазнаванне аўтамабільных нумароў, распазнаванне нумароў кантэйнераў, распазнаванне этыкетак вагі імпартнай ялавічыны і бараніны, распазнаванне машыначытальнай зоны пашпарта, распазнаванне паказанняў электралічыльнікаў , сталёвая шпулька Распазнаванне распыленых знакаў.
Час публікацыі: 16 лістапада 2022 г