Што е OCR технологија?
Оптичко препознавање знаци (англиски: Optical Character Recognition, OCR) се однесува на процес на анализа и препознавање на датотеки со слики од текстуални материјали за да се добијат информации за текст и распоред.
Слично на технологијата за препознавање слики и машинско гледање, процесот на обработка на технологијата OCR е исто така поделен на влезен, предобработка, среднорочна обработка, пост-обработка и излезен процес.
внесете
За различни формати на слики, постојат различни формати за складирање и различни методи на компресија.Во моментов, постојат OpenCV, CxImage, итн.
Претходна обработка – бинаризација
Повеќето од сликите направени од дигиталните фотоапарати денес се слики во боја, кои содржат огромна количина на информации и не се соодветни за OCR технологијата.
За содржината на сликата, можеме едноставно да ја поделиме на преден план и позадина.За да го направиме компјутерот побрз и подобро да ги извршува пресметките поврзани со OCR, прво треба да ја обработиме сликата во боја, така што на сликата остануваат само информациите во преден план и информациите за позадина.Бинаризацијата може едноставно да се разбере како „црно-бело“.
намалување на шумот на сликата
За различни слики, дефиницијата за шум може да биде различна, а процесот на отстранување на шум според карактеристиките на шумот се нарекува намалување на шумот.
корекција на навалување
Бидејќи обичните корисници, кога фотографираат документи, тешко е да се снима целосно во согласност со хоризонталното и вертикалното порамнување, така што направените фотографии неизбежно ќе бидат искривени, што бара софтвер за обработка на слики за да се коригира.
Среднорочна обработка – анализа на распоред
Процесот на делење на сликите на документите на параграфи и гранки се нарекува анализа на распоред.Поради разновидноста и сложеноста на вистинските документи, овој чекор сè уште треба да се оптимизира.
сечење ликови
Поради ограничувањата на условите за фотографирање и пишување, ликовите често се заглавуваат и пенкалата се кршат.Директното користење на таквите слики за OCR анализа во голема мера ќе ги ограничи перформансите на OCR.Затоа, потребна е сегментација на знаци, односно да се одделат различни знаци.
Препознавање ликови
Во раната фаза главно се користеше совпаѓање на шаблоните, а во подоцнежната фаза главно се користеше екстракција на карактеристики.Поради влијанието на факторите како што се поместување на текстот, дебелината на ударот, скршеното пенкало, адхезијата, ротацијата итн., тешкотијата на извлекување на карактеристиките е значително засегната.
Реставрација на распоредот
Луѓето се надеваат дека препознаениот текст е сè уште подреден како слика на оригиналниот документ, а ставовите, позициите и редоследот се емитуваат во Word документи, PDF документи итн., а овој процес се нарекува обновување на распоредот.
пост-обработка
Според односот на специфичен јазичен контекст, резултатот од препознавањето се коригира.
излез
Излезете ги препознаените знаци како текст во одреден формат.
Кои се апликациите на рачните терминали базирани на технологијата OCR?
Преку рачниот терминал PDA натоварен со софтвер за препознавање знаци OCR, може да се реализираат многу апликации за сцени, како што се: препознавање на регистарски таблички на автомобил, препознавање број на контејнер, препознавање на етикети за тежина на увезено говедско и овчо месо, препознавање на машински читливи области од пасош, препознавање на читање на електрично броило , челичен калем Препознавање на прскани знаци.
Време на објавување: 16-11-2022 година