Какво представлява OCR технологията?
Оптичното разпознаване на символи (на английски: Optical Character Recognition, OCR) се отнася до процеса на анализиране и разпознаване на файлове с изображения на текстови материали за получаване на информация за текст и оформление.
Подобно на технологията за разпознаване на изображения и машинно зрение, процесът на обработка на OCR технологията също е разделен на вход, предварителна обработка, междинна обработка, последваща обработка и изходен процес.
влизам
За различните формати на изображения има различни формати за съхранение и различни методи за компресиране.В момента има OpenCV, CxImage и др.
Предварителна обработка – бинаризация
Повечето от снимките, направени с цифрови фотоапарати днес, са цветни изображения, които съдържат огромно количество информация и не са подходящи за OCR технология.
За съдържанието на картината можем просто да я разделим на преден и заден план.За да направим компютъра по-бърз и да изпълнява по-добре изчисления, свързани с OCR, трябва първо да обработим цветното изображение, така че в картината да остане само информацията на преден план и информацията на фона.Бинаризацията може да се разбира просто като „черно и бяло“.
намаляване на шума в изображението
За различните изображения дефиницията на шума може да е различна и процесът на премахване на шума според характеристиките на шума се нарича намаляване на шума.
корекция на наклона
Тъй като обикновените потребители, когато правят снимки на документи, е трудно да снимат напълно в съответствие с хоризонтално и вертикално подравняване, така че направените снимки неизбежно ще бъдат изкривени, което изисква софтуер за обработка на изображения за коригиране.
Междинна обработка – анализ на оформлението
Процесът на разделяне на изображения на документ на абзаци и разклонения се нарича анализ на оформлението.Поради разнообразието и сложността на действителните документи, тази стъпка все още трябва да бъде оптимизирана.
изрязване на символи
Поради ограниченията на условията за снимане и писане, знаците често се залепват и химикалките се счупват.Директното използване на такива изображения за OCR анализ значително ще ограничи производителността на OCR.Следователно е необходимо сегментиране на знаци, тоест отделяне на различни знаци.
Разпознаване на знаци
В ранния етап се използва главно съвпадение на шаблони, а в по-късния етап се използва основно извличане на характеристики.Поради влиянието на фактори като изместване на текста, дебелина на щриха, счупена писалка, адхезия, въртене и т.н., трудността при извличане на характеристики е силно засегната.
Възстановяване на оформлението
Хората се надяват, че разпознатият текст все още е подреден като оригиналната картина на документа и абзаците, позициите и редът се извеждат в документи на Word, PDF документи и т.н., и този процес се нарича възстановяване на оформлението.
последваща обработка
Според връзката на конкретен езиков контекст, резултатът от разпознаването се коригира.
изход
Изведете разпознатите знаци като текст в определен формат.
Какви са приложенията на ръчните терминали, базирани на технологията OCR?
Чрез ръчния терминал PDA, зареден със софтуер за разпознаване на символи OCR, могат да се реализират много приложения за сцени, като: разпознаване на регистрационни табели на автомобили, разпознаване на номера на контейнери, разпознаване на етикети с тегло на внесено говеждо и овнешко месо, разпознаване на машинно четими зони на паспорти, разпознаване на показанията на електромери , стоманена намотка Разпознаване на пръскани знаци.
Време на публикуване: 16 ноември 2022 г