Что такое технология OCR?
Оптическое распознавание символов (англ. Optical Character Recognition, OCR) относится к процессу анализа и распознавания файлов изображений текстовых материалов для получения информации о тексте и макете.
Подобно технологии распознавания изображений и машинного зрения, процесс обработки технологии OCR также делится на процесс ввода, предварительной обработки, промежуточной обработки, постобработки и вывода.
входить
Для разных форматов изображений существуют разные форматы хранения и разные методы сжатия.В настоящее время существуют OpenCV, CxImage и т.д.
Предварительная обработка – бинаризация
Большинство снимков, сделанных сегодня цифровыми камерами, представляют собой цветные изображения, которые содержат огромное количество информации и не подходят для технологии OCR.
По содержанию изображения мы можем просто разделить его на передний план и фон.Чтобы компьютер быстрее и лучше выполнял вычисления, связанные с распознаванием символов, нам нужно сначала обработать цветное изображение, чтобы на изображении осталась только информация о переднем плане и информация о фоне.Бинаризация также может быть понята просто как «черно-белая».
шумоподавление изображения
Для разных изображений определение шума может быть разным, а процесс шумоподавления по характеристикам шума называется шумоподавлением.
коррекция наклона
Поскольку обычным пользователям при фотографировании документов сложно снимать полностью в соответствии с горизонтальным и вертикальным выравниванием, поэтому сделанные снимки неизбежно будут перекошены, для исправления которых требуется программное обеспечение для обработки изображений.
Среднесрочная обработка – анализ макета
Процесс разделения изображений документа на абзацы и ветви называется анализом макета.Из-за разнообразия и сложности фактических документов этот шаг все еще нуждается в оптимизации.
вырезание персонажей
Из-за ограничений условий фотографирования и письма символы часто застревают, а ручки ломаются.Непосредственное использование таких изображений для анализа OCR значительно ограничит производительность OCR.Поэтому требуется сегментация символов, то есть разделение разных символов.
Распознавание символов
На раннем этапе в основном использовалось сопоставление с шаблоном, а на более позднем этапе в основном использовалось извлечение признаков.Из-за влияния таких факторов, как смещение текста, толщина штриха, сломанное перо, слипание, вращение и т. д., сложность извлечения признаков сильно зависит.
Восстановление макета
Люди надеются, что распознанный текст по-прежнему упорядочен как исходное изображение документа, а абзацы, позиции и порядок выводятся в документы Word, PDF-документы и т. д., и этот процесс называется восстановлением макета.
Постобработка
В зависимости от связи конкретного языкового контекста корректируется результат распознавания.
выход
Вывод распознанных символов в виде текста в определенном формате.
Каковы области применения портативных терминалов на основе технологии OCR?
С помощью портативного терминала PDA, загруженного программным обеспечением для распознавания символов OCR, можно реализовать множество сценических приложений, таких как: распознавание номерных знаков автомобилей, распознавание номеров контейнеров, распознавание весовых этикеток импортной говядины и баранины, распознавание машиночитаемой области паспорта, распознавание показаний электросчетчика. , стальная катушка Распознавание напыленных символов.
Время публикации: 16 ноября 2022 г.