¿Qué es la tecnología OCR?
El reconocimiento óptico de caracteres (en inglés: Optical Character Recognition, OCR) se refiere al proceso de análisis y reconocimiento de archivos de imágenes de materiales de texto para obtener información de texto y diseño.
Al igual que la tecnología de reconocimiento de imágenes y visión artificial, el proceso de procesamiento de la tecnología OCR también se divide en entrada, preprocesamiento, procesamiento a medio plazo, posprocesamiento y proceso de salida.
ingresar
Para diferentes formatos de imagen, existen diferentes formatos de almacenamiento y diferentes métodos de compresión.Actualmente existen OpenCV, CxImage, etc.
Preprocesamiento – binarización
La mayoría de las imágenes que toman las cámaras digitales en la actualidad son imágenes en color, que contienen una gran cantidad de información y no son adecuadas para la tecnología OCR.
Para el contenido de la imagen, simplemente podemos dividirla en primer plano y fondo.Para que la computadora sea más rápida y realice mejor los cálculos relacionados con OCR, primero debemos procesar la imagen en color, de modo que solo la información de primer plano y la información de fondo permanezcan en la imagen.La binarización también puede entenderse simplemente como "blanco y negro".
reducción de ruido de imagen
Para diferentes imágenes, la definición de ruido puede ser diferente, y el proceso de eliminación de ruido según las características del ruido se denomina reducción de ruido.
corrección de inclinación
Debido a que los usuarios comunes, cuando toman fotografías de documentos, es difícil disparar completamente en línea con la alineación horizontal y vertical, por lo que las imágenes tomadas inevitablemente estarán sesgadas, lo que requiere que el software de procesamiento de imágenes las corrija.
Procesamiento a medio plazo: análisis de diseño
El proceso de dividir imágenes de documentos en párrafos y ramas se denomina análisis de diseño.Debido a la diversidad y complejidad de los documentos reales, este paso aún debe optimizarse.
corte de personajes
Debido a las limitaciones de las condiciones de fotografía y escritura, los caracteres a menudo se atascan y los bolígrafos se rompen.El uso directo de tales imágenes para el análisis de OCR limitará en gran medida el rendimiento de OCR.Por lo tanto, se requiere la segmentación de caracteres, es decir, separar diferentes caracteres.
Reconocimiento de caracteres
En la etapa inicial, se utilizó principalmente la coincidencia de plantillas y, en la etapa posterior, se utilizó principalmente la extracción de características.Debido a la influencia de factores como el desplazamiento del texto, el grosor del trazo, la pluma rota, la adhesión, la rotación, etc., la dificultad de extracción de características se ve muy afectada.
Restauración de diseño
La gente espera que el texto reconocido todavía esté organizado como la imagen del documento original, y que los párrafos, las posiciones y el orden se envíen a documentos de Word, documentos PDF, etc., y este proceso se denomina restauración del diseño.
Postprocesamiento
Según la relación del contexto lingüístico específico, se corrige el resultado del reconocimiento.
producción
Muestra los caracteres reconocidos como texto en un formato determinado.
¿Cuáles son las aplicaciones de los terminales portátiles basados en tecnología OCR?
A través del terminal de mano PDA cargado con el software de reconocimiento de caracteres OCR, se pueden realizar muchas aplicaciones de escena, tales como: reconocimiento de matrículas de automóviles, reconocimiento de números de contenedores, reconocimiento de etiquetas de peso de carne de res y cordero importadas, reconocimiento de área legible por máquina de pasaporte, reconocimiento de lectura de medidor eléctrico , bobina de acero Reconocimiento de caracteres rociados.
Hora de publicación: 16-nov-2022