Que é a tecnoloxía OCR?
Recoñecemento óptico de caracteres (en inglés: Optical Character Recognition, OCR) refírese ao proceso de análise e recoñecemento de ficheiros de imaxe de materiais de texto para obter información de texto e deseño.
Semellante ao recoñecemento de imaxes e á tecnoloxía de visión artificial, o proceso de procesamento da tecnoloxía OCR tamén se divide en procesos de entrada, pre-procesamento, procesamento a medio prazo, post-procesamento e saída.
entrar
Para os diferentes formatos de imaxe, hai diferentes formatos de almacenamento e diferentes métodos de compresión.Actualmente, existen OpenCV, CxImage, etc.
Pre-procesamento – binarización
A maioría das imaxes tomadas polas cámaras dixitais hoxe en día son imaxes en cor, que conteñen unha gran cantidade de información e non son aptas para a tecnoloxía OCR.
Para o contido da imaxe, podemos simplemente dividilo en primeiro plano e fondo.Para que o ordenador sexa máis rápido e realice mellor os cálculos relacionados con OCR, primeiro necesitamos procesar a imaxe en cor, de modo que só quede na imaxe a información en primeiro plano e a información de fondo.A binarización tamén se pode entender simplemente como "branco e negro".
redución de ruído da imaxe
Para diferentes imaxes, a definición de ruído pode ser diferente e o proceso de eliminación de ruído segundo as características do ruído chámase redución de ruído.
corrección de inclinación
Debido a que os usuarios normais, ao tomar fotos de documentos, é difícil disparar completamente en liña coa aliñación horizontal e vertical, polo que as imaxes tomadas inevitablemente estarán sesgadas, o que require un software de procesamento de imaxes para corrixir.
Procesamento a medio prazo: análise do deseño
O proceso de dividir imaxes de documentos en parágrafos e ramas chámase análise de deseño.Debido á diversidade e complexidade dos documentos reais, este paso aínda debe ser optimizado.
corte de personaxes
Debido ás limitacións das condicións de fotografía e escritura, os personaxes adoitan quedar atrapados e os bolígrafos están rotos.O uso directo deste tipo de imaxes para a análise de OCR limitará moito o rendemento de OCR.Polo tanto, é necesaria a segmentación de caracteres, é dicir, separar os distintos personaxes.
Recoñecemento de personaxes
Na fase inicial, utilizouse principalmente a coincidencia de modelos e, na fase posterior, utilizouse principalmente a extracción de características.Debido á influencia de factores como o desprazamento do texto, o grosor do trazo, a pluma rota, a adhesión, a rotación, etc., a dificultade de extracción de características vese moi afectada.
Restauración de maquetación
A xente espera que o texto recoñecido aínda estea disposto como a imaxe do documento orixinal e que os parágrafos, posicións e orde saian a documentos de Word, documentos PDF, etc., e este proceso chámase restauración do deseño.
post-procesamento
Segundo a relación do contexto lingüístico específico, o resultado do recoñecemento corríxese.
saída
Sae os caracteres recoñecidos como texto nun determinado formato.
Cales son as aplicacións dos terminais portátiles baseados na tecnoloxía OCR?
A través do terminal portátil PDA cargado con software de recoñecemento de caracteres OCR, pódense realizar moitas aplicacións de escenas, como: recoñecemento de matrículas de coches, recoñecemento de número de contedores, recoñecemento de etiquetas de peso de carne e carne de carneiro importados, recoñecemento de áreas lexibles por máquina de pasaportes, recoñecemento de lectura de contadores eléctricos. , bobina de aceiro Recoñecemento de caracteres pulverizados.
Hora de publicación: 16-novembro-2022