+ 86-755-29031883

OCR 핸드 헬드 터미널 PDA 기능의 응용 프로그램은 무엇입니까?

OCR 기술이란?

광학문자인식(영어: Optical Character Recognition, OCR)은 텍스트 및 레이아웃 정보를 얻기 위해 텍스트 자료의 이미지 파일을 분석하고 인식하는 프로세스를 말합니다.

이미지 인식 및 머신 비전 기술과 유사하게 OCR 기술의 처리 프로세스도 입력, 전처리, 중간 처리, 후처리 및 출력 프로세스로 나뉩니다.

입력하다
다른 이미지 형식의 경우 다른 저장 형식과 다른 압축 방법이 있습니다.현재 OpenCV, CxImage 등이 있습니다.

전처리 – 이진화

오늘날 디지털 카메라로 촬영하는 대부분의 사진은 컬러 이미지로 엄청난 양의 정보를 포함하고 있어 OCR 기술에 적합하지 않습니다.

그림의 내용은 단순히 전경과 배경으로 나눌 수 있습니다.컴퓨터가 더 빠르고 OCR 관련 계산을 더 잘 수행하도록 하려면 전경 정보와 배경 정보만 사진에 남도록 컬러 이미지를 먼저 처리해야 합니다.이진화는 단순히 "흑백"으로 이해될 수도 있습니다.

이미지 노이즈 감소
영상마다 노이즈의 정의가 다를 수 있으며, 노이즈의 특성에 따라 노이즈를 제거하는 과정을 노이즈 감소라고 합니다.

기울기 보정
왜냐하면 일반 사용자들은 문서 사진을 찍을 때 수평과 수직 정렬에 완전히 맞춰서 촬영하기가 어려우므로 촬영된 사진은 필연적으로 기울어질 수밖에 없기 때문에 보정을 위한 이미지 처리 소프트웨어가 필요합니다.

중기처리 – 레이아웃 분석
문서 그림을 단락과 가지로 나누는 과정을 레이아웃 분석이라고 합니다.실제 문서의 다양성과 복잡성으로 인해 이 단계는 여전히 최적화되어야 합니다.

문자 절단
사진과 글을 쓰는 여건의 한계로 인해 글자가 끼고 펜이 부러지는 경우가 많다.OCR 분석에 이러한 이미지를 직접 사용하면 OCR 성능이 크게 제한됩니다.따라서 문자 분할, 즉 서로 다른 문자를 구분하는 작업이 필요합니다.

문자 인식
초기에는 템플릿 매칭이 주로 사용되었고, 후기에는 특징 추출이 주로 사용되었다.텍스트 변위, 획 굵기, 펜 부러짐, 접착력, 회전 등의 요인의 영향으로 특징 추출 난이도가 크게 영향을 받습니다.

레이아웃 복원
사람들은 인식된 텍스트가 여전히 원본 문서 그림처럼 정렬되고 단락, 위치 및 순서가 Word 문서, PDF 문서 등으로 출력되기를 희망하며 이 과정을 레이아웃 복원이라고 합니다.

사후 처리
특정 언어 컨텍스트의 관계에 따라 인식 결과가 수정됩니다.

산출
인식된 문자를 특정 형식의 텍스트로 출력합니다.

OCR 기술을 기반으로 한 핸드헬드 단말기의 응용 프로그램은 무엇입니까?

OCR 문자 인식 소프트웨어가 탑재된 핸드헬드 단말기 PDA를 통해 자동차 번호판 인식, 컨테이너 번호 인식, 수입 쇠고기 및 양고기 무게 라벨 인식, 여권 기계 판독 영역 인식, 전기 계량기 판독 인식과 같은 많은 장면 응용 프로그램을 실현할 수 있습니다. , 스틸 코일 스프레이 문자 인식.


게시 시간: 2022년 11월 16일
WhatsApp 온라인 채팅!