+ 86-755-29031883

OCR кол терминалынын PDA функциясынын кандай колдонмолору бар?

OCR технологиясы деген эмне?

Optical Character Recognition (англисче: Optical Character Recognition, OCR) текст жана жайгашуу маалыматын алуу үчүн тексттик материалдардын сүрөт файлдарын талдоо жана таануу процессин билдирет.

Сүрөттөрдү таануу жана машина көрүү технологиясына окшош, OCR технологиясын иштетүү процесси да киргизүү, алдын ала иштетүү, орто мөөнөттүү иштетүү, кийинки иштетүү жана чыгаруу процессине бөлүнөт.

кирүү
Ар кандай сүрөт форматтары үчүн ар кандай сактоо форматтары жана ар кандай кысуу ыкмалары бар.Учурда OpenCV, CxImage ж.б.

Алдын ала иштетүү – бинаризация

Бүгүнкү күндө санариптик камералар тарабынан тартылган сүрөттөрдүн көбү түстүү сүрөттөр, алар өтө чоң көлөмдөгү маалыматты камтыйт жана OCR технологиясына ылайыктуу эмес.

Сүрөттүн мазмуну үчүн аны жөн гана алдыңкы планга жана фонго бөлсөк болот.Компьютерди тезирээк жана OCR менен байланышкан эсептөөлөрдү жакшыраак аткаруу үчүн, биз алгач түстүү сүрөттү иштеп чыгышыбыз керек, андыктан сүрөттө алдыңкы пландагы маалымат жана фондо маалымат гана калат.Binarization да жөн эле "ак жана кара" деп түшүнүүгө болот.

сүрөттүн ызы-чуусун азайтуу
Ар кандай сүрөттөр үчүн ызы-чуунун аныктамасы ар кандай болушу мүмкүн, ызы-чуунун өзгөчөлүктөрүнө жараша деноиздөө процесси ызы-чууларды азайтуу деп аталат.

кыйшаюу оңдоо
Анткени карапайым колдонуучулар документтерди сүрөткө тартып жатканда горизонталдык жана вертикалдуу тегиздөө менен толук шайкеш келтирүү кыйынга турат, андыктан тартылган сүрөттөр сөзсүз кыйгач болуп калат, бул оңдоо үчүн сүрөттү иштетүүчү программалык камсыздоону талап кылат.

Орто мөөнөттүү иштетүү - макет талдоо
Документтин сүрөттөрүн абзацтарга жана бутактарга бөлүү процесси макет анализи деп аталат.Иш жүзүндөгү документтердин көп түрдүүлүгүнө жана татаалдыгына байланыштуу бул кадам дагы эле оптималдаштырылышы керек.

каарман кесүү
Сүрөткө тартуунун жана жазуу шарттарынын чектелүүсүнөн улам каармандар тыгылып, калемдери сынып калат.Түздөн-түз OCR талдоо үчүн мындай сүрөттөрдү колдонуу OCR аткарууну абдан чектейт.Ошондуктан, тамгаларды сегментациялоо, башкача айтканда, ар кандай белгилерди бөлүү талап кылынат.

Каармандарды таануу
Алгачкы этапта негизинен шаблонду далдаштыруу, ал эми кийинки этапта өзгөчөлүктөрдү алуу негизинен колдонулган.Тексттин жылышы, штрих калыңдыгы, сынган калем, адгезия, айлануу ж.

Макетти калыбына келтирүү
Адамдар таанылган текст дагы деле баштапкы документтин сүрөтүндөй жайгаштырылып, абзацтар, позициялар жана тартип Word документтерине, PDF документтерине ж.б. чыгарылат деп үмүттөнүшөт жана бул процесс макетти калыбына келтирүү деп аталат.

кийинки иштетүү
Конкреттүү тилдик контексттин байланышына ылайык таануунун натыйжасы оңдолот.

чыгаруу
Белгилүү бир форматта текст катары таанылган символдорду чыгарыңыз.

OCR технологиясына негизделген кол терминалдарынын кандай колдонулушу бар?

OCR тамгаларды таануу программасы жүктөлгөн кол терминалы PDA аркылуу көптөгөн сахналык тиркемелерди ишке ашырууга болот, мисалы: унаанын номерин таануу, контейнердин номерин таануу, импорттолгон уй жана койдун этинин салмагын таануу, паспорттун машина окуй турган аймакты таануу, электр эсептегичтин окуусун таануу , болот катушка чачылган белгилерди таануу.


Посттун убактысы: Ноябрь-16-2022
WhatsApp онлайн чат!