+ 86-755-29031883

OCR கையடக்க டெர்மினல் PDA செயல்பாட்டின் பயன்பாடுகள் என்ன?

OCR தொழில்நுட்பம் என்றால் என்ன?

ஒளியியல் எழுத்து அங்கீகாரம் (ஆங்கிலம்: Optical Character Recognition, OCR) என்பது உரை மற்றும் தளவமைப்புத் தகவலைப் பெற உரைப் பொருட்களின் படக் கோப்புகளை பகுப்பாய்வு செய்து அங்கீகரிக்கும் செயல்முறையைக் குறிக்கிறது.

பட அங்கீகாரம் மற்றும் இயந்திர பார்வை தொழில்நுட்பத்தைப் போலவே, OCR தொழில்நுட்பத்தின் செயலாக்க செயல்முறையும் உள்ளீடு, முன் செயலாக்கம், இடைக்கால செயலாக்கம், பிந்தைய செயலாக்கம் மற்றும் வெளியீட்டு செயல்முறை என பிரிக்கப்பட்டுள்ளது.

நுழைய
வெவ்வேறு பட வடிவங்களுக்கு, வெவ்வேறு சேமிப்பக வடிவங்கள் மற்றும் வெவ்வேறு சுருக்க முறைகள் உள்ளன.தற்போது, ​​OpenCV, CxImage போன்றவை உள்ளன.

முன் செயலாக்கம் - இருமைப்படுத்தல்

இன்று டிஜிட்டல் கேமராக்களால் எடுக்கப்படும் பெரும்பாலான படங்கள் வண்ணப் படங்களாகும், அவை பெரிய அளவிலான தகவல்களைக் கொண்டிருக்கின்றன மற்றும் OCR தொழில்நுட்பத்திற்கு ஏற்றவை அல்ல.

படத்தின் உள்ளடக்கத்தைப் பொறுத்தவரை, நாம் அதை முன்புறம் மற்றும் பின்னணியாகப் பிரிக்கலாம்.கணினியை வேகமாகவும் சிறப்பாகவும் OCR தொடர்பான கணக்கீடுகளைச் செய்ய, நாம் முதலில் வண்ணப் படத்தைச் செயலாக்க வேண்டும், இதனால் முன்புறத் தகவல் மற்றும் பின்னணித் தகவல்கள் மட்டுமே படத்தில் இருக்கும்.இருமைப்படுத்தல் என்பது "கருப்பு மற்றும் வெள்ளை" என்றும் எளிமையாகப் புரிந்து கொள்ளலாம்.

பட இரைச்சல் குறைப்பு
வெவ்வேறு படங்களுக்கு, சத்தத்தின் வரையறை வேறுபட்டிருக்கலாம், மேலும் இரைச்சலின் சிறப்பியல்புகளின்படி denoising செயல்முறை சத்தம் குறைப்பு என்று அழைக்கப்படுகிறது.

சாய்வு திருத்தம்
சாதாரண பயனர்கள், ஆவணங்களின் படங்களை எடுக்கும்போது, ​​கிடைமட்ட மற்றும் செங்குத்து சீரமைப்புக்கு ஏற்ப முழுமையாக சுடுவது கடினம், எனவே எடுக்கப்பட்ட படங்கள் தவிர்க்க முடியாமல் வளைந்துவிடும், இதற்கு பட செயலாக்க மென்பொருள் தேவை.

இடைக்கால செயலாக்கம் - தளவமைப்பு பகுப்பாய்வு
ஆவணப் படங்களை பத்திகளாகவும் கிளைகளாகவும் பிரிக்கும் செயல்முறை லேஅவுட் பகுப்பாய்வு எனப்படும்.உண்மையான ஆவணங்களின் பன்முகத்தன்மை மற்றும் சிக்கலான தன்மை காரணமாக, இந்த படி இன்னும் மேம்படுத்தப்பட வேண்டும்.

பாத்திரம் வெட்டுதல்
புகைப்படம் எடுத்தல் மற்றும் எழுதும் நிலைமைகளின் வரம்புகள் காரணமாக, எழுத்துக்கள் அடிக்கடி சிக்கி, பேனாக்கள் உடைக்கப்படுகின்றன.OCR பகுப்பாய்விற்கு இத்தகைய படங்களை நேரடியாகப் பயன்படுத்துவது OCR செயல்திறனைப் பெரிதும் கட்டுப்படுத்தும்.எனவே, எழுத்துப் பிரிவு தேவை, அதாவது வெவ்வேறு எழுத்துக்களைப் பிரிக்க.

பாத்திரம் அங்கீகாரம்
ஆரம்ப கட்டத்தில், டெம்ப்ளேட் பொருத்தம் முக்கியமாகப் பயன்படுத்தப்பட்டது, மேலும் பிந்தைய கட்டத்தில், அம்சம் பிரித்தெடுத்தல் முக்கியமாகப் பயன்படுத்தப்பட்டது.உரை இடப்பெயர்ச்சி, பக்கவாதம் தடிமன், உடைந்த பேனா, ஒட்டுதல், சுழற்சி போன்ற காரணிகளின் செல்வாக்கின் காரணமாக, அம்சம் பிரித்தெடுப்பதில் சிரமம் பெரிதும் பாதிக்கப்படுகிறது.

தளவமைப்பு மறுசீரமைப்பு
அங்கீகரிக்கப்பட்ட உரை இன்னும் அசல் ஆவணப் படத்தைப் போலவே அமைக்கப்பட்டிருக்கும் என்று மக்கள் நம்புகிறார்கள், மேலும் பத்திகள், நிலைகள் மற்றும் ஒழுங்கு ஆகியவை Word ஆவணங்கள், PDF ஆவணங்கள் போன்றவற்றுக்கு வெளியீடு ஆகும், மேலும் இந்த செயல்முறை லேஅவுட் மறுசீரமைப்பு என்று அழைக்கப்படுகிறது.

பின் செயலாக்க
குறிப்பிட்ட மொழி சூழலின் உறவின் படி, அங்கீகார முடிவு சரி செய்யப்படுகிறது.

வெளியீடு
அங்கீகரிக்கப்பட்ட எழுத்துக்களை ஒரு குறிப்பிட்ட வடிவத்தில் உரையாக வெளியிடவும்.

OCR தொழில்நுட்பத்தின் அடிப்படையில் கையடக்க டெர்மினல்களின் பயன்பாடுகள் என்ன?

OCR எழுத்து அங்கீகார மென்பொருளுடன் ஏற்றப்பட்ட கையடக்க முனைய PDA மூலம், பல காட்சி பயன்பாடுகளை உணர முடியும், அதாவது: கார் உரிமத் தகடு அங்கீகாரம், கொள்கலன் எண் அங்கீகாரம், இறக்குமதி செய்யப்பட்ட மாட்டிறைச்சி மற்றும் ஆட்டிறைச்சி எடை லேபிள் அங்கீகாரம், பாஸ்போர்ட் இயந்திரம் படிக்கக்கூடிய பகுதி அங்கீகாரம், மின்சார மீட்டர் வாசிப்பு அங்கீகாரம். , எஃகு சுருள் தெளிக்கப்பட்ட எழுத்துக்களின் அங்கீகாரம்.


இடுகை நேரம்: நவம்பர்-16-2022
வாட்ஸ்அப் ஆன்லைன் அரட்டை!