OCR தொழில்நுட்பம் என்றால் என்ன?
ஒளியியல் எழுத்து அங்கீகாரம் (ஆங்கிலம்: Optical Character Recognition, OCR) என்பது உரை மற்றும் தளவமைப்புத் தகவலைப் பெற உரைப் பொருட்களின் படக் கோப்புகளை பகுப்பாய்வு செய்து அங்கீகரிக்கும் செயல்முறையைக் குறிக்கிறது.
பட அங்கீகாரம் மற்றும் இயந்திர பார்வை தொழில்நுட்பத்தைப் போலவே, OCR தொழில்நுட்பத்தின் செயலாக்க செயல்முறையும் உள்ளீடு, முன் செயலாக்கம், இடைக்கால செயலாக்கம், பிந்தைய செயலாக்கம் மற்றும் வெளியீட்டு செயல்முறை என பிரிக்கப்பட்டுள்ளது.
நுழைய
வெவ்வேறு பட வடிவங்களுக்கு, வெவ்வேறு சேமிப்பக வடிவங்கள் மற்றும் வெவ்வேறு சுருக்க முறைகள் உள்ளன.தற்போது, OpenCV, CxImage போன்றவை உள்ளன.
முன் செயலாக்கம் - இருமைப்படுத்தல்
இன்று டிஜிட்டல் கேமராக்களால் எடுக்கப்படும் பெரும்பாலான படங்கள் வண்ணப் படங்களாகும், அவை பெரிய அளவிலான தகவல்களைக் கொண்டிருக்கின்றன மற்றும் OCR தொழில்நுட்பத்திற்கு ஏற்றவை அல்ல.
படத்தின் உள்ளடக்கத்தைப் பொறுத்தவரை, நாம் அதை முன்புறம் மற்றும் பின்னணியாகப் பிரிக்கலாம்.கணினியை வேகமாகவும் சிறப்பாகவும் OCR தொடர்பான கணக்கீடுகளைச் செய்ய, நாம் முதலில் வண்ணப் படத்தைச் செயலாக்க வேண்டும், இதனால் முன்புறத் தகவல் மற்றும் பின்னணித் தகவல்கள் மட்டுமே படத்தில் இருக்கும்.இருமைப்படுத்தல் என்பது "கருப்பு மற்றும் வெள்ளை" என்றும் எளிமையாகப் புரிந்து கொள்ளலாம்.
பட இரைச்சல் குறைப்பு
வெவ்வேறு படங்களுக்கு, சத்தத்தின் வரையறை வேறுபட்டிருக்கலாம், மேலும் இரைச்சலின் சிறப்பியல்புகளின்படி denoising செயல்முறை சத்தம் குறைப்பு என்று அழைக்கப்படுகிறது.
சாய்வு திருத்தம்
சாதாரண பயனர்கள், ஆவணங்களின் படங்களை எடுக்கும்போது, கிடைமட்ட மற்றும் செங்குத்து சீரமைப்புக்கு ஏற்ப முழுமையாக சுடுவது கடினம், எனவே எடுக்கப்பட்ட படங்கள் தவிர்க்க முடியாமல் வளைந்துவிடும், இதற்கு பட செயலாக்க மென்பொருள் தேவை.
இடைக்கால செயலாக்கம் - தளவமைப்பு பகுப்பாய்வு
ஆவணப் படங்களை பத்திகளாகவும் கிளைகளாகவும் பிரிக்கும் செயல்முறை லேஅவுட் பகுப்பாய்வு எனப்படும்.உண்மையான ஆவணங்களின் பன்முகத்தன்மை மற்றும் சிக்கலான தன்மை காரணமாக, இந்த படி இன்னும் மேம்படுத்தப்பட வேண்டும்.
பாத்திரம் வெட்டுதல்
புகைப்படம் எடுத்தல் மற்றும் எழுதும் நிலைமைகளின் வரம்புகள் காரணமாக, எழுத்துக்கள் அடிக்கடி சிக்கி, பேனாக்கள் உடைக்கப்படுகின்றன.OCR பகுப்பாய்விற்கு இத்தகைய படங்களை நேரடியாகப் பயன்படுத்துவது OCR செயல்திறனைப் பெரிதும் கட்டுப்படுத்தும்.எனவே, எழுத்துப் பிரிவு தேவை, அதாவது வெவ்வேறு எழுத்துக்களைப் பிரிக்க.
பாத்திரம் அங்கீகாரம்
ஆரம்ப கட்டத்தில், டெம்ப்ளேட் பொருத்தம் முக்கியமாகப் பயன்படுத்தப்பட்டது, மேலும் பிந்தைய கட்டத்தில், அம்சம் பிரித்தெடுத்தல் முக்கியமாகப் பயன்படுத்தப்பட்டது.உரை இடப்பெயர்ச்சி, பக்கவாதம் தடிமன், உடைந்த பேனா, ஒட்டுதல், சுழற்சி போன்ற காரணிகளின் செல்வாக்கின் காரணமாக, அம்சம் பிரித்தெடுப்பதில் சிரமம் பெரிதும் பாதிக்கப்படுகிறது.
தளவமைப்பு மறுசீரமைப்பு
அங்கீகரிக்கப்பட்ட உரை இன்னும் அசல் ஆவணப் படத்தைப் போலவே அமைக்கப்பட்டிருக்கும் என்று மக்கள் நம்புகிறார்கள், மேலும் பத்திகள், நிலைகள் மற்றும் ஒழுங்கு ஆகியவை Word ஆவணங்கள், PDF ஆவணங்கள் போன்றவற்றுக்கு வெளியீடு ஆகும், மேலும் இந்த செயல்முறை லேஅவுட் மறுசீரமைப்பு என்று அழைக்கப்படுகிறது.
பின் செயலாக்க
குறிப்பிட்ட மொழி சூழலின் உறவின் படி, அங்கீகார முடிவு சரி செய்யப்படுகிறது.
வெளியீடு
அங்கீகரிக்கப்பட்ட எழுத்துக்களை ஒரு குறிப்பிட்ட வடிவத்தில் உரையாக வெளியிடவும்.
OCR தொழில்நுட்பத்தின் அடிப்படையில் கையடக்க டெர்மினல்களின் பயன்பாடுகள் என்ன?
OCR எழுத்து அங்கீகார மென்பொருளுடன் ஏற்றப்பட்ட கையடக்க முனைய PDA மூலம், பல காட்சி பயன்பாடுகளை உணர முடியும், அதாவது: கார் உரிமத் தகடு அங்கீகாரம், கொள்கலன் எண் அங்கீகாரம், இறக்குமதி செய்யப்பட்ட மாட்டிறைச்சி மற்றும் ஆட்டிறைச்சி எடை லேபிள் அங்கீகாரம், பாஸ்போர்ட் இயந்திரம் படிக்கக்கூடிய பகுதி அங்கீகாரம், மின்சார மீட்டர் வாசிப்பு அங்கீகாரம். , எஃகு சுருள் தெளிக்கப்பட்ட எழுத்துக்களின் அங்கீகாரம்.
இடுகை நேரம்: நவம்பர்-16-2022