+ ८६-७५५-२९०३१८८३

ओसीआर हँडहेल्ड टर्मिनल पीडीए फंक्शनचे अनुप्रयोग काय आहेत?

OCR तंत्रज्ञान म्हणजे काय?

ऑप्टिकल कॅरेक्टर रिकग्निशन (इंग्रजी: Optical Character Recognition, OCR) मजकूर आणि मांडणी माहिती मिळविण्यासाठी मजकूर सामग्रीच्या प्रतिमा फाइल्सचे विश्लेषण आणि ओळखण्याच्या प्रक्रियेस संदर्भित करते.

इमेज रेकग्निशन आणि मशीन व्हिजन तंत्रज्ञानाप्रमाणेच, OCR तंत्रज्ञानाची प्रक्रिया प्रक्रिया देखील इनपुट, प्री-प्रोसेसिंग, मिड-टर्म प्रोसेसिंग, पोस्ट-प्रोसेसिंग आणि आउटपुट प्रक्रियांमध्ये विभागली गेली आहे.

प्रविष्ट करा
वेगवेगळ्या इमेज फॉरमॅटसाठी, वेगवेगळे स्टोरेज फॉरमॅट आणि वेगवेगळ्या कॉम्प्रेशन पद्धती आहेत.सध्या, OpenCV, CxImage इ. आहेत.

प्री-प्रोसेसिंग - बायनरायझेशन

आज डिजिटल कॅमेर्‍याने काढलेली बहुतेक चित्रे ही रंगीत प्रतिमा आहेत, ज्यात मोठ्या प्रमाणात माहिती आहे आणि ती OCR तंत्रज्ञानासाठी योग्य नाही.

चित्राच्या सामग्रीसाठी, आम्ही ते फक्त अग्रभाग आणि पार्श्वभूमीमध्ये विभागू शकतो.संगणकाला वेगवान बनवण्यासाठी आणि OCR संबंधित गणिते अधिक चांगल्या प्रकारे पार पाडण्यासाठी, आम्हाला प्रथम रंगीत प्रतिमेवर प्रक्रिया करणे आवश्यक आहे, जेणेकरुन चित्रात फक्त अग्रभाग माहिती आणि पार्श्वभूमी माहिती राहील.बायनरायझेशनला "काळा आणि पांढरा" म्हणून देखील समजले जाऊ शकते.

प्रतिमा आवाज कमी करणे
वेगवेगळ्या प्रतिमांसाठी, आवाजाची व्याख्या भिन्न असू शकते आणि आवाजाच्या वैशिष्ट्यांनुसार कमी करण्याच्या प्रक्रियेला आवाज कमी करणे म्हणतात.

झुकाव सुधारणा
कारण सामान्य वापरकर्ते, दस्तऐवजांची छायाचित्रे घेत असताना, क्षैतिज आणि उभ्या संरेखनानुसार पूर्णपणे शूट करणे कठीण आहे, म्हणून घेतलेली चित्रे अपरिहार्यपणे विस्कळीत होतील, ज्यास दुरुस्त करण्यासाठी प्रतिमा प्रक्रिया सॉफ्टवेअरची आवश्यकता आहे.

मिड-टर्म प्रोसेसिंग - लेआउट विश्लेषण
दस्तऐवज चित्रे परिच्छेद आणि शाखांमध्ये विभाजित करण्याच्या प्रक्रियेस लेआउट विश्लेषण म्हणतात.वास्तविक दस्तऐवजांच्या विविधतेमुळे आणि जटिलतेमुळे, ही पायरी अद्याप ऑप्टिमाइझ करणे आवश्यक आहे.

वर्ण कटिंग
छायाचित्रण आणि लेखन परिस्थितीच्या मर्यादांमुळे, अक्षरे अनेकदा अडकतात आणि पेन तुटतात.OCR विश्लेषणासाठी अशा प्रतिमांचा थेट वापर केल्याने OCR कार्यप्रदर्शन मोठ्या प्रमाणात मर्यादित होईल.म्हणून, वर्ण विभाजन आवश्यक आहे, म्हणजे, भिन्न वर्ण वेगळे करणे.

वर्ण ओळख
सुरुवातीच्या टप्प्यात, टेम्पलेट जुळणी प्रामुख्याने वापरली जात होती, आणि नंतरच्या टप्प्यात, वैशिष्ट्य काढणे प्रामुख्याने वापरले गेले.मजकूर विस्थापन, स्ट्रोक जाडी, तुटलेली पेन, आसंजन, रोटेशन इत्यादी घटकांच्या प्रभावामुळे, वैशिष्ट्य काढण्याच्या अडचणीवर मोठ्या प्रमाणात परिणाम होतो.

लेआउट जीर्णोद्धार
लोकांना आशा आहे की मान्यताप्राप्त मजकूर अद्याप मूळ दस्तऐवज चित्राप्रमाणेच व्यवस्थित केला गेला आहे आणि परिच्छेद, स्थान आणि क्रम हे Word दस्तऐवज, PDF दस्तऐवज इ.चे आउटपुट आहेत आणि या प्रक्रियेला लेआउट पुनर्संचयित म्हणतात.

पोस्ट प्रक्रिया
विशिष्ट भाषेच्या संदर्भाच्या संबंधानुसार, ओळख परिणाम दुरुस्त केला जातो.

आउटपुट
एका विशिष्ट स्वरूपात मजकूर म्हणून ओळखले जाणारे वर्ण आउटपुट करा.

ओसीआर तंत्रज्ञानावर आधारित हँडहेल्ड टर्मिनल्सचे अनुप्रयोग काय आहेत?

ओसीआर कॅरेक्टर रेकग्निशन सॉफ्टवेअरसह लोड केलेल्या हँडहेल्ड टर्मिनल पीडीएद्वारे, अनेक सीन अॅप्लिकेशन्स साकारता येतात, जसे की: कार लायसन्स प्लेट ओळख, कंटेनर क्रमांक ओळख, आयात केलेले बीफ आणि मटण वजन लेबल ओळख, पासपोर्ट मशीन-वाचनीय क्षेत्र ओळख, इलेक्ट्रिक मीटर वाचन ओळख , स्टील कॉइल फवारलेल्या वर्णांची ओळख.


पोस्ट वेळ: नोव्हेंबर-16-2022
व्हॉट्सअॅप ऑनलाइन गप्पा!