ओसीआर तकनीक क्या है?
ऑप्टिकल कैरेक्टर रिकॉग्निशन (अंग्रेजी: ऑप्टिकल कैरेक्टर रिकॉग्निशन, ओसीआर) टेक्स्ट और लेआउट जानकारी प्राप्त करने के लिए टेक्स्ट सामग्री की छवि फ़ाइलों का विश्लेषण और पहचानने की प्रक्रिया को संदर्भित करता है।
छवि पहचान और मशीन विजन प्रौद्योगिकी के समान, ओसीआर प्रौद्योगिकी की प्रसंस्करण प्रक्रिया को भी इनपुट, प्री-प्रोसेसिंग, मध्य-अवधि प्रसंस्करण, पोस्ट-प्रोसेसिंग और आउटपुट प्रक्रिया में विभाजित किया गया है।
प्रवेश करना
विभिन्न छवि प्रारूपों के लिए, अलग-अलग भंडारण प्रारूप और अलग-अलग संपीड़न विधियाँ हैं।वर्तमान में, OpenCV, CxImage इत्यादि हैं।
प्री-प्रोसेसिंग - बाइनराइजेशन
आज डिजिटल कैमरों द्वारा ली गई अधिकांश तस्वीरें रंगीन छवियां हैं, जिनमें भारी मात्रा में जानकारी होती है और वे ओसीआर तकनीक के लिए उपयुक्त नहीं हैं।
चित्र की सामग्री के लिए, हम इसे केवल अग्रभूमि और पृष्ठभूमि में विभाजित कर सकते हैं।कंप्यूटर को ओसीआर से संबंधित गणनाओं को तेज और बेहतर ढंग से निष्पादित करने के लिए, हमें पहले रंगीन छवि को संसाधित करने की आवश्यकता है, ताकि चित्र में केवल अग्रभूमि जानकारी और पृष्ठभूमि जानकारी ही रहे।बिनारीकरण को केवल "काले और सफेद" के रूप में भी समझा जा सकता है।
छवि शोर में कमी
अलग-अलग छवियों के लिए, शोर की परिभाषा अलग-अलग हो सकती है, और शोर की विशेषताओं के अनुसार शोर को कम करने की प्रक्रिया को शोर में कमी कहा जाता है।
झुकाव सुधार
क्योंकि सामान्य उपयोगकर्ताओं के लिए, दस्तावेज़ों की तस्वीरें लेते समय, क्षैतिज और ऊर्ध्वाधर संरेखण के साथ पूरी तरह से शूट करना मुश्किल होता है, इसलिए ली गई तस्वीरें अनिवार्य रूप से तिरछी होंगी, जिन्हें सही करने के लिए इमेज प्रोसेसिंग सॉफ़्टवेयर की आवश्यकता होती है।
मध्यावधि प्रसंस्करण - लेआउट विश्लेषण
दस्तावेज़ चित्रों को पैराग्राफ और शाखाओं में विभाजित करने की प्रक्रिया को लेआउट विश्लेषण कहा जाता है।वास्तविक दस्तावेज़ों की विविधता और जटिलता के कारण, इस चरण को अभी भी अनुकूलित करने की आवश्यकता है।
चरित्र काटना
फोटो खींचने और लिखने की शर्तों की सीमाओं के कारण, पात्र अक्सर अटक जाते हैं और कलम टूट जाते हैं।ओसीआर विश्लेषण के लिए ऐसी छवियों का सीधे उपयोग करने से ओसीआर प्रदर्शन काफी सीमित हो जाएगा।इसलिए, वर्ण विभाजन की आवश्यकता है, अर्थात, विभिन्न वर्णों को अलग करना।
चरित्र पहचान
प्रारंभिक चरण में, टेम्पलेट मिलान का मुख्य रूप से उपयोग किया गया था, और बाद के चरण में, फीचर निष्कर्षण का मुख्य रूप से उपयोग किया गया था।टेक्स्ट विस्थापन, स्ट्रोक की मोटाई, टूटा हुआ पेन, आसंजन, रोटेशन आदि जैसे कारकों के प्रभाव के कारण फीचर निष्कर्षण की कठिनाई बहुत प्रभावित होती है।
लेआउट बहाली
लोगों को उम्मीद है कि मान्यता प्राप्त पाठ अभी भी मूल दस्तावेज़ चित्र की तरह व्यवस्थित है, और पैराग्राफ, स्थिति और क्रम वर्ड दस्तावेज़ों, पीडीएफ दस्तावेज़ों आदि में आउटपुट हैं, और इस प्रक्रिया को लेआउट बहाली कहा जाता है।
प्रोसेसिंग के बाद
विशिष्ट भाषा संदर्भ के संबंध के अनुसार, मान्यता परिणाम को सही किया जाता है।
आउटपुट
पहचाने गए वर्णों को एक निश्चित प्रारूप में टेक्स्ट के रूप में आउटपुट करें।
ओसीआर प्रौद्योगिकी पर आधारित हैंडहेल्ड टर्मिनलों के अनुप्रयोग क्या हैं?
ओसीआर चरित्र पहचान सॉफ्टवेयर से भरे हैंडहेल्ड टर्मिनल पीडीए के माध्यम से, कई दृश्य अनुप्रयोगों को महसूस किया जा सकता है, जैसे: कार लाइसेंस प्लेट पहचान, कंटेनर नंबर पहचान, आयातित गोमांस और मटन वजन लेबल मान्यता, पासपोर्ट मशीन-पठनीय क्षेत्र मान्यता, इलेक्ट्रिक मीटर रीडिंग मान्यता , स्टील का तार छिड़काव किए गए पात्रों की पहचान।
पोस्ट करने का समय: नवंबर-16-2022