+ ८६-७५५-२९०३१८८३

OCR ह्यान्डहेल्ड टर्मिनल PDA प्रकार्यका अनुप्रयोगहरू के हुन्?

OCR प्रविधि के हो?

अप्टिकल क्यारेक्टर रिकग्निसन (अंग्रेजी: Optical Character Recognition, OCR) ले पाठ र लेआउट जानकारी प्राप्त गर्न पाठ सामग्रीको छवि फाइलहरूको विश्लेषण र पहिचान गर्ने प्रक्रियालाई बुझाउँछ।

छवि पहिचान र मेशिन भिजन टेक्नोलोजी जस्तै, OCR प्रविधिको प्रशोधन प्रक्रियालाई पनि इनपुट, पूर्व-प्रशोधन, मध्य-अवधि प्रशोधन, पोस्ट-प्रोसेसिङ र आउटपुट प्रक्रियामा विभाजन गरिएको छ।

प्रविष्ट गर्नुहोस्
विभिन्न छवि ढाँचाहरूको लागि, त्यहाँ विभिन्न भण्डारण ढाँचाहरू र विभिन्न सङ्कुचन विधिहरू छन्।हाल, त्यहाँ OpenCV, CxImage, आदि छन्।

पूर्व-प्रशोधन - binarization

आज डिजिटल क्यामेराद्वारा खिचिएका अधिकांश तस्बिरहरू रंगीन तस्बिरहरू हुन्, जसमा ठूलो मात्रामा जानकारी हुन्छ र OCR प्रविधिको लागि उपयुक्त हुँदैन।

चित्रको सामग्रीको लागि, हामी यसलाई अग्रभूमि र पृष्ठभूमिमा विभाजित गर्न सक्छौं।कम्प्युटरलाई छिटो र राम्रोसँग OCR सम्बन्धित गणनाहरू गर्नको लागि, हामीले पहिले रङ छविलाई प्रशोधन गर्न आवश्यक छ, ताकि केवल अग्रभूमि जानकारी र पृष्ठभूमि जानकारी चित्रमा रहन्छ।Binarization लाई "कालो र सेतो" को रूपमा पनि बुझ्न सकिन्छ।

छवि शोर कमी
विभिन्न छविहरूको लागि, आवाजको परिभाषा फरक हुन सक्छ, र शोरको विशेषताहरू अनुसार डिनोइज गर्ने प्रक्रियालाई आवाज घटाउने भनिन्छ।

झुकाव सुधार
किनभने साधारण प्रयोगकर्ताहरूले कागजातहरूको तस्बिरहरू लिँदा, तेर्सो र ठाडो पङ्क्तिबद्धतासँग पूर्ण रूपमा शूट गर्न गाह्रो हुन्छ, त्यसैले खिचिएका तस्बिरहरू अनिवार्य रूपमा स्क्युड हुनेछन्, जसलाई सच्याउन छवि प्रशोधन सफ्टवेयर आवश्यक पर्दछ।

मध्य-अवधि प्रशोधन - लेआउट विश्लेषण
कागजात चित्रहरूलाई अनुच्छेद र शाखाहरूमा विभाजन गर्ने प्रक्रियालाई लेआउट विश्लेषण भनिन्छ।वास्तविक कागजातहरूको विविधता र जटिलताको कारणले गर्दा, यो चरण अझै पनि अनुकूलित गर्न आवश्यक छ।

चरित्र काट्ने
फोटो खिच्ने र लेख्ने अवस्थाको सीमितताको कारण, क्यारेक्टरहरू प्रायः अड्किएका छन् र कलमहरू भाँचिएका छन्।OCR विश्लेषणको लागि त्यस्ता तस्बिरहरू प्रत्यक्ष रूपमा प्रयोग गर्दा OCR कार्यसम्पादनलाई धेरै सीमित हुनेछ।तसर्थ, क्यारेक्टर सेग्मेन्टेशन आवश्यक छ, त्यो हो, फरक क्यारेक्टरहरू अलग गर्न।

चरित्र पहिचान
प्रारम्भिक चरणमा, टेम्प्लेट मिलान मुख्य रूपमा प्रयोग गरिएको थियो, र पछिको चरणमा, विशेषता निकासी मुख्य रूपमा प्रयोग गरिएको थियो।पाठ विस्थापन, स्ट्रोक मोटाई, भाँचिएको कलम, आसंजन, रोटेशन, आदि जस्ता कारकहरूको प्रभावको कारण, सुविधा निकासीको कठिनाई धेरै प्रभावित हुन्छ।

लेआउट पुनर्स्थापना
मानिसहरूले आशा गर्छन् कि मान्यता प्राप्त पाठ अझै पनि मूल कागजात चित्र जस्तै व्यवस्थित गरिएको छ, र अनुच्छेद, स्थिति, र क्रम Word कागजातहरू, PDF कागजातहरू, इत्यादिमा आउटपुट हुन्छन्, र यो प्रक्रियालाई लेआउट पुनर्स्थापना भनिन्छ।

पोस्ट प्रशोधन
विशिष्ट भाषा सन्दर्भको सम्बन्ध अनुसार, पहिचान परिणाम सही छ।

आउटपुट
निश्चित ढाँचामा पाठको रूपमा मान्यता प्राप्त क्यारेक्टरहरू आउटपुट गर्नुहोस्।

OCR प्रविधिमा आधारित ह्यान्डहेल्ड टर्मिनलहरूको अनुप्रयोगहरू के हुन्?

ओसीआर क्यारेक्टर रिकग्निसन सफ्टवेयरले भरिएको ह्यान्डहेल्ड टर्मिनल PDA मार्फत, धेरै दृश्य अनुप्रयोगहरू महसुस गर्न सकिन्छ, जस्तै: कार लाइसेन्स प्लेट पहिचान, कन्टेनर नम्बर पहिचान, आयातित बीफ र मटनको तौल लेबल पहिचान, राहदानी मेसिन-पढ्न योग्य क्षेत्र पहिचान, इलेक्ट्रिक मिटर रिडिङ पहिचान। , स्टिल कुण्डल स्प्रे गरिएका वर्णहरूको पहिचान।


पोस्ट समय: नोभेम्बर-16-2022
व्हाट्सएप अनलाइन च्याट!