OCR প্রযুক্তি কি?
অপটিক্যাল ক্যারেক্টার রিকগনিশন (ইংরেজি: Optical Character Recognition, OCR) টেক্সট এবং লেআউট তথ্য প্রাপ্ত করার জন্য টেক্সট সামগ্রীর ইমেজ ফাইলগুলি বিশ্লেষণ এবং সনাক্ত করার প্রক্রিয়াকে বোঝায়।
ইমেজ রিকগনিশন এবং মেশিন ভিশন প্রযুক্তির মতো, ওসিআর প্রযুক্তির প্রক্রিয়াকরণ প্রক্রিয়াটি ইনপুট, প্রি-প্রসেসিং, মিড-টার্ম প্রসেসিং, পোস্ট-প্রসেসিং এবং আউটপুট প্রক্রিয়ায় বিভক্ত।
প্রবেশ করা
বিভিন্ন ইমেজ ফরম্যাটের জন্য, বিভিন্ন স্টোরেজ ফরম্যাট এবং বিভিন্ন কম্প্রেশন পদ্ধতি রয়েছে।বর্তমানে, OpenCV, CxImage, ইত্যাদি আছে।
প্রাক-প্রক্রিয়াকরণ - বাইনারিকরণ
বর্তমানে ডিজিটাল ক্যামেরা দ্বারা তোলা বেশিরভাগ ছবিই রঙিন ছবি, যেগুলিতে প্রচুর পরিমাণে তথ্য রয়েছে এবং এটি OCR প্রযুক্তির জন্য উপযুক্ত নয়।
ছবির বিষয়বস্তুর জন্য, আমরা কেবল এটিকে অগ্রভাগ এবং পটভূমিতে ভাগ করতে পারি।কম্পিউটারকে দ্রুততর করতে এবং OCR সম্পর্কিত গণনাগুলি আরও ভালভাবে সম্পাদন করার জন্য, আমাদের প্রথমে রঙিন চিত্রটি প্রক্রিয়া করতে হবে, যাতে কেবলমাত্র অগ্রভাগের তথ্য এবং পটভূমির তথ্য ছবিতে থাকে।বাইনারিকরণকে সহজভাবে "কালো এবং সাদা" হিসাবে বোঝা যায়।
ইমেজ শব্দ হ্রাস
বিভিন্ন চিত্রের জন্য, শব্দের সংজ্ঞা ভিন্ন হতে পারে, এবং শব্দের বৈশিষ্ট্য অনুসারে শব্দ হ্রাস করার প্রক্রিয়াটিকে শব্দ হ্রাস বলা হয়।
কাত সংশোধন
কারণ সাধারণ ব্যবহারকারীরা, নথির ছবি তোলার সময়, অনুভূমিক এবং উল্লম্ব প্রান্তিককরণের সাথে সম্পূর্ণভাবে শুট করা কঠিন, তাই তোলা ছবিগুলি অনিবার্যভাবে তির্যক হবে, যা সংশোধন করার জন্য চিত্র প্রক্রিয়াকরণ সফ্টওয়্যার প্রয়োজন।
মধ্য-মেয়াদী প্রক্রিয়াকরণ - লেআউট বিশ্লেষণ
নথির ছবিকে অনুচ্ছেদ ও শাখায় ভাগ করার প্রক্রিয়াকে লেআউট বিশ্লেষণ বলে।প্রকৃত নথির বৈচিত্র্য এবং জটিলতার কারণে, এই পদক্ষেপটি এখনও অপ্টিমাইজ করা প্রয়োজন।
চরিত্র কাটা
ছবি তোলা এবং লেখার অবস্থার সীমাবদ্ধতার কারণে, অক্ষর প্রায়ই আটকে যায় এবং কলম ভেঙে যায়।OCR বিশ্লেষণের জন্য এই ধরনের ছবি সরাসরি ব্যবহার করলে OCR কর্মক্ষমতা অনেকটাই সীমিত হবে।অতএব, অক্ষর বিভাজন প্রয়োজন, অর্থাৎ, বিভিন্ন অক্ষর পৃথক করতে।
চরিত্রের স্বীকৃতি
প্রাথমিক পর্যায়ে, টেমপ্লেট ম্যাচিং প্রধানত ব্যবহৃত হত, এবং পরবর্তী পর্যায়ে, বৈশিষ্ট্য নিষ্কাশন প্রধানত ব্যবহৃত হয়।টেক্সট ডিসপ্লেসমেন্ট, স্ট্রোকের বেধ, ভাঙা কলম, আনুগত্য, ঘূর্ণন ইত্যাদির মতো কারণগুলির প্রভাবের কারণে বৈশিষ্ট্য নিষ্কাশনের অসুবিধা ব্যাপকভাবে প্রভাবিত হয়।
লেআউট পুনরুদ্ধার
লোকেরা আশা করে যে স্বীকৃত পাঠ্যটি এখনও মূল নথির ছবির মতো সাজানো হয়েছে, এবং অনুচ্ছেদ, অবস্থান এবং ক্রম Word নথি, PDF নথি, ইত্যাদিতে আউটপুট হয় এবং এই প্রক্রিয়াটিকে লেআউট পুনরুদ্ধার বলা হয়।
পোস্ট প্রসেসিং
নির্দিষ্ট ভাষা প্রসঙ্গের সম্পর্ক অনুসারে, স্বীকৃতির ফলাফল সংশোধন করা হয়।
আউটপুট
একটি নির্দিষ্ট বিন্যাসে পাঠ্য হিসাবে স্বীকৃত অক্ষরগুলি আউটপুট করুন।
ওসিআর প্রযুক্তির উপর ভিত্তি করে হ্যান্ডহেল্ড টার্মিনালগুলির অ্যাপ্লিকেশনগুলি কী কী?
ওসিআর ক্যারেক্টার রিকগনিশন সফ্টওয়্যার সহ লোড হ্যান্ডহেল্ড টার্মিনাল পিডিএ-এর মাধ্যমে, অনেক দৃশ্য অ্যাপ্লিকেশন উপলব্ধি করা যেতে পারে, যেমন: গাড়ির লাইসেন্স প্লেট স্বীকৃতি, কন্টেইনার নম্বর স্বীকৃতি, আমদানি করা গরুর মাংস এবং মাটন ওজন লেবেল স্বীকৃতি, পাসপোর্ট মেশিন-পাঠযোগ্য এলাকা স্বীকৃতি, বৈদ্যুতিক মিটার রিডিং স্বীকৃতি , ইস্পাত কুণ্ডলী স্প্রে করা অক্ষর স্বীকৃতি.
পোস্টের সময়: নভেম্বর-16-2022