+ 86-755-29031883

OCR ہینڈ ہیلڈ ٹرمینل PDA فنکشن کی ایپلی کیشنز کیا ہیں؟

OCR ٹیکنالوجی کیا ہے؟

آپٹیکل کریکٹر ریکگنیشن (انگریزی: Optical Character Recognition, OCR) سے مراد متن اور ترتیب کی معلومات حاصل کرنے کے لیے متنی مواد کی تصویری فائلوں کا تجزیہ اور شناخت کرنے کا عمل ہے۔

تصویر کی شناخت اور مشین ویژن ٹیکنالوجی کی طرح، OCR ٹیکنالوجی کے پروسیسنگ کے عمل کو بھی ان پٹ، پری پروسیسنگ، وسط مدتی پروسیسنگ، پوسٹ پروسیسنگ اور آؤٹ پٹ پراسیس میں تقسیم کیا گیا ہے۔

داخل کریں
مختلف امیج فارمیٹس کے لیے، اسٹوریج کے مختلف فارمیٹس اور مختلف کمپریشن طریقے ہیں۔فی الحال، OpenCV، CxImage، وغیرہ موجود ہیں۔

پری پروسیسنگ - بائنرائزیشن

آج کل ڈیجیٹل کیمروں سے لی گئی زیادہ تر تصاویر رنگین تصاویر ہیں، جن میں بہت زیادہ معلومات ہوتی ہیں اور یہ OCR ٹیکنالوجی کے لیے موزوں نہیں ہیں۔

تصویر کے مواد کے لیے، ہم اسے صرف پیش منظر اور پس منظر میں تقسیم کر سکتے ہیں۔کمپیوٹر کو تیز تر بنانے اور OCR سے متعلق حسابات کو بہتر طریقے سے انجام دینے کے لیے، ہمیں پہلے رنگین تصویر پر کارروائی کرنے کی ضرورت ہے، تاکہ تصویر میں صرف پیش منظر کی معلومات اور پس منظر کی معلومات باقی رہیں۔بائنرائزیشن کو "سیاہ اور سفید" کے طور پر بھی سمجھا جاسکتا ہے۔

تصویر شور کی کمی
مختلف امیجز کے لیے، شور کی تعریف مختلف ہو سکتی ہے، اور شور کی خصوصیات کے مطابق ڈینوائزنگ کے عمل کو شور کی کمی کہتے ہیں۔

جھکاؤ کی اصلاح
چونکہ عام صارفین، دستاویزات کی تصویریں لیتے وقت، افقی اور عمودی سیدھ کے مطابق مکمل طور پر گولی مارنا مشکل ہوتا ہے، اس لیے لی گئی تصویریں لامحالہ ترچھی ہو جائیں گی، جس کو درست کرنے کے لیے امیج پروسیسنگ سافٹ ویئر کی ضرورت ہوتی ہے۔

وسط مدتی پروسیسنگ - لے آؤٹ تجزیہ
دستاویز کی تصویروں کو پیراگراف اور شاخوں میں تقسیم کرنے کے عمل کو ترتیب تجزیہ کہا جاتا ہے۔اصل دستاویزات کے تنوع اور پیچیدگی کی وجہ سے، اس قدم کو اب بھی بہتر بنانے کی ضرورت ہے۔

کردار کاٹنا
تصویر کشی اور لکھنے کے حالات کی حدود کی وجہ سے، کردار اکثر پھنس جاتے ہیں اور قلم ٹوٹ جاتے ہیں۔OCR تجزیہ کے لیے ایسی تصاویر کا براہ راست استعمال OCR کی کارکردگی کو بہت حد تک محدود کر دے گا۔لہٰذا، حروف کی تقسیم درکار ہے، یعنی مختلف حروف کو الگ کرنے کے لیے۔

کردار کی پہچان
ابتدائی مرحلے میں، ٹیمپلیٹ مماثلت بنیادی طور پر استعمال کی جاتی تھی، اور بعد کے مرحلے میں، خصوصیت نکالنے کا بنیادی طور پر استعمال کیا جاتا تھا۔متن کی نقل مکانی، اسٹروک کی موٹائی، ٹوٹے ہوئے قلم، چپکنے، گردش، وغیرہ جیسے عوامل کے اثر و رسوخ کی وجہ سے، خصوصیت نکالنے کی دشواری بہت متاثر ہوتی ہے۔

لے آؤٹ کی بحالی
لوگ امید کرتے ہیں کہ تسلیم شدہ متن اب بھی اصل دستاویز کی تصویر کی طرح ترتیب دیا گیا ہے، اور پیراگراف، پوزیشنز، اور آرڈر ورڈ دستاویزات، پی ڈی ایف دستاویزات وغیرہ میں آؤٹ پٹ ہیں، اور اس عمل کو ترتیب کی بحالی کہا جاتا ہے۔

پوسٹ پروسیسنگ
مخصوص زبان کے سیاق و سباق کے تعلق کے مطابق، شناخت کا نتیجہ درست کیا جاتا ہے۔

آؤٹ پٹ
ایک مخصوص فارمیٹ میں متن کے طور پر تسلیم شدہ حروف کو آؤٹ پٹ کریں۔

OCR ٹیکنالوجی پر مبنی ہینڈ ہیلڈ ٹرمینلز کی ایپلی کیشنز کیا ہیں؟

OCR کریکٹر ریکگنیشن سوفٹ ویئر سے لدے ہینڈ ہیلڈ ٹرمینل PDA کے ذریعے، بہت سی منظر ایپلی کیشنز کو حاصل کیا جا سکتا ہے، جیسے: کار لائسنس پلیٹ کی شناخت، کنٹینر نمبر کی شناخت، درآمد شدہ بیف اور مٹن کے وزن کے لیبل کی شناخت، پاسپورٹ مشین کے قابل پڑھنے کے قابل علاقے کی شناخت، الیکٹرک میٹر ریڈنگ کی شناخت۔ , سٹیل کنڈلی چھڑکاو حروف کی شناخت.


پوسٹ ٹائم: نومبر-16-2022
واٹس ایپ آن لائن چیٹ!