რა არის OCR ტექნოლოგია?
ოპტიკური სიმბოლოების ამოცნობა (ინგლ. Optical Character Recognition, OCR) ეხება ტექსტური მასალის გამოსახულების ფაილების ანალიზისა და ამოცნობის პროცესს ტექსტისა და განლაგების ინფორმაციის მისაღებად.
სურათის ამოცნობისა და მანქანური ხედვის ტექნოლოგიის მსგავსად, OCR ტექნოლოგიის დამუშავების პროცესი ასევე იყოფა შეყვანის, წინასწარი დამუშავების, შუალედური დამუშავების, შემდგომი დამუშავების და გამომავალი პროცესად.
შედი
გამოსახულების სხვადასხვა ფორმატებისთვის, არსებობს სხვადასხვა შენახვის ფორმატები და შეკუმშვის სხვადასხვა მეთოდი.ამჟამად არის OpenCV, CxImage და ა.შ.
წინასწარი დამუშავება – ბინარიზაცია
ციფრული კამერებით გადაღებული სურათების უმეტესობა დღეს არის ფერადი გამოსახულება, რომელიც შეიცავს უზარმაზარ ინფორმაციას და არ არის შესაფერისი OCR ტექნოლოგიისთვის.
სურათის შინაარსისთვის შეგვიძლია უბრალოდ დავყოთ ის წინა პლანზე და ფონზე.იმისათვის, რომ კომპიუტერი უფრო სწრაფი იყოს და უკეთ შეასრულოს OCR-თან დაკავშირებული გამოთვლები, ჯერ უნდა დავამუშავოთ ფერადი სურათი, ისე რომ სურათზე დარჩეს მხოლოდ წინა პლანზე და ფონის ინფორმაცია.ბინარიზაცია ასევე შეიძლება უბრალოდ გავიგოთ, როგორც "შავ-თეთრი".
გამოსახულების ხმაურის შემცირება
სხვადასხვა გამოსახულების შემთხვევაში, ხმაურის განმარტება შეიძლება განსხვავებული იყოს, ხოლო ხმაურის მახასიათებლების მიხედვით დენოიზირების პროცესს ეწოდება ხმაურის შემცირება.
დახრის კორექტირება
იმის გამო, რომ ჩვეულებრივი მომხმარებლები, დოკუმენტების გადაღებისას, ძნელია გადაღება მთლიანად ჰორიზონტალური და ვერტიკალური განლაგების შესაბამისად, ამიტომ გადაღებული სურათები აუცილებლად დახრილი იქნება, რაც გამოსახულების დამუშავების პროგრამას მოითხოვს.
შუალედური დამუშავება – განლაგების ანალიზი
დოკუმენტის სურათების აბზაცებად და ტოტებად დაყოფის პროცესს განლაგების ანალიზი ეწოდება.რეალური დოკუმენტების მრავალფეროვნებისა და სირთულის გამო, ეს ნაბიჯი ჯერ კიდევ საჭიროებს ოპტიმიზაციას.
პერსონაჟის ჭრა
ფოტოგრაფიისა და წერის პირობების შეზღუდვის გამო, პერსონაჟები ხშირად იჭედებიან და კალმები იშლება.ასეთი სურათების პირდაპირი გამოყენება OCR ანალიზისთვის მნიშვნელოვნად შეზღუდავს OCR შესრულებას.აქედან გამომდინარე, საჭიროა სიმბოლოების სეგმენტაცია, ანუ სხვადასხვა სიმბოლოების გამოყოფა.
პერსონაჟების ამოცნობა
ადრეულ ეტაპზე ძირითადად გამოიყენებოდა შაბლონის შესატყვისი, ხოლო შემდგომ ეტაპზე ძირითადად ფუნქციების ამოღება.ისეთი ფაქტორების გავლენის გამო, როგორიცაა ტექსტის გადაადგილება, დარტყმის სისქე, გატეხილი კალამი, ადჰეზია, ბრუნვა და ა.შ., ფუნქციის ამოღების სირთულეზე დიდ გავლენას ახდენს.
განლაგების აღდგენა
ხალხი იმედოვნებს, რომ აღიარებული ტექსტი კვლავ დალაგებულია დოკუმენტის ორიგინალური სურათის მსგავსად, ხოლო აბზაცები, პოზიციები და წესრიგი გამოდის Word დოკუმენტებში, PDF დოკუმენტებში და ა.შ., და ამ პროცესს ეწოდება განლაგების აღდგენა.
შემდგომი დამუშავება
სპეციფიკური ენობრივი კონტექსტის ურთიერთმიმართების მიხედვით ხდება ამოცნობის შედეგის კორექტირება.
გამომავალი
ამოიღეთ ამოცნობილი სიმბოლოები ტექსტის სახით გარკვეულ ფორმატში.
რა არის OCR ტექნოლოგიაზე დაფუძნებული ხელის ტერმინალების გამოყენება?
OCR სიმბოლოების ამომცნობი პროგრამული უზრუნველყოფით დატვირთული ხელის ტერმინალის PDA-ს მეშვეობით, შესაძლებელია მრავალი სცენის აპლიკაციის რეალიზება, როგორიცაა: მანქანის სანომრე ნიშნის ამოცნობა, კონტეინერის ნომრის ამოცნობა, იმპორტირებული ძროხის და ცხვრის წონის ეტიკეტების ამოცნობა, პასპორტის მანქანით წაკითხვადი არეალის ამოცნობა, ელექტრო მრიცხველის წაკითხვის ამოცნობა. , ფოლადის კოჭა შესხურებული სიმბოლოების ამოცნობა.
გამოქვეყნების დრო: ნოე-16-2022