Τι είναι η τεχνολογία OCR;
Η οπτική αναγνώριση χαρακτήρων (Αγγλικά: Optical Character Recognition, OCR) αναφέρεται στη διαδικασία ανάλυσης και αναγνώρισης αρχείων εικόνας υλικού κειμένου για τη λήψη πληροφοριών κειμένου και διάταξης.
Παρόμοια με την τεχνολογία αναγνώρισης εικόνας και μηχανικής όρασης, η διαδικασία επεξεργασίας της τεχνολογίας OCR χωρίζεται επίσης σε διαδικασία εισόδου, προεπεξεργασίας, ενδιάμεσης επεξεργασίας, μετα-επεξεργασίας και διαδικασίας εξόδου.
εισαγω
Για διαφορετικές μορφές εικόνας, υπάρχουν διαφορετικές μορφές αποθήκευσης και διαφορετικές μέθοδοι συμπίεσης.Επί του παρόντος, υπάρχουν OpenCV, CxImage κ.λπ.
Προεπεξεργασία – δυαδοποίηση
Οι περισσότερες από τις φωτογραφίες που λαμβάνονται από ψηφιακές φωτογραφικές μηχανές σήμερα είναι έγχρωμες εικόνες, οι οποίες περιέχουν τεράστιο όγκο πληροφοριών και δεν είναι κατάλληλες για την τεχνολογία OCR.
Για το περιεχόμενο της εικόνας, μπορούμε απλά να τη χωρίσουμε σε πρώτο πλάνο και φόντο.Για να κάνουμε τον υπολογιστή ταχύτερο και να εκτελεί καλύτερα τους υπολογισμούς που σχετίζονται με το OCR, πρέπει πρώτα να επεξεργαστούμε την έγχρωμη εικόνα, έτσι ώστε να παραμείνουν στην εικόνα μόνο οι πληροφορίες πρώτου πλάνου και οι πληροφορίες παρασκηνίου.Η δυαδοποίηση μπορεί επίσης να γίνει απλά κατανοητή ως «ασπρόμαυρο».
μείωση θορύβου εικόνας
Για διαφορετικές εικόνες, ο ορισμός του θορύβου μπορεί να είναι διαφορετικός και η διαδικασία απενεργοποίησης θορύβου σύμφωνα με τα χαρακτηριστικά του θορύβου ονομάζεται μείωση θορύβου.
διόρθωση κλίσης
Επειδή οι απλοί χρήστες, κατά τη λήψη φωτογραφιών εγγράφων, είναι δύσκολο να τραβήξουν εντελώς σε ευθυγράμμιση με οριζόντια και κάθετη ευθυγράμμιση, επομένως οι φωτογραφίες που λαμβάνονται αναπόφευκτα θα είναι λοξές, κάτι που απαιτεί λογισμικό επεξεργασίας εικόνας για τη διόρθωση.
Ενδιάμεση επεξεργασία – ανάλυση διάταξης
Η διαδικασία διαίρεσης των εικόνων εγγράφων σε παραγράφους και κλάδους ονομάζεται ανάλυση διάταξης.Λόγω της ποικιλομορφίας και της πολυπλοκότητας των πραγματικών εγγράφων, αυτό το βήμα πρέπει ακόμα να βελτιστοποιηθεί.
κοπή χαρακτήρων
Λόγω των περιορισμών των συνθηκών φωτογραφίας και γραφής, οι χαρακτήρες συχνά κολλάνε και τα στυλό σπάνε.Η απευθείας χρήση τέτοιων εικόνων για ανάλυση OCR θα περιορίσει σημαντικά την απόδοση OCR.Επομένως, απαιτείται τμηματοποίηση χαρακτήρων, δηλαδή διαχωρισμός διαφορετικών χαρακτήρων.
Αναγνώριση χαρακτήρων
Στο αρχικό στάδιο χρησιμοποιήθηκε κυρίως η αντιστοίχιση προτύπων και στο μεταγενέστερο στάδιο χρησιμοποιήθηκε κυρίως η εξαγωγή χαρακτηριστικών.Λόγω της επίδρασης παραγόντων όπως η μετατόπιση κειμένου, το πάχος της διαδρομής, το σπασμένο στυλό, η πρόσφυση, η περιστροφή κ.λπ., η δυσκολία εξαγωγής χαρακτηριστικών επηρεάζεται σε μεγάλο βαθμό.
Αποκατάσταση διάταξης
Οι άνθρωποι ελπίζουν ότι το αναγνωρισμένο κείμενο εξακολουθεί να είναι διατεταγμένο όπως η αρχική εικόνα του εγγράφου και ότι οι παράγραφοι, οι θέσεις και η σειρά εξάγονται σε έγγραφα Word, έγγραφα PDF κ.λπ., και αυτή η διαδικασία ονομάζεται επαναφορά διάταξης.
μετά την επεξεργασία
Σύμφωνα με τη σχέση του συγκεκριμένου γλωσσικού πλαισίου, το αποτέλεσμα αναγνώρισης διορθώνεται.
παραγωγή
Εξαγωγή των αναγνωρισμένων χαρακτήρων ως κείμενο σε μια συγκεκριμένη μορφή.
Ποιες είναι οι εφαρμογές των τερματικών χειρός που βασίζονται στην τεχνολογία OCR;
Μέσω του φορητού τερματικού PDA που είναι φορτωμένο με λογισμικό αναγνώρισης χαρακτήρων OCR, μπορούν να πραγματοποιηθούν πολλές εφαρμογές σκηνής, όπως: αναγνώριση πινακίδας αυτοκινήτου, αναγνώριση αριθμού κοντέινερ, αναγνώριση ετικετών εισαγόμενου βάρους βοείου και προβάτου, αναγνώριση περιοχής αναγνώσιμης από μηχανή διαβατηρίου, αναγνώριση ανάγνωσης ηλεκτρικού μετρητή , ατσάλινο πηνίο Αναγνώριση ψεκασμένων χαρακτήρων.
Ώρα δημοσίευσης: Νοε-16-2022