Cosa hè a tecnulugia OCR?
A ricunniscenza ottica di caratteri (inglese: Optical Character Recognition, OCR) si riferisce à u prucessu di analizà è ricunnosce i fugliali d'imaghjini di materiali di testu per ottene infurmazioni di testu è layout.
Simile à a ricunniscenza di l'imaghjini è a tecnulugia di visione di a macchina, u prucessu di trasfurmazioni di a tecnulugia OCR hè ancu divisu in input, pre-processing, processing mid-term, post-processing and output process.
entre
Per diversi formati di l'imaghjini, ci sò diversi furmati di almacenamento è diversi metudi di cumpressione.Attualmente, ci sò OpenCV, CxImage, etc.
Pre-processing - binarization
A maiò parte di l'imaghjini pigliati da e camere digitali oghje sò imaghjini di culore, chì cuntenenu una quantità enorme di informazioni è ùn sò micca adattati per a tecnulugia OCR.
Per u cuntenutu di a stampa, pudemu simpricimenti divisu in primu pianu è fondu.Per fà l'urdinatore più veloce è eseguisce megliu i calculi di l'OCR, avemu bisognu di processà l'imaghjini di culore prima, in modu chì solu l'infurmazioni in primu pianu è l'infurmazioni di fondo restanu in a stampa.A binarizazione pò ancu esse simplicemente capitu cum'è "biancu è neru".
riduzzione di u rumore di l'imagine
Per diverse imagine, a definizione di u rumore pò esse diversu, è u prucessu di denoising secondu e caratteristiche di u rumore hè chjamatu riduzzione di u rumore.
correzione di inclinazione
Perchè l'utilizatori ordinariu, quandu piglianu ritratti di documenti, hè difficiule di sparà cumpletamente in linea cù l'allineamentu horizontale è verticale, cusì i ritratti pigliati inevitabbilmente seranu sbilanciati, chì esige un software di trattamentu di l'imaghjini per curregà.
Trattamentu à mezu termine - analisi di layout
U prucessu di dividisce l'imaghjini di documenti in paragrafi è rami hè chjamatu analisi di layout.A causa di a diversità è a cumplessità di i ducumenti attuali, stu passu deve esse ottimisatu.
tagliu di caratteru
A causa di e limitazioni di e cundizioni di fotografia è scrittura, i caratteri sò spessu appiccicati è e penne sò rotte.Utilizà direttamente tali immagini per l'analisi OCR limiterà assai u rendiment OCR.Per quessa, a segmentazione di caratteri hè necessariu, vale à dì per separà caratteri diffirenti.
Ricunniscenza di caratteri
In a prima fase, a cuncordanza di mudelli hè stata utilizata principalmente, è in a tappa più tardi, l'estrazione di funziunalità hè stata utilizata principalmente.A causa di l'influenza di fatturi cum'è u spostamentu di u testu, u spessore di u trattu, a penna rotta, l'aderenza, a rotazione, etc., a difficultà di l'estrazione di e funzioni hè assai affettata.
Restaurazione di u layout
A ghjente spera chì u testu ricunnisciutu hè sempre dispostu cum'è l'imaghjini di u documentu originale, è i paragrafi, i pusizioni è l'ordine sò prudutti à i ducumenti Word, documenti PDF, etc., è stu prucessu hè chjamatu restaurazione di layout.
post-elaborazione
Sicondu a relazione di u cuntestu specificu di a lingua, u risultatu di ricunniscenza hè currettu.
output
Output i caratteri ricunnisciuti cum'è testu in un certu furmatu.
Chì sò l'applicazioni di i terminali portatili basati nantu à a tecnulugia OCR?
Attraversu u terminale portatile PDA caricatu cù u software di ricunniscenza di caratteri OCR, parechje applicazioni di scena ponu esse realizate, cum'è: ricunniscenza di a targhetta di vittura, ricunniscenza di u numeru di cuntainer, ricunniscenza di l'etichetta di u pesu di carne bovina impurtata, ricunniscenza di l'area di lettura di passaportu, ricunniscenza di lettura di metri elettrici. , bobina d'acciaio Ricunniscenza di caratteri sprayed.
Tempu di Postu: Nov-16-2022