+ 86-755-29031883

OCR el terminali PDA işlevinin uygulamaları nelerdir?

OCR teknolojisi nedir?

Optik Karakter Tanıma (İngilizce: Optical Character Recognition, OCR), metin ve düzen bilgileri elde etmek için metin materyallerinin görüntü dosyalarını analiz etme ve tanıma sürecini ifade eder.

Görüntü tanıma ve yapay görme teknolojisine benzer şekilde, OCR teknolojisinin işleme süreci de girdi, ön işleme, orta vadeli işleme, son işleme ve çıktı sürecine ayrılmıştır.

girmek
Farklı görüntü formatları için farklı depolama formatları ve farklı sıkıştırma yöntemleri vardır.Şu anda OpenCV, CxImage vb.

Ön işleme – ikili hale getirme

Günümüzde dijital kameralarla çekilen fotoğrafların çoğu, çok büyük miktarda bilgi içeren ve OCR teknolojisine uygun olmayan renkli görüntülerdir.

Resmin içeriği için basitçe ön plan ve arka plan olarak ayırabiliriz.Bilgisayarın daha hızlı olması ve OCR ile ilgili hesaplamaları daha iyi yapabilmesi için önce renkli görüntüyü işlememiz gerekiyor, böylece resimde sadece ön plan bilgisi ve arka plan bilgisi kalıyor.Binarizasyon basitçe "siyah ve beyaz" olarak da anlaşılabilir.

görüntü paraziti azaltma
Farklı görüntüler için gürültü tanımı farklı olabilir ve gürültünün özelliklerine göre gürültü giderme işlemine gürültü azaltma denir.

eğim düzeltme
Çünkü sıradan kullanıcılar belgelerin fotoğraflarını çekerken tamamen yatay ve dikey hizalama ile aynı hizada çekim yapmak zordur, bu nedenle çekilen resimler kaçınılmaz olarak eğri olacaktır ve bu da görüntü işleme yazılımının düzeltilmesini gerektirir.

Ara dönem işleme – yerleşim analizi
Belge resimlerini paragraflara ve dallara ayırma işlemine mizanpaj analizi denir.Gerçek belgelerin çeşitliliği ve karmaşıklığı nedeniyle, bu adımın hala optimize edilmesi gerekiyor.

karakter kesme
Fotoğraf çekme ve yazma koşullarının kısıtlılığından dolayı çoğu zaman karakterler takılıp kalıyor ve kalemler kırılıyor.OCR analizi için bu tür görüntülerin doğrudan kullanılması, OCR performansını büyük ölçüde sınırlayacaktır.Bu nedenle karakter bölütleme, yani farklı karakterleri ayırmak gerekir.

karakter tanıma
Erken aşamada, ağırlıklı olarak şablon eşleştirme kullanıldı ve sonraki aşamada, ağırlıklı olarak özellik çıkarımı kullanıldı.Metin yer değiştirmesi, kontur kalınlığı, kırık kalem, yapışma, döndürme vb. faktörlerin etkisinden dolayı, özellik çıkarmanın zorluğu büyük ölçüde etkilenir.

Düzen restorasyonu
İnsanlar, tanınan metnin hala orijinal belge resmi gibi düzenlendiğini ve paragrafların, konumların ve sıranın Word belgelerine, PDF belgelerine vb.

rötuş
Belirli dil bağlamının ilişkisine göre, tanıma sonucu düzeltilir.

çıktı
Tanınan karakterleri belirli bir formatta metin olarak çıktılayın.

OCR teknolojisine dayalı el terminallerinin uygulamaları nelerdir?

OCR karakter tanıma yazılımı yüklü el terminali PDA aracılığıyla, araba plaka tanıma, konteyner numarası tanıma, ithal sığır ve koyun ağırlığı etiketi tanıma, pasaport makine tarafından okunabilir alan tanıma, elektrik sayacı okuma tanıma gibi birçok sahne uygulaması gerçekleştirilebilir. , çelik bobin Püskürtülen karakterlerin tanınması.


Gönderim zamanı: Kasım-16-2022
WhatsApp Çevrimiçi Sohbet!