+ 86-755-29031883

Apa aplikasi fungsi PDA terminal genggam OCR?

Apa itu teknologi OCR?

Pengenalan Karakter Optik (Bahasa Inggris: Optical Character Recognition, OCR) mengacu pada proses menganalisis dan mengenali file gambar dari bahan teks untuk mendapatkan informasi teks dan tata letak.

Mirip dengan pengenalan gambar dan teknologi visi mesin, proses pemrosesan teknologi OCR juga dibagi menjadi proses input, pra-pemrosesan, pemrosesan jangka menengah, pasca-pemrosesan, dan output.

memasuki
Untuk format gambar yang berbeda, ada format penyimpanan yang berbeda dan metode kompresi yang berbeda.Saat ini, ada OpenCV, CxImage, dll.

Pra-pemrosesan – binarisasi

Sebagian besar gambar yang diambil oleh kamera digital saat ini adalah gambar berwarna yang mengandung banyak informasi dan tidak cocok untuk teknologi OCR.

Untuk isi gambarnya, kita cukup membaginya menjadi foreground dan background.Untuk membuat komputer lebih cepat dan melakukan kalkulasi terkait OCR dengan lebih baik, kita perlu memproses gambar berwarna terlebih dahulu, sehingga hanya informasi latar depan dan informasi latar belakang yang tersisa di gambar.Binarisasi juga bisa dipahami sebagai "hitam dan putih".

pengurangan noise gambar
Untuk gambar yang berbeda, definisi noise mungkin berbeda, dan proses denoising sesuai dengan karakteristik noise disebut reduksi noise.

koreksi kemiringan
Karena pengguna biasa, saat memotret dokumen, sulit untuk memotret sepenuhnya sejalan dengan penyelarasan horizontal dan vertikal, sehingga gambar yang diambil pasti akan miring, yang memerlukan perangkat lunak pengolah gambar untuk memperbaikinya.

Pemrosesan jangka menengah – analisis tata letak
Proses membagi gambar dokumen menjadi paragraf dan cabang disebut analisis tata letak.Karena keragaman dan kerumitan dokumen aktual, langkah ini masih perlu dioptimalkan.

pemotongan karakter
Karena keterbatasan kondisi memotret dan menulis, karakter sering tersangkut dan pulpen patah.Menggunakan gambar tersebut secara langsung untuk analisis OCR akan sangat membatasi kinerja OCR.Oleh karena itu diperlukan segmentasi karakter, yaitu memisahkan karakter yang berbeda.

Pengenalan karakter
Pada tahap awal, pencocokan template terutama digunakan, dan pada tahap selanjutnya, ekstraksi fitur terutama digunakan.Karena pengaruh faktor-faktor seperti perpindahan teks, ketebalan goresan, pena patah, adhesi, rotasi, dll., Kesulitan ekstraksi fitur sangat terpengaruh.

Pemulihan tata letak
Orang berharap teks yang dikenali tetap tersusun seperti gambar dokumen aslinya, dan paragraf, posisi, dan urutannya di-output ke dokumen Word, dokumen PDF, dll., Proses ini disebut restorasi tata letak.

pengolahan pasca
Menurut hubungan konteks bahasa tertentu, hasil pengenalan dikoreksi.

keluaran
Keluarkan karakter yang dikenali sebagai teks dalam format tertentu.

Apa aplikasi terminal genggam berdasarkan teknologi OCR?

Melalui PDA terminal genggam yang dimuat dengan perangkat lunak pengenalan karakter OCR, banyak aplikasi adegan dapat direalisasikan, seperti: pengenalan plat nomor mobil, pengenalan nomor kontainer, pengenalan label berat daging sapi dan kambing yang diimpor, pengenalan area yang dapat dibaca mesin paspor, pengenalan pembacaan meteran listrik , koil baja Pengenalan karakter yang disemprotkan.


Waktu posting: Nov-16-2022
Obrolan Daring WhatsApp!