Apakah teknologi OCR?
Pengecaman Aksara Optik (Bahasa Inggeris: Optical Character Recognition, OCR) merujuk kepada proses menganalisis dan mengecam fail imej bahan teks untuk mendapatkan maklumat teks dan susun atur.
Sama seperti pengecaman imej dan teknologi penglihatan mesin, proses pemprosesan teknologi OCR juga dibahagikan kepada input, pra-pemprosesan, pemprosesan jangka pertengahan, pasca pemprosesan dan proses output.
masuk
Untuk format imej yang berbeza, terdapat format storan yang berbeza dan kaedah pemampatan yang berbeza.Pada masa ini, terdapat OpenCV, CxImage, dll.
Pra-pemprosesan – perduaan
Kebanyakan gambar yang diambil oleh kamera digital hari ini adalah imej berwarna, yang mengandungi sejumlah besar maklumat dan tidak sesuai untuk teknologi OCR.
Untuk kandungan gambar, kita boleh membahagikannya kepada latar depan dan latar belakang.Untuk menjadikan komputer lebih pantas dan lebih baik melaksanakan pengiraan berkaitan OCR, kita perlu memproses imej berwarna terlebih dahulu, supaya hanya maklumat latar depan dan maklumat latar belakang kekal dalam gambar.Perduaan juga boleh difahami secara ringkas sebagai "hitam dan putih".
pengurangan hingar imej
Untuk imej yang berbeza, definisi hingar mungkin berbeza, dan proses denoising mengikut ciri-ciri hingar dipanggil pengurangan hingar.
pembetulan kecondongan
Kerana pengguna biasa, apabila mengambil gambar dokumen, sukar untuk menangkap sepenuhnya mengikut penjajaran mendatar dan menegak, jadi gambar yang diambil pasti akan menjadi senget, yang memerlukan perisian pemprosesan imej untuk diperbetulkan.
Pemprosesan jangka pertengahan - analisis susun atur
Proses membahagikan gambar dokumen kepada perenggan dan cabang dipanggil analisis susun atur.Disebabkan oleh kepelbagaian dan kerumitan dokumen sebenar, langkah ini masih perlu dioptimumkan.
pemotongan watak
Disebabkan oleh keterbatasan keadaan mengambil gambar dan menulis, watak sering tersekat dan pen rosak.Menggunakan imej sedemikian secara langsung untuk analisis OCR akan sangat mengehadkan prestasi OCR.Oleh itu, pembahagian watak diperlukan, iaitu untuk memisahkan watak yang berbeza.
Pengecaman watak
Pada peringkat awal, padanan templat digunakan terutamanya, dan pada peringkat kemudian, pengekstrakan ciri digunakan terutamanya.Disebabkan oleh pengaruh faktor seperti anjakan teks, ketebalan lejang, pen patah, lekatan, putaran, dll., kesukaran pengekstrakan ciri sangat terjejas.
Pemulihan reka letak
Orang ramai berharap bahawa teks yang diiktiraf masih disusun seperti gambar dokumen asal, dan perenggan, kedudukan dan susunan dikeluarkan kepada dokumen Word, dokumen PDF, dsb., dan proses ini dipanggil pemulihan reka letak.
pemprosesan pasca
Mengikut hubungan konteks bahasa tertentu, hasil pengecaman diperbetulkan.
pengeluaran
Keluarkan aksara yang diiktiraf sebagai teks dalam format tertentu.
Apakah aplikasi terminal pegang tangan berdasarkan teknologi OCR?
Melalui PDA terminal pegang tangan yang dimuatkan dengan perisian pengecaman aksara OCR, banyak aplikasi adegan boleh direalisasikan, seperti: pengecaman plat lesen kereta, pengecaman nombor kontena, pengiktirafan label berat daging lembu dan kambing yang diimport, pengecaman kawasan yang boleh dibaca mesin pasport, pengecaman bacaan meter elektrik , gegelung keluli Pengiktirafan aksara yang disembur.
Masa siaran: Nov-16-2022