Apa teknologi OCR?
Pangenalan Karakter Optik (Inggris: Optical Character Recognition, OCR) nuduhake proses nganalisa lan ngenali file gambar saka bahan teks kanggo entuk informasi teks lan tata letak.
Kaya pangenalan gambar lan teknologi visi mesin, proses pangolahan teknologi OCR uga dipérang dadi input, pre-processing, mid-term processing, post-processing lan proses output.
mlebu
Kanggo macem-macem format gambar, ana macem-macem format panyimpenan lan cara kompresi sing beda.Saiki, ana OpenCV, CxImage, lsp.
Pre-processing - binarization
Umume gambar sing dijupuk dening kamera digital saiki yaiku gambar warna, sing ngemot informasi sing akeh banget lan ora cocog kanggo teknologi OCR.
Kanggo isi gambar, kita mung bisa dibagi dadi latar ngarep lan latar mburi.Kanggo nggawe komputer luwih cepet lan luwih apik nindakake petungan OCR related, kita kudu proses gambar werna pisanan, supaya mung informasi latar ngarep lan informasi latar mburi tetep ing gambar.Binarisasi uga bisa dimangerteni minangka "ireng lan putih".
nyuda gangguan gambar
Kanggo gambar sing beda-beda, definisi gangguan bisa uga beda-beda, lan proses denoising miturut karakteristik gangguan diarani pengurangan gangguan.
koreksi miring
Amarga pangguna biasa, nalika njupuk gambar dokumen, angel kanggo njupuk kanthi selaras karo alignment horisontal lan vertikal, mula gambar sing dijupuk mesthi bakal miring, sing mbutuhake piranti lunak pangolahan gambar kanggo mbenerake.
Pangolahan jangka tengah - analisis tata letak
Proses mbagi gambar dokumen dadi paragraf lan cabang diarani analisis tata letak.Amarga macem-macem lan kerumitan dokumen nyata, langkah iki isih kudu dioptimalake.
nglereni karakter
Amarga watesan kahanan motret lan nulis, karakter asring macet lan pulpen rusak.Langsung nggunakake gambar kasebut kanggo analisis OCR bakal mbatesi kinerja OCR.Mulane, segmentasi karakter dibutuhake, yaiku, kanggo misahake karakter sing beda-beda.
Pangenalan karakter
Ing tahap awal, pencocokan cithakan utamane digunakake, lan ing tahap sabanjure, ekstraksi fitur utamane digunakake.Amarga pengaruh faktor kayata pamindahan teks, kekandelan stroke, pena rusak, adhesi, rotasi, lan liya-liyane, angel banget kanggo ekstraksi fitur.
Pemugaran tata letak
Wong-wong ngarep-arep yen teks sing diakoni isih disusun kaya gambar dokumen asli, lan paragraf, posisi, lan urutan minangka output kanggo dokumen Word, dokumen PDF, lan liya-liyane, lan proses iki diarani pemugaran tata letak.
post processing
Miturut sesambungan konteks basa tartamtu, asil pangenalan dibenerake.
output
Output karakter sing dikenali minangka teks ing format tartamtu.
Apa aplikasi terminal genggam adhedhasar teknologi OCR?
Liwat PDA terminal genggam sing dimuat karo piranti lunak pangenalan karakter OCR, akeh aplikasi pemandangan sing bisa diwujudake, kayata: pangenalan plat mobil, pangenalan nomer wadhah, pangenalan label bobot daging sapi lan daging kambing sing diimpor, pangenalan area sing bisa diwaca mesin paspor, pangenalan maca meter listrik , kumparan baja Pangenalan karakter semprotan.
Wektu kirim: Nov-16-2022