ເຕັກໂນໂລຊີ OCR ແມ່ນຫຍັງ?
Optical Character Recognition (ພາສາອັງກິດ: Optical Character Recognition, OCR) ຫມາຍເຖິງຂະບວນການຂອງການວິເຄາະແລະການຮັບຮູ້ໄຟລ໌ຮູບພາບຂອງວັດສະດຸຂໍ້ຄວາມເພື່ອໃຫ້ໄດ້ຂໍ້ມູນຂໍ້ຄວາມແລະຮູບແບບ.
ຄ້າຍຄືກັນກັບເຕັກໂນໂລຊີການຮັບຮູ້ຮູບພາບແລະວິໄສທັດຂອງເຄື່ອງຈັກ, ຂະບວນການປະມວນຜົນຂອງເຕັກໂນໂລຊີ OCR ຍັງແບ່ງອອກເປັນ input, pre-processing, ຂະບວນການກາງໄລຍະ, post-processing ແລະ output process.
ເຂົ້າ
ສໍາລັບຮູບແບບຮູບພາບທີ່ແຕກຕ່າງກັນ, ມີຮູບແບບການເກັບຮັກສາທີ່ແຕກຕ່າງກັນແລະວິທີການບີບອັດທີ່ແຕກຕ່າງກັນ.ໃນປັດຈຸບັນ, ມີ OpenCV, CxImage, ແລະອື່ນໆ.
ການປຸງແຕ່ງກ່ອນ - binarization
ຮູບພາບສ່ວນໃຫຍ່ທີ່ຖ່າຍໂດຍກ້ອງຖ່າຍຮູບດິຈິຕອນໃນມື້ນີ້ແມ່ນຮູບພາບສີ, ເຊິ່ງປະກອບດ້ວຍຂໍ້ມູນຈໍານວນຫລາຍແລະບໍ່ເຫມາະສົມກັບເຕັກໂນໂລຢີ OCR.
ສໍາລັບເນື້ອໃນຂອງຮູບ, ພວກເຮົາພຽງແຕ່ສາມາດແບ່ງອອກເປັນ foreground ແລະພື້ນຫລັງ.ເພື່ອເຮັດໃຫ້ຄອມພິວເຕີໄວຂຶ້ນແລະປະຕິບັດການຄໍານວນທີ່ກ່ຽວຂ້ອງກັບ OCR ໄດ້ດີຂຶ້ນ, ພວກເຮົາຈໍາເປັນຕ້ອງໄດ້ປະມວນຜົນຮູບພາບສີກ່ອນ, ດັ່ງນັ້ນພຽງແຕ່ຂໍ້ມູນດ້ານຫນ້າແລະຂໍ້ມູນພື້ນຖານຍັງຄົງຢູ່ໃນຮູບ.Binarization ຍັງສາມາດເຂົ້າໃຈງ່າຍໆວ່າ "ສີດໍາແລະສີຂາວ".
ການຫຼຸດຜ່ອນສິ່ງລົບກວນຮູບພາບ
ສໍາລັບຮູບພາບທີ່ແຕກຕ່າງກັນ, ຄໍານິຍາມຂອງສິ່ງລົບກວນອາດຈະແຕກຕ່າງກັນ, ແລະຂະບວນການ denoising ຕາມລັກສະນະຂອງສິ່ງລົບກວນແມ່ນເອີ້ນວ່າການຫຼຸດຜ່ອນສິ່ງລົບກວນ.
ການແກ້ໄຂການອຽງ
ເນື່ອງຈາກວ່າຜູ້ໃຊ້ທົ່ວໄປ, ເມື່ອຖ່າຍຮູບເອກະສານ, ມັນຍາກທີ່ຈະຖ່າຍຮູບຢ່າງສົມບູນຕາມແນວນອນແລະແນວຕັ້ງ, ດັ່ງນັ້ນຮູບພາບທີ່ຖ່າຍຈະຖືກບິດເບືອນຢ່າງຫລີກລ້ຽງໄດ້, ເຊິ່ງຕ້ອງການຊອບແວການປຸງແຕ່ງຮູບພາບເພື່ອແກ້ໄຂ.
ການປຸງແຕ່ງໄລຍະກາງ - ການວິເຄາະຮູບແບບ
ຂະບວນການແບ່ງຮູບພາບເອກະສານອອກເປັນວັກ ແລະສາຂາ ເອີ້ນວ່າ ການວິເຄາະຮູບແບບ.ເນື່ອງຈາກຄວາມຫຼາກຫຼາຍແລະຄວາມຊັບຊ້ອນຂອງເອກະສານຕົວຈິງ, ຂັ້ນຕອນນີ້ຍັງຕ້ອງໄດ້ຮັບການປັບປຸງໃຫ້ດີທີ່ສຸດ.
ການຕັດຕົວອັກສອນ
ເນື່ອງຈາກຂໍ້ຈໍາກັດຂອງເງື່ອນໄຂການຖ່າຍຮູບແລະການຂຽນ, ຕົວອັກສອນມັກຈະຕິດຢູ່ແລະປາກກາຖືກທໍາລາຍ.ການນໍາໃຊ້ຮູບພາບດັ່ງກ່າວໂດຍກົງສໍາລັບການວິເຄາະ OCR ຈະຈໍາກັດການປະຕິບັດ OCR ຢ່າງຫຼວງຫຼາຍ.ດັ່ງນັ້ນ, ການແບ່ງສ່ວນລັກສະນະແມ່ນຈໍາເປັນ, ນັ້ນແມ່ນ, ເພື່ອແຍກລັກສະນະທີ່ແຕກຕ່າງກັນ.
ການຮັບຮູ້ລັກສະນະ
ໃນໄລຍະຕົ້ນ, ການຈັບຄູ່ແບບແມ່ແບບຖືກນໍາໃຊ້ເປັນສ່ວນໃຫຍ່, ແລະໃນຂັ້ນຕອນຕໍ່ມາ, ການສະກັດເອົາຄຸນສົມບັດຖືກນໍາໃຊ້ເປັນສ່ວນໃຫຍ່.ເນື່ອງຈາກອິດທິພົນຂອງປັດໃຈເຊັ່ນ: ການຍ້າຍຂໍ້ຄວາມ, ຄວາມຫນາຂອງເສັ້ນເລືອດຕັນໃນ, ປາກກາທີ່ແຕກຫັກ, ການຍຶດຕິດ, ການຫມຸນ, ແລະອື່ນໆ, ຄວາມຫຍຸ້ງຍາກໃນການສະກັດເອົາຄຸນສົມບັດໄດ້ຮັບຜົນກະທົບຢ່າງຫຼວງຫຼາຍ.
ການຟື້ນຟູໂຄງຮ່າງ
ປະຊາຊົນຫວັງວ່າຂໍ້ຄວາມທີ່ຖືກຮັບຮູ້ຍັງຄົງຖືກຈັດລຽງຄືກັບຮູບເອກະສານຕົ້ນສະບັບ, ແລະວັກ, ຕໍາແຫນ່ງ, ແລະຄໍາສັ່ງຖືກສົ່ງອອກໄປຫາເອກະສານ Word, ເອກະສານ PDF, ແລະອື່ນໆ, ແລະຂະບວນການນີ້ເອີ້ນວ່າການຟື້ນຟູຮູບແບບ.
ການປຸງແຕ່ງຫຼັງຈາກນັ້ນ
ອີງຕາມການພົວພັນຂອງສະພາບການພາສາສະເພາະ, ຜົນໄດ້ຮັບການຮັບຮູ້ຖືກແກ້ໄຂ.
ຜົນຜະລິດ
ສົ່ງອອກຕົວອັກສອນທີ່ຮັບຮູ້ເປັນຂໍ້ຄວາມໃນຮູບແບບທີ່ແນ່ນອນ.
ຄໍາຮ້ອງສະຫມັກຂອງອຸປະກອນມືຖືໂດຍອີງໃສ່ເຕັກໂນໂລຢີ OCR ແມ່ນຫຍັງ?
ໂດຍຜ່ານ PDA terminal handheld ໂຫຼດດ້ວຍຊອບແວການຮັບຮູ້ລັກສະນະ OCR, ຄໍາຮ້ອງສະຫມັກ scene ຈໍານວນຫຼາຍສາມາດຮັບຮູ້ໄດ້, ເຊັ່ນ: ການຮັບຮູ້ປ້າຍທະບຽນລົດ, ການຮັບຮູ້ຈໍານວນຕູ້ຄອນເທນເນີ, ການນໍາເຂົ້າຊີ້ນງົວແລະ mutton ການຮັບຮູ້ປ້າຍນ້ໍາຫນັກ, ການຮັບຮູ້ພື້ນທີ່ເຄື່ອງຫນັງສືຜ່ານແດນສາມາດອ່ານໄດ້, ການຮັບຮູ້ການອ່ານແມັດໄຟຟ້າ. , steel coil ການຮັບຮູ້ລັກສະນະສີດພົ່ນ.
ເວລາປະກາດ: 16-11-2022