Dè a th’ ann an teicneòlas OCR?
Tha Aithneachadh Caractaran Optigeach (Beurla: Optical Character Recognition, OCR) a’ toirt iomradh air a’ phròiseas airson mion-sgrùdadh agus aithneachadh faidhlichean ìomhaigh de stuthan teacsa gus fiosrachadh teacsa agus cruth fhaighinn.
Coltach ri aithneachadh ìomhaigh agus teicneòlas lèirsinn inneal, tha pròiseas giollachd teicneòlas OCR cuideachd air a roinn ann an cuir a-steach, ro-ghiollachd, giullachd meadhan-ùine, iar-ghiollachd agus toradh.
steach
Airson diofar chruthan ìomhaigh, tha diofar chruthan stòraidh ann agus diofar dhòighean teannachaidh.An-dràsta, tha OpenCV, CxImage, msaa.
Ro-ghiollachd - binarization
Tha a’ mhòr-chuid de na dealbhan a thog camarathan didseatach an-diugh nan ìomhaighean dathte, anns a bheil tòrr fiosrachaidh agus nach eil freagarrach airson teicneòlas OCR.
Airson susbaint an deilbh, is urrainn dhuinn dìreach a roinn ann an aghaidh agus cùl-raon.Gus an coimpiutair a dhèanamh nas luaithe agus nas fheàrr a dhèanamh àireamhachadh co-cheangailte ri OCR, feumaidh sinn an ìomhaigh dath a phròiseasadh an toiseach, gus nach bi ach am fiosrachadh aghaidh agus cùl-fhiosrachadh fhathast san dealbh.Faodar binarization a thuigsinn gu sìmplidh mar “dubh is geal”.
lughdachadh fuaim ìomhaigh
Airson diofar dhealbhan, faodaidh am mìneachadh air fuaim a bhith eadar-dhealaichte, agus canar lughdachadh fuaim ris a’ phròiseas diùltadh a rèir feartan fuaim.
ceartachadh teilt
Leis gu bheil luchd-cleachdaidh àbhaisteach, nuair a bhios iad a’ togail dhealbhan de sgrìobhainnean, tha e duilich losgadh gu tur a rèir co-thaobhadh còmhnard is inghearach, agus mar sin tha e do-sheachanta gum bi na dealbhan a thèid a thogail air an sgàineadh, a dh’ fheumas bathar-bog giullachd ìomhaighean a cheartachadh.
Giullachd meadhan-ùine - mion-sgrùdadh cruth
Canar mion-sgrùdadh cruth ris a’ phròiseas airson dealbhan sgrìobhainn a roinn ann am paragrafan agus meuran.Air sgàth iomadachd agus iom-fhillteachd nan sgrìobhainnean fìor, feumar an ceum seo a mheudachadh fhathast.
gearradh caractar
Air sgàth cho beag ‘s a tha suidheachadh togail dhealbhan is sgrìobhaidh, bidh caractaran gu tric glaiste agus bidh pinn briste.Le bhith a’ cleachdadh ìomhaighean mar seo gu dìreach airson mion-sgrùdadh OCR, cuiridh sin gu mòr bacadh air coileanadh OCR.Mar sin, tha feum air sgaradh charactaran, is e sin, gus caractaran eadar-dhealaichte a sgaradh.
Aithneachadh caractar
Anns an ìre thràth, bhathas a’ cleachdadh maidseadh teamplaid sa mhòr-chuid, agus aig an ìre as fhaide air adhart, chaidh às-tharraing feart a chleachdadh sa mhòr-chuid.Air sgàth buaidh fhactaran leithid gluasad teacsa, tiugh stròc, peann briste, adhesion, cuairteachadh, msaa, tha buaidh mhòr air an duilgheadas a thaobh toirt a-mach feart.
Ath-nuadhachadh cruth
Tha daoine an dòchas gu bheil an teacsa aithnichte fhathast air a rèiteachadh mar an dealbh sgrìobhainn tùsail, agus tha na paragrafan, na dreuchdan agus an òrdugh air an cur a-mach gu sgrìobhainnean Word, sgrìobhainnean PDF, msaa, agus canar ath-nuadhachadh cruth ris a’ phròiseas seo.
post-giollachd
A rèir an dàimh eadar co-theacsa cànain sònraichte, tha toradh an aithneachaidh air a cheartachadh.
toradh
Cuir a-mach na caractaran aithnichte mar theacsa ann an cruth sònraichte.
Dè na tagraidhean a th’ aig ionadan-làimhe stèidhichte air teicneòlas OCR?
Tro cheann-uidhe inneal-làimhe PDA air a luchdachadh le bathar-bog aithne caractar OCR, faodar mòran thagraidhean seallaidh a thoirt gu buil, leithid: aithneachadh plàta cead càr, aithneachadh àireamh container, aithneachadh leubail cuideam mairtfheòil is caoirich air a thoirt a-steach, aithneachadh sgìre a ghabhas leughadh le inneal cead-siubhail, aithneachadh leughadh meatair dealain , coil stàilinn Aithneachadh air caractaran spèigeach.
Ùine puist: Samhain-16-2022