Teknolojiya OCR çi ye?
Naskirina Karaktera Optîkî (bi Îngilîzî: Optical Character Recognition, OCR) pêvajoya analîzkirin û naskirina pelên wêneyê yên materyalên nivîsê ji bo bidestxistina agahdariya nivîs û sêwiranê vedibêje.
Mîna teknolojiya naskirina wêneyê û dîtina makîneyê, pêvajoya pêvajoyê ya teknolojiya OCR jî di nav pêvajoya têketinê, pêş-pêvajoyê, pêvajoya navîn, paş-pêvajo û hilberînê de tê dabeş kirin.
derbasbûn
Ji bo formên cûda yên wêneyê, formên hilanînê yên cihêreng û awayên cûda yên berhevkirinê hene.Heya niha, OpenCV, CxImage, hwd hene.
Pre-processing - binarîzekirin
Piraniya wêneyên ku îro ji hêla kamerayên dîjîtal ve têne kişandin wêneyên rengîn in, ku di nav wan de gelek agahdarî hene û ji bo teknolojiya OCR ne guncan in.
Ji bo naveroka wêneyê, em dikarin bi tenê li pêş û paşperdeyê dabeş bikin.Ji bo ku em komputer zûtir û çêtir hesabên têkildar ên OCR-ê pêk bînin, pêdivî ye ku em pêşî wêneyê rengîn bişopînin, da ku tenê agahdariya pêşîn û agahdariya paşîn di wêneyê de bimîne.Binarîzasyon dikare bi hêsanî wekî "reş û spî" jî were fêm kirin.
kêmkirina dengê wêneyê
Ji bo wêneyên cihêreng, dibe ku pênaseya dengan cûda be, û ji pêvajoya derxistina dengan re li gorî taybetmendiyên dengbêjiyê kêmkirina deng tê gotin.
rastkirina tilt
Ji ber ku bikarhênerên asayî, dema ku wêneyên belgeyan digirin, dijwar e ku meriv bi tevahî li gorî hevrêziya horizontî û vertîkal bikişîne, ji ber vê yekê wêneyên ku têne kişandin dê bê guman werin qewirandin, ku ji bo rastkirina nermalava hilberandina wêneyê hewce dike.
Pêvajoya navîn - analîza sêwiranê
Pêvajoya dabeşkirina wêneyên belgeyê li paragraf û şaxan jê re analîza sêwiranê tê gotin.Ji ber cihêrengî û tevliheviya belgeyên rastîn, ev gav hîn jî pêdivî ye ku were xweş kirin.
birrîna karakter
Ji ber sînorên şert û mercên wênekêşî û nivîsandinê, karakter bi gelemperî asê dibin û pênûs têne şikandin.Bi rasterast karanîna wêneyên weha ji bo analîza OCR-ê dê performansa OCR-ê pir sînordar bike.Ji ber vê yekê, dabeşkirina karakteran pêdivî ye, ango ji hev veqetandina tîpên cihêreng.
Naskirina karakter
Di qonaxa destpêkê de, lihevhatina şablonê bi gelemperî hate bikar anîn, û di qonaxa paşîn de, derxistina taybetmendiyê bi giranî hate bikar anîn.Ji ber bandora faktorên wekî jicîhûwarkirina nivîsê, stûrbûna lêdanê, pênûsa şikestî, adhezîn, zivirandin û hwd., dijwariya derxistina taybetmendiyê pir bandor dike.
Restorasyona Layout
Mirov hêvî dikin ku metna naskirî hîn jî mîna wêneya belgeya orîjînal were rêz kirin, û paragraf, pozîsyon û rêzik li belgeyên Word, belgeyên PDF, hwd têne derxistin, û ji vê pêvajoyê re restorasyona layout tê gotin.
piştî pêvajoyê
Li gorî pêwendiya naveroka zimanî ya taybetî, encama naskirinê tê rast kirin.
karûabr
Karakterên naskirî wekî metnek bi rengek diyar derxînin.
Serîlêdanên termînalên destan ên li ser bingeha teknolojiya OCR çi ne?
Bi navgîniya PDA-ya destan a ku bi nermalava naskirina karakterê OCR-ê ve hatî barkirin, gelek sepanên dîmenê dikarin werin fêhm kirin, wek: naskirina plaqeya otomobîlê, naskirina hejmara konteynerê, naskirina etîketa giraniya goşt û goştê pez, nasîna devera ku bi makîne-xwendina pasaportê ve tê xwendin, naskirina xwendina metreya elektrîkê. , coil pola Naskirina tîpan sprayed.
Dema şandinê: Nov-16-2022