OCR టెక్నాలజీ అంటే ఏమిటి?
ఆప్టికల్ క్యారెక్టర్ రికగ్నిషన్ (ఇంగ్లీష్: ఆప్టికల్ క్యారెక్టర్ రికగ్నిషన్, OCR) అనేది టెక్స్ట్ మరియు లేఅవుట్ సమాచారాన్ని పొందేందుకు టెక్స్ట్ మెటీరియల్స్ యొక్క ఇమేజ్ ఫైల్లను విశ్లేషించడం మరియు గుర్తించడం అనే ప్రక్రియను సూచిస్తుంది.
ఇమేజ్ రికగ్నిషన్ మరియు మెషిన్ విజన్ టెక్నాలజీ లాగానే, OCR టెక్నాలజీ ప్రాసెసింగ్ ప్రక్రియ కూడా ఇన్పుట్, ప్రీ-ప్రాసెసింగ్, మిడ్-టర్మ్ ప్రాసెసింగ్, పోస్ట్-ప్రాసెసింగ్ మరియు అవుట్పుట్ ప్రాసెస్గా విభజించబడింది.
ఎంటర్
విభిన్న ఇమేజ్ ఫార్మాట్ల కోసం, విభిన్న నిల్వ ఫార్మాట్లు మరియు విభిన్న కంప్రెషన్ పద్ధతులు ఉన్నాయి.ప్రస్తుతం, OpenCV, CxImage మొదలైనవి ఉన్నాయి.
ప్రీ-ప్రాసెసింగ్ - బైనరైజేషన్
నేడు డిజిటల్ కెమెరాల ద్వారా తీసిన చిత్రాలలో చాలా వరకు రంగు చిత్రాలు ఉన్నాయి, ఇవి భారీ మొత్తంలో సమాచారాన్ని కలిగి ఉంటాయి మరియు OCR సాంకేతికతకు తగినవి కావు.
చిత్రం యొక్క కంటెంట్ కోసం, మేము దానిని ముందు మరియు నేపథ్యంగా విభజించవచ్చు.కంప్యూటర్ను వేగవంతం చేయడానికి మరియు OCR సంబంధిత గణనలను మెరుగ్గా నిర్వహించడానికి, మేము ముందుగా రంగు చిత్రాన్ని ప్రాసెస్ చేయాలి, తద్వారా ముందుభాగం సమాచారం మరియు నేపథ్య సమాచారం మాత్రమే చిత్రంలో ఉంటాయి.బైనరైజేషన్ అనేది "నలుపు మరియు తెలుపు" అని కూడా అర్థం చేసుకోవచ్చు.
చిత్రం శబ్దం తగ్గింపు
వేర్వేరు చిత్రాల కోసం, శబ్దం యొక్క నిర్వచనం భిన్నంగా ఉండవచ్చు మరియు శబ్దం యొక్క లక్షణాల ప్రకారం డీనోయిజింగ్ ప్రక్రియను నాయిస్ రిడక్షన్ అంటారు.
వంపు దిద్దుబాటు
ఎందుకంటే సాధారణ వినియోగదారులు, పత్రాల చిత్రాలను తీసేటప్పుడు, క్షితిజ సమాంతర మరియు నిలువు సమలేఖనానికి అనుగుణంగా పూర్తిగా చిత్రీకరించడం కష్టం, కాబట్టి తీసిన చిత్రాలు అనివార్యంగా వక్రీకరించబడతాయి, దీనికి ఇమేజ్ ప్రాసెసింగ్ సాఫ్ట్వేర్ సరిదిద్దాలి.
మధ్య-కాల ప్రాసెసింగ్ - లేఅవుట్ విశ్లేషణ
డాక్యుమెంట్ చిత్రాలను పేరాలు మరియు శాఖలుగా విభజించే ప్రక్రియను లేఅవుట్ విశ్లేషణ అంటారు.వాస్తవ పత్రాల వైవిధ్యం మరియు సంక్లిష్టత కారణంగా, ఈ దశను ఇంకా ఆప్టిమైజ్ చేయాలి.
పాత్ర కోత
ఫోటో తీయడం మరియు వ్రాసే పరిస్థితుల పరిమితుల కారణంగా, అక్షరాలు తరచుగా ఇరుక్కుపోతాయి మరియు పెన్నులు విరిగిపోతాయి.OCR విశ్లేషణ కోసం అటువంటి చిత్రాలను నేరుగా ఉపయోగించడం OCR పనితీరును బాగా పరిమితం చేస్తుంది.కాబట్టి, అక్షర విభజన అవసరం, అంటే, విభిన్న అక్షరాలను వేరు చేయడం.
పాత్ర గుర్తింపు
ప్రారంభ దశలో, టెంప్లేట్ మ్యాచింగ్ ప్రధానంగా ఉపయోగించబడింది మరియు తరువాతి దశలో, ఫీచర్ వెలికితీత ప్రధానంగా ఉపయోగించబడింది.వచన స్థానభ్రంశం, స్ట్రోక్ మందం, విరిగిన పెన్, సంశ్లేషణ, భ్రమణం మొదలైన కారకాల ప్రభావం కారణంగా, ఫీచర్ వెలికితీత యొక్క కష్టం బాగా ప్రభావితమవుతుంది.
లేఅవుట్ పునరుద్ధరణ
గుర్తించబడిన వచనం ఇప్పటికీ అసలు పత్రం చిత్రం వలె అమర్చబడిందని మరియు పేరాగ్రాఫ్లు, స్థానాలు మరియు ఆర్డర్ వర్డ్ డాక్యుమెంట్లు, PDF పత్రాలు మొదలైన వాటికి అవుట్పుట్ అవుతాయని ప్రజలు ఆశిస్తున్నారు మరియు ఈ ప్రక్రియను లేఅవుట్ పునరుద్ధరణ అంటారు.
శుద్ధి చేయబడిన తరువాత
నిర్దిష్ట భాషా సందర్భం యొక్క సంబంధం ప్రకారం, గుర్తింపు ఫలితం సరిదిద్దబడింది.
అవుట్పుట్
గుర్తించబడిన అక్షరాలను నిర్దిష్ట ఆకృతిలో టెక్స్ట్గా అవుట్పుట్ చేయండి.
OCR సాంకేతికత ఆధారంగా హ్యాండ్హెల్డ్ టెర్మినల్స్ యొక్క అప్లికేషన్లు ఏమిటి?
OCR క్యారెక్టర్ రికగ్నిషన్ సాఫ్ట్వేర్తో లోడ్ చేయబడిన హ్యాండ్హెల్డ్ టెర్మినల్ PDA ద్వారా, కారు లైసెన్స్ ప్లేట్ గుర్తింపు, కంటైనర్ నంబర్ రికగ్నిషన్, దిగుమతి చేసుకున్న బీఫ్ మరియు మటన్ వెయిట్ లేబుల్ రికగ్నిషన్, పాస్పోర్ట్ మెషిన్-రీడబుల్ ఏరియా రికగ్నిషన్, ఎలక్ట్రిక్ మీటర్ రీడింగ్ రికగ్నిషన్ వంటి అనేక సీన్ అప్లికేషన్లను గ్రహించవచ్చు. , స్టీల్ కాయిల్ స్ప్రే చేసిన పాత్రల గుర్తింపు.
పోస్ట్ సమయం: నవంబర్-16-2022