OCR ટેકનોલોજી શું છે?
ઓપ્ટિકલ કેરેક્ટર રેકગ્નિશન (અંગ્રેજી: Optical Character Recognition, OCR) એ ટેક્સ્ટ અને લેઆઉટની માહિતી મેળવવા માટે ટેક્સ્ટ સામગ્રીની ઇમેજ ફાઇલોનું વિશ્લેષણ અને ઓળખ કરવાની પ્રક્રિયાનો ઉલ્લેખ કરે છે.
ઇમેજ રેકગ્નિશન અને મશીન વિઝન ટેક્નોલોજીની જેમ, OCR ટેક્નોલોજીની પ્રોસેસિંગ પ્રક્રિયાને પણ ઇનપુટ, પ્રી-પ્રોસેસિંગ, મિડ-ટર્મ પ્રોસેસિંગ, પોસ્ટ-પ્રોસેસિંગ અને આઉટપુટ પ્રક્રિયામાં વિભાજિત કરવામાં આવે છે.
દાખલ કરો
વિવિધ ઇમેજ ફોર્મેટ માટે, વિવિધ સ્ટોરેજ ફોર્મેટ્સ અને વિવિધ કમ્પ્રેશન પદ્ધતિઓ છે.હાલમાં, OpenCV, CxImage, વગેરે છે.
પૂર્વ-પ્રક્રિયા - દ્વિસંગીકરણ
આજે ડિજિટલ કેમેરા દ્વારા લેવામાં આવતી મોટાભાગની તસવીરો રંગીન છબીઓ છે, જેમાં મોટી માત્રામાં માહિતી છે અને તે OCR ટેકનોલોજી માટે યોગ્ય નથી.
ચિત્રની સામગ્રી માટે, અમે તેને અગ્રભૂમિ અને પૃષ્ઠભૂમિમાં વિભાજિત કરી શકીએ છીએ.કોમ્પ્યુટરને ઝડપી બનાવવા અને OCR સંબંધિત ગણતરીઓ વધુ સારી રીતે કરવા માટે, આપણે સૌપ્રથમ કલર ઈમેજ પર પ્રક્રિયા કરવાની જરૂર છે, જેથી માત્ર અગ્રભૂમિની માહિતી અને પૃષ્ઠભૂમિની માહિતી ચિત્રમાં રહે.દ્વિસંગીકરણને "કાળા અને સફેદ" તરીકે પણ સમજી શકાય છે.
છબી અવાજ ઘટાડો
વિવિધ છબીઓ માટે, અવાજની વ્યાખ્યા અલગ હોઈ શકે છે, અને અવાજની લાક્ષણિકતાઓ અનુસાર ડિનોઈઝ કરવાની પ્રક્રિયાને અવાજ ઘટાડો કહેવામાં આવે છે.
ઝુકાવ કરેક્શન
કારણ કે સામાન્ય વપરાશકર્તાઓ, દસ્તાવેજોના ચિત્રો લેતી વખતે, આડી અને ઊભી ગોઠવણી સાથે સંપૂર્ણ રીતે શૂટ કરવું મુશ્કેલ છે, તેથી લીધેલા ચિત્રો અનિવાર્યપણે વિકૃત થઈ જશે, જેને સુધારવા માટે ઇમેજ પ્રોસેસિંગ સૉફ્ટવેરની જરૂર છે.
મધ્ય-ગાળાની પ્રક્રિયા - લેઆઉટ વિશ્લેષણ
દસ્તાવેજના ચિત્રોને ફકરા અને શાખાઓમાં વિભાજીત કરવાની પ્રક્રિયાને લેઆઉટ વિશ્લેષણ કહેવામાં આવે છે.વાસ્તવિક દસ્તાવેજોની વિવિધતા અને જટિલતાને લીધે, આ પગલાને હજુ પણ ઑપ્ટિમાઇઝ કરવાની જરૂર છે.
પાત્ર કાપવું
ફોટોગ્રાફિંગ અને લખવાની શરતોની મર્યાદાઓને લીધે, પાત્રો ઘણીવાર અટકી જાય છે અને પેન તૂટી જાય છે.OCR પૃથ્થકરણ માટે આવી ઈમેજોનો સીધો ઉપયોગ કરવાથી OCR પ્રદર્શનને મોટા પ્રમાણમાં મર્યાદિત કરવામાં આવશે.તેથી, અક્ષરોનું વિભાજન જરૂરી છે, એટલે કે, વિવિધ અક્ષરોને અલગ કરવા.
પાત્રની ઓળખ
પ્રારંભિક તબક્કામાં, ટેમ્પલેટ મેચિંગનો મુખ્યત્વે ઉપયોગ થતો હતો, અને પછીના તબક્કામાં, વિશેષતા નિષ્કર્ષણનો મુખ્યત્વે ઉપયોગ થતો હતો.ટેક્સ્ટ ડિસ્પ્લેસમેન્ટ, સ્ટ્રોકની જાડાઈ, તૂટેલી પેન, સંલગ્નતા, પરિભ્રમણ, વગેરે જેવા પરિબળોના પ્રભાવને લીધે, વિશેષતા નિષ્કર્ષણની મુશ્કેલી ખૂબ પ્રભાવિત થાય છે.
લેઆઉટ પુનઃસંગ્રહ
લોકો આશા રાખે છે કે માન્યતા પ્રાપ્ત ટેક્સ્ટ હજુ પણ મૂળ દસ્તાવેજ ચિત્રની જેમ ગોઠવાયેલ છે, અને ફકરા, સ્થિતિ અને ક્રમ વર્ડ દસ્તાવેજો, PDF દસ્તાવેજો વગેરેમાં આઉટપુટ છે, અને આ પ્રક્રિયાને લેઆઉટ પુનઃસ્થાપન કહેવામાં આવે છે.
પોસ્ટ પ્રોસેસિંગ
ચોક્કસ ભાષા સંદર્ભના સંબંધ અનુસાર, માન્યતા પરિણામ સુધારેલ છે.
આઉટપુટ
માન્ય અક્ષરોને ચોક્કસ ફોર્મેટમાં ટેક્સ્ટ તરીકે આઉટપુટ કરો.
OCR ટેક્નોલોજી પર આધારિત હેન્ડહેલ્ડ ટર્મિનલની એપ્લિકેશન્સ શું છે?
OCR કેરેક્ટર રેકગ્નિશન સોફ્ટવેર સાથે લોડ થયેલ હેન્ડહેલ્ડ ટર્મિનલ PDA દ્વારા, ઘણી બધી સીન એપ્લિકેશનો સાકાર કરી શકાય છે, જેમ કે: કાર લાયસન્સ પ્લેટ રેકગ્નિશન, કન્ટેનર નંબર રેકગ્નિશન, ઈમ્પોર્ટેડ બીફ અને મટન વેઈટ લેબલ રેકગ્નિશન, પાસપોર્ટ મશીન રીડેબલ એરિયા રેકગ્નિશન, ઇલેક્ટ્રિક મીટર રીડિંગ રેકગ્નિશન , સ્ટીલ કોઇલ સ્પ્રે કરેલા અક્ષરોની ઓળખ.
પોસ્ટનો સમય: નવેમ્બર-16-2022