Технологияи OCR чист?
Шинохти оптикии характер (англисӣ: Optical Character Recognition, OCR) ба раванди таҳлил ва шинохти файлҳои тасвирии маводи матнӣ барои ба даст овардани иттилооти матн ва тарҳбандӣ дахл дорад.
Монанди шинохти тасвир ва технологияи биниши мошин, раванди коркарди технологияи OCR низ ба воридот, коркарди пешакӣ, коркарди миёнамӯҳлат, коркарди пас аз коркард ва баромад тақсим мешавад.
ворид кунед
Барои форматҳои гуногуни тасвир, форматҳои гуногуни нигоҳдорӣ ва усулҳои гуногуни фишурдакунӣ мавҷуданд.Дар айни замон, OpenCV, CxImage ва ғайра мавҷуданд.
Пеш аз коркард - бинаризатсия
Аксари расмҳои аз ҷониби камераҳои рақамӣ гирифташуда тасвирҳои ранга мебошанд, ки миқдори зиёди иттилоотро дар бар мегиранд ва барои технологияи OCR мувофиқ нестанд.
Барои мундариҷаи тасвир, мо метавонем онро ба замина ва замина тақсим кунем.Барои он ки компютер тезтар ва беҳтар иҷро кардани ҳисобҳои марбут ба OCR, мо бояд аввал тасвири рангаро коркард кунем, то дар расм танҳо иттилооти замина ва маълумоти замина боқӣ монад.Бинаризатсияро ба таври оддӣ ҳамчун "сиёҳ ва сафед" фаҳмидан мумкин аст.
кам кардани садои тасвир
Барои тасвирҳои гуногун таърифи садо метавонад гуногун бошад ва раванди безараргардонӣ аз рӯи хусусиятҳои садо коҳиши садо номида мешавад.
ислоҳи майл
Зеро корбарони оддӣ ҳангоми гирифтани аксҳои ҳуҷҷатҳо, ба пуррагӣ мувофиқ кардани уфуқӣ ва амудӣ сабт кардан душвор аст, аз ин рӯ аксҳои гирифташуда ҳатман каҷ мешаванд, ки барои ислоҳи нармафзори коркарди тасвир ниёз дорад.
Коркарди миёнамӯҳлат - таҳлили тарҳ
Раванди тақсими тасвирҳои ҳуҷҷат ба параграфҳо ва шохаҳо таҳлили макет номида мешавад.Аз сабаби гуногунрангӣ ва мураккабии ҳуҷҷатҳои воқеӣ, ин қадам ҳоло ҳам бояд оптимизатсия карда шавад.
буридани аломат
Аз сабаби маҳдудияти шароити аксбардорӣ ва навиштан, персонажҳо аксар вақт часпида, қалам шикаста мешавад.Истифодаи мустақими чунин тасвирҳо барои таҳлили OCR иҷрои OCR-ро хеле маҳдуд мекунад.Аз ин рӯ, сегментатсияи аломатҳо, яъне ҷудо кардани аломатҳои гуногун талаб карда мешавад.
Шинохти аломат
Дар марҳилаи ибтидоӣ асосан мувофиқати шаблон ва дар марҳилаи баъдӣ асосан истихроҷи хусусият истифода мешуд.Аз сабаби таъсири омилҳо ба монанди ҷойивазкунии матн, ғафсии зарба, қалами шикаста, пайвастшавӣ, гардиш ва ғайра, ба мушкилии истихроҷи хусусиятҳо хеле таъсир мерасонад.
Барқарорсозии тарҳ
Одамон умедворанд, ки матни эътирофшуда ҳамчун тасвири аслии ҳуҷҷат ҷойгир карда мешавад ва параграфҳо, мавқеъҳо ва тартиб ба ҳуҷҷатҳои Word, ҳуҷҷатҳои PDF ва ғайра бароварда мешаванд ва ин раванд барқарорсозии тарҳ номида мешавад.
коркарди баъди
Мувофиқи муносибати контексти мушаххаси забон, натиҷаи эътироф ислоҳ карда мешавад.
баромад
Аломатҳои эътирофшударо ҳамчун матн дар формати муайян бароварда кунед.
Истифодаи терминалҳои дастӣ дар асоси технологияи OCR кадомҳоянд?
Тавассути терминали дастии PDA, ки бо нармафзори шинохти аломатҳои OCR бор карда шудааст, бисёр замимаҳои саҳнаро амалӣ кардан мумкин аст, ба монанди: шинохти рақами рақами мошин, шинохти рақами контейнер, шинохти тамғаи вазни гӯшти гов ва гӯсфанд, шинохти майдони аз ҷониби мошин хондашавандаи шиноснома, шинохти хондани ҳисобкунакҳои барқ , coil пӯлод Шиносоии аломатҳои пошидашуда.
Вақти фиристодан: Ноябр-16-2022