Mikä on OCR-tekniikka?
Optinen merkintunnistus (englanniksi: Optical Character Recognition, OCR) viittaa tekstimateriaalien kuvatiedostojen analysointiin ja tunnistamiseen teksti- ja asettelutietojen saamiseksi.
Kuten kuvantunnistus- ja konenäköteknologiassa, myös OCR-tekniikan prosessointiprosessi on jaettu syöttö-, esikäsittely-, puolivälikäsittely-, jälkikäsittely- ja tulostusprosessiin.
tulla sisään
Eri kuvaformaateille on olemassa erilaisia tallennusmuotoja ja erilaisia pakkausmenetelmiä.Tällä hetkellä on olemassa OpenCV, CxImage jne.
Esikäsittely – binarisointi
Suurin osa digitaalikameroilla otetuista kuvista on nykyään värikuvia, jotka sisältävät valtavan määrän tietoa eivätkä sovellu OCR-tekniikkaan.
Kuvan sisällön osalta voimme yksinkertaisesti jakaa sen etualaan ja taustaan.Jotta tietokone olisi nopeampi ja suorittaisi paremmin OCR:ään liittyviä laskelmia, meidän on ensin käsiteltävä värikuva, jotta kuvaan jää vain etualan tiedot ja taustatiedot.Binarisointi voidaan ymmärtää myös yksinkertaisesti "mustavalkoiseksi".
kuvan kohinanvaimennus
Eri kuvissa kohinan määritelmä voi olla erilainen, ja kohinan ominaisuuksien mukaista kohinanvaimennusprosessia kutsutaan kohinan vähentämiseksi.
kallistuksen korjaus
Koska tavallisilla käyttäjillä asiakirjoja kuvattaessa on vaikea ottaa täysin linjassa vaaka- ja pystysuuntauksella, joten otetuista kuvista tulee väistämättä vinoja, minkä korjaaminen vaatii kuvankäsittelyohjelmiston.
Keskipitkän aikavälin käsittely – layout-analyysi
Asiakirjan kuvien jakamista kappaleisiin ja osiin kutsutaan asetteluanalyysiksi.Varsinaisten asiakirjojen monimuotoisuuden ja monimutkaisuuden vuoksi tämä vaihe on vielä optimoitava.
hahmon leikkaus
Valokuvaus- ja kirjoitusolosuhteiden rajoitusten vuoksi hahmot ovat usein jumissa ja kynät rikki.Tällaisten kuvien käyttäminen suoraan OCR-analyysiin rajoittaa huomattavasti OCR:n suorituskykyä.Siksi tarvitaan merkkien segmentointia eli erilaisten merkkien erottamista.
Hahmon tunnistus
Alkuvaiheessa käytettiin pääasiassa mallien sovittamista ja myöhemmässä vaiheessa pääosin ominaisuuspoimintaa.Tekstin siirtymisen, viivan paksuuden, rikkinäisen kynän, tarttuvuuden, pyörimisen jne. kaltaisten tekijöiden vaikutuksesta piirteiden poimimisen vaikeus vaikuttaa suuresti.
Asettelun restaurointi
Ihmiset toivovat, että tunnistettu teksti on edelleen järjestetty alkuperäisen asiakirjan kuvan tapaan ja kappaleet, paikat ja järjestys tulostetaan Word-asiakirjoihin, PDF-dokumentteihin jne., ja tätä prosessia kutsutaan asettelun palauttamiseksi.
jälkikäsittelyä
Tietyn kielikontekstin suhteen mukaan tunnistustulos korjataan.
ulostulo
Tulosta tunnistetut merkit tekstinä tietyssä muodossa.
Mitkä ovat OCR-tekniikkaan perustuvien käsipäätteiden sovellukset?
OCR-merkintunnistusohjelmistolla ladatun kämmenpäätteen PDA:n avulla voidaan toteuttaa monia kohtaussovelluksia, kuten: auton rekisterikilven tunnistus, konttinumeroiden tunnistus, tuodun naudan- ja lampaanlihan painon tunnistus, passin koneellisesti luettavan alueen tunnistus, sähkömittarin lukemisen tunnistus , teräskela Suihkutettujen merkkien tunnistus.
Postitusaika: 16.11.2022