וואָס איז OCR טעכנאָלאָגיע?
אָפּטיש כאַראַקטער דערקענונג (ענגליש: Optical Character Recognition, OCR) רעפערס צו דעם פּראָצעס פון אַנאַלייזינג און דערקענען בילד טעקעס פון טעקסט מאַטעריאַלס צו קריגן טעקסט און אויסלייג אינפֿאָרמאַציע.
ענלעך צו בילד דערקענונג און מאַשין זעאונג טעכנאָלאָגיע, די פּראַסעסינג פּראָצעס פון OCR טעכנאָלאָגיע איז אויך צעטיילט אין אַרייַנשרייַב, פאַר-פּראַסעסינג, מיטן-טערמין פּראַסעסינג, פּאָסטן-פּראַסעסינג און רעזולטאַט פּראָצעס.
אַרייַן
פֿאַר פאַרשידענע בילד פֿאָרמאַטירונגען, עס זענען פאַרשידענע סטאָרידזש פֿאָרמאַטירונגען און פאַרשידענע קאַמפּרעשאַן מעטהאָדס.דערווייַל עס זענען OpenCV, CxImage, עטק.
פאַר-פּראַסעסינג - בינאַריזאַטיאָן
רובֿ פון די בילדער גענומען דורך דיגיטאַל קאַמעראַס הייַנט זענען קאָליר בילדער, וואָס אַנטהאַלטן אַ ריזיק סומע פון אינפֿאָרמאַציע און זענען נישט פּאַסיק פֿאַר OCR טעכנאָלאָגיע.
פֿאַר די אינהאַלט פון די בילד, מיר קענען פשוט טיילן עס אין פאָרגראַונד און הינטערגרונט.אין סדר צו מאַכן די קאָמפּיוטער פאַסטער און בעסער דורכפירן OCR פֿאַרבונדענע חשבונות, מיר דאַרפֿן צו פּראָצעס די קאָליר בילד ערשטער, אַזוי אַז בלויז די פאָרגראַונד אינפֿאָרמאַציע און הינטערגרונט אינפֿאָרמאַציע בלייבן אין די בילד.בינאַריזאַטיאָן קענען אויך זיין פשוט פארשטאנען ווי "שוואַרץ און ווייַס".
בילד ראַש רעדוקציע
פֿאַר פאַרשידענע בילדער, די דעפֿיניציע פון ראַש קען זיין אַנדערש, און דער פּראָצעס פון דענאָיסינג לויט די קעראַקטעריסטיקס פון ראַש איז גערופן ראַש רעדוקציע.
טילט קערעקשאַן
ווייַל פּראָסט ניצערס, ווען גענומען בילדער פון דאָקומענטן, עס איז שווער צו דרייען גאָר אין שורה מיט האָריזאָנטאַל און ווערטיקאַל אַליינמאַנט, אַזוי די בילדער גענומען ינעוואַטאַבלי זיין סקיוד, וואָס ריקווייערז בילד פּראַסעסינג ווייכווארג צו ריכטיק.
מיד-טערמין פּראַסעסינג - אויסלייג אַנאַליסיס
דער פּראָצעס פון צעטיילן דאָקומענט בילדער אין פּאַראַגראַפס און צווייגן איז גערופן אויסלייג אַנאַליסיס.רעכט צו דער דייווערסיטי און קאַמפּלעקסיטי פון פאַקטיש דאָקומענטן, דעם שריט נאָך דאַרף זיין אָפּטימיזעד.
כאַראַקטער קאַטינג
רעכט צו די לימיטיישאַנז פון פאָטאָגראַפיע און שרייבן טנאָים, אותיות זענען אָפט סטאַק און פּענס זענען צעבראכן.גלייך ניצן אַזאַ בילדער פֿאַר OCR אַנאַליסיס וועט זייער באַגרענעצן די OCR פאָרשטעלונג.דעריבער, כאַראַקטער סעגמאַנטיישאַן איז פארלאנגט, דאָס איז, צו באַזונדער פאַרשידענע אותיות.
כאַראַקטער דערקענונג
אין דער פרי בינע, מוסטער וואָס ריכטן איז דער הויפּט געניצט, און אין די שפּעטער בינע, שטריך יקסטראַקשאַן איז דער הויפּט געניצט.רעכט צו דער השפּעה פון סיבות אַזאַ ווי טעקסט דיספּלייסמאַנט, מאַך גרעב, צעבראכן פעדער, אַדכיזשאַן, ראָוטיישאַן, אאז"ו ו, די שוועריקייט פון שטריך יקסטראַקשאַן איז זייער אַפעקטאַד.
אויסלייג רעסטעריישאַן
מענטשן האָפן אַז דער דערקענט טעקסט איז נאָך עריינדזשד ווי דער אָריגינעל דאָקומענט בילד, און די פּאַראַגראַפס, שטעלעס און סדר זענען רעזולטאַט צו וואָרט דאָקומענטן, פּדף דאָקומענטן, אאז"ו ו, און דער פּראָצעס איז גערופן אויסלייג רעסטעריישאַן.
פּאָסטן פּראַסעסינג
לויט די שייכות פון ספּעציפיש שפּראַך קאָנטעקסט, דער דערקענונג רעזולטאַט איז קערעקטאַד.
רעזולטאַט
רעזולטאַט די דערקענט אותיות ווי טעקסט אין אַ זיכער פֿאָרמאַט.
וואָס זענען די אַפּלאַקיישאַנז פון כאַנדכעלד טערמינאַלס באזירט אויף OCR טעכנאָלאָגיע?
דורך די כאַנדכעלד וואָקזאַל פּדאַ לאָודיד מיט OCR כאַראַקטער דערקענונג ווייכווארג, פילע סצענע אַפּלאַקיישאַנז קענען זיין איינגעזען, אַזאַ ווי: מאַשין דערלויבעניש טעלער דערקענונג, קאַנטיינער נומער דערקענונג, ימפּאָרטיד רינדערנס און שעפּסנפלייש וואָג פירמע דערקענונג, פּאַס מאַשין-ליינעוודיק געגנט דערקענונג, עלעקטריק מעטער לייענען דערקענונג , שטאָל שפּול דערקענונג פון ספּרייד אותיות.
פּאָסטן צייט: נאוועמבער 16-2022