Ձեռագիր տեքստի ճանաչում

Ձեռագիր տեքստի ճանաչումը համակարգչային հնարավորություն է, որը թույլ է տալիս ստանալ և թարգմանել տեքստը գրավոր փաստաթղթերից, լուսանկարներից, թաչ֊սքրին էկրաններից և այլ սարքրից։ Տեքստի ճանաչումը կարող է կատարվել «օֆլայն» մեթոդով, որը գրված է թղթի վրա գրված տեքստից կամ «առցանց» եղանակով, հաշվի առնելով գրիչի կամ մատի ծայրի շարժումները, օրինակ, հատուկ համակարգչի էկրանին մակերեսին[1]։
Առցանց ճանաչում[խմբագրել | խմբագրել կոդը]
Առցանց ճանաչման ինտերֆեյսը սովորաբար բաղկացած է հետևյալից.
- գրիչ կամ ստիլուս, որով օգտագործողը կատարում է մուտք
- մակերես, որը զգայուն է հպումներին և որը ինտեգրվում է էկրանին
- ծրագրային ապահովում, որը վերծանում է սթայլուս֊ի շարժումները գրվող մակերեսի վրա, թարգմանելով տողերը թվային տեքստում
- Handwriting ճանաչումը լայնորեն կիրառվում է գրպանի համակարգիչ (pocket PC)-ներում։
Առաջին ձեռագրերը ճանաչող առաջին pocket PC- ն Apple Newton- ն է։
Օպտիկական նիշերի ճանաչումը (OCR) ձեռագրերի ճանաչման համար օգտագործվող ամենատարածված մեթոդն է։ Սա կատարվում է փաստաթղթի տեքստի սկանավորումով։ Այն աշխատում է նաև ձեռքով գրված տեքստի նկարի համար[2]։
Անցանց (offline) ճանաչում[խմբագրել | խմբագրել կոդը]
Այս ճանաչման տեսակը համարվում է ավելի բարդ, քան առցանցն է։ Անցանց ճանաչումը պահանջում է մարդու կողմից կատարվող դասընթաց կամ պատրաստի ուսուցման նմուշ։ Նման մեխանիզմը կիրառվում է ABBYY FineReader-ում ։ Ճանաչման որակը կարող է բարելավվել `օգտագործելով կառուցվածքային փաստաթղթեր ։ Բացի այդ, դուք կարող եք բարելավել որակը, նվազեցնելով հնարավոր մուտքագրման նիշերը։ Offline ճանաչումը օգտագործվում է այն տարածքներում, որտեղ անհրաժեշտ է մշակել բազմաթիվ ձեռագիր փաստաթղթեր, օրինակ, ապահովագրական ընկերություններում։
1990-ականների սկզբին սարքավորումների արտադրողները, ներառյալ NCR, IBM-ը և EO-ն, սկսեցին արտադրել GO Corp-ի կողմից մշակված պլանշետային համակարգիչներ, որոնք պարունակում էին PenPoint օպերացիոն համակարգ։ PenPoint-ը թույլ է տալիս օգտագործել ձեռագիր գրվածք ամբողջ ընթացքում և ապահովել երրորդ կողմի ծրագրակազմի համատեղելիությունը։ IBM- ի Tablet PC-ն առաջինն էր, որ օգտագործեց ThinkPad-ը և IBM-ի ձեռագրերի ճանաչումը։ Այս ճանաչման համակարգը հետագայում օգտագործվեց Microsoft Windows-ում, Pen Computing-ի և IBM-ի Pen OS / 2-ի համար։ Այս տեխնոլոգիաներից ոչ մեկը առևտրային տեսանկյունից հաջող չէր։ Ժամանակակից ձեռագրերի ճանաչման համակարգը ներառված է պլանշետային համակարգիչներում օգտագործվող Microsoft օպերացիոն համակարգերում (Windows XP Tablet PC Edition և Windows Vista): Այն հիմնված է Մայքրոսոֆթ-ի կողմից ստեղծված «Inferno» TDNN դասակարգչի վրա։
Ձեռագրքի ճանաչումը ունի ակադեմիական ակտիվ համայնք, որն ուսումնասիրում է այն։ Ձեռագրքի ճանաչման ամենամեծ կոնֆերանսներից է` ձեռագրերի ճանաչման սահմանապահների միջազգային կոնֆերանսը[3] և Փաստաթղթերի վերլուծության և ճանաչման միջազգային համաժողովը (ICDAR): Երկու կոնֆերանսները հավանության են արժանացել IEEE-ի և IAPR-ի կողմից։ Հետազոտության ակտիվ ոլորտներն են` * Առցանց ճանաչում
- Անցանց ճանաչում
- Ստորագրությունների հաստատում
- Փոստային հասցեի մեկնաբանություն
- Բանկի ստուգման գործընթացներ գրողի ճանաչում
Ծանոթագրություններ[խմբագրել | խմբագրել կոդը]
- ↑ «Handwriting recognition» (անգլերեն)։ 2018-11-02
- ↑ Chung Jonathan (2018-09-04)։ «Handwriting OCR: handwriting recognition and language modeling with MXNet Gluon»։ Medium։ Վերցված է 2019-01-08
- ↑ ICFHR