Ձեռագիր տեքստի ճանաչում

Վիքիպեդիայից՝ ազատ հանրագիտարանից

Ձեռագիր տեքստի ճանաչումը համակարգչային հնարավորություն է, որը թույլ է տալիս ստանալ և թարգմանել տեքստը գրավոր փաստաթղթերից, լուսանկարներից, թաչ֊սքրին էկրաններից և այլ սարքրից։ Տեքստի ճանաչումը կարող է կատարվել «օֆլայն» մեթոդով, որը գրված է թղթի վրա գրված տեքստից կամ «առցանց» եղանակով, հաշվի առնելով գրիչի կամ մատի ծայրի շարժումները, օրինակ, հատուկ համակարգչի էկրանին մակերեսին[1]։

Առցանց ճանաչում[խմբագրել | խմբագրել կոդը]

Առցանց ճանաչման ինտերֆեյսը սովորաբար բաղկացած է հետևյալից.

  • գրիչ կամ ստիլուս, որով օգտագործողը կատարում է մուտք
  • մակերես, որը զգայուն է հպումներին և որը ինտեգրվում է էկրանին
  • ծրագրային ապահովում, որը վերծանում է սթայլուս֊ի շարժումները գրվող մակերեսի վրա, թարգմանելով տողերը թվային տեքստում
  • Handwriting ճանաչումը լայնորեն կիրառվում է գրպանի համակարգիչ (pocket PC)-ներում։

Առաջին ձեռագրերը ճանաչող առաջին pocket PC- ն Apple Newton- ն է։

Օպտիկական նիշերի ճանաչումը (OCR) ձեռագրերի ճանաչման համար օգտագործվող ամենատարածված մեթոդն է։ Սա կատարվում է փաստաթղթի տեքստի սկանավորումով։ Այն աշխատում է նաև ձեռքով գրված տեքստի նկարի համար[2]։

Անցանց (offline) ճանաչում[խմբագրել | խմբագրել կոդը]

Այս ճանաչման տեսակը համարվում է ավելի բարդ, քան առցանցն է։ Անցանց ճանաչումը պահանջում է մարդու կողմից կատարվող դասընթաց կամ պատրաստի ուսուցման նմուշ։ Նման մեխանիզմը կիրառվում է ABBYY FineReader-ում ։ Ճանաչման որակը կարող է բարելավվել `օգտագործելով կառուցվածքային փաստաթղթեր ։ Բացի այդ, դուք կարող եք բարելավել որակը, նվազեցնելով հնարավոր մուտքագրման նիշերը։ Offline ճանաչումը օգտագործվում է այն տարածքներում, որտեղ անհրաժեշտ է մշակել բազմաթիվ ձեռագիր փաստաթղթեր, օրինակ, ապահովագրական ընկերություններում։

1990-ականների սկզբին սարքավորումների արտադրողները, ներառյալ NCR, IBM-ը և EO-ն, սկսեցին արտադրել GO Corp-ի կողմից մշակված պլանշետային համակարգիչներ, որոնք պարունակում էին PenPoint օպերացիոն համակարգ։ PenPoint-ը թույլ է տալիս օգտագործել ձեռագիր գրվածք ամբողջ ընթացքում և ապահովել երրորդ կողմի ծրագրակազմի համատեղելիությունը։ IBM- ի Tablet PC-ն առաջինն էր, որ օգտագործեց ThinkPad-ը և IBM-ի ձեռագրերի ճանաչումը։ Այս ճանաչման համակարգը հետագայում օգտագործվեց Microsoft Windows-ում, Pen Computing-ի և IBM-ի Pen OS / 2-ի համար։ Այս տեխնոլոգիաներից ոչ մեկը առևտրային տեսանկյունից հաջող չէր։ Ժամանակակից ձեռագրերի ճանաչման համակարգը ներառված է պլանշետային համակարգիչներում օգտագործվող Microsoft օպերացիոն համակարգերում (Windows XP Tablet PC Edition և Windows Vista): Այն հիմնված է Մայքրոսոֆթ-ի կողմից ստեղծված «Inferno» TDNN դասակարգչի վրա։

Ձեռագրքի ճանաչումը ունի ակադեմիական ակտիվ համայնք, որն ուսումնասիրում է այն։ Ձեռագրքի ճանաչման ամենամեծ կոնֆերանսներից է` ձեռագրերի ճանաչման սահմանապահների միջազգային կոնֆերանսը[3] և Փաստաթղթերի վերլուծության և ճանաչման միջազգային համաժողովը (ICDAR): Երկու կոնֆերանսները հավանության են արժանացել IEEE-ի և IAPR-ի կողմից։ Հետազոտության ակտիվ ոլորտներն են` * Առցանց ճանաչում

  • Անցանց ճանաչում
  • Ստորագրությունների հաստատում
  • Փոստային հասցեի մեկնաբանություն
  • Բանկի ստուգման գործընթացներ գրողի ճանաչում

Ծանոթագրություններ[խմբագրել | խմբագրել կոդը]

  1. «Handwriting recognition» (անգլերեն). 2018 թ․ նոյեմբերի 2. {{cite journal}}: Cite journal requires |journal= (օգնություն)
  2. Chung, Jonathan (2018 թ․ սեպտեմբերի 4). «Handwriting OCR: handwriting recognition and language modeling with MXNet Gluon». Medium. Վերցված է 2019 թ․ հունվարի 8-ին.
  3. ICFHR