Jump to content

Խոսքի թարգմանություն

Վիքիպեդիայից՝ ազատ հանրագիտարանից

Խոսքի թարգմանություն[խմբագրել | խմբագրել կոդը]

Խոսքի թարգմանությունն այն գործընթացն է, որով խոսակցական արտահայտությունները ակնթարթորեն թարգմանվում և բարձրաձայն արտասանվում են երկրորդ լեզվով։ Սա տարբերվում է արտահայտությունների թարգմանությունից, որտեղ համակարգը թարգմանում է միայն համակարգում ձեռքով մուտքագրված արտահայտությունների ֆիքսված և սահմանափակ շարքը։ Խոսքի թարգմանության տեխնոլոգիան տարբեր լեզուներով խոսողներին շփվելու հնարավորություն է տալիս։ Այսպիսով, այն հսկայական արժեք է մարդկության համար գիտության, միջմշակութային փոխանակման և համաշխարհային բիզնեսի տեսանկյունից։

Ինչպես է դա աշխատում[խմբագրել | խմբագրել կոդը]

Խոսքի թարգմանության համակարգը սովորաբար ներառում է հետևյալ երեք ծրագրային տեխնոլոգիաները՝խոսքի ավտոմատ ճանաչում (ASR), մեքենայական թարգմանություն (MT) և ձայնի սինթեզ (TTS):

Ա լեզվով խոսողը խոսում է խոսափողով, իսկ խոսքի ճանաչման մոդուլը ճանաչում է խոսվածքը/ասույթը[AA1] : Այն համեմատում է ներմուծված խոսքը հնչյունաբանական մոդելի հետ, որը բաղկացած է մի քանի խոսողներից ստացված խոսքի տվյալների մեծ կորպուսից։ Այնուհետև ներմուծված խոսքը վերածվում է բառերի շարանի՝օգտագործելով Ա լեզվի բառապաշարն ու քերականությունը՝հիմնվելով Ա լեզվի տեքստի հսկայական կորպուսի վրա։

Այնուհետև մեքենայական թարգմանության մոդուլը թարգմանում է այս շարանը։ Վաղ համակարգերը յուրաքանչյուր բառը փոխարինում էին Բ լեզվի համապատասխան բառով։ Ներկայիս համակարգերը չեն օգտագործում բառացի թարգմանություն, այլ ավելի շուտ հաշվի են առնում ներմուծված խոսքի ամբողջ համատեքստը՝համապատասխան թարգմանություն ստեղծելու համար։ Ստեղծված թարգմանական արտահայտությունն ուղարկվում է խոսքի սինթեզի մոդուլ, որը գնահատում է բառերի շարանին համապատասխանող արտասանությունն ու հնչերանգը՝հիմնվելով Բ լեզվի խոսքի տվյալների կորպուսի վրա։ Տեքստին համապատասխանող ալիքները ընտրվում են այս տվյալների շտեմարանից, և խոսքի սինթեզը դուրս է գալիս և միանում է նրանց[1]։

Պատմություն[խմբագրել | խմբագրել կոդը]

1983 թվականին NEC ընկերությունը ցուցադրեց խոսքի թարգմանությունը որպես հայեցակարգային նմուշ ITU Telecom World-ում (Telecom '83)[2]:

1999թ.-ին C-Star-2 կոնսորցիումը ցուցադրեց 5 լեզուների խոսքից խոսք թարգմանություն, այդ թվում՝ անգլերեն, ճապոներեն, իտալերեն, կորեերեն և գերմաներեն[3][4]։

Հատկություններ[խմբագրել | խմբագրել կոդը]

Բացի տեքստի թարգմանության հետ կապված խնդիրներից, այն նաև պետք է լուծի հատուկ խնդիրներ, որոնք առաջանում են խոսքից-խոսք թարգմանության մեջ՝ ներառելով խոսակցական լեզվի անկապակցությունը, խոսակցական լեզվի քերականական սահմանափակումները, խոսակցական լեզվի անհասկանալի բառային սահմանը, խոսքի ճանաչման սխալների ուղղումը և բազմաթիվ ընտրովի ներմուծված խոսքի տարբերակներ։ Բացի այդ, խոսքից-խոսք թարգմանությունն ունի նաև իր առավելությունները՝ համեմատած տեքստի թարգմանության հետ, ներառյալ խոսակցական լեզվի պակաս բարդ կառուցվածքը և խոսակցական լեզվի ավելի քիչ բառապաշարը:[փա՞ստ]

Հետազոտություն և զարգացում[խմբագրել | խմբագրել կոդը]

Հետազոտությունն ու զարգացումը անցում են կատարել համեմատաբար պարզից ավելի առաջանցիկ թարգմանության։ Հիմնադրվել են միջազգային գնահատման աշխատաժողովներ՝ խոսքի թարգմանության տեխնոլոգիայի զարգացմանն աջակցելու համար։ Նրանք գիտահետազոտական ինստիտուտներին թույլ են տալիս միաժամանակ համագործակցել և մրցել միմյանց դեմ։ Այդ աշխատաժողովի հայեցակարգը մրցութային է. Կազմակերպիչների կողմից տրամադրվում է ընդհանուր տվյալների շտեմարան, իսկ մասնակից գիտահետազոտական ինստիտուտները ստեղծում են համակարգեր, որոնք գնահատվում են։ Այս կերպ խթանվում է արդյունավետ հետազոտությունը։

Խոսքի թարգմանության հետազոտությունների միջազգային կոնսորցիում C-STAR-ի կողմից կազմակերպված Խոսակցական լեզվի թարգմանության միջազգային աշխատաժողովը(IWSLT) անցկացվում է 2004 թվականից ի վեր։ «Ամեն տարի ավելանում է մասնակից ինստիտուտների թիվը, և այն դարձել է առանցքային իրադարձություն խոսքի թարգմանության հետազոտության համար»[1]։

Չափորոշիչներ[խմբագրել | խմբագրել կոդը]

Երբ շատ երկրներ սկսեն ուսումնասիրել և զարգացնել խոսքի թարգմանությունը, անհրաժեշտ կլինի ստանդարտացնել միջերեսները և տվյալների ձևաչափերը՝ ապահովելու համակարգերի փոխհամատեղելիությունը։ Միջազգային համատեղ հետազոտությունները խրախուսվում են խոսքի թարգմանության կոնսորցիումների կողմից (օրինակ՝ C-STAR միջազգային կոնսորցիումը խոսքի թարգմանության համատեղ հետազոտությունների համար և A-STAR-ը Ասիա-խաղաղօվկիանոսյան տարածաշրջանի համար)։ Նրանք հիմնադրվել են որպես «միջազգային համատեղ հետազոտական կազմակերպություններ՝ երկլեզու կորպուսների ձևաչափեր մշակելու համար, որոնք կարևոր են այս տեխնոլոգիայի հետազոտությունն ու զարգացումն առաջ մղելու... և միջերեսներն ու տվյալների ձևաչափերը ստանդարտացնելու համար՝ միջազգայնորեն խոսքի թարգմանության մոդուլը միացնելու նպատակով»[1]։

Կիրառություններ[խմբագրել | խմբագրել կոդը]

Այսօր խոսքի թարգմանության համակարգերը կիրառվում են ամբողջ աշխարհում։ Օրինակները ներառում են բժշկական հաստատություններ, դպրոցներ, ոստիկանություն, հյուրանոցներ, մանրածախ խանութներ և գործարաններ։ Այս համակարգերը կիրառելի են ցանկացած վայրում, որտեղ խոսակցական լեզուն օգտագործվում է հաղորդակցվելու համար։ Հայտնի հավելվածը Jibbigo-ն է, որն աշխատում է անցանց։

Մարտահրավերներ և ապագա հեռանկարներ[խմբագրել | խմբագրել կոդը]

Ներկայումս խոսքի թարգմանության տեխնոլոգիան հասանելի է որպես արտադրանք, որն ակնթարթորեն անվճար թարգմանում է բազմալեզու խոսակցություններ։ Այս համակարգերը ակնթարթորեն թարգմանում են շարունակական խոսքը։ Դրան հասնելու դժվարությունները ներառում են խոսողից կախված խոսելաոճի կամ արտասանության փոփոխությունների հաղթահարումը։ Սրանք այն խնդիրներն են, որոնք պետք է լուծվեն՝ բոլոր օգտատերերի համար բարձր որակ թարգմանություն ապահովելու նպատակով։ Ավելին, խոսքի ճանաչման համակարգերը պետք է կարողանան շտկել արտաքին գործոնները, ինչպիսիք են ակուստիկ աղմուկը կամ այլ խոսողների խոսքը խոսքի թարգմանության համակարգերի իրական օգտագործման ժամանակ։

Այն պատճառով, որ օգտատերը չի հասկանում թիրախ լեզուն, երբ օգտագործվում է խոսքի թարգմանություն, «օգտատիրոջը պետք է տրամադրվի մեթոդ՝ ստուգելու, թե արդյոք թարգմանությունը ճիշտ է, այնպիսի միջոցներով, ինչպիսիք են այն նորից թարգմանելը օգտատիրոջ լեզու»:[ 1] Ամբողջ աշխարհում լեզվական արգելքը վերացնելու նպատակին հասնելու համար համակարգը պետք է ներառի բազմաթիվ լեզուներ։ Սա պահանջում է խոսքի կորպուսներ, երկլեզու կորպուսներ և տեքստային կորպուսներ մոտ 6000 լեզուներից յուրաքանչյուրի համար, որն այսօր գոյություն ունի մեր մոլորակի վրա։

Քանի որ կորպուսների հավաքագրումը չափազանց թանկ է, համացանցից տվյալների հավաքումը կլինի սովորական մեթոդների այլընտրանք։ «Բազմաթիվ լեզուներով հրապարակված նորությունների կամ այլ լրատվամիջոցների երկրորդական օգտագործումը արդյունավետ միջոց կլինի խոսքի թարգմանության կատարողականը բարելավելու համար»։ Այնուամենայնիվ, «հեղինակային իրավունքի մասին գործող օրենքը հաշվի չի առնում երկրորդական կիրառությունները, ինչպիսիք են կորպուսների այս տեսակները», և այդպիսով, «անհրաժեշտ կլինի վերանայել այն` դարձնելով ավելի ճկուն»[1]։

See also[խմբագրել | խմբագրել կոդը]

References[խմբագրել | խմբագրել կոդը]

  1. 1,0 1,1 1,2 1,3 "Overcoming the Language Barrier with Speech Translation Technology" Արխիվացված 2011-07-21 Wayback Machine by Satoshi, Nakamura in Science & Technology Trends - Quarterly Review No.31 April 2009
  2. NEC/021219-1. «NEC Global - Press Release». www.nec.co.jp (անգլերեն). Վերցված է 2017 թ․ սեպտեմբերի 23-ին.{{cite web}}: CS1 սպաս․ թվային անուններ: authors list (link)
  3. «C-Star». NPR.
  4. "A Japanese-to-English Speech Translation System: ATR-MATRIX" by Takezawa, Morimoto, Sagisaka, Campbell, Iida, Sugaya, Yokoo, Yamamoto in Proceedings of the International Conference on Spoken Language Processing 1998