Խոսքի (ձայնի) ճանաչում

Վիքիպեդիայից՝ ազատ հանրագիտարանից
Jump to navigation Jump to search

Խոսքի ճանաչում(անգլ. Speech Recognition)[խմբագրել | խմբագրել կոդը]

Խոսքի ճանաչումը (անգլ․ Speech Recognition[1] ) ձայնային ազդանշանների փոխակերպումն է թվայնացված տեղեկույթի։ Այլ կերպ՝ խոսքի ճանաչումը մեքենային հնարավորությունն է տալիս ճանաչել և հասկանալ մարդու արտահայտած բառերը, թվերը, արտահայտությունները և դրանք փոխակերպել մեքենային հասկանալի լեզվով։

Պատմություն[խմբագրել | խմբագրել կոդը]

Գիտնականները միշտ փորձել են ստեղծել մեքենա, որն ի վիճակի կլինի նմանակել մարդու վարքագիծը և հատկապես նրա խոսելու և պատասխանելու կարողությունը։

Խոսքի տեխնոլոգիաները մեծ փոփոխություն են կրել սկսած Ալեքսանդր Գրեյհամ Բելլի ձայնագրման սարքից(Dictation machine[2]) մինչև այսօրվա խելացի վիրտուալ օգնականները, ինչպիսիք են AppleSiri[3], AmazonAlexa-ն, Yandex-ի Alice[4]-ն և այլն։

Առաջին խոսք ճանաչող մեքենան ստեղծվել է 1952 թվականին Bell Labs-ի կողմից և կոչվել է Աուդրի համակարգ (Audrey system): Այս մեքենան միայն կարողացել է ճանաչել և հասկանալ մարդու կողմից արտաբերված 1-ից մինչև 10 թվերը։

1961-1962 [5]թվականներին IBM-ը ստեղծեց Shoebox[6] մեքենան, որը կարողանում էր հասկանալ մարդու կողմից արտաբերված 16 անգլերեն բառ, 10 թվեր և 6 թվաբանական գործողություններ։

Հզոր միկրոպրոցեսորների շնորհիվ 1990 թվականին Dragon-ը[7] ստեղծեց առաջին խոսք ճանաչող մեքենան սպառողների համար։ 7 տարի հետո ստեղծվեց այս մեքենայի կատարելագործված տարբերակը՝Dragon NaturallySpeaking-ը: Այս ծրագիրը հասկանում էր շարունակական խոսքը՝ մարդը կարող էր խոսել օգտագործելով րոպեում 100 բառ:

1992[8] թվականին Apple-ը ստեղծեց իր խոսքի ճանաչման համակարգը, որն ուներ 20 հազար բառից բաղկացած բառապաշար։

2010 [9]թվականին Google-ը ներկայացրեց իր մասնագիտացված խոսք ճանաչող ծրագիրը Android համակարգերի վրա, որը հասկանում էր ավելի քան 230 միլիարդ անգլերեն բառ և արտահայտություն։

Բոլոր խոսքի ճանաչման համար ստեղծված մեքենաները կամ ծրագրերը աշխատում են մինչև 99% ճշտությամբ։ Այս համակարգերն ունեն սահմանափակ բառապաշար և կարողանում են հասկանալ մարդու արտահայտած խոսքը եթե այն հստակ է, շատ արագ չէ և եթե տվյալ մեքենան իր բառապաշարում պարունակում է արտաբերված խոսքում օգտագործված բառերը։

Խոսք ճանաչող մեքենաները կամ ծրագրերը առանձնացվում են հետևյալ հատկություններով։

  • Բառապաշարի մեծությամբ(որքան մեծ է բառապաշարը, այդքան բարձր է նրա աշխատանքի ճշտությունը։)
  • Խոսողից կախվածությամբ(արտահայտվող խոսքի արագությամբ, ձայնի հստակությամբ։)
  • Խոսքի տեսակով(տարբեր բնագավառներին առընչվող խոսքերում օգտագործվում են տարբեր բառապաշարներ։)
  • Նշանակությամբ(թելադրանք,հրամանի համակարգեր։)
  • Օգտագործվող ալգորիթմով(նեյրոնային ցանցեր, դինամիկ ծրագրավոորում։)
  • Ըստ կառուցվածքային միավորի տեսակի (բառեր, արտահայտություններ, հնչյուններ։)

Կիրառություն[խմբագրել | խմբագրել կոդը]

  • Ձայնի վերահսկում
  • Ձայնային հրամաններ
  • Ձայնի միջոցով տեքստի մուտքագրում
  • Ձայնի միջոցով որոնումների կատարում

Տես նաև[խմբագրել | խմբագրել կոդը]

Գրականություն[խմբագրել | խմբագրել կոդը]

Արտաքին հղումներ[խմբագրել | խմբագրել կոդը]

Ծանոթագրություններ[խմբագրել | խմբագրել կոդը]

  1. Speech recognition(անգլ.) // Wikipedia. — 2019-09-25.
  2. Dictation machine(անգլ.) // Wikipedia. — 2019-08-09.
  3. «What Makes Siri Special?»։ PCWorld (անգլերեն)։ 2011-10-24։ Վերցված է 2019-10-23 
  4. Alice (virtual assistant)(անգլ.) // Wikipedia. — 2019-06-12.
  5. LLC Revolvy։ «"IBM Shoebox" on Revolvy.com»։ www.revolvy.com (անգլերեն)։ Վերցված է 2019-10-23 
  6. IBM Shoebox(անգլ.) // Wikipedia. — 2019-07-21.
  7. «Speech Recognition Through the Decades: How We Ended Up With Siri»։ PCWorld (անգլերեն)։ 2011-11-02։ Վերցված է 2019-10-23 
  8. app! Get exclusive content, get the (2017-02-18)։ «In 1992 Before Apple’s Siri, There Was Casper.»։ @ReadMultiplex (անգլերեն)։ Վերցված է 2019-10-23 
  9. «Voice Search gets personal»։ Վերցված է 2019-10-23