Jump to content

Ժեստերի ճանաչում

Վիքիպեդիայից՝ ազատ հանրագիտարանից

Ժեստերի ճանաչումը (անգլ.՝ gesture recognition) համակարգչային գիտությունների և լեզվական տեխնոլոգիայի թեմա է, որի նպատակն է մարդկային ժեստերը մեկնաբանել մաթեմատիկական ալգորիթմների միջոցով։ Ժեստերը կարող են ծագել ցանկացած մարմնական շարժումից կամ վիճակից, բայց սովորաբար ծագում են դեմքի կամ ձեռքի շարժումից։ Ոլորտում ներառված են հույզերի ճանաչումը(անգլ.՝ emotion recognition) դեմքի միջոցով և ձեռքի ժեստերի ճանաչումը(անգլ.՝ hand gesture recognition): Օգտատերերը կարող են պարզ ժեստերի միջոցով կառավարել կամ ազդել սարքավորումների վրա՝ առանց ֆիզիկապես դրանց դիպչելու։ Նշանակությունների լեզուն (sign language) մեկնաբանելու համար բազմաթիվ տարբերակներ են կիրառվել ՝ օգտագործելով տեսախցիկներ և համակարգչային տեսլականների ալգորիթմներ։ Կեցվածքի, քայլքի, պրոքսեմիայի և մարդու վարքագծի նույնականացումը և ճանաչումը նույնպես ժեստերի ճանաչման տեխնիկայի առարկա են[1]։ Ժեստերի ճանաչումը կարելի է դիտարկել որպես համակարգիչների՝ մարդու մարմնի լեզուն հասկանալ սկսելու միջոց՝ այդպիսով կառուցելով ավելի ուժեղ կամուրջ մեքենաների և մարդկանց միջև, քան պարզունակ տեքստային օգտվողի միջերեսները(անգլ.՝ text user interfaces) կամ նույնիսկ GUI- ներն են (graphical user interfaces), և դրանք փոխազդում են բնական կերպով՝ առանց մեխանիկական սարքերի։

Ժեստերի ճանաչման առանձնահատկությունները

[խմբագրել | խմբագրել կոդը]
  • Ավելի ճշգրիտ
  • Բարձր կայունություն
  • Սարքը բացելու համար ժամանակի խնայողություն

Ներկայիս ժեստերի ճանաչման հիմնական կիրառական ոլորտների սցենարը հետևյալն է.

  • Ավտոմոբիլային ոլորտ
  • Սպառողական էլեկտրոնիկայի ոլորտ
  • Տարանցիկ ոլորտ
  • Խաղային ոլորտ
  • Սմարթֆոնները բացելը
  • Պաշտպանություն[2]
  • Տան ավտոմատացում
  • Ավտոմատ նշանաբառերի թարգմանություն

Ժեստերի տեսակներ

[խմբագրել | խմբագրել կոդը]

Համակարգչային ինտերֆեյսում, երկու տեսակի ժեստեր են առանձնանում[3]։

  • Անցանց(անգլ.՝ offline) ժեստեր. Այն ժեստերը, որոնք մշակվում են օբյեկտի հետ օգտագործողի փոխազդեցությունից հետո։ Օրինակ՝ մենյուն ակտիվացնելու ժեստը։
  • Առցանց(անգլ.՝ online) ժեստեր. Ուղղակի մանիպուլյացիայի ժեստեր։ Դրանք օգտագործվում են շոշափելի առարկան մասշտաբելու կամ պտտելու համար։

Մուտքային սարքեր

[խմբագրել | խմբագրել կոդը]

Անձի շարժումները հետևելու և նրա ժեստերը որոշելու ունակությանը կարելի է հասնել տարբեր գործիքների միջոցով։ Կինետիկ օգտագործողի միջերեսները (KUIs) ինտերֆեյսերի զարգացող տեսակներ են, որոնք թույլ են տալիս օգտվողներին փոխազդել հաշվարկային սարքերի հետ՝ օբյեկտների և մարմինների շարժման միջոցով[4]։ KUI- ների օրինակները ներառում են շոշափելի ինտերֆեյսեր և շարժման մասին տեղեկացված խաղեր, ինչպիսիք են Wii- ն, Microsoft- ի Kinect- ը և այլ ինտերակտիվ նախագծեր։ Չնայած կան մեծ քանակությամբ հետազոտություններ, որոնք արվել են պատկերի / վիդեոյի վրա հիմնված ժեստերի ճանաչման գործընթացում, ներդրումների միջև օգտագործվող գործիքների և միջավայրերի միջև կա որոշակի տարբերություն։

Կախված մուտքային տվյալների տեսակից, ժեստ մեկնաբանելու մոտեցումը կարող է իրականացվել տարբեր եղանակներով։ Այնուամենայնիվ, տեխնիկայի մեծ մասը ապավինում է 3D ցուցանշանային համակարգում ներկայացված հիմնական ցուցիչներին։ Ելնելով դրանց համեմատական շարժումից `ժեստը կարող է հայտնաբերվել մեծ ճշգրտությամբ` կախված մուտքի որակից և ալգորիթմի մոտեցումից։ Մարմնի շարժումները մեկնաբանելու համար հարկավոր է դրանք դասակարգել ըստ ընդհանուր հատկությունների և այն հաղորդագրության, որը կարող են արտահայտել շարժումները։ Օրինակ ՝ նշանների լեզվով յուրաքանչյուր ժեստ ներկայացնում է որևէ բառ կամ արտահայտություն։ Տաքսոնոմիան, որը մարդկային-համակարգչային փոխազդեցության համար շատ տեղին է թվում, առաջարկել է Քուեքը «Դեպի տեսլականի վրա հիմնված ձեռքի ժեստերի միջերես»—ում[5]։ Նա ներկայացնում է մի քանի ինտերակտիվ ժեստերի համակարգ ՝ ժեստերի ամբողջ տարածքը գրավելու համար․

  1. Մանիպուլյատիվ
  2. Կիսաֆորիկ
  3. Խոսակցական

Մարտահրավերներ

[խմբագրել | խմբագրել կոդը]

Կան բազմաթիվ մարտահրավերներ, որոնք կապված են ժեստերի ճանաչման ծրագրակազմի ճշգրտության և օգտակարության հետ։ Պատկերի վրա հիմնված ժեստերի ճանաչման համար կան սահմանափակումներ օգտագործված սարքավորումների և պատկերի աղմուկի վրա։ Նկարները կամ տեսանյութերը պետք է լինեն հաստատուն լուսավորության տակ կամ նույն վայրում։ Հետնաշերտի տարրերը կարող են բարդացնել ճանաչումը։ Պատկերների վրա հիմնված ժեստերի ճանաչման համար իրականացվող բազմազանությունը կարող է նաև խնդիր առաջացնել տեխնոլոգիայի կենսունակության ընդհանուր օգտագործման համար։ Օրինակ՝ մեկ ֆոտոխցիկի համար տրամաչափված ալգորիթմը կարող է չաշխատել այլ խցիկի համար։ Ֆոնային աղմուկի քանակը նույնպես առաջացնում է հետևելու և ճանաչելու դժվարություններ, հատկապես, երբ տեղի են ունենում խցանումներ (անգլ.՝ occlusions) (մասնակի և լրիվ)։ Ավելին, խցիկից հեռավորությունը և տեսախցիկի լուծաչափը և որակը նույնպես առաջացնում են ճանաչման ճշգրտության տատանումներ։ Տեսողական տվիչների միջոցով մարդկային ժեստերը գրավելու համար անհրաժեշտ են նաև համակարգչային տեսլականների ուժեղ մեթոդներ, օրինակ ՝ ձեռքի հետապնդման և ձեռքի կեցվածքի ճանաչման համար կամ գլխի, դեմքի արտահայտությունների , հայացքների ուղղության շարժումները գրավելու համար։

«Գորիլայի բազուկը»

[խմբագրել | խմբագրել կոդը]

«Գորիլայի բազուկը» ուղղահայաց կողմնորոշված սենսորային էկրան օգտագործելու կողմնակի ազդեցություն էր։ Երկարատև օգտագործման ժամանակահատվածում օգտագործողների ձեռքերը սկսեցին հոգնածություն և անհարմարություն զգալ։ Այս էֆֆեկտը նպաստեց սենսորային էկրանի մուտքի անկմանը, չնայած նախնական հայտնիությանը 1980-ականներին[6]։ Ձեռքի հոգնածությունը և «Գորիլայի բազուկի» կողմնակի ազդեցությունը չափելու համար հետազոտողները մշակեցին տեխնիկա, որը կոչվում է «Սպառված տոկունություն»։

Ո՞վ է զբաղվում ժեստերի ճանաչման զարգացմամբ

[խմբագրել | խմբագրել կոդը]

Microsoft-ը առաջատարն է իր Kinect-ով։ Այն ժեստերի ճանաչման հարթակ է, որը թույլ է տալիս մարդկանց շփվել համակարգիչների հետ՝ ամբողջությամբ խեսելու և ժեստերի միջոցով։ Kinect-ը համակարգիչներին տալիս է «ականջներ, աչքր և ուղեղ»։ Կան նաև այլ հարթակներ՝  SoftKinect, GestureTek, PointGrab, EyeSight Արխիվացված 2019-10-15 Wayback Machine և PrimeSense Արխիվացված 2014-02-17 Wayback Machine:

Microsoft- ի և Siemens- ի նման ընկերությունները աշխատում են միասին `վերափոխելու այն ճանապարհը, որով բոլորը` ավտովարորդներից մինչև վիրաբույժներ, իրականացնում են խիստ զգայուն առաջադրանքներ։ Այս ընկերությունները աշխատում են ժեստերի ճանաչման տեխնոլոգիայի վերամշակման վրա `կենտրոնանալու պատկերների նուրբ շարժիչային մանիպուլյացիայի վրա և վիրաբույժին հնարավորություն են տալիս վիրտուալ կերպով օբյեկտը բռնել մոնիտորի վրա տեղաշարժել։

Ծանոթագրություններ

[խմբագրել | խմբագրել կոդը]
  1. [1] Matthias Rehm, Nikolaus Bee, Elisabeth André, Wave Like an Egyptian – Accelerometer Based Gesture Recognition for Culture Specific Interactions, British Computer Society, 2007
  2. [2] Արխիվացված 2019-10-20 Wayback Machine "Patent Landscape Report Hand Gesture Recognition PatSeer Pro". PatSeer. Retrieved 2017-11-02.
  3. [3] Արխիվացված 2019-10-20 Wayback Machine Dietrich Kammer, Mandy Keck, Georg Freitag, Markus Wacker, Taxonomy and Overview of Multi-touch Frameworks: Architecture, Scope and Features Archived 2011-01-25 at the Wayback Machine
  4. [4] V. Pallotta; P. Bruegger; B. Hirsbrunner (February 2008). "Kinetic User Interfaces: Physical Embodied Interaction with Mobile Pervasive Computing Systems". Advances in Ubiquitous Computing: Future Paradigms and Directions. IGI Publishing.
  5. [5] Quek, F., "Toward a vision-based hand gesture interface" Proceedings of the Virtual Reality System Technology Conference, pp. 17-29, August 23–26, 1994, Singapore
  6. [6] Rupert Goodwins. "Windows 7? No arm in it". ZDNet.

Արտաքին հղումներ

[խմբագրել | խմբագրել կոդը]

Գրականություն

[խմբագրել | խմբագրել կոդը]
  • Saha, Sriparna (2018). Gesture Recognition: Principles, Techniques and Applications (Studies in Computational Intelligence). (անգլ.)
  • Escalera, Sergio; Guyon, Isabelle; Athitsos, Vassilis (2017). Gesture Recognition (The Springer Series on Challenges in Machine Learning). (անգլ.)
  • M., Philip (2019). The 2020-2025 World Outlook for Gesture Recognition Technologies. (անգլ.)
  • Chaudhary, Ankit (2018). Robust Hand Gesture Recognition for Robotic Hand Control ). (անգլ.)
  • Nirantar, Sriparna (2012). Smart and Energy-Efficient Home Automation using Gesture Recognition: Controlling home appliances and devices with the flick of your hand. (անգլ.)