Jump to content

Խոր ուսուցում

Վիքիպեդիայից՝ ազատ հանրագիտարանից
Արհեստական բանականության սխեման[1]

Խոր ուսուցում (հայտնի է որպես խոր կառուցվածքային ուսուցում կամ հիերարխիկ ուսուցում), մեքենայական ուսուցման մաս, որը հիմնված է տվյալների ներկայացման ուսուցման վրա, ի տարբերություն խնդրային-հատուկ (task-specific) ալգորիթմների։ Ուսուցումը կարող է լինել վերահսկվող (supervised), կիսավերահսկվող (semi-supervised) և առանց վերահսկման (unsupervised)։ Խոր ուսուցման շատ տարբերակներ հայտնի են եղել դեռ 1980-ական թվականներից, բայց արդյունքները չեն եղել տպավորիչ, մինչ 2000 թվականը` երբ արհեստական նեյրոնային ցանցերի և հաշվողական հզորություններում գրանցվեց առաջընթաց, որը թույլատրեց նեյրոնային ցանցում ստեղծել բարդ տեխնիկական կառուցվածք, որը ուներ բավականին արտադրողականություն, ինչը թույլ էր տալիս լուծել բավականին բարդ խնդիրներ։ Որոշ խնդիրների ժամանակ լուծման որակը համեմատելի է, իսկ որոշակի խնդիրների ժամանակ գործում է «սպիտակուց» փորձագետների արդյունավետությունը[2]։

Խոր ուսուցումը համարվում է մեքենայական ուսուցման ալգորիթմական ենթաբաժին, որը ՝

  • օգտագործում է ոչ գծային բազմաշերտ համակարգը՝ փոփոխությունների հետ կապված առանձնահատկությունները ստանալու համար։ Ամեն հաջորդ շերտ ստանում է նախորդ շերտի տվյալները։ Խորը ուսուցումը կարող է համատեղել ալգորիթմների ուսուցումը ուսուցչի հետ և առանց, բայց օրինակի վերլուծությունը պետք է կատարվի առանց ուսուցչի, իսկ դասակարգումը ուսուցչի հետ։
  • այն ունի տվյալների առանձնահատկությունները ներկայացնելու և պարամետրերը որոշելու մի քանի շերտեր։ Միևնույն ժամանակ նիշերը դասավորված են հիերարխիկ կերպով ՝ ավելի բարձր մակարդակի նշանները առաջանում են ստորին մակարդակի նշաններից։
  • այն ներկայացնում է մեքենայական ուսուցման ուսումնասիրությունը ավելի լայն դաշտում։
  • այն ձևավորվում է շերտերի մի քանի մակարդակների ուսումնասիրության ընթացքում։ Շերտերը ձևավորում են հիերարխիկ հասկացություններ։

Ոչ գծային շերտերի կազմը կախված է լուծելի խնդիրներից։ Օգտագործվում են և՛ նեյրոնային ցանցի թաքնված շերտերը, և՛ բարդ տրամաբանական փոփոխությունների շերտերը։ Համակարգը կարող է ներառել թաքնված փոփոխականներ, ինչպիսիք են խոր ցանցի հանգույցները[3]։

Չնայած նրան, որ «Խոր ուսուցում» տերմինը մեքենայական ուսուցման մեջ առաջացել է 1986 թվականին Ռինի Դիխտեռի աշխատանքից հետո, առաջին ընդհանուր աշխատանքային ալգորիթմը խոր բազմաշերտ ընկալումներով հրատարակվել է դեռ սովետական գիտնականների՝ Ալեքսեյ Իվախնենկոյի և Վալենտինա Լապի «Կիբերնետիկ կանխագուշկաող սարքեր» (ռուս.՝ «Кибернетические предсказывающие устройства») գրքում։

Խոր ուսուցումը հայտնի է դարձել 2000-ական թվականներից, երբ ամեն ինչ զարգացել էր՝ համակարգիչները դարձել էին բավականին հզոր, որպեսզի ուսումնասիրեն մեծ նեյրոնային ցանցերը, տվյալների հավաքածուները դարձել էին բավականին ընդարձակ և մեծ ցանցեր ուսումնասիրելը արդեն իմաստ ուներ, իսկ արհեստական նեյրոնային ցանցերի թեորեմում գրանցվել էր հերթական առաջընթացը։ Այս ժամանակ որոշ գիտնականներ ցույց տվեցին, որ կարող են արդյունավետ ուսումնասիրել բազմաշերտ նեյրոնային ցանցը։ Այն հնարավոր էր եթե սկզբում ուսումնասիրեն ամեն շերտը առանձին-առանձին Բոլցմանի մեքենայի օգնությամբ, իսկ հետո ուսումնասիրեն սխալի հակադարձ տարածման մեթոդի միջոցով[3]։

Ծանոթագրություններ

[խմբագրել | խմբագրել կոդը]
  1. «What is the difference between AI, machine learning, and deep learning». Geospatial World (ամերիկյան անգլերեն). 2017 թ․ մայիսի 6. Վերցված է 2018 թ․ նոյեմբերի 7-ին.
  2. «Deep learning» (անգլերեն). 2018 թ․ նոյեմբերի 7. {{cite journal}}: Cite journal requires |journal= (օգնություն)
  3. 3,0 3,1 «Глубокое обучение» (ռուսերեն). 2018 թ․ հոկտեմբերի 24. {{cite journal}}: Cite journal requires |journal= (օգնություն)