Կլաստեր-անալիզ

Վիքիպեդիայից՝ ազատ հանրագիտարանից

Կլաստերային անալիզ կամ ԿԱ (անգլ.՝ cluster analysis, cluster – փունջ, ճութ, ողկույզ, թուփ), բազմաքայլ վիճակագրական ընթացակարգ, որի նպատակն է որևէ սկզբունքով խմբավորել օբյեկտները/տվյալները այնպես, որ միևնույն խմբում/կլաստերում գտնվող օբյեկտները ավելի նման լինեն միմյանց և տարբեր՝ մյուս խմբի օբյեկտներից։ Կլաստերային վերլուծությունը տվյալների մայնինգի մաս է։ Այն ունի կիրառման լայն շրջանակ [բժշկություն, քիմիա, հնագիտություն (ԿԱ-ով պարզում են քարե զենքերի, գերեզմանների... տաքսոնոմիան), հոգեբանություն, կենսաբանություն, կառավարում, բանասիրություն, մարդաբանություն, մարկետինգ...], որոնք միմյանցից տարբերվում են տերմիններով, մոտեցումներով, մեթոդներով։ ԿԱ-ի հոմանիշերն են թվային տաքսոնոմիան (taxonomy), դասակարգումային անալիզը (classification analysis)։ Գծ-ում (1) ըստ առաջին (x) և երկրորդ (y) փոփոխականների տվյալները բաժանված են 3 խմբի (կլաստերների), որոնք միմյանց հետ կարող են նաև հատվել։

Կլաստերներ

ԿԱ-ի հիմնական խնդիրներն են՝ դասակարգման սկզբունքների մշակում, օբյեկտների խմբավորման օգտակար կոնցեպտուալ սխեմաների ուսումնասիրում, հետազոտման տվյալների հիման վրա առաջացած վարկածների ստուգում։

Կլաստերային տարրերի էվկլիդեսային հեռավորություններ

Կլաստերային անալիզի կիրառման համար իրականացնում են օբյեկտների խմբի առանձնացում, դրանց բնութագրող բազմաթիվ փոփոխականների ընտրություն ըստ հատկանիշերի, օբյեկտների միջև նմանության (կամ տարբերության) աստիճանի հաշվարկում, միանման օբյեկտների խմբի ստեղծման համար կլաստերացման անալիզի եղանակների կիրառում, կլաստերային անալիզի արդյունքների ճշգրտության ստուգում։

Յուրաքանչյուր խումբը նկարագրվում է բնորոշ հատկությունների հավաքածուով (թվային կամ ոչ թվային նշաններով)։ Հաշվի է առնվում նաև ընտրված խմբի օբյեկտների միջև նմանության աստիճանը տարածության վրա, այսինքն, տվյալներից կախված յուրաքանչյուրի համար գոյություն ունի նմանության, ինչպես նաև տարածության (կլաստերների, մոտակա հարևանների, ամենահեռու հարևանների, կլաստերների կենտրոնների... միջև միջին էվկլիդյան հեռավորությունների, գծ. 2) չափման տարբեր եղանակներ։

Մեծ խմբերի բաժանումը առավել փոքր խմբերի թույլ է տալիս հեշտացնել տվյալների հետագա մշակումը և որոշումների կայացումը։ Խիստ կարևոր է յուրաքանչյուր կլաստերում ապահովել օբյեկտների նմանության բարձր աստիճանը։ Ամենամեծ հետաքրքրությունը ներկայացնում են առանձին օբյեկտները, որոնք չեն հարմարվում ոչ մի կլաստերի։ Գոյություն ունեն կլաստերիզացման 100–ից ավելի ալգորիթմեր, սակայն հաճախակի կիրառվում է հիերարխիկ կլաստերային անալիզը։ Մեծ կլաստերները վերածվում են փոքրերի, որոնք էլ իրենց հերթին առավել փոքրերի, այսինքն աստիճանական կառուցվածքով իրական բարդ համակարգերից (տաքսոնոմիա, հուն․՝ taxis – կարգ, nomos - օրենք) ստացվում է ծառանման հիերարխիկ (ստորակարգված) կառուցվածք (դենդրոգրամ) և յուրաքանչյուր օբյեկտ բնութագրվում է բոլոր կլաստերների (խոշորից՝ մանր) թվարկումով, որոնց պատկանում է։

Կլաստերային անալիզը դեղանյութերի սինթեզում[խմբագրել | խմբագրել կոդը]

Ոչ շատ բարդ բանաձևով և ոչ շատ մեծ մոլեկուլային զանգվածով նշված մոլեկուլները (I), որոնց վաճառքի գինը ԱՄՆ-ում կազմում է տարեկան 5-6 միլիարդ դոլար, ստանում են նուրբ օրգանական սինթեզի մեթոդներով։ Առավել բարդ մոլեկուլների սինթեզի համար անհրաժեշտ է կիրառել ժամանակակից ԿԱ -ի եղանակները։

Բարդ մոլեկուլների սինթեզ

Բարդ մոլեկուլի սինթեզի համար անհրաժեշտ է քիմիական ռեակցիաների միջոցով միմյանց միացնել 3 առանձին ենթամիավորները (II, կլաստերները)։ Առաջին փուլն իրականացվում է շատ պարզ ռեակցիայով (III, Խեկ) և միանում են առաջին 2 ֆրագմենտները՝ Pd-ի կոմպլեքսային կատալիզատորի (Pd-ԿԿ) ներկայությամբ, երկրորդ փուլում տեղի է ունենում β- H-ի անջատում (էլիմինացում) և տաուտոմերացում (IV) և հետագա ռեակցիաներով իրականացվում է վերջնական փուլը (V)։ Այս պրոցեսում կարևորը Pd-ԿԿ –ն է, որը համարվում է այս բնագավառում կիրառվող ամենատիպիկ և հաճախ կիրառվող կատալիզատորը։ Այստեղ առաջանում են նոր քիմիական կապեր և մեզ անհրաժեշտ է վերահսկել օրգանական միացությունների միացման ուղղությունները։

Օրգանական մոլեկուլները կարող են միմյանց միանալ 1-ին կամ 2-րդ դիրքերում (VI)։ Եթե միացումը գնա մեզ համար ցանկալի ձևով, ապա հասնում ենք որոշակի կառուցվածքով բարդ կենսամոլեկուլների, որոնք ըստ ժամանակակից ստանդարտների՝ ինդիվիդուալ միացություններ են։ Արգասիքների 100:0 (կամ 99:1) հարաբերությունը ընտրողականության մեծ ցուցանիշ է, մնացած հարաբերությունները ընդունելի չեն։

Կատալիզատորի բաղադրիչներից մեկը փոփոխելով՝ ռեակցիոն խառնուրդին լիգանդ ավելացնելով, կարող ենք ստանալ 2 արգասիք, որոնք 2-ն էլ անհրաժեշտ են, սակայն տարբեր նպատակների համար։ Փոխելով ռեակցիայի պայմանները և վերահսկելով պրոցեսը կարելի է հասնել 99:1 կամ հակառակ հարաբերությամբ ընդունելի ընտրողականության։

Դիտարկենք բազմաթիվ ֆունկցիոնալ խմբերով և հետերոատոմներով հարուստ ռապամիցինի (Sirolimus, Rapamycin) բարդ մոլեկուլի (A) սինթեզը։ Այն հավաքվում է ֆրագմենտներից (B, a,b,c,d), որոնք անհրաժեշտ քիմիական մեթոդներ կիրառելիս` միանում են անհրաժեշտ տեղում և անհրաժեշտ հաջորդականությամբ։ Այսինքն դա յուրատեսակ «փազլ» է և կոմպլեքսային կատալիզատորը հնարավորություն է տալիս այդ փազլի տարրերը միմյանց միացնել։ Տարբեր կոմբինացիաներով դրանք միացնելիս կարելի է ստանալ անվերջ քանակությամբ նյութեր։ Այս պրոցեսներում ընտրողականությունը խիստ կարևոր է։ Անհրաժեշտ ձևով, առանց շեղումների հավաքելով հասնում ենք որոշակի կառուցվածքի և ԿԿ-ի միջոցով, որը հանդես է գալիս որպես ռեակցիայի ուղղորդման համար բանալի, անհրաժեշտ գործիք, ստանում ենք վերջնական մոլեկուլը (տեղակալիչները CH3 խմբեր են)։

Ռապամիցինի կլաստերային սինթեզ

Նման աշխատանքները ակտիվորեն սկսվել են 90-ական թվականներից, ինչը հեղափոխություն էր օրգանական քիմիայի սինթեզի բնագավառում։ Հայտնաբերվեց մետաղակոմպլեքսային կատալիզը, որով կարելի է կառուցել ցանկացած բարդ մոլեկուլ։

ԿԱ-ի առավելություններն են՝ բարձր ընտրողականությունը, արդյունավետությունը, բազմակողմանիությունը։ Թերությունները՝ Pd-ԿԿ –ի մեծ արժեքը, մաքրման բարդությունը, հատկապես ծանր մետաղների աղերից և թանկությունը։

2010 թվականին Խեկը, Սուզուկին և Նեգիսը արժանացան Նոբելյան մրցանակի՝ «Կրոսս-զուգակցման ռեակցիաների ուսումնասիրման և կիրառման համար»։

Գրականություն[խմբագրել | խմբագրել կոդը]