Տվյալների գիտություն

Վիքիպեդիայից՝ ազատ հանրագիտարանից
Jump to navigation Jump to search

Տվյալների գիտություն (անգլ.՝ data science), հանդիսանում է միջդիսցիպլինար դաշտ, որն օգտագործում է գիտական մեթոդներ, գործընթացներ, ալգորիթմներ եւ համակարգեր,որոնք վերցված են մաթեմատիկայից, վիճակագրությունից և ինֆորմատիկայից: Այն համարվում է ինֆորմատիկայի բաժին, որն ուսումնասիրում է թվային ձեւով տվյալների վերլուծութունը, դրանց մշակումն ու ներկայացումը: Տվյալների գիտությունը վիճակագրության, տվյալների վերլուծության, մեքենայական ուսուցման եւ դրանց հետ կապված մեթոդների միավորման գաղափար է: Թյուրինգ մրցանակաբաշծության հաղթող Ջիմ Գրեյը պատկերացնում էր տվյալների գիտությունը որպես գիտության «չորրորդ օրինակ»(փորձով հաստատված, տեսական, հաշվարկային և այժմ տվյալների վրա հիմնված) և պնդում, որ «ամենինչ փոխվում է, ինֆորմացիոն տեխնոլոգիայի ազդեցության պատճառով»[1][2]:

Պատմություն[խմբագրել | խմբագրել կոդը]

«Տվյալների գիտություն» տերմինը հայտնվել է վերջին երեք տասնամյակների ընթացքում տարբեր ոլորտներում: Նախկինում Պետեր Նաուրի կողմից օգտագործվել է, որպես համակարգչային գիտության փոխարինող[3]: Ընդամենը 1990-ականներին է, որ տերմինը սկսել են լայնորեն կիրառել, շնորհիվ Ուիլիամ Քլիվլենդի հրապարակած հոդվածի, որտեղ նա առանձնացրել է տվյալների գիտությունը որպես առանձին ակադեմիական կարգապահություն: 2001 թ.-ին Վիլյամ Ս. Քլիվլենդը ներկայացրեց տվյալների գիտությունը որպես անկախ կարգապահություն՝ ընդլայնելով վիճակագրության դաշտը « Տվյալների հաշվարկի առաջընթացը » հոդվածում: Տվյալների գիտությունը էլ ավելի է տարածվում «մեծ տվյալների» պարադիգմայի առաջացման շնորհիվ, որը կենտրոնանում է նոր տեխնոլոգիական հնարավորությունների վրա: 2011 թվականին O'Reilly-ն տվյալների գիտության վերաբերյալ մի շարք խոշոր կոնֆերանսներ է անցկացնում:

Բովանդակություն[խմբագրել | խմբագրել կոդը]

Տվյալների գիտության հիմնական, գործնական նպատակը տվյալների հայտնաբերումը կամ ձեռքբերումն է: Այս ոլորտի գործունեության համար հաճախ օգտագործվում է Venn դիագրամը, որտեղ մասնագետի պահանջած հմտությունները հատվում են գործնական փորձի և գիտելիքի ոլորտնի խաչմերուկում: Դասական վիճակագրության համեմատ, տվյալների գիտությունը ենթադրում է թվային տեղեկատվության գերիշխող մեծ և բազմաբևեռ զանգվածների ուսումնասիրություն և անխուսափելի կապ` տեղեկատվական տեխնոլոգիաների հետ, որոնք ապահովում են դրանց վերամշակումը : Դիզայնի եւ տվյալների բազաների աշխատանքների հետ համեմատած, որտեղ առաջարկվում է տվյալների մոդելի նախնական ձեւավորում, տվյալների գիտությունը ենթադրում է մաթեմատիկական վիճակագրության, արհեստական ​​հետախուզության, մեքենայական ուսուցման հաճախ առանց նախնական տվյալների ներբեռնելու մոդելը: Համեմատած վերլուծաբանի մասնագիտությանը, որի հիմնական նպատակն է կուտակված տվյալների հիման վրա միջոցառումների նկարագրությունը՝ օգտագործելով համեմատաբար պարզ գործիքներ (օրինակ, աղյուսակներ կամ բիզնեսի հետախուզության դասային գործիքներ), տվյալների գիտության մասնագետի պրոֆիլը ավելի քիչ ուշադրություն է դարձնում ենթակա ոլորտների բովանդակությանը և ավելի խորը գիտելիքներ պահանջում մաթեմատիկական վիճակագրության, մեքենայական ուսուցման և ծրագրավորման ոլորտներում:

Օգտագործման ոլորտներ[խմբագրել | խմբագրել կոդը]

DataScienceDisciplines Տվյալների գիտության խոշորագույն օգտագործման ոլորտները(այբբենական կարգով)

Ծանոթագրություններ[խմբագրել | խմբագրել կոդը]

  1. Stewart Tansley, Kristin Michele Tolle (2009)։ The Fourth Paradigm: Data-intensive Scientific Discovery։ Microsoft Research։ ISBN 978-0-9825442-0-4 
  2. Bell G., Hey T., Szalay A. (2009)։ «COMPUTER SCIENCE: Beyond the Data Deluge»։ Science 323 (5919): 1297–1298։ ISSN 0036-8075։ doi:10.1126/science.1170411 
  3. Naur Peter (1 July 1966)։ «The science of datalogy»։ Communications of the ACM 9 (7): 485։ doi:10.1145/365719.366510