Տվյալների գիտություն

Վիքիպեդիայից՝ ազատ հանրագիտարանից
Jump to navigation Jump to search

Տվյալների գիտություն (անգլ.՝ data science), միջճյուղային ոլորտ է, որը կառուցվածքային և ոչ կառուցվածքային տվյալներից գիտելիք և ինտուիցիա դուրս բերելու համար օգտագործում է գիտական մեթոդներ, գործընթացներ, ալգորիթմներ և համակարգեր[1][2]։ Տվյալների գիտությունը նույն հասկացությունն է ինչ data mining-ը և big data-ն՝ "խնդիրները լուծելու համար օգտագործել ամենահզոր տեխնիկան, ամենահզոր ծրագրային ապահովումը և ամենաարդյունավետ ալգորիթմները"[3]։

Տվյալների գիտությունը՝ վիճակագրության, տվյալների վերլուծության, մեքենայական ուսուցման և դրանց հետ կապված մեթոդների միավորող հայեցակարգ է, որը տվյալների միջոցով օգնում է "հասկանալ և վերլուծել իրական երևույթները"[4]: Այն կիրառում է մաթեմատիկայի, վիճակագրության, ինֆորմատիկայի և հաշվողական գիտության կոնտեքստից վերցված բազմաթիվ միջոցներ և տեսություններ։ Թյուրինգի մրցանակաբաշխության հաղթող Ջիմ Գրեյը պատկերացնում էր տվյալների գիտությունը որպես գիտության «չորրորդ պարադիգմ» (փորձով հաստատված, տեսական, հաշվարկային և այժմ տվյալների վրա հիմնված) և պնդում, որ տվյալների հոսքի և «ինֆորմացիոն տեխնոլոգիաների ազդեցության պատճառով գիտության մեջ ամեն ինչ փոխվում է»[5][6]։

2012 թվականին, երբ Harvard Business Review-ն այն անվանեց "21-րդ դարի ամենասեքսուալ աշխատանքը",[7] "տվյալների գիտություն" տերմինը մոդայիկ դարձավ։ Այն այժմ հաճախ օգտագործվում է փոխարինաբար ավելի վաղ հասկացությունների հետ, ինչպիսիք են բիզնես վերլուծությունը,[8] բիզնես բանականությունը, կանխատեսման մոդելավորումը և վիճակագրությունը։ Հանս Ռոսլինգը, 2011 BBC փաստագրական ֆիլմում հնչած, տվյալների գիտությունը սեքսուալ է, արտահայտությունը վերաձևակերպել է հետևյալ կերպ․ "Վիճակագրությունն այժմ ամենասեքսուալ բնագավառն է[9]։ Նեյթ Սիլվերը տվյալների գիտությունը հիշատակում է որպես վիճակագրությունը սեռերի բաժանող տերմին[10]: Շատ դեպքերում նախկին մոտեցումներն ու լուծումները պարզապես վերանվանվում են որպես "տվյալների գիտություն" ավելի գրավիչ դարձնելու համար, ինչը, ի հավելումն օգտակարությանը, կարող է հանգեցնել նաև տերմինի տարալուծմանը"[11]: Թեև շատ համալսարաններ այժմ առաջարկում են Տվյալների գիտության աստիճան, սակայն դասընթացի բովանդակության վերաբերյալ համապատասխան կոնսենսուս դեռևս չկա[8]: Այնուամենայնիվ, հաճախ վատ կառավարման և ռեսուրսների վատ օգտագործման հետևանքով մեծ տվյալների նախագծերի ցանկալի արդյունքին չհասնելը, բերում է տվյալների գիտության նկատմամբ անվստահության։[12][13][14][15]։

Պատմություն[խմբագրել | խմբագրել կոդը]

"Տվյալների գիտություն" տերմինը վերջին երեսուն տարում հիշատակվել է տարբեր կոնտեքստներում, սակայն որպես տերմին կայացել է միայն վերջերս։ 1960 թվականին այն օգտագործվել է Պետեր Նաուրի կողմից, որպես համակարգչային գիտության այլընտրանք։ Հետագայում Նաուրը մտցրեց "տվյալաբանություն" տերմինը[16]։ 1974 թվականին Նաուրը հրատարակեց տվյալների մշակման ժամանակակից մեթոդների վերլուծությանը վերաբերող Համակարգչային մեթոդների կոնցեպտուալ հետազոտություն աշխատանքը, որտեղ նա ազատորեն օգտագործել է տվյալների գիտություն տերմինը։

1996 թվականին, Դասակարգող հանրությունների միջազգային ֆեդերացիայի (IFCS) երկամյա կոնֆերանսի ժամանակ, առաջին անգամ, Տվյալների գիտություն տերմինը ներառվեց կոնֆերանսի անվանման մեջ ("Տվյալների գիտություն, դասակարգում և առնչվող մեթոդներ"),[17] որից հետո այն առաջարկվեց Չիկիո Հայաշիի կողմից, կլոր սեղանի շուրջ քննարկման ժամանակ[4]։

1997 նոյեմբերին, Ջեֆֆ Վուն Միչիգանի համալսարանում պրոֆեսորի կոչում ստանալու համար տրված իր անդրանիկ դասախոսությունն անվանեց "Վիճակագրություն = Տվյալների գիտություն?"[18][19] Դասախոսության մեջ, նա վիճակագրական աշխատանքը բնութագրեց որպես տվյալների հավաքածուի, տվյալների վերլուծության և մոդելավորման և որոշումների կայացման եռյակ։ Իր եզրակացության մեջ նա նախաձեռնեց "տվյալների գիտության", ժամանակակից ոչ-համակարգչային գիտության տերմինի օգտագործումը և կոչ արեց վիճակագրությունը վերանվանել տվյալների գիտություն, իսկ վիճակագրագետներին՝ տվյալների գիտնական[18]: Հետագայում, նա իր դասախոսությունը վերնագրեց "Վիճակագրություն = Տվյալների գիտություն?" որպես 1998 թվականի մահալանոբիսի հիշատակին նվիրված դասախոսությունների շարքի առաջին դասախոսություն[20]։ Այդ դասախոսությունները նվիրված էին հնդիկ գիտնական, վիճակագրագետ, Հնդկաստանի Վիճակագրության ինստիտուտի հիմնադիր Պրեսանտա Չանդրա Մահալաբոնիսին։

2001 թվականին, Ուիլյամ Քլիվլենդը, իր "Տվյալների Գիտություն․ Վիճակագրության ոլորտի տեխնիկական միջոցների ընդլայնման գործողությունների պլան" հոդվածում, տվյալների գիտությունը ներկայացրեց որպես անկախ ճյուղ, որն ընդլայնելում է վիճակագրության ոլորտը, այն միավորելով "տվյալների միջոցով հաշվարկների առավելությունների ոլորտի" հետ[21]։ Իր զեկույցում Քլիվլենդը վեց տեխնիկական բնագավառ է առանձնացնում, որոնք, ըստ նրա, ընդգրկում են տվյալների գիտության ոլորտը․ միջճյուղային հետազոտություններ, մոդելներ և մեթոդներ տվյալների համար, հաշվարկում տվյալների հետ, մանկավարժություն, գործիքների գնահատում և տեսություն։ Տվյալների գիտությունը էլ ավելի է տարածվում «մեծ տվյալների» պարադիգմայի առաջացման շնորհիվ, որը կենտրոնանում է նոր տեխնոլոգիական հնարավորությունների վրա: 2011 թվականին O'Reilly-ն տվյալների գիտության վերաբերյալ մի շարք խոշոր կոնֆերանսներ է անցկացնում:

2002 թվականի ապրիլին, Գիտության միջազգային խորհուրդը (ICSU): Տվյալների Գիտության և Տեխնոլոգիաների հանձնաժողովը (CODATA)[22] սկսեց հրատարակել Տվյալների Գիտություն ամսագիրը,[23], որը նվիրված էր տվյալների համակարգերի նկարագրության խնդիրներին, համացանցում դրանց հրապարակմանը, կիրառություններին և իրավական խնդիրներին[24]։ Դրանից կարճ ժամանակ անց, 2003 թվականի հունվարին, Կոլումբիայի համալսարանը սկսեց հրատարակել Տվյալների Գիտություն ամսագիրը,[25] որը տվյալների բնագավառում բոլոր աշխատողներին իրենց տեսակետը ներկայացնելու և գաղափարների փոխանակման համար հարթակ էր ապահովում։ Ամսագիրը հիմնականում նվիրված էր վիճակագրական մեթոդների և քանակական հետազոտությունների կիրառմանը։ 2005 թվականին, Գիտության ազգային խորհուրդը հրատարակեց "Երկարակյաց Թվային Տվյալների հավաքածուներ․ 21-րդ դարի հետազոտության և կրթության հնարավորություն", տվյալների գիտնականներ համարելով "ինֆորմացիոն և հաշվարկային գիտնականներին, տվյալների բազաների և ծրագրային ապահովման ծրագրավորողներին, ճյուղային փորձագետներին, գրադարավարներին և այլոց, ովքեր թվային տվյալների հավաքման և կառավարման մեջ վճռական դեր ունեն, որոնց անմիջական գործունեությունը "ստեղծագործ հետազոտության և վերլուծության իրականացումն է։"[26]

Մոտավորապես 2007 թվականին,[փա՞ստ] Թյուրինգի մրցանակի հաղթող Ջիմ Գրեյը "տվյալներով կառավարվող գիտությունը" ներկայացրեց որպես գիտության "չորրորդ պարադիգմ", որը մեծ տվյալների հաշվարկային վերլուծությունն օգտագործում է որպես հիմնական գիտական մեթոդ[5][6] և "ունենալ աշխարհ, որում գիտական ողջ գրականությունը առցանց է, գիտական ողջ տվյալներըն առցանց են և դրանք միմյանց հետ փոխգործակցում են։"[27]

2012 թվականին Harvard Business Reviewում հրապարակված "Տվյալների գիտնական: 21-րդ դարի ամենասեքսուալ աշխատանքը" հոդվածում,[7] Փաթիլը հայտարարում է, որ 2008 թվականին Ջեֆ Համերբեյչերի հետ այդ տերմինը հնարել են, LinkedIn-ում և Facebook-ում, իրենց զբաղվածությունը ներկայացնելու համարը։ Նա պնդում էր, որ տվյալների գիտնականը "նոր տեսակ է", և որ "տվյալների գիտնականների պակասը որոշ հատվածներում լուրջ խոչընդոտ է դառնում"։

2013 թվականին, ստեղծվեց IEEE-ում ստեղծվեց Տվյալների գիտության և առաջատար անալիտիկայի աշխատանքային խումբ[28]։ Նույն թվականին Լյուքսեմբուրգում կազմակերպվեց առաջին "Տվյալների վերլուծության Եվրոպական կոնֆերանսը (ECDA)", որի ընթացքում ստեղծվեց Տվյալների Գիտության Եվրոպական Միությունը (EuADS)։ Առաջին միջազգային կոնֆերանսը: Տվյալների Գիտության և առաջատար վերլուծության միջազգային կոնֆերանսը տեղի ունեցավ 2014 թվականին[29]։ 2014 թվականին, ԱՄՆ-ում Գլխավոր Ասամբլեա մասնավոր դպրոցը կազմակերպեց վճարովի կրթական ճամբար և Դատա ինկուբատոր ուսումնական ընկերությունը կրթաթոշակ սահմանեց Տվյալների գիտությունը զարգացնելու նպատակով[30]։ 2014 թվականին, Ամերիկյան Վիճակագրական ասոցիացիայի Վիճակագրական ուսուցման և տվյալների հայթայթման բաժինը, իր ամսագիրը վերանվանեց "Վիճակագրական վերլուծության և տվյալների հայթայթման: Տվյալների գիտություն", իսկ 2016 թվականին բաժինը վերանվանվեց "Վիճակագրական ուսուցում և Տվյալների Գիտություն"[31]։ 2015 թվականին Սպրինգերը գործարկեց "Տվյալների գիտություն և վերլուծություն" միջազգային ամսագիրը, տվյալների գիտությանը և մեծ տվյալների վերլուծությանը վերաբերող աշխատանքները հրապարակելու համար[32]։

Վիճակագրության հետ կապը[խմբագրել | խմբագրել կոդը]

"Տվյալների գիտություն" տերմինը վերջերս շատ տարածված է գործարար շրջանակներում[33]։ Սակայն շատ գիտնականներ և լրագրողներ տվյալների գիտության և վիճակագրության միջև տարբերություն չեն տեսնում, մինչդեռ ուրիշները գտնում են, որ այն հիանալի տերմին է "տվյալների ինտելեկտուալ վերլուծության" և "մեծ տվյալների" համար[3] Գիլ Պրեսը Ֆորբսում գրում է տվյալների գիտությունը մոդայիկ բառ է առանց հստակ սահմանման և մագիստրոսի աստիճան ստանալու ծրագրերի համատեքստում պարզապես փոխարինել է բիզնես վերլուծություն տերմինին[8]։ Կիրառական վիճակագրագետ Նեյթ Սիլվերը, Ամերիկյան Վիճակագրական Միության խորհրդակցությունների հարց ու պատասխան բաժնում ասել է “Ես կարծում եմ տվյալների գիտնական տերմինը վիճակագրագետ տերմինի սեքսուալ տարբերակն է....Վիճակագրությունը գիտության ճյուղ է։ Տվյալների գիտնական տերմինն ինչ որ տեղ ավելորդ է և վիճակագրագետ տերմինը պետք չէ անտեսել։”[10] Գործարար միջավայրում նույնպես բազմաթիվ հետազոտողներ և վերլուծաբաններ պնդում են, որ միայն տվյալագետները ընկերությանը չեն կարող ապահովել իրական մրցակցային առավելություն[34] և տվյալագետներին դիտարկում են որպես չորս կարևոր աշխատանքների ընտանիքից մեկը՝ Տվյալների վերլուծաբան, տվյալագետ, մեծ տվյալների ծրագրավորող և մեծ տվյալների ճարտարագետ[35]։

Մյուս կողմից քննադատությունների պատասխաններն էլ նույնպես բազմաթիվ են։ 2014 թվականին Իրվինգ Վլադավսկի Բերգերը Wall Street Journal ամսագրում գրած հոդվածում տվյալների գիտության առաջացրած ոգևորությունը համեմատում է համակարգչային գիտության արևածագի հետ։ Նա պնդում է, տվյալների գիտությունը, ինչպես ցանկացած այլ միջճյուղային ոլորտ, օգտագործում է տեսական և արդյունաբերական մեթոդներ, սակայն հենց դրանք այնուհետ նրան կձևափոխեն և կբերեն նոր ճյուղի ձևավորման։ Նա ուշադրություն է հրավիրում այն փաստի վրա, որ սուր քննադատության ենթարկվող կոմպյուտերային գիտությունն այժմ հարգված ակադեմիական բնագավառ է[36]։ Նմանապես Նյու Յորքի համալսարանի բիզնեսի և մարդու իրավունքների կենտրոնից Վազանթ Դհարը, ինչպես Տվյալների գիտության շատ այլ կողմնակիցներ,[36] պնդում են, որ տվյալների գիտությունը տարբերվում է տվյալների վերլուծության առկա կիրառություններից բոլոր բնագավառների համար, որոնք կենտրոնանում են միայն տվյալների բազմության բացատրության վրա։ Տվյալների գիտությունը կիրառելի և հետևողական օրինակ է որոնում կանխատեսելի օգտագործման համար։[1] Այս ինժեներական գործնական նպատակը տվյալների գիտությունը դուրս է բերում ավանդական վերլուծության շրջանակներից։ Այժմ այդ բնագավառների, ինչպիսիք են առողջապահությունը և հասարակական գիտությունները, և դրանց կիրառության ոլորտների տվյալները կարելի է օգտագործել հզոր կանխատեսելի մոդելներ ստեղծելու համար։[1]

2015 թվականի սեպտեմբերին, Ստենֆորդի համալսարանի պրոֆեսոր Դեվիդ Դոնոհոն, Դհարի ջանքերին համահունչ հետագա առաջարկներ է անում, մերժելով տվյալների գիտության երեք պարզունակ և ապակողմնորոշող սահմանումները[37]։ Նախ, ըստ Դոնոհոյի, տվյալների գիտությունը չի հավասարեցվում մեծ տվյալներին՝ տվյալների բազմության չափը չի կարող տարբերակող չափանիշ լինել տվյալների գիտության և վիճակագրության միջև[37] Երկրորդ, տվյալների գիտությունը չի որոշվում մեծ տվյալների տեսակավորման հաշվարկային ունակություններով, քանի որ այդ ունակություններն արդեն իսկ վերլուծությունների համար օգտագործվում են բոլոր բնագավառներում[37]: Երրորդ, տվյալների գիտությունը լայնորեն կիրառելի ոլորտ է, որտեղ աշխատանքի անցնելու համար ներկայումս ակադեմիական ծրագրերը բավարար նախապատրաստում չեն իրականացնում։ Բազմաթիվ կրթական հաստատություններ մոլորության մեջ են գցում, իրենց վերլուծության և վիճակագրության դասընթացները ներկայացնելով որպես տվյալների գիտության էություն[37][38]։ Դոնոհոն, որպես վիճակագրագետ, հետևելով իր բնագավառի առաջատարներին, ընդլայնում է ուսուցման ծավալները ընդհուպ դեպի տվյալների գիտություն, ինչպիսիք են,[37] Ջոն Չամփերը, որը վիճակագիրներին կոչ է անում ընդունել տվյալների հիման վրա ուսուցանելու ներառող հասկացությունը[39], կամ ինչպես Վիլյամ Քլիվլենդը, որը կոչ է անում նախընտրությունը տալ տվյալների դուրս բերման կիրառական գործիքներին, քան բացատրողական տեսություններին[21]: Այս վիճակագրագետները միասին ավելի լայն կիրառական ոլորտ են ընդգրկում, որն աճում է ավանդական վիճակագրությունից և դրանից դուրս։

Դոնոհոն, տվյալների գիտության ապագայի համար, նախագծում է նույնիսկ անընդհատ ընդլայնվող միջավայր, որտեղ ակադեմիական հրատարակչություններում օգտագործվող տվյալների բազմությունները հասանելի են բոլոր հետազոտողների համար[37] ԱՄՆ Առողջապահության Ազգային Ինստիտուտը արդեն իսկ հետազոտվող տվյալների վերարտադրման և թափանցիկության բարձրացման ծրագրեր է ներկայացրել։[40]։ Շատ ակադեմիական ամսագրեր հետևում են այդ օրինակին[41][42]։ Այսպիսով տվյալների գիտության ապագան ոչ միայն ընդլայնում է վիճակագրության տեսության սահմանները ծավալների ու մեթոդոլոգիայի առումով, այլև հեղափոխականացնում ներկայիս ակադեմիական և հետազոտական պարադիգմները[37]: Ինչպես Դոնոհոն է եզրակացնում․ "Առաջիկա տասնամյակների ընթացքում տվյալների գիտության ծավալները և ազդեցությունը կշարունակի էականորեն ընդլայնվել, քանի որ գիտական տվյալներն ու գիտության մասին տվյալները ինքնին դառնում են հասանելի"[37]:

Բովանդակություն[խմբագրել | խմբագրել կոդը]

Տվյալների գիտության հիմնական, գործնական նպատակը տվյալների հայտնաբերումը կամ ձեռքբերումն է: Այս ոլորտի գործունեության համար հաճախ օգտագործվում է Venn դիագրամը, որտեղ մասնագետի պահանջած հմտությունները հատվում են գործնական փորձի և գիտելիքի ոլորտնի խաչմերուկում: Դասական վիճակագրության համեմատ, տվյալների գիտությունը ենթադրում է թվային տեղեկատվության գերիշխող մեծ և բազմաբևեռ զանգվածների ուսումնասիրություն և անխուսափելի կապ` տեղեկատվական տեխնոլոգիաների հետ, որոնք ապահովում են դրանց վերամշակումը : Դիզայնի և տվյալների բազաների աշխատանքների հետ համեմատած, որտեղ առաջարկվում է տվյալների մոդելի նախնական ձևավորում, տվյալների գիտությունը ենթադրում է մաթեմատիկական վիճակագրության, արհեստական ​​հետախուզության, մեքենայական ուսուցման հաճախ առանց նախնական տվյալների ներբեռնելու մոդելը: Համեմատած վերլուծաբանի մասնագիտությանը, որի հիմնական նպատակն է կուտակված տվյալների հիման վրա միջոցառումների նկարագրությունը՝ օգտագործելով համեմատաբար պարզ գործիքներ (օրինակ, աղյուսակներ կամ բիզնեսի հետախուզության դասային գործիքներ), տվյալների գիտության մասնագետի պրոֆիլը ավելի քիչ ուշադրություն է դարձնում ենթակա ոլորտների բովանդակությանը և ավելի խորը գիտելիքներ պահանջում մաթեմատիկական վիճակագրության, մեքենայական ուսուցման և ծրագրավորման ոլորտներում:

Օգտագործման ոլորտներ[խմբագրել | խմբագրել կոդը]

Տվյալների գիտություն

Տվյալների գիտության խոշորագույն օգտագործման ոլորտները(այբբենական կարգով)

Ծանոթագրություններ[խմբագրել | խմբագրել կոդը]

  1. 1,0 1,1 1,2 Dhar V. (2013)։ «Data science and prediction»։ Communications of the ACM 56 (12): 64–73։ doi:10.1145/2500499 
  2. Jeff Leek (2013-12-12)։ «The key word in "Data Science" is not Data, it is Science»։ Simply Statistics 
  3. 3,0 3,1 Leskovec Jure, Rajaraman Anand, Ullman Jeffrey David։ Mining of Massive Datasets (Preprint of 3rd ed.)։ Cambridge University Press։ էջ 1 
  4. 4,0 4,1 Hayashi Chikio (1998-01-01)։ «What is Data Science? Fundamental Concepts and a Heuristic Example»։ in Hayashi Chikio, Yajima Keiji, Bock Hans-Hermann, Ohsumi Noboru, Tanaka Yutaka, Baba Yasumasa։ Data Science, Classification, and Related Methods։ Studies in Classification, Data Analysis, and Knowledge Organization (անգլերեն)։ Springer Japan։ էջեր 40–51։ ISBN 9784431702085։ doi:10.1007/978-4-431-65950-1_3 
  5. 5,0 5,1 Stewart Tansley, Kristin Michele Tolle (2009)։ The Fourth Paradigm: Data-intensive Scientific Discovery։ Microsoft Research։ ISBN 978-0-9825442-0-4 
  6. 6,0 6,1 Bell G., Hey T., Szalay A. (2009)։ «COMPUTER SCIENCE: Beyond the Data Deluge»։ Science 323 (5919): 1297–1298։ ISSN 0036-8075։ PMID 19265007։ doi:10.1126/science.1170411 
  7. 7,0 7,1 Davenport, Thomas H.; Patil, DJ (Oct 2012), Data Scientist: The Sexiest Job of the 21st Century, Harvard Business Review, https://hbr.org/2012/10/data-scientist-the-sexiest-job-of-the-21st-century/ 
  8. 8,0 8,1 8,2 «Data Science: What's The Half-Life Of A Buzzword?»։ Forbes։ 2013-08-19 
  9. Singer Natasha (2011-04-02)։ «When the Data Struts Its Stuff» (en-US)։ Վերցված է 2018-09-01 
  10. 10,0 10,1 «Nate Silver: What I need from statisticians»։ 23 Aug 2013 
  11. Warden Pete (2011-05-09)։ «Why the term "data science" is flawed but useful»։ O'Reilly Radar (en-US)։ Վերցված է 2018-05-20 
  12. «Are You Setting Your Data Scientists Up to Fail?»։ Harvard Business Review։ 2018-01-25։ Վերցված է 2018-05-26 
  13. «70% of Big Data projects in UK fail to realise full potential»։ www.consultancy.uk (անգլերեն)։ Վերցված է 2018-05-26 
  14. «The Data Economy: Why do so many analytics projects fail? – Analytics Magazine»։ Analytics Magazine (en-US)։ 2014-07-07։ Վերցված է 2018-05-26 
  15. «Data Science: 4 Reasons Why Most Are Failing to Deliver»։ www.kdnuggets.com (en-US)։ Վերցված է 2018-05-26 
  16. Naur Peter (1 July 1966)։ «The science of datalogy»։ Communications of the ACM 9 (7): 485։ doi:10.1145/365719.366510 
  17. Press Gil։ «A Very Short History Of Data Science» 
  18. 18,0 18,1 Wu C. F. J. (1997)։ «Statistics = Data Science?»։ Վերցված է 9 October 2014 
  19. «Identity of statistics in science examined»։ The University Records, 9 November 1997, The University of Michigan։ Վերցված է 12 August 2013 
  20. «P.C. Mahalanobis Memorial Lectures, 7th series»։ P.C. Mahalanobis Memorial Lectures, Indian Statistical Institute։ Արխիվացված է օրիգինալից 29 October 2013-ին։ Վերցված է 18 Jul 2017 
  21. 21,0 21,1 Cleveland, W. S. (2001). Data science: an action plan for expanding the technical areas of the field of statistics. International Statistical Review / Revue Internationale de Statistique, 21–26
  22. International Council for Science: Committee on Data for Science and Technology. (2012, April). CODATA, The Committee on Data for Science and Technology. Retrieved from International Council for Science : Committee on Data for Science and Technology: http://www.codata.org/
  23. Data Science Journal. (2012, April). Available Volumes. Retrieved from Japan Science and Technology Information Aggregator, Electronic: http://www.jstage.jst.go.jp/browse/dsj/_vols Archived 3 April 2012 at the Wayback Machine.
  24. Data Science Journal. (2002, April). Contents of Volume 1, Issue 1, April 2002. Retrieved from Japan Science and Technology Information Aggregator, Electronic: http://www.jstage.jst.go.jp/browse/dsj/1/0/_contents
  25. The Journal of Data Science. (2003, January). Contents of Volume 1, Issue 1, January 2003. Retrieved from http://www.jds-online.com/v1-1
  26. National Science Board։ «Long-Lived Digital Data Collections Enabling Research and Education in the 21st Century»։ National Science Foundation։ Վերցված է 30 June 2013 
  27. Markoff John (2009-12-14)։ «Essays Inspired by Microsoft’s Jim Gray, Who Saw Science Paradigm Shift»։ The New York Times (en-US)։ ISSN 0362-4331։ Վերցված է 2018-04-26 
  28. «IEEE Task Force on Data Science and Advanced Analytics» 
  29. «2014 IEEE International Conference on Data Science and Advanced Analytics»։ Արխիվացված է օրիգինալից 29 March 2017-ին 
  30. «NY gets new bootcamp for data scientists: It’s free, but harder to get into than Harvard»։ Venture Beat։ Վերցված է 2016-02-22 
  31. Talley Jill (2016-06-01)։ «ASA Expands Scope, Outreach to Foster Growth, Collaboration in Data Science»։ AMSTATNEWS։ American Statistical Association։ Արխիվացված է օրիգինալից 2017-02-05-ին։ Վերցված է 2017-02-04 
  32. «Journal on Data Science and Analytics» 
  33. Darrow Barb (May 21, 2015)։ «Data science is still white hot, but nothing lasts forever»։ Fortune։ Վերցված է November 20, 2017 
  34. Miller Steven (2014-04-10)։ «Collaborative Approaches Needed to Close the Big Data Skills Gap»։ Journal of Organization Design (անգլերեն) 3 (1): 26–30։ ISSN 2245-408X։ doi:10.7146/jod.9823 
  35. De Mauro Andrea, Greco Marco, Grimaldi Michele, Ritala Paavo (2018)։ «Human resources for Big Data professions: A systematic classification of job roles and required skill sets»։ Information Processing & Management 54 (5): 807–817։ doi:10.1016/j.ipm.2017.05.004 
  36. 36,0 36,1 Wladawsky-Berger Irving (May 2, 2014)։ «Why Do We Need Data Science When We’ve Had Statistics for Centuries?»։ The Wall Street Journal։ Վերցված է November 20, 2017 
  37. 37,0 37,1 37,2 37,3 37,4 37,5 37,6 37,7 Donoho David (September 2015)։ «50 Years of Data Science»։ Based on a Talk at Tukey Centennial Workshop, Princeton NJ Sept 18 2015 
  38. Barlow Mike (2013)։ The Culture of Big Data։ O'Reilly Media, Inc. 
  39. Chambers John M. (1993-12-01)։ «Greater or lesser statistics: a choice for future research»։ Statistics and Computing (անգլերեն) 3 (4): 182–184։ ISSN 0960-3174։ doi:10.1007/BF00141776 
  40. Collins Francis S., Tabak Lawrence A. (2014-01-30)։ «NIH plans to enhance reproducibility»։ Nature 505 (7485): 612–613։ ISSN 0028-0836։ PMC 4058759։ PMID 24482835։ doi:10.1038/505612a 
  41. McNutt Marcia (2014-01-17)։ «Reproducibility»։ Science (անգլերեն) 343 (6168): 229։ ISSN 0036-8075։ PMID 24436391։ doi:10.1126/science.1250475 
  42. Peng Roger D. (2009-07-01)։ «Reproducible research and Biostatistics»։ Biostatistics (անգլերեն) 10 (3): 405–408։ ISSN 1465-4644։ PMID 19535325։ doi:10.1093/biostatistics/kxp014