Համակարգչային տեսլական

Վիքիպեդիայից՝ ազատ հանրագիտարանից
Jump to navigation Jump to search

Համակարգչային տեսլական (անգլ.՝ computer vision) միջդիսցիպլինար գիտական ոլորտ է, որն առնչվում է այն բանի հետ, թե ինչպես կարելի է համակարգիչները կազմել թվային պատկերներից կամ տեսանյութերից[1]։ Ճարտարագիտության տեսանկյունից այն ձգտում է ավտոմատացնել այն խնդիրները, որոնք մարդու տեսողական համակարգը կարող է անել[2][3]։

Համակարգչային տեսողության առաջադրանքները ներառում են թվային պատկերներ ձեռք բերելու, մշակելու, վերլուծելու և հասկանալու, առանձնացնելու բարձր թվային ծավալները իրական աշխարհից՝ թվային կամ սիմվոլիկ ինֆորմացիա արտադրելու նպատակով[4]։

Այս համտեքստում հասկանալ նշանակում է տեսողական պատկերների (the input to retina) վերափոխում աշխարհի նկարագրությունների, որոնք կարող են փոխշփվել այլ մտքի գործընթացների հետ և առաջացնել համապատասխան գործողություններ։ Պատկերների այս ըմբռնումը կարելր է համարել պատկերային տվյալների խորհրդանշական տեղեկատվության տարբերակում՝ օգտագործելով երկրաչափության, ֆիզիկայի, վիճակագրության և ուսուցման տեսության օգնությամբ կառուցված մոդելները[5][6]։

Համակարգչային տեսլականի կարգապահությունը վերաբերում է արհեստական համակարգերի ետևում գտած տեսությանը, որը տեղեկատվություն է բերում պատկերներից։ Պատկերների տվյալները կարող են ունենալ բազմաթիվ ձևեր, ինչպիսիք են վիդեո հաջորդականությունը, պատկերներ բազմաթիվ տեսախցիկներից, կամ բազմաչափ տվյալներ բժշկական սկաներներից։ Համակարգչային տեսլականի տեխնոլոգիական կարգապահությունը նպատակ ունի կիրառել իր տեսությունները և մոդելները համակարգչային տեսողության համակարգերի կառուցման վրա [7]։

Համակարգչային տեսլականի ենթատիրույթները ներառում են տեսարանի վերակառուցում ,իրադարձությունների հայտնաբերում, օբյեկտների ճանաչում, 3D դիրքի գնահատում, ինդեքսավորում, շարժման գնահատում և պատկերների գնահատում ։

Սահմանում[խմբագրել | խմբագրել կոդը]

Համակարգչային տեսլականը միջդիսցիպլինար գիտական ոլորտ է, որն առնչվում է այն բանի հետ, թե ինչպես կարելի է համակարգիչները կազմել թվային պատկերներից կամ տեսանյութերից՝ բարձր մակարդակի պատկերացում կազմելու համար։ Ճարտարագիտության տեսանկյունից այն ձգտում է ավտոմատացնել այն խնդիրները, որոնք մարդու տեսողական համակարգը կարող է անել։ "Համակարգչային տեսլականը պատկերից կամ պատկերների հաջորդականությունից օգտակար տեղեկատվության ավտոմատ արդյունահանմանը, վերլուծությանը և հասկացողությանը։ Այն ներառում է տեսական և ալգորիթմական հիմքի զարգացումը՝ ավտոմատ տեսողական ըմբռնմանը հասնելու համար։ "Որպես գիտական կարգապահություն համակարգչային տեսլականը վերաբերում է արհեստական համակարգերի ետևում գտած տեսությանը, որը տեղեկատվություն է բերում պատկերներից։ Պատկերների տվյալները կարող են ունենալ բազմաթիվ ձևեր, ինչպիսիք են վիդեո հաջորդականությունը, պատկերներ բազմաթիվ տեսախցիկներից, կամ բազմաչափ տվյալներ բժշկական սկաներներից։ Որպես տեխնելեգիական կարգապահություն, համակարգչային տեսլականը փորձում է կիրառել իր տեսությունները և մոդելները համակարգչային տեսլական համակարգեր կառուցելու համար [8][9]։

Պատմություն[խմբագրել | խմբագրել կոդը]

1960-ական թվականներին համալսարաններում սկսվեց համակարգչային տեսլականը։ Այն կոչված էր ընդօրինակել մարդկային տեսողական համակարգը՝ որպես խելացի վարք ունեցող ռոբոտներին դիմանալու աստիճանահարթակ։

1966 թվականին հավատում էին, որ դա կարելի է հասնել ամառային ծրագրի միջոցով՝ համակարգչին միացնելով տեսախցիկը և ունենալով «նկարագրել այն, ինչ տեսել է» [10][11]։

Այն, ինչ առանձնացնում էր համակարգչային տեսլականը այդ ժամանակի թվային պատկերների մշակումից, այն էր եռաչափ կառուցվածքը պատկերներից առանձնացնելու ցանկությունն էր՝ նպատակ ունենալով հասնել տեսարանի ամբողջական պատկերացմանը։ 1970-ականներին կատարված ուսումնասիրությունները ստեղծեցին վաղ հիմունքները համակարգչային տեսլականի ալգորիթմներից շատերի համար, որոնք առկա են այսօր, ներառյալ՝ նկարներից եզրերի արդյունահանում, գծերի պիտակավորում, ոչ պոլիէթիլերային և պոլիէթիլային մոդելավորում, օբյեկտների ներկայացում որպես փոքր կառույցների փոխկապակցվածություն, օպտիկական հոսք և միջնորդության գնահատում[12][13]։

Հաջորդ տասնամյակը կատարեց ուսումնասիրություններ, որոնք հիմնված էին ավելի խիստ մաթեմատիկական վերլուծության և համակարգչային տեսլականի քանակական կողմերի վրա։ Դրանք ներառում են մասշտաբի-տարածության հայեցակարգը, ձևի տարբերակումը տարբեր ցուցանակներից`ստվեր, հյուսվածք ու կենտրոնացում և շրջապատող մոդելներ, որոնք հայտնի են որպես օձեր։ Հետազոտողները գիտակցել են նաև, որ այդ մաթեմատիկական հասկացություններից շատերը կարող են լուծվել նույն օպտիմիզացման շրջանակներում, ինչպես կանոնակարգումը և Մարկովի պատահական դաշտերը[14][15]։

Մինչև 1990-ականները, նախորդ հետազոտությունների թեմաներից մի քանիսը ավելի ակտիվ էին դարձել, քան մյուսները։ 3D վերակառուցման նախագծերում կատարված հետազոտությունները հանգեցրել են տեսախցիկի տրամաչափման ավելի լավ պատկերացմանը։ Խցիկի չափաբերման համար օպտիմիզացման մեթոդների ներդրմամբ, հասկացվեց, որ բազմաթիվ գաղափարներ արդեն ուսումնասիրվել են փաթեթային ճշգրտման տեսության մեջ` ֆոտոգրաֆիկայի չափման ոլորտից։ 1990-ականների վերջին, զգալի փոփոխություն տեղի ունեցավ համակարգչային գրաֆիկայի ոլորտների և համակարգչային տեսլականի ոլորտների միջև փոխգործակցության աճի հետ։ Սա ներառում էր պատկերի վրա հիմնված նկարագրում, պատկերի ձևավորում, ինտերպոլացիա, պանորամային պատկերի կարում և լուսային դաշտի վաղ մատուցում[16] ː

Վերջին աշխատանքներում նկատվել է խաղարկային մեթոդների վերածնունդ, որն օգտագործվում է մեքենայական ուսուցման տեխնիկայի և օպտիմիզացման բարդ շրջանակների հետ միասին [17][18] ː

Համակարգչային և մեքենայական տեսլականի 6 զարմանալի օրինակ[խմբագրել | խմբագրել կոդը]

1) Ինքնավար տրանսպորտային միջոցներ

Համակարգչային տեսլականը անհրաժեշտ է ինքնաշարժվող ավտոմեքենաները հնարավորություն տալու համար։ Այնպիսի արտադրողները, ինչպիսիք են Tesla- ն, BMW- ն, Volvo- ն և Audi- ն, օգտագործում են բազմաթիվ տեսախցիկներ, լիդար, ռադար և ուլտրաձայնային տվիչներ՝ շրջակա միջավայրից պատկերներ ձեռք բերելու համար, որպեսզի իրենց ինքնագնաց մեքենաները կարողանան անվտագորեն վարել օբյեկտներ, գծապատկերներ, նշաններ և երթևեկության ազդանշաններ[19][20]։

2) Google Translate ծրագիրը

Այն ամենը, ինչ դուք պետք է անեք օտար լեզվով նշաններ կարդալու համար` ձեր հեռախոսի ֆոտոխցիկը պետք է մատնանշեք բառերին և թույլ տաք Google Translate հավելվածին պատմել ձեզ, թե ինչ է նշանակում տվյալ բառը ձեր նախընտրած լեզվով [19][21]։

3) Դեմքի ճանաչում

Չինաստանը, անշուշտ, դեմքի ճանաչման տեխնոլոգիայի օգտագործման վերջնարդյունքում է, և նրանք այն օգտագործում են օդանավակայանում, ոստիկանության աշխատանքի, վճարման պորտալների, անվտանգության անցակետերի և նույնիսկ զուգարանի թուղթը տարածելու և թղթի գողությունները կանխելու համար [22][23]։

4) Առողջապահություն

Քանի որ բոլոր բժշկական տվյալների 90 տոկոսը հիմնված է պատկերի վրա, բժշկության մեջ համակարգչային տեսլականի օգտագործման մեծ քանակ կա:Ռենտգենյան ճառագայթների, մամոգրաֆիայի և այլ սկանավորման վերլուծություն կատարելուց առաջ՝ մինչև բժշկական ախտորոշման նոր մեթոդներ թույլ տալը, ավելի վաղ խնդիրներ հայտնաբերելու և վիրահատություններին օգնություն ցուցաբերելու համար հիվանդներին մոնիտորինգ անելու համար, ակնկալում ենք, որ մեր բժշկական հաստատությունները, մասնագետներն ու հիվանդները օգտվեն համակարգչային տեսողությունից այսօր և հետագայում ևս, քանի որ այն գլորվել է առողջապահության ոլորտում[24]։

5) Գյուղատնտեսություն

CES 2019 – ին Ջոն Դիրը ցուցադրեց կիսաավտոմատ կոմբայն, որը օգտագործում է արհեստական բանականությունը և համակարգչային տեսողությունը ՝ հացահատիկի որակը վերլուծելու համար, ինչպես նաև բերք է ստանալու և բերքի միջոցով օպտիմալ ուղին գտնելու համար [25]։ Համակարգչային տեսլականի մեծ պոտենցիալ կա նաև մոլախոտերի հայտնաբերման համար, որպեսզի հերբիցիդները ուղղակիորեն ցողվեն դրանց վրա, այլ ոչ թե բերքի վրա։ Ակնկալվում է, որ դա 90 տոկոսով կնվազեցնի անհրաժեշտ հերբիցիդների քանակը[19]։

6) Արտադրություն

Համակարգչային տեսլականը արտադրողներին օգնում է վարվել ավելի անվտանգ, խելացի և արդյունավետ։ Կանխատեսելի պահպանումը միայն մեկ օրինակ է, երբ սարքավորումները վերահսկվում են համակարգչային տեսլականի միջոցով, որպեսզի միջամտեն նախքան խափանումներ պատահելը ։ Փաթեթավորումը և արտադրանքի որակը վերահսկվում են, և թերի արտադրանքները նույնպես կրճատվում են համակարգչային տեսլականի միջոցով[19][26]։

Գրականություն[խմբագրել | խմբագրել կոդը]

Ծանոթագրություններ[խմբագրել | խմբագրել կոդը]

  1. https://towardsdatascience.com/computer-vision-an-introduction-bbc81743a2f7 Համակարգչային տեսլական )
  2. Ballard Dana H. (Dana Harry) (1982)։ Computer vision։ Internet Archive։ Englewood Cliffs, N.J. : Prentice-Hall 
  3. «Computer Vision - CERN Document Server»։ cds.cern.ch։ Վերցված է 2019-10-14 
  4. «Ինֆորմացիա» (հայերեն)։ 2019-08-04 
  5. «Երկրաչափություն» (հայերեն)։ 2019-09-04 
  6. «Ֆիզիկա» (հայերեն)։ 2019-09-09 
  7. Murphy Mike։ «Star Trek’s “tricorder” medical scanner just got closer to becoming a reality»։ Quartz (անգլերեն)։ Վերցված է 2019-10-14 
  8. Mihajlovic Ilija (2019-10-13)։ «Everything You Ever Wanted To Know About Computer Vision.»։ Medium (անգլերեն)։ Վերցված է 2019-10-14 
  9. «Computer Vision: Algorithms and Applications»։ szeliski.org։ Վերցված է 2019-10-14 
  10. Davies E.R (November 15,2017)։ Computer Vision: Principles, Algorithms, Applications, Learning 
  11. «Տեսողություն» (հայերեն)։ 2019-03-17 
  12. Steger Carsten, Ulrich Markus, Wiedemann Christian (2018-03-12)։ Machine Vision Algorithms and Applications (անգլերեն)։ John Wiley & Sons։ ISBN 9783527413652 
  13. «Ալգորիթմ» (հայերեն)։ 2019-06-04 
  14. Kanade Takeo (2012-12-06)։ Three-Dimensional Machine Vision (անգլերեն)։ Springer Science & Business Media։ ISBN 9781461319818 
  15. «Markov random field» (անգլերեն)։ 2019-10-12 
  16. Szeliski Richard (2010-09-30)։ Computer Vision: Algorithms and Applications (անգլերեն)։ Springer Science & Business Media։ ISBN 9781848829350 
  17. Sebe Nicu, Cohen Ira, Garg Ashutosh, Huang Thomas S. (2005-06-03)։ Machine Learning in Computer Vision (անգլերեն)։ Springer Science & Business Media։ ISBN 9781402032745 
  18. «Information Engineering | Department of Engineering»։ www.eng.cam.ac.uk։ Վերցված է 2019-10-14 
  19. 19,0 19,1 19,2 19,3 Marr Bernard։ «7 Amazing Examples Of Computer And Machine Vision In Practice»։ Forbes (անգլերեն)։ Վերցված է 2019-10-14 
  20. Janai Joel, Güney Fatma, Behl Aseem, Geiger Andreas (2017-04-18)։ «Computer Vision for Autonomous Vehicles: Problems, Datasets and State-of-the-Art»։ arXiv:1704.05519 [cs] 
  21. Korbut Daniil (2017-08-01)։ «Machine Learning Translation and the Google Translate Algorithm»։ Medium (անգլերեն)։ Վերցված է 2019-10-14 
  22. «Face Recognition Homepage - Journals and Books»։ www.face-rec.org։ Վերցված է 2019-10-14 
  23. «Behind the Rise of China's Facial-Recognition Giants»։ Wired (անգլերեն)։ ISSN 1059-1028։ Վերցված է 2019-10-14 
  24. «Computer Vision for Assistive Healthcare | ScienceDirect»։ www.sciencedirect.com (անգլերեն)։ Վերցված է 2019-10-14 
  25. «CES 2019: Deere puts spotlight on high-tech farming»։ The Star Online (անգլերեն)։ 2019-01-10։ Վերցված է 2019-10-14 
  26. Author Jamie MaguireSoftware Architect | Consultant | Developer | Tech (2018-03-22)։ «10 Examples of Using Machine Vision in Manufacturing»։ DevTeam.Space (en-US)։ Վերցված է 2019-10-14 

Արտաքին հղումներ[խմբագրել | խմբագրել կոդը]