Պատկերի հատվածավորում

Վիքիպեդիայից՝ ազատ հանրագիտարանից
Մարդու ձախ ազդրոսկրի հատվածավորման մոդել։ Ցույց է տալիս արտաքին մակերեսը (կարմիր), կոմպակտ շերտի և սպունգանման ոսկրանյութի միջև ընկած մակերեսը (կանաչ) և ոսկրածուծի մակերեսը (կապույտ)։

Պատկերի հատվածավորումը, պատկերի թվային մշակման և համակարգչային տեսլականի մեջ, թվային պատկերի մասնատումն է բազմակի հատվածների (փիքսելների բազմություն, հայտնի որպես նկարի օբյեկտներ)։ Հատվածավորման նպատակն է պարզեցնել կամ փոփոխել պատկերի ներկայացման եղանակը՝ վերլուծման համար դարձնելով ավելի նպատակահարմար[1][2]։ Պատկերի հատվածավորումը հիմնականում օգտագործվում է օբյեկտներն ու սահմանները (գծեր, կորեր և այլն) պատկերում տեղակայելու համար։ Ավելի կոնկրետ, պատկերի հատվածավորումը նկարին պատկանող յուրաքանչյուր փիքսելին պիտակավորելու գործընթացն է այնպես, որ նույն պիտակին պատկաող փիքսելները ունենան որոշակի ընդհանուր հատկանիշներ։

Պատկերի հատվածավորման արդյունքը հատվածների բազմություն է, որոնք միասին ծածկում են ողջ պատկերը կամ նկարից արտահանված ուրվագծերի բազմություն (տես՝ եզրերի հայտնաբերում)։ Տարածքում պիքսելներից յուրաքանչյուրը նման է մյուսին ինչ֊որ հատկանիշով կամ հաշվարկված հատկությամբ, ինչպես օրինակ՝ գույնով, ինտենսիվությամբ կամ կառուցվածքով։ Հարակից տարածքները զգալիորեն տարբերվում են նույն հատկանիշներով[1]։ Երբ կիրառվում է պատկերների ստեկի վրա, որը բնորոշ է բժշկական պատկերապատմանը, պատկերի բաժանման արդյունքում ստացված ուրվագիծը կարող է օգտագործվել 3D վերակառուցումներ ստեղծելու համար` ինտերպոլյացիոն ալգորիթմների օգնությամբ, ինչպիսիք են երթային խորանարդները[3]։

Կիրառություններ[խմբագրել | խմբագրել կոդը]

3D-ներկայացված կրծքավանդակի Համակարգչային շերտագրության ծավալային հատվածավորում։ Կրծքային պարունակությունը թվային արտացոլելու նպատակով հեռացվել են նախնական կրծքային պատը, օդուղիները և թոքային անոթները՝ թոքի արմատից առաջ․
– կապույտ: թոքային զարկերակ
– կարմիր: թոքային երակ(և նաև որովայնի պատ)
– դեղին: միջնորմ
– մանուշակագույն: ստոծանի։

Պատկերի հատվածավորման որոշ պրակտիկ կիրառություններից են

Պատկերների բաժանման համար մշակվել են մի քանի ընդհանուր նպատակային ալգորիթմներ և տեխնիկա։ Օգտակար լինելու համար, այս տեխնիկան, որպես կանոն, պետք է համակցված լինի տիրույթի հատուկ գիտելիքների հետ, որպեսզի արդյունավետ լուծի որոշման տիրույթի հատվածավորման խնդիրները։

Շեմադրում[խմբագրել | խմբագրել կոդը]

Պատկերի հատվածավորման պարզագույն մեթոդներից մեկը շեմադրման մեթոդն է։ Այս մեթոդը մոխրագույն մասշտաբի պատկերը վերածում է երկուական համակարգի պատկերի՝ հիմնվելով շեմի արժեքից։

Այս մեթոդի հիմնական բանալին շեմի արժեքի ընտրությունն է (կամ արժեքների, երբ ընտրվում են բազմաթիվ մակարդակներ)։ Ոլորտում օգտագործվում են մի քանի հանրաճանաչ մեթոդներ՝ ներառյալ էնթրոպիայի առավելագույն մեթոդը, բալանսավորված հիստոգրամի շեմադրումը, Օցուի մեթոդը (առավելագույն վարիացիա) և k-միջիններ կլաստերացումը։

Վերջերս մշակվել են մեթոդներ՝ hամակարգչային շերտագրություն (ՀՇ), պատկերների շեմի համար։ Առանցքային գաղափարը, ի տարբերություն Օցուի մեթոդի, շեմերի բխումն է ռադիոգրաֆներից (վերակառուցված) պատկերի փոխարեն[13][14]։

Նոր մեթոդները առաջարկում են օգտագործել բազմաչափ ոչ հստակ կանոնների վրա հիմնված ոչ գծային շեմի օգտագործումը։ Այս աշխատանքներում որոշման վերաբերյալ յուրաքանչյուր պիքսելային մասնաբաժնի վերաբերյալ որոշումը հիմնված է ոչ հստակ տրամաբանության և էվոլյուցիոն ալգորիթմներից բխող բազմաբնույթ կանոնների վրա, որոնք հիմնված են պատկերի լուսավորման միջավայրի և կիրառման վրա[15]։

Կլաստերացման մեթոդներ[խմբագրել | խմբագրել կոդը]

K-միջիններով ալգորիթմը իտերատիվ տեխնիկա է, որն օգտագործվում է պատկերը K հատ կլաստերների բաժանելու համար[16]։ Հիմնական ալգորիթմն է

  1. Վերցնել K հատ կլաստերի կենտրոններ պատահական ձևով կամ հիմնված ինչ֊որ ժառանգական մեթոդի վրա, օրինակ՝ K-միջիններ ++
  2. Նշանակել պատկերի յուրաքանչյուր պիքսել այն կլաստերին, որի համար տվյալ կլաստերի կենտրոնից պիքսելի հերավորությունը նվազագույնն է
  3. Կրկին հաշվել կլաստերի կենտրոնները՝ միջինացնելով կլաստերի բոլոր պիքսելները
  4. Կրկնել երկրորդ և երրորդ կետերը մինչև զուգամիտման հասնելը (այսինքն՝ պիքսելները չեն փոխում կլաստերը)

Այս դեպքում, հեռավորությունը պիքսելի և կլաստերի կենտրոնի տարբերության քարակուսին է կամ բացարձակ արժեքը։ Տարբերությունը հիմնականում հիմնված է պիքսելի գույնի, ինտենսիվության, կառուցվածքի, տեղակայման կամ այս գործոնների կշռված համադրության վրա։ K -ն կարող է ընտրվել ձեռքով, պատահականորեն, կամ հեուրիստական ալգորիթմով։ Այս ալգորիթմտ երաշխավորում է զուգամիտում, բայց կարող է չվերադարձնել օպտիմալ լուծում։ Լուծման որակը կախված է կլաստերների սկզբանական բազմությունից և K-ի արժեքից։

Շարժում և ինտերակտիվ հատվածավորում[խմբագրել | խմբագրել կոդը]

Շարժման հատվածավորումը մեթոդ է, որը հատվածավորելու համար հիմնվում է նկարի վրա պատկերված շարժման վրա։

Գաղափարը նկարների զույգի տարբերությունների դիտարկումն է։ Ենթադրելով, որ հետաքրքրող օբյեկտը շարժվում է, նկարների տարբերությունը բնականաբար կլինի օբյեկտը։

Բարելավելով գաղափարը՝ Քեննին և համախոհները առաջարկեցին ինտերակտիվ հատվածավորում [2]։ Նրանք օգտագործում են ռոբոտ օբյեկտները մատնանշելու համար, որպեսզի առաջացնեն շարժման ազդանշան, որն էլ անհրաժեշտ է շարժման վրա հիմնված հատվածավորման համար։

Ինտերակտիվ սեգմենտացիան հետևում է Դով Կատցի [3] և Օլիվեր Բրոքի [4] առաջարկած ինտերակտիվ ընկալման ֆրեյմվորքին։

Սեղմման վրա հիմնված մեթոդներ[խմբագրել | խմբագրել կոդը]

Սեղմման վրա հիմնված մեթոդները ենթադրում են, որ օպտիմալ հատվածավորումը բոլոր հնարավոր հատվածավորման տարբերակներից այն մեկն է, որը նվազագույնի է հասցնում տվյալների կոդավորման երկարությունը[17][18]։ Այս երկու հասկացությունների միջև կապն այն է, որ հատվածայնացումը փորձում է պատկերների մեջ գտնել նախշեր, և պատկերի ցանկացած օրինաչափություն կարող է օգտագործվել այն սեղմելու համար։ Մեթոդը նկարագրում է յուրաքանչյուր հատվածն իր կառուցվածքով և սահմանային ձևով։ Այս բաղադրիչներից յուրաքանչյուրը մոդելավորվում է հավանականության բաշխման գործառույթով և դրա կոդավորման երկարությունը հաշվարկվում է հետևյալ կերպ՝

  1. Սահմանի կոդավորումը սահմանափակում է այն փաստը, որ բնական պատկերների շրջանները հակված են հարթ եզրագծին։ Սա նախկինում օգտագործվել է Հաֆմանի կոդավորման մեջ ՝ պատկերների մեջ պատկերված ուրվագծերի շղթայի տարբերության ծածկագիրը կոդավորելու համար։ Այսպիսով, որքան ավելի հարթ է սահմանը, այնքան ավելի կարճ է կոդավորման երկարությունը։
  2. Կառուցվածքը կոդավորվում է կորուստային սեղմմամբ՝ նկարագրության նվազագույն երկարության (ՆՆԵ) սկզբունքին նման եղանակով, բայց այստեղ տվյալ մոդելի տրված տվյալների երկարությունը մոտավոր հաշվարկվում է նմուշների քանակը բազմապատկելով մոդելի էնտրոպիային։ Յուրաքանչյուր տարածաշրջանում կառուցվածքը մոդելավորվում է բազմաբնույթ նորմալ բաշխմամբ, որի էնտրոպիան ունի փակ կազմության արտահայտություն։ Այս մոդելի հետաքրքիր առանձնահատկությունն այն է, որ գնահատված էնտրոպիան սահմանափակում է վերևից ստացված տվյալների իրական էտրոպիան։ Պատճառը, տվյալ բաշխվածությամբ և կովարիանսով բոլոր բաշխումներում, նորմալ բաշխման ամենամեծ էնտրոպիա ունենալն է։ Հետևաբար, կոդավորման իրական երկարությունը չի կարող ավելին լինել, քան այն, ինչ ալգորիթմը փորձում է նվազագույնի հասցնել։

Պատկերի ցանկացած հատվածի բաժանման համար այս սխեման տալիս է տվյալ պատկերի կոդավորման համար պահանջվող բիթերի քանակը` տվյալ հատվածի բաժանման հիման վրա։ Հետևաբար, պատկերի բոլոր հնարավոր հատվածների միջև նպատակն է գտնել այն հատվածավորումը, որը վերադարձնում է ամենակարճ կոդավորման երկարությունը։ Դրան կարելի է հասնել ագլոմերատիվ կլաստերավորման պարզ եղանակով։ Կորուստային սեղմման ալգորիթմում աղավաղումը որոշում է հատվածի բաժանման անճշտությունը և դրա օպտիմալ արժեքը կարող է տարբեր լինել յուրաքանչյուր պատկերի համար։ Այս պարամետրը կարելի է հեուրիստական եղանակով գնահատել պատկերված կառուցվածքների հակադրությունից։ Օրինակ, երբ պատկերում առկա կառուցվածքները նման են, ինչպես քողարկման պատկերներում, անհրաժեշտ է ավելի ուժեղ զգայունություն և այդպիսով ավելի ցածր քանակականացում։

Հիստոգրամի վրա հիմնված մեթոդներ[խմբագրել | խմբագրել կոդը]

Հիստոգրամի վրա հիմնված մեթոդները շատ արդյունավետ են, համեմատած պատկերի հատվածավորման այլ մեթոդների հետ, քանի որ դրանք սովորաբար պահանջում են պիքսելների միջոցով միայն մեկ անցում։ Այս տեխնիկայում հիստոգրամը հաշվարկվում է պատկերի բոլոր պիքսելներից, իսկ նկարագրության մեջ գտնվող կլաստերները տեղակայելու համար գագաթներն ու հովիտներն են օգտագործվում[1]։ Գույնը կամ ինտենսիվությունը կարող են օգտագործվել որպես չափման միջոց։

Այս տեխնիկայի կատարելագործումը ռեկուրսիվորեն հիստոգրամով որոնման մեթոդի կիրառումն է պատկերում գտնվող կլաստերների վրա, որպեսզի դրանք բաժանվեն ավելի փոքր կլաստերների։ Այս գործողությունը կրկնվում է ավելի փոքր և փոքր կլաստերներով, մինչև որ այլևս չկազմվեն նոր կլաստերներ[1][19]։

Հիստոգրաֆի որոնման մեթոդի թերություններից մեկն այն է, որ գուցե դժվար լինի պատկերել նշանակալից գագաթներն ու հովիտները։

Հիստոգրամի վրա հիմնված մոտեցումները կարող են նաև արագորեն հարմարվել բազմակի շրջանակներում կիրառելու համար՝ միաժամանակ պահպանելով դրանց միայնակ անցման արդյունավետությունը։ Հիստոգրամը կարող է կազմվել մի քանի տարբերակով, երբ հաշվի են առնվում բազմաթիվ շրջանակներ։ Նույն մոտեցումը, որն ընդունվում է մեկ շրջանակով, կարող է կիրառվել բազմակի տարբերակներով, և արդյունքների միաձուլումից հետո գագաթներն ու հովիտները, որոնք նախկինում դժվար էր գտնել, ավելի հավանական է, որ տարբերվեն։ Հիստոգրամը կարող է կիրառվել նաև յուրաքանչյուր պիքսելի հիման վրա, որտեղ արդյունքում ստացված տեղեկատվությունն օգտագործվում է պիքսելների տեղակայման առավել հաճախակի գույնը որոշելու համար։ Այս մոտեցումը հատվածավորում է ակտիվ օբյեկտների և ստատիկ միջավայրի հիման վրա, ինչը հանգեցնում է մեկ այլ տիպի հատվածավորման, որը օգտակար է տեսանյութերի հետևման համակարգերի համար։

Եզրերի հայտնաբերում[խմբագրել | խմբագրել կոդը]

Եզրերի հայտնաբերումը լավ զարգացած ոլորտ է պատկերի թվային մշակման մեջ։ Տարածքի սահմաններն ու եզրերը սերտորեն կապված են, քանի որ տարածաշրջանի սահմաններում հաճախ ինտենսիվության կտրուկ ճշգրտում կա։ Այդ պատճառով եզրերի հայտնաբերման մեթոդները օգտագործվում են հատվածավորման տեխնիկաների մեջ։

Եզրերի հայտնաբերմամբ որոշված եզրերը հաճախ կապակցված չեն։ Այնուամենայնիվ, պատկերից առարկան բաժանելու համար հարկավոր է փակ տարածաշրջանի սահմաններ։ Ցանկալի եզրերը նման օբյեկտների կամ տարածական տաքսոնների միջև եղած սահմաններն են[20][21]։

Տարածական տաքսոնները[22] ինֆորմացիայի հատիկներ են[23], բաղկացած փխրուն պիքսելային շրջանից, որը տեղակայված է վերացականության մակարդակներում` հիերարխիկ մեկը մյուսի մեջ դարսված տեսարանի ճարտարապետության մեջ։ Դրանք նման են Գեշտալտ հոգեբանության ֆիգուրա-ֆոնի նշանակմանը, բայց դրանք տարածվում են առաջակողմի, օբյեկտների խմբերի, առարկաների և ակնառու առարկաների մասերի վրա։ Եզրագծերի հայտնաբերման մեթոդները կարող են կիրառվել տարածական-տաքսոնային տարածաշրջանում, այնպես ինչպես դրանք կկիրառվեն ուրվագծի համար։ Այս մեթոդը հատկապես օգտակար է այն դեպքում, երբ անջատված եզրը պատրանքային եզրագծի մի մասն է[24][25]։

Հատվածավորման մեթոդները կարող են նաև կիրառվել եզրերի հայտնաբերմամբ ստացված եզրերի վրա։ Լինդեբերգը և Լին[26] մշակել են ինտեգրված մեթոդ, որը հատվածավորում է եզրերը բաժանելով ուղիղ և կոր գծերի հատվածների`մասերի վրա հիմնված օբյեկտի ճանաչման համար` հիմք ընդունելով նկարագրության նվազագույն երկարության (ՆՆԵ) չափանիշը։ Այն օպտիմիզացվել է անջատման և միաձուլմանը նման եղանակով՝ օգտվելով թեկնածու կանգերի կետերից, որոնք ձեռք են բերվել լրացուցիչ հանգույցի ցուցիչներից՝ ավելի հավանական կետեր ստանալու համար, որոնցում կարելի է տարբեր հատվածների բաժանումներ դիտարկել։

Կրկնակի կլաստերավորման մեթոդ[խմբագրել | խմբագրել կոդը]

Այս մեթոդը պատկերի երեք հատկանիշների համադրություն է։ Դրանք են հիստոգրամի վերլուծության հիման վրա պատկերի բաժանումը, որը ստուգվում է կլաստերի (օբյեկտների) բարձր կոմպակտության և դրանց սահմանների բարձր աստիճանների միջոցով։ Այդ նպատակով երկու տարածությունները պետք է ներկայացնել։ Առաջին տարածությունը պայծառության միաչափ H = H(B) պայծառության հիստոգրամն է, երկրորդ տարածությունը ինքնատիպ պատկերի երկակի եռաչափ տարածությունն է B = B (x, y): Առաջին տարածությունը թույլ է տալիս չափել, թե որքանով կոմպակտ է պատկերի պայծառությունը բաշխված `նվազագույն կլաստերավորվող k-միջինով։ k-միջինին համապատասխանող շեմի պայծառությունը T-ին սահմանում է երկուական (սև և սպիտակ) պատկերը՝ բիթմեփ bφ(xy), որտեղ φ(xy) = 0, եթե B(xy) < T, և φ(xy) = 1, եթե B(xy) ≥ T: Bitmap b-ն երկակի տարածության օբյեկտ է։ Այդ բիթմեփում պետք է սահմանվի մի միջոց, որն արտացոլում է, թե որքան կոմպակտ բաշխված սև (կամ սպիտակ) պիքսելներ կան։ Այսպիսով, նպատակը լավ սահմաններ ունեցող օբյեկտներ գտնելն է։ Բոլոր T- երի համար պետք է հաշվարկվի MDCG/(k × L) կետը (որտեղ k-ն օբյեկտի և ֆոնի միջև պայծառության տարբերությունն է, L- ը բոլոր սահմանների երկարությունն է, իսկ G-ն `սահմանների միջին գրադիենտը)։ MDC-ի առավելագույն մասը սահմանում է հատվածավորումը[27]։

Աճող տարածության մեթոդներ[խմբագրել | խմբագրել կոդը]

Աճող տարածության մեթոդները հիմնականում հիմնվում են այն ենթադրության վրա, որ մեկ շրջանի հարևան պիքսելներն ունեն նման արժեքներ։ Ընդհանուր ընթացակարգը մեկ պիքսելի համեմատությունն է հարևանների հետ։ Եթե նմանության չափանիշը բավարարված է, ապա պիքսելը կարող է սահմանվել, որ պատկանում է նույն կլաստերին, ինչպես իր հարևաններից մեկը կամ մի քանիսը։ Նմանության չափանիշի ընտրությունը շատ կարևոր է, և արդյունքների վրա ազդում են պատկերի աղմուկը բոլոր նմուշներում։

Վիճակագրական շրջանի միաձուլման մեթոդը[28] (SRM) սկսվում է պիքսելների գրաֆիկի կառուցմամբ՝ օգտագործելով 4 կապակցված եզրեր, որոնց կշիռը տրված է ինտենսիվության տարբերության բացարձակ արժեքով։ Սկզբում յուրաքանչյուր պիքսել կազմում է մեկ պիքսելային շրջան։ Այնուհետև SRM-ը տեսակավորում է այդ եզրերը առաջնային հերթում և որոշում կայացնում՝ միաձուլել եզրային պիքսելներին պատկանող ներկայիս տարածաշրջանները օգտագործելով վիճակագրական նախադրյալ, թե ոչ։

Աճող տարածության մեթոդ է սերմնավորած աճեցման եղանակը։ Այս մեթոդը պատկերի հետ միասին վերցնում է մի շարք սերմեր։ Սերմերը նշում են բաժանման ենթակա օբյեկտներից յուրաքանչյուրը։ Տարածքները պարբերաբար կրկնվում են՝ համեմատաբար տարածված բոլոր հարևան պիքսելների համեմատությամբ։ Պիքսելային ինտենսիվության արժեքի և տարածաշրջանի միջինության միջև տարբերությունը՝ -ն, օգտագործվում է որպես նույնության չափ։ Այս եղանակով չափված ամենափոքր տարբերությամբ պիքսելը նշանակվում է համապատասխան տարածքին։ Այս ընթացքը շարունակվում է մինչև բոլոր պիքսելները նշանակվում են ինչ-որ տարածքի։ Քանի որ սերմնավորված տարածքները կարիք ունեն հավելյալ ներմուծման պարամետրի՝ սերմի, հատվածավորման արդյունքները կախված են այդ սերմից, և պատկերի աղմուկը կարող է նպաստել, որ սերմերը թերի տեղակայվեն։

Մեկ այլ աճող տարածոթւյան մեթոդ է առանց սերմնավորման աճող տարածության մեթոդը։ Այն փոփոխված ալգորիթմ է, որը չի պահանջում որոշակի սերմեր։ Այն սկսվում է ինչ-որ մի տարածքով, որտեղ ընտրված պիքսելը նշանակալիորեն չի ազդում վերջնական հատվածավորման արդյունքի վրա։ Յուրաքանչյուր քայլին, այն հաշվի է առնում հարևան պիքսելները այնպես ինչպես սերմնավորված աճող տարածության մեթոդում։ Այս մեթոդը սերմնավորված մեթոդից տարբերվում է այն բանով, որ եթե նվազագույն -ն նախապես ընտրված շեմից փոքր է, ապա այն համապատասխանաբար ավելացվում է տարածքին։ Հակառակ դեպքում, պիքսելը համարվում է բոլոր առկա տարածքներից տարբեր և նոր տարածք է ստեղծվում այդ պիքսելով։

Այս տեխնիկայի տարբերակներից մեկը, որն առաջարկել են Հարալիկն ու Շապիրոն (1985)[1], հիմնված են պիքսելային ինտենսիվությունների վրա։ Տարածքի և թեկնածու պիքսելի ինտենսիվության միջինն ու վարիացիան օգտագործվում են թեստի վիճակագրական տվյալների հաշվարկման համար։ Եթե թեստային վիճակագրական արժեքները բավարար չափով փոքր են, պիքսելը ներառվում է տվյալ տարածքի կազմում և տարածքի միջինն ու վարիացիան վերահաշվարկվում են։ Հակառակ դեպքում պիքսելը մերժվում է և ստեղծում նոր խումբ կամ տարածք։

Հատուկ աճող տարածության մեթոդ է -կապակցված հատվածավորումը։ Այն հիմնված է պիքսելի ինտենսիվության և հարևան կապող ճանապարհների վրա։ Կապակցվածության աստիճանը հաշվարկվում է հիմք ընդունելով պիքսելով ձևավորված ճանապարհը։ Որևէ արժեքի համար երկու պիքսելներ կոչվում են -կապակցված, եթե գոյություն ունի դրանք կապող ճանապարհ , որի արժեքը նվազագույնը է։ -կապակցվածությունը համարժեքության հարաբերություն է[29]

Ճեղքման և միաձուլման բաժանումը հիմնված է պատկերի քառանկյուն ծառի բաժանման վրա։ Այն երբեմն կոչվում է քառանկյուն ծառ հատվածավորում։

Այս մեթոդը սկսվում է ծառի արմատից, որը ներկայացնում է ամբողջ պատկերը։ Եթե այն գտնվել է որպես ոչ միատեսակ (ոչ համասեռ), ապա այն բաժանվում է չորս երեխա քառակուսու (բաժանման ընթացք) և այսպես շարունակ։ Եթե հակառակն է՝ չորս երեխա քառակուսիները համասեռ են, ապա դրանք միաձուլվում են որպես մի քանի կապակցված կոմպոնենտներ (միաձուլման ընթացք)։ Ծառի հանգույցը հատվածավորված հանգույց է։ Այս գործընթացը շարունակվում է հետընթաց, քանի դեռ հնարավոր չեն այլ մասնատումներ կամ միաձուլումներ՝ մեթոդի օպտիմալ ալգորիթմ[30][31]։ Երբ հատուկ տվյալի կառուցվածք է ներառվում մեթոդի ալգորիթմի իմպլեմենտացիայի մեջ, ալգորիթմական բարդությունը կարող է լավագույն տարբերակում հասնել [32]։

Մասնակի դիֆերենցիալ հավասարումների վրա հիմնված մեթոդներ[խմբագրել | խմբագրել կոդը]

Օգտագործելով մասնակի դիֆերենցիալ հավասարման (ՄԴՀ), ի վրա հիմնված մեթոդը և լուծելով ՄԴՀ-ի հավասարման թվային սխեման, կարելի է հատվածավորել պատկերը[33]։ Կորի բազմացումը այս կատեգորիայի մեջ հանրաճանաչ տեխնիկա է, որի մեջ կան բազմաթիվ դիմումներ օբյեկտի արդյունահանման, օբյեկտը հետևելու, ստերեո վերակառուցման և այլնի համար։ Հիմնական կենտրոնացումն է՝ սկզբնական կորը զարգացնել դեպի ծախսերի գործառույթի ամենացածր ներուժը, որտեղ դրա սահմանումը արտացոլում է խնդրի հասցեագրումը։ Ինչ վերաբերում է հակադարձ մեծ խնդիրներին, ապա ինքնարժեքի ֆունկցիոնալության նվազեցումը ոչ տրիվիալ է և լուծման համար պարտադրում է որոշակի սահունության սահմանափակումներ, որըը տվյալ դեպքում կարող է արտահայտվել որպես զարգացող կորի վրա երկրաչափական սահմանափակումներ։

Պարամետրական մեթոդներ[խմբագրել | խմբագրել կոդը]

Լագրանժյան տեխնիկան հիմնված է որոշման նմուշառման որոշակի ռազմավարության համաձայն ուրվագիծը պարամետրացնելու վրա, այնուհետև յուրաքանչյուր տարր ըստ պատկերի և ներքին տերմինների զարգացնելու վրա։ Նման տեխնիկան արագ և արդյունավետ է, սակայն բնօրինակ «պարզապես պարամետրային» ձևակերպումը (հայտնաբերված 1987-ին ՝ Քասի, Վիտկինի և Թերզոպուլոսի կողմից և հայտնի որպես «օձեր»), ընդհանուր առմամբ քննադատվում է նմուշառման ռազմավարության ընտրության, ներքին երկրաչափական հատկությունների ընտրության սահմանափակումների համար, կորի տոպոլոգիայի փոփոխությունների (կորի պառակտման և միաձուլման), ավելի մեծ չափսերի խնդիրներին անդրադառնալիս և այլն։ Այժմ մշակվել են արդյունավետ «դիսկրետավորված» ձևակերպումներ `այդ սահմանափակումները լուծելու համար` միաժամանակ պահպանելով բարձր արդյունավետությունը։ Երկու դեպքում էլ էներգիայի նվազագույնի հասցնելը ընդհանուր առմամբ իրականացվում է առավելագույն աստիճանական ծագմամբ, որի արդյունքում ածանցյալները հաշվարկվում են օգտագործելով, օրինակ ՝ վերջավոր տարբերություններ։

Մակարդակի սահմանումով մեթոդներ[խմբագրել | խմբագրել կոդը]

Մակարդակի սահմանումով մեթոդը սկզբնական շրջանում առաջարկում էր հետևել 1979 և 1981 թվականներին Դերվյուկի և Թոմասետի[34][35] շարժվող ինտերֆեյսներին, այնուհետև վերագործարկվել է Օշերի և Սեթիանի կողմից 1988 թ.-ին։ Այն կարող է օգտագործվել կորության / մակերևույթի / այլնի խնդիրը արդյունավետ լուծելու համար ենթադրյալ եղանակով։ Հիմնական գաղափարը զարգացող ուրվագիծը ներկայացնելն է`օգտագործելով ստորագրված գործառույթ, որի զրոն համապատասխանում է իրական ուրվագծին։ Այնուհետև, ըստ եզրագծի շարժման հավասարման, ենթադրյալ մակերևույթի համար կարելի է հեշտությամբ բխել նմանատիպ հոսք, որը զրոյական մակարդակի կիրառման դեպքում արտացոլում է եզրագծի բազմացումը։ Մակարդակոի սահմանումով մեթոդը տալիս է բազմաթիվ առավելություններ։ Այն ենթակա է, պարամետրերից զերծ է, ապահովում է զարգացող կառուցվածքի երկրաչափական հատկությունները գնահատելու ուղիղ միջոց, թույլ է տալիս փոխել տոպոլոգիան և բնորոշ է։ Այն կարող է օգտագործվել օպտիմիզացման շրջանակ սահմանելու համար, ինչպես առաջարկվել է Ժաոյի, Մերիմանի և Օշերի կողմից 1996 թվականին։ Կարելի է եզրակացնել, որ այն շատ հարմար հիմք է համակարգչային տեսլականի և բժշկական պատկերների վերլուծության բազմաթիվ կիրառությունների համար[36]։ Տվյալ մակարդակի վրա հիմնված տվյալների տարբեր կառուցվածքների ուսումնասիրությունը հանգեցրել է այս մեթոդի շատ արդյունավետ իրականացմանը։

Արագ քայլող մեթոդներ[խմբագրել | խմբագրել կոդը]

Արագ քայլող մեթոդները օգտագործվել են հատվածավորման մեջ[37], և այս մոդելը բարելավվել է (թույլատրելով և՛ դրական, և՛ բացասական բազմացման արագություն) ընդհանրացված մոտեցմամբ[38]։

Փոփոխական մեթոդներ[խմբագրել | խմբագրել կոդը]

Փոփոխական մեթոդների նպատակն է գտնել հատված, որը օպտիմալ է որոշակի էներգետիկ ֆունկցիոնալ առումով։ Գործառույթները բաղկացած են տվյալների տեղավորման տերմինից և կանոնակարգող պայմաններից։ Դասական ներկայացուցիչը Փոթսի մոդելն է, որը սահմանված է պատկերի համար

հավասարումով։

Նվազեցնող -ը մասնակիորեն կայուն պատկեր է, որն օպտիմալ փոխանակում ունի տվյալ պատկերից տրված պատկեր L2 քառակուսի հեռավորության միջև և դրա ցատկման բազմության ընդհանուր երկարության միջև։ Ցատկերի բազմություն -ն սահմանում է հատվածավորումը։ Էներգիաների հարաբերական կշիռը կարգավորվում է պարամետրով։ Փոթսի մոդելի երկուական տարբերակը, որի ժամանակ եթե միջակայքը սահմանափակված է ընդհուպ երկու արժեքի, հաճախ կոչվում է Չան-Վիս մոդել[39]։ Կարևոր ընդհանրացում է Մամֆորդ-Շահի մոդելը[40] տրված հետևյալ հավասարմամբ՝

։

Ֆունկցիոնալ արժեքը հատվածավորման հատվածի կորի ընդհանուր երկարության գումարն է, մոտարկման սահունությունը և սկզբնական պատկերից հեռավորությունը։ Սահունության տուգանքի կշիռըը ճշգրտվում է ըստ -ի։ Փոթսի մոդելը հաճախ կոչվում է մասնակիորեն կոնստանտ Մամֆորդ-Շահի մոդել, քանի որ այն կարելի է դիտարկել որպես դեգեներացված դեպք։ Օպտիմիզացման խնդիրները հայտնի են ընդհանուր առմամբ որպես NP-բարդ, բայց գրեթե նվազագույնի հասցնող ռազմավարությունները գործնականում լավ են գործում։ Դասական ալգորիթմներն են ավարտված ոչ կորնթարդությունը և Ամբրոսիո-Տորտորելիի մոտարկումը։

Գրաֆիկի բաժանման մեթոդներ[խմբագրել | խմբագրել կոդը]

Գրաֆիկի բաժանման մեթոդները արդյունավետ գործիք են պատկերի բաժանման համար, քանի որ դրանք մոդելավորում են պիքսելային հարևանության ազդեցությունը տվյալ պիքսելների կամ պիքսելի կլաստերի վրա՝ կախված պատկերների համասեռությունից։ Այս մեթոդներում նկարը մոդելավորվում է որպես կշռված, չուղղված գրաֆիկ։ Սովորաբար մի պիքսել կամ պիքսելների խումբ կապված է հանգույցների հետ, և եզրային կշիռները սահմանում են հարևան պիքսելների միջև (dis) նմանությունը։ Գրաֆիկը (պատկերը) այնուհետև բաժանվում է ըստ չափանիշի, որը նախատեսված է «լավ» կլաստերները մոդելավորելու համար։ Այս ալգորիթմներից ստացվող հանգույցների (պիքսել) յուրաքանչյուր բաժանումը համարվում է պատկերված առարկայի հատված։ Այս կատեգորիայի որոշ հանրաճանաչ ալգորիթմներ են՝ նորմալացված կրճատումները[41], պատահական քայլքը[42], նվազագույն կտրումը[43], իզոպերիմետրիկ բաժանումը[44], նվազագույն տարածվող ծառի վրա հիմնված հատվածավորումը և հատվածավորման վրա հիմնված օբյեկտների դասակարգումը։

Մարկովի պատահական դաշտերը[խմբագրել | խմբագրել կոդը]

Նկարների համար Մարկովի պատահական դաշտերի (MRF) կիրառումը առաջարկվել է 1984 թվականի սկզբին Սթյուարդ Գեմանի և Դոնալդ Գեմանի կողմից[45]։ Նրանց ուժեղ մաթեմատիկական հիմքը և համաշխարհային օպտիմալ տրամադրման ունակությունը նույնիսկ այն դեպքում, երբ որոշվում են տեղական առանձնահատկությունների հիման վրա, ապացուցված էին, որ հիմք են հանդիսանում պատկերների վերլուծության նոր հետազոտությունների համար, աղմուկի վերացման և հատվածայնացման ոլորտում։ MRF-ները լիովին բնութագրվում են իրենց հավանականության նախնական բաշխումներով, հավանականության սահմանային բաշխումներով, կլիկներով, հարթեցման սահմանափակումներով, ինչպես նաև արժեքների թարմացման չափանիշով։ MRF-ների օգտագործմամբ պատկերի բաժանման չափանիշը վերանայվում է որպես պիտակավորման սխեմայի որոնում, որն ունի առավելագույն հավանականություն տվյալ մի շարք առանձնահատկությունների համար։ MRF-ների օգտագործմամբ պատկերի հատվածավորման լայն կատեգորիաներն են վերահսկվող և առանց վերահսկման հատվածավորում։

Վերահսկվող պատկերի հատվածայնացումը`օգտագործելով MRF և MAP[խմբագրել | խմբագրել կոդը]

Պատկերների բաժանման առումով ֆունկցիան, որին MRF-ները ձգտում են առավելագույնի հասցնել, պիտակավորման սխեման նույնականացնելու հավանականությունն է, եթե տրված է առանձնահատկությունների որոշակի շարք, որը պատկերում հայտնաբերվում է։ Սա հետին գնահատման մեթոդի առավելագույն վերականգնումն է։

MRF հարևանություն ընտրված պիքսելի համար

MAP-ի միջոցով պատկերի բաժանման համար ընդհանուր ալգորիթմը տրված է ստորև․

  1. Յուրաքանչյուր հատկանիշի համար սահմանել հարևաններին (պատահական փոփոխական MRF-ի տերմիններով)։
    Ընդհանրապես սա ներառում է առաջին և երկրորդ կարգի հարևաններ։
  2. Տեղադրել սկզբնական հավանականությունները P(fi)> յուրաքանչյուր հատկանիշի համար որպես զրո կամ
  3. որտեղ fi ∈ Σ հատկանիշները պարունակող բազմությունն է քաղված
    i պիքսելի համար և սահմանի՛ր կլաստերների սկզբնական բազմությունը։
  4. Օգտագործելով վարժեցման տվյալները՝ հաշվել յուրաքանչյուր պիտակի միջինը (μi) and variance (σi)։ Սա կոչվում է դասի վիճակագրություն։
  5. Հաշվարկել տվյալ պիտակավորման սխեմայի համար սահմանային բաշխումը P(fi | i)՝ օգտագործելով Բայեսի թեորեմը և ավելի վաղ հաշվարկված դասի վիճակագրությունը։ Գաոսյան մոդելը օգտագործվում է սահմանային բաշխման համար։
  6. Յուրաքանչյուր դասի պիտակի համար հաշվել հավանականությունը՝ ունենալով սահմանված հարևաններին։
    Կլիկի պոտենցիալները օգտագործվում են պիտակավորման մեջ սոցիալական ազդեցությունը մոդելավորելու համար։
  7. Կրկին հաշվեք նոր նախնական հավանականությունները և վերաձևակերպեք կլաստերները, որպեսզի այդ հավանականությունները առավելագույնի հասցվեն։
    Դա արվում է ստորև նկարագրված տարբեր օպտիմիզացման ալգորիթմների միջոցով։
  8. Դադարեք, երբ հավանականությունը առավելագույնի է հասցվում, և պիտակավորման սխեման չի փոխվում։ Հաշվարկները կարող են իրականացվել նաև լոգարիթմական հավանականության պայմաններով

Օպտիմիզացման ալգորիթմներ[խմբագրել | խմբագրել կոդը]

Յուրաքանչյուր օպտիմիզացման ալգորիթմը տարբեր ոլորտների մոդելների հարմարեցում է, և դրանք առանձնացված են ըստ իրենց եզակի ծախսային գործառույթների։ Արժեքի գործառույթների ընդհանուր առանձնահատկությունը պիքսելի արժեքի փոփոխության, ինչպես նաև հարևան պիքսելների պիտակների համեմատ պիքսելի պիտակի տարբերության տուգանումն է։

Կրկնվող պայմանական ռեժիմներ / գրադիենտի անկում[խմբագրել | խմբագրել կոդը]

Կրկնվող պայմանական ռեժիմների (ICM) ալգորիթմը փորձում է վերակառուցել պիտակավորման իդեալական սխեման` յուրաքանչյուր իտերացիային փոխելով յուրաքանչյուր պիքսելի արժեքը, և գնահատելով նոր պիտակավորման սխեմայի էներգիան` օգտագործելով ստորև տրված ծախսային գործառույթը․

,

որտեղ α-ն պիքսելային պիտակի փոփոխության համար տուգանքն է, իսկ β -ն հարևան պիքսելների և ընտրված պիքսելների միջև պիտակի տարբերության համար տուգանքը։ Այստեղ -ն i պիքսելի հարևանությունն է, և δ -ը Կրոնեկեր դելտայի ֆունկցիան է։ ICM-ի հետ կապված գլխավոր խնդիրն այն է, որ գրադիենտի անկման նման, այն միտում ունի հանգստանալ տեղական մաքսիմումներից և այդպիսով չստանալ գլոբալ օպտիմալ պիտակավորման սխեման։

Կրկնօրինակող կոփում (SA)[խմբագրել | խմբագրել կոդը]

Ստեղծվելով որպես մետալուրգիայի կոփման անալոգիա, կրկնօրինակող կոփումը (SA) օգտագործում է պիքսելային պիտակի փոփոխություն իտերացիայի ժամանակ և գնահատում է յուրաքանչյուր նորաստեղծ գրաֆի էներգիայի տարբերությունը նախնական տվյալների համեմատ։ Եթե նոր ձևավորված գրաֆը ավելի շահավետ է, էներգիայի ցածր արժեքի առումով, տրված

ալգորիթմը ընտրում է նոր ձևավորված գրաֆ։ Կրկնօրինակող կոփումը պահանջում է ջերմաստիճանի գրաֆների մուտքագրում, որն անմիջականորեն ազդում է համակարգի զուգամիտման արագության վրա, ինչպես նաև էներգիայի շեմի վրա` մինիմիզացնելու համար։

Այլընտրանքային ալգորիթմներ[խմբագրել | խմբագրել կոդը]

Գոյություն ունեն բազմաթիվ այլ ալգորիթմներ սովորական, ինչպես նաև բարձր կարգի MRF-ներ լուծելու համար։ Դրանք ներառում են Հետին սահմանային մաքսիմալացում, Բազմամասշտաբ MAP գնահատում[46], Բազմակի թողունակության հատվածավորում[47], և այլն։ Բացի հավանականության գնահատականներից, MRF-ների լուծման համար գոյություն ունեն գրաֆ-կտրվածք առավելագույն հոսք[48] և խիստ սահմանափակված գրաֆի վրա հիմնված այլ մեթոդներ[49][50]։

Պատկերների առանց վերահսկման հատվածավորում `օգտագործելով MRF և ակնկալիք-մաքսիմալացում[խմբագրել | խմբագրել կոդը]

Առանց վերահսկման մեքենայական ուսուցման ենթաբազմություն՝ ակնկալիք-մաքսիմալիզացման ալգորիթմը, օգտագործվում է՝ հետադարձաբար գնահատելու պիտակավորման հետին հավանականությունները և բաշխումները, երբ վերապատրաստման որևէ տվյալ չկա, և չի կարող ձևավորվել հատվածավորման մոդելի որևէ գնահատական։ Ընդհանուր մոտեցում է օգտագործել հիստոգրամներ՝ պատկերների հատկությունները ներկայացնելու համար և ընթացք տրվի հետևյալ երեք քայլանոց ալգորիթմով․

1. Օգտագործվում է մոդելի պարամետրերի պատահական գնահատումը (նույնը ՝ վերահսկվող ուսուցման ընթացքում).

2. Սահմանված դասակարգային վիճակագրությունը որոշվում է պատահական բաժանումների մոդելի հիման վրա։ Դրանցից օգտվելով՝ հաշվարկել պիտակի պատկանելության պայմանական հավանականությունը, եթե առանձնահատկությունների շարքը հաշվարկվվում է Բայեսի թեորեմի միջոցով։

Այստեղ , բոլոր հնարավոր պիտակների ամբողջությունն է։

3. M քայլ. պիտակավորման սխեմային տրված այս առանձնահատկության սահմանված համապատասխանությունն այժմ օգտագործվում է ալգորիթմի երկրորդ մասում տվյալ պիտակի գերակա գնահատումը հաշվարկելու համար։ Քանի որ ընդհանուր պիտակների իրական թիվը անհայտ է (վերապատրաստման տվյալների հավաքածուից), հաշվարկներում օգտագործողի կողմից տրված պիտակների թաքնված գնահատումը օգտագործվում է

,

որտեղ բոլոր հնարավոր հատկանիշների ամբողջությունն է։

Գունավոր պատկերի հատվածավորում՝ օգտագործելով HMRF-EM մոդելը

MAP-ի և EM-ի վրա հիմնված պատկերի հատվածավորման թերությունները[խմբագրել | խմբագրել կոդը]

  1. MAP-ի ճշգրիտ գնահատականները հնարավոր չէ հեշտությամբ հաշվարկել։
  2. MAP-ի մոտավոր գնահատականները հաշվարկային թանկ են։
  3. Բազմամակարդակ պիտակավորման վրա երկարացումը խափանում է կատարողականը և մեծացնում պահեստավորման անհրաժեշտությունը։
  4. Գլոբալ օպտիմալացման համար անհրաժեշտ է EM-ի պարամետրերի հուսալի գնահատում։
  5. Հիմնվելով օպտիմիզացիայի մեթոդի վրա՝ հատվածավորումը կարող է կլաստերավորվել լոկալ նվազագույնի։

Ջրբաժան տրանսֆորմացիա[խմբագրել | խմբագրել կոդը]

Ջրբաժան տրանսֆորմացիան պատկերի գրադիենտի մեծությունը համարում է որպես տեղագրական մակերես։ Պիքսելները, որոնք ունեն գրադիենտի մեծության ամենաբարձր ինտենսիվություն (GMIs) համապատասխանում են ջրբաժանի գծերին, որոնք ցույց են տալիս տարածքի սահմանները։ Ջուրը տեղակայված ընդհանուր ջրբաժան գծով եզրափակված ցանկացած պիքսելի վրա հոսում է ներքև դեպի ինտենսիվության ընդհանուր լոկալ մինիմում (LIM)։ Պիքսելները, որոնք ջանում են ընդհանուր նվազագույնի, կազմում են արգելակի ավազան, որը ներկայացնում է հատված։

Մոդելի վրա հիմնված հատվածավորում[խմբագրել | խմբագրել կոդը]

Մոդելի վրա հիմնված մոտեցումների հիմնական ենթադրությունն այն է, որ հետաքրքրության կառույցները որոշակի ձևի նկատմամբ հակում ունեն։ Հետևաբար, կարելի է փնտրել հավանական մոդել, որը բնութագրում է ձևն ու դրա փոփոխությունը։ Պատկերը բաժանելիս սահմանափակումներ կարող են սահմանվել այս մոդելի օգտագործմամբ որպես նախնական հիմք[51]։ Նման առաջադրանքը կարող է ներառել (i) վարժեցման օրինակների գրանցումը սովորական դիրքի, (ii) գրանցված նմուշների տատանումների հավանականության ներկայացում, և (iii) վիճակագրական եզրակացությունը մոդելի և պատկերի միջև։ Մոդելի վրա հիմնված հատվածավորման համար գրականության մյուս կարևոր մեթոդներն են՝ ձևի ակտիվ մոդելները և արտաքին տեսքի ակտիվ մոդելները։

Բազմամասշտաբ հատվածավորում[խմբագրել | խմբագրել կոդը]

Պատկերների հատվածները հաշվարկվում են մասշտաբի տարածության մի քանի մասշտաբներով և երբեմն տարածվում են կոպիտից մինչև նուրբ մասշտաբների. տե՛ս մասշտաբի-տարածության բաժանումը։

Հատվածավորման չափանիշները կարող են լինել կամայական բարդ և կարող են հաշվի առնել գլոբալ, ինչպես նաև լոկալ չափորոշիչները։ Ընդհանուր պահանջն այն է, որ յուրաքանչյուր շրջան պետք է ինչ-որ իմաստով կապված լինի։

Միաչափ հիերարխիկ ազդանշանային հատվածավորում[խմբագրել | խմբագրել կոդը]

Վիտկինի սեմինարի աշխատանքը[52][53] մասշտաբի տարածության մեջ ներառում էր այն միտքը, որ միակողմանի ազդանշանը կարող է միանշանակորեն բաժանվել շրջանների, ընդ որում մեկ մասշտաբի պարամետրով վերահսկում է հատվածավորման մասշտաբը։

Առանցքային դիտարկումն այն է, որ ազդանշանի բազմածավալ հարթեցված տարբերակների երկրորդ ածանցյալների (նվազագույնի և մաքսիմումի առաջին մաքսիմումի) զրոյական խաչմերուկները կազմում են իրար մեջ տեղավորվող ծառ, որը սահմանում է տարբեր մասշտաբների հատվածների միջև հիերարխիկ հարաբերությունները։ Մասնավորապես, կոպիտ մասշտաբների թեքվածության էքստրեման կարելի է հետ բերել համապատասխան նիշերի համապատասխան մասշտաբներով։ Երբ թեքության առավելագույնը և թեքության նվազագույնը միմյանց ոչնչացնում են ավելի մեծ մասշտաբով, երեք բաժինները, որոնք նրանք առանձնացնում են, միավորվում են մեկ հատվածի մեջ՝ այսպիսով սահմանելով հատվածների հիերարխիան։

Պատկերի հատվածավորում և առաջնային ուրվագծում[խմբագրել | խմբագրել կոդը]

Այս ոլորտում կատարվել են բազմաթիվ հետազոտական աշխատանքներ, որոնցից մի քանիսն այժմ հասել են մի վիճակի, որում կարող են կիրառվել կամ ինտերակտիվ ձեռնարկի միջամտությամբ (սովորաբար `դիմելով բժշկական պատկերապատման), կամ ամբողջովին ինքնաբերաբար։ Հետևյալը համառոտ ակնարկ է այն հիմնական հետազոտական գաղափարների վերաբերյալ, որոնց հիման վրա հիմնված են ներկայիս մոտեցումները։

Այնուամենայնիվ, այն նկարագրող միմյանց մեջ մտած կառուցվածքը, որը նկարագրել է Վիտկինը, հատուկ է միակողմանի ազդանշաններին և չնչին կերպով չի փոխանցվում ավելի բարձր չափսի պատկերներին։ Բացի այդ, այս ընդհանուր գաղափարը ոգեշնչել է մի քանի այլ հեղինակների ՝ ուսումնասիրելու կոպիտ և նուրբ սխեմաները պատկերի հատվածավորման համար։ Կոնդերինկն[54] առաջարկել է ուսումնասիրել, թե ինչպես են զարգանում իզո-ինտենսիվության ուրվագծերը զարգանում մասշտաբներով, և այս մոտեցումը ավելի մանրամասն ուսումնասիրվեց Լիֆշիցի և Պիզերի կողմից[55]։ Ցավոք, պատկերի առանձնահատկությունների ինտենսիվությունը փոխվում է ըստ կշիռի, ինչը ենթադրում է, որ դժվար է անցնել կոպիտ մասշտաբներով պատկերի առանձնահատկություններից ավելի լավ մասշտաբների իզո-ինտենսիվության տեղեկատվություն։

Լինդբերգը[56][57] ուսումնասիրեց լոկալ էքստրեմաները և թամբի կետերը կշիռի հետ կապելու խնդիրը։ Նա առաջարկեց պատկերների ներկայացում, որը կոչվում է մասշտաբի-տիեզերական առաջնային ուրվագիծ, որն ակնհայտ է դարձնում տարբեր մասշտաբների կառուցվածքների միջև հարաբերությունները, ինչպես նաև պարզ է դարձնում, թե որ պատկերի առանձնահատկություններն են կայուն մեծ մասշտաբների վրա՝ ներառյալ դրանց համար տեղական համապատասխան մասշտաբները։ Բերգոլմն առաջարկել է կոպիտ մասշտաբների մասերում հայտնաբերել եզրեր մասշտաբով տարածության մեջ, այնուհետև դրանք հետ բերել դեպի ավելի նուրբ մասշտաբներ՝ ինչպես կոպիտ հայտնաբերման, այնպես էլ ձեռքով ընտրությամբ նուրբ տեղայնացման մասշտաբի։

Գաուչը և Պայզերը[58] ուսումնասիրեցին գագաթների և հովիտների լրացուցիչ խնդիրը մի շարք մասշտաբներով և ստեղծեցին գործիք՝ ինտերակտիվ պատկերի բաժանման համար, որը հիմնված է բազմաշերտ ջրբաժանների վրա։ Գրադիենտ քարտեզի կիրառմամբ բազմաբնույթ ջրբաժանի օգտագործումը նույնպես ուսումնասիրվել է Օլսենի և Նիլսենի[59] կողմից և տեղափոխվել է Դիմի կողմից[60] կլինիկական օգտագործման համար։ Վինկենը և այլք[61] առաջարկեցին հիպերստեկ՝ տարբեր մասշտաբների պատկերի կառուցվածքների միջև հավանականությունների հարաբերությունները սահմանելու համար։ Մասշտաբների նկատմամբ պատկերի կայուն կառուցվածքների օգտագործումը Ահուջային[62][63] և նրա գործընկերներին նպաստեց լիովին ավտոմատացված համակարգի։ Ամբողջովին ավտոմատ ուղեղի հատվածավորման ալգորիթմը, որը հիմնված է բազմակողմանի ջրբաժաններին սերտորեն կապված գաղափարների վրա, ներկայացվել է Ունդեմանի և Լինդբերգի[64] կողմից և լայնորեն փորձարկվել է ուղեղի տվյալների բազայում։

Պատկերների բազմաբնույթ հատվածավորման այս գաղափարները կապելով պատկերի կառուցվածքների մասշտաբների հետ, նույնպես վերցրել են Ֆլորակը և Քուջփերը[65]։ Բիջաուի և Ռուեի[66] ասոցացված կառույցները մասշտաբային տարածքում հայտնաբերել են նվազագույն աղմուկի շեմից բարձր օբյեկտ ծառի մեջ, որը պարունակում է բազմաթիվ մասշտաբներ և համապատասխանում է բնօրինակի ազդանշանի մի տեսակ առանձնահատկությանը։ Արդյունահանված առանձնահատկությունները ճշգրտորեն վերակառուցվում են՝ օգտագործելով կրկնվող լծորդ գրադիենտի մատրիցային մեթոդը։

Կիսով չափ ավտոմատ հատվածավորում[խմբագրել | խմբագրել կոդը]

Մեկ տեսակի հատվածավորման դեպքում օգտագործողը մկնիկի կտտոցներով նախանշում է հետաքրքրության շրջանը և կիրառվում են ալգորիթմներ, որպեսզի ցույց տրվի այն ճանապարհը, որն առավելագույնս տեղավորվում է պատկերի եզրին։

Տեխնիկական այսպիսի հատվածավորման մեջ օգտագործվում են այնպիսի մեթոդներ, ինչպիսիք են SIOX-ը, Livewire-ը, Խելացի մկրատը կամ IT-SNAPS-ը։ Կիսով չափ ավտոմատավորման այլընտրանքային տեսակի ալգորիթմները վերադարձնում են օգտագործողի կողմից ընտրված կամ նախնական հավանականությունների միջոցով ընտրված տարածական-տաքսոնը (այսինքն ՝ առաջին պլան, օբյեկտ-խումբ, առարկա կամ առարկա-մաս) ընտրված օգտագործողի կողմից կամ նշանակված նախնական հավանականություններով[67][68]։

Վարժեցվող հատվածավորում[խմբագրել | խմբագրել կոդը]

Վերոհիշյալ հատվածավորման մեթոդների մեծ մասը հիմնված է միայն պատկերի պիքսելների գունային տեղեկատվության վրա։ Մարդիկ օգտագործում են ավելի շատ գիտելիքներ պատկերի բաժանումն իրականացնելիս, բայց այդ գիտելիքների իրականացումը կարժենա զգալի մարդկային ճարտարագիտություն և հաշվարկային ժամանակ, կպահանջի հսկայական գիտելիքների տվյալների բազա, որը ներկայումս գոյություն չունի։ Դասընթացային հատվածավորման մեթոդները, ինչպիսիք են նեյրոնային ցանցի հատվածավորումը, հաղթահարում են այդ խնդիրները՝ պիտակավորված պիքսելների տվյալների շտեմարանից դոմենային գիտելիքները մոդելավորելով։

Պատկերի հատվածավորման նեյրոնային ցանցը կարող է վերամշակել պատկերի փոքր տարածքներ, որպեսզի վեր հանելի այնպիսի պարզ հատկություններ ինչպիսիք են եզրերը[69]։ Մեկ այլ նեյրոնային ցանց կամ որոշումների կայացման ցանկացած մեխանիզմ կարող է հետագայում համատեղել այս հատկությունները համապատասխանաբար պատկերի տարածքները պիտակավորելու։ Այս ձևով նախագծված ցանցի մի տեսակ Կոհոնենի քարտեզն է։

Պուլսային զուգակցված նեյրոնային ցանցերը (PCNNs) նեյրոնային մոդելներ են, որոնք առաջարկվում են կատվի տեսողական ծառի կեղև մոդելավորելով և մշակվել են բարձրորակ կենսասիմետրիկ պատկերի մշակման համար։ 1989-ին Ռեյնհարդ Էկհորնը ներմուծեց նեյրոնային մոդել՝ կատվի տեսողական ծառի կեղևի մեխանիզմը զուգակցելու համար։ Էկհորնի մոդելը տրամադրում էր պարզ և արդյունավետ գործիք փոքր կաթնասունների տեսողական ծառի կեղևը ուսումնասիրելու համար, և շուտով պարզվեց, որ պատկերի մշակման գործում կիրառական նշանակալի ներուժ ունի։ 1994 թվականին Էկհորնի մոդելը հարմարեցվեց Ջոնսոնի կողմից պատկերի մշակման ալգորիթմին, որը այս ալգորիթմը անվանեց Պուլսային զուգակցված նեյրոնային ցանց[70]։ Անցած տասնամյակի ընթացքում PCNN-ը օգտագործվել է պատկերի մշակման մի շարք ծրագրերի համար, ներառյալ՝ պատկերի հատվածավորում, խաղարկային առաջացում, դեմքի հատկանիշների վերհանում, շարժման հայտնաբերում, տարածաշրջանի աճ, աղմուկի իջեցում և այլն։ PCNN-ը երկկողմանի նեյրոնային ցանց է։ Ցանցի յուրաքանչյուր նեյրոն մուտքային պատկերում համապատասխանում է մեկ պիքսելին՝ ստանալով դրա համապատասխան պիքսելների գունային տեղեկատվությունը (օրինակ ՝ ինտենսիվությունը) որպես արտաքին խթան։ Յուրաքանչյուր նեյրոն նույնպես կապվում է հարևան նեյրոնների հետ ՝ ստանալով դրանցից տեղային խթաններ։ Արտաքին և տեղային խթանները միավորված են ներքին ակտիվացման համակարգում, որը կուտակում է խթանները, քանի դեռ այն չի գերազանցում դինամիկ շեմը, ինչը հանգեցնում է պուլսային արտանետման։ Կրկնվող հաշվարկի միջոցով PCNN նեյրոնները արտադրում են պուլսային արդյունքների ժամանակավոր շարքը։ Պուլսային ելքերի ժամանակավոր շարքը պարունակում է մուտքային պատկերների տեղեկատվություն և կարող է օգտագործվել տարբեր պատկերների մշակման համար, ինչպիսիք են պատկերի հատվածավորումը և հատկանիշների առաջացումը։ Պատկերների մշակման սովորական միջոցների համեմատությամբ, PCNN- ները ունեն մի քանի նշանակալի արժանիքներ, ներառյալ կայունությունը աղմուկի դեմ, մուտքային օրինաչափությունների երկրաչափական տատանումներից անկախ, մուտքային նմուշներում փոքր ինտենսիվության փոփոխությունների կամուրջի հնարավորություն և այլն։

U-Net-ը հեղափոխական նեյրոնային ցանց է, որը մուտքագրում է պատկերը և դուրս է բերում պիտակի յուրաքանչյուր պիքսել։ U-Net-ը ի սկզբանե մշակվել է կենսաբժշկական պատկերների մեջ բջիջների սահմանները հայտնաբերելու համար։ U-Net-ը հետևում է դասական ավտոկոդավորողների ճարտարապետությանը, քանի որ այդպիսին պարունակում է երկու ենթակառույց։ Կոդավորիչի կառուցվածքը հետևում է ավանդական կոնվոլյուցիոն ստեկը և առավելագույն միավորող շերտերը՝ ընկալող դաշտը նվազեցնելու համար, քանի որ այն անցնում է շերտերի միջոցով։ Այն օգտագործվում է նկարում ենթատեքստը գրավելու համար։ Ապակոդավորիչի կառուցվածքն օգտագործում է փոխադրվող կոնվոլյուցիոն շերտերի վերամշակման համար, որպեսզի վերջի չափերը մոտ լինեն մուտքային պատկերի չափերին։ Անցկացված միացումները տեղադրվում են նույն ձևի կոնվոլյուցիոն և փոխակերպվող կոնվոլյուցիոն շերտերի միջև, որպեսզի պահպանեն այլ մանրամասներ, որոնք այլ կերպ կորած կլինեին։

Ի հավելում պիքսել-մակարդակի իմաստային հատվածավորման առաջադրանքների, որոնք յուրաքանչյուր փիքսելին են տալիս տվյալ կատեգորիա, ժամանակակից սեգմենտացիայի ծրագրերը ներառում են օրինակելի մակարդակի իմաստային հատվածավորման առաջադրանքներ, որոնցում տվյալ կատեգորիայի յուրաքանչյուր անհատ պետք է յուրահատուկ կերպով նույնականացվի, ինչպես նաև պանոպտիկ հատվածավորման առաջադրանքները, որոնք միավորում են այս երկու առաջադրանքները ավելի ամբողջական պատկերի հատվածավորման համար[71]։

Միմյանց հետ կապված պատկերների և տեսանյութերի հատվածավորում[խմբագրել | խմբագրել կոդը]

Նմանատիպ պատկերները, ինչպիսիք են լուսանկարչական ալբոմը կամ վիդեո շրջանակների հաջորդականությունը, հաճախ պարունակում են սեմալտորեն նման առարկաներ և տեսարաններ, ուստի հաճախ օգտակար է օգտագործել նման հարաբերակցությունները[72]։ Համապատասխան պատկերներից կամ վիդեո շրջանակներից տեսարաններ միաժամանակ բաժանելու խնդիրն անվանում են համակցված հատվածավորում[11], որը սովորաբար օգտագործվում է մարդու գործողությունների տեղայնացման մեջ։ Ի տարբերություն սովորական սահմանափակող տուփի վրա հիմնված օբյեկտի հայտնաբերման, մարդկային գործողությունների տեղայնացման մեթոդները տալիս են ավելի մանրակրկիտ արդյունքներ, սովորաբար յուրաքանչյուր պատկերի բաժանման դիմակներ, որոնք նկարագրում են մարդու հետաքրքրության առարկան և դրա գործողությունների կատեգորիան (օրինակ ՝ հատվածի խողովակ[12]): Այնպիսի տեխնիկաներ ինրպիսիք են դինամիկ Մարկովի ցանցերը, CNN-ը և LSTM-ը հաճախ օգտագործվում է միջշրջանակային հարաբերակցությունները օգտագործելու համար։

Այլ մեթոդներ[խմբագրել | խմբագրել կոդը]

Բաժանման շատ այլ մեթոդներ կան, ինչպիսիք են բազմասպեկտրային հատվածավորումը կամ կապի վրա հիմնված հատվածավորումը[73][74]։

Հատվածավորման համեմատական[խմբագրել | խմբագրել կոդը]

Բաժանման մի քանի հենանիշներ հասանելի են հատվածավորման եղանակների կատարումը ստանդարտացված բազմությունների վրա ամենաբարձր բաժանումների մեթոդների հետ համեմատելու համար։

Տես նաև[խմբագրել | խմբագրել կոդը]

Ծանոթագրություններ[խմբագրել | խմբագրել կոդը]

  1. 1,0 1,1 1,2 1,3 1,4 Linda G. Shapiro and George C. Stockman (2001): “Computer Vision”, pp 279–325, New Jersey, Prentice-Hall, 0-13-030796-3
  2. Barghout, Lauren, and Lawrence W. Lee. "Perceptual information processing system." Paravue Inc. U.S. Patent Application 10/618,543, filed July 11, 2003.
  3. Zachow, Stefan, Michael Zilske, and Hans-Christian Hege. "3D reconstruction of individual anatomy from medical image data: Segmentation and geometry processing." (2007).
  4. Belongie, Serge, et al. "Color-and texture-based image segmentation using EM and its application to content-based image retrieval." Sixth International Conference on Computer Vision (IEEE Cat. No. 98CH36271). IEEE, 1998.
  5. Pham, Dzung L.; Xu, Chenyang; Prince, Jerry L. (2000). «Current Methods in Medical Image Segmentation». Annual Review of Biomedical Engineering. 2: 315–337. doi:10.1146/annurev.bioeng.2.1.315. PMID 11701515.
  6. Forghani, M.; Forouzanfar, M.; Teshnehlab, M. (2010). «Parameter optimization of improved fuzzy c-means clustering algorithm for brain MR image segmentation». Engineering Applications of Artificial Intelligence. 23 (2): 160–168. doi:10.1016/j.engappai.2009.10.002.
  7. W. Wu, A. Y. C. Chen, L. Zhao and J. J. Corso (2014): "Brain Tumor detection and segmentation in a CRF framework with pixel-pairwise affinity and super pixel-level features", International Journal of Computer Aided Radiology and Surgery, pp. 241–253, Vol. 9.
  8. E. B. George and M. Karnan (2012): "MR Brain image segmentation using Bacteria Foraging Optimization Algorithm", International Journal of Engineering and Technology, Vol. 4.
  9. Kamalakannan, Sridharan; Gururajan, Arunkumar; Sari-Sarraf, Hamed; Rodney, Long; Antani, Sameer (2010 թ․ փետրվարի 17). «Double-Edge Detection of Radiographic Lumbar Vertebrae Images Using Pressurized Open DGVF Snakes». IEEE Transactions on Biomedical Engineering. 57 (6): 1325–1334. doi:10.1109/tbme.2010.2040082. PMID 20172792.
  10. J. A. Delmerico, P. David and J. J. Corso (2011): "Building façade detection, segmentation and parameter estimation for mobile robot localization and guidance", International Conference on Intelligent Robots and Systems, pp. 1632–1639.
  11. 11,0 11,1 Liu, Ziyi; Wang, Le; Hua, Gang; Zhang, Qilin; Niu, Zhenxing; Wu, Ying; Zheng, Nanning (2018). «Joint Video Object Discovery and Segmentation by Coupled Dynamic Markov Networks» (PDF). IEEE Transactions on Image Processing. 27 (12): 5840–5853. Bibcode:2018ITIP...27.5840L. doi:10.1109/tip.2018.2859622. ISSN 1057-7149. PMID 30059300.
  12. 12,0 12,1 Wang, Le; Duan, Xuhuan; Zhang, Qilin; Niu, Zhenxing; Hua, Gang; Zheng, Nanning (2018 թ․ մայիսի 22). «Segment-Tube: Spatio-Temporal Action Localization in Untrimmed Videos with Per-Frame Segmentation» (PDF). Sensors. 18 (5): 1657. doi:10.3390/s18051657. ISSN 1424-8220. PMC 5982167. PMID 29789447.{{cite journal}}: CS1 սպաս․ չպիտակված ազատ DOI (link)
  13. Batenburg, K J.; Sijbers, J. (2009). «Adaptive thresholding of tomograms by projection distance minimization». Pattern Recognition. 42 (10): 2297–2305. CiteSeerX 10.1.1.182.8483. doi:10.1016/j.patcog.2008.11.027.
  14. Batenburg, K J.; Sijbers, J. (2009 թ․ հունիս). «Optimal Threshold Selection for Tomogram Segmentation by Projection Distance Minimization». IEEE Transactions on Medical Imaging. 28 (5): 676–686. doi:10.1109/tmi.2008.2010437. PMID 19272989. Արխիվացված է օրիգինալից (PDF) 2013 թ․ մայիսի 3-ին. Վերցված է 2012 թ․ հուլիսի 31-ին.
  15. Kashanipour, A.; Milani, N; Kashanipour, A.; Eghrary, H. (2008 թ․ մայիս). «Robust Color Classification Using Fuzzy Rule-Based Particle Swarm Optimization». IEEE Congress on Image and Signal Processing. 2: 110–114. doi:10.1109/CISP.2008.770. ISBN 978-0-7695-3119-9.
  16. Barghout, Lauren; Sheynin, Jacob (2013). «Real-world scene perception and perceptual organization: Lessons from Computer Vision». Journal of Vision. 13 (9): 709. doi:10.1167/13.9.709.
  17. Hossein Mobahi; Shankar Rao; Allen Yang; Shankar Sastry; Yi Ma. (2011). «Segmentation of Natural Images by Texture and Boundary Compression» (PDF). International Journal of Computer Vision. 95: 86–98. CiteSeerX 10.1.1.180.3579. doi:10.1007/s11263-011-0444-0. Արխիվացված է օրիգինալից (PDF) 2017 թ․ օգոստոսի 8-ին. Վերցված է 2011 թ․ մայիսի 8-ին.
  18. Shankar Rao, Hossein Mobahi, Allen Yang, Shankar Sastry and Yi Ma Natural Image Segmentation with Adaptive Texture and Boundary Encoding Արխիվացված 2016-05-19 Wayback Machine, Proceedings of the Asian Conference on Computer Vision (ACCV) 2009, H. Zha, R.-i. Taniguchi, and S. Maybank (Eds.), Part I, LNCS 5994, pp. 135–146, Springer.
  19. Ohlander, Ron; Price, Keith; Reddy, D. Raj (1978). «Picture Segmentation Using a Recursive Region Splitting Method». Computer Graphics and Image Processing. 8 (3): 313–333. doi:10.1016/0146-664X(78)90060-6.
  20. R. Kimmel and A.M. Bruckstein. https://www.cs.technion.ac.il/~ron/PAPERS/Paragios_chapter2003.pdf Արխիվացված 2022-01-22 Wayback Machine, International Journal of Computer Vision 2003; 53(3):225–243.
  21. R. Kimmel, https://www.cs.technion.ac.il/~ron/PAPERS/laplacian_ijcv2003.pdf Արխիվացված 2021-03-08 Wayback Machine, chapter in Geometric Level Set Methods in Imaging, Vision and Graphics, (S. Osher, N. Paragios, Eds.), Springer Verlag, 2003. 0387954880
  22. Barghout, Lauren. Visual Taxometric approach Image Segmentation using Fuzzy-Spatial Taxon Cut Yields Contextually Relevant Regions. Communications in Computer and Information Science (CCIS). Springer-Verlag. 2014
  23. Witold Pedrycz (Editor), Andrzej Skowron (Co-Editor), Vladik Kreinovich (Co-Editor). Handbook of Granular Computing. Wiley 2008
  24. Barghout, Lauren (2014). Vision. Global Conceptual Context Changes Local Contrast Processing (Ph.D. Dissertation 2003). Updated to include Computer Vision Techniques. Scholars' Press. 978-3-639-70962-9.
  25. Barghout, Lauren, and Lawrence Lee. "Perceptual information processing system." Google Patents
  26. Lindeberg, T.; Li, M.-X. (1997). «Segmentation and classification of edges using minimum description length approximation and complementary junction cues». Computer Vision and Image Understanding. 67 (1): 88–98. doi:10.1006/cviu.1996.0510.
  27. [1] Արխիվացված 2017-10-13 Wayback MachineShelia Guberman, Vadim V. Maximov, Alex Pashintsev Gestalt and Image Understanding. GESTALT THEORY 2012, Vol. 34, No.2, 143–166.
  28. R. Nock and F. Nielsen, Statistical Region Merging(չաշխատող հղում), IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol 26, No 11, pp 1452–1458, 2004.
  29. L. Chen, H. D. Cheng, and J. Zhang, Fuzzy subfiber and its application to seismic lithology classification, Information Sciences: Applications, Vol 1, No 2, pp 77–95, 1994.
  30. S.L. Horowitz and T. Pavlidis, Picture Segmentation by a Directed Split and Merge Procedure, Proc. ICPR, 1974, Denmark, pp. 424–433.
  31. S.L. Horowitz and T. Pavlidis, Picture Segmentation by a Tree Traversal Algorithm, Journal of the ACM, 23 (1976), pp. 368–388.
  32. L. Chen, The lambda-connected segmentation and the optimal algorithm for split-and-merge segmentation Արխիվացված 2016-03-10 Wayback Machine, Chinese J. Computers, 14(1991), pp 321–331
  33. Caselles, V.; Kimmel, R.; Sapiro, G. (1997). «Geodesic active contours» (PDF). International Journal of Computer Vision. 22 (1): 61–79. doi:10.1023/A:1007979827043. Արխիվացված է օրիգինալից (PDF) 2021 թ․ հունիսի 26-ին. Վերցված է 2020 թ․ օգոստոսի 1-ին.
  34. Dervieux, A. and Thomasset, F. 1979. A finite element method for the simulation of Raleigh-Taylor instability. Springer Lect. Notes in Math., 771:145–158.
  35. Dervieux, A. and Thomasset, F. 1981. Multifluid incompressible flows by a finite element method. Lecture Notes in Physics, 11:158–163.
  36. S. Osher and N. Paragios. Geometric Level Set Methods in Imaging Vision and Graphics, Springer Verlag, 0-387-95488-0, 2003.
  37. James A. Sethian. «Segmentation in Medical Imaging». Վերցված է 2012 թ․ հունվարի 15-ին.
  38. Forcadel, Nicolas; Le Guyader, Carole; Gout, Christian (2008 թ․ հուլիս), «Generalized fast marching method: applications to image segmentation», Numerical Algorithms, 48 (1–3): 189–211, doi:10.1007/s11075-008-9183-x
  39. Chan, T.F.; Vese, L. (2001). «Active contours without edges». IEEE Transactions on Image Processing. 10 (2): 266–277. Bibcode:2001ITIP...10..266C. doi:10.1109/83.902291. PMID 18249617.
  40. David Mumford and Jayant Shah (1989): Optimal approximations by piecewise smooth functions and associated variational problems, Communications on Pure and Applied Mathematics, pp 577–685, Vol. 42, No. 5
  41. Jianbo Shi and Jitendra Malik (2000): "Normalized Cuts and Image Segmentation", IEEE Transactions on Pattern Analysis and Machine Intelligence, pp 888–905, Vol. 22, No. 8
  42. Leo Grady (2006): "Random Walks for Image Segmentation", IEEE Transactions on Pattern Analysis and Machine Intelligence, pp. 1768–1783, Vol. 28, No. 11
  43. Z. Wu and R. Leahy (1993): "An optimal graph theoretic approach to data clustering: Theory and its application to image segmentation"(չաշխատող հղում), IEEE Transactions on Pattern Analysis and Machine Intelligence, pp. 1101–1113, Vol. 15, No. 11
  44. Leo Grady and Eric L. Schwartz (2006): "Isoperimetric Graph Partitioning for Image Segmentation" Արխիվացված 2011-07-19 Wayback Machine, IEEE Transactions on Pattern Analysis and Machine Intelligence, pp. 469–475, Vol. 28, No. 3
  45. S. Geman and D. Geman (1984): "Stochastic relaxation, Gibbs Distributions and Bayesian Restoration of Images", IEEE Transactions on Pattern Analysis and Machine Intelligence, pp. 721–741, Vol. 6, No. 6.
  46. A. Bouman and M. Shapiro (2002): "A multiscale Random field model for Bayesian image segmentation", IEEE Transactions on Image Processing, pp. 162–177, Vol. 3.
  47. J. Liu and Y. H. Yang (1994): "Multiresolution color image segmentation", IEEE Transactions on Pattern Analysis and Machine Intelligence, pp. 689–700, Vol. 16.
  48. S. Vicente, V. Kolmogorov and C. Rother (2008): "Graph cut based image segmentation with connectivity priors", CVPR
  49. Corso, Z. Tu, and A. Yuille (2008): "MRF Labelling with Graph-Shifts Algorithm", Proceedings of International workshop on combinatorial Image Analysis
  50. B. J. Frey and D. MacKayan (1997): "A Revolution: Belief propagation in Graphs with Cycles", Proceedings of Neural Information Processing Systems (NIPS)
  51. Staib, L.H.; Duncan, J.S. (1992). «Boundary finding with parametrically deformable models». IEEE Transactions on Pattern Analysis and Machine Intelligence. 14 (11): 1061–1075. doi:10.1109/34.166621. ISSN 0162-8828.
  52. Witkin, A. P. "Scale-space filtering", Proc. 8th Int. Joint Conf. Art. Intell., Karlsruhe, Germany,1019–1022, 1983.
  53. A. Witkin, "Scale-space filtering: A new approach to multi-scale description," in Proc. IEEE Int. Conf. Acoust., Speech, Signal Processing (ICASSP), vol. 9, San Diego, CA, Mar. 1984, pp. 150–153.
  54. Koenderink, Jan "The structure of images", Biological Cybernetics, 50:363–370, 1984
  55. Lifshitz, L. and Pizer, S.: A multiresolution hierarchical approach to image segmentation based on intensity extrema, IEEE Transactions on Pattern Analysis and Machine Intelligence, 12:6, 529–540, 1990.
  56. Lindeberg, T.: Detecting salient blob-like image structures and their scales with a scale-space primal sketch: A method for focus-of-attention, International Journal of Computer Vision, 11(3), 283–318, 1993.
  57. Lindeberg, Tony, Scale-Space Theory in Computer Vision, Kluwer Academic Publishers, 1994, 0-7923-9418-6
  58. Gauch, J. and Pizer, S.: Multiresolution analysis of ridges and valleys in grey-scale images, IEEE Transactions on Pattern Analysis and Machine Intelligence, 15:6 (June 1993), pages: 635–646, 1993.
  59. Olsen, O. and Nielsen, M.: Multi-scale gradient magnitude watershed segmentation, Proc. of ICIAP 97, Florence, Italy, Lecture Notes in Computer Science, pages 6–13. Springer Verlag, September 1997.
  60. Dam, E., Johansen, P., Olsen, O. Thomsen,, A. Darvann, T. , Dobrzenieck, A., Hermann, N., Kitai, N., Kreiborg, S., Larsen, P., Nielsen, M.: "Interactive multi-scale segmentation in clinical use" in European Congress of Radiology 2000.
  61. Vincken, K., Koster, A. and Viergever, M.: Կաղապար:Doi-inline, IEEE Transactions on Pattern Analysis and Machine Intelligence, 19:2, pp. 109–120, 1997.]
  62. M. Tabb and N. Ahuja, Unsupervised multiscale image segmentation by integrated edge and region detection, IEEE Transactions on Image Processing, Vol. 6, No. 5, 642–655, 1997. Արխիվացված Հուլիս 20, 2011 Wayback Machine
  63. E. Akbas and N. Ahuja, "From ramp discontinuities to segmentation tree"
  64. C. Undeman and T. Lindeberg (2003) "Fully Automatic Segmentation of MRI Brain Images using Probabilistic Anisotropic Diffusion and Multi-Scale Watersheds", Proc. Scale-Space'03, Isle of Skye, Scotland, Springer Lecture Notes in Computer Science, volume 2695, pages 641–656.
  65. Florack, L. and Kuijper, A.: The topological structure of scale-space images, Journal of Mathematical Imaging and Vision, 12:1, 65–79, 2000.
  66. Bijaoui, A.; Rué, F. (1995). «A Multiscale Vision Model». Signal Processing. 46 (3): 345. doi:10.1016/0165-1684(95)00093-4.
  67. Barghout, Lauren. Visual Taxometric Approach to Image Segmentation using Fuzzy-Spatial Taxon Cut Yields Contextually Relevant Regions. IPMU 2014, Part II. A. Laurent et al (Eds.) CCIS 443, pp 163–173. Springer International Publishing Switzerland
  68. Barghout, Lauren (2014). Vision: How Global Perceptual Context Changes Local Contrast Processing (Ph.D. Dissertation 2003). Updated to include Computer Vision Techniques. Scholars Press. ISBN 978-3-639-70962-9.
  69. Mahinda Pathegama & Ö Göl (2004): "Edge-end pixel extraction for edge-based image segmentation", Transactions on Engineering, Computing and Technology, vol. 2, pp 213–216, ISSN 1305-5313
  70. Johnson, John L. (1994 թ․ սեպտեմբեր). «Pulse-coupled neural nets: translation, rotation, scale, distortion, and intensity signal invariance for images». Applied Optics. OSA. 33 (26): 6239–6253. doi:10.1364/AO.33.006239. PMID 20936043.
  71. A bot will complete this citation soon. Click here to jump the queue arXiv:1801.00868.
  72. Vicente, Sara; Rother, Carsten; Kolmogorov, Vladimir (2011). Object cosegmentation. IEEE. doi:10.1109/cvpr.2011.5995530. ISBN 978-1-4577-0394-2.
  73. Saygin, ZM, Osher, DE, Augustinack, J, Fischl, B, and Gabrieli, JDE.: Կաղապար:Doi-inline, Neuroimage, 56:3, pp. 1353–61, 2011.
  74. Menke, RA, Jbabdi, S, Miller, KL, Matthews, PM and Zarei, M.: Կաղապար:Doi-inline, Neuroimage, 52:4, pp. 1175–80, 2010.]
  75. Haindl, Michal; Mikes, Stanislav (2008). Texture segmentation benchmark. CiteSeerX 10.1.1.214.2307. doi:10.1109/ICPR.2008.4761118. ISBN 978-1-4244-2174-9. {{cite book}}: |journal= ignored (օգնություն)
  76. D.Martin; C. Fowlkes; D. Tal; J. Malik (2001 թ․ հուլիս). «A Database of Human Segmented Natural Images and its Application to Evaluating Segmentation Algorithms and Measuring Ecological Statistics». Proc. 8th Int'l Conf. Computer Vision. Vol. 2. էջեր 416–423.

Հղումներ[խմբագրել | խմբագրել կոդը]

Արտաքին աղբյուրներ[խմբագրել | խմբագրել կոդը]