Ինֆորմացիայի տեսություն

Վիքիպեդիայից՝ ազատ հանրագիտարանից

Ինֆորմացիայի տեսություն, ինֆորմատիկայի, ռադիոտեխնիկայի և կիրառական մաթեմատիկայի բաժին, որն ուսումնասիրում է ինֆորմացիայի քանակի չափումը, նրա հատկությունները, և որը սահմանում է տվյալների փոխանցման սահմանային հարաբերակցությունը։ Ինչպես և ցանկացած մաթեմատիկական տեսություն, այս տեսությունը օգտագործում է մաթեմատիկական մոդելները, այլ ոչ թե ֆիզիկական օբեկտները (կապի գծեր և աղբյուրներ)։ Գլխավորապես օգտագործում է մաթեմատիկական վիճակագրության և հավանականությունների տեսության մաթեմատիկական ապարատները։

Ինֆորմացիայի տեսության հիմնական բաժիններն են աղբյուրի կոդավորումը (ինֆորմացիայի սեղմում) և կապուղային կոդավորումը (խանգարակայուն)։ Ինֆորմացիայի տեսությունը սերտ կապված է ինֆորմացիոն էնտրոպիայի, հեռախաղորդակցության համակարգերի, ծածկագրման և այլ նմանատիպ բնագավառների հետ։

Ներածություն[խմբագրել | խմբագրել կոդը]

Ինֆորմացիայի տեսությունը կապված է 1984 թվականին Կլոդ Շենոնի կողմից «Կապի մաթեմատիկական տեսություն» աշխատության հրապարակման հետ։ Ըստ Շենոնի՝ ինֆորմացիայի տեսությունը կապի մաթեմատիկական տեսության բաժին է։ Ինֆորմացիայի տեսությունը սահմանում է ինֆորմացիայի փոխանցման համակարգերի հնարավորությունների հիմնական սահմանները, սահմանում է նրանց աշխատանքի և գործնական իրագործման ելակետային սկզբունքները։ Ինֆորմացիայի տեսության խնդիրների շղթան ներկայացվում է կառուցվածքային սխեմայի տեսքով, որը ինֆորմացիայի պահպանման և փոխանցման սովորական համակարգ է։

Կապի համակարգի նկարագրություն

Պատկերում՝ աղբյուր կարող է լինել տիեզերքի յուրաքանչյուր օբյեկտ, որը ծնում է հաղորդագրություններ, և որոնք պետք է տեղափոխվեն տարածության և ժամանակի միջով։ Սկզբնապես ֆիզիկական բնությունից անկախ, փոխանցման ենթակա բոլոր հաղորդագրությունները սովորաբար փոխակերպվում են էլեկտրական ազդանշանների։ Ինֆորմացիայի կոդավորիչը ինֆորմացիան ներկայացնում է ավելի սեղմ տեսքով։ Կապուղու կոդավորիչը ինֆորացիան մշակում է, հաղորդագրություները կապուղով փոխանցելու ժամանակ, հնարավոր խանգարումներից և ինֆորմացիայի պապհպանման ժամանակ հնարավոր աղավաղումներից պաշտպանելու համար։ Մոդուլյատորը կապուղու կոդավորիչի ձևավորած հաղորդագրությունները փոխակերպում է կապուղու ֆիզիկական բնության կամ ինֆորմացիայի կուտակիչի միջավայրի հետ համաձայնեցված ազդանշանի։ Ինֆորմացիայի տարածման միջավայրը (կապուղի) ինֆորմացիայի փոխանցման գործընթացում մի փոքր աղմուկ է ներմուծում, որը աղավաղում է հաղորդագրությունը և դրանով իսկ դժվարացնում է նրա կարդալը։ Ստացող կողմում գտնվող սարքերը հակառակ գործողություններն են կատարում և ստացված ինֆորմացիան ներկայացնում են ընկալման համար հարմար տեսքով։ Հաղորդագության փոխանցման դժվարությունը կախված չէ նրա պարունակությունից, այնպես որ անիմաստ հաղորդագրությունները նույնքան դժվար է փոխանցել, որքան՝ իմաստալից հաղորդագրությունները։

Ինֆորմացիան կարելի է ներկայացնել և՛ որպես օբյեկտների հատկություն, և՛ որպես նրանց փոխազդեցության արդյունք։ Ինֆորմացիայի օբյեկտիվ գոյության փաստը՝ անկախ մեր գիտակցությունից, որոշ հետազոտողների համար բավականին արտառոց կարծիքների առիթ հանդիսացավ, ըստ որոնց՝ ինֆորմացիան նյութական աշխարհի երրորդ սուբստանցիան է (նյութի և էներգիայի կողքին)։ Բայց ինֆորմացիայի համար դեռ ձևակերպված չեն պահպանման և նյութի կամ էներգիայի՝ համարժեք քանակի անցման օրենքներ։ Ներկայումս ընդունված է, որ ինֆորմացիան գոյություն ունի անկախ նրանից, թե ընկալվում է այն, թե չէ, սակայն դրսևվորվում է միայն փոխազդեցության դեպքում։

Պատմություն[խմբագրել | խմբագրել կոդը]

Ինֆորմացիայի տեսության զարգացումը սովորաբար կապում են 1948թ․ հուլիս֊օգոստոս ամիսներին Կլոդ Շենոնի կողմից «Կապի մաթեմատիկական տեսություն» անունով՝ «Bell System» հեռախոսային ընկերության ամսագրում հրապարակված աշխատության հետ։ Սակայն պետք է նշել, որ ինֆորմացիայի տեսության ձևակերպման և ստեղծման գործում իրենց ավանդն են ունեցել նաև ականավոր այլ գիտնականներ։ Շենոնը իր հոդվածի սկզբում նշել է, որ «Այս տեսության որոշ հիմնական կետեր առկա են Նայքվիստի և Հարթլիի կարևոր աշխատություններում»։ Ներկայումս տեսությունը ընդլայնված է նրանով, որ նրանում որոշ նոր գործոններ են ներառվել, մասնավորապես՝ աղմուկի ազդեցությունը կապուղում։

Հիմնականում Շենոնը զարգացրել է Հարթլիի աշխատանքները՝ օգտագործելով «ինֆորմացիա» հասկացությունը, բայց բուն տերմինը չի պարզաբանում, այլ միայն նախապայման է որոշում, որ հաղարդագրությունները կարող են որոշակի «արժեք» ունենալ, այսինքն՝ իր հայեցողական կամ ֆիզիկական բնությունը ունեցող համակարգի մաս լինել (կիբեռնետիկ համակարգ)։ Շենոնի տեսությունը ի սկզբանե դիտարկվում էր՝ որպես ճշգրիտ ձևակերպված մաթեմատիկական խնդիր և հնարավորություն է տվել որոշելու աղմուկով լի հեռահաղորդակցային կապուղու թողունակությունը։

Ինֆորմացիայի հատկությունները[խմբագրել | խմբագրել կոդը]

  • Ինֆորմացիայի որոնում, ինֆորմացիայի՝ սպառողի պահանջմունքներին (հարցումներին) համապատասխանելու հատկություն։
  • Ամբողջականություն, ինֆորմացիայի՝ տվյալ օբյեկտը կամ գործընթացը ամբողջապես բնութագրելու հատկություն։
  • Արդիականություն, ինֆորմացիայի՝ ժամանակակի անհրաժեշտ պահին սպառողի պահանջմունքներին համապատասխանելու հատկություն։
  • Հավաստիություն, ինֆորմացիայի՝ թաքնված սխալներ չունենալու հատկություն։
  • Պաշտպանվածություն, հատկություն, որը բնոորշում է ինֆորմացիայի չարտոնված օգտագործման կամ փոփոխման անհնարինությունը։
  • Հարմարավետություն, հատկություն, որը բնորոշում է ինֆորմացիայի ձևի կամ ծավալի հարմարավետությունը՝ տվյալ սպառողի տեսանկյունից։
  • Համապատասխանություն, հատկություն, որը բնորոշում է ինֆորմացիայի՝ տվյալ օբյեկտին կամ երևույթին ճիշգրիտ կերպով համապատասխանելը։

Համապատասխանությունը՝ սպառողի համար ինֆորմացիայի ներքին հատկություն է, որն իրեն դրսևորում է հավաստիության միջոցով։

Նաև՝ ինֆորմացիայի հատկությունները կարելի է որոշել ըստ նրա սպառողի․ քաղաքական, քիմիական, կենսաբանական, տեխնիկական, տնտեսագիտական և այլն։ Ինֆորմացիան ունի նաև ներքին հատկություններ՝ ինֆորմացիայի ներքին կազմակերպություն (կառուցվածք) և ծավալ (քանակ)։ Ինֆորմացիան կազմված է մի քանի առանձին տարրերից, որոնք կարող են լինել և՛ բարդ և՛ պարզ։ Պարզ տարրերը հետագա մասնատման չեն ենթարկվում, իսկ բարդերը ձևավորվում են որպես մի քանի տարրերի համադրություն և ներկայացվում են որպես ինֆորմացիոն ամբողջութուններ։

Ինֆորմացիայի կառուցվածքը բավականին բարդ է, և կարող է ներառել ինֆորմացիոն ամբողջությունների տարբեր համակցություններ, որոնք տարբեր բովանդակություն ունեն։ Իսկ ինֆորմացիայի քանակը, ինֆորմացիոն հաղորդագրություններ ստանալու ժամանակ գիտելիքի անորոշության նվազման չափն է։ Ինֆորմացիայի քանակի միավորն է բիթը։ Դա ինֆորմացիայի քանակն է, որի դեպքում ընտրության տարբերակների թիվը փոքրանում է երկու անգամ (դա որոշակի հարց է, որին պատասխանելու համար անհրաժեշտ է պատասխանել ընդամենը այո կամ ոչ)։ Հավասարահավանական իրադարձությունների ինֆորմացիայի քանակը որոշվում է Հարթլիի բանաձևով, որտեղ ինֆորմացիայի ստացման գործընթացը դիտակվում է որպես՝ նախօրոք սահմանված հավասարահավանական հաղորդագրությունների բազմության միջից մեկ հաղրոդագրության ընտրություն։

որտեղ  — ն ինֆորմացիայի քանակն է, իսկ ֊ը — հաղորդագրությունների հնարավոր բազմությունը։ Լոգարիթմը 2 հիմքով է, քանի որ ինֆորմացիայի հաշվարկը օգտագործվում հիմնականում համակարգչային տեխնիկայում, և որտեղ ինֆորմացիան պահպանվում է երկուական համակարգի միջոցով։ Ինֆորմացիայի քանակի բանաձևը, հաշվի առնելով իրադարձությունների ոչ միանման հավանականությունը, անվանվել է նրա հայտնագործողի՝ Շենոնի պատվին։

որտեղ  — ն հավանականությունն է նրա, որ -րդ հաղորդագրությունը ճշմարիտ է։ Պայմանականորեն ինֆորմացիայի քանակի հայտնաբերման մեթոդները կարելի է բաժանել 5 տեսակի՝

  • Էնտրոպիական
  • Ալգորիթմական
  • Կոմբինատորական
  • Բովանդակային
  • Պրագմատիկ

Էնտրոպիական, ալգորիթմական, կոմբինատորական տեսակները բնորոշում են դիտարկվող օբյեկտի կամ երևույթի բարդության քանակական սահմանումը, և հիմնվում ինֆորմացիայի հետևյալ հատկությունների վրա՝ ամբողջականություն, հասանելիություն, հարմարավետություն։ Բովանդակային տեսակը նկարագրում է ստացողի համար՝ փոխանցվող հաղորդագրության արդի և իմաստալից լինելը (որոնման համար հասանելիության և համապատասխանության հատկություներ)։ Պրագմատիկ տեսակը ուշադրություն է դարձնում օգտագործողի համար՝ ստացված հաղորդագրության օգտակարության վրա (ամբողջականության, արդիականության, հարմարավետության և համապատասխանության հատկություններ)։

Ինֆորմացիայի կոդավորում[խմբագրել | խմբագրել կոդը]

Կոդավորումը՝ հաղորդագրության՝ կապուղու մուտքից մինչև ելք՝ կոդով անցման գործընթացն է։ Ընդ որում հաղորդագրության ինֆորմացիոն արժեքը պետք է անփոփոխ մնա։ Ինֆորմացիայի տեսության մեջ կարելի է ընգծել կոդավորման հետևյալ տեսակները։

1. Դիսկրետ աղբյուրների կոդավորում։ Դա ինֆորմացիայի «առանց կորուստների» կոդավորման ենթադրյալ մոդել է, որը կապուղով անցնում է առանց աղմուկի՝ ինֆորմացիայի սեղմումով։

2. Ինֆորմացիայի կոդավորում, նրա՝ աղմուկով լի կապուղով անցնելու ժամանակ։ Այդ մեթոդն հաշվի է առնում և պաշտպանում է ինֆորմացիան կապուղում առկա խանգարումներից։

Կոդը միանշանակ ապակոդավորվող է, եթե կոդի այբուբենից (հիմնականում դա 0 կամ 1 է) սիմվոլների ցանկացած հաջորդականություն բաժանվում է առանձին բառերի։ Եթե ոչ մի կոդային բառ մյուսի սկիզբը չէ, ապա կոդը անվանում են պրեֆիքսային, և նա միանշանակ ապակոդավորվող է։ Հետևապես՝ պրեֆիքսությունը միանշանակ ապակոդավորվելու բավարար, սակայն ոչ անհրաժեշտ պայման է։ Պրեֆիքսության պահանջը սահմանափակում է կոդային բառերի բազմաթիվ երկարություններ և հնարավորություն չի տալիս շատ կարճ կոդային բառեր ընտրել։ Կոդային բառերի երկարություններով, ծավալով պրեֆիքսային կոդի գոյության անհրաժեշտ և բավարար պայման է Քրաֆտի անհավասարության կատարումը։

Նաև անհրաժեշտ է դիտարկել Շենոն֊Ֆանոյի կոդը՝ պրեֆիքսային անհամասեռ կոդավորման ալգորիթմը։ Կոդավորման այդ մեթոդը օգտագործում է հաղորդագրության ավելորդությունը, որը ներառված է իր այբուբենի սիմվոլների հաճախականության անհամասեռ բաշխվածության մեջ, այսինքն՝ ավելի հաճախ հանդիպող սիմվոլները փոխարինում է կարճ երկուական հաջորդականություններով, իսկ ավելի հազվադեպ հանդիպող սիմվոլները՝ ավելի երկար երկուական հաջորդականություններով։ Դիտրակենք աղբյուրը, որը ընտրում է տառերը բազմությունից՝ հավանականություններով։ Ենթադրենք, որ տառերը դասավորված են () հավանականության նվազման կարգով։ Շենոնի կոդի կոդային բառը՝ համարով հաղորդագրության համար երկուական հաջորդականությունն է, որն իրենից ներկայացնում է թվի երկուական տեսքով գրանցված թվի՝ ստորակետից հետո առաջին թվանշանակարգերը։

3. Կոդավորում՝ որակի տվյալ չափանիշներով։ Հաշվի առնելով այն, որ անալոգային աղբյուրների ինֆորմացիան չի կարող ներկայացվել թվային տեսքով՝ առանց աղավաղումների, կոդավորման այս մեթոդը ինֆորմացիայի փոխանցման որակի և ծախսերի միջև լավագույն փոխզիջումն է ապահովում։ Այն օգտագործվում է այն դեպքերում, երբ աղբյուրի կոդավորումը իրականցվում է այն կերպ, որ կոդավորված հաղորդագրությունները վերականգնվում են որոշակի արժեքից ոչ մեծ որոշակի սխալով։ Այն կոդավորման ամենաարդիական մեթոդներից մեկն է, քանի որ լայն տարածում է գտել տեսա և ձայնային ինֆորմացիայի թվային փոխանցման մեջ։

4. Ինֆորմացիայի կոդավորումը՝ բազմաթիվ օգտատերերով համակարգերի համար, լավագույնս ապահովում է բաժանորդների փոխազդեցությունը, որոնք ընդհանուր ռեսուրս են գտագործում, օրինակ՝ կապուղի։

5. Գաղտնի կապ, ինֆորմացիայի՝ չարտոնված մուտքից պաշտպանման համակարգեր։ Այս տեսակը գործածվում է ակտիվ կերպով և շատ արդիական է։ Ներառում է ինֆորմացիայի տեսությունը, ալգորիթմների հաշվողական հզորության տեսությունը, օպերացիաների ուսումնասիրություն և թվերի տեսություննները։

Ինֆորմացիոն էնտրոպիա[խմբագրել | խմբագրել կոդը]

Ինֆորմացիոն էնտրոպիան () ինֆորմացիայի քաոսի չափն է, առաջնային այբուբենի ինչ֊որ սիմվոլի հայտնվելու անորոշությունը։ Ինֆորմացիոն կորուստների բացակայության դեպքում էնտրոպիան հավասար է փոխանցվող հաղորդագրության մեկ սիմվոլի համար պահանջվող ինֆորմացիայի քանակին։ Էնտրոպիան տվյալների աղբյուրի համար, հավանականությունների մոդելի համատեքստում, որոշված քանակն է։ Տվյալների աղբյուրի էնտրոպիայի աստիճանը՝ տվյալների մեկ տարրի համար, բիտերի միջին քանակն է, որը պահանջվում է նրա ծածկագրման համար՝ առանց ինֆորմացիայի կորուստի՝ լավագույնս կոդավորելու դեպքում։ Էնտրոպիան սահմանափակում է առավելագույն հնարավոր, առանց կորուստների սեղմումը, որը կարող է իրագործվել տեսականորեն՝ սովորական հավաքածույի օգտագործման դեպքում, կամ գործնականում՝ Հաֆմանի կոդավորման, Լեմպել֊Զիվա֊Վելչայի կոդավորման, կամ հանրահաշվական կոդավորման օգտագործման դեպքում։

Էնտրոպիայի հատկությունները

  • Էնտրոպիան չի կարող լինել բացասական ։
  • Էնտրոպիան սահմանափակված է (եթե բոլոր տարրերը հավասարահավանական են)։
  • Եթե անկախ են, ապա ։
  • Եթե ունեն տարրերի հավանականությունների միևնույն բաշխվածությունը, ապա ։
  • Տվյալների որոշ բիթեր կարող են չկրել ինֆորմացիա։
  • Էնտրոպիայի քանակը միշտ չէ, որ արտահայտվում է բիթերի ամբողջ թվով։

Սահմանում սեփական ինֆորմացիայի միջոցով[խմբագրել | խմբագրել կոդը]

Սեփական ինֆորմացիան պատահական դիսկրետ մեծության ստատիկ ֆունկցիա է։ Կարելի է որոշել պատահական մեծության էնտրոպիան՝ նախապես ներմուծելով պատահական մեծության բաշխվածության հասկացությունները, որոնք ունեն վերջավոր թվով նշանակումներ և սեփական ինֆորմացիա, այդ ժամանակ էնտրոպիան կսահմանվի հետևյալ կերպ՝

Հաղորդագրության միջին էնտրոպիան[խմբագրել | խմբագրել կոդը]

Ինֆորմացիոն էնտրոպիան՝ հնարավոր վիճակներով՝ պատահական անկախ իրադարձությունների համար (-ից մինչև ) հաշվում են հետևյալ բանաձևով՝

Այդ կերպ՝ իրադարձության էնտրոպիան իրադարձության տեղի ունենալու հարաբերական հաճախականությունների հակառակ նշանով բոլոր արտադրյալների (որոնք բազմապատկված են իրենց սեփական երկուական լոգարիթմներին) գումարն է։

Մասնակի էնտրոպիա[խմբագրել | խմբագրել կոդը]

մեծությունը անվանում են մասնակի էնտրոպիա, որը բնորոշում է միայն i-րդ տարրի արժեքը։

Շենոնի բանաձևը[խմբագրել | խմբագրել կոդը]

Շենոնի էնտրոպիայի չափը պատահական փոփոխականի իրագործման նկատմամբ անվստահություն է արտահայտում։ Այդ կերպ՝ էնտրոպիան տարբերությունն է հաղորդագրությունում պարունակվող ինֆորմացիայի և ինֆորմացիայի այն մասի, որը հաստատ հայտնի է հաղորդագրության մեջ։ Շենոնը ենթադրեց, որ ինֆորմացիայի աճը հավասար է կորցված անորոշությանը, և, նրա չափման համար նոր պահանջներ սահմանելով, ստացավ հետևյալ բանաձևը

որտեղ ֊ն հաստատուն է, որը անհրաժեշտ է չափման միավորների ընտրության համար։

Այլընտրանքային սահմանում[խմբագրել | խմբագրել կոդը]

էնտրոպիայի սահմանման այլ տարբերակ է ապացույցը, որ ֊ը միանշանակ որոշված է, եթե ֊ը բավարարում է հետևյալ պահանջներին՝

1. ֊ը որոշված է և շարունակական է բոլոր ֊ի համար, որտեղ -ը բոլոր -երի -երի համար

2. ամբողջ դրական թվերի համար, պետք է կատարվի հետևյալ անհավասարությունը՝

3. ամբողջ դրական թվերի համար, որտեղ , պետք է կատարվի հետևյալ պայմանը՝

Գրականություն[խմբագրել | խմբագրել կոդը]

Արտաքին հղումներ[խմբագրել | խմբագրել կոդը]

Այս հոդվածի կամ նրա բաժնի որոշակի հատվածի սկզբնական կամ ներկայիս տարբերակը վերցված է Քրիեյթիվ Քոմմոնս Նշում–Համանման տարածում 3.0 (Creative Commons BY-SA 3.0) ազատ թույլատրագրով թողարկված Հայկական սովետական հանրագիտարանից  (հ․ 4, էջ 371