DjVu

Վիքիպեդիայից՝ ազատ հանրագիտարանից

DjVu ( ֆր.՝ déjà vu — «արդեն տեսանելի») — «պատկերների սեղմում կորուստներով» տեխնոլոգիան, որը մշակվել է հատուկ սկանավորված փաստաթղթերը (գրքեր, ամսագրեր, ձեռագրեր և այլն) պահպանելու համար, որտեղ բանաձևերի առատությունը, սխեմաները, նկարները և ձեռագիր սիմվոլները չափազանց ժամանակատար են դարձնում սիմվոլների օպտիկական նիշերը ճանաչելը։ Այն նաև արդյունավետ լուծում է, եթե կարիք կա նմուշի բոլոր նրբությունները փոխանցել, օրինակ պատմական փաստատթղթերը, որտեղ կարևոր է ոչ միայն բովանդակությունը, այլև թղթի գույնն ու որակը, մագաղաթի թերությունները, ճաքերը, ծալված տեղերի հետքերը, ուղղումները, այլ իրերով թողնված հետքերը։

Ամենասկզբից տեխնոլոգիան մշակվել է Յան Լեկունի, Լեոն Բոտի և Պատիկ Հեֆֆերնի կողմից՝ AT&T լաբորատորիայում (1996-2001 թվականներին)։ DjVu-ն էլեկտրոնային մի քանի գրադարանների հիմք է դարձել։ Այն բավականին հայտնի է և օգտագործվում է բազմապիսի փաստաթղթերի համար։

Ֆորմատը օպտիմիզացված է ցանկցով փոխանցելու այնպիսի մեթոդով, որ էջը կարելի է դիտել մինչ բեռնման ավարտը։ DjVu ֆորմատը կարող է պարունակել տեքստային (OCR) շերտ, ինչը թույլ է տալիս փնտրել որևէ բան ողջ տեքստի մեջ։ Բացի դա, DjVu ֆայլը կարող է պարունակել ներդրված ինտերակտիվ ցանկ և ակտիվ շրջանները՝ հղումներ, ինչը թույլ է տալիս իրականացնել հարմար նավարկում ողջ DjVu ֆայլի մեջ։

Օգտագործվող տեխնոլոգիաները[խմբագրել | խմբագրել կոդը]

DjVu-ում գունավոր պատկերները սեղմելու օգտագործվում է հատուկ տեխնոլոգիա, որը պատկերը բաժանում է 3 շերտի՝ առջևի պլան, հետևի պլան և սև-սպիտակ (մեկբիթանի) երեսի։ Երեսը պահպահում է իսկական պատկերի չափսը, հենց դա էլ պարունակում է տեքստի պատկերը և այլ հստակ տվյալներ։ Հետևի պլանի չափսը, որում մնում են էջի նկարազարդումներն ու հյուսվածները, տարածք խնայելու համար փոքրացվում է։ Առջևի պլանը պարունակում է երեսի գունային ինֆորմացիան։ Առևի պլանի չափսը սովորաբար շատ ավելի է փոքրացվում։ Այնուհետև հետևի և առջևի պլանները вейвлет-преобразования օգնությամբ խտացվում են, իսկ երեսը՝ JB2 ալգորիթմով։

JB2 ալգորիթմի առանձնահատկությունը կայանում է նրանում, որ այն էջի վրա փնտրում կրկնվող սիմվոլներ և պահպանում է դրանց պատկերը միայն մեկ անգամ։ Մի քանի էջից բաղկացած փաստաթղթերում յուրաքանչյուր էջ օգտագործում է ընդհանուր «բառարանի» պատկերները։

Գրքերի մեծ մասը սեղմելու համար կարելի է օգտվել միայն երկու գույնից։ Այս դեպքում օգտագործվում է միայն մեկ շերտ, ինչը թույլ է տալիս հասնել սեղմման ռեկորդային աստիճանի։ Սև ու սպիտակ նկարազարդումներով սովորական գրքում, որը սկանավորվել է 600 dpi խտությամբ, էջի չափսը կազմում է միջինում 15 ԿԲ, այսինքն՝ մոտավորապես 100 անգամ ավելի փոքր, քան իրական ֆայլը։ Բարդ հետևի պլանի դեպքում հնարավոր է սեղմել իրական չափից 4-ից 10 անգամ։ Սակայն DjVu-ի լռելյայն կարգավորումներում օգտագործվում է «Տվյալների կորուստներով սեղմում» ֆունկցիան, այդ պատճառով էլ շատ կարևոր փաստաթղթերը պահպանելիս սովորաբար ընտրվում է «առանց կորուստների»՝ PNG, JPEG 2000, TIFF և այլ տարբերակներ։ DjVu-ում կարելի է նաև օգտագործել «տվյալների սեղմում առանց կորուստների» ֆունկցիան։ Այսպես օրինակ DjVuLibre փաթեթի CJB2 գործիքը հնարավորություն է ընձեռում սեղմել տվյալները «առանց կորուստների»։

DjVu ֆորմատում հիմնականում գործում են մի քանի տեխնոլոգիաներ, այդ թվում նար AT&T լաբորատորիայի մշակածը.

  • սկանավորված պատկերից տեքստի՝ ֆոնից առանձնացնելու ալգորիթմ,
  • Ֆոնի սեղմման Վեյվլետային ալգորիթմ IW44,
  • Սև-սպիտակ պատկերների սեղմման JB2 ալգորիթմ,
  • Սեղմման ունիվերսալ ալգորիթմ ZIP,
  • «Պահանջի դեպքում» սեղմածի ընդլայնման ալգորիթմ
  • Պատկերների «քողարկման» ալգորիթմ։

Պատկերների տեքստային ներկայացումը[խմբագրել | խմբագրել կոդը]

DjVu ֆորմատը նախատեսում է «տեքստային շերտի» առկայություն, որը պարունակում է էջի տեքստը (Օգտագործվում է տեքստը հեշտությամբ փնտրելու և պատճենելու համար)։ Այն դեպքում, երբ տեքստային շերտը հասանելի չէ, տեքստ ստանալու միակ եղանակը օպտիկական նիշերի ճանաչումն է այլ ծրագրերի միջոցով։

Արտոնագիր[խմբագրել | խմբագրել կոդը]

AT&T ընկերությունը վաճառել է տեխնոլոգիան LizardTech ընկերությանը, որը փորձել է օգտագործել այն իր կոմերցիոն շահերից ելնելով, բայց շնորհիվ ֆորմատի բաց լինելու[1] DjVu փաստաթղթերի ստեղծման և դիտման համար գոյություն ունի Ազատ ծրագրային ապահովում, որը հասանելի է մի շարք պլատֆորմաների։ 2008 թվականի հուլիսի 1-ին LizardTech ընկերությունը DjVu-ի կառավարումը հանձնեց Celartem մայր ընկերությանը,[2], իսկ 2009 թվականի հունիսի 10-ին Celartem ընկերությունը փոխանցեց իր DjVu տեխնոլոգիայի իրավունքները Caminova ընկերությանը։[3].

Գոյություն ունի ազատ ծրագիր, որը թողարկվում է GNU GPL լիցենզիայով, DjVuLibre գրադարան և դիտարկիչներ և ծրագիր-կոդավորիչներ։

DjVu ֆայլերի հետ աշխատելու համար ծրագրեր[խմբագրել | խմբագրել կոդը]

Դիտում

Windows օպերացիոն համակարգի համար՝

Linux օպերացիոն համակարգի համար՝

UNIX օպերացիոն համակարգի համար՝

  • DjVuLibre DjView

OS X օպերացիոն համակարգի համար՝

  • Caminova Official DjVu Browser Plug-in
  • DjVuLibre DjView
  • MacDjView Desktop Viewers

Android օպերացիոն համակարգի համար՝

iOS օպերացիոն համակարգի համար՝

BlackBerry OS օպերացիոն համակարգի համար՝

  • DjVuBB.
Խմբագրում
  • DjVuLibre;
  • Document Express՝ հեղինակի պաշտոնական ծրագիրը,
DJVU փաստաթղթում տեքստի ճանաչման (OCR) հնարավորության ավելացում փնտրելու և պատճենելու համար,
  • any2djvu՝ առցանց ծառայություն, որը աշխատում է միայն անգլալեզու տեքստերի հետ[4].
  • DjvuOCR՝ DJVU փաստաթղթում ավելացնում է տեքստերի ճանաչում[5].
  • ABBYY FineReader՝ պահպանում է պրոյեկտը DJVU տեսքով, OCR շերտով (սկսած 10-րդ տարբերակից)

Կարդացեք նաև[խմբագրել | խմբագրել կոդը]

Հղումներ[խմբագրել | խմբագրել կոդը]

  1. Лицензия
  2. Пресс-релиз LizardTech
  3. Пресс-релиз LizardTech
  4. any2djvu - онлайн-конвертирование в DJVU
  5. сайт разработки DjvuOCR