DjVu

Aktuální verze stránky ještě nebyla zkontrolována zkušenými přispěvateli a může se výrazně lišit od verze recenzované 4. ledna 2021; kontroly vyžadují 4 úpravy .
DjVu
Rozšíření .djvu[3] nebo [3].djv
MIME typ image/vnd.djvu
image/x-djvu
Podpis AT&TFORM
Vývojář AT&T Labs-Research, LizardTech (od března 2000 [1] )
zveřejněno 1998
Poslední vydání 27 (červenec 2006 [2] )
Typ formátu Elektronický dokument
otevřený formát ? Ano
webová stránka djvu.org
 Mediální soubory na Wikimedia Commons

DjVu (z francouzštiny  déjà vu  - „již viděno“) je technologie pro prezentaci a ukládání dokumentů (knih, časopisů, rukopisů a podobně, primárně naskenovaných), využívající ztrátovou kompresi obrazu .

Tuto technologii původně vyvinuli Jan LeCun , Leon Bothu a Patrick Heffner v AT&T Labs v letech 1996 až 2001.

Formát je optimalizován pro síťový přenos, takže stránku lze zobrazit před dokončením stahování souboru. Soubor DjVu může obsahovat textovou ( OCR ) vrstvu, která umožňuje fulltextové vyhledávání v souboru. Kromě toho může soubor DjVu obsahovat vestavěný interaktivní obsah a aktivní body – odkazy, které vám umožňují implementovat pohodlnou navigaci v knihách DjVu.

Použité technologie

Pro kompresi barevných obrázků v DjVu se používá speciální technologie, která rozděluje původní obrázek do tří vrstev: popředí, pozadí a černobílá (jednobitová) maska. Maska se uloží s rozlišením původního souboru; obsahuje obrázek textu a další jasné detaily. Rozlišení pozadí, které zachovává ilustrace a texturu stránky, je ve výchozím nastavení sníženo, aby se ušetřilo místo. Popředí obsahuje barevné informace o masce; jeho rozlišení je obvykle ještě sníženo. Poté jsou pozadí a popředí komprimovány pomocí vlnkové transformace a maska ​​je komprimována pomocí algoritmu JB2 .

Funkce algoritmu JB2 spočívá v tom, že hledá na stránce opakované znaky a jejich obrázek uloží pouze jednou. Ve vícestránkových dokumentech sdílí každých několik po sobě jdoucích stránek společný „slovník“ obrázků.

Pro komprimaci většiny knih si vystačíte s pouhými dvěma barvami. V tomto případě je použita pouze jedna vrstva, což umožňuje dosáhnout kompresního poměru záznamu. V typické knize s černobílými ilustracemi naskenované v rozlišení 600 dpi je průměrná velikost stránky asi 15 kB , tedy asi 100krát menší než původní soubor. V přítomnosti složitého pozadí je nárůst objemu obvykle 4-10krát. Při standardním nastavení však DjVu používá ztrátovou kompresi dat , takže formáty bezztrátové komprese se obvykle používají pro zvláště důležité dokumenty : PNG , JPEG 2000 , TIFF atd. Bezeztrátovou kompresi zajišťuje například utilita CJB2 z balíčku DjVuLibre .

Formát DjVu je založen na několika technologiích, včetně těch, které vyvinula AT&T Labs:

Textová reprezentace obrázků DjVu

Formát DjVu poskytuje textovou vrstvu , která obsahuje text ze stránky (slouží k vyhledávání a snadnému kopírování textu při práci s ní). V případě, že textová vrstva není k dispozici, jediným způsobem, jak získat text, je provést OCR v programech třetích stran.

Licenční informace

V březnu 2000 [1] AT&T prodal technologii společnosti LizardTech [4] , která se ji pokusila komerčně využít, ale kvůli otevřenosti formátu [5] je k dispozici svobodný software pro vytváření a prohlížení dokumentů DjVu pro různé platformy. K 1. červenci 2008 převedl LizardTech vedení DjVu na mateřskou společnost Celartem [6] a 10. června 2009 převedl Celartem práva na technologii DjVu na společnost Cuminas (dříve Caminova [7] ) [8] .

Existuje otevřená knihovna DjVuLibre publikovaná pod licencí GNU GPL a na ní programy-kodéry a prohlížeče.

Viz také

Poznámky

  1. 1 2 Viz soubor readme balíčku DjVuLibre -3.5.27.tar.gz
  2. Verze formátu souborů DjVu . DjVu Developers (červenec 2006). Datum přístupu: 16. ledna 2010. Archivováno z originálu 13. června 2010.
  3. 1 2 TriID - 2003.
  4. Historie a kredity DjVuLibre archivovány 9. září 2017 na Wayback Machine 
  5. Licence . Získáno 28. května 2009. Archivováno z originálu 2. května 2009.
  6. Tisková zpráva LizardTech (odkaz není k dispozici) . Získáno 4. října 2008. Archivováno z originálu 28. září 2008. 
  7. Přechod Caminova - Cuminas (downlink) . Získáno 25. října 2014. Archivováno z originálu 5. října 2014. 
  8. Tisková zpráva LizardTech (odkaz není k dispozici) . Získáno 17. července 2009. Archivováno z originálu dne 16. července 2009. 

Odkazy