DjVu | |
---|---|
Rozšíření | .djvu[3] nebo [3].djv |
MIME typ |
image/vnd.djvu image/x-djvu |
Podpis | AT&TFORM |
Vývojář | AT&T Labs-Research, LizardTech (od března 2000 [1] ) |
zveřejněno | 1998 |
Poslední vydání | 27 (červenec 2006 [2] ) |
Typ formátu | Elektronický dokument |
otevřený formát ? | Ano |
webová stránka | djvu.org |
Mediální soubory na Wikimedia Commons |
DjVu (z francouzštiny déjà vu - „již viděno“) je technologie pro prezentaci a ukládání dokumentů (knih, časopisů, rukopisů a podobně, primárně naskenovaných), využívající ztrátovou kompresi obrazu .
Tuto technologii původně vyvinuli Jan LeCun , Leon Bothu a Patrick Heffner v AT&T Labs v letech 1996 až 2001.
Formát je optimalizován pro síťový přenos, takže stránku lze zobrazit před dokončením stahování souboru. Soubor DjVu může obsahovat textovou ( OCR ) vrstvu, která umožňuje fulltextové vyhledávání v souboru. Kromě toho může soubor DjVu obsahovat vestavěný interaktivní obsah a aktivní body – odkazy, které vám umožňují implementovat pohodlnou navigaci v knihách DjVu.
Pro kompresi barevných obrázků v DjVu se používá speciální technologie, která rozděluje původní obrázek do tří vrstev: popředí, pozadí a černobílá (jednobitová) maska. Maska se uloží s rozlišením původního souboru; obsahuje obrázek textu a další jasné detaily. Rozlišení pozadí, které zachovává ilustrace a texturu stránky, je ve výchozím nastavení sníženo, aby se ušetřilo místo. Popředí obsahuje barevné informace o masce; jeho rozlišení je obvykle ještě sníženo. Poté jsou pozadí a popředí komprimovány pomocí vlnkové transformace a maska je komprimována pomocí algoritmu JB2 .
Funkce algoritmu JB2 spočívá v tom, že hledá na stránce opakované znaky a jejich obrázek uloží pouze jednou. Ve vícestránkových dokumentech sdílí každých několik po sobě jdoucích stránek společný „slovník“ obrázků.
Pro komprimaci většiny knih si vystačíte s pouhými dvěma barvami. V tomto případě je použita pouze jedna vrstva, což umožňuje dosáhnout kompresního poměru záznamu. V typické knize s černobílými ilustracemi naskenované v rozlišení 600 dpi je průměrná velikost stránky asi 15 kB , tedy asi 100krát menší než původní soubor. V přítomnosti složitého pozadí je nárůst objemu obvykle 4-10krát. Při standardním nastavení však DjVu používá ztrátovou kompresi dat , takže formáty bezztrátové komprese se obvykle používají pro zvláště důležité dokumenty : PNG , JPEG 2000 , TIFF atd. Bezeztrátovou kompresi zajišťuje například utilita CJB2 z balíčku DjVuLibre .
Formát DjVu je založen na několika technologiích, včetně těch, které vyvinula AT&T Labs:
Formát DjVu poskytuje textovou vrstvu , která obsahuje text ze stránky (slouží k vyhledávání a snadnému kopírování textu při práci s ní). V případě, že textová vrstva není k dispozici, jediným způsobem, jak získat text, je provést OCR v programech třetích stran.
V březnu 2000 [1] AT&T prodal technologii společnosti LizardTech [4] , která se ji pokusila komerčně využít, ale kvůli otevřenosti formátu [5] je k dispozici svobodný software pro vytváření a prohlížení dokumentů DjVu pro různé platformy. K 1. červenci 2008 převedl LizardTech vedení DjVu na mateřskou společnost Celartem [6] a 10. června 2009 převedl Celartem práva na technologii DjVu na společnost Cuminas (dříve Caminova [7] ) [8] .
Existuje otevřená knihovna DjVuLibre publikovaná pod licencí GNU GPL a na ní programy-kodéry a prohlížeče.
kontejnery na média | |
---|---|
Video/Audio | |
Zvuk | |
Hudba |
|
Rastrové | |
Vektor | |
Komplex |
zařízení a dokumenty ) | E-knihy (|
---|---|
Řada zařízení | |
Formáty souborů | |
Katalogizátory | |
Knihovny | |
viz také |