CELP

Aktuální verze stránky ještě nebyla zkontrolována zkušenými přispěvateli a může se výrazně lišit od verze recenzované 8. června 2019; kontroly vyžadují 4 úpravy .

Kódování Code Excited Linear Prediction ( CELP ) je algoritmus kódování řeči původně navržený Manfredem Schroederem a B. S. Atalem v roce 1985. Algoritmus v té době poskytoval výrazně lepší kvalitu než stávající algoritmy s nízkou bitovou rychlostí , jako jsou zvukové kodeky RELP a LPC (např . FS-1015 ). Spolu s variantami jako ACELP , RCELP , LD-CELP a VSELP je dnes nejrozšířenějším algoritmem kódování řeči. CELP se v současnosti používá spíše jako obecný termín pro třídu algoritmů než jako specifický kodek .

Úvod

Algoritmus CELP je založen na čtyřech hlavních myšlenkách:

Použití modelu zdrojového filtru pro reprodukci řeči na základě lineární predikce (LP);
Použití adaptivních a pevných kódových tabulek jako základu pro lineární predikční model;
Vyhledávání v uzavřené smyčce v "percepčně vážené doméně".
Aplikace vektorové kvantizace (VQ)

Původní algoritmus Schroedera a Atala z roku 1983, když byl spuštěn na superpočítači Cray I, vyžadoval 150 sekund na zakódování 1sekundového signálu řeči. S příchodem efektivnějších způsobů implementace kódových tabulek a zlepšením výpočetních schopností se algoritmus stal možným ve vestavěných zařízeních, jako jsou mobilní telefony.

CELP dekodér

Než prozkoumáme složitý proces kódování CELP, podívejme se, jak funguje dekodér. Obrázek popisuje univerzální dekodér CELP. Buzení se provádí sčítáním příspěvků z adaptivní (jinak hodinové ) kódové tabulky a pevné (jinak stochastické) kódové tabulky:

e[n]=e_{a}[n]+e_{f}[n]

kde je adaptivní (hodinový) příspěvek kódové knihy a je fixní (stochastický) příspěvek kódové knihy. Pevný kódový seznam je vektorový kvantizační slovník, který je (implicitně nebo explicitně) pevně zakódován do kodeku. Tento číselník může být algebraický ACELP nebo explicitně uložený (např . Speex ). Záznamy v adaptivním kódovém seznamu se skládají ze zpožděných verzí buzení. To umožňuje efektivně kódovat periodické signály, jako je lidská řeč. $e_{a}[n]$ $e_{f}[n]$

Filtr, který generuje buzení, má ve tvaru všechny póly modelu Tento filtr je použitelný nejen proto, že využívá všechny póly, ale také proto, že se snadno počítá a dobře znázorňuje lidský hlas. $1/A(z)$ $A(z)$

CELP kodér

Základní princip CELP se nazývá (Absolute) "Analysis by Synthesis", což znamená, že kódování (analýza) se provádí percepčně, optimalizuje dekódovaný signál v uzavřené smyčce. Teoreticky by nejlepší tok CELP byl vytvořen kombinací všech možných binárních znakových sad a výběrem té, která produkuje nejlépe znějící dekódovaný signál. To samozřejmě není možné ze dvou důvodů: složitost implementace přesahuje jakýkoli aktuálně dostupný hardware a kritérium výběru „nejlépe znějící“ implikuje lidskou bytost jako posluchače.

Aby bylo možné implementovat kódování v reálném čase pomocí omezených výpočetních zdrojů, je vyhledávání CELP rozděleno na menší, lépe ovladatelná, sekvenční vyhledávání pomocí jednoduché funkce percepčního vážení. Obvykle se kódování provádí v následujícím pořadí:

Linear Prediction Coefficients (LPC) se počítají a kvantují, obvykle jako LSP
Adaptivní (hodinová) kódová tabulka je prohledána a její příspěvek/příspěvek/ je odstraněn
Vyhledávání podle tabulky pevných (stochastických) kódů

Zkreslení šumem

Většina (pokud ne všechny) moderních audio kodeků se pokouší tvarovat zkreslení v kódování tak, aby se objevovalo hlavně v těch frekvenčních oblastech, kde je lidské ucho nezachytí. Například ucho lépe snáší zkreslení v částech zvukového rozsahu, které jsou hlasitější a naopak. Proto CELP místo minimalizace kvadratické chyby minimalizuje chyby ve vážené oblasti. Výsledek vážení na křivce W(z) je obvykle odvozen z filtru LKP prostřednictvím rozšíření šířky pásma :

W(z) = \frac{A(z/\gamma_1)}{A(z/\gamma_2)}

kde . $\gamma_1 > \gamma_2$

Odkazy

Kompresní metody

Teorie

Informace	Vlastní Vzájemné Entropie Podmíněná entropie Složitost Nadbytek
Jednotky	Bit Nat Okusovat Hartley Hartleyho vzorec

Bezztrátový

Entropická komprese	Asymetrické číselné soustavy Huffmanův algoritmus Adaptivní Huffmanův algoritmus Shannon-Fano algoritmus Shannonův algoritmus Aritmetické kódování ( interval ) Golombovy kódy Delta Univerzální kód Eliáš fibonacci
Slovníkové metody	RLE Vyfouknout LZ ( LZ77/LZ78 LZSS LZW LZWL LZO LZMA LZX LZRW LZJB LZT LZ4 Brotli zstandard )
jiný	RLE CTW BWT MTF PPM DMC

Zvuk

Teorie	Konvoluce PCM Aliasing Vzorkování Kotelnikovova věta
Metody	LPC LAR LSP WLPC CELP ACELP Zákon μ-zákon ADPCM MDCT Fourierova transformace Psychoakustický model
jiný	Audio kompresor Komprese řeči Pásmové kódování

snímky

Podmínky	barevný prostor Pixel Saturační podvzorkování Kompresní artefakty
Metody	RLE DPCM fraktál vlnka EZW SPIHT LP Přípravka PCL
jiný	Bitová rychlost Standardní testovací obrázek PSNR Kvantování

Video

Podmínky	Vlastnosti videa Rám Typy rámů Kvalita videa
Metody	Kompenzace pohybu Přípravka Kvantování vlnka
jiný	Video kodek Teorie zkreslení sazby CBR ABR VBR