Vysoce účinné pokročilé kódování zvuku
Aktuální verze stránky ještě nebyla zkontrolována zkušenými přispěvateli a může se výrazně lišit od
verze recenzované 29. dubna 2016; kontroly vyžadují
6 úprav .
Vysoce účinné pokročilé kódování zvuku |
---|
|
MIME typ |
audio/aacp , audio/ 3gpp a audio/3gpp2 |
Vývojář |
ISO |
Typ formátu |
Formát komprese zvuku |
Obsaženo v |
3GP , MP4 , .dvb |
Rozšířeno z |
Pokročilé kódování zvuku |
standard(y) |
ISO/IEC 14496-3 [1] |
HE-AAC ( High-Efficiency Advanced Audio Coding ) je ztrátový formát komprese zvuku definovaný jako profil MPEG-4 Audio (část 3) v ISO/IEC 14496-3 [1] . Formát je rozšířením profilu Low Complexity AAC (AAC LC) optimalizovaného pro aplikace s nízkou přenosovou rychlostí. Profil HE-AAC verze 1 (HE-AAC v1) využívá technologii vysokofrekvenční obnovy SBR ( Spectral Band Replication ) ke zlepšení účinnosti kódování ve frekvenční doméně. V profilu HE-AAC verze 2 (HE-AAC v2) je technologie SBR kombinována s technologií Parametric Stereo pro zvýšení účinnosti stereo kódování . Toto je standardizovaná a vylepšená verze zvukového kodeku AACplus
.
HE-AAC se používá ve standardech digitálního rozhlasového vysílání DAB+ a Digital Radio Mondiale .
Historie
- HE-AAC verze 1 byl standardizován jako MPEG-4 Audio profil v roce 2003 skupinou MPEG a publikován jako součást MPEG-4 v ISO/IEC 14496-3:2001/Amd 1:2003 [4]
- HE-AAC verze 2 byla standardizována v roce 2006 jako ISO/IEC 14496-3:2005/Amd 2:2006 [2] [5] .
- Technologie Stereo Panorama Parametric Coding (PS) použitá v HE-AAC v2 byla standardizována v roce 2004 skupinou MPEG a publikována v ISO/IEC 14496-3:2001/Amd 2:2004 [6] .
- HE-AAC verze 2 byla také standardizována pod názvem Enhanced aacPlus konsorciem 3GPP pro UMTS 3G multimediální služby v září 2004 (3GPP TS 26.401). Zvukový kodek Enhanced aacPlus je založen na kódovacích technologiích AAC LC, SBR a Parametric Stereo a je definován ve standardu MPEG-4 Audio.
- Předchůdci technologií HE-AAC byli technologie Coding Technologies, známé pod obchodním názvem CT-aacPlus. Kodek CT-aacPlus byl získán kombinací MPEG-2 AAC LC s technologií High Frequency Recovery (SBR) společnosti Coding Technologies. CT-aacPlus se používá v satelitním vysílání XM Radio . Následně společnost Coding Technologies navrhla SBR skupině MPEG jako základ pro HE-AAC.
- Později, ale ještě před standardizací HE-AAC v2 skupinou MPEG, Coding Technologies navrhla sloučit HE-AAC v1 s technologií 3GPP Stereo Parametric Coding nazvanou Enhanced AAC+. Výsledkem je, že aacPlus v2 a eAAC+ jsou nyní nejznámějšími ochrannými známkami technologie HE-AAC v2. AAC+ a aacPlus jsou ochranné známky technologie HE-AAC v1.
Funkce kódování
Technologie AAC, SBR a Parametric Stereo jsou hlavními součástmi profilu MPEG-4 HE-AAC v2.
- Kodek AAC se používá pro kódování nízkého a středního rozsahu.
- Základem technologie vysokofrekvenční obnovy (SBR) je identifikovaný přísný vztah mezi charakteristikami vysokofrekvenčního a nízkofrekvenčního rozsahu audio signálu. Velmi adekvátní obnovy vysokofrekvenčního rozsahu původního audio signálu lze tedy dosáhnout transpozicí (posunem) z nízkofrekvenční oblasti do vysokofrekvenční. Před kódováním je analyzován vysokofrekvenční rozsah (nad 7 kHz) v původním digitálním audio signálu a jsou extrahovány informace o některých jeho parametrech: například spektrální obálka vstupního signálu. Poté, po eliminaci přebytečných vysokofrekvenčních složek, je do kodéru přenesen malý datový tok o eliminovaných vysokých frekvencích nutných pro jejich obnovu a pouze zbývající nízké a střední frekvence jsou zakódovány [7] .
- Parametrické stereo kódování, tedy způsob, který zvyšuje efektivitu kódování stereo signálů při přenosu audio dat s nízkou bitovou rychlostí. Vstupní stereo signál je smíchán do mono signálu a jsou analyzovány parametry popisující stereo panorama. Stereo parametry vyžadují malý zlomek (2-3 kbps) celkového výstupního toku potřebného k přenosu mono signálu přijatelné kvality. Dva parametry používané k popisu stereo informace jsou panorama a prostředí. Parametr pan obsahuje informace o rozdílech mezi pravým a levým kanálem v různých frekvenčních pásmech. Podobně parametr prostředí popisuje stereo prostředí pro skupinu frekvenčních pásem. Oba parametry jsou zakódovány pomocí podobných principů entropického kódování v časově-frekvenční doméně, jaké jsou aplikovány na obálky SBR. Uplatňuje se také kvantování [7] .
Verze
Porovnání verzí kodeku HE-AAC:
Verze
|
Hlavní ochranná známka
|
Vlastnosti kodeku
|
Standard
|
HE-AACv1
|
aacPlus v1, eAAC, AAC+, CT-aacPlus
|
AACLC+SBR
|
ISO/IEC 14496-3:2001/Amd 1:2003
|
HE-AAC v2
|
aacPlus v2, eAAC+, AAC++, Enhanced AAC+
|
AAC LC+SBR+PS
|
ISO/IEC 14496-3:2005/Amd 2:2006
|
Viz také
Poznámky
- ↑ 12 ISO . _ ISO/IEC 14496-3:1999 - Informační technologie - Kódování audiovizuálních objektů - Část 3: Zvuk (odkaz není k dispozici) . ISO (1999). Získáno 16. března 2011. Archivováno z originálu 16. února 2012. (neurčitý)
- ↑ 1 2 ISO/IEC JTC1/SC29/WG11/N7016 (2005-01-11), Text ISO/IEC 14496-3:2001/FPDAM 4, Audio Lossless Coding (ALS), nové zvukové profily a rozšíření BSAC , < http://www.itscj.ipsj.or.jp/sc29/open/29view/29n6475t.doc > . Získáno 16. března 2011. Archivováno 3. května 2011 na Wayback Machine
- ↑ Fraunhofer IIS, MPEG-4 Audio and Video Technology , < http://www.itu.int/dms_pub/itu-r/oth/0A/07/R0A0700001F0001PDFE.pdf > . Získáno 16. března 2011. Archivováno 4. ledna 2012 na Wayback Machine
- ↑ ISO. Rozšíření šířky pásma, ISO/IEC 14496-3:2001/Amd 1:2003 (odkaz není k dispozici) . ISO (2003). Získáno 16. března 2011. Archivováno z originálu 16. února 2012. (neurčitý)
- ↑ ISO. Audio Lossless Coding (ALS), nové zvukové profily a rozšíření BSAC, ISO/IEC 14496-3:2005/Amd 2:2006 (odkaz není k dispozici) . ISO (2006). Získáno 16. března 2011. Archivováno z originálu 16. února 2012. (neurčitý)
- ↑ ISO. Parametrické kódování pro vysoce kvalitní zvuk, ISO/IEC 14496-3:2001/Amd 2:2004 (odkaz není k dispozici) . ISO (2004). Získáno 16. března 2011. Archivováno z originálu 16. února 2012. (neurčitý)
- ↑ 1 2 Technologie Spectral Band Replication (SBR) a její aplikace v Broadcastinu Archivováno 9. března 2011.
Odkazy
MPEG (Moving Picture Experts Group) |
---|
|
Sekce MPEG-1 |
|
---|
Sekce MPEG-2 |
|
---|
Sekce MPEG-4 |
|
---|
Sekce MPEG-7 |
- Část 2: Definice Description Language (DDL)
|
---|
Sekce MPEG-21 |
- Části 2, 3 a 9: Digitální objekt
- Část 5: Jazyk popisu práv (REL)
|
---|
Sekce MPEG-D |
- Část 1: Prostorový zvuk MPEG
|
---|