MPEG-1 Audio Layer II

MPEG-1/MPEG-2 Audio Layer 2
Rozšíření .mp2
MIME typ audio/mpeg, video/mpeg
Vývojář ISO , IEC
Typ formátu audio, video, kontejner
Rozšířeno z MUSICAM
Vyvinutý v MPEG-2
standard(y) ISO/IEC 11172-3 [1] ,
ISO/IEC 13818-3 [2]

MPEG-1 Audio Layer II (zkr. MP2 , někdy nazývaný Musicam ) je jedním ze tří ztrátových formátů komprese zvuku (úroveň 2) definovaných ve standardu MPEG-1 [3] . Používá se v digitálním vysílání DAB a starším standardu Video CD , který se používal k distribuci filmů na optických CD v 90. letech a předcházel širokému používání DVD .

Kodér MPEG-1 Audio Layer 2 se vyvinul ze  zvukového kodeku MUSICAM (Universal Subband  Integrated Coding And Multiplexing přizpůsobený maskovacím vzorům), který vyvinuly CCETT , Philips a IRT v roce 1989 jako součást evropských studií EUREKA 147. Mezivládní vývoj pro systémy digitálního vysílání pro pevné, přenosné a mobilní přijímače (založena v roce 1987). Hlavní parametry MPEG-1 Audio byly zděděny z MUSICAM, včetně banky filtrů, zpracování časové domény, velikosti audio rámce atd. Po dalším vylepšení však nebyl algoritmus MUSICAM ve finální verzi MPEG-1 Layer použit. II standard [4] .

Základní parametry

Kódování a dekódování zvuku MPEG-1 Layer II

Metoda kódování

Vstupní digitální audio signál je rozdělen do rámců (rámců), z nichž každý je zakódován a dekódován nezávisle na ostatních rámcích. Velikost rámce pro vrstvu II je 1152 vzorků.

Pásmo audio signálu je pomocí digitálních pásmových filtrů rozděleno do 32 dílčích pásem. Všechna dílčí pásma mají stejnou šířku, která závisí na vzorkovací frekvenci vstupního signálu. Po rozdělení se vzorkovací frekvence sníží faktorem 32, takže počet vzorků na snímek v každém dílčím pásmu je 36.

Poté jsou data kvantována. Předběžně jsou určeny faktory měřítka, které závisí na maximální hodnotě signálu. V tomto případě je faktor měřítka určen pro skupiny 12 odečtů v každém podrozsahu a faktor může být společný pro dvě nebo tři skupiny. Pro každé dílčí pásmo v rámci jsou tedy určeny až tři měřítkové faktory. Před kvantizací se hodnoty signálu vydělí příslušnými měřítkovými faktory.

Poté se v kvantovacím a kódovacím bloku provede kvantizace dat. Komprese zvukové informace na úrovni vrstvy II je založena na metodě zvané adaptivní přidělování bitů. Tento způsob spočívá v provádění kvantování s různým počtem kvantizačních bitů pro různá frekvenční dílčí pásma. V tomto případě se používá jednotné kvantování. Celkový počet bitů přidělených všem dílčím pásmům v daném rámci závisí na vzorkovací frekvenci vstupního signálu a na dané výstupní bitové rychlosti, tedy na požadovaném stupni komprese zvukové informace. Rozdělení bitů do dílčích pásem se provádí blokem psychoakustického modelu .

Po kvantizaci jsou přijatá data zakódována. Kvantované vzorky signálu v každém dílčím pásmu jsou kombinovány třemi a výsledné bitové sekvence jsou kódovány pomocí tabulek kódu s proměnnou délkou. Kromě toho jsou data o rozložení bitů v dílčích pásmech a data o faktorech měřítka kódována pomocí odpovídajících tabulek.

Pro provedení distribuce bitů v bloku psychoakustického modelu je analyzováno spektrum původního audio signálu (nerozloženého na subpásma). K tomu se provádí rychlá Fourierova transformace úseků tohoto signálu pro 1024 impulzů, po kterých se vypočítá výkonové spektrum zvukového signálu a velikost akustického tlaku v každém frekvenčním dílčím pásmu.

Poté se analyzují tónové (sinusové) a netónové složky audio signálu, určí se místní a globální prahové hodnoty maskování a vypočítá se poměr signál/maska ​​pro všechna dílčí pásma, na základě kterých jsou bity přiděleny dílčím pásmům.

V těch dílčích pásmech, ve kterých je zkreslení zvuku způsobené kvantováním pro posluchače méně patrné nebo je maskováno vyšší úrovní signálu v jiných dílčích pásmech, je kvantování hrubší, to znamená, že pro tato dílčí pásma je přiděleno méně bitů. U plně maskovaných dílčích pásem se nepřidělují vůbec žádné bity. Díky tomu je možné výrazně snížit množství přenášených informací při zachování dostatečně vysoké kvality zvuku.

Dekódování

Data obsažená v rámci jsou dekódována v souladu s jejich pořadím a kódovými tabulkami obsaženými v pracovním programu dekodéru. Dekódovaná data distribuce bitů a měřítka se používají k dekódování a dekvantizaci audio dat. Po dekvantizaci jsou vzorky subpásmových signálů vynásobeny odpovídajícími měřítkovými faktory.

Po dekódování a dekvantizaci jsou vzorky signálu všech dílčích pásem sloučeny do výstupního digitálního audio signálu.

Poznámky

  1. ISO/IEC 11172-3:1993 – Informační technologie – Kódování pohyblivých obrázků a souvisejícího zvuku pro digitální paměťová média rychlostí až asi 1,5 Mbit/s – Část 3: Zvuk (sestupné spojení) . ISO (1993). Získáno 15. března 2011. Archivováno z originálu dne 23. března 2012. 
  2. ISO/IEC 13818-3:1995 - Informační technologie - Obecné kódování pohyblivých obrázků a souvisejících zvukových informací - Část 3: Zvuk (sestupná linka) . ISO (1995). Získáno 15. března 2011. Archivováno z originálu dne 23. března 2012. 
  3. ISO/IEC 11172-3:1993 Informační technologie – Kódování pohyblivých obrázků a souvisejícího zvuku pro digitální paměťová média rychlostí až asi 1,5 Mbit/s – Část 3: Zvuk . Získáno 14. března 2011. Archivováno z originálu 23. března 2012.
  4. Fakta o kompresi MPEG Archivováno 8. května 2001.
  5. MPEG-2 Audio Layer I/II . Získáno 14. března 2011. Archivováno z originálu 30. dubna 2010.
  6. Záhlaví MPEG Audio Frame Archivováno 8. února 2015.

Literatura

Odkazy

Digitální audio komprese: psychoakustické základy a algoritmy. Jurij Kovalgin

Viz také