MPEG-1 Audio Layer I

MPEG-1 Audio Layer 1
Rozšíření .mp1nebo.m1a
MIME typ audio/mpeg [1] , audio/MPA [2]
Vývojář ISO , IEC
Typ formátu Zvuk
standard(y) ISO/IEC 11172-3 [3] ,
ISO/IEC 13818-3 [4]
webová stránka mpeg.chiariglione.org

MPEG-1 Audio Layer I (zkr. MP1 ) je jedním ze tří ztrátových formátů komprese zvuku (úroveň 1) definovaných ve standardu MPEG-1 [5] . Zatímco MPEG-1 Audio Layer I je podporován většinou moderních přehrávačů médií , formát je považován za zastaralý. Místo toho se používají hlavně formáty MP2 a MP3 .

Soubory, které obsahují pouze zvukové informace MP1, používají příponu .mp1 nebo někdy .m1a.

Technologie komprese MP1 využívá relativně jednoduché schéma pásmového kódování s 32 dílčími pásmy.

Vrstva I (Layer 1) se doporučuje pro profesionální použití ve vysoce studiových systémech nahrávání/přehrávání s dostatečnou kapacitou paměti. Vyznačuje se nízkou složitostí a nízkým stupněm redukce zvukových dat.

Vrstva MPEG-1 I byla také použita v digitální kompaktní kazetě jako součást zvukového kodeku PASC ( Precision Adaptive Sub-band Coding  ) .  Vzhledem k nutnosti přenášet konstantní proud jednotlivých datových bloků (rámců) na pásku, PASC použil extra bit v MPEG hlavičce k určení začátku rámce. Přenosová rychlost je vždy 384 kbps [6] .

Základní parametry

Kódování a dekódování zvuku MPEG-1 Layer I

Metoda kódování

Vstupní digitální audio signál je rozdělen do rámců (rámců), z nichž každý je zakódován a dekódován nezávisle na ostatních rámcích. Velikost rámce pro vrstvu I je 384 vzorků.

Pásmo audio signálu je pomocí digitálních pásmových filtrů rozděleno do 32 dílčích pásem. Všechna dílčí pásma mají stejnou šířku, která závisí na vzorkovací frekvenci vstupního signálu. Po rozdělení se vzorkovací frekvence sníží faktorem 32, takže počet vzorků na snímek v každém dílčím pásmu je 12.

Poté jsou data kvantována. Předběžně jsou určeny faktory měřítka, které závisí na maximální hodnotě signálu. V tomto případě je měřítkový faktor určen pro každé dílčí pásmo v rámci, tj. pro 12 vzorků signálu dílčího pásma. Před kvantizací se hodnoty signálu vydělí příslušnými měřítkovými faktory.

Poté se v kvantovacím a kódovacím bloku provede kvantizace dat. Komprese zvukové informace na úrovni vrstvy I je založena na metodě zvané adaptivní přidělování bitů. Tento způsob spočívá v provádění kvantování s různým počtem kvantizačních bitů pro různá frekvenční dílčí pásma. V tomto případě se používá jednotné kvantování. Celkový počet bitů přidělených všem dílčím pásmům v daném rámci závisí na vzorkovací frekvenci vstupního signálu a na dané výstupní bitové rychlosti, tedy na požadovaném stupni komprese zvukové informace. Rozdělení bitů do dílčích pásem se provádí blokem psychoakustického modelu .

Pro provedení bitové distribuce v bloku psychoakustického modelu je analyzováno spektrum původního audio signálu (nerozloženého na subpásma). K tomu je provedena rychlá Fourierova transformace úseků tohoto signálu v 512 vzorcích, načež se vypočítá výkonové spektrum zvukového signálu a velikost akustického tlaku v každém frekvenčním dílčím pásmu.

Poté se analyzují tónové (sinusové) a netónové složky audio signálu, určí se místní a globální prahové hodnoty maskování a vypočítá se poměr signál/maska ​​pro všechna dílčí pásma, na základě kterých jsou bity přiděleny dílčím pásmům.

V těch dílčích pásmech, ve kterých je zkreslení zvuku způsobené kvantováním pro posluchače méně patrné nebo je maskováno vyšší úrovní signálu v jiných dílčích pásmech, je kvantování hrubší, to znamená, že pro tato dílčí pásma je přiděleno méně bitů. U plně maskovaných dílčích pásem se nepřidělují vůbec žádné bity. Díky tomu je možné výrazně snížit množství přenášených informací při zachování dostatečně vysoké kvality zvuku.

Dekódování

Data obsažená v rámci jsou dekódována v souladu s jejich pořadím a kódovými tabulkami obsaženými v pracovním programu dekodéru. Dekódovaná data distribuce bitů a měřítka se používají k dekódování a dekvantizaci audio dat. Po dekvantizaci jsou vzorky subpásmových signálů vynásobeny odpovídajícími měřítkovými faktory.

Po dekódování a dekvantizaci jsou vzorky signálu všech dílčích pásem sloučeny do výstupního digitálního audio signálu.

Literatura

Odkazy

Digitální audio komprese: psychoakustické základy a algoritmy. Jurij Kovalgin

Viz také

Poznámky

  1. Audio/mpeg Media Type - RFC 3003 (downlink) . IETF (listopad 2000). Získáno 15. března 2011. Archivováno z originálu dne 23. března 2012. 
  2. Registrace typu MIME RTP Payload Formats - RFC 3555 (odkaz není k dispozici) . IETF (červenec 2003). Získáno 15. března 2011. Archivováno z originálu dne 23. března 2012. 
  3. ISO/IEC 11172-3:1993 – Informační technologie – Kódování pohyblivých obrázků a souvisejícího zvuku pro digitální paměťová média rychlostí až asi 1,5 Mbit/s – Část 3: Zvuk (sestupné spojení) . ISO (1993). Získáno 15. března 2011. Archivováno z originálu dne 23. března 2012. 
  4. 1 2 ISO/IEC 13818-3:1995 - Informační technologie - Obecné kódování pohyblivých obrázků a souvisejících zvukových informací - Část 3: Zvuk (sestupná linka) . ISO (1995). Získáno 15. března 2011. Archivováno z originálu dne 23. března 2012. 
  5. ISO/IEC 11172-3 "Kódování pohyblivých obrázků a souvisejícího zvuku pro digitální paměťová média rychlostí až asi 1,5 mbit/s. Část 3 Audio»
  6. Digitální kompaktní kazeta. Často kladené otázky
  7. Záhlaví MPEG Audio Frame Archivováno 8. února 2015.
  8. ISO/IEC 13818-3 (Druhé vydání 1998-04-15) . Získáno 15. března 2011. Archivováno z originálu 8. srpna 2011.