Digitální zvuk
Aktuální verze stránky ještě nebyla zkontrolována zkušenými přispěvateli a může se výrazně lišit od
verze recenzované 8. prosince 2021; ověření vyžaduje
1 úpravu .
Digitální zvuk je výsledkem převodu analogového zvukového signálu do digitálního zvukového formátu .
Nejjednodušší metoda převodu, pulzní kódová modulace (PCM), sestává z prezentace sekvence okamžitých úrovní signálu měřených analogově-digitálním převodníkem ( ADC ) v pravidelných intervalech.
Variantou PCM je delta modulace , kde v každém okamžiku vzorku je signál porovnáván s pilovitým napětím v každém kroku vzorkování .
Sigma-delta modulace '- metoda reprezentace signálu založená na principu převzorkování a kvantizace generování šumu, umožňuje snížit hladinu šumu .
Moderní metody používají složitější transformační algoritmy . Kromě znázornění zvukových vibrací v digitální podobě se využívá i vytváření speciálních příkazů pro automatické přehrávání na různých elektronických hudebních nástrojích. Nejjasnějším příkladem takové technologie je MIDI .
Výhody bitového kódu se využívají při přenosu kódovaného signálu na dálku, šifrování signálu, digitálním podpisu signálu, obnově ztrát způsobených rušením přenosu a také v dalších aplikacích.
Digitální záznam zvuku je technologie pro převod analogového zvuku na digitální zvuk za účelem jeho uložení na fyzické médium, aby bylo možné zaznamenaný signál později reprodukovat.
Prezentace zvukových dat v digitální podobě umožňuje velmi efektivně měnit zdrojový materiál pomocí speciálních zařízení nebo počítačových programů - zvukových editorů , což je hojně využíváno v průmyslu, mediálním průmyslu i běžném životě.
K reprodukci digitálního zvuku se používá speciální zařízení, jako jsou hudební centra , digitální přehrávače , počítače se zvukovou kartou a nainstalovaným softwarem: audio přehrávač nebo přehrávač médií .
Historie
- V roce 1928 Harry Nyquist ve své práci „Certain Problems in the Theory of Telegraph Transmission“ určil požadovanou šířku pásma komunikační linky pro přenos pulzního signálu – základ digitálního zvuku [1]
- V. A. Kotelnikov v roce 1933 ve své práci „O propustnosti éteru a drátu v telekomunikacích“ navrhl a dokázal Kotelnikovův teorém , podle kterého lze analogový signál s omezeným spektrem jedinečně a bez ztráty obnovit z jeho diskrétních vzorků odebraných pomocí frekvence přísně vyšší než dvojnásobek maximální frekvence spektra [2]
- V roce 1937 si britský vědec Alec Reeves patentoval první popis pulzní kódové modulace [3]
- V roce 1948 Claude Shannon publikoval "Matematickou teorii komunikace" [4] , a v roce 1949 - "Přenos dat za přítomnosti šumu", kde nezávisle na Kotelnikovovi dokázal větu s podobnými výsledky jako Kotelnikovova věta , proto v r. Západní literatura, tato věta se často nazývá Shannonova věta. [5]
- V roce 1950 Richard Hamming publikoval článek o detekci a opravě chyb [6]
- V roce 1952 vytvořil David Huffman algoritmus kódování předpony minimální redundance (známý jako Huffmanův algoritmus nebo kód ) [6]
- V roce 1959 vytvořil Alex Hockwingham kód opravy chyb nyní známý jako Bowes-Chowdhury-Hockwingham kód [6]
- V roce 1960 Irwin Reid a Gustav Solomon, zaměstnanci Lincolnovy laboratoře na Massachusetts Institute of Technology, vynalezli Reed-Solomonův kód [6].
- V roce 1967 představil NHK technický výzkumný ústav první digitální kotoučový stereorekordér na 1palcové videokazetě. Zařízení využívalo PCM záznam s bitovou hloubkou 12 bitů a vzorkovací frekvencí 30 kHz pomocí kompandéru pro rozšíření dynamického rozsahu [6]
- V roce 1969 představila společnost Sony 13bitový digitální stereo rekordér se vzorkovací frekvencí 47,25 kHz, zaznamenaný na 2palcovou videokazetu [6]
- V roce 1972 bylo vydáno první album nahrané z digitální master pásky Nippon Columbia [7]
- V roce 1977 na Tokyo Audio Exhibition předvedly Mitsubishi , Sony a Hitachi prototypy digitálních gramofonových desek nebo zvukových disků [6]
- V roce 1979 v Evropě Philips předvádí prototyp CD o průměru 115 mm, aby se z něj stal světový standard. 14bitový záznam při 44,050 kHz nevyhovoval Sony, která nabízela 16bitový záznam při 50 kHz, ale nakonec bylo z důvodu omezení formátu rozhodnuto zvolit vzorkovací frekvenci 44,1 kHz a zvětšit velikost disku na 120 mm. Disk je schopen pojmout 74 minut záznamu.
- V roce 1980 byl oficiálně navržen standard kompaktních disků , ale trvalo dva roky, než byla všechna schválení a vylepšení [6]
- V roce 1982 byl standard CD systému přijat v Evropě a Japonsku [6]
- Také v roce 1982 byl představen formát digitálního zvukového záznamu pro kotoučovou pásku DASH , navržený společností Sony pro vícekanálové studiové nahrávání.
- V roce 1987 představily společnosti Sony a Philips formát digitální kompaktní kazety DAT .
- V roce 1992 představily společnosti Philips a Matsushita formát digitální kompaktní kazety využívající kompresi MPEG1 vrstvy 1.
- Také v roce 1992 představila společnost Sony osobní zvukový systém MiniDisc a systém kina SDDS založený na algoritmu komprese ATRAC .
- V roce 1999 vyvinuly společnosti Sony a Philips standard SACD .
- Formát DVD-Audio představený v roce 2000
Princip digitálního záznamu zvuku metodou periodického vzorkování a kvantování signálu
Princip digitální reprezentace vibrací zvukového záznamu je poměrně jednoduchý:
Princip činnosti ADC je také poměrně jednoduchý: analogový signál přijímaný z mikrofonů a elektrických hudebních nástrojů je převeden na digitální. Tato transformace zahrnuje následující operace:
- Omezení pásma se provádí pomocí dolní propusti k potlačení spektrálních složek, jejichž frekvence přesahuje polovinu vzorkovací frekvence.
- Diskretizace v čase, to znamená nahrazení spojitého analogového signálu sekvencí jeho hodnot v diskrétních bodech v čase - vzorky. Tento problém je vyřešen použitím speciálního obvodu na vstupu ADC - zařízení pro vzorkování a podržení .
- Kvantování úrovní je nahrazení hodnoty vzorku signálu nejbližší hodnotou ze sady pevných hodnot - úrovní kvantování.
- Kódování nebo digitalizace, v důsledku čehož je hodnota každého kvantovaného vzorku reprezentována jako číslo odpovídající pořadovému číslu úrovně kvantizace.
To se provádí následovně: spojitý analogový signál je „rozřezán“ na sekce se vzorkovací frekvencí, získá se digitální diskrétní signál, který projde kvantizačním procesem s určitou bitovou hloubkou a poté je zakódován, tj. posloupností kódových symbolů. Pro kvalitní záznam zvuku ve frekvenčním pásmu 20-20 000 Hz se používá minimální standardní vzorkovací frekvence 44,1 kHz a vyšší (v současnosti se objevily ADC a DAC se vzorkovací frekvencí 192,3 a dokonce 384,6 kHz). Pro získání vcelku kvalitního záznamu stačí bitová hloubka 16 bitů, pro rozšíření dynamického rozsahu a zlepšení kvality záznamu zvuku se však používá bitová hloubka 24 (výjimečně 32) bitů.
Korekce šumu a kódování kanálů
Kódování korekce šumu umožňuje během přehrávání signálu identifikovat a eliminovat (nebo snížit frekvenci jejich výskytu) chyby čtení z média. K tomu se během procesu záznamu ke vzorkům získaným na výstupu ADC přidává umělá redundance (kontrolní bity), která následně pomáhá obnovit poškozený vzorek. Zařízení pro záznam zvuku obvykle používají kombinaci dvou nebo tří kódů pro opravu chyb. Pokud zvolená úroveň redundance kódování neumožňuje obnovit správnou hodnotu reference, je nahrazena interpolací , aby se vyloučil výskyt náhlé změny úrovně signálu (kliknutí).
Prokládání se také používá k lepší ochraně před shlukovými chybami způsobenými poškozením média (poškrábání CD, přehyby magnetické pásky) .
K užitečnému signálu jsou také přidána pomocná data pro usnadnění následného dekódování. Mohou to být signály časového kódu , servisní signály, synchronizační signály.
Kódování kanálu se používá k přizpůsobení digitálních signálů parametrům přenosového kanálu (nahrávání / přehrávání). Například při záznamu digitálních signálů na magnetické médium je nutné vyloučit výskyt konstantní složky a nízkofrekvenčních složek spektra v záznamovém proudu (vznikající při výskytu dlouhých sekvencí nul nebo jedniček). K tomu slouží převodní tabulky, podle kterých se slova z m datových bitů nahrazují slovy z n kanálových bitů a vždy n > m. V zařízeních pro přehrávání digitálních signálů kanálový dekodér extrahuje hodinové signály z obecného datového toku a inverzně převádí n-bitová kanálová slova na m-bitová datová slova. Po opravě chyby jde signál do DAC.
Princip činnosti DAC
Digitální signál přijatý z dekodéru je převeden na analogový. Tato transformace probíhá následovně:
- Dekodér DAC převádí posloupnost čísel na diskrétní kvantovaný signál
- Vyhlazováním v časové oblasti se z diskrétních vzorků generuje časově spojitý signál
- Konečná obnova signálu se provádí potlačením bočních spekter v analogovém dolnopropustném filtru.
Metody digitálního záznamu zvuku
Podle principu záznamu se rozlišují následující metody:
- Magnetický záznam zvuku - digitální signály jsou zaznamenávány na magnetickou pásku. Existují dva typy záznamů:
- systém záznamu po řádcích - ve kterém se páska pohybuje po bloku pevných magnetických záznamových / přehrávacích hlav ( DASH , DCC )
- systém šikmého záznamu čáry - ve kterém se páska pohybuje po bubnu rotujících magnetických hlav a záznam je prováděn šikmo samostatnými stopami, což poskytuje větší hustotu než systém záznamu podélné čáry. ( R-DAT , ADAT a dřívější systémy sestávající z PCM set-top boxu a videorekordéru)
- Magnetooptický záznam - záznam se provádí pomocí magnetické hlavy na speciální magnetooptické vrstvě a v okamžiku magnetizace se krátce zahřeje laserem na teplotu Curieho bodu. ( Minidisc , Hi-MD )
- Laserový záznam - záznam je prováděn laserovým paprskem, který vypaluje prohlubně (prohlubně) na světlocitlivou vrstvu optického média . ( CD , DVD-Audio , DTS , SACD )
- Optický (fotografický) záznam zvuku je založen na působení světelného toku na světlocitlivou vrstvu nosiče (filmového pásu). ( Dolby Digital , SDDS )
- Záznam zvuku na elektronická média - zvuková data jsou zaznamenávána pomocí osobního počítače jako soubory na různá média ( pevné disky , přepisovatelné optické disky , flash karty , SSD ) , přičemž není omezeno povinné přizpůsobení zvukového formátu mediální formát.
Na digitálních médiích a v osobních počítačích se pro ukládání zvuku (hudba, hlas atd.) používají různé formáty , které umožňují zvolit přijatelný poměr komprese , kvality zvuku a objemu dat.
Oblíbené formáty souborů pro osobní počítače a související zařízení:
Zvuky lze nahrávat pomocí mikrofonu, který převádí zvukové vibrace ve vzduchu na elektrický signál. Tento signál lze následně kvantifikovat, ale digitalizace musí zahrnovat kvantifikační velikost (objem) a čas.
Trochu více o různých formátech zvukových souborů:
- WAV (vyslovováno jako anglické slovo "wave") je formát, který pokaždé ukládá digitalizovanou hodnotu. Z toho vyplývá mnoho údajů pro střednědobé záznamy. Jiné formáty zase využívají některé metody komprese dat. Formát WAV je velmi oblíbený a široce používaný v profesionálních aplikacích, které zpracovávají digitalizované audio signály. Mezi výhody - dobrá kvalita zvuku; podporováno v prohlížečích bez pluginu. Mezi nevýhody formátu však patří skutečnost, že zvuková data jsou obvykle uložena v nezpracovaném, nekomprimovaném formátu, takže soubory jsou obvykle velké.
- MP3 je další populární formát digitalizace zvuku, který odstraňuje části zvukového signálu, které lidské ucho snadno neslyší. Výsledný zvuk stále zní téměř přesně jako originál, ale s výrazně méně bity. Díky tomu je tento formát oblíbený zejména na internetu, protože mnoho uživatelů chce hudbu ve vysoké kvalitě, ale s relativně krátkou dobou stahování. Mezi nedostatky formátu uživatelé poznamenávají možnost, že k přehrávání zvukového souboru může být vyžadován samostatný přehrávač nebo zásuvný modul prohlížeče.
- Formát AAC (Advanced Audio Coding) je velmi podobný výše zmíněnému podporovanému MP3, byl však navržen jako nástupce a nabízí lepší kvalitu a menší velikosti souborů. Mezi nevýhody patří, že soubory mohou být chráněny proti kopírování, takže uživatel je omezen na schválená zařízení. Formát se používá pro hudbu iTunes.
- Ogg Vorbis je souborový formát navržený pro efektivní distribuci zvukových souborů přes připojení se střední šířkou pásma. Kódování Vorbis lze použít při vyšších přenosových rychlostech pro větší přesnost. Výhody jsou, že program je zdarma, otevřený standard; podporovány některými prohlížeči (Firefox 3.5, Chrome 4 a Opera 10.5). Popularita tohoto formátu přicházela postupně.
- FLAC (Free Lossless Audio Compression) je formát souboru, který ukládá hudbu nebo zvuk v bezztrátové kvalitě. Pokud je soubor komprimován, komprese nijak neovlivňuje kvalitu hudby, protože data a zpracování probíhá jinak než v jiných formátech (např. MP3).
- WMA (Windows Media Audio) je licencovaný formát souborů vyvinutý společností Microsoft pro ukládání a vysílání zvukových materiálů. WMA byl původně ohlášen jako alternativa k MP3, ale nyní je nástupcem MP3 AAC (používá jej populární obchod iTunes, jak již bylo zmíněno výše). Výhody WMA - velmi dobrá kvalita zvuku; široce používané na internetu. Nevýhody - soubory lze chránit před kopírováním; Některá zařízení vyžadují stažení přehrávače samostatně.
Je třeba poznamenat, že pro přehrávání digitálního zvukového souboru musíte použít nějaký další software, jako jsou audio přehrávače, audio pluginy a audio software.
Parametry ovlivňující kvalitu digitálního zvuku
Hlavní parametry, které ovlivňují kvalitu digitálního zvukového záznamu, jsou:
Důležité jsou také parametry analogové cesty zařízení pro záznam a přehrávání digitálního zvuku:
Digitální audio technika
Digitální záznam zvuku se v současnosti provádí v nahrávacích studiích, pod kontrolou osobních počítačů a dalšího drahého a kvalitního vybavení. Poměrně široce rozvinutý je také koncept „domácího studia“, ve kterém se používá profesionální a poloprofesionální nahrávací zařízení, které umožňuje vytvářet vysoce kvalitní nahrávky doma.
Zvukové karty se používají jako součást počítačů, které zpracovávají ve svých ADC a DAC - nejčastěji ve 24 bitech a 96 kHz, další zvýšení bitové hloubky a vzorkovací frekvence prakticky nezvyšuje kvalitu záznamu.
Existuje celá třída počítačových programů - zvukových editorů , které vám umožňují pracovat se zvukem:
Některé jednoduché programy umožňují pouze převod formátů a kodeků.
Některé typy digitálního zvuku ve srovnání
Název formátu
|
Bitová hloubka, bit
|
Vzorkovací frekvence, kHz
|
Počet kanálů
|
Datový tok na disku, kbit/s
|
Poměr komprese/balení
|
CD |
16 |
44.1 |
2 |
1411,2
|
1:1 bez ztráty
|
Dolby Digital (AC3) |
16-24 |
48
|
6 |
až 640 |
~12:1 ztrátový
|
DTS |
20-24 |
48; 96 |
až 8 |
před rokem 1536
|
~3:1 ztráta
|
DVD Audio |
16; dvacet; 24 |
44,1; 48; 88,2; 96 |
6 |
6912
|
2:1 bez ztráty
|
DVD Audio |
16; dvacet; 24 |
176,4; 192 |
2 |
4608
|
2:1 bez ztráty
|
MP3 |
plovoucí |
až 48 |
2 |
až 320
|
~11:1 ztráta
|
AAC |
plovoucí |
až 96 |
až 48 |
až 529
|
se ztrátami
|
AAC+ ( SBR ) |
plovoucí |
až 48 |
2 |
až 320
|
se ztrátami
|
Ogg Vorbis |
až 32 |
až 192 |
až 255 |
až 1000
|
se ztrátami
|
WMA |
až 24 |
až 96 |
až 8 |
až 768
|
2:1, existuje bezztrátová verze
|
Viz také
Poznámky
- ↑ H. Nyquist, "Určitá témata v teorii telegrafního přenosu," Trans. AIEE, sv. 47, str. 617-644, duben. 1928
- ↑ Kotelnikov V. A. O propustnosti „éteru“ a drátu v telekomunikacích // Uspekhi fizicheskikh nauk : Journal. - 2006. - č. 7 . - S. 762-770 .
- ↑ Robertson, David. Alec Reeves 1902-1971 Privateline.com: Historie telefonu archivována 11. května 2014. (Angličtina)
- ↑ Claude Shannon - Matematická teorie komunikace
- ↑ C.E. Shannon. Komunikace v přítomnosti hluku. Proč. Ústav rozhlasových inženýrů. sv. 37. Ne. 1. S. 10-21. Jan. 1949.
- ↑ 1 2 3 4 5 6 7 8 9 Kompaktní disk: příručka teorie a použití Autor: Ken C. Pohlmann
- ↑ Billboard 22. srpna 1981 – 10letý digitální veterán japonské značky Denon
Literatura
- Shkritek P. Referenční příručka ke zvukovým obvodům: Per. s němčinou - M. Mir, 1991.-446 s.: ill.
- Zolotukhin I.P., Izyumov A.A., Raizman M.M. Digitální záznamníky zvuku. - Tomsk: "Rozhlas a komunikace", 1990. - 160 s. — ISBN 5-256-00559-6 .
Odkazy