Morfování (zvukový efekt)

Morphing ( anglicky  morphing - transformace) - zvukový efekt, který spočívá v vnucování vlastností jednoho zvuku druhému. Charakteristikou může být obálka , spektrum nebo časová struktura signálu. Často se mluví o témbrovém morfování - procesu kombinování dvou nebo více zvuků různého zabarvení za účelem získání nového zvuku, jehož zabarvení zahrnuje individuální charakteristiky obou zvuků [1] .

Při zpracování zvuku se morphing obvykle používá k řešení dvou typů problémů:

Jak to funguje

Morphing je v principu podobný vokodéru , ve kterém je zabarvení jednoho nástroje řízeno dynamickými charakteristikami zvukové produkce jiného. Když člověk vysloví zvuk, jeho řečový aparát funguje jako složitý systém filtrů, kterými prochází zvuková vlna vydávaná hlasivkami. Pokud je přes stejný filtrační systém aplikován jiný zvuk, například kytara, začne „mluvit“. V tomto případě se mluví o spektrálním nebo frekvenčním morfování.

Navíc v průběhu času dochází k morfování. Například zvuk kytarové struny má rychlý náběh a dlouhý doznívání, trubky naopak pomalý náběh a rychlý doznívání. Temporální morfování spočívá v tom, že je možné nahradit původní témbr při zachování principů reprodukce.

Morphing je také podobný amplitudové modulaci, nicméně s morphingem má každé frekvenční pásmo svou vlastní formu změny amplitudy.

Implementace

Existuje mnoho implementací morfování. Ve většině z nich je zvukového efektu dosaženo interpolací signálových charakteristik získaných pomocí metod analýzy nebo syntézy, jako je okénková Fourierova transformace , sinusové modelování nebo lineární predikční kódování. Níže jsou uvedeny nejběžnější algoritmy morfování zvuku.

Lineární interpolace s hladkými přechody

Jedním z prvních přístupů používaných k implementaci úloh morfování zvuku byla lineární interpolace a crossfade. V tomto případě je výstupní signál určen vzorcem:

,

kde a jsou vstupní signály, je interpolační koeficient.

Zejména pomocí crossfade - plynulého poklesu hlasitosti jednoho zvuku současně s plynulým zvýšením hlasitosti druhého - dochází k postupné transformaci jednoho zvuku na jiný (přičemž hodnota se musí změnit), a díky lineární interpolaci má výstupní signál průměrnou charakteristiku původních signálů.

Navzdory skutečnosti, že tyto přístupy jsou vhodné pro výpočty, v praxi se používají zřídka, protože s jejich pomocí není možné vytvořit vysoce kvalitní zvuk, pokud jsou zabarvení vstupních signálů velmi odlišné - oba původní signály jsou slyšet ve výstupním signálu.

Amplitudové morfování

Amplitudového morfování je dosaženo sledováním obálky signálu. K tomu se volí amplitudová obálka řídicího signálu, která se pak používá k řízení amplitudy syntetického signálu. Například amplituda obálky řeči může být použita k řízení amplitudy širokopásmového šumu. V tomto případě bude zvuk znít, jako by byl mluven nahlas. Zdokonalení této metody vedlo k vynálezu vokodéru, kde je tento algoritmus aplikován v každém z frekvenčních pásem, do kterých se hlas a šum dělí.

Morfování je dosaženo změnou amplitudy vstupního signálu pomocí předem definované obálky amplitudy nebo amplitudy jiného signálu. Pokud se použije hotová obálka signálu, pak se vstupní signál násobí výstupním signálem generátoru obálky. Pokud je použit řídicí signál, pak je nutné nejprve zvolit amplitudovou obálku tohoto signálu. Pro přesná měření by měl být použit detektor RMS. Amplituda signálů akustických nástrojů se však obvykle mění jen málo a jejich hlasitost závisí spíše na změnách spektra než na změnách amplitudy. Pokud by hlasitost výstupního signálu měla být podobná hlasitosti řídicího signálu, pak je nutné rozšířit dynamický rozsah řídicího signálu. [2]

Změny amplitudy řídicího signálu aplikovaného na vstupní signál vytvářejí efekt, který je vnímán v časové nebo frekvenční oblasti signálu v závislosti na frekvenci modulačního signálu. Pro frekvence pod 20 Hz se tento efekt objevuje v časové oblasti a nazývá se amplitudové sledování. Pro frekvence nad 20 Hz je tento efekt vnímán ve frekvenční oblasti a nazývá se amplitudová modulace .

Má-li řídicí signál velkou šířku pásma , musí být šířka spektra signálu zmenšena pomocí bloku průměrování signálu. Typická konstanta doby doznívání v bloku průměrování signálu je 30...100 ms. Tyto hodnoty vyhladí amplitudu signálu, takže zůstane v sub-audio rozsahu. Často je však žádoucí transformovat útoky vstupního signálu bez průměrování. Proto se doporučuje pro časovou konstantu útoku používat hodnoty menší než pro časovou konstantu pádu. Typická časová konstanta útoku signálu je 1...30 ms.

Změny amplitudy vstupního signálu a řídicího signálu mohou být v protifázi, čímž se snižuje dopad efektu, nebo mohou být ve fázi, což vede k rozšíření dynamického rozsahu. Aby změny amplitudy výstupního signálu byly podobné změnám amplitudy řídicího signálu, doporučuje se nejprve projít vstupní signál přes omezovací kompresor .

Křížová syntéza

Myšlenkou křížové syntézy je zkombinovat dva signály tak, že spektrum prvního signálu je tvořeno pomocí spektra druhého signálu, zatímco výška prvního zvuku je zachována. Tuto metodu lze zlepšit odstraněním spektrální obálky prvního signálu před filtrací.

Křížová syntéza se skládá z následujících kroků [3] :

  1. Proveďte okénkovou Fourierovu transformaci pro každý ze vstupních signálů.
  2. Vypočítejte spektrální obálku pro každý snímek.
  3. Navíc rozdělte spektrum každého rámce nosného signálu do jeho spektrální obálky, čímž jej učiníte plochým.
  4. Vynásobte plochý spektrální rámec obálkou odpovídajícího modulačního rámce, čímž se nosná obálka nahradí modulační.
Kepstrální analýza

Zpracování signálu založené na kepstrální analýze se také nazývá homomorfní . Pomocí kepstra můžete získat spektrální obálku signálu. Změna zvuku je dosažena filtrováním inverzní obálky následovaným filtrováním obálky druhého signálu . Zapojením obou filtrů do série dochází k přenosové funkci formuláře . Vzhledem k tomu je filtrování založeno na rozdílu mezi dvěma spektrálními obálkami. Inverzní filtraci prvního signálu a následnou filtraci spektrální obálky druhého signálu lze provést v jednom kroku pomocí rychlé konvoluce.

Simulace sinusoidy

Při použití sinusového modelu jsou časově proměnné spektrální charakteristiky reprezentovány jako součty sinusoid, nazývané podtóny . Vstupní signál může být reprezentován následovně [4] :

,

kde je amplituda n-té sinusoidy, je fáze n-té sinusoidy, N je počet uvažovaných podtónů.

Obecnější představu lze získat pomocí sinusového modelu se zbytkem. Lze to považovat za zobecnění okénkové Fourierovy transformace a sinusového modelování. Pomocí tohoto přístupu je možné určit, která část spektrální informace je prezentována ve formě sinusoid a která je zbytkem okénkové Fourierovy transformace. Při dobré analýze se jedná o velmi flexibilní a účinný model, který si zachovává dobrou zvukovou věrnost. S tímto přístupem se sinusová reprezentace používá pouze pro stabilní podtexty a zbytek by měl být v ideálním případě stochastická složka. Vstupní signál vypadá takto:

,

kde je složka hluku v čase (v sekundách).

Tento algoritmus poskytuje tři interpolační faktory, z nichž každý lze použít k řízení generovaného zvuku: základní frekvence , harmonické zabarvení a zbytková obálka.

Aplikace

Morphing se aktivně používá v zábavním průmyslu: vytvořené zvuky se používají ve filmových soundtrackech a v reklamě v televizi. Morfování se také používá v psychoakustických experimentech, zejména ke studiu prostoru zabarvení.

Morphing lze použít k vytvoření nových zvuků s různými charakteristikami a také k poskytnutí realističtější syntézy přirozených tónů, kterou lze uplatnit například zvýšením hlasitosti tichého zvuku.

Jedním z nejznámějších příkladů audiomorfování bylo znovuvytvoření Farinelliho hlasu pro film o životě slavného kastráta z 18. století. Poté bylo použito morphingu k vytvoření rozsahu zpěvákova hlasu kombinací koloraturního sopránu a kontratenoru .

Poznámky

  1. Holloway B., Tellman E., Haken L. Morphing zabarvení zvuků s nestejným počtem funkcí. // Journal of the Audio Engineering Society - 1995 - č. 43 (09) - str. 678-689.
  2. DAFX - Digitální zvukové efekty / Ed. Udo Zolzer. - Chichester: John Wiley & Sons, 2002. - 554 s.
  3. Křížová syntéza . Datum přístupu: 15. ledna 2014. Archivováno z originálu 27. prosince 2013.
  4. F. Primavera, F. Piazza a J. Reiss . Morphing zvuku pro generování perkusivního hybridního zvuku. – V Proc. 45. # "Audio Engineering Society Conference", 2012. - 8 s.

Doporučená četba

  • DAFX - Digitální zvukové efekty / Ed. Udo Zolzer. - Chichester: John Wiley & Sons, 2002. - 554 s.
  • Serra, X. Hudební modelování zvuku se sinusoidami a hlukem. — Swets & Zeitlinger, 1997. — s. 91-122.
  • Pokroky ve zpracování audio a řečových signálů: Technologie a aplikace / Ed. Hector Perez Meana. - Idea Group Inc (IGI), 2007. - 446 s.