Kovariance a kontravariance (matematika)

Kovariance a kontravariance  - používané v matematice ( lineární algebra , diferenciální geometrie , tenzorová analýza ) a ve fyzice , koncepty, které charakterizují, jak se mění tenzory ( skaláry , vektory , operátory , bilineární formy atd.) při transformaci bází v odpovídajících prostorech nebo varietách . Kontravarianty se nazývají "obyčejné" komponenty, které se při změně základny prostoru mění pomocí transformace inverzní k transformaci základu. Kovariantní  – ty, které se mění stejným způsobem jako základ.

Spojení mezi kovariantními a kontravariančními souřadnicemi tenzoru je možné pouze v prostorech, kde je dán metrický tenzor (neplést s metrickým prostorem ).

Termíny kovariance a kontravariance zavedl Sylvester v roce 1853 pro výzkum algebraické teorie invariantů.

Kovariance a kontravariance ve vektorových prostorech

Kontravariantní a kovariantní vektory

Dovolit být  nějaký konečný -dimenzionální vektorový prostor a nějaký základ je daný v něm . Libovolný vektor může být reprezentován jako lineární kombinace základních vektorů: . Pro zjednodušení zápisu (a z důvodů, které budou zřejmé níže), označíme souřadnice horním indexem a přijmeme Einsteinovo pravidlo: pokud se na výrazu podílejí stejné víceúrovňové indexy, pak se nad nimi předpokládá sumace. Můžeme tedy psát: . Nastavme nový základ pomocí transformační matice . Ze stejných důvodů zavádíme indexy dolní a horní (aby se nepsaly součtové znaky) - . Potom (předpokládá se sumace přes index j). Označením inverzní matice můžeme napsat: . Dosazením tohoto vzorce do souřadnicové reprezentace vektoru x dostaneme: . Souřadnice vektoru v nové bázi se tedy ukáží jako rovné , to znamená, že jsou transformovány „opačně“ (inverzně) ke změně báze. Z tohoto důvodu se takové vektory nazývají kontravariantní  – měnící se opačně k základně. Kontravariantní vektory jsou běžné vektory. Kontravariantní vektory v souřadnicové reprezentaci se obvykle zapisují jako "sloupcový vektor". Horní nebo kontravariantní index se používá k identifikaci kontravariantních vektorů.

Prostor všech lineárních funkcionálů, které mapují vektory na čísla, se nazývá duální prostor . Je to také vektorový prostor stejné dimenze jako základní prostor. V tomto prostoru je také možné definovat základ. Prvky základu duálního prostoru označme horním indexem . Libovolný funkcionál může být v tomto základu reprezentován pomocí souřadnic, které budou označeny indexy. Potom, za použití Einsteinova pravidla, můžeme napsat: , to znamená, že jakýkoli lineární funkcionál lze jednoduše zapsat jako množinu čísel , jako běžný vektor (kromě umístění nižšího indexu).

Bázi v duálním prostoru volíme tak , že , tedy tyto funkcionály najdou tou souřadnici vektoru (projekci na vektor báze ). Takový základ se nazývá duální (k základu hlavního prostoru). Při změně základu hlavního prostoru musí být tento stav zachován, tedy . Duální základ se tedy mění inverzně ke změně hlavního základu. Souřadnice libovolného lineárního funkcionálu se budou měnit opačně než jejich vlastní báze (jako v každém prostoru), tedy pomocí matice . Proto se budou měnit stejně jako hlavní základ. Tato vlastnost se nazývá kovariance . Samotné lineární funkcionály v reprezentaci souřadnic v duální bázi se nazývají kovariantní vektory nebo stručně kovektory . Navenek covektor „vypadá“ jako pravidelný vektor ve smyslu pravidelné sady čísel reprezentujících jeho souřadnice. Rozdíl mezi covektorem a kontravariantním vektorem spočívá v pravidle pro transformaci jeho souřadnic při změně báze: transformují se jako báze, na rozdíl od kontravariantních vektorů, které jsou transformovány opačně k bázi. Covektory v souřadnicovém tvaru jsou psány jako "řádkové vektory". Nižší neboli kovariantní index se používá k identifikaci covectors .

Kontravariance a kovariance tenzorů

To, co bylo řečeno o kontravarianci a kovarianci vektorů, lze zobecnit na objekty s několika indexy - tenzory , z nichž speciálními případy jsou vektory a covektory.

Analogicky s lineárním funkcionálem uvažujme funkcionál, který sdružuje několik ( ) prostorových vektorů s určitým číslem, které má v každém vektoru vlastnost linearity . Jedná se o takzvané multilineární funkce . Lze ukázat, že všechny -lineární funkce tvoří lineární prostor, do kterého lze také zavést bázi a reprezentovat libovolnou -lineární funkci v souřadnicovém tvaru. Lze také ukázat, že jejich souřadnice se transformují jako báze základního prostoru (stejně jako kovariantní vektory). Proto se takové multilineární funkce nazývají časy kovariantní tenzory . Jsou psány s dolním indexem. Například dvojitý kovariantní tenzor je označen jako .

Podobně lze uvažovat o multilineárních funkcích nikoli v hlavním prostoru, ale v duálním prostoru , jehož množina také tvoří lineární prostor , který je duální k . V souřadnicové reprezentaci v duální bázi jsou transformovány stejným způsobem jako základna prostoru , a tedy naproti základu hlavního prostoru . To znamená, že mají kontravariantní vlastnost a nazývají se časově kontravariantní tenzor . Jsou označeny horními indexy. Zejména dvojitě kontravariantní tenzor bude psán jako .

Pro obvykle uvažované prostory, tzv. kanonický izomorfismus a , to znamená, že tyto prostory lze považovat za nerozlišitelné. Proto lze 1-násobný kontravariantní tenzor považovat za ekvivalent běžného kontravariančního vektoru.

Zobecněním výše uvedených definic lze uvažovat o multilineárních funkcích vektorů a kovektorů současně. Podle toho bude při změně báze transformován souřadnicový záznam takové funkce za účasti jak transformační matice hlavní báze (v počtu kovektorů účastnících se multilineární funkce), tak její inverzní (v počtu vektorů multilineární funkce). Odpovídající tenzor se nazývá m krát kontravariantní a k krát kovariantní  - . Dolní indexy se používají pro kovariantní komponenty a horní indexy se používají pro kontravariantní komponenty. Například 1-krát kontravariantní a 1-krát kovariantní tenzor je označen . Celkový počet indexů se nazývá hodnost nebo valence tenzoru. Komponenty tenzoru jsou hodnoty multilineární funkce na základních vektorech. Například .

Operace sčítání nad stejnými víceúrovňovými tenzorovými indexy se nazývá konvoluce nad těmito indexy. Jak již bylo zmíněno výše, podle Einsteinova pravidla je součtový znak přeskočen. V důsledku konvoluce tenzoru nad párem indexů se jeho pozice sníží o 2. Například zobrazení nějakého kontravariančního vektoru pomocí nějakého lineárního operátoru v zápisu tenzoru bude vypadat jako . Lineární operátory jsou klasickým příkladem typového tenzoru .

Při transformaci typového tenzoru se při změně báze použije matice přímé transformace báze m krát a inverzní matice k krát. Například tenzor typu , když se mění základ, se transformuje takto:

Obecně je nutné chápat, že samotný objekt nezávisí na jeho reprezentaci v základu. Všechny transformace jsou reprezentace stejného objektu (tensor).

Metrický tenzor

Pokud je skalární součin zaveden do lineárního prostoru  - bilineární forma (nebo v tenzorové terminologii - dvojitě kovariantní tenzor ), který má vlastnosti symetrie a nedegenerace, pak se takové prostory (konečně-dimenzionální) nazývají euklidovské (za předpokladu že odpovídající kvadratická forma je pozitivně-definitivní ) nebo pseudoeuklidovská (bez omezení znaménkové kvadratické formy). Tenzor odpovídající této bilineární formě se nazývá metrický tenzor . Složky tohoto tenzoru v dané bázi . Pokud je tato báze ortonormální (taková báze vždy existuje v (pseudo)euklidovském prostoru), pak je matice složek diagonální. Na diagonále v případě euklidovského prostoru jsou jedničky (matice identity). V případě pseudoeuklidovského prostoru jsou na diagonále kromě jednotek i „mínusové jednotky“. V obecném případě však báze nemusí být ortogonální, takže metrický tenzor může být reprezentován i mimodiagonální maticí (nicméně v „plochém“ prostoru vždy existuje transformace báze, která jej přivede do diagonální formy) .

Pomocí metrického tenzoru lze skalární součin zapsat jako . V prostorech s vnitřním součinem existuje kanonický izomorfismus prostoru a duálního prostoru , to znamená, že každý vektor je spojen s covektorem a naopak. Tato korespondence se provádí přesně pomocí skalárního součinu nebo, v tensorové notaci, pomocí metrického tenzoru. Totiž, můžeme psát . Tato operace se nazývá snížení nebo snížení indexu . Opačná korespondence se provádí pomocí kontravariančního metrického tenzoru . Tato operace se nazývá zvedání nebo zvedání indexu . Je snadné ukázat, že matice kovariantních a kontravariančních metrických tenzorů jsou vzájemně inverzní, tedy . Skalární produkt může být exprimován v kontravariančních i kovariantních vektorech: .

V případě ortonormálního základu v euklidovském prostoru je metrickým tenzorem matice identity, takže kovariantní vektor v souřadnicovém zápisu se shoduje s kontravariančním. Proto v tomto případě není nutné dělení vektorů na kontravariantní a kovariantní. Nicméně, i když je základ neortogonální a (nebo) prostor je pseudoeuklidovský, takové rozlišení je důležité. V pseudoeuklidovském prostoru na ortogonální bázi se kovektory liší znaménky některých souřadnic od běžného vektoru. Systém vektorů a kovektorů nám v tomto případě umožňuje napsat vzorec pro druhou mocninu délky vektoru podobným způsobem jako v případě euklidovského prostoru . V případě neortogonálních (šikmých) bází v euklidovských (pseudoeuklidovských) prostorech není metrický tenzor transformující kontravariantní vektory na kovariantní vektory diagonální. V tomto případě se délka vektoru zapisuje stejně jako v euklidovském prostoru pomocí kontravariančních a kovariantních vektorů. Všechny tyto případy mají jedno společné – metrický tenzor (v dané bázi) má stejnou matici pro všechny body (vektory) prostoru.

V prostorech s metrickým tenzorem jsou "kovariantní vektor" a "kontravariantní vektor" ve skutečnosti různé reprezentace (záznamy jako soubor čísel) stejného geometrického objektu - obyčejného vektoru nebo covektoru . To znamená, že stejný vektor lze zapsat jako kovariantní (to je soubor kovariančních souřadnic) a kontravariantní (to znamená soubor kontravariančních souřadnic). Totéž lze říci o covectoru. Transformace z jedné reprezentace do druhé se provádí jednoduše konvolucí s metrickým tenzorem . Obsahově se vektory a kovektory rozlišují pouze podle toho, které ze zobrazení je pro ně přirozené. Přirozená reprezentace pro obyčejný vektor je kontravariantní reprezentace. Pro kovariantní vektor je přirozené konvolvovat s běžnými vektory bez účasti metriky. Příkladem kovariantního vektoru je gradient skalární funkce . Jeho konvoluce s kontravariančním (obyčejným) vektorem dává invariant - diferenciál funkce . Pokud tedy přijmeme prostory jako obyčejné vektory, pak by gradient měl být covektor, aby nebylo nutné při skládání používat metrický tenzor. Přitom samotné vektory vyžadují použití metrického tenzoru při kolapsu se stejnými vektory .

Pokud mluvíme o běžném fyzickém prostoru, jednoduchým znakem kovariance-kontravariance vektoru je to, jak je jeho přirozená reprezentace konvolvována se sadou souřadnic prostorového posunutí , což je příklad kontravariančního vektoru. Ty, které konvolvují jednoduchým sčítáním, bez účasti metriky, jsou kovariantní vektory a ty, které zahrnují metriku, jsou kontravariantní vektory. Pokud jsou prostor a souřadnice tak abstraktní, že neexistuje žádný způsob, jak rozlišit mezi hlavní a duální bází, s výjimkou libovolného podmíněného výběru, pak smysluplné rozlišení mezi kovariantními a kontravariančními vektory zmizí nebo se stane také čistě podmíněným.

Kovariantní vektor, zejména ve fyzikální literatuře, je často rozkladem libovolného vektoru (tj. vektoru nebo covektoru, vektoru tečného nebo kotangentního prostoru) na duální bázi. Pak se bavíme o množině kovariantních souřadnic libovolného objektu, většinou se však snaží každý typ objektů zapsat do pro něj přirozeného základu, který odpovídá hlavní definici.

Zobecnění na křivočaré základny a zakřivené prostory

Souřadnice euklidovského (pseudoeuklidovského) prostoru mohou být také křivočaré. Klasickým příkladem křivočarých souřadnic jsou polární souřadnice v euklidovské rovině. V tomto případě lze základny souřadnic považovat za lineární pouze v nekonečně malých okolích daného bodu. Proto zůstává v platnosti výraz pro druhou mocninu vzdálenosti pro dostatečně blízké body: . V případě křivočarých souřadnic se metrický tenzor mění bod od bodu. Jde tedy o tenzorové pole  – každý bod v prostoru je spojen s nějakým metrickým tenzorem.

Obecnější situace nastává v případě zakřivených prostorů – riemannovských (pseudoriemannovských) variet. Zakřivený prostor lze vizualizovat pro případ dvourozměrného povrchu - nějaký hladký zakřivený povrch v trojrozměrném prostoru (například kulový povrch). Vnitřní geometrie takového povrchu (zakřiveného) je geometrií zakřiveného prostoru. V obecném případě zakřiveného prostoru dimenze  si jej lze představit jako libovolnou (zakřivenou) hyperplochu v prostoru vyšší dimenze. Pro hladké variety s počitatelnou bází je dokázán Whitneyův teorém o vnoření , podle kterého je každá taková varieta dimenze vnořena do "plochého" (tj. nezakřiveného euklidovského nebo pseudoeuklidovského) prostoru dimenze .

V zakřiveném prostoru nemusí existovat ortogonální a obecně lineární souřadnicové základny. V obecném případě se musíme přesně vypořádat s křivočarými základnami. V tomto případě se použití všech výše uvedených formalismů kovariantních a kontravariantních vektorů stává nejen zvláště důležitým, ale stává se nevyhnutelným.

Obecné definice

V případě křivočarých souřadnic nebo zakřivených prostorů jsou nové souřadnice, obecně řečeno, nelineární funkce starých souřadnic: . Pro infinitezimální změny starých souřadnic lze změny nových souřadnic určit pomocí jakobiánu uvedených funkcí:

Jakýkoli vektor , který se transformuje stejným způsobem jako , tj.

se nazývá kontravariantní vektor .

Pro nějakou skalární funkci souřadnic zvažte její gradient . Při přesunu na jiné souřadnice máme:

Jakýkoli vektor , který se transformuje stejným způsobem jako gradient, tzn.

se nazývá kovariantní vektor .

V souladu s tím je jednou kontravariantní a jednou kovariantní tenzor (tensor typu ) objekt, který se transformuje, když se změní báze jednou aplikací „inverzní“ transformace a jednou „přímou“ transformací .

Například dvojitě kontravariantní tenzor a dvojitě kovariantní tenzor se transformují podle následujících zákonů:

A pro 1-násobný kontravariantní a 1-násobný kovariantní tenzor transformace vypadají takto:

Obvykle, aby se naznačilo, že složky tenzoru jsou převedeny na nový základ s prvočíslem, je prvočíslo uvedeno u odpovídajících indexů tenzoru, a nikoli u jeho písmenného označení, v takovém případě jsou výše uvedené vzorce zapsány následovně

Algebra a geometrie

V teorii kategorií mohou být funktory kovariantní a kontravariantní. Duální prostor vektorového prostoru je standardním příkladem kontravariančního funktoru. Některé konstrukce multilineární algebry jsou smíšené a nejsou funktory.

V geometrii se stejné mapování liší v prostoru nebo mimo něj, což umožňuje určit rozptyl konstrukce. Tangentní vektor k hladké varietě M v bodě P je třída ekvivalence křivek v M , které procházejí daným bodem P. Proto je kontravariantní pod hladkým mapováním M . Kovariantní vektor nebo covektor je konstruován stejným způsobem z hladkého mapování z M na reálnou osu kolem P v kotangentním svazku konstruovaném na duálním prostoru svazku tečny.

Kovariantní a kontravariantní složky se při transformaci bází a podle toho i souřadnic transformují různými způsoby, vezmeme-li, jak se obvykle dělá, souřadnicové báze. .

Viz také

Poznámky

  1. JA Wheeler; C. Misner; KS Thorne. Gravitace  (neopr.) . - W. H. Freeman & Co, 1973. - ISBN 0-7167-0344-0 .

Literatura