Direct3D 10 - sada funkcí API pro interakci s grafickou kartou; podporováno grafickými kartami NV GeForce 8x00, ATI Radeon 2x00 a vyšší. Direct3D 10 (D3D10) je komponenta rozhraní API (Application Programming Interface) rozhraní DirectX 10, 10. verze Direct3D, nástupce Direct3D 9. Direct3D 10 poskytuje funkce pro operační systém a interakci aplikací s ovladači grafické karty. Tyto funkce jsou specifické pro operační systém řady Windows a jsou dostupné ve Windows Vista a Windows 7 . Částečně D3D10 funguje na grafických kartách úrovně Direct3D 9.
Oficiální finální verze byla vydána 10. listopadu 2006 jako součást Windows Vista .
Níže jsou uvedeny klíčové funkce a rozdíly oproti Direct3D verze 9.
Ve Windows Vista je zcela nový model ovladače, WDDM ( Windows Display Driver Model , dříve LDDM - Longhorn Display Driver Model), hlavní změnou v modelu ovladače videa od příchodu hardwarové akcelerace. V XDDM ( Windows XP Display Driver Model) každé volání DirectX přidalo příkazový ukazatel (token) do vyrovnávací paměti příkazů ve formátu nezávislém na grafické kartě. Když DX Runtime rozhodlo, že vyrovnávací paměť je dostatečně plná, byla zavolána funkce ovladače (v režimu jádra ), aby tuto vyrovnávací paměť získala. Poté ovladač analyzoval tuto vyrovnávací paměť a přenesl data na grafickou kartu. To znamená, že v uživatelském režimu nebyly žádné funkce ovladače . Vývoj grafických karet a v důsledku toho komplikace příkazového bufferu vedly k tomu, že se ovladač stal nemyslitelně velkým a v případě jakékoli chyby vyvolal BSOD . Také v XDDM nemá operační systém žádný způsob, jak nastavit prioritu, spravovat videopaměť, plánovat DX hovory, což ztěžuje sdílení grafické karty mezi několika procesy – příčina „ztráty zařízení“.
V novém modelu ovladače je vytvořeno oddělení mezi uživatelskou částí a částí ovladače v režimu jádra. Všechna DX volání jdou přímo do uživatelského ovladače, který okamžitě připraví vyrovnávací paměť s hardwarově specifickým obsahem. Tato vyrovnávací paměť přenáší data do jádra operačního systému, odkud jdou na grafickou kartu. Veškerá těžká práce se tedy provádí v uživatelské části a v jádře - pouze přenos shromážděné vyrovnávací paměti na grafickou kartu. Výsledkem je, že pokud dojde k selhání vlastního ovladače, nestane se nic špatného - konkrétní aplikace se zavře, ale nedojde k žádné BSOD . Ovladač nyní navíc rozhoduje, kdy a kolik volání funkcí jádra provést. Také DX Runtime se stává velmi tenkým - neexistují žádné vyrovnávací paměti příkazů, funkce ovladače jsou volány přímo. Kromě toho je mezi uživatelskou a částí jádra plánovač úloh, který vybírá, které shromážděné vyrovnávací paměti se mají odeslat na grafickou kartu ( rozdělení GPU na mnoho procesů).
Nyní, pokud není dostatek video paměti, jsou prostředky přeneseny do systému (odkud je lze vyměnit ). Vzhledem k tomu, že Windows Vista řídí alokaci video paměti (dříve ovladač), je možné ji alokovat efektivněji než POOL_MANAGED v XDDM. V této fázi to funguje na softwarové úrovni – plánovač GPU před přenosem paketu DMA na kartu nahraje všechny potřebné textury do video paměti (může je načíst předem, zatímco je GPU zaneprázdněno jiným a sběrnice je zdarma). Pokud je aplikace na celou obrazovku, vše navíc z video paměti se podle potřeby přenese do systémové paměti; pokud je v režimu okna, pak je paměť sdílena mezi aktuálními procesy. Pokud chcete zaručit 100% dostupnost zdroje ve videopaměti, musíte použít režim celé obrazovky a ovládat velikost alokací.
V předchozích verzích mohlo z různých důvodů dojít ke ztrátě zařízení, po které bylo nutné znovu načíst všechny prostředky do video paměti a obnovit objekty. S novým modelem ovladače již tento problém neexistuje. Je možná situace Odebráno zařízení, což znamená, že grafická karta byla fyzicky odebrána ze systému nebo že byl aktualizován ovladač videa. Situace je velmi vzácná.
V DX10 je zaručena veškerá funkčnost, to znamená, že pokud karta podporuje DX10, tak musí podporovat nejnovější verzi shaderů v plném rozsahu, podporovat všechny formáty textur, všechny možné režimy filtrování, šablonu (stencil) a vše ostatní. Navíc pro DX10 napsali specifikaci pravidel rasterizace, to znamená, že nyní by obrázek na různých grafických kartách používajících stejný kód měl být vždy stejný a odpovídat referenčnímu softwarovému rasterizátoru. Pokud tomu tak není, jedná se o chybu výrobce grafické karty. V budoucnu bude funkčnost rozšiřována (balíček DX10.1, DX11 atd.).
Snížená doba volání funkcí (včetně DIP) na CPU. Podle prezentací společnosti Microsoft lze pozorovat 10x zkrácení času. To je důležité, protože těžká hra může strávit přibližně 10+ milisekund v DX hovorech. Většinu času hovoru dříve strávili Runtime a Driver, ale nyní model ovladače ve skutečnosti nedělá nic, ale okamžitě poskytuje spuštění ovladači.
Objevily se stavové objekty - objekty, které lze během vytváření předem sestavit a poté rychle nainstalovat na grafickou kartu. Přidány konstantní vyrovnávací paměti, umožňující efektivnější nastavení konstant shaderu.
Všechny Set*States byly nahrazeny stavovými objekty. Státy jsou rozděleny do několika skupin:
Stavy pro každou skupinu jsou nastaveny jako celek, nikoli každý zvlášť, jako v D3D9. Pro každou skupinu můžete vytvořit stavový objekt, který po vytvoření specifikuje úplnou sadu stavů skupiny a můžete jej pouze „nastavit“. Vytvoření stavového objektu je nákladná a pomalá operace a měla by být volána zřídka. Motivací pro tuto novinku je, že takové API umožňuje ovladači generovat sadu příkazů pro grafickou kartu předem (při vytváření objektu State) a negenerovat je pokaždé během vykreslování při volání Set*State.
Pro hlavní datové typy (vrcholy, indexy, konstanty) byl zaveden jediný buffer - ID3D10Buffer - sada bajtů v paměti. Typ safe je poskytován zadáním při vytváření obsahu vyrovnávací paměti. Pro zdroje byly zavedeny samostatné objekty pro vazbu na kanál – zobrazení zdrojů. To znamená, že nejprve vytvoříme texturu jako objekt v paměti a poté její pohled na prostředky jako vstup pro shader nebo jako cíl vykreslení a tímto pohledem zavoláme PSSetShaderResources (místo SetTexture) a OMSetRenderTargets (místo SetRenderTarget). Stojí za zmínku, že jeden zdroj může mít několik zobrazení zdrojů.
Tento princip umožňuje pracovat zobecněným způsobem. Existují zdroje „bez typu“ (bez typu), tedy zdroje, které nemají konkrétní typ (nezadaný při vytváření) – například DXGI_FORMAT_R32G32B32_TYPELESS. Typ takových zdrojů se vybírá během vytváření pohledu (například DXGI_FORMAT_R32G32B32_UINT nebo DXGI_FORMAT_R32G32B32_FLOAT) a výběru prvku/ řezu z pole textur/volumetrické textury.
Set*ShaderConstant jsou nahrazeny Constant Buffers - skupinami konstant (buffer pro n konstant), které jsou nastaveny najednou. Skupinu lze uzamknout a zaznamenat jako normální vyrovnávací paměť. Vazba na shader se provádí od určitého slotu.
Použití konstant tedy spočívá v jejich rozdělení do několika skupin podle frekvence aktualizace (na objekt, na materiál, na průchod, na scénu) a vytvoření konstantní vyrovnávací paměti pro každou skupinu. Kromě dalšího výkonu poskytuje tento přístup řidiči obraz na vysoké úrovni – více příležitostí k optimalizaci.
VertexDeclaration nahrazena Input Layout. Vyžaduje při vytváření Shader Input Signature, tedy seznam vstupních (vstupních) parametrů shaderu. Vytvořený objekt lze použít jako Vertex Declaration s jakýmkoli shaderem, který má stejný seznam vstupních parametrů. V D3D9 byla Vertex Declaration nastavena nezávisle na shaderu při renderování, a proto museli ovladače vážně upravit nastavení při změně vdecl. Nyní je vdecl pevně připojen ke vstupu shaderu, což umožňuje ovladači vše předem vypočítat.
Shadery již nelze psát v assembleru - musíte použít HLSL. Přestože existuje assembler pro shader model 4.x a výsledek kompilace shaderů do něj vidíte, z textu assembleru již nelze získat binární kód shaderu (co udělal psa.exe / vsa.exe ), ale můžete k tomu použít metodu reverzního inženýrství .
Pro snazší portování kódu shaderu může kompilátor zkompilovat starší verze shaderů HLSL (SM2.0, SM 3.0) do SM4.0. V novém HLSL jsme do kompilátoru přidali atributy pro hints – odvíjení smyček a volbu dynamického vs statického větvení pro podmíněné skoky.
V Shader Model 4 byly přidány celočíselné instrukce a bitové operace (můžete počítat ve spravedlivém pevném bodu a předávat booleovské příznaky), omezení počtu instrukcí bylo odstraněno (ale velmi dlouhý shader může běžet za 10 sekund časový limit spuštění balíčku na GPU)
Geometrický shader - další shader mezi vrcholem (Vertex Shader) a pixelem (Pixel Shader), který dokáže generovat primitiva. Na vstupu je dáno primitivum s informacemi o sousedech, na výstupu - můžete vygenerovat několik (ne pevný počet).
Jedná se o schopnost zapsat výsledek Vertex Shader / Geometry Shader do paměti. Například pro ukládání do mezipaměti zpracování geometrie nebo obecně geometrie vytvořené GS. Můžete si představit opakující se efekty jako Cloth/Water. To znamená, že nyní můžete přímo transformovat a zapisovat geometrii do GPU a nejen kreslit pixely v cíli vykreslení. Je také možné číst v shaderu z vyrovnávací paměti v paměti podle indexu, to znamená mít poměrně velkou sdílenou paměť pouze pro čtení. NV například navrhuje ukládat tam konstanty animace pro instanci.
Objevila se pole textur, tedy kontejner textur stejné velikosti a formátu, ze kterých může shader vybírat podle indexu (v DX10.1 jsou možná i pole cubemap). Jedná se o stejný atlas, který se provádí správně – dříve, když bylo několik různých textur uloženo do jedné textury, museli jste se starat o úrovně mip, nechávat mezi texturami mezeru atd. Nyní už nemusíte. Primitivní/id instance přichází do shaderu, v závislosti na ID instance můžete použít jinou sadu textur/souřadnic/jakýchkoli dat. Očekává se, že dynamická větev v shaderu bude rychlá (lepší než v hardwaru DX9), takže můžete předat ID materiálu a vybrat materiál v shaderu. To znamená, že teoreticky je možné generovat velké množství geometrie s různými parametry, texturami a materiály v jednom volání. V praxi má dynamická větev poměrně velké časové náklady a řadu dalších problémů (výpočet gradientů souřadnic textur).
Jedna z nejužitečnějších novinek, kvůli které mnozí přešli na DX10. Nyní si v shaderu můžete přečíst každý vzorek MSAA zvlášť, tedy napsat si vlastní AA filtr, bez problémů vzorek při zpracování a dokonce použít MSAA RT jako texturu. Také AlphaToCoverage je nyní oficiálně přítomen. V D3D10.1 mají hloubkové textury také tyto vlastnosti.
Nyní lze hloubkový buffer použít jako texturu. Můžeme říci, že při vzorkování, porovnání s hodnotou a filtrování sousedů můžete získat čistou hodnotu hloubky a vzorníku.
Operační systém Windows XP nepodporuje DX10. Důvodem je, že portování nového modelu ovladače není možné – v jádře operačního systému je vyžadováno příliš mnoho změn. Pokud se však přenese pouze sada nových funkcí DX10, pak také nastanou problémy: virtualizaci a plánování nelze provést ve starém modelu ovladače, přenos hardwarových funkcí je pro Microsoft a IHV příliš práce .