Maxwell (mikroarchitektura)

Aktuální verze stránky ještě nebyla zkontrolována zkušenými přispěvateli a může se výrazně lišit od verze recenzované 29. května 2020; kontroly vyžadují 4 úpravy .
Maxwell
Datum vydání únor 2014
Výrobci TSMC
Pascal

Maxwell  je kódové označení pro mikroarchitekturu GPU vyvinutou společností Nvidia jako nástupce mikroarchitektury Kepler . Architektura Maxwell byla představena v pozdějších modelech řady GeForce 700 a je také použita v řadě GeForce 800M , GeForce 900 a Quadro Mxxx. Nvidia vzala Keplera jako základ pro novou architekturu Maxwell a vylepšila ji v několika oblastech. V architektuře Maxwell byl streamovací multiprocesor SMX přejmenován na SMM ( Streaming Maxwell Multiprocessor ), rozdělené do čtyř bloků po 32 stream procesorech. Celkem SMM cluster obsahuje 128 stream procesorů. Méně složitá řídicí logika zajišťuje efektivnější rozdělení úloh mezi jádra CUDA . Plocha třísek se zvýšila o 25 % ze 118 mm² na 148 mm². Zároveň se zvýšil počet tranzistorů z 1,3 miliardy na 1,87 miliardy, což představuje nárůst o 44 %. Důvod spočívá ve změně rozložení čipu.

Mikroarchitektura je pojmenována po Jamesi Clerku Maxwellovi , zakladateli teorie elektromagnetického záření .

Vlastnosti architektury Nvidia Maxwell

Zvýšená přidělená sdílená paměť

Architektura Maxwell poskytuje 64 KB distribuované (registrované) paměti, zatímco ve Fermi nebo Kepler je tato paměť rozdělena mezi L1 cache a distribuovanou paměť. V Maxwellu může jeden blok využít až 48 KB distribuované paměti a zvýšení celkového množství této paměti může vést ke zvýšení zátěže multiprocesoru. To bylo umožněno spojením funkčnosti mezipaměti L1 a mezipaměti textur v samostatném bloku.

Rychlejší atomové operace ve sdílené paměti

Architektura Maxwell zavedla vestavěné atomické operace na 32bitových celých číslech v distribuované paměti, stejně jako operace CAS na 32bitových a 64bitových hodnotách v paměti – lze je použít k implementaci dalších atomických funkcí. V případě Keplera a Fermiho musel být použit komplikovaný princip Uzamknout/Aktualizovat/Odemknout, což mělo za následek další náklady.

Dynamická souběžnost

Dynamický paralelismus, představený s Kepler GK110, umožňuje GPU vytvářet úlohy pro sebe. Podpora této funkce byla poprvé přidána v CUDA 5.0, což umožnilo vláknům na GK110 provozovat další jádra na stejném GPU.

Vykreslování dlaždic

Poprvé u grafických karet Nvidia a řady GeForce byla zavedena technologie vykreslování dlaždic, která zvyšuje výkon a snižuje zatížení paměti. [1] [2] Konkurence AMD ji přitom prakticky nemá, tato technologie v současné době stále chybí, jedinou výjimkou je řada VEGA s pamětí HBM.

Srovnání Keplera a Maxwella

Charakteristika Kepler Maxwell
GPU GK107 (Kepler) GM107 (Maxwell)
CUDA jádra 384 640
základní frekvence 1058 MHz 1020 MHz
Zesilovací frekvence GPU n/a 1085 MHz
gigaflopy 812,5 1305,6
Výpočetní schopnosti 3.0 5,0
Distribuovaná paměť / SM 16 kB / 48 kB 64 kB
Registrovat velikost souboru / SM 256 kB 256 kB
Maximální počet bloků 16 32
Frekvence paměti 5000 MHz 5400 MHz
Velikost mezipaměti L2 256 kB 2048 kB
TDP 64 W 60 W
tranzistory 1,3 miliardy 1,87 miliardy
Krystalová oblast 118 mm² 148 mm²
Procesní technologie 28 nm 28 nm

nástupce

Další architektura po Maxwellovi přišla pod kódovým jménem Pascal . [3]

Poznámky

  1. Hlavní tajemství účinnosti nových architektur NVIDIA je odhaleno . 3DNews - Daily Digital Digest. Získáno 1. března 2019. Archivováno z originálu dne 2. března 2019.
  2. Zobrazování dlaždic – tajný recept na architekturu Maxwell/Pascal . www.hardwareluxx.ru Získáno 1. března 2019. Archivováno z originálu dne 2. března 2019.
  3. Plán aktualizace GPU NVIDIA; Oznamuje Pascal Archived 25. března 2014 na Wayback Machine // Oficiální blog NVIDIA, 25. března 2014