Softwarová transakční paměť

V počítačové technologii je softwarová transakční paměť ( STM ) mechanismem souběžného řízení podobným mechanismu databázových transakcí pro řízení přístupu ke sdílené paměti v paralelním počítání . Je to alternativa pro synchronizaci založenou na zámku . Transakce je v tomto kontextu kus kódu, který čte ze sdílené (sdílené) paměti a zapisuje do ní. Čtení a zápis logicky probíhají v jediném okamžiku a mezistavy jsou pro ostatní (výsledné) transakce neviditelné. Myšlenka poskytování transakcí s hardwarovou podporou vznikla v roce 1986 v díle a patentu Toma Knighta . [1] Nápad zveřejnili Maurice Herlihy a Eliot Moss . [2] V roce 1995 Nir Shavit a Dan Toytu rozšířili tuto myšlenku na softwarovou transakční paměť (STM). STM je stále v centru intenzivního výzkumu; jeho podpora praktických implementací se zvyšuje.

Charakteristika

Na rozdíl od metod blokování používaných ve většině moderních vícevláknových aplikací je STM velmi optimistický: vlákno dokončuje změny sdílené paměti bez ohledu na to, co dělají ostatní vlákna, a zaznamenává všechna čtení a zápisy do protokolu. Namísto použití zapisovače ke kontrole, zda to má negativní vliv na další probíhající operace, je odpovědnost přenesena na čtečku, která po dokončení transakce zkontroluje, zda jiná vlákna neprovedla souběžné změny v paměti, ke které se přistupovalo v minulost.. Tato poslední operace, která kontroluje změny transakce a která, pokud kontrola uspěje, zůstane nezměněna, se nazývá potvrzení. Transakci lze kdykoli ukončit, v důsledku čehož budou zrušeny všechny poslední změny. Pokud transakce nemůže být potvrzena kvůli konfliktům změn, bude přerušena a bude opakována od začátku, dokud nebude úspěšně dokončena.

Výhoda tohoto optimistického přístupu je umocněna paralelismem: žádné vlákno nemusí čekat na přístup ke zdroji a různá vlákna mohou současně a bezpečně upravovat nesouvislé části datové struktury, které by byly chráněny stejným zámkem.

V praxi však systémy STM ztrácejí na výkonu oproti jemnozrnným systémům založeným na zámcích na malém počtu procesorů (od 1 do 4 v závislosti na aplikaci). To je způsobeno především režií údržby protokolu a časem stráveným transakcemi. Ale i v tomto případě se výkon neliší více než 2krát. [3] Zastánci STM věří, že takové ztráty jsou ospravedlněny koncepčními výhodami STM.

Teoreticky je časová a prostorová složitost běhu n paralelních transakcí v nejhorším případě O (n) . Skutečná cena závisí na implementaci (transakci můžete předčasně zrušit, abyste se vyhnuli režii), ale vždy budou existovat případy, i když vzácné, kdy budou mít zamykací algoritmy lepší časovou složitost než softwarová transakční paměť.

Koncepční výhody a nevýhody

Kromě výkonnostních výhod STM výrazně zjednodušuje koncepční pochopení vícevláknových programů a pomáhá při jejich udržovatelnosti bezproblémovou prací s existujícími abstrakcemi na vysoké úrovni, jako jsou objekty a moduly.

Programování zámků obsahuje řadu známých problémů, které se v praxi často objevují:

Je důležité si uvědomit překrývající se operace a dílčí operace v samostatných a zdánlivě nesouvisejících částech kódu – což je velmi obtížný a k chybám náchylný úkol.
Vyžaduje to, aby se programátoři naučili zásady zamykání, aby se vyhnuli zablokování ( Deadlocks , Livelocks ) a dalším problémům s řízením procesů. Takové zásady jsou často svévolně vynucovány a chybné, a když nastanou problémy, je obtížné je reprodukovat a ladit.
To může vést k inverzi priority , což je jev, kdy je vlákno s vysokou prioritou nuceno čekat na vlákno s nízkou prioritou, které má výhradní přístup k požadovanému zdroji.

Naopak koncept transakční paměti je mnohem jednodušší, protože každou transakci lze posuzovat individuálně, jako jednovláknový výpočet. Zablokování je buď zcela zabráněno, nebo je řeší externí správce transakcí; o to se programátor nemusí starat. Inverze priority může být stále problémem, ale transakce s vysokou prioritou mohou zrušit konfliktní transakce s nízkou prioritou, které ještě nebyly potvrzeny.

Na druhou stranu nutnost přerušit neúspěšné transakce také ukládá omezení jejich chování: nemohou provádět žádnou operaci, kterou nelze vrátit zpět, včetně většiny I/O. Taková omezení jsou v praxi obvykle překonána vytvořením vyrovnávacích pamětí, které řadí nevratné operace do fronty a provádějí je o nějaký čas později mimo jakoukoli transakci. V Haskellu je toto omezení vynuceno systémem typů v době kompilace.

Skládací operace

V roce 2005 Tim Harris, Simon Marlow, Simon Peyton-Jones a Maurice Herlihy popsali systém STM postavený v Haskellu , který implementuje paralelismus. Tento systém umožňuje kombinovat libovolné atomické operace do větších atomových operací, což je užitečný koncept, který není možný s programováním zámků. Podle autorů:

„Možná nejzásadnější nevýhodou je, že zámkové programy se nemohou propojit: správné fragmenty nemusí při propojení fungovat. Zvažte například hašovací tabulku s vkládáním a mazáním bezpečným pro vlákna. Nyní předpokládejme, že chceme odstranit jeden prvek z tabulky t1 a vložit jej do tabulky t2, ale mezistav (ve kterém žádná tabulka tento prvek neobsahuje) by neměl být viditelný pro ostatní vlákna. Dokud návrhář hashovacích tabulek nestanoví tuto potřebu, neexistuje žádný způsob, jak tento požadavek uspokojit. Obecně platí, že každou správnou operaci (vložení, vymazání) nelze spojovat do větších správných operací.

— (Tim Harris a kol., „Operace přístupu ke složitelné paměti“, oddíl 2. Pozadí, str. 2)

S STM je tento problém vyřešen jednoduše: prostým spojením dvou operací v jedné transakci se ze sestavitelné operace stane atomická. Jediným kamenem úrazu je, že volajícímu, který nezná detaily implementace metod propojení, není jasné, kdy by se měl pokusit transakci opakovat, pokud k ní nedojde. V reakci na to autoři navrhli příkaz opakovat, který používá protokol transakcí (soubor protokolu) generovaný neúspěšnou transakcí k určení části paměti, kterou čte. Poté automaticky zahájí transakci znovu, když se jedno z těchto paměťových míst změní. To je založeno na logice, že transakce se nebude chovat jinak, dokud se nezmění alespoň jedna taková hodnota.

Autoři také navrhli mechanismus pro konstrukci alternativ (funkce orElse). Zahájí jednu transakci a pokud se transakce zopakuje, spustí druhou. Pokud se totéž stane druhému, mechanismus spustí oba znovu, dokud nenastane výrazná změna. Tato funkce, srovnatelná s funkcí select() standardu sítě POSIX, umožňuje volajícímu čekat na kteroukoli z mnoha událostí současně. Také zjednodušuje programování rozhraní, například tím, že poskytuje jednoduchý převodní mechanismus mezi blokujícími a neblokujícími operacemi.

Toto schéma bylo implementováno v Haskell kompilátoru GHC .

Doporučený pomocný jazyk

Koncepční jednoduchost systémů STM umožňuje programátorovi s nimi snadno pracovat pomocí relativně jednoduché syntaxe jazyka. Tim Harris a Keir Fraser ve své knize An Auxiliary Language for Lightweight Transactions navrhli myšlenku použití klasické podmíněné kritické oblasti (CCR) k reprezentaci transakcí. Ve své nejjednodušší podobě je to jen „atomový blok“, kus kódu, který je postupně spouštěn v jediném okamžiku:

// Atomicky vložit uzel do dvojitě propojeného seznamu atomový { newNode->prev = uzel; novyUzel->dalsi = uzel->dalsi; uzel->dalsi->prev = novyUzel; uzel->dalsi = novyUzel; }

Po dosažení konce bloku je transakce pokud možno potvrzena, jinak je ukončena a opakována. Podmíněné kritické oblasti také umožňují podmínku perzistence, která umožňuje transakci čekat, dokud se její úloha neprovede.

atomic (velikost fronty > 0) { odstranit položku z fronty a použít ji }

Pokud podmínka selže, správce transakcí počká, dokud nenastane další, která ovlivní podmínku, než to zkusí znovu. Tato volná komunikace mezi výrobci a spotřebiteli zlepšuje modularitu oproti jasné signalizaci mezi vlákny. Composable Memory Access jde dále pomocí příkazu opakování (viz výše), který může transakci kdykoli zrušit a před opakováním počkat, dokud nedojde k nějaké změně v hodnotě dříve načtené operací. Příklad:

atomový { if (velikost fronty > 0) { odstranit položku z fronty a použít ji } jinak { zkusit znovu } }

Tato možnost dynamického opakování na konci transakce zjednodušuje programovací model a otevírá nové možnosti.

Jedním z problémů je chování výjimek, když se šíří mimo transakce. V "A Composable Memory Access Operation" se autoři rozhodli, že by to mělo zrušit transakci, protože výjimky obvykle naznačují neočekávané chyby v Haskellu (se souběžným zpracováním), ale že tato výjimka může ukládat poskytnuté informace a číst je během transakce pro účely diagnostiky. Zdůrazňují, že další konstrukční rozhodnutí jsou rozumná i za jiných parametrů.

Transakční zamykání

STM lze implementovat jako bezuzamykatelný a uzamykatelný algoritmus. Existují dva typy blokování.

Uzamčení kolizí operací (Enals, Saha a Harris), kdy se zápisy do paměti provádějí tak, že se nejprve dočasně uzamkne daná oblast paměti, přímo se zapíší hodnoty a zaznamenají se do protokolu o vrácení operací.
Uzamčení transakce, které pouze zamyká paměťové buňky v průběhu fáze.

Schéma provádění transakcí nazvané „Transactional Locking-2“ a implementované společnostmi Dice, Shalev a Shavit využívá globální čas. Každá transakce začíná načtením aktuální časové hodnoty a uloží ji pro čtení. Poté se při každém čtení a zápisu porovnává verze zadané oblasti paměti s verzí pro čtení, a pokud je větší, transakce se zruší. Tím je zajištěno, že se kód spustí na příslušné kopii paměti. Během potvrzení jsou všechny oblasti čtení uzamčeny a hodnoty dané verze všech oblastí paměti pro zápis a čtení jsou znovu zkontrolovány. Nakonec se zvýší globální čas, nové hodnoty záznamu protokolu se zapíší zpět do paměti s novou verzí času.

Stále populárnější metodou pro správu transakčních konfliktů v transakční paměti , zejména v STM, je pořadí, ve kterém(CO). Používá se k dosažení bezuzamykatelného řazení (tj. žádné uzamčení konfliktních transakcí a pouze uzamčení potvrzení transakce) přeskupováním transakcí (např. Ramadan et al. 2009 a Zhang et al. 2006). Objednávání je základem pro správný stav transakční paměti (při paralelních transakcích). O STM pomocí „exekučního řádu“ již byly publikovány desítky prací a patentů.

"Zhang et al., 2006" je americký patent s názvem "Software pro objednávky transakcí a řízení konfliktů" (který odkazuje na Order Order US Patent 5,701,480). Zde jsou úryvky:

„Vyvíjejí se různé technologie a metody pro uplatnění pořadí provádění v softwarovém transakčním paměťovém systému. Systém transakční paměti programu je vybaven funkcí, na kterou lze aplikovat předem definované pořadí provádění mnoho operací. Předdefinované pořadí odevzdání se za běhu používá k určení pořadí, ve kterém provádět transakce v softwarovém transakčním paměťovém systému. Proces řízení konfliktů je vyvolán, když konflikt mezi první a druhou transakcí. Předdefinované pořadí odevzdání se používá v procesu řízení konfliktů, určit, která transakce by měla konflikt vyhrát a mít povolení pokračovat."

S pořadím odevzdání je požadované vlastnosti uspořádání dosaženo potvrzením transakcí pouze v chronologickém pořadí v souladu s pořadím priority (určené chronologickým pořadím operací v konfliktech)

Implementace

SRTM byl implementován (různé kvality a stability) v různých programovacích jazycích. Jako:

C/C++

TBoost.STM (dříve DracoSTM) Společné úsilí mezi CU-Boulder a Boost Libraries Group vytvořilo knihovnu pro C++ STM, primárně od Justina E. Gottschlicha a Jeremyho G. Sika.
TinySTM time-based STM a Tanger pro integraci STM s C a C++ prostřednictvím LLVM.
Lightweight Transaction Library (LibLTX), implementace pro C, (od Roberta Ennalse), hlavní důraz je kladen na efektivitu. Implementace je založena na jeho článcích „Softwarová transakční paměť by neměla být bez obstrukce“ a „Softwarová transakční paměť citlivá na mezipaměť“.
LibCMT , open source implementace C od Duilio Protti založená na „transakcích složené paměti“. Tato implementace také zahrnuje vazbu C# .
TARIFA je prototyp, který implementuje klíčové slovo „atomic“ v C/C++.
Intel STM Compiler Prototype Edition implementace STM pro C/C++ přímo v kompilátoru (Intel Compiler) pro Linux nebo Windows, generující 32 nebo 64bitový kód pro procesory Intel a AMD. Implementuje klíčové slovo "atomic" a také poskytuje způsoby, jak ozdobit definice funkcí (declspec) pro řízení/umožnění použití v "atomových" sekcích.
stmmap je implementace STM v jazyce C založená na sdílené paměti. Navrženo pro sdílení paměti mezi vlákny a/nebo procesy (nejen mezi vlákny v rámci procesu) pomocí transakční sémantiky. C++ implementuje vícevláknovou verzi tohoto alokátoru .
CTL implementace STM v C, založená na TL2, ale s mnoha rozšířeními a optimalizacemi.
Několik implementací od Tima Harrise a Keir Frasera , založených na myšlence od Language Support for Lightweight Transactions, Practical Lock Freedom a chystané nepublikované práci.
RSTM University of Rochester STM napsaná týmem vědců vedeným Michaelem L. Scottem .
G++ 4.7 již podporuje STM pro C/C++ přímo v kompilátoru. Tato funkce je stále experimentální, ale poskytuje funkce potřebné pro testování.

C#

Implementace SXM pro C# Microsoft Research . Dokumentace , Stránka ke stažení (nedostupný odkaz) .
LibCMT , implementace s otevřeným zdrojovým kódem (Duilio Protti) založená na „transakcích složené paměti“. Implementace také zahrnuje vazbu C# .
NSTM , softwarová transakční paměť .NET napsaná výhradně v C#, nabízí vnořené transakce a dokonce integraci s System.Transactions.
MikroKosmos Model orientovaný na ověřování Implementace STM v C#.

Clojure

Podpora Clojure STM je zabudována do jádra jazyka.

Common Lisp

CL-STM je multiplatformní implementace STM pro Common Lisp.

Haskell

Knihovna STM , jak je uvedeno v Composable Memory Transactions , je součástí platformy Haskell .

Java

Implementace AtomJava výzkumné skupiny SCAT .
JVSTM implementuje koncept verzovaných boxů navržený João Cachopo a Antóniem Rito Silvou, členy Software Engineering Group - INESC-ID
XSTM je open source pro Javu a .NET s rozšiřitelnou architekturou. XSTM je implementován jako knihovna a také poskytuje rozšíření pro oznamování změn, persistenci a replikaci objektů.
Vývojové prostředí Deuce pro Java Software Transakční paměť pomocí bajtkódu.
Multiverse Java 1.6+ založená na softwarové transakční paměti (STM). Tato implementace využívá Multi Version Concurrency Control (MVCC) jako paralelní kontrolní mechanismus.
DSTM2 Knihovna Dynamic STM společnosti Sun Lab.
Distribuce ObjectFabric STM.

OCaml

coThreads a zároveň programovací knihovna OCaml , nabízí jako modul STM (původně STMLib ). Stejně jako kteroukoli jinou komponentu v této knihovně lze modul STM použít ve spojení s vlákny na úrovni VM, což je systém vláken a procesů.

Perl

STM pro Perl 6 byl implementován v Pugs prostřednictvím knihovny STM překladače Glasgow Haskell Compiler .

Python

Durus je jednoduchá, ale kompletní a rychlá implementace STM pro Python , která umožňuje použití STM v rámci jednoho procesu a STM v architektuře server/více klient. Kromě formátu embedded paměti jsou k dispozici i další, například Berkeley DB zde .
Fork of CPython s atomovými zámky Archivováno 25. března 2012 na Wayback Machine - Armin Rigo vysvětluje svůj patch CPython v e-mailu na seznam pypy-dev .
pypy-stm Archivováno 5. prosince 2013 na Wayback Machine , doplněk PyPy s funkční implementací interpretu Python 2.7, který podporuje současné spouštění vláken existujících vícevláknových aplikací na různých jádrech CPU.

scala

ScalaSTM Lehká knihovna STM pro Scala.
RadonSTM STM for Scala, který byl implementován v rámci projektu Activate Framework

Smalltalk

GemStone/S [1] Server transakční paměti pro Smalltalk.

Jiné jazyky

Fortress jazyk vyvinutý společností Sun, používá DSTM2
STM.NET

Poznámky

↑ Tom Knight. Architektura pro většinou funkcionální jazyky. Archivováno 1. listopadu 2013 na Wayback Machine Proceedings konference ACM o LISP a funkcionálním programování v roce 1986.
↑ Maurice Herlihy a J. Eliot B. Moss. Transakční paměť: architektonická podpora pro datové struktury bez zámku. Sborník příspěvků z 20. ročníku mezinárodního sympozia o počítačové architektuře (ISCA '93). Ročník 21, číslo 2, květen 1993.
↑ Simon Peyton-Jones. Programování ve věku souběžnosti: softwarová transakční paměť . Kanál 9. Získáno 9. června 2007. Archivováno z originálu dne 2. září 2012. (neurčitý)

Odkazy

Morry Katz, PARATRAN: Transparentní transakční runtime mechanismus pro paralelní provádění Scheme , MIT LCS, 1989
Nir Shavit a Dan Touitou. Softwarová transakční paměť . Proceedings of the 14th ACM Symposium on Principles of Distributed Computing , pp. 204–213. Srpen 1995. Papír pocházející z STM.
Maurice Herlihy, Victor Luchangco, Mark Moir a William N. Scherer III. Softwarová transakční paměť pro dynamické datové struktury . Sborník z 22. výročního sympozia ACM SIGACT-SIGOPS o principech distribuovaného počítání (PODC) , 92-101. června 2003
Tim Harris a Keir Fraser. Jazyková podpora pro jednoduché transakce . Objektově orientované programování, systémy, jazyky a aplikace , str. 388–402. října 2003.
Tim Harris, Simon Marlow, Simon Peyton Jones a Maurice Herlihy. Transakce složenou pamětí . ACM Symposium o principech a praxi paralelního programování 2005 (PPoPP'05). 2005.
Robert Annals. Softwarová transakční paměť by neměla být bez překážek .
Michael L. Scott a kol. Snížení režie neblokující softwarové transakční paměti poskytuje dobrý úvod nejen do RSTM, ale také do stávajících přístupů STM.
Torvald Riegel a Pascal Felber a Christof Fetzer, Lazy Snapshot Algorithm with Eager Validation představuje první STM založený na čase.
Dave Dice, Ori Shalev a Nir Shavit. Transakční zamykání II .
Knight, TF, Architektura pro většinou funkcionální jazyky , konference ACM Lisp a funkční programování, srpen 1986.
Knight, TF, Systém a metoda pro paralelní zpracování s většinou funkčními jazyky, US Patent 4,825,360, duben, 1989.
Ali-Reza Adl-Tabatabai, Christos Kozyrakis, Bratin Saha, Unlocking concurrency , ACM Queue 4, 10 (prosinec 2006), str. 24–33. Spojuje vícejádrové procesory a výzkum/zájem o STM dohromady.
James R Larus, Ravi Rajwar, Transactional Memory , Morgan and Claypool Publishers, 2006.
Leonid Černyak. Transakční paměť - první kroky // Open Systems, č. 04, 2007