Odolnost proti chybám
Aktuální verze stránky ještě nebyla zkontrolována zkušenými přispěvateli a může se výrazně lišit od
verze recenzované 2. dubna 2020; kontroly vyžadují
15 úprav .
Odolnost vůči poruchám je vlastnost technického systému udržet si svůj výkon i po poruše jedné nebo více jeho součástí [1] .
Koncept odolnosti proti chybám ve strojírenství
Tolerance poruch je určena počtem jednotlivých poruch komponentů (prvků) systému, po jejichž vzniku je zachována provozuschopnost systému jako celku. Základní úroveň odolnosti proti poruchám znamená ochranu proti selhání kteréhokoli prvku. Proto je hlavním způsobem, jak zlepšit odolnost proti chybám, redundance . Redundance je nejúčinněji implementována v hardwaru pomocí redundance . V řadě oblastí techniky je odolnost proti chybám pomocí redundance povinným požadavkem, který ukládají státní regulační orgány na technické systémy [2] .
U vysoce rizikových technických systémů je zvláštním případem odolnosti proti poruchám bezpečnost poruch - schopnost systému v případě selhání některé ze svých komponent přejít do provozního režimu, který nepředstavuje nebezpečí pro lidi, prostředí nebo majetek. V reálných systémech lze tyto dvě vlastnosti posuzovat společně.
Charakteristiky odolnosti proti poruchám
Vlastnost odolnosti proti chybám je spojena s následujícími technickými charakteristikami:
- faktor dostupnosti , který ukazuje, jaký podíl z celkové životnosti je systém v provozním stavu;
- indikátory spolehlivosti systému , které určují pravděpodobnost bezporuchového provozu nebo pravděpodobnost určitých typů poruch systému nebo jeho prvků za určité časové období.
Architektura odolná proti poruchám z hlediska inženýrství je způsob, jak budovat systémy odolné proti poruchám, které zůstávají funkční (pravděpodobně s poklesem účinnosti), když prvky selžou [3] . Termín se často používá při tvorbě počítačových systémů, které nadále pracují s možným snížením propustnosti nebo prodloužením doby odezvy v případě selhání části prvků systému (problémy s hardwarem nebo softwarem ). Architektura odolná proti chybám v počítačích se používá například v procesu replikace .
Stejně tak nosné konstrukce využívají konstrukce, které si zachovávají svou celistvost a nosnost při poškození korozí nebo únavou , výrobními vadami nebo náhodným poškozením.
Opatření týkající se odolnosti proti poruchám lze implementovat i na úrovních prvků systému. Například na autě navrženém tak, aby neztratilo kontrolu, když jedna z pneumatik selže, obsahuje každá pneumatika pryžové jádro, které jim umožňuje fungovat po omezenou dobu a při snížené rychlosti.
Redundance
Redundance se nazývá funkčnost, která není nutná pro bezproblémový chod systému [4] .
Příkladem jsou náhradní díly, které se automaticky uvádějí do provozu, pokud se hlavní porouchá. Zejména velké nákladní vozy mohou přijít o pneumatiku bez vážnějších následků. Mají nainstalované hodně pneumatik a ztráta jedné není kritická (kromě předního páru, který se používá v zatáčkách). Myšlenku zahrnutí redundantních částí ke zvýšení spolehlivosti systému poprvé navrhl John von Neumann v 50. letech [5] .
Existují dva typy redundance [6] : prostorová a časová. Prostorová redundance je realizována zavedením dalších komponent, funkcí nebo dat, která nejsou potřebná pro bezproblémový provoz. Další (nadbytečné) komponenty mohou být hardware, software a informace . Dočasná redundance je realizována přepočtem nebo odesláním dat, po kterém je výsledek porovnán s uloženou kopií předchozího.
Kritéria rozhodování o odolnosti
Navrhování konstrukcí odolných proti poruchám něco stojí: zvýšená hmotnost, náklady, spotřeba energie, náklady a čas strávený navrhováním, kontrolou a testováním. Pro určení, které části systému by měly být navrženy tak, aby byly odolné vůči chybám, existuje řada kritérií [7] :
- Jak důležitý je prvek? Například v soukromém autě není rádio nezbytnou součástí řízení, takže nemusí být odolné vůči poruchám.
- Jaká je pravděpodobnost, že prvek selže? Některé konstrukční prvky, například kardanový hřídel automobilu, se zlomí velmi zřídka, a proto nevyžadují odolnost proti poruchám.
- Jak drahé bude převzetí služeb při selhání? Například zajištění odolnosti proti poruchám u motorových systémů osobních automobilů není odůvodněné náklady na vytvoření a provoz (velikost, hmotnost, kontroly, cena, kontroly a inspekce ve fázi provozu).
Příkladem předmětu, který prošel celou cestou, jsou bezpečnostní pásy . Primární metodou zadržování osob v jakémkoli vozidle je gravitace , ale v případě převrácení nebo jiných silových sil nemusí primární metoda omezení fungovat. Sekundární systém, který v takových podmínkách udržuje lidi na místě, zvyšuje jejich bezpečnost – tím je potvrzen první bod. Případy vymrštění osob při nehodě, jako je auto, byly před zavedením bezpečnostních pásů běžné, což potvrzuje druhý bod. Cena instalace bezpečnostních pásů je nízká jak z hlediska nákladů, tak z hlediska vyrobitelnosti, což potvrzuje třetí bod. V důsledku toho můžeme dojít k závěru, že instalace bezpečnostních pásů na všechna vozidla je rozumným opatřením.
Hardwarová odolnost někdy vyžaduje, aby byly vadné části odstraněny a nahrazeny novými, zatímco systém pokračuje v provozu (známé v počítačovém světě jako hot swapping ). V takových systémech musí být střední doba mezi poruchami dostatečně dlouhá, aby umožnila dokončení opravy dříve, než selže i redundantní část.
Nevýhody systémů odolných proti chybám
Výhody technických řešení odolných proti poruchám jsou zřejmé, ale mají také své nevýhody.
- Obtíže při odhalování skrytých poruch redundantních prvků. Řidič auta si například nemusí všimnout propíchnutí pneumatiky, pokud je použit jakýkoli bezpečnostní systém. Problém lze vyřešit přidáním speciálního systému pro detekci poruch (v případě pneumatiky systém hlídá tlak v komorách a při jeho poklesu upozorní řidiče). Alternativou by bylo naplánovat prohlídky a kontroly k odhalení a prevenci skrytých poruch a poškození, jako jsou řidičské kontroly pneumatik při každé zastávce vozidla.
- Potíže při kontrole vícenásobných poruch. Odolnost proti chybám jednoho prvku může narušovat detekci poruch jiného prvku. Pokud například část B provádí nějakou operaci na základě dat z části A , pak pracovní část B může skrýt problém, který se objevil v části A . Pokud je část B následně nahrazena méně spolehlivou, systém může náhle selhat, přičemž se bude zdát, že problém spočívá v nové části B. A teprve po důkladné kontrole systému se ukáže, že problém byl v části A.
- Zvýšené riziko ignorování známých poruch. I když si je obsluha vědoma přítomnosti poruchy redundantního prvku systému odolného proti poruchám, může být pomalá při jejím odstraňování, protože systém funguje. To nakonec povede k úplnému selhání systému, když selžou všechny prvky redundance.
- Obtížnost ověření. Pro některé kritické bezpečnostní systémy, jako je jaderný reaktor , neexistuje snadný způsob, jak zajistit, aby byly redundantní prvky funkční. Nechvalně známým příkladem je havárie v Černobylu , kdy operátoři testovali systém nouzového chlazení odstavením hlavního a pomocného systému. Havarijní systém to nevydržel, což mělo za následek přehřátí reaktoru a velký únik radiace.
- Rostoucí náklady. Opatření v oblasti odolnosti proti chybám zvyšují náklady na životní cyklus systému v důsledku zvýšení nákladů na vývoj a testování, zvýšení spotřeby hmoty a materiálu, ceny systému, dodatečné náklady na údržbu a opravy atd. Například kosmické lodě s lidskou posádkou mají více redundantních systémů a prvků, což zvyšuje jejich hmotnost ve srovnání s bezpilotními prostředky, které nevyžadují tuto úroveň zabezpečení proti selhání.
- Riziko použití nekvalitních prvků. Architektura odolná proti chybám může umožnit použití nekvalitních komponent, které by jinak učinily systém nepoužitelným. Zatímco tento postup lze použít k omezení nárůstu nákladů, použití více takových částí může snížit spolehlivost systému a způsobit neplánované náklady na fázi.
Viz také
Poznámky
- ↑ GOST R 56111-2014 Integrovaná logistická podpora pro exportované vojenské produkty. Číselník ukazatelů provozních a technických vlastností . Standartinform (2015). Získáno 16. května 2020. Archivováno z originálu dne 21. ledna 2022. (neurčitý)
- ↑ Egor Sergejevič Sogomonjan. Samokontrolní zařízení a systémy odolné proti poruchám . - Rozhlas a komunikace, 1989. - 207 s. — ISBN 9785256003081 .
- ↑ Johnson, BW "Fault-Tolerant Microprocessor-Based Systems", IEEE Micro (1984), sv. 4, č. 6, str. 6-21
- ↑ Laprie, JC (1985). "Dependable Computing and Fault Tolerance: Concepts and Terminology", Proceedings of 15th International Symposium on Fault-Tolerant Computing (FTSC-15), pp. 2-11
- ↑ von Neumann, J. (1956). "Pravděpodobnostní logika a syntéza spolehlivých organismů z nespolehlivých součástí", v Automata Studies, eds. C. Shannon a J. McCarthy, Princeton University Press, str. 43-98
- ↑ Avizienis, A. (1976). Fault-Tolerant Systems, IEEE Transactions on Computers, sv. 25, č. 12, str. 1304-1312
- ↑ Dubrová, E. (2013). "Design odolný vůči chybám", Springer, 2013, ISBN 978-1-4614-2112-2
Odkazy
Literatura
- Slovník kybernetiky / Edited by akademik V. S. Mikhalevich . - 2. - Kyjev: Hlavní vydání Ukrajinské sovětské encyklopedie pojmenované po M. P. Bazhanovi, 1989. - 751 s. - (C48). — 50 000 výtisků. - ISBN 5-88500-008-5 .
Slovníky a encyklopedie |
|
---|