OLAP kostka

OLAP kostka  - ( On -Line A nalytical Processing - interaktivní analýza dat ) vícerozměrné pole dat , obvykle řídké a dlouhodobě uložené, používané v OLAP . Může být implementován na základě univerzálního relačního DBMS nebo specializovaného softwaru .

Indexy pole odpovídají rozměrům (rozměrům) nebo osám krychle a hodnoty prvků pole odpovídají mírám (mírám) krychle.

w  : ( x , y , z ) → w xyz ,

kde x , y , z  jsou míry, w  je míra.

Na rozdíl od běžného pole v programovacím jazyce může být přístup k prvkům OLAP krychle prováděn jak prostřednictvím celé sady indexových dimenzí, tak pomocí jejich podmnožiny. Výsledkem pak nebude jeden prvek, ale jejich množina, což je argument pro agregační funkci [1] :

W  : ( x , y ) → W = { w z1 , w z2 , …, w zn }

Známý je také popis OLAP krychle pomocí terminologie relační algebry, jako projekce vztahů .

Vzhledem k vztahu řádu N uvažujme projekci s rozměry X , Y a Z jako klíčem a W jako atributem delta. To se vyznačuje funkcí:

W  : ( X , Y , Z ) → W ,

jehož atributy ( X , Y a Z ) odpovídají ose krychle a hodnoty W pro každou možnou trojici ( ( X, Y, Z) ) odpovídají datům každé buňky krychle.

Protože dvourozměrná výstupní zařízení neumí řešit tři rozměry, je praktičtější promítat "výřezy" krychle (projekce se používá ve smyslu zmenšení počtu rozměrů matice - krychle), třeba ve tvaru

W  : ( X , Y ) → W

Tato projekce nemá primární klíč . Je tedy možná nejednoznačnost funkce. Ořez ternární funkční reprezentace o určitou hodnotu Z je však velmi důležitý.

Důvodem pro prezentaci dat jako OLAP je rozšířené použití paradigmatu sestav s kartami (neboli kontingenční tabulky ). Uživatelé chtějí vidět data prezentovaná jako stránky, na kterých (téměř jako tabulkový editor ) je horní řádek vyplněn hodnotami X ; hodnoty ​​Y  - sloupec zcela vlevo; a hodnoty ​​W : (X, Y) -> W naplní zbytek tabulky. Je také možné použít DML z tradičního SQL k zobrazení trojic (X, Y, W) , i když to není tak pohodlný formát jako sestava s kartami, protože reprezentace DML vyžaduje lineární vyhledávání v seznamu požadovaného páru ( X, Y) a pro stránkování potřebuje najít průsečík sloupce X s řádkem Y

Jazyk MDX (Multidimensional Expressions) byl vyvinut jako odlehčený nástroj pro reprezentaci OLAP. Některé dotazy je možné převést na tradiční SQL, i když je často nutné používat velké dotazy s mnoha složitými strukturami. Většina dodavatelů OLAP podporuje MDX.

Poznámky

  1. Tarasov S. V. DBMS pro programátora. Databáze zevnitř. — M.: SOLON-Press, 2015. — 320 s. - ISBN 978-2-7466-7383-0 .

Literatura

Viz také