Skladování sloupců

Stabilní verze byla zkontrolována 7. srpna 2022 . Existují neověřené změny v šablonách nebo .

Sloupcové úložiště  je způsob organizace úložiště v databázích , kdy se data neukládají řádek po řádku (řádek po řádku), ale sloupec po sloupci. Je nejúčinnější pro operace výběru dat z malé podmnožiny sloupců s jejich následným zpracováním sloupec po sloupci, stejně jako pro kompresi dat (protože sloupce často ukládají duplicitní nebo uzavírací data). Vkládání velkého počtu řádků lze efektivně implementovat, ale jednotlivé operace vkládání, aktualizace a odstraňování jsou méně efektivní v úložišti sloupců než v úložišti řádků.

Columnar DBMS  je systém pro správu databází, který podporuje sloupcové úložiště. Tradiční relační DBMS obvykle používají úložiště řádků, které je efektivní proscénáře OLTP , zatímco pro úlohy OLAP má úložiště sloupců tendenci poskytovat lepší výkon.

Mezi relační sloupcové DBMS patří Teradata Database , Netezza , Sybase IQ , kdb , C-Store (a jeho potomek Vertica ), Greenplum , Hana , ParAccel (a jeho potomek Amazon Redshift ), MonetDB , ClickHouse . Řada tradičních relačních DBMS implementuje sloupcové úložiště ( Oracle Database , MS SQL Server , MariaDB ) nebo existují doplňky (například Citus pro PostgreSQL ). Hlavní formáty Hadoop - RCFIle , ORC , Parquet , Apache Arrow  - také používají sloupcovou organizaci. Sloupcové DBMS jsou řada systémů zaměřených na práci s časovými řadami ( InfluxDB , Apache Druid ).

Odkazy