Panelová data [1] [2] nebo longitudinální data [2] jsou vícerozměrná data používaná v sociálních vědách a ekonometrii , získaná sérií měření nebo pozorování během několika časových období pro stejné společnosti nebo osoby. Studie využívající panelová data se nazývá panelová studie .
Člověk | Rok | Příjem | Stáří | Podlaha |
---|---|---|---|---|
Č.1 | 2016 | 1300 | 27 | jeden |
Č.1 | 2017 | 1600 | 28 | jeden |
Č.1 | 2018 | 2000 | 29 | jeden |
č. 2 | 2016 | 2000 | 38 | 2 |
č. 2 | 2017 | 2300 | 39 | 2 |
č. 2 | 2018 | 2400 | 40 | 2 |
Člověk | Rok | Příjem | Stáří | Podlaha |
---|---|---|---|---|
Č.1 | 2016 | 1600 | 23 | jeden |
Č.1 | 2017 | 1500 | 24 | jeden |
č. 2 | 2016 | 1900 | 41 | 2 |
č. 2 | 2017 | 2000 | 42 | 2 |
č. 2 | 2018 | 2100 | 43 | 2 |
číslo 3 | 2017 | 3300 | 34 | jeden |
Níže uvedený příklad ukazuje dvě sady dat shromážděných ve struktuře panelu. Jednotlivé charakteristiky (příjem, věk, pohlaví) se shromažďují pro různé osoby a různé roky. V prvním datovém souboru jsou dva lidé (#1, #2) sledováni každý rok po dobu tří let (2016, 2017, 2018). V druhém souboru dat jsou tři lidé (č. 1, #2, #3) viděni dvakrát (osoba #1), třikrát (osoba #2) a jednou (osoba #3) v průběhu tří let (2016 , 2017, 2018); konkrétně chybí údaje za rok 2018 pro osobu č. 1 a za roky 2016 a 2018 pro osobu #3.
Vyvážený panel [3] (první příklad) je soubor dat, ve kterém je každý rok sledován každý člen skupiny (tj. osoba). Pokud tedy vyvážený panel obsahuje N jednotek pozorování a T období, počet pozorování (n) v souboru dat bude nutně n = N × T [4] .
Nevyvážený panel [3] (druhá datová sada v příkladu) je datová sada, ve které alespoň jeden člen skupiny nemá data za všechna období. Pokud tedy nevyvážený panel obsahuje N jednotek pozorování a T období, pak počet pozorování (n) v souboru dat je přísně nižší než jejich součin: n < N × T [4] .
Obě datové sady jsou strukturovány v dlouhém formátu, kde jeden řádek obsahuje vždy jedno pozorování. Dalším způsobem, jak strukturovat data panelu, je široký formát, kde jeden řádek představuje jednu jednotku pozorování pro všechny časové body [5] (například v širokém formátu budou pouze dva (první příklad) nebo tři (druhý příklad) řádky dat s dalšími sloupci pro každou časovou proměnnou (příjem, věk).