Anscombe Quartet

Anscombův kvartet  jsou čtyři soubory numerických dat, jejichž jednoduché statistické vlastnosti jsou identické, ale jejich grafy jsou výrazně odlišné. Každá sada se skládá z 11 dvojic čísel. Kvarteto sestavil v roce 1973 anglický matematik F. J. Anscombe , aby ilustroval důležitost vykreslování pro statistickou analýzu a dopad odlehlých hodnot na vlastnosti celého souboru dat.

Všechny sady mají následující vlastnosti:

Charakteristický Význam
Proměnný průměr 9,0
Rozptyl proměnné 10,0
Proměnný průměr 7.5
Rozptyl proměnné 3,75
Korelace mezi proměnnými a 0,816
Přímá lineární regrese
Koeficient stanovení lineární regrese 0,67

Samotné sekvence jsou uvedeny níže. Hodnota je stejná pro první tři sekvence.

Anscombe Quartet
II III IV
X y X y X y X y
10,0 8.04 10,0 9.14 10,0 7.46 8,0 6.58
8,0 6,95 8,0 8.14 8,0 6,77 8,0 5,76
13,0 7,58 13,0 8,74 13,0 12,74 8,0 7,71
9,0 8,81 9,0 8,77 9,0 7.11 8,0 8,84
11.0 8.33 11.0 9.26 11.0 7,81 8,0 8,47
14.0 9,96 14.0 8.10 14.0 8,84 8,0 7.04
6.0 7.24 6.0 6.13 6.0 6.08 8,0 5.25
4,0 4.26 4,0 3.10 4,0 5.39 19.0 12,50
12.0 10,84 12.0 9.13 12.0 8.15 8,0 5.56
7,0 4,82 7,0 7.26 7,0 6.42 8,0 7,91
5,0 5.68 5,0 4,74 5,0 5,73 8,0 6,89

Viz také

Odkazy