Anscombův kvartet jsou čtyři soubory numerických dat, jejichž jednoduché statistické vlastnosti jsou identické, ale jejich grafy jsou výrazně odlišné. Každá sada se skládá z 11 dvojic čísel. Kvarteto sestavil v roce 1973 anglický matematik F. J. Anscombe , aby ilustroval důležitost vykreslování pro statistickou analýzu a dopad odlehlých hodnot na vlastnosti celého souboru dat.
Všechny sady mají následující vlastnosti:
Charakteristický | Význam |
---|---|
Proměnný průměr | 9,0 |
Rozptyl proměnné | 10,0 |
Proměnný průměr | 7.5 |
Rozptyl proměnné | 3,75 |
Korelace mezi proměnnými a | 0,816 |
Přímá lineární regrese | |
Koeficient stanovení lineární regrese | 0,67 |
Samotné sekvence jsou uvedeny níže. Hodnota je stejná pro první tři sekvence.
já | II | III | IV | ||||
---|---|---|---|---|---|---|---|
X | y | X | y | X | y | X | y |
10,0 | 8.04 | 10,0 | 9.14 | 10,0 | 7.46 | 8,0 | 6.58 |
8,0 | 6,95 | 8,0 | 8.14 | 8,0 | 6,77 | 8,0 | 5,76 |
13,0 | 7,58 | 13,0 | 8,74 | 13,0 | 12,74 | 8,0 | 7,71 |
9,0 | 8,81 | 9,0 | 8,77 | 9,0 | 7.11 | 8,0 | 8,84 |
11.0 | 8.33 | 11.0 | 9.26 | 11.0 | 7,81 | 8,0 | 8,47 |
14.0 | 9,96 | 14.0 | 8.10 | 14.0 | 8,84 | 8,0 | 7.04 |
6.0 | 7.24 | 6.0 | 6.13 | 6.0 | 6.08 | 8,0 | 5.25 |
4,0 | 4.26 | 4,0 | 3.10 | 4,0 | 5.39 | 19.0 | 12,50 |
12.0 | 10,84 | 12.0 | 9.13 | 12.0 | 8.15 | 8,0 | 5.56 |
7,0 | 4,82 | 7,0 | 7.26 | 7,0 | 6.42 | 8,0 | 7,91 |
5,0 | 5.68 | 5,0 | 4,74 | 5,0 | 5,73 | 8,0 | 6,89 |