Iluze shlukování

Iluze shlukování  je kognitivní zkreslení, tendence mylně předpokládat, že nevyhnutelné „pásy“ nebo „shluky“ hodnot, které se vyskytují v malých vzorcích z náhodných distribucí, nejsou náhodné. Tato iluze je způsobena lidskou tendencí podceňovat míru variability, která se může objevit v malém vzorku náhodných nebo pseudonáhodných dat.

Esence

Iluze shlukování je lidská tendence očekávat, že náhodné události se budou jevit pravidelnější nebo jednotnější, než ve skutečnosti jsou, což vede k předpokladu, že shluky nebo vzory v datech nemohou být způsobeny pouze náhodností.

Důležitým příkladem shlukování je, že hvězdy na noční obloze se v některých oblastech zdají jasnější a přeplněnější, zatímco v jiných oblastech jsou „prázdná“ místa. V iluzi hvězdokupy se jednoduše očekává, že pro to musí existovat nějaké fyzikální vysvětlení (například hvězdy musí být fyzicky seskupeny v prostoru), protože „se nezdají být skutečně náhodné“. Pozice hvězd je však náhodná a naše představa o systému je chybná.

Výzkum

Thomas Gilovich , časný výzkumník na toto téma, tvrdil, že iluze shlukování nastává s různými typy náhodných odchylek, včetně dvourozměrných dat, jako jsou shluky na místech bombardování V-1 na mapách Londýna během druhé světové války ; nebo při hodnocení vzorců kolísání cen na akciovém trhu v čase [1] .

Přestože Londýňané vyvinuli specifické teorie o povaze bombových útoků v Londýně, statistická analýza R. D. Clarka, poprvé publikovaná v roce 1946 , ukázala, že rozložení bomb se blíží matematické náhodnosti [2] [3] [4] [5] .

Podle odvětví matematiky známého jako Ramseyova teorie není úplná náhodnost možná v žádném fyzikálním systému. Bylo by však správnější tvrdit, že iluze shlukování odkazuje na přirozenou lidskou tendenci spojovat nějakou hodnotu s určitými vzory, které se nevyhnutelně musí objevit v každém dostatečně velkém souboru dat.

Většina lidí například tvrdí, že sekvence „OXXXOXXXOXXOOOXOOXXOO“ není náhodná, i když ve skutečnosti má mnoho kvalit, které by mohly být také charakteristikami toho, co bychom viděli v „náhodném“ proudu hodnot, jako je například stejný počet hodnot. každou hodnotu a skutečnost, že počet sousedních shluků se stejným výsledkem je stejný pro oba možné výsledky. U takových sekvencí se zdá, že lidé očekávají, že uvidí více změn, než by se statisticky předpovídalo. Ve skutečnosti je u malého počtu pokusů variabilita a nenáhodně vyhlížející „shluky“ docela pravděpodobné.

Dalším příkladem jsou odpovědi SAT , standardizovaného testu s více možnostmi výběru ve Spojených státech , ve kterém jsou otázky záměrně rozmístěny tak, aby neobsahovaly žádné dlouhé sekvence. V důsledku toho může student pociťovat tlak, aby zvolil špatnou odpověď.

Existence vzorů v lidském hodnocení souboru dat může být často určena pomocí statistické analýzy nebo dokonce techniky kryptoanalýzy.

Zvažte sekvenci "XXOXOXOOOXOXOOOXOX"; je náhodná? Odpověď je ne; pokud spojíte pozici "X" v řetězci s prvočísly a "O" - se složenými čísly počínaje číslem 2, vzor je zřejmý. Počítačové programy, které čtou a komprimují data, jsou v určitém smyslu navrženy tak, aby v datech „hledaly vzory“ a vytvářely alternativní reprezentace, ze kterých lze z komprimované formy rekonstruovat původní data. U velkých datových sad, které obsahují „shluky“ nenáhodné povahy, lze očekávat, že se budou dobře komprimovat pomocí správného kódovacího algoritmu. Na druhou stranu, pokud v konkrétní datové sadě není žádné skutečné shlukování nebo vzor, ​​lze očekávat, že se komprimuje špatně, pokud vůbec.

Iluze shlukování byla ústředním bodem vysoce propagovaného výzkumu Thomase Giloviche, Roberta Valloneho a Amose Tverského . Jejich závěr odhalil iluzi „horké ruky“ v basketbalu tím, že prokázal, že rozdělení výsledků je nerozeznatelné od náhodnosti [6] . Prominentní trenéři, včetně Bobbyho Knighta, se tomuto nápadu údajně také vysmívali.

Podobné kognitivní zkreslení

Použití této kognitivní zaujatosti při studiu příčinné souvislosti může vést k chybám, a to i mezi odstřelovači.

Častějšími formami chyb v rozpoznávání vzorů jsou pareidolie a apotenie . Související předsudky souvisí s iluzí kontroly, ke které může iluze shlukování přispívat, a necitlivostí na velikost vzorku, kdy lidé neočekávají větší změny v malých vzorcích. Další kognitivní zaujatost spojená s nepochopením náhodných proudů informací se nazývá chyba hráče .

Možné důvody

Daniel Kahneman a Amos Tversky přišli na důvody této iluze a zjistili, že nesprávná předpověď založená na shlukování je způsobena heuristickou reprezentativností (jejíž byli také průkopníky). Zjevná přítomnost řádků nebo sekvencí v distribuci dat tam, kde žádné nejsou, může být pro investory problematická. Důvodem je, že investor může období vysokých výnosů interpretovat jako trend, i když ve skutečnosti jde jen o zlomek běžné změny výnosů. Iluze shlukování vytváří pasti na investory. Krátkodobá data o růstu cen (od několika měsíců až po několik let) nás mohou přesvědčit o atraktivitě určité třídy investic, jako jsou akcie, dluhopisy nebo nemovitosti.

To může ovlivnit styl investování – například low cap vs. high cap, nebo růst vs. value investování. Může dokonce přesvědčit investora, že konkrétní správce peněz je neomylný génius, když jeho nebo její výsledky lze přičíst pouze čistému štěstí.

Při vyhodnocování statistických dat získaných ve vědeckém výzkumu je navíc nutné brát v úvahu iluzi shlukování. Jak relevantní a přesný je zdánlivý „vzorek“ ve skutečnosti často závisí na tom, jak velká byla původní velikost vzorku populace.

Například při odhadu prevalence schizofrenie v určité etnické skupině by bylo spolehlivější podívat se na vzorek několika tisíc lidí než na jednoho ze 100 lidí. Výběrem pouze 100 lidí a pozorováním patnácti lidí se schizofrenií by výzkumník mohl dojít k závěru, že schizofrenií trpí neuvěřitelných 15 % populace – to by byl další projev iluze shlukování. Zatímco výběr tisíce lidí by s největší pravděpodobností vyústil ve skutečné, typické 1% procento schizofreniků, což je případ většiny etnických lidí. Velký vzorek populace usnadňuje extrapolaci přesných čísel a zabraňuje iluzi shlukování.

Poznámky

  1. Kahneman, Daniel; Amos Tversky. Subjektivní pravděpodobnost: Úsudek o reprezentativnosti  (anglicky)  // Cognitive Psychology : journal. - 1972. - Sv. 3 , ne. 3 . - str. 430-454 . - doi : 10.1016/0010-0285(72)90016-3 .
  2. Clarke, R.D. Aplikace Poissonova rozdělení  (neurčité)  // Journal of the Institute of Actuaries. - 1946. - T. 72 . - S. 481 .
  3. Gilovich, 1991 s. 19
  4. Mori, Kentaro Vidění vzorů . Získáno 3. března 2012. Archivováno z originálu dne 24. února 2020.
  5. Bombardování Londýna (downlink) . Datum přístupu: 3. března 2012. Archivováno z originálu 21. února 2012. 
  6. Gilovich, T., Vallone, R. & Tversky, A. (1985). Horká ruka v basketbalu: O špatném vnímání náhodných sekvencí. Kognitivní psychologie 17, 295-314.

Viz také