Jak lhát se statistikami

Jak lhát se statistikami
Autor Darell Huff
Původní jazyk Angličtina
Originál publikován 1954
Výzdoba Irving Geis
Vydavatel W. W. Norton & Company Inc.
Stránky 142
ISBN 0-393-31072-8

How to Lie with Statistics  je kniha od Darella Huffa .v roce 1954. Hovoří o různých způsobech, jakými lze statistiky zneužít k klamání publika a manipulaci s jejich názory. Uvažuje se o mnoha konkrétních příkladech, především z amerického života (reklama, politika, propaganda a agitace).

První epigraf ke knize je citát hraběte Beaconsfielda (B. Disraeli) o statistice: "Existují tři druhy lží: lži, do očí bijící lži a statistiky."

Kniha je určena pro laického čtenáře a je opatřena názornými ilustracemi. Materiál je podán názorně a přístupnou formou, což knize zajistilo vysokou popularitu – jde o jednu z nejrozšířenějších publikací o statistice druhé poloviny 20. století [1] .

Obsah

Vzorek je ze své podstaty zaujatý

Vysvětlení toho, co je to sampling , jak tazatelé nevědomě vybírají zpovídané a ovlivňují jejich odpovědi.

Dobře zvolený průměr

Uvažují se tyto typy průměru:

Příklady ukazují, jak volba typu střední hodnoty ovlivňuje její hodnotu pro stejné vzorky. Upozorňuje se na možnost manipulace s nepřipraveným čtenářem volbou „pohodlného“ (pro manipulátora) typu průměru.

Nuance, které jsou skromně tiché

V této kapitole se autor zamýšlí nad důležitými nuancemi statistického výzkumu, které jsou v článcích určených široké veřejnosti často záměrně či nevědomě opomíjeny.

Je vysvětlena důležitost velikosti vzorku a její vztah k typu populace. Jsou uvedeny příklady manipulace s velikostí vzorku:

Představují se pojmy:

Na příkladu Hesselovy vývojové škályhovoří o nebezpečí vnímání bodového (mimo intervalového) hodnocení průměrné hodnoty – rodiče začnou panikařit, pokud jejich dítě normu (průměrnou hodnotu) nesplňuje.

Je třeba upozornit na důležitost formulací v článcích založených na statistikách. Jako příklad uveďme prohlášení společností dodávajících elektřinu (1948): "Elektrická energie je dostupná pro více než 3/4 farem ve Spojených státech." Slovo „dostupný“, které není v aplikaci nijak definováno, ztrácí význam – obvykle znamená, že elektrické vedení se nachází ve vzdálenosti 16–160 km od farmy, ale něco jinak lze chápat jako dostupnost. Autor také poznamenává, že při interpretaci stejných dat by bylo možné klást opačný důraz a napsat: "Elektrická energie není dostupná čtvrtině amerických farem."

Kapitola končí připomenutím důležitosti mít čísla v grafech – graf růstu zisků společnosti za několik let (uveřejněný v časopise Fortune) čtenáři nic neřekne, protože na ose y chybí číselná označení. Z takového grafu nelze poznat, zda byl růst zisků výrazný, průměrný nebo blízký nule.

Mnoho povyku pro nic

Koncepty intervalu spolehlivosti a úrovně spolehlivosti jsou ilustrovány na příkladech ze skutečného života:

Rozvrh je tak dobrý, jak jen může

První z kapitol je věnována úvahám o způsobech manipulace s pomocí grafických informací.

Zvažuje způsoby, jak zkreslit vnímání grafů:

Schematický obrázek

Pochopení způsobů, jak oklamat publikum pomocí infografiky .

Použití grafických objektů spojených s prezentovanými informacemi otevírá široké možnosti zneužití. Toto tvrzení je ilustrováno řadou příkladů:

Obrázek níže ukazuje příklad zneužití infografiky - druhý objekt je vizuálně 8x větší:

Pseudodůvodněná figura

Kapitola začíná sžíravým doporučením: „Pokud nemůžete dokázat, co chcete, ukažte něco jiného a předstírejte, že tyto věci jsou stejné.

Existuje mnoho příkladů takových podvodů. Zejména:

Znovu, „po je kvůli“

Tato kapitola hovoří o konceptu korelace a zmatku, který často vzniká mezi příčinou a následkem. Pokud se jevy A a B vyskytují společně, lze to vysvětlit třemi způsoby:

  1. Fenomén A je důsledkem jevu B
  2. Fenomén B je důsledkem jevu A
  3. Jevy A a B jsou důsledky jiného/jiného jevu(ů)

Je uvedena řada příkladů chybných úsudků o kauzálních vztazích. Zejména:

Kapitola končí téměř anekdotickým (ale skutečným) příkladem záměny příčiny a následku domorodci z Nových Hebrid. Věřili, že přítomnost vší vede ke zdraví. Tento závěr byl učiněn na základě toho, že vši opustily nemocného (protože v důsledku zvýšené tělesné teploty se pro něj staly nepříjemné životní podmínky), zatímco všichni zdraví lidé je měli (jinými slovy, existovala pozitivní korelace mezi zdraví a přítomnost vší).

Jak vytvářet statistiky

Statistiky jsou statistické manipulace. V této kapitole autor opět na konkrétních příkladech ukazuje, jak manipulovat se statistickými daty. Vyzývá však, abychom statistická data nevybíravě neodmítali, ale než je vzali na vědomí, promyšleně, důkladně, s opatrnou nedůvěřivostí je prostudovali.

Jak zavést statistiky

Autor navrhuje zkontrolovat statistická data pomocí pěti jednoduchých otázek:

Vydání v jiných jazycích

V ruštině

Poznámky

  1. "Za posledních padesát let se knihy Jak lhát se statistikou prodalo více výtisků než jakéhokoli jiného statistického textu." JM Steele. " Darrell Huff a Fifty Years of How to Lie with Statistics archivováno 23. února 2021 na Wayback Machine . Statistical Science , 20(3), 2005, 205-209.

Odkazy