Stupnice (měřicí stupnice) je znakový systém, pro který je nastaveno zobrazení ( operace měření ), které spojuje ten či onen prvek (hodnotu) stupnice s reálnými objekty, situacemi, událostmi nebo procesy . Formálně je měřítko n-tice , ⟨ X , φ, Y ⟩, kde X je množina reálných objektů, situací, událostí nebo procesů, φ je zobrazení, Y je množina prvků (hodnot) znakového systému [ 1] [2] .
Různé typy měřících stupnic jsou široce používány v teoretické i praktické lidské činnosti , ve vědě a technice - včetně mnoha humanitních vědních oborů, jako je ekonomie , psychometrie , sociologie a další [3] [4] pro symbolické ( formální ) znázornění objekty (události), jejich vlastnosti (charakteristiky) a vztahy.
Měřící stupnice jsou klasifikovány podle typů měřených dat, které určují vztahy povolené pro danou stupnici, včetně těch, které odpovídají matematickým transformacím hodnot stupnice [2] [5] . Klasifikace moderního měřítka byla navržena v roce 1946 Stanley Smith Stevens .
Jmenná stupnice (nominální, klasifikační) Používá se k měření hodnot kvalitativních znaků. Hodnota takového znaku je název třídy ekvivalence, do které uvažovaný objekt patří. Příklady hodnot kvalitativních znaků jsou názvy států, barvy, značky automobilů atd. Takové znaky splňují axiomy identity:Ze zvažovaných měřítek jsou první dvě nemetrické a zbytek jsou metrické .
Problém přiměřenosti metod pro matematické zpracování výsledků měření přímo souvisí s otázkou typu stupnice. V obecném případě jsou adekvátní statistiky ty, které jsou invariantní s ohledem na přípustné transformace použité škály měření.
Nominální měřítko |
pořadové měřítko |
Intervalová stupnice |
Vztahová škála | ||
---|---|---|---|---|---|
Logické / matematické operace |
× ÷ |
Ne | Ne | Ne | Ano |
+ − |
Ne | Ne | Ano | Ano | |
< > |
Ne | Ano | Ano | Ano | |
= ≠ |
Ano | Ano | Ano | Ano | |
Příklady ( dichotomické a nedichotomické proměnné) |
Dichotomické: pohlaví (muž/žena) Nedichotomické: |
Dichotomický: zdravotní stav (zdravý/nemocný), krása (krásný/ošklivý) Nedichotomický: |
Datum (od roku 1457 př . n. l . do roku 2013 n. l.), zeměpisná šířka teplota |
Věk (od 0 do 99 let) | |
Míra centrální tendence | Móda | Medián | Průměrný | geometrický průměr | |
Metrické nebo ne | Nemetrické (kvalita) |
Nemetrické (kvalita) |
Metrické (kvantitativní) |
Metrické (kvantitativní) |
F. N. Ilyasov při analýze různých typů škál dospívá k závěru, že nominální a intervalové škály jsou výzkumnými artefakty [7].[ upřesnit ] .
Přestože je Stevensova typologie stále široce použitelná, je stále předmětem kritiky teoretiků, zejména v případě nominální a ordinální stupnice. [osm]
Hlavní body kritiky Stevensonových vah:
Pán[ co? ] kritizoval Stevensovy argumenty tím, že ukázal, že výběr platných statistických testů pro daný soubor dat nezávisí na problémech reprezentace nebo jedinečnosti, ale závisí na smysluplnosti. [9]
Baker, Hardik a Petrinovich, stejně jako Borgatta a Bornstedt, zdůraznili, že dodržování Stevensových omezení často nutí výzkumníky uchýlit se k řazení dat podle pořadí, a tím upustit od použití parametrických testů. Jejich argumentace byla spíše ad hoc povahy a končila návrhem na použití standardních parametrických postupů místo toho, aby se zabývali problémem robustnosti. [10] [11]
Guttmann obecněji tvrdil, že statistická interpretace dat závisí na tom, jaká otázka je datům položena a jaké důkazy jsme ochotni přijmout jako odpověď na tuto otázku. Definoval tento důkaz z hlediska ztrátové funkce zvolené pro testování kvality modelu. [12]
John Tukey také kritizoval Stevensova omezení jako nebezpečná pro dobrou statistickou analýzu. Stejně jako Lord a Guttman si Tukey všiml důležitosti významu dat při určování rozsahu a vhodného způsobu analýzy. Vzhledem k tomu, že typy Stevensových stupnic jsou absolutní, v situaci, kdy například data nelze považovat za zcela intervalová, je třeba je snížit na ordinální.
Dokonce i sám Stevens učinil výhradu a poznamenal: „Ve skutečnosti je většina škál široce a efektivně používaných psychology škálami řádu. Při práci s těmito stupnicemi by se neměla striktně používat běžná statistika, včetně průměrů a směrodatných odchylek, ale takové neoprávněné použití lze do jisté míry pragmaticky zdůvodnit: v mnoha případech vede k plodným výsledkům.
Duncane[ co? ] (1986) protestoval proti použití slova „měření“ v popisu nominální stupnice, ale Stevens (1975) poté uvedl vlastní definici „měření“, která zní jako „přisouzení rysu podle nějakého pravidla. Jediným pravidlem, které nelze pro tyto účely použít, je náhodné přiřazení. Takzvaná „nominální dimenze“ však zahrnuje hodnotový soud výzkumníka a možné transformace této dimenze jsou nekonečné. Toto je jedna z poznámek, které Lord učinil v roce 1953 v satirickém článku On the Statistical Treatment of Football Numbers [13]
Použití „středního“ jako míry centrální tendence pro ordinální typ je stále kontroverzní mezi těmi, kdo přijímají Stevensovu typologii. Navzdory tomu mnoho behaviorálních vědců používá průměr pro ordinální data. Obvyklým odůvodněním je, že ordinální typ v behaviorálních vědách je někde mezi skutečnými ordinálními a intervalovými typy. Ačkoli rozdíl mezer mezi dvěma řadovými číslicemi není konstantní, často je stejného řádu.
Například použití modelů měření ve vzdělávacím kontextu ukazuje, že celkové známky mají poměrně lineární vztah s měřeními v rámci rozsahu známek. Někteří tedy tvrdí, že pokud rozdíl v rozestupech mezi řadovými číslicemi není příliš velký, statistika intervalových měřítek (např. „střední“) může mít pro řadová měřítka smysluplný výsledek. Software pro statistickou analýzu (např . SPSS ) vyžaduje, aby uživatel specifikoval vhodnou třídu měření pro každou proměnnou. To zajišťuje, že neúmyslné chyby uživatele nevedou k nesmyslné analýze (příklad: korelační analýza s nominální proměnnou).
Thurstone[ co? ] dosáhl pokroku ve vývoji zdůvodnění pro odvození intervalového typu založeného na zákonu srovnávacího úsudku . Běžnou aplikací zákona je analytický proces hierarchie . Geogr Rasch učinil další pokrok vyvinutím pravděpodobnostního modelu Rasch , který poskytuje teoretický základ a zdůvodnění pro odvození intervalových měření z počtů pozorování (např. celkových skóre za známky).
Přes veškerou kritiku v celé řadě situací zkušenosti ukazují, že aplikace zakázaných statistik na data vede k vědecky významným výsledkům, které jsou důležité při rozhodování a cenné pro další výzkum.
Existují i jiné typologie než Stevens. Například: Mostller Mosteller a Tukey (1977), Nelder (1990) vytvořili popisy spojitého počítání, spojitých vztahů a kategoriálních datových modelů. Viz také: Chrisman (1998), van den Berg (1991).
Typologie Mostellera a Tukeyho (1977)Mostellera Tukey si všimli, že úroveň 4 nestačí a navrhli následující rozdělení: [14]
Například procenta (varianta zlomků v termínech Mosteller-Tukey) neodpovídají Stevensově teorii, protože neexistují žádné zcela platné transformace. [osm]
Crismanova typologie (1998)Nicholas Crisman navrhl rozšířené vyhledávání na úrovni dimenzí, aby zohlednil různé dimenze, které nemusí nutně odpovídat tradičním představám o úrovních dimenzí. Měření související s rozsahem a opakováním (např. radiální stupně na kruhu, hodiny atd.), odstupňované kategorie členství a další typy měření se neshodují se Stevenovou původní prací, což má za následek zavedení šesti nových úrovní měření do stávajících deseti :
Rozšířené úrovně měření se mimo akademickou geografii používají jen zřídka. [patnáct]
Teorie škálového typu je jakýmsi „intelektuálním služebníkem“ Stevensovy operační teorie měření, která se stala definitivní v psychologii a behaviorálních vědách , navzdory Michellově kritice za to, že je v rozporu s měřeními v přírodních vědách (Michell, 1999). Teorie operačních měření byla ve skutečnosti reakcí na zjištění výboru zřízeného Britskou asociací pro rozvoj vědy v roce 1932, aby prozkoumal možnost skutečného vědeckého měření v psychologických a behaviorálních vědách. Tento výbor, který se stal známým jako „Fergusonův výbor“, publikoval závěrečnou zprávu (Ferguson, et al., 1940, s. 245), ve které byla terčem kritiky Stevensova spánková stupnice (Stevens & Davis, 1938).
…jakýkoli zákon určený k vyjádření kvantitativního vztahu mezi intenzitou vjemu a intenzitou podnětu je nejen nepravdivý, ale ve skutečnosti nesmyslný, dokud pojem sčítání aplikovaný na vjem nezíská význam.
Pokud tedy Stevensova škála snů skutečně měří intenzitu pocitů publika, musí být předložen důkaz, že tyto pocity jsou kvantitativní atributy. Nezbytným důkazem byla přítomnost „aditivních struktur“ – koncept vyvinutý německým matematikem Otto Holderem (Hölder, 1901). S fyzikem a teoretikem měření Normanem Robertem Campbellem , který dominoval diskusi Fergusonova výboru, bylo rozhodnuto, že měření ve společenských vědách jsou nemožná kvůli absenci operace zřetězení . Následně bylo toto rozhodnutí uznáno jako nesprávné po vývoji teorie společných měření Debru, stejně jako nezávisle Luce a Tukey. Stevens však nechtěl zavádět další experimenty k detekci aditivních struktur, ale zcela zrušit rozhodnutí Fergusonova výboru navržením nové teorie měření.
Abych parafrázoval N.R. Campbella (Final Report, str.340), lze říci, že měření v nejširším slova smyslu je definováno jako přiřazování čísel objektům a událostem podle nějakého pravidla (Stevens, 1946, str.677).
Stevens byl velmi ovlivněn myšlenkami dalšího nositele Nobelovy ceny z Harvardu, fyzika Percyho Bridgmana (1927), jehož doktrína „operacionismu“ Stevens definoval pojem „měření“. Například Stevensova definice používá svinovací metr, který definuje délku (objekt měření) jako měřitelnou (tedy kvantifikovatelnou). Kritici operacionalismu namítají, že zaměňuje vztahy mezi dvěma objekty nebo událostmi za vlastnosti jednoho z objektů nebo událostí (Hardcastle, 1995; Michell, 1999; Moyer, 1981a, b; Rogers, 1989).
Kanadský teoretik měření William Rozeboom (1966) byl jedním z prvních kritiků, kteří se důrazně vyslovili proti Stevensově teorii škálových typů.
Typ proměnné závisí na kontextuDalším problémem může být, že stejná proměnná může mít různé typy měřítek v závislosti na způsobu měření a účelu analýzy. Například barva vlasů je obvykle považována za nominální proměnnou, protože nemá konkrétní pořadí. [16] Je však možné seřadit barvy v určitém pořadí několika způsoby, včetně odstínu, pomocí kolorimetrie .
Pomocí různých škál je možné produkovat různá psychologická měření [17] . Úplně první metody psychologických měření byly vyvinuty v psychofyzice . Hlavním úkolem psychofyziků bylo zjistit, jak fyzické parametry stimulace korelují se subjektivním hodnocením vjemů, které jim odpovídají. Když známe toto spojení, můžeme pochopit, jaký pocit odpovídá jednomu nebo druhému znamení. Psychofyzická funkce stanoví vztah mezi číselnou hodnotou stupnice fyzického měření podnětu a číselnou hodnotou psychické nebo subjektivní reakce na tento podnět.