Měřítko

Stupnice (měřicí stupnice) je znakový systém, pro který je nastaveno zobrazení ( operace měření ), které spojuje ten či onen prvek (hodnotu) stupnice s reálnými objekty, situacemi, událostmi nebo procesy . Formálně je měřítko n-tice , ⟨ X , φ, Y ⟩, kde X je množina reálných objektů, situací, událostí nebo procesů, φ je zobrazení, Y je množina prvků (hodnot) znakového systému [ 1] [2] .

Různé typy měřících stupnic jsou široce používány v teoretické i praktické lidské činnosti , ve vědě a technice - včetně mnoha humanitních vědních oborů, jako je ekonomie , psychometrie , sociologie a další [3] [4] pro symbolické ( formální ) znázornění objekty (události), jejich vlastnosti (charakteristiky) a vztahy.

Typy měřítek

Měřící stupnice jsou klasifikovány podle typů měřených dat, které určují vztahy povolené pro danou stupnici, včetně těch, které odpovídají matematickým transformacím hodnot stupnice [2] [5] . Klasifikace moderního měřítka byla navržena v roce 1946 Stanley Smith Stevens .

Jmenná stupnice (nominální, klasifikační) Používá se k měření hodnot kvalitativních znaků. Hodnota takového znaku je název třídy ekvivalence, do které uvažovaný objekt patří. Příklady hodnot kvalitativních znaků jsou názvy států, barvy, značky automobilů atd. Takové znaky splňují axiomy identity:

Buď A = B , nebo A ≠ B .
Jestliže A = B , pak B = A .
Jestliže A = B a B = C , pak A = C .

Při velkém počtu tříd se používají hierarchické pojmenovací stupnice. Nejznámějšími příklady takových stupnic jsou [6] stupnice používané ke klasifikaci zvířat a rostlin. S hodnotami naměřenými na stupnici názvů můžete provést pouze jednu operaci - kontrolu jejich shody nebo neshody. Na základě výsledků takové kontroly je možné dodatečně vypočítat četnosti plnění (pravděpodobnosti) pro různé třídy, které lze použít pro aplikaci různých metod statistické analýzy [6] - test dobré shody, Cramerův test pro testování hypotézy o vztahu kvalitativních znaků atp.

\chi ^{2}

Pořadová stupnice (nebo hodnost) Zahrnuje identitu a vztahy objednávky. Objekty v tomto měřítku jsou seřazeny. Ale ne všechny předměty lze podřídit vztahu řádu. Například nelze říci, co je větší - kruh nebo trojúhelník, ale lze v těchto objektech vyčlenit společnou vlastnost - oblast, a tak je snazší navazovat ordinální vztahy. Pro toto měřítko je přijatelná monotónní transformace. Takové měřítko je hrubé, protože nebere v úvahu rozdíl mezi objekty měřítka. Příklad takové stupnice: výkonnostní skóre (neuspokojivý, uspokojivý, dobrý, výborný), Mohsova stupnice . Ordinální stupnice používané k reprezentaci vlastností objektů, které mohou nabývat extrémních, opačných hodnot, se nazývají bipolární stupnice . Mezi takové vlastnosti patří například shoda předmětu s určitým účelem: od „zcela neodpovídá“ po „zcela odpovídá“ a různé stupně částečné shody. V tomto případě jsou extrémní hodnoty stupnice přiřazeny extrémním, opačným hodnotám vlastností, střední hodnoty se používají k reprezentaci různého stupně souladu objektu s účelem. Intervalová stupnice (neboli rozdílová stupnice) Zde je srovnání se standardem. Konstrukce takové škály umožňuje většinu vlastností existujících numerických systémů přisuzovat číslům získaným na základě subjektivních hodnocení. Například sestavení škály intervalů pro reakce. Pro toto měřítko je přijatelná lineární transformace. To vám umožní přivést výsledky testů na běžná měřítka a porovnat tak ukazatele. Příklad: Celsiova stupnice. Počátek je libovolný, měrná jednotka je nastavena. Platné transformace jsou směny. Příklad: měření času. Absolutní měřítko (také znám jako poměrové měřítko) Jedná se o intervalovou stupnici, ve které existuje další vlastnost - přirozená a jednoznačná přítomnost nulového bodu. Příklad: počet lidí v publiku. Ve stupnici poměrů působí poměr „tolikrát více“. Jako jediná ze čtyř vah má absolutní nulu. Nulový bod charakterizuje absenci měřitelné kvality. Toto měřítko umožňuje transformaci podobnosti (násobení konstantou). Stanovení nulového bodu je pro psychologický výzkum obtížným úkolem, který omezuje použití této škály. Pomocí takových vah lze měřit hmotnost, délku, sílu, cenu (cena). Příklad: Kelvinova stupnice (teploty měřené od absolutní nuly, s jednotkou měření zvolenou po dohodě specialistů - kelvin).

Ze zvažovaných měřítek jsou první dvě nemetrické a zbytek jsou metrické .

Problém přiměřenosti metod pro matematické zpracování výsledků měření přímo souvisí s otázkou typu stupnice. V obecném případě jsou adekvátní statistiky ty, které jsou invariantní s ohledem na přípustné transformace použité škály měření.

Typy vah a jejich vlastnosti podle klasifikace Stanley Smith Stevens

		Nominální měřítko	pořadové měřítko	Intervalová stupnice	Vztahová škála
Logické / matematické operace	× ÷	Ne	Ne	Ne	Ano
	+ −	Ne	Ne	Ano	Ano
	< >	Ne	Ano	Ano	Ano
	= ≠	Ano	Ano	Ano	Ano
Příklady ( dichotomické a nedichotomické proměnné)		Dichotomické: pohlaví (muž/žena) Nedichotomické: národnost (americká/čínská/atd.)	Dichotomický: zdravotní stav (zdravý/nemocný), krása (krásný/ošklivý) Nedichotomický: názor (rozhodně souhlasím / spíše souhlasím / spíše nesouhlasím / rozhodně nesouhlasím)	Datum (od roku 1457 př . n. l . do roku 2013 n. l.), zeměpisná šířka (od +90° do -90°), teplota (od 10 °C do 20 °C)	Věk (od 0 do 99 let)
Míra centrální tendence		Móda	Medián	Průměrný	geometrický průměr
Metrické nebo ne		Nemetrické (kvalita)	Nemetrické (kvalita)	Metrické (kvantitativní)	Metrické (kvantitativní)

Kritika Stevensovy typologie

F. N. Ilyasov při analýze různých typů škál dospívá k závěru, že nominální a intervalové škály jsou výzkumnými artefakty [7].[ upřesnit ] .

Přestože je Stevensova typologie stále široce použitelná, je stále předmětem kritiky teoretiků, zejména v případě nominální a ordinální stupnice. [osm]

Hlavní body kritiky Stevensonových vah:

Omezení výběru pouze na ty statistické metody, které „prokazují invarianci vhodnou pro tento typ škály“, se zdá být pro analýzu dat v praxi nebezpečné.
Jeho taxonomie je příliš přísná na to, aby byla aplikována na skutečná data.
Stevensova omezení často vedou k downgradu dat prostřednictvím konverze na hodnosti a následnému zbytečnému využívání neparametrických metod.

Pán[ co? ] kritizoval Stevensovy argumenty tím, že ukázal, že výběr platných statistických testů pro daný soubor dat nezávisí na problémech reprezentace nebo jedinečnosti, ale závisí na smysluplnosti. [9]

Baker, Hardik a Petrinovich, stejně jako Borgatta a Bornstedt, zdůraznili, že dodržování Stevensových omezení často nutí výzkumníky uchýlit se k řazení dat podle pořadí, a tím upustit od použití parametrických testů. Jejich argumentace byla spíše ad hoc povahy a končila návrhem na použití standardních parametrických postupů místo toho, aby se zabývali problémem robustnosti. [10] [11]

Guttmann obecněji tvrdil, že statistická interpretace dat závisí na tom, jaká otázka je datům položena a jaké důkazy jsme ochotni přijmout jako odpověď na tuto otázku. Definoval tento důkaz z hlediska ztrátové funkce zvolené pro testování kvality modelu. [12]

John Tukey také kritizoval Stevensova omezení jako nebezpečná pro dobrou statistickou analýzu. Stejně jako Lord a Guttman si Tukey všiml důležitosti významu dat při určování rozsahu a vhodného způsobu analýzy. Vzhledem k tomu, že typy Stevensových stupnic jsou absolutní, v situaci, kdy například data nelze považovat za zcela intervalová, je třeba je snížit na ordinální.

Dokonce i sám Stevens učinil výhradu a poznamenal: „Ve skutečnosti je většina škál široce a efektivně používaných psychology škálami řádu. Při práci s těmito stupnicemi by se neměla striktně používat běžná statistika, včetně průměrů a směrodatných odchylek, ale takové neoprávněné použití lze do jisté míry pragmaticky zdůvodnit: v mnoha případech vede k plodným výsledkům.

Duncane[ co? ] (1986) protestoval proti použití slova „měření“ v popisu nominální stupnice, ale Stevens (1975) poté uvedl vlastní definici „měření“, která zní jako „přisouzení rysu podle nějakého pravidla. Jediným pravidlem, které nelze pro tyto účely použít, je náhodné přiřazení. Takzvaná „nominální dimenze“ však zahrnuje hodnotový soud výzkumníka a možné transformace této dimenze jsou nekonečné. Toto je jedna z poznámek, které Lord učinil v roce 1953 v satirickém článku On the Statistical Treatment of Football Numbers [13]

Použití „středního“ jako míry centrální tendence pro ordinální typ je stále kontroverzní mezi těmi, kdo přijímají Stevensovu typologii. Navzdory tomu mnoho behaviorálních vědců používá průměr pro ordinální data. Obvyklým odůvodněním je, že ordinální typ v behaviorálních vědách je někde mezi skutečnými ordinálními a intervalovými typy. Ačkoli rozdíl mezer mezi dvěma řadovými číslicemi není konstantní, často je stejného řádu.

Například použití modelů měření ve vzdělávacím kontextu ukazuje, že celkové známky mají poměrně lineární vztah s měřeními v rámci rozsahu známek. Někteří tedy tvrdí, že pokud rozdíl v rozestupech mezi řadovými číslicemi není příliš velký, statistika intervalových měřítek (např. „střední“) může mít pro řadová měřítka smysluplný výsledek. Software pro statistickou analýzu (např . SPSS ) vyžaduje, aby uživatel specifikoval vhodnou třídu měření pro každou proměnnou. To zajišťuje, že neúmyslné chyby uživatele nevedou k nesmyslné analýze (příklad: korelační analýza s nominální proměnnou).

Thurstone[ co? ] dosáhl pokroku ve vývoji zdůvodnění pro odvození intervalového typu založeného na zákonu srovnávacího úsudku . Běžnou aplikací zákona je analytický proces hierarchie . Geogr Rasch učinil další pokrok vyvinutím pravděpodobnostního modelu Rasch , který poskytuje teoretický základ a zdůvodnění pro odvození intervalových měření z počtů pozorování (např. celkových skóre za známky).

Přes veškerou kritiku v celé řadě situací zkušenosti ukazují, že aplikace zakázaných statistik na data vede k vědecky významným výsledkům, které jsou důležité při rozhodování a cenné pro další výzkum.

Další navrhované typologie

Existují i jiné typologie než Stevens. Například: Mostller Mosteller a Tukey (1977), Nelder (1990) vytvořili popisy spojitého počítání, spojitých vztahů a kategoriálních datových modelů. Viz také: Chrisman (1998), van den Berg (1991).

Typologie Mostellera a Tukeyho (1977)

Mostellera Tukey si všimli, že úroveň 4 nestačí a navrhli následující rozdělení: [14]

Jména
Hodnotové soudy (např. prvák, druhák atd.)
Hodnocení je omezeno na 0 a 1
Počitatelné (kladná celá čísla)
Přirozená (kladná reálná čísla)
Vyvážený (jakákoli reálná čísla)

Například procenta (varianta zlomků v termínech Mosteller-Tukey) neodpovídají Stevensově teorii, protože neexistují žádné zcela platné transformace. [osm]

Crismanova typologie (1998)

Nicholas Crisman navrhl rozšířené vyhledávání na úrovni dimenzí, aby zohlednil různé dimenze, které nemusí nutně odpovídat tradičním představám o úrovních dimenzí. Měření související s rozsahem a opakováním (např. radiální stupně na kruhu, hodiny atd.), odstupňované kategorie členství a další typy měření se neshodují se Stevenovou původní prací, což má za následek zavedení šesti nových úrovní měření do stávajících deseti :

Hodnocené
Absolvované členství
řadové
Časový úsek
Intervalová logaritmická
Rozsáhlý vztah
Cyklický vztah
Odvozený vztah
Počítací
Absolutní

Rozšířené úrovně měření se mimo akademickou geografii používají jen zřídka. [patnáct]

Typy škál a Stevensova "operační teorie měření"

Teorie škálového typu je jakýmsi „intelektuálním služebníkem“ Stevensovy operační teorie měření, která se stala definitivní v psychologii a behaviorálních vědách , navzdory Michellově kritice za to, že je v rozporu s měřeními v přírodních vědách (Michell, 1999). Teorie operačních měření byla ve skutečnosti reakcí na zjištění výboru zřízeného Britskou asociací pro rozvoj vědy v roce 1932, aby prozkoumal možnost skutečného vědeckého měření v psychologických a behaviorálních vědách. Tento výbor, který se stal známým jako „Fergusonův výbor“, publikoval závěrečnou zprávu (Ferguson, et al., 1940, s. 245), ve které byla terčem kritiky Stevensova spánková stupnice (Stevens & Davis, 1938).

…jakýkoli zákon určený k vyjádření kvantitativního vztahu mezi intenzitou vjemu a intenzitou podnětu je nejen nepravdivý, ale ve skutečnosti nesmyslný, dokud pojem sčítání aplikovaný na vjem nezíská význam.

Pokud tedy Stevensova škála snů skutečně měří intenzitu pocitů publika, musí být předložen důkaz, že tyto pocity jsou kvantitativní atributy. Nezbytným důkazem byla přítomnost „aditivních struktur“ – koncept vyvinutý německým matematikem Otto Holderem (Hölder, 1901). S fyzikem a teoretikem měření Normanem Robertem Campbellem , který dominoval diskusi Fergusonova výboru, bylo rozhodnuto, že měření ve společenských vědách jsou nemožná kvůli absenci operace zřetězení . Následně bylo toto rozhodnutí uznáno jako nesprávné po vývoji teorie společných měření Debru, stejně jako nezávisle Luce a Tukey. Stevens však nechtěl zavádět další experimenty k detekci aditivních struktur, ale zcela zrušit rozhodnutí Fergusonova výboru navržením nové teorie měření.

Abych parafrázoval N.R. Campbella (Final Report, str.340), lze říci, že měření v nejširším slova smyslu je definováno jako přiřazování čísel objektům a událostem podle nějakého pravidla (Stevens, 1946, str.677).

Stevens byl velmi ovlivněn myšlenkami dalšího nositele Nobelovy ceny z Harvardu, fyzika Percyho Bridgmana (1927), jehož doktrína „operacionismu“ Stevens definoval pojem „měření“. Například Stevensova definice používá svinovací metr, který definuje délku (objekt měření) jako měřitelnou (tedy kvantifikovatelnou). Kritici operacionalismu namítají, že zaměňuje vztahy mezi dvěma objekty nebo událostmi za vlastnosti jednoho z objektů nebo událostí (Hardcastle, 1995; Michell, 1999; Moyer, 1981a, b; Rogers, 1989).

Kanadský teoretik měření William Rozeboom (1966) byl jedním z prvních kritiků, kteří se důrazně vyslovili proti Stevensově teorii škálových typů.

Typ proměnné závisí na kontextu

Dalším problémem může být, že stejná proměnná může mít různé typy měřítek v závislosti na způsobu měření a účelu analýzy. Například barva vlasů je obvykle považována za nominální proměnnou, protože nemá konkrétní pořadí. [16] Je však možné seřadit barvy v určitém pořadí několika způsoby, včetně odstínu, pomocí kolorimetrie .

Použití v psychometrii

Pomocí různých škál je možné produkovat různá psychologická měření [17] . Úplně první metody psychologických měření byly vyvinuty v psychofyzice . Hlavním úkolem psychofyziků bylo zjistit, jak fyzické parametry stimulace korelují se subjektivním hodnocením vjemů, které jim odpovídají. Když známe toto spojení, můžeme pochopit, jaký pocit odpovídá jednomu nebo druhému znamení. Psychofyzická funkce stanoví vztah mezi číselnou hodnotou stupnice fyzického měření podnětu a číselnou hodnotou psychické nebo subjektivní reakce na tento podnět.

Některé běžné váhy

Teplotní stupnice různých zemí a časů (Celsius, Fahrenheit, Kelvin atd.)
Richterova stupnice
Beaufortova stupnice rychlosti větru
Mohsova stupnice - stupnice tvrdosti minerálů
Paleta barev , Atlas barev

Viz také

Poznámky

↑ Zhuravlev Yu. I. , Rjazanov V. V., Senko O. V. „Uznání“. Matematické metody. Softwarový systém. Praktické aplikace. - M .: Fazis, 2006. - ISBN 5-7036-0108-8 .
↑ 1 2 Anfilatov V. S., Emelyanov A. A., Kukushkin A. A. Systémová analýza v managementu. - M. : Finance a statistika, 2002. - 368 s.
↑ Ekonomika a management – špičkové statistické technologie .
↑ Statistické metody – vysoce statistické technologie .
↑ Peregudov F.I. , Tarasevich F.P. Úvod do systémové analýzy. - M . : Vyšší škola, 1989. - 367 s.
↑ 1 2 Bakhrushin V. E. Metody analýzy dat. - Záporizhzhya, KPU, 2011.
↑ Ilyasov F. N. Škály a specifika sociologického měření // Monitoring veřejného mínění: ekonomické a sociální změny. 2014. č. 1. S. 3-16.
↑ 1 2 Velleman, Paul F.; Wilkinson, Leland. Nominální, ordinální, intervalové a poměrové typologie jsou zavádějící // The American Statistician : deník. - Americká statistická asociace, 1993. - Sv. 47 . - str. 65-72 . - doi : 10.2307/2684788 . — .
↑ Scaling: zdrojová kniha pro behaviorální vědce (anglicky) / Gary Maranell (ed.). — Aldine Transaction, [2007]. — ISBN 9780202361758 .
↑ Bela O. Baker, Curtis D. Hardyck, Lewis F. Petrinovich. Slabá měření vs. Silná statistika: Empirická kritika předpisů SS Stevense nn Statistics // Vzdělávací a psychologická měření. — 1966-07-01. — Sv. 26 , iss. 2 . - S. 291-309 . — ISSN 0013-1644 . - doi : 10.1177/001316446602600204 .
↑ Edgar F. Borgatta, George W. Bohrnstedt. Level of Measurement: Once Over Again // Sociologické metody a výzkum. — 11.11.1980. — Sv. 9 , iss. 2 . - S. 147-160 . — ISSN 0049-1241 . - doi : 10.1177/004912418000900202 .
↑ Louis Guttman. What is Not What in Statistics (anglicky) // Journal of the Royal Statistical Society. Řada D (The Statistician). - 1977. - Sv. 26 , iss. 2 . - S. 81-107 . - doi : 10.2307/2987957 .
↑ Lord, Frederic M. On the Statistical Treatment of Football Numbers // American Psychologist : journal . - 1953. - prosinec ( 8. díl ). - S. 750-751 . doi : 10.1037 / h0063675 .
↑ Mosteller, Frederick. Analýza dat a regrese: druhý kurz statistiky . — Reading, Mass: Addison-Wesley Pub. Co, 1977. - ISBN 978-0201048544 .
↑ Wolman, Abel G. Měření a smysluplnost ve vědě o ochraně přírody (anglicky) // Conservation biology : journal. — 2006.
↑ Jaký je rozdíl mezi kategorickými, ordinálními a intervalovými proměnnými? . Institut pro digitální výzkum a vzdělávání . Kalifornská univerzita, Los Angeles. Staženo: 7. února 2016. (neurčitý)
↑ Suppes P. , Zinnes D. Základy teorie měření // Psychologická měření. M.: 1967. S. 9-110.

Literatura

Gusev A. N., Izmailov C. A., Mikhalevskaya M. B. Měření v psychologii. Obecná psychologická praxe . Řada "Praktikum". Číslo 2. - M . : Meaning, 1987, - 280 s.
Kliger S. L., Kosolapov M. S., Tolstova Yu. N. Škálování ve sběru a analýze sociologických informací . - M .: Věda. 1978. - 107 s.