Evropská komise je součástí struktury. Evropská komise. Potřebujete pomoc s tématem

V dnešním článku si povíme, jak spolu mohou proměnné souviset. Pomocí korelace budeme schopni určit, zda existuje vztah mezi první a druhou proměnnou. Doufám, že pro vás bude tato lekce stejně vzrušující jako ty předchozí!

Korelace měří sílu a směr vztahu mezi x a y. Obrázek ukazuje různé typy korelace jako bodové grafy uspořádaných párů (x, y). Tradičně je x umístěno na vodorovné ose a y na svislé.

Graf A je příkladem pozitivní lineární korelace: jak roste x, roste i y, a to lineárně. Graf B nám ukazuje příklad negativní lineární korelace, kde jak x roste, y lineárně klesá. V grafu C nevidíme žádnou korelaci mezi x a y. Tyto proměnné se navzájem nijak neovlivňují.

A konečně graf D je příkladem nelineárních vztahů mezi proměnnými. Jak se x zvyšuje, y nejprve klesá, pak mění směr a roste.

Zbytek článku je věnován lineárním vztahům mezi závislými a nezávislými proměnnými.

Korelační koeficient

Korelační koeficient r nám poskytuje jak sílu, tak směr vztahu mezi nezávislými a závislými proměnnými. Hodnoty r jsou mezi -1,0 a +1,0. Když má r kladná hodnota, vztah mezi x a y je kladný (graf A na obrázku), a když je hodnota r záporná, je vztah také záporný (graf B). Korelační koeficient blízký nule ukazuje, že mezi x a y není žádný graf C.

Síla spojení mezi x a y je určena blízkostí korelačního koeficientu k - 1,0 nebo + - 1,0. Prostudujte si následující obrázek.

Graf A ukazuje dokonalou pozitivní korelaci mezi x a y při r = + 1,0. Graf B je dokonalá negativní korelace mezi x a y při r = -1,0. Grafy C a D jsou příklady slabších vztahů mezi závislými a nezávislými proměnnými.

Korelační koeficient r určuje jak sílu, tak směr vztahu mezi závislými a nezávislými proměnnými. Hodnoty r se pohybují od -1,0 (silná negativní asociace) do +1,0 (silně pozitivní asociace). Pro r=0 neexistuje žádný vztah mezi x a y.

Skutečný korelační koeficient můžeme vypočítat pomocí následující rovnice:

Ale Ale! Vím, že tato rovnice vypadá jako strašná změť nejasných symbolů, ale než zpanikaříme, aplikujme na ni příklad ze zkoušky. Řekněme, že chci zjistit, zda existuje vztah mezi počtem hodin, které student stráví studiem statistiky, a známkou ze závěrečné zkoušky. Níže uvedená tabulka nám pomůže rozdělit tuto rovnici do několika jednoduchých výpočtů a učinit je lépe zvládnutelnými.

Jak vidíte, existuje velmi silná pozitivní korelace mezi počtem hodin strávených studiem předmětu a známkou zkoušky. Učitelé se o tom budou velmi rádi dozvědět.

Jaká je výhoda vytvoření vztahu mezi podobnými proměnnými? Skvělá otázka. Pokud se zjistí, že existuje spojení, můžeme předpovědět skóre zkoušek na základě určitého počtu hodin strávených studiem předmětu. Jednoduše řečeno, čím silnější je vztah, tím přesnější bude naše předpověď.

Použití Excelu k výpočtu korelačních koeficientů

Jsem si jistý, že po zhlédnutí těchto příšerných výpočtů korelačních koeficientů zažijete opravdovou radost, když víte, že Excel může udělat všechnu tuto práci za vás pomocí funkce CORREL s následujícími vlastnostmi:

CORREL(pole 1; pole 2),

pole 1 = rozsah dat pro první proměnnou,

pole 2 = datový rozsah pro druhou proměnnou.

Obrázek například ukazuje funkci CORREL použitou při výpočtu korelačního koeficientu pro příklad stupně zkoušky.

V kapitole 4 jsme se podívali na základní jednorozměrné popisné statistiky – míry centrální tendence a variability – které se používají k popisu jedné proměnné. V této kapitole se podíváme na hlavní korelační koeficienty.

Korelační koeficient- dvourozměrná popisná statistika, kvantitativní měřítko vztahu (společné variability) dvou proměnných.

Historie vývoje a aplikace korelačních koeficientů pro studium vztahů vlastně začala současně se vznikem měřícího přístupu ke studiu individuálních rozdílů - v letech 1870-1880. Průkopníkem v měření lidských schopností a také autorem samotného termínu „korelační koeficient“ byl Francis Galton a nejoblíbenější korelační koeficienty vyvinul jeho následovník Karl Pearson. Od té doby je studium vztahů pomocí korelačních koeficientů jednou z nejoblíbenějších činností v psychologii.

K dnešnímu dni bylo vyvinuto velké množství různých korelačních koeficientů, problému měření vztahu s jejich pomocí jsou věnovány stovky knih. Proto, aniž bychom si činili nárok na úplnost, budeme uvažovat pouze o těch nejdůležitějších, skutečně nepostradatelných při výzkumu měřítek spojení - /--Pearson, r-Spearman a m-Kendall. Jim společný rys spočívá v tom, že odrážejí vztah dvou znaků měřených na kvantitativním měřítku – pořadí nebo metriky.

Obecně řečeno, jakákoli empirická studie se zaměřuje na studium vztahu dvou nebo více proměnných.

PŘÍKLADY

Uveďme dva příklady studia vlivu předvádění násilných scén v televizi na agresivitu adolescentů. 1. Studuje se vztah dvou proměnných měřených v kvantitativní (hodnostní nebo metrické) škále: 1) „doba sledování televizních programů s násilím“; 2) "agresivita".

Čte se jako Tau-Kendall.


KAPITOLA 6. KORELAČNÍ KOEFICIENTY

2. Studujeme rozdíl v agresivitě 2 a více skupin adolescentů, lišících se délkou sledování TV pořadů s ukázkami násilných scén.

Ve druhém příkladu lze studium rozdílů znázornit jako studium vztahu mezi 2 proměnnými, z nichž jedna je nominativní (délka sledování TV). A pro tuto situaci byly také vyvinuty jejich vlastní korelační koeficienty.

Jakákoli studie může být redukována na studium korelací, protože pro téměř jakoukoli výzkumnou situaci byla vynalezena celá řada korelačních koeficientů. Ale v následujícím budeme rozlišovat mezi dvěma třídami problémů:

P studie korelací - když jsou dvě proměnné prezentovány na číselné škále;

rozdílová studie - když je alespoň jedna ze dvou proměnných uvedena v nominativní škále.


Tomuto členění odpovídá i logika budování oblíbených počítačových statistických programů, ve kterých je menu Korelace jsou navrženy tři koeficienty (/--Pearson, r-Spearman a x-Kendall) a pro řešení dalších výzkumných problémů jsou navrženy metody pro porovnávání skupin.

KONCEPCE KORELACE

Vztahy v jazyce matematiky jsou obvykle popsány pomocí funkcí, které jsou graficky znázorněny jako čáry. Na Obr. 6.1 ukazuje několik grafů funkcí. Pokud změna jedné proměnné o jednu jednotku vždy vede ke změně druhé proměnné o stejnou hodnotu, funkce je lineární(jeho graf je přímka); jakékoli jiné spojení nelineární. Pokud je zvýšení jedné proměnné spojeno se zvýšením jiné, pak vztah je pozitivní (rovný); Pokud je zvýšení jedné proměnné spojeno s poklesem jiné, pak vztah je negativní (reverzní). Pokud se směr změny jedné proměnné nemění s růstem (poklesem) jiné proměnné, pak je taková funkce monotónní; jinak se funkce volá nemonotónní.

funkční odkazy, podobné těm, které jsou znázorněny na Obr. 6.1 jsou idealizace. Jejich zvláštnost spočívá v tom, že jedna hodnota jedné proměnné odpovídá přísně definované hodnotě jiné proměnné. Například takový je vztah dvou fyzikálních proměnných – hmotnosti a délky těla (lineární kladný). Avšak i ve fyzikálních experimentech se empirický vztah bude lišit od funkčního vztahu kvůli nezodpovězeným nebo neznámým důvodům: kolísání složení materiálu, chyby měření atd.

Rýže. 6.1. Příklady grafů často se vyskytujících funkcí

V psychologii, stejně jako v mnoha jiných vědách, při studiu vztahu znaků badatel nevyhnutelně ztrácí mnoho možných důvodů pro variabilitu těchto znaků. Výsledkem je, že dokonce funkční vztah mezi proměnnými, který existuje ve skutečnosti, se empiricky jeví jako pravděpodobnostní (stochastický): stejná hodnota jedné proměnné odpovídá rozložení různých hodnot jiné proměnné (a naopak). Nejjednodušším příkladem je poměr výšky a hmotnosti osob. Empirické výsledky studia těchto dvou znamení samozřejmě ukáží jejich pozitivní vztah. Ale lze snadno uhodnout, že se bude lišit od striktní, lineární, pozitivní - ideální matematické funkce, a to i se všemi badatelskými triky, jak zohlednit harmonii nebo plnost subjektů. (Je nepravděpodobné, že by na tomto základě někoho napadlo popírat existenci striktního funkčního vztahu mezi délkou a hmotností těla.)

Takže v psychologii, stejně jako v mnoha jiných vědách, může být funkční vztah jevů empiricky odhalen pouze jako pravděpodobnostní vztah odpovídajících znaků. Vizuální reprezentace povahy pravděpodobnostního vztahu dává rozptylový diagram - graf, jehož osy odpovídají hodnotám dvou proměnných a každý subjekt je bod (obr. 6.2). Korelační koeficienty se používají jako číselná charakteristika pravděpodobnostního spojení.

6.6.2018 16 235 0 Igor

Psychologie a společnost

Všechno na světě je propojeno. Každý člověk se na úrovni intuice snaží najít vztah mezi jevy, aby je mohl ovlivňovat a ovládat. Koncept, který odráží tento vztah, se nazývá korelace. Co to znamená zjednodušeně?

Obsah:

Pojem korelace

Korelace (z latinského "correlatio" - poměr, vztah)- matematický pojem, který znamená míru statistické pravděpodobnostní závislosti mezi náhodnými veličinami (proměnnými).



Příklad: Vezměme si dva typy vztahů:

  1. První- pero v ruce člověka. Jakým směrem se pohybuje ruka, tím směrem se pohybuje pero. Pokud je ruka v klidu, pero nebude psát. Když na to člověk trochu víc přitlačí, tak bude stopa na papíře bohatší. Tento typ vztahu odráží rigidní závislost a není korelací. Tento vztah je funkční.
  2. Druhý pohled- vztah mezi úrovní vzdělání člověka a četbou literatury. Není předem známo, kdo z lidí čte více: vysokoškolské vzdělání nebo bez něj. Tento vztah je náhodný nebo stochastický, zkoumá jej statistická věda, která se zabývá výhradně hromadnými jevy. Pokud statistický výpočet umožní prokázat korelaci mezi úrovní vzdělání a četností literatury, pak to umožní dělat jakékoli prognózy, předpovídat pravděpodobnostní výskyt událostí. Na tomto příkladu lze s vysokou mírou pravděpodobnosti tvrdit, že lidé s vyšším vzděláním, ti vzdělanější, čtou více knih. Protože ale vztah mezi těmito parametry není funkční, můžeme udělat chybu. Vždy je možné vypočítat pravděpodobnost takové chyby, která bude jednoznačně malá a nazývá se hladina statistické významnosti (p).

Příklady vztahu mezi přírodní jev jsou: potravinový řetězec v přírodě, lidské tělo, které se skládá z orgánových systémů vzájemně propojených a fungujících jako celek.

Každý den se setkáváme s korelací v Každodenní život: mezi počasím a dobrá nálada, správná formulace cílů a jejich dosažení, pozitivní přístup a štěstí, pocit štěstí a finanční blahobyt. Ale hledáme souvislosti nikoli na základě matematických výpočtů, ale na mýtech, intuici, pověrách, planých dohadech. Tyto jevy je velmi obtížné převést do matematického jazyka, vyjádřit čísly, změřit. Jiná věc je, když analyzujeme jevy, které lze vypočítat a prezentovat ve formě čísel. V tomto případě můžeme korelaci určit pomocí korelačního koeficientu (r), který odráží sílu, stupeň, blízkost a směr korelace mezi náhodnými veličinami.

Silná korelace mezi náhodnými proměnnými- důkaz o přítomnosti nějakého statistického vztahu specificky mezi těmito jevy, ale tento vztah nelze přenést na stejné jevy, ale pro jinou situaci. Výzkumníci, kteří ve svých výpočtech získali významnou korelaci mezi dvěma proměnnými na základě jednoduchosti korelační analýzy, často dělají falešné intuitivní předpoklady o existenci kauzálních vztahů mezi rysy a zapomínají, že korelační koeficient je pravděpodobnostní.

Příklad: počet lidí zraněných během náledí a počet dopravních nehod mezi vozidly. Tyto veličiny budou vzájemně korelovat, i když spolu absolutně nejsou propojeny, ale mají pouze souvislost s běžná příčina tyto náhodné události- ledový. Pokud analýza neodhalila korelační vztah mezi jevy, ještě to není důkazem absence vztahu mezi nimi, který může být složitý nelineární, neodhalený korelačními výpočty.




První, kdo zavedl pojem korelace do vědeckého oběhu, byli Francouzi paleontolog Georges Cuvier. V 18. století odvodil zákon korelace částí a orgánů živých organismů, díky kterému bylo možné z nalezených částí těla (zbytků) obnovit vzhled celého fosilního tvora, zvířete. Ve statistice byl termín korelace poprvé použit v roce 1886 anglickým vědcem Francis Galton. Ale nedokázal odvodit přesný vzorec pro výpočet korelačního koeficientu, ale jeho student to udělal - slavný matematik a biolog Karl Pearson.

Typy korelace

Podle důležitosti- vysoce významný, významný a nevýznamný.

Druhy

co je r

vysoce významné

r odpovídá hladině statistické významnosti p<=0,01

smysluplný

r odpovídá p<=0,05

bezvýznamný

r nedosahuje p>0,1

negativní(snížení hodnoty jedné proměnné vede ke zvýšení úrovně jiné: čím více fóbií člověk má, tím menší je pravděpodobnost, že zaujme vedoucí pozici) a pozitivní (pokud zvýšení jedné hodnoty znamená zvýšení úroveň druhého: čím jste nervóznější, tím je pravděpodobnější, že onemocníte). Pokud mezi proměnnými neexistuje žádný vztah, pak se taková korelace nazývá nulová.

Lineární(když jedna hodnota roste nebo klesá, druhá se také zvyšuje nebo snižuje) a nelineární (když, když se jedna hodnota změní, nelze charakter změny druhé popsat pomocí lineární závislosti, pak se použijí jiné matematické zákony - polynom, hyperbolická závislost).

Silou.

Kurzy




V závislosti na tom, do jaké škály studované proměnné patří, se počítají různé typy korelačních koeficientů:

  1. Pearsonův korelační koeficient, párový lineární korelační koeficient nebo součinová momentová korelace se počítá pro proměnné s intervalovými a kvantitativními měřítky.
  2. Spearmanův nebo Kendallův korelační koeficient hodnosti - když alespoň jedna z hodnot má ordinální stupnici nebo není normálně rozdělena.
  3. Bodový dvouřadý korelační koeficient (Fechnerův korelační koeficient) - pokud je jedna ze dvou hodnot dichotomická.
  4. Čtyřpolní korelační koeficient (koeficient vícenásobné hodnostní korelace (konkordance) - pokud jsou dvě proměnné dichotomické.

Pearsonův koeficient se vztahuje na parametrické ukazatele korelace, všechny ostatní - na neparametrické.

Hodnota korelačního koeficientu je v rozmezí od -1 do +1. Při úplné pozitivní korelaci r = +1, při úplné negativní korelaci r = -1.

Vzorec a výpočet





Příklady

Je nutné určit vztah mezi dvěma proměnnými: úrovní intelektuálního rozvoje (podle výsledků testování) a počtem zpoždění za měsíc (podle záznamů ve vzdělávacím časopise) u školáků.

Počáteční údaje jsou uvedeny v tabulce:

údaje o IQ (x)

Údaje o počtu pozdních příchodů (y)

Součet

1122

Průměrný

112,2


Pro správnou interpretaci získaného ukazatele je nutné analyzovat znaménko korelačního koeficientu (+ nebo -) a jeho absolutní hodnotu (modulo).

V souladu s klasifikační tabulkou korelačního koeficientu podle síly docházíme k závěru, že rxy = -0,827 je silně negativní korelace. Počet opožděných školáků tedy velmi silně závisí na úrovni jejich intelektuálního rozvoje. Můžeme říci, že u studentů s vysokým IQ je méně pravděpodobné, že přijdou pozdě na hodinu, než u studentů s nízkým IQ.



Korelační koeficient mohou využít jak vědci k potvrzení či vyvrácení domněnky o závislosti dvou veličin či jevů a měření její síly, významnosti, tak studenti k empirickému a statistickému výzkumu v různých předmětech. Je třeba připomenout, že tento ukazatel není ideálním nástrojem, počítá se pouze pro měření síly lineárního vztahu a vždy se bude jednat o pravděpodobnostní hodnotu, která má určitou chybu.

Korelační analýza se používá v následujících oblastech:

  • ekonomická věda;
  • astrofyzika;
  • společenské vědy (sociologie, psychologie, pedagogika);
  • agrochemie;
  • věda o kovu;
  • průmysl (pro kontrolu kvality);
  • hydrobiologie;
  • biometrie atd.

Důvody popularity metody korelační analýzy:

  1. Relativní jednoduchost výpočtu korelačních koeficientů nevyžaduje speciální matematické vzdělání.
  2. Umožňuje vypočítat vztah mezi hmotnostními náhodnými veličinami, které jsou předmětem analýzy statistické vědy. V tomto ohledu se tato metoda rozšířila na poli statistického výzkumu.

Doufejme, že nyní budete schopni rozlišit mezi funkčním vztahem a korelačním a budete vědět, že když slyšíte v televizi nebo čtete v tisku o korelaci, znamená to pozitivní a poměrně významný vztah mezi dvěma jevy.

Ve vědeckém výzkumu je často nutné najít vztah mezi výslednými a faktorovými proměnnými (výnos plodiny a množství srážek, výška a hmotnost člověka v homogenních skupinách podle pohlaví a věku, tepová frekvence a tělesná teplota , atd.).

Druhým jsou znaky, které přispívají ke změně těch, kteří jsou s nimi spojeni (první).

Pojem korelační analýzy

Existuje soubor Na základě výše uvedeného lze říci, že korelační analýza je metoda sloužící k testování hypotézy statistické významnosti dvou a více proměnných, pokud je výzkumník dokáže změřit, ale neměnit.

Existují i ​​další definice tohoto pojmu. Korelační analýza je metoda zpracování, která zkoumá korelační koeficienty mezi proměnnými. V tomto případě se porovnávají korelační koeficienty mezi jedním párem nebo více páry znaků, aby se mezi nimi stanovily statistické vztahy. Korelační analýza je metoda pro studium statistické závislosti mezi náhodnými veličinami s volitelnou přítomností striktně funkční povahy, ve které dynamika jedné náhodné veličiny vede k dynamice matematického očekávání jiné.

Koncept falešné korelace

Při provádění korelační analýzy je třeba vzít v úvahu, že ji lze provést ve vztahu k jakémukoli souboru znaků, často absurdních ve vztahu k sobě navzájem. Někdy mezi sebou nemají žádnou příčinnou souvislost.

V tomto případě se mluví o falešné korelaci.

Problémy korelační analýzy

Na základě výše uvedených definic můžeme formulovat následující úkoly popsané metody: získat informace o jedné z požadovaných proměnných pomocí druhé; určit blízkost vztahu mezi zkoumanými proměnnými.

Korelační analýza zahrnuje určení vztahu mezi studovanými znaky, a proto lze úkoly korelační analýzy doplnit o následující:

  • identifikace faktorů, které mají největší vliv na výsledné znaménko;
  • identifikace dříve neprobádaných příčin vztahů;
  • vytvoření korelačního modelu s jeho parametrickou analýzou;
  • studium významu komunikačních parametrů a jejich intervalového odhadu.

Spojení korelační analýzy s regresí

Metoda korelační analýzy se často neomezuje pouze na zjištění blízkosti vztahu mezi studovanými veličinami. Někdy je doplněna o sestavení regresních rovnic, které jsou získány pomocí stejnojmenné analýzy a které jsou popisem korelace mezi výsledným a faktoriálním (faktoriálním) znakem(y). Tato metoda spolu s uvažovanou analýzou tvoří metodu

Podmínky použití metody

Faktory výsledku závisí na jednom nebo více faktorech. Metodu korelační analýzy lze použít v případě velkého počtu pozorování hodnoty efektivních a faktorových ukazatelů (faktorů), přičemž zkoumané faktory by měly být kvantitativní a reflektované v konkrétních zdrojích. První lze určit normálním zákonem - v tomto případě jsou Pearsonovy korelační koeficienty výsledkem korelační analýzy, nebo, pokud znaménka tomuto zákonu nevyhovují, použije se Spearmanův koeficient pořadové korelace.

Pravidla pro výběr faktorů korelační analýzy

Při aplikaci této metody je nutné určit faktory, které ovlivňují výkonnostní ukazatele. Jsou vybírány s přihlédnutím k tomu, že mezi ukazateli musí existovat kauzální vztahy. V případě tvorby multifaktoriálního korelačního modelu se vybírají ty, které mají významný vliv na výsledný ukazatel, přičemž je vhodnější nezahrnout do korelačního modelu vzájemně závislé faktory s párovým korelačním koeficientem větším než 0,85, stejně jako ty pro které je vztah s výsledným parametrem nepřímý nebo funkční.

Zobrazení výsledků

Výsledky korelační analýzy lze prezentovat v textové i grafické podobě. V prvním případě jsou prezentovány jako korelační koeficient, ve druhém jako bodový graf.

Není-li mezi parametry korelace, jsou body na diagramu umístěny náhodně, průměrný stupeň spojení je charakterizován větší mírou uspořádanosti a je charakterizován víceméně jednotnou vzdáleností označených značek od mediánu. Silné spojení směřuje k přímce a při r=1 je bodový graf rovná čára. Inverzní korelace je charakterizována směrem grafu z levého horního rohu do pravého dolního rohu, přímá - z levého dolního do pravého horního rohu.

3D znázornění bodového grafu (rozptyl)

Kromě tradičního 2D bodového zobrazení se v současnosti používá 3D grafické znázornění korelační analýzy.

Používá se také matice bodového grafu, která zobrazuje všechny spárované grafy v jediném obrázku ve formátu matice. Pro n proměnných obsahuje matice n řádků a n sloupců. Diagram umístěný na průsečíku i-tého řádku a j-tého sloupce je grafem proměnných Xi ve srovnání s Xj. Každý řádek a sloupec je tedy jedna dimenze, jedna buňka zobrazuje bodový graf dvou dimenzí.

Odhad těsnosti spoje

Těsnost korelace je určena korelačním koeficientem (r): silná - r = ±0,7 až ±1, střední - r = ±0,3 až ±0,699, slabá - r = 0 až ±0,299. Tato klasifikace není přísná. Obrázek ukazuje trochu jiné schéma.

Příklad aplikace metody korelační analýzy

Zajímavá studie byla provedena ve Velké Británii. Je věnována vztahu kouření a karcinomu plic a byla provedena korelační analýzou. Toto pozorování je uvedeno níže.

Počáteční data pro korelační analýzu

Profesní skupina

úmrtnost

Zemědělci, lesníci a rybáři

Horníci a dělníci v lomech

Výrobci plynu, koksu a chemikálií

Výrobci skla a keramiky

Dělníci v pecích, kovárnách, slévárnách a válcovnách

Pracovníci elektrotechniky a elektroniky

Strojírenství a příbuzné profese

Dřevozpracující výroba

Koželuhové

Textilní dělníci

Výrobci pracovních oděvů

Pracovníci v potravinářském, nápojovém a tabákovém průmyslu

Výrobci papíru a tisku

Výrobci jiných produktů

Stavitelé

Umělci a dekoratéři

Řidiči stacionárních motorů, jeřábů atd.

Pracovníci jinde neuvedení

Pracovníci dopravy a spojů

Skladníci, skladníci, baliči a pracovníci plnicích strojů

pracovníci v kanceláři

Prodejci

Pracovníci sportovních a rekreačních služeb

Administrátoři a manažeři

Profesionálové, technici a umělci

Začneme korelační analýzou. Řešení je lepší pro přehlednost začít grafickou metodou, pro kterou sestrojíme rozptylový (rozptylový) diagram.

Ukazuje přímou souvislost. Jen na základě grafické metody je však obtížné vyvodit jednoznačný závěr. Proto budeme v korelační analýze pokračovat. Příklad výpočtu korelačního koeficientu je uveden níže.

Pomocí softwarových nástrojů (na příkladu MS Excel bude popsán níže) určíme korelační koeficient, který je 0,716, což znamená silný vztah mezi studovanými parametry. Statistickou významnost získané hodnoty určíme podle příslušné tabulky, pro kterou potřebujeme odečíst 2 od 25 dvojic hodnot, ve výsledku dostaneme 23 a pro tento řádek v tabulce najdeme r kritické pro p = 0,01 (protože se jedná o medicínská data, přísnější závislost, v ostatních případech stačí p=0,05), což je pro tuto korelační analýzu 0,51. Příklad ukázal, že vypočtené r je větší než kritické r, hodnota korelačního koeficientu je považována za statisticky významnou.

Využití softwaru v korelační analýze

Popsaný typ statistického zpracování dat lze provádět pomocí softwaru, zejména MS Excel. Korelace zahrnuje výpočet následujících parametrů pomocí funkcí:

1. Korelační koeficient je určen pomocí funkce CORREL (pole1; pole2). Pole1,2 je buňka rozsahu hodnot výsledných a faktorových proměnných.

Lineární korelační koeficient se také nazývá Pearsonův korelační koeficient, a proto počínaje Excelem 2007 můžete funkci používat se stejnými poli.

Grafické zobrazení korelační analýzy v Excelu se provádí pomocí panelu "Charts" s volbou "Scatter Plot".

Po upřesnění výchozích dat získáme graf.

2. Vyhodnocení významnosti párového korelačního koeficientu pomocí Studentova t-testu. Vypočtená hodnota t-kritéria je porovnána s tabulkovou (kritickou) hodnotou tohoto ukazatele z odpovídající tabulky hodnot uvažovaného parametru s přihlédnutím k dané hladině významnosti a počtu stupňů volnosti. Tento odhad se provádí pomocí funkce STUDIV(pravděpodobnost; stupně_volnosti).

3. Matice párových korelačních koeficientů. Analýza se provádí pomocí nástroje "Analýza dat", ve kterém je vybrána "Korelace". Statistické vyhodnocení párových korelačních koeficientů se provádí porovnáním jejich absolutní hodnoty s tabulkovou (kritickou) hodnotou. Když vypočtený párový korelační koeficient překročí tuto kritickou hodnotu, můžeme s přihlédnutím k danému stupni pravděpodobnosti říci, že nulová hypotéza o významnosti lineárního vztahu není zamítnuta.

Konečně

Využití metody korelační analýzy ve vědeckém výzkumu umožňuje určit vztah mezi různými faktory a výkonnostními ukazateli. Zároveň je třeba vzít v úvahu, že vysoký korelační koeficient lze získat i z absurdního páru nebo souboru dat, a proto je nutné tento typ analýzy provádět na dostatečně velkém datovém poli.

Po získání vypočtené hodnoty r je žádoucí porovnat ji s r kritickou pro potvrzení statistické významnosti určité hodnoty. Korelační analýzu lze provádět ručně pomocí vzorců nebo pomocí softwarových nástrojů, zejména MS Excel. Zde můžete také vytvořit rozptylový (rozptylový) diagram pro účely vizuální reprezentace vztahu mezi studovanými faktory korelační analýzy a výsledným znakem.

Při studiu korelace pokuste se zjistit, zda existuje nějaký vztah mezi dvěma ukazateli ve stejném vzorku (například mezi výškou a hmotností dětí nebo mezi úrovní IQ a školním prospěchem) nebo mezi dvěma různými vzorky (například při srovnávání párů dvojčat), a pokud tento vztah existuje, zda je nárůst jednoho ukazatele doprovázen zvýšením (pozitivní korelace) nebo poklesem (negativní korelace) jiný.

Jinými slovy, korelační analýza pomáhá zjistit, zda je možné předvídat možné hodnoty jednoho ukazatele se znalostí hodnoty jiného.

Až dosud jsme při analýze výsledků našich zkušeností se studiem účinků marihuany záměrně ignorovali takový ukazatel, jako je reakční doba. Mezitím by bylo zajímavé ověřit, zda existuje vztah mezi účinností reakcí a jejich rychlostí. To by umožnilo například tvrdit, že čím je člověk pomalejší, tím přesnější a efektivnější bude jeho jednání a naopak.

K tomuto účelu lze použít dvě různé metody: parametrickou metodu pro výpočet Bravais-Pearsonova koeficientu (r) a výpočet korelačního koeficientu Spearmanových řad (r s ), který se vztahuje na ordinální data, tedy je neparametrický. Nejprve si však ujasněme, co je to korelační koeficient.

Korelační koeficient

Korelační koeficient je hodnota, která se může měnit od -1 do 1. V případě úplné kladné korelace je tento koeficient plus 1 a s úplným záporem - mínus 1. Na grafu to odpovídá přímce procházející přes průsečíky hodnot každého páru dat:

Variabilní

Pokud tyto body nejsou zarovnány v přímce, ale tvoří „mrak“, absolutní hodnota korelačního koeficientu bude menší než jedna a při zaokrouhlování mraku se blíží nule:

Pokud je korelační koeficient 0, jsou obě proměnné na sobě zcela nezávislé.

V humanitních oborech je korelace považována za silnou, pokud je její koeficient větší než 0,60; pokud překročí 0,90, pak je korelace považována za velmi silnou. Abychom však mohli vyvozovat závěry o vztazích mezi proměnnými, má velký význam velikost výběrového souboru: čím větší výběr, tím spolehlivější hodnota získaného korelačního koeficientu. Existují tabulky s kritickými hodnotami Bravais-Pearsonových a Spearmanových korelačních koeficientů pro různý počet stupňů volnosti (je roven počtu párů mínus 2, tzn. n-2). Pouze pokud jsou korelační koeficienty větší než tyto kritické hodnoty, lze je považovat za spolehlivé. Aby byl korelační koeficient 0,70 spolehlivý, mělo by se do analýzy vzít alespoň 8 párů dat ( = P - 2 = 6) při výpočtu r(tabulka B.4) a 7 párů dat (= n - 2 = 5) při výpočtu r s (Tabulka 5 v příloze B. 5).

Bravais-Pearsonův koeficient

Pro výpočet tohoto koeficientu se používá následující vzorec (u různých autorů může vypadat jinak):

kde  XY je součet součinů dat z každého páru;

n - počet párů;

- průměr pro proměnná data X;

Průměr pro proměnná data Y;

S X - X;

s Y - směrodatná odchylka pro rozdělení y

Nyní můžeme pomocí tohoto koeficientu určit, zda existuje vztah mezi reakční dobou subjektů a účinností jejich akcí. Vezměte si například úroveň pozadí kontrolní skupiny.

n= 15  15,8  13,4 = 3175,8;

(n 1)S X S y = 14  3,07  2,29 = 98,42;

r =

Záporná hodnota korelačního koeficientu může znamenat, že čím delší je reakční doba, tím nižší je účinnost. Jeho hodnota je však příliš malá na to, aby se dalo hovořit o významném vztahu mezi těmito dvěma proměnnými.

nXY=………

(n- 1) S X S Y = ……

Jaký závěr lze z těchto výsledků vyvodit? Pokud si myslíte, že existuje vztah mezi proměnnými, tak jaký to je - přímý nebo reverzní? Je to spolehlivé [srov. tab. 4 (v příloze B. 5) s kritickými hodnotami r]?

Spearmanův koeficient pořadové korelacer s

Tento koeficient se snáze vypočítá, ale výsledky jsou méně přesné než použití r. To je způsobeno skutečností, že při výpočtu Spearmanova koeficientu se používá pořadí dat, nikoli jejich kvantitativní charakteristiky a intervaly mezi třídami.

Jde o to, že při použití koeficientu pořadové korelace Spearman(r s ) pouze ověřují, zda bude pořadí údajů u některého vzorku stejné jako v řadě jiných údajů pro tento vzorek spárovaný s prvním (například zda budou studenti „umístěni“ stejně, když projdou psychologií i matematikou, popř. i se dvěma různými profesory psychologie?). Pokud je koeficient blízký + 1, pak to znamená, že se obě řady prakticky shodují, a pokud je tento koeficient blízko - 1, můžeme mluvit o úplném inverzním vztahu.

Součinitel r s vypočítané podle vzorce

kde d- rozdíl mezi řadami hodnot konjugovaných vlastností (bez ohledu na jeho znaménko) a n- počet párů.

Obvykle se tento neparametrický test používá v případech, kdy potřebujete vyvodit nějaké závěry, o kterých se tolik nemluví intervalech mezi údaji, kolik o nich hodnosti, a také když jsou distribuční křivky příliš asymetrické a neumožňují použití takových parametrických kritérií, jako je koeficient r(v těchto případech může být nutné převést kvantitativní data na ordinální data).

Protože je tomu tak v případě rozložení hodnot účinnosti a reakční doby v experimentální skupině po expozici, můžete zopakovat výpočty, které jste již provedli pro tuto skupinu, pouze nyní ne pro koeficient r, a pro indikátor r s . To vám umožní vidět, jak se tyto dva indikátory liší*.

* To je třeba mít na paměti

1) pro počet zásahů odpovídá 1. místo nejvyššímu a 15. nejnižšímu výkonu, zatímco u reakční doby odpovídá 1. pořadí nejkratšímu času a 15. nejdelšímu;

2) údajům ex aequo je přiřazeno průměrné pořadí.

Tedy jako v případě koeficientu r, obdržel pozitivní, i když nespolehlivý výsledek. Který z těchto dvou výsledků je věrohodnější: r=-0,48 resp r s = +0,24? Taková otázka může vyvstat pouze tehdy, jsou-li výsledky spolehlivé.

Rád bych ještě jednou zdůraznil, že podstata těchto dvou koeficientů je poněkud odlišná. Záporný koeficient r udává, že účinnost je nejčastěji tím vyšší, čím rychlejší je reakční doba, přičemž při výpočtu koeficientu r s bylo nutné zkontrolovat, zda rychlejší subjekty reagují vždy přesněji a pomalejší méně přesně.

Protože v experimentální skupině byl po expozici získán koeficient r s , rovna 0,24, takový trend zde zjevně nelze vysledovat. Pokuste se sami porozumět údajům pro kontrolní skupinu po expozici s vědomím, že  d 2 = 122,5:

; je to spolehlivé?

Jaký je váš závěr? …………………………………………………………………………………………………………

…………………………………………………………………………………………………………………….

Zvažovali jsme tedy různé parametrické a neparametrické statistické metody používané v psychologii. Naše recenze byla velmi povrchní a jejím hlavním úkolem bylo přimět čtenáře, aby pochopil, že statistiky nejsou tak děsivé, jak se zdají, a vyžadují především zdravý rozum. Připomínáme, že údaje o „zkušenosti“, kterými jsme se zde zabývali, jsou fiktivní a nemohou sloužit jako základ pro jakékoli závěry. Takový experiment by však stál za provedení. Protože byla pro tento experiment zvolena čistě klasická technika, mohla být stejná statistická analýza použita v mnoha různých experimentech. V každém případě se nám zdá, že jsme nastínili některé hlavní směry, které mohou být užitečné pro ty, kteří nevědí, kde začít se statistickou analýzou výsledků.

Existují tři hlavní odvětví statistiky: deskriptivní statistika, induktivní statistika a korelační analýza.