Európska komisia je súčasťou štruktúry. Európska komisia. Potrebujete pomoc s témou

V dnešnom článku si povieme, ako môžu byť premenné navzájom prepojené. Pomocou korelácie budeme vedieť určiť, či existuje vzťah medzi prvou a druhou premennou. Dúfam, že táto lekcia bude pre vás rovnako vzrušujúca ako tie predchádzajúce!

Korelácia meria silu a smer vzťahu medzi x a y. Obrázok ukazuje rôzne typy korelácií ako bodové grafy usporiadaných párov (x, y). Tradične je x umiestnené na vodorovnej osi a y na zvislej.

Graf A je príkladom pozitívnej lineárnej korelácie: so zvyšovaním x rastie aj y, a to lineárne. Graf B nám ukazuje príklad negatívnej lineárnej korelácie, kde ako x rastie, y lineárne klesá. V grafe C nevidíme žiadnu koreláciu medzi x a y. Tieto premenné sa navzájom nijako neovplyvňujú.

Nakoniec graf D je príkladom nelineárnych vzťahov medzi premennými. Keď sa x zvyšuje, y najprv klesá, potom mení smer a rastie.

Zvyšok článku je venovaný lineárnym vzťahom medzi závislými a nezávislými premennými.

Korelačný koeficient

Korelačný koeficient r nám poskytuje silu a smer vzťahu medzi nezávislými a závislými premennými. Hodnoty r sú medzi -1,0 a +1,0. Keď má r kladná hodnota, vzťah medzi x a y je pozitívny (graf A na obrázku), a keď je hodnota r záporná, vzťah je tiež negatívny (graf B). Korelačný koeficient blízky nule naznačuje, že medzi x a y nie je žiadny graf C.

Sila spojenia medzi x a y je určená blízkosťou korelačného koeficientu k - 1,0 alebo + - 1,0. Preštudujte si nasledujúci obrázok.

Graf A ukazuje perfektnú pozitívnu koreláciu medzi x a y pri r = + 1,0. Graf B je dokonalá negatívna korelácia medzi x a y pri r = -1,0. Grafy C a D sú príkladmi slabších vzťahov medzi závislými a nezávislými premennými.

Korelačný koeficient r určuje silu aj smer vzťahu medzi závislými a nezávislými premennými. Hodnoty r sa pohybujú od -1,0 (silná negatívna asociácia) do +1,0 (silná pozitívna asociácia). Pre r=0 neexistuje vzťah medzi x a y.

Skutočný korelačný koeficient môžeme vypočítať pomocou nasledujúcej rovnice:

Dobre dobre! Viem, že táto rovnica vyzerá ako strašná spleť nejasných symbolov, ale skôr ako spanikárime, aplikujme na ňu príklad zo skúšky. Povedzme, že chcem zistiť, či existuje vzťah medzi počtom hodín, ktoré študent strávi štúdiom štatistiky, a známkou zo záverečnej skúšky. Nižšie uvedená tabuľka nám pomôže rozdeliť túto rovnicu na niekoľko jednoduchých výpočtov a urobiť ich lepšie zvládnuteľnými.

Ako vidíte, existuje veľmi silná pozitívna korelácia medzi počtom hodín strávených štúdiom predmetu a známkou zo skúšky. Učitelia sa o tom budú veľmi tešiť.

Aká je výhoda vytvorenia vzťahu medzi podobnými premennými? Skvelá otázka. Ak sa zistí, že existuje spojenie, môžeme predpovedať skóre skúšky na základe určitého počtu hodín strávených štúdiom predmetu. Jednoducho povedané, čím silnejší je vzťah, tým presnejšia bude naša predpoveď.

Použitie Excelu na výpočet korelačných koeficientov

Som si istý, že po zhliadnutí týchto strašných výpočtov korelačných koeficientov zažijete skutočnú radosť z toho, že Excel dokáže urobiť všetku túto prácu za vás pomocou funkcie CORREL s nasledujúcimi charakteristikami:

CORREL(pole 1; pole 2),

pole 1 = rozsah údajov pre prvú premennú,

pole 2 = rozsah údajov pre druhú premennú.

Na obrázku je napríklad znázornená funkcia CORREL použitá pri výpočte korelačného koeficientu pre príklad známky zo skúšky.

V kapitole 4 sme sa pozreli na základné jednorozmerné deskriptívne štatistiky – miery centrálnej tendencie a variability – ktoré sa používajú na opis jednej premennej. V tejto kapitole sa pozrieme na hlavné korelačné koeficienty.

Korelačný koeficient- dvojrozmerná popisná štatistika, kvantitatívna miera vzťahu (spoločnej variability) dvoch premenných.

História vývoja a aplikácie korelačných koeficientov na štúdium vzťahov sa vlastne začala súčasne so vznikom meracieho prístupu k štúdiu individuálnych rozdielov - v rokoch 1870-1880. Priekopníkom v meraní ľudských schopností, ako aj autorom samotného pojmu „korelačný koeficient“, bol Francis Galton a najpopulárnejšie korelačné koeficienty vyvinul jeho nasledovník Karl Pearson. Odvtedy je štúdium vzťahov pomocou korelačných koeficientov jednou z najpopulárnejších činností v psychológii.

Dodnes bolo vyvinutých veľké množstvo rôznych korelačných koeficientov, problematike merania vzťahu s ich pomocou sú venované stovky kníh. Preto, bez nároku na úplnosť, budeme brať do úvahy len tie najdôležitejšie, skutočne nevyhnutné vo výskume miery spojenia - /--Pearson, r-Spearman a m-Kendall. ich spoločný znak spočíva v tom, že odrážajú vzťah dvoch znakov meraných na kvantitatívnej škále – poradia alebo metriky.

Vo všeobecnosti sa každá empirická štúdia zameriava na štúdium vzťahu dvoch alebo viacerých premenných.

PRÍKLADY

Uveďme dva príklady skúmania vplyvu predvádzania násilných scén v TV na agresivitu adolescentov. 1. Skúma sa vzťah dvoch premenných meraných v kvantitatívnej (hodnotovej alebo metrickej) škále: 1) „čas sledovania televíznych programov s násilím“; 2) "agresivita".

Číta sa ako Tau-Kendall.


KAPITOLA 6. KORELAČNÉ KOEFICIENTY

2. Skúmame rozdiel v agresivite 2 a viacerých skupín adolescentov, líšiacich sa dĺžkou sledovania TV relácií s ukážkami násilných scén.

V druhom príklade možno štúdium rozdielov znázorniť ako štúdium vzťahu medzi 2 premennými, z ktorých jedna je nominačná (dĺžka sledovania TV). A pre túto situáciu boli vyvinuté aj ich vlastné korelačné koeficienty.

Akákoľvek štúdia môže byť zredukovaná na štúdium korelácií, pretože pre takmer akúkoľvek výskumnú situáciu boli vynájdené rôzne korelačné koeficienty. Ale v nasledujúcom budeme rozlišovať medzi dvoma triedami problémov:

P štúdium korelácií - keď sú dve premenné prezentované na číselnej škále;

rozdielová štúdia - keď je aspoň jedna z dvoch premenných prezentovaná v nominatívnej škále.


Tomuto členeniu zodpovedá aj logika budovania populárnych počítačových štatistických programov, v ktorých je menu Korelácie sú navrhnuté tri koeficienty (/--Pearson, r-Spearman a x-Kendall) a na riešenie ďalších výskumných problémov sú navrhnuté metódy porovnávania skupín.

KONCEPCIA KORELOVANIA

Vzťahy v jazyku matematiky sa zvyčajne opisujú pomocou funkcií, ktoré sú graficky znázornené ako čiary. Na obr. 6.1 ukazuje niekoľko grafov funkcií. Ak zmena jednej premennej o jednu jednotku vždy vedie k zmene druhej premennej o rovnakú hodnotu, funkcia je lineárne(jeho graf je priamka); akékoľvek iné spojenie nelineárne. Ak je nárast jednej premennej spojený so zvýšením inej premennej, potom tento vzťah je pozitívny (rovný); Ak je nárast jednej premennej spojený s poklesom inej premennej, potom tento vzťah je negatívny (reverzný). Ak sa smer zmeny jednej premennej nemení s rastom (poklesom) inej premennej, potom je takáto funkcia monotónny; inak sa volá funkcia nemonotónne.

funkčné odkazy, podobné tým, ktoré sú znázornené na obr. 6.1 sú idealizácie. Ich zvláštnosť spočíva v tom, že jednej hodnote jednej premennej zodpovedá presne definovaná hodnota inej premennej. Napríklad taký je vzťah dvoch fyzikálnych premenných – hmotnosti a dĺžky tela (lineárny kladný). Avšak aj vo fyzikálnych experimentoch sa empirický vzťah bude líšiť od funkčného vzťahu z dôvodu nezohľadnených alebo neznámych dôvodov: kolísanie v zložení materiálu, chyby merania atď.

Ryža. 6.1. Príklady grafov často sa vyskytujúcich funkcií

V psychológii, podobne ako v mnohých iných vedách, výskumník pri štúdiu vzťahu znakov nevyhnutne stráca veľa možných dôvodov pre variabilitu týchto znakov. Výsledkom je, že dokonca funkčný vzťah medzi premennými, ktorý existuje v skutočnosti, sa empiricky javí ako pravdepodobnostný (stochastický): rovnaká hodnota jednej premennej zodpovedá rozdeleniu rôznych hodnôt inej premennej (a naopak). Najjednoduchším príkladom je pomer výšky a hmotnosti ľudí. Empirické výsledky skúmania týchto dvoch znamení samozrejme ukážu ich pozitívny vzťah. Je však ľahké uhádnuť, že sa bude líšiť od striktnej, lineárnej, pozitívnej - ideálnej matematickej funkcie, a to aj so všetkými trikmi výskumníka, aby sa zohľadnila harmónia alebo plnosť predmetov. (Je nepravdepodobné, že by na tomto základe niekomu napadlo popierať existenciu striktného funkčného vzťahu medzi dĺžkou a hmotnosťou tela.)

Takže v psychológii, ako aj v mnohých iných vedách, funkčný vzťah javov možno empiricky odhaliť iba ako pravdepodobnostný vzťah zodpovedajúcich znakov. Vizuálne znázornenie povahy pravdepodobnostného vzťahu dáva Rozptylový diagram - graf, ktorého osi zodpovedajú hodnotám dvoch premenných a každý subjekt je bod (obr. 6.2). Korelačné koeficienty sa používajú ako číselná charakteristika pravdepodobnostného spojenia.

6.6.2018 16 235 0 Igor

Psychológia a spoločnosť

Všetko na svete je prepojené. Každý človek sa na úrovni intuície snaží nájsť vzťah medzi javmi, aby ich mohol ovplyvňovať a kontrolovať. Koncept, ktorý odráža tento vzťah, sa nazýva korelácia. Čo to znamená zjednodušene?

Obsah:

Koncept korelácie

Korelácia (z latinského "correlatio" - pomer, vzťah)- matematický pojem, ktorý znamená mieru štatistickej pravdepodobnostnej závislosti medzi náhodnými veličinami (premennými).



Príklad: Zoberme si dva typy vzťahov:

  1. Prvý- pero v ruke človeka. Akým smerom sa pohybuje ruka, tým smerom sa pohybuje aj pero. Ak je ruka v pokoji, pero nebude písať. Ak na to človek trochu silnejšie stlačí, potom bude známka na papieri bohatšia. Tento typ vzťahu odráža rigidnú závislosť a nie je koreláciou. Tento vzťah je funkčný.
  2. Druhý pohľad- vzťah medzi úrovňou vzdelania človeka a čítaním literatúry. Nie je vopred známe, kto z ľudí číta viac: vyššie vzdelanie alebo bez neho. Tento vzťah je náhodný alebo stochastický, skúma ho štatistická veda, ktorá sa zaoberá výlučne hromadnými javmi. Ak štatistický výpočet umožní preukázať koreláciu medzi úrovňou vzdelania a čítanosťou literatúry, potom to umožní robiť akékoľvek prognózy, predpovedať pravdepodobnostný výskyt udalostí. Na tomto príklade možno s vysokou mierou pravdepodobnosti tvrdiť, že ľudia s vyšším vzdelaním, tí vzdelanejší, čítajú viac kníh. Ale keďže vzťah medzi týmito parametrami nie je funkčný, môžeme urobiť chybu. Vždy je možné vypočítať pravdepodobnosť takejto chyby, ktorá bude jednoznačne malá a nazýva sa hladina štatistickej významnosti (p).

Príklady vzťahu medzi prirodzený fenomén sú: potravinový reťazec v prírode, ľudské telo, ktoré pozostáva z orgánových systémov navzájom prepojených a fungujúcich ako celok.

Každý deň sa stretávame s koreláciou v Každodenný život: medzi počasím a dobrá nálada, správna formulácia cieľov a ich dosahovanie, pozitívny prístup a šťastie, pocit šťastia a finančný blahobyt. Ale hľadáme súvislosti nie na základe matematických výpočtov, ale na mýtoch, intuícii, poverách, planých dohadoch. Tieto javy je veľmi ťažké preložiť do matematického jazyka, vyjadriť číslami, zmerať. Iná vec je, keď analyzujeme javy, ktoré sa dajú vypočítať a prezentovať vo forme čísel. V tomto prípade môžeme koreláciu určiť pomocou korelačného koeficientu (r), ktorý odráža silu, stupeň, blízkosť a smer korelácie medzi náhodnými premennými.

Silná korelácia medzi náhodnými premennými- dôkaz o prítomnosti nejakého štatistického vzťahu špecificky medzi týmito javmi, ale tento vzťah nemožno preniesť na rovnaké javy, ale pre inú situáciu. Výskumníci, ktorí vo svojich výpočtoch získali významnú koreláciu medzi dvoma premennými na základe jednoduchosti korelačnej analýzy, často robia falošné intuitívne predpoklady o existencii kauzálnych vzťahov medzi znakmi, pričom zabúdajú, že korelačný koeficient je pravdepodobný.

Príklad: počet zranených osôb počas poľadovice a počet dopravných nehôd medzi vozidlami. Tieto veličiny budú navzájom korelovať, hoci absolútne nie sú navzájom prepojené, ale majú iba spojitosť s spoločná príčina títo náhodné udalosti- ľadový. Ak analýza neodhalila korelačný vzťah medzi javmi, ešte to nie je dôkazom absencie vzťahu medzi nimi, ktorý môže byť komplexne nelineárny, neodhalený korelačnými výpočtami.




Prvý, kto zaviedol pojem korelácia do vedeckého obehu, boli Francúzi paleontológ Georges Cuvier. V 18. storočí odvodil zákon korelácie častí a orgánov živých organizmov, vďaka ktorému bolo možné z nájdených častí tela (pozostatkov) obnoviť vzhľad celého fosílneho tvora, živočícha. V štatistike termín korelácia prvýkrát použil v roku 1886 anglický vedec Francis Galton. Nevedel však odvodiť presný vzorec na výpočet korelačného koeficientu, ale jeho študent to urobil - slávny matematik a biológ Karl Pearson.

Typy korelácií

Podľa dôležitosti- veľmi významný, významný a bezvýznamný.

Druhy

čo je r

vysoko významné

r zodpovedá hladine štatistickej významnosti p<=0,01

zmysluplný

r zhoduje sa p<=0,05

bezvýznamný

r nedosahuje p>0,1

negatívne(zníženie hodnoty jednej premennej vedie k zvýšeniu úrovne inej: čím viac fóbií má človek, tým menšia je pravdepodobnosť, že zaujme vedúcu pozíciu) a pozitívne (ak zvýšenie jednej hodnoty znamená zvýšenie úroveň iného: čím ste nervóznejší, tým je pravdepodobnejšie, že ochoriete). Ak medzi premennými neexistuje vzťah, potom sa takáto korelácia nazýva nulová.

Lineárne(keď sa jedna hodnota zvyšuje alebo znižuje, druhá sa tiež zvyšuje alebo znižuje) a nelineárne (keď, keď sa zmení jedna hodnota, charakter zmeny druhej nemožno opísať pomocou lineárnej závislosti, potom sa uplatňujú iné matematické zákony - polynóm, hyperbolická závislosť).

Silou.

Odds




V závislosti od toho, do ktorej stupnice patria študované premenné, sa vypočítajú rôzne typy korelačných koeficientov:

  1. Pearsonov korelačný koeficient, párový lineárny korelačný koeficient alebo súčinová momentová korelácia sa počíta pre premenné s intervalovými a kvantitatívnymi meracími stupnicami.
  2. Spearmanov alebo Kendallov koeficient poradovej korelácie - keď aspoň jedna z hodnôt má ordinálnu stupnicu alebo nie je normálne rozložená.
  3. Bodový dvojsériový korelačný koeficient (Fechnerov znak korelácie) - ak je jedna z dvoch hodnôt dichotomická.
  4. Štvorpoľový korelačný koeficient (koeficient viacnásobnej hodnostnej korelácie (zhody) - ak sú dve premenné dichotomické.

Pearsonov koeficient sa vzťahuje na parametrické ukazovatele korelácie, všetky ostatné - na neparametrické.

Hodnota korelačného koeficientu je v rozmedzí od -1 do +1. Pri úplnej pozitívnej korelácii r = +1, pri úplnej negatívnej korelácii r = -1.

Vzorec a výpočet





Príklady

Je potrebné určiť vzťah medzi dvoma premennými: úrovňou intelektuálneho rozvoja (podľa výsledkov testovania) a počtom meškaní za mesiac (podľa záznamov vo vzdelávacom časopise) medzi školákmi.

Počiatočné údaje sú uvedené v tabuľke:

Údaje o IQ (x)

Údaje o počte neskorých príchodov (y)

Sum

1122

Priemerná

112,2


Pre správnu interpretáciu získaného ukazovateľa je potrebné analyzovať znamienko korelačného koeficientu (+ alebo -) a jeho absolútnu hodnotu (modulo).

V súlade s klasifikačnou tabuľkou korelačného koeficientu podľa sily sme dospeli k záveru, že rxy = -0,827 je silne negatívna korelácia. Počet meškajúcich školákov teda veľmi silne závisí od úrovne ich intelektuálneho rozvoja. Môžeme povedať, že u študentov s vysokým IQ je menej pravdepodobné, že prídu neskoro na vyučovanie, ako u študentov s nízkym IQ.



Korelačný koeficient môžu využiť ako vedci na potvrdenie alebo vyvrátenie predpokladu o závislosti dvoch veličín alebo javov a meranie jeho sily, významnosti, tak aj študenti na empirický a štatistický výskum v rôznych predmetoch. Treba mať na pamäti, že tento ukazovateľ nie je ideálnym nástrojom, počíta sa len na meranie sily lineárneho vzťahu a vždy bude pravdepodobnostnou hodnotou, ktorá má určitú chybu.

Korelačná analýza sa používa v týchto oblastiach:

  • ekonomická veda;
  • astrofyzika;
  • spoločenské vedy (sociológia, psychológia, pedagogika);
  • agrochémia;
  • veda o kovoch;
  • priemysel (na kontrolu kvality);
  • hydrobiológia;
  • biometria atď.

Dôvody popularity metódy korelačnej analýzy:

  1. Relatívna jednoduchosť výpočtu korelačných koeficientov si nevyžaduje špeciálne matematické vzdelanie.
  2. Umožňuje vypočítať vzťah medzi hromadnými náhodnými premennými, ktoré sú predmetom analýzy štatistickej vedy. V tomto smere sa táto metóda rozšírila v oblasti štatistického výskumu.

Dúfajme, že teraz budete vedieť rozlíšiť medzi funkčným vzťahom a korelačným a budete vedieť, že keď počujete v televízii alebo čítate v tlači o korelácii, znamená to pozitívny a dosť významný vzťah medzi dvoma javmi.

Vo vedeckom výskume je často potrebné nájsť vzťah medzi výslednými a faktorovými premennými (úroda úrody a množstvo zrážok, výška a hmotnosť osoby v homogénnych skupinách podľa pohlavia a veku, pulzová frekvencia a telesná teplota , atď.).

Druhým sú znaky, ktoré prispievajú k zmene tých, ktoré sú s nimi spojené (prvé).

Koncept korelačnej analýzy

Existuje súbor Na základe vyššie uvedeného môžeme povedať, že korelačná analýza je metóda používaná na testovanie hypotézy štatistickej významnosti dvoch alebo viacerých premenných, ak ich výskumník dokáže zmerať, ale nie zmeniť.

Existujú aj iné definície tohto pojmu. Korelačná analýza je metóda spracovania, ktorá skúma korelačné koeficienty medzi premennými. V tomto prípade sa porovnávajú korelačné koeficienty medzi jedným párom alebo viacerými pármi znakov, aby sa medzi nimi stanovili štatistické vzťahy. Korelačná analýza je metóda na štúdium štatistickej závislosti medzi náhodnými premennými s voliteľnou prítomnosťou striktne funkčnej povahy, v ktorej dynamika jednej náhodnej premennej vedie k dynamike matematického očakávania inej.

Koncept falošnej korelácie

Pri vykonávaní korelačnej analýzy je potrebné vziať do úvahy, že ju možno vykonať vo vzťahu k akémukoľvek súboru znakov, často absurdných vo vzťahu k sebe navzájom. Niekedy nemajú medzi sebou žiadnu príčinnú súvislosť.

V tomto prípade sa hovorí o falošnej korelácii.

Problémy korelačnej analýzy

Na základe vyššie uvedených definícií môžeme formulovať nasledujúce úlohy opísanej metódy: získať informácie o jednej z požadovaných premenných pomocou druhej; určiť blízkosť vzťahu medzi skúmanými premennými.

Korelačná analýza zahŕňa určenie vzťahu medzi študovanými znakmi, a preto možno úlohy korelačnej analýzy doplniť o nasledovné:

  • identifikácia faktorov, ktoré majú najväčší vplyv na výsledný znak;
  • identifikácia predtým nepreskúmaných príčin vzťahov;
  • vytvorenie korelačného modelu s jeho parametrickou analýzou;
  • štúdium významu komunikačných parametrov a ich intervalového odhadu.

Spojenie korelačnej analýzy s regresiou

Metóda korelačnej analýzy sa často neobmedzuje len na zistenie blízkosti vzťahu medzi skúmanými veličinami. Niekedy je doplnená o zostavenie regresných rovníc, ktoré sa získajú pomocou rovnomennej analýzy a ktoré sú popisom korelácie medzi výsledným a faktoriálnym (faktoriálnym) znakom(ami). Táto metóda spolu s uvažovanou analýzou predstavuje metódu

Podmienky použitia metódy

Faktory výsledku závisia od jedného alebo viacerých faktorov. Metódu korelačnej analýzy je možné použiť, ak existuje veľké množstvo pozorovaní o hodnote efektívnych a faktorových ukazovateľov (faktorov), pričom skúmané faktory by mali byť kvantitatívne a premietnuté do konkrétnych zdrojov. Prvý môže byť určený normálnym zákonom - v tomto prípade sú Pearsonove korelačné koeficienty výsledkom korelačnej analýzy, alebo ak znamienka nevyhovujú tomuto zákonu, použije sa Spearmanov koeficient poradovej korelácie.

Pravidlá pre výber faktorov korelačnej analýzy

Pri aplikácii tejto metódy je potrebné určiť faktory, ktoré ovplyvňujú ukazovatele výkonnosti. Vyberajú sa s prihliadnutím na skutočnosť, že medzi ukazovateľmi musia existovať kauzálne vzťahy. V prípade tvorby multifaktoriálneho korelačného modelu sa vyberú tie, ktoré majú významný vplyv na výsledný ukazovateľ, pričom je vhodnejšie do korelačného modelu nezaradiť vzájomne závislé faktory s párovým korelačným koeficientom vyšším ako 0,85, ako aj tie pre ktoré je vzťah s výsledným parametrom nepriamy.alebo funkčný.

Zobrazenie výsledkov

Výsledky korelačnej analýzy je možné prezentovať v textovej a grafickej forme. V prvom prípade sú prezentované ako korelačný koeficient, v druhom ako bodový graf.

Ak medzi parametrami neexistuje korelácia, body na diagrame sú umiestnené náhodne, priemerný stupeň spojenia je charakterizovaný väčšou mierou usporiadanosti a je charakterizovaný viac-menej rovnomernou vzdialenosťou označených značiek od mediánu. Silné spojenie má tendenciu k priamej čiare a pri r=1 je bodový graf rovná čiara. Inverzná korelácia je charakterizovaná smerom grafu z ľavého horného do pravého dolného rohu, priamou - z ľavého dolného do pravého horného rohu.

3D znázornenie bodového grafu (rozptyl)

Okrem tradičnej 2D bodovej prezentácie sa v súčasnosti používa 3D grafické znázornenie korelačnej analýzy.

Používa sa aj matica bodového grafu, ktorá zobrazuje všetky spárované grafy v jednom obrázku vo formáte matice. Pre n premenných obsahuje matica n riadkov a n stĺpcov. Diagram umiestnený na priesečníku i-tého riadku a j-tého stĺpca je grafom premenných Xi v porovnaní s Xj. Každý riadok a stĺpec je teda jedna dimenzia, jedna bunka zobrazuje bodový graf dvoch dimenzií.

Odhad tesnosti spoja

Tesnosť korelácie je určená korelačným koeficientom (r): silná - r = ±0,7 až ±1, stredná - r = ±0,3 až ±0,699, slabá - r = 0 až ±0,299. Táto klasifikácia nie je prísna. Obrázok ukazuje trochu inú schému.

Príklad použitia metódy korelačnej analýzy

Vo Veľkej Británii sa uskutočnila zaujímavá štúdia. Venuje sa vzťahu fajčenia k rakovine pľúc a bola vykonaná korelačnou analýzou. Toto pozorovanie je uvedené nižšie.

Počiatočné údaje pre korelačnú analýzu

Profesionálna skupina

úmrtnosť

Poľnohospodári, lesníci a rybári

Baníci a pracovníci lomov

Výrobcovia plynu, koksu a chemikálií

Výrobcovia skla a keramiky

Robotníci v peciach, vyhniach, zlievarniach a valcovniach

Pracovníci v oblasti elektrotechniky a elektroniky

Strojárstvo a príbuzné profesie

Drevospracujúca výroba

Garbiare

Textilní robotníci

Výrobcovia pracovných odevov

Pracovníci v potravinárskom, nápojovom a tabakovom priemysle

Výrobcovia papiera a tlače

Výrobcovia iných produktov

Stavitelia

Umelci a dekoratéri

Vodiči stacionárnych motorov, žeriavov atď.

Pracovníci inde nezahrnutí

Pracovníci dopravy a spojov

Skladníci, skladníci, baliči a pracovníci plniacich strojov

kancelárskych pracovníkov

Predajcovia

Pracovníci športových a rekreačných služieb

Administrátori a manažéri

Profesionáli, technici a umelci

Začneme korelačnou analýzou. Riešenie je lepšie začať pre prehľadnosť grafickou metódou, pre ktorú zostavíme rozptylový (rozptylový) diagram.

Ukazuje priame spojenie. Len na základe grafickej metódy je však ťažké vyvodiť jednoznačný záver. Preto budeme pokračovať v korelačnej analýze. Príklad výpočtu korelačného koeficientu je uvedený nižšie.

Pomocou softvérových nástrojov (na príklade MS Excel bude popísaný nižšie) určíme korelačný koeficient, ktorý je 0,716, čo znamená silný vzťah medzi skúmanými parametrami. Stanovme si štatistickú významnosť získanej hodnoty podľa príslušnej tabuľky, pre ktorú potrebujeme od 25 párov hodnôt odpočítať 2, výsledkom je 23 a pre tento riadok v tabuľke nájdeme r kritické pre p = 0,01 (keďže ide o medicínske údaje, prísnejšia závislosť, v ostatných prípadoch stačí p=0,05), čo je pre túto korelačnú analýzu 0,51. Príklad ukázal, že vypočítané r je väčšie ako kritické r, hodnota korelačného koeficientu sa považuje za štatisticky významnú.

Využitie softvéru v korelačnej analýze

Opísaný typ štatistického spracovania údajov je možné uskutočniť pomocou softvéru, najmä MS Excel. Korelácia zahŕňa výpočet nasledujúcich parametrov pomocou funkcií:

1. Korelačný koeficient sa určí pomocou funkcie CORREL (pole1; pole2). Pole1,2 je bunka rozsahu hodnôt výsledných a faktorových premenných.

Koeficient lineárnej korelácie sa tiež nazýva Pearsonov korelačný koeficient, a preto od Excelu 2007 môžete funkciu použiť s rovnakými poľami.

Grafické zobrazenie korelačnej analýzy v Exceli sa vykonáva pomocou panela "Grafy" s výberom "Rozptylový graf".

Po zadaní počiatočných údajov dostaneme graf.

2. Vyhodnotenie významnosti párového korelačného koeficientu pomocou Studentovho t-testu. Vypočítaná hodnota t-kritéria sa porovnáva s tabuľkovou (kritickou) hodnotou tohto ukazovateľa zo zodpovedajúcej tabuľky hodnôt uvažovaného parametra, berúc do úvahy danú úroveň významnosti a počet stupňov voľnosti. Tento odhad sa robí pomocou funkcie STUDIV(pravdepodobnosť; stupne_voľnosti).

3. Matica párových korelačných koeficientov. Analýza sa vykonáva pomocou nástroja "Analýza údajov", v ktorom je vybratá možnosť "Korelácia". Štatistické vyhodnotenie párových korelačných koeficientov sa vykonáva porovnaním ich absolútnej hodnoty s tabuľkovou (kritickou) hodnotou. Keď vypočítaný párový korelačný koeficient prekročí túto kritickú hodnotu, môžeme s prihliadnutím na daný stupeň pravdepodobnosti povedať, že nulová hypotéza o významnosti lineárneho vzťahu nie je zamietnutá.

Konečne

Použitie metódy korelačnej analýzy vo vedeckom výskume umožňuje určiť vzťah medzi rôznymi faktormi a ukazovateľmi výkonnosti. Zároveň je potrebné vziať do úvahy, že vysoký korelačný koeficient možno získať aj z absurdného páru alebo súboru údajov, a preto je potrebné tento typ analýzy vykonávať na dostatočne veľkom poli údajov.

Po získaní vypočítanej hodnoty r je žiaduce porovnať ju s kritickou hodnotou r, aby sa potvrdila štatistická významnosť určitej hodnoty. Korelačnú analýzu je možné vykonávať manuálne pomocou vzorcov alebo pomocou softvérových nástrojov, najmä MS Excel. Tu môžete tiež zostaviť rozptylový (rozptylový) diagram za účelom vizuálnej reprezentácie vzťahu medzi skúmanými faktormi korelačnej analýzy a výsledným znakom.

Pri štúdiu korelácie pokúste sa zistiť, či existuje nejaký vzťah medzi dvoma ukazovateľmi v tej istej vzorke (napríklad medzi výškou a hmotnosťou detí alebo medzi úrovňou IQ a školským prospechom) alebo medzi dvoma rôznymi vzorkami (napríklad pri porovnávaní párov dvojčiat), a ak tento vzťah existuje, či je nárast jedného ukazovateľa sprevádzaný zvýšením (pozitívna korelácia) alebo znížením (negatívna korelácia) iné.

Inými slovami, korelačná analýza pomáha zistiť, či je možné predpovedať možné hodnoty jedného ukazovateľa, pričom poznáme hodnotu iného.

Doteraz sme pri analyzovaní výsledkov našich skúseností so štúdiom účinkov marihuany zámerne ignorovali taký ukazovateľ, akým je reakčný čas. Medzitým by bolo zaujímavé skontrolovať, či existuje vzťah medzi účinnosťou reakcií a ich rýchlosťou. To by umožnilo napríklad tvrdiť, že čím je človek pomalší, tým presnejšie a efektívnejšie bude jeho konanie a naopak.

Na tento účel možno použiť dve rôzne metódy: parametrickú metódu na výpočet Bravaisovho-Pearsonovho koeficientu. (r) a výpočet korelačného koeficientu Spearmanových radov (r s ), ktorý sa vzťahuje na ordinálne údaje, teda je neparametrický. Najprv však pochopme, čo je korelačný koeficient.

Korelačný koeficient

Korelačný koeficient je hodnota, ktorá sa môže meniť od -1 do 1. V prípade úplnej kladnej korelácie je tento koeficient plus 1 a s úplným mínusom - mínus 1. Na grafe to zodpovedá priamke prechádzajúcej cez priesečníky hodnôt každého páru údajov:

Variabilné

Ak tieto body nie sú zoradené v priamke, ale tvoria „oblak“, absolútna hodnota korelačného koeficientu bude menšia ako jedna a pri zaokrúhľovaní oblaku sa blíži k nule:

Ak je korelačný koeficient 0, obe premenné sú od seba úplne nezávislé.

V humanitných vedách sa korelácia považuje za silnú, ak je jej koeficient väčší ako 0,60; ak presiahne 0,90, potom sa korelácia považuje za veľmi silnú. Na to, aby bolo možné vyvodiť závery o vzťahoch medzi premennými, má však veľký význam veľkosť vzorky: čím väčšia vzorka, tým spoľahlivejšia je hodnota získaného korelačného koeficientu. Existujú tabuľky s kritickými hodnotami Bravais-Pearsonových a Spearmanových korelačných koeficientov pre rôzny počet stupňov voľnosti (rovná sa počtu párov mínus 2, t.j. n-2). Iba ak sú korelačné koeficienty väčšie ako tieto kritické hodnoty, možno ich považovať za spoľahlivé. Takže, aby bol korelačný koeficient 0,70 spoľahlivý, do analýzy by sa malo vziať aspoň 8 párov údajov ( = P - 2 = 6) pri výpočte r(tabuľka B.4) a 7 párov údajov (= n - 2 = 5) pri výpočte r s (Tabuľka 5 v prílohe B. 5).

Bravais-Pearsonov koeficient

Na výpočet tohto koeficientu sa používa nasledujúci vzorec (pre rôznych autorov môže vyzerať inak):

kde  XY je súčet súčinov údajov z každého páru;

n - počet párov;

- priemer pre variabilné údaje X;

Priemer pre variabilné údaje Y;

S X - X;

s Y - štandardná odchýlka pre rozdelenie r.

Teraz môžeme pomocou tohto koeficientu určiť, či existuje vzťah medzi reakčným časom subjektov a efektívnosťou ich konania. Vezmite si napríklad úroveň pozadia kontrolnej skupiny.

n= 15  15,8  13,4 = 3175,8;

(n 1)S X S r = 14  3,07  2,29 = 98,42;

r =

Záporná hodnota korelačného koeficientu môže znamenať, že čím dlhší je reakčný čas, tým nižšia je účinnosť. Jeho hodnota je však príliš malá na to, aby sa dalo hovoriť o významnom vzťahu medzi týmito dvoma premennými.

nXY=………

(n- 1) S X S Y = ……

Aký záver možno vyvodiť z týchto výsledkov? Ak si myslíte, že existuje vzťah medzi premennými, čo to je - priamy alebo reverzný? Je to spoľahlivé [porov. tab. 4 (v prílohe B. 5) s kritickými hodnotami r]?

Spearmanov koeficient poradovej korelácier s

Tento koeficient sa ľahšie vypočíta, ale výsledky sú menej presné ako pri použití r. Je to spôsobené tým, že pri výpočte Spearmanovho koeficientu sa používa poradie údajov a nie ich kvantitatívne charakteristiky a intervaly medzi triedami.

Ide o to, že pri použití koeficientu poradovej korelácie Spearman(r s ) iba skontrolujú, či poradie údajov pre niektorú vzorku bude rovnaké ako v sérii iných údajov pre túto vzorku spárovanú s prvou (napríklad, či budú študenti „zoradení“ rovnako, keď prejdú z psychológie aj z matematiky, resp. aj s dvoma rôznymi profesormi psychológie?). Ak je koeficient blízky + 1, potom to znamená, že obe série sa prakticky zhodujú, a ak je tento koeficient blízky - 1, môžeme hovoriť o úplnom inverznom vzťahu.

Koeficient r s vypočítané podľa vzorca

kde d- rozdiel medzi hodnotami konjugovaných znakov (bez ohľadu na jeho znamienko) a n- počet párov.

Tento neparametrický test sa zvyčajne používa v prípadoch, keď potrebujete vyvodiť nejaké závery, o ktorých nie je toľko intervaloch medzi údajmi, koľko o nich hodnosti, a tiež vtedy, keď sú distribučné krivky príliš asymetrické a neumožňujú použitie takých parametrických kritérií, ako je koeficient r(v týchto prípadoch môže byť potrebné previesť kvantitatívne údaje na poradové údaje).

Keďže toto je prípad rozloženia hodnôt účinnosti a reakčného času v experimentálnej skupine po expozícii, môžete zopakovať výpočty, ktoré ste už urobili pre túto skupinu, len teraz nie pre koeficient r, a pre indikátor r s . To vám umožní vidieť, ako sa tieto dva indikátory líšia*.

* Na to treba pamätať

1) pri počte zásahov 1. miesto zodpovedá najvyššiemu a 15. najnižšiemu výkonu, zatiaľ čo pri reakčnom čase 1. miesto zodpovedá najkratšiemu času a 15. najdlhšiemu;

2) údajom ex aequo je priradené priemerné poradie.

Teda ako v prípade koeficientu r, dostal pozitívny, aj keď nespoľahlivý výsledok. Ktorý z týchto dvoch výsledkov je vierohodnejší: r=-0,48 resp r s = +0,24? Takáto otázka môže vzniknúť iba vtedy, ak sú výsledky spoľahlivé.

Chcel by som ešte raz zdôrazniť, že podstata týchto dvoch koeficientov je trochu odlišná. Záporný koeficient r označuje, že účinnosť je najčastejšie tým vyššia, čím rýchlejšia je reakčná doba, pričom pri výpočte koeficientu r s bolo potrebné skontrolovať, či rýchlejšie subjekty reagujú vždy presnejšie a pomalšie menej presnejšie.

Pretože v experimentálnej skupine sa po expozícii získal koeficient r s , rovná 0,24, takýto trend tu zjavne nie je možné sledovať. Pokúste sa sami pochopiť údaje pre kontrolnú skupinu po expozícii, vediac, že ​​ d 2 = 122,5:

; je to spoľahlivé?

Aký je váš záver? …………………………………………………………………………………………………………

…………………………………………………………………………………………………………………….

Zvažovali sme teda rôzne parametrické a neparametrické štatistické metódy používané v psychológii. Naša recenzia bola veľmi povrchná a jej hlavnou úlohou bolo, aby čitateľ pochopil, že štatistiky nie sú také strašidelné, ako sa zdajú, a vyžadujú si hlavne zdravý rozum. Pripomíname, že údaje o „skúsenostiach“, ktorými sme sa tu zaoberali, sú fiktívne a nemôžu slúžiť ako základ pre žiadne závery. Takýto experiment by však stál za vykonanie. Keďže pre tento experiment bola zvolená čisto klasická technika, rovnakú štatistickú analýzu bolo možné použiť v mnohých rôznych experimentoch. V každom prípade sa nám zdá, že sme načrtli niekoľko hlavných smerov, ktoré môžu byť užitočné pre tých, ktorí nevedia, kde začať so štatistickou analýzou výsledkov.

Existujú tri hlavné odvetvia štatistiky: deskriptívna štatistika, induktívna štatistika a korelačná analýza.