Comisia Europeană face parte din structură. Comisia Europeană. Am nevoie de ajutor cu un subiect

În articolul de astăzi, vom vorbi despre modul în care variabilele pot fi legate între ele. Cu ajutorul corelației, vom putea determina dacă există o relație între prima și a doua variabilă. Sper că veți găsi această lecție la fel de interesantă ca și cele anterioare!

Corelația măsoară puterea și direcția relației dintre x și y. Figura prezintă diferite tipuri de corelații ca diagrame de dispersie de perechi ordonate (x, y). În mod tradițional, x este plasat pe axa orizontală și y pe verticală.

Graficul A este un exemplu de corelație liniară pozitivă: pe măsură ce x crește, crește și y și liniar. Graficul B ne arată un exemplu de corelație liniară negativă în care pe măsură ce x crește, y scade liniar. În graficul C, nu vedem nicio corelație între x și y. Aceste variabile nu se afectează în niciun fel reciproc.

În cele din urmă, diagrama D este un exemplu de relații neliniare între variabile. Pe măsură ce x crește, y mai întâi scade, apoi își schimbă direcția și crește.

Restul articolului este dedicat relațiilor liniare dintre variabilele dependente și independente.

Coeficient de corelație

Coeficientul de corelație, r, ne oferă atât puterea, cât și direcția relației dintre variabilele independente și dependente. Valorile r sunt cuprinse între -1,0 și +1,0. Când r are valoare pozitivă, relația dintre x și y este pozitivă (graficul A din figură), iar când valoarea lui r este negativă, relația este și ea negativă (graficul B). Un coeficient de corelație apropiat de zero indică faptul că nu există un grafic C între x și y.

Forța conexiunii dintre x și y este determinată de apropierea coeficientului de corelație de - 1,0 sau + - 1,0. Studiați următoarea figură.

Graficul A arată o corelație pozitivă perfectă între x și y la r = + 1,0. Graficul B este o corelație negativă perfectă între x și y la r = -1,0. Graficele C și D sunt exemple de relații mai slabe între variabilele dependente și independente.

Coeficientul de corelație, r, determină atât puterea, cât și direcția relației dintre variabilele dependente și cele independente. Valorile r variază de la -1,0 (asociere negativă puternică) la +1,0 (asociere pozitivă puternică). Pentru r=0, nu există nicio relație între x și y.

Putem calcula coeficientul de corelație real folosind următoarea ecuație:

Ei bine! Știu că această ecuație arată ca o groază groaznică de simboluri obscure, dar înainte de a intra în panică, să-i aplicăm exemplul de calificare la examen. Să presupunem că vreau să determin dacă există o relație între numărul de ore pe care un student le petrece studiind statistica și nota finală la examen. Tabelul de mai jos ne va ajuta să descompunem această ecuație în câteva calcule simple și să le facem mai ușor de gestionat.

După cum puteți vedea, există o corelație pozitivă foarte puternică între numărul de ore petrecute studiind o materie și nota la examen. Profesorii vor fi foarte bucuroși să afle despre asta.

Care este beneficiul stabilirii unei relații între variabile similare? Mare întrebare. Dacă se constată că există o conexiune, putem prezice scorurile la examen pe baza unui anumit număr de ore petrecute studiind subiectul. Mai simplu spus, cu cât relația este mai puternică, cu atât predicția noastră va fi mai precisă.

Utilizarea Excel pentru a calcula coeficienții de corelație

Sunt sigur că, după ce te uiți la aceste calcule groaznice ale coeficienților de corelare, vei experimenta adevărata bucurie să știi că Excel poate face toată această muncă pentru tine folosind funcția CORREL cu următoarele caracteristici:

CORREL(matrice 1; matrice 2),

matrice 1 = interval de date pentru prima variabilă,

matrice 2 = interval de date pentru a doua variabilă.

De exemplu, figura prezintă funcția CORREL utilizată la calcularea coeficientului de corelație pentru exemplul de calificare la examen.

În capitolul 4, ne-am uitat la statisticile descriptive univariate de bază – măsuri ale tendinței centrale și ale variabilității – care sunt folosite pentru a descrie o singură variabilă. În acest capitol, vom analiza principalii coeficienți de corelație.

Coeficient de corelație- statistica descriptivă bidimensională, o măsură cantitativă a relației (variabilitatea comună) a două variabile.

Istoria dezvoltării și aplicării coeficienților de corelație pentru studiul relațiilor a început de fapt odată cu apariția unei abordări de măsurare a studiului diferențelor individuale - în 1870-1880. Pionierul în măsurarea abilităților umane, precum și autorul termenului „coeficient de corelație” în sine, a fost Francis Galton, iar cei mai populari coeficienți de corelație au fost dezvoltați de adeptul său Karl Pearson. De atunci, studiul relațiilor folosind coeficienți de corelație a fost una dintre cele mai populare activități în psihologie.

Până în prezent, au fost dezvoltați o mulțime de coeficienți de corelație diferiți, sute de cărți sunt dedicate problemei măsurării relației cu ajutorul lor. Prin urmare, fără a pretinde că sunt complete, vom considera doar cele mai importante, cu adevărat indispensabile în cercetarea măsurilor de conexiune - / - Pearson, r-Spearman și m-Kendall. Lor trasatura comuna este că ele reflectă relația dintre două caracteristici măsurate pe o scară cantitativă - rang sau metrică.

În general, orice studiu empiric se concentrează pe studiul relației dintre două sau mai multe variabile.

EXEMPLE

Să dăm două exemple de studiul influenței demonstrației scenelor de violență la TV asupra agresivității adolescenților. 1. Se studiază relația dintre două variabile măsurate într-o scală cantitativă (rang sau metrică): 1) „timpul de vizionare a programelor de televiziune cu violență”; 2) „agresivitate”.

Citește ca Tau-Kendall.


CAPITOLUL 6. COEFICIENȚI DE CORELARE

2. Studiem diferența de agresivitate a 2 sau mai multe grupuri de adolescenți, diferind în durata de vizionare a emisiunilor TV cu demonstrații de scene de violență.

În al doilea exemplu, studiul diferențelor poate fi reprezentat ca un studiu al relației dintre 2 variabile, dintre care una nominativă (durata vizionării TV). Și pentru această situație s-au dezvoltat și proprii coeficienți de corelație.

Orice studiu poate fi redus la studiul corelațiilor, deoarece au fost inventați o varietate de coeficienți de corelație pentru aproape orice situație de cercetare. Dar în cele ce urmează, vom distinge între două clase de probleme:

P studiul corelațiilor - când două variabile sunt prezentate pe o scară numerică;

studiu de diferenta - când cel puţin una dintre cele două variabile este prezentată în scala nominativă.


Această diviziune corespunde, de asemenea, logicii construirii de programe populare de statistică pe computer, în care meniul Corelații se propun trei coeficienţi (/--Pearson, r-Spearman şi x-Kendall), iar pentru rezolvarea altor probleme de cercetare se propun metode de comparare a grupurilor.

CONCEPTUL DE CORELARE

Relațiile în limbajul matematicii sunt de obicei descrise folosind funcții care sunt reprezentate grafic ca linii. Pe fig. 6.1 prezintă mai multe grafice ale funcțiilor. Dacă o modificare a unei variabile cu o unitate duce întotdeauna la o modificare a celeilalte variabile cu aceeași valoare, funcția este liniar(graficul său este o linie dreaptă); orice altă legătură neliniară. Dacă o creștere a unei variabile este asociată cu o creștere a alteia, atunci relația este pozitiv (direct); Dacă o creștere a unei variabile este asociată cu o scădere a alteia, atunci relația este negativ (invers). Dacă direcția de schimbare a unei variabile nu se schimbă odată cu creșterea (scăderea) unei alte variabile, atunci o astfel de funcție este monoton;în caz contrar funcția este numită nemonotonică.

legături funcționale, similare cu cele prezentate în fig. 6.1 sunt idealizări. Particularitatea lor constă în faptul că o valoare a unei variabile corespunde unei valori strict definite a altei variabile. De exemplu, aceasta este relația dintre două variabile fizice - greutatea și lungimea corpului (liniar pozitiv). Cu toate acestea, chiar și în experimentele fizice, relația empirică va diferi de relația funcțională din motive nesocotite sau necunoscute: fluctuații în compoziția materialului, erori de măsurare etc.

Orez. 6.1. Exemple de grafice ale funcțiilor care apar frecvent

În psihologie, ca și în multe alte științe, atunci când studiază relația dintre trăsături, cercetătorul pierde inevitabil din vedere multe motive posibile pentru variabilitatea acestor trăsături. Rezultatul este că chiar relația funcțională dintre variabile care există în realitate apare empiric ca probabilistică (stochastică): aceeași valoare a unei variabile corespunde distribuției diferitelor valori ale altei variabile (și invers). Cel mai simplu exemplu este raportul dintre înălțimea și greutatea oamenilor. Rezultatele empirice ale studiului acestor două semne vor arăta, desigur, relația lor pozitivă. Dar este ușor de ghicit că va diferi de o funcție matematică strictă, liniară, pozitivă - ideală, chiar și cu toate trucurile cercetătorului pentru a ține cont de armonia sau plenitudinea subiecților. (Este puțin probabil ca, pe această bază, nimănui să i se pară să nege existența unei relații funcționale stricte între lungimea și greutatea corpului.)

Deci, în psihologie, ca și în multe alte științe, interconectarea funcțională a fenomenelor poate fi relevată empiric doar ca o legătură probabilistică a trăsăturilor corespunzătoare. O reprezentare vizuală a naturii relației probabilistice oferă Diagrama de dispersie - un grafic ale cărui axe corespund valorilor a două variabile, iar fiecare subiect este un punct (Fig. 6.2). Coeficienții de corelație sunt utilizați ca o caracteristică numerică a unei conexiuni probabilistice.

06.06.2018 16 235 0 Igor

Psihologie și societate

Totul în lume este interconectat. Fiecare persoană la nivelul intuiției încearcă să găsească relația dintre fenomene pentru a le putea influența și controla. Conceptul care reflectă această relație se numește corelație. Ce înseamnă în cuvinte simple?

Conţinut:

Conceptul de corelare

Corelație (din latinescul „correlatio” - raport, relație)- un termen matematic care înseamnă o măsură a dependenței probabilistice statistice între variabile aleatoare (variabile).



Exemplu: Să luăm două tipuri de relații:

  1. Primul- un stilou în mâna unei persoane. În ce direcție se mișcă mâna, în acea direcție se mișcă stiloul. Dacă mâna este în repaus, atunci stiloul nu va scrie. Dacă o persoană apasă puțin mai tare pe ea, atunci semnul de pe hârtie va fi mai bogat. Acest tip de relație reflectă o dependență rigidă și nu este o corelație. Această relație este funcțională.
  2. A doua vedere- relația dintre nivelul de educație al unei persoane și lectura literaturii. Nu se știe dinainte care dintre oameni citește mai mult: educatie inalta sau fără ea. Această relație este aleatorie sau stocastică, este studiată de știința statistică, care se ocupă exclusiv de fenomene de masă. Dacă un calcul statistic face posibilă demonstrarea unei corelații între nivelul de educație și citirea literaturii, atunci aceasta va face posibilă efectuarea oricăror prognoze, anticiparea apariției probabilistice a evenimentelor. În acest exemplu, se poate argumenta cu un grad ridicat de probabilitate ca oamenii cu studii superioare, cei mai educați, să citească mai multe cărți. Dar din moment ce relația dintre acești parametri nu este funcțională, putem face o greșeală. Este întotdeauna posibil să se calculeze probabilitatea unei astfel de erori, care va fi unic mic și se numește nivelul de semnificație statistică (p).

Exemple de relație dintre fenomene naturale sunteți: lanțul trofic în natură, corpul uman, care constă din sisteme de organe interconectate și funcționând ca un întreg.

În fiecare zi ne confruntăm cu o corelație în Viata de zi cu zi: între vreme şi bună dispoziție, formularea corectă a obiectivelor și realizarea lor, o atitudine pozitivă și noroc, un sentiment de fericire și bunăstare financiară. Însă căutăm conexiuni bazate nu pe calcule matematice, ci pe mituri, intuiție, superstiție, conjecturi inactiv. Aceste fenomene sunt foarte greu de tradus în limbaj matematic, de exprimat în numere, de măsurat. Un alt lucru este atunci când analizăm fenomene care pot fi calculate și prezentate sub formă de numere. În acest caz, putem determina corelația folosind coeficientul de corelație (r), care reflectă puterea, gradul, apropierea și direcția corelației dintre variabile aleatoare.

Corelație puternică între variabile aleatoare- dovada prezenței unei relații statistice specific între aceste fenomene, dar această relație nu poate fi transferată la aceleași fenomene, ci pentru o situație diferită. Adesea, cercetătorii, obținând o corelație semnificativă între două variabile în calculele lor, pe baza simplității analizei corelației, fac presupuneri intuitive false despre existența unor relații cauzale între caracteristici, uitând că coeficientul de corelație este probabilistic.

Exemplu: numărul de persoane rănite în condiții de polei și numărul de accidente rutiere între vehicule. Aceste cantități se vor corela între ele, deși nu sunt în mod absolut interconectate între ele, ci au doar o legătură cu cauza comuna aceste evenimente aleatorii- înghețat. Dacă analiza nu a evidențiat o relație de corelație între fenomene, aceasta nu este încă o dovadă a absenței unei relații între ele, care poate fi complexă neliniară, nedezvăluită prin calculele de corelație.




Primul care a introdus conceptul de corelare în circulația științifică a fost francezul paleontologul Georges Cuvier. În secolul al XVIII-lea, a dedus legea corelării părților și organelor organismelor vii, datorită căreia a devenit posibilă restabilirea aspectului întregii creaturi fosile, animal, din părțile (rămășițele) ale corpului găsite. În statistică, termenul de corelație a fost folosit pentru prima dată în 1886 de un om de știință englez Francis Galton. Dar nu a putut deriva formula exactă pentru calcularea coeficientului de corelație, dar elevul său a făcut-o - celebrul matematician și biolog Karl Pearson.

Tipuri de corelație

După importanță- foarte semnificativ, semnificativ și nesemnificativ.

feluri

ce este r

extrem de semnificative

r corespunde nivelului de semnificație statistică p<=0,01

plin de înțeles

r potrivește p<=0,05

nesemnificativ

r nu ajunge la p>0,1

negativ(o scădere a valorii unei variabile duce la o creștere a nivelului alteia: cu cât o persoană are mai multe fobii, cu atât este mai puțin probabil să ocupe o poziție de conducere) și pozitive (dacă o creștere a unei valori implică o creștere a nivelul altuia: cu cât ești mai nervos, cu atât este mai probabil să te îmbolnăvești). Dacă nu există o relație între variabile, atunci o astfel de corelație se numește zero.

Liniar(când o valoare crește sau scade, a doua crește sau scade și ea) și neliniară (când, atunci când o valoare se schimbă, natura modificării celei de-a doua nu poate fi descrisă folosind o dependență liniară, atunci se aplică alte legi matematice - polinom, dependență hiperbolică).

Prin putere.

Cote




În funcție de scara căreia îi aparțin variabilele studiate, se calculează diferite tipuri de coeficienți de corelație:

  1. Coeficientul de corelație al lui Pearson, coeficientul de corelație liniară pe perechi sau corelația momentului produsului sunt calculate pentru variabilele cu intervale și scale de măsurare cantitative.
  2. Coeficientul de corelare a rangului lui Spearman sau Kendall - atunci când cel puțin una dintre valori are o scară ordinală sau nu este distribuită în mod normal.
  3. Coeficientul de corelație cu două serii punctuale (coeficientul de corelație cu semnul Fechner) - dacă una dintre cele două valori este dihotomică.
  4. Coeficient de corelație cu patru câmpuri (coeficient de corelație de rang multiplu (concordanță) - dacă cele două variabile sunt dihotomice.

Coeficientul lui Pearson se referă la indicatorii parametrici de corelație, restul - la cei neparametrici.

Valoarea coeficientului de corelație este în intervalul de la -1 la +1. Cu o corelație pozitivă completă, r = +1, cu o corelație completă negativă, r = -1.

Formula și calculul





Exemple

Este necesar să se determine relația dintre două variabile: nivelul de dezvoltare intelectuală (conform rezultatelor testării) și numărul de întârzieri pe lună (conform intrărilor din jurnalul educațional) în rândul școlarilor.

Datele inițiale sunt prezentate în tabel:

date IQ (x)

Date privind numărul de sosiri întârziate (y)

Sumă

1122

In medie

112,2


Pentru a da o interpretare corectă a indicatorului obținut este necesar să se analizeze semnul coeficientului de corelație (+ sau -) și valoarea lui absolută (modulo).

În conformitate cu tabelul de clasificare a coeficientului de corelație în funcție de forță, concluzionăm că rxy = -0,827 este o corelație negativă puternică. Astfel, numărul de şcolari care întârzie are o dependenţă foarte puternică de nivelul lor de dezvoltare intelectuală. Putem spune că studenții cu IQ ridicat sunt mai puțin probabil să întârzie la clasă decât elevii cu IQ scăzut.



Coeficientul de corelație poate fi utilizat atât de oamenii de știință pentru a confirma sau infirma ipoteza despre dependența a două cantități sau fenomene și pentru a măsura puterea, semnificația acestuia, cât și de către studenți pentru a efectua cercetări empirice și statistice la diferite subiecte. Trebuie amintit că acest indicator nu este un instrument ideal, este calculat doar pentru a măsura puterea unei relații liniare și va fi întotdeauna o valoare probabilistică care are o anumită eroare.

Analiza corelației se aplică în următoarele domenii:

  • stiinta economica;
  • astrofizică;
  • stiinte sociale (sociologie, psihologie, pedagogie);
  • agrochimie;
  • știința metalelor;
  • industrie (pentru controlul calității);
  • hidrobiologie;
  • biometrie etc.

Motive pentru popularitatea metodei de analiză a corelației:

  1. Simplitatea relativă a calculării coeficienților de corelație, aceasta nu necesită o educație matematică specială.
  2. Vă permite să calculați relația dintre variabilele aleatoare de masă, care fac obiectul analizei științei statistice. În acest sens, această metodă a devenit larg răspândită în domeniul cercetării statistice.

Sper că acum vei putea face distincția între o relație funcțională și una de corelație și vei ști că atunci când auzi la televizor sau citești în presă despre o corelație, atunci prin aceasta se înțelege o relație pozitivă și destul de semnificativă între două fenomene.

În cercetarea științifică, devine adesea necesar să se găsească o relație între variabilele rezultante și factori (randamentul unei culturi și cantitatea de precipitații, înălțimea și greutatea unei persoane în grupuri omogene după sex și vârstă, pulsul și temperatura corpului). , etc.).

Al doilea sunt semne care contribuie la schimbarea celor asociate acestora (primul).

Conceptul de analiză a corelației

Există un set Pe baza celor de mai sus, putem spune că analiza corelației este o metodă folosită pentru a testa ipoteza semnificației statistice a două sau mai multe variabile, dacă cercetătorul le poate măsura, dar nu le poate modifica.

Există și alte definiții ale conceptului luat în considerare. Analiza corelației este o metodă de procesare care examinează coeficienții de corelație dintre variabile. În acest caz, coeficienții de corelație dintre o pereche sau mai multe perechi de caracteristici sunt comparați pentru a stabili relații statistice între ele. Analiza corelației este o metodă de studiere a dependenței statistice dintre variabile aleatoare cu prezența opțională de natură funcțională strictă, în care dinamica unei variabile aleatoare conduce la dinamica așteptării alteia.

Conceptul de corelație falsă

Atunci când se efectuează o analiză de corelație, trebuie să se țină cont de faptul că aceasta poate fi realizată în raport cu orice set de caracteristici, adesea absurde unele în raport cu altele. Uneori nu au nicio legătură cauzală unul cu celălalt.

În acest caz, se vorbește despre o corelație falsă.

Probleme de analiză a corelației

Pe baza definițiilor de mai sus, putem formula următoarele sarcini ale metodei descrise: obținerea de informații despre una dintre variabilele dorite folosind cealaltă; determina proximitatea relatiei dintre variabilele studiate.

Analiza corelației presupune determinarea relației dintre caracteristicile studiate și, prin urmare, sarcinile de analiză a corelației pot fi completate cu următoarele:

  • identificarea factorilor care au cel mai mare impact asupra semnului rezultat;
  • identificarea cauzelor neexplorate anterior ale relațiilor;
  • construirea unui model de corelare cu analiza lui parametrică;
  • studiul semnificației parametrilor de comunicare și estimarea intervalului acestora.

Legătura dintre analiza corelației cu regresia

Metoda analizei corelației nu se limitează adesea la găsirea strângerii relației dintre cantitățile studiate. Uneori este completată de compilarea ecuațiilor de regresie, care sunt obținute folosind analiza cu același nume și care sunt o descriere a corelației dintre atributul(ele) rezultat și factorial (factorial). Această metodă, împreună cu analiza luată în considerare, constituie metoda

Condiții de utilizare a metodei

Factorii de rezultat depind de unul sau mai mulți factori. Metoda analizei corelației poate fi utilizată dacă există un număr mare de observații asupra valorii indicatorilor (factorilor) efectivi și factorilor, în timp ce factorii studiați ar trebui să fie cantitativi și reflectați în surse specifice. Prima poate fi determinată de legea normală - în acest caz, rezultatul analizei de corelație este coeficienții de corelație ai lui Pearson, sau, dacă semnele nu respectă această lege, se folosește coeficientul de corelație de rang al lui Spearman.

Reguli de selectare a factorilor de analiză a corelației

La aplicarea acestei metode, este necesar să se determine factorii care influențează indicatorii de performanță. Acestea sunt selectate ținând cont de faptul că trebuie să existe relații cauzale între indicatori. În cazul creării unui model de corelație multifactorială, sunt selectați cei care au un impact semnificativ asupra indicatorului rezultat, în timp ce factorii interdependenți cu un coeficient de corelație de pereche mai mare de 0,85 ar trebui să nu fie incluși în modelul de corelație, precum și cei din care relaţia cu parametrul rezultant este indirectă.sau funcţională.

Afișează rezultatele

Rezultatele analizei corelațiilor pot fi prezentate sub formă de text și grafic. În primul caz, ele sunt prezentate ca un coeficient de corelație, în al doilea - sub forma unui grafic de dispersie.

Dacă nu există o corelație între parametri, punctele de pe diagramă sunt situate aleatoriu, gradul mediu de conectare se caracterizează printr-un grad mai mare de ordine și se caracterizează printr-o distanță mai mult sau mai puțin uniformă a marcajelor marcate față de mediană. O conexiune puternică tinde spre o linie dreaptă și la r=1 diagrama de dispersie este o linie plată. O corelație inversă este caracterizată de direcția graficului din stânga sus la dreapta jos, una directă - din stânga jos în colțul din dreapta sus.

Reprezentarea 3D a unui grafic de dispersie (difuzare)

În plus față de prezentarea tradițională 2D scatterplot, în prezent este utilizată o reprezentare grafică 3D a analizei de corelație.

Este, de asemenea, utilizată o matrice de dispersie, care afișează toate diagramele pereche într-o singură cifră într-un format de matrice. Pentru n variabile, matricea conține n rânduri și n coloane. Diagrama situată la intersecția rândului i și coloanei j este un grafic al variabilelor Xi față de Xj. Astfel, fiecare rând și coloană este o dimensiune, o singură celulă afișează un grafic de dispersie a celor două dimensiuni.

Estimarea etanșeității comunicării

Etanșeitatea corelației este determinată de coeficientul de corelație (r): puternic - r = ±0,7 la ±1, mediu - r = ±0,3 la ±0,699, slab - r = 0 la ±0,299. Această clasificare nu este strictă. Figura arată o schemă ușor diferită.

Un exemplu de aplicare a metodei de analiză a corelației

Un studiu interesant a fost întreprins în Marea Britanie. Este dedicat relației fumatului cu cancerul pulmonar și a fost realizat prin analiză de corelație. Această observație este prezentată mai jos.

Date inițiale pentru analiza corelației

Grup profesional

mortalitate

Fermierii, pădurari și pescari

Mineri și muncitori la carieră

Producători de gaze, cocs și produse chimice

Producatori de sticla si ceramica

Muncitori în cuptoare, forje, turnătorii și laminoare

Lucrători în electricitate și electronică

Inginerie și profesii conexe

Industrii de prelucrare a lemnului

Tanatorii

Muncitori din textile

Producători de îmbrăcăminte de lucru

Lucrători din industria alimentară, a băuturilor și a tutunului

Producători de hârtie și imprimare

Producători de alte produse

Constructorii

Artiști și decoratori

Șoferi de motoare staționare, macarale etc.

Lucrători necuprinși în altă parte

Lucrători în transport și comunicații

Muncitori din depozit, depozitari, ambalatori și muncitori la mașini de umplere

muncitori la birou

Vânzători

Lucrători în servicii de sport și recreere

Administratori și manageri

Profesioniști, tehnicieni și artiști

Să începem analiza corelației. Este mai bine să începem soluția pentru claritate cu o metodă grafică, pentru care vom construi o diagramă de împrăștiere.

Ea arată o legătură directă. Cu toate acestea, este dificil să trageți o concluzie fără ambiguitate doar pe baza metodei grafice. Prin urmare, vom continua să efectuăm analize de corelație. Un exemplu de calcul al coeficientului de corelație este prezentat mai jos.

Folosind instrumente software (pe exemplul MS Excel, va fi descris mai jos), determinăm coeficientul de corelație, care este 0,716, ceea ce înseamnă o relație puternică între parametrii studiați. Să determinăm semnificația statistică a valorii obținute conform tabelului corespunzător, pentru care trebuie să scădem 2 din 25 de perechi de valori, ca rezultat obținem 23 și pentru această linie din tabel găsim r critic pentru p = 0,01 ( deoarece acestea sunt date medicale, este suficientă o dependență mai strictă, în alte cazuri p=0,05), care este 0,51 pentru această analiză de corelație. Exemplul a demonstrat că r calculat este mai mare decât r critic, valoarea coeficientului de corelație este considerată semnificativă statistic.

Utilizarea software-ului în analiza corelației

Tipul descris de prelucrare a datelor statistice poate fi realizat folosind software, în special, MS Excel. Corelația presupune calcularea următorilor parametri folosind funcții:

1. Coeficientul de corelație se determină folosind funcția CORREL (array1; array2). Array1,2 este o celulă a intervalului de valori ale variabilelor rezultate și factor.

Coeficientul de corelație liniară se mai numește și coeficientul de corelație Pearson și, prin urmare, începând cu Excel 2007, puteți utiliza funcția cu aceleași matrice.

Afișarea grafică a analizei de corelație în Excel se face folosind panoul „Diagrame” cu selecția „Grafic de dispersie”.

După specificarea datelor inițiale, obținem un grafic.

2. Evaluarea semnificației coeficientului de corelație cu ajutorul testului t Student. Valoarea calculată a criteriului t este comparată cu valoarea tabelară (critică) a acestui indicator din tabelul corespunzător de valori ale parametrului luat în considerare, ținând cont de nivelul de semnificație dat și de numărul de grade de libertate. Această estimare se face folosind funcția STUDIV(probabilitate; grade_de_libertate).

3. Matricea coeficienților de corelație perechi. Analiza se efectuează cu ajutorul instrumentului „Analiza datelor”, în care este selectată „Corelație”. Evaluarea statistică a coeficienților de corelație de pereche se realizează prin compararea valorii absolute a acestuia cu valoarea tabelară (critică). Când coeficientul de corelație al perechii calculat îl depășește pe cel critic, putem spune, ținând cont de gradul de probabilitate dat, că ipoteza nulă despre semnificația relației liniare nu este respinsă.

In cele din urma

Utilizarea metodei de analiză a corelației în cercetarea științifică face posibilă determinarea relației dintre diverși factori și indicatori de performanță. În același timp, trebuie luat în considerare faptul că un coeficient de corelație ridicat poate fi obținut și dintr-o pereche sau un set absurd de date și, prin urmare, acest tip de analiză trebuie efectuat pe o matrice de date suficient de mare.

După obținerea valorii calculate a lui r, este de dorit să o comparăm cu r critic pentru a confirma semnificația statistică a unei anumite valori. Analiza corelației poate fi efectuată manual folosind formule sau folosind instrumente software, în special MS Excel. Aici puteți construi și o diagramă de împrăștiere (împrăștiere) în scopul unei reprezentări vizuale a relației dintre factorii studiați ai analizei corelației și semnul rezultat.

Când studiezi corelațiiîncercați să stabiliți dacă există vreo relație între doi indicatori din același eșantion (de exemplu, între înălțimea și greutatea copiilor sau între nivelul IQși performanța școlară) sau între două eșantioane diferite (de exemplu, la compararea perechilor de gemeni), și dacă această relație există, dacă o creștere a unui indicator este însoțită de o creștere (corelație pozitivă) sau o scădere (corelație negativă) a alte.

Cu alte cuvinte, analiza corelației ajută la stabilirea dacă este posibil să se prezică valorile posibile ale unui indicator, cunoscând valoarea altuia.

Până acum, când analizăm rezultatele experienței noastre în studierea efectelor marijuanei, am ignorat în mod deliberat un astfel de indicator precum timpul de reacție. Între timp, ar fi interesant de verificat dacă există o relație între eficiența reacțiilor și viteza lor. Acest lucru ar permite, de exemplu, să argumentăm că cu cât o persoană este mai lentă, cu atât acțiunile sale vor fi mai precise și mai eficiente și invers.

În acest scop, se pot folosi două metode diferite: metoda parametrică de calcul al coeficientului Bravais-Pearson (r)și calcularea coeficientului de corelație al rândurilor Spearman (r s ), care se aplică datelor ordinale, adică este neparametric. Cu toate acestea, să înțelegem mai întâi ce este un coeficient de corelație.

Coeficient de corelație

Coeficientul de corelație este o valoare care poate varia de la -1 la 1. În cazul unei corelații pozitive complete, acest coeficient este plus 1, iar în cazul unui negativ complet - minus 1. Pe grafic, acesta corespunde unui linie dreaptă care trece prin punctele de intersecție a valorilor fiecărei perechi de date:

Variabil

Dacă aceste puncte nu se aliniază într-o linie dreaptă, ci formează un „nor”, ​​valoarea absolută a coeficientului de corelație devine mai mică decât unitatea și se apropie de zero pe măsură ce norul se rotunjește:

Dacă coeficientul de corelație este 0, ambele variabile sunt complet independente una de cealaltă.

În științe umaniste, o corelație este considerată puternică dacă coeficientul ei este mai mare de 0,60; dacă depășește 0,90, atunci corelația este considerată foarte puternică. Cu toate acestea, pentru a putea trage concluzii despre relațiile dintre variabile, dimensiunea eșantionului este de mare importanță: cu cât eșantionul este mai mare, cu atât valoarea coeficientului de corelație obținut este mai fiabilă. Există tabele cu valori critice ale coeficienților de corelație Bravais-Pearson și Spearman pentru un număr diferit de grade de libertate (este egal cu numărul de perechi minus 2, adică n-2). Numai dacă coeficienții de corelație sunt mai mari decât aceste valori critice pot fi considerați de încredere. Deci, pentru ca coeficientul de corelație de 0,70 să fie de încredere, cel puțin 8 perechi de date ar trebui luate în analiză ( = P - 2 = 6) la calcul r(Tabelul B.4) și 7 perechi de date (= n - 2 = 5) la calcul r s (Tabelul 5 din Anexa B. 5).

Coeficientul Bravais-Pearson

Pentru a calcula acest coeficient, se folosește următoarea formulă (poate arăta diferit pentru diferiți autori):

unde  X Y este suma produselor datelor din fiecare pereche;

n - numărul de perechi;

- medie pentru date variabile X;

Medie pentru date variabile Y;

S X - X;

s Y - abaterea standard pentru distribuție y.

Acum putem folosi acest coeficient pentru a determina dacă există o relație între timpul de reacție al subiecților și eficacitatea acțiunilor lor. Luați, de exemplu, nivelul de fundal al grupului de control.

n= 15  15,8  13,4 = 3175,8;

(n 1)S X S y = 14  3,07  2,29 = 98,42;

r =

O valoare negativă a coeficientului de corelare poate însemna că cu cât timpul de reacție este mai lung, cu atât eficiența este mai mică. Cu toate acestea, valoarea sa este prea mică pentru a putea vorbi despre o relație semnificativă între aceste două variabile.

nXY=………

(n- 1) S X S Y = ……

Ce concluzie se poate trage din aceste rezultate? Dacă credeți că există o relație între variabile, atunci ce este - directă sau inversă? Este de încredere [cf. fila. 4 (în Anexa B. 5) cu valori critice r]?

Coeficientul de corelare a rangului Spearmanr s

Acest coeficient este mai ușor de calculat, dar rezultatele sunt mai puțin precise decât utilizarea r. Acest lucru se datorează faptului că la calcularea coeficientului Spearman se folosește ordinea datelor, și nu caracteristicile cantitative și intervalele dintre clase ale acestora.

Ideea este că atunci când se utilizează coeficientul de corelație de rang Spearman(r s ) ei verifică doar dacă clasarea datelor pentru un eșantion va fi aceeași ca într-o serie de alte date pentru acest eșantion asociate cu primul (de exemplu, dacă elevii vor fi „clasați” în mod egal atunci când promovează atât psihologie, cât și matematică, sau chiar și cu doi profesori de psihologie diferiți?). Dacă coeficientul este aproape de + 1, atunci aceasta înseamnă că ambele serii practic coincid, iar dacă acest coeficient este aproape de - 1, putem vorbi despre o relație inversă completă.

Coeficient r s calculate după formula

Unde d- diferența dintre rândurile valorilor caracteristicilor conjugate (indiferent de semnul acesteia) și n- numărul de perechi.

De obicei, acest test non-parametric este folosit în cazurile în care trebuie să trageți niște concluzii nu atât de mult intervaleîntre date, cât despre ele grade,și, de asemenea, atunci când curbele de distribuție sunt prea asimetrice și nu permit utilizarea unor criterii parametrice precum coeficientul r(în aceste cazuri, poate fi necesară convertirea datelor cantitative în date ordinale).

Deoarece acesta este cazul distribuției valorilor de eficiență și timp de reacție în grupul experimental după expunere, puteți repeta calculele pe care le-ați făcut deja pentru acest grup, doar că acum nu pentru coeficient r, iar pentru indicator r s . Acest lucru vă va permite să vedeți cât de diferiți sunt acești doi indicatori*.

* Trebuie amintit că

1) pentru numărul de lovituri, rangul 1 corespunde celui mai mare și al 15-lea celui mai scăzut performanță, în timp ce pentru timpul de reacție, rangul 1 corespunde celui mai scurt timp, iar al 15-lea celui mai lung;

2) datele ex aequo primesc un rang mediu.

Astfel, ca și în cazul coeficientului r, a primit un rezultat pozitiv, deși nesigur. Care dintre cele două rezultate este mai plauzibil: r=-0,48 sau r s = +0,24? O astfel de întrebare poate apărea numai dacă rezultatele sunt de încredere.

Aș dori să subliniez încă o dată că esența acestor doi coeficienți este oarecum diferită. Coeficient negativ r indică faptul că eficiența este cel mai adesea cu atât mai mare, cu atât timpul de reacție este mai rapid, în timp ce la calcularea coeficientului r s a fost necesar să se verifice dacă subiecții mai rapidi reacționează întotdeauna mai precis, iar cei mai lenți mai puțin precis.

Întrucât în ​​lotul experimental, după expunere, s-a obţinut un coeficient r s , egal cu 0,24, o astfel de tendință nu este evident urmărită aici. Încercați să înțelegeți singur datele pentru grupul de control după expunere, știind că  d 2 = 122,5:

; este de incredere?

Care este concluzia ta?…………………………………………………………………………………………………………

…………………………………………………………………………………………………………………….

Deci, am luat în considerare diverse metode statistice parametrice și neparametrice utilizate în psihologie. Recenzia noastră a fost foarte superficială, iar sarcina sa principală a fost să-l facă pe cititor să înțeleagă că statisticile nu sunt atât de înfricoșătoare pe cât par și necesită în mare parte bun simț. Vă reamintim că datele de „experiență” cu care ne-am ocupat aici sunt fictive și nu pot servi drept bază pentru nicio concluzie. Cu toate acestea, un astfel de experiment ar merita făcut. Deoarece pentru acest experiment a fost aleasă o tehnică pur clasică, aceeași analiză statistică ar putea fi utilizată în multe experimente diferite. În orice caz, ni se pare că am conturat câteva direcții principale care pot fi utile celor care nu știu de unde să înceapă analiza statistică a rezultatelor.

Există trei ramuri principale ale statisticii: statistica descriptivă, statistica inductivă și analiza corelației.