Ceea ce nu este o funcție a Comisiei Europene. Comisia Europeană. Funcții și puteri. Direcția Generală Energie DG ENER - Energie

Testul de corelație al lui Pearson este o metodă statistică parametrică care vă permite să determinați prezența sau absența unei relații liniare între doi indicatori cantitativi, precum și să evaluați apropierea și semnificația statistică a acesteia. Cu alte cuvinte, testul de corelație Pearson vă permite să determinați dacă există o relație liniară între modificările valorilor a două variabile. În calculele statistice și inferențe, coeficientul de corelație este de obicei notat ca rxy sau Rxy.

1. Istoricul dezvoltării criteriului de corelare

Testul de corelație Pearson a fost dezvoltat de o echipă de oameni de știință britanici condusă de Karl Pearson(1857-1936) în anii 90 ai secolului al XIX-lea, pentru a simplifica analiza covarianței a două variabile aleatoare. Pe lângă Karl Pearson, s-a lucrat și testul de corelație al lui Pearson Francis Edgeworthși Raphael Weldon.

2. Pentru ce este folosit testul de corelație Pearson?

Criteriul de corelare Pearson vă permite să determinați care este apropierea (sau puterea) corelației dintre doi indicatori măsurați pe o scară cantitativă. Cu ajutorul unor calcule suplimentare, puteți determina și cât de semnificativă este statistic relația identificată.

De exemplu, folosind testul de corelație Pearson, se poate răspunde la întrebarea dacă există o relație între temperatura corpului și conținutul de leucocite din sânge în cazuri acute. infecție respiratorie, intre inaltimea si greutatea pacientului, intre continutul in bând apă fluor şi incidenţa cariilor în populaţie.

3. Condiții și restricții privind utilizarea testului chi-pătrat al lui Pearson

  1. Indicatorii comparabili ar trebui măsurați în scară cantitativă(de exemplu, ritmul cardiac, temperatura corpului, numărul de leucocite la 1 ml de sânge, tensiunea arterială sistolica).
  2. Prin intermediul criteriului de corelație Pearson este posibil să se determine numai prezența și puterea unei relații liniareîntre cantităţi. Alte caracteristici ale relației, inclusiv direcția (directă sau inversă), natura modificărilor (rectilinii sau curbilinii), precum și dependența unei variabile de alta, sunt determinate cu ajutorul analizei de regresie.
  3. Numărul de valori care trebuie comparate trebuie să fie egal cu două. În cazul analizei relației dintre trei sau mai mulți parametri, ar trebui să utilizați metoda analiza factorilor.
  4. Criteriul de corelare al lui Pearson este parametrice, în legătură cu care se află condiția aplicării acesteia distributie normala variabile potrivite. Dacă este necesar să se efectueze o analiză de corelație a indicatorilor a căror distribuție diferă de cea normală, inclusiv a celor măsurați pe o scară ordinală, trebuie utilizat coeficientul de corelație a rangului lui Spearman.
  5. Este necesar să se facă distincția clară între conceptele de dependență și corelație. Dependența valorilor determină prezența unei corelații între ele, dar nu invers.

De exemplu, creșterea unui copil depinde de vârsta lui, adică de ce copil mai mare, cu atât este mai sus. Dacă luăm doi copii de vârste diferite, atunci cu un grad mare de probabilitate creșterea copilului mai mare va fi mai mare decât cea a celui mai mic. Acest fenomen se numește dependenta, implicând o relație cauzală între indicatori. Desigur, există și corelație, ceea ce înseamnă că modificările unui indicator sunt însoțite de modificări ale altui indicator.

Într-o altă situație, luați în considerare relația dintre creșterea copilului și ritmul cardiac (HR). După cum știți, ambele aceste valori depind direct de vârstă, prin urmare, în majoritatea cazurilor, copiii de înălțime mai mare (și, prin urmare, de vârstă mai înaintată) vor avea valori mai mici ale ritmului cardiac. Acesta este, corelație vor fi respectate și pot avea o etanșeitate suficient de mare. Totuși, dacă luăm copii aceasi varsta, dar înălțime diferită, atunci, cel mai probabil, ritmul cardiac va diferi nesemnificativ, în legătură cu care putem concluziona că independenţă Ritmul cardiac de la creștere.

Exemplul de mai sus arată cât de important este să se facă distincția între conceptele fundamentale în statistică conexiuniși dependențe indicatori pentru a trage concluzii corecte.

4. Cum se calculează coeficientul de corelație Pearson?

Coeficientul de corelație al lui Pearson se calculează folosind următoarea formulă:

5. Cum se interpretează valoarea coeficientului de corelație Pearson?

Valorile coeficientului de corelație Pearson sunt interpretate pe baza valorilor sale absolute. Valorile posibile ale coeficientului de corelație variază de la 0 la ±1. Cu cât valoarea absolută a lui r xy este mai mare, cu atât este mai mare apropierea relației dintre cele două mărimi. r xy = 0 indică o lipsă completă de conexiune. r xy = 1 - indică prezența unei conexiuni absolute (funcționale). Dacă valoarea criteriului de corelație Pearson s-a dovedit a fi mai mare de 1 sau mai mică de -1, a fost făcută o eroare în calcule.

Pentru a evalua apropierea sau puterea corelației, se folosesc criterii general acceptate, conform cărora valorile absolute ale rxy< 0.3 свидетельствуют о slab conexiune, valorile r xy de la 0,3 la 0,7 - despre conexiune mijloc etanșeitate, valori r xy > 0,7 - o puternic conexiuni.

O estimare mai precisă a puterii corelației poate fi obținută prin utilizarea Masa Chaddock:

Nota semnificație statistică coeficientul de corelație r xy se realizează folosind testul t, calculat prin următoarea formulă:

Se compară valoarea t r obţinută cu valoarea critică la un anumit nivel de semnificaţie şi cu numărul de grade de libertate n-2. Dacă t r depășește t crit, atunci se face o concluzie despre semnificația statistică a corelației identificate.

6. Un exemplu de calcul al coeficientului de corelație Pearson

Scopul studiului a fost identificarea, determinarea etanșeității și semnificației statistice a corelației dintre doi indicatori cantitativi: nivelul de testosteron din sânge (X) și procentul masa muscularaîn corp (Y). Datele inițiale pentru un eșantion de 5 subiecți (n = 5) sunt rezumate în tabel.

Coeficientul de corelație (sau coeficientul de corelație liniară) este notat cu „r” (în cazuri rare, ca „ρ”) și caracterizează corelația liniară (adică relația dată de o anumită valoare și direcție) a două sau mai multe variabile . Valoarea coeficientului se află între -1 și +1, adică corelația poate fi atât pozitivă, cât și negativă. Dacă coeficientul de corelație este -1, există o corelație negativă perfectă; dacă coeficientul de corelație este +1, există o corelație pozitivă perfectă. În alte cazuri, există o corelație pozitivă, o corelație negativă sau nicio corelație între cele două variabile. Coeficientul de corelare poate fi calculat manual, cu calculatoare online gratuite sau cu un calculator grafic bun.

Pași

Calcularea manuală a coeficientului de corelație

    Adunați date.Înainte de a începe să calculați coeficientul de corelație, examinați perechea de numere dată. Este mai bine să le scrieți într-un tabel care poate fi aranjat vertical sau orizontal. Etichetați fiecare rând sau coloană drept „x” și „y”.

    • De exemplu, având în vedere patru perechi de valori (numere) ale variabilelor „x” și „y”. Puteți crea următorul tabel:
      • x || y
      • 1 || 1
      • 2 || 3
      • 4 || 5
      • 5 || 7
  1. Calculați media aritmetică „x”. Pentru a face acest lucru, adunați toate valorile „x”, apoi împărțiți rezultatul la numărul de valori.

    Aflați media aritmetică „y”. Pentru a face acest lucru, urmați aceiași pași, adică adăugați toate valorile „y”, apoi împărțiți suma la numărul de valori.

    Calculați abaterea standard a lui „x”. După ce ați calculat mediile lui x și y, găsiți abaterile standard ale acestor variabile. Abaterea standard se calculează folosind următoarea formulă:

    Calculați abaterea standard „y”. Urmați pașii din pasul anterior. Utilizați aceeași formulă, dar înlocuiți valorile „y” în ea.

    Notați formula de bază pentru calcularea coeficientului de corelație. Această formulă include mediile, abaterile standard și numărul (n) de perechi de numere ale ambelor variabile. Coeficientul de corelație este notat cu „r” (în cazuri rare, ca „ρ”). Acest articol folosește formula pentru a calcula coeficientul de corelație Pearson.

    Ați calculat mediile și abaterile standard ale ambelor variabile, astfel încât să puteți utiliza formula pentru a calcula coeficientul de corelație. Amintiți-vă că „n” este numărul de perechi de valori ale ambelor variabile. Valoarea altor cantități a fost calculată anterior.

    • În exemplul nostru, calculele vor fi scrise după cum urmează:
    • ρ = (1 n - 1) Σ (x - μ x σ x) ∗ (y - μ y σ y) (\displaystyle \rho =\left((\frac (1)(n-1))\right) \Sigma \left((\frac (x-\mu _(x))(\sigma _(x)))\right)*\left((\frac (y-\mu _(y)))(\sigma _(y)))\dreapta))
    • ρ = (1 3) ∗ (\displaystyle \rho =\left((\frac (1)(3))\right)*)[ (1 − 3 1 , 83) ∗ (1 − 4 2 , 58) + (2 − 3 1 , 83) ∗ (3 − 4 2 , 58) (\displaystyle \left((\frac (1-3)() 1.83))\right)*\left((\frac (1-4)(2.58))\right)+\left((\frac (2-3)(1.83))\right) *\left((\ frac (3-4)(2,58))\dreapta))
      + (4 − 3 1 , 83) ∗ (5 − 4 2 , 58) + (5 − 3 1 , 83) ∗ (7 − 4 2 , 58) (\displaystyle +\left((\frac (4-3) )(1.83))\dreapta)*\left((\frac (5-4)(2.58))\right)+\left((\frac (5-3)(1.83))\ dreapta)*\left( (\frac (7-4)(2,58))\dreapta))]
    • ρ = (1 3) ∗ (6 + 1 + 1 + 6 4 , 721) (\displaystyle \rho =\left((\frac (1)(3))\right)*\left((\frac (6) +1+1+6)(4.721))\dreapta))
    • ρ = (1 3) ∗ 2 , 965 (\displaystyle \rho =\left((\frac (1)(3))\right)*2.965)
    • ρ = (2 , 965 3) (\displaystyle \rho =\left((\frac (2.965)(3))\right))
    • ρ = 0. 988 (\displaystyle \rho =0,988)
  2. Analizați rezultatul.În exemplul nostru, coeficientul de corelație este 0,988. Această valoare caracterizează într-un fel un anumit set de perechi de numere. Acordați atenție semnului și mărimii valorii.

    • Deoarece valoarea coeficientului de corelare este pozitivă, există o corelație pozitivă între variabilele „x” și „y”. Adică, atunci când valoarea lui „x” crește, crește și valoarea lui „y”.
    • Deoarece valoarea coeficientului de corelație este foarte apropiată de +1, valorile variabilelor x și y sunt foarte corelate. Dacă puneți puncte pe planul de coordonate, acestea vor fi situate aproape de o linie dreaptă.

    Utilizarea calculatoarelor online pentru a calcula coeficientul de corelație

    1. Găsiți un calculator pe Internet pentru a calcula coeficientul de corelație. Acest coeficient este adesea calculat în statistici. Dacă există multe perechi de numere, este practic imposibil să se calculeze manual coeficientul de corelație. Prin urmare, există calculatoare online pentru calcularea coeficientului de corelație. În motorul de căutare, introduceți „calculator coeficient de corelație” (fără ghilimele).

      Introduceți datele. Citiți instrucțiunile de pe site pentru a introduce datele corect (perechi de numere). Este extrem de important să introduceți perechile adecvate de numere; altfel vei obține un rezultat greșit. Rețineți că site-urile web diferite au formate diferite de introducere a datelor.

      • De exemplu, pe site-ul http://ncalculators.com/statistics/correlation-coefficient-calculator.htm, valorile variabilelor „x” și „y” sunt introduse în două linii orizontale. Valorile sunt separate prin virgule. Adică, în exemplul nostru, valorile lui „x” sunt introduse astfel: 1,2,4,5, iar valorile lui „y” sunt astfel: 1,3,5,7.
      • Pe un alt site, http://www.alcula.com/calculators/statistics/correlation-coefficient/ , datele sunt introduse vertical; în acest caz, nu confundați perechile corespunzătoare de numere.
    2. Calculați coeficientul de corelație. După ce ați introdus datele, faceți clic pe butonul „Calculați”, „Calculați” sau pe butonul similar pentru a obține rezultatul.

    Utilizarea unui calculator grafic

    1. Introduceți datele. Luați un calculator grafic, comutați la modul de calcul statistic și selectați comanda Editare.

      • Pe calculatoare diferite, trebuie să apăsați taste diferite. Acest articol se concentrează pe calculatorul Texas Instruments TI-86.
      • Pentru a comuta la modul de calcul statistic, apăsați - Stat (deasupra tastei „+”). Apoi apăsați F2 - Editare (Editare).
    2. Ștergeți datele salvate anterioare. Majoritatea calculatoarelor păstrează statisticile introduse până când le ștergeți. Pentru a evita confundarea datelor vechi cu datele noi, ștergeți mai întâi orice informații stocate.

      • Utilizați tastele săgeți pentru a muta cursorul și evidențiați titlul „xStat”. Apoi apăsați Clear și Enter pentru a șterge toate valorile introduse în coloana xStat.
      • Utilizați tastele săgeți pentru a evidenția titlul „yStat”. Apoi apăsați Clear și Enter pentru a șterge toate valorile introduse în coloana yStat.
    3. Introduceți datele inițiale. Utilizați tastele săgeți pentru a muta cursorul la prima celulă de sub titlul „xStat”. Introduceți prima valoare și apăsați Enter. În partea de jos a ecranului, va fi afișat „xStat (1) = __”, cu valoarea introdusă în loc de spațiu. După ce apăsați Enter, valoarea introdusă va apărea în tabel, iar cursorul se va muta pe linia următoare; aceasta va afișa „xStat(2) = __” în partea de jos a ecranului.

      • Introduceți toate valorile variabilei „x”.
      • După ce ați introdus toate valorile pentru variabila x, utilizați tastele săgeți pentru a naviga la coloana yStat și introduceți valorile pentru variabila y.
      • După ce ați introdus toate perechile de numere, apăsați Ieșire pentru a șterge ecranul și a ieși din modul de agregare.
    4. Calculați coeficientul de corelație. Caracterizează cât de aproape sunt datele de o linie dreaptă. Calculatorul grafic poate determina rapid linia dreaptă corespunzătoare și poate calcula coeficientul de corelație.

      • Faceți clic pe Stat (Statistici) - Calc (Calcuri). Pe TI-86, apăsați - - .
      • Selectați funcția „Regresie liniară”. Pe TI-86, apăsați , care este etichetat „LinR”. Linia „LinR _” va fi afișată pe ecran cu un cursor care clipește.
      • Acum introduceți numele a două variabile: xStat și yStat.
        • Pe TI-86, deschideți lista de nume; pentru a face acest lucru apăsați – – .
        • Variabilele disponibile sunt afișate pe linia de jos a ecranului. Selectați (cel mai probabil apăsând F1 sau F2), introduceți o virgulă și apoi selectați .
        • Apăsați Enter pentru a procesa datele introduse.

7.3.1. Coeficienți de corelare și determinare. Poate fi cuantificat apropierea comunicăriiîntre factori şi orientare(direct sau invers) prin calcularea:

1) dacă este necesar să se determine o relație liniară între doi factori, - coeficient de pereche corelații: în 7.3.2 și 7.3.3, operațiile de calcul al coeficientului de corelație liniar pereche Bravais-Pearson ( r) și coeficientul de corelație a rangului perechi al lui Spearman ( r);

2) dacă dorim să determinăm relația dintre doi factori, dar această relație este clar neliniară, atunci relație de corelație ;

3) dacă dorim să determinăm relația dintre un factor și un set de alți factori - atunci (sau, în mod echivalent, „coeficient de corelație multiplu”);

4) dacă dorim să identificăm izolat relația dintre un factor doar cu un altul specific, care face parte din grupul de factori care îl afectează pe primul, pentru care trebuie să considerăm neschimbată influența tuturor celorlalți factori, atunci coeficient de corelație privat (parțial). .

Orice coeficient de corelație (r, r) nu poate depăși 1 în valoare absolută, adică –1< r (r) < 1). Если получено значение 1, то это значит, что рассматриваемая зависимость не статистическая, а функциональная, если 0 - корреляции нет вообще.

Semnul de la coeficientul de corelare determină direcția conexiunii: semnul „+” (sau absența unui semn) înseamnă că conexiunea Drept (pozitiv), semnul „–” - că conexiunea verso (negativ). Semnul nu are nimic de-a face cu strânsoarea conexiunii.

Coeficientul de corelație caracterizează relația statistică. Dar adesea este necesar să se determine un alt tip de dependență, și anume: care este contribuția unui anumit factor la formarea unui alt factor înrudit. Acest tip de dependență, cu un anumit grad de convenționalitate, se caracterizează prin coeficient de determinare (D ) determinată de formula D = r 2 ´100% (unde r este coeficientul de corelație Bravais-Pearson, vezi 7.3.2). Dacă măsurătorile au fost luate în scară de ordine (scala de rang), apoi cu o oarecare pierdere a fiabilității, în loc de valoarea lui r, valoarea lui r (coeficientul de corelație al lui Spearman, vezi 7.3.3) poate fi înlocuită în formulă.

De exemplu, dacă am obținut ca caracteristică a dependenței factorului B de factorul A coeficientul de corelație r = 0,8 sau r = –0,8, atunci D = 0,8 2 ´100% = 64%, adică aproximativ 2 ½ 3. Prin urmare, contribuția factorului A și modificările sale la formarea factorului B este de aproximativ 2 ½ 3 din contribuția totală a tuturor factorilor în general.

7.3.2. Coeficientul de corelație Bravais-Pearson. Procedura de calcul al coeficientului de corelație Bravais-Pearson ( r ) poate fi utilizat numai în acele cazuri în care conexiunea este luată în considerare pe baza unor eșantioane care au o distribuție normală a frecvenței ( distributie normala ) și obținute prin măsurători în scale de intervale sau rapoarte. Formula de calcul pentru acest coeficient de corelare este:



å ( X eu – )( y i-)

r = .

n×sx×sy

Ce arată coeficientul de corelație? În primul rând, semnul de la coeficientul de corelație arată direcția relației și anume: semnul „–” indică faptul că relația verso, sau negativ(există o tendință: pe măsură ce valorile unui factor scad, valorile corespunzătoare ale celuilalt factor cresc, iar pe măsură ce cresc, scad), iar absența unui semn sau a semnului „+” indică Drept, sau pozitiv conexiuni (există o tendință: cu o creștere a valorilor unui factor, valorile celuilalt cresc, iar cu o scădere, acestea scad). În al doilea rând, valoarea absolută (independentă de semn) a coeficientului de corelație indică etanșeitatea (rezistența) conexiunii. Se obișnuiește să se presupună (mai degrabă convențional): pentru valorile lui r< 0,3 корреляция foarte slab, de multe ori pur și simplu nu este luat în considerare, pentru 0,3 £ r< 5 корреляция slab, pentru 0,5 £ r< 0,7) - in medie, la 0,7 £ r £ 0,9) - puternicși, în final, pentru r > 0,9 - foarte puternic.În cazul nostru (r » 0,83), relația este inversă (negativă) și puternică.

Amintiți-vă că valorile coeficientului de corelație pot fi în intervalul de la -1 la +1. Dacă valoarea lui r depășește aceste limite, indică faptul că în calcule s-a făcut o greșeală . În cazul în care un r= 1, asta înseamnă că legătura nu este statistică, ci funcțională - ceea ce practic nu se întâmplă în sport, biologie, medicină. Deși cu un număr mic de măsurători, este posibilă o selecție aleatorie a valorilor care oferă o imagine a unei relații funcționale, dar un astfel de caz este cu atât mai puțin probabil, cu cât volumul probelor comparate (n) este mai mare, adică numărul de perechi de măsurători comparate.

Tabelul de calcul (Tabelul 7.1) este construit după formula.

Tabelul 7.1.

Tabel de calcul pentru calculul Bravais-Pearson

x i y eu (X i-) (X i –) 2 (y i-) (y i –) 2 (X eu – )( y i-)
13,2 4,75 0,2 0,04 –0,35 0,1225 – 0,07
13,5 4,7 0,5 0,25 – 0,40 0,1600 – 0,20
12,7 5,10 – 0,3 0,09 0,00 0,0000 0,00
12,5 5,40 – 0,5 0,25 0,30 0,0900 – 0,15
13,0 5,10 0,0 0,00 0,00 0.0000 0,00
13,2 5,00 0,1 0,01 – 0,10 0,0100 – 0,02
13,1 5,00 0,1 0,01 – 0,10 0,0100 – 0,01
13,4 4,65 0,4 0,16 – 0,45 0,2025 – 0,18
12,4 5,60 – 0,6 0,36 0,50 0,2500 – 0,30
12,3 5,50 – 0,7 0,49 0,40 0,1600 – 0,28
12,7 5,20 –0,3 0,09 0,10 0,0100 – 0,03
åx i \u003d 137 \u003d 13.00 åy i =56,1 =5,1 å( X i - ) 2 \u003d \u003d 1,78 å( y i – ) 2 = = 1,015 å( X eu – )( y i – )= = –1,24

Pentru că s x = ï ï = ï ï» 0,42, a

s y= ï ï» 0,32, r" –1,24ï (11´0,42´0,32) » –1,24ï 1,48 » –0,83 .

Cu alte cuvinte, trebuie să știți foarte ferm că coeficientul de corelație nu poti depășește 1,0 în valoare absolută. Acest lucru evită adesea cele mai grosolane greseli, mai exact - să găsească și să corecteze erorile făcute în calcule.

7.3.3. Coeficientul de corelație Spearman. După cum sa menționat deja, este posibil să se aplice coeficientul de corelație Bravais-Pearson (r) numai în acele cazuri în care factorii analizați sunt aproape de normal în ceea ce privește distribuția frecvenței și valorile variantei sunt obținute prin măsurători neapărat pe scara de rapoarte sau pe scara de intervale, ceea ce se întâmplă dacă sunt exprimate unități fizice. În alte cazuri, se găsește coeficientul de corelație Spearman ( r). Cu toate acestea, acest raport poate sa se aplică și în cazurile în care este permis (și dezirabil ! ) aplică coeficientul de corelație Bravais-Pearson. Dar trebuie avut în vedere că procedura de determinare a coeficientului Bravais-Pearson are mai multă putere („rezolvare abilitate"), de aceea r mai informativ decât r. Chiar și cu un mare n deviere r poate fi de ordinul a ±10%.

Tabelul 7.2 Formula de calcul pentru coeficient

x i y i R x R y |d R | d R 2 Coeficientul de corelație Spearman

13,2 4,75 8,5 3,0 5,5 30,25 r= 1 – . Vos

13,5 4,70 11,0 2,0 9,0 81,00 folosim exemplul nostru

12,7 5,10 4,5 6,5 2,0 4,00 pentru calcul r, dar hai să construim

12,5 5,40 3,0 9,0 6,0 36,00 alt tabel (Tabelul 7.2).

13,0 5,10 6,0 6,5 0,5 0,25 Înlocuiți valorile:

13,2 5,00 8,5 4,5 4,0 16,00 r = 1– =

13,1 5,00 7,0 4,5 2,5 6,25 =1– 2538:1320 » 1–1,9 » – 0,9.

13,4 4,65 10,0 1,0 9,0 81,00 Vedem: r s-a dovedit a fi un pic

12,4 5,60 2,0 11,0 9,0 81,00 mai mult decât r, dar asta este diferit

12,3 5,50 1,0 10,0 9,0 81,00 nu foarte mare. La urma urmei, la

12,7 5,20 4,5 8,0 3,5 12,25 atât de mic n valorile rși r

åd R 2 = 423 sunt foarte aproximative, nu foarte fiabile, valoarea lor reală poate fluctua foarte mult, deci diferența rși rîn 0,1 este nesemnificativă. De obiceirconsiderat ca un analogr , dar mai puțin precis. Semnele la rși r arată direcția conexiunii.

7.3.4. Aplicarea și validarea coeficienților de corelație. Determinarea gradului de corelare între factori este necesară pentru a controla dezvoltarea factorului de care avem nevoie: pentru aceasta, trebuie să influențăm alți factori care îl afectează semnificativ și trebuie să cunoaștem măsura eficacității acestora. Este necesar să cunoaștem relația factorilor pentru a dezvolta sau selecta teste gata făcute: conținutul informațional al unui test este determinat de corelarea rezultatelor acestuia cu manifestările unei trăsături sau proprietăți care ne interesează. Fără cunoașterea corelațiilor, orice formă de selecție este imposibilă.

S-a remarcat mai sus că în sport și în general practica pedagogică, medicală și chiar economică și sociologică interes mare reprezintă definiţia de contribuţie , care un factor contribuie la formarea altuia. Acest lucru se datorează faptului că, pe lângă factorul considerat-cauze pe ţintă(care ne interesează) act factor, fiecare dând una sau alta contribuție la acesta și altele.

Se crede că măsura contribuției fiecărui factor-cauză poate fi coeficient de determinare D i = r 2 ´100%. Deci, de exemplu, dacă r = 0,6, i.e. relația dintre factorii A și B este medie, atunci D = 0,6 2 ´100% = 36%. Știind, așadar, că contribuția factorului A la formarea factorului B este de aproximativ 1 ½ 3, este posibil, de exemplu, să se dedice aproximativ 1 ½ 3 timpi de antrenament. Dacă coeficientul de corelație r \u003d 0,4, atunci D \u003d r 2 100% \u003d 16%, sau aproximativ 1 ½ 6 - de mai mult de două ori mai puțin și, conform acestei logici, doar 1 ar trebui acordat dezvoltării sale ½ 6 părți din timpul de antrenament.

Valorile lui D i pentru diverși factori semnificativi oferă o idee aproximativă a relației cantitative a influențelor lor asupra factorului țintă care ne interesează, de dragul îmbunătățirii pe care, de fapt, lucrăm la alți factori ( de exemplu, un săritor în lungime lucrează la creșterea vitezei sprintului său, astfel încât acesta este factorul care aduce cea mai semnificativă contribuție la formarea rezultatului în sărituri).

Amintiți-vă că definind Dîn loc de r a pune r, deși, desigur, acuratețea determinării este mai mică.

Bazat selectiv(calculat din datele eșantionului) al coeficientului de corelație, este imposibil de concluzionat că faptul existenței unei legături între factorii considerați în general este de încredere. Pentru a trage o astfel de concluzie cu diferite grade de validitate, utilizați standardul criterii de semnificație a corelației. Aplicarea lor presupune o relaţie liniară între factorii şi distributie normala frecvențele în fiecare dintre ele (adică nu o reprezentare selectivă, ci generală).

Puteți, de exemplu, să aplicați testele t ale Studentului. Rasa lui

formula pare: tp= –2 , unde k este coeficientul de corelație al eșantionului studiat, a n- volumul probelor comparate. Valoarea calculată rezultată a criteriului t (t p) este comparată cu valoarea tabelului la nivelul de semnificație pe care l-am ales și cu numărul de grade de libertate n = n - 2. Pentru a scăpa de munca de calcul, puteți utiliza o masă specială valorile critice ale coeficienților de corelație ale eșantionului(vezi mai sus), corespunzând prezenței unei relații semnificative între factori (ținând cont n și A).

Tabelul 7.3.

Valorile limită ale fiabilității coeficientului de corelație al eșantionului

Numărul de grade de libertate în determinarea coeficienților de corelație este luat egal cu 2 (adică n= 2) Indicat în tabel. Valorile 7.3 au o limită inferioară a intervalului de încredere Adevărat coeficientul de corelație este 0, adică cu astfel de valori nu se poate argumenta că corelația are loc deloc. Dacă valoarea coeficientului de corelație al eșantionului este mai mare decât cea indicată în tabel, se poate considera la nivelul corespunzător de semnificație că adevăratul coeficient de corelație nu este egal cu zero.

Dar răspunsul la întrebarea dacă există o legătură reală între factorii luați în considerare lasă loc pentru o altă întrebare: în ce interval valoare adevarata coeficient de corelație, așa cum poate fi de fapt, cu un infinit de mare n? Acest interval pentru orice valoare anume rși n factorii comparați pot fi calculați, dar este mai convenabil să folosiți un sistem de grafice ( nomograma), unde fiecare pereche de curbe construită pentru unele specificate mai sus n, corespunde limitelor intervalului.

Orez. 7.4. Limitele de încredere ale coeficientului de corelație al eșantionului (a = 0,05). Fiecare curbă corespunde celei de deasupra ei. n.

Referindu-ne la nomograma din Fig. 7.4, este posibil să se determine intervalul de valori ale coeficientului de corelație adevărat pentru valorile calculate ale coeficientului de corelație al eșantionului la a = 0,05.

7.3.5. relații de corelație. Dacă corelarea perechii neliniară, este imposibil de calculat coeficientul de corelație, determinați relații de corelație . Cerință obligatorie: caracteristicile trebuie măsurate pe o scară de raport sau pe o scară de interval. Puteți calcula dependența de corelare a factorului X din factor Yși dependența de corelare a factorului Y din factor X- sunt diferite. Cu un volum mic n considerate eșantioane reprezentând factori, pentru a calcula relațiile de corelație, puteți utiliza formulele:

raportul de corelare h x ½ y= ;

raportul de corelare h y ½ x= .

Iată și sunt mediile aritmetice ale eșantioanelor X și Y și - intraclasă medii aritmetice. Adică media aritmetică a acelor valori din eșantionul factorului X, cu care conjugă valori egale în eșantionul factorului Y (de exemplu, dacă factorul X are valori 4, 6 și 5, cu care 3 opțiuni cu aceeași valoare de 9 sunt conjugate în eșantionul factorului Y, atunci = (4+6+) 5) ½ 3 = 5). În consecință - media aritmetică a acelor valori din eșantionul factorului Y, care sunt asociate cu aceleași valori din eșantionul factorului X. Să dăm un exemplu și să calculăm:

X: 75 77 78 76 80 79 83 82 ; Y: 42 42 43 43 43 44 44 45 .

Tabelul 7.4

Tabel de calcul

x i y eu X y x i – x (x i – x) 2 x i - X y (x iX y) 2
–4 –1
–2
–3 –2
–1
–3
x=79 y=43 S=76 S=28

Prin urmare h y ½ x= » 0,63.

7.3.6. Coeficienți de corelație parțială și multiplă. Pentru a evalua relația dintre 2 factori, prin calcularea coeficienților de corelație, presupunem implicit că niciun alt factor nu are vreun efect asupra acestei relații. În realitate, nu este cazul. Deci, relația dintre greutate și înălțime este foarte semnificativ afectată de conținutul de calorii al dietei, valoarea sistematicii activitate fizica, ereditatea etc. Când este necesar la evaluarea relaţiei dintre 2 factori luați în considerare impactul semnificativ alți factori și, în același timp, cum să se izoleze de ei, considerându-le neschimbate, calculati privat (in caz contrar - parțial ) coeficienți de corelare.

Exemplu: trebuie să evaluați dependențele pereche între 3 esențiale factori de operare X, Y și Z. Notă r XY (Z) coeficient de corelație privat (parțial) între factorii X și Y (în acest caz, valoarea factorului Z este considerată neschimbată), r ZX (Y) - coeficient de corelație parțială între factorii Z și X (cu valoarea constantă a factorului Y), r YZ (X) - coeficient de corelație parțială între factorii Y și Z (cu valoarea constantă a factorului X). Folosind coeficienții de corelație perechi simple calculați (conform Bravais-Pearson). r X y, r XZ și r YZ, m

Puteți calcula coeficienți de corelație privat (parțial) folosind formulele:

rXY- r XZ' r YZ r XZ- r X Y' r ZY r ZY –r ZX ´ r YZ

r XY (Z) =; r XZ (Y) =; r ZY (X) =

Ö(1– r 2XZ)(1– r 2 YZ) Ö(1– r 2XY)(1– r 2 ZY) Ö(1– r 2ZX)(1– r 2YX)

Și coeficienții de corelație parțială pot lua valori de la -1 la +1. Prin pătrarea lor, obținem coeficientii corespunzători coeficienții de determinare numit si măsuri private de certitudine(înmulțind cu 100, exprimăm în %%). Coeficienții de corelație parțială diferă mai mult sau mai puțin de coeficienții de pereche simpli (compleți), care depinde de puterea influenței celui de-al 3-lea factor (parcă neschimbat). Se testează ipoteza nulă (H 0), adică ipoteza că nu există nicio legătură (dependență) între factorii X și Y (cu numărul total de caracteristici k) prin calcularea testului t după formula: t P = r XY (Z) ´ ( n-k) 1 ½ 2 ´ (1– r 2XY(Z)) –1 ½ 2 .

În cazul în care un t R< t a n , ipoteza este acceptată (presupunem că nu există dependență), dacă tt a n - ipoteza este infirmată, adică se crede că dependența are loc cu adevărat. t un n este luat din tabel t-Criteriul elevului, și k- numărul de factori luați în considerare (în exemplul nostru 3), numărul de grade de libertate n= n - 3. Alți coeficienți de corelație parțială sunt verificați în mod similar (în formulă în loc de r XY (Z) sunt substituite în mod corespunzător r XZ (Y) sau r ZY(X)).

Tabelul 7.5

Datele inițiale

Ö (1 – 0,71 2)(1 – 0,71 2) Ö (1 – 0,5)(1 – 0,5)

Pentru a evalua dependența factorului X de acțiunea combinată a mai multor factori (aici, factorii Y și Z), calculați valorile coeficienților de corelație perechi simpli și, folosindu-le, calculați coeficient de corelație multiplă r X (YZ):

Ö r 2XY+ r 2XZ - 2 r X Y' r XZ' r YZ

r X (YZ) = .

Ö 1 - r 2 YZ

7.2.7. coeficientul de asociere. Este adesea necesar să se cuantifice relația dintre calitate semne, adică astfel de semne care nu pot fi reprezentate (caracterizate) cantitativ, care nemăsurată. De exemplu, sarcina este de a afla dacă există o relație între specializarea sportivă a celor implicați și proprietăți personale precum introversia (accentul personalității asupra fenomenelor din propria lume subiectivă) și extraversie (accentul personalității asupra lumii). obiecte externe). Simbolurile sunt prezentate în tabel. 7.6.

Tabelul 7.6.

X (ani) Y (ori) Z (ori) X (ani) Y (ori) Z (ori)
Caracteristica 1 Caracteristica 2 introversiune Extraversie
Jocuri sportive A b
Gimnastică Cu d

Evident, numerele pe care le avem la dispoziție aici pot fi doar frecvențe de distribuție. În acest caz, calculați coeficientul de asociere (alt nume " coeficient de contingență "). Luați în considerare cel mai simplu caz: relația dintre două perechi de caracteristici, în timp ce se numește coeficientul de contingență calculat tetrachoric (Vezi tabelul).

Tabelul 7.7.

a = 20 b = 15 A + b = 35
c =15 d=5 c + d = 20
A + c = 35 b + d = 20 n = 55

Facem calcule după formula:

ad-bc 100-225-123

Calculul coeficienților de asociere (coeficienții de conjugare) cu un număr mai mare de caracteristici este asociat cu calcule folosind o matrice similară de ordinul corespunzător.

La studierea diferitelor fenomene socio-economice se disting o conexiune funcțională și o dependență stocastică. O relație funcțională este un tip de relație în care o valoare dată a unui indicator de factor corespunde doar unei valori a indicatorului efectiv. Relația funcțională se manifestă în toate cazurile de studiu și pentru fiecare unitate specifică a populației analizate.

Postat pe www.site

În cazul în care dependența cauzală nu operează în fiecare caz specific, ci în general pentru întreaga populație observată, media pentru un număr semnificativ de observații, atunci o astfel de dependență este stocastică. Un caz special de dependență stocastică este o corelație, în care o modificare a valorii medii a indicatorului efectiv este cauzată de o modificare a valorilor indicatorilor factorilor. Calculul gradului de apropiere și direcție a comunicării este o sarcină semnificativă de cercetare și cuantificare relaţia dintre diversele fenomene socio-economice. Determinarea gradului de apropiere a relației dintre diverși indicatori necesită determinarea nivelului raportului modificării semnului rezultat din modificarea unuia (în cazul studiului dependențelor pereche) sau al variației mai multor (în cazul a studiului dependenţelor multiple) semne-factori. Pentru determinarea acestui nivel se folosește coeficientul de corelație.

Coeficientul de corelație liniară a fost introdus pentru prima dată la începutul anilor 1990. secolul al 19-lea Pearson și arată gradul de etanșeitate și direcția relației dintre doi factori corelați în cazul în care între ei există o relație liniară. La interpretarea valorii obținute a coeficientului de corelație liniară, gradul de apropiere a relației dintre semne este evaluat pe scara Chaddock, una dintre opțiunile pentru această scală este dată în tabelul de mai jos:

Scala Chaddock pentru evaluarea cantitativă a gradului de apropiere a comunicării

Valoarea indicatorului de apropiere a conexiunii

Natura relației

Practic absent

Moderat

La interpretarea valorii coeficientului de corelație liniară în direcția comunicării se disting direct și invers. În cazul unei legături directe cu o creștere sau scădere a valorii unui atribut de factor, are loc o creștere sau scădere a indicatorilor atributului efectiv, i.e. factorul și rezultatul se schimbă în aceeași direcție. De exemplu, o creștere a cantității de profit contribuie la creșterea indicatorilor de profitabilitate. În prezența feedback-ului, valorile atributului rezultat se modifică sub influența atributului factorului, dar în direcția opusă în comparație cu dinamica atributului factorului. De exemplu, cu o creștere a productivității muncii, costul unitar al producției scade etc.