Což není funkcí Evropské komise. Evropská komise. Funkce a pravomoci. Generální ředitelství pro energetiku GŘ ENER – Energetika

Pearsonův korelační test je metoda parametrické statistiky, která umožňuje určit přítomnost nebo nepřítomnost lineárního vztahu mezi dvěma kvantitativními ukazateli a také vyhodnotit jeho blízkost a statistickou významnost. Jinými slovy, Pearsonův korelační test vám umožňuje určit, zda existuje lineární vztah mezi změnami hodnot dvou proměnných. Ve statistických výpočtech a inferencích se korelační koeficient obvykle označuje jako rxy nebo Rxy.

1. Historie vývoje korelačního kritéria

Pearsonův korelační test byl vyvinut týmem britských vědců pod vedením Karl Pearson(1857-1936) v 90. letech 19. století pro zjednodušení analýzy kovariance dvou náhodných veličin. Kromě Karla Pearsona se pracovalo i na Pearsonově korelačním testu Francis Edgeworth a Raphael Weldon.

2. K čemu slouží Pearsonův korelační test?

Pearsonovo korelační kritérium vám umožňuje určit, jaká je blízkost (nebo síla) korelace mezi dvěma indikátory měřenými na kvantitativní stupnici. Pomocí dodatečných výpočtů můžete také určit, jak statisticky významný je zjištěný vztah.

Například pomocí Pearsonova korelačního testu lze odpovědět na otázku, zda existuje vztah mezi tělesnou teplotou a obsahem leukocytů v krvi u akutních respirační infekce, mezi výškou a hmotností pacienta, mezi obsahem v pití vody fluoridů a výskyt kazů v populaci.

3. Podmínky a omezení použití Pearsonova chí-kvadrát testu

  1. Je třeba měřit srovnatelné ukazatele kvantitativní měřítko(například srdeční frekvence, tělesná teplota, počet leukocytů na 1 ml krve, systolický krevní tlak).
  2. Pomocí Pearsonova korelačního kritéria lze pouze určit přítomnost a síla lineárního vztahu mezi množstvími. Další charakteristiky spojení, včetně směru (přímého nebo reverzního), povahy změn (přímočarých nebo křivočarých), jakož i přítomnosti závislosti jedné proměnné na druhé, jsou určeny pomocí regresní analýzy.
  3. Počet porovnávaných hodnot se musí rovnat dvěma. V případě analýzy vztahu tří nebo více parametrů byste měli použít metodu faktorová analýza.
  4. Pearsonovo korelační kritérium je parametrické, v souvislosti s nímž je podmínkou jeho uplatnění normální distribuce shodné proměnné. Je-li nutné provést korelační analýzu ukazatelů, jejichž rozložení se liší od normálního, včetně ukazatelů měřených na ordinální stupnici, je třeba použít Spearmanův koeficient pořadové korelace.
  5. Je nutné jasně rozlišovat mezi pojmy závislost a korelace. Závislost hodnot určuje přítomnost korelace mezi nimi, ale ne naopak.

Například růst dítěte závisí na jeho věku, tedy jaký starší dítě, tím je vyšší. Pokud vezmeme dvě děti různého věku, pak s vysokou mírou pravděpodobnosti bude růst staršího dítěte větší než u mladšího. Tento jev se nazývá závislost, což naznačuje příčinnou souvislost mezi indikátory. Samozřejmě existují také korelace, což znamená, že změny v jednom ukazateli jsou doprovázeny změnami v ukazateli jiném.

V jiné situaci zvažte vztah mezi růstem dítěte a srdeční frekvencí (HR). Jak víte, obě tyto hodnoty jsou přímo závislé na věku, proto ve většině případů budou mít děti vyšší výšky (a tedy staršího věku) nižší hodnoty srdeční frekvence. to znamená, korelace budou pozorovány a mohou mít dostatečně vysokou těsnost. Pokud však vezmeme děti stejný věk, ale jiná výška, pak se s největší pravděpodobností jejich srdeční frekvence bude nepatrně lišit, v souvislosti s tím můžeme dojít k závěru, že nezávislost Srdeční frekvence z růstu.

Výše uvedený příklad ukazuje, jak důležité je rozlišovat mezi základními pojmy ve statistice spojení a závislosti indikátory, aby bylo možné vyvodit správné závěry.

4. Jak vypočítat Pearsonův korelační koeficient?

Pearsonův korelační koeficient se vypočítá pomocí následujícího vzorce:

5. Jak interpretovat hodnotu Pearsonova korelačního koeficientu?

Hodnoty Pearsonova korelačního koeficientu jsou interpretovány na základě jeho absolutních hodnot. Možné hodnoty korelačního koeficientu se pohybují od 0 do ±1. Čím větší je absolutní hodnota r xy, tím vyšší je blízkost vztahu mezi oběma veličinami. r xy = 0 znamená úplné přerušení spojení. r xy = 1 - označuje přítomnost absolutního (funkčního) spojení. Pokud se ukázalo, že hodnota Pearsonova korelačního kritéria je větší než 1 nebo menší než -1, došlo k chybě ve výpočtech.

Pro posouzení blízkosti nebo síly korelace se používají obecně uznávaná kritéria, podle kterých jsou absolutní hodnoty r xy< 0.3 свидетельствуют о slabý připojení, hodnoty r xy ​​od 0,3 do 0,7 - o připojení střední těsnost, hodnoty r xy ​​> 0,7 - o silný spojení.

Přesnější odhad síly korelace lze získat použitím Chaddock stůl:

Školní známka statistická významnost korelační koeficient r xy se provádí pomocí t-testu vypočítaného podle následujícího vzorce:

Získaná hodnota t r je porovnána s kritickou hodnotou na určité hladině významnosti a počtu stupňů volnosti n-2. Pokud t r překročí t crit, pak je učiněn závěr o statistické významnosti zjištěné korelace.

6. Příklad výpočtu Pearsonova korelačního koeficientu

Cílem studie bylo identifikovat, určit těsnost a statistickou významnost korelace mezi dvěma kvantitativními ukazateli: hladinou testosteronu v krvi (X) a procentem svalová hmota v těle (Y). Počáteční údaje pro vzorek 5 subjektů (n = 5) jsou shrnuty v tabulce.

Korelační koeficient (nebo lineární korelační koeficient) se označuje jako "r" (ve vzácných případech jako "ρ") a charakterizuje lineární korelaci (tedy vztah, který je dán nějakou hodnotou a směrem) dvou nebo více proměnných. . Hodnota koeficientu leží mezi -1 a +1, to znamená, že korelace může být kladná i záporná. Pokud je korelační koeficient -1, existuje dokonalá negativní korelace; pokud je korelační koeficient +1, existuje dokonalá kladná korelace. V ostatních případech existuje pozitivní korelace, negativní korelace nebo žádná korelace mezi těmito dvěma proměnnými. Korelační koeficient lze vypočítat ručně, pomocí bezplatných online kalkulaček nebo pomocí dobré grafické kalkulačky.

Kroky

Ruční výpočet korelačního koeficientu

    Sbírejte data. Než začnete počítat korelační koeficient, prozkoumejte danou dvojici čísel. Je lepší si je zapsat do tabulky, která může být uspořádána svisle nebo vodorovně. Označte každý řádek nebo sloupec jako "x" a "y".

    • Například jsou dány čtyři páry hodnot (čísla) proměnných "x" a "y". Můžete vytvořit následující tabulku:
      • x || y
      • 1 || 1
      • 2 || 3
      • 4 || 5
      • 5 || 7
  1. Vypočítejte aritmetický průměr "x". Chcete-li to provést, sečtěte všechny hodnoty „x“ a poté vydělte výsledek počtem hodnot.

    Najděte aritmetický průměr "y". Chcete-li to provést, postupujte podle stejných kroků, to znamená sečtěte všechny hodnoty „y“ a poté vydělte součet počtem hodnot.

    Vypočítejte směrodatnou odchylku "x". Jakmile spočítáte průměry x a y, najděte směrodatné odchylky těchto proměnných. Směrodatná odchylka se vypočítá pomocí následujícího vzorce:

    Vypočítejte směrodatnou odchylku "y". Postupujte podle kroků v předchozím kroku. Použijte stejný vzorec, ale nahraďte do něj hodnoty "y".

    Zapište si základní vzorec pro výpočet korelačního koeficientu. Tento vzorec zahrnuje střední hodnoty, směrodatné odchylky a počet (n) dvojic čísel obou proměnných. Korelační koeficient je označen jako "r" (ve vzácných případech jako "ρ"). Tento článek používá vzorec k výpočtu Pearsonova korelačního koeficientu.

    Vypočítali jste průměry a směrodatné odchylky obou proměnných, takže můžete pomocí vzorce vypočítat korelační koeficient. Připomeňme, že „n“ je počet dvojic hodnot obou proměnných. Hodnota ostatních veličin byla vypočtena dříve.

    • V našem příkladu budou výpočty zapsány následovně:
    • ρ = (1 n − 1) Σ (x − μ x σ x) ∗ (y − μ y σ y) (\displaystyle \rho =\left((\frac (1)(n-1))\vpravo) \Sigma \left((\frac (x-\mu _(x))(\sigma _(x)))\right)*\left((\frac (y-\mu _(y))(\sigma _(y)))\vpravo))
    • ρ = (1 3) ∗ (\displaystyle \rho =\left((\frac (1)(3))\right)*)[ (1 − 3 1 , 83) ∗ (1 − 4 2 , 58) + (2 − 3 1 , 83) ∗ (3 − 4 2 , 58) (\displaystyle \left((\frac (1-3)( 1,83))\vpravo)*\doleva((\frac (1-4)(2,58))\vpravo)+\doleva((\frac (2-3)(1,83))\vpravo) *\doleva((\ frac (3-4) (2,58))\vpravo))
      + (4 − 3 1 , 83) ∗ (5 − 4 2 , 58) + (5 − 3 1 , 83) ∗ (7 − 4 2 , 58) (\displaystyle +\left((\frac (4-3) )(1,83))\vpravo)*\vlevo((\frac (5-4)(2,58))\vpravo)+\vlevo ((\frac (5-3)(1,83))\ vpravo)*\vlevo ( (\frac (7-4)(2,58))\right))]
    • ρ = (1 3) ∗ (6 + 1 + 1 + 6 4 , 721) (\displaystyle \rho =\left((\frac (1)(3))\right)*\left((\frac (6) +1+1+6)(4721))\vpravo))
    • ρ = (1 3) ∗ 2 , 965 (\displaystyle \rho =\left((\frac (1)(3))\right)*2,965)
    • ρ = (2 , 965 3) (\displaystyle \rho =\left((\frac (2,965)(3))\right))
    • ρ = 0,988 (\displaystyle \rho =0,988)
  2. Analyzujte výsledek. V našem příkladu je korelační koeficient 0,988. Tato hodnota nějakým způsobem charakterizuje danou množinu dvojic čísel. Věnujte pozornost znaménku a velikosti hodnoty.

    • Jelikož je hodnota korelačního koeficientu kladná, existuje kladná korelace mezi proměnnými „x“ a „y“. To znamená, že když se zvýší hodnota "x", zvýší se i hodnota "y".
    • Protože hodnota korelačního koeficientu je velmi blízká +1, jsou hodnoty proměnných x a y vysoce korelované. Pokud umístíte body na souřadnicovou rovinu, budou umístěny blízko nějaké přímky.

    Použití online kalkulaček k výpočtu korelačního koeficientu

    1. Najděte si na internetu kalkulačku pro výpočet korelačního koeficientu. Tento koeficient se často počítá ve statistikách. Pokud existuje mnoho dvojic čísel, je prakticky nemožné vypočítat korelační koeficient ručně. Proto existují online kalkulačky pro výpočet korelačního koeficientu. Do vyhledávače zadejte "kalkulátor korelačních koeficientů" (bez uvozovek).

      Zadejte údaje. Přečtěte si pokyny na webu, abyste správně zadali údaje (dvojice čísel). Je nesmírně důležité zadat příslušné dvojice čísel; jinak dostanete špatný výsledek. Mějte na paměti, že různé webové stránky mají různé formáty zadávání dat.

      • Například na webu http://ncalculators.com/statistics/correlation-coefficient-calculator.htm jsou hodnoty proměnných „x“ a „y“ zadány ve dvou vodorovných řádcích. Hodnoty jsou odděleny čárkami. To znamená, že v našem příkladu jsou hodnoty "x" zadány takto: 1,2,4,5 a hodnoty "y" jsou takto: 1,3,5,7.
      • Na jiném webu, http://www.alcula.com/calculators/statistics/correlation-coefficient/ , se data zadávají svisle; v tomto případě nezaměňujte odpovídající dvojice čísel.
    2. Vypočítejte korelační koeficient. Po zadání údajů stačí kliknout na tlačítko "Vypočítat", "Vypočítat" nebo podobné, abyste získali výsledek.

    Použití grafické kalkulačky

    1. Zadejte údaje. Uchopte grafickou kalkulačku, přepněte do režimu statistických výpočtů a vyberte příkaz Upravit.

      • Na různých kalkulačkách musíte stisknout různé klávesy. Tento článek se zaměřuje na kalkulačku Texas Instruments TI-86.
      • Pro přepnutí do režimu statistického výpočtu stiskněte - Stat (nad tlačítkem "+"). Poté stiskněte F2 - Upravit (Upravit).
    2. Smazat předchozí uložená data. Většina kalkulaček uchovává zadané statistiky, dokud je nevymažete. Abyste předešli záměně starých dat s novými daty, nejprve odstraňte všechny uložené informace.

      • Pomocí kláves se šipkami posuňte kurzor a zvýrazněte nadpis „xStat“. Poté stiskněte Clear a Enter pro vymazání všech hodnot zadaných ve sloupci xStat.
      • Pomocí kláves se šipkami zvýrazněte nadpis „yStat“. Poté stiskněte Clear a Enter pro vymazání všech hodnot zadaných ve sloupci yStat.
    3. Zadejte počáteční údaje. Pomocí kláves se šipkami přesuňte kurzor na první buňku pod nadpisem „xStat“. Zadejte první hodnotu a stiskněte Enter. V dolní části obrazovky se zobrazí "xStat (1) = __" se zadanou hodnotou místo mezery. Po stisknutí klávesy Enter se zadaná hodnota objeví v tabulce a kurzor se přesune na další řádek; toto zobrazí "xStat(2) = __" ve spodní části obrazovky.

      • Zadejte všechny hodnoty proměnné "x".
      • Jakmile zadáte všechny hodnoty pro proměnnou x, přejděte pomocí kláves se šipkami do sloupce yStat a zadejte hodnoty pro proměnnou y.
      • Po zadání všech dvojic čísel stiskněte Exit pro vymazání obrazovky a opuštění režimu agregace.
    4. Vypočítejte korelační koeficient. Charakterizuje, jak blízko jsou data k nějaké přímce. Grafický kalkulátor dokáže rychle určit vhodnou přímku a vypočítat korelační koeficient.

      • Klikněte na Stat (Statistics) - Calc (Calculations). Na TI-86 stiskněte - - .
      • Vyberte funkci "Lineární regrese". Na TI-86 stiskněte , což je označeno „LinR“. Řádek „LinR _“ se zobrazí na obrazovce s blikajícím kurzorem.
      • Nyní zadejte názvy dvou proměnných: xStat a yStat.
        • Na TI-86 otevřete seznam jmen; k tomu stiskněte – – .
        • Dostupné proměnné jsou zobrazeny na spodním řádku obrazovky. Vyberte (nejpravděpodobněji stisknutím F1 nebo F2), zadejte čárku a poté vyberte .
        • Stiskněte Enter pro zpracování zadaných údajů.

7.3.1. Koeficienty korelace a determinace. Lze kvantifikovat blízkost komunikace mezi faktory a orientace(přímo nebo obráceně) výpočtem:

1) pokud je nutné určit lineární vztah mezi dvěma faktory, - párový koeficient korelace: v 7.3.2 a 7.3.3 operace výpočtu párového lineárního Bravais-Pearsonova korelačního koeficientu ( r) a Spearmanův párový korelační koeficient pořadí ( r);

2) pokud chceme určit vztah mezi dvěma faktory, ale tento vztah je zjevně nelineární, pak korelační vztah ;

3) pokud chceme určit vztah mezi jedním faktorem a nějakým souborem dalších faktorů – pak (nebo ekvivalentně "koeficient vícenásobné korelace");

4) pokud chceme izolovaně identifikovat vztah jednoho faktoru pouze s konkrétním jiným, který je součástí skupiny faktorů ovlivňujících první, u nichž musíme uvažovat vliv všech ostatních faktorů beze změny, pak soukromý (dílčí) korelační koeficient .

Žádný korelační koeficient (r, r) nesmí v absolutní hodnotě překročit 1, tedy –1< r (r) < 1). Если получено значение 1, то это значит, что рассматриваемая зависимость не статистическая, а функциональная, если 0 - корреляции нет вообще.

Znaménko u korelačního koeficientu určuje směr spojení: znaménko „+“ (nebo absence znaménka) znamená, že spojení rovný (pozitivní), znaménko „–“ - že spojení zvrátit (negativní). Značka nemá nic společného s těsností spojení.

Statistický vztah charakterizuje korelační koeficient. Často je ale potřeba určit jiný typ závislosti, a to: jaký je podíl určitého faktoru na vzniku jiného příbuzného faktoru. Tento druh závislosti se s jistou mírou konvenčnosti vyznačuje determinační koeficient (D ) určeno vzorcem D = r 2 ´100 % (kde r je Bravais-Pearsonův korelační koeficient, viz 7.3.2). Pokud byla měření provedena v stupnice objednávek (stupnice pořadí), pak lze s určitou újmou na spolehlivosti místo hodnoty r do vzorce dosadit hodnotu r (Spearmanův korelační koeficient, viz 7.3.3).

Pokud bychom například získali jako charakteristiku závislosti faktoru B na faktoru A korelační koeficient r = 0,8 nebo r = –0,8, pak D = 0,8 2 ´100 % = 64 %, tedy asi 2 ½ 3. Proto je příspěvek faktoru A a jeho změn k tvorbě faktoru B přibližně 2 ½ 3 z celkového příspěvku všech faktorů obecně.

7.3.2. Bravais-Pearsonův korelační koeficient. Postup pro výpočet Bravais-Pearsonova korelačního koeficientu ( r ) lze použít pouze v případech, kdy je spojení uvažováno na základě vzorků s normálním frekvenčním rozložením ( normální distribuce ) a získané měřením v intervalech nebo poměrech. Výpočtový vzorec tento korelační koeficient:



å ( X já –)( y i-)

r = .

n×sx×sy

Co ukazuje korelační koeficient? Za prvé, znaménko u korelačního koeficientu ukazuje směr vztahu, konkrétně: znaménko „–“ označuje, že vztah zvrátit nebo negativní(existuje trend: jak hodnoty jednoho faktoru klesají, odpovídající hodnoty druhého faktoru rostou, a jak rostou, snižují se) a absence znaménka nebo znaménka „+“ označuje rovný nebo pozitivní připojení (existuje trend: s nárůstem hodnot jednoho faktoru se hodnoty druhého zvyšují a s poklesem se snižují). Za druhé, absolutní (nezávislá na znaménku) hodnota korelačního koeficientu udává těsnost (pevnost) spoje. Je obvyklé předpokládat (spíše konvenčně): pro hodnoty r< 0,3 корреляция velmi slabá, často se to prostě nebere v úvahu, za 0,3 £ r< 5 корреляция slabý, za 0,5 £ r< 0,7) - průměrný, za 0,7 £ r £ 0,9) - silný a nakonec pro r > 0,9 - velmi silný. V našem případě (r » 0,83) je vztah inverzní (negativní) a silný.

Připomeňme, že hodnoty korelačního koeficientu mohou být v rozsahu od -1 do +1. Pokud hodnota r přesahuje tyto limity, znamená to ve výpočtech, že došlo k chybě . Pokud r= 1, to znamená, že souvislost není statistická, ale funkční - což se ve sportu, biologii, medicíně prakticky neděje. Při malém počtu měření je sice možný náhodný výběr hodnot, které dávají obraz funkčního vztahu, ale takový případ je tím méně pravděpodobný, čím větší je objem porovnávaných vzorků (n), tj. počet párů porovnávaných měření.

Výpočtová tabulka (tabulka 7.1) je sestavena podle vzorce.

Tabulka 7.1.

Výpočtová tabulka pro Bravais-Pearsonův výpočet

x i y i (X i-) (X i –) 2 (y i-) (y i –) 2 (X já –)( y i-)
13,2 4,75 0,2 0,04 –0,35 0,1225 – 0,07
13,5 4,7 0,5 0,25 – 0,40 0,1600 – 0,20
12,7 5,10 – 0,3 0,09 0,00 0,0000 0,00
12,5 5,40 – 0,5 0,25 0,30 0,0900 – 0,15
13,0 5,10 0,0 0,00 0,00 0.0000 0,00
13,2 5,00 0,1 0,01 – 0,10 0,0100 – 0,02
13,1 5,00 0,1 0,01 – 0,10 0,0100 – 0,01
13,4 4,65 0,4 0,16 – 0,45 0,2025 – 0,18
12,4 5,60 – 0,6 0,36 0,50 0,2500 – 0,30
12,3 5,50 – 0,7 0,49 0,40 0,1600 – 0,28
12,7 5,20 –0,3 0,09 0,10 0,0100 – 0,03
åx i \u003d 137 \u003d 13:00 åy i = 56,1 = 5,1 å( X i - ) 2 \u003d \u003d 1,78 å( y i – ) 2 = = 1,015 å( X já –)( y i – )= = –1,24

Protože s x = ï ï = ï ï» 0,42, a

s y= ï ï» 0,32, r" –1,24ï (11´0.42´0.32) » –1,24ï 1,48 » –0,83 .

Jinými slovy, musíte velmi pevně vědět, že korelační koeficient nemůže překročit 1,0 v absolutní hodnotě. Tomu se často vyhne nejhrubší chyby, přesněji - najít a opravit chyby vzniklé ve výpočtech.

7.3.3. Spearmanův korelační koeficient. Jak již bylo zmíněno, Bravais-Pearsonův korelační koeficient (r) je možné aplikovat pouze v těch případech, kdy se analyzované faktory blíží normálu z hlediska frekvenčního rozložení a hodnoty varianty jsou získány měřením nutně na stupnice poměrů nebo na stupnici intervalů, k čemuž dochází, jsou-li vyjádřeny fyzikálními jednotkami. V ostatních případech se zjistí Spearmanův korelační koeficient ( r). Nicméně tento poměr umět platí i v případech, kdy je to povoleno (a žádoucí ! ) použít Bravais-Pearsonův korelační koeficient. Ale je třeba mít na paměti, že postup pro stanovení Bravais-Pearsonův koeficient má více síly („vyřešení schopnost"), proto r více informativní než r. I s velkým n odchylka r může být v řádu ±10 %.

Tabulka 7.2 Výpočtový vzorec pro koeficient

x i y i R x R y |d R | d R 2 Spearmanův korelační koeficient

13,2 4,75 8,5 3,0 5,5 30,25 r= 1 – . Vos

13,5 4,70 11,0 2,0 9,0 81,00 použijeme náš příklad

12,7 5,10 4,5 6,5 2,0 4,00 pro výpočet r, ale pojďme stavět

12,5 5,40 3,0 9,0 6,0 36,00 jiný stůl (tab. 7.2).

13,0 5,10 6,0 6,5 0,5 0,25 Dosaďte hodnoty:

13,2 5,00 8,5 4,5 4,0 16,00 r = 1– =

13,1 5,00 7,0 4,5 2,5 6,25 =1– 2538:1320 » 1–1,9 » – 0,9.

13,4 4,65 10,0 1,0 9,0 81,00 Vidíme: r se ukázalo být trochu

12,4 5,60 2,0 11,0 9,0 81,00 více než r, ale tohle je jiné

12,3 5,50 1,0 10,0 9,0 81,00 nepříliš velká. Ostatně při

12,7 5,20 4,5 8,0 3,5 12,25 tak malý n hodnoty r a r

åd R 2 = 423 jsou velmi přibližné, nepříliš spolehlivé, jejich skutečná hodnota může značně kolísat, takže rozdíl r a r v 0,1 je nevýznamné. Obvyklerpovažován za analogr , ale méně přesné. Znamení na r a r ukazuje směr připojení.

7.3.4. Aplikace a validace korelačních koeficientů. Určení míry korelace mezi faktory je nutné pro řízení vývoje faktoru, který potřebujeme: k tomu musíme ovlivňovat další faktory, které jej významně ovlivňují, a potřebujeme znát míru jejich účinnosti. Aby bylo možné vyvinout nebo vybrat hotové testy, je nutné vědět o vztahu faktorů: informační obsah testu je určen korelací jeho výsledků s projevy vlastnosti nebo vlastnosti, která nás zajímá. Bez znalosti korelací je jakákoliv forma výběru nemožná.

Výše bylo uvedeno, že ve sportovní a obecně pedagogické, lékařské a dokonce i ekonomické a sociologické praxi velký zájem představuje definici příspěvek , který jeden faktor přispívá ke vzniku druhého. To je způsobeno tím, že kromě uvažovaného faktoru-příčiny na cílová(nás zajímavého) činitele, z nichž každý k němu přispívá tím či oním způsobem, a další.

Předpokládá se, že míra příspěvku každého faktoru-příčiny může být koeficient determinace Di = r2'100 %. Pokud tedy například r = 0,6, tzn. vztah mezi faktory A a B je průměrný, pak D = 0,6 2 ´100 % = 36 %. S vědomím toho, že příspěvek faktoru A k tvorbě faktoru B je přibližně 1 ½ 3 je možné věnovat např. přibližně 1 ½ 3 tréninkové časy. Pokud je korelační koeficient r \u003d 0,4, pak D \u003d r 2 100 % \u003d 16 % nebo přibližně 1 ½ 6 - více než dvakrát méně a podle této logiky by se jeho vývoji mělo dát pouze 1 ½ 6 část tréninkového času.

Hodnoty D i pro různé významné faktory dávají přibližnou představu o kvantitativním vztahu jejich vlivů na cílový faktor, který nás zajímá, v zájmu jeho zlepšení ve skutečnosti pracujeme na jiných faktorech ( například skokan do dálky pracuje na zvýšení rychlosti svého sprintu, takže je to faktor, který se nejvýrazněji podílí na utváření výsledku ve skocích).

Připomeňte si to definováním D namísto r dát r, i když přesnost určení je samozřejmě nižší.

Na základě selektivní(vypočteno z výběrových dat) korelačního koeficientu, nelze dospět k závěru, že skutečnost existence souvislosti mezi uvažovanými faktory obecně je spolehlivá. Chcete-li vyvodit takový závěr s různou mírou platnosti, použijte standard kritéria významnosti korelace. Jejich aplikace předpokládá lineární vztah mezi faktory a normální distribuce frekvence v každém z nich (myšleno nikoli selektivní, ale jejich obecné zastoupení).

Můžete například použít Studentovy t-testy. Jeho rasa

sudý vzorec: tp= –2 , kde k je studovaný výběrový korelační koeficient, a n- objem porovnávaných vzorků. Výsledná vypočtená hodnota t-kritéria (t p) je porovnána s tabulkovou hodnotou na námi zvolené hladině významnosti a počtu stupňů volnosti n = n - 2. Abyste se zbavili výpočetní práce, můžete použít speciální stůl kritické hodnoty výběrových korelačních koeficientů(viz výše), což odpovídá přítomnosti významného vztahu mezi faktory (s přihlédnutím k n a A).

Tabulka 7.3.

Hraniční hodnoty spolehlivosti výběrového korelačního koeficientu

Počet stupňů volnosti při určování korelačních koeficientů se bere rovný 2 (tj. n= 2) Uvedeno v tabulce. Hodnoty 7,3 mají spodní hranici intervalu spolehlivosti skutečný korelační koeficient je 0, to znamená, že s takovými hodnotami nelze tvrdit, že ke korelaci vůbec dochází. Pokud je hodnota výběrového korelačního koeficientu vyšší, než je uvedeno v tabulce, lze na příslušné hladině významnosti uvažovat, že skutečný korelační koeficient není roven nule.

Odpověď na otázku, zda mezi posuzovanými faktory existuje skutečná souvislost, však ponechává prostor pro další otázku: v jakém intervalu ano skutečnou hodnotu korelační koeficient, jak to ve skutečnosti může být, s nekonečně velkým n? Tento interval pro libovolnou konkrétní hodnotu r a n porovnávané faktory lze spočítat, ale pohodlnější je použít soustavu grafů ( nomogram), kde každá dvojice křivek vytvořená pro některé uvedené nad nimi n, odpovídá hranicím intervalu.

Rýže. 7.4. Meze spolehlivosti výběrového korelačního koeficientu (a = 0,05). Každá křivka odpovídá té nad ní. n.

S odkazem na nomogram na Obr. 7.4 je možné určit interval hodnot skutečného korelačního koeficientu pro vypočtené hodnoty výběrového korelačního koeficientu při a = 0,05.

7.3.5. korelační vztahy. Pokud párová korelace nelineární, nelze vypočítat korelační koeficient, určit korelační vztahy . Povinný požadavek: vlastnosti musí být měřeny na poměrové stupnici nebo na intervalové stupnici. Můžete vypočítat korelační závislost faktoru X od faktoru Y a korelační závislost faktoru Y od faktoru X- jsou rozdílní. S malým objemem n uvažované vzorky představující faktory, pro výpočet korelačních vztahů můžete použít vzorce:

korelační poměr h x ½ r= ;

korelační poměr h y ½ x= .

Zde a jsou aritmetické průměry vzorků X a Y a - intraclass aritmetické průměry. To znamená - aritmetický průměr těch hodnot ve vzorku faktoru X, se kterými konjugovat stejné hodnoty ve vzorku faktoru Y (pokud má například faktor X hodnoty 4, 6 a 5, se kterými jsou ve vzorku faktoru Y spojeny 3 možnosti se stejnou hodnotou 9, pak = (4+6+ 5) ½ 3 = 5). V souladu s tím - aritmetický průměr těch hodnot ve vzorku faktoru Y, které jsou spojeny se stejnými hodnotami ve vzorku faktoru X. Uveďme příklad a vypočítejme:

X: 75 77 78 76 80 79 83 82 ; Y: 42 42 43 43 43 44 44 45 .

Tabulka 7.4

Tabulka výpočtu

x i y i x y x i – x (x i – x) 2 x i - x y (x ix y) 2
–4 –1
–2
–3 –2
–1
–3
x=79 y=43 S = 76 S = 28

Proto h y ½ x= » 0,63.

7.3.6. Parciální a vícenásobné korelační koeficienty. Pro vyhodnocení vztahu mezi 2 faktory výpočtem korelačních koeficientů standardně předpokládáme, že žádné další faktory nemají na tento vztah žádný vliv. Ve skutečnosti tomu tak není. Takže vztah mezi hmotností a výškou je velmi významně ovlivněn obsahem kalorií ve stravě, hodnotou systematičnosti fyzická aktivita, dědičnost atd. Kdy je to nutné při posuzování vztahu mezi 2 faktory vzít v úvahu významný dopad další faktory a zároveň jak se od nich izolovat, považovat je za nezměněné, vypočítat soukromé (v opačném případě - částečný ) korelační koeficienty.

Příklad: potřebujete vyhodnotit spárované závislosti mezi 3 základními provozní faktory X, Y a Z. Označte r XY (Z) soukromý (dílčí) korelační koeficient mezi faktory X a Y (v tomto případě je hodnota faktoru Z považována za nezměněnou), r ZX (Y) - parciální korelační koeficient mezi faktory Z a X (s konstantní hodnotou faktoru Y), r YZ (X) - parciální korelační koeficient mezi faktory Y a Z (s konstantní hodnotou faktoru X). Pomocí vypočítaných jednoduchých párových (podle Bravais-Pearsonových) korelačních koeficientů r xy, r XZ a r YZ, m

Soukromé (částečné) korelační koeficienty můžete vypočítat pomocí vzorců:

rXY- r XZ' r YZ r XZ- r XY' r Z Y r ZY –r ZX ´ r YZ

r XY (Z) =; r XZ (Y) =; r ZY (X) =

Ö(1– r 2XZ)(1– r 2 YZ) Ö(1– r 2XY)(1– r 2 ZY) Ö(1– r 2ZX)(1– r 2YX)

A dílčí korelační koeficienty mohou nabývat hodnot od -1 do +1. Jejich umocněním získáme odpovídající podíly determinační koeficienty také zvaný soukromé míry jistoty(vynásobíme 100, vyjádříme v %%). Parciální korelační koeficienty se od jednoduchých (plných) párových koeficientů více či méně liší, což závisí na síle vlivu 3. faktoru (jakoby neměnného). Testuje se nulová hypotéza (H 0), tedy hypotéza, že mezi faktory X a Y neexistuje žádná souvislost (závislost) (s celkovým počtem znaků k) výpočtem t-testu podle vzorce: t P = r XY (Z) ´ ( n-k) 1 ½ 2 ' (1– r 2XY(Z)) –1 ½ 2 .

Pokud t R< t a n , hypotéza je přijata (předpokládáme, že neexistuje žádná závislost), jestliže t P ³ t a n - hypotéza je vyvrácena, to znamená, že se má za to, že k závislosti skutečně dochází. t a n je převzato z tabulky t-Studentské kritérium a k- počet zohledněných faktorů (v našem příkladu 3), počet stupňů volnosti n= n - 3. Ostatní parciální korelační koeficienty se kontrolují podobně (do vzorce místo r XY (Z) jsou odpovídajícím způsobem substituovány r XZ (Y) nebo r ZY(X)).

Tabulka 7.5

Počáteční údaje

Ö (1 – 0,71 2) (1 – 0,71 2) Ö (1 – 0,5) (1 – 0,5)

Pro posouzení závislosti faktoru X na kombinovaném působení několika faktorů (zde faktory Y a Z) vypočítejte hodnoty jednoduchých párových korelačních koeficientů a pomocí nich vypočítejte vícenásobný korelační koeficient r X (YZ):

Ö r 2XY+ r 2XZ - 2 r XY' r XZ' r YZ

r X (YZ) = .

Ö 1 - r 2 YZ

7.2.7. Asociační koeficient.Často je nutné kvantifikovat vztah mezi kvalitní znamení, tzn. takové znaky, které nelze kvantitativně znázornit (charakterizovat), které nezměřitelný. Úkolem je například zjistit, zda existuje vztah mezi sportovní specializací zúčastněných a takovými osobními vlastnostmi, jako je introverze (zaměření osobnosti na fenomény vlastního subjektivního světa) a extraverze (zaměření osobnosti na svět vnější předměty). Symboly jsou uvedeny v tabulce. 7.6.

Tabulka 7.6.

X (roky) Y (krát) Z (krát) X (roky) Y (krát) Z (krát)
Funkce 1 Funkce 2 uzavřenost Extraverze
Sportovní hry A b
Gymnastika S d

Je zřejmé, že čísla, která zde máme k dispozici, mohou být pouze distribuční frekvence. V tomto případě počítejte asociační koeficient (jiné jméno " kontingenční koeficient "). Zvažte nejjednodušší případ: vztah mezi dvěma páry znaků, přičemž se nazývá vypočítaný koeficient kontingence tetrachorický (viz tabulka).

Tabulka 7.7.

a = 20 b = 15 A + b = 35
c = 15 d=5 C + d = 20
A + C = 35 b + d = 20 n = 55

Provádíme výpočty podle vzorce:

ad-bc 100-225-123

Výpočet asociačních koeficientů (konjugačních koeficientů) s větším počtem znaků je spojen s výpočty pomocí podobné matice odpovídajícího řádu.

Při studiu různých socioekonomických jevů se rozlišuje funkční souvislost a stochastická závislost. Funkční vztah je typ vztahu, ve kterém daná hodnota faktorového ukazatele odpovídá pouze jedné hodnotě efektivního ukazatele. Funkční vztah se projevuje ve všech případech studie a pro každou konkrétní jednotku analyzované populace.

Zveřejněno na www.site

V případě, kdy kauzální závislost nepůsobí v každém konkrétním případě, ale obecně pro celou sledovanou populaci, průměr za významný počet pozorování, pak je taková závislost stochastická. Speciálním případem stochastické závislosti je korelace, ve které je změna průměrné hodnoty efektivního ukazatele způsobena změnou hodnot faktorových ukazatelů. Výpočet míry blízkosti a směru komunikace je významným úkolem výzkumu a kvantifikace vztah různých socioekonomických jevů. Určení míry těsnosti vztahu mezi různými ukazateli vyžaduje stanovení úrovně poměru změny výsledného znaménka od změny jednoho (v případě studia párových závislostí) nebo variace několika (v případě studia více závislostí) znakové faktory. K určení této úrovně se používá korelační koeficient.

Lineární korelační koeficient byl poprvé zaveden na počátku 90. let. 19. století Pearson a ukazuje míru těsnosti a směr vztahu mezi dvěma korelovanými faktory v případě, že mezi nimi existuje lineární vztah. Při interpretaci získané hodnoty lineárního korelačního koeficientu se míra blízkosti vztahu mezi znaménky hodnotí na Chaddockově škále, jedna z možností této škály je uvedena v tabulce níže:

Chaddockova škála pro kvantitativní hodnocení míry blízkosti komunikace

Hodnota ukazatele blízkosti komunikace

Povaha vztahu

Prakticky chybí

Mírný

Při interpretaci hodnoty koeficientu lineární korelace ve směru komunikace se rozlišují přímé a inverzní. V případě přímé souvislosti se zvýšením nebo snížením hodnoty faktoru atributu dochází ke zvýšení nebo snížení ukazatelů efektivního atributu, tzn. faktor a výsledek se mění stejným směrem. Například zvýšení výše zisku přispívá k růstu ukazatelů ziskovosti. Za přítomnosti zpětné vazby se hodnoty výsledného atributu mění pod vlivem atributu faktoru, ale v opačném směru než dynamika atributu faktoru. Například s růstem produktivity práce klesají jednotkové náklady na výkon atp.