Europos Komisija yra šios struktūros dalis. Europos Komisija. Reikia pagalbos dėl temos

Dieta ir fitnesas

Šiandienos straipsnyje kalbėsime apie tai, kaip kintamieji gali būti susiję vienas su kitu. Koreliacijos pagalba galėsime nustatyti, ar yra ryšys tarp pirmojo ir antrojo kintamųjų. Tikiuosi, kad ši pamoka bus tokia pat įdomi kaip ir ankstesnės!

Koreliacija matuoja ryšio tarp x ir y stiprumą ir kryptį. Paveiksle pavaizduoti skirtingi koreliacijos tipai, kaip išdėstytų porų (x, y) sklaidos diagramos. Tradiciškai x yra horizontalioje ašyje, o y – vertikalioje.

Grafikas A yra teigiamos tiesinės koreliacijos pavyzdys: x didėjant, y taip pat didėja ir tiesiškai. B diagrama rodo neigiamos tiesinės koreliacijos pavyzdį, kai x didėjant, y tiesiškai mažėja. Grafike C nematome koreliacijos tarp x ir y. Šie kintamieji niekaip neveikia vienas kito.

Galiausiai, diagrama D yra netiesinių ryšių tarp kintamųjų pavyzdys. Kai x didėja, y pirmiausia mažėja, tada keičia kryptį ir didėja.

Likusi straipsnio dalis skirta tiesiniams priklausomų ir nepriklausomų kintamųjų ryšiams.

Koreliacijos koeficientas

Koreliacijos koeficientas r suteikia mums ryšio tarp nepriklausomų ir priklausomų kintamųjų stiprumą ir kryptį. R reikšmės yra nuo -1,0 iki +1,0. Kai r turi teigiama vertė, ryšys tarp x ir y yra teigiamas (brėžinys A paveiksle), o kai r reikšmė yra neigiama, ryšys taip pat yra neigiamas (brėžinys B). Koreliacijos koeficientas, artimas nuliui, rodo, kad tarp x ir y nėra grafiko C.

Ryšio tarp x ir y stiprumas nustatomas pagal koreliacijos koeficiento artumą - 1,0 arba + - 1,0. Išstudijuokite toliau pateiktą paveikslą.

A diagrama rodo tobulą teigiamą koreliaciją tarp x ir y, kai r = + 1,0. B diagrama yra tobula neigiama koreliacija tarp x ir y, kai r = -1,0. C ir D grafikai yra silpnesnių priklausomų ir nepriklausomų kintamųjų ryšių pavyzdžiai.

Koreliacijos koeficientas, r, lemia priklausomo ir nepriklausomo kintamųjų ryšio stiprumą ir kryptį. r reikšmės svyruoja nuo -1,0 (stipri neigiama asociacija) iki +1,0 (stipri teigiama asociacija). Jei r = 0, nėra ryšio tarp x ir y.

Faktinį koreliacijos koeficientą galime apskaičiuoti naudodami šią lygtį:

Na gerai! Žinau, kad ši lygtis atrodo kaip baisus neaiškių simbolių kratinys, bet kol nepanikuojame, pritaikykime jai egzamino pažymio pavyzdį. Tarkime, noriu nustatyti, ar yra ryšys tarp valandų, kurias studentas praleidžia studijuodamas statistiką, ir baigiamojo egzamino pažymio. Toliau pateikta lentelė padės mums suskaidyti šią lygtį į kelis paprastus skaičiavimus ir padaryti juos lengviau valdomus.

Kaip matote, tarp valandų, praleistų studijuojant dalyką, ir egzamino pažymio yra labai stipri teigiama koreliacija. Mokytojams bus labai malonu apie tai sužinoti.

Kokia nauda nustatant ryšį tarp panašių kintamųjų? Puikus klausimas. Jei nustatomas ryšys, galime numatyti egzaminų balus pagal tam tikrą valandų skaičių, praleistų studijuojant dalyką. Paprasčiau tariant, kuo stipresni santykiai, tuo tikslesnės bus mūsų prognozės.

„Excel“ naudojimas koreliacijos koeficientams apskaičiuoti

Esu tikras, kad pažvelgę į šiuos siaubingus koreliacijos koeficientų skaičiavimus patirsite tikrą džiaugsmą sužinoję, kad „Excel“ gali atlikti visą šį darbą už jus naudodama CORREL funkciją, pasižyminčią šiomis savybėmis:

CORREL(masyvas 1; masyvas 2),

1 masyvas = pirmojo kintamojo duomenų diapazonas,

masyvas 2 = antrojo kintamojo duomenų diapazonas.

Pavyzdžiui, paveikslėlyje parodyta funkcija CORREL, naudojama skaičiuojant koreliacijos koeficientą egzamino pažymio pavyzdžiui.

4 skyriuje apžvelgėme pagrindinę vienmatę aprašomąją statistiką – centrinės tendencijos ir kintamumo matus – kurie naudojami vienam kintamajam apibūdinti. Šiame skyriuje apžvelgsime pagrindinius koreliacijos koeficientus.

Koreliacijos koeficientas- dvimatė aprašomoji statistika, kiekybinis dviejų kintamųjų ryšio (jungtinio kintamumo) matas.

Koreliacijos koeficientų kūrimo ir taikymo santykių tyrimui istorija faktiškai prasidėjo tuo pat metu, kai atsirado matuojamasis požiūris į individualių skirtumų tyrimą – 1870-1880 m. Žmogaus gebėjimų matavimo pradininkas, taip pat paties termino „koreliacijos koeficientas“ autorius buvo Francisas Galtonas, o populiariausius koreliacijos koeficientus sukūrė jo pasekėjas Karlas Pearsonas. Nuo tada santykių tyrimas naudojant koreliacijos koeficientus yra viena populiariausių psichologijos veiklų.

Iki šiol buvo sukurta labai daug įvairių koreliacijos koeficientų, šimtai knygų yra skirta santykių matavimo jų pagalba problemai. Todėl, nepretenduodami į išsamumą, nagrinėsime tik svarbiausias, tikrai nepakeičiamas ryšio priemones - /--Pearson, r-Spearman ir m-Kendall. Juos bendras bruožas yra tai, kad jie atspindi dviejų požymių, išmatuotų kiekybine skale – rango arba metrikos – ryšį.

Paprastai kalbant, bet koks empirinis tyrimas daugiausia dėmesio skiria dviejų ar daugiau kintamųjų santykių tyrimui.

PAVYZDŽIAI

Pateiksime du pavyzdžius, kaip tirti smurto scenų demonstravimo televizijoje įtaką paauglių agresyvumui. 1. Tiriamas dviejų kintamųjų, matuojamų kiekybine (rangos arba metrine) skale, ryšys: 1) „televizijos programų žiūrėjimo su smurtu laikas“; 2) „agresyvumas“.

Skaito kaip Tau-Kendall.

6 SKYRIUS. KORELIACIJOS KOEFICIENTAI

2. Tiriame 2 ir daugiau paauglių grupių agresyvumo skirtumą, besiskiriantį televizijos laidų su smurto scenų demonstravimu žiūrėjimo trukme.

Antrajame pavyzdyje skirtumų tyrimą galima pavaizduoti kaip ryšį tarp 2 kintamųjų, iš kurių vienas yra vardinis (TV žiūrėjimo trukmė). Ir šiai situacijai taip pat buvo sukurti savo koreliacijos koeficientai.

Bet koks tyrimas gali būti sumažintas iki koreliacijų tyrimo, nes beveik bet kokiai tyrimo situacijai buvo išrasta daugybė koreliacijos koeficientų. Tačiau toliau skirsime dvi problemų klases:

P koreliacijų tyrimas - kai du kintamieji pateikiami skaitine skale;

□ skirtumų tyrimas - kai bent vienas iš dviejų kintamųjų pateikiamas vardininko skalėje.

Šis skirstymas taip pat atitinka populiarių kompiuterinių statistinių programų kūrimo logiką, kurioje meniu Koreliacijos siūlomi trys koeficientai (/--Pearson, r-Spearman ir x-Kendall), o kitoms tyrimo problemoms spręsti siūlomi grupių palyginimo metodai.

KORELIACIJOS SAMPRATA

Ryšiai matematikos kalba dažniausiai aprašomi naudojant funkcijas, kurios grafiškai atvaizduojamos kaip linijos. Ant pav. 6.1 pavaizduoti keli funkcijų grafikai. Jei vieno kintamojo pakeitimas vienu vienetu visada lemia kito kintamojo pasikeitimą tokiu pat dydžiu, funkcija yra linijinis(jos grafikas yra tiesi linija); bet koks kitas ryšys nelinijinis. Jei vieno kintamojo padidėjimas yra susijęs su kito padidėjimu, tada ryšys yra teigiamas (tiesus); Jei vieno kintamojo padidėjimas yra susijęs su kito sumažėjimu, tada ryšys yra neigiamas (atvirkščias). Jei vieno kintamojo kitimo kryptis nesikeičia didėjant (mažėjant) kitam kintamajam, tai tokia funkcija yra monotoniškas; kitu atveju funkcija vadinama nemonotoniškas.

funkcinės jungtys, panašus į parodytus pav. 6.1 yra idealizacija. Jų ypatumas slypi tame, kad viena vieno kintamojo reikšmė atitinka griežtai apibrėžtą kito kintamojo reikšmę. Pavyzdžiui, toks yra dviejų fizinių kintamųjų – svorio ir kūno ilgio – ryšys (tiesiškai teigiamas). Tačiau net ir atliekant fizikinius eksperimentus, empirinis ryšys skirsis nuo funkcinio ryšio dėl nenumatytų ar nežinomų priežasčių: medžiagos sudėties svyravimų, matavimo paklaidų ir pan.

Ryžiai. 6.1. Dažnai pasitaikančių funkcijų grafikų pavyzdžiai

Psichologijoje, kaip ir daugelyje kitų mokslų, tyrinėdamas ženklų ryšį, tyrėjas neišvengiamai praranda daugybę galimų šių ženklų kintamumo priežasčių. Rezultatas toks, kad net realybėje egzistuojantis funkcinis ryšys tarp kintamųjų empiriškai atrodo kaip tikimybinis (stochastinis): ta pati vieno kintamojo reikšmė atitinka kito kintamojo skirtingų reikšmių pasiskirstymą (ir atvirkščiai). Paprasčiausias pavyzdys – žmonių ūgio ir svorio santykis. Empiriniai šių dviejų ženklų tyrimo rezultatai, žinoma, parodys jų teigiamą ryšį. Bet nesunku atspėti, kad ji skirsis nuo griežtos, tiesinės, pozityvios – idealios matematinės funkcijos, net ir su visais tyrinėtojo gudrybėmis atsižvelgti į tiriamųjų harmoniją ar pilnatvę. (Mažai tikėtina, kad šiuo pagrindu kam nors kiltų mintis neigti griežto funkcinio ryšio tarp kūno ilgio ir svorio egzistavimą.)

Taigi psichologijoje, kaip ir daugelyje kitų mokslų, funkcinis reiškinių ryšys gali būti empiriškai atskleistas tik kaip tikimybinis atitinkamų požymių ryšys. Vaizdinis tikimybinio ryšio pobūdžio vaizdas sklaidos diagrama - grafikas, kurio ašys atitinka dviejų kintamųjų reikšmes, o kiekvienas subjektas yra taškas (6.2 pav.). Koreliacijos koeficientai naudojami kaip tikimybinio ryšio skaitinė charakteristika.

2018-06-06 16 235 0 Igoris

Psichologija ir visuomenė

Viskas pasaulyje yra tarpusavyje susiję. Kiekvienas žmogus intuicijos lygmenyje bando rasti ryšį tarp reiškinių, kad galėtų juos paveikti ir kontroliuoti. Sąvoka, atspindinti šį ryšį, vadinama koreliacija. Ką tai reiškia paprastais žodžiais?

Turinys:

Koreliacijos samprata

Koreliacija (iš lotynų "correlatio" - santykis, santykis)- matematinis terminas, reiškiantis statistinės tikimybinės priklausomybės tarp atsitiktinių dydžių (kintamųjų) matą.

Pavyzdys: Paimkime dviejų tipų santykius:

Pirmas- rašiklis žmogaus rankoje. Kuria kryptimi juda ranka, ta kryptimi juda rašiklis. Jei ranka yra ramybės būsenoje, rašiklis nerašys. Jei žmogus šiek tiek stipriau jį paspaus, tada ženklas popieriuje bus turtingesnis. Šio tipo santykiai atspindi griežtą priklausomybę ir nėra koreliacija. Šis ryšys yra funkcionalus.
Antras vaizdas- asmens išsilavinimo lygio ir literatūros skaitymo santykis. Iš anksto nežinoma, kuris iš žmonių skaito daugiau: Aukštasis išsilavinimas arba be jo. Šis ryšys yra atsitiktinis arba stochastinis, jį tiria statistikos mokslas, nagrinėjantis tik masinius reiškinius. Jei statistinis skaičiavimas leidžia įrodyti išsilavinimo lygio ir literatūros skaitymo koreliaciją, tai leis daryti bet kokias prognozes, numatyti tikimybinį įvykių įvykį. Šiame pavyzdyje su didele tikimybe galima teigti, kad aukštąjį išsilavinimą turintys žmonės, labiau išsilavinę žmonės skaito daugiau knygų. Tačiau kadangi ryšys tarp šių parametrų nėra funkcionalus, galime padaryti klaidą. Visada galima apskaičiuoti tokios paklaidos tikimybę, kuri bus vienareikšmiškai maža ir vadinama statistinio reikšmingumo lygiu (p).

Santykių tarp natūralus fenomenas yra: maisto grandinė gamtoje, žmogaus kūnas, susidedantis iš organų sistemų, tarpusavyje susijusių ir veikiančių kaip visuma.

Kiekvieną dieną mes susiduriame su koreliacija Kasdienybė: tarp orų ir gera nuotaika, teisingas tikslų formulavimas ir jų pasiekimas, teigiamas požiūris ir sėkmė, laimės jausmas ir finansinė gerovė. Bet mes ieškome sąsajų, pagrįstų ne matematiniais skaičiavimais, o mitais, intuicija, prietarais, dykomis spėlionėmis. Šiuos reiškinius labai sunku išversti į matematinę kalbą, išreikšti skaičiais, išmatuoti. Kitas dalykas, kai analizuojame reiškinius, kuriuos galima apskaičiuoti ir pateikti skaičių pavidalu. Šiuo atveju koreliaciją galime nustatyti naudodami koreliacijos koeficientą (r), kuris atspindi atsitiktinių dydžių koreliacijos stiprumą, laipsnį, artumą ir kryptį.

Stipri koreliacija tarp atsitiktinių dydžių- įrodymai, kad tarp šių reiškinių egzistuoja tam tikras statistinis ryšys, tačiau šis ryšys negali būti perkeltas į tuos pačius reiškinius, bet skirtinga situacija. Dažnai mokslininkai, savo skaičiavimuose gavę reikšmingą koreliaciją tarp dviejų kintamųjų, remdamiesi koreliacinės analizės paprastumu, daro klaidingas intuityvias prielaidas apie priežastinių ryšių tarp požymių egzistavimą, pamiršdami, kad koreliacijos koeficientas yra tikimybinis.

Pavyzdys:žmonių, sužalotų ledo sąlygomis, ir eismo įvykių tarp transporto priemonių skaičių. Šie kiekiai koreliuos vienas su kitu, nors jie visiškai nesusiję vienas su kitu, o turi ryšį tik su bendra priežastisšie atsitiktiniai įvykiai- ledinis. Jei analizė neatskleidė koreliacinio ryšio tarp reiškinių, tai dar nėra įrodymas, kad tarp jų nėra ryšio, kuris gali būti sudėtingas netiesinis, neatskleistas koreliacijos skaičiavimais.

Pirmieji koreliacijos sąvoką į mokslinę apyvartą įvedė prancūzai paleontologas Georgesas Cuvier. XVIII amžiuje jis išvedė gyvų organizmų dalių ir organų koreliacijos dėsnį, kurio dėka iš rastų kūno dalių (palaikų) atsirado galimybė atkurti viso fosilinio padaro, gyvūno, išvaizdą. Statistikoje koreliacijos terminą 1886 m. pirmą kartą pavartojo anglų mokslininkas Pranciškus Galtonas. Bet jis negalėjo gauti tikslios koreliacijos koeficiento apskaičiavimo formulės, tačiau jo mokinys tai padarė - žinomas matematikas ir biologas Karlas Pearsonas.

Koreliacijos tipai

Pagal svarbą- labai reikšmingas, reikšmingas ir nereikšmingas.

Rūšys	kas yra r
labai reikšmingas	r atitinka statistinio reikšmingumo lygį p<=0,01
reikšmingas	r atitikmenys p<=0,05
nereikšmingas	r nesiekia p>0,1

neigiamas(vieno kintamojo vertės sumažėjimas lemia kito lygio padidėjimą: kuo daugiau fobijų žmogus turi, tuo mažesnė tikimybė, kad jis užimtų lyderio poziciją) ir teigiamas (jei vienos vertės padidėjimas padidina kito lygis: kuo labiau nervinatės, tuo didesnė tikimybė susirgti). Jei tarp kintamųjų nėra ryšio, tada tokia koreliacija vadinama nuliu.

Linijinis(kai vienai reikšmei didėja arba mažėja, antroji taip pat didėja arba mažėja) ir netiesinė (kai, pasikeitus vienai reikšmei, antrosios pokyčio pobūdžio negalima apibūdinti naudojant tiesinę priklausomybę, tada taikomi kiti matematiniai dėsniai - polinominė, hiperbolinė priklausomybė).

Pagal jėgą.

Šansai

Priklausomai nuo to, kokiai skalei priklauso tiriamieji kintamieji, apskaičiuojami įvairių tipų koreliacijos koeficientai:

Pirsono koreliacijos koeficientas, porinės tiesinės koreliacijos koeficientas arba sandaugos momentų koreliacija skaičiuojama kintamiesiems su intervalų ir kiekybinių matavimų skalėmis.
Spearmano arba Kendallo rango koreliacijos koeficientas – kai bent viena iš reikšmių turi eilės skalę arba nėra normaliai pasiskirstyta.
Taškinis dviejų eilučių koreliacijos koeficientas (Fechnerio ženklo koreliacijos koeficientas) - jei viena iš dviejų verčių yra dvilypė.
Keturių laukų koreliacijos koeficientas (kelių rangų koreliacijos (atitikties) koeficientas – jei du kintamieji yra dichotomiški.

Pearsono koeficientas reiškia parametrinius koreliacijos rodiklius, o visi kiti - neparametrinius.

Koreliacijos koeficiento reikšmė yra intervale nuo -1 iki +1. Esant visiškai teigiamai koreliacijai, r = +1, esant visiškai neigiamai koreliacijai, r = -1.

Formulė ir skaičiavimas

Pavyzdžiai

Būtina nustatyti ryšį tarp dviejų kintamųjų: mokinių intelektinio išsivystymo lygio (pagal testavimo rezultatus) ir vėlavimų skaičiaus per mėnesį (pagal įrašus ugdymo žurnale).

Pradiniai duomenys pateikti lentelėje:

№	IQ duomenys (x)	Duomenys apie vėluojančių atvykimų skaičių (y)










Suma	1122
Vidutinis	112,2

Norint teisingai interpretuoti gautą rodiklį, būtina išanalizuoti koreliacijos koeficiento ženklą (+ arba -) ir jo absoliučią reikšmę (modulo).

Remiantis koreliacijos koeficiento pagal stiprumą klasifikavimo lentele, darome išvadą, kad rxy = -0,827 yra stipri neigiama koreliacija. Taigi vėluojančių moksleivių skaičius labai stipriai priklauso nuo jų intelektinio išsivystymo lygio. Galime sakyti, kad aukšto IQ mokiniai rečiau vėluoja į pamokas nei žemo IQ studentai.

Koreliacijos koeficientą gali naudoti tiek mokslininkai, norėdami patvirtinti arba paneigti prielaidą apie dviejų dydžių ar reiškinių priklausomybę bei išmatuoti jos stiprumą, reikšmingumą, tiek studentai, atlikdami įvairių dalykų empirinius ir statistinius tyrimus. Reikia atsiminti, kad šis rodiklis nėra idealus įrankis, jis skaičiuojamas tik tiesinio ryšio stiprumui matuoti ir visada bus tikimybinė reikšmė, turinti tam tikrą paklaidą.

Koreliacinė analizė taikoma šiose srityse:

ekonomikos mokslas;
astrofizika;
socialiniai mokslai (sociologija, psichologija, pedagogika);
agrochemija;
metalo mokslas;
pramonė (kokybės kontrolei);
hidrobiologija;
biometriniai duomenys ir kt.

Koreliacinės analizės metodo populiarumo priežastys:

Santykinis koreliacijos koeficientų skaičiavimo paprastumas nereikalauja specialaus matematinio išsilavinimo.
Leidžia apskaičiuoti ryšį tarp masinių atsitiktinių dydžių, kurie yra statistikos mokslo analizės objektas. Šiuo atžvilgiu šis metodas tapo plačiai paplitęs statistinių tyrimų srityje.

Tikimės, kad dabar sugebėsite atskirti funkcinį ryšį nuo koreliacinio ir žinosite, kad išgirdę per televiziją ar skaitydami spaudoje apie koreliaciją, tai reiškia teigiamą ir gana reikšmingą ryšį tarp dviejų reiškinių.

Atliekant mokslinius tyrimus, dažnai reikia rasti ryšį tarp rezultato ir faktoriaus kintamųjų (derliaus derliaus ir kritulių kiekio, žmogaus ūgio ir svorio homogeninėse grupėse pagal lytį ir amžių, pulso dažnį ir kūno temperatūrą). ir kt.).

Antrasis yra ženklai, kurie prisideda prie su jais susijusių asmenų pasikeitimo (pirmasis).

Koreliacinės analizės samprata

Yra aibė Remiantis tuo, kas išdėstyta aukščiau, galima teigti, kad koreliacinė analizė yra metodas, naudojamas dviejų ar daugiau kintamųjų statistinio reikšmingumo hipotezei patikrinti, jei tyrėjas gali juos išmatuoti, bet ne pakeisti.

Yra ir kitų nagrinėjamos sąvokos apibrėžimų. Koreliacinė analizė yra apdorojimo metodas, kuris tiria koreliacijos koeficientus tarp kintamųjų. Šiuo atveju koreliacijos koeficientai tarp vienos poros ar kelių požymių porų yra lyginami, siekiant nustatyti statistinius ryšius tarp jų. Koreliacinė analizė – tai metodas, skirtas tirti statistinę priklausomybę tarp atsitiktinių dydžių, turinčių griežtą funkcinį pobūdį, kai vieno atsitiktinio dydžio dinamika lemia kito matematinio lūkesčio dinamiką.

Klaidingos koreliacijos samprata

Atliekant koreliacinę analizę, reikia atsižvelgti į tai, kad ji gali būti atliekama atsižvelgiant į bet kokį požymių rinkinį, dažnai absurdišką vienas kito atžvilgiu. Kartais jie neturi priežastinio ryšio vienas su kitu.

Šiuo atveju kalbama apie netikrą koreliaciją.

Koreliacinės analizės problemos

Remdamiesi aukščiau pateiktais apibrėžimais, galime suformuluoti tokius aprašyto metodo uždavinius: gauti informaciją apie vieną iš norimų kintamųjų naudojant kitą; nustatyti ryšio tarp tiriamų kintamųjų glaudumą.

Koreliacinė analizė apima ryšio tarp tiriamų požymių nustatymą, todėl koreliacinės analizės uždaviniai gali būti papildyti šiais dalykais:

veiksnių, turinčių didžiausią įtaką gaunamam ženklui, nustatymas;
anksčiau netyrinėtų santykių priežasčių nustatymas;
koreliacijos modelio sukūrimas su jo parametrine analize;
ryšio parametrų reikšmės tyrimas ir jų intervalų įvertinimas.

Koreliacinės analizės ryšys su regresija

Koreliacinės analizės metodas dažnai neapsiriboja tirtų dydžių ryšio glaudumo nustatymu. Kartais ją papildo regresijos lygčių, gautų taikant to paties pavadinimo analizę, sudarymas, kurios yra gautos ir faktorinės (faktorinės) požymio (-ių) koreliacijos aprašymas. Šis metodas kartu su nagrinėjama analize yra metodas

Metodo naudojimo sąlygos

Rezultato veiksniai priklauso nuo vieno ar kelių veiksnių. Koreliacinės analizės metodas gali būti naudojamas, jei yra daug stebėjimų dėl efektyvių ir faktorinių rodiklių (veiksnių) reikšmės, o tiriami veiksniai turėtų būti kiekybiniai ir atspindėti konkrečiuose šaltiniuose. Pirmąjį galima nustatyti pagal įprastą dėsnį – šiuo atveju Pirsono koreliacijos koeficientai yra koreliacinės analizės rezultatas arba, jei ženklai nepaklūsta šiam dėsniui, naudojamas Spearman rango koreliacijos koeficientas.

Koreliacinės analizės veiksnių parinkimo taisyklės

Taikant šį metodą, būtina nustatyti veiksnius, turinčius įtakos veiklos rodikliams. Jie parenkami atsižvelgiant į tai, kad tarp rodiklių turi būti priežastiniai ryšiai. Kuriant daugiafaktorinį koreliacijos modelį pasirenkami tie, kurie turi reikšmingos įtakos gautam rodikliui, o į koreliacijos modelį pageidautina neįtraukti tarpusavyje priklausomų veiksnių, kurių poros koreliacijos koeficientas didesnis nei 0,85, taip pat kuriems ryšys su gaunamu parametru yra netiesioginis.arba funkcinis.

Rezultatų rodymas

Koreliacinės analizės rezultatai gali būti pateikti tekstiniu ir grafiniu pavidalu. Pirmuoju atveju jie pateikiami kaip koreliacijos koeficientas, antruoju – kaip sklaidos diagrama.

Jei tarp parametrų nėra koreliacijos, taškai diagramoje išsidėstę atsitiktinai, vidutiniam ryšio laipsniui būdingas didesnis tvarkos laipsnis ir būdingas daugmaž vienodas pažymėtų ženklų atstumas nuo medianos. Stiprus ryšys linkęs į tiesią liniją, o esant r = 1 sklaidos grafikas yra plokščia linija. Atvirkščiai koreliacijai būdinga grafiko kryptis iš viršutinės kairės į apatinę dešinę, tiesioginė - iš apatinio kairiojo į viršutinį dešinįjį kampą.

3D sklaidos diagramos vaizdavimas (sklaidymas)

Be tradicinio 2D sklaidos diagramos pateikimo, šiuo metu naudojamas 3D grafinis koreliacinės analizės vaizdas.

Taip pat naudojama taškinės diagramos matrica, kuri rodo visus suporuotus brėžinius vienoje figūroje matricos formatu. n kintamųjų matricoje yra n eilučių ir n stulpelių. Diagrama, esanti i-osios eilutės ir j-ojo stulpelio sankirtoje, yra kintamųjų Xi, palyginti su Xj, grafikas. Taigi kiekviena eilutė ir stulpelis yra vienas matmuo, viename langelyje rodoma dviejų matmenų sklaidos diagrama.

Jungties sandarumo įvertinimas

Koreliacijos sandarumą lemia koreliacijos koeficientas (r): stiprus - r = ±0,7 iki ±1, vidutinis - r = ±0,3 iki ±0,699, silpnas - r = 0 iki ±0,299. Ši klasifikacija nėra griežta. Paveikslėlyje parodyta šiek tiek kitokia schema.

Koreliacinės analizės metodo taikymo pavyzdys

JK buvo atliktas įdomus tyrimas. Jis skirtas rūkymo ryšiui su plaučių vėžiu ir buvo atliktas koreliacijos analize. Šis pastebėjimas pateikiamas žemiau.

Pradiniai koreliacinės analizės duomenys

Profesionalų grupė		mirtingumas
Ūkininkai, miškininkai ir žvejai
Kalnakasiai ir karjerų darbuotojai
Dujų, kokso ir cheminių medžiagų gamintojai
Stiklo ir keramikos gamintojai
Krosnių, kalvių, liejyklų ir valcavimo staklių darbuotojai
Elektros ir elektronikos darbuotojai
Inžinerija ir susijusios profesijos
Medienos apdirbimo gamyba
Odininkai
Tekstilininkai
Darbo drabužių gamintojai
Maisto, gėrimų ir tabako pramonės darbuotojai
Popieriaus ir spaudos gamintojai
Kitų produktų gamintojai
Statybininkai
Menininkai ir dekoratoriai
Stacionarių variklių, kranų vairuotojai ir kt.
Kitur neįtraukti darbuotojai
Transporto ir ryšių darbuotojai
Sandėlio darbuotojai, sandėlininkai, pakuotojai ir pildymo mašinų darbuotojai
ofiso darbuotojai
Pardavėjai
Sporto ir poilsio paslaugų darbuotojai
Administratoriai ir vadovai
Profesionalai, technikai ir menininkai

Pradedame koreliacijos analizę. Sprendimą aiškumo dėlei geriau pradėti nuo grafinio metodo, kuriam sukursime sklaidos (sklaidos) diagramą.

Ji rodo tiesioginį ryšį. Tačiau remiantis vien grafiniu metodu vienareikšmę išvadą padaryti sunku. Todėl ir toliau atliksime koreliacinę analizę. Koreliacijos koeficiento apskaičiavimo pavyzdys pateiktas žemiau.

Naudodami programinius įrankius (MS Excel pavyzdžiu, tai bus aprašyta toliau), nustatome koreliacijos koeficientą, kuris yra 0,716, o tai reiškia stiprų ryšį tarp tiriamų parametrų. Nustatykime gautos reikšmės statistinį reikšmingumą pagal atitinkamą lentelę, kuriai iš 25 reikšmių porų reikia atimti 2, rezultatas gauname 23 ir šiai lentelės eilutei randame r kritinį, kai p = 0,01 (kadangi tai medicininiai duomenys, tai griežtesnė priklausomybė, kitais atvejais pakanka p=0,05), tai šiai koreliacinei analizei yra 0,51. Pavyzdys parodė, kad apskaičiuotas r yra didesnis už kritinį r, koreliacijos koeficiento reikšmė laikoma statistiškai reikšminga.

Programinės įrangos naudojimas koreliacinėje analizėje

Aprašytas statistinių duomenų apdorojimo tipas gali būti atliekamas naudojant programinę įrangą, ypač MS Excel. Koreliacija apima šių parametrų apskaičiavimą naudojant funkcijas:

1. Koreliacijos koeficientas nustatomas naudojant CORREL funkciją (masyvas1; masyvas2). Masyvas1,2 yra gautų ir faktorių kintamųjų verčių diapazono langelis.

Linijinės koreliacijos koeficientas taip pat vadinamas Pearsono koreliacijos koeficientu, todėl, pradedant nuo Excel 2007, galite naudoti funkciją su tais pačiais masyvais.

Grafinis koreliacijos analizės atvaizdavimas programoje „Excel“ atliekamas naudojant skydelį „Charts“ su pasirinkimu „Scatter Plot“.

Nurodžius pradinius duomenis, gauname grafiką.

2. Poros koreliacijos koeficiento reikšmingumo įvertinimas Stjudento t-testu. Apskaičiuota t kriterijaus vertė palyginama su lentelės (kritine) šio rodiklio verte iš atitinkamos nagrinėjamo parametro verčių lentelės, atsižvelgiant į nurodytą reikšmingumo lygį ir laisvės laipsnių skaičių. Šis įvertinimas atliktas naudojant funkciją STUDIV(tikimybė; laisvės_laipsniai).

3. Porų koreliacijos koeficientų matrica. Analizė atliekama naudojant „Duomenų analizės“ įrankį, kuriame pasirenkama „Koreliacija“. Statistinis porų koreliacijos koeficientų įvertinimas atliekamas lyginant jo absoliučią vertę su lentelės (kritine) reikšme. Kai apskaičiuotas poros koreliacijos koeficientas viršija tą kritinį, galime sakyti, atsižvelgiant į nurodytą tikimybės laipsnį, kad nulinė hipotezė apie tiesinio ryšio reikšmingumą nėra atmesta.

Pagaliau

Koreliacinės analizės metodo naudojimas moksliniuose tyrimuose leidžia nustatyti ryšį tarp įvairių veiksnių ir veiklos rodiklių. Tuo pačiu metu reikia atsižvelgti į tai, kad aukštą koreliacijos koeficientą galima gauti ir iš absurdiškos duomenų poros ar rinkinio, todėl tokio tipo analizė turi būti atliekama pakankamai dideliame duomenų masyve.

Gavus apskaičiuotą r reikšmę, pageidautina palyginti ją su r kritiniu, kad būtų patvirtintas tam tikros reikšmės statistinis reikšmingumas. Koreliacinė analizė gali būti atliekama rankiniu būdu naudojant formules arba naudojant programinės įrangos įrankius, ypač MS Excel. Čia taip pat galite sukurti sklaidos (sklaidos) diagramą, kad būtų galima vizualiai pavaizduoti ryšį tarp tiriamų koreliacinės analizės veiksnių ir gautos savybės.

Studijuojant koreliacijos pabandykite nustatyti, ar yra koks nors ryšys tarp dviejų tos pačios imties rodiklių (pavyzdžiui, tarp vaikų ūgio ir svorio arba tarp lygio IQ ir mokyklos rezultatai) arba tarp dviejų skirtingų imčių (pavyzdžiui, lyginant dvynių poras), ir jei toks ryšys egzistuoja, ar vieno rodiklio padidėjimą lydi rodiklio padidėjimas (teigiama koreliacija), ar sumažėjimas (neigiama koreliacija). kitas.

Kitaip tariant, koreliacinė analizė padeda nustatyti, ar galima numatyti galimas vieno rodiklio reikšmes, žinant kito reikšmę.

Iki šiol analizuodami savo patirtį tiriant marihuanos poveikį, sąmoningai ignoravome tokį rodiklį kaip reakcijos laikas. Tuo tarpu būtų įdomu patikrinti, ar yra ryšys tarp reakcijų efektyvumo ir jų greičio. Tai leistų, pavyzdžiui, teigti, kad kuo žmogus lėtesnis, tuo tikslesni ir efektyvesni bus jo veiksmai ir atvirkščiai.

Šiuo tikslu gali būti naudojami du skirtingi metodai: parametrinis Bravaiso-Pirsono koeficiento skaičiavimo metodas. (r) ir Spearman rangų koreliacijos koeficiento apskaičiavimas (r s ), kuris taikomas eiliniams duomenims, t.y. yra neparametrinis. Tačiau pirmiausia išsiaiškinkime, kas yra koreliacijos koeficientas.

Koreliacijos koeficientas

Koreliacijos koeficientas yra vertė, kuri gali svyruoti nuo -1 iki 1. Esant visiškai teigiamai koreliacijai, šis koeficientas yra plius 1, o esant visiškam neigiamam - minus 1. Grafike tai atitinka tiesės eigą per kiekvienos poros duomenų reikšmių susikirtimo taškus:

Kintamasis

Jei šie taškai išsidėsto ne tiesia linija, o sudaro „debesį“, koreliacijos koeficiento absoliuti reikšmė tampa mažesnė už vienetą ir artėja prie nulio debesiui suapvalinus:

Jei koreliacijos koeficientas yra 0, abu kintamieji yra visiškai nepriklausomi vienas nuo kito.

Humanitariniuose moksluose koreliacija laikoma stipria, jei jos koeficientas didesnis nei 0,60; jei jis viršija 0,90, tai koreliacija laikoma labai stipri. Tačiau tam, kad būtų galima padaryti išvadas apie ryšius tarp kintamųjų, didelę reikšmę turi imties dydis: kuo didesnė imtis, tuo patikimesnė gauto koreliacijos koeficiento reikšmė. Yra lentelių su kritinėmis Bravais-Pearson ir Spearman koreliacijos koeficientų reikšmėmis skirtingam laisvės laipsnių skaičiui (tai lygu porų skaičiui atėmus 2, t.y. n-2). Tik jei koreliacijos koeficientai yra didesni už šias kritines vertes, jie gali būti laikomi patikimais. Taigi, kad koreliacijos koeficientas 0,70 būtų patikimas, į analizę reikia atsižvelgti bent 8 duomenų poras. ( = P - 2 = 6) skaičiuojant r(B.4 lentelė) ir 7 duomenų poras (= n - 2 = 5) skaičiuojant r s (B priedo 5 lentelė. 5).

Bravaiso – Pearsono koeficientas

Šiam koeficientui apskaičiuoti naudojama ši formulė (skirtingiems autoriams ji gali atrodyti skirtingai):

kur  XY yra kiekvienos poros duomenų sandaugų suma;

n - porų skaičius;

- kintamų duomenų vidurkis X;

Kintamų duomenų vidurkis Y;

S X - x;

s Y - pasiskirstymo standartinis nuokrypis y.

Dabar galime naudoti šį koeficientą norėdami nustatyti, ar yra ryšys tarp tiriamųjų reakcijos laiko ir jų veiksmų efektyvumo. Paimkite, pavyzdžiui, kontrolinės grupės fono lygį.

n= 15  15,8  13,4 = 3175,8;

(n – 1)S x S y = 14  3,07  2,29 = 98,42;

r =

Neigiama koreliacijos koeficiento reikšmė gali reikšti, kad kuo ilgesnis reakcijos laikas, tuo mažesnis efektyvumas. Tačiau jo reikšmė per maža, kad būtų galima kalbėti apie reikšmingą ryšį tarp šių dviejų kintamųjų.

nXY=………

(n- 1) S X S Y = ……

Kokią išvadą galima padaryti iš šių rezultatų? Jei manote, kad tarp kintamųjų yra ryšys, kas tai yra – tiesioginis ar atvirkštinis? Ar tai patikima [plg. skirtuką. 4 (B. 5 priede) su kritinėmis vertėmis r]?

Spearman rango koreliacijos koeficientasr s

Šį koeficientą lengviau apskaičiuoti, tačiau rezultatai yra ne tokie tikslūs nei naudojant r. Taip yra dėl to, kad skaičiuojant Spearmano koeficientą, naudojama duomenų tvarka, o ne jų kiekybinės charakteristikos ir intervalai tarp klasių.

Esmė ta, kad naudojant rango koreliacijos koeficientą Spearman(r s ) jie tik tikrina, ar tam tikros imties duomenų reitingas bus toks pat, kaip ir kitų šios imties duomenų, suporuotų su pirmuoju, eilėje (pavyzdžiui, ar mokiniai bus „reitinguojami“ vienodai, kai išlaikys psichologijos ir matematikos studijas, arba net su dviem skirtingais psichologijos profesoriais?). Jei koeficientas yra artimas + 1, tai reiškia, kad abi eilutės praktiškai sutampa, o jei šis koeficientas yra artimas - 1, galime kalbėti apie visišką atvirkštinį ryšį.

Koeficientas r s apskaičiuojamas pagal formulę

kur d- skirtumas tarp konjuguotų savybių verčių eilučių (nepriklausomai nuo jo ženklo) ir n- porų skaičius.

Paprastai šis neparametrinis testas naudojamas tais atvejais, kai reikia padaryti kai kurias išvadas ne tiek apie intervalais tarp duomenų, kiek apie juos gretas, taip pat kai pasiskirstymo kreivės yra per daug asimetrinės ir neleidžia naudoti tokių parametrinių kriterijų kaip koeficientas r(šiais atvejais gali prireikti kiekybinius duomenis konvertuoti į eilinius).

Kadangi taip yra su efektyvumo ir reakcijos laiko verčių pasiskirstymu eksperimentinėje grupėje po ekspozicijos, galite pakartoti skaičiavimus, kuriuos jau atlikote šiai grupei, tik dabar ne koeficientui. r, ir indikatoriui r s . Tai leis jums pamatyti, kuo šie du rodikliai skiriasi*.

* Reikėtų prisiminti, kad

1) pagal pataikymų skaičių 1 eilė atitinka aukščiausią, o 15 – mažiausią našumą, o pagal reakcijos laiką – 1 eilė – trumpiausią laiką, o 15 – ilgiausią;

2) ex aequo duomenims suteikiamas vidutinis rangas.

Taigi, kaip ir koeficiento atveju r, gavo teigiamą, nors ir nepatikimą rezultatą. Kuris iš dviejų rezultatų yra labiau tikėtinas: r=-0,48 arba r s = +0,24? Toks klausimas gali kilti tik tuo atveju, jei rezultatai yra patikimi.

Dar kartą noriu pabrėžti, kad šių dviejų koeficientų esmė kiek skiriasi. Neigiamas koeficientas r rodo, kad efektyvumas dažniausiai yra didesnis, tuo greitesnis reakcijos laikas, tuo tarpu skaičiuojant koeficientą r s reikėjo patikrinti, ar greitesni subjektai visada reaguoja tiksliau, o lėtesni – ne taip tiksliai.

Kadangi eksperimentinėje grupėje po ekspozicijos buvo gautas koeficientas r s , lygus 0,24, tokia tendencija čia akivaizdžiai neatsekama. Pabandykite suprasti kontrolinės grupės duomenis po poveikio patys, žinodami, kad  d 2 = 122,5:

; ar tai patikima?

Kokia jūsų išvada?…………………………………………………………………………………………………

…………………………………………………………………………………………………………………….

Taigi, mes išnagrinėjome įvairius parametrinius ir neparametrinius statistikos metodus, naudojamus psichologijoje. Mūsų apžvalga buvo labai paviršutiniška, o jos pagrindinė užduotis buvo priversti skaitytoją suprasti, kad statistika nėra tokia baisi, kaip atrodo, o dažniausiai reikalauja sveiko proto. Primename, kad „patirties“ duomenys, su kuriais čia nagrinėjome, yra fiktyvūs ir negali būti pagrindas jokioms išvadoms. Tačiau tokį eksperimentą būtų verta atlikti. Kadangi šiam eksperimentui buvo pasirinkta grynai klasikinė technika, tą pačią statistinę analizę galima naudoti daugelyje skirtingų eksperimentų. Bet kuriuo atveju mums atrodo, kad nubrėžėme keletą pagrindinių krypčių, kurios gali būti naudingos tiems, kurie nežino, nuo ko pradėti statistinę rezultatų analizę.

Yra trys pagrindinės statistikos šakos: aprašomoji statistika, indukcinė statistika ir koreliacinė analizė.