Koľko eurokomisárov je v Európskej komisii. Európska komisia. Európska komisia je hlavným výkonným orgánom Európskej únie. Aktivity Európskej komisie

Korelačný koeficient je hodnota, ktorá sa môže meniť od +1 do -1. V prípade úplnej pozitívnej korelácie sa tento koeficient rovná plus 1 (hovoria, že s nárastom hodnoty jednej premennej sa zvyšuje hodnota inej premennej) a pri úplnej negatívnej korelácii - mínus 1 (uvádzajú spätnú väzbu t.j. keď sa hodnoty jednej premennej zvýšia, hodnoty druhej sa znížia).

Príklad 1:

Graf závislosti plachosti a depresie. Ako vidíte, bodky (predmety) nie sú umiestnené náhodne, ale zoraďujú sa okolo jednej čiary a pri pohľade na túto čiaru môžeme povedať, že čím vyššia je u človeka plachosť, tým sú tieto javy depresívnejšie, t.j. sú vzájomne prepojené.

Príklad 2: Graf pre hanblivosť a spoločenskosť. Vidíme, že ako sa plachosť zvyšuje, spoločenskosť klesá. Ich korelačný koeficient je -0,43. Korelačný koeficient väčší od 0 do 1 teda označuje priamo úmerný vzťah (čím viac ... tým viac ...) a koeficient od -1 do 0 naznačuje nepriamo úmerný vzťah (čím viac ... tým menej . ..)

Ak je korelačný koeficient 0, obe premenné sú od seba úplne nezávislé.

korelácia- ide o vzťah, kde sa vplyv jednotlivých faktorov javí len ako trend (v priemere) pri hromadnom sledovaní aktuálnych údajov. Príkladom korelačnej závislosti môže byť závislosť medzi veľkosťou aktív banky a výškou zisku banky, rastom produktivity práce a dĺžkou služby zamestnancov.

Používajú sa dva systémy klasifikácie korelácií podľa ich sily: všeobecný a konkrétny.

Všeobecná klasifikácia korelácií: 1) silná alebo blízka s korelačným koeficientom r> 0,70; 2) stredná na 0,500,70, a nie len korelácia s vysokou úrovňou významnosti.

V nasledujúcej tabuľke sú uvedené názvy korelačných koeficientov pre rôzne typy škál.

Dichotomická stupnica (1/0) Poradová (ordinálna) stupnica
Dichotomická stupnica (1/0) Pearsonov asociačný koeficient, Pearsonov štvorbunkový konjugačný koeficient. Biseriálna korelácia
Poradová (ordinálna) stupnica Rank-biseriálna korelácia. Spearmanov alebo Kendallov koeficient poradovej korelácie.
Intervalová a absolútna stupnica Biseriálna korelácia Hodnoty intervalovej stupnice sa prevedú na poradia a použije sa koeficient poradia Pearsonov korelačný koeficient (lineárny korelačný koeficient)

O r=0 neexistuje lineárna korelácia. V tomto prípade sa skupinové priemery premenných zhodujú s ich všeobecnými priemermi a regresné čiary sú rovnobežné so súradnicovými osami.

Rovnosť r=0 hovorí len o absencii lineárnej korelačnej závislosti (nekorelované premenné), ale nie vo všeobecnosti o absencii korelácie a ešte viac o štatistickej závislosti.

Niekedy je záver, že neexistuje žiadna korelácia, dôležitejší ako prítomnosť silnej korelácie. Nulová korelácia dvoch premenných môže naznačovať, že neexistuje žiadny vplyv jednej premennej na druhú, za predpokladu, že výsledkom meraní dôverujeme.

V SPSS: 11.3.2 Korelačné koeficienty

Doteraz sme zisťovali len samotný fakt existencie štatistického vzťahu medzi dvoma znakmi. Ďalej sa pokúsime zistiť, aké závery možno vyvodiť o sile alebo slabosti tejto závislosti, ako aj o jej forme a smerovaní. Kritériá na kvantifikáciu vzťahu medzi premennými sa nazývajú korelačné koeficienty alebo miery konektivity. Dve premenné sú pozitívne korelované, ak medzi nimi existuje priamy, jednosmerný vzťah. V jednosmernom vzťahu malé hodnoty jednej premennej zodpovedajú malým hodnotám druhej premennej, veľké hodnoty zodpovedajú veľkým. Dve premenné sú negatívne korelované, ak medzi nimi existuje inverzný vzťah. Pri viacsmernom vzťahu zodpovedajú malé hodnoty jednej premennej veľké hodnoty iná premenná a naopak. Hodnoty korelačných koeficientov sú vždy v rozmedzí od -1 do +1.

Spearmanov koeficient sa používa ako korelačný koeficient medzi premennými patriacimi do ordinálnej stupnice a Pearsonov korelačný koeficient (moment súčinov) pre premenné patriace do intervalovej stupnice. V tomto prípade je potrebné poznamenať, že každú dichotomickú premennú, teda premennú patriacu do nominálnej stupnice a majúcu dve kategórie, možno považovať za ordinálnu.

Najprv skontrolujeme, či existuje korelácia medzi premennými pohlavia a psychiky zo súboru studium.sav. Berieme pritom do úvahy, že dichotomickú premennú pohlavie možno považovať za ordinálnu premennú. Postupujte takto:

Vyberte z príkazového menu Analyzovať (Analýza) Popisná štatistika (Popisná štatistika) Krížové tabuľky... (Kontingenčné tabuľky)

· Premennú pohlavie presuňte do zoznamu riadkov a premennú psychiku do zoznamu stĺpcov.

· Kliknite na tlačidlo Štatistika.... V dialógovom okne Krížové tabuľky: Štatistika začiarknite políčko Korelácie. Svoj výber potvrďte tlačidlom Pokračovať.

· V dialógovom okne Krížové tabuľky zastavte zobrazovanie tabuliek začiarknutím políčka Potlačiť tabuľky. Kliknite na tlačidlo OK.

Vypočítajú sa Spearmanove a Pearsonove korelačné koeficienty a otestuje sa ich význam:

/ SPSS 10

Úloha číslo 10 Korelačná analýza

Koncept korelácie

Korelačný alebo korelačný koeficient je štatistický ukazovateľ pravdepodobnostný vzťahy medzi dvoma premennými meranými na kvantitatívnych škálach. Na rozdiel od funkčného spojenia, v ktorom každá hodnota jednej premennej zodpovedá prísne definované hodnota inej premennej, pravdepodobnostné spojenie vyznačujúci sa tým, že každej hodnote jednej premennej zodpovedá súbor hodnôtĎalšia premenná, Príkladom pravdepodobnostného vzťahu je vzťah medzi výškou a hmotnosťou ľudí. Je jasné, že ľudia rôznej hmotnosti môžu mať rovnakú výšku a naopak.

Korelácia je hodnota medzi -1 a + 1 a označuje sa písmenom r. Navyše, ak je hodnota bližšia k 1, znamená to prítomnosť silného spojenia, a ak je bližšie k 0, potom slabé. Hodnota korelácie menšia ako 0,2 sa považuje za slabú koreláciu, väčšia ako 0,5 za vysokú. Ak je korelačný koeficient záporný, znamená to, že existuje inverzný vzťah: čím vyššia je hodnota jednej premennej, tým nižšia je hodnota druhej.

V závislosti od akceptovaných hodnôt koeficientu r možno rozlíšiť rôzne typy korelácie:

Silná pozitívna korelácia je určená hodnotou r=1. Výraz „prísny“ znamená, že hodnota jednej premennej je jednoznačne určená hodnotami inej premennej, a výraz „ pozitívne" -že so zvyšujúcou sa hodnotou jednej premennej rastie aj hodnota druhej premennej.

Striktná korelácia je matematickou abstrakciou a v skutočnom výskume sa takmer nikdy nevyskytuje.

pozitívna korelácia zodpovedá hodnotám 0

Nedostatok korelácie je určená hodnotou r=0. Nulový korelačný koeficient naznačuje, že hodnoty premenných spolu nijako nesúvisia.

Nedostatok korelácie H o : 0 r xy =0 formulované ako odraz nulový hypotézy v korelačnej analýze.

negatívna korelácia: -1

Silná negatívna korelácia určená hodnotou r= -1. Rovnako ako striktná pozitívna korelácia je abstrakciou a nenachádza výraz v praktickom výskume.

stôl 1

Typy korelácií a ich definície

Spôsob výpočtu korelačného koeficientu závisí od typu stupnice, na ktorej sa merajú hodnoty premennej.

Korelačný koeficient rPearson je hlavný a možno ho použiť pre premenné s nominálnymi a čiastočne usporiadanými intervalovými stupnicami, ktorých rozloženie hodnôt zodpovedá normálu (korelácia momentov súčinu). Pearsonov korelačný koeficient poskytuje pomerne presné výsledky aj v prípadoch abnormálneho rozdelenia.

Pre distribúcie, ktoré nie sú normálne, je vhodnejšie použiť Spearmanove a Kendallove koeficienty poradovej korelácie. Sú zoradené, pretože program vopred zoradí korelované premenné.

Program SPSS vypočítava r-Spearmanovu koreláciu nasledovne: najprv sa premenné prevedú na poradie a potom sa na poradia použije Pearsonov vzorec.

Korelácia navrhnutá M. Kendallom je založená na myšlienke, že smer spojenia možno posúdiť porovnaním subjektov v pároch. Ak sa u dvojice subjektov zhoduje zmena v X v smere so zmenou v Y, znamená to pozitívny vzťah. Ak sa nezhoduje, tak o negatívnom vzťahu. Tento koeficient využívajú najmä psychológovia pracujúci s malými vzorkami. Keďže sociológovia pracujú s veľkými poľami údajov, je ťažké triediť páry, identifikovať rozdiel v relatívnych frekvenciách a inverziách všetkých párov subjektov vo vzorke. Najbežnejší je koeficient. Pearson.

Keďže korelačný koeficient rPearson je hlavný a možno ho použiť (s určitou chybou v závislosti od typu škály a úrovne abnormality v distribúcii) pre všetky premenné merané na kvantitatívnych škálach, zvážime príklady jeho použitia a porovnáme výsledky získané s výsledkami meraní pomocou iných korelačných koeficientov.

Vzorec na výpočet koeficientu r- Pearson:

r xy = ∑ (Xi-Xav)∙(Yi-Yav) / (N-1)∙σ x ∙σ y ∙

Kde: Xi, Yi- Hodnoty dvoch premenných;

Xav, Yav - priemerné hodnoty dvoch premenných;

σ x , σ y sú štandardné odchýlky,

N je počet pozorovaní.

Párové korelácie

Chceli by sme napríklad zistiť, aké sú odpovede medzi rôzne druhy tradičné hodnoty v predstavách študentov o ideálnom pracovisku (premenné: a9.1, a9.3, a9.5, a9.7) a potom o pomere liberálnych hodnôt (a9.2, a9 4. a9.6, a9. osem) . Tieto premenné sa merajú na 5-členných usporiadaných škálach.

Používame postup: „Analýza“,  „Korelácie“,  „Párové“. Štandardne koeficient Pearson je nastavený v dialógovom okne. Používame koeficient Pearson

Testované premenné sa prenesú do výberového okna: a9.1, a9.3, a9.5, a9.7

Po stlačení OK dostaneme výpočet:

Korelácie

a9.1.t. Aké dôležité je mať dostatok času na rodinný a osobný život?

Pearsonova korelácia

Hodnota (obojstranná)

a9.3.t. Aké dôležité je nebáť sa straty zamestnania?

Pearsonova korelácia

Hodnota (obojstranná)

a9.5.t. Aké dôležité je mať takého šéfa, ktorý sa s vami poradí pri tom či onom rozhodnutí?

Pearsonova korelácia

Hodnota (obojstranná)

a9.7.t. Aké dôležité je pracovať dobre zohraný tím cítiš sa byť jeho súčasťou?

Pearsonova korelácia

Hodnota (obojstranná)

** Korelácia je významná na úrovni 0,01 (obojstranná).

Tabuľka kvantitatívnych hodnôt vytvorenej korelačnej matice

Čiastočné korelácie:

Najprv vytvorte párovú koreláciu medzi týmito dvoma premennými:

Korelácie

c8. Cíťte sa blízko k tým, ktorí bývajú blízko vás, susedia

Pearsonova korelácia

Hodnota (obojstranná)

c12. Cítiť blízkosť ich rodiny

Pearsonova korelácia

Hodnota (obojstranná)

**. Korelácia je významná na úrovni 0,01 (obojstranná).

Potom použijeme postup na konštrukciu parciálnej korelácie: „Analýza“,  „Korelácie“,  „Čiastočná“.

Predpokladajme, že hodnota „Je dôležité nezávisle určiť a zmeniť poradie vašej práce“ vo vzťahu k uvedeným premenným bude rozhodujúcim faktorom, pod vplyvom ktorého predtým identifikovaný vzťah zmizne alebo sa ukáže ako málo významný. .

Korelácie

Vylúčené premenné

c8. Cíťte sa blízko k tým, ktorí bývajú blízko vás, susedia

c12. Cítiť blízkosť ich rodiny

c16. Cítite blízkosť ľudí, ktorí majú rovnaké bohatstvo ako vy

c8. Cíťte sa blízko k tým, ktorí bývajú blízko vás, susedia

Korelácia

Význam (obojstranný)

c12. Cítiť blízkosť ich rodiny

Korelácia

Význam (obojstranný)

Ako vidno z tabuľky, vplyvom riadiacej premennej sa vzťah mierne znížil: z 0,120 na 0,102. zostáva dostatočne vysoká a umožňuje vyvrátiť nulovú hypotézu s nulovou chybou.

Korelačný koeficient

Najpresnejší spôsob, ako určiť tesnosť a povahu korelácie, je nájsť korelačný koeficient. Korelačný koeficient je číslo určené vzorcom:


kde r xy je korelačný koeficient;

x i -hodnoty prvého znaku;

i -hodnoty druhého znaku;

Aritmetický priemer hodnôt prvého znaku

Aritmetický priemer hodnôt druhého znaku

Aby sme použili vzorec (32), zostrojíme tabuľku, ktorá poskytne potrebnú postupnosť pri príprave čísel na nájdenie čitateľa a menovateľa korelačného koeficientu.

Ako je zrejmé zo vzorca (32), postupnosť akcií je nasledovná: nájdeme aritmetické priemery oboch znamienok x a y, nájdeme rozdiel medzi hodnotami znamienka a jeho priemerom (х i - ) a y i - ), potom nájdeme ich súčin (х i - ) ( y i - ) – ich súčet dáva čitateľa korelačného koeficientu. Ak chcete nájsť jeho menovateľa, mali by ste umocniť rozdiely (x i -) a (y i -), nájsť ich súčty a vybrať druhú odmocninu z ich súčinu.

Takže napríklad 31 nájdenie korelačného koeficientu podľa vzorca (32) možno znázorniť nasledovne (tabuľka 50).

Výsledné číslo korelačného koeficientu umožňuje zistiť prítomnosť, blízkosť a povahu vzťahu.

1. Ak je korelačný koeficient nulový, medzi znakmi nie je vzťah.

2. Ak je korelačný koeficient rovný jednej, vzťah medzi znakmi je taký veľký, že sa zmení na funkčný.

3. Absolútna hodnota korelačného koeficientu nepresahuje interval od nuly do jednej:

To umožňuje zamerať sa na tesnosť spojenia: čím je koeficient bližšie k nule, tým je spojenie slabšie a čím bližšie k jednote, tým je spojenie bližšie.

4. Znamienko korelačného koeficientu „plus“ znamená priamu koreláciu, znamienko „mínus“ znamená opak.

Tabuľka 50

x i i (х i - ) (y i -) (x i - ) (y i - ) (х i - )2 (y i -) 2
14,00 12,10 -1,70 -2,30 +3,91 2,89 5,29
14,20 13,80 -1,50 -0,60 +0,90 2,25 0,36
14,90 14,20 -0,80 -0,20 +0,16 0,64 0,04
15,40 13,00 -0,30 -1,40 +0,42 0,09 1,96
16,00 14,60 +0,30 +0,20 +0,06 0,09 0,04
17,20 15,90 +1,50 +2,25 2,25
18,10 17,40 +2,40 +2,00 +4,80 5,76 4,00
109,80 101,00 12,50 13,97 13,94


Korelačný koeficient vypočítaný v príklade 31 je teda r xy = +0,9. nám umožňuje vyvodiť tieto závery: medzi hodnotou je korelácia svalovú silu pravá a ľavá ruka u skúmaných školákov (koeficient r xy = +0,9 sa líši od nuly), vzťah je veľmi tesný (koeficient r xy = +0,9 sa blíži k jednote), korelácia je priama (koeficient r xy = +0,9 je kladné ), t.j. s nárastom svalovej sily jednej ruky sa zvyšuje sila druhej ruky.

Pri výpočte korelačného koeficientu a používaní jeho vlastností je potrebné vziať do úvahy, že závery poskytujú správne výsledky, keď sú znaky normálne rozdelené a keď sa berie do úvahy vzťah medzi veľkým počtom hodnôt oboch znakov.

V uvažovanom príklade 31 bolo analyzovaných iba 7 hodnôt oboch vlastností, čo, samozrejme, na takéto štúdie nestačí. Opäť pripomíname, že príklady v tejto knihe vo všeobecnosti a najmä v tejto kapitole majú charakter ilustračných metód, a nie podrobnú prezentáciu akýchkoľvek vedeckých experimentov. V dôsledku toho sa berie do úvahy malý počet hodnôt vlastností, merania sú zaokrúhlené - to všetko sa robí, aby sa myšlienka metódy nezakryla ťažkopádnymi výpočtami.

Osobitná pozornosť by sa mala venovať podstate posudzovaného vzťahu. Korelačný koeficient nemôže viesť k správnym výsledkom štúdie, ak sa analýza vzťahu medzi znakmi vykonáva formálne. Vráťme sa k príkladu 31. Obidva uvažované znaky boli hodnoty svalovej sily pravej a ľavej ruky. Predstavme si, že znakom x i v príklade 31 (14,0; 14,2; 14,9... ...18,1) rozumieme dĺžku náhodne ulovených rýb v centimetroch a znakom y i (12,1 ; 13,8; 14,2 ... ... 17.4) - hmotnosť prístrojov v laboratóriu v kilogramoch. Formálne, použitím aparatúry výpočtov na nájdenie korelačného koeficientu a v tomto prípade aj získaním r xy =+0>9, by sme mali dospieť k záveru, že existuje úzky vzťah priamej povahy medzi dĺžkou ryby a hmotnosťou ryby. nástroje. Absurdnosť takéhoto záveru je zrejmá.

Aby sme sa vyhli formálnemu prístupu k používaniu korelačného koeficientu, je potrebné použiť akúkoľvek inú metódu – matematickú, logickú, experimentálnu, teoretickú – na identifikáciu možnosti korelácie medzi znakmi, teda na zistenie organickej jednoty znakov. Až potom možno začať používať korelačnú analýzu a určiť veľkosť a povahu vzťahu.

V matematickej štatistike existuje aj pojem viacnásobná korelácia- Vzťahy medzi tromi alebo viacerými funkciami. V týchto prípadoch sa používa viacnásobný korelačný koeficient pozostávajúci z vyššie opísaných párových korelačných koeficientov.

Napríklad korelačný koeficient troch znakov - x і , y і , z і - je:

kde R xyz - viacnásobný korelačný koeficient vyjadrujúci, ako znak x i závisí od znakov y i a z i;

r xy -korelačný koeficient medzi znakmi xi a yi;

r xz - korelačný koeficient medzi znakmi Xi a Zi;

r yz - korelačný koeficient medzi znakmi y i, z i

Korelačná analýza je:

Korelačná analýza

Korelácia- štatistický vzťah dvoch alebo viacerých náhodných premenných (alebo premenných, ktoré možno za také považovať s určitou prijateľnou mierou presnosti). Zmeny jednej alebo viacerých z týchto veličín zároveň vedú k systematickej zmene druhej alebo iných veličín. Korelačný koeficient slúži ako matematická miera korelácie dvoch náhodných premenných.

Korelácia môže byť pozitívna a negatívna (je tiež možné, že neexistuje štatistický vzťah - napríklad pre nezávislé náhodné premenné). negatívna korelácia - korelácia, pri ktorej je nárast jednej premennej spojený s poklesom inej premennej, pričom korelačný koeficient je negatívny. pozitívna korelácia - korelácia, pri ktorej je nárast jednej premennej spojený so zvýšením inej premennej, pričom korelačný koeficient je kladný.

autokorelácia - štatistický vzťah medzi náhodnými premennými z rovnakého radu, ale braný s posunom, napríklad pre náhodný proces - s posunom v čase.

Metóda spracovania štatistických údajov, ktorá spočíva v štúdiu koeficientov (korelácií) medzi premennými, sa nazýva korelačná analýza.

Korelačný koeficient

Korelačný koeficient alebo párový korelačný koeficient v teórii pravdepodobnosti a štatistike je to indikátor charakteru zmeny dvoch náhodných premenných. Korelačný koeficient je označený latinským písmenom R a môže nadobúdať hodnoty medzi -1 a +1. Ak je hodnota modulo bližšia k 1, znamená to prítomnosť silného spojenia (s korelačným koeficientom rovným jednej, hovoria o funkčnom spojení), a ak je bližšie k 0, potom slabé.

Pearsonov korelačný koeficient

Pre metrické veličiny sa používa Pearsonov korelačný koeficient, ktorého presný vzorec zaviedol Francis Galton:

Nechaj X,Y- dve náhodné premenné definované na rovnakom pravdepodobnostnom priestore. Potom je ich korelačný koeficient daný vzorcom:

,

kde cov je kovariancia a D je rozptyl alebo ekvivalentne,

,

kde symbol označuje matematické očakávanie.

Na grafické znázornenie takéhoto vzťahu môžete použiť pravouhlý súradnicový systém s osami, ktoré zodpovedajú obom premenným. Každá dvojica hodnôt je označená špecifickým symbolom. Takáto zápletka sa nazýva „rozptyl“.

Spôsob výpočtu korelačného koeficientu závisí od typu škály, na ktorú sa premenné vzťahujú. Takže na meranie premenných s intervalovými a kvantitatívnymi škálami je potrebné použiť Pearsonov korelačný koeficient (korelácia momentov súčinu). Ak aspoň jedna z dvoch premenných má ordinálnu stupnicu alebo nie je normálne rozložená, musí sa použiť Spearmanova rank korelácia alebo Kendalovo τ (tau). V prípade, že jedna z dvoch premenných je dichotomická, použije sa bodová dvojsériová korelácia a ak sú obe premenné dichotomické, použije sa štvorpoľová korelácia. Výpočet korelačného koeficientu medzi dvoma nedichotomickými premennými má zmysel len vtedy, ak je vzťah medzi nimi lineárny (jednosmerný).

Kendellov korelačný koeficient

Používa sa na meranie vzájomného neporiadku.

Spearmanov korelačný koeficient

Vlastnosti korelačného koeficientu

  • Cauchy - Bunyakovsky nerovnosť:
ak vezmeme kovarianciu ako skalárny súčin dvoch náhodných premenných, potom sa norma náhodnej premennej bude rovnať , a dôsledkom Cauchyho-Bunyakovského nerovnosti bude: . , kde . Navyše v tomto prípade znaky a k zápas: .

Korelačná analýza

Korelačná analýza- spôsob spracovania štatistických údajov, ktorý spočíva v štúdiu koeficientov ( korelácie) medzi premennými. V tomto prípade sa porovnávajú korelačné koeficienty medzi jedným párom alebo viacerými pármi znakov, aby sa medzi nimi stanovili štatistické vzťahy.

Cieľ korelačná analýza- poskytnúť nejaké informácie o jednej premennej pomocou inej premennej. V prípadoch, keď je možné dosiahnuť cieľ, hovoríme, že premenné korelovať. Vo veľmi všeobecný pohľad prijatie hypotézy o prítomnosti korelácie znamená, že zmena hodnoty premennej A nastane súčasne s proporcionálnou zmenou hodnoty B: ak obe premenné rastú, potom korelácia je pozitívna ak jedna premenná rastie a druhá klesá, korelácia je negatívna.

Korelácia odráža len lineárnu závislosť veličín, ale neodráža ich funkčnú súvislosť. Napríklad, ak vypočítame korelačný koeficient medzi hodnotami A = sin(X) a B = cos(X), potom sa bude blížiť nule, t.j. medzi veličinami nie je žiadna závislosť. Medzitým sú veličiny A a B zjavne funkčne spojené podľa zákona sin 2(X) + cos 2(X) = 1.

Obmedzenia korelačnej analýzy



Grafy rozdelenia párov (x,y) so zodpovedajúcimi x a y korelačnými koeficientmi pre každý z nich. Všimnite si, že korelačný koeficient odráža lineárny vzťah (horný riadok), ale neopisuje krivku vzťahu (stredný riadok) a vôbec nie je vhodný na opis zložitých, nelineárnych vzťahov (spodný riadok).
  1. Aplikácia je možná, ak existuje dostatočný počet prípadov na štúdium: pre konkrétny typ korelačného koeficientu sa pohybuje od 25 do 100 párov pozorovaní.
  2. Druhé obmedzenie vyplýva z hypotézy korelačnej analýzy, ktorá zahŕňa lineárna závislosť premenných. V mnohých prípadoch, keď je spoľahlivo známe, že závislosť existuje, korelačná analýza nemusí poskytnúť výsledky jednoducho preto, že závislosť je nelineárna (vyjadrená napríklad ako parabola).
  3. Fakt korelácie sám osebe neodôvodňuje tvrdenie, ktorá z premenných predchádza alebo spôsobuje zmeny, alebo že premenné sú vo všeobecnosti navzájom kauzálne spojené, napríklad v dôsledku pôsobenia tretieho faktora.

Oblasť použitia

Tento spôsob spracovania štatistických údajov je veľmi populárny v ekonómii a spoločenských vedách (najmä v psychológii a sociológii), hoci rozsah použitia korelačných koeficientov je široký: kontrola kvality priemyselných výrobkov, hutníctvo, poľnohospodárska chémia, hydrobiológia, biometria, a ďalšie.

Obľúbenosť metódy je spôsobená dvoma bodmi: korelačné koeficienty sa dajú pomerne ľahko vypočítať, ich aplikácia si nevyžaduje špeciálne matematické školenie. V kombinácii s jednoduchosťou interpretácie viedla jednoduchosť aplikácie koeficientu k jeho širokému použitiu v oblasti štatistickej analýzy údajov.

falošná korelácia

Často lákavá jednoduchosť korelačnej štúdie povzbudzuje výskumníka, aby vyvodil falošné intuitívne závery o prítomnosti kauzálneho vzťahu medzi pármi znakov, zatiaľ čo korelačné koeficienty stanovujú iba štatistické vzťahy.

V modernej kvantitatívnej metodológii sociálnych vied sa v skutočnosti upustilo od pokusov o stanovenie kauzálnych vzťahov medzi pozorovanými premennými empirickými metódami. Preto, keď výskumníci v sociálnych vedách hovoria o vytváraní vzťahov medzi premennými, ktoré študujú, znamená to buď všeobecný teoretický predpoklad alebo štatistickú závislosť.

pozri tiež

  • Autokorelačná funkcia
  • Krížová korelačná funkcia
  • kovariancia
  • Koeficient determinácie
  • Regresná analýza

Nadácia Wikimedia. 2010.

Korelačný koeficient odráža mieru vzťahu medzi dvoma ukazovateľmi. Vždy nadobúda hodnotu od -1 do 1. Ak sa koeficient nachádza blízko 0, potom hovoria, že medzi premennými nie je žiadna súvislosť.

Ak je hodnota blízka jednej (napríklad od 0,9), potom medzi pozorovanými objektmi existuje silný priamy vzťah. Ak je koeficient blízko druhého krajného bodu rozsahu (-1), potom medzi premennými existuje silný inverzný vzťah. Keď je hodnota niekde v strede od 0 do 1 alebo od 0 do -1, potom hovoríme o slabom vzťahu (vpred alebo vzad). Tento vzťah sa zvyčajne neberie do úvahy: má sa za to, že neexistuje.

Výpočet korelačného koeficientu v Exceli

Zvážte napríklad metódy na výpočet korelačného koeficientu, vlastnosti priameho a inverzného vzťahu medzi premennými.

Hodnoty indikátorov x a y:

Y je nezávislá premenná, x je závislá premenná. Je potrebné nájsť silu (silný / slabý) a smer (dopredu / dozadu) vzťahu medzi nimi. Vzorec pre korelačný koeficient vyzerá takto:


Pre zjednodušenie jeho pochopenia ho rozdelíme na niekoľko jednoduchých prvkov.

Medzi premennými existuje silný priamy vzťah.

Zabudovaná funkcia CORREL sa vyhýba zložitým výpočtom. Vypočítajme pomocou neho v Exceli koeficient párovej korelácie. Voláme majstra funkcií. Nájdeme to, čo potrebujeme. Argumenty funkcie sú pole hodnôt y a pole hodnôt x:

Ukážme hodnoty premenných na grafe:


Medzi y a x je silný vzťah, pretože Čiary prebiehajú takmer paralelne navzájom. Vzťah je priamy: rastúce y - rastúce x, klesajúce y - klesajúce x.



Matica párových korelačných koeficientov v Exceli

Korelačná matica je tabuľka, v ktorej sú priesečníky riadkov a stĺpcov korelačné koeficienty medzi zodpovedajúcimi hodnotami. Má zmysel stavať ho pre niekoľko premenných.

Matica korelačných koeficientov v Exceli je vytvorená pomocou nástroja "Korelácia" z balíka "Analýza údajov".


Medzi hodnotami y a x1 bol nájdený silný priamy vzťah. Medzi x1 a x2 existuje silná spätná väzba. Neexistuje prakticky žiadna súvislosť s hodnotami v stĺpci x3.

Všimnite si! Riešenie vášho konkrétneho problému bude vyzerať podobne ako v tomto príklade vrátane všetkých nižšie uvedených tabuliek a vysvetľujúcich textov, ale s prihliadnutím na vaše počiatočné údaje ...

Úloha:
Existuje súvisiaca vzorka 26 párov hodnôt (x k, y k):

k 1 2 3 4 5 6 7 8 9 10
x k 25.20000 26.40000 26.00000 25.80000 24.90000 25.70000 25.70000 25.70000 26.10000 25.80000
y k 30.80000 29.40000 30.20000 30.50000 31.40000 30.30000 30.40000 30.50000 29.90000 30.40000

k 11 12 13 14 15 16 17 18 19 20
x k 25.90000 26.20000 25.60000 25.40000 26.60000 26.20000 26.00000 22.10000 25.90000 25.80000
y k 30.30000 30.50000 30.60000 31.00000 29.60000 30.40000 30.70000 31.60000 30.50000 30.60000

k 21 22 23 24 25 26
x k 25.90000 26.30000 26.10000 26.00000 26.40000 25.80000
y k 30.70000 30.10000 30.60000 30.50000 30.70000 30.80000

Je potrebné vypočítať/zostaviť:
- korelačný koeficient;
- testovať hypotézu závislosti náhodných premenných X a Y, na hladine významnosti α = 0,05;
- koeficienty lineárnej regresnej rovnice;
- rozptylový diagram (korelačné pole) a regresný čiarový graf;

RIEŠENIE:

1. Vypočítajte korelačný koeficient.

Korelačný koeficient je ukazovateľom vzájomného pravdepodobnostného vplyvu dvoch náhodných veličín. Korelačný koeficient R môže preberať hodnoty z -1 predtým +1 . Ak je absolútna hodnota bližšie k 1 , potom je to dôkaz silného vzťahu medzi množstvom, a ak je bližšie k 0 - potom indikuje slabé spojenie alebo jeho absenciu. Ak absolútna hodnota R rovná jednej, potom môžeme hovoriť o funkčnom vzťahu medzi veličinami, to znamená, že jedna veličina môže byť vyjadrená inou pomocou matematickej funkcie.


Korelačný koeficient môžete vypočítať pomocou nasledujúcich vzorcov:
n
Σ
k = 1
(x k - M x) 2, y 2 =
Mx =
1
n
n
Σ
k = 1
x k , M r =

alebo podľa vzorca

Rx, y =
M xy - M x M y
SxSy
(1.4), kde:
Mx =
1
n
n
Σ
k = 1
x k , M r =
1
n
n
Σ
k = 1
y k , Mxy =
1
n
n
Σ
k = 1
x k y k (1,5)
S x 2 =
1
n
n
Σ
k = 1
x k 2 - M x 2, S y 2 =
1
n
n
Σ
k = 1
y k 2 - M y 2 (1,6)

V praxi sa na výpočet korelačného koeficientu častejšie používa vzorec (1.4), od r vyžaduje menej výpočtov. Ak však bola predtým vypočítaná kovariancia cov(X,Y), potom je výhodnejšie použiť vzorec (1.1), pretože okrem skutočnej hodnoty kovariancie môžete použiť aj výsledky medzivýpočtov.

1.1 Vypočítajte korelačný koeficient pomocou vzorca (1.4), na tento účel vypočítame hodnoty x k 2, y k 2 a x k y k a zapíšeme ich do tabuľky 1.

stôl 1


k
x k y k x k 2 y k 2 x ky k
1 2 3 4 5 6
1 25.2 30.8 635.04000 948.64000 776.16000
2 26.4 29.4 696.96000 864.36000 776.16000
3 26.0 30.2 676.00000 912.04000 785.20000
4 25.8 30.5 665.64000 930.25000 786.90000
5 24.9 31.4 620.01000 985.96000 781.86000
6 25.7 30.3 660.49000 918.09000 778.71000
7 25.7 30.4 660.49000 924.16000 781.28000
8 25.7 30.5 660.49000 930.25000 783.85000
9 26.1 29.9 681.21000 894.01000 780.39000
10 25.8 30.4 665.64000 924.16000 784.32000
11 25.9 30.3 670.81000 918.09000 784.77000
12 26.2 30.5 686.44000 930.25000 799.10000
13 25.6 30.6 655.36000 936.36000 783.36000
14 25.4 31 645.16000 961.00000 787.40000
15 26.6 29.6 707.56000 876.16000 787.36000
16 26.2 30.4 686.44000 924.16000 796.48000
17 26 30.7 676.00000 942.49000 798.20000
18 22.1 31.6 488.41000 998.56000 698.36000
19 25.9 30.5 670.81000 930.25000 789.95000
20 25.8 30.6 665.64000 936.36000 789.48000
21 25.9 30.7 670.81000 942.49000 795.13000
22 26.3 30.1 691.69000 906.01000 791.63000
23 26.1 30.6 681.21000 936.36000 798.66000
24 26 30.5 676.00000 930.25000 793.00000
25 26.4 30.7 696.96000 942.49000 810.48000
26 25.8 30.8 665.64000 948.64000 794.64000


1.2. M x vypočítame podľa vzorca (1.5).

1.2.1. x k

x 1 + x 2 + ... + x 26 = 25,20000 + 26,40000 + ... + 25,80000 = 669,500000

1.2.2.

669.50000 / 26 = 25.75000

Mx = 25,750000

1.3. Podobne vypočítame M y.

1.3.1. Pridajme postupne všetky prvky y k

y 1 + y 2 + ... + y 26 = 30,80000 + 29,40000 + ... + 30,80000 = 793,000000

1.3.2. Výsledný súčet vydeľte počtom prvkov vzorky

793.00000 / 26 = 30.50000

M y = 30,500000

1.4. Podobne vypočítame M xy.

1.4.1. Postupne pridávame všetky prvky 6. stĺpca tabuľky 1

776.16000 + 776.16000 + ... + 794.64000 = 20412.830000

1.4.2. Výsledný súčet vydeľte počtom prvkov

20412.83000 / 26 = 785.10885

M xy = 785,108846

1.5. Vypočítajte hodnotu S x 2 pomocou vzorca (1.6.).

1.5.1. Postupne pridávame všetky prvky 4. stĺpca tabuľky 1

635.04000 + 696.96000 + ... + 665.64000 = 17256.910000

1.5.2. Výsledný súčet vydeľte počtom prvkov

17256.91000 / 26 = 663.72731

1.5.3. Odčítaním druhej mocniny hodnoty M x od posledného čísla dostaneme hodnotu S x 2

S x 2 = 663.72731 - 25.75000 2 = 663.72731 - 663.06250 = 0.66481

1.6. Hodnotu S y 2 vypočítajte podľa vzorca (1.6.).

1.6.1. Postupne pridávame všetky prvky 5. stĺpca tabuľky 1

948.64000 + 864.36000 + ... + 948.64000 = 24191.840000

1.6.2. Výsledný súčet vydeľte počtom prvkov

24191.84000 / 26 = 930.45538

1.6.3. Od posledného čísla odčítame druhú mocninu M y, dostaneme hodnotu S y 2

S y 2 = 930.45538 - 30.50000 2 = 930.45538 - 930.25000 = 0.20538

1.7. Vypočítajme súčin S x 2 a S y 2.

S x 2 Sy 2 = 0,66481 0,20538 = 0,136541

1.8. Vytiahnite posledné číslo Odmocnina, dostaneme hodnotu S x S y.

S x Sy = 0,36951

1.9. Hodnotu korelačného koeficientu vypočítajte podľa vzorca (1.4.).

R = (785,10885 - 25,75000 30,50000) / 0,36951 = (785,10885 - 785,37500) / 0,36951 = -0,72028

ODPOVEĎ: Rx,y = -0,720279

2. Kontrolujeme významnosť korelačného koeficientu (overujeme hypotézu závislosti).

Keďže odhad korelačného koeficientu sa počíta na konečnej vzorke, a preto sa môže odchyľovať od svojej všeobecnej hodnoty, je potrebné skontrolovať významnosť korelačného koeficientu. Kontrola sa vykonáva pomocou t-kritéria:

t =
Rx, y
n - 2
1 - R 2 x, y
(2.1)

Náhodná hodnota t sleduje Studentovo t-rozdelenie a podľa tabuľky t-rozdelenia je potrebné nájsť kritickú hodnotu kritéria (t kr.α) na danej hladine významnosti α . Ak sa ukáže, že modulo t vypočítané podľa vzorca (2.1) je menšie ako t cr.α , potom medzi náhodnými premennými X a Y neexistuje žiadna závislosť. Inak experimentálne údaje nie sú v rozpore s hypotézou o závislosti náhodných premenných.


2.1. Vypočítajte hodnotu t-kritéria podľa vzorca (2.1), dostaneme:
t =
-0.72028
26 - 2
1 - (-0.72028) 2
= -5.08680

2.2. Určme kritickú hodnotu parametra t cr.α z tabuľky t-rozdelenia

Požadovaná hodnota t kr.α sa nachádza v priesečníku riadka zodpovedajúceho počtu stupňov voľnosti a stĺpca zodpovedajúceho danej hladine významnosti α .
V našom prípade je počet stupňov voľnosti n - 2 = 26 - 2 = 24 a a = 0.05 , čo zodpovedá kritickej hodnote kritéria t cr.α = 2.064 (pozri tabuľku 2)

tabuľka 2 t-distribúcia

Počet stupňov voľnosti
(n - 2)
a = 0,1 a = 0,05 a = 0,02 a = 0,01 a = 0,002 a = 0,001
1 6.314 12.706 31.821 63.657 318.31 636.62
2 2.920 4.303 6.965 9.925 22.327 31.598
3 2.353 3.182 4.541 5.841 10.214 12.924
4 2.132 2.776 3.747 4.604 7.173 8.610
5 2.015 2.571 3.365 4.032 5.893 6.869
6 1.943 2.447 3.143 3.707 5.208 5.959
7 1.895 2.365 2.998 3.499 4.785 5.408
8 1.860 2.306 2.896 3.355 4.501 5.041
9 1.833 2.262 2.821 3.250 4.297 4.781
10 1.812 2.228 2.764 3.169 4.144 4.587
11 1.796 2.201 2.718 3.106 4.025 4.437
12 1.782 2.179 2.681 3.055 3.930 4.318
13 1.771 2.160 2.650 3.012 3.852 4.221
14 1.761 2.145 2.624 2.977 3.787 4.140
15 1.753 2.131 2.602 2.947 3.733 4.073
16 1.746 2.120 2.583 2.921 3.686 4.015
17 1.740 2.110 2.567 2.898 3.646 3.965
18 1.734 2.101 2.552 2.878 3.610 3.922
19 1.729 2.093 2.539 2.861 3.579 3.883
20 1.725 2.086 2.528 2.845 3.552 3.850
21 1.721 2.080 2.518 2.831 3.527 3.819
22 1.717 2.074 2.508 2.819 3.505 3.792
23 1.714 2.069 2.500 2.807 3.485 3.767
24 1.711 2.064 2.492 2.797 3.467 3.745
25 1.708 2.060 2.485 2.787 3.450 3.725
26 1.706 2.056 2.479 2.779 3.435 3.707
27 1.703 2.052 2.473 2.771 3.421 3.690
28 1.701 2.048 2.467 2.763 3.408 3.674
29 1.699 2.045 2.462 2.756 3.396 3.659
30 1.697 2.042 2.457 2.750 3.385 3.646
40 1.684 2.021 2.423 2.704 3.307 3.551
60 1.671 2.000 2.390 2.660 3.232 3.460
120 1.658 1.980 2.358 2.617 3.160 3.373
1.645 1.960 2.326 2.576 3.090 3.291


2.2. Porovnajme absolútnu hodnotu t-kritéria a t kr.α

Absolútna hodnota t-kritéria nie je menšia ako kritická t = 5,08680, tcr.α = 2,064, preto experimentálne údaje, s pravdepodobnosťou 0,95(1 – α), neprotirečia hypotéze na závislosti náhodných premenných X a Y.

3. Vypočítame koeficienty rovnice lineárnej regresie.

Rovnica lineárnej regresie je rovnica priamky, ktorá aproximuje (približne opisuje) vzťah medzi náhodnými premennými X a Y. Ak predpokladáme, že X je voľné a Y je závislé od X, potom bude regresná rovnica napísaná nasledovne


Y = a + b X (3.1), kde:

b=Rx, y
r
σ x
= Rx, y
Sy
S x
(3.2),
a = M y - b M x (3,3)

Koeficient vypočítaný podľa vzorca (3.2) b sa nazýva koeficient lineárnej regresie. V niektorých zdrojoch a sa nazýva konštantný regresný koeficient a b podľa premenných.

Chyby predpovede Y pre danú hodnotu X sa vypočítajú podľa vzorcov:

Nazýva sa aj hodnota σ y/x (vzorec 3.4). zvyšková štandardná odchýlka, charakterizuje odchýlku Y od regresnej priamky opísanej rovnicou (3.1) pri pevnej (danej) hodnote X.

.
Sy2/Sx2 = 0,20538 / 0,66481 = 0,30894. Extrahujeme druhú odmocninu z posledného čísla - dostaneme:
Sy/Sx = 0,55582

3.3 Vypočítajte koeficient b podľa vzorca (3.2)

b = -0.72028 0.55582 = -0.40035

3.4 Vypočítajte koeficient a podľa vzorca (3.3)

a = 30.50000 - (-0.40035 25.75000) = 40.80894

3.5 Odhadnite chyby regresnej rovnice.

3.5.1 Extrahujeme druhú odmocninu z S y 2 a dostaneme:

= 0.31437
3.5.4 Vypočítajme relatívnu chybu podľa vzorca (3.5)

δy/x = (0,31437 / 30,50000) 100 % = 1,03073 %

4. Zostavíme bodový graf (korelačné pole) a graf regresnej priamky.

Bodový graf je grafické znázornenie zodpovedajúcich párov (x k , y k ) ako bodov v rovine, v pravouhlých súradniciach s osami X a Y. Korelačné pole je jedným z grafických znázornení prepojenej (párovej) vzorky. V rovnakom súradnicovom systéme je vynesený aj graf regresnej priamky. Mierky a začiatočné body na osiach by sa mali vyberať opatrne, aby bol diagram čo najjasnejší.

4.1. Zistili sme, že minimálny a maximálny prvok vzorky X je 18. a 15. prvok, v tomto poradí, x min = 22,10000 a x max = 26,60000.

4.2. Zistili sme, že minimálny a maximálny prvok vzorky Y je 2. a 18. prvok, y min = 29,40000 a y max = 31,60000.

4.3. Na osi x vyberieme začiatočný bod hneď naľavo od bodu x 18 = 22,10000 a takú mierku, aby sa bod x 15 = 26,60000 zmestil na os a ostatné body boli jasne rozlíšené.

4.4. Na osi y vyberieme začiatočný bod hneď naľavo od bodu y 2 = 29,40000 a takú mierku, aby sa bod y 18 = 31,60000 zmestil na os a ostatné body boli jasne rozlíšené.

4.5. Na vodorovnú os umiestnime hodnoty x k a na zvislú os hodnoty y k.

4.6. Na rovinu súradníc položíme body (x 1, y 1), (x 2, y 2), ..., (x 26, y 26). Dostaneme bodový graf (korelačné pole), znázornený na obrázku nižšie.

4.7. Nakreslíme regresnú čiaru.

Aby sme to urobili, nájdeme dva rôzne body so súradnicami (x r1 , y r1) a (x r2 , y r2), ktoré spĺňajú rovnicu (3.6), umiestnime ich na súradnicovú rovinu a nakreslíme cez ne priamku. Vezmime x min = 22,10000 ako úsečku prvého bodu. Do rovnice (3.6) dosadíme hodnotu x min, dostaneme ordinátu prvého bodu. Máme teda bod so súradnicami (22,10000, 31,96127). Podobne získame súradnice druhého bodu, pričom ako úsečku nastavíme hodnotu x max = 26,60000. Druhý bod bude: (26,60000, 30,15970).

Regresná čiara je znázornená na obrázku nižšie červenou farbou

Upozorňujeme, že regresná čiara vždy prechádza bodom priemerných hodnôt X a Y, t.j. so súradnicami (M x , M y).

KURZOVÁ PRÁCA

Téma: Korelačná analýza

Úvod

1. Korelačná analýza

1.1 Pojem korelácie

1.2 Všeobecná klasifikácia korelácií

1.3 Korelačné polia a účel ich konštrukcie

1.4 Etapy korelačnej analýzy

1.5 Korelačné koeficienty

1.6 Normalizovaný Bravais-Pearsonov korelačný koeficient

1.7 Spearmanov koeficient poradovej korelácie

1.8 Základné vlastnosti korelačných koeficientov

1.9 Kontrola významnosti korelačných koeficientov

1.10 Kritické hodnoty párového korelačného koeficientu

2. Plánovanie viacrozmerného experimentu

2.1 Stav problému

2.2 Určenie stredu plánu (hlavná úroveň) a úrovne variácie faktorov

2.3 Zostavenie plánovacej matice

2.4 Kontrola homogenity disperzie a rovnakej presnosti meraní v rôznych sériách

2.5 Koeficienty regresnej rovnice

2.6 Disperzia reprodukovateľnosti

2.7 Kontrola významnosti koeficientov regresnej rovnice

2.8 Kontrola primeranosti regresnej rovnice

Záver

Bibliografia

ÚVOD

Plánovanie experimentu je matematicko-štatistická disciplína, ktorá študuje metódy racionálnej organizácie experimentálneho výskumu - od optimálneho výberu skúmaných faktorov a stanovenia skutočného plánu experimentu v súlade s jeho účelom až po metódy analýzy výsledkov. Začiatok plánovania experimentov položili práce anglického štatistika R. Fishera (1935), ktorý zdôraznil, že racionálne plánovanie experimentov prináša nemenej významný zisk v presnosti odhadov ako optimálne spracovanie výsledkov meraní. V 60. rokoch 20. storočia vznikla moderná teória plánovania experimentov. Jeho metódy úzko súvisia s teóriou aproximácie funkcií a matematickým programovaním. Konštruujú sa optimálne plány a skúmajú sa ich vlastnosti pre širokú triedu modelov.

Plánovanie experimentu – výber plánu experimentu, ktorý spĺňa špecifikované požiadavky, súbor akcií zameraných na vypracovanie stratégie experimentu (od získania apriórnych informácií až po získanie funkčného matematického modelu alebo určenie optimálnych podmienok). Ide o cieľavedomú kontrolu experimentu, realizovanú v podmienkach neúplného poznania mechanizmu skúmaného javu.

V procese meraní, následného spracovania údajov, ako aj formalizácie výsledkov vo forme matematického modelu dochádza k chybám a strate časti informácií obsiahnutých v pôvodných údajoch. Použitie metód plánovania experimentu umožňuje určiť chybu matematického modelu a posúdiť jeho primeranosť. Ak je presnosť modelu nedostatočná, potom použitie metód plánovania experimentov umožňuje modernizáciu matematického modelu o ďalšie experimenty bez straty predchádzajúcich informácií a s minimálnymi nákladmi.

Účelom plánovania experimentu je nájsť také podmienky a pravidlá na vykonávanie experimentov, za ktorých je možné získať spoľahlivé a spoľahlivé informácie o objekte s najnižšími nákladmi na pracovnú silu, a tiež tieto informácie prezentovať v kompaktnej a pohodlnej forme s kvantifikácia presnosť.

Medzi hlavné metódy plánovania používané v rôzne štádiá výskum využíva:

Plánovanie skríningového experimentu, ktorého hlavným významom je výber skupiny významných faktorov z celkového počtu faktorov, ktoré sú predmetom ďalšieho podrobného štúdia;

Navrhovanie experimentu na analýzu rozptylu, t.j. vypracovanie plánov objektov s kvalitatívnymi faktormi;

Plánovanie regresného experimentu, ktorý umožňuje získať regresné modely (polynómy a iné);

Plánovanie extrémneho experimentu, v ktorom je hlavnou úlohou experimentálna optimalizácia predmetu štúdia;

Plánovanie pri štúdiu dynamických procesov a pod.

Účelom štúdia odboru je pripraviť študentov na výrobno-technickú činnosť v odbore s využitím metód teórie plánovania a moderných informačných technológií.

Ciele disciplíny: štúdium moderné metódy plánovanie, organizovanie a optimalizácia vedeckých a priemyselných experimentov, vykonávanie experimentov a spracovanie výsledkov.

1. KORELAČNÁ ANALÝZA

1.1 Koncept korelácie

Výskumníka často zaujíma, ako spolu súvisia dve alebo viac premenných v jednej alebo viacerých skúmaných vzorkách. Môže napríklad výška ovplyvniť hmotnosť človeka alebo môže tlak ovplyvniť kvalitu produktu?

Tento druh vzťahu medzi premennými sa nazýva korelácia alebo korelácia. Korelácia je konzistentná zmena dvoch znakov, ktorá odráža skutočnosť, že variabilita jedného znaku je v súlade s variabilitou druhého.

Je napríklad známe, že medzi výškou ľudí a ich hmotnosťou je v priemere pozitívny vzťah, a to taký, že čím väčšia výška, tým väčšia váha človeka. Existujú však výnimky z tohto pravidla, keď majú ľudia relatívne nízkeho vzrastu nadváhu, a naopak, astenici s vysokým rastom sú ľahkí. Dôvodom takýchto vylúčení je, že každá biologická, fyziologická alebo psychologická vlastnosť je určená vplyvom mnohých faktorov: environmentálnych, genetických, sociálnych, ekologických atď.

Korelácie sú pravdepodobnostné zmeny, ktoré možno študovať len na reprezentatívnych vzorkách metódami matematickej štatistiky. Oba pojmy – korelácia a korelačná závislosť – sa často používajú zameniteľne. Závislosť znamená vplyv, spojenie – akékoľvek koordinované zmeny, ktoré možno vysvetliť stovkami dôvodov. Korelácie nemožno považovať za dôkaz kauzálneho vzťahu, len naznačujú, že zmeny v jednom znaku sú spravidla sprevádzané určitými zmenami v inom.

Korelačná závislosť - sú zmeny, ktoré hodnoty jednej funkcie spôsobujú v pravdepodobnosti výskytu rôzne hodnotyďalšie znamenie.

Úloha korelačnej analýzy sa redukuje na určenie smeru (pozitívneho alebo negatívneho) a formy (lineárneho, nelineárneho) vzťahu medzi premenlivými znakmi, meranie jeho tesnosti a nakoniec kontrolu hladiny významnosti získaných korelačných koeficientov. .

Korelácie sa líšia formou, smerom a stupňom (sila) .

Tvar korelácie môže byť priamočiary alebo krivočiary. Napríklad vzťah medzi počtom tréningov na simulátore a počtom správne vyriešených problémov na kontrolnom stretnutí môže byť jednoduchý. Krivočiary môže byť napríklad vzťah medzi úrovňou motivácie a efektivitou úlohy (obrázok 1). S nárastom motivácie sa najprv zvyšuje účinnosť úlohy, potom sa dosiahne optimálna úroveň motivácie, ktorá zodpovedá maximálnej účinnosti úlohy; ďalší nárast motivácie je sprevádzaný poklesom efektívnosti.

Obrázok 1 - Vzťah medzi efektivitou riešenia problémov a silou motivačnej tendencie

V smere môže byť korelácia pozitívna („priama“) a negatívna („reverzná“). Pri pozitívnej priamej korelácii vyššie hodnoty jedného atribútu zodpovedajú vyšším hodnotám druhého a nižšie hodnoty jedného atribútu zodpovedajú nízkym hodnotám iného (obrázok 2). Pri negatívnej korelácii sú pomery obrátené (obrázok 3). Pri kladnej korelácii má korelačný koeficient kladné znamienko, pri zápornej korelácii - záporné znamienko.

Obrázok 2 - Priama korelácia

Obrázok 3 - Inverzná korelácia


Obrázok 4 - Žiadna korelácia

Mieru, silu alebo tesnosť korelácie určuje hodnota korelačného koeficientu. Sila spojenia nezávisí od jeho smeru a je určená absolútnou hodnotou korelačného koeficientu.

1.2 Všeobecná klasifikácia korelácií

V závislosti od korelačného koeficientu sa rozlišujú tieto korelácie:

Silné alebo blízke s korelačným koeficientom r>0,70;

Stredná (pri 0,50

Mierne (o 0.30

Slabé (na 0,20

Veľmi slabé (v r<0,19).

1.3 Korelačné polia a účel ich konštrukcie

Korelácia je študovaná na základe experimentálnych údajov, ktorými sú namerané hodnoty (x i, y i) dvoch vlastností. Ak existuje málo experimentálnych údajov, potom je dvojrozmerné empirické rozdelenie reprezentované ako dvojitý rad hodnôt x i a y i. V tomto prípade možno koreláciu medzi znakmi opísať rôznymi spôsobmi. Korešpondencia medzi argumentom a funkciou môže byť daná tabuľkou, vzorcom, grafom atď.

Korelačná analýza, podobne ako iné štatistické metódy, je založená na použití pravdepodobnostných modelov, ktoré popisujú správanie študovaných znakov v určitej všeobecnej populácii, z ktorej sa získavajú experimentálne hodnoty x i a y i. Pri skúmaní korelácie medzi kvantitatívnymi charakteristikami, ktorých hodnoty možno presne merať v jednotkách metrických mierok (metre, sekundy, kilogramy atď.), je veľmi často model dvojrozmernej normálne rozloženej všeobecnej populácie prijali. Takýto model zobrazuje vzťah medzi premennými x i a y i graficky ako miesto bodov v pravouhlom súradnicovom systéme. Táto grafická závislosť sa tiež nazýva bodový graf alebo korelačné pole.
Tento model dvojrozmerného normálneho rozdelenia (korelačné pole) vám umožňuje poskytnúť vizuálnu grafickú interpretáciu korelačného koeficientu, pretože agregované rozdelenie závisí od piatich parametrov: μ x , μ y – priemerné hodnoty (matematické očakávania); σ x ,σ y sú štandardné odchýlky náhodných premenných X a Y a p je korelačný koeficient, ktorý je mierou vzťahu medzi náhodnými premennými X a Y.
Ak p \u003d 0, potom hodnoty x i, y i, získané z dvojrozmernej normálnej populácie, sa nachádzajú na grafe v súradniciach x, y v rámci oblasti ohraničenej kružnicou (obrázok 5, a). V tomto prípade neexistuje žiadna korelácia medzi náhodnými premennými X a Y a nazývajú sa nekorelované. Pre dvojrozmerné normálne rozdelenie znamená nekorelácia zároveň nezávislosť náhodných premenných X a Y.