Das ist keine Aufgabe der Europäischen Kommission. Europäische Kommission. Funktionen und Befugnisse. Generaldirektion Energie GD ENER - Energie

Der Korrelationstest nach Pearson ist eine parametrische Statistikmethode, mit der Sie das Vorhandensein oder Fehlen einer linearen Beziehung zwischen zwei quantitativen Indikatoren bestimmen sowie deren Nähe und statistische Signifikanz bewerten können. Mit anderen Worten, mit dem Pearson-Korrelationstest können Sie feststellen, ob eine lineare Beziehung zwischen Änderungen der Werte zweier Variablen besteht. In statistischen Berechnungen und Schlussfolgerungen wird der Korrelationskoeffizient normalerweise als bezeichnet rxy oder Rxy.

1. Geschichte der Entwicklung des Korrelationskriteriums

Der Pearson-Korrelationstest wurde von einem Team britischer Wissenschaftler unter der Leitung von entwickelt Karl Pearson(1857-1936) in den 90er Jahren des 19. Jahrhunderts entwickelt, um die Analyse der Kovarianz zweier Zufallsvariablen zu vereinfachen. Neben Karl Pearson wurde auch am Korrelationstest von Pearson gearbeitet Franz Edgeworth und Raffael Weldon.

2. Wofür wird der Korrelationstest nach Pearson verwendet?

Mit dem Pearson-Korrelationskriterium können Sie die Nähe (oder Stärke) der Korrelation zwischen zwei auf einer quantitativen Skala gemessenen Indikatoren bestimmen. Mit Hilfe zusätzlicher Berechnungen können Sie außerdem ermitteln, wie statistisch signifikant der identifizierte Zusammenhang ist.

Beispielsweise kann man mit Hilfe des Pearson-Korrelationstests die Frage beantworten, ob es einen Zusammenhang zwischen der Körpertemperatur und dem Gehalt an Leukozyten im Blut im Akutzustand gibt Infektionen der Atemwege, zwischen der Größe und dem Gewicht des Patienten, zwischen dem Inhalt in Wasser trinken Fluorid und Kariesinzidenz in der Bevölkerung.

3. Bedingungen und Einschränkungen für die Verwendung des Chi-Quadrat-Tests nach Pearson

  1. Vergleichbare Indikatoren sollten eingemessen werden quantitative Skala(zum Beispiel Herzfrequenz, Körpertemperatur, Leukozytenzahl pro 1 ml Blut, systolischer Blutdruck).
  2. Mittels des Korrelationskriteriums von Pearson lässt sich nur bestimmen das Vorhandensein und die Stärke einer linearen Beziehung zwischen Mengen. Andere Eigenschaften der Verbindung, einschließlich der Richtung (direkt oder umgekehrt), der Art der Änderungen (geradlinig oder krummlinig) sowie der Abhängigkeit einer Variablen von einer anderen, werden durch Regressionsanalyse bestimmt.
  3. Die Anzahl der zu vergleichenden Werte muss gleich zwei sein. Wenn Sie die Beziehung von drei oder mehr Parametern analysieren, sollten Sie die Methode verwenden Faktorenanalyse.
  4. Das Korrelationskriterium von Pearson ist parametrisch, in deren Zusammenhang Voraussetzung für seine Anwendung steht Normalverteilungübereinstimmende Variablen. Wenn es notwendig ist, eine Korrelationsanalyse von Indikatoren durchzuführen, deren Verteilung von der normalen abweicht, einschließlich der auf einer Ordinalskala gemessenen, sollte der Rangkorrelationskoeffizient von Spearman verwendet werden.
  5. Es ist notwendig, zwischen den Begriffen Abhängigkeit und Korrelation klar zu unterscheiden. Die Abhängigkeit der Werte bestimmt das Vorhandensein einer Korrelation zwischen ihnen, aber nicht umgekehrt.

Zum Beispiel hängt das Wachstum eines Kindes von seinem Alter ab, das heißt, was älteres Kind, desto höher ist es. Nehmen wir zwei Kinder unterschiedlichen Alters, so wird mit hoher Wahrscheinlichkeit das Wachstum des älteren Kindes größer sein als das des jüngeren. Dieses Phänomen heißt Sucht, was eine kausale Beziehung zwischen Indikatoren impliziert. Gibt es natürlich auch Korrelation, was bedeutet, dass Änderungen bei einem Indikator von Änderungen bei einem anderen Indikator begleitet werden.

Betrachten Sie in einer anderen Situation die Beziehung zwischen dem Wachstum des Kindes und der Herzfrequenz (HF). Wie Sie wissen, sind diese beiden Werte direkt altersabhängig, daher haben in den meisten Fällen Kinder mit größerer Statur (und damit ältere) niedrigere Herzfrequenzwerte. Also, Korrelation eingehalten werden und eine ausreichend hohe Dichtheit aufweisen dürfen. Allerdings, wenn wir Kinder mitnehmen das gleiche Alter, aber unterschiedliche Höhe, dann wird sich ihre Herzfrequenz höchstwahrscheinlich geringfügig unterscheiden, woraus wir schließen können Unabhängigkeit Herzfrequenz vom Wachstum.

Das obige Beispiel zeigt, wie wichtig es ist, zwischen den in der Statistik grundlegenden Konzepten zu unterscheiden Verbindungen und Abhängigkeiten Indikatoren, um richtige Schlüsse zu ziehen.

4. Wie berechnet man den Pearson-Korrelationskoeffizienten?

Der Korrelationskoeffizient nach Pearson wird mit der folgenden Formel berechnet:

5. Wie ist der Wert des Pearson-Korrelationskoeffizienten zu interpretieren?

Die Werte des Pearson-Korrelationskoeffizienten werden basierend auf seinen absoluten Werten interpretiert. Mögliche Werte des Korrelationskoeffizienten variieren von 0 bis ±1. Je größer der Absolutwert von r xy ist, desto enger ist die Beziehung zwischen den beiden Größen. r xy = 0 zeigt ein vollständiges Fehlen der Verbindung an. r xy = 1 - zeigt das Vorhandensein einer absoluten (funktionalen) Verbindung an. Wenn sich herausstellte, dass der Wert des Pearson-Korrelationskriteriums größer als 1 oder kleiner als -1 war, wurde ein Fehler in den Berechnungen gemacht.

Zur Beurteilung der Nähe oder Stärke der Korrelation werden allgemein anerkannte Kriterien verwendet, nach denen die absoluten Werte von r xy< 0.3 свидетельствуют о schwach Verbindung, r xy-Werte von 0,3 bis 0,7 - über Verbindung Mitte Dichtheit, r xy Werte > 0,7 - o stark Verbindungen.

Eine genauere Schätzung der Stärke der Korrelation kann durch Verwendung von erhalten werden Chaddock-Tisch:

Klasse statistische Signifikanz Korrelationskoeffizient r xy wird mit dem t-Test durchgeführt, der nach folgender Formel berechnet wird:

Der erhaltene Wert tr wird mit dem kritischen Wert bei einem bestimmten Signifikanzniveau und der Anzahl der Freiheitsgrade n-2 verglichen. Übersteigt t r t crit, so wird auf die statistische Signifikanz der ermittelten Korrelation geschlossen.

6. Ein Beispiel für die Berechnung des Pearson-Korrelationskoeffizienten

Das Ziel der Studie war es, die Korrelation zwischen zwei quantitativen Indikatoren zu identifizieren, zu bestimmen, die Enge und statistische Signifikanz zu bestimmen: den Testosteronspiegel im Blut (X) und den Prozentsatz Muskelmasse im Körper (Y). Die Ausgangsdaten für eine Stichprobe von 5 Probanden (n = 5) sind in der Tabelle zusammengefasst.

Der Korrelationskoeffizient (oder linearer Korrelationskoeffizient) wird als "r" (in seltenen Fällen als "ρ") bezeichnet und charakterisiert die lineare Korrelation (dh die Beziehung, die durch einen Wert und eine Richtung gegeben ist) von zwei oder mehr Variablen . Der Wert des Koeffizienten liegt zwischen -1 und +1, dh die Korrelation kann sowohl positiv als auch negativ sein. Wenn der Korrelationskoeffizient -1 ist, gibt es eine perfekte negative Korrelation; wenn der Korrelationskoeffizient +1 ist, gibt es eine perfekte positive Korrelation. In anderen Fällen gibt es eine positive Korrelation, eine negative Korrelation oder keine Korrelation zwischen den beiden Variablen. Der Korrelationskoeffizient kann manuell, mit kostenlosen Online-Rechnern oder mit einem guten Grafikrechner berechnet werden.

Schritte

Manuelle Berechnung des Korrelationskoeffizienten

    Daten sammeln. Bevor Sie mit der Berechnung des Korrelationskoeffizienten beginnen, untersuchen Sie das angegebene Zahlenpaar. Es ist besser, sie in einer Tabelle zu notieren, die vertikal oder horizontal angeordnet werden kann. Beschriften Sie jede Zeile oder Spalte mit einem „x“ und einem „y“.

    • Gegeben seien beispielsweise vier Wertepaare (Zahlen) der Variablen „x“ und „y“. Sie können die folgende Tabelle erstellen:
      • x || j
      • 1 || 1
      • 2 || 3
      • 4 || 5
      • 5 || 7
  1. Berechnen Sie das arithmetische Mittel "x". Addieren Sie dazu alle Werte von „x“ und teilen Sie das Ergebnis dann durch die Anzahl der Werte.

    Finden Sie das arithmetische Mittel "y". Führen Sie dazu die gleichen Schritte aus, dh addieren Sie alle Werte von „y“ und dividieren Sie dann die Summe durch die Anzahl der Werte.

    Berechnen Sie die Standardabweichung von "x". Nachdem Sie die Mittelwerte von x und y berechnet haben, ermitteln Sie die Standardabweichungen dieser Variablen. Die Standardabweichung wird nach folgender Formel berechnet:

    Berechnen Sie die Standardabweichung "y". Befolgen Sie die Schritte im vorherigen Schritt. Verwenden Sie die gleiche Formel, aber ersetzen Sie die "y"-Werte darin.

    Schreiben Sie die Grundformel zur Berechnung des Korrelationskoeffizienten auf. Diese Formel enthält Mittelwerte, Standardabweichungen und die Anzahl (n) der Zahlenpaare beider Variablen. Der Korrelationskoeffizient wird als "r" (in seltenen Fällen als "ρ") bezeichnet. Dieser Artikel verwendet die Formel zur Berechnung des Pearson-Korrelationskoeffizienten.

    Sie haben die Mittelwerte und Standardabweichungen beider Variablen berechnet, sodass Sie die Formel verwenden können, um den Korrelationskoeffizienten zu berechnen. Denken Sie daran, dass "n" die Anzahl der Wertepaare beider Variablen ist. Der Wert anderer Größen wurde zuvor berechnet.

    • In unserem Beispiel werden die Berechnungen wie folgt geschrieben:
    • ρ = (1 n − 1) Σ (x − μ x σ x) ∗ (y − μ y σ y) (\displaystyle \rho =\left((\frac (1)(n-1))\right) \Sigma \left((\frac (x-\mu _(x))(\sigma _(x)))\right)*\left((\frac (y-\mu _(y))(\sigma _(y)))\right))
    • ρ = (1 3) ∗ (\displaystyle \rho =\left((\frac (1)(3))\right)*)[ (1 − 3 1 , 83) ∗ (1 − 4 2 , 58) + (2 − 3 1 , 83) ∗ (3 − 4 2 , 58) (\displaystyle \left((\frac (1-3)( 1,83))\right)*\left((\frac (1-4)(2,58))\right)+\left((\frac (2-3)(1,83))\right) *\left((\ frac (3-4)(2,58))\right))
      + (4 − 3 1 , 83) ∗ (5 − 4 2 , 58) + (5 − 3 1 , 83) ∗ (7 − 4 2 , 58) (\displaystyle +\left((\frac (4-3 )(1,83))\right)*\left((\frac (5-4)(2,58))\right)+\left((\frac (5-3)(1,83))\right)*\left( (\frac (7-4)(2,58))\right))]
    • ρ = (1 3) ∗ (6 + 1 + 1 + 6 4 , 721) (\displaystyle \rho =\left((\frac (1)(3))\right)*\left((\frac (6 +1+1+6)(4.721))\right))
    • ρ = (1 3) ∗ 2 , 965 (\displaystyle \rho =\left((\frac (1)(3))\right)*2.965)
    • ρ = (2 , 965 3) (\displaystyle \rho =\left((\frac (2,965)(3))\right))
    • ρ = 0 , 988 (\displaystyle \rho =0,988)
  2. Analysieren Sie das Ergebnis. In unserem Beispiel beträgt der Korrelationskoeffizient 0,988. Dieser Wert charakterisiert in gewisser Weise eine gegebene Menge von Zahlenpaaren. Achten Sie auf Vorzeichen und Betrag des Wertes.

    • Da der Wert des Korrelationskoeffizienten positiv ist, besteht eine positive Korrelation zwischen den Variablen "x" und "y". Das heißt, wenn der Wert von "x" zunimmt, steigt auch der Wert von "y".
    • Da der Wert des Korrelationskoeffizienten sehr nahe bei +1 liegt, sind die Werte der x- und y-Variablen stark korreliert. Wenn Sie Punkte auf der Koordinatenebene platzieren, werden sie in der Nähe einer geraden Linie liegen.

    Verwenden von Online-Rechnern zur Berechnung des Korrelationskoeffizienten

    1. Finden Sie im Internet einen Rechner, um den Korrelationskoeffizienten zu berechnen. Dieser Koeffizient wird häufig in Statistiken berechnet. Bei vielen Zahlenpaaren ist es praktisch unmöglich, den Korrelationskoeffizienten manuell zu berechnen. Daher gibt es Online-Rechner zur Berechnung des Korrelationskoeffizienten. Geben Sie in der Suchmaschine "Korrelationskoeffizientenrechner" (ohne Anführungszeichen) ein.

      Daten eingeben. Lesen Sie die Anweisungen auf der Website, um die Daten korrekt einzugeben (Zahlenpaare). Es ist äußerst wichtig, die entsprechenden Zahlenpaare einzugeben; Andernfalls erhalten Sie ein falsches Ergebnis. Beachten Sie, dass verschiedene Websites unterschiedliche Dateneingabeformate haben.

      • Auf der Seite http://ncalculators.com/statistics/correlation-coefficient-calculator.htm werden beispielsweise die Werte der Variablen „x“ und „y“ in zwei horizontale Zeilen eingetragen. Werte werden durch Kommas getrennt. Das heißt, in unserem Beispiel werden die Werte von "x" so eingegeben: 1,2,4,5, und die Werte von "y" sind so: 1,3,5,7.
      • Auf einer anderen Website, http://www.alcula.com/calculators/statistics/correlation-coefficient/ , werden Daten vertikal eingegeben; Verwechseln Sie in diesem Fall die entsprechenden Zahlenpaare nicht.
    2. Berechnen Sie den Korrelationskoeffizienten. Nach Eingabe der Daten klicken Sie einfach auf den Button „Berechnen“, „Berechnen“ oder ähnliches, um das Ergebnis zu erhalten.

    Verwenden eines Grafikrechners

    1. Daten eingeben. Schnappen Sie sich einen Grafikrechner, wechseln Sie in den statistischen Berechnungsmodus und wählen Sie den Befehl Bearbeiten.

      • Auf verschiedenen Taschenrechnern müssen Sie unterschiedliche Tasten drücken. Dieser Artikel konzentriert sich auf den Taschenrechner TI-86 von Texas Instruments.
      • Um in den statistischen Berechnungsmodus zu wechseln, drücken Sie - Stat (über der „+“-Taste). Drücken Sie dann F2 - Bearbeiten (Bearbeiten).
    2. Löschen Sie zuvor gespeicherte Daten. Die meisten Taschenrechner behalten Ihre eingegebenen Statistiken, bis Sie sie löschen. Um zu vermeiden, dass alte Daten mit neuen Daten verwechselt werden, löschen Sie zuerst alle gespeicherten Informationen.

      • Verwenden Sie die Pfeiltasten, um den Cursor zu bewegen und die Überschrift „xStat“ hervorzuheben. Drücken Sie dann Clear und Enter, um alle in der xStat-Spalte eingegebenen Werte zu löschen.
      • Verwenden Sie die Pfeiltasten, um die Überschrift „yStat“ zu markieren. Drücken Sie dann Clear und Enter, um alle in der Spalte yStat eingegebenen Werte zu löschen.
    3. Anfangsdaten eingeben. Verwenden Sie die Pfeiltasten, um den Cursor in die erste Zelle unter der Überschrift „xStat“ zu bewegen. Geben Sie den ersten Wert ein und drücken Sie die Eingabetaste. Am unteren Rand des Bildschirms wird „xStat (1) = __“ mit dem eingegebenen Wert anstelle eines Leerzeichens angezeigt. Nachdem Sie die Eingabetaste gedrückt haben, erscheint der eingegebene Wert in der Tabelle und der Cursor springt in die nächste Zeile; Dadurch wird unten auf dem Bildschirm „xStat(2) = __“ angezeigt.

      • Geben Sie alle Werte der Variable „x“ ein.
      • Wenn Sie alle Werte für die x-Variable eingegeben haben, navigieren Sie mit den Pfeiltasten zur Spalte yStat und geben Sie die Werte für die y-Variable ein.
      • Nachdem Sie alle Zahlenpaare eingegeben haben, drücken Sie Beenden, um den Bildschirm zu löschen und den Aggregationsmodus zu verlassen.
    4. Berechnen Sie den Korrelationskoeffizienten. Sie charakterisiert, wie nahe die Daten an einer geraden Linie liegen. Der Grafikrechner kann schnell die passende Gerade bestimmen und den Korrelationskoeffizienten berechnen.

      • Klicken Sie auf Statistik (Statistik) - Berechnen (Berechnungen). Drücken Sie auf dem TI-86 - - .
      • Wählen Sie die Funktion "Lineare Regression". Drücken Sie auf dem TI-86 auf , das mit „LinR“ beschriftet ist. Auf dem Bildschirm wird die Zeile „LinR _“ mit einem blinkenden Cursor angezeigt.
      • Geben Sie nun die Namen von zwei Variablen ein: xStat und yStat.
        • Öffnen Sie auf dem TI-86 die Namensliste; drücken Sie dazu – – .
        • Die verfügbaren Variablen werden in der unteren Zeile des Bildschirms angezeigt. Wählen Sie (wahrscheinlich durch Drücken von F1 oder F2), geben Sie ein Komma ein und wählen Sie dann .
        • Drücken Sie die Eingabetaste, um die eingegebenen Daten zu verarbeiten.

7.3.1. Korrelations- und Bestimmtheitsmaße. Kann quantifiziert werden Nähe der Kommunikation zwischen Faktoren und Orientierung(direkt oder umgekehrt) durch Berechnung von:

1) wenn es notwendig ist, eine lineare Beziehung zwischen zwei Faktoren zu bestimmen, - Paarkoeffizient Korrelationen: in 7.3.2 und 7.3.3 die Operationen zur Berechnung des gepaarten linearen Bravais-Pearson-Korrelationskoeffizienten ( r) und Spearmans paarweiser Rangkorrelationskoeffizient ( r);

2) wenn wir die Beziehung zwischen zwei Faktoren bestimmen wollen, diese Beziehung aber eindeutig nichtlinear ist, dann Korrelationsbeziehung ;

3) wenn wir die Beziehung zwischen einem Faktor und einigen anderen Faktoren bestimmen wollen – dann (oder äquivalent „multiple Korrelationskoeffizient“);

4) Wenn wir die Beziehung eines Faktors nur zu einem bestimmten anderen Faktor isoliert identifizieren wollen, der Teil einer Gruppe von Faktoren ist, die den ersten beeinflussen, für den wir den Einfluss aller anderen Faktoren unverändert berücksichtigen müssen, dann privater (partieller) Korrelationskoeffizient .

Jeder Korrelationskoeffizient (r, r) darf im absoluten Wert 1 nicht überschreiten, d. h. –1< r (r) < 1). Если получено значение 1, то это значит, что рассматриваемая зависимость не статистическая, а функциональная, если 0 - корреляции нет вообще.

Das Vorzeichen beim Korrelationskoeffizienten bestimmt die Richtung der Verbindung: Das „+“-Zeichen (oder das Fehlen eines Vorzeichens) bedeutet, dass die Verbindung besteht gerade (positiv), das Zeichen „–“ - dass die Verbindung umkehren (Negativ). Das Vorzeichen hat nichts mit der Dichtheit der Verbindung zu tun.

Der Korrelationskoeffizient charakterisiert den statistischen Zusammenhang. Aber oft ist es notwendig, eine andere Art von Abhängigkeit zu bestimmen, nämlich: Was ist der Beitrag eines bestimmten Faktors zur Bildung eines anderen verwandten Faktors? Diese Art von Abhängigkeit, mit einem gewissen Maß an Konventionalität, ist gekennzeichnet durch Bestimmungskoeffizient (D ) bestimmt durch die Formel D = r 2 ´100% (wobei r der Bravais-Pearson-Korrelationskoeffizient ist, siehe 7.3.2). Wenn die Messungen durchgeführt wurden Ordnungsskala (Rangskala), dann kann mit einem gewissen Verlust an Zuverlässigkeit anstelle des Werts von r der Wert von r (Korrelationskoeffizient nach Spearman, siehe 7.3.3) in die Formel eingesetzt werden.

Wenn wir zum Beispiel als Merkmal für die Abhängigkeit von Faktor B von Faktor A den Korrelationskoeffizienten r = 0,8 oder r = –0,8 erhalten, dann ist D = 0,8 2 ´100% = 64%, also etwa 2 ½ 3. Daher beträgt der Beitrag von Faktor A und seinen Änderungen zur Bildung von Faktor B ungefähr 2 ½ 3 aus dem Gesamtbeitrag aller Faktoren im Allgemeinen.

7.3.2. Bravais-Pearson-Korrelationskoeffizient. Das Verfahren zur Berechnung des Bravais-Pearson-Korrelationskoeffizienten ( r ) kann nur dann verwendet werden, wenn der Zusammenhang anhand von Stichproben mit normaler Häufigkeitsverteilung ( Normalverteilung ) und durch Messungen in Skalen von Intervallen oder Verhältnissen erhalten. Berechnungsformel dieser Korrelationskoeffizient:



å ( x ich - )( j ich-)

r = .

n×sx×sy

Was zeigt der Korrelationskoeffizient? Erstens zeigt das Vorzeichen beim Korrelationskoeffizienten die Richtung des Zusammenhangs an, nämlich: Das „–“-Zeichen zeigt an, dass der Zusammenhang besteht umkehren, oder Negativ(Es gibt einen Trend: Wenn die Werte eines Faktors abnehmen, steigen die entsprechenden Werte des anderen Faktors, und wenn sie zunehmen, nehmen sie ab), und das Fehlen eines Vorzeichens oder des „+“ -Zeichens zeigt an gerade, oder positiv Verbindungen (es gibt einen Trend: Mit einer Zunahme der Werte eines Faktors steigen die Werte des anderen und mit einer Abnahme sinken sie). Zweitens zeigt der absolute (vorzeichenunabhängige) Wert des Korrelationskoeffizienten die Enge (Stärke) der Verbindung an. Es ist üblich anzunehmen (eher konventionell): für Werte von r< 0,3 корреляция sehr schwach, oft wird es einfach nicht berücksichtigt, für 0,3 £ r< 5 корреляция schwach, für 0,5 £ r< 0,7) - Durchschnitt, bei 0,7 £ r £ 0,9) - stark und schließlich für r > 0,9 - sehr stark. In unserem Fall (r » 0,83) ist die Beziehung umgekehrt (negativ) und stark.

Denken Sie daran, dass die Werte des Korrelationskoeffizienten im Bereich von -1 bis +1 liegen können. Wenn der Wert von r diese Grenzen überschreitet, zeigt er dies in den Berechnungen an ein Fehler wurde gemacht . Wenn ein r= 1, das bedeutet, dass der Zusammenhang nicht statistisch, sondern funktional ist - was in Sport, Biologie, Medizin praktisch nicht vorkommt. Zwar ist bei einer geringen Anzahl von Messungen eine zufällige Auswahl von Werten möglich, die ein Bild eines funktionellen Zusammenhangs vermittelt, jedoch ist ein solcher Fall umso unwahrscheinlicher, je größer das Volumen der verglichenen Stichproben (n) ist, d.h Anzahl der Paare verglichener Messungen.

Die Berechnungstabelle (Tabelle 7.1) ist nach der Formel aufgebaut.

Tabelle 7.1.

Berechnungstabelle für die Bravais-Pearson-Berechnung

x ich y ich (x ich-) (x ich – ) 2 (j ich-) (j ich – ) 2 (x ich - )( j ich-)
13,2 4,75 0,2 0,04 –0,35 0,1225 – 0,07
13,5 4,7 0,5 0,25 – 0,40 0,1600 – 0,20
12,7 5,10 – 0,3 0,09 0,00 0,0000 0,00
12,5 5,40 – 0,5 0,25 0,30 0,0900 – 0,15
13,0 5,10 0,0 0,00 0,00 0.0000 0,00
13,2 5,00 0,1 0,01 – 0,10 0,0100 – 0,02
13,1 5,00 0,1 0,01 – 0,10 0,0100 – 0,01
13,4 4,65 0,4 0,16 – 0,45 0,2025 – 0,18
12,4 5,60 – 0,6 0,36 0,50 0,2500 – 0,30
12,3 5,50 – 0,7 0,49 0,40 0,1600 – 0,28
12,7 5,20 –0,3 0,09 0,10 0,0100 – 0,03
åx ich \u003d 137 \u003d 13.00 åy ich =56,1 =5,1 å( x ich - ) 2 \u003d \u003d 1,78 å( j i – ) 2 = = 1,015 å( x ich - )( j i – )= = –1,24

Weil die s x= ï ï = ï ï» 0,42, ein

s y= ï ï» 0,32, r" –1,24ï (11´0.42´0.32) » –1,24ï 1,48 » –0,83 .

Mit anderen Worten, Sie müssen den Korrelationskoeffizienten sehr genau kennen kann nicht den absoluten Wert von 1,0 überschreiten. Dies vermeidet oft gröbste Fehler, genauer gesagt - um die in den Berechnungen gemachten Fehler zu finden und zu korrigieren.

7.3.3. Spearman-Korrelationskoeffizient. Wie bereits erwähnt, ist es möglich, den Bravais-Pearson-Korrelationskoeffizienten (r) nur in den Fällen anzuwenden, in denen die analysierten Faktoren in Bezug auf die Häufigkeitsverteilung nahezu normal sind und die Werte der Variante unbedingt durch Messungen an der erhalten werden Skala von Verhältnissen oder auf der Skala von Intervallen, was passiert, wenn es sich um ausgedrückte physikalische Einheiten handelt. In anderen Fällen wird der Spearman-Korrelationskoeffizient gefunden ( r). Allerdings ist dieses Verhältnis kann gelten auch dort, wo es erlaubt (und wünschenswert) ist ! ) Wenden Sie den Bravais-Pearson-Korrelationskoeffizienten an. Es ist jedoch zu beachten, dass das Verfahren zur Bestimmung des Bravais-Pearson-Koeffizienten gilt mehr Kraft ("auflösen Fähigkeit"), deshalb r informativer als r. Auch bei einem großen n Abweichung r kann in der Größenordnung von ±10 % liegen.

Tabelle 7.2 Berechnungsformel für den Koeffizienten

x ich y ich R. x R. y |d R. | d R 2 Spearman-Korrelationskoeffizient

13,2 4,75 8,5 3,0 5,5 30,25 r= 1 – . Vos

13,5 4,70 11,0 2,0 9,0 81,00 Wir verwenden unser Beispiel

12,7 5,10 4,5 6,5 2,0 4,00 zur Berechnung r, aber lass uns bauen

12,5 5,40 3,0 9,0 6,0 36,00 andere Tabelle (Tabelle 7.2).

13,0 5,10 6,0 6,5 0,5 0,25 Werte ersetzen:

13,2 5,00 8,5 4,5 4,0 16,00 r = 1– =

13,1 5,00 7,0 4,5 2,5 6,25 =1– 2538:1320 » 1–1,9 » – 0,9.

13,4 4,65 10,0 1,0 9,0 81,00 Wir sehen: r ist ein bisschen geworden

12,4 5,60 2,0 11,0 9,0 81,00 mehr als r, aber das ist anders

12,3 5,50 1,0 10,0 9,0 81,00 nicht sehr groß. Immerhin bei

12,7 5,20 4,5 8,0 3,5 12,25 so klein n Werte r und r

åd R 2 = 423 sind sehr ungefähr, nicht sehr zuverlässig, ihr tatsächlicher Wert kann stark schwanken, daher die Differenz r und r in 0,1 ist unbedeutend. In der Regelrals analog betrachtetr , aber weniger genau. Zeichen bei r und r zeigt die Verbindungsrichtung an.

7.3.4. Anwendung und Validierung von Korrelationskoeffizienten. Die Bestimmung des Korrelationsgrades zwischen Faktoren ist notwendig, um die Entwicklung des benötigten Faktors zu steuern: Dazu müssen wir andere Faktoren beeinflussen, die ihn signifikant beeinflussen, und wir müssen das Maß ihrer Wirksamkeit kennen. Um vorgefertigte Tests zu entwickeln oder auszuwählen, ist es notwendig, die Zusammenhänge der Faktoren zu kennen: Der Informationsgehalt eines Tests wird durch die Korrelation seiner Ergebnisse mit den Ausprägungen eines für uns interessanten Merkmals oder einer Eigenschaft bestimmt. Ohne Kenntnis von Zusammenhängen ist jede Form der Selektion unmöglich.

Es wurde oben darauf hingewiesen, dass im Sport und in der allgemeinen pädagogischen, medizinischen und sogar wirtschaftlichen und soziologischen Praxis großes Interesse stellt die Definition von dar Beitrag , was die ein Faktor trägt zur Bildung eines anderen bei. Dies liegt daran, dass zusätzlich zu den betrachteten Faktor-Ursachen auf Ziel(uns interessierende) Faktor Akt, die jeweils den einen oder anderen Beitrag dazu leisten, und andere.

Es wird angenommen, dass das Maß für den Beitrag jedes Faktors ursächlich sein kann Bestimmtheitsmaß D ich = r 2 ´100%. Also zum Beispiel, wenn r = 0,6, d.h. das Verhältnis zwischen den Faktoren A und B ist durchschnittlich, dann ist D = 0,6 2 ´100% = 36%. In dem Wissen also, dass der Beitrag von Faktor A zur Bildung von Faktor B ungefähr 1 beträgt ½ 3 ist es beispielsweise möglich, ungefähr 1 zu widmen ½ 3 Trainingszeiten. Wenn der Korrelationskoeffizient r \u003d 0,4 ist, dann D \u003d r 2 100% \u003d 16% oder ungefähr 1 ½ 6 - mehr als zweimal weniger, und nach dieser Logik sollte nur 1 für seine Entwicklung gegeben werden ½ 6 Teil der Trainingszeit.

Die Werte von D i für verschiedene signifikante Faktoren geben eine ungefähre Vorstellung von der quantitativen Beziehung ihrer Einflüsse auf den für uns interessierenden Zielfaktor, an dessen Verbesserung wir tatsächlich an anderen Faktoren arbeiten ( zum Beispiel arbeitet ein Weitspringer daran, die Geschwindigkeit seines Sprints zu erhöhen, da dies der Faktor ist, der den größten Beitrag zur Bildung des Ergebnisses bei Sprüngen leistet).

Erinnern Sie sich daran, indem Sie definieren D Anstatt von r stellen r, obwohl natürlich die Genauigkeit der Bestimmung geringer ist.

Aufgrund selektiv(berechnet aus Stichprobendaten) des Korrelationskoeffizienten, kann nicht allgemein auf einen Zusammenhang zwischen den betrachteten Faktoren geschlossen werden. Um eine solche Schlussfolgerung mit unterschiedlicher Gültigkeit zu ziehen, verwenden Sie den Standard Korrelation Signifikanzkriterien. Ihre Anwendung geht von einem linearen Zusammenhang zwischen den Faktoren und aus Normalverteilung Frequenzen in jedem von ihnen (d. h. nicht eine selektive, sondern ihre allgemeine Darstellung).

Sie können beispielsweise Student's t-Tests anwenden. Seine Rasse

gerade Formel: tp= –2 , wobei k der Korrelationskoeffizient der untersuchten Stichprobe ist, a n- das Volumen der verglichenen Proben. Der resultierende berechnete Wert des t-Kriteriums (t p) wird mit dem Tabellenwert auf dem von uns gewählten Signifikanzniveau und der Anzahl der Freiheitsgrade n = n - 2 verglichen. Um die Rechenarbeit loszuwerden, können Sie verwenden ein besonderer Tisch kritische Werte von Stichprobenkorrelationskoeffizienten(siehe oben), entsprechend dem Vorliegen eines signifikanten Zusammenhangs zwischen den Faktoren (unter Berücksichtigung n und a).

Tabelle 7.3.

Grenzwerte der Zuverlässigkeit des Stichprobenkorrelationskoeffizienten

Die Anzahl der Freiheitsgrade bei der Bestimmung der Korrelationskoeffizienten wird gleich 2 genommen (d. h. n= 2) In der Tabelle angegeben. 7,3-Werte haben eine untere Grenze des Konfidenzintervalls Stimmt der Korrelationskoeffizient ist 0, das heißt, bei solchen Werten kann nicht argumentiert werden, dass die Korrelation überhaupt stattfindet. Wenn der Wert des Stichöher ist als in der Tabelle angegeben, kann auf dem entsprechenden Signifikanzniveau davon ausgegangen werden, dass der wahre Korrelationskoeffizient nicht gleich Null ist.

Aber die Antwort auf die Frage, ob es einen wirklichen Zusammenhang zwischen den betrachteten Faktoren gibt, lässt Raum für eine andere Frage: in welchem ​​Intervall wahrer Wert Korrelationskoeffizient, wie er eigentlich sein kann, mit unendlich groß n? Dieses Intervall für einen bestimmten Wert r und n Vergleichsfaktoren können berechnet werden, aber es ist bequemer, ein System von Diagrammen zu verwenden ( Nomogramm), wo jedes Kurvenpaar für einige der oben angegebenen konstruiert ist n, entspricht den Grenzen des Intervalls.

Reis. 7.4. Vertrauensgrenzen des Stic(a = 0,05). Jede Kurve entspricht der darüber liegenden. n.

Bezugnehmend auf das Nomogramm in Abb. 7.4 ist es möglich, das Werteintervall des wahren Korrelationskoeffizienten für die berechneten Werte des Sticbei a = 0,05 zu bestimmen.

7.3.5. Korrelationsbeziehungen. Wenn das Paar Korrelation nichtlinear, ist es unmöglich, den Korrelationskoeffizienten zu berechnen, zu bestimmen Korrelationsbeziehungen . Zwingende Anforderung: Merkmale müssen auf einer Verhältnisskala oder auf einer Intervallskala gemessen werden. Sie können die Korrelationsabhängigkeit des Faktors berechnen X vom Faktor Y und Korrelationsabhängigkeit des Faktors Y vom Faktor X- Sie sind anders. Mit kleinem Volumen n berücksichtigten Stichproben, die Faktoren darstellen, können Sie zur Berechnung der Korrelationsbeziehungen die folgenden Formeln verwenden:

Korrelationsverhältnis h x ½ y= ;

Korrelationsverhältnis h y ½x= .

Hier und sind die arithmetischen Mittel der Proben X und Y und - innerhalb der Klasse arithmetische Mittelwerte. Das heißt, das arithmetische Mittel dieser Werte in der Stichprobe von Faktor X, mit denen gleiche Werte konjugieren in der Stichprobe von Faktor Y (wenn beispielsweise Faktor X die Werte 4, 6 und 5 hat, denen 3 Optionen mit demselben Wert von 9 in der Stichprobe von Faktor Y zugeordnet sind, dann = (4+6+ 5) ½ 3 = 5). Dementsprechend - das arithmetische Mittel der Werte in der Stichprobe des Faktors Y, die mit den gleichen Werten in der Stichprobe des Faktors X verbunden sind. Geben wir ein Beispiel und berechnen Sie:

X: 75 77 78 76 80 79 83 82 ; Y: 42 42 43 43 43 44 44 45 .

Tabelle 7.4

Berechnungstabelle

x ich y ich x y x ich – x (x ich – x) 2 x ich - x y (x ichx y) 2
–4 –1
–2
–3 –2
–1
–3
x=79 y=43 S=76 S=28

Deshalb h y ½ x= » 0,63.

7.3.6. Partielle und multiple Korrelationskoeffizienten. Um die Beziehung zwischen 2 Faktoren zu bewerten, gehen wir bei der Berechnung der Korrelationskoeffizienten standardmäßig davon aus, dass keine anderen Faktoren einen Einfluss auf diese Beziehung haben. In Wirklichkeit ist dies nicht der Fall. So wird das Verhältnis zwischen Gewicht und Körpergröße ganz wesentlich durch den Kaloriengehalt der Ernährung beeinflusst, der Wert der Systematik physische Aktivität, Vererbung usw. Wenn es notwendig ist, die Beziehung zwischen 2 Faktoren zu beurteilen berücksichtigen Sie die erheblichen Auswirkungen andere Faktoren und wie man sich gleichzeitig von ihnen isolieren kann, Betrachtet man sie unverändert, Berechnung Privatgelände (Andernfalls - teilweise ) Korrelationskoeffizienten.

Beispiel: Sie müssen gepaarte Abhängigkeiten zwischen 3 wesentlichen auswerten Betriebsfaktoren X, Y und Z. bezeichnen r XY (Z) privater (partieller) Korrelationskoeffizient zwischen den Faktoren X und Y (in diesem Fall wird der Wert des Faktors Z als unverändert betrachtet), r ZX (Y) - partieller Korrelationskoeffizient zwischen den Faktoren Z und X (mit dem konstanten Wert des Faktors Y), r YZ (X) - partieller Korrelationskoeffizient zwischen den Faktoren Y und Z (mit dem konstanten Wert des Faktors X). Unter Verwendung der berechneten einfachen gepaarten (nach Bravais-Pearson) Korrelationskoeffizienten r xy, r XZ und r YZ, m

Sie können private (partielle) Korrelationskoeffizienten mit den folgenden Formeln berechnen:

rXY- r XZ´ r YZ r XZ- r XY' r ZY r ZY –r ZX ´ r YZ

r XY (Z) = ; r XZ (Y) = ; r ZY (X) =

Ö(1– r 2XZ)(1– r 2 YZ) Ö(1– r 2XY)(1– r 2 ZY) Ö(1– r 2ZX)(1– r 2YX)

Und partielle Korrelationskoeffizienten können Werte von -1 bis +1 annehmen. Durch Quadrieren erhalten wir die entsprechenden Quotienten Bestimmungskoeffizienten auch genannt private Sicherheitsmaßnahmen(Multiplizieren mit 100, wir drücken in % aus). Partielle Korrelationskoeffizienten unterscheiden sich mehr oder weniger von einfachen (vollständigen) Paarkoeffizienten, was von der Stärke des Einflusses des 3. Faktors auf sie abhängt (wie unverändert). Getestet wird die Nullhypothese (H 0), also die Hypothese, dass zwischen den Faktoren X und Y kein Zusammenhang (Abhängigkeit) besteht (mit der Gesamtzahl der Merkmale k) durch Berechnung des t-Tests nach der Formel: t P = r XY (Z)´ ( n–k) 1 ½ 2 ´ (1– r 2XY(Z)) –1 ½ 2 .

Wenn ein t R< t a n , die Hypothese wird akzeptiert (wir gehen davon aus, dass keine Abhängigkeit besteht), wenn tt a n - die Hypothese wird widerlegt, das heißt, es wird angenommen, dass die Abhängigkeit wirklich stattfindet. t a n wird der Tabelle entnommen t-Schülerkriterium und k- die Anzahl der berücksichtigten Faktoren (in unserem Beispiel 3), die Anzahl der Freiheitsgrade n= n - 3. Andere partielle Korrelationskoeffizienten werden ähnlich geprüft (in die Formel statt r XY (Z) werden entsprechend ersetzt r XZ (Y) bzw r ZY(X)).

Tabelle 7.5

Ausgangsdaten

Ö (1 – 0,71 2)(1 – 0,71 2) Ö (1 – 0,5)(1 – 0,5)

Um die Abhängigkeit des Faktors X von der kombinierten Wirkung mehrerer Faktoren (hier der Faktoren Y und Z) zu beurteilen, berechnen Sie die Werte einfacher gepaarter Korrelationskoeffizienten und berechnen Sie damit mehrfacher Korrelationskoeffizient r X (YZ) :

Ö r 2XY+ r 2XZ-2 r XY' r XZ´ r YZ

r X (YZ) = .

Ö 1 - r 2 YZ

7.2.7. Assoziationskoeffizient. Es ist oft notwendig, die Beziehung zwischen zu quantifizieren Qualität Zeichen, d.h. solche Zeichen, die nicht quantitativ dargestellt (charakterisiert) werden können, die unermesslich. So soll beispielsweise herausgefunden werden, ob ein Zusammenhang besteht zwischen der sportlichen Spezialisierung der Beteiligten und solchen persönlichen Eigenschaften wie Introversion (Bezogenheit der Persönlichkeit auf die Phänomene ihrer eigenen subjektiven Welt) und Extraversion (Bezogenheit der Persönlichkeit auf die Welt der eigenen Person). externe Objekte). Symbole sind in der Tabelle dargestellt. 7.6.

Tabelle 7.6.

X (Jahre) J (mal) Z (mal) X (Jahre) J (mal) Z (mal)
Merkmal 1 Merkmal 2 Introvertiertheit Extraversion
Sport Spiele a b
Gymnastik Mit d

Offensichtlich können die uns hier zur Verfügung stehenden Zahlen nur Verteilungshäufigkeiten sein. Berechnen Sie in diesem Fall Assoziationskoeffizient (anderer Name " Kontingenzkoeffizient "). Betrachten Sie den einfachsten Fall: die Beziehung zwischen zwei Merkmalspaaren, während der berechnete Kontingenzkoeffizient genannt wird tetrachorisch (siehe Tabelle).

Tabelle 7.7.

a = 20 b = 15 a + b = 35
c = 15 d=5 c + d = 20
a + c = 35 b + d = 20 n = 55

Wir berechnen nach der Formel:

ad-bc 100-225-123

Die Berechnung von Assoziationskoeffizienten (Konjugationskoeffizienten) mit einer größeren Anzahl von Merkmalen ist mit Berechnungen unter Verwendung einer ähnlichen Matrix der entsprechenden Ordnung verbunden.

Bei der Untersuchung verschiedener sozioökonomischer Phänomene wird zwischen einem funktionalen Zusammenhang und einer stochastischen Abhängigkeit unterschieden. Eine funktionale Beziehung ist eine Art von Beziehung, bei der ein bestimmter Wert eines Faktorindikators nur einem Wert des effektiven Indikators entspricht. Die funktionale Beziehung manifestiert sich in allen Fällen der Studie und für jede spezifische Einheit der analysierten Population.

Gepostet auf www.site

In dem Fall, dass die kausale Abhängigkeit nicht in jedem einzelnen Fall, sondern im Allgemeinen für die gesamte beobachtete Population, den Durchschnitt für eine signifikante Anzahl von Beobachtungen, gilt, dann ist eine solche Abhängigkeit stochastisch. Ein Sonderfall der stochastischen Abhängigkeit ist eine Korrelation, bei der eine Änderung des Durchschnittswerts des effektiven Indikators durch eine Änderung der Werte von Faktorindikatoren verursacht wird. Die Berechnung des Grades der Nähe und Richtung der Kommunikation ist eine wesentliche Aufgabe der Forschung und Quantifizierung die Beziehung verschiedener sozioökonomischer Phänomene. Um den Grad der Nähe der Beziehung zwischen verschiedenen Indikatoren zu bestimmen, muss die Höhe des Verhältnisses der Änderung des resultierenden Vorzeichens aus der Änderung in einem (im Fall des Studiums gepaarter Abhängigkeiten) oder der Variation mehrerer (im Fall des Studiums) bestimmt werden mehrere Abhängigkeiten) Vorzeichenfaktoren. Um dieses Niveau zu bestimmen, wird der Korrelationskoeffizient verwendet.

Der lineare Korrelationskoeffizient wurde erstmals Anfang der 1990er Jahre eingeführt. 19. Jahrhundert Pearson und zeigt den Grad der Enge und die Richtung der Beziehung zwischen zwei korrelierten Faktoren für den Fall, dass zwischen ihnen eine lineare Beziehung besteht. Bei der Interpretation des erhaltenen Werts des linearen Korrelationskoeffizienten wird der Grad der Nähe der Beziehung zwischen den Zeichen auf der Chaddock-Skala bewertet, eine der Varianten dieser Skala ist in der folgenden Tabelle angegeben:

Chaddock-Skala zur quantitativen Erfassung des Grades der Kommunikationsnähe

Der Wert des Indikators für die Nähe der Kommunikation

Die Art der Beziehung

Praktisch abwesend

Mäßig

Bei der Interpretation des Wertes des Koeffizienten der linearen Korrelation in Kommunikationsrichtung werden direkt und invers unterschieden. Besteht ein direkter Zusammenhang mit einer Wertsteigerung oder Wertminderung eines Faktorattributs, kommt es zu einer Wertsteigerung oder -minderung der Kennziffern des Wirkmerkmals, d.h. der Faktor und das Ergebnis ändern sich in die gleiche Richtung. Beispielsweise trägt eine Erhöhung der Gewinnhöhe zum Wachstum der Rentabilitätsindikatoren bei. Bei Vorhandensein von Feedback ändern sich die Werte des resultierenden Attributs unter dem Einfluss des Faktorattributs, jedoch in die entgegengesetzte Richtung im Vergleich zur Dynamik des Faktorattributs. Beispielsweise sinken mit steigender Arbeitsproduktivität die Stückkosten der Produktion usw.