คณะกรรมาธิการยุโรปไม่มีสิทธิ์ คณะกรรมาธิการยุโรป: แนวคิด ความหมาย และประวัติความเป็นมา คณะกรรมาธิการยุโรป: องค์ประกอบและองค์กรของงาน

ที่มีความสัมพันธ์กันค่าเดียวกันของแอตทริบิวต์หนึ่งสอดคล้องกับค่าที่ต่างกันของแอตทริบิวต์อื่น ตัวอย่างเช่น มีความสัมพันธ์กันระหว่างส่วนสูงและน้ำหนัก ระหว่างอุบัติการณ์ของเนื้องอกร้ายกับอายุ เป็นต้น

มี 2 ​​วิธีในการคำนวณค่าสัมประสิทธิ์สหสัมพันธ์: วิธีกำลังสอง (เพียร์สัน) วิธีอันดับ (สเปียร์แมน)

วิธีที่ถูกต้องที่สุดคือวิธีการของกำลังสอง (เพียร์สัน) ซึ่งค่าสัมประสิทธิ์สหสัมพันธ์ถูกกำหนดโดยสูตร: ที่ไหน

r xy คือสัมประสิทธิ์สหสัมพันธ์ระหว่างอนุกรมทางสถิติ X และ Y

d x คือค่าเบี่ยงเบนของตัวเลขแต่ละตัวของอนุกรมสถิติ X จากค่าเฉลี่ยเลขคณิต

d y คือค่าเบี่ยงเบนของตัวเลขแต่ละตัวของอนุกรมสถิติ Y จากค่าเฉลี่ยเลขคณิต

ค่าสัมประสิทธิ์สหสัมพันธ์สามารถอยู่ในช่วงตั้งแต่ 0 ถึง 1 (-1) ทั้งนี้ขึ้นอยู่กับความแรงของการเชื่อมต่อและทิศทาง ค่าสัมประสิทธิ์สหสัมพันธ์ 0 บ่งชี้ว่าขาดการเชื่อมต่ออย่างสมบูรณ์ ยิ่งระดับสัมประสิทธิ์สหสัมพันธ์ใกล้ชิดกับ 1 หรือ (-1) มากเท่าไร ค่าโดยตรงหรือผลป้อนกลับที่วัดได้ก็จะยิ่งใกล้ขึ้นตามลำดับ ด้วยค่าสัมประสิทธิ์สหสัมพันธ์เท่ากับ 1 หรือ (-1) การเชื่อมต่อจึงสมบูรณ์และใช้งานได้จริง

แบบแผนสำหรับการประเมินความแข็งแรงของสหสัมพันธ์โดยสัมประสิทธิ์สหสัมพันธ์

ความแข็งแกร่งของการเชื่อมต่อ

ค่าสัมประสิทธิ์สหสัมพันธ์ หากมี

การเชื่อมต่อโดยตรง (+)

ข้อเสนอแนะ (-)

ไม่มีการเชื่อมต่อ

การสื่อสารมีขนาดเล็ก (อ่อนแอ)

จาก 0 ถึง +0.29

0 ถึง -0.29

ค่าเฉลี่ยการสื่อสาร (ปานกลาง)

+0.3 ถึง +0.69

-0.3 ถึง -0.69

การสื่อสารที่ยิ่งใหญ่ (แข็งแกร่ง)

+0.7 ถึง +0.99

-0.7 ถึง -0.99

การสื่อสารเสร็จสมบูรณ์

(การทำงาน)

ในการคำนวณค่าสัมประสิทธิ์สหสัมพันธ์โดยใช้วิธีกำลังสองจะรวบรวมตาราง 7 คอลัมน์ มาวิเคราะห์กระบวนการคำนวณโดยใช้ตัวอย่าง:

กำหนดจุดแข็งและลักษณะของความสัมพันธ์ระหว่าง

ได้เวลา-

เนส

คอพอก

(วี y )

d x= วี xเอ็ม x

d y= วี yเอ็ม y

d x d y

d x 2

d y 2

Σ -1345 ,0

Σ 13996 ,0

Σ 313 , 47

1. กำหนดปริมาณไอโอดีนเฉลี่ยในน้ำ (ในมก. / ลิตร)

มก./ลิตร

2. กำหนดอุบัติการณ์เฉลี่ยของโรคคอพอกเป็น%

3. กำหนดค่าเบี่ยงเบนของแต่ละ V x จาก M x เช่น ดี เอ็กซ์ .

201–138=63; 178–138=40 เป็นต้น

4. ในทำนองเดียวกัน เรากำหนดความเบี่ยงเบนของแต่ละ V y จาก M y นั่นคือ d

0.2–3.8=-3.6; 0.6–38=-3.2 เป็นต้น

5. เรากำหนดผลคูณของการเบี่ยงเบน ผลผลิตที่ได้จะถูกสรุปและรับ

6. เรายกกำลัง d x และสรุปผลลัพธ์ที่ได้

7. ในทำนองเดียวกัน เรายกกำลังสอง d y สรุปผลลัพธ์ เราจะได้

8. สุดท้าย เราแทนที่จำนวนเงินทั้งหมดที่ได้รับลงในสูตร:

ในการแก้ไขปัญหาความน่าเชื่อถือของสัมประสิทธิ์สหสัมพันธ์ ข้อผิดพลาดเฉลี่ยจะถูกกำหนดโดยสูตร:

(หากจำนวนการสังเกตน้อยกว่า 30 ตัวส่วนจะเป็น n-1)

ในตัวอย่างของเรา

ค่าสัมประสิทธิ์สหสัมพันธ์ถือว่าเชื่อถือได้หากสูงกว่าค่าคลาดเคลื่อนเฉลี่ยอย่างน้อย 3 เท่า

ในตัวอย่างของเรา

ดังนั้นค่าสัมประสิทธิ์สหสัมพันธ์จึงไม่น่าเชื่อถือ ซึ่งทำให้จำเป็นต้องเพิ่มจำนวนการสังเกต

สัมประสิทธิ์สหสัมพันธ์สามารถกำหนดได้ค่อนข้างแม่นยำน้อยกว่า แต่ง่ายกว่ามาก วิธีจัดอันดับ (สเปียร์แมน)

วิธีสเปียร์แมน: P=1-(6∑d 2 /n-(n 2 -1))

สร้างคุณลักษณะเปรียบเทียบที่จับคู่กันสองแถว โดยกำหนดแถวที่หนึ่งและสองตามลำดับ x และ y ในเวลาเดียวกัน นำเสนอแถวแรกของแอตทริบิวต์ในลำดับจากมากไปน้อยหรือน้อยไปหามาก และวางค่าตัวเลขของแถวที่สองตรงข้ามกับค่าของแถวแรกที่ตรงกัน

ค่าของคุณลักษณะในแต่ละแถวที่เปรียบเทียบควรแทนที่ด้วยหมายเลขซีเรียล (อันดับ) อันดับหรือตัวเลขระบุตำแหน่งของตัวบ่งชี้ (ค่า) ของแถวที่หนึ่งและสอง โดยที่ ค่าตัวเลขของแอตทริบิวต์ที่สองจะต้องกำหนดอันดับในลำดับเดียวกันกับที่นำมาใช้เมื่อแจกจ่ายให้กับค่าของแอตทริบิวต์แรก ด้วยค่าแอตทริบิวต์ในชุดเดียวกัน จึงควรพิจารณาอันดับเป็นตัวเลขเฉลี่ยจากผลรวมของเลขลำดับของค่าเหล่านี้

กำหนดความแตกต่างในอันดับระหว่าง x และ y (d): d = x - y

ยกกำลังความแตกต่างของอันดับผลลัพธ์ (d 2)

รับผลรวมของกำลังสองของส่วนต่าง (Σ d 2) และแทนที่ค่าที่ได้รับลงในสูตร:

ตัวอย่าง:ใช้วิธีการจัดอันดับเพื่อกำหนดทิศทางและความแรงของความสัมพันธ์ระหว่างระยะเวลาในการให้บริการเป็นปีและความถี่ของการบาดเจ็บหากได้รับข้อมูลต่อไปนี้:

เหตุผลในการเลือกวิธีการ:ในการแก้ปัญหาสามารถเลือกวิธีสหสัมพันธ์อันดับได้ตั้งแต่ แถวแรกของแอตทริบิวต์ "ประสบการณ์การทำงานในปี" มีตัวเลือกที่เปิดอยู่ (ประสบการณ์การทำงานสูงสุด 1 ปีและ 7 ปีหรือมากกว่า) ซึ่งไม่อนุญาตให้ใช้วิธีที่แม่นยำยิ่งขึ้น - วิธีการสี่เหลี่ยม - เพื่อสร้างความสัมพันธ์ระหว่าง เปรียบเทียบลักษณะ

วิธีการแก้. ลำดับของการคำนวณอธิบายไว้ในข้อความ ผลลัพธ์แสดงในตาราง 2.

ตารางที่ 2

ประสบการณ์การทำงานในรอบหลายปี

จำนวนผู้บาดเจ็บ

เลขลำดับ (อันดับ)

อันดับความแตกต่าง

อันดับความแตกต่างกำลังสอง

ง(x-y)

d 2

เครื่องหมายคู่แต่ละแถวแสดงด้วย "x" และ "y" (คอลัมน์ 1-2)

ค่าของเครื่องหมายแต่ละอันจะถูกแทนที่ด้วยหมายเลขลำดับ (ซีเรียล) ลำดับการแจกแจงอันดับในชุด "x" มีดังนี้: ค่าต่ำสุดของแอตทริบิวต์ (ประสบการณ์สูงสุด 1 ปี) ถูกกำหนดหมายเลขซีเรียล "1" ซึ่งเป็นตัวแปรที่ตามมาของชุดแอตทริบิวต์เดียวกันตามลำดับ ตามลำดับที่เพิ่มขึ้นของหมายเลขซีเรียลที่ 2, 3, 4 และ 5 - อันดับ (ดูคอลัมน์ 3) ลำดับที่คล้ายกันจะสังเกตได้เมื่อกระจายอันดับไปยังจุดสนใจที่สอง "y" (คอลัมน์ 4) ในกรณีที่มีหลายรุ่นที่มีขนาดเท่ากัน (เช่น ในงานมาตรฐาน การบาดเจ็บ 12 และ 12 ครั้งต่อคนงาน 100 คนที่มีประสบการณ์ 3-4 ปีและ 5-6 ปี) จะมีการระบุหมายเลขประจำเครื่อง โดยค่าเฉลี่ยจากผลรวมของ Serial Number ข้อมูลเหล่านี้เกี่ยวกับจำนวนการบาดเจ็บ (12 การบาดเจ็บ) ในการจัดอันดับควรอยู่ในอันดับที่ 2 และ 3 ดังนั้นจำนวนเฉลี่ยของพวกเขาคือ (2 + 3) / 2 = 2.5 ) ควรแจกแจงหมายเลขลำดับเดียวกัน - "2.5" (คอลัมน์ 4)

กำหนดความแตกต่างในอันดับ d = (x - y) - (คอลัมน์ 5)

กำลังยกกำลังสองส่วนต่างอันดับ (d 2) และรับผลรวมกำลังสองของส่วนต่างอันดับ Σ d 2 (คอลัมน์ 6)

คำนวณค่าสัมประสิทธิ์สหสัมพันธ์อันดับโดยใช้สูตร:

โดยที่ n คือจำนวนคู่ของตัวเลือกที่ตรงกันในแถว "x" และแถว "y"

ระยะที่ 3 การหาความสัมพันธ์ระหว่างข้อมูล

ความสัมพันธ์เชิงเส้น

ขั้นตอนสุดท้ายของงานศึกษาความสัมพันธ์ระหว่างปรากฏการณ์คือการประเมินความหนาแน่นของการเชื่อมต่อตามตัวบ่งชี้สหสัมพันธ์ ขั้นตอนนี้สำคัญมากสำหรับการระบุการพึ่งพาระหว่างปัจจัยและสัญญาณผลลัพธ์ และด้วยเหตุนี้ สำหรับความเป็นไปได้ในการวินิจฉัยและทำนายปรากฏการณ์ภายใต้การศึกษา

การวินิจฉัย(จากภาษากรีก. การวินิจฉัยโรค) - การกำหนดสาระสำคัญและคุณสมบัติของสถานะของวัตถุหรือปรากฏการณ์บนพื้นฐานของการศึกษาที่ครอบคลุม

พยากรณ์(จากภาษากรีก การพยากรณ์โรค การพยากรณ์) - การทำนายเฉพาะใด ๆ การตัดสินเกี่ยวกับสถานะของปรากฏการณ์ในอนาคต (พยากรณ์อากาศผลการเลือกตั้ง ฯลฯ ) การพยากรณ์เป็นสมมติฐานทางวิทยาศาสตร์ที่พิสูจน์ได้เกี่ยวกับสถานะในอนาคตที่น่าจะเป็นของระบบ วัตถุหรือปรากฏการณ์ภายใต้การศึกษาและตัวบ่งชี้ที่บ่งบอกถึงสถานะนี้ การพยากรณ์คือการพัฒนาการคาดการณ์ การศึกษาทางวิทยาศาสตร์พิเศษเกี่ยวกับแนวโน้มเฉพาะสำหรับการพัฒนาปรากฏการณ์

จำคำจำกัดความของสหสัมพันธ์:

ความสัมพันธ์- การพึ่งพาอาศัยกันระหว่างตัวแปรสุ่ม ซึ่งแสดงออกในข้อเท็จจริงที่ว่าการกระจายตัวของตัวแปรหนึ่งขึ้นอยู่กับค่าของตัวแปรอื่น

ความสัมพันธ์ไม่เพียงสังเกตระหว่างคุณสมบัติเชิงปริมาณ แต่ยังรวมถึงคุณสมบัติเชิงคุณภาพด้วย มีอยู่ วิธีต่างๆและตัวชี้วัดการประเมินความใกล้ชิดความสัมพันธ์ เราจะเน้นที่ .เท่านั้น ค่าสัมประสิทธิ์สหสัมพันธ์คู่เชิงเส้น ซึ่งใช้เมื่อมีความสัมพันธ์เชิงเส้นตรงระหว่างตัวแปรสุ่ม ในทางปฏิบัติ มักจะจำเป็นต้องกำหนดระดับการเชื่อมต่อระหว่างตัวแปรสุ่มของมิติที่ไม่เท่ากัน ดังนั้นจึงควรมีลักษณะเฉพาะที่ไม่มีมิติของการเชื่อมต่อนี้ ลักษณะดังกล่าว (การวัดการเชื่อมต่อ) คือสัมประสิทธิ์สหสัมพันธ์เชิงเส้น rxyซึ่งถูกกำหนดโดยสูตร

ที่ไหน , .

แสดงถึง และ คุณสามารถรับนิพจน์ต่อไปนี้เพื่อคำนวณสัมประสิทธิ์สหสัมพันธ์

.

ถ้าเราแนะนำแนวคิด ค่าเบี่ยงเบนมาตรฐาน ซึ่งแสดงความเบี่ยงเบนของค่าที่สัมพันธ์กันจากค่าเฉลี่ยในเศษส่วนของส่วนเบี่ยงเบนมาตรฐาน:



จากนั้นนิพจน์สำหรับสัมประสิทธิ์สหสัมพันธ์จะอยู่ในรูปแบบ

.

หากคำนวณค่าสัมประสิทธิ์สหสัมพันธ์ตามค่าสุดท้ายของตัวแปรสุ่มเริ่มต้นจากตารางการคำนวณ ค่าสัมประสิทธิ์สหสัมพันธ์สามารถคำนวณได้ตามสูตร

.

สมบัติของสัมประสิทธิ์สหสัมพันธ์เชิงเส้น:

หนึ่ง). ค่าสัมประสิทธิ์สหสัมพันธ์เป็นปริมาณไร้มิติ

2). |r| £1 หรือ .

3). , a,b= const, - ค่าของสัมประสิทธิ์สหสัมพันธ์จะไม่เปลี่ยนแปลงหากค่าทั้งหมดของตัวแปรสุ่ม X และ Y ถูกคูณ (หรือหาร) ด้วยค่าคงที่

4). , a,b= const, - ค่าของสัมประสิทธิ์สหสัมพันธ์จะไม่เปลี่ยนแปลงหากค่าทั้งหมดของตัวแปรสุ่ม X และ Y เพิ่มขึ้น (หรือลดลง) ด้วยค่าคงที่

5). มีความสัมพันธ์ระหว่างสัมประสิทธิ์สหสัมพันธ์และสัมประสิทธิ์การถดถอย:

ค่าสัมประสิทธิ์สหสัมพันธ์สามารถตีความได้ดังนี้

เกณฑ์เชิงปริมาณสำหรับการประเมินความใกล้ชิดของการสื่อสาร:

สำหรับวัตถุประสงค์ในการพยากรณ์ ให้ปริมาณด้วย |r| > 0.7.

ค่าสัมประสิทธิ์สหสัมพันธ์ช่วยให้เราสามารถสรุปได้ว่ามีความสัมพันธ์เชิงเส้นตรงระหว่างตัวแปรสุ่มสองตัว แต่ไม่ได้ระบุว่าตัวแปรใดทำให้เกิดการเปลี่ยนแปลงในอีกตัวแปรหนึ่ง ในความเป็นจริง ความสัมพันธ์ระหว่างตัวแปรสุ่มสองตัวสามารถเกิดขึ้นได้โดยไม่มีความสัมพันธ์เชิงสาเหตุระหว่างตัวตัวแปรเอง เพราะ การเปลี่ยนแปลงในตัวแปรสุ่มทั้งสองอาจเกิดจากการเปลี่ยนแปลง (อิทธิพล) ที่สาม

ค่าสัมประสิทธิ์สหสัมพันธ์ rxyมีความสมมาตรเมื่อเทียบกับตัวแปรสุ่มที่พิจารณาแล้ว Xและ Y. ซึ่งหมายความว่าในการหาค่าสัมประสิทธิ์สหสัมพันธ์นั้น ปริมาณใดที่เป็นอิสระและขึ้นต่อกันโดยสิ้นเชิง

ความสำคัญของสัมประสิทธิ์สหสัมพันธ์

แม้แต่สำหรับปริมาณที่เป็นอิสระ ค่าสัมประสิทธิ์สหสัมพันธ์อาจกลายเป็นไม่เท่ากับศูนย์เนื่องจากการกระจัดกระจายของผลการวัดแบบสุ่มหรือเนื่องจากตัวอย่างขนาดเล็กของตัวแปรสุ่ม ดังนั้นควรตรวจสอบความสำคัญของค่าสัมประสิทธิ์สหสัมพันธ์

ความสำคัญของค่าสัมประสิทธิ์สหสัมพันธ์เชิงเส้นได้รับการทดสอบตาม t-test ของนักเรียน :

.

ถ้า t > t cr(พี น-2) ดังนั้นสัมประสิทธิ์สหสัมพันธ์เชิงเส้นจึงมีนัยสำคัญ ดังนั้น ความสัมพันธ์ทางสถิติก็มีความสำคัญเช่นกัน Xและ Y.

.

เพื่อความสะดวกในการคำนวณ ตารางค่าขีดจำกัดความเชื่อมั่นของสัมประสิทธิ์สหสัมพันธ์สำหรับจำนวนองศาอิสระที่แตกต่างกันได้ถูกสร้างขึ้น ฉ = น–2 (การทดสอบสองด้าน) และระดับนัยสำคัญที่แตกต่างกัน เอ= 0.1; 0.05; 0.01 และ 0.001 ถือว่าสหสัมพันธ์มีนัยสำคัญหากค่าสัมประสิทธิ์สหสัมพันธ์ที่คำนวณได้เกินค่าขีด จำกัด ความเชื่อมั่นของสัมประสิทธิ์สหสัมพันธ์ที่กำหนด และ ก.

สำหรับบิ๊ก และ เอ= 0.01 ค่าขีด จำกัด ความเชื่อมั่นของสัมประสิทธิ์สหสัมพันธ์สามารถคำนวณได้โดยใช้สูตรโดยประมาณ

.

ในสถิติ ค่าสัมประสิทธิ์สหสัมพันธ์ (ภาษาอังกฤษ ค่าสัมประสิทธิ์สหสัมพันธ์) ใช้เพื่อทดสอบสมมติฐานเกี่ยวกับการมีอยู่ของความสัมพันธ์ระหว่างตัวแปรสุ่มสองตัว และยังช่วยให้คุณประเมินความแข็งแกร่งของตัวแปรได้อีกด้วย ในทฤษฎีพอร์ตโฟลิโอ ตัวบ่งชี้นี้มักจะใช้เพื่อกำหนดลักษณะและความแข็งแกร่งของความสัมพันธ์ระหว่างผลตอบแทนจากหลักทรัพย์ (สินทรัพย์) และผลตอบแทนจากพอร์ตโฟลิโอ หากการแจกแจงตัวแปรเหล่านี้เป็นปกติหรือใกล้เคียงปกติ ให้ใช้ ค่าสัมประสิทธิ์สหสัมพันธ์เพียร์สันซึ่งคำนวณโดยใช้สูตรต่อไปนี้:

ส่วนเบี่ยงเบนมาตรฐานของผลตอบแทนจากหุ้นของบริษัท A จะเท่ากับ 0.6398, หุ้นของบริษัท B 0.5241 และพอร์ต 0.5668 ( คุณสามารถอ่านเกี่ยวกับวิธีการคำนวณค่าเบี่ยงเบนมาตรฐาน)

ค่าสัมประสิทธิ์สหสัมพันธ์ของผลตอบแทนจากหุ้นของบริษัท A และผลตอบแทนจากพอร์ตการลงทุนจะเท่ากับ -0.864 และผลตอบแทนของบริษัท B - 0.816

R A \u003d -0.313 / (0.6389 * 0.5668) \u003d -0.864

R B \u003d 0.242 / (0.5241 * 0.5668) \u003d 0.816

สรุปได้ว่ามีความสัมพันธ์ที่ค่อนข้างแน่นแฟ้นระหว่างผลตอบแทนของพอร์ตและผลตอบแทนจากหุ้นของบริษัท ก และบริษัท ข ในขณะเดียวกัน ผลตอบแทนจากหุ้นของบริษัท ก แสดงให้เห็นถึงการเคลื่อนไหวหลายทิศทางพร้อมกับผลตอบแทนจากพอร์ตการลงทุน และผลตอบแทนจากหุ้นของบริษัท B แสดงให้เห็นการเคลื่อนไหวทางเดียว

ค่าสัมประสิทธิ์สหสัมพันธ์

ความสัมพันธ์- ความสัมพันธ์ทางสถิติของตัวแปรสุ่มตั้งแต่สองตัวขึ้นไป (หรือตัวแปรที่พิจารณาได้ว่ามีระดับความแม่นยำที่ยอมรับได้) ในเวลาเดียวกัน การเปลี่ยนแปลงในปริมาณเหล่านี้อย่างน้อยหนึ่งอย่างจะนำไปสู่การเปลี่ยนแปลงอย่างเป็นระบบในปริมาณอื่นหรือปริมาณอื่นๆ การวัดทางคณิตศาสตร์ของความสัมพันธ์ของตัวแปรสุ่มสองตัวคือสัมประสิทธิ์สหสัมพันธ์

ความสัมพันธ์อาจเป็นค่าบวกและค่าลบ (อาจเป็นไปได้ว่าไม่มีความสัมพันธ์ทางสถิติ ตัวอย่างเช่น สำหรับตัวแปรสุ่มอิสระ) ความสัมพันธ์เชิงลบ - ความสัมพันธ์ซึ่งการเพิ่มขึ้นของตัวแปรหนึ่งเกี่ยวข้องกับการลดลงของตัวแปรอื่นในขณะที่ค่าสัมประสิทธิ์สหสัมพันธ์เป็นค่าลบ ความสัมพันธ์เชิงบวก - ความสัมพันธ์ที่การเพิ่มขึ้นของตัวแปรหนึ่งเกี่ยวข้องกับการเพิ่มขึ้นของตัวแปรอื่น ในขณะที่ค่าสัมประสิทธิ์สหสัมพันธ์เป็นบวก

ความสัมพันธ์อัตโนมัติ - ความสัมพันธ์ทางสถิติระหว่างตัวแปรสุ่มจากชุดเดียวกัน แต่ถ่ายด้วยกะ เช่น สำหรับกระบวนการสุ่ม - กับการเปลี่ยนแปลงของเวลา

อนุญาต X,Y- ตัวแปรสุ่มสองตัวที่กำหนดไว้ในพื้นที่ความน่าจะเป็นเดียวกัน จากนั้นสัมประสิทธิ์สหสัมพันธ์จะได้รับจากสูตร:

,

โดยที่ cov หมายถึงความแปรปรวนร่วม และ D คือความแปรปรวนหรือเทียบเท่า

,

โดยที่สัญลักษณ์แสดงถึงความคาดหวังทางคณิตศาสตร์

ในการแสดงความสัมพันธ์ดังกล่าวแบบกราฟิก คุณสามารถใช้ระบบพิกัดสี่เหลี่ยมที่มีแกนที่สอดคล้องกับตัวแปรทั้งสองได้ ค่าแต่ละคู่จะถูกทำเครื่องหมายด้วยสัญลักษณ์เฉพาะ พล็อตดังกล่าวเรียกว่า "แผนกระจาย"

วิธีการคำนวณสัมประสิทธิ์สหสัมพันธ์ขึ้นอยู่กับประเภทของมาตราส่วนที่ตัวแปรอ้างอิง ดังนั้น ในการวัดตัวแปรด้วยช่วงเวลาและมาตราส่วนเชิงปริมาณ จำเป็นต้องใช้สัมประสิทธิ์สหสัมพันธ์แบบเพียร์สัน (สหสัมพันธ์ของโมเมนต์ของผลิตภัณฑ์) ถ้าอย่างน้อยหนึ่งในสองตัวแปรมีสเกลลำดับ หรือไม่มีการแจกแจงแบบปกติ ต้องใช้สหสัมพันธ์อันดับของสเปียร์แมนหรือ τ (เทา) ของเคนดัล ในกรณีที่ตัวแปรตัวใดตัวหนึ่งเป็นขั้วแบบสองขั้ว จะใช้ความสัมพันธ์แบบจุดสองชุด และถ้าตัวแปรทั้งสองตัวเป็นแบบขั้วคู่ จะใช้ความสัมพันธ์แบบสี่ช่อง การคำนวณค่าสัมประสิทธิ์สหสัมพันธ์ระหว่างสองตัวแปรที่ไม่ใช่ขั้วคู่นั้นสมเหตุสมผลก็ต่อเมื่อความสัมพันธ์ระหว่างตัวแปรเหล่านี้เป็นเชิงเส้น (ทิศทางเดียว)

ค่าสัมประสิทธิ์สหสัมพันธ์ Kendell

ใช้เพื่อวัดความผิดปกติซึ่งกันและกัน

ค่าสัมประสิทธิ์สหสัมพันธ์ของสเปียร์แมน

คุณสมบัติของสัมประสิทธิ์สหสัมพันธ์

ถ้าเราหาความแปรปรวนร่วมเป็นผลคูณสเกลาร์ของตัวแปรสุ่มสองตัว แล้วค่าปกติของตัวแปรสุ่มจะเท่ากับ และผลที่ตามมาของความไม่เท่าเทียมกันของ Cauchy-Bunyakovsky จะเป็น: . , ที่ไหน . นอกจากนี้ในกรณีนี้สัญญาณและ kการแข่งขัน: .

การวิเคราะห์สหสัมพันธ์

การวิเคราะห์สหสัมพันธ์- วิธีการประมวลผลข้อมูลสถิติซึ่งประกอบด้วยการศึกษาค่าสัมประสิทธิ์ ( ความสัมพันธ์) ระหว่างตัวแปร ในกรณีนี้ ค่าสัมประสิทธิ์สหสัมพันธ์ระหว่างคู่คุณลักษณะหนึ่งคู่หรือหลายคู่จะถูกเปรียบเทียบเพื่อสร้างความสัมพันธ์ทางสถิติระหว่างกัน

เป้า การวิเคราะห์สหสัมพันธ์- ให้ข้อมูลบางอย่างเกี่ยวกับตัวแปรหนึ่งโดยใช้ตัวแปรอื่น ในกรณีที่สามารถบรรลุเป้าหมายได้ เรากล่าวว่าตัวแปร สัมพันธ์กัน. ในยามที่ ปริทัศน์การยอมรับสมมติฐานของการมีอยู่ของความสัมพันธ์หมายความว่าการเปลี่ยนแปลงในค่าของตัวแปร A จะเกิดขึ้นพร้อมกันกับการเปลี่ยนแปลงตามสัดส่วนในค่าของ B: ถ้าตัวแปรทั้งสองเพิ่มขึ้นแล้ว ความสัมพันธ์เป็นบวกถ้าตัวแปรหนึ่งเพิ่มขึ้นและอีกตัวแปรหนึ่งลดลง ความสัมพันธ์เป็นลบ.

ความสัมพันธ์สะท้อนให้เห็นเฉพาะการพึ่งพาเชิงเส้นของปริมาณเท่านั้น แต่ไม่ได้สะท้อนถึงการเชื่อมต่อที่ใช้งานได้ ตัวอย่างเช่น หากเราคำนวณค่าสัมประสิทธิ์สหสัมพันธ์ระหว่างค่า อา = ผม(x) และ บี = o(x) จากนั้นค่าจะใกล้ศูนย์ กล่าวคือ ไม่มีการพึ่งพากันระหว่างปริมาณ ในขณะเดียวกัน ปริมาณ A และ B มีความเกี่ยวข้องกันอย่างชัดเจนตามหน้าที่ตามกฎหมาย ผม 2 (x) + o 2 (x) = 1 .

ข้อจำกัดของการวิเคราะห์สหสัมพันธ์

พล็อตการแจกแจงคู่ (x,y) พร้อมค่าสัมประสิทธิ์สหสัมพันธ์ x และ y ที่สอดคล้องกันสำหรับแต่ละคู่ โปรดทราบว่าสัมประสิทธิ์สหสัมพันธ์สะท้อนถึงความสัมพันธ์เชิงเส้น (แถวบนสุด) แต่ไม่ได้อธิบายเส้นโค้งความสัมพันธ์ (แถวกลาง) และไม่เหมาะสำหรับการอธิบายความสัมพันธ์ที่ซับซ้อนและไม่เชิงเส้นเลย (แถวล่าง)

  1. การสมัครเป็นไปได้หากมีกรณีศึกษาเพียงพอ: สำหรับค่าสัมประสิทธิ์สหสัมพันธ์บางประเภท จะมีค่าการสังเกตตั้งแต่ 25 ถึง 100 คู่
  2. ข้อจำกัดที่สองตามมาจากสมมติฐานของการวิเคราะห์สหสัมพันธ์ ซึ่งรวมถึง การพึ่งพาอาศัยกันเชิงเส้นของตัวแปร. ในหลายกรณี เมื่อทราบได้อย่างน่าเชื่อถือว่าการพึ่งพาอาศัยกันนั้นมีอยู่จริง การวิเคราะห์สหสัมพันธ์อาจไม่ให้ผลลัพธ์เพียงเพราะการพึ่งพาอาศัยกันนั้นไม่เป็นเชิงเส้น (แสดงออกมา เช่น เป็นพาราโบลา)
  3. โดยตัวของมันเอง ข้อเท็จจริงของความสัมพันธ์ไม่ได้ให้เหตุผลในการยืนยันว่าตัวแปรใดมาก่อนหรือทำให้เกิดการเปลี่ยนแปลง หรือโดยทั่วไปแล้วตัวแปรนั้นเกี่ยวข้องกันเชิงสาเหตุ ตัวอย่างเช่น เนื่องจากการกระทำของปัจจัยที่สาม

พื้นที่สมัคร

วิธีการประมวลผลข้อมูลทางสถิตินี้เป็นที่นิยมอย่างมากในด้านเศรษฐศาสตร์และสังคมศาสตร์ (โดยเฉพาะในด้านจิตวิทยาและสังคมวิทยา) แม้ว่าขอบเขตของสัมประสิทธิ์สหสัมพันธ์จะกว้างขวาง: การควบคุมคุณภาพของผลิตภัณฑ์อุตสาหกรรม โลหะวิทยา เคมีเกษตร อุทชีววิทยา ไบโอเมตริก และอื่นๆ

ความนิยมของวิธีการนี้เกิดจากสองจุด: ค่าสัมประสิทธิ์สหสัมพันธ์ค่อนข้างง่ายต่อการคำนวณ แอปพลิเคชันไม่ต้องการการฝึกอบรมทางคณิตศาสตร์พิเศษ เมื่อรวมกับความง่ายในการตีความ ความง่ายในการใช้สัมประสิทธิ์ได้นำไปสู่การใช้สัมประสิทธิ์อย่างแพร่หลายในด้านการวิเคราะห์ข้อมูลทางสถิติ

ความสัมพันธ์ปลอมๆ

ความเรียบง่ายที่ดึงดูดใจบ่อยครั้งของการศึกษาสหสัมพันธ์กระตุ้นให้ผู้วิจัยวาดข้อสรุปที่ผิดพลาดโดยสัญชาตญาณเกี่ยวกับการมีอยู่ของความสัมพันธ์เชิงสาเหตุระหว่างคู่ของลักษณะ ขณะที่ค่าสัมประสิทธิ์สหสัมพันธ์สร้างความสัมพันธ์ทางสถิติเท่านั้น

ในวิธีการเชิงปริมาณสมัยใหม่ของสังคมศาสตร์ อันที่จริง มีการละทิ้งความพยายามที่จะสร้างความสัมพันธ์เชิงสาเหตุระหว่างตัวแปรที่สังเกตได้ด้วยวิธีเชิงประจักษ์ ดังนั้น เมื่อนักวิจัยในสังคมศาสตร์พูดถึงการสร้างความสัมพันธ์ระหว่างตัวแปรที่พวกเขาศึกษา ไม่ว่าจะเป็นการสันนิษฐานทางทฤษฎีทั่วไปหรือการพึ่งพาทางสถิติก็ตาม

ดูสิ่งนี้ด้วย

มูลนิธิวิกิมีเดีย 2010 .

ดูว่า "สัมประสิทธิ์สหสัมพันธ์" ในพจนานุกรมอื่นๆ คืออะไร:

    ค่าสัมประสิทธิ์สหสัมพันธ์- การแสดงทางคณิตศาสตร์ของระดับความสัมพันธ์ระหว่างชุดการวัดสองชุด ปัจจัย +1 บ่งชี้ถึงความสัมพันธ์เชิงบวกที่แข็งแกร่ง: คะแนนสูงในด้านหนึ่ง (เช่น ความสูง) มีความสัมพันธ์กับคะแนนสูงในอีกมิติหนึ่ง... ... สารานุกรมจิตวิทยาที่ยิ่งใหญ่

    - ρ คือการวัดความแข็งแกร่งของความสัมพันธ์เชิงเส้นตรงระหว่างตัวแปรสุ่ม X และ Y: โดยที่ EX คือความคาดหวังของ X ความแปรปรวน DX X, EY ความคาดหวังทางคณิตศาสตร์ Y; ความแปรปรวน DY Y; 1 ≤ ρ ≤ 1 ถ้า X, Y มีการเชื่อมต่อเชิงเส้น ดังนั้น ρ = ± 1 สำหรับ… … สารานุกรมธรณีวิทยา

    ภาษาอังกฤษ ค่าสัมประสิทธิ์สหสัมพันธ์ เยอรมัน Korrelationskoeffizient. การวัดความใกล้ชิดของความสัมพันธ์ระหว่างตัวแปรตั้งแต่สองตัวขึ้นไป อันตินาซี สารานุกรมสังคมวิทยา 2552 ... สารานุกรมสังคมวิทยา

    ค่าสัมประสิทธิ์สหสัมพันธ์- — หัวข้อเทคโนโลยีชีวภาพ EN ค่าสัมประสิทธิ์สหสัมพันธ์ … คู่มือนักแปลทางเทคนิค

    ค่าสัมประสิทธิ์สหสัมพันธ์- (สัมประสิทธิ์สหสัมพันธ์) สัมประสิทธิ์สหสัมพันธ์เป็นตัวบ่งชี้ทางสถิติของการพึ่งพาตัวแปรสุ่มสองตัว ความหมายของสัมประสิทธิ์สหสัมพันธ์ ประเภทของสัมประสิทธิ์สหสัมพันธ์ คุณสมบัติของสัมประสิทธิ์สหสัมพันธ์ การคำนวณและการประยุกต์ใช้ ... ... สารานุกรมของนักลงทุน

    ค่าสัมประสิทธิ์สหสัมพันธ์- 1.33. ค่าสัมประสิทธิ์สหสัมพันธ์ อัตราส่วนของความแปรปรวนร่วมของตัวแปรสุ่มสองตัวต่อผลคูณของค่าเบี่ยงเบนมาตรฐาน: หมายเหตุ 1 ค่านี้จะใช้ค่าตั้งแต่ลบ 1 ถึงบวก 1 เสมอ รวมถึงค่าสุดขั้วด้วย 2. ถ้าสุ่มสองตัว ... ... หนังสืออ้างอิงพจนานุกรมของข้อกำหนดของเอกสารเชิงบรรทัดฐานและทางเทคนิค

    ค่าสัมประสิทธิ์สหสัมพันธ์- (สัมประสิทธิ์สหสัมพันธ์) การวัดความสัมพันธ์ของตัวแปรหนึ่งกับตัวแปรอื่น ดูความสัมพันธ์; ค่าสัมประสิทธิ์สหสัมพันธ์ของเพียร์สันที่ได้รับ; ค่าสัมประสิทธิ์สหสัมพันธ์อันดับของสเปียร์แมน … พจนานุกรมสังคมวิทยาอธิบายขนาดใหญ่

    ค่าสัมประสิทธิ์สหสัมพันธ์- ค่าสัมประสิทธิ์สหสัมพันธ์ ตัวบ่งชี้ระดับของความสัมพันธ์เชิงเส้นตรงระหว่างสองตัวแปร: ค่าสัมประสิทธิ์สหสัมพันธ์สามารถเปลี่ยนแปลงได้ตั้งแต่ 1 ถึง 1 หากค่าขนาดใหญ่ของค่าหนึ่งสอดคล้องกัน คุณค่าที่ยิ่งใหญ่อื่นๆ (และ... ... หนังสืออ้างอิงพจนานุกรมเศรษฐศาสตร์

เป้าหมายที่สำคัญที่สุด สถิติคือการศึกษาความสัมพันธ์ที่มีอยู่อย่างเป็นกลางระหว่างปรากฏการณ์ต่างๆ ในการศึกษาทางสถิติของความสัมพันธ์เหล่านี้ จำเป็นต้องระบุความสัมพันธ์เชิงสาเหตุระหว่างตัวชี้วัด กล่าวคือ การเปลี่ยนแปลงของอินดิเคเตอร์บางตัวขึ้นอยู่กับการเปลี่ยนแปลงของอินดิเคเตอร์อื่นๆ

มีการพึ่งพาสองประเภท (การทำงานและความสัมพันธ์) และสัญญาณสองกลุ่ม (ปัจจัยสัญญาณและสัญญาณที่มีประสิทธิภาพ) ตรงกันข้ามกับความสัมพันธ์เชิงหน้าที่ ซึ่งมีความสอดคล้องกันอย่างสมบูรณ์ระหว่างปัจจัยและลักษณะผลลัพธ์ ในความสัมพันธ์เชิงสหสัมพันธ์นั้นไม่มีการโต้ตอบที่สมบูรณ์เช่นนั้น

ความสัมพันธ์- นี่คือความสัมพันธ์ที่ผลกระทบของปัจจัยแต่ละอย่างปรากฏเป็นแนวโน้มเท่านั้น (โดยเฉลี่ย) กับการสังเกตจำนวนมากของข้อมูลจริง ตัวอย่างของความสัมพันธ์ที่พึ่งพาอาศัยกัน ได้แก่ การพึ่งพาอาศัยกันระหว่างขนาดของสินทรัพย์ของธนาคารกับจำนวนกำไรของธนาคาร การเติบโตของผลิตภาพแรงงาน และระยะเวลาในการให้บริการของพนักงาน

เวอร์ชันที่ง่ายที่สุดของการพึ่งพาสหสัมพันธ์คือสหสัมพันธ์คู่ นั่นคือ การพึ่งพาอาศัยกันระหว่างสัญญาณสองตัว (ผลและแฟกทอเรียลหรือระหว่างสัญญาณแฟกทอเรียลสองตัว) ในทางคณิตศาสตร์ การพึ่งพาอาศัยกันนี้สามารถแสดงเป็นการพึ่งพาตัวบ่งชี้ที่มีประสิทธิภาพ y บนตัวบ่งชี้ปัจจัย x การเชื่อมต่อสามารถทำได้โดยตรงและย้อนกลับ ในกรณีแรก เมื่อแอตทริบิวต์ x เพิ่มขึ้น คุณลักษณะ y ก็จะเพิ่มขึ้น เมื่อผลป้อนกลับ เมื่อแอตทริบิวต์ x เพิ่มขึ้น คุณลักษณะ y จะลดลง

งานที่สำคัญที่สุดคือการกำหนดรูปแบบการเชื่อมต่อกับการคำนวณพารามิเตอร์ของสมการที่ตามมาหรือกล่าวอีกนัยหนึ่งคือการค้นหาสมการการเชื่อมต่อ ( สมการถดถอย).

อาจมีหลากหลาย แบบฟอร์มการติดต่อ:

เส้นตรง

เส้นโค้งในรูปแบบ: พาราโบลาอันดับสอง (หรือคำสั่งที่สูงกว่า)

อติพจน์

ฟังก์ชันเลขชี้กำลัง ฯลฯ

พารามิเตอร์สำหรับสมการคัปปลิ้งเหล่านี้มักจะถูกกำหนดจาก ระบบสมการปกติซึ่งต้องเป็นไปตามข้อกำหนดของวิธีกำลังสองน้อยที่สุด (LSM):

ถ้าความสัมพันธ์แสดงด้วยพาราโบลาอันดับสอง ( ) จากนั้นระบบสมการปกติสำหรับการค้นหาพารามิเตอร์ a0, a1, a2 (การเชื่อมต่อดังกล่าวเรียกว่าพหุคูณเนื่องจากหมายถึงการพึ่งพาปัจจัยมากกว่าสองปัจจัย) สามารถแสดงเป็น

งานสำคัญอีกอย่างคือ การวัดความหนาแน่นของการพึ่งพา- สำหรับการสื่อสารทุกรูปแบบสามารถแก้ไขได้โดยการคำนวณอัตราส่วนสหสัมพันธ์เชิงประจักษ์:

ที่ไหน - ความแปรปรวนในชุดของค่าที่เท่าเทียมกันของตัวบ่งชี้ที่มีประสิทธิภาพ

การกระจายในชุดของค่าจริง y

เพื่อกำหนดระดับความหนาแน่นของการพึ่งพาอาศัยเชิงเส้นคู่ ค่าสัมประสิทธิ์สหสัมพันธ์เชิงเส้น r ซึ่งสามารถคำนวณได้โดยใช้ ตัวอย่างเช่น สองสูตรต่อไปนี้:

สัมประสิทธิ์สหสัมพันธ์เชิงเส้นสามารถรับค่าได้ตั้งแต่ -1 ถึง + 1 หรือโมดูโลจาก 0 ถึง 1 ยิ่งค่าสัมบูรณ์เข้าใกล้ 1 มากเท่าใด ความสัมพันธ์ก็จะยิ่งใกล้ชิดกันมากขึ้นเท่านั้น เครื่องหมายระบุทิศทางของการเชื่อมต่อ: "+" - การพึ่งพาโดยตรง "-" เกิดขึ้นพร้อมกับการพึ่งพาผกผัน

ในทางปฏิบัติทางสถิติ อาจมีบางกรณีที่คุณภาพของปัจจัยและคุณลักษณะที่เป็นผลลัพธ์ไม่สามารถแสดงเป็นตัวเลขได้ ดังนั้นในการวัดความใกล้ชิดของการพึ่งพาอาศัยกันจึงจำเป็นต้องใช้ตัวบ่งชี้อื่น เพื่อการนี้ เรียกว่า วิธีการแบบไม่อิงพารามิเตอร์.

ที่แพร่หลายที่สุดคือ อันดับสัมประสิทธิ์สหสัมพันธ์ซึ่งอยู่บนพื้นฐานของหลักการนับค่าของอนุกรมทางสถิติ เมื่อใช้สัมประสิทธิ์สหสัมพันธ์ของอันดับ มันไม่ใช่ค่าของตัวบ่งชี้ x และ y ที่มีความสัมพันธ์กัน แต่เฉพาะตัวเลขของตำแหน่งที่พวกมันครอบครองในแต่ละชุดของค่า ในกรณีนี้ จำนวนของแต่ละยูนิตจะเป็นลำดับ

K. Spearman และ M. Kendall เสนอค่าสัมประสิทธิ์สหสัมพันธ์ตามการใช้วิธีจัดอันดับ

ค่าสัมประสิทธิ์สหสัมพันธ์อันดับสเปียร์แมน(p) ขึ้นอยู่กับการพิจารณาความแตกต่างระหว่างอันดับของค่าของผลลัพธ์และลักษณะปัจจัยและสามารถคำนวณได้โดยสูตร

โดยที่ d = Nx - Ny เช่น ความแตกต่างของอันดับของค่า x และ y แต่ละคู่ n คือจำนวนการสังเกต

ค่าสัมประสิทธิ์สหสัมพันธ์อันดับของ Kendal() สามารถกำหนดได้โดยสูตร

โดยที่ S = P + Q

วิธีการวิจัยแบบไม่อิงพารามิเตอร์ ได้แก่ สัมประสิทธิ์ความสัมพันธ์ Cus และ ปัจจัยฉุกเฉิน Kkon ซึ่งใช้ตัวอย่างเช่นหากจำเป็นต้องตรวจสอบความใกล้ชิดของความสัมพันธ์ระหว่างคุณสมบัติเชิงคุณภาพซึ่งแต่ละรายการจะถูกนำเสนอในรูปแบบของคุณสมบัติทางเลือก

ในการกำหนดสัมประสิทธิ์เหล่านี้ ตารางการคำนวณจะถูกสร้างขึ้น ("ตารางสี่ฟิลด์") โดยที่เพรดิเคตทางสถิติจะถูกนำเสนอในรูปแบบต่อไปนี้:

ป้าย

ที่นี่ a, b, c, d คือความถี่ของการรวมกัน (การรวมกัน) ของสัญญาณทางเลือกสองทาง n คือผลรวมของความถี่ทั้งหมด

ค่าสัมประสิทธิ์การจัดสรรผลิตภัณฑ์คำนวณโดยสูตร

โปรดทราบว่าสำหรับข้อมูลเดียวกัน ค่าสัมประสิทธิ์ฉุกเฉิน (แปรผันจาก -1 ถึง +1) จะน้อยกว่าค่าสัมประสิทธิ์การเชื่อมโยงเสมอ

หากจำเป็นต้องประเมินความใกล้ชิดของความสัมพันธ์ระหว่างคุณสมบัติทางเลือกที่สามารถใช้กับตัวเลือกมูลค่าเท่าใดก็ได้ ใช้ ค่าสัมประสิทธิ์การผันคำกริยาร่วมกันของเพียร์สัน(เคพี).

เพื่อศึกษาความสัมพันธ์ประเภทนี้ ข้อมูลทางสถิติเบื้องต้นจะอยู่ในรูปแบบของตาราง:

ป้าย

ที่นี่ mij คือความถี่ของการรวมกันระหว่างคุณลักษณะสองคุณลักษณะ P คือจำนวนคู่ของการสังเกต

ค่าสัมประสิทธิ์ฉุกเฉินร่วมกันของเพียร์สันถูกกำหนดโดยสูตร

ดัชนีคอนจูกาซีกำลังสองเฉลี่ยอยู่ที่ไหน:

ค่าสัมประสิทธิ์ฉุกเฉินร่วมกันแตกต่างกันไปตั้งแต่ 0 ถึง 1

สุดท้ายนี้ก็ต้องพูดถึง ค่าสัมประสิทธิ์เฟชเนอร์ซึ่งกำหนดลักษณะระดับเบื้องต้นของความใกล้ชิดของการเชื่อมต่อ ซึ่งแนะนำให้ใช้เพื่อสร้างความจริงของการมีอยู่ของการเชื่อมต่อเมื่อมีข้อมูลเบื้องต้นจำนวนเล็กน้อย สัมประสิทธิ์นี้ถูกกำหนดโดยสูตร

โดยที่ na คือจำนวนความบังเอิญของสัญญาณของการเบี่ยงเบนของค่าแต่ละค่าจากค่าเฉลี่ยเลขคณิต nb - จำนวนที่ไม่ตรงกันตามลำดับ

ค่าสัมประสิทธิ์ Fechner สามารถเปลี่ยนแปลงได้ภายใน -1.0 Kf +1.0