คณะกรรมาธิการยุโรปไม่มีสิทธิ์ คณะกรรมาธิการยุโรป: แนวคิด ความหมาย และประวัติความเป็นมา คณะกรรมาธิการยุโรป: องค์ประกอบและองค์กรของงาน
ที่มีความสัมพันธ์กันค่าเดียวกันของแอตทริบิวต์หนึ่งสอดคล้องกับค่าที่ต่างกันของแอตทริบิวต์อื่น ตัวอย่างเช่น มีความสัมพันธ์กันระหว่างส่วนสูงและน้ำหนัก ระหว่างอุบัติการณ์ของเนื้องอกร้ายกับอายุ เป็นต้น
มี 2 วิธีในการคำนวณค่าสัมประสิทธิ์สหสัมพันธ์: วิธีกำลังสอง (เพียร์สัน) วิธีอันดับ (สเปียร์แมน)
วิธีที่ถูกต้องที่สุดคือวิธีการของกำลังสอง (เพียร์สัน) ซึ่งค่าสัมประสิทธิ์สหสัมพันธ์ถูกกำหนดโดยสูตร: ที่ไหน
r xy คือสัมประสิทธิ์สหสัมพันธ์ระหว่างอนุกรมทางสถิติ X และ Y
d x คือค่าเบี่ยงเบนของตัวเลขแต่ละตัวของอนุกรมสถิติ X จากค่าเฉลี่ยเลขคณิต
d y คือค่าเบี่ยงเบนของตัวเลขแต่ละตัวของอนุกรมสถิติ Y จากค่าเฉลี่ยเลขคณิต
ค่าสัมประสิทธิ์สหสัมพันธ์สามารถอยู่ในช่วงตั้งแต่ 0 ถึง 1 (-1) ทั้งนี้ขึ้นอยู่กับความแรงของการเชื่อมต่อและทิศทาง ค่าสัมประสิทธิ์สหสัมพันธ์ 0 บ่งชี้ว่าขาดการเชื่อมต่ออย่างสมบูรณ์ ยิ่งระดับสัมประสิทธิ์สหสัมพันธ์ใกล้ชิดกับ 1 หรือ (-1) มากเท่าไร ค่าโดยตรงหรือผลป้อนกลับที่วัดได้ก็จะยิ่งใกล้ขึ้นตามลำดับ ด้วยค่าสัมประสิทธิ์สหสัมพันธ์เท่ากับ 1 หรือ (-1) การเชื่อมต่อจึงสมบูรณ์และใช้งานได้จริง
แบบแผนสำหรับการประเมินความแข็งแรงของสหสัมพันธ์โดยสัมประสิทธิ์สหสัมพันธ์
ความแข็งแกร่งของการเชื่อมต่อ |
ค่าสัมประสิทธิ์สหสัมพันธ์ หากมี |
|
การเชื่อมต่อโดยตรง (+) |
ข้อเสนอแนะ (-) |
|
ไม่มีการเชื่อมต่อ | ||
การสื่อสารมีขนาดเล็ก (อ่อนแอ) |
จาก 0 ถึง +0.29 |
0 ถึง -0.29 |
ค่าเฉลี่ยการสื่อสาร (ปานกลาง) |
+0.3 ถึง +0.69 |
-0.3 ถึง -0.69 |
การสื่อสารที่ยิ่งใหญ่ (แข็งแกร่ง) |
+0.7 ถึง +0.99 |
-0.7 ถึง -0.99 |
การสื่อสารเสร็จสมบูรณ์ (การทำงาน) |
ในการคำนวณค่าสัมประสิทธิ์สหสัมพันธ์โดยใช้วิธีกำลังสองจะรวบรวมตาราง 7 คอลัมน์ มาวิเคราะห์กระบวนการคำนวณโดยใช้ตัวอย่าง:
กำหนดจุดแข็งและลักษณะของความสัมพันธ์ระหว่าง
ได้เวลา- เนส คอพอก (วี y ) |
d x= วี x –เอ็ม x |
d y= วี y –เอ็ม y |
d x d y |
d x 2 |
d y 2 |
|
Σ -1345 ,0 |
Σ 13996 ,0 |
Σ 313 , 47 |
1. กำหนดปริมาณไอโอดีนเฉลี่ยในน้ำ (ในมก. / ลิตร)
มก./ลิตร
2. กำหนดอุบัติการณ์เฉลี่ยของโรคคอพอกเป็น%
3. กำหนดค่าเบี่ยงเบนของแต่ละ V x จาก M x เช่น ดี เอ็กซ์ .
201–138=63; 178–138=40 เป็นต้น
4. ในทำนองเดียวกัน เรากำหนดความเบี่ยงเบนของแต่ละ V y จาก M y นั่นคือ d
0.2–3.8=-3.6; 0.6–38=-3.2 เป็นต้น
5. เรากำหนดผลคูณของการเบี่ยงเบน ผลผลิตที่ได้จะถูกสรุปและรับ
6. เรายกกำลัง d x และสรุปผลลัพธ์ที่ได้
7. ในทำนองเดียวกัน เรายกกำลังสอง d y สรุปผลลัพธ์ เราจะได้
8. สุดท้าย เราแทนที่จำนวนเงินทั้งหมดที่ได้รับลงในสูตร:
ในการแก้ไขปัญหาความน่าเชื่อถือของสัมประสิทธิ์สหสัมพันธ์ ข้อผิดพลาดเฉลี่ยจะถูกกำหนดโดยสูตร:
(หากจำนวนการสังเกตน้อยกว่า 30 ตัวส่วนจะเป็น n-1)
ในตัวอย่างของเรา
ค่าสัมประสิทธิ์สหสัมพันธ์ถือว่าเชื่อถือได้หากสูงกว่าค่าคลาดเคลื่อนเฉลี่ยอย่างน้อย 3 เท่า
ในตัวอย่างของเรา
ดังนั้นค่าสัมประสิทธิ์สหสัมพันธ์จึงไม่น่าเชื่อถือ ซึ่งทำให้จำเป็นต้องเพิ่มจำนวนการสังเกต
สัมประสิทธิ์สหสัมพันธ์สามารถกำหนดได้ค่อนข้างแม่นยำน้อยกว่า แต่ง่ายกว่ามาก วิธีจัดอันดับ (สเปียร์แมน)
วิธีสเปียร์แมน: P=1-(6∑d 2 /n-(n 2 -1))
สร้างคุณลักษณะเปรียบเทียบที่จับคู่กันสองแถว โดยกำหนดแถวที่หนึ่งและสองตามลำดับ x และ y ในเวลาเดียวกัน นำเสนอแถวแรกของแอตทริบิวต์ในลำดับจากมากไปน้อยหรือน้อยไปหามาก และวางค่าตัวเลขของแถวที่สองตรงข้ามกับค่าของแถวแรกที่ตรงกัน
ค่าของคุณลักษณะในแต่ละแถวที่เปรียบเทียบควรแทนที่ด้วยหมายเลขซีเรียล (อันดับ) อันดับหรือตัวเลขระบุตำแหน่งของตัวบ่งชี้ (ค่า) ของแถวที่หนึ่งและสอง โดยที่ ค่าตัวเลขของแอตทริบิวต์ที่สองจะต้องกำหนดอันดับในลำดับเดียวกันกับที่นำมาใช้เมื่อแจกจ่ายให้กับค่าของแอตทริบิวต์แรก ด้วยค่าแอตทริบิวต์ในชุดเดียวกัน จึงควรพิจารณาอันดับเป็นตัวเลขเฉลี่ยจากผลรวมของเลขลำดับของค่าเหล่านี้
กำหนดความแตกต่างในอันดับระหว่าง x และ y (d): d = x - y
ยกกำลังความแตกต่างของอันดับผลลัพธ์ (d 2)
รับผลรวมของกำลังสองของส่วนต่าง (Σ d 2) และแทนที่ค่าที่ได้รับลงในสูตร:
ตัวอย่าง:ใช้วิธีการจัดอันดับเพื่อกำหนดทิศทางและความแรงของความสัมพันธ์ระหว่างระยะเวลาในการให้บริการเป็นปีและความถี่ของการบาดเจ็บหากได้รับข้อมูลต่อไปนี้:
เหตุผลในการเลือกวิธีการ:ในการแก้ปัญหาสามารถเลือกวิธีสหสัมพันธ์อันดับได้ตั้งแต่ แถวแรกของแอตทริบิวต์ "ประสบการณ์การทำงานในปี" มีตัวเลือกที่เปิดอยู่ (ประสบการณ์การทำงานสูงสุด 1 ปีและ 7 ปีหรือมากกว่า) ซึ่งไม่อนุญาตให้ใช้วิธีที่แม่นยำยิ่งขึ้น - วิธีการสี่เหลี่ยม - เพื่อสร้างความสัมพันธ์ระหว่าง เปรียบเทียบลักษณะ
วิธีการแก้. ลำดับของการคำนวณอธิบายไว้ในข้อความ ผลลัพธ์แสดงในตาราง 2.
ตารางที่ 2
ประสบการณ์การทำงานในรอบหลายปี |
จำนวนผู้บาดเจ็บ |
เลขลำดับ (อันดับ) |
อันดับความแตกต่าง |
อันดับความแตกต่างกำลังสอง |
|
ง(x-y) |
d 2 |
||||
เครื่องหมายคู่แต่ละแถวแสดงด้วย "x" และ "y" (คอลัมน์ 1-2)
ค่าของเครื่องหมายแต่ละอันจะถูกแทนที่ด้วยหมายเลขลำดับ (ซีเรียล) ลำดับการแจกแจงอันดับในชุด "x" มีดังนี้: ค่าต่ำสุดของแอตทริบิวต์ (ประสบการณ์สูงสุด 1 ปี) ถูกกำหนดหมายเลขซีเรียล "1" ซึ่งเป็นตัวแปรที่ตามมาของชุดแอตทริบิวต์เดียวกันตามลำดับ ตามลำดับที่เพิ่มขึ้นของหมายเลขซีเรียลที่ 2, 3, 4 และ 5 - อันดับ (ดูคอลัมน์ 3) ลำดับที่คล้ายกันจะสังเกตได้เมื่อกระจายอันดับไปยังจุดสนใจที่สอง "y" (คอลัมน์ 4) ในกรณีที่มีหลายรุ่นที่มีขนาดเท่ากัน (เช่น ในงานมาตรฐาน การบาดเจ็บ 12 และ 12 ครั้งต่อคนงาน 100 คนที่มีประสบการณ์ 3-4 ปีและ 5-6 ปี) จะมีการระบุหมายเลขประจำเครื่อง โดยค่าเฉลี่ยจากผลรวมของ Serial Number ข้อมูลเหล่านี้เกี่ยวกับจำนวนการบาดเจ็บ (12 การบาดเจ็บ) ในการจัดอันดับควรอยู่ในอันดับที่ 2 และ 3 ดังนั้นจำนวนเฉลี่ยของพวกเขาคือ (2 + 3) / 2 = 2.5 ) ควรแจกแจงหมายเลขลำดับเดียวกัน - "2.5" (คอลัมน์ 4)
กำหนดความแตกต่างในอันดับ d = (x - y) - (คอลัมน์ 5)
กำลังยกกำลังสองส่วนต่างอันดับ (d 2) และรับผลรวมกำลังสองของส่วนต่างอันดับ Σ d 2 (คอลัมน์ 6)
คำนวณค่าสัมประสิทธิ์สหสัมพันธ์อันดับโดยใช้สูตร:
โดยที่ n คือจำนวนคู่ของตัวเลือกที่ตรงกันในแถว "x" และแถว "y"
ระยะที่ 3 การหาความสัมพันธ์ระหว่างข้อมูล
ความสัมพันธ์เชิงเส้น
ขั้นตอนสุดท้ายของงานศึกษาความสัมพันธ์ระหว่างปรากฏการณ์คือการประเมินความหนาแน่นของการเชื่อมต่อตามตัวบ่งชี้สหสัมพันธ์ ขั้นตอนนี้สำคัญมากสำหรับการระบุการพึ่งพาระหว่างปัจจัยและสัญญาณผลลัพธ์ และด้วยเหตุนี้ สำหรับความเป็นไปได้ในการวินิจฉัยและทำนายปรากฏการณ์ภายใต้การศึกษา
การวินิจฉัย(จากภาษากรีก. การวินิจฉัยโรค) - การกำหนดสาระสำคัญและคุณสมบัติของสถานะของวัตถุหรือปรากฏการณ์บนพื้นฐานของการศึกษาที่ครอบคลุม
พยากรณ์(จากภาษากรีก การพยากรณ์โรค การพยากรณ์) - การทำนายเฉพาะใด ๆ การตัดสินเกี่ยวกับสถานะของปรากฏการณ์ในอนาคต (พยากรณ์อากาศผลการเลือกตั้ง ฯลฯ ) การพยากรณ์เป็นสมมติฐานทางวิทยาศาสตร์ที่พิสูจน์ได้เกี่ยวกับสถานะในอนาคตที่น่าจะเป็นของระบบ วัตถุหรือปรากฏการณ์ภายใต้การศึกษาและตัวบ่งชี้ที่บ่งบอกถึงสถานะนี้ การพยากรณ์คือการพัฒนาการคาดการณ์ การศึกษาทางวิทยาศาสตร์พิเศษเกี่ยวกับแนวโน้มเฉพาะสำหรับการพัฒนาปรากฏการณ์
จำคำจำกัดความของสหสัมพันธ์:
ความสัมพันธ์- การพึ่งพาอาศัยกันระหว่างตัวแปรสุ่ม ซึ่งแสดงออกในข้อเท็จจริงที่ว่าการกระจายตัวของตัวแปรหนึ่งขึ้นอยู่กับค่าของตัวแปรอื่น
ความสัมพันธ์ไม่เพียงสังเกตระหว่างคุณสมบัติเชิงปริมาณ แต่ยังรวมถึงคุณสมบัติเชิงคุณภาพด้วย มีอยู่ วิธีต่างๆและตัวชี้วัดการประเมินความใกล้ชิดความสัมพันธ์ เราจะเน้นที่ .เท่านั้น ค่าสัมประสิทธิ์สหสัมพันธ์คู่เชิงเส้น ซึ่งใช้เมื่อมีความสัมพันธ์เชิงเส้นตรงระหว่างตัวแปรสุ่ม ในทางปฏิบัติ มักจะจำเป็นต้องกำหนดระดับการเชื่อมต่อระหว่างตัวแปรสุ่มของมิติที่ไม่เท่ากัน ดังนั้นจึงควรมีลักษณะเฉพาะที่ไม่มีมิติของการเชื่อมต่อนี้ ลักษณะดังกล่าว (การวัดการเชื่อมต่อ) คือสัมประสิทธิ์สหสัมพันธ์เชิงเส้น rxyซึ่งถูกกำหนดโดยสูตร
ที่ไหน ,
.
แสดงถึง และ คุณสามารถรับนิพจน์ต่อไปนี้เพื่อคำนวณสัมประสิทธิ์สหสัมพันธ์
.
ถ้าเราแนะนำแนวคิด ค่าเบี่ยงเบนมาตรฐาน ซึ่งแสดงความเบี่ยงเบนของค่าที่สัมพันธ์กันจากค่าเฉลี่ยในเศษส่วนของส่วนเบี่ยงเบนมาตรฐาน:
จากนั้นนิพจน์สำหรับสัมประสิทธิ์สหสัมพันธ์จะอยู่ในรูปแบบ
.
หากคำนวณค่าสัมประสิทธิ์สหสัมพันธ์ตามค่าสุดท้ายของตัวแปรสุ่มเริ่มต้นจากตารางการคำนวณ ค่าสัมประสิทธิ์สหสัมพันธ์สามารถคำนวณได้ตามสูตร
.
สมบัติของสัมประสิทธิ์สหสัมพันธ์เชิงเส้น:
หนึ่ง). ค่าสัมประสิทธิ์สหสัมพันธ์เป็นปริมาณไร้มิติ
2). |r| £1 หรือ .
3). , a,b= const, - ค่าของสัมประสิทธิ์สหสัมพันธ์จะไม่เปลี่ยนแปลงหากค่าทั้งหมดของตัวแปรสุ่ม X และ Y ถูกคูณ (หรือหาร) ด้วยค่าคงที่
4). , a,b= const, - ค่าของสัมประสิทธิ์สหสัมพันธ์จะไม่เปลี่ยนแปลงหากค่าทั้งหมดของตัวแปรสุ่ม X และ Y เพิ่มขึ้น (หรือลดลง) ด้วยค่าคงที่
5). มีความสัมพันธ์ระหว่างสัมประสิทธิ์สหสัมพันธ์และสัมประสิทธิ์การถดถอย:
ค่าสัมประสิทธิ์สหสัมพันธ์สามารถตีความได้ดังนี้
เกณฑ์เชิงปริมาณสำหรับการประเมินความใกล้ชิดของการสื่อสาร:
สำหรับวัตถุประสงค์ในการพยากรณ์ ให้ปริมาณด้วย |r| > 0.7.
ค่าสัมประสิทธิ์สหสัมพันธ์ช่วยให้เราสามารถสรุปได้ว่ามีความสัมพันธ์เชิงเส้นตรงระหว่างตัวแปรสุ่มสองตัว แต่ไม่ได้ระบุว่าตัวแปรใดทำให้เกิดการเปลี่ยนแปลงในอีกตัวแปรหนึ่ง ในความเป็นจริง ความสัมพันธ์ระหว่างตัวแปรสุ่มสองตัวสามารถเกิดขึ้นได้โดยไม่มีความสัมพันธ์เชิงสาเหตุระหว่างตัวตัวแปรเอง เพราะ การเปลี่ยนแปลงในตัวแปรสุ่มทั้งสองอาจเกิดจากการเปลี่ยนแปลง (อิทธิพล) ที่สาม
ค่าสัมประสิทธิ์สหสัมพันธ์ rxyมีความสมมาตรเมื่อเทียบกับตัวแปรสุ่มที่พิจารณาแล้ว Xและ Y. ซึ่งหมายความว่าในการหาค่าสัมประสิทธิ์สหสัมพันธ์นั้น ปริมาณใดที่เป็นอิสระและขึ้นต่อกันโดยสิ้นเชิง
ความสำคัญของสัมประสิทธิ์สหสัมพันธ์
แม้แต่สำหรับปริมาณที่เป็นอิสระ ค่าสัมประสิทธิ์สหสัมพันธ์อาจกลายเป็นไม่เท่ากับศูนย์เนื่องจากการกระจัดกระจายของผลการวัดแบบสุ่มหรือเนื่องจากตัวอย่างขนาดเล็กของตัวแปรสุ่ม ดังนั้นควรตรวจสอบความสำคัญของค่าสัมประสิทธิ์สหสัมพันธ์
ความสำคัญของค่าสัมประสิทธิ์สหสัมพันธ์เชิงเส้นได้รับการทดสอบตาม t-test ของนักเรียน :
.
ถ้า t > t cr(พี น-2) ดังนั้นสัมประสิทธิ์สหสัมพันธ์เชิงเส้นจึงมีนัยสำคัญ ดังนั้น ความสัมพันธ์ทางสถิติก็มีความสำคัญเช่นกัน Xและ Y.
.
เพื่อความสะดวกในการคำนวณ ตารางค่าขีดจำกัดความเชื่อมั่นของสัมประสิทธิ์สหสัมพันธ์สำหรับจำนวนองศาอิสระที่แตกต่างกันได้ถูกสร้างขึ้น ฉ = น–2 (การทดสอบสองด้าน) และระดับนัยสำคัญที่แตกต่างกัน เอ= 0.1; 0.05; 0.01 และ 0.001 ถือว่าสหสัมพันธ์มีนัยสำคัญหากค่าสัมประสิทธิ์สหสัมพันธ์ที่คำนวณได้เกินค่าขีด จำกัด ความเชื่อมั่นของสัมประสิทธิ์สหสัมพันธ์ที่กำหนด ฉและ ก.
สำหรับบิ๊ก นและ เอ= 0.01 ค่าขีด จำกัด ความเชื่อมั่นของสัมประสิทธิ์สหสัมพันธ์สามารถคำนวณได้โดยใช้สูตรโดยประมาณ
.
ในสถิติ ค่าสัมประสิทธิ์สหสัมพันธ์ (ภาษาอังกฤษ ค่าสัมประสิทธิ์สหสัมพันธ์) ใช้เพื่อทดสอบสมมติฐานเกี่ยวกับการมีอยู่ของความสัมพันธ์ระหว่างตัวแปรสุ่มสองตัว และยังช่วยให้คุณประเมินความแข็งแกร่งของตัวแปรได้อีกด้วย ในทฤษฎีพอร์ตโฟลิโอ ตัวบ่งชี้นี้มักจะใช้เพื่อกำหนดลักษณะและความแข็งแกร่งของความสัมพันธ์ระหว่างผลตอบแทนจากหลักทรัพย์ (สินทรัพย์) และผลตอบแทนจากพอร์ตโฟลิโอ หากการแจกแจงตัวแปรเหล่านี้เป็นปกติหรือใกล้เคียงปกติ ให้ใช้ ค่าสัมประสิทธิ์สหสัมพันธ์เพียร์สันซึ่งคำนวณโดยใช้สูตรต่อไปนี้:
ส่วนเบี่ยงเบนมาตรฐานของผลตอบแทนจากหุ้นของบริษัท A จะเท่ากับ 0.6398, หุ้นของบริษัท B 0.5241 และพอร์ต 0.5668 ( คุณสามารถอ่านเกี่ยวกับวิธีการคำนวณค่าเบี่ยงเบนมาตรฐาน)
ค่าสัมประสิทธิ์สหสัมพันธ์ของผลตอบแทนจากหุ้นของบริษัท A และผลตอบแทนจากพอร์ตการลงทุนจะเท่ากับ -0.864 และผลตอบแทนของบริษัท B - 0.816
R A \u003d -0.313 / (0.6389 * 0.5668) \u003d -0.864
R B \u003d 0.242 / (0.5241 * 0.5668) \u003d 0.816
สรุปได้ว่ามีความสัมพันธ์ที่ค่อนข้างแน่นแฟ้นระหว่างผลตอบแทนของพอร์ตและผลตอบแทนจากหุ้นของบริษัท ก และบริษัท ข ในขณะเดียวกัน ผลตอบแทนจากหุ้นของบริษัท ก แสดงให้เห็นถึงการเคลื่อนไหวหลายทิศทางพร้อมกับผลตอบแทนจากพอร์ตการลงทุน และผลตอบแทนจากหุ้นของบริษัท B แสดงให้เห็นการเคลื่อนไหวทางเดียว
ค่าสัมประสิทธิ์สหสัมพันธ์
ความสัมพันธ์- ความสัมพันธ์ทางสถิติของตัวแปรสุ่มตั้งแต่สองตัวขึ้นไป (หรือตัวแปรที่พิจารณาได้ว่ามีระดับความแม่นยำที่ยอมรับได้) ในเวลาเดียวกัน การเปลี่ยนแปลงในปริมาณเหล่านี้อย่างน้อยหนึ่งอย่างจะนำไปสู่การเปลี่ยนแปลงอย่างเป็นระบบในปริมาณอื่นหรือปริมาณอื่นๆ การวัดทางคณิตศาสตร์ของความสัมพันธ์ของตัวแปรสุ่มสองตัวคือสัมประสิทธิ์สหสัมพันธ์
ความสัมพันธ์อาจเป็นค่าบวกและค่าลบ (อาจเป็นไปได้ว่าไม่มีความสัมพันธ์ทางสถิติ ตัวอย่างเช่น สำหรับตัวแปรสุ่มอิสระ) ความสัมพันธ์เชิงลบ - ความสัมพันธ์ซึ่งการเพิ่มขึ้นของตัวแปรหนึ่งเกี่ยวข้องกับการลดลงของตัวแปรอื่นในขณะที่ค่าสัมประสิทธิ์สหสัมพันธ์เป็นค่าลบ ความสัมพันธ์เชิงบวก - ความสัมพันธ์ที่การเพิ่มขึ้นของตัวแปรหนึ่งเกี่ยวข้องกับการเพิ่มขึ้นของตัวแปรอื่น ในขณะที่ค่าสัมประสิทธิ์สหสัมพันธ์เป็นบวก
ความสัมพันธ์อัตโนมัติ - ความสัมพันธ์ทางสถิติระหว่างตัวแปรสุ่มจากชุดเดียวกัน แต่ถ่ายด้วยกะ เช่น สำหรับกระบวนการสุ่ม - กับการเปลี่ยนแปลงของเวลา
อนุญาต X,Y- ตัวแปรสุ่มสองตัวที่กำหนดไว้ในพื้นที่ความน่าจะเป็นเดียวกัน จากนั้นสัมประสิทธิ์สหสัมพันธ์จะได้รับจากสูตร:
,โดยที่ cov หมายถึงความแปรปรวนร่วม และ D คือความแปรปรวนหรือเทียบเท่า
,โดยที่สัญลักษณ์แสดงถึงความคาดหวังทางคณิตศาสตร์
ในการแสดงความสัมพันธ์ดังกล่าวแบบกราฟิก คุณสามารถใช้ระบบพิกัดสี่เหลี่ยมที่มีแกนที่สอดคล้องกับตัวแปรทั้งสองได้ ค่าแต่ละคู่จะถูกทำเครื่องหมายด้วยสัญลักษณ์เฉพาะ พล็อตดังกล่าวเรียกว่า "แผนกระจาย"
วิธีการคำนวณสัมประสิทธิ์สหสัมพันธ์ขึ้นอยู่กับประเภทของมาตราส่วนที่ตัวแปรอ้างอิง ดังนั้น ในการวัดตัวแปรด้วยช่วงเวลาและมาตราส่วนเชิงปริมาณ จำเป็นต้องใช้สัมประสิทธิ์สหสัมพันธ์แบบเพียร์สัน (สหสัมพันธ์ของโมเมนต์ของผลิตภัณฑ์) ถ้าอย่างน้อยหนึ่งในสองตัวแปรมีสเกลลำดับ หรือไม่มีการแจกแจงแบบปกติ ต้องใช้สหสัมพันธ์อันดับของสเปียร์แมนหรือ τ (เทา) ของเคนดัล ในกรณีที่ตัวแปรตัวใดตัวหนึ่งเป็นขั้วแบบสองขั้ว จะใช้ความสัมพันธ์แบบจุดสองชุด และถ้าตัวแปรทั้งสองตัวเป็นแบบขั้วคู่ จะใช้ความสัมพันธ์แบบสี่ช่อง การคำนวณค่าสัมประสิทธิ์สหสัมพันธ์ระหว่างสองตัวแปรที่ไม่ใช่ขั้วคู่นั้นสมเหตุสมผลก็ต่อเมื่อความสัมพันธ์ระหว่างตัวแปรเหล่านี้เป็นเชิงเส้น (ทิศทางเดียว)
ค่าสัมประสิทธิ์สหสัมพันธ์ Kendell
ใช้เพื่อวัดความผิดปกติซึ่งกันและกัน
ค่าสัมประสิทธิ์สหสัมพันธ์ของสเปียร์แมน
คุณสมบัติของสัมประสิทธิ์สหสัมพันธ์
ถ้าเราหาความแปรปรวนร่วมเป็นผลคูณสเกลาร์ของตัวแปรสุ่มสองตัว แล้วค่าปกติของตัวแปรสุ่มจะเท่ากับ![](https://i1.wp.com/dic.academic.ru/pictures/wiki/files/101/e1fb2c1da9fc8d568c8c0432b8ad41bb.png)
การวิเคราะห์สหสัมพันธ์
การวิเคราะห์สหสัมพันธ์- วิธีการประมวลผลข้อมูลสถิติซึ่งประกอบด้วยการศึกษาค่าสัมประสิทธิ์ ( ความสัมพันธ์) ระหว่างตัวแปร ในกรณีนี้ ค่าสัมประสิทธิ์สหสัมพันธ์ระหว่างคู่คุณลักษณะหนึ่งคู่หรือหลายคู่จะถูกเปรียบเทียบเพื่อสร้างความสัมพันธ์ทางสถิติระหว่างกัน
เป้า การวิเคราะห์สหสัมพันธ์- ให้ข้อมูลบางอย่างเกี่ยวกับตัวแปรหนึ่งโดยใช้ตัวแปรอื่น ในกรณีที่สามารถบรรลุเป้าหมายได้ เรากล่าวว่าตัวแปร สัมพันธ์กัน. ในยามที่ ปริทัศน์การยอมรับสมมติฐานของการมีอยู่ของความสัมพันธ์หมายความว่าการเปลี่ยนแปลงในค่าของตัวแปร A จะเกิดขึ้นพร้อมกันกับการเปลี่ยนแปลงตามสัดส่วนในค่าของ B: ถ้าตัวแปรทั้งสองเพิ่มขึ้นแล้ว ความสัมพันธ์เป็นบวกถ้าตัวแปรหนึ่งเพิ่มขึ้นและอีกตัวแปรหนึ่งลดลง ความสัมพันธ์เป็นลบ.
ความสัมพันธ์สะท้อนให้เห็นเฉพาะการพึ่งพาเชิงเส้นของปริมาณเท่านั้น แต่ไม่ได้สะท้อนถึงการเชื่อมต่อที่ใช้งานได้ ตัวอย่างเช่น หากเราคำนวณค่าสัมประสิทธิ์สหสัมพันธ์ระหว่างค่า อา = สผมน(x) และ บี = คoส(x) จากนั้นค่าจะใกล้ศูนย์ กล่าวคือ ไม่มีการพึ่งพากันระหว่างปริมาณ ในขณะเดียวกัน ปริมาณ A และ B มีความเกี่ยวข้องกันอย่างชัดเจนตามหน้าที่ตามกฎหมาย สผมน 2 (x) + คoส 2 (x) = 1 .
ข้อจำกัดของการวิเคราะห์สหสัมพันธ์
พล็อตการแจกแจงคู่ (x,y) พร้อมค่าสัมประสิทธิ์สหสัมพันธ์ x และ y ที่สอดคล้องกันสำหรับแต่ละคู่ โปรดทราบว่าสัมประสิทธิ์สหสัมพันธ์สะท้อนถึงความสัมพันธ์เชิงเส้น (แถวบนสุด) แต่ไม่ได้อธิบายเส้นโค้งความสัมพันธ์ (แถวกลาง) และไม่เหมาะสำหรับการอธิบายความสัมพันธ์ที่ซับซ้อนและไม่เชิงเส้นเลย (แถวล่าง)
- การสมัครเป็นไปได้หากมีกรณีศึกษาเพียงพอ: สำหรับค่าสัมประสิทธิ์สหสัมพันธ์บางประเภท จะมีค่าการสังเกตตั้งแต่ 25 ถึง 100 คู่
- ข้อจำกัดที่สองตามมาจากสมมติฐานของการวิเคราะห์สหสัมพันธ์ ซึ่งรวมถึง การพึ่งพาอาศัยกันเชิงเส้นของตัวแปร. ในหลายกรณี เมื่อทราบได้อย่างน่าเชื่อถือว่าการพึ่งพาอาศัยกันนั้นมีอยู่จริง การวิเคราะห์สหสัมพันธ์อาจไม่ให้ผลลัพธ์เพียงเพราะการพึ่งพาอาศัยกันนั้นไม่เป็นเชิงเส้น (แสดงออกมา เช่น เป็นพาราโบลา)
- โดยตัวของมันเอง ข้อเท็จจริงของความสัมพันธ์ไม่ได้ให้เหตุผลในการยืนยันว่าตัวแปรใดมาก่อนหรือทำให้เกิดการเปลี่ยนแปลง หรือโดยทั่วไปแล้วตัวแปรนั้นเกี่ยวข้องกันเชิงสาเหตุ ตัวอย่างเช่น เนื่องจากการกระทำของปัจจัยที่สาม
พื้นที่สมัคร
วิธีการประมวลผลข้อมูลทางสถิตินี้เป็นที่นิยมอย่างมากในด้านเศรษฐศาสตร์และสังคมศาสตร์ (โดยเฉพาะในด้านจิตวิทยาและสังคมวิทยา) แม้ว่าขอบเขตของสัมประสิทธิ์สหสัมพันธ์จะกว้างขวาง: การควบคุมคุณภาพของผลิตภัณฑ์อุตสาหกรรม โลหะวิทยา เคมีเกษตร อุทชีววิทยา ไบโอเมตริก และอื่นๆ
ความนิยมของวิธีการนี้เกิดจากสองจุด: ค่าสัมประสิทธิ์สหสัมพันธ์ค่อนข้างง่ายต่อการคำนวณ แอปพลิเคชันไม่ต้องการการฝึกอบรมทางคณิตศาสตร์พิเศษ เมื่อรวมกับความง่ายในการตีความ ความง่ายในการใช้สัมประสิทธิ์ได้นำไปสู่การใช้สัมประสิทธิ์อย่างแพร่หลายในด้านการวิเคราะห์ข้อมูลทางสถิติ
ความสัมพันธ์ปลอมๆ
ความเรียบง่ายที่ดึงดูดใจบ่อยครั้งของการศึกษาสหสัมพันธ์กระตุ้นให้ผู้วิจัยวาดข้อสรุปที่ผิดพลาดโดยสัญชาตญาณเกี่ยวกับการมีอยู่ของความสัมพันธ์เชิงสาเหตุระหว่างคู่ของลักษณะ ขณะที่ค่าสัมประสิทธิ์สหสัมพันธ์สร้างความสัมพันธ์ทางสถิติเท่านั้น
ในวิธีการเชิงปริมาณสมัยใหม่ของสังคมศาสตร์ อันที่จริง มีการละทิ้งความพยายามที่จะสร้างความสัมพันธ์เชิงสาเหตุระหว่างตัวแปรที่สังเกตได้ด้วยวิธีเชิงประจักษ์ ดังนั้น เมื่อนักวิจัยในสังคมศาสตร์พูดถึงการสร้างความสัมพันธ์ระหว่างตัวแปรที่พวกเขาศึกษา ไม่ว่าจะเป็นการสันนิษฐานทางทฤษฎีทั่วไปหรือการพึ่งพาทางสถิติก็ตาม
ดูสิ่งนี้ด้วย
มูลนิธิวิกิมีเดีย 2010 .
ดูว่า "สัมประสิทธิ์สหสัมพันธ์" ในพจนานุกรมอื่นๆ คืออะไร:
ค่าสัมประสิทธิ์สหสัมพันธ์- การแสดงทางคณิตศาสตร์ของระดับความสัมพันธ์ระหว่างชุดการวัดสองชุด ปัจจัย +1 บ่งชี้ถึงความสัมพันธ์เชิงบวกที่แข็งแกร่ง: คะแนนสูงในด้านหนึ่ง (เช่น ความสูง) มีความสัมพันธ์กับคะแนนสูงในอีกมิติหนึ่ง... ... สารานุกรมจิตวิทยาที่ยิ่งใหญ่
- ρ คือการวัดความแข็งแกร่งของความสัมพันธ์เชิงเส้นตรงระหว่างตัวแปรสุ่ม X และ Y: โดยที่ EX คือความคาดหวังของ X ความแปรปรวน DX X, EY ความคาดหวังทางคณิตศาสตร์ Y; ความแปรปรวน DY Y; 1 ≤ ρ ≤ 1 ถ้า X, Y มีการเชื่อมต่อเชิงเส้น ดังนั้น ρ = ± 1 สำหรับ… … สารานุกรมธรณีวิทยา
ภาษาอังกฤษ ค่าสัมประสิทธิ์สหสัมพันธ์ เยอรมัน Korrelationskoeffizient. การวัดความใกล้ชิดของความสัมพันธ์ระหว่างตัวแปรตั้งแต่สองตัวขึ้นไป อันตินาซี สารานุกรมสังคมวิทยา 2552 ... สารานุกรมสังคมวิทยา
ค่าสัมประสิทธิ์สหสัมพันธ์- — หัวข้อเทคโนโลยีชีวภาพ EN ค่าสัมประสิทธิ์สหสัมพันธ์ … คู่มือนักแปลทางเทคนิค
ค่าสัมประสิทธิ์สหสัมพันธ์- (สัมประสิทธิ์สหสัมพันธ์) สัมประสิทธิ์สหสัมพันธ์เป็นตัวบ่งชี้ทางสถิติของการพึ่งพาตัวแปรสุ่มสองตัว ความหมายของสัมประสิทธิ์สหสัมพันธ์ ประเภทของสัมประสิทธิ์สหสัมพันธ์ คุณสมบัติของสัมประสิทธิ์สหสัมพันธ์ การคำนวณและการประยุกต์ใช้ ... ... สารานุกรมของนักลงทุน
ค่าสัมประสิทธิ์สหสัมพันธ์- 1.33. ค่าสัมประสิทธิ์สหสัมพันธ์ อัตราส่วนของความแปรปรวนร่วมของตัวแปรสุ่มสองตัวต่อผลคูณของค่าเบี่ยงเบนมาตรฐาน: หมายเหตุ 1 ค่านี้จะใช้ค่าตั้งแต่ลบ 1 ถึงบวก 1 เสมอ รวมถึงค่าสุดขั้วด้วย 2. ถ้าสุ่มสองตัว ... ... หนังสืออ้างอิงพจนานุกรมของข้อกำหนดของเอกสารเชิงบรรทัดฐานและทางเทคนิค
ค่าสัมประสิทธิ์สหสัมพันธ์- (สัมประสิทธิ์สหสัมพันธ์) การวัดความสัมพันธ์ของตัวแปรหนึ่งกับตัวแปรอื่น ดูความสัมพันธ์; ค่าสัมประสิทธิ์สหสัมพันธ์ของเพียร์สันที่ได้รับ; ค่าสัมประสิทธิ์สหสัมพันธ์อันดับของสเปียร์แมน … พจนานุกรมสังคมวิทยาอธิบายขนาดใหญ่
ค่าสัมประสิทธิ์สหสัมพันธ์- ค่าสัมประสิทธิ์สหสัมพันธ์ ตัวบ่งชี้ระดับของความสัมพันธ์เชิงเส้นตรงระหว่างสองตัวแปร: ค่าสัมประสิทธิ์สหสัมพันธ์สามารถเปลี่ยนแปลงได้ตั้งแต่ 1 ถึง 1 หากค่าขนาดใหญ่ของค่าหนึ่งสอดคล้องกัน คุณค่าที่ยิ่งใหญ่อื่นๆ (และ... ... หนังสืออ้างอิงพจนานุกรมเศรษฐศาสตร์
เป้าหมายที่สำคัญที่สุด สถิติคือการศึกษาความสัมพันธ์ที่มีอยู่อย่างเป็นกลางระหว่างปรากฏการณ์ต่างๆ ในการศึกษาทางสถิติของความสัมพันธ์เหล่านี้ จำเป็นต้องระบุความสัมพันธ์เชิงสาเหตุระหว่างตัวชี้วัด กล่าวคือ การเปลี่ยนแปลงของอินดิเคเตอร์บางตัวขึ้นอยู่กับการเปลี่ยนแปลงของอินดิเคเตอร์อื่นๆ
มีการพึ่งพาสองประเภท (การทำงานและความสัมพันธ์) และสัญญาณสองกลุ่ม (ปัจจัยสัญญาณและสัญญาณที่มีประสิทธิภาพ) ตรงกันข้ามกับความสัมพันธ์เชิงหน้าที่ ซึ่งมีความสอดคล้องกันอย่างสมบูรณ์ระหว่างปัจจัยและลักษณะผลลัพธ์ ในความสัมพันธ์เชิงสหสัมพันธ์นั้นไม่มีการโต้ตอบที่สมบูรณ์เช่นนั้น
ความสัมพันธ์- นี่คือความสัมพันธ์ที่ผลกระทบของปัจจัยแต่ละอย่างปรากฏเป็นแนวโน้มเท่านั้น (โดยเฉลี่ย) กับการสังเกตจำนวนมากของข้อมูลจริง ตัวอย่างของความสัมพันธ์ที่พึ่งพาอาศัยกัน ได้แก่ การพึ่งพาอาศัยกันระหว่างขนาดของสินทรัพย์ของธนาคารกับจำนวนกำไรของธนาคาร การเติบโตของผลิตภาพแรงงาน และระยะเวลาในการให้บริการของพนักงาน
เวอร์ชันที่ง่ายที่สุดของการพึ่งพาสหสัมพันธ์คือสหสัมพันธ์คู่ นั่นคือ การพึ่งพาอาศัยกันระหว่างสัญญาณสองตัว (ผลและแฟกทอเรียลหรือระหว่างสัญญาณแฟกทอเรียลสองตัว) ในทางคณิตศาสตร์ การพึ่งพาอาศัยกันนี้สามารถแสดงเป็นการพึ่งพาตัวบ่งชี้ที่มีประสิทธิภาพ y บนตัวบ่งชี้ปัจจัย x การเชื่อมต่อสามารถทำได้โดยตรงและย้อนกลับ ในกรณีแรก เมื่อแอตทริบิวต์ x เพิ่มขึ้น คุณลักษณะ y ก็จะเพิ่มขึ้น เมื่อผลป้อนกลับ เมื่อแอตทริบิวต์ x เพิ่มขึ้น คุณลักษณะ y จะลดลง
งานที่สำคัญที่สุดคือการกำหนดรูปแบบการเชื่อมต่อกับการคำนวณพารามิเตอร์ของสมการที่ตามมาหรือกล่าวอีกนัยหนึ่งคือการค้นหาสมการการเชื่อมต่อ ( สมการถดถอย).
อาจมีหลากหลาย แบบฟอร์มการติดต่อ:
เส้นตรง
เส้นโค้งในรูปแบบ: พาราโบลาอันดับสอง (หรือคำสั่งที่สูงกว่า)
อติพจน์
ฟังก์ชันเลขชี้กำลัง ฯลฯ
พารามิเตอร์สำหรับสมการคัปปลิ้งเหล่านี้มักจะถูกกำหนดจาก ระบบสมการปกติซึ่งต้องเป็นไปตามข้อกำหนดของวิธีกำลังสองน้อยที่สุด (LSM):
ถ้าความสัมพันธ์แสดงด้วยพาราโบลาอันดับสอง ( ) จากนั้นระบบสมการปกติสำหรับการค้นหาพารามิเตอร์ a0, a1, a2 (การเชื่อมต่อดังกล่าวเรียกว่าพหุคูณเนื่องจากหมายถึงการพึ่งพาปัจจัยมากกว่าสองปัจจัย) สามารถแสดงเป็น
งานสำคัญอีกอย่างคือ การวัดความหนาแน่นของการพึ่งพา- สำหรับการสื่อสารทุกรูปแบบสามารถแก้ไขได้โดยการคำนวณอัตราส่วนสหสัมพันธ์เชิงประจักษ์:
ที่ไหน - ความแปรปรวนในชุดของค่าที่เท่าเทียมกันของตัวบ่งชี้ที่มีประสิทธิภาพ
การกระจายในชุดของค่าจริง y
เพื่อกำหนดระดับความหนาแน่นของการพึ่งพาอาศัยเชิงเส้นคู่ ค่าสัมประสิทธิ์สหสัมพันธ์เชิงเส้น r ซึ่งสามารถคำนวณได้โดยใช้ ตัวอย่างเช่น สองสูตรต่อไปนี้:
สัมประสิทธิ์สหสัมพันธ์เชิงเส้นสามารถรับค่าได้ตั้งแต่ -1 ถึง + 1 หรือโมดูโลจาก 0 ถึง 1 ยิ่งค่าสัมบูรณ์เข้าใกล้ 1 มากเท่าใด ความสัมพันธ์ก็จะยิ่งใกล้ชิดกันมากขึ้นเท่านั้น เครื่องหมายระบุทิศทางของการเชื่อมต่อ: "+" - การพึ่งพาโดยตรง "-" เกิดขึ้นพร้อมกับการพึ่งพาผกผัน
ในทางปฏิบัติทางสถิติ อาจมีบางกรณีที่คุณภาพของปัจจัยและคุณลักษณะที่เป็นผลลัพธ์ไม่สามารถแสดงเป็นตัวเลขได้ ดังนั้นในการวัดความใกล้ชิดของการพึ่งพาอาศัยกันจึงจำเป็นต้องใช้ตัวบ่งชี้อื่น เพื่อการนี้ เรียกว่า วิธีการแบบไม่อิงพารามิเตอร์.
ที่แพร่หลายที่สุดคือ อันดับสัมประสิทธิ์สหสัมพันธ์ซึ่งอยู่บนพื้นฐานของหลักการนับค่าของอนุกรมทางสถิติ เมื่อใช้สัมประสิทธิ์สหสัมพันธ์ของอันดับ มันไม่ใช่ค่าของตัวบ่งชี้ x และ y ที่มีความสัมพันธ์กัน แต่เฉพาะตัวเลขของตำแหน่งที่พวกมันครอบครองในแต่ละชุดของค่า ในกรณีนี้ จำนวนของแต่ละยูนิตจะเป็นลำดับ
K. Spearman และ M. Kendall เสนอค่าสัมประสิทธิ์สหสัมพันธ์ตามการใช้วิธีจัดอันดับ
ค่าสัมประสิทธิ์สหสัมพันธ์อันดับสเปียร์แมน(p) ขึ้นอยู่กับการพิจารณาความแตกต่างระหว่างอันดับของค่าของผลลัพธ์และลักษณะปัจจัยและสามารถคำนวณได้โดยสูตร
โดยที่ d = Nx - Ny เช่น ความแตกต่างของอันดับของค่า x และ y แต่ละคู่ n คือจำนวนการสังเกต
ค่าสัมประสิทธิ์สหสัมพันธ์อันดับของ Kendal() สามารถกำหนดได้โดยสูตร
โดยที่ S = P + Q
วิธีการวิจัยแบบไม่อิงพารามิเตอร์ ได้แก่ สัมประสิทธิ์ความสัมพันธ์ Cus และ ปัจจัยฉุกเฉิน Kkon ซึ่งใช้ตัวอย่างเช่นหากจำเป็นต้องตรวจสอบความใกล้ชิดของความสัมพันธ์ระหว่างคุณสมบัติเชิงคุณภาพซึ่งแต่ละรายการจะถูกนำเสนอในรูปแบบของคุณสมบัติทางเลือก
ในการกำหนดสัมประสิทธิ์เหล่านี้ ตารางการคำนวณจะถูกสร้างขึ้น ("ตารางสี่ฟิลด์") โดยที่เพรดิเคตทางสถิติจะถูกนำเสนอในรูปแบบต่อไปนี้:
ป้าย |
|||
ที่นี่ a, b, c, d คือความถี่ของการรวมกัน (การรวมกัน) ของสัญญาณทางเลือกสองทาง n คือผลรวมของความถี่ทั้งหมด
ค่าสัมประสิทธิ์การจัดสรรผลิตภัณฑ์คำนวณโดยสูตร
โปรดทราบว่าสำหรับข้อมูลเดียวกัน ค่าสัมประสิทธิ์ฉุกเฉิน (แปรผันจาก -1 ถึง +1) จะน้อยกว่าค่าสัมประสิทธิ์การเชื่อมโยงเสมอ
หากจำเป็นต้องประเมินความใกล้ชิดของความสัมพันธ์ระหว่างคุณสมบัติทางเลือกที่สามารถใช้กับตัวเลือกมูลค่าเท่าใดก็ได้ ใช้ ค่าสัมประสิทธิ์การผันคำกริยาร่วมกันของเพียร์สัน(เคพี).
เพื่อศึกษาความสัมพันธ์ประเภทนี้ ข้อมูลทางสถิติเบื้องต้นจะอยู่ในรูปแบบของตาราง:
ป้าย |
||||
ที่นี่ mij คือความถี่ของการรวมกันระหว่างคุณลักษณะสองคุณลักษณะ P คือจำนวนคู่ของการสังเกต
ค่าสัมประสิทธิ์ฉุกเฉินร่วมกันของเพียร์สันถูกกำหนดโดยสูตร
ดัชนีคอนจูกาซีกำลังสองเฉลี่ยอยู่ที่ไหน:
ค่าสัมประสิทธิ์ฉุกเฉินร่วมกันแตกต่างกันไปตั้งแต่ 0 ถึง 1
สุดท้ายนี้ก็ต้องพูดถึง ค่าสัมประสิทธิ์เฟชเนอร์ซึ่งกำหนดลักษณะระดับเบื้องต้นของความใกล้ชิดของการเชื่อมต่อ ซึ่งแนะนำให้ใช้เพื่อสร้างความจริงของการมีอยู่ของการเชื่อมต่อเมื่อมีข้อมูลเบื้องต้นจำนวนเล็กน้อย สัมประสิทธิ์นี้ถูกกำหนดโดยสูตร
โดยที่ na คือจำนวนความบังเอิญของสัญญาณของการเบี่ยงเบนของค่าแต่ละค่าจากค่าเฉลี่ยเลขคณิต nb - จำนวนที่ไม่ตรงกันตามลำดับ
ค่าสัมประสิทธิ์ Fechner สามารถเปลี่ยนแปลงได้ภายใน -1.0 Kf +1.0