คณะกรรมาธิการยุโรปเป็นส่วนหนึ่งของโครงสร้าง คณะกรรมาธิการยุโรป ต้องการความช่วยเหลือเกี่ยวกับหัวข้อ
ในบทความวันนี้ เราจะพูดถึงว่าตัวแปรเกี่ยวข้องกันได้อย่างไร ด้วยความช่วยเหลือของสหสัมพันธ์ เราจะสามารถระบุได้ว่ามีความสัมพันธ์ระหว่างตัวแปรตัวที่หนึ่งและตัวที่สองหรือไม่ ฉันหวังว่าคุณจะพบว่าบทเรียนนี้น่าตื่นเต้นเหมือนกับบทที่แล้ว!
ความสัมพันธ์วัดความแข็งแกร่งและทิศทางของความสัมพันธ์ระหว่าง x และ y รูปนี้แสดงความสัมพันธ์ประเภทต่างๆ เป็นแผนภาพกระจายของคู่อันดับ (x, y) ตามธรรมเนียมแล้ว x จะอยู่บนแกนนอน และ y จะอยู่ในแนวตั้ง
กราฟ A เป็นตัวอย่างของความสัมพันธ์เชิงเส้นเชิงบวก เมื่อ x เพิ่มขึ้น y ก็เพิ่มขึ้นและเป็นเส้นตรง แผนภาพ B แสดงตัวอย่างความสัมพันธ์เชิงเส้นเชิงลบ โดยที่ x เพิ่มขึ้น y ลดลงเชิงเส้น ในกราฟ C เราไม่เห็นความสัมพันธ์ระหว่าง x และ y ตัวแปรเหล่านี้ไม่มีผลซึ่งกันและกันแต่อย่างใด
สุดท้าย พล็อต D เป็นตัวอย่างของความสัมพันธ์ที่ไม่ใช่เชิงเส้นระหว่างตัวแปร เมื่อ x เพิ่มขึ้น y จะลดลงก่อน จากนั้นจึงเปลี่ยนทิศทางและเพิ่มขึ้น
บทความที่เหลืออุทิศให้กับความสัมพันธ์เชิงเส้นระหว่างตัวแปรตามและตัวแปรอิสระ
ค่าสัมประสิทธิ์สหสัมพันธ์
ค่าสัมประสิทธิ์สหสัมพันธ์ r ให้ทั้งความแข็งแกร่งและทิศทางของความสัมพันธ์ระหว่างตัวแปรอิสระและตัวแปรตาม ค่า r อยู่ระหว่าง -1.0 ถึง +1.0 เมื่อ r มี ค่าบวกความสัมพันธ์ระหว่าง x และ y เป็นบวก (แผนภาพ A ในรูป) และเมื่อค่าของ r เป็นลบ ความสัมพันธ์ก็เป็นลบด้วย (แผนภาพ B) ค่าสัมประสิทธิ์สหสัมพันธ์ที่ใกล้ศูนย์แสดงว่าไม่มีกราฟ C ระหว่าง x และ y
ความแข็งแรงของการเชื่อมต่อระหว่าง x และ y ถูกกำหนดโดยค่าความใกล้เคียงของค่าสัมประสิทธิ์สหสัมพันธ์ถึง - 1.0 หรือ + - 1.0 ศึกษารูปต่อไปนี้
พล็อต A แสดงความสัมพันธ์เชิงบวกที่สมบูรณ์แบบระหว่าง x และ y ที่ r = + 1.0 แผนภาพ B เป็นความสัมพันธ์เชิงลบที่สมบูรณ์แบบระหว่าง x และ y ที่ r = -1.0 พล็อต C และ D เป็นตัวอย่างของความสัมพันธ์ที่อ่อนแอกว่าระหว่างตัวแปรตามและตัวแปรอิสระ
ค่าสัมประสิทธิ์สหสัมพันธ์ r กำหนดทั้งความแรงและทิศทางของความสัมพันธ์ระหว่างตัวแปรตามและตัวแปรอิสระ ค่า r มีตั้งแต่ -1.0 (การเชื่อมโยงเชิงลบที่รุนแรง) ถึง +1.0 (การเชื่อมโยงเชิงบวกที่แข็งแกร่ง) สำหรับ r=0 ไม่มีความสัมพันธ์ระหว่าง x และ y
เราสามารถคำนวณค่าสัมประสิทธิ์สหสัมพันธ์จริงโดยใช้สมการต่อไปนี้
ดีดี! ฉันรู้ว่าสมการนี้ดูเหมือนสัญลักษณ์ที่สับสนปนเปกันไปหมด แต่ก่อนที่เราจะตื่นตระหนก ลองใช้ตัวอย่างเกรดข้อสอบกับสมการนี้ก่อน สมมติว่าฉันต้องการทราบว่ามีความสัมพันธ์ระหว่างจำนวนชั่วโมงที่นักเรียนใช้เรียนวิชาสถิติกับคะแนนสอบปลายภาคหรือไม่ ตารางด้านล่างจะช่วยเราแบ่งสมการนี้ออกเป็นการคำนวณง่ายๆ สองสามรายการ และทำให้สามารถจัดการได้มากขึ้น
อย่างที่คุณเห็น มีความสัมพันธ์เชิงบวกอย่างมากระหว่างจำนวนชั่วโมงที่ใช้เรียนวิชาหนึ่งกับคะแนนสอบ ครูจะมีความสุขมากที่ได้ทราบเกี่ยวกับเรื่องนี้
ประโยชน์ของการสร้างความสัมพันธ์ระหว่างตัวแปรที่คล้ายกันคืออะไร? คำถามที่ดี หากพบว่ามีการเชื่อมต่อ เราสามารถคาดการณ์คะแนนสอบตามจำนวนชั่วโมงที่ใช้เรียนวิชานั้นๆ พูดง่ายๆ ก็คือ ยิ่งความสัมพันธ์แน่นแฟ้นมากเท่าไหร่ การทำนายของเราก็จะยิ่งแม่นยำมากขึ้นเท่านั้น
การใช้ Excel เพื่อคำนวณค่าสัมประสิทธิ์สหสัมพันธ์
ฉันแน่ใจว่าหลังจากดูการคำนวณค่าสัมประสิทธิ์สหสัมพันธ์ที่น่ากลัวเหล่านี้แล้ว คุณจะรู้สึกยินดีอย่างแท้จริงที่รู้ว่า Excel สามารถทำงานทั้งหมดนี้ให้คุณได้โดยใช้ฟังก์ชัน CORREL ที่มีลักษณะดังต่อไปนี้:
CORREL(อาร์เรย์ 1; อาร์เรย์ 2),
อาร์เรย์ 1 = ช่วงข้อมูลสำหรับตัวแปรแรก
อาร์เรย์ 2 = ช่วงข้อมูลสำหรับตัวแปรที่สอง
ตัวอย่าง รูปแสดงฟังก์ชัน CORREL ที่ใช้ในการคำนวณค่าสัมประสิทธิ์สหสัมพันธ์สำหรับตัวอย่างเกรดข้อสอบ
ในบทที่ 4 เราดูสถิติเชิงพรรณนาพื้นฐานแบบตัวแปรเดียว ซึ่งเป็นการวัดแนวโน้มเข้าสู่ศูนย์กลางและความแปรปรวน ซึ่งใช้เพื่ออธิบายตัวแปรเดียว ในบทนี้ เราจะดูที่ค่าสัมประสิทธิ์สหสัมพันธ์หลัก
ค่าสัมประสิทธิ์สหสัมพันธ์- สถิติเชิงพรรณนาสองมิติ การวัดความสัมพันธ์เชิงปริมาณ (ความแปรปรวนร่วม) ของตัวแปรสองตัว
ประวัติของการพัฒนาและการใช้ค่าสัมประสิทธิ์สหสัมพันธ์สำหรับการศึกษาความสัมพันธ์นั้นเริ่มขึ้นพร้อมๆ กับการเกิดขึ้นของวิธีการวัดเพื่อศึกษาความแตกต่างระหว่างบุคคล - ในปี 1870-1880 ผู้บุกเบิกในการวัดความสามารถของมนุษย์ ตลอดจนผู้เขียนคำว่า "ค่าสัมประสิทธิ์สหสัมพันธ์" คือ Francis Galton และค่าสัมประสิทธิ์สหสัมพันธ์ที่เป็นที่นิยมมากที่สุดได้รับการพัฒนาโดยผู้ติดตามของเขา Karl Pearson ตั้งแต่นั้นมา การศึกษาความสัมพันธ์โดยใช้ค่าสัมประสิทธิ์สหสัมพันธ์เป็นหนึ่งในกิจกรรมที่ได้รับความนิยมมากที่สุดในด้านจิตวิทยา
จนถึงปัจจุบัน มีการพัฒนาค่าสัมประสิทธิ์สหสัมพันธ์ที่แตกต่างกันมากมาย หนังสือหลายร้อยเล่มทุ่มเทให้กับปัญหาในการวัดความสัมพันธ์ด้วยความช่วยเหลือของพวกเขา ดังนั้น เราจะพิจารณาเฉพาะสิ่งที่สำคัญที่สุดและขาดไม่ได้จริงๆ ในการวิจัยความสัมพันธ์ -- //--Pearson, r-Spearman และ m-Kendall ของพวกเขา ลักษณะทั่วไปคือการสะท้อนความสัมพันธ์ของคุณลักษณะสองประการที่วัดในระดับเชิงปริมาณ - อันดับหรือเมตริก
โดยทั่วไปแล้ว การศึกษาเชิงประจักษ์จะเน้นไปที่การศึกษาความสัมพันธ์ของตัวแปรตั้งแต่สองตัวขึ้นไป
ตัวอย่าง
ให้เรายกตัวอย่างสองตัวอย่างเกี่ยวกับการศึกษาอิทธิพลของการสาธิตฉากความรุนแรงในทีวีเกี่ยวกับความก้าวร้าวของวัยรุ่น 1. กำลังศึกษาความสัมพันธ์ของตัวแปรสองตัวที่วัดได้ในระดับเชิงปริมาณ (อันดับหรือเมตริก): 1) "เวลาในการดูรายการโทรทัศน์ที่มีความรุนแรง"; 2) "ความก้าวร้าว"
อ่านเหมือน Tau-Kendall
บทที่ 6 ค่าสัมประสิทธิ์สหสัมพันธ์
2. เราศึกษาความแตกต่างของความก้าวร้าวของวัยรุ่นตั้งแต่ 2 กลุ่มขึ้นไป ต่างกันที่ระยะเวลาในการรับชมรายการทีวีที่มีการสาธิตฉากความรุนแรง
ในตัวอย่างที่สอง การศึกษาความแตกต่างสามารถแสดงเป็นการศึกษาความสัมพันธ์ระหว่าง 2 ตัวแปร ซึ่งหนึ่งในนั้นคือตัวแปรเชิงนาม (ระยะเวลาการดูทีวี) และสำหรับสถานการณ์นี้ ยังมีการพัฒนาค่าสัมประสิทธิ์สหสัมพันธ์ของตัวเองด้วย
การศึกษาใด ๆ สามารถลดลงเป็นการศึกษาความสัมพันธ์ได้ เนื่องจากมีการคิดค้นค่าสัมประสิทธิ์สหสัมพันธ์ที่หลากหลายสำหรับเกือบทุกสถานการณ์การวิจัย แต่ต่อไปนี้เราจะแยกปัญหาออกเป็นสองประเภท:
P การศึกษาความสัมพันธ์ -เมื่อนำเสนอตัวแปรสองตัวในระดับตัวเลข
□ การศึกษาความแตกต่าง -เมื่ออย่างน้อยหนึ่งในสองตัวแปรถูกนำเสนอในระดับประโยค
ส่วนนี้ยังสอดคล้องกับตรรกะของการสร้างโปรแกรมสถิติคอมพิวเตอร์ยอดนิยมซึ่งในเมนู ความสัมพันธ์มีการเสนอค่าสัมประสิทธิ์สามค่า (/--Pearson, r-Spearman และ x-Kendall) และสำหรับการแก้ปัญหาการวิจัยอื่น ๆ มีการเสนอวิธีการเปรียบเทียบกลุ่ม
แนวคิดของความสัมพันธ์
ความสัมพันธ์ในภาษาคณิตศาสตร์มักอธิบายโดยใช้ฟังก์ชันที่แสดงเป็นภาพกราฟิกเป็นเส้น บนมะเดื่อ 6.1 แสดงกราฟของฟังก์ชันต่างๆ ถ้าการเปลี่ยนแปลงในตัวแปรหนึ่งหน่วยหนึ่งส่งผลให้ตัวแปรอื่นเปลี่ยนแปลงด้วยจำนวนที่เท่ากันเสมอ ฟังก์ชันจะเป็น เชิงเส้น(กราฟเป็นเส้นตรง); การเชื่อมต่ออื่นใด ไม่ใช่เชิงเส้นหากการเพิ่มขึ้นของตัวแปรหนึ่งสัมพันธ์กับการเพิ่มขึ้นของอีกตัวแปรหนึ่ง แสดงว่าความสัมพันธ์นั้นเป็นเช่นนั้น บวก (ตรง);หากการเพิ่มขึ้นของตัวแปรหนึ่งสัมพันธ์กับการลดลงของอีกตัวแปรหนึ่ง แสดงว่าความสัมพันธ์นั้นเป็นเช่นนั้น ลบ (ย้อนกลับ)หากทิศทางการเปลี่ยนแปลงของตัวแปรหนึ่งไม่เปลี่ยนแปลงตามการเพิ่ม (ลด) ของตัวแปรอื่น แสดงว่าฟังก์ชันดังกล่าวคือ ซ้ำซากจำเจ;มิฉะนั้นฟังก์ชันจะถูกเรียก ไม่โมโนโทนิก
ลิงค์การทำงานคล้ายกับที่แสดงในรูป 6.1 เป็นอุดมคติ ความไม่ชอบมาพากลอยู่ที่ความจริงที่ว่าค่าหนึ่งของตัวแปรหนึ่งสอดคล้องกับค่าที่กำหนดอย่างเคร่งครัดของตัวแปรอื่น ตัวอย่างเช่น ความสัมพันธ์ของตัวแปรทางกายภาพสองตัวคือน้ำหนักและความยาวลำตัว (ผลบวกเชิงเส้น) อย่างไรก็ตาม แม้ในการทดลองทางกายภาพ ความสัมพันธ์เชิงประจักษ์จะแตกต่างจากความสัมพันธ์เชิงหน้าที่เนื่องจากไม่ทราบสาเหตุหรือไม่ทราบสาเหตุ: ความผันผวนในองค์ประกอบของวัสดุ ข้อผิดพลาดในการวัด ฯลฯ
ข้าว. 6.1. ตัวอย่างกราฟของฟังก์ชันที่เกิดบ่อย
ในทางจิตวิทยา เช่นเดียวกับในศาสตร์อื่นๆ เมื่อศึกษาความสัมพันธ์ของสัญญาณ นักวิจัยจะสูญเสียเหตุผลที่เป็นไปได้หลายประการสำหรับความแปรปรวนของสัญญาณเหล่านี้อย่างหลีกเลี่ยงไม่ได้ ผลลัพธ์ที่ได้ก็คือ ความสัมพันธ์เชิงฟังก์ชันระหว่างตัวแปรที่มีอยู่จริงปรากฏเชิงประจักษ์ว่าน่าจะเป็น (สุ่ม): ค่าเดียวกันของตัวแปรหนึ่งสอดคล้องกับการกระจายของค่าต่าง ๆ ของตัวแปรอื่น (และในทางกลับกัน)ตัวอย่างที่ง่ายที่สุดคืออัตราส่วนของส่วนสูงและน้ำหนักของคน ผลลัพธ์เชิงประจักษ์ของการศึกษาสัญญาณทั้งสองนี้จะแสดงให้เห็นความสัมพันธ์เชิงบวกของสัญญาณทั้งสองอย่างแน่นอน แต่เดาได้ง่ายว่ามันจะแตกต่างจากฟังก์ชันทางคณิตศาสตร์ในอุดมคติที่เคร่งครัด เชิงเส้น บวก แม้ว่าจะใช้กลอุบายทั้งหมดของผู้วิจัยเพื่อคำนึงถึงความกลมกลืนหรือความสมบูรณ์ของวิชาก็ตาม (ไม่น่าเป็นไปได้ที่บนพื้นฐานนี้จะเกิดขึ้นกับใครก็ตามที่จะปฏิเสธการมีอยู่ของความสัมพันธ์เชิงหน้าที่ที่เข้มงวดระหว่างความยาวและน้ำหนักของร่างกาย)
ดังนั้น ในทางจิตวิทยา เช่นเดียวกับในศาสตร์อื่น ๆ ความสัมพันธ์เชิงหน้าที่ของปรากฏการณ์สามารถเปิดเผยได้ในเชิงประจักษ์โดยเป็นความสัมพันธ์เชิงความน่าจะเป็นของคุณลักษณะที่สอดคล้องกันเท่านั้น การแสดงภาพของธรรมชาติของความสัมพันธ์ที่น่าจะเป็นให้ แผนภาพกระจาย -กราฟที่มีแกนตรงกับค่าของตัวแปรสองตัวและแต่ละหัวเรื่องคือจุด (รูปที่ 6.2) ค่าสัมประสิทธิ์สหสัมพันธ์ถูกใช้เป็นลักษณะตัวเลขของการเชื่อมต่อที่น่าจะเป็น
06/06/2018 16 235 0 อิกอร์
จิตวิทยาและสังคม
ทุกสิ่งในโลกเชื่อมโยงถึงกัน แต่ละคนในระดับสัญชาตญาณพยายามที่จะค้นหาความสัมพันธ์ระหว่างปรากฏการณ์เพื่อให้สามารถมีอิทธิพลและควบคุมพวกเขาได้ แนวคิดที่สะท้อนถึงความสัมพันธ์นี้เรียกว่าสหสัมพันธ์ มันหมายความว่าอะไรในคำง่ายๆ?
เนื้อหา:
แนวคิดของความสัมพันธ์
ความสัมพันธ์ (จากภาษาละติน "correlatio" - อัตราส่วน, ความสัมพันธ์)- คำศัพท์ทางคณิตศาสตร์ที่หมายถึงการวัดความน่าจะเป็นทางสถิติที่พึ่งพาระหว่างตัวแปรสุ่ม (ตัวแปร)
ตัวอย่าง:ลองมาสองประเภทของความสัมพันธ์:
- อันดับแรก- ปากกาในมือคน มือเคลื่อนไปทางไหน ปากกาก็เคลื่อนไปทางนั้น ถ้ามืออยู่เฉยๆ ปากกาจะไม่เขียน หากคนกดแรงขึ้นเล็กน้อยเครื่องหมายบนกระดาษจะสมบูรณ์ยิ่งขึ้น ความสัมพันธ์ประเภทนี้สะท้อนถึงการพึ่งพาอาศัยกันอย่างเหนียวแน่นและไม่ใช่ความสัมพันธ์ ความสัมพันธ์นี้ใช้งานได้จริง
- มุมมองที่สอง- ความสัมพันธ์ระหว่างระดับการศึกษาของบุคคลกับการอ่านวรรณกรรม ไม่ทราบล่วงหน้าว่าคนอ่านเพิ่มเติม: อุดมศึกษาหรือไม่มีก็ได้ ความสัมพันธ์นี้เป็นแบบสุ่มหรือแบบสุ่ม มีการศึกษาโดยวิทยาศาสตร์ทางสถิติซึ่งเกี่ยวข้องกับปรากฏการณ์มวลเท่านั้น หากการคำนวณทางสถิติทำให้สามารถพิสูจน์ความสัมพันธ์ระหว่างระดับการศึกษาและการอ่านวรรณกรรมได้ สิ่งนี้จะทำให้สามารถคาดการณ์ใด ๆ เพื่อทำนายการเกิดเหตุการณ์ที่น่าจะเป็นได้ ในตัวอย่างนี้ มีความเป็นไปได้สูงที่บุคคลที่มีการศึกษาสูงกว่า ผู้ที่มีการศึกษาสูงกว่า จะอ่านหนังสือมากกว่า แต่เนื่องจากความสัมพันธ์ระหว่างพารามิเตอร์เหล่านี้ใช้งานไม่ได้ เราจึงอาจทำผิดพลาดได้ การคำนวณความน่าจะเป็นของข้อผิดพลาดดังกล่าวเป็นไปได้เสมอ ซึ่งจะมีค่าน้อยเป็นพิเศษและเรียกว่าระดับนัยสำคัญทางสถิติ (p)
ตัวอย่างความสัมพันธ์ระหว่าง ปรากฏการณ์ทางธรรมชาติเป็น:ห่วงโซ่อาหารในธรรมชาติ ร่างกายมนุษย์ซึ่งประกอบด้วยระบบอวัยวะที่เชื่อมโยงกันและทำงานเป็นองค์รวม
ทุกวันเราต้องเผชิญกับความสัมพันธ์ใน ชีวิตประจำวัน: ระหว่างสภาพอากาศและ อารมณ์ดี, การกำหนดเป้าหมายที่ถูกต้องและความสำเร็จของพวกเขา, ทัศนคติเชิงบวกและโชค, ความรู้สึกของความสุขและ ความเป็นอยู่ที่ดีทางการเงิน. แต่เรากำลังมองหาการเชื่อมโยงที่ไม่ได้ขึ้นอยู่กับการคำนวณทางคณิตศาสตร์ แต่มาจากตำนาน สัญชาตญาณ ไสยศาสตร์ การคาดเดาที่ไม่ได้ใช้งาน ปรากฏการณ์เหล่านี้เป็นเรื่องยากมากที่จะแปลเป็นภาษาทางคณิตศาสตร์ การแสดงเป็นตัวเลข การวัด อีกสิ่งหนึ่งคือเมื่อเราวิเคราะห์ปรากฏการณ์ที่สามารถคำนวณและนำเสนอในรูปของตัวเลขได้ ในกรณีนี้ เราสามารถกำหนดความสัมพันธ์โดยใช้ค่าสัมประสิทธิ์สหสัมพันธ์ (r) ซึ่งสะท้อนถึงความแข็งแกร่ง ระดับ ความใกล้เคียง และทิศทางของความสัมพันธ์ระหว่างตัวแปรสุ่ม
ความสัมพันธ์ที่แข็งแกร่งระหว่างตัวแปรสุ่ม- หลักฐานการมีอยู่ของความสัมพันธ์ทางสถิติบางอย่างโดยเฉพาะระหว่างปรากฏการณ์เหล่านี้ แต่ความสัมพันธ์นี้ไม่สามารถถ่ายโอนไปยังปรากฏการณ์เดียวกันได้ แต่สำหรับสถานการณ์ที่แตกต่างกัน บ่อยครั้ง นักวิจัยที่ได้รับความสัมพันธ์อย่างมีนัยสำคัญระหว่างตัวแปรสองตัวในการคำนวณโดยอาศัยความเรียบง่ายของการวิเคราะห์ความสัมพันธ์ ทำให้ตั้งสมมติฐานผิดๆ เกี่ยวกับการมีอยู่ของความสัมพันธ์เชิงสาเหตุระหว่างคุณลักษณะต่างๆ โดยลืมไปว่าค่าสัมประสิทธิ์สหสัมพันธ์นั้นน่าจะเป็นไปได้
ตัวอย่าง:จำนวนผู้บาดเจ็บระหว่างสภาวะน้ำแข็งและจำนวนอุบัติเหตุทางถนนระหว่างยานพาหนะ ปริมาณเหล่านี้จะสัมพันธ์กันแม้ว่าจะไม่เชื่อมโยงกันโดยสิ้นเชิง แต่มีความเกี่ยวพันกันเท่านั้น สาเหตุทั่วไปเหล่านี้ เหตุการณ์สุ่ม- น้ำแข็ง หากการวิเคราะห์ไม่ได้เปิดเผยความสัมพันธ์เชิงสหสัมพันธ์ระหว่างปรากฏการณ์ แสดงว่าสิ่งนี้ยังไม่เป็นหลักฐานของการไม่มีความสัมพันธ์ระหว่างปรากฏการณ์เหล่านี้ ซึ่งอาจมีความซับซ้อนไม่เชิงเส้น ซึ่งไม่ถูกเปิดเผยโดยการคำนวณความสัมพันธ์
คนแรกที่นำเสนอแนวคิดเกี่ยวกับความสัมพันธ์ในการหมุนเวียนทางวิทยาศาสตร์คือชาวฝรั่งเศส นักบรรพชีวินวิทยา Georges Cuvier. ในศตวรรษที่ 18 เขาได้อนุมานกฎแห่งความสัมพันธ์ของชิ้นส่วนและอวัยวะของสิ่งมีชีวิต ต้องขอบคุณที่มันเป็นไปได้ที่จะฟื้นฟูรูปลักษณ์ของสิ่งมีชีวิตฟอสซิลทั้งหมด สัตว์ จากส่วนที่พบของร่างกาย (ซากศพ) ในทางสถิติ คำว่าสหสัมพันธ์ถูกใช้ครั้งแรกในปี พ.ศ. 2429 โดยนักวิทยาศาสตร์ชาวอังกฤษ ฟรานซิส กาลตัน. แต่เขาไม่สามารถหาสูตรที่แน่นอนสำหรับการคำนวณค่าสัมประสิทธิ์สหสัมพันธ์ได้ แต่นักเรียนของเขาทำได้ - คาร์ล เพียร์สัน นักคณิตศาสตร์และนักชีววิทยาชื่อดัง
ประเภทของความสัมพันธ์
โดยความสำคัญ- มีนัยสำคัญสูง มีนัยสำคัญและไม่มีนัยสำคัญ
ชนิด |
ร.คืออะไร |
มีนัยสำคัญอย่างมาก |
r สอดคล้องกับระดับนัยสำคัญทางสถิติ p<=0,01 |
มีความหมาย |
r ตรงกับหน้า<=0,05 |
ไม่มีนัยสำคัญ |
r ไม่ถึง p>0.1 |
เชิงลบ(การลดลงของค่าของตัวแปรหนึ่งนำไปสู่การเพิ่มขึ้นของระดับของอีกตัวแปรหนึ่ง: ยิ่งบุคคลนั้นมีความหวาดกลัวมากเท่าใด โอกาสที่จะดำรงตำแหน่งผู้นำก็จะยิ่งน้อยลงเท่านั้น) และเชิงบวก (หากการเพิ่มขึ้นของค่าหนึ่งทำให้เกิดการเพิ่มขึ้นของ ระดับอื่น: ยิ่งคุณประหม่ามากเท่าไหร่คุณก็ยิ่งมีโอกาสป่วยมากขึ้นเท่านั้น) หากไม่มีความสัมพันธ์ระหว่างตัวแปร ความสัมพันธ์ดังกล่าวจะเรียกว่าศูนย์
เชิงเส้น(เมื่อค่าหนึ่งเพิ่มขึ้นหรือลดลง ค่าที่สองก็จะเพิ่มขึ้นหรือลดลงด้วย) และไม่เป็นเชิงเส้น (เมื่อค่าหนึ่งเปลี่ยนแปลง ลักษณะของการเปลี่ยนแปลงในค่าที่สองไม่สามารถอธิบายได้โดยใช้การพึ่งพาเชิงเส้น จากนั้นจึงใช้กฎทางคณิตศาสตร์อื่นๆ - พหุนาม, การพึ่งพาเกินความจริง).
ตามกำลัง.
อัตราต่อรอง
คำนวณค่าสัมประสิทธิ์สหสัมพันธ์ประเภทต่างๆ ขึ้นอยู่กับสเกลของตัวแปรที่ศึกษา:
- ค่าสัมประสิทธิ์สหสัมพันธ์ของเพียร์สัน ค่าสัมประสิทธิ์สหสัมพันธ์เชิงเส้นคู่ หรือสหสัมพันธ์ของโมเมนต์ผลิตภัณฑ์ถูกคำนวณสำหรับตัวแปรที่มีมาตราส่วนการวัดช่วงเวลาและเชิงปริมาณ
- ค่าสัมประสิทธิ์สหสัมพันธ์อันดับของ Spearman หรือ Kendall - เมื่อค่าอย่างน้อยหนึ่งค่ามีมาตราส่วนลำดับหรือไม่ได้กระจายตามปกติ
- ชี้ค่าสัมประสิทธิ์สหสัมพันธ์แบบสองชุด (ค่าสัมประสิทธิ์สหสัมพันธ์เครื่องหมาย Fechner) - หากค่าใดค่าหนึ่งเป็นค่าสองค่า
- ค่าสัมประสิทธิ์สหสัมพันธ์แบบสี่ฟิลด์ (ค่าสัมประสิทธิ์ของความสัมพันธ์หลายอันดับ (สอดคล้องกัน) - ถ้าตัวแปรสองตัวเป็นแบบสองขั้ว
ค่าสัมประสิทธิ์ของเพียร์สันหมายถึงตัวบ่งชี้ความสัมพันธ์แบบพาราเมตริก ส่วนที่เหลือทั้งหมดเป็นค่าที่ไม่ใช่พารามิเตอร์
ค่าของสัมประสิทธิ์สหสัมพันธ์อยู่ในช่วงตั้งแต่ -1 ถึง +1 โดยมีความสัมพันธ์เชิงบวกอย่างสมบูรณ์ r = +1 โดยมีความสัมพันธ์เชิงลบอย่างสมบูรณ์ r = -1
สูตรและการคำนวณ
ตัวอย่าง
จำเป็นต้องกำหนดความสัมพันธ์ระหว่างตัวแปรสองตัว: ระดับการพัฒนาทางปัญญา (ตามผลการทดสอบ) และจำนวนการมาสายต่อเดือน (ตามรายการในวารสารการศึกษา) ของเด็กนักเรียน
ข้อมูลเริ่มต้นแสดงในตาราง:
№ |
ข้อมูลไอคิว (x) |
ข้อมูลจำนวนผู้มาสาย (y) |
ผลรวม |
1122 |
|
เฉลี่ย |
112,2 |
ในการตีความตัวบ่งชี้ที่ได้รับอย่างถูกต้องจำเป็นต้องวิเคราะห์สัญญาณของค่าสัมประสิทธิ์สหสัมพันธ์ (+ หรือ -) และค่าสัมบูรณ์ (โมดูโล)
ตามตารางการจำแนกประเภทของค่าสัมประสิทธิ์สหสัมพันธ์ตามความแข็งแกร่ง เราสรุปได้ว่า rxy = -0.827 เป็นความสัมพันธ์เชิงลบที่แข็งแกร่ง ดังนั้น จำนวนเด็กนักเรียนที่มาสายจึงขึ้นอยู่กับระดับพัฒนาการทางสติปัญญาของพวกเขาเป็นอย่างมาก อาจกล่าวได้ว่านักเรียนที่มี IQ สูงมีโอกาสเข้าเรียนสายน้อยกว่านักเรียนที่มี IQ ต่ำ
นักวิทยาศาสตร์สามารถใช้ค่าสัมประสิทธิ์สหสัมพันธ์เพื่อยืนยันหรือหักล้างข้อสันนิษฐานเกี่ยวกับการพึ่งพาของปริมาณหรือปรากฏการณ์สองอย่าง และวัดความแข็งแกร่ง ความสำคัญ และโดยนักเรียนเพื่อทำการวิจัยเชิงประจักษ์และสถิติในวิชาต่างๆ ต้องจำไว้ว่าตัวบ่งชี้นี้ไม่ใช่เครื่องมือในอุดมคติ มันถูกคำนวณเพื่อวัดความแข็งแกร่งของความสัมพันธ์เชิงเส้นเท่านั้น และจะเป็นค่าความน่าจะเป็นที่มีข้อผิดพลาดเสมอ
การวิเคราะห์สหสัมพันธ์ใช้ในพื้นที่ต่อไปนี้:
- วิทยาศาสตร์เศรษฐศาสตร์
- ฟิสิกส์ดาราศาสตร์;
- สังคมศาสตร์ (สังคมวิทยา จิตวิทยา การสอน);
- เคมีเกษตร;
- โลหะศาสตร์
- อุตสาหกรรม (สำหรับการควบคุมคุณภาพ);
- อุทกวิทยา;
- ไบโอเมตริกซ์ ฯลฯ
เหตุผลที่นิยมใช้วิธีวิเคราะห์ความสัมพันธ์:
- ความเรียบง่ายของการคำนวณสัมประสิทธิ์สหสัมพันธ์ไม่จำเป็นต้องมีการศึกษาทางคณิตศาสตร์พิเศษ
- ให้คุณคำนวณความสัมพันธ์ระหว่างตัวแปรสุ่มเชิงมวลซึ่งเป็นเรื่องของการวิเคราะห์ทางสถิติศาสตร์ ในเรื่องนี้วิธีการนี้แพร่หลายในด้านการวิจัยทางสถิติ
หวังว่าตอนนี้คุณจะสามารถแยกความแตกต่างระหว่างความสัมพันธ์เชิงหน้าที่และความสัมพันธ์เชิงสัมพันธ์ได้แล้ว และคุณจะรู้ว่าเมื่อคุณได้ยินทางโทรทัศน์หรืออ่านข่าวเกี่ยวกับความสัมพันธ์ มันหมายถึงความสัมพันธ์เชิงบวกและค่อนข้างสำคัญระหว่างสองปรากฏการณ์
ในการวิจัยทางวิทยาศาสตร์ บ่อยครั้งที่จำเป็นต้องค้นหาความสัมพันธ์ระหว่างตัวแปรผลลัพธ์และตัวแปรปัจจัย (ผลผลิตของพืชผลและปริมาณน้ำฝน ความสูงและน้ำหนักของบุคคลในกลุ่มที่เป็นเนื้อเดียวกันตามเพศและอายุ อัตราการเต้นของชีพจร และอุณหภูมิของร่างกาย ฯลฯ).
ประการที่สองคือสัญญาณที่นำไปสู่การเปลี่ยนแปลงของผู้ที่เกี่ยวข้อง (สัญญาณแรก)
แนวคิดของการวิเคราะห์ความสัมพันธ์
มีชุดหนึ่ง จากข้างต้น เราสามารถพูดได้ว่าการวิเคราะห์สหสัมพันธ์เป็นวิธีการที่ใช้ในการทดสอบสมมติฐานของนัยสำคัญทางสถิติของตัวแปรสองตัวหรือมากกว่านั้น หากผู้วิจัยสามารถวัดค่าเหล่านั้นได้ แต่ไม่สามารถเปลี่ยนแปลงได้
มีคำจำกัดความอื่น ๆ ของแนวคิดที่กำลังพิจารณาอยู่ การวิเคราะห์สหสัมพันธ์เป็นวิธีการประมวลผลที่ตรวจสอบค่าสัมประสิทธิ์สหสัมพันธ์ระหว่างตัวแปร ในกรณีนี้ ค่าสัมประสิทธิ์สหสัมพันธ์ระหว่างคุณลักษณะหนึ่งคู่หรือหลายคู่จะถูกเปรียบเทียบเพื่อสร้างความสัมพันธ์ทางสถิติระหว่างทั้งสอง การวิเคราะห์สหสัมพันธ์เป็นวิธีการศึกษาการพึ่งพาทางสถิติระหว่างตัวแปรสุ่มที่มีตัวเลือกของลักษณะการทำงานที่เข้มงวด ซึ่งไดนามิกของตัวแปรสุ่มหนึ่งตัวนำไปสู่ไดนามิกของความคาดหวังทางคณิตศาสตร์ของอีกตัวแปรหนึ่ง
แนวคิดของความสัมพันธ์ที่ผิดพลาด
เมื่อทำการวิเคราะห์ความสัมพันธ์ จะต้องคำนึงถึงว่าสามารถดำเนินการได้โดยสัมพันธ์กับชุดของคุณลักษณะใดๆ ซึ่งมักจะไร้สาระเมื่อเกี่ยวข้องกัน บางครั้งพวกเขาไม่มีความสัมพันธ์เชิงสาเหตุซึ่งกันและกัน
ในกรณีนี้ เราพูดถึงความสัมพันธ์ปลอมๆ
ปัญหาการวิเคราะห์ความสัมพันธ์
จากคำจำกัดความข้างต้น เราสามารถกำหนดงานต่อไปนี้ของวิธีการที่อธิบายไว้: รับข้อมูลเกี่ยวกับตัวแปรที่ต้องการโดยใช้อีกตัวแปรหนึ่ง กำหนดความใกล้ชิดของความสัมพันธ์ระหว่างตัวแปรที่ศึกษา
การวิเคราะห์สหสัมพันธ์เกี่ยวข้องกับการกำหนดความสัมพันธ์ระหว่างคุณลักษณะที่ศึกษา ดังนั้นงานของการวิเคราะห์สหสัมพันธ์สามารถเสริมด้วยสิ่งต่อไปนี้:
- การระบุปัจจัยที่มีผลกระทบมากที่สุดต่อเครื่องหมายผลลัพธ์
- การระบุสาเหตุของความสัมพันธ์ที่ยังไม่ได้สำรวจก่อนหน้านี้
- การสร้างแบบจำลองความสัมพันธ์ด้วยการวิเคราะห์พาราเมตริก
- ศึกษาความสำคัญของพารามิเตอร์การสื่อสารและการประมาณช่วงเวลา
การเชื่อมโยงการวิเคราะห์ความสัมพันธ์กับการถดถอย
วิธีการวิเคราะห์ความสัมพันธ์มักจะไม่จำกัดเฉพาะการหาความใกล้ชิดของความสัมพันธ์ระหว่างปริมาณที่ศึกษา บางครั้งก็เสริมด้วยการรวบรวมสมการถดถอย ซึ่งได้มาจากการวิเคราะห์ชื่อเดียวกัน และเป็นคำอธิบายของความสัมพันธ์ระหว่างคุณลักษณะที่เป็นผลลัพธ์และแฟกทอเรียล (แฟกทอเรียล) วิธีนี้ประกอบกับการวิเคราะห์ที่กำลังพิจารณาประกอบกันเป็นวิธีการ
เงื่อนไขการใช้เมธอด
ปัจจัยด้านผลลัพธ์ขึ้นอยู่กับปัจจัยอย่างน้อยหนึ่งปัจจัย วิธีการวิเคราะห์ความสัมพันธ์สามารถใช้ได้หากมีข้อสังเกตจำนวนมากเกี่ยวกับค่าของประสิทธิภาพและตัวบ่งชี้ปัจจัย (ปัจจัย) ในขณะที่ปัจจัยที่ศึกษาควรเป็นเชิงปริมาณและสะท้อนให้เห็นในแหล่งเฉพาะ ค่าแรกสามารถกำหนดได้โดยกฎปกติ - ในกรณีนี้ ค่าสัมประสิทธิ์สหสัมพันธ์ของเพียร์สันเป็นผลมาจากการวิเคราะห์สหสัมพันธ์ หรือหากสัญญาณไม่เป็นไปตามกฎนี้ ค่าสัมประสิทธิ์สหสัมพันธ์อันดับสเปียร์แมนจะถูกใช้
หลักเกณฑ์การเลือกตัวประกอบในการวิเคราะห์สหสัมพันธ์
เมื่อใช้วิธีนี้จำเป็นต้องกำหนดปัจจัยที่มีอิทธิพลต่อตัวบ่งชี้ประสิทธิภาพ พวกเขาได้รับการคัดเลือกโดยคำนึงถึงข้อเท็จจริงที่ว่าต้องมีความสัมพันธ์เชิงสาเหตุระหว่างตัวบ่งชี้ ในกรณีของการสร้างแบบจำลองสหสัมพันธ์หลายปัจจัย แบบจำลองสหสัมพันธ์ที่มีผลกระทบอย่างมีนัยสำคัญต่อตัวบ่งชี้ผลลัพธ์จะถูกเลือก ในขณะที่ไม่ควรรวมปัจจัยที่พึ่งพาซึ่งกันและกันที่มีค่าสัมประสิทธิ์สหสัมพันธ์คู่มากกว่า 0.85 ในแบบจำลองสหสัมพันธ์ เช่นเดียวกับปัจจัยเหล่านั้น ซึ่งความสัมพันธ์กับพารามิเตอร์ผลลัพธ์เป็นทางอ้อม หรือการทำงาน
แสดงผล
ผลการวิเคราะห์ความสัมพันธ์สามารถนำเสนอในรูปแบบข้อความและกราฟิก ในกรณีแรก จะแสดงเป็นค่าสัมประสิทธิ์สหสัมพันธ์ ส่วนกรณีที่สองจะแสดงเป็นแผนภาพกระจาย
หากไม่มีความสัมพันธ์ระหว่างพารามิเตอร์ จุดบนไดอะแกรมจะอยู่แบบสุ่ม ระดับเฉลี่ยของการเชื่อมต่อจะมีลักษณะตามระดับของลำดับที่มากขึ้น และมีลักษณะระยะห่างที่สม่ำเสมอของเครื่องหมายที่ทำเครื่องหมายจากค่ามัธยฐานมากหรือน้อย การเชื่อมต่อที่แข็งแกร่งมีแนวโน้มที่จะเป็นเส้นตรงและที่ r=1 พล็อตกระจายจะเป็นเส้นแบน ความสัมพันธ์แบบผกผันมีลักษณะโดยทิศทางของกราฟจากซ้ายบนไปขวาล่าง ซึ่งเป็นทิศทางตรงจากซ้ายล่างไปยังมุมขวาบน
การแสดง 3 มิติของ scatterplot (การกระจาย)
นอกเหนือจากการนำเสนอ scatterplot แบบ 2 มิติแบบดั้งเดิมแล้ว ปัจจุบันมีการใช้การแสดงกราฟิก 3 มิติของการวิเคราะห์ความสัมพันธ์
นอกจากนี้ยังใช้เมทริกซ์ scatterplot ซึ่งแสดงพล็อตที่จับคู่ทั้งหมดในรูปเดียวในรูปแบบเมทริกซ์ สำหรับตัวแปร n ตัว เมทริกซ์ประกอบด้วย n แถวและ n คอลัมน์ แผนภาพที่อยู่ตรงจุดตัดของแถว i-th และคอลัมน์ j เป็นกราฟของตัวแปร Xi เทียบกับ Xj ดังนั้นแต่ละแถวและคอลัมน์จึงเป็นหนึ่งมิติ เซลล์เดียวจะแสดงแผนภาพกระจายของสองมิติ
การประมาณความหนาแน่นของการเชื่อมต่อ
ความหนาแน่นของความสัมพันธ์ถูกกำหนดโดยค่าสัมประสิทธิ์สหสัมพันธ์ (r): แข็งแกร่ง - r = ±0.7 ถึง ±1, ปานกลาง - r = ±0.3 ถึง ±0.699, อ่อนแอ - r = 0 ถึง ±0.299 การจัดหมวดหมู่นี้ไม่เข้มงวด รูปแสดงโครงร่างที่แตกต่างกันเล็กน้อย
ตัวอย่างการใช้วิธีวิเคราะห์สหสัมพันธ์
มีการศึกษาที่น่าสนใจในสหราชอาณาจักร อุทิศให้กับความสัมพันธ์ของการสูบบุหรี่กับมะเร็งปอด และดำเนินการโดยการวิเคราะห์ความสัมพันธ์ ข้อสังเกตนี้แสดงไว้ด้านล่าง
กลุ่มอาชีพ | ความตาย |
|
ชาวนา ชาวป่า และชาวประมง | ||
คนงานเหมืองและคนงานเหมืองหิน | ||
ผู้ผลิตก๊าซ ถ่านโค้ก และเคมีภัณฑ์ | ||
ผู้ผลิตแก้วและเซรามิก | ||
คนงานในเตาหลอม โรงหลอม โรงหล่อ และโรงรีด | ||
พนักงานไฟฟ้าและอิเล็กทรอนิกส์ | ||
วิศวกรรมศาสตร์และวิชาชีพที่เกี่ยวข้อง | ||
การผลิตงานไม้ | ||
แทนเนอร์ | ||
คนงานสิ่งทอ | ||
ผู้ผลิตชุดทำงาน | ||
ผู้ปฏิบัติงานในอุตสาหกรรมอาหาร เครื่องดื่ม และยาสูบ | ||
ผู้ผลิตกระดาษและสิ่งพิมพ์ | ||
ผู้ผลิตสินค้าอื่นๆ | ||
ผู้สร้าง | ||
ศิลปินและมัณฑนากร | ||
พนักงานขับรถเครน เครน ฯลฯ | ||
ไม่รวมคนงานที่อื่น | ||
พนักงานขนส่งและสื่อสาร | ||
คนงานคลังสินค้า ผู้ดูแลร้าน คนบรรจุหีบห่อ และคนงานเครื่องบรรจุ | ||
พนักงานออฟฟิศ | ||
ผู้ขาย | ||
พนักงานบริการกีฬาและนันทนาการ | ||
ผู้บริหารและผู้จัดการ | ||
มืออาชีพ ช่างเทคนิค และศิลปิน |
เราเริ่มการวิเคราะห์ความสัมพันธ์ เป็นการดีกว่าที่จะเริ่มต้นการแก้ปัญหาเพื่อความชัดเจนด้วยวิธีกราฟิกซึ่งเราจะสร้างไดอะแกรมกระจาย (กระจาย)
เธอแสดงการเชื่อมต่อโดยตรง อย่างไรก็ตาม เป็นการยากที่จะสรุปผลที่ชัดเจนโดยใช้วิธีกราฟิกเพียงอย่างเดียว ดังนั้นเราจะดำเนินการวิเคราะห์ความสัมพันธ์ต่อไป ตัวอย่างการคำนวณค่าสัมประสิทธิ์สหสัมพันธ์แสดงไว้ด้านล่าง
การใช้เครื่องมือซอฟต์แวร์ (ในตัวอย่างของ MS Excel จะอธิบายไว้ด้านล่าง) เรากำหนดค่าสัมประสิทธิ์สหสัมพันธ์ซึ่งเท่ากับ 0.716 ซึ่งหมายถึงความสัมพันธ์ที่แข็งแกร่งระหว่างพารามิเตอร์ที่ศึกษา ให้เรากำหนดนัยสำคัญทางสถิติของค่าที่ได้รับตามตารางที่เกี่ยวข้อง ซึ่งเราต้องลบ 2 จาก 25 คู่ของค่า ดังนั้นเราจะได้ 23 และสำหรับบรรทัดนี้ในตาราง เราพบว่า r สำคัญสำหรับ p = 0.01 (เนื่องจากข้อมูลเหล่านี้เป็นข้อมูลทางการแพทย์ การพึ่งพาอาศัยกันที่เข้มงวดมากขึ้น ในกรณีอื่นๆ p=0.05 ก็เพียงพอแล้ว) ซึ่งเป็น 0.51 สำหรับการวิเคราะห์สหสัมพันธ์นี้ ตัวอย่างแสดงให้เห็นว่า r ที่คำนวณได้มีค่ามากกว่าค่าวิกฤต r ค่าของสัมประสิทธิ์สหสัมพันธ์ถือว่ามีนัยสำคัญทางสถิติ
การใช้ซอฟต์แวร์ในการวิเคราะห์ความสัมพันธ์
ประเภทของการประมวลผลข้อมูลทางสถิติที่อธิบายไว้สามารถทำได้โดยใช้ซอฟต์แวร์ โดยเฉพาะ MS Excel ความสัมพันธ์เกี่ยวข้องกับการคำนวณพารามิเตอร์ต่อไปนี้โดยใช้ฟังก์ชัน:
1. ค่าสัมประสิทธิ์สหสัมพันธ์ถูกกำหนดโดยใช้ฟังก์ชัน CORREL (array1; array2) Array1,2 เป็นเซลล์ของช่วงค่าของตัวแปรผลลัพธ์และปัจจัย
ค่าสัมประสิทธิ์สหสัมพันธ์เชิงเส้นเรียกอีกอย่างว่าค่าสัมประสิทธิ์สหสัมพันธ์เพียร์สัน ดังนั้น ตั้งแต่ Excel 2007 เป็นต้นไป คุณสามารถใช้ฟังก์ชันกับอาร์เรย์เดียวกันได้
การแสดงกราฟิกของการวิเคราะห์ความสัมพันธ์ใน Excel ทำได้โดยใช้แผง "แผนภูมิ" ที่มีตัวเลือก "Scatter Plot"
หลังจากระบุข้อมูลเริ่มต้นแล้ว เราจะได้กราฟ
2. การประเมินนัยสำคัญของค่าสัมประสิทธิ์สหสัมพันธ์รายคู่โดยใช้แบบทดสอบของนักเรียน ค่าที่คำนวณได้ของเกณฑ์ t จะถูกนำไปเปรียบเทียบกับค่าตาราง (วิกฤต) ของตัวบ่งชี้นี้จากตารางค่าที่สอดคล้องกันของพารามิเตอร์ภายใต้การพิจารณา โดยคำนึงถึงระดับความสำคัญที่กำหนดและจำนวนองศาอิสระ การประมาณค่านี้ทำได้โดยใช้ฟังก์ชัน STUDIV(ความน่าจะเป็น; องศาของอิสระ)
3. เมทริกซ์ของค่าสัมประสิทธิ์สหสัมพันธ์คู่ การวิเคราะห์ดำเนินการโดยใช้เครื่องมือ "การวิเคราะห์ข้อมูล" ซึ่งเลือก "ความสัมพันธ์" การประเมินทางสถิติของค่าสัมประสิทธิ์สหสัมพันธ์ของคู่ดำเนินการโดยการเปรียบเทียบค่าสัมบูรณ์กับค่าตาราง (วิกฤต) เมื่อค่าสัมประสิทธิ์สหสัมพันธ์ของคู่ที่คำนวณได้มีค่ามากกว่าค่าวิกฤต เราสามารถพูดโดยคำนึงถึงระดับความน่าจะเป็นที่กำหนดว่าสมมติฐานว่างเกี่ยวกับความสำคัญของความสัมพันธ์เชิงเส้นจะไม่ถูกปฏิเสธ
ในที่สุด
การใช้วิธีการวิเคราะห์สหสัมพันธ์ในการวิจัยทางวิทยาศาสตร์ทำให้สามารถกำหนดความสัมพันธ์ระหว่างปัจจัยต่างๆ และตัวบ่งชี้ประสิทธิภาพได้ ในเวลาเดียวกัน ควรคำนึงถึงว่าค่าสัมประสิทธิ์สหสัมพันธ์สูงสามารถหาได้จากคู่ข้อมูลหรือชุดข้อมูลที่ไร้สาระ ดังนั้นการวิเคราะห์ประเภทนี้จึงต้องดำเนินการกับอาร์เรย์ข้อมูลที่มีขนาดใหญ่เพียงพอ
หลังจากได้รับค่าที่คำนวณได้ของ r แล้ว ขอแนะนำให้เปรียบเทียบกับค่าวิกฤต r เพื่อยืนยันนัยสำคัญทางสถิติของค่าหนึ่งๆ การวิเคราะห์ความสัมพันธ์สามารถทำได้ด้วยตนเองโดยใช้สูตร หรือใช้เครื่องมือซอฟต์แวร์ โดยเฉพาะ MS Excel ที่นี่ คุณยังสามารถสร้างไดอะแกรมกระจาย (กระจาย) เพื่อจุดประสงค์ในการแสดงภาพความสัมพันธ์ระหว่างปัจจัยที่ศึกษาของการวิเคราะห์สหสัมพันธ์และคุณลักษณะที่เป็นผลลัพธ์
เมื่อเรียน ความสัมพันธ์พยายามระบุว่ามีความสัมพันธ์ใดๆ ระหว่างตัวบ่งชี้สองตัวในกลุ่มตัวอย่างเดียวกันหรือไม่ (เช่น ระหว่างส่วนสูงและน้ำหนักของเด็ก หรือระหว่างระดับ ไอคิวและผลการเรียน) หรือระหว่างสองตัวอย่างที่แตกต่างกัน (เช่น เมื่อเปรียบเทียบฝาแฝดคู่หนึ่ง) และหากมีความสัมพันธ์นี้อยู่ ไม่ว่าการเพิ่มขึ้นของตัวบ่งชี้หนึ่งจะมาพร้อมกับการเพิ่มขึ้น (ความสัมพันธ์เชิงบวก) หรือการลดลง (ความสัมพันธ์เชิงลบ) ของ อื่น.
กล่าวอีกนัยหนึ่ง การวิเคราะห์สหสัมพันธ์ช่วยในการกำหนดว่าเป็นไปได้หรือไม่ที่จะทำนายค่าที่เป็นไปได้ของตัวบ่งชี้หนึ่ง โดยรู้ถึงค่าของอีกตัวบ่งชี้หนึ่ง
จนถึงขณะนี้ เมื่อวิเคราะห์ผลลัพธ์จากประสบการณ์ของเราในการศึกษาผลกระทบของกัญชา เราจงใจเพิกเฉยต่อตัวบ่งชี้เช่นเวลาตอบสนอง ในขณะเดียวกัน มันเป็นเรื่องที่น่าสนใจที่จะตรวจสอบว่ามีความสัมพันธ์ระหว่างประสิทธิภาพของปฏิกิริยากับความเร็วของมันหรือไม่ สิ่งนี้จะช่วยให้สามารถโต้แย้งได้ว่ายิ่งบุคคลนั้นช้าเท่าไร การกระทำของเขาก็จะแม่นยำและมีประสิทธิภาพมากขึ้นเท่านั้น และในทางกลับกัน
เพื่อจุดประสงค์นี้ สามารถใช้สองวิธีที่แตกต่างกัน: วิธีพาราเมตริกสำหรับการคำนวณค่าสัมประสิทธิ์ของ Bravais-Pearson (ร)และคำนวณค่าสัมประสิทธิ์สหสัมพันธ์ของอันดับสเปียร์แมน (ร ส ), ซึ่งใช้กับข้อมูลลำดับ กล่าวคือ ไม่ใช่พารามิเตอร์ อย่างไรก็ตาม ก่อนอื่นเรามาทำความเข้าใจว่าค่าสัมประสิทธิ์สหสัมพันธ์คืออะไร
ค่าสัมประสิทธิ์สหสัมพันธ์
ค่าสัมประสิทธิ์สหสัมพันธ์คือค่าที่สามารถเปลี่ยนแปลงได้ตั้งแต่ -1 ถึง 1 ในกรณีของความสัมพันธ์เชิงบวกโดยสมบูรณ์ ค่าสัมประสิทธิ์นี้คือบวก 1 และเมื่อมีค่าลบทั้งหมด - ลบ 1 บนกราฟ ค่านี้จะสอดคล้องกับเส้นตรงที่ผ่าน ผ่านจุดตัดกันของค่าข้อมูลแต่ละคู่:
ตัวแปร
หากจุดเหล่านี้ไม่เรียงตัวเป็นเส้นตรง แต่ก่อตัวเป็น "เมฆ" ค่าสัมบูรณ์ของสัมประสิทธิ์สหสัมพันธ์จะน้อยกว่าหนึ่งและเข้าใกล้ศูนย์เมื่อเมฆปัดเศษออก:
ถ้าสัมประสิทธิ์สหสัมพันธ์เป็น 0 ตัวแปรทั้งสองจะเป็นอิสระจากกันโดยสิ้นเชิง
ในมนุษยศาสตร์ ความสัมพันธ์ถือว่าแข็งแกร่งถ้าค่าสัมประสิทธิ์มากกว่า 0.60; หากเกิน 0.90 แสดงว่าความสัมพันธ์นั้นแข็งแกร่งมาก อย่างไรก็ตาม เพื่อให้สามารถสรุปผลเกี่ยวกับความสัมพันธ์ระหว่างตัวแปรต่างๆ ได้ ขนาดของกลุ่มตัวอย่างมีความสำคัญยิ่ง: ยิ่งกลุ่มตัวอย่างมีขนาดใหญ่ ค่าสัมประสิทธิ์สหสัมพันธ์ที่ได้รับก็จะยิ่งน่าเชื่อถือมากขึ้นเท่านั้น มีตารางที่มีค่าวิกฤตของค่าสัมประสิทธิ์สหสัมพันธ์ของ Bravais-Pearson และ Spearman สำหรับจำนวนองศาอิสระที่แตกต่างกัน (เท่ากับจำนวนคู่ลบ 2 เช่น น-2). เฉพาะในกรณีที่ค่าสัมประสิทธิ์สหสัมพันธ์มากกว่าค่าวิกฤตเหล่านี้เท่านั้นจึงจะถือว่าเชื่อถือได้ ดังนั้นเพื่อให้ค่าสัมประสิทธิ์สหสัมพันธ์ 0.70 มีความน่าเชื่อถือ ควรนำข้อมูลอย่างน้อย 8 คู่มาวิเคราะห์ ( = พี - 2 = 6) เมื่อทำการคำนวณ ร(ตารางที่ ข.4) และ 7 คู่ข้อมูล (= n - 2 = 5) เมื่อคำนวณ ร ส (ตารางที่ 5 ในภาคผนวก ข.5)
สัมประสิทธิ์บราเวส์–เพียร์สัน
ในการคำนวณค่าสัมประสิทธิ์นี้ จะใช้สูตรต่อไปนี้ (อาจดูแตกต่างออกไปสำหรับผู้แต่งที่แตกต่างกัน):
โดยที่ เอ็กซ์วาย คือผลรวมของผลคูณของข้อมูลจากแต่ละคู่
น - จำนวนคู่
- ค่าเฉลี่ยสำหรับข้อมูลตัวแปร เอ็กซ์;
ค่าเฉลี่ยสำหรับข้อมูลตัวแปร วาย;
ส เอ็กซ์ - x;
ส วาย - ส่วนเบี่ยงเบนมาตรฐานสำหรับการแจกแจง ย.
ตอนนี้เราสามารถใช้ค่าสัมประสิทธิ์นี้เพื่อกำหนดว่ามีความสัมพันธ์ระหว่างเวลาตอบสนองของอาสาสมัครกับประสิทธิผลของการกระทำของพวกเขาหรือไม่ ยกตัวอย่างเช่น ระดับพื้นหลังของกลุ่มควบคุม
น= 15 15,8 13,4 = 3175,8;
(น – 1)ส x ส ย = 14 3,07 2,29 = 98,42;
ร
=
ค่าสัมประสิทธิ์สหสัมพันธ์ที่เป็นลบอาจหมายความว่ายิ่งเวลาตอบสนองนานเท่าใด ประสิทธิภาพก็จะยิ่งลดลงเท่านั้น อย่างไรก็ตาม ค่าของมันน้อยเกินไปที่จะสามารถพูดถึงความสัมพันธ์ที่มีนัยสำคัญระหว่างตัวแปรทั้งสองนี้ได้
เอ็นเอ็กซ์วาย=………
(น- 1) ส เอ็กซ์ ส วาย = ……
ข้อสรุปใดที่สามารถสรุปได้จากผลลัพธ์เหล่านี้ หากคุณคิดว่ามีความสัมพันธ์ระหว่างตัวแปร แล้วมันคืออะไร - โดยตรงหรือย้อนกลับ? เชื่อถือได้หรือไม่ [cf. แท็บ 4 (ในภาคผนวก B. 5) ที่มีค่าวิกฤต ร]?
ค่าสัมประสิทธิ์สหสัมพันธ์อันดับสเปียร์แมนร ส
ค่าสัมประสิทธิ์นี้คำนวณได้ง่ายกว่า แต่ผลลัพธ์มีความแม่นยำน้อยกว่าการใช้ ร.นี่คือความจริงที่ว่าเมื่อคำนวณค่าสัมประสิทธิ์ Spearman จะใช้ลำดับของข้อมูลไม่ใช่ลักษณะเชิงปริมาณและช่วงเวลาระหว่างคลาส
ประเด็นคือเมื่อใช้ค่าสัมประสิทธิ์สหสัมพันธ์อันดับ สเปียร์แมน(ร ส ) พวกเขาเพียงตรวจสอบว่าการจัดอันดับข้อมูลสำหรับตัวอย่างบางส่วนจะเหมือนกับในชุดข้อมูลอื่นสำหรับตัวอย่างนี้ที่จับคู่กับตัวอย่างแรกหรือไม่ (เช่น นักเรียนจะได้รับ "อันดับ" เท่ากันหรือไม่เมื่อสอบผ่านทั้งจิตวิทยาและคณิตศาสตร์ หรือ แม้จะมีอาจารย์ด้านจิตวิทยาสองคนที่แตกต่างกัน?) หากค่าสัมประสิทธิ์ใกล้เคียงกับ + 1 แสดงว่าทั้งสองอนุกรมตรงกัน และถ้าค่าสัมประสิทธิ์นี้ใกล้เคียงกับ - 1 เราสามารถพูดถึงความสัมพันธ์ผกผันได้อย่างสมบูรณ์
ค่าสัมประสิทธิ์ ร ส คำนวณตามสูตร
ที่ไหน d-ความแตกต่างระหว่างอันดับของค่าคุณลักษณะคอนจูเกต (โดยไม่คำนึงถึงเครื่องหมาย) และ น- จำนวนคู่
โดยปกติแล้ว การทดสอบแบบไม่มีพารามิเตอร์นี้จะใช้ในกรณีที่คุณจำเป็นต้องสรุปผลบางอย่างที่ไม่ค่อยเกี่ยวกับเรื่องนี้มากนัก ช่วงเวลาระหว่างข้อมูลเท่าไหร่เกี่ยวกับพวกเขา อันดับและเมื่อเส้นโค้งการกระจายไม่สมมาตรมากเกินไปและไม่อนุญาตให้ใช้เกณฑ์พาราเมตริกดังกล่าวเป็นค่าสัมประสิทธิ์ ร(ในกรณีเหล่านี้ อาจจำเป็นต้องแปลงข้อมูลเชิงปริมาณเป็นข้อมูลลำดับ)
เนื่องจากเป็นกรณีที่มีการแจกแจงค่าประสิทธิภาพและเวลาตอบสนองในกลุ่มทดลองหลังจากการสัมผัส คุณสามารถทำซ้ำการคำนวณที่คุณทำไปแล้วสำหรับกลุ่มนี้ได้ แต่ตอนนี้ไม่ใช่สำหรับค่าสัมประสิทธิ์ ร, และสำหรับตัวบ่งชี้ ร ส . สิ่งนี้จะช่วยให้คุณเห็นว่าตัวบ่งชี้ทั้งสองนี้แตกต่างกันอย่างไร*
* พึงระลึกว่า
1) สำหรับจำนวนการเข้าชม อันดับที่ 1 สอดคล้องกับประสิทธิภาพสูงสุด และอันดับที่ 15 ถึงประสิทธิภาพต่ำสุด ในขณะที่สำหรับเวลาตอบสนอง อันดับที่ 1 สอดคล้องกับเวลาที่สั้นที่สุด และอันดับที่ 15 ถึงนานที่สุด
2) ข้อมูล ex aequo จะได้รับอันดับเฉลี่ย
ดังนั้นในกรณีของค่าสัมประสิทธิ์ อาร์ได้รับผลบวกแม้ว่าจะไม่น่าเชื่อถือก็ตาม ผลลัพธ์ใดในสองข้อที่น่าเชื่อถือมากกว่ากัน: r=-0.48 หรือ ร ส = +0.24? คำถามดังกล่าวสามารถเกิดขึ้นได้ก็ต่อเมื่อผลลัพธ์นั้นเชื่อถือได้
ฉันต้องการเน้นอีกครั้งว่าสาระสำคัญของค่าสัมประสิทธิ์ทั้งสองนี้แตกต่างกันบ้าง ค่าสัมประสิทธิ์ลบ รบ่งชี้ว่าประสิทธิภาพส่วนใหญ่ยิ่งสูง เวลาตอบสนองเร็วขึ้น ในขณะที่คำนวณค่าสัมประสิทธิ์ ร ส จำเป็นต้องตรวจสอบว่าวัตถุที่เร็วกว่ามักจะตอบสนองได้แม่นยำกว่าเสมอ และวัตถุที่ช้ากว่าจะตอบสนองได้แม่นยำน้อยกว่า
เนื่องจากในกลุ่มทดลองหลังจากได้รับแสงแล้วจะได้ค่าสัมประสิทธิ์ ร ส , เท่ากับ 0.24 เห็นได้ชัดว่าไม่มีการติดตามแนวโน้มดังกล่าวที่นี่ พยายามทำความเข้าใจข้อมูลของกลุ่มควบคุมหลังจากสัมผัสสารด้วยตัวคุณเอง โดยรู้ว่า ง 2 = 122,5:
; เชื่อถือได้หรือไม่?
ข้อสรุปของคุณคืออะไร………………………………………………………………………
…………………………………………………………………………………………………………………….
ดังนั้นเราจึงได้พิจารณาวิธีการทางสถิติแบบพาราเมตริกและแบบไม่ใช้พาราเมตริกต่างๆ ที่ใช้ในทางจิตวิทยา การตรวจทานของเรานั้นผิวเผินมาก และงานหลักคือการทำให้ผู้อ่านเข้าใจว่าสถิติไม่ได้น่ากลัวอย่างที่คิด และต้องใช้สามัญสำนึกเป็นส่วนใหญ่ เราขอเตือนคุณว่าข้อมูลของ "ประสบการณ์" ที่เราจัดการในที่นี้เป็นเรื่องสมมติและไม่สามารถใช้เป็นพื้นฐานสำหรับข้อสรุปใดๆ อย่างไรก็ตาม การทดลองดังกล่าวก็คุ้มค่าที่จะทำ เนื่องจากการทดลองนี้เลือกใช้เทคนิคดั้งเดิมล้วนๆ จึงสามารถใช้การวิเคราะห์ทางสถิติแบบเดียวกันในการทดลองต่างๆ ได้ ไม่ว่าในกรณีใด ดูเหมือนว่าเราได้สรุปแนวทางหลักบางประการที่อาจเป็นประโยชน์สำหรับผู้ที่ไม่ทราบว่าจะเริ่มต้นการวิเคราะห์ทางสถิติของผลลัพธ์ได้จากที่ใด
สถิติมีสามสาขาหลัก: สถิติเชิงพรรณนา สถิติอุปนัย และการวิเคราะห์สหสัมพันธ์