คณะกรรมาธิการยุโรปเป็นส่วนหนึ่งของโครงสร้าง คณะกรรมาธิการยุโรป ต้องการความช่วยเหลือเกี่ยวกับหัวข้อ

ในบทความวันนี้ เราจะพูดถึงว่าตัวแปรเกี่ยวข้องกันได้อย่างไร ด้วยความช่วยเหลือของสหสัมพันธ์ เราจะสามารถระบุได้ว่ามีความสัมพันธ์ระหว่างตัวแปรตัวที่หนึ่งและตัวที่สองหรือไม่ ฉันหวังว่าคุณจะพบว่าบทเรียนนี้น่าตื่นเต้นเหมือนกับบทที่แล้ว!

ความสัมพันธ์วัดความแข็งแกร่งและทิศทางของความสัมพันธ์ระหว่าง x และ y รูปนี้แสดงความสัมพันธ์ประเภทต่างๆ เป็นแผนภาพกระจายของคู่อันดับ (x, y) ตามธรรมเนียมแล้ว x จะอยู่บนแกนนอน และ y จะอยู่ในแนวตั้ง

กราฟ A เป็นตัวอย่างของความสัมพันธ์เชิงเส้นเชิงบวก เมื่อ x เพิ่มขึ้น y ก็เพิ่มขึ้นและเป็นเส้นตรง แผนภาพ B แสดงตัวอย่างความสัมพันธ์เชิงเส้นเชิงลบ โดยที่ x เพิ่มขึ้น y ลดลงเชิงเส้น ในกราฟ C เราไม่เห็นความสัมพันธ์ระหว่าง x และ y ตัวแปรเหล่านี้ไม่มีผลซึ่งกันและกันแต่อย่างใด

สุดท้าย พล็อต D เป็นตัวอย่างของความสัมพันธ์ที่ไม่ใช่เชิงเส้นระหว่างตัวแปร เมื่อ x เพิ่มขึ้น y จะลดลงก่อน จากนั้นจึงเปลี่ยนทิศทางและเพิ่มขึ้น

บทความที่เหลืออุทิศให้กับความสัมพันธ์เชิงเส้นระหว่างตัวแปรตามและตัวแปรอิสระ

ค่าสัมประสิทธิ์สหสัมพันธ์

ค่าสัมประสิทธิ์สหสัมพันธ์ r ให้ทั้งความแข็งแกร่งและทิศทางของความสัมพันธ์ระหว่างตัวแปรอิสระและตัวแปรตาม ค่า r อยู่ระหว่าง -1.0 ถึง +1.0 เมื่อ r มี ค่าบวกความสัมพันธ์ระหว่าง x และ y เป็นบวก (แผนภาพ A ในรูป) และเมื่อค่าของ r เป็นลบ ความสัมพันธ์ก็เป็นลบด้วย (แผนภาพ B) ค่าสัมประสิทธิ์สหสัมพันธ์ที่ใกล้ศูนย์แสดงว่าไม่มีกราฟ C ระหว่าง x และ y

ความแข็งแรงของการเชื่อมต่อระหว่าง x และ y ถูกกำหนดโดยค่าความใกล้เคียงของค่าสัมประสิทธิ์สหสัมพันธ์ถึง - 1.0 หรือ + - 1.0 ศึกษารูปต่อไปนี้

พล็อต A แสดงความสัมพันธ์เชิงบวกที่สมบูรณ์แบบระหว่าง x และ y ที่ r = + 1.0 แผนภาพ B เป็นความสัมพันธ์เชิงลบที่สมบูรณ์แบบระหว่าง x และ y ที่ r = -1.0 พล็อต C และ D เป็นตัวอย่างของความสัมพันธ์ที่อ่อนแอกว่าระหว่างตัวแปรตามและตัวแปรอิสระ

ค่าสัมประสิทธิ์สหสัมพันธ์ r กำหนดทั้งความแรงและทิศทางของความสัมพันธ์ระหว่างตัวแปรตามและตัวแปรอิสระ ค่า r มีตั้งแต่ -1.0 (การเชื่อมโยงเชิงลบที่รุนแรง) ถึง +1.0 (การเชื่อมโยงเชิงบวกที่แข็งแกร่ง) สำหรับ r=0 ไม่มีความสัมพันธ์ระหว่าง x และ y

เราสามารถคำนวณค่าสัมประสิทธิ์สหสัมพันธ์จริงโดยใช้สมการต่อไปนี้

ดีดี! ฉันรู้ว่าสมการนี้ดูเหมือนสัญลักษณ์ที่สับสนปนเปกันไปหมด แต่ก่อนที่เราจะตื่นตระหนก ลองใช้ตัวอย่างเกรดข้อสอบกับสมการนี้ก่อน สมมติว่าฉันต้องการทราบว่ามีความสัมพันธ์ระหว่างจำนวนชั่วโมงที่นักเรียนใช้เรียนวิชาสถิติกับคะแนนสอบปลายภาคหรือไม่ ตารางด้านล่างจะช่วยเราแบ่งสมการนี้ออกเป็นการคำนวณง่ายๆ สองสามรายการ และทำให้สามารถจัดการได้มากขึ้น

อย่างที่คุณเห็น มีความสัมพันธ์เชิงบวกอย่างมากระหว่างจำนวนชั่วโมงที่ใช้เรียนวิชาหนึ่งกับคะแนนสอบ ครูจะมีความสุขมากที่ได้ทราบเกี่ยวกับเรื่องนี้

ประโยชน์ของการสร้างความสัมพันธ์ระหว่างตัวแปรที่คล้ายกันคืออะไร? คำถามที่ดี หากพบว่ามีการเชื่อมต่อ เราสามารถคาดการณ์คะแนนสอบตามจำนวนชั่วโมงที่ใช้เรียนวิชานั้นๆ พูดง่ายๆ ก็คือ ยิ่งความสัมพันธ์แน่นแฟ้นมากเท่าไหร่ การทำนายของเราก็จะยิ่งแม่นยำมากขึ้นเท่านั้น

การใช้ Excel เพื่อคำนวณค่าสัมประสิทธิ์สหสัมพันธ์

ฉันแน่ใจว่าหลังจากดูการคำนวณค่าสัมประสิทธิ์สหสัมพันธ์ที่น่ากลัวเหล่านี้แล้ว คุณจะรู้สึกยินดีอย่างแท้จริงที่รู้ว่า Excel สามารถทำงานทั้งหมดนี้ให้คุณได้โดยใช้ฟังก์ชัน CORREL ที่มีลักษณะดังต่อไปนี้:

CORREL(อาร์เรย์ 1; อาร์เรย์ 2),

อาร์เรย์ 1 = ช่วงข้อมูลสำหรับตัวแปรแรก

อาร์เรย์ 2 = ช่วงข้อมูลสำหรับตัวแปรที่สอง

ตัวอย่าง รูปแสดงฟังก์ชัน CORREL ที่ใช้ในการคำนวณค่าสัมประสิทธิ์สหสัมพันธ์สำหรับตัวอย่างเกรดข้อสอบ

ในบทที่ 4 เราดูสถิติเชิงพรรณนาพื้นฐานแบบตัวแปรเดียว ซึ่งเป็นการวัดแนวโน้มเข้าสู่ศูนย์กลางและความแปรปรวน ซึ่งใช้เพื่ออธิบายตัวแปรเดียว ในบทนี้ เราจะดูที่ค่าสัมประสิทธิ์สหสัมพันธ์หลัก

ค่าสัมประสิทธิ์สหสัมพันธ์- สถิติเชิงพรรณนาสองมิติ การวัดความสัมพันธ์เชิงปริมาณ (ความแปรปรวนร่วม) ของตัวแปรสองตัว

ประวัติของการพัฒนาและการใช้ค่าสัมประสิทธิ์สหสัมพันธ์สำหรับการศึกษาความสัมพันธ์นั้นเริ่มขึ้นพร้อมๆ กับการเกิดขึ้นของวิธีการวัดเพื่อศึกษาความแตกต่างระหว่างบุคคล - ในปี 1870-1880 ผู้บุกเบิกในการวัดความสามารถของมนุษย์ ตลอดจนผู้เขียนคำว่า "ค่าสัมประสิทธิ์สหสัมพันธ์" คือ Francis Galton และค่าสัมประสิทธิ์สหสัมพันธ์ที่เป็นที่นิยมมากที่สุดได้รับการพัฒนาโดยผู้ติดตามของเขา Karl Pearson ตั้งแต่นั้นมา การศึกษาความสัมพันธ์โดยใช้ค่าสัมประสิทธิ์สหสัมพันธ์เป็นหนึ่งในกิจกรรมที่ได้รับความนิยมมากที่สุดในด้านจิตวิทยา

จนถึงปัจจุบัน มีการพัฒนาค่าสัมประสิทธิ์สหสัมพันธ์ที่แตกต่างกันมากมาย หนังสือหลายร้อยเล่มทุ่มเทให้กับปัญหาในการวัดความสัมพันธ์ด้วยความช่วยเหลือของพวกเขา ดังนั้น เราจะพิจารณาเฉพาะสิ่งที่สำคัญที่สุดและขาดไม่ได้จริงๆ ในการวิจัยความสัมพันธ์ -- //--Pearson, r-Spearman และ m-Kendall ของพวกเขา ลักษณะทั่วไปคือการสะท้อนความสัมพันธ์ของคุณลักษณะสองประการที่วัดในระดับเชิงปริมาณ - อันดับหรือเมตริก

โดยทั่วไปแล้ว การศึกษาเชิงประจักษ์จะเน้นไปที่การศึกษาความสัมพันธ์ของตัวแปรตั้งแต่สองตัวขึ้นไป

ตัวอย่าง

ให้เรายกตัวอย่างสองตัวอย่างเกี่ยวกับการศึกษาอิทธิพลของการสาธิตฉากความรุนแรงในทีวีเกี่ยวกับความก้าวร้าวของวัยรุ่น 1. กำลังศึกษาความสัมพันธ์ของตัวแปรสองตัวที่วัดได้ในระดับเชิงปริมาณ (อันดับหรือเมตริก): 1) "เวลาในการดูรายการโทรทัศน์ที่มีความรุนแรง"; 2) "ความก้าวร้าว"

อ่านเหมือน Tau-Kendall


บทที่ 6 ค่าสัมประสิทธิ์สหสัมพันธ์

2. เราศึกษาความแตกต่างของความก้าวร้าวของวัยรุ่นตั้งแต่ 2 กลุ่มขึ้นไป ต่างกันที่ระยะเวลาในการรับชมรายการทีวีที่มีการสาธิตฉากความรุนแรง

ในตัวอย่างที่สอง การศึกษาความแตกต่างสามารถแสดงเป็นการศึกษาความสัมพันธ์ระหว่าง 2 ตัวแปร ซึ่งหนึ่งในนั้นคือตัวแปรเชิงนาม (ระยะเวลาการดูทีวี) และสำหรับสถานการณ์นี้ ยังมีการพัฒนาค่าสัมประสิทธิ์สหสัมพันธ์ของตัวเองด้วย

การศึกษาใด ๆ สามารถลดลงเป็นการศึกษาความสัมพันธ์ได้ เนื่องจากมีการคิดค้นค่าสัมประสิทธิ์สหสัมพันธ์ที่หลากหลายสำหรับเกือบทุกสถานการณ์การวิจัย แต่ต่อไปนี้เราจะแยกปัญหาออกเป็นสองประเภท:

P การศึกษาความสัมพันธ์ -เมื่อนำเสนอตัวแปรสองตัวในระดับตัวเลข

การศึกษาความแตกต่าง -เมื่ออย่างน้อยหนึ่งในสองตัวแปรถูกนำเสนอในระดับประโยค


ส่วนนี้ยังสอดคล้องกับตรรกะของการสร้างโปรแกรมสถิติคอมพิวเตอร์ยอดนิยมซึ่งในเมนู ความสัมพันธ์มีการเสนอค่าสัมประสิทธิ์สามค่า (/--Pearson, r-Spearman และ x-Kendall) และสำหรับการแก้ปัญหาการวิจัยอื่น ๆ มีการเสนอวิธีการเปรียบเทียบกลุ่ม

แนวคิดของความสัมพันธ์

ความสัมพันธ์ในภาษาคณิตศาสตร์มักอธิบายโดยใช้ฟังก์ชันที่แสดงเป็นภาพกราฟิกเป็นเส้น บนมะเดื่อ 6.1 แสดงกราฟของฟังก์ชันต่างๆ ถ้าการเปลี่ยนแปลงในตัวแปรหนึ่งหน่วยหนึ่งส่งผลให้ตัวแปรอื่นเปลี่ยนแปลงด้วยจำนวนที่เท่ากันเสมอ ฟังก์ชันจะเป็น เชิงเส้น(กราฟเป็นเส้นตรง); การเชื่อมต่ออื่นใด ไม่ใช่เชิงเส้นหากการเพิ่มขึ้นของตัวแปรหนึ่งสัมพันธ์กับการเพิ่มขึ้นของอีกตัวแปรหนึ่ง แสดงว่าความสัมพันธ์นั้นเป็นเช่นนั้น บวก (ตรง);หากการเพิ่มขึ้นของตัวแปรหนึ่งสัมพันธ์กับการลดลงของอีกตัวแปรหนึ่ง แสดงว่าความสัมพันธ์นั้นเป็นเช่นนั้น ลบ (ย้อนกลับ)หากทิศทางการเปลี่ยนแปลงของตัวแปรหนึ่งไม่เปลี่ยนแปลงตามการเพิ่ม (ลด) ของตัวแปรอื่น แสดงว่าฟังก์ชันดังกล่าวคือ ซ้ำซากจำเจ;มิฉะนั้นฟังก์ชันจะถูกเรียก ไม่โมโนโทนิก

ลิงค์การทำงานคล้ายกับที่แสดงในรูป 6.1 เป็นอุดมคติ ความไม่ชอบมาพากลอยู่ที่ความจริงที่ว่าค่าหนึ่งของตัวแปรหนึ่งสอดคล้องกับค่าที่กำหนดอย่างเคร่งครัดของตัวแปรอื่น ตัวอย่างเช่น ความสัมพันธ์ของตัวแปรทางกายภาพสองตัวคือน้ำหนักและความยาวลำตัว (ผลบวกเชิงเส้น) อย่างไรก็ตาม แม้ในการทดลองทางกายภาพ ความสัมพันธ์เชิงประจักษ์จะแตกต่างจากความสัมพันธ์เชิงหน้าที่เนื่องจากไม่ทราบสาเหตุหรือไม่ทราบสาเหตุ: ความผันผวนในองค์ประกอบของวัสดุ ข้อผิดพลาดในการวัด ฯลฯ

ข้าว. 6.1. ตัวอย่างกราฟของฟังก์ชันที่เกิดบ่อย

ในทางจิตวิทยา เช่นเดียวกับในศาสตร์อื่นๆ เมื่อศึกษาความสัมพันธ์ของสัญญาณ นักวิจัยจะสูญเสียเหตุผลที่เป็นไปได้หลายประการสำหรับความแปรปรวนของสัญญาณเหล่านี้อย่างหลีกเลี่ยงไม่ได้ ผลลัพธ์ที่ได้ก็คือ ความสัมพันธ์เชิงฟังก์ชันระหว่างตัวแปรที่มีอยู่จริงปรากฏเชิงประจักษ์ว่าน่าจะเป็น (สุ่ม): ค่าเดียวกันของตัวแปรหนึ่งสอดคล้องกับการกระจายของค่าต่าง ๆ ของตัวแปรอื่น (และในทางกลับกัน)ตัวอย่างที่ง่ายที่สุดคืออัตราส่วนของส่วนสูงและน้ำหนักของคน ผลลัพธ์เชิงประจักษ์ของการศึกษาสัญญาณทั้งสองนี้จะแสดงให้เห็นความสัมพันธ์เชิงบวกของสัญญาณทั้งสองอย่างแน่นอน แต่เดาได้ง่ายว่ามันจะแตกต่างจากฟังก์ชันทางคณิตศาสตร์ในอุดมคติที่เคร่งครัด เชิงเส้น บวก แม้ว่าจะใช้กลอุบายทั้งหมดของผู้วิจัยเพื่อคำนึงถึงความกลมกลืนหรือความสมบูรณ์ของวิชาก็ตาม (ไม่น่าเป็นไปได้ที่บนพื้นฐานนี้จะเกิดขึ้นกับใครก็ตามที่จะปฏิเสธการมีอยู่ของความสัมพันธ์เชิงหน้าที่ที่เข้มงวดระหว่างความยาวและน้ำหนักของร่างกาย)

ดังนั้น ในทางจิตวิทยา เช่นเดียวกับในศาสตร์อื่น ๆ ความสัมพันธ์เชิงหน้าที่ของปรากฏการณ์สามารถเปิดเผยได้ในเชิงประจักษ์โดยเป็นความสัมพันธ์เชิงความน่าจะเป็นของคุณลักษณะที่สอดคล้องกันเท่านั้น การแสดงภาพของธรรมชาติของความสัมพันธ์ที่น่าจะเป็นให้ แผนภาพกระจาย -กราฟที่มีแกนตรงกับค่าของตัวแปรสองตัวและแต่ละหัวเรื่องคือจุด (รูปที่ 6.2) ค่าสัมประสิทธิ์สหสัมพันธ์ถูกใช้เป็นลักษณะตัวเลขของการเชื่อมต่อที่น่าจะเป็น

06/06/2018 16 235 0 อิกอร์

จิตวิทยาและสังคม

ทุกสิ่งในโลกเชื่อมโยงถึงกัน แต่ละคนในระดับสัญชาตญาณพยายามที่จะค้นหาความสัมพันธ์ระหว่างปรากฏการณ์เพื่อให้สามารถมีอิทธิพลและควบคุมพวกเขาได้ แนวคิดที่สะท้อนถึงความสัมพันธ์นี้เรียกว่าสหสัมพันธ์ มันหมายความว่าอะไรในคำง่ายๆ?

เนื้อหา:

แนวคิดของความสัมพันธ์

ความสัมพันธ์ (จากภาษาละติน "correlatio" - อัตราส่วน, ความสัมพันธ์)- คำศัพท์ทางคณิตศาสตร์ที่หมายถึงการวัดความน่าจะเป็นทางสถิติที่พึ่งพาระหว่างตัวแปรสุ่ม (ตัวแปร)



ตัวอย่าง:ลองมาสองประเภทของความสัมพันธ์:

  1. อันดับแรก- ปากกาในมือคน มือเคลื่อนไปทางไหน ปากกาก็เคลื่อนไปทางนั้น ถ้ามืออยู่เฉยๆ ปากกาจะไม่เขียน หากคนกดแรงขึ้นเล็กน้อยเครื่องหมายบนกระดาษจะสมบูรณ์ยิ่งขึ้น ความสัมพันธ์ประเภทนี้สะท้อนถึงการพึ่งพาอาศัยกันอย่างเหนียวแน่นและไม่ใช่ความสัมพันธ์ ความสัมพันธ์นี้ใช้งานได้จริง
  2. มุมมองที่สอง- ความสัมพันธ์ระหว่างระดับการศึกษาของบุคคลกับการอ่านวรรณกรรม ไม่ทราบล่วงหน้าว่าคนอ่านเพิ่มเติม: อุดมศึกษาหรือไม่มีก็ได้ ความสัมพันธ์นี้เป็นแบบสุ่มหรือแบบสุ่ม มีการศึกษาโดยวิทยาศาสตร์ทางสถิติซึ่งเกี่ยวข้องกับปรากฏการณ์มวลเท่านั้น หากการคำนวณทางสถิติทำให้สามารถพิสูจน์ความสัมพันธ์ระหว่างระดับการศึกษาและการอ่านวรรณกรรมได้ สิ่งนี้จะทำให้สามารถคาดการณ์ใด ๆ เพื่อทำนายการเกิดเหตุการณ์ที่น่าจะเป็นได้ ในตัวอย่างนี้ มีความเป็นไปได้สูงที่บุคคลที่มีการศึกษาสูงกว่า ผู้ที่มีการศึกษาสูงกว่า จะอ่านหนังสือมากกว่า แต่เนื่องจากความสัมพันธ์ระหว่างพารามิเตอร์เหล่านี้ใช้งานไม่ได้ เราจึงอาจทำผิดพลาดได้ การคำนวณความน่าจะเป็นของข้อผิดพลาดดังกล่าวเป็นไปได้เสมอ ซึ่งจะมีค่าน้อยเป็นพิเศษและเรียกว่าระดับนัยสำคัญทางสถิติ (p)

ตัวอย่างความสัมพันธ์ระหว่าง ปรากฏการณ์ทางธรรมชาติเป็น:ห่วงโซ่อาหารในธรรมชาติ ร่างกายมนุษย์ซึ่งประกอบด้วยระบบอวัยวะที่เชื่อมโยงกันและทำงานเป็นองค์รวม

ทุกวันเราต้องเผชิญกับความสัมพันธ์ใน ชีวิตประจำวัน: ระหว่างสภาพอากาศและ อารมณ์ดี, การกำหนดเป้าหมายที่ถูกต้องและความสำเร็จของพวกเขา, ทัศนคติเชิงบวกและโชค, ความรู้สึกของความสุขและ ความเป็นอยู่ที่ดีทางการเงิน. แต่เรากำลังมองหาการเชื่อมโยงที่ไม่ได้ขึ้นอยู่กับการคำนวณทางคณิตศาสตร์ แต่มาจากตำนาน สัญชาตญาณ ไสยศาสตร์ การคาดเดาที่ไม่ได้ใช้งาน ปรากฏการณ์เหล่านี้เป็นเรื่องยากมากที่จะแปลเป็นภาษาทางคณิตศาสตร์ การแสดงเป็นตัวเลข การวัด อีกสิ่งหนึ่งคือเมื่อเราวิเคราะห์ปรากฏการณ์ที่สามารถคำนวณและนำเสนอในรูปของตัวเลขได้ ในกรณีนี้ เราสามารถกำหนดความสัมพันธ์โดยใช้ค่าสัมประสิทธิ์สหสัมพันธ์ (r) ซึ่งสะท้อนถึงความแข็งแกร่ง ระดับ ความใกล้เคียง และทิศทางของความสัมพันธ์ระหว่างตัวแปรสุ่ม

ความสัมพันธ์ที่แข็งแกร่งระหว่างตัวแปรสุ่ม- หลักฐานการมีอยู่ของความสัมพันธ์ทางสถิติบางอย่างโดยเฉพาะระหว่างปรากฏการณ์เหล่านี้ แต่ความสัมพันธ์นี้ไม่สามารถถ่ายโอนไปยังปรากฏการณ์เดียวกันได้ แต่สำหรับสถานการณ์ที่แตกต่างกัน บ่อยครั้ง นักวิจัยที่ได้รับความสัมพันธ์อย่างมีนัยสำคัญระหว่างตัวแปรสองตัวในการคำนวณโดยอาศัยความเรียบง่ายของการวิเคราะห์ความสัมพันธ์ ทำให้ตั้งสมมติฐานผิดๆ เกี่ยวกับการมีอยู่ของความสัมพันธ์เชิงสาเหตุระหว่างคุณลักษณะต่างๆ โดยลืมไปว่าค่าสัมประสิทธิ์สหสัมพันธ์นั้นน่าจะเป็นไปได้

ตัวอย่าง:จำนวนผู้บาดเจ็บระหว่างสภาวะน้ำแข็งและจำนวนอุบัติเหตุทางถนนระหว่างยานพาหนะ ปริมาณเหล่านี้จะสัมพันธ์กันแม้ว่าจะไม่เชื่อมโยงกันโดยสิ้นเชิง แต่มีความเกี่ยวพันกันเท่านั้น สาเหตุทั่วไปเหล่านี้ เหตุการณ์สุ่ม- น้ำแข็ง หากการวิเคราะห์ไม่ได้เปิดเผยความสัมพันธ์เชิงสหสัมพันธ์ระหว่างปรากฏการณ์ แสดงว่าสิ่งนี้ยังไม่เป็นหลักฐานของการไม่มีความสัมพันธ์ระหว่างปรากฏการณ์เหล่านี้ ซึ่งอาจมีความซับซ้อนไม่เชิงเส้น ซึ่งไม่ถูกเปิดเผยโดยการคำนวณความสัมพันธ์




คนแรกที่นำเสนอแนวคิดเกี่ยวกับความสัมพันธ์ในการหมุนเวียนทางวิทยาศาสตร์คือชาวฝรั่งเศส นักบรรพชีวินวิทยา Georges Cuvier. ในศตวรรษที่ 18 เขาได้อนุมานกฎแห่งความสัมพันธ์ของชิ้นส่วนและอวัยวะของสิ่งมีชีวิต ต้องขอบคุณที่มันเป็นไปได้ที่จะฟื้นฟูรูปลักษณ์ของสิ่งมีชีวิตฟอสซิลทั้งหมด สัตว์ จากส่วนที่พบของร่างกาย (ซากศพ) ในทางสถิติ คำว่าสหสัมพันธ์ถูกใช้ครั้งแรกในปี พ.ศ. 2429 โดยนักวิทยาศาสตร์ชาวอังกฤษ ฟรานซิส กาลตัน. แต่เขาไม่สามารถหาสูตรที่แน่นอนสำหรับการคำนวณค่าสัมประสิทธิ์สหสัมพันธ์ได้ แต่นักเรียนของเขาทำได้ - คาร์ล เพียร์สัน นักคณิตศาสตร์และนักชีววิทยาชื่อดัง

ประเภทของความสัมพันธ์

โดยความสำคัญ- มีนัยสำคัญสูง มีนัยสำคัญและไม่มีนัยสำคัญ

ชนิด

ร.คืออะไร

มีนัยสำคัญอย่างมาก

r สอดคล้องกับระดับนัยสำคัญทางสถิติ p<=0,01

มีความหมาย

r ตรงกับหน้า<=0,05

ไม่มีนัยสำคัญ

r ไม่ถึง p>0.1

เชิงลบ(การลดลงของค่าของตัวแปรหนึ่งนำไปสู่การเพิ่มขึ้นของระดับของอีกตัวแปรหนึ่ง: ยิ่งบุคคลนั้นมีความหวาดกลัวมากเท่าใด โอกาสที่จะดำรงตำแหน่งผู้นำก็จะยิ่งน้อยลงเท่านั้น) และเชิงบวก (หากการเพิ่มขึ้นของค่าหนึ่งทำให้เกิดการเพิ่มขึ้นของ ระดับอื่น: ยิ่งคุณประหม่ามากเท่าไหร่คุณก็ยิ่งมีโอกาสป่วยมากขึ้นเท่านั้น) หากไม่มีความสัมพันธ์ระหว่างตัวแปร ความสัมพันธ์ดังกล่าวจะเรียกว่าศูนย์

เชิงเส้น(เมื่อค่าหนึ่งเพิ่มขึ้นหรือลดลง ค่าที่สองก็จะเพิ่มขึ้นหรือลดลงด้วย) และไม่เป็นเชิงเส้น (เมื่อค่าหนึ่งเปลี่ยนแปลง ลักษณะของการเปลี่ยนแปลงในค่าที่สองไม่สามารถอธิบายได้โดยใช้การพึ่งพาเชิงเส้น จากนั้นจึงใช้กฎทางคณิตศาสตร์อื่นๆ - พหุนาม, การพึ่งพาเกินความจริง).

ตามกำลัง.

อัตราต่อรอง




คำนวณค่าสัมประสิทธิ์สหสัมพันธ์ประเภทต่างๆ ขึ้นอยู่กับสเกลของตัวแปรที่ศึกษา:

  1. ค่าสัมประสิทธิ์สหสัมพันธ์ของเพียร์สัน ค่าสัมประสิทธิ์สหสัมพันธ์เชิงเส้นคู่ หรือสหสัมพันธ์ของโมเมนต์ผลิตภัณฑ์ถูกคำนวณสำหรับตัวแปรที่มีมาตราส่วนการวัดช่วงเวลาและเชิงปริมาณ
  2. ค่าสัมประสิทธิ์สหสัมพันธ์อันดับของ Spearman หรือ Kendall - เมื่อค่าอย่างน้อยหนึ่งค่ามีมาตราส่วนลำดับหรือไม่ได้กระจายตามปกติ
  3. ชี้ค่าสัมประสิทธิ์สหสัมพันธ์แบบสองชุด (ค่าสัมประสิทธิ์สหสัมพันธ์เครื่องหมาย Fechner) - หากค่าใดค่าหนึ่งเป็นค่าสองค่า
  4. ค่าสัมประสิทธิ์สหสัมพันธ์แบบสี่ฟิลด์ (ค่าสัมประสิทธิ์ของความสัมพันธ์หลายอันดับ (สอดคล้องกัน) - ถ้าตัวแปรสองตัวเป็นแบบสองขั้ว

ค่าสัมประสิทธิ์ของเพียร์สันหมายถึงตัวบ่งชี้ความสัมพันธ์แบบพาราเมตริก ส่วนที่เหลือทั้งหมดเป็นค่าที่ไม่ใช่พารามิเตอร์

ค่าของสัมประสิทธิ์สหสัมพันธ์อยู่ในช่วงตั้งแต่ -1 ถึง +1 โดยมีความสัมพันธ์เชิงบวกอย่างสมบูรณ์ r = +1 โดยมีความสัมพันธ์เชิงลบอย่างสมบูรณ์ r = -1

สูตรและการคำนวณ





ตัวอย่าง

จำเป็นต้องกำหนดความสัมพันธ์ระหว่างตัวแปรสองตัว: ระดับการพัฒนาทางปัญญา (ตามผลการทดสอบ) และจำนวนการมาสายต่อเดือน (ตามรายการในวารสารการศึกษา) ของเด็กนักเรียน

ข้อมูลเริ่มต้นแสดงในตาราง:

ข้อมูลไอคิว (x)

ข้อมูลจำนวนผู้มาสาย (y)

ผลรวม

1122

เฉลี่ย

112,2


ในการตีความตัวบ่งชี้ที่ได้รับอย่างถูกต้องจำเป็นต้องวิเคราะห์สัญญาณของค่าสัมประสิทธิ์สหสัมพันธ์ (+ หรือ -) และค่าสัมบูรณ์ (โมดูโล)

ตามตารางการจำแนกประเภทของค่าสัมประสิทธิ์สหสัมพันธ์ตามความแข็งแกร่ง เราสรุปได้ว่า rxy = -0.827 เป็นความสัมพันธ์เชิงลบที่แข็งแกร่ง ดังนั้น จำนวนเด็กนักเรียนที่มาสายจึงขึ้นอยู่กับระดับพัฒนาการทางสติปัญญาของพวกเขาเป็นอย่างมาก อาจกล่าวได้ว่านักเรียนที่มี IQ สูงมีโอกาสเข้าเรียนสายน้อยกว่านักเรียนที่มี IQ ต่ำ



นักวิทยาศาสตร์สามารถใช้ค่าสัมประสิทธิ์สหสัมพันธ์เพื่อยืนยันหรือหักล้างข้อสันนิษฐานเกี่ยวกับการพึ่งพาของปริมาณหรือปรากฏการณ์สองอย่าง และวัดความแข็งแกร่ง ความสำคัญ และโดยนักเรียนเพื่อทำการวิจัยเชิงประจักษ์และสถิติในวิชาต่างๆ ต้องจำไว้ว่าตัวบ่งชี้นี้ไม่ใช่เครื่องมือในอุดมคติ มันถูกคำนวณเพื่อวัดความแข็งแกร่งของความสัมพันธ์เชิงเส้นเท่านั้น และจะเป็นค่าความน่าจะเป็นที่มีข้อผิดพลาดเสมอ

การวิเคราะห์สหสัมพันธ์ใช้ในพื้นที่ต่อไปนี้:

  • วิทยาศาสตร์เศรษฐศาสตร์
  • ฟิสิกส์ดาราศาสตร์;
  • สังคมศาสตร์ (สังคมวิทยา จิตวิทยา การสอน);
  • เคมีเกษตร;
  • โลหะศาสตร์
  • อุตสาหกรรม (สำหรับการควบคุมคุณภาพ);
  • อุทกวิทยา;
  • ไบโอเมตริกซ์ ฯลฯ

เหตุผลที่นิยมใช้วิธีวิเคราะห์ความสัมพันธ์:

  1. ความเรียบง่ายของการคำนวณสัมประสิทธิ์สหสัมพันธ์ไม่จำเป็นต้องมีการศึกษาทางคณิตศาสตร์พิเศษ
  2. ให้คุณคำนวณความสัมพันธ์ระหว่างตัวแปรสุ่มเชิงมวลซึ่งเป็นเรื่องของการวิเคราะห์ทางสถิติศาสตร์ ในเรื่องนี้วิธีการนี้แพร่หลายในด้านการวิจัยทางสถิติ

หวังว่าตอนนี้คุณจะสามารถแยกความแตกต่างระหว่างความสัมพันธ์เชิงหน้าที่และความสัมพันธ์เชิงสัมพันธ์ได้แล้ว และคุณจะรู้ว่าเมื่อคุณได้ยินทางโทรทัศน์หรืออ่านข่าวเกี่ยวกับความสัมพันธ์ มันหมายถึงความสัมพันธ์เชิงบวกและค่อนข้างสำคัญระหว่างสองปรากฏการณ์

ในการวิจัยทางวิทยาศาสตร์ บ่อยครั้งที่จำเป็นต้องค้นหาความสัมพันธ์ระหว่างตัวแปรผลลัพธ์และตัวแปรปัจจัย (ผลผลิตของพืชผลและปริมาณน้ำฝน ความสูงและน้ำหนักของบุคคลในกลุ่มที่เป็นเนื้อเดียวกันตามเพศและอายุ อัตราการเต้นของชีพจร และอุณหภูมิของร่างกาย ฯลฯ).

ประการที่สองคือสัญญาณที่นำไปสู่การเปลี่ยนแปลงของผู้ที่เกี่ยวข้อง (สัญญาณแรก)

แนวคิดของการวิเคราะห์ความสัมพันธ์

มีชุดหนึ่ง จากข้างต้น เราสามารถพูดได้ว่าการวิเคราะห์สหสัมพันธ์เป็นวิธีการที่ใช้ในการทดสอบสมมติฐานของนัยสำคัญทางสถิติของตัวแปรสองตัวหรือมากกว่านั้น หากผู้วิจัยสามารถวัดค่าเหล่านั้นได้ แต่ไม่สามารถเปลี่ยนแปลงได้

มีคำจำกัดความอื่น ๆ ของแนวคิดที่กำลังพิจารณาอยู่ การวิเคราะห์สหสัมพันธ์เป็นวิธีการประมวลผลที่ตรวจสอบค่าสัมประสิทธิ์สหสัมพันธ์ระหว่างตัวแปร ในกรณีนี้ ค่าสัมประสิทธิ์สหสัมพันธ์ระหว่างคุณลักษณะหนึ่งคู่หรือหลายคู่จะถูกเปรียบเทียบเพื่อสร้างความสัมพันธ์ทางสถิติระหว่างทั้งสอง การวิเคราะห์สหสัมพันธ์เป็นวิธีการศึกษาการพึ่งพาทางสถิติระหว่างตัวแปรสุ่มที่มีตัวเลือกของลักษณะการทำงานที่เข้มงวด ซึ่งไดนามิกของตัวแปรสุ่มหนึ่งตัวนำไปสู่ไดนามิกของความคาดหวังทางคณิตศาสตร์ของอีกตัวแปรหนึ่ง

แนวคิดของความสัมพันธ์ที่ผิดพลาด

เมื่อทำการวิเคราะห์ความสัมพันธ์ จะต้องคำนึงถึงว่าสามารถดำเนินการได้โดยสัมพันธ์กับชุดของคุณลักษณะใดๆ ซึ่งมักจะไร้สาระเมื่อเกี่ยวข้องกัน บางครั้งพวกเขาไม่มีความสัมพันธ์เชิงสาเหตุซึ่งกันและกัน

ในกรณีนี้ เราพูดถึงความสัมพันธ์ปลอมๆ

ปัญหาการวิเคราะห์ความสัมพันธ์

จากคำจำกัดความข้างต้น เราสามารถกำหนดงานต่อไปนี้ของวิธีการที่อธิบายไว้: รับข้อมูลเกี่ยวกับตัวแปรที่ต้องการโดยใช้อีกตัวแปรหนึ่ง กำหนดความใกล้ชิดของความสัมพันธ์ระหว่างตัวแปรที่ศึกษา

การวิเคราะห์สหสัมพันธ์เกี่ยวข้องกับการกำหนดความสัมพันธ์ระหว่างคุณลักษณะที่ศึกษา ดังนั้นงานของการวิเคราะห์สหสัมพันธ์สามารถเสริมด้วยสิ่งต่อไปนี้:

  • การระบุปัจจัยที่มีผลกระทบมากที่สุดต่อเครื่องหมายผลลัพธ์
  • การระบุสาเหตุของความสัมพันธ์ที่ยังไม่ได้สำรวจก่อนหน้านี้
  • การสร้างแบบจำลองความสัมพันธ์ด้วยการวิเคราะห์พาราเมตริก
  • ศึกษาความสำคัญของพารามิเตอร์การสื่อสารและการประมาณช่วงเวลา

การเชื่อมโยงการวิเคราะห์ความสัมพันธ์กับการถดถอย

วิธีการวิเคราะห์ความสัมพันธ์มักจะไม่จำกัดเฉพาะการหาความใกล้ชิดของความสัมพันธ์ระหว่างปริมาณที่ศึกษา บางครั้งก็เสริมด้วยการรวบรวมสมการถดถอย ซึ่งได้มาจากการวิเคราะห์ชื่อเดียวกัน และเป็นคำอธิบายของความสัมพันธ์ระหว่างคุณลักษณะที่เป็นผลลัพธ์และแฟกทอเรียล (แฟกทอเรียล) วิธีนี้ประกอบกับการวิเคราะห์ที่กำลังพิจารณาประกอบกันเป็นวิธีการ

เงื่อนไขการใช้เมธอด

ปัจจัยด้านผลลัพธ์ขึ้นอยู่กับปัจจัยอย่างน้อยหนึ่งปัจจัย วิธีการวิเคราะห์ความสัมพันธ์สามารถใช้ได้หากมีข้อสังเกตจำนวนมากเกี่ยวกับค่าของประสิทธิภาพและตัวบ่งชี้ปัจจัย (ปัจจัย) ในขณะที่ปัจจัยที่ศึกษาควรเป็นเชิงปริมาณและสะท้อนให้เห็นในแหล่งเฉพาะ ค่าแรกสามารถกำหนดได้โดยกฎปกติ - ในกรณีนี้ ค่าสัมประสิทธิ์สหสัมพันธ์ของเพียร์สันเป็นผลมาจากการวิเคราะห์สหสัมพันธ์ หรือหากสัญญาณไม่เป็นไปตามกฎนี้ ค่าสัมประสิทธิ์สหสัมพันธ์อันดับสเปียร์แมนจะถูกใช้

หลักเกณฑ์การเลือกตัวประกอบในการวิเคราะห์สหสัมพันธ์

เมื่อใช้วิธีนี้จำเป็นต้องกำหนดปัจจัยที่มีอิทธิพลต่อตัวบ่งชี้ประสิทธิภาพ พวกเขาได้รับการคัดเลือกโดยคำนึงถึงข้อเท็จจริงที่ว่าต้องมีความสัมพันธ์เชิงสาเหตุระหว่างตัวบ่งชี้ ในกรณีของการสร้างแบบจำลองสหสัมพันธ์หลายปัจจัย แบบจำลองสหสัมพันธ์ที่มีผลกระทบอย่างมีนัยสำคัญต่อตัวบ่งชี้ผลลัพธ์จะถูกเลือก ในขณะที่ไม่ควรรวมปัจจัยที่พึ่งพาซึ่งกันและกันที่มีค่าสัมประสิทธิ์สหสัมพันธ์คู่มากกว่า 0.85 ในแบบจำลองสหสัมพันธ์ เช่นเดียวกับปัจจัยเหล่านั้น ซึ่งความสัมพันธ์กับพารามิเตอร์ผลลัพธ์เป็นทางอ้อม หรือการทำงาน

แสดงผล

ผลการวิเคราะห์ความสัมพันธ์สามารถนำเสนอในรูปแบบข้อความและกราฟิก ในกรณีแรก จะแสดงเป็นค่าสัมประสิทธิ์สหสัมพันธ์ ส่วนกรณีที่สองจะแสดงเป็นแผนภาพกระจาย

หากไม่มีความสัมพันธ์ระหว่างพารามิเตอร์ จุดบนไดอะแกรมจะอยู่แบบสุ่ม ระดับเฉลี่ยของการเชื่อมต่อจะมีลักษณะตามระดับของลำดับที่มากขึ้น และมีลักษณะระยะห่างที่สม่ำเสมอของเครื่องหมายที่ทำเครื่องหมายจากค่ามัธยฐานมากหรือน้อย การเชื่อมต่อที่แข็งแกร่งมีแนวโน้มที่จะเป็นเส้นตรงและที่ r=1 พล็อตกระจายจะเป็นเส้นแบน ความสัมพันธ์แบบผกผันมีลักษณะโดยทิศทางของกราฟจากซ้ายบนไปขวาล่าง ซึ่งเป็นทิศทางตรงจากซ้ายล่างไปยังมุมขวาบน

การแสดง 3 มิติของ scatterplot (การกระจาย)

นอกเหนือจากการนำเสนอ scatterplot แบบ 2 มิติแบบดั้งเดิมแล้ว ปัจจุบันมีการใช้การแสดงกราฟิก 3 มิติของการวิเคราะห์ความสัมพันธ์

นอกจากนี้ยังใช้เมทริกซ์ scatterplot ซึ่งแสดงพล็อตที่จับคู่ทั้งหมดในรูปเดียวในรูปแบบเมทริกซ์ สำหรับตัวแปร n ตัว เมทริกซ์ประกอบด้วย n แถวและ n คอลัมน์ แผนภาพที่อยู่ตรงจุดตัดของแถว i-th และคอลัมน์ j เป็นกราฟของตัวแปร Xi เทียบกับ Xj ดังนั้นแต่ละแถวและคอลัมน์จึงเป็นหนึ่งมิติ เซลล์เดียวจะแสดงแผนภาพกระจายของสองมิติ

การประมาณความหนาแน่นของการเชื่อมต่อ

ความหนาแน่นของความสัมพันธ์ถูกกำหนดโดยค่าสัมประสิทธิ์สหสัมพันธ์ (r): แข็งแกร่ง - r = ±0.7 ถึง ±1, ปานกลาง - r = ±0.3 ถึง ±0.699, อ่อนแอ - r = 0 ถึง ±0.299 การจัดหมวดหมู่นี้ไม่เข้มงวด รูปแสดงโครงร่างที่แตกต่างกันเล็กน้อย

ตัวอย่างการใช้วิธีวิเคราะห์สหสัมพันธ์

มีการศึกษาที่น่าสนใจในสหราชอาณาจักร อุทิศให้กับความสัมพันธ์ของการสูบบุหรี่กับมะเร็งปอด และดำเนินการโดยการวิเคราะห์ความสัมพันธ์ ข้อสังเกตนี้แสดงไว้ด้านล่าง

ข้อมูลเบื้องต้นสำหรับการวิเคราะห์สหสัมพันธ์

กลุ่มอาชีพ

ความตาย

ชาวนา ชาวป่า และชาวประมง

คนงานเหมืองและคนงานเหมืองหิน

ผู้ผลิตก๊าซ ถ่านโค้ก และเคมีภัณฑ์

ผู้ผลิตแก้วและเซรามิก

คนงานในเตาหลอม โรงหลอม โรงหล่อ และโรงรีด

พนักงานไฟฟ้าและอิเล็กทรอนิกส์

วิศวกรรมศาสตร์และวิชาชีพที่เกี่ยวข้อง

การผลิตงานไม้

แทนเนอร์

คนงานสิ่งทอ

ผู้ผลิตชุดทำงาน

ผู้ปฏิบัติงานในอุตสาหกรรมอาหาร เครื่องดื่ม และยาสูบ

ผู้ผลิตกระดาษและสิ่งพิมพ์

ผู้ผลิตสินค้าอื่นๆ

ผู้สร้าง

ศิลปินและมัณฑนากร

พนักงานขับรถเครน เครน ฯลฯ

ไม่รวมคนงานที่อื่น

พนักงานขนส่งและสื่อสาร

คนงานคลังสินค้า ผู้ดูแลร้าน คนบรรจุหีบห่อ และคนงานเครื่องบรรจุ

พนักงานออฟฟิศ

ผู้ขาย

พนักงานบริการกีฬาและนันทนาการ

ผู้บริหารและผู้จัดการ

มืออาชีพ ช่างเทคนิค และศิลปิน

เราเริ่มการวิเคราะห์ความสัมพันธ์ เป็นการดีกว่าที่จะเริ่มต้นการแก้ปัญหาเพื่อความชัดเจนด้วยวิธีกราฟิกซึ่งเราจะสร้างไดอะแกรมกระจาย (กระจาย)

เธอแสดงการเชื่อมต่อโดยตรง อย่างไรก็ตาม เป็นการยากที่จะสรุปผลที่ชัดเจนโดยใช้วิธีกราฟิกเพียงอย่างเดียว ดังนั้นเราจะดำเนินการวิเคราะห์ความสัมพันธ์ต่อไป ตัวอย่างการคำนวณค่าสัมประสิทธิ์สหสัมพันธ์แสดงไว้ด้านล่าง

การใช้เครื่องมือซอฟต์แวร์ (ในตัวอย่างของ MS Excel จะอธิบายไว้ด้านล่าง) เรากำหนดค่าสัมประสิทธิ์สหสัมพันธ์ซึ่งเท่ากับ 0.716 ซึ่งหมายถึงความสัมพันธ์ที่แข็งแกร่งระหว่างพารามิเตอร์ที่ศึกษา ให้เรากำหนดนัยสำคัญทางสถิติของค่าที่ได้รับตามตารางที่เกี่ยวข้อง ซึ่งเราต้องลบ 2 จาก 25 คู่ของค่า ดังนั้นเราจะได้ 23 และสำหรับบรรทัดนี้ในตาราง เราพบว่า r สำคัญสำหรับ p = 0.01 (เนื่องจากข้อมูลเหล่านี้เป็นข้อมูลทางการแพทย์ การพึ่งพาอาศัยกันที่เข้มงวดมากขึ้น ในกรณีอื่นๆ p=0.05 ก็เพียงพอแล้ว) ซึ่งเป็น 0.51 สำหรับการวิเคราะห์สหสัมพันธ์นี้ ตัวอย่างแสดงให้เห็นว่า r ที่คำนวณได้มีค่ามากกว่าค่าวิกฤต r ค่าของสัมประสิทธิ์สหสัมพันธ์ถือว่ามีนัยสำคัญทางสถิติ

การใช้ซอฟต์แวร์ในการวิเคราะห์ความสัมพันธ์

ประเภทของการประมวลผลข้อมูลทางสถิติที่อธิบายไว้สามารถทำได้โดยใช้ซอฟต์แวร์ โดยเฉพาะ MS Excel ความสัมพันธ์เกี่ยวข้องกับการคำนวณพารามิเตอร์ต่อไปนี้โดยใช้ฟังก์ชัน:

1. ค่าสัมประสิทธิ์สหสัมพันธ์ถูกกำหนดโดยใช้ฟังก์ชัน CORREL (array1; array2) Array1,2 เป็นเซลล์ของช่วงค่าของตัวแปรผลลัพธ์และปัจจัย

ค่าสัมประสิทธิ์สหสัมพันธ์เชิงเส้นเรียกอีกอย่างว่าค่าสัมประสิทธิ์สหสัมพันธ์เพียร์สัน ดังนั้น ตั้งแต่ Excel 2007 เป็นต้นไป คุณสามารถใช้ฟังก์ชันกับอาร์เรย์เดียวกันได้

การแสดงกราฟิกของการวิเคราะห์ความสัมพันธ์ใน Excel ทำได้โดยใช้แผง "แผนภูมิ" ที่มีตัวเลือก "Scatter Plot"

หลังจากระบุข้อมูลเริ่มต้นแล้ว เราจะได้กราฟ

2. การประเมินนัยสำคัญของค่าสัมประสิทธิ์สหสัมพันธ์รายคู่โดยใช้แบบทดสอบของนักเรียน ค่าที่คำนวณได้ของเกณฑ์ t จะถูกนำไปเปรียบเทียบกับค่าตาราง (วิกฤต) ของตัวบ่งชี้นี้จากตารางค่าที่สอดคล้องกันของพารามิเตอร์ภายใต้การพิจารณา โดยคำนึงถึงระดับความสำคัญที่กำหนดและจำนวนองศาอิสระ การประมาณค่านี้ทำได้โดยใช้ฟังก์ชัน STUDIV(ความน่าจะเป็น; องศาของอิสระ)

3. เมทริกซ์ของค่าสัมประสิทธิ์สหสัมพันธ์คู่ การวิเคราะห์ดำเนินการโดยใช้เครื่องมือ "การวิเคราะห์ข้อมูล" ซึ่งเลือก "ความสัมพันธ์" การประเมินทางสถิติของค่าสัมประสิทธิ์สหสัมพันธ์ของคู่ดำเนินการโดยการเปรียบเทียบค่าสัมบูรณ์กับค่าตาราง (วิกฤต) เมื่อค่าสัมประสิทธิ์สหสัมพันธ์ของคู่ที่คำนวณได้มีค่ามากกว่าค่าวิกฤต เราสามารถพูดโดยคำนึงถึงระดับความน่าจะเป็นที่กำหนดว่าสมมติฐานว่างเกี่ยวกับความสำคัญของความสัมพันธ์เชิงเส้นจะไม่ถูกปฏิเสธ

ในที่สุด

การใช้วิธีการวิเคราะห์สหสัมพันธ์ในการวิจัยทางวิทยาศาสตร์ทำให้สามารถกำหนดความสัมพันธ์ระหว่างปัจจัยต่างๆ และตัวบ่งชี้ประสิทธิภาพได้ ในเวลาเดียวกัน ควรคำนึงถึงว่าค่าสัมประสิทธิ์สหสัมพันธ์สูงสามารถหาได้จากคู่ข้อมูลหรือชุดข้อมูลที่ไร้สาระ ดังนั้นการวิเคราะห์ประเภทนี้จึงต้องดำเนินการกับอาร์เรย์ข้อมูลที่มีขนาดใหญ่เพียงพอ

หลังจากได้รับค่าที่คำนวณได้ของ r แล้ว ขอแนะนำให้เปรียบเทียบกับค่าวิกฤต r เพื่อยืนยันนัยสำคัญทางสถิติของค่าหนึ่งๆ การวิเคราะห์ความสัมพันธ์สามารถทำได้ด้วยตนเองโดยใช้สูตร หรือใช้เครื่องมือซอฟต์แวร์ โดยเฉพาะ MS Excel ที่นี่ คุณยังสามารถสร้างไดอะแกรมกระจาย (กระจาย) เพื่อจุดประสงค์ในการแสดงภาพความสัมพันธ์ระหว่างปัจจัยที่ศึกษาของการวิเคราะห์สหสัมพันธ์และคุณลักษณะที่เป็นผลลัพธ์

เมื่อเรียน ความสัมพันธ์พยายามระบุว่ามีความสัมพันธ์ใดๆ ระหว่างตัวบ่งชี้สองตัวในกลุ่มตัวอย่างเดียวกันหรือไม่ (เช่น ระหว่างส่วนสูงและน้ำหนักของเด็ก หรือระหว่างระดับ ไอคิวและผลการเรียน) หรือระหว่างสองตัวอย่างที่แตกต่างกัน (เช่น เมื่อเปรียบเทียบฝาแฝดคู่หนึ่ง) และหากมีความสัมพันธ์นี้อยู่ ไม่ว่าการเพิ่มขึ้นของตัวบ่งชี้หนึ่งจะมาพร้อมกับการเพิ่มขึ้น (ความสัมพันธ์เชิงบวก) หรือการลดลง (ความสัมพันธ์เชิงลบ) ของ อื่น.

กล่าวอีกนัยหนึ่ง การวิเคราะห์สหสัมพันธ์ช่วยในการกำหนดว่าเป็นไปได้หรือไม่ที่จะทำนายค่าที่เป็นไปได้ของตัวบ่งชี้หนึ่ง โดยรู้ถึงค่าของอีกตัวบ่งชี้หนึ่ง

จนถึงขณะนี้ เมื่อวิเคราะห์ผลลัพธ์จากประสบการณ์ของเราในการศึกษาผลกระทบของกัญชา เราจงใจเพิกเฉยต่อตัวบ่งชี้เช่นเวลาตอบสนอง ในขณะเดียวกัน มันเป็นเรื่องที่น่าสนใจที่จะตรวจสอบว่ามีความสัมพันธ์ระหว่างประสิทธิภาพของปฏิกิริยากับความเร็วของมันหรือไม่ สิ่งนี้จะช่วยให้สามารถโต้แย้งได้ว่ายิ่งบุคคลนั้นช้าเท่าไร การกระทำของเขาก็จะแม่นยำและมีประสิทธิภาพมากขึ้นเท่านั้น และในทางกลับกัน

เพื่อจุดประสงค์นี้ สามารถใช้สองวิธีที่แตกต่างกัน: วิธีพาราเมตริกสำหรับการคำนวณค่าสัมประสิทธิ์ของ Bravais-Pearson (ร)และคำนวณค่าสัมประสิทธิ์สหสัมพันธ์ของอันดับสเปียร์แมน (ร ), ซึ่งใช้กับข้อมูลลำดับ กล่าวคือ ไม่ใช่พารามิเตอร์ อย่างไรก็ตาม ก่อนอื่นเรามาทำความเข้าใจว่าค่าสัมประสิทธิ์สหสัมพันธ์คืออะไร

ค่าสัมประสิทธิ์สหสัมพันธ์

ค่าสัมประสิทธิ์สหสัมพันธ์คือค่าที่สามารถเปลี่ยนแปลงได้ตั้งแต่ -1 ถึง 1 ในกรณีของความสัมพันธ์เชิงบวกโดยสมบูรณ์ ค่าสัมประสิทธิ์นี้คือบวก 1 และเมื่อมีค่าลบทั้งหมด - ลบ 1 บนกราฟ ค่านี้จะสอดคล้องกับเส้นตรงที่ผ่าน ผ่านจุดตัดกันของค่าข้อมูลแต่ละคู่:

ตัวแปร

หากจุดเหล่านี้ไม่เรียงตัวเป็นเส้นตรง แต่ก่อตัวเป็น "เมฆ" ค่าสัมบูรณ์ของสัมประสิทธิ์สหสัมพันธ์จะน้อยกว่าหนึ่งและเข้าใกล้ศูนย์เมื่อเมฆปัดเศษออก:

ถ้าสัมประสิทธิ์สหสัมพันธ์เป็น 0 ตัวแปรทั้งสองจะเป็นอิสระจากกันโดยสิ้นเชิง

ในมนุษยศาสตร์ ความสัมพันธ์ถือว่าแข็งแกร่งถ้าค่าสัมประสิทธิ์มากกว่า 0.60; หากเกิน 0.90 แสดงว่าความสัมพันธ์นั้นแข็งแกร่งมาก อย่างไรก็ตาม เพื่อให้สามารถสรุปผลเกี่ยวกับความสัมพันธ์ระหว่างตัวแปรต่างๆ ได้ ขนาดของกลุ่มตัวอย่างมีความสำคัญยิ่ง: ยิ่งกลุ่มตัวอย่างมีขนาดใหญ่ ค่าสัมประสิทธิ์สหสัมพันธ์ที่ได้รับก็จะยิ่งน่าเชื่อถือมากขึ้นเท่านั้น มีตารางที่มีค่าวิกฤตของค่าสัมประสิทธิ์สหสัมพันธ์ของ Bravais-Pearson และ Spearman สำหรับจำนวนองศาอิสระที่แตกต่างกัน (เท่ากับจำนวนคู่ลบ 2 เช่น -2). เฉพาะในกรณีที่ค่าสัมประสิทธิ์สหสัมพันธ์มากกว่าค่าวิกฤตเหล่านี้เท่านั้นจึงจะถือว่าเชื่อถือได้ ดังนั้นเพื่อให้ค่าสัมประสิทธิ์สหสัมพันธ์ 0.70 มีความน่าเชื่อถือ ควรนำข้อมูลอย่างน้อย 8 คู่มาวิเคราะห์ ( = พี - 2 = 6) เมื่อทำการคำนวณ (ตารางที่ ข.4) และ 7 คู่ข้อมูล (= n - 2 = 5) เมื่อคำนวณ (ตารางที่ 5 ในภาคผนวก ข.5)

สัมประสิทธิ์บราเวส์–เพียร์สัน

ในการคำนวณค่าสัมประสิทธิ์นี้ จะใช้สูตรต่อไปนี้ (อาจดูแตกต่างออกไปสำหรับผู้แต่งที่แตกต่างกัน):

โดยที่  เอ็กซ์วาย คือผลรวมของผลคูณของข้อมูลจากแต่ละคู่

- จำนวนคู่

- ค่าเฉลี่ยสำหรับข้อมูลตัวแปร เอ็กซ์;

ค่าเฉลี่ยสำหรับข้อมูลตัวแปร วาย;

เอ็กซ์ - x;

วาย - ส่วนเบี่ยงเบนมาตรฐานสำหรับการแจกแจง ย.

ตอนนี้เราสามารถใช้ค่าสัมประสิทธิ์นี้เพื่อกำหนดว่ามีความสัมพันธ์ระหว่างเวลาตอบสนองของอาสาสมัครกับประสิทธิผลของการกระทำของพวกเขาหรือไม่ ยกตัวอย่างเช่น ระดับพื้นหลังของกลุ่มควบคุม

= 15  15,8  13,4 = 3175,8;

( 1) x = 14  3,07  2,29 = 98,42;

=

ค่าสัมประสิทธิ์สหสัมพันธ์ที่เป็นลบอาจหมายความว่ายิ่งเวลาตอบสนองนานเท่าใด ประสิทธิภาพก็จะยิ่งลดลงเท่านั้น อย่างไรก็ตาม ค่าของมันน้อยเกินไปที่จะสามารถพูดถึงความสัมพันธ์ที่มีนัยสำคัญระหว่างตัวแปรทั้งสองนี้ได้

เอ็นเอ็กซ์วาย=………

(น- 1) ส เอ็กซ์ วาย = ……

ข้อสรุปใดที่สามารถสรุปได้จากผลลัพธ์เหล่านี้ หากคุณคิดว่ามีความสัมพันธ์ระหว่างตัวแปร แล้วมันคืออะไร - โดยตรงหรือย้อนกลับ? เชื่อถือได้หรือไม่ [cf. แท็บ 4 (ในภาคผนวก B. 5) ที่มีค่าวิกฤต ]?

ค่าสัมประสิทธิ์สหสัมพันธ์อันดับสเปียร์แมน

ค่าสัมประสิทธิ์นี้คำนวณได้ง่ายกว่า แต่ผลลัพธ์มีความแม่นยำน้อยกว่าการใช้ ร.นี่คือความจริงที่ว่าเมื่อคำนวณค่าสัมประสิทธิ์ Spearman จะใช้ลำดับของข้อมูลไม่ใช่ลักษณะเชิงปริมาณและช่วงเวลาระหว่างคลาส

ประเด็นคือเมื่อใช้ค่าสัมประสิทธิ์สหสัมพันธ์อันดับ สเปียร์แมน(ร ) พวกเขาเพียงตรวจสอบว่าการจัดอันดับข้อมูลสำหรับตัวอย่างบางส่วนจะเหมือนกับในชุดข้อมูลอื่นสำหรับตัวอย่างนี้ที่จับคู่กับตัวอย่างแรกหรือไม่ (เช่น นักเรียนจะได้รับ "อันดับ" เท่ากันหรือไม่เมื่อสอบผ่านทั้งจิตวิทยาและคณิตศาสตร์ หรือ แม้จะมีอาจารย์ด้านจิตวิทยาสองคนที่แตกต่างกัน?) หากค่าสัมประสิทธิ์ใกล้เคียงกับ + 1 แสดงว่าทั้งสองอนุกรมตรงกัน และถ้าค่าสัมประสิทธิ์นี้ใกล้เคียงกับ - 1 เราสามารถพูดถึงความสัมพันธ์ผกผันได้อย่างสมบูรณ์

ค่าสัมประสิทธิ์ คำนวณตามสูตร

ที่ไหน d-ความแตกต่างระหว่างอันดับของค่าคุณลักษณะคอนจูเกต (โดยไม่คำนึงถึงเครื่องหมาย) และ - จำนวนคู่

โดยปกติแล้ว การทดสอบแบบไม่มีพารามิเตอร์นี้จะใช้ในกรณีที่คุณจำเป็นต้องสรุปผลบางอย่างที่ไม่ค่อยเกี่ยวกับเรื่องนี้มากนัก ช่วงเวลาระหว่างข้อมูลเท่าไหร่เกี่ยวกับพวกเขา อันดับและเมื่อเส้นโค้งการกระจายไม่สมมาตรมากเกินไปและไม่อนุญาตให้ใช้เกณฑ์พาราเมตริกดังกล่าวเป็นค่าสัมประสิทธิ์ (ในกรณีเหล่านี้ อาจจำเป็นต้องแปลงข้อมูลเชิงปริมาณเป็นข้อมูลลำดับ)

เนื่องจากเป็นกรณีที่มีการแจกแจงค่าประสิทธิภาพและเวลาตอบสนองในกลุ่มทดลองหลังจากการสัมผัส คุณสามารถทำซ้ำการคำนวณที่คุณทำไปแล้วสำหรับกลุ่มนี้ได้ แต่ตอนนี้ไม่ใช่สำหรับค่าสัมประสิทธิ์ , และสำหรับตัวบ่งชี้ . สิ่งนี้จะช่วยให้คุณเห็นว่าตัวบ่งชี้ทั้งสองนี้แตกต่างกันอย่างไร*

* พึงระลึกว่า

1) สำหรับจำนวนการเข้าชม อันดับที่ 1 สอดคล้องกับประสิทธิภาพสูงสุด และอันดับที่ 15 ถึงประสิทธิภาพต่ำสุด ในขณะที่สำหรับเวลาตอบสนอง อันดับที่ 1 สอดคล้องกับเวลาที่สั้นที่สุด และอันดับที่ 15 ถึงนานที่สุด

2) ข้อมูล ex aequo จะได้รับอันดับเฉลี่ย

ดังนั้นในกรณีของค่าสัมประสิทธิ์ อาร์ได้รับผลบวกแม้ว่าจะไม่น่าเชื่อถือก็ตาม ผลลัพธ์ใดในสองข้อที่น่าเชื่อถือมากกว่ากัน: r=-0.48 หรือ = +0.24? คำถามดังกล่าวสามารถเกิดขึ้นได้ก็ต่อเมื่อผลลัพธ์นั้นเชื่อถือได้

ฉันต้องการเน้นอีกครั้งว่าสาระสำคัญของค่าสัมประสิทธิ์ทั้งสองนี้แตกต่างกันบ้าง ค่าสัมประสิทธิ์ลบ บ่งชี้ว่าประสิทธิภาพส่วนใหญ่ยิ่งสูง เวลาตอบสนองเร็วขึ้น ในขณะที่คำนวณค่าสัมประสิทธิ์ จำเป็นต้องตรวจสอบว่าวัตถุที่เร็วกว่ามักจะตอบสนองได้แม่นยำกว่าเสมอ และวัตถุที่ช้ากว่าจะตอบสนองได้แม่นยำน้อยกว่า

เนื่องจากในกลุ่มทดลองหลังจากได้รับแสงแล้วจะได้ค่าสัมประสิทธิ์ , เท่ากับ 0.24 เห็นได้ชัดว่าไม่มีการติดตามแนวโน้มดังกล่าวที่นี่ พยายามทำความเข้าใจข้อมูลของกลุ่มควบคุมหลังจากสัมผัสสารด้วยตัวคุณเอง โดยรู้ว่า  2 = 122,5:

; เชื่อถือได้หรือไม่?

ข้อสรุปของคุณคืออะไร………………………………………………………………………

…………………………………………………………………………………………………………………….

ดังนั้นเราจึงได้พิจารณาวิธีการทางสถิติแบบพาราเมตริกและแบบไม่ใช้พาราเมตริกต่างๆ ที่ใช้ในทางจิตวิทยา การตรวจทานของเรานั้นผิวเผินมาก และงานหลักคือการทำให้ผู้อ่านเข้าใจว่าสถิติไม่ได้น่ากลัวอย่างที่คิด และต้องใช้สามัญสำนึกเป็นส่วนใหญ่ เราขอเตือนคุณว่าข้อมูลของ "ประสบการณ์" ที่เราจัดการในที่นี้เป็นเรื่องสมมติและไม่สามารถใช้เป็นพื้นฐานสำหรับข้อสรุปใดๆ อย่างไรก็ตาม การทดลองดังกล่าวก็คุ้มค่าที่จะทำ เนื่องจากการทดลองนี้เลือกใช้เทคนิคดั้งเดิมล้วนๆ จึงสามารถใช้การวิเคราะห์ทางสถิติแบบเดียวกันในการทดลองต่างๆ ได้ ไม่ว่าในกรณีใด ดูเหมือนว่าเราได้สรุปแนวทางหลักบางประการที่อาจเป็นประโยชน์สำหรับผู้ที่ไม่ทราบว่าจะเริ่มต้นการวิเคราะห์ทางสถิติของผลลัพธ์ได้จากที่ใด

สถิติมีสามสาขาหลัก: สถิติเชิงพรรณนา สถิติอุปนัย และการวิเคราะห์สหสัมพันธ์