คณะกรรมาธิการยุโรปมีกี่คณะกรรมาธิการยุโรป คณะกรรมาธิการยุโรป คณะกรรมาธิการยุโรปเป็นคณะผู้บริหารหลักของสหภาพยุโรป กิจกรรมของคณะกรรมาธิการยุโรป

ค่าสัมประสิทธิ์สหสัมพันธ์เป็นค่าที่สามารถเปลี่ยนแปลงได้ตั้งแต่ +1 ถึง -1 ในกรณีของความสัมพันธ์เชิงบวกที่สมบูรณ์ ค่าสัมประสิทธิ์นี้จะเท่ากับบวก 1 (พวกเขากล่าวว่าเมื่อค่าของตัวแปรหนึ่งเพิ่มขึ้น ค่าของตัวแปรอื่นจะเพิ่มขึ้น) และด้วยความสัมพันธ์เชิงลบที่สมบูรณ์ - ลบ 1 (ระบุข้อเสนอแนะ เช่น เมื่อค่าของตัวแปรหนึ่งเพิ่มขึ้น ค่าของอีกตัวแปรหนึ่งจะลดลง)

อดีต 1:

กราฟการพึ่งพาความประหม่าและภาวะซึมเศร้า อย่างที่คุณเห็น จุด (หัวเรื่อง) ไม่ได้อยู่แบบสุ่ม แต่เรียงกันเป็นแถวหนึ่งบรรทัด และเมื่อดูที่บรรทัดนี้ เราสามารถพูดได้ว่ายิ่งแสดงอาการเขินอายในบุคคลมากเท่าไหร่ อาการซึมเศร้าก็จะยิ่งมากขึ้นเท่านั้น เช่น ปรากฏการณ์เหล่านี้ มีการเชื่อมต่อกัน

ตัวอย่างที่ 2: กราฟสำหรับความประหม่าและการเข้าสังคม เราเห็นว่าเมื่อความเขินอายเพิ่มขึ้น ความเป็นกันเองก็ลดลง ค่าสัมประสิทธิ์สหสัมพันธ์คือ -0.43 ดังนั้น ค่าสัมประสิทธิ์สหสัมพันธ์ที่มากกว่า 0 ถึง 1 บ่งชี้ถึงความสัมพันธ์แบบสัดส่วนโดยตรง (ยิ่งมาก ... ยิ่งมาก) และค่าสัมประสิทธิ์ตั้งแต่ -1 ถึง 0 บ่งชี้ถึงความสัมพันธ์แบบสัดส่วนผกผัน (ยิ่งมาก ... ยิ่งน้อย . ..)

ถ้าสัมประสิทธิ์สหสัมพันธ์เป็น 0 ตัวแปรทั้งสองจะเป็นอิสระจากกันโดยสิ้นเชิง

ความสัมพันธ์- นี่คือความสัมพันธ์ที่ผลกระทบของปัจจัยแต่ละอย่างปรากฏเป็นแนวโน้มเท่านั้น (โดยเฉลี่ย) กับการสังเกตข้อมูลจริงจำนวนมาก ตัวอย่างของการพึ่งพาความสัมพันธ์อาจเป็นการพึ่งพาระหว่างขนาดสินทรัพย์ของธนาคารและจำนวนกำไรของธนาคาร การเติบโตของผลิตภาพแรงงานและอายุงานของพนักงาน

มีการใช้ระบบการจำแนกความสัมพันธ์สองระบบตามความแข็งแกร่ง: ทั่วไปและเฉพาะ

การจำแนกความสัมพันธ์โดยทั่วไป: 1) สูงหรือใกล้เคียงด้วยค่าสัมประสิทธิ์สหสัมพันธ์ r> 0.70; 2) ปานกลางที่ 0.500.70 และไม่ใช่แค่ความสัมพันธ์ที่มีนัยสำคัญระดับสูงเท่านั้น

ตารางต่อไปนี้แสดงชื่อค่าสัมประสิทธิ์สหสัมพันธ์สำหรับมาตราส่วนประเภทต่างๆ

สเกลสองขั้ว (1/0) ระดับอันดับ (ลำดับ)
สเกลสองขั้ว (1/0) ค่าสัมประสิทธิ์การเชื่อมโยงของเพียร์สัน ค่าสัมประสิทธิ์การผันสี่เซลล์ของเพียร์สัน ความสัมพันธ์แบบทวิภาค
ระดับอันดับ (ลำดับ) ความสัมพันธ์ระหว่างอันดับและทวิภาค ค่าสัมประสิทธิ์สหสัมพันธ์อันดับของสเปียร์แมนหรือเคนดัลล์
ช่วงเวลาและมาตราส่วนสัมบูรณ์ ความสัมพันธ์แบบทวิภาค ค่าของมาตราส่วนช่วงเวลาจะถูกแปลงเป็นอันดับและใช้ค่าสัมประสิทธิ์อันดับ ค่าสัมประสิทธิ์สหสัมพันธ์แบบเพียร์สัน (ค่าสัมประสิทธิ์สหสัมพันธ์เชิงเส้น)

ที่ =0 ไม่มีความสัมพันธ์เชิงเส้น ในกรณีนี้ ค่าเฉลี่ยกลุ่มของตัวแปรตรงกับค่าเฉลี่ยทั่วไป และเส้นถดถอยจะขนานกับแกนพิกัด

ความเท่าเทียมกัน =0 พูดถึงเฉพาะการขาดความสัมพันธ์เชิงเส้นที่พึ่งพา (ตัวแปรที่ไม่มีความสัมพันธ์กัน) แต่ไม่ใช่โดยทั่วไปเกี่ยวกับการขาดความสัมพันธ์ และยิ่งกว่านั้น การพึ่งพาทางสถิติ

บางครั้งข้อสรุปที่ว่าไม่มีความสัมพันธ์กันนั้นสำคัญกว่าการมีความสัมพันธ์ที่แน่นแฟ้น ความสัมพันธ์ที่เป็นศูนย์ของตัวแปรสองตัวอาจบ่งชี้ว่าตัวแปรหนึ่งไม่มีอิทธิพลต่ออีกตัวแปรหนึ่ง โดยมีเงื่อนไขว่าเราต้องเชื่อถือผลลัพธ์ของการวัด

ใน SPSS: 11.3.2 ค่าสัมประสิทธิ์สหสัมพันธ์

จนถึงขณะนี้ เราได้ค้นพบเพียงข้อเท็จจริงของการมีอยู่ของความสัมพันธ์ทางสถิติระหว่างสองคุณลักษณะ ต่อไปเราจะพยายามค้นหาข้อสรุปที่สามารถสรุปได้เกี่ยวกับจุดแข็งหรือจุดอ่อนของการพึ่งพาอาศัยกันนี้ ตลอดจนรูปแบบและทิศทางของมัน เกณฑ์สำหรับการวัดปริมาณความสัมพันธ์ระหว่างตัวแปรเรียกว่าค่าสัมประสิทธิ์สหสัมพันธ์หรือการวัดความเชื่อมโยง ตัวแปรสองตัวมีความสัมพันธ์เชิงบวกหากมีความสัมพันธ์โดยตรงและทิศทางเดียวระหว่างตัวแปรทั้งสอง ในความสัมพันธ์แบบทิศทางเดียว ค่าน้อยของตัวแปรหนึ่งสอดคล้องกับค่าน้อยของตัวแปรอื่น ค่ามากตรงกับค่ามาก ตัวแปรสองตัวมีความสัมพันธ์เชิงลบหากมีความสัมพันธ์แบบผกผันระหว่างตัวแปรทั้งสอง ด้วยความสัมพันธ์แบบหลายทิศทาง ค่าเล็กน้อยของตัวแปรหนึ่งตัวจะสอดคล้องกัน ค่ามากตัวแปรอื่นและในทางกลับกัน ค่าของสัมประสิทธิ์สหสัมพันธ์จะอยู่ในช่วงตั้งแต่ -1 ถึง +1 เสมอ

ค่าสัมประสิทธิ์ของสเปียร์แมนถูกใช้เป็นค่าสัมประสิทธิ์สหสัมพันธ์ระหว่างตัวแปรที่อยู่ในสเกลลำดับ และค่าสัมประสิทธิ์สหสัมพันธ์ของเพียร์สัน (โมเมนต์ของผลิตภัณฑ์) ใช้สำหรับตัวแปรที่อยู่ในสเกลช่วงเวลา ในกรณีนี้ ควรสังเกตว่าแต่ละตัวแปรแบบสองขั้ว นั่นคือ ตัวแปรที่อยู่ในมาตราส่วนเล็กน้อยและมีสองประเภท สามารถพิจารณาเป็นลำดับได้

ก่อนอื่น เราจะตรวจสอบว่ามีความสัมพันธ์ระหว่างตัวแปรเพศและจิตใจจากไฟล์ studium.sav หรือไม่ ในการทำเช่นนั้น เราพิจารณาว่าเพศของตัวแปรสองขั้วถือเป็นตัวแปรลำดับ ทำดังต่อไปนี้:

เลือกจากเมนูคำสั่ง วิเคราะห์ (การวิเคราะห์) สถิติเชิงพรรณนา (สถิติเชิงพรรณนา) ครอสแท็บ... (ตารางฉุกเฉิน)

· ย้ายตัวแปรเพศไปยังรายการของแถว และตัวแปรจิตใจไปยังรายการของคอลัมน์

· คลิกปุ่มสถิติ... ในกล่องโต้ตอบแท็บไขว้: สถิติ ให้เลือกกล่องความสัมพันธ์ ยืนยันการเลือกของคุณด้วยปุ่มดำเนินการต่อ

· ในไดอะล็อกแท็บไขว้ ให้หยุดแสดงตารางโดยทำเครื่องหมายที่ช่องทำเครื่องหมาย ระงับตาราง คลิกปุ่มตกลง

ค่าสัมประสิทธิ์สหสัมพันธ์ของสเปียร์แมนและเพียร์สันจะถูกคำนวณ และจะมีการทดสอบนัยสำคัญ:

/สพปส.10

งานหมายเลข 10 การวิเคราะห์ความสัมพันธ์

แนวคิดของความสัมพันธ์

สหสัมพันธ์หรือค่าสัมประสิทธิ์สหสัมพันธ์เป็นตัวบ่งชี้ทางสถิติ ความน่าจะเป็นความสัมพันธ์ระหว่างตัวแปรสองตัวที่วัดด้วยมาตราส่วนเชิงปริมาณ ตรงกันข้ามกับการเชื่อมต่อการทำงานซึ่งแต่ละค่าของตัวแปรหนึ่งตัวสัมพันธ์กัน กำหนดไว้อย่างเคร่งครัดค่าของตัวแปรอื่น การเชื่อมต่อความน่าจะเป็นโดดเด่นด้วยความจริงที่ว่าแต่ละค่าของตัวแปรหนึ่งสอดคล้องกับ ชุดค่าอีกตัวแปรหนึ่ง ตัวอย่างของความสัมพันธ์เชิงความน่าจะเป็นคือความสัมพันธ์ระหว่างส่วนสูงและน้ำหนักของคน เป็นที่ชัดเจนว่าคนที่มีน้ำหนักต่างกันสามารถมีส่วนสูงเท่ากันและในทางกลับกัน

ความสัมพันธ์คือค่าระหว่าง -1 ถึง + 1 และเขียนแทนด้วยตัวอักษร r ยิ่งกว่านั้นหากค่าเข้าใกล้ 1 แสดงว่ามีการเชื่อมต่อที่แข็งแกร่งและหากมีค่าใกล้เคียงกับ 0 แสดงว่าเป็นการเชื่อมต่อที่อ่อนแอ ค่าสหสัมพันธ์น้อยกว่า 0.2 ถือเป็นความสัมพันธ์ที่อ่อนแอ มากกว่า 0.5 - สูง ถ้าค่าสัมประสิทธิ์สหสัมพันธ์เป็นลบ แสดงว่ามีความสัมพันธ์แบบผกผัน: ยิ่งค่าของตัวแปรหนึ่งมีค่าสูง ค่าของอีกตัวแปรหนึ่งก็จะยิ่งต่ำลง

ขึ้นอยู่กับค่าที่ยอมรับของค่าสัมประสิทธิ์ r ความสัมพันธ์ประเภทต่าง ๆ สามารถแยกแยะได้:

ความสัมพันธ์เชิงบวกที่แข็งแกร่งถูกกำหนดโดยค่า r=1 คำว่า "เข้มงวด" หมายความว่าค่าของตัวแปรหนึ่งถูกกำหนดโดยค่าของตัวแปรอื่นโดยไม่ซ้ำกันและคำว่า " เชิงบวก" -เมื่อค่าของตัวแปรหนึ่งเพิ่มขึ้น ค่าของตัวแปรอีกตัวก็จะเพิ่มขึ้นด้วย

ความสัมพันธ์อย่างเข้มงวดเป็นนามธรรมทางคณิตศาสตร์และแทบไม่เคยเกิดขึ้นในการวิจัยจริง

ความสัมพันธ์เชิงบวกสอดคล้องกับค่า 0

ขาดความสัมพันธ์ถูกกำหนดโดยค่า r=0 ค่าสัมประสิทธิ์สหสัมพันธ์เป็นศูนย์แสดงว่าค่าของตัวแปรไม่เกี่ยวข้องกันแต่อย่างใด

ขาดความสัมพันธ์ ชม โอ : 0 xy =0 กำหนดเป็นภาพสะท้อน โมฆะสมมติฐานในการวิเคราะห์ความสัมพันธ์

ความสัมพันธ์เชิงลบ: -1

ความสัมพันธ์เชิงลบที่แข็งแกร่งกำหนดโดยค่า r= -1 เช่นเดียวกับความสัมพันธ์เชิงบวกที่เข้มงวด เป็นนามธรรมและไม่พบการแสดงออกในการวิจัยเชิงปฏิบัติ

ตารางที่ 1

ประเภทของความสัมพันธ์และคำจำกัดความ

วิธีการคำนวณค่าสัมประสิทธิ์สหสัมพันธ์ขึ้นอยู่กับประเภทของมาตราส่วนที่วัดค่าของตัวแปร

ค่าสัมประสิทธิ์สหสัมพันธ์ เพียร์สันเป็นตัวหลักและสามารถใช้สำหรับตัวแปรที่มีสเกลช่วงเวลาเล็กน้อยและสั่งซื้อบางส่วน การกระจายของค่าที่สอดคล้องกับปกติ (ความสัมพันธ์ของช่วงเวลาผลิตภัณฑ์) ค่าสัมประสิทธิ์สหสัมพันธ์แบบเพียร์สันให้ผลลัพธ์ที่ค่อนข้างแม่นยำในกรณีของการแจกแจงที่ผิดปกติเช่นกัน

สำหรับการแจกแจงที่ไม่ปกติ ควรใช้ค่าสัมประสิทธิ์สหสัมพันธ์อันดับของสเปียร์แมนและเคนดัลล์ มีการจัดอันดับเนื่องจากโปรแกรมจัดลำดับล่วงหน้าของตัวแปรที่สัมพันธ์กัน

โปรแกรม SPSS คำนวณความสัมพันธ์ r-Spearman ดังนี้ ขั้นแรก ตัวแปรจะถูกแปลงเป็นลำดับ จากนั้นจึงใช้สูตรเพียร์สันกับอันดับ

ความสัมพันธ์ที่เสนอโดย M. Kendall นั้นขึ้นอยู่กับแนวคิดที่ว่าทิศทางของการเชื่อมต่อสามารถตัดสินได้โดยการเปรียบเทียบอาสาสมัครเป็นคู่ ถ้าสำหรับคู่ของเรื่อง การเปลี่ยนแปลงใน X ไปในทิศทางเดียวกับการเปลี่ยนแปลงใน Y พร้อมกัน แสดงว่ามีความสัมพันธ์เชิงบวก หากไม่ตรงกันก็เกี่ยวกับความสัมพันธ์เชิงลบ ค่าสัมประสิทธิ์นี้ส่วนใหญ่ใช้โดยนักจิตวิทยาที่ทำงานกับกลุ่มตัวอย่างขนาดเล็ก เนื่องจากนักสังคมวิทยาทำงานกับอาร์เรย์ข้อมูลขนาดใหญ่ จึงเป็นเรื่องยากที่จะจัดเรียงเป็นคู่ๆ ระบุความแตกต่างของความถี่สัมพัทธ์และการผกผันของทุกคู่ในตัวอย่าง ที่พบมากที่สุดคือค่าสัมประสิทธิ์ เพียร์สัน

เนื่องจากค่าสัมประสิทธิ์สหสัมพันธ์ rPearson เป็นค่าหลักและสามารถใช้ได้ (โดยมีข้อผิดพลาดบ้างขึ้นอยู่กับชนิดของมาตราส่วนและระดับความผิดปกติในการแจกแจง) สำหรับตัวแปรทั้งหมดที่วัดด้วยมาตราส่วนเชิงปริมาณ เราจะพิจารณาตัวอย่างการใช้และเปรียบเทียบ ผลลัพธ์ที่ได้กับผลการวัดโดยใช้ค่าสัมประสิทธิ์สหสัมพันธ์อื่น ๆ

สูตรคำนวณค่าสัมประสิทธิ์ - เพียร์สัน:

r xy = ∑ (ซี-ซาฟ)∙(ยี่-ยัฟ) / (N-1)∙σ x ∙σ y ∙

ที่ไหน: Xi, Yi- ค่าของตัวแปรสองตัว

Xav, Yav - ค่าเฉลี่ยของสองตัวแปร

σ x , σ y คือส่วนเบี่ยงเบนมาตรฐาน

N คือจำนวนการสังเกต

ความสัมพันธ์แบบคู่

เช่น เราต้องการหาคำตอบว่าระหว่าง หลากหลายชนิดค่านิยมดั้งเดิมในความคิดของนักเรียนเกี่ยวกับสถานที่ทำงานในอุดมคติ (ตัวแปร: a9.1, a9.3, a9.5, a9.7) และอัตราส่วนของค่านิยมเสรีนิยม (a9.2, a9 .4. a9.6, a9. แปด) . ตัวแปรเหล่านี้วัดจากมาตราส่วนตามคำสั่ง 5 ระยะ

เราใช้ขั้นตอน: "การวิเคราะห์",  "ความสัมพันธ์",  "จับคู่" โดยค่าเริ่มต้น ค่าสัมประสิทธิ์ เพียร์สันถูกตั้งค่าในกล่องโต้ตอบ เราใช้ค่าสัมประสิทธิ์ เพียร์สัน

ตัวแปรที่ทดสอบจะถูกถ่ายโอนไปยังหน้าต่างการเลือก: a9.1, a9.3, a9.5, a9.7

เมื่อกดตกลง เราจะได้รับการคำนวณ:

ความสัมพันธ์

a9.1.t. การมีเวลาเพียงพอสำหรับครอบครัวและชีวิตส่วนตัวมีความสำคัญอย่างไร?

ความสัมพันธ์แบบเพียร์สัน

ค่า (2 ด้าน)

a9.3.t. การไม่กลัวตกงานสำคัญแค่ไหน?

ความสัมพันธ์แบบเพียร์สัน

ค่า (2 ด้าน)

a9.5.t. การมีเจ้านายแบบนี้คอยให้คำปรึกษากับคุณเมื่อต้องตัดสินใจเรื่องนี้มีความสำคัญแค่ไหน?

ความสัมพันธ์แบบเพียร์สัน

ค่า (2 ด้าน)

a9.7.t. สำคัญแค่ไหนในการทำงาน ทีมประสานงานที่ดีรู้สึกเหมือนเป็นส่วนหนึ่งของมัน?

ความสัมพันธ์แบบเพียร์สัน

ค่า (2 ด้าน)

** ความสัมพันธ์มีนัยสำคัญที่ระดับ 0.01 (2 ด้าน)

ตารางค่าเชิงปริมาณของเมทริกซ์สหสัมพันธ์ที่สร้างขึ้น

ความสัมพันธ์บางส่วน:

ก่อนอื่นมาสร้างความสัมพันธ์แบบคู่ระหว่างตัวแปรทั้งสองนี้:

ความสัมพันธ์

ค8. รู้สึกใกล้ชิดกับผู้ที่อาศัยอยู่ใกล้คุณ เพื่อนบ้าน

ความสัมพันธ์แบบเพียร์สัน

ค่า (2 ด้าน)

ค12. รู้สึกใกล้ชิดกับครอบครัวของพวกเขา

ความสัมพันธ์แบบเพียร์สัน

ค่า (2 ด้าน)

**. มีความสัมพันธ์อย่างมีนัยสำคัญทางสถิติที่ระดับ 0.01 (2 ด้าน)

จากนั้นเราใช้ขั้นตอนในการสร้างความสัมพันธ์บางส่วน: "การวิเคราะห์",  "ความสัมพันธ์",  "บางส่วน"

สมมติว่าค่า "เป็นสิ่งสำคัญที่จะต้องกำหนดและเปลี่ยนแปลงลำดับงานของคุณอย่างอิสระ" ซึ่งสัมพันธ์กับตัวแปรที่ระบุจะเป็นปัจจัยชี้ขาดภายใต้อิทธิพลของความสัมพันธ์ที่ระบุก่อนหน้านี้จะหายไปหรือกลายเป็นความสำคัญเล็กน้อย .

ความสัมพันธ์

ตัวแปรที่ยกเว้น

ค8. รู้สึกใกล้ชิดกับผู้ที่อาศัยอยู่ใกล้คุณ เพื่อนบ้าน

ค12. รู้สึกใกล้ชิดกับครอบครัวของพวกเขา

ค16. รู้สึกใกล้ชิดกับคนที่มีความมั่งคั่งเช่นเดียวกับคุณ

ค8. รู้สึกใกล้ชิดกับผู้ที่อาศัยอยู่ใกล้คุณ เพื่อนบ้าน

ความสัมพันธ์

นัยสำคัญ (2 ด้าน)

ค12. รู้สึกใกล้ชิดกับครอบครัวของพวกเขา

ความสัมพันธ์

นัยสำคัญ (2 ด้าน)

ดังที่เห็นได้จากตาราง ภายใต้อิทธิพลของตัวแปรควบคุม ความสัมพันธ์ลดลงเล็กน้อย: จาก 0.120 เป็น 0.102 มันยังคงสูงเพียงพอและอนุญาตให้หักล้างสมมติฐานว่างที่มีข้อผิดพลาดเป็นศูนย์

ค่าสัมประสิทธิ์สหสัมพันธ์

วิธีที่ถูกต้องที่สุดในการกำหนดความหนาแน่นและลักษณะของความสัมพันธ์คือการหาค่าสัมประสิทธิ์สหสัมพันธ์ ค่าสัมประสิทธิ์สหสัมพันธ์คือตัวเลขที่กำหนดโดยสูตร:


โดยที่ r xy คือสัมประสิทธิ์สหสัมพันธ์

x ผม -ค่าของคุณลักษณะแรก

ฉัน - ค่าของคุณลักษณะที่สอง

ค่าเฉลี่ยเลขคณิตของค่าของคุณลักษณะแรก

ค่าเฉลี่ยเลขคณิตของค่าของคุณสมบัติที่สอง

ในการใช้สูตร (32) เราสร้างตารางที่จะให้ลำดับที่จำเป็นในการเตรียมตัวเลขเพื่อหาตัวเศษและตัวส่วนของค่าสัมประสิทธิ์สหสัมพันธ์

ดังที่เห็นได้จากสูตร (32) ลำดับของการกระทำมีดังนี้: เราพบค่าเฉลี่ยเลขคณิตของทั้งเครื่องหมาย x และ y เราพบความแตกต่างระหว่างค่าของเครื่องหมายและค่าเฉลี่ย (x i - ) และ y ผม - ) จากนั้นเราจะพบผลคูณของพวกมัน (x ผม - ) ( y ผม - ) – ผลรวมของค่าหลังให้ตัวเศษของค่าสัมประสิทธิ์สหสัมพันธ์ ในการหาตัวส่วน ควรนำผลต่างยกกำลังสอง (x i -) และ (y i -) หาผลบวกและแยกรากที่สองออกจากผลคูณ

ตัวอย่างเช่น 31 การหาค่าสัมประสิทธิ์สหสัมพันธ์ตามสูตร (32) สามารถแสดงได้ดังนี้ (ตารางที่ 50)

จำนวนผลลัพธ์ของค่าสัมประสิทธิ์สหสัมพันธ์ทำให้สามารถสร้างสถานะ ความใกล้ชิด และลักษณะของความสัมพันธ์ได้

1. ถ้าค่าสัมประสิทธิ์สหสัมพันธ์เป็นศูนย์ แสดงว่าไม่มีความสัมพันธ์ระหว่างคุณสมบัติ

2. หากค่าสัมประสิทธิ์สหสัมพันธ์เท่ากับหนึ่ง ความสัมพันธ์ระหว่างคุณลักษณะต่างๆ นั้นยิ่งใหญ่จนกลายเป็นความสัมพันธ์ที่ใช้งานได้

3. ค่าสัมบูรณ์ของค่าสัมประสิทธิ์สหสัมพันธ์ไม่เกินช่วงจากศูนย์ถึงหนึ่ง:

สิ่งนี้ทำให้สามารถมุ่งเน้นไปที่ความแน่นของการเชื่อมต่อ: ยิ่งค่าสัมประสิทธิ์เข้าใกล้ศูนย์มากเท่าไหร่ การเชื่อมต่อก็จะยิ่งอ่อนแอลง และยิ่งเข้าใกล้ความสามัคคีมากเท่าไหร่

4. เครื่องหมายของค่าสัมประสิทธิ์สหสัมพันธ์ "บวก" หมายถึงความสัมพันธ์โดยตรง เครื่องหมาย "ลบ" หมายถึงตรงกันข้าม

ตาราง 50

x ฉัน ผม (x ฉัน - ) (ย ฉัน - ) (x ฉัน - )(y ฉัน - ) (x ฉัน - )2 (y ฉัน - )2
14,00 12,10 -1,70 -2,30 +3,91 2,89 5,29
14,20 13,80 -1,50 -0,60 +0,90 2,25 0,36
14,90 14,20 -0,80 -0,20 +0,16 0,64 0,04
15,40 13,00 -0,30 -1,40 +0,42 0,09 1,96
16,00 14,60 +0,30 +0,20 +0,06 0,09 0,04
17,20 15,90 +1,50 +2,25 2,25
18,10 17,40 +2,40 +2,00 +4,80 5,76 4,00
109,80 101,00 12,50 13,97 13,94


ดังนั้น สัมประสิทธิ์สหสัมพันธ์ที่คำนวณในตัวอย่างที่ 31 คือ r xy = +0.9 ทำให้เราได้ข้อสรุปดังต่อไปนี้: มีความสัมพันธ์ระหว่างค่า ความแข็งแรงของกล้ามเนื้อมือขวาและซ้ายในเด็กนักเรียนที่ศึกษา (ค่าสัมประสิทธิ์ r xy = +0.9 แตกต่างจากศูนย์) ความสัมพันธ์ใกล้ชิดมาก (ค่าสัมประสิทธิ์ r xy = +0.9 ใกล้เคียงกับความสามัคคี) ความสัมพันธ์โดยตรง (ค่าสัมประสิทธิ์ r xy = +0.9 เป็นค่าบวก ) เช่น เมื่อความแข็งแรงของกล้ามเนื้อของมือข้างใดข้างหนึ่งเพิ่มขึ้น ความแข็งแรงของมืออีกข้างหนึ่งก็จะเพิ่มขึ้น

เมื่อคำนวณค่าสัมประสิทธิ์สหสัมพันธ์และใช้คุณสมบัติของมัน ควรคำนึงถึงข้อสรุปที่ให้ผลลัพธ์ที่ถูกต้องเมื่อมีการกระจายคุณสมบัติตามปกติและเมื่อพิจารณาความสัมพันธ์ระหว่างค่าจำนวนมากของคุณสมบัติทั้งสอง

ในตัวอย่างที่พิจารณา 31 มีการวิเคราะห์คุณลักษณะทั้งสองเพียง 7 ค่าซึ่งแน่นอนว่าไม่เพียงพอสำหรับการศึกษาดังกล่าว ขอย้ำเตือนอีกครั้งว่าตัวอย่างในหนังสือเล่มนี้โดยทั่วไปและโดยเฉพาะในบทนี้ มีลักษณะเป็นวิธีการแสดงภาพประกอบ ไม่ใช่การนำเสนอโดยละเอียดของการทดลองทางวิทยาศาสตร์ใดๆ เป็นผลให้มีการพิจารณาค่าคุณลักษณะจำนวนเล็กน้อยการวัดจะถูกปัดเศษ - ทั้งหมดนี้ทำเพื่อไม่ให้บดบังแนวคิดของวิธีการด้วยการคำนวณที่ยุ่งยาก

ควรให้ความสนใจเป็นพิเศษกับสาระสำคัญของความสัมพันธ์ภายใต้การพิจารณา ค่าสัมประสิทธิ์สหสัมพันธ์ไม่สามารถนำไปสู่ผลลัพธ์ที่ถูกต้องของการศึกษาได้ หากการวิเคราะห์ความสัมพันธ์ระหว่างคุณลักษณะนั้นดำเนินการอย่างเป็นทางการ กลับไปที่ตัวอย่างที่ 31 สัญญาณที่พิจารณาทั้งสองคือค่าความแข็งแรงของกล้ามเนื้อของมือขวาและมือซ้าย ลองจินตนาการว่าโดยคุณลักษณะ x i ในตัวอย่างที่ 31 (14.0; 14.2; 14.9... ...18.1) เราหมายถึงความยาวของปลาที่สุ่มจับได้เป็นเซนติเมตร และโดยคุณลักษณะ y i (12.1 ; 13.8; 14.2 ... ... 17.4) - น้ำหนักของเครื่องมือในห้องปฏิบัติการเป็นกิโลกรัม อย่างเป็นทางการ โดยใช้อุปกรณ์ในการคำนวณเพื่อหาค่าสัมประสิทธิ์สหสัมพันธ์ และในกรณีนี้ยังได้ r xy =+0>9 เราควรสรุปได้ว่ามีความสัมพันธ์ใกล้ชิดโดยธรรมชาติระหว่างความยาวของปลากับน้ำหนักของปลา เครื่องมือ ความไร้เหตุผลของข้อสรุปดังกล่าวนั้นชัดเจน

เพื่อหลีกเลี่ยงวิธีการที่เป็นทางการในการใช้ค่าสัมประสิทธิ์สหสัมพันธ์ เราควรใช้วิธีการอื่นใด - ทางคณิตศาสตร์ ตรรกะ การทดลอง ทางทฤษฎี - เพื่อระบุความเป็นไปได้ของความสัมพันธ์ระหว่างสัญญาณ นั่นคือ เพื่อตรวจหาเอกภาพของสัญญาณ จากนั้นเราจึงจะเริ่มใช้การวิเคราะห์ความสัมพันธ์และสร้างขนาดและลักษณะของความสัมพันธ์ได้

ในสถิติทางคณิตศาสตร์ก็มีแนวคิดเช่นกัน ความสัมพันธ์ที่หลากหลาย- ความสัมพันธ์ระหว่างคุณลักษณะตั้งแต่สามอย่างขึ้นไป ในกรณีเหล่านี้ จะใช้ค่าสัมประสิทธิ์สหสัมพันธ์พหุคูณ ซึ่งประกอบด้วยค่าสัมประสิทธิ์สหสัมพันธ์แบบคู่ที่อธิบายไว้ข้างต้น

ตัวอย่างเช่น ค่าสัมประสิทธิ์สหสัมพันธ์ของสามสัญญาณ - x і , y і , z і - คือ:

โดยที่ R xyz -ค่าสัมประสิทธิ์สหสัมพันธ์หลายค่าแสดงว่าคุณลักษณะ xi ขึ้นอยู่กับคุณลักษณะ y i และ zi อย่างไร ;

r xy - ค่าสัมประสิทธิ์สหสัมพันธ์ระหว่างคุณสมบัติ x ผม และ y ผม ;

r xz - ค่าสัมประสิทธิ์สหสัมพันธ์ระหว่างคุณสมบัติ Xi และ Zi

r yz - ค่าสัมประสิทธิ์สหสัมพันธ์ระหว่างคุณสมบัติ y i , zi

การวิเคราะห์ความสัมพันธ์คือ:

การวิเคราะห์ความสัมพันธ์

ความสัมพันธ์- ความสัมพันธ์ทางสถิติของตัวแปรสุ่มตั้งแต่สองตัวขึ้นไป (หรือตัวแปรที่สามารถพิจารณาได้ในระดับความแม่นยำที่ยอมรับได้) ในขณะเดียวกัน การเปลี่ยนแปลงในปริมาณเหล่านี้อย่างน้อยหนึ่งปริมาณจะนำไปสู่การเปลี่ยนแปลงอย่างเป็นระบบในปริมาณอื่นหรือปริมาณอื่น ค่าสัมประสิทธิ์สหสัมพันธ์ทำหน้าที่เป็นการวัดทางคณิตศาสตร์ของความสัมพันธ์ของตัวแปรสุ่มสองตัว

ความสัมพันธ์สามารถเป็นได้ทั้งบวกและลบ (เป็นไปได้ว่าไม่มีความสัมพันธ์ทางสถิติ - ตัวอย่างเช่น สำหรับตัวแปรสุ่มอิสระ) ความสัมพันธ์เชิงลบ - สหสัมพันธ์ ซึ่งการเพิ่มขึ้นของตัวแปรหนึ่งสัมพันธ์กับการลดลงของตัวแปรอื่น ในขณะที่ค่าสัมประสิทธิ์สหสัมพันธ์เป็นค่าลบ ความสัมพันธ์เชิงบวก - ความสัมพันธ์ที่การเพิ่มขึ้นของตัวแปรหนึ่งมีความสัมพันธ์กับการเพิ่มขึ้นของตัวแปรอื่น ในขณะที่ค่าสัมประสิทธิ์สหสัมพันธ์เป็นบวก

ความสัมพันธ์อัตโนมัติ - ความสัมพันธ์ทางสถิติระหว่างตัวแปรสุ่มจากซีรีส์เดียวกัน แต่ดำเนินการด้วยการเปลี่ยนแปลง ตัวอย่างเช่น สำหรับกระบวนการสุ่ม - มีการเปลี่ยนแปลงตามเวลา

วิธีการประมวลผลข้อมูลทางสถิติซึ่งประกอบด้วยการศึกษาค่าสัมประสิทธิ์ (สหสัมพันธ์) ระหว่างตัวแปรเรียกว่า การวิเคราะห์ความสัมพันธ์.

ค่าสัมประสิทธิ์สหสัมพันธ์

ค่าสัมประสิทธิ์สหสัมพันธ์หรือ ค่าสัมประสิทธิ์สหสัมพันธ์แบบคู่ในทฤษฎีความน่าจะเป็นและสถิติ นี่เป็นตัวบ่งชี้ธรรมชาติของการเปลี่ยนแปลงในตัวแปรสุ่มสองตัว ค่าสัมประสิทธิ์สหสัมพันธ์แสดงด้วยอักษรละติน R และสามารถรับค่าระหว่าง -1 ถึง +1 หากค่าโมดูโลเข้าใกล้ 1 แสดงว่ามีการเชื่อมต่อที่แข็งแกร่ง (โดยมีค่าสัมประสิทธิ์สหสัมพันธ์เท่ากับ 1 แสดงว่ามีการเชื่อมต่อที่ใช้งานได้) และถ้าเข้าใกล้ 0 แสดงว่าเป็นการเชื่อมต่อที่อ่อนแอ

ค่าสัมประสิทธิ์สหสัมพันธ์แบบเพียร์สัน

สำหรับปริมาณเมตริกจะใช้ค่าสัมประสิทธิ์สหสัมพันธ์ของเพียร์สันซึ่งเป็นสูตรที่แน่นอนซึ่งนำเสนอโดย Francis Galton:

ปล่อยให้เป็น เอ็กซ์,วาย- ตัวแปรสุ่มสองตัวที่กำหนดไว้ในพื้นที่ความน่าจะเป็นเดียวกัน จากนั้นค่าสัมประสิทธิ์สหสัมพันธ์จะได้รับจากสูตร:

,

โดยที่ cov คือความแปรปรวนร่วม และ D คือความแปรปรวน หรือเทียบเท่า

,

โดยสัญลักษณ์แสดงถึงความคาดหวังทางคณิตศาสตร์

หากต้องการแสดงความสัมพันธ์ดังกล่าวในรูปแบบกราฟิก คุณสามารถใช้ระบบพิกัดสี่เหลี่ยมที่มีแกนที่สอดคล้องกับตัวแปรทั้งสองได้ ค่าแต่ละคู่จะถูกทำเครื่องหมายด้วยสัญลักษณ์เฉพาะ พล็อตดังกล่าวเรียกว่า "พล็อตกระจาย"

วิธีการคำนวณค่าสัมประสิทธิ์สหสัมพันธ์ขึ้นอยู่กับประเภทของสเกลที่ตัวแปรอ้างอิง ดังนั้น ในการวัดตัวแปรด้วยสเกลช่วงเวลาและเชิงปริมาณ จึงจำเป็นต้องใช้ค่าสัมประสิทธิ์สหสัมพันธ์เพียร์สัน (สหสัมพันธ์ของช่วงเวลาผลิตภัณฑ์) ถ้าอย่างน้อยหนึ่งในสองตัวแปรมีมาตราส่วนเชิงลำดับ หรือไม่ได้กระจายตามปกติ จะต้องใช้ความสัมพันธ์อันดับของ Spearman หรือ τ (tau) ของ Kendal ในกรณีที่ตัวแปรตัวใดตัวหนึ่งเป็นแบบสองขั้ว จะใช้ความสัมพันธ์แบบสองชุดแบบจุด และถ้าตัวแปรทั้งสองเป็นแบบสองขั้ว จะใช้ความสัมพันธ์แบบสี่ฟิลด์ การคำนวณค่าสัมประสิทธิ์สหสัมพันธ์ระหว่างตัวแปรที่ไม่แบ่งขั้วสองตัวเหมาะสมก็ต่อเมื่อความสัมพันธ์ระหว่างตัวแปรทั้งสองเป็นแบบเส้นตรง (ทิศทางเดียว)

ค่าสัมประสิทธิ์สหสัมพันธ์ของเคนเดลล์

ใช้ในการวัดความผิดปกติร่วมกัน

ค่าสัมประสิทธิ์สหสัมพันธ์ของสเปียร์แมน

คุณสมบัติของสัมประสิทธิ์สหสัมพันธ์

  • Cauchy - ความไม่เท่าเทียมกันของ Bunyakovsky:
ถ้าเรานำค่าความแปรปรวนร่วมเป็นผลคูณสเกลาร์ของตัวแปรสุ่มสองตัว ค่าบรรทัดฐานของตัวแปรสุ่มจะเท่ากับ และผลที่ตามมาของความไม่เท่าเทียมกัน Cauchy-Bunyakovsky จะเป็น: . , ที่ไหน . นอกจากนี้ในกรณีนี้สัญญาณและ เคจับคู่: .

การวิเคราะห์ความสัมพันธ์

การวิเคราะห์ความสัมพันธ์- วิธีการประมวลผลข้อมูลทางสถิติซึ่งประกอบด้วยการศึกษาค่าสัมประสิทธิ์ ( ความสัมพันธ์) ระหว่างตัวแปร ในกรณีนี้ ค่าสัมประสิทธิ์สหสัมพันธ์ระหว่างคุณลักษณะหนึ่งคู่หรือหลายคู่จะถูกเปรียบเทียบเพื่อสร้างความสัมพันธ์ทางสถิติระหว่างทั้งสอง

เป้า การวิเคราะห์ความสัมพันธ์- ให้ข้อมูลบางอย่างเกี่ยวกับตัวแปรหนึ่งด้วยความช่วยเหลือของตัวแปรอื่น ในกรณีที่เป็นไปได้ที่จะบรรลุเป้าหมายเราจะบอกว่าตัวแปร สัมพันธ์กัน. ในมาก ปริทัศน์การยอมรับสมมติฐานของการมีอยู่ของความสัมพันธ์หมายความว่าการเปลี่ยนแปลงค่าของตัวแปร A จะเกิดขึ้นพร้อมกันกับการเปลี่ยนแปลงตามสัดส่วนของค่า B: ถ้าตัวแปรทั้งสองเพิ่มขึ้น ดังนั้น ความสัมพันธ์เป็นบวกถ้าตัวแปรหนึ่งเพิ่มขึ้นและอีกตัวแปรหนึ่งลดลง ความสัมพันธ์เป็นลบ.

ความสัมพันธ์สะท้อนถึงการพึ่งพาเชิงเส้นของปริมาณเท่านั้น แต่ไม่ได้สะท้อนถึงการเชื่อมต่อการทำงาน ตัวอย่างเช่น หากเราคำนวณค่าสัมประสิทธิ์สหสัมพันธ์ระหว่างค่าต่างๆ = ผม(x) และ = โอ(x) จากนั้นจะใกล้เคียงกับศูนย์นั่นคือไม่มีการพึ่งพาระหว่างปริมาณ ในขณะเดียวกัน ปริมาณ A และ B นั้นสัมพันธ์กันอย่างชัดเจนตามหน้าที่ตามกฎหมาย ผม 2(x) + โอ 2(x) = 1.

ข้อจำกัดของการวิเคราะห์ความสัมพันธ์



แผนภาพการแจกแจงของคู่ (x,y) พร้อมค่าสัมประสิทธิ์สหสัมพันธ์ x และ y ที่สอดคล้องกันสำหรับแต่ละคู่ โปรดทราบว่าค่าสัมประสิทธิ์สหสัมพันธ์สะท้อนถึงความสัมพันธ์เชิงเส้น (แถวบนสุด) แต่ไม่ได้อธิบายเส้นโค้งของความสัมพันธ์ (แถวกลาง) และไม่เหมาะสำหรับการอธิบายความสัมพันธ์ที่ซับซ้อนและไม่เป็นเชิงเส้น (แถวล่าง)
  1. การประยุกต์ใช้เป็นไปได้หากมีจำนวนกรณีศึกษาเพียงพอ: สำหรับค่าสัมประสิทธิ์สหสัมพันธ์ประเภทใดประเภทหนึ่ง จะมีค่าตั้งแต่ 25 ถึง 100 คู่ของการสังเกต
  2. ข้อจำกัดที่สองตามมาจากสมมติฐานของการวิเคราะห์สหสัมพันธ์ ซึ่งรวมถึง การพึ่งพาเชิงเส้นของตัวแปร. ในหลายกรณี เมื่อเป็นที่ทราบอย่างน่าเชื่อถือว่าการพึ่งพานั้นมีอยู่จริง การวิเคราะห์สหสัมพันธ์อาจไม่ให้ผลลัพธ์เพียงเพราะการพึ่งพานั้นไม่เป็นเชิงเส้น (แสดงเป็นพาราโบลา)
  3. โดยตัวของมันเองแล้ว ข้อเท็จจริงของความสัมพันธ์ไม่ได้ให้เหตุผลในการยืนยันว่าตัวแปรใดนำหน้าหรือทำให้เกิดการเปลี่ยนแปลง หรือตัวแปรนั้นมักเกี่ยวข้องกันในเชิงสาเหตุ ตัวอย่างเช่น เนื่องจากการกระทำของปัจจัยที่สาม

พื้นที่ใช้งาน

วิธีการประมวลผลข้อมูลทางสถิตินี้เป็นที่นิยมอย่างมากในด้านเศรษฐศาสตร์และสังคมศาสตร์ (โดยเฉพาะอย่างยิ่งในด้านจิตวิทยาและสังคมวิทยา) แม้ว่าขอบเขตของการใช้ค่าสัมประสิทธิ์สหสัมพันธ์จะกว้างขวาง: การควบคุมคุณภาพของผลิตภัณฑ์อุตสาหกรรม, โลหะวิทยา, เคมีเกษตร, อุทกชีววิทยา, ไบโอเมตริก และคนอื่น ๆ.

ความนิยมของวิธีนี้เกิดจากสองประเด็น: ค่าสัมประสิทธิ์สหสัมพันธ์นั้นค่อนข้างง่ายในการคำนวณ แอปพลิเคชันของพวกเขาไม่ต้องการการฝึกอบรมทางคณิตศาสตร์พิเศษ เมื่อรวมกับความง่ายในการตีความ ความง่ายในการใช้ค่าสัมประสิทธิ์ได้นำไปสู่การใช้อย่างแพร่หลายในด้านการวิเคราะห์ข้อมูลทางสถิติ

ความสัมพันธ์ปลอมๆ

ความเรียบง่ายที่ดึงดูดใจของการศึกษาความสัมพันธ์มักกระตุ้นให้ผู้วิจัยสรุปโดยสัญชาตญาณผิดๆ เกี่ยวกับการมีอยู่ของความสัมพันธ์เชิงสาเหตุระหว่างลักษณะคู่ ในขณะที่ค่าสัมประสิทธิ์สหสัมพันธ์สร้างความสัมพันธ์ทางสถิติเท่านั้น

ในระเบียบวิธีเชิงปริมาณสมัยใหม่ของสังคมศาสตร์ ความจริงแล้ว มีการละทิ้งความพยายามที่จะสร้างความสัมพันธ์เชิงสาเหตุระหว่างตัวแปรที่สังเกตได้ด้วยวิธีการเชิงประจักษ์ ดังนั้น เมื่อนักวิจัยในสาขาสังคมศาสตร์พูดถึงการสร้างความสัมพันธ์ระหว่างตัวแปรที่พวกเขาศึกษา สมมติฐานทางทฤษฎีทั่วไปหรือการพึ่งพาทางสถิติก็มีความหมายโดยนัย

ดูสิ่งนี้ด้วย

  • ฟังก์ชันความสัมพันธ์อัตโนมัติ
  • ฟังก์ชันข้ามสหสัมพันธ์
  • ความแปรปรวนร่วม
  • ค่าสัมประสิทธิ์การกำหนด
  • การวิเคราะห์การถดถอย

มูลนิธิวิกิมีเดีย 2553.

ค่าสัมประสิทธิ์สหสัมพันธ์สะท้อนถึงระดับความสัมพันธ์ระหว่างตัวบ่งชี้สองตัว รับค่าจาก -1 ถึง 1 เสมอ หากค่าสัมประสิทธิ์อยู่ใกล้ 0 แสดงว่าไม่มีการเชื่อมต่อระหว่างตัวแปร

หากค่าใกล้เคียงกับค่าหนึ่ง (เช่น จาก 0.9) แสดงว่ามีความสัมพันธ์โดยตรงอย่างมากระหว่างวัตถุที่สังเกตได้ หากค่าสัมประสิทธิ์ใกล้เคียงกับจุดสุดโต่งอื่นๆ ของช่วง (-1) แสดงว่ามีความสัมพันธ์แบบผกผันอย่างมากระหว่างตัวแปร เมื่อค่าอยู่ตรงกลางระหว่าง 0 ถึง 1 หรือจาก 0 ถึง -1 แสดงว่าเรากำลังพูดถึงความสัมพันธ์ที่อ่อนแอ (ไปข้างหน้าหรือย้อนกลับ) ความสัมพันธ์นี้มักจะไม่นำมาพิจารณา: ถือว่าไม่มีอยู่จริง

การคำนวณค่าสัมประสิทธิ์สหสัมพันธ์ใน Excel

ตัวอย่างเช่น พิจารณาวิธีการคำนวณค่าสัมประสิทธิ์สหสัมพันธ์ คุณลักษณะของความสัมพันธ์โดยตรงและผกผันระหว่างตัวแปร

ค่าของตัวบ่งชี้ x และ y:

Y คือตัวแปรอิสระ x คือตัวแปรตาม จำเป็นต้องค้นหาจุดแข็ง (แข็งแกร่ง / อ่อนแอ) และทิศทาง (ไปข้างหน้า / ย้อนกลับ) ของความสัมพันธ์ระหว่างพวกเขา สูตรสำหรับค่าสัมประสิทธิ์สหสัมพันธ์มีลักษณะดังนี้:


เพื่อให้เข้าใจได้ง่ายขึ้น เราจะแบ่งมันออกเป็นองค์ประกอบง่ายๆ หลายอย่าง

มีความสัมพันธ์โดยตรงระหว่างตัวแปร

ฟังก์ชัน CORREL ในตัวช่วยหลีกเลี่ยงการคำนวณที่ซับซ้อน ลองคำนวณค่าสัมประสิทธิ์สหสัมพันธ์ของคู่ใน Excel โดยใช้ เราเรียกเจ้านายของฟังก์ชัน เราพบสิ่งที่เราต้องการ อาร์กิวเมนต์ของฟังก์ชันคืออาร์เรย์ของค่า y และอาร์เรย์ของค่า x:

แสดงค่าของตัวแปรบนแผนภูมิ:


มีความสัมพันธ์อย่างมากระหว่าง y และ x เนื่องจาก เส้นวิ่งเกือบจะขนานกัน ความสัมพันธ์โดยตรง: การเพิ่ม y - การเพิ่ม x, การลด y - การลด x



เมทริกซ์ของค่าสัมประสิทธิ์สหสัมพันธ์แบบคู่ใน Excel

เมทริกซ์สหสัมพันธ์คือตารางที่จุดตัดของแถวและคอลัมน์ซึ่งมีค่าสัมประสิทธิ์สหสัมพันธ์ระหว่างค่าที่สอดคล้องกัน มันสมเหตุสมผลที่จะสร้างมันสำหรับตัวแปรหลายตัว

เมทริกซ์ของค่าสัมประสิทธิ์สหสัมพันธ์ใน Excel สร้างขึ้นโดยใช้เครื่องมือ "ความสัมพันธ์" จากแพ็คเกจ "การวิเคราะห์ข้อมูล"


พบความสัมพันธ์โดยตรงที่แข็งแกร่งระหว่างค่าของ y และ x1 มีข้อเสนอแนะที่แข็งแกร่งระหว่าง x1 และ x2 ไม่มีการเชื่อมต่อกับค่าในคอลัมน์ x3

สังเกต!วิธีแก้ปัญหาเฉพาะของคุณจะคล้ายกับตัวอย่างนี้ รวมถึงตารางและข้อความอธิบายทั้งหมดด้านล่าง แต่คำนึงถึงข้อมูลเริ่มต้นของคุณ ...

งาน:
มีตัวอย่างที่เกี่ยวข้องของค่า 26 คู่ (x k ,y k ):

เค 1 2 3 4 5 6 7 8 9 10
x ก 25.20000 26.40000 26.00000 25.80000 24.90000 25.70000 25.70000 25.70000 26.10000 25.80000
y k 30.80000 29.40000 30.20000 30.50000 31.40000 30.30000 30.40000 30.50000 29.90000 30.40000

เค 11 12 13 14 15 16 17 18 19 20
x ก 25.90000 26.20000 25.60000 25.40000 26.60000 26.20000 26.00000 22.10000 25.90000 25.80000
y k 30.30000 30.50000 30.60000 31.00000 29.60000 30.40000 30.70000 31.60000 30.50000 30.60000

เค 21 22 23 24 25 26
x ก 25.90000 26.30000 26.10000 26.00000 26.40000 25.80000
y k 30.70000 30.10000 30.60000 30.50000 30.70000 30.80000

จำเป็นต้องคำนวณ / สร้าง:
- ค่าสัมประสิทธิ์สหสัมพันธ์
- ทดสอบสมมติฐานของการพึ่งพาตัวแปรสุ่ม X และ Y ที่ระดับนัยสำคัญ α = 0.05
- ค่าสัมประสิทธิ์ของสมการถดถอยเชิงเส้น
- แผนภาพกระจาย (ฟิลด์สหสัมพันธ์) และกราฟเส้นถดถอย

การตัดสินใจ:

1. คำนวณค่าสัมประสิทธิ์สหสัมพันธ์

ค่าสัมประสิทธิ์สหสัมพันธ์เป็นตัวบ่งชี้ถึงอิทธิพลของความน่าจะเป็นร่วมกันของตัวแปรสุ่มสองตัว ค่าสัมประสิทธิ์สหสัมพันธ์ สามารถรับค่าจาก -1 ก่อน +1 . ถ้าค่าสัมบูรณ์ใกล้เคียง 1 นี่คือหลักฐานของความสัมพันธ์ที่แข็งแกร่งระหว่างปริมาณและถ้าใกล้เคียงกับ 0 - จากนั้นแสดงว่ามีการเชื่อมต่อที่อ่อนแอหรือขาดหายไป ถ้าค่าสัมบูรณ์ เท่ากับหนึ่ง เราสามารถพูดถึงความสัมพันธ์เชิงฟังก์ชันระหว่างปริมาณได้ กล่าวคือ ปริมาณหนึ่งสามารถแสดงในรูปของอีกจำนวนหนึ่งได้โดยใช้ฟังก์ชันทางคณิตศาสตร์


คุณสามารถคำนวณค่าสัมประสิทธิ์สหสัมพันธ์โดยใช้สูตรต่อไปนี้:
Σ
k = 1
(x k -M x) 2 , y 2 =
=
1
Σ
k = 1
xk , ของฉัน =

หรือตามสูตร

อาร์เอ็กซ์,วาย =
ม xy - ม x ม y
เอสเอ็กซ์ซี
(1.4) โดยที่:
=
1
Σ
k = 1
xk , ของฉัน =
1
Σ
k = 1
yk , มซ =
1
Σ
k = 1
x y k (1.5)
เอส x 2 =
1
Σ
k = 1
xk 2 - ม x 2, สย 2 =
1
Σ
k = 1
y k 2 - y k 2 (1.6)

ในทางปฏิบัติมักใช้สูตร (1.4) ในการคำนวณค่าสัมประสิทธิ์สหสัมพันธ์ตั้งแต่ ต้องใช้การคำนวณน้อยลง อย่างไรก็ตาม หากก่อนหน้านี้มีการคำนวณความแปรปรวนร่วม โคฟ(X,Y)ดังนั้นการใช้สูตร (1.1) จะเป็นประโยชน์มากกว่าเพราะ นอกจากค่าที่แท้จริงของความแปรปรวนร่วมแล้ว คุณยังสามารถใช้ผลลัพธ์ของการคำนวณขั้นกลางได้อีกด้วย

1.1 คำนวณค่าสัมประสิทธิ์สหสัมพันธ์โดยใช้สูตร (1.4)สำหรับสิ่งนี้เราคำนวณค่า x k 2 , y k 2 และ x k y k และป้อนลงในตารางที่ 1

ตารางที่ 1


เค
x ก y k x ก 2 y k 2 x กy k
1 2 3 4 5 6
1 25.2 30.8 635.04000 948.64000 776.16000
2 26.4 29.4 696.96000 864.36000 776.16000
3 26.0 30.2 676.00000 912.04000 785.20000
4 25.8 30.5 665.64000 930.25000 786.90000
5 24.9 31.4 620.01000 985.96000 781.86000
6 25.7 30.3 660.49000 918.09000 778.71000
7 25.7 30.4 660.49000 924.16000 781.28000
8 25.7 30.5 660.49000 930.25000 783.85000
9 26.1 29.9 681.21000 894.01000 780.39000
10 25.8 30.4 665.64000 924.16000 784.32000
11 25.9 30.3 670.81000 918.09000 784.77000
12 26.2 30.5 686.44000 930.25000 799.10000
13 25.6 30.6 655.36000 936.36000 783.36000
14 25.4 31 645.16000 961.00000 787.40000
15 26.6 29.6 707.56000 876.16000 787.36000
16 26.2 30.4 686.44000 924.16000 796.48000
17 26 30.7 676.00000 942.49000 798.20000
18 22.1 31.6 488.41000 998.56000 698.36000
19 25.9 30.5 670.81000 930.25000 789.95000
20 25.8 30.6 665.64000 936.36000 789.48000
21 25.9 30.7 670.81000 942.49000 795.13000
22 26.3 30.1 691.69000 906.01000 791.63000
23 26.1 30.6 681.21000 936.36000 798.66000
24 26 30.5 676.00000 930.25000 793.00000
25 26.4 30.7 696.96000 942.49000 810.48000
26 25.8 30.8 665.64000 948.64000 794.64000


1.2. เราคำนวณ M x ตามสูตร (1.5).

1.2.1. x ก

x 1 + x 2 + ... + x 26 = 25.20000 + 26.40000 + ... + 25.80000 = 669.500000

1.2.2.

669.50000 / 26 = 25.75000

มx=25.750000

1.3. ในทำนองเดียวกัน เราคำนวณ M y.

1.3.1. เพิ่มองค์ประกอบทั้งหมดตามลำดับ y k

y 1 + y 2 + … + y 26 = 30.80000 + 29.40000 + ... + 30.80000 = 793.000000

1.3.2. นำผลรวมที่ได้มาหารด้วยจำนวนองค์ประกอบตัวอย่าง

793.00000 / 26 = 30.50000

มาย = 30.500000

1.4. ในทำนองเดียวกัน เราคำนวณ M xy.

1.4.1. เราเพิ่มองค์ประกอบทั้งหมดของคอลัมน์ที่ 6 ของตารางที่ 1 ตามลำดับ

776.16000 + 776.16000 + ... + 794.64000 = 20412.830000

1.4.2. นำผลรวมที่ได้มาหารด้วยจำนวนองค์ประกอบ

20412.83000 / 26 = 785.10885

ม xy = 785.108846

1.5 คำนวณค่า S x 2 โดยใช้สูตร (1.6.).

1.5.1. เราเพิ่มองค์ประกอบทั้งหมดของคอลัมน์ที่ 4 ของตารางที่ 1 ตามลำดับ

635.04000 + 696.96000 + ... + 665.64000 = 17256.910000

1.5.2. นำผลรวมที่ได้มาหารด้วยจำนวนองค์ประกอบ

17256.91000 / 26 = 663.72731

1.5.3. ลบกำลังสองของค่า M x จากตัวเลขสุดท้ายเราจะได้ค่าสำหรับ S x 2

เอส x 2 = 663.72731 - 25.75000 2 = 663.72731 - 663.06250 = 0.66481

1.6. คำนวณค่า S y 2 ตามสูตร (1.6.).

1.6.1. เราเพิ่มองค์ประกอบทั้งหมดของคอลัมน์ที่ 5 ของตารางที่ 1 ตามลำดับ

948.64000 + 864.36000 + ... + 948.64000 = 24191.840000

1.6.2. นำผลรวมที่ได้มาหารด้วยจำนวนองค์ประกอบ

24191.84000 / 26 = 930.45538

1.6.3. ลบกำลังสองของ M y จากตัวเลขสุดท้าย เราจะได้ค่า S y 2

สย 2 = 930.45538 - 30.50000 2 = 930.45538 - 930.25000 = 0.20538

1.7. ให้เราคำนวณผลคูณของ S x 2 และ S y 2.

ส x 2 ส ย 2 = 0.66481 0.20538 = 0.136541

1.8. แยกหมายเลขสุดท้าย รากที่สองเราได้ค่า S x S y.

ส x ส ย = 0.36951

1.9. คำนวณค่าสัมประสิทธิ์สหสัมพันธ์ตามสูตร (1.4.).

R = (785.10885 - 25.75000 30.50000) / 0.36951 = (785.10885 - 785.37500) / 0.36951 = -0.72028

คำตอบ: Rx,y = -0.720279

2. เราตรวจสอบความสำคัญของค่าสัมประสิทธิ์สหสัมพันธ์ (เราตรวจสอบสมมติฐานการพึ่งพาอาศัยกัน)

เนื่องจากการประมาณค่าสัมประสิทธิ์สหสัมพันธ์คำนวณจากตัวอย่างจำกัด ดังนั้นอาจเบี่ยงเบนไปจากค่าทั่วไป จึงจำเป็นต้องตรวจสอบนัยสำคัญของค่าสัมประสิทธิ์สหสัมพันธ์ ตรวจสอบโดยใช้เกณฑ์ t:

เสื้อ =
อาร์เอ็กซ์,วาย
n - 2
1 - ร 2 x,y
(2.1)

ค่าสุ่ม ทีติดตามการแจกแจงแบบ t ของนักเรียนและตามตารางการแจกแจงแบบ t จำเป็นต้องค้นหาค่าวิกฤตของเกณฑ์ (t cr.α) ที่ระดับนัยสำคัญที่กำหนด α . หากโมดูโล t ที่คำนวณโดยสูตร (2.1) มีค่าน้อยกว่า t cr.α แสดงว่าไม่มีการพึ่งพาระหว่างตัวแปรสุ่ม X และ Y มิฉะนั้น ข้อมูลการทดลองจะไม่ขัดแย้งกับสมมติฐานเกี่ยวกับการพึ่งพาอาศัยกันของตัวแปรสุ่ม


2.1. คำนวณค่าของเกณฑ์ t ตามสูตร (2.1) ที่เราได้รับ:
เสื้อ =
-0.72028
26 - 2
1 - (-0.72028) 2
= -5.08680

2.2. ให้เรากำหนดค่าวิกฤตของพารามิเตอร์ t cr.α จากตารางการแจกแจงแบบ t

ค่าที่ต้องการ t kr.α อยู่ที่จุดตัดของแถวที่สอดคล้องกับจำนวนองศาอิสระและคอลัมน์ที่สอดคล้องกับระดับนัยสำคัญที่กำหนด α
ในกรณีของเรา จำนวนองศาอิสระคือ n - 2 = 26 - 2 = 24 และ α = 0.05 ซึ่งสอดคล้องกับค่าวิกฤตของเกณฑ์ t cr.α = 2.064 (ดูตารางที่ 2)

ตารางที่ 2 t-การแจกแจง

จำนวนองศาอิสระ
(น - 2)
α = 0.1 α = 0.05 α = 0.02 α = 0.01 α = 0.002 α = 0.001
1 6.314 12.706 31.821 63.657 318.31 636.62
2 2.920 4.303 6.965 9.925 22.327 31.598
3 2.353 3.182 4.541 5.841 10.214 12.924
4 2.132 2.776 3.747 4.604 7.173 8.610
5 2.015 2.571 3.365 4.032 5.893 6.869
6 1.943 2.447 3.143 3.707 5.208 5.959
7 1.895 2.365 2.998 3.499 4.785 5.408
8 1.860 2.306 2.896 3.355 4.501 5.041
9 1.833 2.262 2.821 3.250 4.297 4.781
10 1.812 2.228 2.764 3.169 4.144 4.587
11 1.796 2.201 2.718 3.106 4.025 4.437
12 1.782 2.179 2.681 3.055 3.930 4.318
13 1.771 2.160 2.650 3.012 3.852 4.221
14 1.761 2.145 2.624 2.977 3.787 4.140
15 1.753 2.131 2.602 2.947 3.733 4.073
16 1.746 2.120 2.583 2.921 3.686 4.015
17 1.740 2.110 2.567 2.898 3.646 3.965
18 1.734 2.101 2.552 2.878 3.610 3.922
19 1.729 2.093 2.539 2.861 3.579 3.883
20 1.725 2.086 2.528 2.845 3.552 3.850
21 1.721 2.080 2.518 2.831 3.527 3.819
22 1.717 2.074 2.508 2.819 3.505 3.792
23 1.714 2.069 2.500 2.807 3.485 3.767
24 1.711 2.064 2.492 2.797 3.467 3.745
25 1.708 2.060 2.485 2.787 3.450 3.725
26 1.706 2.056 2.479 2.779 3.435 3.707
27 1.703 2.052 2.473 2.771 3.421 3.690
28 1.701 2.048 2.467 2.763 3.408 3.674
29 1.699 2.045 2.462 2.756 3.396 3.659
30 1.697 2.042 2.457 2.750 3.385 3.646
40 1.684 2.021 2.423 2.704 3.307 3.551
60 1.671 2.000 2.390 2.660 3.232 3.460
120 1.658 1.980 2.358 2.617 3.160 3.373
1.645 1.960 2.326 2.576 3.090 3.291


2.2. ลองเปรียบเทียบค่าสัมบูรณ์ของเกณฑ์ t และ t cr.α

ค่าสัมบูรณ์ของเกณฑ์ t ไม่น้อยกว่าค่าวิกฤต t = 5.08680, tcr.α = 2.064 ดังนั้น ข้อมูลการทดลองที่มีความน่าจะเป็น 0.95(1 - α ), ไม่ขัดแย้งกับสมมติฐานในการพึ่งพาอาศัยกันของตัวแปรสุ่ม X และ Y

3. เราคำนวณค่าสัมประสิทธิ์ของสมการถดถอยเชิงเส้น

สมการถดถอยเชิงเส้นเป็นสมการของเส้นตรงที่ประมาณความสัมพันธ์ระหว่างตัวแปรสุ่ม X และ Y หากเราถือว่า X ว่างและ Y ขึ้นกับ X จะเขียนสมการถดถอยได้ดังนี้


Y = a + b X (3.1) โดยที่:

ข=อาร์เอ็กซ์,วาย
σ x
= อาร์เอ็กซ์,วาย
ไซ
เอสเอ็กซ์
(3.2),
ก = ม ย - ข ม x (3.3)

ค่าสัมประสิทธิ์คำนวณตามสูตร (3.2) เรียกว่าสัมประสิทธิ์การถดถอยเชิงเส้น ในบางแหล่ง เรียกว่า ค่าสัมประสิทธิ์การถดถอยคงที่ และ ตามตัวแปร

ข้อผิดพลาดในการคาดการณ์ Y สำหรับค่าที่กำหนด X คำนวณโดยสูตร:

ค่า σ y/x (สูตร 3.4) เรียกอีกอย่างว่า ส่วนเบี่ยงเบนมาตรฐานที่เหลือมันแสดงลักษณะของการออกจาก Y จากเส้นถดถอยที่อธิบายโดยสมการ (3.1) ที่ค่าคงที่ (ที่กำหนด) ของ X

.
ส ย 2 / ส x 2 = 0.20538 / 0.66481 = 0.30894. เราแยกรากที่สองออกจากตัวเลขสุดท้าย - เราได้รับ:
ส ย / ส x = 0.55582

3.3 คำนวณค่าสัมประสิทธิ์ขตามสูตร (3.2)

= -0.72028 0.55582 = -0.40035

3.4 คำนวณค่าสัมประสิทธิ์กตามสูตร (3.3)

= 30.50000 - (-0.40035 25.75000) = 40.80894

3.5 ประมาณข้อผิดพลาดของสมการถดถอย.

3.5.1 เราแยกรากที่สองออกจาก S y 2 และรับ:

= 0.31437
3.5.4 ให้เราคำนวณข้อผิดพลาดสัมพัทธ์ตามสูตร (3.5)

δy/x = (0.31437 / 30.50000)100% = 1.03073%

4. เราสร้าง scatterplot (ฟิลด์สหสัมพันธ์) และกราฟของเส้นการถดถอย

Scatterplot เป็นการแสดงกราฟิกของคู่ที่เกี่ยวข้องกัน (x k , y k ) เป็นจุดในระนาบในพิกัดสี่เหลี่ยมที่มีแกน X และ Y ช่องสหสัมพันธ์เป็นหนึ่งในการแสดงกราฟิกของตัวอย่างที่เชื่อมโยง (จับคู่) ในระบบพิกัดเดียวกัน กราฟของเส้นการถดถอยจะถูกลงจุดด้วย ควรเลือกมาตราส่วนและจุดเริ่มต้นบนแกนอย่างระมัดระวังเพื่อให้ไดอะแกรมมีความชัดเจนมากที่สุด

4.1. เราพบว่าองค์ประกอบต่ำสุดและสูงสุดของตัวอย่าง X คือองค์ประกอบที่ 18 และ 15 ตามลำดับ x นาที = 22.10000 และ x สูงสุด = 26.60000

4.2. เราพบว่าองค์ประกอบต่ำสุดและสูงสุดของตัวอย่าง Y คือองค์ประกอบที่ 2 และ 18 ตามลำดับ y นาที = 29.40000 และ y สูงสุด = 31.60000

4.3. บนแกน abscissa เราเลือกจุดเริ่มต้นทางด้านซ้ายของจุด x 18 = 22.10000 และมาตราส่วนที่จุด x 15 = 26.60000 พอดีกับแกนและจุดอื่นๆ

4.4. บนแกน y เราเลือกจุดเริ่มต้นทางด้านซ้ายของจุด y 2 = 29.40000 และสเกลดังกล่าวที่จุด y 18 = 31.60000 พอดีกับแกน และจุดอื่นๆ จะถูกแยกแยะอย่างชัดเจน

4.5. บนแกน abscissa เราใส่ค่า x k และบนแกนกำหนดเราใส่ค่า y k .

4.6. เราใส่จุด (x 1, y 1), (x 2, y 2), ..., (x 26, y 26) บนระนาบพิกัด เราได้รับ scatterplot (ฟิลด์สหสัมพันธ์) ดังแสดงในรูปด้านล่าง

4.7. ลองวาดเส้นถดถอย

ในการทำเช่นนี้ เราพบจุดที่แตกต่างกันสองจุดพร้อมพิกัด (x r1 , y r1) และ (x r2 , y r2) สมการที่น่าพอใจ (3.6) วางบนระนาบพิกัดแล้วลากเส้นผ่านจุดเหล่านั้น สมมติว่า x นาที = 22.10000 เป็น abscissa ของจุดแรก เราแทนค่า x min ในสมการ (3.6) เราได้พิกัดของจุดแรก ดังนั้นเราจึงมีจุดพิกัด (22.10000, 31.96127) ในทำนองเดียวกันเราได้รับพิกัดของจุดที่สองโดยตั้งค่า x สูงสุด = 26.60000 เป็น abscissa จุดที่สองจะเป็น: (26.60000, 30.15970)

เส้นถดถอยจะแสดงในรูปด้านล่างเป็นสีแดง

โปรดทราบว่าเส้นการถดถอยจะผ่านจุดค่าเฉลี่ยของ X และ Y เสมอ นั่นคือ พร้อมพิกัด (M x , M y).

งานหลักสูตร

หัวข้อ: การวิเคราะห์ความสัมพันธ์

บทนำ

1. การวิเคราะห์ความสัมพันธ์

1.1 แนวคิดของความสัมพันธ์

1.2 การจำแนกทั่วไปของความสัมพันธ์

1.3 เขตข้อมูลความสัมพันธ์และวัตถุประสงค์ของการก่อสร้าง

1.4 ขั้นตอนของการวิเคราะห์ความสัมพันธ์

1.5 ค่าสัมประสิทธิ์สหสัมพันธ์

1.6 ค่าสัมประสิทธิ์สหสัมพันธ์ Bravais-Pearson ที่ปรับให้เป็นมาตรฐาน

1.7 ค่าสัมประสิทธิ์สหสัมพันธ์อันดับของสเปียร์แมน

1.8 คุณสมบัติพื้นฐานของสัมประสิทธิ์สหสัมพันธ์

1.9 ตรวจสอบนัยสำคัญของค่าสัมประสิทธิ์สหสัมพันธ์

1.10 ค่าวิกฤตของค่าสัมประสิทธิ์สหสัมพันธ์คู่

2. วางแผนการทดสอบหลายตัวแปร

2.1 สภาพของปัญหา

2.2 การกำหนดศูนย์กลางของแผน (ระดับหลัก) และระดับการเปลี่ยนแปลงของปัจจัย

2.3 สร้างเมทริกซ์การวางแผน

2.4 การตรวจสอบความเป็นเนื้อเดียวกันของการกระจายและความแม่นยำเท่ากันของการวัดในชุดต่างๆ

2.5 ค่าสัมประสิทธิ์ของสมการถดถอย

2.6 การกระจายความสามารถในการทำซ้ำ

2.7 ตรวจสอบความสำคัญของสัมประสิทธิ์ของสมการถดถอย

2.8 การตรวจสอบความเพียงพอของสมการถดถอย

บทสรุป

บรรณานุกรม

การแนะนำ

การวางแผนการทดลองเป็นวินัยทางคณิตศาสตร์และสถิติที่ศึกษาวิธีการจัดระเบียบที่มีเหตุผลของการวิจัยเชิงทดลอง - ตั้งแต่การเลือกปัจจัยที่เหมาะสมที่สุดภายใต้การศึกษาและการกำหนดแผนการทดลองจริงตามวัตถุประสงค์ไปจนถึงวิธีการวิเคราะห์ผลลัพธ์ จุดเริ่มต้นของการวางแผนการทดลองวางโดยผลงานของนักสถิติชาวอังกฤษ อาร์. ฟิชเชอร์ (1935) ซึ่งเน้นว่าการวางแผนการทดลองอย่างมีเหตุผลนั้นให้ความแม่นยำในการประมาณการเพิ่มขึ้นไม่น้อยไปกว่าการประมวลผลผลการวัดที่เหมาะสมที่สุด ในช่วงทศวรรษที่ 60 ของศตวรรษที่ 20 ทฤษฎีการวางแผนการทดลองสมัยใหม่ได้เกิดขึ้น วิธีการของมันสัมพันธ์อย่างใกล้ชิดกับทฤษฎีการประมาณฟังก์ชันและการเขียนโปรแกรมทางคณิตศาสตร์ มีการสร้างแผนที่เหมาะสมที่สุดและคุณสมบัติของมันจะถูกตรวจสอบสำหรับโมเดลประเภทต่างๆ

การวางแผนการทดลอง - ทางเลือกของแผนการทดลองที่ตรงตามข้อกำหนดที่ระบุ ชุดของการดำเนินการที่มุ่งพัฒนากลยุทธ์การทดลอง (ตั้งแต่การได้รับข้อมูลเบื้องต้นไปจนถึงการได้รับแบบจำลองทางคณิตศาสตร์ที่ใช้การได้หรือการกำหนดเงื่อนไขที่เหมาะสมที่สุด) นี่คือการควบคุมการทดลองอย่างมีจุดมุ่งหมายซึ่งดำเนินการในเงื่อนไขของความรู้ที่ไม่สมบูรณ์เกี่ยวกับกลไกของปรากฏการณ์ภายใต้การศึกษา

ในกระบวนการวัด การประมวลผลข้อมูลที่ตามมา ตลอดจนการทำให้เป็นทางการของผลลัพธ์ในรูปแบบของแบบจำลองทางคณิตศาสตร์ ข้อผิดพลาดเกิดขึ้นและส่วนหนึ่งของข้อมูลที่มีอยู่ในข้อมูลต้นฉบับจะสูญหายไป การใช้วิธีการวางแผนการทดลองทำให้สามารถระบุข้อผิดพลาดของแบบจำลองทางคณิตศาสตร์และตัดสินความเพียงพอได้ หากความแม่นยำของแบบจำลองไม่เพียงพอ การใช้วิธีการวางแผนการทดลองทำให้สามารถปรับปรุงแบบจำลองทางคณิตศาสตร์ให้ทันสมัยด้วยการทดลองเพิ่มเติมโดยไม่สูญเสียข้อมูลก่อนหน้าและมีค่าใช้จ่ายน้อยที่สุด

จุดประสงค์ของการวางแผนการทดลองคือการค้นหาเงื่อนไขและกฎดังกล่าวสำหรับการดำเนินการทดลองซึ่งเป็นไปได้ที่จะได้รับข้อมูลที่น่าเชื่อถือและเชื่อถือได้เกี่ยวกับวัตถุด้วยต้นทุนแรงงานที่น้อยที่สุดและเพื่อนำเสนอข้อมูลนี้ในรูปแบบที่กะทัดรัดและสะดวกด้วย ปริมาณความแม่นยำ.

ในบรรดาวิธีการวางแผนหลักที่ใช้ใน ขั้นตอนต่างๆการวิจัยใช้:

การวางแผนการทดลองคัดกรอง ความหมายหลักคือการเลือกกลุ่มของปัจจัยที่มีนัยสำคัญจากจำนวนปัจจัยทั้งหมดที่ต้องศึกษาในรายละเอียดเพิ่มเติม

การออกแบบการทดลองเพื่อการวิเคราะห์ความแปรปรวน ได้แก่ จัดทำแผนสำหรับวัตถุด้วยปัจจัยเชิงคุณภาพ

วางแผนการทดลองการถดถอยที่ช่วยให้คุณได้รับแบบจำลองการถดถอย (พหุนามและอื่น ๆ )

วางแผนการทดลองที่รุนแรงซึ่งงานหลักคือการเพิ่มประสิทธิภาพการทดลองของวัตถุประสงค์ของการศึกษา

การวางแผนในการศึกษากระบวนการพลวัต เป็นต้น

วัตถุประสงค์ของการศึกษาระเบียบวินัยคือเพื่อเตรียมนักเรียนสำหรับการผลิตและกิจกรรมทางเทคนิคพิเศษโดยใช้วิธีการของทฤษฎีการวางแผนและเทคโนโลยีสารสนเทศที่ทันสมัย

วัตถุประสงค์ของระเบียบวินัย: ศึกษา วิธีการที่ทันสมัยวางแผน จัดระเบียบ และเพิ่มประสิทธิภาพการทดลองทางวิทยาศาสตร์และอุตสาหกรรม ดำเนินการทดลองและประมวลผลผลลัพธ์

1. การวิเคราะห์ความสัมพันธ์

1.1 แนวคิดของความสัมพันธ์

ผู้วิจัยมักสนใจว่าตัวแปรสองตัวหรือมากกว่ามีความสัมพันธ์กันอย่างไรในตัวอย่างที่ศึกษาอย่างน้อยหนึ่งตัว ตัวอย่างเช่น ความสูงอาจส่งผลต่อน้ำหนักของบุคคล หรือความกดดันอาจส่งผลต่อคุณภาพของผลิตภัณฑ์

ความสัมพันธ์ระหว่างตัวแปรในลักษณะนี้เรียกว่าสหสัมพันธ์หรือสหสัมพันธ์ ความสัมพันธ์คือการเปลี่ยนแปลงที่สอดคล้องกันในสองคุณลักษณะ ซึ่งสะท้อนถึงความจริงที่ว่าความแปรปรวนของคุณลักษณะหนึ่งสอดคล้องกับความแปรปรวนของคุณลักษณะอื่น

เป็นที่ทราบกันดีว่าโดยเฉลี่ยแล้วมีความสัมพันธ์เชิงบวกระหว่างส่วนสูงและน้ำหนักของคน และยิ่งสูงเท่าไร น้ำหนักของคนก็จะยิ่งมากขึ้นเท่านั้น อย่างไรก็ตาม มีข้อยกเว้นสำหรับกฎนี้เมื่อคนตัวเตี้ยมีน้ำหนักเกิน และในทางกลับกัน คนอ้วนที่มีการเติบโตสูงจะเบา เหตุผลของการยกเว้นดังกล่าวคือลักษณะทางชีววิทยา สรีรวิทยา หรือจิตใจแต่ละอย่างถูกกำหนดโดยอิทธิพลของปัจจัยหลายอย่าง: สิ่งแวดล้อม พันธุกรรม สังคม ระบบนิเวศ ฯลฯ

ความสัมพันธ์คือการเปลี่ยนแปลงความน่าจะเป็นที่สามารถศึกษาได้เฉพาะตัวอย่างที่เป็นตัวแทนโดยวิธีการทางสถิติทางคณิตศาสตร์ คำศัพท์ทั้งสอง - ความสัมพันธ์และการพึ่งพาความสัมพันธ์ - มักใช้แทนกันได้ การพึ่งพาหมายถึงอิทธิพล การเชื่อมต่อ - การเปลี่ยนแปลงที่ประสานกันซึ่งสามารถอธิบายได้ด้วยเหตุผลหลายร้อยประการ ความสัมพันธ์ไม่สามารถพิจารณาเป็นหลักฐานของความสัมพันธ์เชิงสาเหตุได้ แต่บ่งชี้ว่าการเปลี่ยนแปลงในคุณลักษณะหนึ่ง ตามกฎแล้วจะมาพร้อมกับการเปลี่ยนแปลงบางอย่างในคุณลักษณะอื่น

การพึ่งพาความสัมพันธ์ - เป็นการเปลี่ยนแปลงที่ค่าของคุณสมบัติหนึ่งทำให้ความน่าจะเป็นเกิดขึ้น ค่าที่แตกต่างกันสัญญาณอื่น

งานของการวิเคราะห์ความสัมพันธ์จะลดลงเหลือแค่การกำหนดทิศทาง (บวกหรือลบ) และรูปแบบ (เชิงเส้น ไม่ใช่เชิงเส้น) ของความสัมพันธ์ระหว่างคุณลักษณะต่างๆ การวัดความรัดกุม และสุดท้ายคือการตรวจสอบระดับนัยสำคัญของค่าสัมประสิทธิ์สหสัมพันธ์ที่ได้รับ .

ความสัมพันธ์แตกต่างกันในรูปแบบ ทิศทาง และระดับ (ความแข็งแรง) .

รูปร่างของความสัมพันธ์สามารถเป็นเส้นตรงหรือเส้นโค้ง ตัวอย่างเช่น ความสัมพันธ์ระหว่างจำนวนเซสชันการฝึกบนเครื่องจำลองและจำนวนของปัญหาที่ได้รับการแก้ไขอย่างถูกต้องในเซสชันการควบคุมสามารถตรงไปตรงมาได้ ตัวอย่างเช่น Curvilinear สามารถเป็นความสัมพันธ์ระหว่างระดับของแรงจูงใจและประสิทธิผลของงาน (รูปที่ 1) เมื่อแรงจูงใจเพิ่มขึ้น ประสิทธิภาพของงานจะเพิ่มขึ้นก่อน จากนั้นจึงถึงระดับแรงจูงใจที่เหมาะสมที่สุด ซึ่งสอดคล้องกับประสิทธิภาพสูงสุดของงาน แรงจูงใจที่เพิ่มขึ้นมาพร้อมกับประสิทธิภาพที่ลดลง

รูปที่ 1 - ความสัมพันธ์ระหว่างประสิทธิผลของการแก้ปัญหาและความแข็งแกร่งของแนวโน้มการสร้างแรงบันดาลใจ

ในทิศทาง ความสัมพันธ์สามารถเป็นบวก ("โดยตรง") และลบ ("ย้อนกลับ") ด้วยความสัมพันธ์แบบเส้นตรงเชิงบวก ค่าที่สูงกว่าของแอตทริบิวต์หนึ่งจะสอดคล้องกับค่าที่สูงกว่าของอีกอันหนึ่ง และค่าที่ต่ำกว่าของแอตทริบิวต์หนึ่งจะสอดคล้องกับค่าที่ต่ำของอีกอันหนึ่ง (รูปที่ 2) ด้วยความสัมพันธ์เชิงลบ อัตราส่วนจะถูกกลับด้าน (รูปที่ 3) ด้วยความสัมพันธ์เชิงบวก ค่าสัมประสิทธิ์สหสัมพันธ์จะมีเครื่องหมายบวก และค่าสหสัมพันธ์เชิงลบจะเป็นเครื่องหมายลบ

รูปที่ 2 - ความสัมพันธ์โดยตรง

รูปที่ 3 - ความสัมพันธ์ผกผัน


รูปที่ 4 - ไม่มีความสัมพันธ์กัน

ระดับ ความแข็งแกร่ง หรือความหนาแน่นของความสัมพันธ์ถูกกำหนดโดยค่าของสัมประสิทธิ์สหสัมพันธ์ ความแข็งแรงของการเชื่อมต่อไม่ได้ขึ้นอยู่กับทิศทางและถูกกำหนดโดยค่าสัมบูรณ์ของค่าสัมประสิทธิ์สหสัมพันธ์

1.2 การจำแนกความสัมพันธ์โดยทั่วไป

ขึ้นอยู่กับค่าสัมประสิทธิ์สหสัมพันธ์

แข็งแกร่งหรือใกล้เคียงกับค่าสัมประสิทธิ์สหสัมพันธ์ r>0.70;

ปานกลาง (ที่ 0.50

ปานกลาง (ณ 0.30 น

อ่อนแอ (ที่ 0.20

อ่อนแอมาก (ที่ร<0,19).

1.3 เขตข้อมูลความสัมพันธ์และวัตถุประสงค์ของการก่อสร้าง

มีการศึกษาความสัมพันธ์บนพื้นฐานของข้อมูลการทดลองซึ่งเป็นค่าที่วัดได้ (x i , y i) ของสองคุณสมบัติ หากมีข้อมูลการทดลองเพียงเล็กน้อย การแจกแจงเชิงประจักษ์แบบสองมิติจะแสดงเป็นอนุกรมคู่ของค่า x i และ y i ในกรณีนี้ สามารถอธิบายความสัมพันธ์ระหว่างคุณลักษณะต่างๆ ได้หลายวิธี ความสอดคล้องระหว่างอาร์กิวเมนต์และฟังก์ชันสามารถกำหนดได้ด้วยตาราง สูตร กราฟ ฯลฯ

การวิเคราะห์สหสัมพันธ์เช่นเดียวกับวิธีการทางสถิติอื่น ๆ นั้นขึ้นอยู่กับการใช้แบบจำลองความน่าจะเป็นที่อธิบายพฤติกรรมของคุณลักษณะที่ศึกษาในประชากรทั่วไปบางกลุ่มซึ่งได้ค่าการทดลอง x i และ y i เมื่อทำการตรวจสอบความสัมพันธ์ระหว่างลักษณะเชิงปริมาณค่าที่สามารถวัดได้อย่างแม่นยำในหน่วยมาตราส่วนเมตริก (เมตร วินาที กิโลกรัม ฯลฯ) แบบจำลองของประชากรทั่วไปที่กระจายตามปกติแบบสองมิติมักจะมาก บุตรบุญธรรม โมเดลดังกล่าวแสดงความสัมพันธ์ระหว่างตัวแปร x i และ y i ในเชิงกราฟิกในฐานะตำแหน่งของจุดในระบบพิกัดสี่เหลี่ยม การพึ่งพาแบบกราฟิกนี้เรียกอีกอย่างว่า scatterplot หรือฟิลด์ความสัมพันธ์
แบบจำลองของการแจกแจงแบบปกติสองมิติ (ฟิลด์สหสัมพันธ์) นี้ช่วยให้คุณตีความภาพกราฟิกของค่าสัมประสิทธิ์สหสัมพันธ์ได้เนื่องจาก การกระจายโดยรวมขึ้นอยู่กับห้าพารามิเตอร์: μ x , μ y – ค่าเฉลี่ย (ความคาดหวังทางคณิตศาสตร์); σ x ,σ y คือส่วนเบี่ยงเบนมาตรฐานของตัวแปรสุ่ม X และ Y และ p คือสัมประสิทธิ์สหสัมพันธ์ ซึ่งเป็นมาตรวัดความสัมพันธ์ระหว่างตัวแปรสุ่ม X และ Y
ถ้า p \u003d 0 ค่า x i , y i ที่ได้รับจากประชากรปกติสองมิติจะอยู่บนกราฟในพิกัด x, y ภายในพื้นที่ที่ล้อมรอบด้วยวงกลม (รูปที่ 5, a) ในกรณีนี้ ไม่มีความสัมพันธ์ระหว่างตัวแปรสุ่ม X และ Y และเรียกว่าไม่มีความสัมพันธ์กัน สำหรับการแจกแจงแบบปกติสองมิติ ความไม่สัมพันธ์กันหมายถึงความเป็นอิสระของตัวแปรสุ่ม X และ Y ในขณะเดียวกัน