ไคสแควร์ (Chi-Square) logo on print
chisquare

ไคสแควร์ (Chi-Square)

ไคสแควร์ คือ การทดสอบผลรวมของสัดส่วนกำลังสองของผลต่าง ระหว่าง ความถี่ของค่าที่สังเกต กับ ค่าความถี่ของค่าคาดหวัง หรือ ใช้ทดสอบการแจกแจงของข้อมูล มักใช้กับข้อมูลที่แจกแจงแบบไม่ต่อเนื่อง (Discontinuous data)
SPSS | SPSS16 | T-Test | Chi-Square | วิจัยคืออะไร | peer review | TCI-1140 | TCI-1243 | R |
ไคสแควร์ (Chi-Square) ค-สแควร์ หรือ ไคสแควร์ ((Chi-Square)) คือ การทดสอบผลรวมของสัดส่วนกำลังสองของผลต่าง ระหว่าง ความถี่ของค่าที่สังเกต กับ ค่าความถี่ของค่าคาดหวัง หรือ ใช้ทดสอบการแจกแจงของข้อมูล มักใช้กับข้อมูลที่แจกแจงแบบไม่ต่อเนื่อง ((Discontinuous \_ data)) ซึ่งใช้จำแนกได้ 2 ทาง คือ 1) ข้อมูลจำแนกทางเดียว ((One-Dimensional \_ Classification \_ Data)) เช่น ชื่อนักเรียนกับคะแนนภาษาอังกฤษ หรือ วันที่กับจำนวนผู้ใช้บริการ หรือ ยี่ห้อทีวีกับจำนวนลูกค้า ตัวอย่างการทดสอบสมมติฐาน H0 เช่น นักเรียนมีคะแนนสอบภาษาอังกฤษเฉลี่ยที่ 15 คะแนน ส่วนเบี่ยงเบนมาตรฐานมีค่าเป็น 2 หรือไม่ ที่ระดับนัยสำคัญ 0.05 2) ข้อมูลจำแนกสองทาง ((Two-Way \_ Contingency \_ Table)) เช่น เพศกับหลักสูตรที่สนใจศึกษาต่อ หรือ รายได้กับอาชีพ หรือ อายุกับค่าใช้จ่ายในการท่องเที่ยวต่อปี ตัวอย่างการทดสอบสมมติฐาน H0 เช่น เพศไม่มีความสัมพันธ์กับหลักสูตรที่สนใจศึกษาต่อ หรือ รายได้ไม่สัมพันธ์กับอาชีพ หรือ อายุไม่สัมพันธ์กับค่าใช้จ่ายในการท่องเที่ยว
การทดสอบไคสแควร์
ไคสแควร์ คืออะไร chisquare Chi-square test ((การทดสอบไคสแควร์)) เป็นการทดสอบทางสถิติที่ใช้ตรวจสอบว่า ค่าที่สังเกตได้ ((Observed \_ Frequencies)) แตกต่างจาก ค่าที่คาดหวัง ((Expected \_ Frequencies)) อย่างมีนัยสำคัญทางสถิติหรือไม่ โดยหลัก ๆ ใช้กับข้อมูลที่อยู่ใน รูปแบบเชิงจัดประเภท ((Categorical \_ Data))
ประเภทของ Chi-square test
1. Chi-square goodness-of-fit test ใช้ตรวจสอบว่า การกระจายของข้อมูลที่สังเกตตรงกับการกระจายที่คาดหวังหรือไม่ เช่น ตรวจว่าจำนวนลูกค้าที่ชอบสินค้าสีต่าง ๆ กระจายตามสัดส่วนที่คาดไว้หรือไม่
2. Chi-square test of independence ใช้ตรวจสอบว่า ตัวแปรเชิงจัดประเภท 2 ตัว มีความสัมพันธ์กันหรือไม่ เช่น เพศ (ชาย/หญิง) กับการเลือกประเภทสินค้า (A/B/C) มีความสัมพันธ์กันหรือไม่
สูตรพื้นฐาน
$$ \chi^2 = \sum \frac{(O - E)^2}{E} $$
* $O$ = ค่าที่สังเกต (Observed frequency)
* $E$ = ค่าที่คาดหวัง (Expected frequency)
เงื่อนไขการใช้
* ใช้กับข้อมูลเชิงจัดประเภท
* ข้อมูลต้องเป็นการนับจำนวน (frequency) ไม่ใช่ค่าเฉลี่ย
* ค่าที่คาดหวังในแต่ละช่องควร ≥ 5 (เพื่อความแม่นยำของผลทดสอบ)
* แต่ละการสังเกตต้องเป็นอิสระต่อกัน (independent)
ไคสแควร์ (Chi-square) ต.ย. การตั้งสมมติฐานที่ใช้ Chi-square
ตัวแปรตาม แบบนามบัญญัติ เช่น รายการเพลง ช่วงเวลา ประเภท
ตัวแปรอิสระ แบบนามบัญญัติ เช่น เพศ อายุ ภูมิลำเนา อาชีพ
สมมติฐาน
- การเลือกประเภทเพลงที่ชอบขึ้นอยู่กับสถานภาพด้านเพศ
- รายการเพลงที่ชอบแตกต่างกันไปตามอายุ
- ช่วงเวลาที่ฟังเพลงกับอาชีพมีความสัมพันธ์กัน
- การเลือกรายการเพลงที่สอดคล้องกับ อายุ อาชีพ เพศ และภูมิลำเนา
- การเลือกห้างสรรพสินค้ามีความสัมพันธ์กับ อายุ อาชีพ เพศ และภูมิลำเนา
ด้พูดคุยแลกเปลี่ยนกับ อาจารย์ที่สอนทางด้านสถิติ เรื่อง การใช้ค่าสถิติในการทดสอบสมมติฐาน เกี่ยวกับลักษณะข้อมูลแบบนามบัญญัติ การเลือกใช้ chi-square, t-test, f-test หรือ ANOVA แล้วผมก็ได้อ่านหนังสือของ อ.ธานินทร์ ศิลป์จาระ และ อ.ธันยพัฒน์ วงศ์รัตน์ ทำให้เข้าใจชัดเจนขึ้น โดยเอกสารของ อ.จุฬารัตน์ ชุมนวล ให้ความหมายของ ไคสแวร์ (chi-square) ว่าเป็นการทดสอบสมมติฐานที่ใช้ในกรณีที่ข้อมูลที่พิจารณา แบ่งออกเป็นกลุ่ม หรือข้อมูลในรูปความถี่ โดยความถี่นั้นจะเป็นความถี่ของแต่ละกลุ่ม เช่น เพศ กับความคิดเห็น ส่วนการจำแนก มี 2 แบบ คือ 1) จำแนกทางเดียว หรือ 2) จำแนกสองทาง ถ้าจำแนกทางเดียวก็จะเป็นทดสอบเกี่ยวกับสัดส่วนของประชากรระหว่างกลุ่ม หรือทดสอบเกี่ยวกับการแจกแจงของประชากร เช่น สัดส่วนของผลการเรียนแต่ละเกรดแตกต่างกันหรือไม่ หรือ เพศมีการแจกแจงแบบปกติหรือไม่ เป็นต้น แต่ถ้าจำแนกสองทางก็จะทดสอบความเป็นอิสระของสองลักษณะ เช่น ทดสอบว่าเพศกับผลการเรียนมีความสัมพันธ์กันหรือไม่ อีกค่าสถิติที่น่าสนใจคือ การวิเคราะห์ความแปรปรวน ((ANOVA)) ถ้าเป็นการวิเคราะห์ทางเดียว ((One-way)) ก็จะมีตัวแปรตัวเดียว ((ตัวแปรอิสระ)) ที่มีผลต่อค่าสังเกต ((ตัวแปรตาม)) เท่าที่อ่านงานของนักศึกษา พบว่า ส่วนใหญ่ใช้การวิเคราะห์ทางเดียว และใช้ค่า F-Test ตามด้วย LSD ถ้าค่า sig จาก F-Test < 0.05 ซึ่งแสดงว่าใน ข้อมูลแต่ละกลุ่มที่มีค่าเฉลี่ยแตกต่างกัน
แนะนำเอกสาร
347-211 สถิติพื้นฐาน - อ.จุฬารัตน์ ชุมนวล
4113105 สถิติเพื่อการวิจัย - อ.ชลิดา ตระกูลสุนทร
การทดสอบไคสแควร์ ารทดสอบไคสแควร์ (Chi-Square Test) คือ การทดสอบเพื่อเปรียบเทียบข้อมูลที่วัดเป็นความถี่ อาจเป็นจำนวนความคิดเห็น ความสนใจ หรือการยอมรับ ต่อเกณฑ์ 5 ระดับ ซึ่งไม่สามารถวัดออกมาเป็นค่าที่แน่นอน เช่น ความสูง น้ำหนัก ขนาด
กรณีที่ 1. ถ้าข้อมูลมี 1 ตัวแปร ทดสอบการทับกันสนิท
เป็นการทดสอบความกลมกลืน หรือการทดสอบสารรูปสนิทดี ((Goodness \_ of \_ Fit \_ Test)) หรือทับกันสนิท เป็นการทดสอบว่ากลุ่มตัวอย่างเป็นไปตามสัดส่วน หรือสมการที่กำหนดไว้หรือไม่
ต.ย. เด็กเกิด 12 เดือน ทุกเดือนเท่ากัน
เก็บข้อมูลเด็กเกิดใหม่ แต่ละเดือนมีจำนวน 10,12,15,10,9,8,10,12,15,10,8,7 (N = sum(x1 .. x12))
โดยความคาดหวังว่าทุกเดือนเกิดเท่ากัน
◈ H0 : แต่ละเดือนมีจำนวนเด็กเกิดใหม่ ไม่แตกต่างกัน
◈ H1 : แต่ละเดือนมีจำนวนเด็กเกิดใหม่ แตกต่างกัน
ค่า sig. >= 0.05 จึงยอมรับ H0 ที่ระดับนัยสำคัญ 0.05
เพราะค่า sig. < 0.05 จะเป็นการยอมรับ H1
สรุปว่า ยอมรับ H0 แต่ละเดือนมีจำนวนเด็กเกิดใหม่ ไม่แตกต่างกัน เพราะเปิดตารางแล้วได้ sig. >= 0.05
กรณีที่ 2. ถ้าข้อมูลมากกว่า 1 ตัวแปร ทดสอบความเป็นอิสระต่อกัน
แล้วเป็นการทดสอบความเป็นอิสระต่อกัน (( Test \_ of \_ Independence ))
หรือ การทดสอบความสัมพันธ์ระหว่างกัน (( Test \_ of \_ Association ))
คือ การทดสอบว่าตัวแปรมีความสัมพันธ์กันหรือไม่
โดยทดสอบทีละคู่ อาจอยู่ในรูปตาราง 2*2, 2*3 หรือ 3*2
ต.ย. เพศกับอยากเป็นพยาบาล
ระดับนัยสำคัญ 0.01
◈ H0 : ไม่มีความสัมพันธ์ระหว่างอาชีพพยาบาลกับเพศ
◈ H1 : มีความสัมพันธ์ระหว่างอาชีพพยาบาลกับเพศ
สรุปว่า ยอมรับ H1 - มีความสัมพันธ์ระหว่างอาชีพพยาบาลกับเพศ โดยเปิดตารางแล้วพบ sig. น้อยกว่า 0.01
กรณีที่ 3. ถ้าข้อมูลมากกว่า 1 ตัวแปร ทดสอบความเป็นเอกภาพ
แล้วเป็นการทดสอบความเป็นเอกภาพ (( Test \_ of \_ Homogeneity ))
หรือ การทดสอบความคล้ายคลึงกันของตัวแปร
ต.ย. ประเมินความพึงพอใจต่อระบบไอที
นักศึกษา 46 คน กับ อาจารย์ 49 คน รวมกัน 95 คน
มีผลประเมินความพึงพอใจทั้งหมด 4 ระดับ โดยแต่ละระดับไม่เหมือนกัน
สรุปได้หรือไม่ว่า ผลประเมินความพึงพอใจต่อระบบไอทีแตกต่างกันที่นัยสำคัญ 0.01
◈ H0 : ความพึงพอใจของนักศึกษาและอาจารย์ต่อระบบไอทีเหมือนกัน
◈ H1 : ความพึงพอใจของนักศึกษาและอาจารย์ต่อระบบไอทีไม่เหมือนกัน
สรุปว่า
ยอมรับ H0 มีความพึงพอใจของนักศึกษาและอาจารย์ต่อระบบไอทีเหมือนกัน
เพราะเปิดตารางแล้วได้ค่า SIG มากกว่า 0.01

หนังสือ การวิจัยของ ดร.มนต์ชัย เทียนทอง 14 บทเรียน
chi-square.xlsx ***
การแจกแจงแบบตารางไขว้ (Crosstabs) และค่าไคสแวร์ ารใช้ Crosstabs และ Chi-square แสดงความสัมพันธ์ของสองตัวแปร .. ซึ่งการใช้ค่า Chi-square และการทำ Crosstabs นั้น สามารถหาได้ว่า 2 ตัวแปรนี้มีผลต่อกันหรือไม่ ถ้าข้อมูลไม่สัมพันธ์กัน ค่า sig ก็จะมากกว่า 0.05 อย่างกรณีนี้ ข้อมูลของ v1 กับ v2 สัมพันธ์กัน ทำให้ค่า Sig. Pearson Chi-square ได้ 0.002
สำหรับงานวิจัยที่ต้องการ เปรียบเทียบการรับรู้ และ การนำไปใช้ ก็สามารถใช้ Chi-square และทำการแจกแจงแบบตารางไขว้ ๖(Crosstabs)) ซึ่งนำเสนอผลการศึกษาได้ชัดเจน ดังภาพประกอบ แต่การใช้ตาราง Crosstabs ก็ต้องอ่านตารางด้วยความเข้าใจ และอธิบายเชิงพรรณาให้ชัดเจน ว่าทำไมจึงมีความสัมพันธ์แบบนั้นเกิดขึ้น
☸ อ่านเพิ่ม thaiall.com/blog/burin/6356/
การใช้โปรแกรม SPSS ทดสอบสมมติฐาน ระหว่าง เพศ กับ วิทยากร เอกสาร และอาหาร

speaker_and_sex
xlsx
1. เปิดโปรแกรม spss
2. เตรียมข้อมูลมี 2 ทางเลือก ได้แก่ Type in data , Open an existing data source
3. เตรียม เพศ กับระดับความพึงพอใจวิทยากร จำนวน 400 ข้อมูล
4. แก้ชื่อ var เป็น sex กับ speaker พบ tab = Data View, Variable View
5. Menu, Analyse, Descriptive Statistics, Crosstabs,
- Row = sex , Column = speaker
- Cells, Counts:Expected = checked
6. Menu, Analyse, Descriptive Statistics, Crosstabs,
- Statistics
- Chi-square = checked
- Phi and Cramer's V = checked
7. OK ได้ SPSS Viewer พบตาราง Crosstab และ Chi-Square Tests
พบค่า Peason Chi-Square มี Asymp. Sig. = .0 แสดงว่า มีความสัมพันธ์
สมมติฐานที่ 1
เปรียบเทียบ ว่า เพศ กับ วิทยากร พบว่า Sig. = .0
ยอมรับ H1: เพศชาย และเพศหญิงมีความพึงพอใจในวิทยากรแตกต่างกัน
8. ทดสอบกับ Document ด้วย Crosstabs ((Chi-square))
สมมติฐานที่ 2
เปรียบเทียบ ว่า เพศ กับ เอกสารการอบรม พบว่า Sig. = 1.0
ยอมรับ H0: เพศชาย และเพศหญิงมีความพึงพอใจเอกสารการอบรม ไม่แตกต่างกัน
9. ทั้ง Crosstabs ((Chi-square)) และ Compare Means (One-way Anova)
ให้ผลการทดสอบสมมติฐานไม่แตกต่างกัน ระหว่างเพศ กับ วิทยากร และเอกสาร
10. เปรียบเทียบ ว่า เพศ กับ อาหาร
ซึ่งเตรียมข้อมูลให้ก้ำกึ่งระหว่างยอมรับกับไม่ยอมรับ H0
ค่าสถิติ Crosstabs ((Chi-square)) พบว่า Sig. =0.041
และ Compare Means ((One-way \_ Anova)) พบว่า Sig. =0.041
ยอมรับ H1: เพศชาย และเพศหญิงมีความพึงพอใจในอาหารแตกต่างกัน
11. ตัวอย่างข้อมูล เพศอย่างละ 200 คน
ความพึงพอใจในอาหาร กรอกข้อมูล 1 - 5 เรียงรายคนให้กับเพศชายทั้ง 200 คน
แต่เพศหญิง กรอกข้อมูล 1 - 5 เรียงรายคน จำนวน 165 คน อีก 35 คนพอใจระดับ 1
ค่าสถิติ chi-square ได้ค่า Sig. = 0.041 ซึ่ง < 0.05 ยอมรับ H1
นั่นคือ ยอมรับ H1 หมายถึง มีผลต่อกัน หรือ แตกต่างกัน หรือแจกแจงไม่ปกติ
12. แฟ้มที่เกี่ยวข้อง ข้อมูล .xlsx และ .sav , ผลลัพธ์ .doc
Chi-square test in SPSS
ต.ย. sam400 ทดสอบ chi-square ด้วย Phi and Cramer's V
ปรียบเทียบ 3 กรณี ดังนี้ 1) ผลการทดสอบ ระหว่าง เพศ และ เคยเที่ยวทะเล พบว่า ค่า sig ได้ 0.004 ซึ่ง < 0.05 ยอมรับ H1 หมายความว่า เพศ สัมพันธ์กับ เคยเที่ยวทะเล หรือกล่าวได้ว่าสองเพศนี้มีประสบการณ์กับทะเลต่างกัน จากตาราง Crosstab เปรียบเทียบข้อมูล 400 คน พบว่า หญิงไม่เคยเที่ยวทะเลมี 8 คน ชายไม่เคยเที่ยวทะเลมี 0 คน 2) ผลการทดสอบ ระหว่าง เพศ และ ระดับความพึงพอใจศีลข้อ 1 พบว่า ค่า sig ได้ 0.024 ซึ่ง < 0.05 ยอมรับ H1 หมายความว่า เพศ สัมพันธ์กับ ศีลข้อ 1 หรือกล่าวได้ว่าสองเพศนี้มีความคิดต่างกัน จากตาราง Crosstab พบว่า ผู้หญิงทุกคนให้คะแนนศีลข้อ 1 ในระดับ 5 แต่ผู้ชายให้คะแนนกระจายในหลายระดับมีตั้งแต่ 1 ถึง 5 3) ผลการทดสอบ ระหว่าง เพศ และ คะแนนสอบหลังเรียน พบว่า ค่า sig ได้ 0.735 ซึ่ง >= 0.05 ยอมรับ H0 หมายความว่า เพศไม่สัมพันธ์กับคะแนนสอบหลังเรียน หรือกล่าวได้ว่า สองเพศนี้มีคะแนนหลังสอบกระจายตัวระหว่าง 6 ถึง 10 ใกล้เคียงกัน
GET
   FILE='D:\thaiall.com\spss\sam400.sav'.
 DATASET NAME DataSet1 WINDOW=FRONT.
 CROSSTABS
   /TABLES=VAR00001 BY VAR00008 VAR00012 VAR00007
   /FORMAT=AVALUE TABLES
   /STATISTICS=CHISQ PHI
   /CELLS=COUNT
   /COUNT ROUND CELL.
sam400.sav
- Menu bar
- Analyze
- Descriptive Statistics, Crosstabs
  row=เพศ
  Column=เคยเที่ยวทะเล
  Column=ศีลข้อ 1
  Column=คะแนนหลังเรียน
- Statistics
- Chi-square=checked
- Phi and Cramer's V=checked
- Ok
บทความในฐานข้อมูลวารสารอิเล็กทรอนิกส์กลางของประเทศไทย
เอกสารอ้างอิง

Thongphanh Chanthalak และ พรนภา ศุกรเวทย์ศิริ. ((2556)). ปัจจัยที่มีความสัมพันธ์ต่อการบริจากโลหิตด้วยความสมัครในไม่หวังสิ่งตอบแทนของประชาชน ชุมชนเมืองจันทะบูลี นครหลวงเวียงจันทน์ สาธารณรัฐประชาธิปไตยประชาชนลาว. วารสารวิจัยสาธารณสุขศาสตร์ มหาวิทยาลัยขอนแก่น, 6((2)), 34-41.

พบว่า มีการใช้ค่าสถิติ Chi-Square test มาทดสอบ ตัวแปรต้นต่าง ๆ กับความถี่ในการบริจาคโลหิตของประชาชน คราวละตัวแปร แล้วได้ค่า p-value มาเขียนรายงานการวิจัย เช่น ตัวแปรเพศมีความสัมพันธ์กับการบริจาคโลหิต อย่างมีนัยสำคัญทางสถิติที่ ((p-value < 0.001)) โดยพบว่าเพศชายบริจาคโลหิตมากกว่าเพศหญิงประมาณ 1.7 เท่า
Thaiall.com