Skip to main content
🟢 Beginner

מחשבון צ'י-רבוע

לחשב את הסטטיסטיקה של chi-square, p-value, ודרגות החופש עבור טבלת תנאי 2x2. לבדוק באופן מיידי את העצמאות בין שני משתנים קטגוריים. כלי סטטיסטיקה חינם.

מהו מבחן צ'י-רבוע?

בדיקת צ'י בריבוע (χ2) היא אחת הבדיקות הסטטיסטיות הנפוצות ביותר לניתוח נתונים קטגוריים. היא עונה על שאלה בסיסית:האם שני משתנים קטגוריים הם עצמאיים, או שיש קשר אמיתי ביניהם?שלא כמו בדיקות לנתונים מספריים (כמו בדיקות t), chi-square עובד עם ספירות -- כמה פריטים נופלים לכל קטגוריה.

דוגמאות קלאסיות ליישומים של chi-square:

הבדיקה עובדת על ידי השוואהתדירות שנצפו(מה שבאמת ספרת) עדתדירות צפויה(מה שהיית מצפה לו אם שני המשתנים היו עצמאיים לחלוטין) אם המספרים שנצפו סוטים מספיק מהצפוי, אתה דוחה את ההשערה של עצמאות ומגיע למסקנה שהמשתנים קשורים.

עבור טבלה 2x2 (שתי קטגוריות לכל אחת משני משתנים), למבחן יש 1 מידה של חופש. הסטטיסטית chi-square שהתקבלה משווה לערך קריטי או מומרת לערך p כדי לקבוע משמעות סטטיסטית.

נוסחת ה-Chi-Square לשולחן 2x2

בהתחשב בשולחן חירום 2x2 עם ספירות A, B, C, D:

קטגוריה 1קטגוריה 2סך כל השורות
קבוצה 1ABא + ב
קבוצה 2CDC + D
סך הכלA + Cב + דN = A + B + C + D

צעד 1 -- לחשב תדירות צפויה:

E_A = (A+B) ((A+C) /N E_B = (A+B) ((B+D) /N
E_C = (C+D) ((A+C) /N E_D = (C+D) ((B+D) /N

שלב 2 -- לחשב chi בריבוע:

χ2 = Σ [(O - E) 2 / E]
= (A-E_A) /E_A + (B-E_B) /E_B + (C-E_C) /E_C + (D-E_D) /E_D

או באופן שווה ערך עבור טבלה 2x2, הנוסחה הקצרה:

χ2 = N ((AD - BC) 2 / [ ((A+B) ((C+D) ((A+C) ((B+D)) ]

שלב 3 - דרגות חופש:עבור טבלה 2x2: df = (שורות - 1) x (cols - 1) = 1 x 1 = 1

צעד 4 -- למצוא p-ערך:השוואה של χ2 עם ההפצה של chi-square עם df = 1. עם ביטחון של 95% (α = 0.05), הערך הקריטי הוא 3.841. אם χ2 > 3.841, התוצאה משמעותית מבחינה סטטיסטית - אתה דוחה את העצמאות.

דוגמא מעובדת:A = 50 (רצים שהתאמנו בתדירות גבוהה, ללא פציעה), B = 30 (תדירות גבוהה, פציעה), C = 20 (תדירות נמוכה, ללא פציעה), D = 40 (תדירות נמוכה, פציעה). N = 140.

טבלת ערכי הקריטי Chi-Square

ערכי התייחסות לבדיקת חשיבות chi-square ברמת חופש אחת (טבלה 2x2):

p-ערךחשיבותקריטי χ2 (df=1)פרשנות
0.10ביטחון של 90%2.706מגמה מרמזת
0.0595% ביטחון3.841משמעותית מבחינה סטטיסטית.
0.01ביטחון של 99%6.635משמעותי מאוד.
. 00199.9% ביטחון10.828מאוד מאוד משמעותי.

עבור טבלאות חירום גדולות יותר, רמות החופש גדלות. עבור טבלאות 2x3: df = (2-1) ((3-1) = 2. עבור טבלאות 3x3: df = 4. הערך הקריטי גדל עם רמות החופש, כך שטבלאות גדולות יותר דורשות ערכים chi-square גבוהים יותר כדי להשיג משמעות.

גודל השולחןdfקריטי χ2 (p = 0.05)קריטי χ2 (p = 0.01)
2 על 213.8416.635
2x3 או 3x225.9919.210
שלוש על שלוש.49.48813.277
4x4916.91921.666

הנחות וכאשר צ'י-רבוע תקף

בדיקת ה-chi-square כוללת כמה הנחות חשובות שיש לעמוד בהן כדי לקבל תוצאות תקפות:

תיקון המשכיות של יאטס:עבור טבלאות 2x2 עם דוגמאות קטנות (n < 40 או כל תדירות צפויה < 10), תיקון יאטס מוריד 0.5 מכל אחד מ-O-E-E לפני הריבוע, ומפחית את הערך של chi-square. תיקון זה שנוי במחלוקת - כמה סטטיסטיקאים ממליצים על מבחן פישר המדויק במקום. המחשב שלנו מראה את הערכים הלא מתוקנים ואת הערכים המתוקנים של יאטס.

מבחן פישר המדויק:עבור טבלאות 2x2 עם דגימות קטנות מאוד (סך N < 20, או כל תא צפוי < 5), מבחן פישר המדויק מחשב את ההסתברות המדויקת של התצפית על ספירת התאים הניתנת, מבלי להסתמך על ההערכה chi-square. זהו הסטנדרט הזהב לדגימות קטנות ברפואה ובביולוגיה.

גודל ההשפעה: פי (φ) ו-V של קרמר

תוצאה של chi-square משמעותית מבחינה סטטיסטית אומרת לכם שיש קשר אמיתי -- אבל לא כמה חזק הוא. דגימה גדולה מאוד יכולה לגרום אפילו לקשר קטן, כמעט חסר משמעות, להיות משמעותי מבחינה סטטיסטית. מדידות גודל ההשפעה ממדידות את עוצמת הקשר ללא קשר לגודל הדגימה.

אמצעינוסחהטווחמתי להשתמש
פי (φ)√(χ2/N)0 עד 1רק שולחנות 2x2
ה-V של קרמר√(χ2/(Nxmin(r-1,c-1)))0 עד 1כל גודל שולחן

הנחיות לפרשנות (קוהן, 1988):

דוגמה: בדוגמת תדירות האימונים / הפציעה שלנו (χ2 = 11.67, N = 140), phi = √(11.67/140) = √0.0834 = 0.29 - גודל אפקט בינוני. הקשר אמיתי וחזק בינוני, לא רק חפץ סטטיסטי של דגימה גדולה.

בדיקת כושר ההתאמה

מעבר לבדיקת עצמאות בין שני משתנים, chi-square משמש גם לבדיקת אם חלוקה של ספירות תצפית תואמת חלוקה צפויה (תיאורטית).בדיקת איכות ההתאמה.

יישומים קלאסיים:

נוסחה: χ2 = Σ[(O_i - E_i) 2 / E_i] עבור כל קטגוריה i. דרגות חופש = מספר קטגוריות - 1 (מינוס כל פרמטרים מוערכים נוספים). הבדיקה עוקבת אחר אותו חלוקת chi-square כמו בדיקת העצמאות.

יישומים בעולם האמיתי במחקר ספורט ובריאות

בדיקות צ'י-רבוע הן סוס עבודה במדעי הספורט ובמחקר האפידמיולוגי כי כל כך הרבה נתונים בתחומים אלה הם קטגוריים.

גורמי סיכון לפציעה:השוואת שיעורי הפציעות בין ספורטאים שעושים תרגילי חימום לעומת אלה שאינם עושים זאת. נצפו: 15 פציעות בקרב 80 ספורטאים מחממים, 28 פציעות בקרב 70 ספורטאים שאינם מחממים. צ'י-רבוע בוחן אם ההבדל של 18.75% לעומת 40% הוא משמעותי מבחינה סטטיסטית או יכול להיות עקב סיכוי.

סקרים של יעילות תוספת:האם ספורטאים שנטלו תוסף X (כן/לא) דיווחו על שיפור ביצועים (כן/לא)? עם 200 ספורטאים בטבלה 2x2, chi-square קובע במהירות אם כל קשר שנצפה עולה על מה שהסיכוי לבדו היה מייצר.

תוצאות בדיקת הסמים:ניתוח אם שיעורי הבדיקות החיוביות שונים בין ספורט או רמות תחרות. כל ספורט / רמה הופכת לעמודה; חיובי / שלילי הופך למשתנה השורה.

בדיקה רפואית:האם בדיקת אבחון חדשה חיובית או שלילית מתייחסת למצב המחלה האמיתי (הסטנדרט הזהב אושר)? זה נותן רגישות וספציפיות, ו-chi-square מאשרת שהבדיקה מתפקדת טוב יותר מאשר מקריות.

ניתוח תשובות הסקר:האם גברים ונשים מגיבים בצורה שונה לשאלת סקר קטגורית (סכים/לא מסכים/ניטרלי)?

בכל המקרים האלה, צ'י בריבוע הוא הבחירה הנכונה כי הנתונים הם תדירות של תוצאות קטגוריות, לא מדידות מתמשכות. זה המבחן הסטטיסטי ששואל: "בהתחשב בהשערה אפסית שלנו שהמשתנים האלה לא קשורים, כמה מפתיעים הנתונים שלנו?"

שאלות נפוצות

בשביל מה משתמשים במבחן צ'י-רבועי?

בדיקת ה-chi-square משמשת כדי לקבוע אם ישקשר משמעותי בין שני משתנים קטגוריים(בדיקת עצמאות) או אם ספירת הקטגוריות שנצפתה תואמת את הספירה הצפויה (בדיקת התאימות). זה עובד עם נתוני תדירות -- ספירת כמה פריטים נופלים לכל קטגוריה -- לא מדידות מתמשכות.

איזה p-ערך הוא משמעותי במבחן chi-square?

הסף המקובל הוא:p < 0.05(95% ביטחון). אם ערך ה-p שלך נמוך מ- 0.05, אתה דוחה את ההשערה האפס של עצמאות ומסיק כי המשתנים קשורים באופן משמעותי. עבור קריטריונים קפדניים יותר, השתמש ב- p < 0.01 או p < 0.001. תמיד דווח על ערך ה-p המדויק במקום רק לומר "משמעותי" או "לא משמעותי".

מה הן דרגות החופש במבחן צ'י-רבוע?

עבור טבלת חירום:df = (מספר השורות - 1) x (מספר העמודות - 1). עבור טבלה 2x2: df = 1. עבור טבלה 3x4: df = (3-1) ((4-1) = 6. עבור בדיקת טובת התאמה: df = מספר קטגוריות - 1. מעלות החופש קובעות איזה חלוקה chi-square להשתמש כדי למצוא את p-ערך.

מה אם תדר הסלולרי הצפוי שלי הוא פחות מ 5?

אם כל תדר תא צפוי הואפחות מ-5אפשרויות: (1) להשתמש במבחן המדויק של פישר, אשר נותן p-ערכים מדויקים עבור דגימות קטנות; (2) לשלב קטגוריות אם זה הגיוני; (3) ליישם תיקון המשכיות של יאטס (מחלוקת אבל לפעמים משמש). עבור טבלאות 2x2 עם סך N < 20, מבחן מדויק של פישר מועדף מאוד.

האם כיכר-צ'י יכולה לומר לי את עוצמת הקשר?

חשיבות צ'י ריבועי לבדה עושהלא מציין את גודל ההשפעהעם מדגם גדול מספיק, אפילו מערכת יחסים חלשה טריוויאלית הופכת משמעותית מבחינה סטטיסטית.פי (φ)עבור שולחנות 2x2 אוה-V של קרמרעבור טבלאות גדולות יותר כדי למדוד את גודל ההשפעה. ערכים קרובים ל- 0.1 הם קטנים, קרובים ל- 0.3 הם בינוניים, וקרוב ל- 0.5 הם השפעות גדולות.

},{"@type":"שאלה","שם":"איזה ערך p הוא משמעותי במבחן chi-square?","שובה מקובלת":{"@type":"שובה","טקסט":"הגבול הקונבנציונלי הוא p < 0.05 (95% בטחון). אם ערך p שלך הוא מתחת ל- 0.05, אתה דוחה את ההשערה אפסית ומגיע למסקנה שהמשתנים קשורים באופן משמעותי. עבור קריטריונים קפדניים יותר, השתמש p < 0.01 או p < 0.001."}},{"@type":"שאלה","שם":"מה הן דרגות החופש במבחן chi-square?","שובה מקובלת":{"@type":"שובה","טקסט":"בשביל טבלת אקריות: df = (שורות - 1) x (עמודות - 1) עבור טבלה 2x2 df = 1. עבור בדיקת איכות התאמה: df = מספר קטגוריות - 1. "}},{"@type":"שאלה","שם":"מה אם תדרי התא הצפויים שלי הם פחות מ 5?","שובה מקובלת":{"@type":"שובה","טקסט":"אם תדרי התא הצפויים שלי הם פחות מ 5, השתמש ב- Fisher's Exact Test במקום ב- chi-square. אתה יכול גם לשלב קטגוריות או להחיל תיקון המשכיות של Yates. עבור סך N < 20, Fisher's Exact Test מועדף מאוד. "}},{"@type":"שאלה","שם":"Can chi-square tell me the strength of an association?","acceptedAnswer":{"@type":"Answer","text:"Chi-square alone does not indicate effect size. השתמש ב- Phi (φ) עבור טבלאות 2x2 או ב- Cérram's V עבור טבלאות גדולות יותר. ערכים קרובים ל- 0.1 הם השפעות קטנות, 0.3 בינוניות ו- 0.5 השפעות גדולות.