מחשבון צ'י-רבוע
לחשב את הסטטיסטיקה של chi-square, p-value, ודרגות החופש עבור טבלת תנאי 2x2. לבדוק באופן מיידי את העצמאות בין שני משתנים קטגוריים. כלי סטטיסטיקה חינם.
מהו מבחן צ'י-רבוע?
בדיקת צ'י בריבוע (χ2) היא אחת הבדיקות הסטטיסטיות הנפוצות ביותר לניתוח נתונים קטגוריים. היא עונה על שאלה בסיסית:האם שני משתנים קטגוריים הם עצמאיים, או שיש קשר אמיתי ביניהם?שלא כמו בדיקות לנתונים מספריים (כמו בדיקות t), chi-square עובד עם ספירות -- כמה פריטים נופלים לכל קטגוריה.
דוגמאות קלאסיות ליישומים של chi-square:
- האם מצב העישון (מעשן/לא מעשן) קשור למחלת ריאות (כן/לא)?
- האם יש קשר בין תדירות האימונים (נמוכה/גבוהה) לבין שיעור הפציעות (כן/לא)?
- האם המין משפיע על העדפת המוצר (מוצר A/מוצר B)?
- האם הקובייה הוגנת? (האם כל פנים מופיעה בערך 1/6 מהזמן?)
הבדיקה עובדת על ידי השוואהתדירות שנצפו(מה שבאמת ספרת) עדתדירות צפויה(מה שהיית מצפה לו אם שני המשתנים היו עצמאיים לחלוטין) אם המספרים שנצפו סוטים מספיק מהצפוי, אתה דוחה את ההשערה של עצמאות ומגיע למסקנה שהמשתנים קשורים.
עבור טבלה 2x2 (שתי קטגוריות לכל אחת משני משתנים), למבחן יש 1 מידה של חופש. הסטטיסטית chi-square שהתקבלה משווה לערך קריטי או מומרת לערך p כדי לקבוע משמעות סטטיסטית.
נוסחת ה-Chi-Square לשולחן 2x2
בהתחשב בשולחן חירום 2x2 עם ספירות A, B, C, D:
| קטגוריה 1 | קטגוריה 2 | סך כל השורות | |
|---|---|---|---|
| קבוצה 1 | A | B | א + ב |
| קבוצה 2 | C | D | C + D |
| סך הכל | A + C | ב + ד | N = A + B + C + D |
צעד 1 -- לחשב תדירות צפויה:
E_A = (A+B) ((A+C) /N E_B = (A+B) ((B+D) /N
E_C = (C+D) ((A+C) /N E_D = (C+D) ((B+D) /N
שלב 2 -- לחשב chi בריבוע:
χ2 = Σ [(O - E) 2 / E]
= (A-E_A) /E_A + (B-E_B) /E_B + (C-E_C) /E_C + (D-E_D) /E_D
או באופן שווה ערך עבור טבלה 2x2, הנוסחה הקצרה:
χ2 = N ((AD - BC) 2 / [ ((A+B) ((C+D) ((A+C) ((B+D)) ]
שלב 3 - דרגות חופש:עבור טבלה 2x2: df = (שורות - 1) x (cols - 1) = 1 x 1 = 1
צעד 4 -- למצוא p-ערך:השוואה של χ2 עם ההפצה של chi-square עם df = 1. עם ביטחון של 95% (α = 0.05), הערך הקריטי הוא 3.841. אם χ2 > 3.841, התוצאה משמעותית מבחינה סטטיסטית - אתה דוחה את העצמאות.
דוגמא מעובדת:A = 50 (רצים שהתאמנו בתדירות גבוהה, ללא פציעה), B = 30 (תדירות גבוהה, פציעה), C = 20 (תדירות נמוכה, ללא פציעה), D = 40 (תדירות נמוכה, פציעה). N = 140.
- χ2 = 140 x (50x40 - 30x20) 2 / [(80) ((60) ((70))) = 140 x (2000-600) 2 / 23,520,000
- = 140 כפול 1,960,000 / 23,520,000 = 11.67
- ערך p ~ 0.00064 -- משמעותי מאוד. תדירות האימון והנזק אינם עצמאיים.
טבלת ערכי הקריטי Chi-Square
ערכי התייחסות לבדיקת חשיבות chi-square ברמת חופש אחת (טבלה 2x2):
| p-ערך | חשיבות | קריטי χ2 (df=1) | פרשנות |
|---|---|---|---|
| 0.10 | ביטחון של 90% | 2.706 | מגמה מרמזת |
| 0.05 | 95% ביטחון | 3.841 | משמעותית מבחינה סטטיסטית. |
| 0.01 | ביטחון של 99% | 6.635 | משמעותי מאוד. |
| . 001 | 99.9% ביטחון | 10.828 | מאוד מאוד משמעותי. |
עבור טבלאות חירום גדולות יותר, רמות החופש גדלות. עבור טבלאות 2x3: df = (2-1) ((3-1) = 2. עבור טבלאות 3x3: df = 4. הערך הקריטי גדל עם רמות החופש, כך שטבלאות גדולות יותר דורשות ערכים chi-square גבוהים יותר כדי להשיג משמעות.
| גודל השולחן | df | קריטי χ2 (p = 0.05) | קריטי χ2 (p = 0.01) |
|---|---|---|---|
| 2 על 2 | 1 | 3.841 | 6.635 |
| 2x3 או 3x2 | 2 | 5.991 | 9.210 |
| שלוש על שלוש. | 4 | 9.488 | 13.277 |
| 4x4 | 9 | 16.919 | 21.666 |
הנחות וכאשר צ'י-רבוע תקף
בדיקת ה-chi-square כוללת כמה הנחות חשובות שיש לעמוד בהן כדי לקבל תוצאות תקפות:
- עצמאות של תצפיות:כל אדם או פריט צריך להופיע רק בתא אחד. אם אותם אנשים נמדדים פעמיים (לפני / לאחר), השתמש בבדיקה של מקנמר במקום.
- תדירות צפויה מספקת:כל תדרי התא הצפויים צריכים להיות >= 5. אם לכל תא הצפוי יש פחות מ 5, chi-square עשוי להיות לא אמין. השתמש ב- Fisher's Exact Test במקום זאת עבור דגימות קטנות.
- דגימה אקראית:הנתונים צריכים לבוא ממבחן אקראי או מייצג, לא מדגם נוחות של מתנדבים שעשויים להיות שונים באופן שיטתי מהאוכלוסייה.
- נתונים קטגוריים בלבד:צ'י-רבוע הוא עבור ספירות/קטגוריות. אל תשתמשו בו עבור נתונים מספריים מתמשכים - השתמשו במקום זאת בקורלציה, בדיקות t או ANOVA.
תיקון המשכיות של יאטס:עבור טבלאות 2x2 עם דוגמאות קטנות (n < 40 או כל תדירות צפויה < 10), תיקון יאטס מוריד 0.5 מכל אחד מ-O-E-E לפני הריבוע, ומפחית את הערך של chi-square. תיקון זה שנוי במחלוקת - כמה סטטיסטיקאים ממליצים על מבחן פישר המדויק במקום. המחשב שלנו מראה את הערכים הלא מתוקנים ואת הערכים המתוקנים של יאטס.
מבחן פישר המדויק:עבור טבלאות 2x2 עם דגימות קטנות מאוד (סך N < 20, או כל תא צפוי < 5), מבחן פישר המדויק מחשב את ההסתברות המדויקת של התצפית על ספירת התאים הניתנת, מבלי להסתמך על ההערכה chi-square. זהו הסטנדרט הזהב לדגימות קטנות ברפואה ובביולוגיה.
גודל ההשפעה: פי (φ) ו-V של קרמר
תוצאה של chi-square משמעותית מבחינה סטטיסטית אומרת לכם שיש קשר אמיתי -- אבל לא כמה חזק הוא. דגימה גדולה מאוד יכולה לגרום אפילו לקשר קטן, כמעט חסר משמעות, להיות משמעותי מבחינה סטטיסטית. מדידות גודל ההשפעה ממדידות את עוצמת הקשר ללא קשר לגודל הדגימה.
| אמצעי | נוסחה | טווח | מתי להשתמש |
|---|---|---|---|
| פי (φ) | √(χ2/N) | 0 עד 1 | רק שולחנות 2x2 |
| ה-V של קרמר | √(χ2/(Nxmin(r-1,c-1))) | 0 עד 1 | כל גודל שולחן |
הנחיות לפרשנות (קוהן, 1988):
- השפעה קטנה:φ או V = 0.1 - הקשר קיים אך חלש; ההשפעה המעשית עשויה להיות מינימלית
- השפעה בינונית:φ או V = 0.3 - קשר מתון, ראוי לתשומת לב במחקר יישומי
- השפעה גדולה:φ או V = 0.5 - קשר חזק, נראה בבירור בתצוגת הנתונים
דוגמה: בדוגמת תדירות האימונים / הפציעה שלנו (χ2 = 11.67, N = 140), phi = √(11.67/140) = √0.0834 = 0.29 - גודל אפקט בינוני. הקשר אמיתי וחזק בינוני, לא רק חפץ סטטיסטי של דגימה גדולה.
בדיקת כושר ההתאמה
מעבר לבדיקת עצמאות בין שני משתנים, chi-square משמש גם לבדיקת אם חלוקה של ספירות תצפית תואמת חלוקה צפויה (תיאורטית).בדיקת איכות ההתאמה.
יישומים קלאסיים:
- בדיקת הוגנות:תזרוק את הקובייה 60 פעמים, אתה מצפה שכל צד יהיה 10 פעמים, האם התקרבת מספיק כדי לטעון שהקובייה הוגנת?
- יחסים גנטיים:ניסויי האפונה של מנדל בדקו אם יחסי הצאצאים שנצפו (למשל, 3: 1 דומיננטי: רסיסיבי) תואמים את היחס הגנטי הצפוי.
- חלוקת ימי הולדת:האם הלידות מפוזרות באופן שווה בכל ימי השבוע, או שיש ימים מסוימים שכיחים יותר (בגלל ניתוחי קיסרית וניתוחי אינדוקציה)?
- נתח שוק:האם הפצת הרכישה של מוצר מתאימה למספר האחוזים הצפויים של נתח השוק?
נוסחה: χ2 = Σ[(O_i - E_i) 2 / E_i] עבור כל קטגוריה i. דרגות חופש = מספר קטגוריות - 1 (מינוס כל פרמטרים מוערכים נוספים). הבדיקה עוקבת אחר אותו חלוקת chi-square כמו בדיקת העצמאות.
יישומים בעולם האמיתי במחקר ספורט ובריאות
בדיקות צ'י-רבוע הן סוס עבודה במדעי הספורט ובמחקר האפידמיולוגי כי כל כך הרבה נתונים בתחומים אלה הם קטגוריים.
גורמי סיכון לפציעה:השוואת שיעורי הפציעות בין ספורטאים שעושים תרגילי חימום לעומת אלה שאינם עושים זאת. נצפו: 15 פציעות בקרב 80 ספורטאים מחממים, 28 פציעות בקרב 70 ספורטאים שאינם מחממים. צ'י-רבוע בוחן אם ההבדל של 18.75% לעומת 40% הוא משמעותי מבחינה סטטיסטית או יכול להיות עקב סיכוי.
סקרים של יעילות תוספת:האם ספורטאים שנטלו תוסף X (כן/לא) דיווחו על שיפור ביצועים (כן/לא)? עם 200 ספורטאים בטבלה 2x2, chi-square קובע במהירות אם כל קשר שנצפה עולה על מה שהסיכוי לבדו היה מייצר.
תוצאות בדיקת הסמים:ניתוח אם שיעורי הבדיקות החיוביות שונים בין ספורט או רמות תחרות. כל ספורט / רמה הופכת לעמודה; חיובי / שלילי הופך למשתנה השורה.
בדיקה רפואית:האם בדיקת אבחון חדשה חיובית או שלילית מתייחסת למצב המחלה האמיתי (הסטנדרט הזהב אושר)? זה נותן רגישות וספציפיות, ו-chi-square מאשרת שהבדיקה מתפקדת טוב יותר מאשר מקריות.
ניתוח תשובות הסקר:האם גברים ונשים מגיבים בצורה שונה לשאלת סקר קטגורית (סכים/לא מסכים/ניטרלי)?
בכל המקרים האלה, צ'י בריבוע הוא הבחירה הנכונה כי הנתונים הם תדירות של תוצאות קטגוריות, לא מדידות מתמשכות. זה המבחן הסטטיסטי ששואל: "בהתחשב בהשערה אפסית שלנו שהמשתנים האלה לא קשורים, כמה מפתיעים הנתונים שלנו?"
שאלות נפוצות
בשביל מה משתמשים במבחן צ'י-רבועי?
בדיקת ה-chi-square משמשת כדי לקבוע אם ישקשר משמעותי בין שני משתנים קטגוריים(בדיקת עצמאות) או אם ספירת הקטגוריות שנצפתה תואמת את הספירה הצפויה (בדיקת התאימות). זה עובד עם נתוני תדירות -- ספירת כמה פריטים נופלים לכל קטגוריה -- לא מדידות מתמשכות.
איזה p-ערך הוא משמעותי במבחן chi-square?
הסף המקובל הוא:p < 0.05(95% ביטחון). אם ערך ה-p שלך נמוך מ- 0.05, אתה דוחה את ההשערה האפס של עצמאות ומסיק כי המשתנים קשורים באופן משמעותי. עבור קריטריונים קפדניים יותר, השתמש ב- p < 0.01 או p < 0.001. תמיד דווח על ערך ה-p המדויק במקום רק לומר "משמעותי" או "לא משמעותי".
מה הן דרגות החופש במבחן צ'י-רבוע?
עבור טבלת חירום:df = (מספר השורות - 1) x (מספר העמודות - 1). עבור טבלה 2x2: df = 1. עבור טבלה 3x4: df = (3-1) ((4-1) = 6. עבור בדיקת טובת התאמה: df = מספר קטגוריות - 1. מעלות החופש קובעות איזה חלוקה chi-square להשתמש כדי למצוא את p-ערך.
מה אם תדר הסלולרי הצפוי שלי הוא פחות מ 5?
אם כל תדר תא צפוי הואפחות מ-5אפשרויות: (1) להשתמש במבחן המדויק של פישר, אשר נותן p-ערכים מדויקים עבור דגימות קטנות; (2) לשלב קטגוריות אם זה הגיוני; (3) ליישם תיקון המשכיות של יאטס (מחלוקת אבל לפעמים משמש). עבור טבלאות 2x2 עם סך N < 20, מבחן מדויק של פישר מועדף מאוד.
האם כיכר-צ'י יכולה לומר לי את עוצמת הקשר?
חשיבות צ'י ריבועי לבדה עושהלא מציין את גודל ההשפעהעם מדגם גדול מספיק, אפילו מערכת יחסים חלשה טריוויאלית הופכת משמעותית מבחינה סטטיסטית.פי (φ)עבור שולחנות 2x2 אוה-V של קרמרעבור טבלאות גדולות יותר כדי למדוד את גודל ההשפעה. ערכים קרובים ל- 0.1 הם קטנים, קרובים ל- 0.3 הם בינוניים, וקרוב ל- 0.5 הם השפעות גדולות.