מחשבון שונות – שונות אוכלוסיה ומדגם
חשב שונות וסטיית תקן לסט נתונים. תומך בשונות אוכלוסיה ומדגם. מחשבון סטטיסטיקה חינמי לתוצאות מיידיות.
מהי שונות?
שונות מודדת את הפיזור של סט נתונים – עד כמה הערכים רחוקים מהממוצע. שונות נמוכה פירושה שנקודות הנתונים מתקבצות קרוב לממוצע; שונות גבוהה פירושה שהן פרושות לרוחב.
שונות מחושבת כממוצע של ריבועי ההפרשים מהממוצע:
- שונות אוכלוסיה (σ²): σ² = Σ(xᵢ − μ)² / N
- שונות מדגם (s²): s² = Σ(xᵢ − x̄)² / (N−1)
כאשר xᵢ הוא כל נקודת נתון, μ (או x̄) הוא הממוצע, ו-N הוא מספר הערכים. סטיית התקן היא פשוט שורש ריבועי של השונות – היא נמצאת באותן יחידות כמו הנתונים המקוריים, מה שהופך אותה לניתנת יותר לפירוש.
שונות אוכלוסיה לעומת שונות מדגם
ההבדל המרכזי הוא המכנה – N לעומת (N−1) – הידוע כתיקון בסל:
| סוג | מכנה | השתמש כאשר | סמל |
|---|---|---|---|
| שונות אוכלוסיה | N | יש לך נתונים על כל האוכלוסיה | σ² |
| שונות מדגם | N−1 | יש לך מדגם מאוכלוסיה גדולה יותר | s² |
בפועל, רוב הנתונים בעולם האמיתי הם מדגם. שימוש ב-N−1 (שונות מדגם) מייצר הערכה לא מוטה של שונות האוכלוסיה האמיתית. שימוש ב-N (שונות אוכלוסיה) על מדגם מעריך פחות מדי את השונות האמיתית באופן שיטתי.
דוגמה: בדיקת תרופה חדשה על 50 חולים פירושה שימוש בשונות מדגם (s²). ניתוח כל התלמידים בכיתה פירושו שימוש בשונות אוכלוסיה (σ²).
חישוב שונות שלב אחר שלב
בהינתן סט הנתונים: 4, 7, 13, 2, 8
- חשב את הממוצע: (4+7+13+2+8) ÷ 5 = 34/5 = 6.8
- מצא סטיות מהממוצע: (4−6.8)=−2.8; (7−6.8)=0.2; (13−6.8)=6.2; (2−6.8)=−4.8; (8−6.8)=1.2
- רבע את הסטיות: 7.84; 0.04; 38.44; 23.04; 1.44
- סכום ריבועים: 7.84+0.04+38.44+23.04+1.44 = 70.8
- שונות אוכלוסיה: 70.8 ÷ 5 = 14.16
- שונות מדגם: 70.8 ÷ 4 = 17.7
- סטיית תקן: √14.16 = 3.76 (אוכלוסיה) או √17.7 = 4.21 (מדגם)
יישומים מעשיים של שונות
| תחום | יישום | דוגמה |
|---|---|---|
| פיננסים | סיכון השקעה | שונות גבוהה = תשואות מניה תנודתיות יותר |
| ייצור | בקרת איכות | שונות נמוכה = ממדי מוצר עקביים |
| רפואה | ניסויים קליניים | מדידת שונות בתגובות חולים |
| מדעי ספורט | ניתוח ביצועים | שונות בביצועי ספורטאי לאורך עונה |
| חינוך | ניתוח ציוני מבחן | הבנת פיזור ביצועי תלמידים |
💡 האם ידעת?
- השונות הוצגה על ידי רונלד פישר ב-1918 – אותו מאמר שבו טבע את המונח "variance".
- בפיננסים, שונות היא הבסיס של תיאוריית תיק ההשקעות המודרנית. שונות תיק תלויה לא רק בשונות נכסים בודדים אלא בקורלציות ביניהם.
- מקדם השונות (CV = סטיית תקן / ממוצע × 100%) מאפשר להשוות שונות בין סטי נתונים עם יחידות או קנה מידה שונים.
שאלות נפוצות
מה ההבדל בין שונות לסטיית תקן?
שונות היא ממוצע סטיות ריבועיות מהממוצע; סטיית תקן היא שורשה הריבועי. סטיית תקן נמצאת באותן יחידות כמו הנתונים המקוריים (למשל, דולרים, ק"ג, שניות), מה שהופך אותה לניתנת יותר לפירוש. שונות שימושית בפעולות מתמטיות (שונות של משתנים בלתי תלויים מתווספת ישירות), בעוד סטיית תקן טובה יותר לתיאור פיזור לקהל לא טכני.
מתי להשתמש בשונות מדגם לעומת שונות אוכלוסיה?
השתמש בשונות אוכלוסיה כאשר הנתונים שלך מכילים כל חבר בקבוצה שאתה מנתח (למשל, כל עובדי חברה אחת). השתמש בשונות מדגם כאשר הנתונים שלך הם קבוצת משנה של קבוצה גדולה יותר (למשל, סקר של 500 מצביעים להערכת דעות כל המצביעים). ברוב המחקר וסטטיסטיקה בעולם האמיתי, שונות מדגם מתאימה.
האם שונות יכולה להיות שלילית?
לא. שונות היא תמיד אפס או חיובית כיוון שהיא מחושבת מערכים מרובעים. שונות = 0 רק כאשר כל נקודות הנתונים זהות (ללא פיזור). שונות שלילית בלתי אפשרית מתמטית ומצביעה על שגיאת חישוב.
מהי שונות "גבוהה" או "נמוכה"?
גבוה ונמוך הם יחסיים לקנה המידה ולהקשר של הנתונים. שונות של 10 היא "נמוכה" לגבהי אדם בסנטימטרים אך "גבוהה" לגבהים במטרים. מקדם השונות (SD / ממוצע × 100%) הוא עצמאי קנה מידה ומאפשר השוואה בין סטי נתונים שונים. בבקרת איכות, מפרטים מגדירים טווחי שונות מקובלים לכל מדידה.