Standard Deviation Calculator
Calculate standard deviation, variance, mean, and more for any data set. Supports both population and sample calculations. Free step-by-step solution.
چه چیزی است معیار انحراف معیار و چرا اهمیت دارد؟
انحراف معیار اندازهگیری میکند که دادهها چگونه پراکندهاند دور از میانگین (میانگین). یک انحراف معیار کوچک نشان میدهد که دادهها در اطراف میانگین تنگ هستند؛ انحراف معیار بزرگ نشان میدهد که دادهها پراکنده هستند.
دو مجموعه داده میتوانند دارای میانگین یکسان باشند اما توزیع کاملاً متفاوت داشته باشند — انحراف معیار این تفاوت را نشان میدهد:
- مجموعه A: {9, 10, 10, 11, 10} — میانگین = 10، انحراف معیار ≈ 0.63 (تنگ)
- مجموعه B: {2, 5, 10, 15, 18} — میانگین = 10، انحراف معیار ≈ 5.83 (پراکندگی زیاد)
هر دو دارای میانگین 10 هستند، اما مجموعه B تقریباً 10 برابر پراکندهتر است. انحراف معیار این تفاوت را نشان میدهد.
انحراف معیار با علامت σ (sigma) برای جمعیت و s برای نمونه نشان داده میشود. این معیار مربع ریشه از واریانس است و در واحدهای اصلی دادهها بیان میشود — بنابراین قابل تفسیر تر از واریانس تنها است.
توسعه و کاربرد آن در hầu همه زمینهها گسترده است: کنترل کیفیت (آیا قطعات تولید شده در محدوده مجاز هستند؟)، مالی (خطر سرمایهگذاری = نوسان بازده)، پزشکی (آیا خوانش یک بیمار در 2 SD از نرمال است؟)، آموزش (چطور توزیع نمرات است؟) و تجزیه و تحلیل ورزشی (چطور هماهنگ است عملکرد یک ورزشکار؟).
انحراف معیار جمعیت و نمونه
انتخاب مهمترین انتخاب هنگام محاسبه انحراف معیار این است که آیا با پопولیشن (همه دادههای ممکن) یا نمونه (یک زیر مجموعه) کار میکنید. این تعیین میکند که کدام فرمول را استفاده کنید و بر نتیجه تأثیر میگذارد.
انحراف معیار جمعیت (σ): استفاده کنید اگر دادههای کل گروهی که در حال مطالعه هستید را دارید. فرمول: σ = √[Σ(xᵢ − μ)² / N]
जह: μ = میانگین جمعیت، N = تعداد مقادیر، Σ = مجموع همه مقادیر.
انحراف معیار نمونه (s): استفاده کنید اگر دادههای شما یک نمونه از یک جمعیت بزرگتر هستند. فرمول: s = √[Σ(xᵢ − x̄)² / (n−1)]
जह: x̄ = میانگین نمونه، n = تعداد مقادیر در نمونه، (n−1) = اصلاحیه بسل.
اصلاحیه بسل تقسیم را بر (n−1) انجام میدهد نه n زیرا نمونهها معمولاً واریانس واقعی جمعیت را تحت估یم میکنند — به ویژه برای نمونههای کوچک. استفاده از (n−1) یک استیماتور بیطرفانه از واریانس جمعیت را فراهم میکند.
که کدام یک را استفاده کنید؟
- انحراف معیار جمعیت: شما دادههای همه دانشآموزان در یک کلاس خاص را دارید؛ همه نمرات یک آزمون خاص را دارید؛ همه کارمندان یک شرکت خاص را دارید.
- انحراف معیار نمونه: شما 500 آمریکایی را مورد بررسی قرار دادهاید (به همه آمریکاییها اشاره دارد); شما 30 قطعه از یک تولید را اندازهگیری کردهاید (به همه قطعات اشاره دارد); هر مطالعه علمی با نمونهای.
مرحله به مرحله محاسبه انحراف معیار
به یک مثال واقعی با اعداد واقعی کار میکنیم:
مجموعه داده: نمرات 6 دانشآموز: {72, 85, 91, 68, 79, 88}
مرحله 1 — میانگین را پیدا کنید: (72 + 85 + 91 + 68 + 79 + 88) / 6 = 483 / 6 = 80.5
مرحله 2 — هر انحراف از میانگین را پیدا کنید و آن را مربع کنید:
| نمره (xᵢ) | انحراف (xᵢ − x̄) | مربع شده (xᵢ − x̄)² |
|---|---|---|
| 72 | 72 − 80.5 = −8.5 | 72.25 |
| 85 | 85 − 80.5 = +4.5 | 20.25 |
| 91 | 91 − 80.5 = +10.5 | 110.25 |
| 68 | 68 − 80.5 = −12.5 | 156.25 |
| 79 | 79 − 80.5 = −1.5 | 2.25 |
| 88 | 88 − 80.5 = +7.5 | 56.25 |
| مجموع | 0 (همیشه) | 417.50 |
مرحله 3 — واریانس را محاسبه کنید: واریانس نمونه (n−1) = 417.50 / 5 = 83.50
مرحله 4 — ریشه مربع برای انحراف معیار: s = √83.50 ≈ 9.14
تفسیر: اکثر نمرات در حدود 9.14 نقطه از میانگین 80.5 قرار دارند. تقریباً 68٪ از نمرات انتظار میرود بین 71.4 و 89.6 (میانگین ± 1 SD) اگر این یک جمعیت نرمال بود.
قاعده تجربی و توزیع نرمال
برای دادههایی که توزیع نرمال (شکل مثل یک بیضه) دارند، قاعده تجربی (68-95-99.7) به شما میگوید که دقیقاً چندین مقدار در هر بازه استانداردی قرار میگیرند:
| رنج | درصد داده | نمونه (میانگین=100، SD=15) |
|---|---|---|
| میانگین ± 1 SD | ~68.27% | 85 تا 115 |
| میانگین ± 2 SD | ~95.45% | 70 تا 130 |
| میانگین ± 3 SD | ~99.73% | 55 تا 145 |
| بeyond ± 3 SD | ~0.27% | پایین از 55 یا بالاتر از 145 |
تجویز کلاسیک این است که نمرات IQ است: میانگین = 100، SD = 15. یک IQ 130، 2 SD بالاتر از میانگین است — فقط حدود 2.3% از مردم نمرهای این بالا دارند. یک IQ 145، 3 SD بالاتر از میانگین است — حدود 0.13% از مردم (حدود 1 در 750).
در کنترل کیفیت، استاندارد شش سیگما نیاز دارد که فرآیندها کمتر از 3.4 نقص در میلیون فرصت داشته باشند — معادل با نگه داشتن Variation در ±6 استاندارد از هدف، تنها 0.00034% نرخ نقص را باقی میگذارد. این اساس آماری از برنامههای کیفیت شش سیگما تولید است.
همه دادهها توزیع نرمال نیستند. توزیع درآمدها به سمت راست کشیده شده است (فقط چندین درآمد بسیار بالا تاجی را در سمت راست کشیدهاند). در این موارد، میانگین و میانه و فاصله چهارم Quartile ممکن است اطلاعات بیشتری نسبت به میانگین و انحراف معیار بدهند.
سنجههای آماری دیگر: میانگین، میانه، واریانس، و بیشتر
انحراف معیار meaningful-ترین است در کنار سنجههای آماری دیگر. اینجاست که چگونه کار میکنند:
- میانگین (میانگین عددی): مجموع همه مقادیر ÷ تعداد. حساس به اعداد دورافتاده — یک مقدار بسیار زیاد میتواند میانگین را به طور قابل توجهی تغییر دهد.
- میانه: مقدار وسطی وقتی دادهها مرتب شوند. نسبت به میانگین مقاومتر است. برای {1، 2، 3، 4، 100}: میانگین = 22، میانه = 3.
- حالت: مقدار تکرار شوندهترین. مفید برای دادههای طبقهبندی؛ یک مجموعه داده میتواند چندین حالت یا هیچ حالت را داشته باشد.
- رنج: حداکثر − حداقل. ساده اما حساس به اعداد دورافتاده؛ نمیتواند شکل توزیع را توصیف کند.
- واریانس (σ² یا s²): مربع انحراف معیار. مفید ریاضیاتی اما سختتر برای تفسیر است زیرا در واحدهای مربع است. مثال: اگر قدها در سانتیمتر هستند، واریانس در سانتیمتر مربع است — که هیچ معنای فیزیکی ندارد.
- ضریب تغییرات (CV): (انحراف معیار / میانگین) × 100%. اجازه میدهد تا تغییرات را در مجموعههای مختلف با میانگینهای مختلف مقایسه کنید. یک CV 10% به این معنی است که SD 10% از میانگین است — مفید در اقتصاد و زیستشناسی.
- خطای معیار میانگین (SEM): SD ÷ √n. اندازهگیری دقت میانگین نمونه به عنوان یک برآورد از میانگین جمعیت است. با افزایش اندازه نمونه، SEM کاهش مییابد — نمونههای بزرگتر برآوردهای دقیقتری میدهند.
معیار پراکندگی در اقتصاد، علوم و ورزش
معیار پراکندگی دارای تفسیرهای خاص و عملی در زمینههای مختلف است:
اقتصاد — اندازهگیری ریسک: در اقتصاد، پراکندگی بازدهها = نوسان = ریسک. یک سهام که 10 درصد در سال بازده دارد و SD 15 درصد دارد، 68 درصد احتمال دارد که در هر سال بین -5 درصد و +25 درصد بازده داشته باشد. S & P 500 تاریخیاً SD سالانه حدود 15-20 درصد دارد. پرتفوی اوراق قرضه معمولاً SD 3-7 درصد دارد. عملکرد تعدیل شده بر اساس ریسک (نسبت شارپ) = (بازده - نرخ ریسک-آزاد) / SD — بالاتر، بهتر است.
علوم — کنترل کیفیت و اندازهگیری: ابزارهای آزمایشگاهی اندازهگیری را به عنوان میانگین ± SD گزارش میدهند. یک ترمومتری که 37.2 ± 0.3 درجه سانتیگراد را نشان میدهد، به این معنی است که اندازهگیری در 0.3 درجه سانتیگراد از مقدار واقعی با 68 درصد اطمینان است. در آزمایشهای بالینی، معنیداری آماری معمولاً به عنوان اثر درمان که بیش از 2 SD از میانگین گروه کنترل است (p < 0.05) تعریف میشود.
تحلیلهای ورزشی: هماهنگی بازیکنان با SD اندازهگیری میشود. یک بازیکن بسکتبال که 25 امتیاز در هر بازی میانگین میکند و SD 3 دارد، قابل اعتمادتر از کسی است که 25 امتیاز میانگین میکند و SD 10 دارد. پیشبینی هوا از مدلهای انبوه استفاده میکند که SD پیشبینیهای دمای نشاندهنده اطمینان است — SD狹ی نشاندهنده توافق پیشبینیکنندگان است؛ SD گسترده نشاندهنده عدم قطعیت بالا است.
آموزش: نمره Z نشاندهنده تعداد معیارهای استانداردی است که نمره دانشآموز از میانگین کلاس فاصله دارد: Z = (نمره - میانگین) / SD. یک Z-score +2 نشاندهنده نمرهای است که 2 SD بالاتر از میانگین است — بهتر از تقریباً 97.7 درصد از دانشآموزان. آزمونهای استانداردی مانند SAT طراحی شدهاند تا نمرات به طور تقریبی توزیع نرمال داشته باشند، بنابراین مقایسههای درصد را امکانپذیر میکنند.
سوالهای متداول
تفاوت بین انحراف معیار و انحراف معیار مربعی چیست؟
انحراف معیار مربعی میانگین مربعات انحرافات از میانگین است. انحراف معیار ریشه مربع انحراف معیار است. هر دو پراکندگی را اندازهگیری میکنند، اما انحراف معیار در واحدهای دادهها (آسانتر برای تفسیر) است، در حالی که انحراف معیار مربعی در واحدهای مربعی است. یک مجموعه ارتفاع در سانتیمتر انحراف معیار مربعی در سانتیمتر مربع دارد — معنادار نیست. انحراف معیار در سانتیمتر مستقیماً قابل مقایسه با اندازهگیریهای اصلی است.
وقتی باید از انحراف معیار جمعیت یا نمونه استفاده کنم؟
از انحراف معیار جمعیت (σ، تقسیم بر N) استفاده کنید जब دادههای شما برای کل جمعیتی که میخواهید توصیف کنید موجود است — همه دانشآموزان در یک کلاس خاص، همه کارمندان در یک شرکت. از انحراف معیار نمونه (s، تقسیم بر n-1) استفاده کنید اگر دادههای شما زیر مجموعهای از یک جمعیت بزرگتر است و میخواهید انحراف پاپولیشن را تخمین بزنید — نمونهای از نظرسنجی، شرکتکنندگان در یک آزمایش بالینی، نمونههای کنترل کیفیت از یک تولید.
آیا انحراف معیار بالا یا پایین معنی دارد؟
انحراف معیار پایین نشاندهنده این است که دادهها در اطراف میانگین تجمع یافتهاند — هماهنگی، کمبود پراکندگی. انحراف معیار بالا نشاندهنده این است که دادهها پراکنده هستند — پراکندگی زیاد. هیچ کدام از اینها به تنهایی خوب نیستند؛ بستگی به زمینه دارد. در تولید، انحراف معیار پایین مطلوب است (هماهنگی). در بازده سرمایهگذاری، برخی از سرمایهگذاران از انحراف معیار بالاتر برای بازدههای بالقوه بالاتر پذیرا هستند.
چیستی Z-score و چگونه با انحراف معیار ارتباط دارد؟
ز-スコور اندازهگیری میکند که چندین انحراف معیار دادهای از میانگین است: Z = (مقدار - میانگین) / انحراف معیار. یک ز-スコور 0 = دقیقاً میانگین است. Z = +1 = 1 انحراف معیار بالاتر از میانگین (84٪ صدی). Z = -2 = 2 انحراف معیار زیر میانگین (2.3٪ صدی). ز-スコورها اجازه مقایسه مقادیر از مجموعههای داده با مقیاسهای مختلف را میدهند.
چیستی خطای استاندارد و چگونه با انحراف معیار متفاوت است؟
انحراف معیار پراکندگی دادههای فردی را توصیف میکند. خطای استاندارد از میانگین (SEM = انحراف معیار / √n) توصیف میکند که دقت میانگین نمونه به عنوان تخمین میانگین واقعی جمعیت است. با افزایش اندازه نمونه، خطای استاندارد کاهش مییابد (دادههای بیشتر = تخمین دقیقتر)، اما انحراف معیار نمیتواند تغییر کند. خطای استاندارد در محدوده اطمینان استفاده میشود؛ انحراف معیار پراکندگی دادهها را توصیف میکند.
میتوان انحراف معیار منفی را داشت؟
نه. انحراف معیار همیشه صفر یا مثبت است. انحراف معیار فقط در صورت اینکه همه مقادیر داده یکسان باشند صفر است (هیچ پراکندگی وجود ندارد). زیرا به عنوان ریشه مربع مجموع مربعات است، نمیتواند منفی باشد. انحراف معیار یا منفی یا انحراف معیار مربعی نشاندهنده خطای محاسباتی است.
آیا انحراف معیار را چگونه تحت تأثیر قرار میدهد؟
انحرافات میتوانند انحراف معیار را به طور قابل توجهی افزایش دهند زیرا انحرافات به صورت مربعی هستند — انحرافات بزرگ از میانگین به طور غیر пропورسیونال تأثیر میگذارند. برای مثال، در {10، 11، 10، 12، 100}: حذف انحراف (100) انحراف معیار را از ~38 به ~0.9 کاهش میدهد. اگر انحرافات وجود داشته باشد، میانگین و فاصله چهارم و سوم (IQR) معیارهای بیشتر مقاوم برای مرکزیت و پراکندگی هستند.
اگر انحراف معیار صفر باشد، چه معنی دارد؟
انحراف معیار صفر نشاندهنده این است که همه مقادیر در مجموعه داده یکسان هستند — هیچ پراکندگی وجود ندارد. برای مثال، {5، 5، 5، 5، 5} میانگین = 5 و انحراف معیار = 0 را دارد. این در مجموعههای مصنوعی یا بسیار محدودی که دادهها یکسان هستند رخ میدهد. در مجموعههای عملی، انحراف معیار = 0 اغلب نشاندهنده خطای جمعآوری دادهها یا اندازهگیریهای یکسان است.