🔬 Advanced 🔥 Popular

Standard Deviation Calculator

Calculate standard deviation, variance, mean, and more for any data set. Supports both population and sample calculations. Free step-by-step solution.

چه چیزی است معیار انحراف معیار و چرا اهمیت دارد؟

انحراف معیار اندازه‌گیری می‌کند که داده‌ها چگونه پراکنده‌اند دور از میانگین (میانگین). یک انحراف معیار کوچک نشان می‌دهد که داده‌ها در اطراف میانگین تنگ هستند؛ انحراف معیار بزرگ نشان می‌دهد که داده‌ها پراکنده هستند.

دو مجموعه داده می‌توانند دارای میانگین یکسان باشند اما توزیع کاملاً متفاوت داشته باشند — انحراف معیار این تفاوت را نشان می‌دهد:

مجموعه A: {9, 10, 10, 11, 10} — میانگین = 10، انحراف معیار ≈ 0.63 (تنگ)
مجموعه B: {2, 5, 10, 15, 18} — میانگین = 10، انحراف معیار ≈ 5.83 (پراکندگی زیاد)

هر دو دارای میانگین 10 هستند، اما مجموعه B تقریباً 10 برابر پراکنده‌تر است. انحراف معیار این تفاوت را نشان می‌دهد.

انحراف معیار با علامت σ (sigma) برای جمعیت و s برای نمونه نشان داده می‌شود. این معیار مربع ریشه از واریانس است و در واحدهای اصلی داده‌ها بیان می‌شود — بنابراین قابل تفسیر تر از واریانس تنها است.

توسعه و کاربرد آن در hầu همه زمینه‌ها گسترده است: کنترل کیفیت (آیا قطعات تولید شده در محدوده مجاز هستند؟)، مالی (خطر سرمایه‌گذاری = نوسان بازده)، پزشکی (آیا خوانش یک بیمار در 2 SD از نرمال است؟)، آموزش (چطور توزیع نمرات است؟) و تجزیه و تحلیل ورزشی (چطور هماهنگ است عملکرد یک ورزشکار؟).

انحراف معیار جمعیت و نمونه

انتخاب مهم‌ترین انتخاب هنگام محاسبه انحراف معیار این است که آیا با پопولیشن (همه داده‌های ممکن) یا نمونه (یک زیر مجموعه) کار می‌کنید. این تعیین می‌کند که کدام فرمول را استفاده کنید و بر نتیجه تأثیر می‌گذارد.

انحراف معیار جمعیت (σ): استفاده کنید اگر داده‌های کل گروهی که در حال مطالعه هستید را دارید. فرمول: σ = √[Σ(xᵢ − μ)² / N]

जह: μ = میانگین جمعیت، N = تعداد مقادیر، Σ = مجموع همه مقادیر.

انحراف معیار نمونه (s): استفاده کنید اگر داده‌های شما یک نمونه از یک جمعیت بزرگ‌تر هستند. فرمول: s = √[Σ(xᵢ − x̄)² / (n−1)]

जह: x̄ = میانگین نمونه، n = تعداد مقادیر در نمونه، (n−1) = اصلاحیه بسل.

اصلاحیه بسل تقسیم را بر (n−1) انجام می‌دهد نه n زیرا نمونه‌ها معمولاً واریانس واقعی جمعیت را تحت‌估یم می‌کنند — به ویژه برای نمونه‌های کوچک. استفاده از (n−1) یک استیماتور بی‌طرفانه از واریانس جمعیت را فراهم می‌کند.

که کدام یک را استفاده کنید؟

انحراف معیار جمعیت: شما داده‌های همه دانش‌آموزان در یک کلاس خاص را دارید؛ همه نمرات یک آزمون خاص را دارید؛ همه کارمندان یک شرکت خاص را دارید.
انحراف معیار نمونه: شما 500 آمریکایی را مورد بررسی قرار داده‌اید (به همه آمریکایی‌ها اشاره دارد); شما 30 قطعه از یک تولید را اندازه‌گیری کرده‌اید (به همه قطعات اشاره دارد); هر مطالعه علمی با نمونه‌ای.

مرحله به مرحله محاسبه انحراف معیار

به یک مثال واقعی با اعداد واقعی کار می‌کنیم:

مجموعه داده: نمرات 6 دانش‌آموز: {72, 85, 91, 68, 79, 88}

مرحله 1 — میانگین را پیدا کنید: (72 + 85 + 91 + 68 + 79 + 88) / 6 = 483 / 6 = 80.5

مرحله 2 — هر انحراف از میانگین را پیدا کنید و آن را مربع کنید:

نمره (xᵢ)	انحراف (xᵢ − x̄)	مربع شده (xᵢ − x̄)²
72	72 − 80.5 = −8.5	72.25
85	85 − 80.5 = +4.5	20.25
91	91 − 80.5 = +10.5	110.25
68	68 − 80.5 = −12.5	156.25
79	79 − 80.5 = −1.5	2.25
88	88 − 80.5 = +7.5	56.25
مجموع	0 (همیشه)	417.50

مرحله 3 — واریانس را محاسبه کنید: واریانس نمونه (n−1) = 417.50 / 5 = 83.50

مرحله 4 — ریشه مربع برای انحراف معیار: s = √83.50 ≈ 9.14

تفسیر: اکثر نمرات در حدود 9.14 نقطه از میانگین 80.5 قرار دارند. تقریباً 68٪ از نمرات انتظار می‌رود بین 71.4 و 89.6 (میانگین ± 1 SD) اگر این یک جمعیت نرمال بود.

قاعده تجربی و توزیع نرمال

برای داده‌هایی که توزیع نرمال (شکل مثل یک بیضه) دارند، قاعده تجربی (68-95-99.7) به شما می‌گوید که دقیقاً چندین مقدار در هر بازه استانداردی قرار می‌گیرند:

رنج	درصد داده	نمونه (میانگین=100، SD=15)
میانگین ± 1 SD	~68.27%	85 تا 115
میانگین ± 2 SD	~95.45%	70 تا 130
میانگین ± 3 SD	~99.73%	55 تا 145
بeyond ± 3 SD	~0.27%	پایین از 55 یا بالاتر از 145

تجویز کلاسیک این است که نمرات IQ است: میانگین = 100، SD = 15. یک IQ 130، 2 SD بالاتر از میانگین است — فقط حدود 2.3% از مردم نمره‌ای این بالا دارند. یک IQ 145، 3 SD بالاتر از میانگین است — حدود 0.13% از مردم (حدود 1 در 750).

در کنترل کیفیت، استاندارد شش سیگما نیاز دارد که فرآیندها کمتر از 3.4 نقص در میلیون فرصت داشته باشند — معادل با نگه داشتن Variation در ±6 استاندارد از هدف، تنها 0.00034% نرخ نقص را باقی می‌گذارد. این اساس آماری از برنامه‌های کیفیت شش سیگما تولید است.

همه داده‌ها توزیع نرمال نیستند. توزیع درآمد‌ها به سمت راست کشیده شده است (فقط چندین درآمد بسیار بالا تاجی را در سمت راست کشیده‌اند). در این موارد، میانگین و میانه و فاصله چهارم Quartile ممکن است اطلاعات بیشتری نسبت به میانگین و انحراف معیار بدهند.

سنجه‌های آماری دیگر: میانگین، میانه، واریانس، و بیشتر

انحراف معیار meaningful-ترین است در کنار سنجه‌های آماری دیگر. اینجاست که چگونه کار می‌کنند:

میانگین (میانگین عددی): مجموع همه مقادیر ÷ تعداد. حساس به اعداد دورافتاده — یک مقدار بسیار زیاد می‌تواند میانگین را به طور قابل توجهی تغییر دهد.
میانه: مقدار وسطی وقتی داده‌ها مرتب شوند. نسبت به میانگین مقاوم‌تر است. برای {1، 2، 3، 4، 100}: میانگین = 22، میانه = 3.
حالت: مقدار تکرار شونده‌ترین. مفید برای داده‌های طبقه‌بندی؛ یک مجموعه داده می‌تواند چندین حالت یا هیچ حالت را داشته باشد.
رنج: حداکثر − حداقل. ساده اما حساس به اعداد دورافتاده؛ نمی‌تواند شکل توزیع را توصیف کند.
واریانس (σ² یا s²): مربع انحراف معیار. مفید ریاضیاتی اما سخت‌تر برای تفسیر است زیرا در واحدهای مربع است. مثال: اگر قد‌ها در سانتی‌متر هستند، واریانس در سانتی‌متر مربع است — که هیچ معنای فیزیکی ندارد.
ضریب تغییرات (CV): (انحراف معیار / میانگین) × 100%. اجازه می‌دهد تا تغییرات را در مجموعه‌های مختلف با میانگین‌های مختلف مقایسه کنید. یک CV 10% به این معنی است که SD 10% از میانگین است — مفید در اقتصاد و زیست‌شناسی.
خطای معیار میانگین (SEM): SD ÷ √n. اندازه‌گیری دقت میانگین نمونه به عنوان یک برآورد از میانگین جمعیت است. با افزایش اندازه نمونه، SEM کاهش می‌یابد — نمونه‌های بزرگ‌تر برآورد‌های دقیق‌تری می‌دهند.

معیار پراکندگی در اقتصاد، علوم و ورزش

معیار پراکندگی دارای تفسیرهای خاص و عملی در زمینه‌های مختلف است:

اقتصاد — اندازه‌گیری ریسک: در اقتصاد، پراکندگی بازده‌ها = نوسان = ریسک. یک سهام که 10 درصد در سال بازده دارد و SD 15 درصد دارد، 68 درصد احتمال دارد که در هر سال بین -5 درصد و +25 درصد بازده داشته باشد. S & P 500 تاریخیاً SD سالانه حدود 15-20 درصد دارد. پرتفوی اوراق قرضه معمولاً SD 3-7 درصد دارد. عملکرد تعدیل شده بر اساس ریسک (نسبت شارپ) = (بازده - نرخ ریسک-آزاد) / SD — بالاتر، بهتر است.

علوم — کنترل کیفیت و اندازه‌گیری: ابزارهای آزمایشگاهی اندازه‌گیری را به عنوان میانگین ± SD گزارش می‌دهند. یک ترمومتری که 37.2 ± 0.3 درجه سانتیگراد را نشان می‌دهد، به این معنی است که اندازه‌گیری در 0.3 درجه سانتیگراد از مقدار واقعی با 68 درصد اطمینان است. در آزمایش‌های بالینی، معنی‌داری آماری معمولاً به عنوان اثر درمان که بیش از 2 SD از میانگین گروه کنترل است (p < 0.05) تعریف می‌شود.

تحلیل‌های ورزشی: هماهنگی بازیکنان با SD اندازه‌گیری می‌شود. یک بازیکن بسکتبال که 25 امتیاز در هر بازی میانگین می‌کند و SD 3 دارد، قابل اعتمادتر از کسی است که 25 امتیاز میانگین می‌کند و SD 10 دارد. پیش‌بینی هوا از مدل‌های انبوه استفاده می‌کند که SD پیش‌بینی‌های دمای نشان‌دهنده اطمینان است — SD狹ی نشان‌دهنده توافق پیش‌بینی‌کنندگان است؛ SD گسترده نشان‌دهنده عدم قطعیت بالا است.

آموزش: نمره Z نشان‌دهنده تعداد معیارهای استانداردی است که نمره دانش‌آموز از میانگین کلاس فاصله دارد: Z = (نمره - میانگین) / SD. یک Z-score +2 نشان‌دهنده نمره‌ای است که 2 SD بالاتر از میانگین است — بهتر از تقریباً 97.7 درصد از دانش‌آموزان. آزمون‌های استانداردی مانند SAT طراحی شده‌اند تا نمرات به طور تقریبی توزیع نرمال داشته باشند، بنابراین مقایسه‌های درصد را امکان‌پذیر می‌کنند.

سوال‌های متداول

تفاوت بین انحراف معیار و انحراف معیار مربعی چیست؟

انحراف معیار مربعی میانگین مربعات انحرافات از میانگین است. انحراف معیار ریشه مربع انحراف معیار است. هر دو پراکندگی را اندازه‌گیری می‌کنند، اما انحراف معیار در واحدهای داده‌ها (آسان‌تر برای تفسیر) است، در حالی که انحراف معیار مربعی در واحدهای مربعی است. یک مجموعه ارتفاع در سانتی‌متر انحراف معیار مربعی در سانتی‌متر مربع دارد — معنادار نیست. انحراف معیار در سانتی‌متر مستقیماً قابل مقایسه با اندازه‌گیری‌های اصلی است.

وقتی باید از انحراف معیار جمعیت یا نمونه استفاده کنم؟

از انحراف معیار جمعیت (σ، تقسیم بر N) استفاده کنید जब داده‌های شما برای کل جمعیتی که می‌خواهید توصیف کنید موجود است — همه دانش‌آموزان در یک کلاس خاص، همه کارمندان در یک شرکت. از انحراف معیار نمونه (s، تقسیم بر n-1) استفاده کنید اگر داده‌های شما زیر مجموعه‌ای از یک جمعیت بزرگتر است و می‌خواهید انحراف پاپولیشن را تخمین بزنید — نمونه‌ای از نظرسنجی، شرکت‌کنندگان در یک آزمایش بالینی، نمونه‌های کنترل کیفیت از یک تولید.

آیا انحراف معیار بالا یا پایین معنی دارد؟

انحراف معیار پایین نشان‌دهنده این است که داده‌ها در اطراف میانگین تجمع یافته‌اند — هماهنگی، کمبود پراکندگی. انحراف معیار بالا نشان‌دهنده این است که داده‌ها پراکنده هستند — پراکندگی زیاد. هیچ کدام از این‌ها به تنهایی خوب نیستند؛ بستگی به زمینه دارد. در تولید، انحراف معیار پایین مطلوب است (هماهنگی). در بازده سرمایه‌گذاری، برخی از سرمایه‌گذاران از انحراف معیار بالاتر برای بازده‌های بالقوه بالاتر پذیرا هستند.

چیستی Z-score و چگونه با انحراف معیار ارتباط دارد؟

ز-スコور اندازه‌گیری می‌کند که چندین انحراف معیار داده‌ای از میانگین است: Z = (مقدار - میانگین) / انحراف معیار. یک ز-スコور 0 = دقیقاً میانگین است. Z = +1 = 1 انحراف معیار بالاتر از میانگین (84٪ صدی). Z = -2 = 2 انحراف معیار زیر میانگین (2.3٪ صدی). ز-スコورها اجازه مقایسه مقادیر از مجموعه‌های داده با مقیاس‌های مختلف را می‌دهند.

چیستی خطای استاندارد و چگونه با انحراف معیار متفاوت است؟

انحراف معیار پراکندگی داده‌های فردی را توصیف می‌کند. خطای استاندارد از میانگین (SEM = انحراف معیار / √n) توصیف می‌کند که دقت میانگین نمونه به عنوان تخمین میانگین واقعی جمعیت است. با افزایش اندازه نمونه، خطای استاندارد کاهش می‌یابد (داده‌های بیشتر = تخمین دقیق‌تر)، اما انحراف معیار نمی‌تواند تغییر کند. خطای استاندارد در محدوده اطمینان استفاده می‌شود؛ انحراف معیار پراکندگی داده‌ها را توصیف می‌کند.

می‌توان انحراف معیار منفی را داشت؟

نه. انحراف معیار همیشه صفر یا مثبت است. انحراف معیار فقط در صورت اینکه همه مقادیر داده یکسان باشند صفر است (هیچ پراکندگی وجود ندارد). زیرا به عنوان ریشه مربع مجموع مربعات است، نمی‌تواند منفی باشد. انحراف معیار یا منفی یا انحراف معیار مربعی نشان‌دهنده خطای محاسباتی است.

آیا انحراف معیار را چگونه تحت تأثیر قرار می‌دهد؟

انحرافات می‌توانند انحراف معیار را به طور قابل توجهی افزایش دهند زیرا انحرافات به صورت مربعی هستند — انحرافات بزرگ از میانگین به طور غیر пропورسیونال تأثیر می‌گذارند. برای مثال، در {10، 11، 10، 12، 100}: حذف انحراف (100) انحراف معیار را از ~38 به ~0.9 کاهش می‌دهد. اگر انحرافات وجود داشته باشد، میانگین و فاصله چهارم و سوم (IQR) معیارهای بیشتر مقاوم برای مرکزیت و پراکندگی هستند.

اگر انحراف معیار صفر باشد، چه معنی دارد؟

انحراف معیار صفر نشان‌دهنده این است که همه مقادیر در مجموعه داده یکسان هستند — هیچ پراکندگی وجود ندارد. برای مثال، {5، 5، 5، 5، 5} میانگین = 5 و انحراف معیار = 0 را دارد. این در مجموعه‌های مصنوعی یا بسیار محدودی که داده‌ها یکسان هستند رخ می‌دهد. در مجموعه‌های عملی، انحراف معیار = 0 اغلب نشان‌دهنده خطای جمع‌آوری داده‌ها یا اندازه‌گیری‌های یکسان است.