🟢 Beginner 🔥 Popular

میانگین، میانگین و محاسبات حالت

برای محاسبه میانگین، میانگین، حالت، محدوده و سایر آمار برای هر مجموعه داده استفاده کنید. از این ماشین حساب ریاضی آنلاین رایگان برای نتایج دقیق و فوری استفاده کنید. بدون ثبت نام.

درک اندازه گیری های گرایش مرکزی

در آمار،اندازه گیری های گرایش مرکزیارزش های منفرد هستند که مرکز یا ارزش معمولی یک مجموعه داده را توصیف می کنند. سه مورد مهم میانگین، میانگین، و حالت هستند-- هر کدام چیزی متفاوت در مورد داده ها به شما می گوید، و هر کدام در موقعیت های مختلف مناسب تر است.

این مجموعه داده ها را در نظر بگیرید: نمرات آزمون {۵۵، ۶۰، ۷۰، ۷۵، ۷۵، ۸۰، ۹۵}. هر اندازه گیری چشم انداز متفاوتی را ارائه می دهد:

اقدام	ارزش	نحوه محاسبه	بهترین برای
میانگین	72.9	(55+60+70+75+75+80+95) / 7	توزیع های متقارن
میانگین (ارزش متوسط)	75	مقدار متوسط داده های مرتب شده	توزیع های منحرف، ارزش های نامناسب
حالت (متداول ترین)	75	بیشترین مقدار تکرار شده	داده های دسته بندی شده، پیدا کردن قله ها
محدوده	40	ماکس - مین = 95 - 55	اندازه گیری پراکندگی

هیچ معیار واحدی به طور جهانی "بهترین" نیست. یک تحلیلگر داده، معیار مناسب را بر اساس شکل توزیع، وجود ارزش های نامناسب، و سوالی که پرسیده می شود انتخاب می کند. درک هر سه - به علاوه محدودیت های آنها - برای سواد آماری اساسی است.

میانگین (میانه ریاضی): چگونه آن را محاسبه کنیم

The میانگین ریاضیمجموع تمام مقادیر تقسیم بر تعداد مقادیر است. این رایج ترین اندازه گیری گرایش مرکزی است و چیزی است که اکثر مردم وقتی می گویند "متوسط" می گویند.

فرمول: میانگین (x̄) = (Σxi) / n

جایی که Σxi مجموع تمام مقادیر است و n شمارش است.

مثال:داده = {3، 7، 8، 5، 12، 4، 9، 6}

جمع: 3 + 7 + 8 + 5 + 12 + 4 + 9 + 6 = 54
شمارش: 8 مقدار
میانگین = 54 / 8 =۶٫۷۵

میانگین حساس بهموارد عجیب و غریب-- ارزش های افراطی میانگین را به سمت خود می کشند. به عنوان مثال، اگر یک مقدار در مجموعه فوق 100 به جای 12 باشد، میانگین به (54 - 12 + 100) / 8 = 142 / 8 = 17.75، دور از ارزش "معمولی" داده های باقی مانده است.

انواع دیگر وسایل برای استفاده های تخصصی:

میانگین هندسی:n√(x1 x x2 x ... x xn) -- برای نرخ رشد، بازده، نسبت استفاده می شود
متوسط هارمونیک:n / (1/x1 + 1/x2 + ... + 1/xn) -- برای سرعت، نرخ، قیمت در هر واحد استفاده می شود
میانگین وزنی:Σ(wixi) / Σwi -- زمانی استفاده می شود که نقاط داده اهمیت متفاوتی دارند (به عنوان مثال، GPA)

میانگین: مقدار متوسط

The میانگینمقدار میانی یک مجموعه داده است که به ترتیب رو به افزایش مرتب شده است. این توزیع را دقیقاً به نصف تقسیم می کند: 50٪ از مقادیر زیر میانگین و 50٪ بالاتر از آن قرار می گیرند.

برای یک عدد جفت از مقادیر:میانگین = مقدار (n+1) /2.

برای یک عدد جفت از مقادیر:میانگین = میانگین n/2 th و (n/2 + 1) th.

مجموعه داده ها	n	دسته بندی شده	میانگین
{4، 1، 9، 2، 6}	5 (نادر)	{1، 2، 4، 6، 9}	4 (ارزش سوم)
{7, 3, 8, 5}	4 (حتی)	{3, 5, 7, 8}	(5+7)/2 = 6
{10،20،30،40}	4 (حتی)	{10،20،30،40}	(20+30)/2 = 25
{1،1،1،1000}	4 (حتی)	{1،1،1،1000}	(1+1)/2 = 1

به آخرین مثال توجه کنید: میانگین {1، 1، 1، 1000} = 250.75، اما میانگین = 1 این به خوبی نشان می دهد که چرامیانگین برای توزیع های منحرف ترجیح داده می شود تا میانگینبا ارزش های نامتعارف -- درآمد متوسط، قیمت مسکن، و مدت زمان بستری در بیمارستان همگی به عنوان میانگین گزارش می شوند زیرا چند مقدار بسیار بالا باعث می شود میانگین نشان دهنده تجربه معمولی نباشد.

حالت: متداول ترین مقدار

The حالتارزشی است که اغلب در مجموعه داده ها ظاهر می شود. یک مجموعه داده می تواند:

بدون حالت:تمام مقادیر به طور مساوی مکرر ظاهر می شوند (به عنوان مثال، {1، 2، 3، 4، 5})
یک حالت (unimodal):یک مقدار بیشتر از بقیه ظاهر می شود (به عنوان مثال، {1، 2، 2، 3، 4} -> mode = 2)
دو حالت (دو حالت):دو مقدار برای متداول ترین (به عنوان مثال، {1، 1، 2، 3، 3} -> حالت = 1 و 3)
حالت های متعدد (متعدد حالت):سه یا چند مقدار برای متداول ترین

این حالت به ویژه برای موارد زیر مفید است:

داده های دسته بندی شده:"مشهورترین سایز کفش چیست؟" (به عنوان مثال سایز 10 برای مردان ایالات متحده)
داده های مجزا:"به طور معمول خانواده ها چند فرزند دارند؟" (اغلب دو فرزند)
شکل توزیع:یک توزیع دو روش (دو قله) نشان می دهد دو زیر جمعیت متمایز در داده های خود را - یک سیگنال بسیار مهم در تجزیه و تحلیل اکتشافی

مجموعه داده ها	حالت	نوع
{1، 2، 3، 4، 5}	هیچکدام	بدون حالت
{2،4،4،6،8}	4	یک مدال
{1، 1، 3، 5}	1 و 5	بیمودال
{a، b، b، c، c، d، d}	ب، ج، د	تریمودال

محدوده و سایر اندازه گیری های گسترش

در حالی که میانگین، میانگین، و حالت مرکز توزیع را توصیف می کنند،اندازه گیری انتشارآنها برای درک یک مجموعه داده به همان اندازه مهم هستند.

اقدام	فرمول	مثال ({2, 4, 4, 6, 8})	حساسیت به ارزش های نامناسب
محدوده	ماکس - من	8-2=6	خیلی حساسه
محدوده بین ربعین (IQR)	Q3 - Q1	7 - 3 = 4	مقاوم
انحراف (σ2)	Σ ((xi - x̄) 2 / n	۳.۴۴	حساس
انحراف استاندارد (σ)	√تفاوت	1،855	حساس
میانگین انحراف مطلق	" ساكسيكسي "	۱.۶	متوسط

برای {2, 4, 4, 6, 8}: میانگین = 4.8، بنابراین انحرافات: (2-4.8) 2=7.84، (4-4.8) 2=0.64، (4-4.8) 2=0.64، (6-4.8) 2=1.44، (8-4.8) 2=10.24 است. انحراف = (7.84+0.64+0.64+1.44+10.24) / 5 = 20.8 / 5 = 4.16. SD = √4.16 ~ 2.04.

انحراف استاندارد اسب کار آماری است - در آزمایش فرضیه ، فواصل اطمینان ، محاسبات توزیع نرمال و کنترل فرآیند ظاهر می شود. انحراف استاندارد پایین تر به این معنی است که داده ها در نزدیکی میانگین خوشه بندی شده اند؛ انحراف استاندارد بالاتر به این معنی است که داده ها بیشتر پراکنده هستند.

چه زمانی باید از حالت میانگین و میانگین استفاده کرد؟

انتخاب اشتباه اندازه گیری گرایش مرکزی می تواند گمراه کننده باشد. این یک راهنمای عملی است:

وضعیت	اقدام توصیه شده	چرا؟
مترادف، هیچ چیز عجیب و غریب	بدجنس	بیشتر از نظر ریاضی قابل استفاده است؛ از تمام داده ها استفاده می کند
توزیع منحرف	میانگین	با ارزش های افراطی کشیده نمی شود
درآمد / قیمت مسکن	میانگین	چند تا ميليونر ميانگين رو به بالا تحريف ميکنن
داده های دسته بندی شده	حالت	میانگین/متوسط برای دسته بندی ها اعمال نمی شود
رایج ترین مقدار	حالت	پاسخ مستقیم به "مشهورترین"
میانگین نمره / GPA	میانگین (با وزن)	تمام نمرات به طور متناسب کمک می کنند.
بازده سهام / نرخ رشد	میانگین هندسی	حساب های ترکیبی
زمان بقا، بستری شدن در بیمارستان	میانگین	به سمت راست به واسطه پرونده های طولانی مدت

مشاهده معروف: "به طور متوسط آمریکایی یک سینه و یک بیضه دارد" نشان می دهد که چرا میانگین می تواند برای توزیع های دوگانه گمراه کننده باشد. در این مورد، حالت (با جنسیت جدا شده) و میانگین توصیف کننده های اطلاعاتی بیشتری نسبت به میانگین کلی است.

نمونه های دنیای واقعی: میانگین، میانگین و حالت در عمل

درک چگونگی کاربرد این مفاهیم در شرایط واقعی، شهود آماری را ایجاد می کند:

درآمد خانوار ایالات متحده (2023):میانگین ~ 105,000 دلار؛ میانگین ~ 74,580 دلار. این شکاف نشان دهنده انحراف درآمد است - تعداد کمی از افراد با درآمد بسیار بالا به طور چشمگیری میانگین را بالا می برند. بحث های سیاسی از درآمد میانگین استفاده می کنند زیرا بهتر است خانواده "معمولی" را نشان دهد.
زمان پایان مسابقه:در یک مسابقه ۱۰ کیلومتری، میانگین زمان پایان ممکن است بالاتر از میانگین باشد زیرا پیاده های آهسته دم راست طولانی را تشکیل می دهند. میانگین پایان دهنده بیشتر نماینده دونده وسط بسته است.
نمرات آزمون کلاس:اگر یک دانش آموز نمره 5/100 و بیست دانش آموز دیگر نمره 75 - 95/100 داشته باشند، میانگین با مقدار خارج شده به پایین کشیده می شود. معلم ممکن است میانگین را برای نشان دادن بهتر عملکرد کلاس گزارش کند.
اندازه کفش:این حالت قابل اجرا ترین آمار است-- خرده فروشان بیشترین موجودی را در اندازه مدال (معمول) ذخیره می کنند.
کنترل کیفیت:در تولید، انحراف استاندارد اندازه گیری محصول توانایی فرآیند را تعیین می کند. SD پایین به معنی تولید سازگار است؛ SD بالا به معنی نرخ نقص بالا است.

سوالات متداول

کدام بهتر است: متوسط یا متوسط؟

هیچ یک از آنها به طور جهانی بهتر نیست - آنها به اهداف مختلف خدمت می کنند. میانگین در برابر نقاط خارج از حد قوی تر است و بهتر "معمولی" را در توزیع های منحرف (درآمد، قیمت مسکن، زمان بقا) نشان می دهد. میانگین از تمام نقاط داده استفاده می کند، از نظر ریاضی برای توزیع های متقارن بهینه است و برای محاسبات آماری بیشتر مانند انحراف استاندارد و آزمایش فرضیه ضروری است. برای یک تصویر کامل از هر دو با هم استفاده کنید.

آیا یک مجموعه داده می تواند بدون حالت باشد؟

بله. اگر تمام مقادیر به طور مساوی مکرر رخ دهند، هیچ حالت (به عنوان مثال، {1، 2، 3، 4، 5} - هر مقدار دقیقا یک بار ظاهر می شود) وجود ندارد. یک مجموعه داده همچنین می تواند چند حالت باشد - دو حالت (دو حالت: {1، 1، 3، 3، 5}) یا سه حالت. در عمل، توزیع دو حالت اغلب دو زیرگروه متمایز را در داده های شما نشان می دهد، که یک الگوی مهم برای بررسی است.

چطور می توانم میانگین یک عدد جفت را پیدا کنم؟

مقادیر را به ترتیب رو به بالا مرتب کنید، سپس میانگین دو عدد میانی را انتخاب کنید. برای {2، 4، 6، 8}: دو مقدار میانی 4 و 6 هستند، بنابراین میدانی = (4+6) / 2 = 5. برای {1، 3، 5، 7، 9، 11}: مقادیر میانی 5 و 7 هستند، بنابراین میدانی = (5+7) / 2 = 6. میدانی لازم نیست یک مقدار در مجموعه داده باشد.

اگر میانگین = میانگین = حالت به چه معناست؟

هنگامی که هر سه اندازه گیری برابر است، توزیع کاملاً متقارن و یک مدال است - منحنی زنگ کلاسیک (توزعه نرمال). این بدان معنی است که هیچ عددی منحرف در داده ها وجود ندارد، و هر سه اندازه گیری به همان اندازه توصیف کننده های معتبر مرکز هستند. در عمل، داده های دنیای واقعی به ندرت به تقارن کامل می رسند، اما هماهنگی نزدیک میانگین و میانگین نشان دهنده تقارن تقریبی است.

رابطه میان میانگین، میانگین و انحراف چیست؟

در یک توزیع شیب راست (شیب مثبت): میانگین > میانگین > حالت. در یک توزیع شیب چپ (شیب منفی): میانگین < میانگین < حالت. در یک توزیع متقارن: میانگین = میانگین ~ حالت. این رابطه یک بررسی بصری سریع را فراهم می کند: میانگین و میانگین را برای تعیین جهت شیب بدون نگاه کردن به نمودار مقایسه کنید.

شما چطور میانگین داده های گروه بندی شده را محاسبه می کنید؟

برای داده های فرکانس گروه بندی شده ، از نقطه میانی هر فاصله کلاس استفاده کنید: میانگین = Σ ((مرکز x فرکانس) / n. مثال: اگر 10 دانش آموز نمره 50 - 60 (مرکز 55) ، 15 نمره 60 - 70 (مرکز 65) و 5 نمره 70 - 80 (مرکز 75) داشته باشند: میانگین = (10x55 + 15x65 + 5x75) / 30 = (550+975+375) / 30 = 1900/30 ~ 63.3.

تفاوت میان میانگین جمعیت و میانگین نمونه چیست؟

میانگین جمعیت (μ، "mu") از هر عضو کل جمعیت محاسبه می شود. میانگین نمونه (x̄، "x-bar") از یک زیر مجموعه (نمونه) که از آن جمعیت گرفته شده است محاسبه می شود. فرمول یکسان است، اما نمادها متفاوت است. در عمل، ما تقریبا همیشه با میانگین نمونه کار می کنیم و از آنها برای برآورد میانگین جمعیت استفاده می کنیم - که خطای نمونه گیری را معرفی می کند و به تکنیک های استنباط آماری نیاز دارد.

چه تاثیری در میانگین و میانگین دارد؟

شاخص های عجیب و غریب به شدت بر میانگین تأثیر می گذارند اما تأثیر کمی بر میانگین دارند. مثال: داده های {1، 2، 3، 4، 5} دارای میانگین = 3 و میانگین = 3 است. اضافه کردن یک شاخص عجیب و غریب {1، 2، 3، 4، 5، 100}: میانگین به 19.2 می رسد اما میانگین فقط به (3 + 4) / 2 = 3.5 تغییر می کند. این استحکام باعث می شود میانگین اندازه گیری ترجیح داده شود هر زمان که شاخص های عجیب و غریب وجود داشته باشد یا مشکوک باشد.

میانگین تراز شده چیست؟

یک میانگین کوتاه (یا میانگین کوتاه) یک درصد ثابت از مقادیر افراطی را قبل از محاسبه میانگین حذف می کند. به عنوان مثال، یک میانگین کوتاه 10٪ در {1، 2، 3، 4، 5، 6، 7، 8، 9، 100}: پایین و بالا 10٪ (تقریبا 1 ارزش هر یک) را حذف می کند، و باقی می ماند {2، 3، 4، 5، 6، 7، 8، 9}؛ میانگین = 5.5. میانگین کوتاه در سیستم های امتیاز دهی (حکمت المپیک، اسکیت بازی) و آمار اقتصادی برای کاهش نفوذ خارجی در حالی که داده های بیشتری از میانگین را حفظ می کند، استفاده می شود.

چگونه می توانم میانگین وزنی را محاسبه کنم؟

میانگین وزنی = Σ ((وزن x ارزش) / Σ ((وزن). مثال: محاسبه GPA: درجه A (4.0) در یک دوره 3 اعتباری، درجه B (3.0) در یک دوره 4 اعتباری، درجه C (2.0) در یک دوره 2 اعتباری: GPA وزنی = (4.0x3 + 3.0x4 + 2.0x2) / (3+4+2) = (12+12+4) / 9 = 28/9 ~ 3.11. بدون وزنه، میانگین ساده خواهد بود (4+3+2) / 3 = 3.0 - فقدان تاثیر سنگین تر از دوره 4 اعتباری.

خلاصه ای از آمار توصیفی: آنچه همیشه به آن نیاز دارید

خلاصه ای کامل از آمارهای توصیفی برای هر مجموعه داده باید شامل همه موارد زیر باشد. این همان چیزی است که شما در یک مقاله علمی، تجزیه و تحلیل کسب و کار یا کار آکادمیک گزارش می دهید:

آمار	نماد	مثال {2,4,4,6,8,10}	تفسیر
شمارش	n	6	چند تا مشاهدات
بدجنس	x̄	5.67	ارزش متوسط
میانگین	M	5.0	مقدار متوسط (پنجاهمین درصد)
حالت	Mo	4	متداول ترین مقدار
محدوده	R	8	گسترش از min تا max
انحراف استاندارد	σ یا s	2.58	انحراف معمولی از میانگین
انحراف	σ²	۶٫۶۷	SD به مربع
حداقل / حداکثر	—	2 / 10	مقادیر افراطی

در کارهای علمی و علمی، همیشه اندازه گیری مرکز و اندازه گیری گسترش را گزارش کنید. گزارش تنها میانگین (یا میانگین) بدون انحراف استاندارد (یا IQR) یک تصویر ناقص از داده های شما را ارائه می دهد. یک کلاس که دانش آموزان میانگین 75٪ را با SD = 5٪ کسب کرده اند بسیار متفاوت از یکی با میانگین = 75٪ اما SD = 25٪ است - اول یک خوشه تنگ از نمرات B است، دوم یک گروه مخلوط وحشیانه از شکست تا نزدیک به کامل است.

پرسنتیل ها، کوارتیل ها و پلاکت های جعبه ای

فراتر از میانگین، میانگین، و حالت، یک خلاصه آماری کامل اغلب شامل تجزیه و تحلیل درصد است. درصد ها به شما می گویند که چه کسری از داده ها زیر یک مقدار داده شده است - ضروری برای درک موقعیت نسبی، شناسایی نقاط خارج و مقایسه در میان جمعیت ها.

میانگین = درصد پنجاهمی:نیمی از داده ها زیر این مقدار هستند
Q1 (ربع اول) = 25 درصد:25% از داده ها زیر Q1 است
Q3 (چهارگانه سوم) = 75 درصد:75% از داده ها زیر Q3 است
IQR (مجموعه بین ربعین) = Q3 - Q1:شامل 50 درصد اطلاعات میانه است
قانون انحراف:نقاط زیر Q1 - 1.5xIQR یا بالاتر از Q3 + 1.5xIQR به عنوان نقاط ناهنجاری در نظر گرفته می شوند.

درصد	معنی	مثال (درجات امتحان، n=100)
دهمین	10درصد نمره پایین تر	نمره 52 -> نمره بهتر از 10 درصد کلاس
بیست و پنجم (Q1)	25درصد نمره پایین تر	نمره 64 -> مرز چهارم پایین
پنجاهمین (متوسط)	50درصد نمره پایین تر	نمره 75 -> وسط توزیع
هفتاد و پنجم (Q3)	75درصد نمره پایین تر	نمره 87 -> مرز ربع بالایی
نهم	90 درصد کمتر از 90 درصد	نمره 93 -> 10 درصد برتر کلاس
نهم و نهم	99درصد نمره پایین تر	نمره 99 -> 1 درصد برتر

نمودار جعبه ای این اطلاعات را تجسم می کند: جعبه Q1 تا Q3 (IQR) را پوشش می دهد ، یک خط میانه را نشان می دهد و "موزه ها" به کوچکترین / بزرگترین مقادیر غیر منحرف گسترش می یابد. نقاط منحرف فردی به عنوان نقاط ترسیم می شوند. نمودار جعبه برای مقایسه توزیع در چندین گروه در کنار هم عالی است و تفاوت در مرکز ، گسترش و انحراف را نشان می دهد که یک مقایسه متوسط ساده آن را از دست می دهد. به عنوان مثال ، مقایسه نمرات آزمون در سه مدرسه با استفاده از سه طرح جعبه ای که در کنار هم قرار دارند ، بلافاصله نشان می دهد که کدام مدرسه دارای عملکرد متوسط بالاتر است ، که گسترش بیشتری دارد (که نشان دهنده عدم انسجام آموزش است) ، و اینکه آیا هر مدرسه دارای یک خوشه از دانش آموزان بی نظیر است که به پشتیبانی نیاز دارند. این تراکم بصری اطلاعات آماری در یک صفحه نمایش جمع و جور ، طرح جعبه را به یکی از قدرتمندترین و کم استفاده ترین ابزار در ارتباطات داده ها تبدیل می کند.

گام به گام: محاسبه میانگین، میانگین و حالت با دست

بیایید از طریق یک مثال کامل با مجموعه داده های واقع گرایانه کار کنیم: ارقام فروش ماهانه (در هزاران نفر) برای یک کسب و کار کوچک بیش از 12 ماه: {42، 38، 55، 61، 48، 52، 75، 48، 63، 44، 38، 57}.

مرحله 1: مرتب کردن داده ها

به ترتیب رو به بالا: {38, 38, 42, 44, 48, 48, 52, 55, 57, 61, 63, 75}

گام دوم: میانگین را محاسبه کنید

جمع = 38+38+42+44+48+48+52+55+57+61+63+75 = 621

n = 12، میانگین = 621 / 12 =51.75 (هزار)

گام سوم: میانه را پیدا کنید

n = 12 (هم): میانگین مقادیر ششم و هفتم = (48 + 52) / 2 =50

مرحله ۴: حالت را شناسایی کنید

هر دو 38 و 48 دو بار ظاهر می شوند.{38, 48}(بیمودال)

مرحله 5: محاسبه محدوده و انحراف استاندارد

محدوده = 75 - 38 =37

انحرافات از میانگین (51.75): (38-51.75) 2 = 189.06؛ (38-51.75) 2 = 189.06؛ (42-51.75) 2 = 95.06؛ (44-51.75) 2 = 60.06؛ (48-51.75) 2 = 14.06؛ (52-51.75) 2 = 0.06؛ (55-51.75) 2 = 10.56؛ (57-51.75) 2 = 27.56؛ (61-51.75) 2 = 85.56؛ (63-51.75) 2 = 126.56؛ (75-51.75) 2 = 540.56

مجموع انحرافات مربع = 1,352.25؛ انحراف = 1,352.25/12 = 112.69؛ SD = √112.69 ~۱۰٫۶۲

تفسیر

این کسب و کار دارای میانگین فروش ماهانه 51،750 دلار با متوسط 50،000 دلار است. انحراف استاندارد ~ 10،620 دلار به این معنی است که بیشتر ماه ها در حدود +/- 10،620 دلار از میانگین قرار می گیرند. توزیع دو روش (دو حالت) ممکن است الگوهای فصلی را نشان دهد - بررسی کنید که آیا دو 38 و دو 48 در ماه های خاص جمع می شوند. بالاترین مقدار (75،000 دلار در یک ماه) میانگین را کمی بالاتر از میانگین می کشد ، که نشان دهنده انحراف مثبت خفیف است - احتمالاً یک ماه فروش استثنایی (موسم تعطیلات ، قرارداد بزرگ و غیره).