Skip to main content
🟢 Beginner 🔥 Popular

میانگین، میانگین و محاسبات حالت

برای محاسبه میانگین، میانگین، حالت، محدوده و سایر آمار برای هر مجموعه داده استفاده کنید. از این ماشین حساب ریاضی آنلاین رایگان برای نتایج دقیق و فوری استفاده کنید. بدون ثبت نام.

درک اندازه گیری های گرایش مرکزی

در آمار،اندازه گیری های گرایش مرکزیارزش های منفرد هستند که مرکز یا ارزش معمولی یک مجموعه داده را توصیف می کنند. سه مورد مهم میانگین، میانگین، و حالت هستند-- هر کدام چیزی متفاوت در مورد داده ها به شما می گوید، و هر کدام در موقعیت های مختلف مناسب تر است.

این مجموعه داده ها را در نظر بگیرید: نمرات آزمون {۵۵، ۶۰، ۷۰، ۷۵، ۷۵، ۸۰، ۹۵}. هر اندازه گیری چشم انداز متفاوتی را ارائه می دهد:

اقدامارزشنحوه محاسبهبهترین برای
میانگین72.9(55+60+70+75+75+80+95) / 7توزیع های متقارن
میانگین (ارزش متوسط)75مقدار متوسط داده های مرتب شدهتوزیع های منحرف، ارزش های نامناسب
حالت (متداول ترین)75بیشترین مقدار تکرار شدهداده های دسته بندی شده، پیدا کردن قله ها
محدوده40ماکس - مین = 95 - 55اندازه گیری پراکندگی

هیچ معیار واحدی به طور جهانی "بهترین" نیست. یک تحلیلگر داده، معیار مناسب را بر اساس شکل توزیع، وجود ارزش های نامناسب، و سوالی که پرسیده می شود انتخاب می کند. درک هر سه - به علاوه محدودیت های آنها - برای سواد آماری اساسی است.

میانگین (میانه ریاضی): چگونه آن را محاسبه کنیم

The میانگین ریاضیمجموع تمام مقادیر تقسیم بر تعداد مقادیر است. این رایج ترین اندازه گیری گرایش مرکزی است و چیزی است که اکثر مردم وقتی می گویند "متوسط" می گویند.

فرمول: میانگین (x̄) = (Σxi) / n

جایی که Σxi مجموع تمام مقادیر است و n شمارش است.

مثال:داده = {3، 7، 8، 5، 12، 4، 9، 6}

  1. جمع: 3 + 7 + 8 + 5 + 12 + 4 + 9 + 6 = 54
  2. شمارش: 8 مقدار
  3. میانگین = 54 / 8 =۶٫۷۵

میانگین حساس بهموارد عجیب و غریب-- ارزش های افراطی میانگین را به سمت خود می کشند. به عنوان مثال، اگر یک مقدار در مجموعه فوق 100 به جای 12 باشد، میانگین به (54 - 12 + 100) / 8 = 142 / 8 = 17.75، دور از ارزش "معمولی" داده های باقی مانده است.

انواع دیگر وسایل برای استفاده های تخصصی:

میانگین: مقدار متوسط

The میانگینمقدار میانی یک مجموعه داده است که به ترتیب رو به افزایش مرتب شده است. این توزیع را دقیقاً به نصف تقسیم می کند: 50٪ از مقادیر زیر میانگین و 50٪ بالاتر از آن قرار می گیرند.

برای یک عدد جفت از مقادیر:میانگین = مقدار (n+1) /2.

برای یک عدد جفت از مقادیر:میانگین = میانگین n/2 th و (n/2 + 1) th.

مجموعه داده هاnدسته بندی شدهمیانگین
{4، 1، 9، 2، 6}5 (نادر){1، 2، 4، 6، 9}4 (ارزش سوم)
{7, 3, 8, 5}4 (حتی){3, 5, 7, 8}(5+7)/2 = 6
{10،20،30،40}4 (حتی){10،20،30،40}(20+30)/2 = 25
{1،1،1،1000}4 (حتی){1،1،1،1000}(1+1)/2 = 1

به آخرین مثال توجه کنید: میانگین {1، 1، 1، 1000} = 250.75، اما میانگین = 1 این به خوبی نشان می دهد که چرامیانگین برای توزیع های منحرف ترجیح داده می شود تا میانگینبا ارزش های نامتعارف -- درآمد متوسط، قیمت مسکن، و مدت زمان بستری در بیمارستان همگی به عنوان میانگین گزارش می شوند زیرا چند مقدار بسیار بالا باعث می شود میانگین نشان دهنده تجربه معمولی نباشد.

حالت: متداول ترین مقدار

The حالتارزشی است که اغلب در مجموعه داده ها ظاهر می شود. یک مجموعه داده می تواند:

این حالت به ویژه برای موارد زیر مفید است:

مجموعه داده هاحالتنوع
{1، 2، 3، 4، 5}هیچکدامبدون حالت
{2،4،4،6،8}4یک مدال
{1، 1، 3، 5}1 و 5بیمودال
{a، b، b، c، c، d، d}ب، ج، دتریمودال

محدوده و سایر اندازه گیری های گسترش

در حالی که میانگین، میانگین، و حالت مرکز توزیع را توصیف می کنند،اندازه گیری انتشارآنها برای درک یک مجموعه داده به همان اندازه مهم هستند.

اقدامفرمولمثال ({2, 4, 4, 6, 8})حساسیت به ارزش های نامناسب
محدودهماکس - من8-2=6خیلی حساسه
محدوده بین ربعین (IQR)Q3 - Q17 - 3 = 4مقاوم
انحراف (σ2)Σ ((xi - x̄) 2 / n۳.۴۴حساس
انحراف استاندارد (σ)√تفاوت1،855حساس
میانگین انحراف مطلق" ساكسيكسي "۱.۶متوسط

برای {2, 4, 4, 6, 8}: میانگین = 4.8، بنابراین انحرافات: (2-4.8) 2=7.84، (4-4.8) 2=0.64، (4-4.8) 2=0.64، (6-4.8) 2=1.44، (8-4.8) 2=10.24 است. انحراف = (7.84+0.64+0.64+1.44+10.24) / 5 = 20.8 / 5 = 4.16. SD = √4.16 ~ 2.04.

انحراف استاندارد اسب کار آماری است - در آزمایش فرضیه ، فواصل اطمینان ، محاسبات توزیع نرمال و کنترل فرآیند ظاهر می شود. انحراف استاندارد پایین تر به این معنی است که داده ها در نزدیکی میانگین خوشه بندی شده اند؛ انحراف استاندارد بالاتر به این معنی است که داده ها بیشتر پراکنده هستند.

چه زمانی باید از حالت میانگین و میانگین استفاده کرد؟

انتخاب اشتباه اندازه گیری گرایش مرکزی می تواند گمراه کننده باشد. این یک راهنمای عملی است:

وضعیتاقدام توصیه شدهچرا؟
مترادف، هیچ چیز عجیب و غریببدجنسبیشتر از نظر ریاضی قابل استفاده است؛ از تمام داده ها استفاده می کند
توزیع منحرفمیانگینبا ارزش های افراطی کشیده نمی شود
درآمد / قیمت مسکنمیانگینچند تا ميليونر ميانگين رو به بالا تحريف ميکنن
داده های دسته بندی شدهحالتمیانگین/متوسط برای دسته بندی ها اعمال نمی شود
رایج ترین مقدارحالتپاسخ مستقیم به "مشهورترین"
میانگین نمره / GPAمیانگین (با وزن)تمام نمرات به طور متناسب کمک می کنند.
بازده سهام / نرخ رشدمیانگین هندسیحساب های ترکیبی
زمان بقا، بستری شدن در بیمارستانمیانگینبه سمت راست به واسطه پرونده های طولانی مدت

مشاهده معروف: "به طور متوسط آمریکایی یک سینه و یک بیضه دارد" نشان می دهد که چرا میانگین می تواند برای توزیع های دوگانه گمراه کننده باشد. در این مورد، حالت (با جنسیت جدا شده) و میانگین توصیف کننده های اطلاعاتی بیشتری نسبت به میانگین کلی است.

نمونه های دنیای واقعی: میانگین، میانگین و حالت در عمل

درک چگونگی کاربرد این مفاهیم در شرایط واقعی، شهود آماری را ایجاد می کند:

سوالات متداول

کدام بهتر است: متوسط یا متوسط؟

هیچ یک از آنها به طور جهانی بهتر نیست - آنها به اهداف مختلف خدمت می کنند. میانگین در برابر نقاط خارج از حد قوی تر است و بهتر "معمولی" را در توزیع های منحرف (درآمد، قیمت مسکن، زمان بقا) نشان می دهد. میانگین از تمام نقاط داده استفاده می کند، از نظر ریاضی برای توزیع های متقارن بهینه است و برای محاسبات آماری بیشتر مانند انحراف استاندارد و آزمایش فرضیه ضروری است. برای یک تصویر کامل از هر دو با هم استفاده کنید.

آیا یک مجموعه داده می تواند بدون حالت باشد؟

بله. اگر تمام مقادیر به طور مساوی مکرر رخ دهند، هیچ حالت (به عنوان مثال، {1، 2، 3، 4، 5} - هر مقدار دقیقا یک بار ظاهر می شود) وجود ندارد. یک مجموعه داده همچنین می تواند چند حالت باشد - دو حالت (دو حالت: {1، 1، 3، 3، 5}) یا سه حالت. در عمل، توزیع دو حالت اغلب دو زیرگروه متمایز را در داده های شما نشان می دهد، که یک الگوی مهم برای بررسی است.

چطور می توانم میانگین یک عدد جفت را پیدا کنم؟

مقادیر را به ترتیب رو به بالا مرتب کنید، سپس میانگین دو عدد میانی را انتخاب کنید. برای {2، 4، 6، 8}: دو مقدار میانی 4 و 6 هستند، بنابراین میدانی = (4+6) / 2 = 5. برای {1، 3، 5، 7، 9، 11}: مقادیر میانی 5 و 7 هستند، بنابراین میدانی = (5+7) / 2 = 6. میدانی لازم نیست یک مقدار در مجموعه داده باشد.

اگر میانگین = میانگین = حالت به چه معناست؟

هنگامی که هر سه اندازه گیری برابر است، توزیع کاملاً متقارن و یک مدال است - منحنی زنگ کلاسیک (توزعه نرمال). این بدان معنی است که هیچ عددی منحرف در داده ها وجود ندارد، و هر سه اندازه گیری به همان اندازه توصیف کننده های معتبر مرکز هستند. در عمل، داده های دنیای واقعی به ندرت به تقارن کامل می رسند، اما هماهنگی نزدیک میانگین و میانگین نشان دهنده تقارن تقریبی است.

رابطه میان میانگین، میانگین و انحراف چیست؟

در یک توزیع شیب راست (شیب مثبت): میانگین > میانگین > حالت. در یک توزیع شیب چپ (شیب منفی): میانگین < میانگین < حالت. در یک توزیع متقارن: میانگین = میانگین ~ حالت. این رابطه یک بررسی بصری سریع را فراهم می کند: میانگین و میانگین را برای تعیین جهت شیب بدون نگاه کردن به نمودار مقایسه کنید.

شما چطور میانگین داده های گروه بندی شده را محاسبه می کنید؟

برای داده های فرکانس گروه بندی شده ، از نقطه میانی هر فاصله کلاس استفاده کنید: میانگین = Σ ((مرکز x فرکانس) / n. مثال: اگر 10 دانش آموز نمره 50 - 60 (مرکز 55) ، 15 نمره 60 - 70 (مرکز 65) و 5 نمره 70 - 80 (مرکز 75) داشته باشند: میانگین = (10x55 + 15x65 + 5x75) / 30 = (550+975+375) / 30 = 1900/30 ~ 63.3.

تفاوت میان میانگین جمعیت و میانگین نمونه چیست؟

میانگین جمعیت (μ، "mu") از هر عضو کل جمعیت محاسبه می شود. میانگین نمونه (x̄، "x-bar") از یک زیر مجموعه (نمونه) که از آن جمعیت گرفته شده است محاسبه می شود. فرمول یکسان است، اما نمادها متفاوت است. در عمل، ما تقریبا همیشه با میانگین نمونه کار می کنیم و از آنها برای برآورد میانگین جمعیت استفاده می کنیم - که خطای نمونه گیری را معرفی می کند و به تکنیک های استنباط آماری نیاز دارد.

چه تاثیری در میانگین و میانگین دارد؟

شاخص های عجیب و غریب به شدت بر میانگین تأثیر می گذارند اما تأثیر کمی بر میانگین دارند. مثال: داده های {1، 2، 3، 4، 5} دارای میانگین = 3 و میانگین = 3 است. اضافه کردن یک شاخص عجیب و غریب {1، 2، 3، 4، 5، 100}: میانگین به 19.2 می رسد اما میانگین فقط به (3 + 4) / 2 = 3.5 تغییر می کند. این استحکام باعث می شود میانگین اندازه گیری ترجیح داده شود هر زمان که شاخص های عجیب و غریب وجود داشته باشد یا مشکوک باشد.

میانگین تراز شده چیست؟

یک میانگین کوتاه (یا میانگین کوتاه) یک درصد ثابت از مقادیر افراطی را قبل از محاسبه میانگین حذف می کند. به عنوان مثال، یک میانگین کوتاه 10٪ در {1، 2، 3، 4، 5، 6، 7، 8، 9، 100}: پایین و بالا 10٪ (تقریبا 1 ارزش هر یک) را حذف می کند، و باقی می ماند {2، 3، 4، 5، 6، 7، 8، 9}؛ میانگین = 5.5. میانگین کوتاه در سیستم های امتیاز دهی (حکمت المپیک، اسکیت بازی) و آمار اقتصادی برای کاهش نفوذ خارجی در حالی که داده های بیشتری از میانگین را حفظ می کند، استفاده می شود.

چگونه می توانم میانگین وزنی را محاسبه کنم؟

میانگین وزنی = Σ ((وزن x ارزش) / Σ ((وزن). مثال: محاسبه GPA: درجه A (4.0) در یک دوره 3 اعتباری، درجه B (3.0) در یک دوره 4 اعتباری، درجه C (2.0) در یک دوره 2 اعتباری: GPA وزنی = (4.0x3 + 3.0x4 + 2.0x2) / (3+4+2) = (12+12+4) / 9 = 28/9 ~ 3.11. بدون وزنه، میانگین ساده خواهد بود (4+3+2) / 3 = 3.0 - فقدان تاثیر سنگین تر از دوره 4 اعتباری.

خلاصه ای از آمار توصیفی: آنچه همیشه به آن نیاز دارید

خلاصه ای کامل از آمارهای توصیفی برای هر مجموعه داده باید شامل همه موارد زیر باشد. این همان چیزی است که شما در یک مقاله علمی، تجزیه و تحلیل کسب و کار یا کار آکادمیک گزارش می دهید:

آمارنمادمثال {2,4,4,6,8,10}تفسیر
شمارشn6چند تا مشاهدات
بدجنس5.67ارزش متوسط
میانگینM5.0مقدار متوسط (پنجاهمین درصد)
حالتMo4متداول ترین مقدار
محدودهR8گسترش از min تا max
انحراف استانداردσ یا s2.58انحراف معمولی از میانگین
انحرافσ²۶٫۶۷SD به مربع
حداقل / حداکثر2 / 10مقادیر افراطی

در کارهای علمی و علمی، همیشه اندازه گیری مرکز و اندازه گیری گسترش را گزارش کنید. گزارش تنها میانگین (یا میانگین) بدون انحراف استاندارد (یا IQR) یک تصویر ناقص از داده های شما را ارائه می دهد. یک کلاس که دانش آموزان میانگین 75٪ را با SD = 5٪ کسب کرده اند بسیار متفاوت از یکی با میانگین = 75٪ اما SD = 25٪ است - اول یک خوشه تنگ از نمرات B است، دوم یک گروه مخلوط وحشیانه از شکست تا نزدیک به کامل است.

پرسنتیل ها، کوارتیل ها و پلاکت های جعبه ای

فراتر از میانگین، میانگین، و حالت، یک خلاصه آماری کامل اغلب شامل تجزیه و تحلیل درصد است. درصد ها به شما می گویند که چه کسری از داده ها زیر یک مقدار داده شده است - ضروری برای درک موقعیت نسبی، شناسایی نقاط خارج و مقایسه در میان جمعیت ها.

درصدمعنیمثال (درجات امتحان، n=100)
دهمین10درصد نمره پایین ترنمره 52 -> نمره بهتر از 10 درصد کلاس
بیست و پنجم (Q1)25درصد نمره پایین ترنمره 64 -> مرز چهارم پایین
پنجاهمین (متوسط)50درصد نمره پایین ترنمره 75 -> وسط توزیع
هفتاد و پنجم (Q3)75درصد نمره پایین ترنمره 87 -> مرز ربع بالایی
نهم90 درصد کمتر از 90 درصدنمره 93 -> 10 درصد برتر کلاس
نهم و نهم99درصد نمره پایین ترنمره 99 -> 1 درصد برتر

نمودار جعبه ای این اطلاعات را تجسم می کند: جعبه Q1 تا Q3 (IQR) را پوشش می دهد ، یک خط میانه را نشان می دهد و "موزه ها" به کوچکترین / بزرگترین مقادیر غیر منحرف گسترش می یابد. نقاط منحرف فردی به عنوان نقاط ترسیم می شوند. نمودار جعبه برای مقایسه توزیع در چندین گروه در کنار هم عالی است و تفاوت در مرکز ، گسترش و انحراف را نشان می دهد که یک مقایسه متوسط ساده آن را از دست می دهد. به عنوان مثال ، مقایسه نمرات آزمون در سه مدرسه با استفاده از سه طرح جعبه ای که در کنار هم قرار دارند ، بلافاصله نشان می دهد که کدام مدرسه دارای عملکرد متوسط بالاتر است ، که گسترش بیشتری دارد (که نشان دهنده عدم انسجام آموزش است) ، و اینکه آیا هر مدرسه دارای یک خوشه از دانش آموزان بی نظیر است که به پشتیبانی نیاز دارند. این تراکم بصری اطلاعات آماری در یک صفحه نمایش جمع و جور ، طرح جعبه را به یکی از قدرتمندترین و کم استفاده ترین ابزار در ارتباطات داده ها تبدیل می کند.

گام به گام: محاسبه میانگین، میانگین و حالت با دست

بیایید از طریق یک مثال کامل با مجموعه داده های واقع گرایانه کار کنیم: ارقام فروش ماهانه (در هزاران نفر) برای یک کسب و کار کوچک بیش از 12 ماه: {42، 38، 55، 61، 48، 52، 75، 48، 63، 44، 38، 57}.

مرحله 1: مرتب کردن داده ها

به ترتیب رو به بالا: {38, 38, 42, 44, 48, 48, 52, 55, 57, 61, 63, 75}

گام دوم: میانگین را محاسبه کنید

جمع = 38+38+42+44+48+48+52+55+57+61+63+75 = 621

n = 12، میانگین = 621 / 12 =51.75 (هزار)

گام سوم: میانه را پیدا کنید

n = 12 (هم): میانگین مقادیر ششم و هفتم = (48 + 52) / 2 =50

مرحله ۴: حالت را شناسایی کنید

هر دو 38 و 48 دو بار ظاهر می شوند.{38, 48}(بیمودال)

مرحله 5: محاسبه محدوده و انحراف استاندارد

محدوده = 75 - 38 =37

انحرافات از میانگین (51.75): (38-51.75) 2 = 189.06؛ (38-51.75) 2 = 189.06؛ (42-51.75) 2 = 95.06؛ (44-51.75) 2 = 60.06؛ (48-51.75) 2 = 14.06؛ (52-51.75) 2 = 0.06؛ (55-51.75) 2 = 10.56؛ (57-51.75) 2 = 27.56؛ (61-51.75) 2 = 85.56؛ (63-51.75) 2 = 126.56؛ (75-51.75) 2 = 540.56

مجموع انحرافات مربع = 1,352.25؛ انحراف = 1,352.25/12 = 112.69؛ SD = √112.69 ~۱۰٫۶۲

تفسیر

این کسب و کار دارای میانگین فروش ماهانه 51،750 دلار با متوسط 50،000 دلار است. انحراف استاندارد ~ 10،620 دلار به این معنی است که بیشتر ماه ها در حدود +/- 10،620 دلار از میانگین قرار می گیرند. توزیع دو روش (دو حالت) ممکن است الگوهای فصلی را نشان دهد - بررسی کنید که آیا دو 38 و دو 48 در ماه های خاص جمع می شوند. بالاترین مقدار (75،000 دلار در یک ماه) میانگین را کمی بالاتر از میانگین می کشد ، که نشان دهنده انحراف مثبت خفیف است - احتمالاً یک ماه فروش استثنایی (موسم تعطیلات ، قرارداد بزرگ و غیره).