평균 계산기 – 평균, 중앙값, 최빈값, 범위
숫자 목록의 평균, 중앙값, 최빈값, 범위를 즉시 계산하세요. 쉼표로 구분된 값을 입력하면 완전한 통계 요약을 얻을 수 있습니다. 무료 수학 도구.
평균 (Mean) 이란?
평균은 중앙값을 측정하는 가장 일반적인 방법입니다. 모든 값의 합을 계산하고 개수를 나눈 것입니다.
Mean = (x₁ + x₂ + ... + xₙ) / n
예시: 8, 12, 7, 15, 3의 평균을 구하세요.
- 합: 8 + 12 + 7 + 15 + 3 = 45
- 개수: 5
- 평균: 45 / 5 = 9
평균은 극단값 (outliers)에 민감합니다. 위의 집합에서 15 대신 100을 사용한다면?
평균 = (8 + 12 + 7 + 100 + 3) / 5 = 26. 이 26은 실제 값 중 하나를 대표하지 않습니다. - 중간값 (median)이 더 유용합니다.
우리 계산기는 또한 중간값, 모드, 범위, 분산, 표준편차를 계산합니다. - 데이터 세트의 완전한 통계 요약.
평균 vs 중간값 vs 모드: 어느 것을 사용해야 하나?
이 세 가지 중앙값 측정 방법은 모두 "일반적인" 값을 다르게 설명합니다.
| 측정 방법 | 정의 | 사용할 때 | 극단값에 영향을 받나요? |
|---|---|---|---|
| 평균 | 합 ÷ 개수 | 데이터가 대칭적이고 극단적인 값이 없을 때 | 예 — 강하게 |
| 중간값 | 정렬된 후 중간 값 | 극단적인 값이 있는 데이터 또는 왜곡된 데이터 (소득, 가격) | 아니요 — 강력 |
| 모드 | 가장 빈도 높은 값 | 범주형 데이터, 가장 일반적인 결과를 찾을 때 | 아니요 |
클래식 예 - 미국 소득: 2023년 미국 평균 가구 소득은 ~$74,000, 평균 가구 소득은 ~$105,000이었습니다. 평균은 부유한 사람들에 의해 끌어올려집니다. 중간값이 일반적인 가구를 더 잘 대표합니다.
모드가 가장 유용한 경우: 신발 크기 (스토어는 가장 일반적인 크기를 주문해야 함), 설문 조사 ("대다수는 옵션 B를 선택했습니다"), 범주형 데이터.
완벽히 대칭 분포 (벨 커브)에서 평균 = 중간값 = 모드. 이러한 분포가 얼마나 왜곡되고 비대칭인지에 따라 이들이 분리됩니다.
가중 평균: 모든 값이 동일하지 않은 경우
가중 평균은 가중치를 할당하여 다른 값에 다른 중요성을 부여합니다.
가중 평균 = Σ(값 × 가중치) / Σ(가중치)
GPA 계산 예:
| 과목 | 학점 | 학점 (가중치) | 가중 점수 |
|---|---|---|---|
| 물리학 | 3.7 (A−) | 4 | 14.8 |
| 영어 | 3.3 (B+) | 3 | 9.9 |
| 역사 | 4.0 (A) | 3 | 12.0 |
| 체육 | 4.0 (A) | 1 | 4.0 |
| 총 | 11 | 40.7 |
가중 GPA = 40.7 / 11 = 3.70
4 개의 학점의 단순 (비 가중) 평균: (3.7 + 3.3 + 4.0 + 4.0) / 4 = 3.75 - 가중치를 더 많이 가진 물리학 과목이 가중치를 낮추기 때문에 다릅니다.
가중 평균의 다른 응용 예: 투자 포트폴리오 수익률 (달러 금액에 따라 가중), 학생 시험 점수 (시험 60%, 과제 40%), 스포츠 통계, 소비자 가격 지수 계산.
범위, 분산, 표준편차
중앙값을 알기만 하면 충분하지 않습니다. 데이터의 분산을 이해해야 합니다.
- 범위: 최대 - 최소. 단순하지만 극단적인 값에 영향을 받습니다. 데이터 세트 {2, 5, 5, 6, 100}: 범위 = 98, 그러나 98%의 값은 2와 6 사이입니다.
- 분산: 평균에서 제곱한 편차의 평균. 데이터의 분산을 측정하지만, 제곱 단위 (직접 해석하기 어려움).
- 표준편차 (σ 또는 SD): 분산의 제곱근. 데이터의 단위와 동일 - 가장 유용한 분산 측정 방법.
표준편차를 계산하는 단계별로 (데이터: 4, 7, 13, 16):
- 평균 = (4 + 7 + 13 + 16) / 4 = 10
- 평균에서 편차: -6, -3, +3, +6
- 제곱 편차: 36, 9, 9, 36
- 분산 = (36 + 9 + 9 + 36) / 4 = 22.5 (집단) 또는 / 3 = 30 (표본)
- 표준편차 = √22.5 = 4.74 (집단)
68-95-99.7 규칙 (정규 분포): 68%의 데이터가 1 SD, 95%가 2 SD, 99.7%가 3 SD 이내에 있습니다.
지평균과 사칙연산 평균의 차이
성장률 또는 복리수익률을 비교할 때, 지평균이 사칙연산 평균보다 적절합니다.
지평균 = (x₁ × x₂ × ... × xₙ)^(1/n)
예시 — 투자 수익률: 1년간 50%의 수익률을 얻고, 2년간 -50%의 수익률을 얻습니다.
- 사칙연산 평균: (50% + (-50%)) / 2 = 0% 평균 수익률
- 실제 결과: 10,000 달러 → 15,000 달러 → 7,500 달러 — 돈의 25%가 손실되었습니다!
- 지평균: √(1.50 × 0.50) − 1 = √0.75 − 1 = −13.4% 년
지평균은 실제 복리 연간 성장률 (CAGR)을 반영합니다. 투자 수익률, 인구 성장률 및 복리 시나리오의 경우 항상 지평균을 사용하십시오. 사칙연산 평균은 변동성이 큰 경우 성능을 과대평가합니다.
CAGR 공식: CAGR = (End Value / Start Value)^(1/years) − 1
예시: 10,000 달러가 5년 동안 17,500 달러로 성장했습니다: CAGR = (17,500/10,000)^(1/5) − 1 = 1.75^0.2 − 1 = 11.84% 년.
일상생활에서 평균 계산
평균은 일상적인 결정에 자주 나타납니다.
| 시나리오 | 숫자 | 평균 | 인사이트 |
|---|---|---|---|
| 주간 달리기 거리 | 8, 12, 0, 10, 15, 11, 0 | 8 마일/일 평균 (56 총) | 0 (휴식일) 이 평균을 크게 낮추는 |
| 월별 지출 (1월-6월) | $2,100 / $1,900 / $2,400 / $2,200 / $1,850 / $2,150 | $2,100/월 | 일관된 달에 예산을 조정하십시오 |
| 시험 점수 (70% 통과 필요) | 65, 72, 58, 80 | 68.75% — 1.25%로 실패 | 한 번 더 시험을 치르면 평균을 올릴 수 있습니다 |
| 5 개의 직장 임금 제안 ($K) | 52, 55, 58, 62, 120 | 평균: $69.4K — 중간값: $58K | 이상치 ($120K)는 평균을 왜곡합니다 |
급여 예시에서 왜 중간값이 더 유용한지 알 수 있습니다. 시장 급여 데이터를 평가할 때 항상 평균인지 중간값인지 물어보십시오 — 실제로는 $10,000-$30,000의 차이가 날 수 있습니다.
조화 평균: 속도 및 비율에 적합한 평균
조화 평균은 사칙연산 평균, 지평균, 조화 평균 중 가장 알려지지 않은 평균입니다. 그러나 속도, 속도, 비율의 분母가 변할 때 평균을 평균화할 때 사용됩니다.
조화 평균 = n / (1/x₁ + 1/x₂ + ... + 1/xₙ)
클래식 예 — 평균 속도: 직장으로 60 km/h로 가고, 돌아오는 40 km/h로 가는 경우, 반복 여행의 평균 속도는?
- 사칙연산 평균: (60 + 40) / 2 = 50 km/h — 틀리다
- 조화 평균: 2 / (1/60 + 1/40) = 2 / (0.0167 + 0.025) = 2 / 0.0417 = 48 km/h — 정답!
사칙연산 평균이 왜 틀렸을까요? 더 느린 속도로 더 많은 시간을 소비합니다. 120 km의 반복 여행: 가는 데 2 시간 (120/60)과 돌아오는 데 3 시간 (120/40)이 소요됩니다. 총 240 km, 5 시간 = 48 km/h.
조화 평균은 항상 사칙연산 평균보다 작거나 같으며, 값이 더 퍼지면 차이가 커집니다. 다른 사용 사례로는 금융에서 가격-이익 비율을 평균화하고, 차량의 집합에서 연료 효율성을 평균화하는 것입니다.
데이터 과학 및 달리기 분석에서 평균
현대 달리기 분석 플랫폼은 거대한 양의 데이터를 생성하고, 의미 있는 분석을 위해 적용해야 하는 평균을 이해하는 것이 중요합니다:
| 달리기 지표 | 최고 평균 유형 | 왜 |
|---|---|---|
| 시즌 동안 주당 마일리지 | 산술 평균 | 간단한 총 맥락; 모든 주가 동일하게 가중치 |
| 달리기 거리별 평균 속도 | 가중 평균 (거리에 따라 가중치) | 20 km 달리기보다 3 km의 조깅이 더 중요합니다 |
| 외곽 코스에 대한 평균 속도 | 조화 평균 | 속도에 대한 시간이 다릅니다 |
| 연도별 개선률 | 지평 평균 | 시간에 대한 누적 퍼센티지 |
| 일반적인 심박수 | 중간값 또는 절단 평균 | 정지/시작으로부터의 극단적인 값이 산술 평균을 왜곡합니다 |
절단 평균 (절단 평균): 산술 평균을 계산하기 전에 상위 X%와 하위 X%를 제거하는 유용한 하이브리드입니다. 10% 절단 평균은 10%를 제거하고 나머지 평균을 계산합니다. 올림픽 피겨 스케이팅은 심판 점수에서 가장 높은 점수와 가장 낮은 점수를 제거하는 점수 시스템에서 사용됩니다. 달리기 속도 데이터를 분석할 때 GPS 오류로 인해 극단적인 값이 생성될 수 있으므로 이 방법을 사용합니다.
이동 평균: 달리기 훈련 분석에서 일일 마일리지의 7일 또는 30일 이동 평균은 일일 변동성을 평활화하고 경향을 드러냅니다. 개인별 일일 마일리지가 0에서 20 km 사이로 변동할 수 있지만 7일 이동 평균은 40에서 55 km/주로 상승하는 정체적인 상승 경향을 보여줍니다. - 훨씬 더 정보가 풍부한 훈련량의 진행과 부상 위험을 모니터링하는 데 유용합니다.
달리기 데이터를 분석할 때 항상 물어보세요: 어떤 질문을 해결하고 싶은가요? 올바른 평균은 질문에 달려 있습니다. "주당 평균 마일리지가 무엇이었나요?" (산술 평균). "실제로 가장 거리를 달리기 위해 어떤 속도로 달렸나요?" (가중 평균). "연도별로 개선률이 어떻게 되나요?" (지평 평균의 개선률 퍼센티지).
주로 묻는 질문
평균과 평균의 차이점은 무엇인가?
일상 생활에서 '평균'과 '평균'은 같은 것을 의미합니다: 합 ÷ 개수. 기술적으로 '평균'은 평균, 중간값, 모드에 대한 더 광범위한 용어입니다. 수학 및 통계학에서 '평균'은 항상 산술 평균을 의미한다고 명시하지 않는 한(지질학적 평균, 조화 평균 등).
모든 숫자가 동일한 횟수만큼 나타난다면, 모드가 무엇인가?
모든 값이 동일한 횟수만큼 나타난다면, 단일 모드가 없다는 것을 의미합니다. - 모달 또는 모든 값이 동등한 모드입니다. 실제로 통계학자들은 종종 '모드가 없다고' 말합니다. 두 값이 가장 높은 빈도를 공유하는 경우, 데이터 세트는 이중 모드입니다.
무게 평균을 계산하는 방법은?
각 값에 무게를 곱하고, 그 곱의 합을 구한 후, 모든 무게의 합으로 나눕니다. 예를 들어, 시험 (80 점, 60%) 과 과제 (90 점, 40%): 무게 평균 = (80 × 0.6 + 90 × 0.4) / (0.6 + 0.4) = (48 + 36) / 1 = 84.
어디서 median을 사용해야 하나?
데이터가 이상치가 있거나 치우침이 심한 경우, 중간값을 사용하십시오. 예를 들어, 가구 소득 (몇몇 억만장자가 평균을 올려줌), 집 가격 (럭셔리 집이 평균을 올려줌), 응답 시간 (몇몇 개의 느린 응답이 평균을 올려줌). 중간값은 이러한 경우에 더 공정하게 '일반적인' 관찰을 나타냅니다.
표준편차는 무엇이고 왜 중요합니까?
표준편차는 데이터가 평균에서 얼마나 퍼져 있는지 측정합니다. 낮은 SD는 데이터 점들이 평균 근처에 집중되어 있음을 의미하고, 높은 SD는 데이터 점들이 퍼져 있음을 의미합니다. 예를 들어, 70-75%의 점수를 받은 모든 학생이 있는 경우, SD는 40-100%의 점수를 받은 학생이 있는 경우보다 낮습니다.
지질학적 평균은 무엇이고 언제 사용해야 하나?
지질학적 평균은 n개의 값의 곱의 n제곱근입니다: (x₁ × x₂ × ... × xₙ)^(1/n). 투자 수익률, 성장률, 복합률과 같은 변화를 측정하는 데 사용하십시오. 50%의 수익률과 -50%의 수익률을 가진 포트폴리오의 산술 평균은 0%이지만 지질학적 평균은 -13.4%로 실제 손실을 반영합니다.
데이터 세트의 중간값을 찾는 방법은?
숫자를 낮은 것부터 높은 것으로 정렬합니다. 홀수 개의 경우, 중간값은 중간 값입니다. 짝수 개의 경우, 중간값은 두 중간값의 평균입니다. 예를 들어, {3, 5, 7, 9, 11} → 중간값 = 7. 예를 들어, {3, 5, 7, 9} → 중간값 = (5+7)/2 = 6.
데이터 세트의 범위는?
범위 = 최대값 - 최소값. 예를 들어, {4, 8, 15, 16, 23, 42}: 범위 = 42 - 4 = 38. 범위는 이상치에 매우 민감합니다. 더 강력한 분산 측정에 대해, 중간사분위수 (IQR = Q3 - Q1) 또는 표준편차를 사용하십시오.