🔬 Advanced 🔥 Popular

Kalkulator odchylenia standardowego

Oblicz odchylenie standardowe, odchylenie, średnią i więcej dla dowolnego zestawu danych. Wspiera zarówno obliczenia populacji, jak i próbki. Darmowe rozwiązanie krok po kroku.

Czym jest odchylenie standardowe i dlaczego ma to znaczenie?

Miary odchylenia standardowegojak rozłożone dane są wokół średniej (średniej)Niewielkie odchylenie standardowe oznacza, że wartości skupiają się ściśle wokół średniej; duże odchylenie standardowe oznacza, że wartości są szeroko rozproszone.

Dwa zestawy danych mogą mieć tę samą średnią, ale zupełnie inne rozkłady -- odchylenie standardowe oddaje tę różnicę:

Zestaw danych A: {9, 10, 10, 11, 10} -- Średnia = 10, SD ~ 0,63 (surowy klaster)
Zestaw danych B: {2, 5, 10, 15, 18} -- Średnia = 10, SD ~ 5,83 (szerokie rozmieszczenie)

Oba mają średnią 10, ale zestaw danych B jest prawie 10 razy bardziej zmienny. Odchylenie standardowe sprawia, że jest to widoczne.

Odchylenie standardowe oznaczane jestσ (sigma)dla populacji isJest to pierwiastek kwadratowy odchylenia, wyrażony w tych samych jednostkach co pierwotne dane, co czyni go bardziej interpretowalnym niż samo odchylenie.

Zastosowania obejmują niemal każdą dziedzinę: kontrolę jakości (czy produkowane części są konsekwentnie w granicach tolerancji?), finanse (ryzyko inwestycyjne = zmienność zwrotu), medycyna (czy czytanie pacjenta jest w granicach 2 SD od normy?), edukacja (jak rozprowadzane są wyniki testów?), i analityka sportowa (jak spójna jest wydajność sportowca?).

Populacja w stosunku do odchylenia standardowego próbki

Najważniejszym wyborem przy obliczaniu odchylenia standardowego jest to, czy pracujesz zliczba ludności(wszystkie możliwe punkty danych) lubpróbka(podzbiór) określa, którą formułę należy użyć i wpływa na wynik.

Odchylenie standardowe populacji (σ):Formuła: σ = √[Σ(xi - μ) 2 / N]

gdzie: μ = średnia populacji, N = liczba wartości, Σ = suma wszystkich wartości.

Odchylenie standardowe próbki:Formuła: s = √[Σ(xi - x̄) 2 / (n-1) ]

gdzie: x̄ = średnia próbki, n = liczba wartości w próbce, (n-1) =Korekta Bessela.

Korekta Bessela dzieli się przez (n-1) zamiast n, ponieważ próbki mają tendencję do niedoceniania prawdziwej zmienności populacji - szczególnie w przypadku małych próbek.bezstronny oszacownikodchylenia populacji.

Który użyć?

Populacja SD:Mamy dane wszystkich uczniów z konkretnej klasy, wszystkie wyniki z jednego konkretnego egzaminu, wszystkich pracowników jednej firmy.
Próbka SD:Zbadano 500 Amerykanów na temat dochodów (wnioskowanie do wszystkich Amerykanów); zmierzono 30 gadżetów z produkcji (wnioskowanie do wszystkich gadżetów); każde badanie naukowe z próbką.

Obliczanie odchylenia standardowego krok po kroku

Przeanalizujmy kompletny przykład z liczbami rzeczywistymi:

Zestaw danych:Wyniki testów 6 uczniów: {72, 85, 91, 68, 79, 88}

Krok 1 -- Znajdź średnią:(72 + 85 + 91 + 68 + 79 + 88) / 6 = 483 / 6 =80,5

Krok 2 -- Znajdź każde odchylenie od średniej i podnieś je do kwadratu:

Wynik (xi)	Odchylenie (xi - x̄)	Kwadrat (xi - x̄) 2
72	72 - 80,5 = -8,5	72,25
85	85 - 80,5 = +4,5	20,25
91	91 - 80,5 = +10,5	110,25
68	68 - 80,5 = -12,5	156,25
79	79 - 80,5 = -1,5	2.25
88	88 - 80,5 = +7,5	56,25
Łączna suma	0 (zawsze)	417,50 zł

Krok 3 -- Oblicz odchylenie:Wariancja próbki (n-1) = 417,50 / 5 = 83,50

Krok 4 -- Wybierz pierwiastek kwadratowy odchylenia standardowego:s = √83,50 ~9.14 Działania

Tłumaczenie:Większość wyników mieści się w granicach około 9,14 punktów od średniej 80,5. Około 68% wyników można by oczekiwać między 71,4 a 89,6 (średnia +/- 1 SD), gdyby była to populacja o normalnym rozkładzie.

Zasada empiryczna i rozkład normalny

W przypadku danych następujących porozkład normalny (krzywa dzwonkowa), Zasada empiryczna (zasada 68-95-99,7) mówi dokładnie, ile wartości znajduje się w obrębie każdego odstępstwa standardowego:

Zakres	Odsetek danych	Przykład (średnia=100, SD=15)
Średnia +/- 1 SD	~68,27%	Od 85 do 115
Średnia +/- 2 SD	~95,45%	70 do 130
Średnia +/- 3 SD	~99,73%	Od 55 do 145
Powyżej +/- 3 SD	~0,27%	poniżej 55 lub powyżej 145

Klasycznym zastosowaniem są wyniki IQ: średnia = 100, SD = 15. IQ 130 to 2 SD powyżej średniej - tylko około 2,3% ludzi ma tak wysoki wynik. IQ 145 to 3 SD powyżej średniej - około 0,13% ludzi (około 1 na 750).

W zakresie kontroli jakościSześć Sigmastandard wymaga, aby procesy miały mniej niż 3,4 wad na milion możliwości - co odpowiada utrzymaniu zmienności w granicach +/-6 odchylenia standardowego od celu, pozostawiając tylko 0,00034% wskaźnika wad. To jest statystyczna podstawa programów jakości produkcyjnej Six Sigma.

Nie wszystkie dane są normalnie rozłożone. Rozkłady dochodów są skrzywione w prawo (kilka osób o bardzo wysokich zarobkach rozciągają prawy ogon). W takich przypadkach średnia i zakres międzykwartalny mogą być bardziej pouczające niż średnia i odchylenie standardowe.

Inne wskaźniki statystyczne: średnia, mediana, odchylenie i inne

Odchylenie standardowe jest najbardziej znaczące wraz z innymi statystykami opisowymi.

Średnia (średnia arytmetyczna):Łączna wartość wszystkich wartości ÷ liczba. wrażliwość na wartości odbiegające - jedna skrajna wartość może znacząco przesunąć średnią.
Średnia:Średnia wartość, gdy dane są sortowane. Bardziej stabilne dla odbiegających wartości niż średnia. Dla {1, 2, 3, 4, 100}: średnia = 22, mediana = 3.
Tryb:Najczęściej występująca wartość. Przydatna dla danych kategorycznych; zestaw danych może mieć wiele trybów lub żaden.
Zasięg:Maksymalny - minimalny. Prosty, ale wrażliwy na wartości odbiegające; nie opisuje kształtu rozkładu.
Odchylenie (σ2 lub s2):Kwadrat odchylenia standardowego. Użyteczny matematycznie, ale trudniejszy do interpretacji, ponieważ jest w jednostkach kwadratowych. Przykład: jeśli wysokości są w centymetrach, rozbieżność jest w cm2 - co nie ma fizycznego znaczenia.
Współczynnik zmienności (CV):(Odchylenie standardowe / średnia) x 100%. Umożliwia porównanie zmienności w zestawach danych z różnymi środkami. CV 10% oznacza, że SD wynosi 10% średniej - przydatne w finansach i biologii.
Standardowy błąd średniej (SEM):SD ÷ √n. Mierzy precyzję średniej próbki jako szacunek średniej populacji. W miarę wzrostu wielkości próbki SEM się kurczy - większe próbki dają bardziej precyzyjne szacunki.

Odchylenie standardowe w finansach, nauce i sporcie

Odchylenie standardowe ma specyficzne, praktyczne interpretacje w różnych dziedzinach:

Finanse -- Pomiar ryzyka inwestycyjnego:W finansach odchylenie standardowe zwrotów = zmienność = ryzyko. Akcja, która przynosi 10% rocznie z SD 15% ma 68% prawdopodobieństwa zwrotu między -5% a +25% w danym roku. S&P 500 historycznie ma roczny SD około 15 - 20%. Portfele obligacji zazwyczaj mają SD 3 - 7%. Wydajność skorygowana ryzykiem (Sharpe Ratio) = (oprocentowanie zwrotu - bez ryzyka) / SD - im wyższe, tym lepiej.

Nauka -- Kontrola jakości i pomiary:W badaniach klinicznych istotność statystyczną zazwyczaj definiuje się jako odległość efektu leczenia od średniej grupy kontrolnej o więcej niż 2 SD (p < 0,05).

Analiza sportu:Konsekwencja gracza jest mierzona SD. Koszykarz średnio 25 punktów na mecz z SD 3 jest bardziej wiarygodny niż jeden średnio 25 z SD 10. Prognozowanie pogody wykorzystuje modele zespołowe, w których SD prognozy temperatury wskazuje na pewność - wąski SD oznacza, że prognozujący się zgadzają; szeroki SD oznacza wysoką niepewność.

Edukacja:Wyniki Z-score wyrażają, ile standardowych odchyleń wynik ucznia od średniej klasy: Z = (score - mean) / SD. Wynik Z +2 oznacza uzyskanie 2 SD powyżej średniej - lepiej niż około 97,7% uczniów. Testy standardowe, takie jak SAT, są zaprojektowane w taki sposób, aby wyniki podążały za mniej więcej normalnym rozkładem, umożliwiając porównanie procentylne.

Często zadawane pytania

Jaka jest różnica pomiędzy odchyleniem standardowym a rozbieżnością?

Odchylenie jest średnią odchylenia kwadratowego od średniej. Odchylenie standardowe jest pierwiastkiem kwadratowym odchylenia. Oba pomiary są rozłożone, ale odchylenie standardowe jest w tych samych jednostkach co dane (łatwiejsze do interpretacji), podczas gdy odchylenie jest w jednostkach kwadratowych. Zestaw danych o wysokości w cm ma odchylenie w cm2 - nie ma znaczenia. SD w cm jest bezpośrednio porównywalny z oryginalnymi pomiarami.

Kiedy należy użyć odchylenia standardowego populacji w stosunku do próbki?

Użyj SD populacji (σ, dzielone przez N) kiedy masz dane dla całej populacji, którą opisujesz - wszystkich uczniów w jednej konkretnej klasie, wszystkich pracowników w jednej firmie. Użyj SD próbki (s, dzielone przez n-1) kiedy twoje dane są podzbiorem większej populacji i szacujesz zmienność populacji - próbka ankiety, uczestnicy badań klinicznych, próbki kontroli jakości z produkcji.

Co oznacza wysokie lub niskie odchylenie standardowe?

Niskie odchylenie standardowe oznacza, że punkty danych są ściśle zgrupowane wokół średniej - spójność, niska zmienność. Wysokie odchylenie standardowe oznacza, że dane są szeroko rozproszone - duża zmienność. Żadne z nich nie jest z natury lepsze; zależy to od kontekstu. W produkcji pożądane jest niskie SD (spójność). W zwrotów z inwestycji niektórzy inwestorzy akceptują wyższe SD dla wyższych potencjalnych zwrotów.

Co to jest wynik Z i jak się odnosi do odchylenia standardowego?

Wskaźnik Z mierzy odchylenia standardowe punktu danych od średniej: Z = (wartość - średnia) / SD. Wskaźnik Z wynoszący 0 = dokładnie średnia. Z = +1 = 1 SD powyżej średniej (84 procentyl). Z = -2 = 2 SD poniżej średniej (2,3 procentyl). Wskaźniki Z umożliwiają porównanie wartości z różnych zestawów danych o różnych skalach.

Czym jest błąd standardowy i czym się różni od odchylenia standardowego?

Odchylenie standardowe opisuje rozprzestrzenianie się poszczególnych punktów danych. Standardowy błąd średniej (SEM = SD/√n) opisuje precyzję średniej próbki jako szacunek prawdziwej średniej populacji. Wraz ze wzrostem wielkości próbki SEM zmniejsza się (więcej danych = bardziej precyzyjne szacunki), ale SD niekoniecznie się zmienia. SEM jest używany w przedziałach ufności; SD opisuje rozkład samych danych.

Czy odchylenie standardowe może być ujemne?

Nie. Odchylenie standardowe jest zawsze zerowe lub dodatnie. Równa się zerowi tylko wtedy, gdy wszystkie wartości danych są identyczne (żadnej zmienności). Ponieważ jest obliczana jako pierwiastek kwadratowy sumy kwadratów, nie może być ujemna. Ujemna odchylka lub odchylenie standardowe wskazywałyby błąd obliczeniowy.

Jak odbiegające wartości wpływają na odchylenie standardowe?

Wartości zewnętrzne mogą znacznie zwiększyć odchylenie standardowe, ponieważ odchylenia są kwadratowe - duże odchylenia od średniej przyczyniają się nieproporcjonalnie. Na przykład w {10, 11, 10, 12, 100}: usunięcie wartości zewnętrznej (100) obniża SD z ~38 do ~0,9.

Co to znaczy, jeśli odchylenie standardowe jest równe zero?

Odchylenie standardowe równe zeru oznacza, że wszystkie wartości w zbiorze danych są identyczne - nie ma żadnej zmienności. Na przykład {5, 5, 5, 5, 5} ma średnią = 5 i SD = 0. Występuje to w sztucznych lub silnie ograniczonych zestawach danych. W praktycznych zestawach danych, SD = 0 często wskazuje błąd zbierania danych lub identyczne pomiary.