Standard Deviation Calculator

Ano ang Standard Deviation at Bakit Ito Ang Mabisa?

Ang standard deviation ay nagpapahiwatig ng kung gaano malayo ang iyong datos ay nakalagay sa paligid ng mean (talahanayan). Ang maliit na standard deviation ay nangangahulugang ang mga halaga ay nakalagay nang malapit sa mean; ang malaking standard deviation ay nangangahulugang ang mga halaga ay malawak na nakalagang nakalagay.

Ang dalawang set ng datos ay maaaring may parehong talahanayan ng average ngunit mayroong iba't ibang pagkakalagay — ang standard deviation ay nagpapakita ng pagkakaiba:

Set A: {9, 10, 10, 11, 10} — Talahanayan = 10, SD ≈ 0.63 (malapit na nakalagay)
Set B: {2, 5, 10, 15, 18} — Talahanayan = 10, SD ≈ 5.83 (malawak na nakalagay)

Ang dalawa ay may parehong talahanayan ng 10, ngunit ang Set B ay halos 10× mas malawak na nakalagay. Ang standard deviation ay nagpapakita ng pagkakaiba.

Ang standard deviation ay pinapahiwatig ng σ (sigma) para sa populasyon at s para sa sample. Ito ay ang square root ng variance, na inilalagay sa parehong yunit ng orihinal na datos — na nagpapakita ito ng mas mabisa kaysa sa variance lamang.

Ang mga aplikasyon ay naglalayon sa lahat ng larangan: kalidad ng paggawa (ang mga bahagi ng paggawa ay konsistente sa pagitan ng pagtanggap?), pagsasahod (ang panganib ng pagsasahod = ang pagbabago ng pagbabago), medisina (ang pagbabasa ng isang pasyente ay nasa loob ng 2 SD ng normal?), edukasyon (paano ang mga marka ng pagsusulit ay nakalagay?), at analisis ng mga larong pagsasama (paano konsistente ang pagganap ng isang manlalaro?}

Populasyon vs Sample Standard Deviation

Ang pinakamahalagang pagpili nang paglalaro ng standard deviation ay kung saan ka nagtatrabaho sa isang populasyon (ang lahat ng mga datos) o isang sample (isang bahagi). Ito ay nagpapahiwatig ng formula na gagamitin at nagpapahiwatig ng resulta.

Standard deviation ng populasyon (σ): Gamit kung may datos para sa buong grupo na pinag-aaralan. Formula: σ = √[Σ(xᵢ − μ)² / N]

Kung: μ = talahanayan ng populasyon, N = bilang ng mga halaga, Σ = sum ng lahat ng mga halaga.

Standard deviation ng sample (s): Gamit kung ang datos ay isang sample na kinuha mula sa isang mas malaking populasyon. Formula: s = √[Σ(xᵢ − x̄)² / (n−1)]

Kung: x̄ = talahanayan ng sample, n = bilang ng mga halaga sa sample, (n−1) = Bessel's correction.

Ang Bessel's correction ay nagbabawas ng (n−1) sa halipang n dahil ang mga sample ay madalas na humahadlang ang tunay na populasyon na pagbabago — partikular na para sa mga maliliit na sample. Ang paggamit ng (n−1) ay nagbibigay ng isang unbiased estimator ng populasyon na pagbabago.

Ang anong gamitin?

Populasyon SD: May datos para sa lahat ng mag-aaral sa isang partikular na klase; ang lahat ng mga marka ng pagsusulit mula sa isang partikular na pagsusulit; ang lahat ng mga empleyado sa isang partikular na kumpanya.
Sample SD: Nagtatanong 500 Amerikano tungkol sa kikitain (inirerepresenta sa lahat ng mga Amerikano); nagmemeasure ng 30 widget mula sa isang produksyon (inirerepresenta sa lahat ng mga widget); anumang agham na may sample.

Ang mga Hakbang ng Paglalaro ng Standard Deviation

Ang mga tayo ay gagawa ng isang buong halimbawa ng tunay na mga numero:

Dataset: Ang mga marka ng pagsusulit ng 6 mag-aaral: {72, 85, 91, 68, 79, 88}

Step 1 — Maghanap ng talahanayan: (72 + 85 + 91 + 68 + 79 + 88) / 6 = 483 / 6 = 80.5

Step 2 — Maghanap ng bawat pagbabago mula sa talahanayan at isquare ito:

Score (xᵢ)	Deviation (xᵢ − x̄)	Squared (xᵢ − x̄)²
72	72 − 80.5 = −8.5	72.25
85	85 − 80.5 = +4.5	20.25
91	91 − 80.5 = +10.5	110.25
68	68 − 80.5 = −12.5	156.25
79	79 − 80.5 = −1.5	2.25
88	88 − 80.5 = +7.5	56.25
Sum	0 (palaging)	417.50

Step 3 — Maglalaro ng pagbabago: Sample variance (n−1) = 417.50 / 5 = 83.50

Step 4 — Maghanap ng square root para sa standard deviation: s = √83.50 ≈ 9.14

Pagsasama: Ang karamihan ng mga marka ay nasa paligid ng 9.14 puntos mula sa 80.5 na talahanayan. Ang mga marka ng pagsusulit ay nasa pagitan ng 71.4 at 89.6 (talahanayan ± 1 SD) kung ito ay isang normal na nakalagay na populasyon.

Ang Empirical Rule at Normal Distribution

Para sa mga datos na sumusunod sa isang normal distribution (bell curve), ang Empirical Rule (68-95-99.7 rule) ay nagtuturo sa iyo kung exactly magkano ang mga halaga na nasa bawat standard deviation range:

Range	Percentage of Data	Halimbawa (mean=100, SD=15)
Mean ± 1 SD	~68.27%	85 to 115
Mean ± 2 SD	~95.45%	70 to 130
Mean ± 3 SD	~99.73%	55 to 145
Beyond ± 3 SD	~0.27%	Below 55 or above 145

Ang klasikong aplikasyon ay IQ scores: mean = 100, SD = 15. Ang IQ ng 130 ay 2 SDs sa itaas ng mean — lamang tungkol sa 2.3% ng mga tao ang nakakakuha ng ganitong mataas. Ang IQ ng 145 ay 3 SDs sa itaas ng mean — tungkol sa 0.13% ng mga tao (halos 1 sa 750).

Sa kalidad ng kontrol, ang Six Sigma standard ay kinakailangan ang mga proseso na may mas mababang 3.4 defects per million opportunities — katumbas sa pagpapanatili ng pagbabago sa loob ng ±6 standard deviations mula sa target, na naglalayong 0.00034% defect rate. Ito ang estadistika na basehan ng Six Sigma manufacturing quality programs.

Hindi lahat ng datos ay normal na napapaloob. Ang mga distribusyon ng kita ay right-skewed (mga ilang mababang nagtataglay ng mataas na kinita ang humahati sa kanan). Sa mga kaso na ito, ang median at interquartile range ay maaaring mas makatutulong kaysa sa mean at standard deviation.

Ang Ibang Statistika: Mean, Median, Variance, at Marami Pa

Ang standard deviation ay pinakamahusay na makatutulong sa iba pang descriptibong estadistika. Dito kung paano sila gumagana kasama:

Mean (arithmetic average): Suma ng lahat ng mga halaga ÷ bilang. Sensitive sa outliers — isang ekstremong halaga ay maaaring makapagpabago ng mean.
Median: Ang gitnang halaga kapag ang datos ay sinort. Mas matatagpuan sa outliers kaysa sa mean. Para sa {1, 2, 3, 4, 100}: mean = 22, median = 3.
Mode: Ang pinakamaraming nagaganap na halaga. Maaaring magamit para sa kategoryal na datos; ang isang dataset ay maaaring may maraming mga mode o walang.
Range: Maximum − minimum. Simple pero sensitive sa outliers; hindi naglalarawan ng hugis ng distribusyon.
Variance (σ² o s²): Ang kuwadra ng standard deviation. Maaaring magamit sa matematika ngunit mas mahirap itong intindihin dahil ito ay sa squared units. Halimbawa: kung ang mga taas ay sa sentimetro, ang variance ay sa cm² — na walang pisikal na kahulugan.
Coefficient of Variation (CV): (Standard deviation / mean) × 100%. Nagbibigay ng pagkakataon sa paghahambing ng pagbabago sa iba't ibang dataset na may iba't ibang mga mean. Isang CV ng 10% ay nangangahulugang ang SD ay 10% ng mean — maaaring magamit sa pagsasahod at biyolohiya.
Standard Error of the Mean (SEM): SD ÷ √n. Naglalarawan ang presyurasyon ng sample mean bilang isang estimate ng populasyon mean. Kapag ang sample size ay lumalaki, ang SEM ay mawawalan ng laki — mas malaking mga sample ay nagbibigay ng mas matatag na mga estimate.

Standard Deviation sa Finance, Agham, at Sports

Ang standard deviation ay may mga espesipikong, praktikal na interpretasyon sa iba't ibang larangan:

Finance — Pagtukoy ng panganib: Sa finance, ang standard deviation ng mga return = volatility = panganib. Ang isang stock na nagbabalik 10% taon-taon na may SD ng 15% ay may 68% na pag-asa ng pagbabalik sa pagitan ng −5% at +25% sa anumang taon. Ang S&P 500 ay may taunang SD na humigit-kumulang 15–20%. Ang mga portfolio ng bond ay karaniwang may SD ng 3–7%. Ang performance na pinalitan ng panganib (Sharpe Ratio) = (return − rate ng walang panganib) / SD — ang mas mataas, ang mas maganda.

Agham — Kalidad ng kontrol at pagmidya: Ang mga instrumento ng laboratoryo ay nagrereport ng mga pagmidya bilang mean ± SD. Ang isang termometro na 37.2 ± 0.3°C ay nangangahulugang ang pagmidya ay nasa loob ng 0.3°C ng tunay na halaga ng 68% ng pag-asa. Sa mga clinical trials, ang estadistika na kahalagahan ay karaniwang binibigyan ng kahulugan bilang ang epekto ng paggamot na higit sa 2 SDs mula sa mean ng grupo ng kontrol (p < 0.05).

Sports analytics: Ang pagkakaroon ng katatagan ng isang manlalaro ay pinapakilala sa SD. Ang isang manlalaro na nagbabalik 25 puntos kada laro na may SD ng 3 ay mas matatag kaysa sa isang manlalaro na nagbabalik 25 na may SD ng 10. Ang pagbabalita ng panahon ay gumagamit ng mga modelo ng ensemble kung saan ang SD ng mga pagtataya ng temperatura ay nagpapahiwatig ng pag-asa — isang makapal na SD ay nangangahulugang ang mga tagapagbalita ay nagkakasundong magkaisa; isang malalalim na SD ay nangangahulugang mababa ang pag-asa.

Edukasyon: Ang mga Z-scores ay nagpapahiwatig ng kung gaano karaming standard deviation ang isang estudyante ay mula sa mean ng klase: Z = (score − mean) / SD. Ang isang Z-score na +2 ay nangangahulugang ang pag-score ng +2 SDs mula sa mean — mas mabuti kaysa sa humigit-kumulang 97.7% ng mga mag-aaral. Ang mga pagsusulit na standard ay disenyo upang ang mga score ay sumunod sa isang halos normal na distribusyon, na nagpapahiwatig ng mga paghahambing ng percentile.

Mga Kadalasang Tinatanong

Anong pagkakaiba ng standard deviation at variance?

Variance ay ang average ng mga pagkakaiba mula sa mean. Ang standard deviation ay ang square root ng variance. Ang dalawa ay nagpapamalas sa pagkalawak, ngunit ang standard deviation ay sa parehong yunit ng datos (mas madaling interpretyahan), habang ang variance ay sa squared yunit. Ang isang dataset ng taas sa cm ay may variance sa cm² — hindi makabuluhan. Ang SD sa cm ay direktang kumpara sa orihinal na mga pagbasa.

Kailan gamitin ang populasyon vs sample standard deviation?

Gamitin ang populasyon SD (σ, ibahagi sa N) kapag may datos ka para sa buong populasyon na inaangkin mo — lahat ng mag-aaral sa isang partikular na klase, lahat ng empleyado sa isang kumpanya. Gamitin ang sample SD (s, ibahagi sa n−1) kapag ang datos mo ay isang bahagi ng isang mas malaking populasyon at ikakalap mo ang populasyon na pagkalawak — isang survey sample, mga partisipante sa clinical trial, mga sample ng kalidad ng pagkontrol mula sa isang production run.

Anong kahulugan ng mataas o mababang standard deviation?

Ang mababang standard deviation ay nangangahulugang ang mga datos ay nakakalat nang malapit sa mean — konsistensiya, mababang pagkalawak. Ang mataas na standard deviation ay nangangahulugang ang datos ay nakakalat nang malawak — mababang pagkalawak. Walang isa sa dalawa ay mas mahusay; ito ay depende sa konteksto. Sa paggawa ng mga produkto, ang mababang SD ay kailangan (konsistensiya). Sa mga pagbabayad sa investimento, ang ilang mananaliksik ay tumatanggap ng mas mataas na SD para sa mas mataas na potensyal na pagbabayad.

Anong kahulugan ng Z-score at paano ito nauugnay sa standard deviation?

Ang Z-score ay nagpapamalas ng kung gaano maraming standard deviation ang isang datos ay mula sa mean: Z = (value − mean) / SD. Ang Z-score na 0 = exactly average. Z = +1 = 1 SD sa itaas ng mean (84th percentile). Z = −2 = 2 SDs sa itaas ng mean (2.3rd percentile). Ang Z-scores ay nagpapahintulot na makapagpapalitan ang mga halaga mula sa iba't ibang dataset na may iba't ibang mga saklaw.

Anong kahulugan ng standard error at paano ito iba sa standard deviation?

Ang standard deviation ay nagpapamalas sa pagkalawak ng mga indibidwal na datos. Ang standard error ng mean (SEM = SD/√n) ay nagpapamalas sa pagkakatiwasay ng sample mean bilang isang estimate ng tunay na populasyon mean. Sa tumaas ang sample size, ang SEM ay bumaba (mas maraming datos = mas matibay na estimate), ngunit ang SD ay hindi nangangailangan ng pagbabago. Ang SEM ay ginagamit sa mga panahon ng pagkakatiwasay; ang SD ay nagpapamalas sa distribusyon ng datos mismo.

Maari bang maging negative ang standard deviation?

Wala. Ang standard deviation ay palaging zero o positibo. Ito ay zero lamang kapag lahat ng mga halaga ng datos ay magkakatulad (walang pagkalawak ng anuman). Dahil ito ay binubuo bilang isang square root ng isang sum ng mga kuwadra, ito ay hindi maaaring negative. Ang negative na variance o standard deviation ay nagpapahiwatig ng isang pagkakamali sa paglutas.

Papaano ang mga outliers na nag-aangkin sa standard deviation?

Ang mga outliers ay maaaring magdramatikong magpapalaki sa standard deviation dahil ang mga pagkakaiba ay kuwadra — ang malalaking pagkakaiba mula sa mean ay nagdadala ng malaki. Halimbawa, sa {10, 11, 10, 12, 100}: pagtanggal ng outlier (100) ay bumababa ang SD mula sa ~38 patungong ~0.9. Kapag may mga outliers, ang median at interquartile range (IQR) ay mas matibay na mga hakbang ng sentro at pagkalawak.

Anong kahulugan kung standard deviation ay zero?

Ang isang standard deviation na zero ay nangangahulugang ang lahat ng mga halaga sa dataset ay magkakatulad — walang pagkalawak ng anuman. Halimbawa, {5, 5, 5, 5, 5} ay may mean = 5 at SD = 0. Ito ay nangyayari sa mga dataset na artificial o napakababa. Sa mga praktikal na datos, SD = 0 ay karaniwang nagpapahiwatig ng isang pagkakamali sa pagkolekta ng datos o mga pagbasa na magkakatulad.