Υπολογιστής τυπικής απόκλισης
Υπολογίστε τυπική απόκλιση, διακύμανση, μέσο όρο και πολλά άλλα για οποιοδήποτε σύνολο δεδομένων. Υποστηρίζει υπολογισμούς πληθυσμού και δείγματος. Δωρεάν λύση βήμα προς βήμα.
Τι Είναι η Τυποποιημένη Απόκλιση και Γιατί Έχει Σημασία;
Μέτρα τυπικής απόκλισηςπόσο διασκορπισμένα είναι τα δεδομένα σας γύρω από το μέσο όρο (μέσο όρο)Μικρή τυπική απόκλιση σημαίνει ότι οι τιμές συγκεντρώνονται στενά γύρω από το μέσο όρο· μεγάλη τυπική απόκλιση σημαίνει ότι οι τιμές είναι ευρέως διασκορπισμένες.
Δύο σύνολα δεδομένων μπορούν να έχουν τον ίδιο μέσο όρο αλλά εντελώς διαφορετικές κατανομές -- η τυπική απόκλιση καταγράφει αυτή τη διαφορά:
- Σύνολο δεδομένων Α: {9, 10, 10, 11, 10} - Μέσος όρος = 10, SD ~ 0,63 (σφιχτό σύμπλεγμα)
- Συγκρότημα δεδομένων Β: {2, 5, 10, 15, 18} -- Μέσος όρος = 10, SD ~ 5,83 (ευρέως διαδεδομένη)
Και οι δύο έχουν μέσο όρο 10, αλλά το σύνολο δεδομένων Β είναι σχεδόν 10 φορές πιο μεταβλητό.
Η τυπική απόκλιση σημειώνεταισ (σφραγίδα)για πληθυσμό καιsΕίναι η τετραγωνική ρίζα της διακύμανσης, εκφρασμένη στις ίδιες μονάδες με τα αρχικά δεδομένα -- κάνοντάς την πιο ερμηνεύσιμη από τη διακύμανση μόνη της.
Οι εφαρμογές καλύπτουν σχεδόν όλους τους τομείς: τον έλεγχο ποιότητας (παρασκευάζονται τα μέρη με συνέπεια εντός των ορίων ανοχής;), τη χρηματοδότηση (επενδυτικός κίνδυνος = μεταβλητότητα απόδοσης), την ιατρική (είναι η ανάγνωση ενός ασθενούς εντός 2 SD του φυσιολογικού;), την εκπαίδευση (πώς κατανέμονται οι βαθμολογίες των εξετάσεων;), και την αθλητική ανάλυση (πόσο συνεπής είναι η απόδοση ενός αθλητή;).
Ο πληθυσμός έναντι της τυπικής απόκλισης του δείγματος
Η πιο σημαντική επιλογή κατά τον υπολογισμό της τυπικής απόκλισης είναι αν εργάζεστε μεπληθυσμός(όλα τα πιθανά σημεία δεδομένων) ήδείγμαΑυτό καθορίζει τον τύπο που πρέπει να χρησιμοποιηθεί και επηρεάζει το αποτέλεσμα.
Τυπική απόκλιση του πληθυσμού (σ):Χρησιμοποιήστε όταν έχετε δεδομένα για ολόκληρη την ομάδα που μελετάτε.
όπου: μ = μέσος όρος πληθυσμού, N = αριθμός τιμών, Σ = άθροισμα όλων των τιμών.
Τυποποιημένη απόκλιση (-ες) του δείγματος:Χρησιμοποιήστε όταν τα δεδομένα σας είναι ένα δείγμα που προέρχεται από μεγαλύτερο πληθυσμό.
Όπου: x̄ = μέσος όρος δείγματος, n = αριθμός τιμών στο δείγμα, (n-1) =Διόρθωση του Μπέσελ.
Η διόρθωση του Μπέσελ διαιρείται με (n-1) αντί για n επειδή τα δείγματα τείνουν να υποτιμούν την πραγματική διακύμανση του πληθυσμού - ιδιαίτερα για μικρά δείγματα.αμερόληπτος εκτιμητήςτης διακύμανσης του πληθυσμού.
Ποιο να χρησιμοποιήσω;
- Πληθυσμός SD:Έχετε δεδομένα για όλους τους μαθητές σε μια συγκεκριμένη τάξη, όλα τα αποτελέσματα εξετάσεων από μια συγκεκριμένη εξέταση, όλους τους υπαλλήλους σε μια συγκεκριμένη εταιρεία.
- Δείγμα SD:Ερευνήσατε 500 Αμερικανούς για το εισόδημα (με βάση όλους τους Αμερικανούς), μετρήσατε 30 συσκευασίες από μια σειρά παραγωγής (με βάση όλες τις συσκευασίες), οποιαδήποτε επιστημονική μελέτη με δείγμα.
Υπολογισμός της τυπικής απόκλισης βήμα προς βήμα
Ας δούμε ένα πλήρες παράδειγμα με πραγματικούς αριθμούς:
Σύνολο δεδομένων:Αποτελέσματα τεστ 6 μαθητών: {72, 85, 91, 68, 79, 88}
Βήμα 1 -- Βρείτε το μέσο όρο:(72 + 85 + 91 + 68 + 79 + 88) / 6 = 483 / 6 =80,5
Βήμα 2 -- Βρείτε κάθε απόκλιση από το μέσο όρο και το τετράγωνο:
| Σκορ (xi) | Απόκλιση (xi - x̄) | Τετραγωνισμός (xi - x̄) 2 |
|---|---|---|
| 72 | 72 - 80,5 = -8,5 | 72,25 εκατ. |
| 85 | 85 - 80,5 = +4,5 | 20 και 25 |
| 91 | 91 - 80,5 = +10,5 | 110,25 εκατ. |
| 68 | 68 - 80,5 = - 12,5 | 156,25 |
| 79 | 79 - 80,5 = -1,5 | 2,25 εκατ. |
| 88 | 88 - 80,5 = +7,5 | 56,25 |
| Σύνολο | 0 (πάντα) | 417,50 χλμ. |
Βήμα 3 - Υπολογισμός διακύμανσης:Διακύμανση του δείγματος (n-1) = 417,50 / 5 = 83,50
Βήμα 4 -- Πάρτε την τετραγωνική ρίζα για την τυπική απόκλιση:s = √83.50 ~9,1 4
Ερμηνεία:Περίπου το 68% των αποτελεσμάτων θα αναμενόταν μεταξύ 71,4 και 89,6 (μέσος όρος +/- 1 SD) αν πρόκειται για ένα κανονικά κατανεμημένο πληθυσμό.
Ο εμπειρικός κανόνας και η κανονική κατανομή
Για δεδομένα που ακολουθούν μιακανονική κατανομή (καμπύλη καμπύλης), ο Εμπειρικός Κανόνας (68-95-99,7) σας λέει ακριβώς πόσες τιμές εμπίπτουν σε κάθε περιοχή τυπικής απόκλισης:
| Εμβέλεια | Ποσοστό των δεδομένων | Παράδειγμα (μέσος όρος=100, SD=15) |
|---|---|---|
| Μέσος όρος +/- 1 SD | ~68,27% | 85 έως 115 |
| Μέσος όρος +/- 2 SD | ~ 95,45% | 70 έως 130 |
| Μέσος όρος +/- 3 SD | ~99,73% | 55 έως 145 |
| Πέρα από +/- 3 SD | ~ 0,27% | Κάτω από 55 ή άνω 145 |
Η κλασική εφαρμογή είναι οι βαθμολογίες IQ: μέσος όρος = 100, SD = 15. Ένας IQ 130 είναι 2 SDs πάνω από τον μέσο όρο - μόνο περίπου 2,3% των ανθρώπων έχουν τόσο υψηλή βαθμολογία. Ένας IQ 145 είναι 3 SDs πάνω από τον μέσο όρο - περίπου 0,13% των ανθρώπων (περίπου 1 στους 750).
Στον έλεγχο ποιότητας, ηΈξι ΣίγκμαΤο πρότυπο απαιτεί οι διαδικασίες να έχουν λιγότερα από 3,4 ελαττώματα ανά εκατομμύριο ευκαιρίες - ισοδύναμο με τη διατήρηση της διακύμανσης εντός +/-6 τυπικών αποκλίσεων από τον στόχο, αφήνοντας μόνο 0,00034% ποσοστό ελαττωμάτων.
Δεν είναι όλα τα δεδομένα κανονικά κατανεμημένα. Οι κατανομές εισοδήματος είναι δεξιόστροφες (μερικοί πολύ υψηλοί εισοδηματίες τεντώνουν τη δεξιά ουρά).
Άλλα στατιστικά μέτρα: Μέσος όρος, διάμεσος όρος, διακύμανση και άλλα
Η τυπική απόκλιση είναι πιο σημαντική παράλληλα με άλλες περιγραφικές στατιστικές.
- Μέσος όρος (αριθμητικός μέσος όρος):Το άθροισμα όλων των τιμών ÷ αριθμός. Ευαίσθητο στις εξωτερικές τιμές - μια ακραία τιμή μπορεί να μετατοπίσει σημαντικά τον μέσο όρο.
- Μέσος όρος:Η μέση τιμή όταν ταξινομούνται τα δεδομένα.
- Τρόπος:Χρήσιμη για κατηγοριοποιημένα δεδομένα· ένα σύνολο δεδομένων μπορεί να έχει πολλαπλούς τρόπους ή κανένα.
- Διάσταση:Μέγιστο - ελάχιστο. Απλό αλλά ευαίσθητο στις εξωτερικές τιμές· δεν περιγράφει το σχήμα κατανομής.
- Διακύμανση (σ2 ή s2):Το τετράγωνο της τυπικής απόκλισης. Χρήσιμο μαθηματικά αλλά πιο δύσκολο να ερμηνευτεί επειδή είναι σε τετραγωνικές μονάδες. Παράδειγμα: αν τα ύψη είναι σε εκατοστά, η απόκλιση είναι σε cm2 - που δεν έχει καμία φυσική σημασία.
- Συντελεστής διακύμανσης (CV):Επιτρέπει τη σύγκριση της μεταβλητότητας σε σύνολα δεδομένων με διαφορετικά μέσα. Ένα CV 10% σημαίνει ότι το SD είναι 10% του μέσου - χρήσιμο στη χρηματοδότηση και τη βιολογία.
- Τυπικό σφάλμα του μέσου όρου (SEM):SD ÷ √n. Μετρά την ακρίβεια του μέσου όρου του δείγματος ως εκτίμηση του μέσου όρου του πληθυσμού. Καθώς το μέγεθος του δείγματος αυξάνεται, το SEM συρρικνώνεται - μεγαλύτερα δείγματα δίνουν πιο ακριβείς εκτιμήσεις.
Τυπική απόκλιση στα οικονομικά, την επιστήμη και τον αθλητισμό
Η τυπική απόκλιση έχει συγκεκριμένες, πρακτικές ερμηνείες σε διάφορους τομείς:
Χρηματοοικονομικά -- Μέτρηση του επενδυτικού κινδύνου:Στη χρηματοδότηση, η τυπική απόκλιση των αποδόσεων = μεταβλητότητα = κίνδυνος. Μια μετοχή που αποδίδει 10% ετησίως με SD 15% έχει 68% πιθανότητα επιστροφής μεταξύ -5% και +25% σε οποιοδήποτε δεδομένο έτος.
Επιστήμη - Έλεγχος και μέτρηση της ποιότητας:Τα εργαλεία του εργαστηρίου αναφέρουν τις μετρήσεις ως μέσο όρο +/- SD. Μια ανάγνωση θερμόμετρου 37,2 +/- 0,3 ° C σημαίνει ότι η μέτρηση είναι εντός 0,3 ° C της πραγματικής τιμής με 68% αξιοπιστία. Σε κλινικές δοκιμές, η στατιστική σημασία ορίζεται συνήθως ως το αποτέλεσμα της θεραπείας που είναι περισσότερο από 2 SD από το μέσο όρο της ομάδας ελέγχου (p < 0,05).
Αθλητικές αναλύσεις:Η συνέπεια του παίκτη ποσοτικοποιείται με SD. Ένας παίκτης μπάσκετ με μέσο όρο 25 πόντους ανά παιχνίδι με SD 3 είναι πιο αξιόπιστος από έναν με μέσο όρο 25 με SD 10.
Εκπαίδευση:Οι βαθμολογίες Z εκφράζουν πόσες τυπικές αποκλίσεις έχει η βαθμολογία ενός μαθητή από το μέσο όρο της τάξης: Z = (score - mean) / SD. Μια βαθμολογία Z +2 σημαίνει βαθμολογία 2 SDs πάνω από το μέσο όρο - καλύτερη από περίπου το 97,7% των μαθητών.
Συχνές ερωτήσεις
Ποια είναι η διαφορά μεταξύ τυπικής απόκλισης και απόκλισης;
Η απόκλιση είναι ο μέσος όρος των τετραγωνικών αποκλίσεων από το μέσο όρο. Η τυπική απόκλιση είναι η τετραγωνική ρίζα της απόκλισης. Και οι δύο μετρήσεις εξαπλώνονται, αλλά η τυπική απόκλιση είναι στις ίδιες μονάδες με τα δεδομένα (ευκολότερο να ερμηνευτεί), ενώ η απόκλιση είναι σε τετραγωνικές μονάδες. Ένα σύνολο δεδομένων ύψους σε cm έχει απόκλιση σε cm2 - δεν έχει νόημα. Η SD σε cm είναι άμεσα συγκρίσιμη με τις αρχικές μετρήσεις.
Πότε πρέπει να χρησιμοποιήσω την τυπική απόκλιση πληθυσμού έναντι δείγματος;
Χρησιμοποιήστε το SD πληθυσμού (σ, διαιρείται με N) όταν έχετε δεδομένα για ολόκληρο τον πληθυσμό που περιγράφετε -- όλους τους μαθητές σε μια συγκεκριμένη τάξη, όλους τους υπαλλήλους σε μια εταιρεία. Χρησιμοποιήστε το SD δείγματος (s, διαιρείται με n-1) όταν τα δεδομένα σας είναι ένα υποσύνολο ενός μεγαλύτερου πληθυσμού και εκτιμάτε την μεταβλητότητα του πληθυσμού -- ένα δείγμα έρευνας, συμμετέχοντες σε κλινικές δοκιμές, δείγματα ελέγχου ποιότητας από μια σειρά παραγωγής.
Τι σημαίνει υψηλή ή χαμηλή τυπική απόκλιση;
Μια χαμηλή τυπική απόκλιση σημαίνει ότι τα σημεία δεδομένων είναι συγκεντρωμένα στενά γύρω από το μέσο όρο - συνέπεια, χαμηλή μεταβλητότητα. Μια υψηλή τυπική απόκλιση σημαίνει ότι τα δεδομένα είναι ευρέως διαδεδομένα - υψηλή μεταβλητότητα. Κανένα από τα δύο δεν είναι εγγενώς καλύτερο· εξαρτάται από το πλαίσιο.
Τι είναι το Z-score και πώς σχετίζεται με την τυπική απόκλιση;
Ένα Z-score μετρά πόσες τυπικές αποκλίσεις έχει ένα σημείο δεδομένων από το μέσο όρο: Z = (αξία - μέσο όρο) / SD. Ένα Z-score του 0 = ακριβώς μέσο όρο. Z = +1 = 1 SD πάνω από το μέσο όρο (84ο εκατοστημόριο). Z = -2 = 2 SD κάτω από το μέσο όρο (2,3ο εκατοστημόριο).
Τι είναι το τυπικό σφάλμα και πώς διαφέρει από την τυπική απόκλιση;
Η τυπική απόκλιση περιγράφει την εξάπλωση των μεμονωμένων σημείων δεδομένων. Το τυπικό σφάλμα του μέσου όρου (SEM = SD/√n) περιγράφει την ακρίβεια του μέσου όρου του δείγματος ως εκτίμηση του πραγματικού μέσου όρου του πληθυσμού. Καθώς το μέγεθος του δείγματος αυξάνεται, το SEM μειώνεται (περισσότερα δεδομένα = πιο ακριβής εκτίμηση), αλλά το SD δεν αλλάζει απαραίτητα.
Μπορεί η τυπική απόκλιση να είναι αρνητική;
Όχι. Η τυπική απόκλιση είναι πάντα μηδενική ή θετική. Είναι ίση με το μηδέν μόνο όταν όλες οι τιμές των δεδομένων είναι πανομοιότυπες (χωρίς καμία μεταβλητότητα). Δεδομένου ότι υπολογίζεται ως η τετραγωνική ρίζα ενός αθροίσματος τετραγώνων, δεν μπορεί να είναι αρνητική. Η αρνητική διακύμανση ή η τυπική απόκλιση θα υποδεικνύει ένα σφάλμα υπολογισμού.
Πώς επηρεάζουν οι αποκλίσεις την τυπική απόκλιση;
Οι απόκεντρες τιμές μπορούν να διογκώσουν δραματικά την τυπική απόκλιση επειδή οι απόκλισεις είναι τετραγωνισμένες - οι μεγάλες αποκλίσεις από το μέσο όρο συμβάλλουν δυσανάλογα.
Τι σημαίνει αν η τυπική απόκλιση είναι ίση με το μηδέν;
Μια τυπική απόκλιση του μηδέν σημαίνει ότι όλες οι τιμές στο σύνολο δεδομένων είναι πανομοιότυπες - δεν υπάρχει καμία μεταβλητότητα.