Mean, Median & Mode Calculator
Calculate mean, median, mode, range, and other statistics for any data set. Use this free online math calculator for instant, accurate results. No signup.
Ποια είναι τα Μέτρα Κεντρικής Τάσης
Στα στατιστικά, τα μέτρα κεντρικής τάσης είναι μονά τιμές που περιγράφουν το κέντρο ή το τυπικό όγκο ενός ογκού. Οι τρεις πιο σημαντικές είναι ο μέσος όρος, ο μεσόλογος και ο moda — κάθε ένας λέει κάτι διαφορετικό για τα δεδομένα και κάθε ένας είναι πιο κατάλληλος σε διαφορετικές καταστάσεις.
Δεδομένα: βαθμοί εξέτασης {55, 60, 70, 75, 75, 80, 95}. Κάθε μέτρο δίνει διαφορετική άποψη:
| Μέτρο | Αξία | Πώς Υπολογίζεται | Καλύτερο για |
|---|---|---|---|
| Μέσος όρος (μέσος όρος) | 72,9 | (55+60+70+75+75+80+95) / 7 | Συμμετρικές κατανομές |
| Μέσος όρος (μέσος όρος) | 75 | Μέσος όρος των ταξινομημένων δεδομένων | Ασυμμετρικές κατανομές, ανωμαλίες |
| Μονότονος (περισσότερο συχνό) | 75 | Περισσότερο επαναλαμβανόμενο όγκο | Κατηγοριακά δεδομένα, αναζήτηση κορυφών |
| Περίγραμμα | 40 | Μέγιστος - Μικρότερο = 95 - 55 | Μέτρηση διασποράς |
Κανένα από τα μέτρα δεν είναι παντοδύναμο. Ένας στατιστικός επιλέγει το κατάλληλο μέτρο με βάση τη μορφή της κατανομής, την παρουσία ανωμαλιών και την ερώτηση που γίνεται.
Μέσος Όρος (Αριθμητικός Μέσος Όρος): Πώς να Τον Υπολογίσειτε
O αριθμητικός μέσος όρος είναι η άθροιση όλων των τιμών διαιρεμένη με τον αριθμό των τιμών. Είναι το πιο συχνά χρησιμοποιούμενο μέτρο κεντρικής τάσης και είναι αυτό που σημαίνει περισσότερο οι άνθρωποι όταν λένε "μέσος όρος".
Συντελεστής: Μέσος όρος (x̄) = (Σxᵢ) / n
Πού Σxᵢ είναι η άθροιση όλων των τιμών και n είναι ο αριθμός.
Παράδειγμα: Δεδομένα = {3, 7, 8, 5, 12, 4, 9, 6}
- Άθροιση: 3 + 7 + 8 + 5 + 12 + 4 + 9 + 6 = 54
- Αριθμός: 8 τιμές
- Μέσος όρος = 54 / 8 = 6,75
O μέσος όρος είναι ευαίσθητος στις ανωμαλίες — οι ακραίες τιμές_pull τον μέσο όρο προς αυτές. Για παράδειγμα, αν μια τιμή στο παραπάνω σύνολο ήταν 100 αντί για 12, ο μέσος όρος θα ανέβηκε σε (54 − 12 + 100) / 8 = 142 / 8 = 17,75, μακριά από το "τυπικό" όγκο των υπόλοιπων δεδομένων.
Άλλες τύποι μέσων για ειδικούς σκοπούς:
- Γεωμετρικός μέσος όρος: ⁿ√(x₁ × x₂ × … × xₙ) — χρησιμοποιείται για τις ταχύτητες ανάπτυξης, τακτικές, αναλογίες
- Χορδικός μέσος όρος: n / (1/x₁ + 1/x₂ + … + 1/xₙ) — χρησιμοποιείται για ταχύτητες, τακτικές, τιμές ανά μονάδα
- Βαρυμετρικός μέσος όρος: Σ(wᵢxᵢ) / Σwᵢ — χρησιμοποιείται όταν τα δεδομένα έχουν διαφορετική σημασία (π.χ. βαθμοί)
Μέσος Όρος: Η Μέση Τιμή
O μέσος όρος είναι η μέση τιμή ενός ογκού όταν ταξινομηθεί σε αύξοντα κράμα. Διαχωρίζει την κατανομή ακριβώς στο μέσο: 50% των τιμών πέφτουν κάτω από τον μέσο όρο και 50% πάνω από αυτόν.
Για ένα περιθώριο με περιθώριο: Μέσος όρος = η (n+1)/2η τιμή.
Για ένα περιθώριο με περιθώριο: Μέσος όρος = μέσος όρος των n/2 και (n/2 + 1)ων τιμών.
| Ογκός Δεδομένων | n | Ταξινομημένο | Μέσος Όρος |
|---|---|---|---|
| {4, 1, 9, 2, 6} | 5 (άριθμός) | {1, 2, 4, 6, 9} | 4 (3η τιμή) |
| {7, 3, 8, 5} | 4 (περίθορος) | {3, 5, 7, 8} | (5+7)/2 = 6 |
| {10, 20, 30, 40} | 4 (περίθορος) | {10, 20, 30, 40} | (20+30)/2 = 25 |
| {1, 1, 1, 1000} | 4 (περίθορος) | {1, 1, 1, 1000} | (1+1)/2 = 1 |
Σημειώστε το τελευταίο παράδειγμα: ο μέσος όρος {1, 1, 1, 1000} = 250,75, αλλά ο μέσος όρος = 1. Αυτό είναι ένα τέλειο παράδειγμα γιατί ο μέσος όρος προτιμάται έναντι του μέσου όρου για ασυμμετρικές κατανομές με ανωμαλίες — ο μέσος όρος της ετήσιας εισόδημα, οι τιμές των ακινήτων και οι διάρκεια των νοσηλειών είναι όλα αναφερόμενα ως μέσο όρος επειδή κάποιες εξαιρετικά υψηλές τιμές θα κάνουν τον μέσο όρο ανεπίσημο για την αντιπροσωπευτική εμπειρία.
Μοντέλο: Η Περισσότερη Συχνότητα
Το μοντέλο είναι η τιμή που εμφανίζεται πιο συχνά σε ένα σύνολο δεδομένων. Ένα σύνολο δεδομένων μπορεί να έχει:
- Κανένα μοντέλο: όλες οι τιμές εμφανίζονται ισόποσες (π.χ., {1, 2, 3, 4, 5})
- Μοντέλο (μονόμορφο): μια τιμή εμφανίζεται περισσότερες από όλες τις άλλες (π.χ., {1, 2, 2, 3, 4} → μοντέλο = 2)
- Δύο μοντέλα (δίμορφο): δύο τιμές ισοδύναμες για την πιο συχνή (π.χ., {1, 1, 2, 3, 3} → μοντέλα = 1 και 3)
- Πολλαπλά μοντέλα (πολυμορφο): τρεις ή περισσότερες τιμές ισοδύναμες για την πιο συχνή
Το μοντέλο είναι ιδιαίτερα χρήσιμο για:
- Κατηγοριακά δεδομένα: "Ποιος είναι ο πιο δημοφιλής μέγεθος παπουτσιού;" (μέγεθος 10 για τους άνδρες των ΗΠΑ, για παράδειγμα)
- Διακριτικά δεδομένα: "Πόσοι παιδιά έχουν συνήθως οι οικογένειες;" (συνήθως 2, το μοντέλο)
- Σχήμα κατανομής: Ένα διμορφικό σχήμα (δύο κορυφές) υποδηλώνει δύο διακριτές υποπληθυσμούς στα δεδομένα σας — ένα κριτικό σημείο σε εξερευνητική ανάλυση
| Σύνολο Δεδομένων | Μοντέλο | Τύπος |
|---|---|---|
| {1, 2, 3, 4, 5} | Κανένα | Κανένα μοντέλο |
| {2, 4, 4, 6, 8} | 4 | Μονόμορφο |
| {1, 1, 3, 5, 5} | 1 και 5 | Διμορφικό |
| {α, β, β, γ, γ, δ, δ} | β, γ, δ | Τριμορφικό |
Περίμετρος και Άλλες Μέτρησεις Διασποράς
Αν και ο μέσος όρος, η median και το μοντέλο περιγράφουν το κέντρο μιας κατανομής, οι μέτρησεις διασποράς περιγράφουν πόσο πολύ τα δεδομένα διασκορπίζονται. Είναι εξίσου σημαντικές για την κατανόηση ενός συνόλου δεδομένων.
| Μέτρηση | Φόρμουλα | Παράδειγμα ({2, 4, 4, 6, 8}) | Εύρος Αντίρρησης |
|---|---|---|---|
| Περίμετρος | Μέγιστη − Μικρότερη | 8 − 2 = 6 | Πολύ ευαίσθητη |
| Διαστήριο Τρίτου και Πρώτου Τεταρτηρίσματος (IQR) | Q3 − Q1 | 7 − 3 = 4 | Ανθεκτική |
| Απάντηση (σ²) | Σ(xᵢ − x̄)² / n | 3,44 | Ευαίσθητη |
| Στάνταρντ Διάμετρος (σ) | √Απάντηση | 1,855 | Ευαίσθητη |
| Μέσος Αριθμός Αντίρρησης | Σ|xᵢ − x̄| / n | 1,6 | Μoderate |
Για {2, 4, 4, 6, 8}: μέσος όρος = 4,8, οπότε οι αντίστοιχες αποστάσεις είναι: (2−4,8)²=7,84, (4−4,8)²=0,64, (4−4,8)²=0,64, (6−4,8)²=1,44, (8−4,8)²=10,24. Απάντηση = (7,84+0,64+0,64+1,44+10,24)/5 = 20,8/5 = 4,16. Στάνταρντ Διάμετρος = √4,16 ≈ 2,04.
Η στάνταρντ διάμετρος είναι το εργαλείο των στατιστικών — εμφανίζεται σε δοκιμαστικές δοκιμές, εμπιστευτικές διαστήματα, υπολογισμούς κανονικής κατανομής και ελέγχους διαδικασίας. Μια χαμηλότερη στάνταρντ διάμετρος σημαίνει ότι τα δεδομένα είναι skupμένα γύρω από τον μέσο όρο, μια υψηλότερη στάνταρντ διάμετρος σημαίνει ότι τα δεδομένα είναι πιο διασκορπισμένα.
Πότε να χρησιμοποιήσετε Μέσο Όρο vs Median vs Μοντέλο
Η επιλογή του λάθος κεντρικού μέτρηματος μπορεί να είναι παραπλανητική. Εδώ είναι μια πρακτική οδηγία:
| Σύμπτωση | Επιλεγμένο Μέτρημα | Γιατί |
|---|---|---|
| Συμμετρική κατανομή, χωρίς ανωμαλίες | Μέσος Όρος | Ευκολότερο στατιστικά; χρησιμοποιεί όλα τα δεδομένα |
| Κατανομή με σχήμα | Median | Δεν πιέζεται από εξαιρετικά μεγάλες τιμές |
| Απώλειες / τιμές ακινήτων | Median | Κάποιοι εκατομμυριούχοι στρέφουν τον μέσο όρο προς τα επάνω |
| Κατηγοριακά δεδομένα | Μοντέλο | Ο μέσος όρος / median δεν εφαρμόζονται σε κατηγοριακά δεδομένα |
| Η πιο συνηθισμένη τιμή | Μοντέλο | Διασταυρωμένο απάντηση σε "ποιο είναι ο πιο δημοφιλής;" |
| Μέσες βαθμολογίες / GPA | Μέσος Όρος (βαρεμεριζόμενος) | Όλες οι βαθμολογίες συνεισφέρονται ανάλογα |
| Επιστροφές μετοχών / ποσοστά ανάπτυξης | Γεωμετρικός μέσος όρος | Ληφθεί με σε λογισμό |
| Χρόνια επιβίωσης, διαμονή σε νοσοκομείο | Median | Στρέφεται προς τα δεξιά από τις μακροχρόνιες περιπτώσεις |
Η γνωστή παρατήρηση: "Ο μέσος Αμερικανός έχει ένα στήθος και ένα όρχι" δείχνει γιατί ο μέσος όρος μπορεί να είναι παραπλανητικός για διμορφικές κατανομές. Σε αυτή την περίπτωση, το μοντέλο (διαχωρισμένο από το φύλο) και η median είναι πιο πληροφοριακά περιγραφικά από τον συνολικό μέσο όρο.
Πραγματικές Απάντηση: Μέσος Όρος, Μέσος Αριθμός και Τύπος στην Πράξη
Η κατανόηση του πώς αυτά τα συστατικά εφαρμόζονται σε πραγματικές καταστάσεις χτίζει στατιστική σκέψη:
- Εισοδήματα Αμερικανικών Οικιών (2023): Μέσος όρος ≈ $105,000; Μέσος Αριθμός ≈ $74,580. Η διαφορά αντικατοπτρίζει την αсимμετρία εισοδήματος — ένα μικρό αριθμό πολύ υψηλών εισοδημάτων δραματικά_pulls τον μέσο όρο προς τα επάνω. Οι συζητήσεις πολιτικής χρησιμοποιούν τον μέσο όρο εισοδήματος επειδή καλύπτει καλύτερα το "τυπικό" οικιακό.
- Χρόνοι ολοκλήρωσης δρόμου: Σε ένα δρόμο 10K, ο μέσος χρόνος ολοκλήρωσης μπορεί να είναι υψηλότερος από τον μέσο όρο επειδή οι αργοί περιπάτες σχηματίζουν μια μακρά δεξιά ουρά. Ο μέσος ολοκληρωτής είναι πιο αντιπροσωπευτικός του μέσου-πακέτου δρομέα.
- Ονομασίες μαθημάτων: Αν ένας μαθητής σημειώνει 5/100 και είκοσι άλλοι σημειώνουν 75–95/100, ο μέσος όρος πιέζεται από το εξωτικό στοιχείο. Ο δάσκαλος μπορεί να αναφέρει τον μέσο όρο για να αντιπροσωπεύσει καλύτερα την απόδοση της τάξης.
- Μέγεθοςรอง: Ο τύπος είναι ο πιο δραστικός στατιστικός — οι εμπόροι αποθηκεύουν την μεγαλύτερη αποθήκη στην τυποποιημένη (περισσότερο συνηθισμένη) μέγεθος.
- Ελέγχου ποιότητας: Στην παραγωγή, ο στόχος διασποράς των μέτρησεων προϊόντων καθορίζει την ικανότητα διαδικασίας. Ένας χαμηλός SD σημαίνει σταθερή παραγωγή, ενώ ένας υψηλός SD σημαίνει υψηλά ποσοστά ελαττωμάτων.
Φrequently Asked Questions
Ποιο είναι καλύτερο: η μέση ή η μεσόταξη;
Κανένα δεν είναι παντοτινά καλύτερο — εξυπηρετούν διαφορετικούς σκοπούς. Η μεσόταξη είναι πιο ανθεκτική στα εξωτερικά στοιχεία και αντιπροσωπεύει καλύτερα το "τυπικό" σε διανομές που έχουν κλίση (απώλεια, τιμές ακινήτων, χρόνοι επιβίωσης). Η μέση χρησιμοποιεί όλα τα στοιχεία, είναι μαθηματικά ιδανική για συμμετρικές διανομές και απαιτείται για περαιτέρω στατιστικές υπολογισμούς όπως η στάνταρντ διακύμανση και η υπόθεση δοκιμής. Χρησιμοποιήστε και τις δύο μαζί για να αποκτήσετε μια ολοκληρωμένη εικόνα.
Μπορεί ένα σύνολο δεδομένων να μην έχει κανένα τρόπο;
Ναι. Αν όλα τα στοιχεία εμφανίζονται με ίση συχνότητα, δεν υπάρχει τρόπος (π.χ., {1, 2, 3, 4, 5} — κάθε τιμή εμφανίζεται ακριβώς μια φορά). Ένα σύνολο δεδομένων μπορεί επίσης να είναι πολυμορφικό — διμορφικό (δύο τρόποι: {1, 1, 3, 3, 5}) ή τριμορφικό. Στην πράξη, μια διμορφική διανομή συχνά σημαίνει δύο διαφορετικές ομάδες στο δεδομένο σας, που είναι σημαντική πορεία να εξετάσετε.
Πώς βρίσκω τη μεσόταξη ενός αριθμού ισότιμων τιμών;
Ταξινομήστε τα στοιχεία σε αύξουσα σειρά, στη συνέχεια, μέσο των δύο μέσων αριθμών. Για {2, 4, 6, 8}: οι δύο μέσοι αριθμοί είναι 4 και 6, οπότε μεσόταξη = (4+6)/2 = 5. Για {1, 3, 5, 7, 9, 11}: μέσοι αριθμοί είναι 5 και 7, οπότε μεσόταξη = (5+7)/2 = 6. Η μεσόταξη δεν πρέπει να είναι μια τιμή στο σύνολο δεδομένων.
Τι σημαίνει όταν η μέση = μεσόταξη = τρόπος;
Όταν όλα τα τρία μέτρα είναι ίσα, η διανομή είναι τέλεια συμμετρική και μονομορφική — η κλασική καμπύλη (κανονική διανομή). Αυτό σημαίνει ότι δεν υπάρχουν εξωτερικά στοιχεία που να διαστρέφουν τα δεδομένα, και όλα τα τρία μέτρα είναι ισότιμα περιγραφείς του κέντρου. Στην πράξη, τα πραγματικά δεδομένα σπάνε να επιτύχουν τέλεια συμμετρία, αλλά η συμφωνία μεταξύ μέσης και μεσόταξης υποδεικνύει περίπου συμμετρία.
Ποιος είναι ο συνάφειας μεταξύ μέσης, μεσόταξης και κλίσης;
Σε μια δεξιά κλινωμένη (απώλεια) διανομή: Μέση > Μεσόταξη > Τρόπος. Στην αριστερά κλινωμένη (απώλεια) διανομή: Μέση < Μεσόταξη < Τρόπος. Στη συμμετρική διανομή: Μέση = Μεσόταξη ≈ Τρόπος. Αυτή η σχέση παρέχει μια γρήγορη οπτική έλεγχο: συγκρίνετε μέση και μεσόταξη για να καθορίσετε τη διεύθυνση της κλίσης χωρίς να κοιτάτε ένα γράφημα.
Πώς υπολογίζω τη μέση για τα κατηγοριοποιημένα δεδομένα;
Για τα κατηγοριοποιημένα συχνότητα δεδομένα, χρησιμοποιήστε το μέσο του κάθε κλάσματος διαστήματος: Μέση = Σ(μέσο × συχνότητα) / n. Παράδειγμα: αν 10 μαθητές σημείωσαν 50–60 (μέσο 55), 15 σημείωσαν 60–70 (μέσο 65) και 5 σημείωσαν 70–80 (μέσο 75): Μέση = (10×55 + 15×65 + 5×75) / 30 = (550+975+375)/30 = 1900/30 ≈ 63,3.
Ποιος είναι η διαφορά μεταξύ της μέσης της πληθυσμού και της μέσης της δειγματοληψίας;
Η μέση του πληθυσμού (μ, "μ") υπολογίζεται από κάθε μέλος του πληθυσμού. Η μέση της δειγματοληψίας (x̄, "x-μπαρ") υπολογίζεται από ένα υποσύνολο (δειγμα) που προέρχεται από αυτόν τον πληθυσμό. Η формуλα είναι ίδια, αλλά τα σύμβολα διαφέρουν. Στην πράξη, σχεδόν πάντα εργαζόμαστε με δειγματικές μέσες και τις χρησιμοποιούμε για να εκτιμήσουμε τη μέση του πληθυσμού — που εισάγει σφάλμα δειγματοληψίας και απαιτεί στατιστικές τεχνικές αντίληψης.
Πώς επηρεάζει ένα εξωτερικό στοιχείο τη μέση έναντι τη μεσόταξη;
Τα εξωτερικά στοιχεία επηρεάζουν σοβαρά τη μέση, αλλά έχουν μικρότερο αντίκρισμα στη μεσόταξη. Παράδειγμα: τα δεδομένα {1, 2, 3, 4, 5} έχουν μέση = 3 και μεσόταξη = 3. Προσθέστε ένα εξωτερικό στοιχείο {1, 2, 3, 4, 5, 100}: η μέση ανεβαίνει σε 19,2, αλλά η μεσόταξη αλλάζει μόνο σε (3+4)/2 = 3,5. Αυτή η ανθεκτικότητα κάνει τη μεσόταξη την προτιμώμενη μέτρηση όταν υπάρχουν εξωτερικά στοιχεία ή υποπτεύεστε.
Τι είναι η μεσαία μέση;
Μια μεσαία μέση (ή τριμμένη μέση) αφαιρεί ένα σταθερό ποσοστό των ακραίων τιμών πριν από τον υπολογισμό της μέσης. Για παράδειγμα, μια 10% τριμμένη μέση στο {1, 2, 3, 4, 5, 6, 7, 8, 9, 100}: αφαιρέστε τα κάτω και τα πάνω 10% (περίπου 1 τιμή κάθε ένα), αφήνοντας {2, 3, 4, 5, 6, 7, 8, 9}; μέση = 5,5. Οι τριμμένες μέσες χρησιμοποιούνται σε συστήματα βαθμολογίας (ολυμπιακά κριτήρια, πατινάζ) και οικονομικές στατιστικές για να μειώσουν την επίδραση των εξωτερικών στοιχείων ενώ να διατηρούν περισσότερα δεδομένα από τη μεσόταξη.
Πώς υπολογίζω τη μεσαία μέση;
Μηχανογραφημένη μέση = Σ(βάρος × τιμή) / Σ(βαρύτητες). Παράδειγμα — υπολογισμός βαθμολόγησης: βαθμός A (4,0) σε μια 3-κρυστάλλινη διαδικασία, βαθμός B (3,0) σε μια 4-κρυστάλλινη διαδικασία, βαθμός C (2,0) σε μια 2-κρυστάλλινη διαδικασία: Μηχανογραφημένη βαθμολόγηση = (4,0×3 + 3,0×4 + 2,0×2) / (3+4+2) = (12+12+4)/9 = 28/9 ≈ 3,11. Χωρίς βάρος, η απλή μέση θα ήταν (4+3+2)/3 = 3,0 — λείπει η nặngτερη επίδραση της 4-κρυστάλλινης διαδικασίας.
Συνοπτική Στατιστική Αναφορά: Αυτό που Πρέπει να Έχετε Πάντα
Μια πλήρη συνοπτική στατιστική αναφορά για οποιαδήποτε σετ δεδομένων πρέπει να περιλαμβάνει όλα τα ακόλουθα. Αυτό είναι αυτό που θα αναφέρετε σε επιστημονικό άρθρο, επιχειρηματική ανάλυση ή ακαδημαϊκή εργασία:
| Στατιστική | Σύμβολο | Παράδειγμα ({2,4,4,6,8,10}) | Ερμηνεία |
|---|---|---|---|
| Αριθμός | n | 6 | Πόσοι παρατηρήσεις |
| Μέσος Όρος | x̄ | 5.67 | Μέσος όρος |
| Μέσος Όρος | M | 5.0 | Κεντρική τιμή (50η περιεκτική) |
| Τύπος | Mo | 4 | Η πιο συχνή τιμή |
| Περιοχή | R | 8 | Ποσοστό από το ελάχιστο στο μέγιστο |
| Στάνταρτ Διάμετρος | σ ή s | 2.58 | Τυπική απόκλιση από τον μέσο όρο |
| Στατιστική Διακύμανση | σ² | 6.67 | Διακύμανση στο τετραγωνικό |
| Ελάχιστο / Μέγιστο | — | 2 / 10 | Εξωτερικά σημεία |
Σε ακαδημαϊκά και επιστημονικά έργα, αναφέρετε πάντα και μια μέτρηση του κέντρου ΚΑΙ μια μέτρηση της διάδοσης. Η αναφορά μόνο του μέσου όρου (ή της μεσολάβησης) χωρίς τη στατιστική απόκλιση (ή IQR) δίνει μια ανεπαρκή εικόνα των δεδομένων σας. Ένα σχολείο όπου οι μαθητές σημείωσαν μέσο όρο 75% με στάνταρτ απόκλιση = 5% είναι πολύ διαφορετικό από ένα άλλο με μέσο όρο = 75% αλλά στάνταρτ απόκλιση = 25% — το πρώτο είναι μια στενή ομάδα από Β γράμματα, το δεύτερο είναι μια άκρως μικτή ομάδα από αποτυχημένους έως σχεδόν τέλειους.
Δεκαδικές Περίцентρες, Τεταρτοπρόσωποι και Βοξ Πλέιτς
Πέρα από τον μέσο όρο, την μεσολάβηση και τον τύπο, μια πλήρη στατιστική αναφορά συχνά περιλαμβάνει ανάλυση δεκαδικών περιεκτικών. Οι δεκαδικές περιεκτικές σαςบอกουν ποια ποσοστό των δεδομένων βρίσκεται κάτω από μια δεδομένη τιμή — απαραίτητη για την κατανόηση της σχετικής κατάστασης, την ταυτοποίηση των εξωλέμβων και την σύγκριση μεταξύ πληθυσμών.
- Μέσος Όρος = 50η περιεκτική: Ημισυ των δεδομένων βρίσκεται κάτω από αυτήν την τιμή
- Q1 (Πρώτος τεταρτοπρόσωπος) = 25η περιεκτική: 25% των δεδομένων βρίσκεται κάτω από Q1
- Q3 (Τρίτος τεταρτοπρόσωπος) = 75η περιεκτική: 75% των δεδομένων βρίσκεται κάτω από Q3
- IQR (Διακύμανση Τεταρτοπρόσωπων) = Q3 − Q1: Περιέχει το μεσαίο 50% των δεδομένων
- Κανόνας των Εξωλέμβων: Τα σημεία κάτω από Q1 − 1,5×IQR ή πάνω από Q3 + 1,5×IQR θεωρούνται εξωλέμβες
| Περιεκτική | Μέρος | Παράδειγμα (πληροφορίες εξαμήνου, n=100) |
|---|---|---|
| 10η | 10% βρίσκεται κάτω από | Μarks = 52 → σημείωσε καλύτερη από 10% της τάξης |
| 25η (Q1) | 25% βρίσκεται κάτω από | Μarks = 64 → όριο κάτω από την τεταρτοπρόσωπο |
| 50η (Μέσος Όρος) | 50% βρίσκεται κάτω από | Μarks = 75 → μέσο της κατανομής |
| 75η (Q3) | 75% βρίσκεται κάτω από | Μarks = 87 → όριο πάνω από την τεταρτοπρόσωπο |
| 90η | 90% βρίσκεται κάτω από | Μarks = 93 → πάνω από 10% της τάξης |
| 99η | 99% βρίσκεται κάτω από | Μarks = 99 → πάνω από 1% |
Ένα βωξ πλέιτς (βωξ-και-πλέιτς) vizualize την πληροφορία αυτή: το βωξ καλύπτει Q1 έως Q3 (το IQR), μια γραμμή σηματοδοτεί τον μέσο όρο, και "πλέιτς" εκτείνεται στο μικρότερο/μεγαλύτερο μη-εξωλέμβο αξία. Τα ατομικά εξωλέμβα σημεία αναφέρονται ως δότες. Τα βωξ πλέιτς είναι εξαιρετικά χρήσιμα για την σύγκριση κατανομών μεταξύ πολλών ομάδων πλευρά-πλευρά, αποκαλύπτοντας διαφορές στο κέντρο, διάδοση και σκαλισμό που μια απλή σύγκριση μέσου όρου θα bỏλούσε. Για παράδειγμα, η σύγκριση των βαθμολογιών εξετάσεων μεταξύ τριών σχολείων με τρεις πλευρά-πλευρά βωξ πλέιτς δείχνει αμέσως ποιο σχολείο έχει υψηλότερο μέσο όρο, ποιο έχει μεγαλύτερη διάδοση (αντιπροσωπεύοντας ανισότητα στην διδασκαλία) και αν οποιοδήποτε σχολείο έχει μια ομάδα εξωλέμβων μαθητών που χρειάζονται υποστήριξη. Αυτή η vizual density στατιστικής πληροφορίας σε μια συμπαγή εμφάνιση κάνει τα βωξ πλέιτς ένα από τα πιο ισχυρά και λιγότερο χρησιμοποιούμενα εργαλεία στην επικοινωνία δεδομένων.
Σταδιακά: Λήψη Μέσου, Μέσης και Τύπου με χέρι
Ας δούμε ένα πλήρες παράδειγμα με ένα πραγματικό σύνολο δεδομένων: μηνιαίες πωλήσεις (σε χιλιάδες) για μια μικρή επιχείρηση κατά τη διάρκεια 12 μηνών: {42, 38, 55, 61, 48, 52, 75, 48, 63, 44, 38, 57}.
Βήμα 1: Ταξινομήστε τα Δεδομένα
Ταξινομημένα σε αύξοντα: {38, 38, 42, 44, 48, 48, 52, 55, 57, 61, 63, 75}
Βήμα 2: Λήψη του Μέσου
Σύνολο = 38+38+42+44+48+48+52+55+57+61+63+75 = 621
n = 12, Μέσος = 621 / 12 = 51,75 (χιλιάδες)
Βήμα 3: Βρες την Μέση Αξία
n = 12 (παράνομη): μέσο των 6ου και 7ου αξιών = (48 + 52) / 2 = 50
Βήμα 4: Αναγνωρίστε τον Τύπο
Και οι 38 και 48 εμφανίζονται δύο φορές. Τύπος = {38, 48} (διπλάσιο)
Βήμα 5: Υπολογισμός της Διακύμανσης και της Στάθμης
Διακύμανση = 75 − 38 = 37
Απώλειες από μέσο (51,75): (38−51,75)² = 189,06; (38−51,75)² = 189,06; (42−51,75)² = 95,06; (44−51,75)² = 60,06; (48−51,75)² = 14,06; (48−51,75)² = 14,06; (52−51,75)² = 0,06; (55−51,75)² = 10,56; (57−51,75)² = 27,56; (61−51,75)² = 85,56; (63−51,75)² = 126,56; (75−51,75)² = 540,56
Σύνολο τετραγωνικών αποκλίσεων = 1.352,25; Διακύμανση = 1.352,25/12 = 112,69; Στάθμη = √112,69 ≈ 10,62
Ερμηνεία
Αυτή η επιχείρηση έχει μέσο μηνιαίες πωλήσεις 51.750 δολαρίων με μέσο όρο 50.000 δολαρίων. Η στάθμη ~ 10.620 δολαρίων σημαίνει ότι οι πλειοψηφία των μηνών βρίσκεται στο ±10.620 δολάρια από το μέσο όρο. Η διπλάσια κατανομή (δύο τύποι) μπορεί να υποδηλώνει εποχιακά μοτίβα — ελέγξτε αν οι δύο 38 και 48 συσσωματώνονται σε συγκεκριμένα μήνες. Η κορυφαία αποκλίνουσα τιμή (75.000 δολάρια σε ένα μήνα)_pulls_ το μέσο όρο ελαφρά πάνω από το μέσο όρο, υποδεικνύοντας μια ελαφρά θετική σκαλί — πιθανότατα ένα εξαιρετικό μήνα πωλήσεων (εορταστική περίοδος, μεγάλο συμβόλαιο κ.λπ.).