Περιθώριο σφάλματος: Τύπος, Παραδείγματα, Υπολογισμός

Περιθώριο σφάλματος: Τύπος, Παραδείγματα, Υπολογισμός

März 10, 2023 0 Von admin

Το περιθώριο σφάλματος είναι μια από τις πιο σημαντικές στατιστικές έννοιες που πρέπει να γνωρίζετε όταν εξετάζετε τα αποτελέσματα διαδικτυακών ερευνών ή δημοσκοπήσεων. Εάν δεν το γνωρίζετε, μπορείτε εύκολα να παρερμηνεύσετε τα αποτελέσματα και να βγάλετε ψευδή συμπεράσματα. Από την άλλη πλευρά, εάν το γνωρίζετε, μπορείτε να είστε πιο σίγουροι πώς να χρησιμοποιήσετε τα αποτελέσματά σας. Σήμερα θα σας εξηγήσω αυτή τη σημαντική ιδέα!

Περιθώριο σφάλματος: ένα πρακτικό παράδειγμα

Ας ξεκινήσουμε με μια ιστορία!

Το τμήμα HR μιας εταιρείας διενεργεί την ίδια έρευνα κάθε χρόνο.

Η εταιρεία έχει 3000 υπαλλήλους και το HR λαμβάνει 550 απαντήσεις τόσο το 2021 όσο και το 2022 (για λόγους απλότητας).

Στην έρευνα, υπάρχει ένα ερώτημα για την ικανοποίηση των μισθών και τα αποτελέσματα είναι:

2021: Το 85% είναι ικανοποιημένο με τον μισθό.

2022: Το 89% είναι ικανοποιημένο με τον μισθό.

Όταν η Διευθύντρια Ανθρώπινου Δυναμικού παρουσιάζει τα αποτελέσματα, δηλώνει ότι η ικανοποίηση από τον μισθό σαφώς αυξήθηκε.

Όμως, δεν είναι απαραίτητα αληθινή.

Γιατί;

Ο διευθυντής ανθρώπινου δυναμικού ξέχασε να αναφέρει το Περιθώριο σφάλματος.

  • Ποιο είναι το Περιθώριο σφάλματος;
  • Πώς να το υπολογίσετε;
  • Πότε και πώς να το χρησιμοποιήσετε;

Θα λάβετε τις απαντήσεις σε αυτήν την ανάρτηση ιστολογίου – και θα δείτε πώς ο διευθυντής ανθρώπινου δυναμικού θα μπορούσε να τα είχε πάει καλύτερα. Ας σκάψουμε!

Ποιο είναι το Περιθώριο σφάλματος;

ο Περιθώριο σφάλματος (MoE) είναι μια στατιστική έννοια που βοηθά στη μέτρηση της αβεβαιότητας ενός αποτελέσματος έρευνας ή δημοσκόπησης. Συνήθως εκφράζεται ως ποσοστό ή αριθμός.

Οι έρευνες και οι δημοσκοπήσεις βασίζονται συνήθως σε δείγματα, τα οποία είναι μικρότερες ομάδες που επιλέγονται από τον μεγαλύτερο πληθυσμό. Δεδομένου ότι το δείγμα δεν είναι ολόκληρος ο πληθυσμός, υπάρχει κάποια αβεβαιότητα ή μεταβλητότητα στα αποτελέσματα. Εάν το περιθώριο σφάλματος είναι μεγάλο, μπορεί να υποδηλώνει ότι το δείγμα δεν ήταν αντιπροσωπευτικό του πληθυσμού. Από την άλλη πλευρά, εάν το περιθώριο λάθους είναι μικρό, σημαίνει ότι η εκτίμηση του δείγματος είναι αξιόπιστη και μπορούμε να είμαστε πιο σίγουροι για την ακρίβειά της.

Από το Περιθώριο Σφάλματος, μπορούμε να υπολογίσουμε το διάστημα εμπιστοσύνης

Το περιθώριο σφάλματος μας δίνει το διάστημα εμπιστοσύνης. Υποδεικνύει το εύρος εντός του οποίου η πραγματική τιμή πληθυσμού πιθανός ψέματα. Το πλάτος του εύρους θα είναι δύο φορές το περιθώριο σφάλματος. Έχει δύο όρια:

  • Κάτω όριο = παρατηρούμενη βαθμολογία – MoE
  • Ανώτερο όριο = παρατηρούμενη βαθμολογία + MoE

Σημείωση: θυμηθείτε ότι το „MoE“ σημαίνει Περιθώριο Σφάλματος.

περιθώριο σφάλματος και διάστημα εμπιστοσύνης

Σημείωση: Αυτές είναι οι τιμές για το αρχικό μας παράδειγμα, οπότε αν είστε καλός παρατηρητής, πιθανότατα έχετε ήδη μια ιδέα γιατί ο Διευθυντής Ανθρώπινου Δυναμικού έκανε λάθος.

Υπάρχουν διάφοροι παράγοντες που επηρεάζουν το περιθώριο σφάλματος.

Το πιο σημαντικό από αυτά είναι το το μέγεθος του δείγματος. Γενικά, Όσο μεγαλύτερο είναι το μέγεθος του δείγματος, τόσο μικρότερο θα είναι το περιθώριο σφάλματος. Αυτό συμβαίνει επειδή ένα μεγαλύτερο δείγμα παρέχει περισσότερες πληροφορίες για τον πληθυσμό και επομένως είναι πιο πιθανό να παράγει μια ακριβή εκτίμηση.

Επίπεδο αυτοπεποίθησης

Υπάρχει μεγάλη διαφορά μεταξύ του διαστήματος εμπιστοσύνης και του επιπέδου εμπιστοσύνης.

Προσέξατε τη λέξη „πιθανός‘ στον ορισμό του διαστήματος εμπιστοσύνης;

Όταν εργαζόμαστε με δείγματα, δεν μπορούμε να είμαστε απολύτως βέβαιοι ότι το δείγμα είναι μια τέλεια αναπαράσταση του πληθυσμού, επομένως δεν μπορούμε να είμαστε σίγουροι ότι το διάστημα εμπιστοσύνης είναι πάντα σωστό. Μπορούμε να περιγράψουμε αυτή την αβεβαιότητα (ή βεβαιότητα) με πιθανότητες.

Το επίπεδο εμπιστοσύνης σας λέει πόσο σίγουροι μπορείτε να είστε ότι το διάστημα εμπιστοσύνης είναι σωστό και θα περιλαμβάνει την πραγματική βαθμολογία για τον πληθυσμό.

Στις επιχειρήσεις, το τυπικό διάστημα εμπιστοσύνης είναι 95%, ενώ για ορισμένες ιατρικές ή επιστημονικές μελέτες, χρησιμοποιείται συνήθως το 99%, αλλά μπορεί να είναι οποιαδήποτε τιμή μεταξύ 0 και 100.

Για παράδειγμα, ένα επίπεδο εμπιστοσύνης 95% σημαίνει ότι το 95% των περιπτώσεων, το αντίστοιχο διάστημα εμπιστοσύνης θα περιλαμβάνει την πραγματική βαθμολογία.

Ίσως ρωτήσετε: Γιατί δεν χρησιμοποιούμε το 99% όλη την ώρα; Θέλουμε να είμαστε σίγουροι ότι ο υπολογισμός μας είναι σωστός.

Υπάρχει μια λογική απάντηση σε αυτό το ερώτημα. Όσο υψηλότερο είναι το επίπεδο εμπιστοσύνης, τόσο μεγαλύτερο θα είναι το περιθώριο σφάλματος. Εάν θέλετε να είστε σίγουροι ότι η πραγματική βαθμολογία βρίσκεται στο διάστημα εμπιστοσύνης, πρέπει να αυξήσετε το διάστημα εμπιστοσύνης. Το MoE με επίπεδο εμπιστοσύνης 95% θα είναι μεγαλύτερο από ό,τι αν θέλουμε να είμαστε 90% σίγουροι για την ακρίβεια της εκτίμησης.

τυπικά επίπεδα εμπιστοσύνης

Z-score

Το z-score είναι ένα στατιστικό μέτρο που αντιπροσωπεύει τον αριθμό των τυπικών αποκλίσεων που είναι μια τιμή από το μέσο όρο ενός συνόλου δεδομένων.

Για να υπολογίσουμε το z-score πρέπει να έχουμε πληροφορίες για τον μέσο όρο και την τυπική απόκλιση του πλήρους πληθυσμού. Όταν δεν έχουμε πληροφορίες για αυτά (όπως στο παράδειγμά μας), μπορούμε να υποθέσουμε μια κανονική κατανομή και να χρησιμοποιήσουμε τις τυπικές βαθμολογίες z για υπολογισμούς.

Στην κανονική κατανομή, σύμφωνα με το Κανόνας 68-95-99,7, θα περιμέναμε ότι το 95% των αποτελεσμάτων είναι εντός +- 1,96 τυπικών αποκλίσεων από τον πραγματικό μέσο όρο. Αυτό το διάστημα είναι το διάστημα εμπιστοσύνης σε επίπεδο εμπιστοσύνης 95%.

Ο πίνακας z παραθέτει τις βαθμολογίες z για κάθε τυπική απόκλιση από τον μέσο όρο και μπορείτε να τον χρησιμοποιήσετε για να αναζητήσετε τη βαθμολογία z για ένα δεδομένο επίπεδο εμπιστοσύνης. Για παράδειγμα, το z-score για το επίπεδο εμπιστοσύνης 95% είναι 1,96.

Ακολουθούν οι πιο χρησιμοποιούμενες βαθμολογίες z:

Επίπεδο αυτοπεποίθησης Z-Score
80% 1.28
90% 1,64
95% 1,96
99% 2.58
99,9% 3.29

Τύποι περιθωρίου λάθους — ήρθε η ώρα να υπολογίσετε το MoE!

Έχουμε διαφορετικούς τύπους για διαφορετικά σενάρια.

  1. Όταν υπολογίζουμε με αριθμούς
  2. Όταν υπολογίζουμε με αναλογίες
  3. Όταν έχουμε μικρό πληθυσμό

Ο γενικός τύπος υποθέτει έναν άπειρο ή πολύ μεγάλο πληθυσμό με κανονική κατανομή στις 2 πρώτες περιπτώσεις, η μόνη διαφορά υπάρχει αν χρησιμοποιήσουμε αριθμούς ή αναλογίες.

Μερικές φορές χρειάζεται να εργαστούμε με μικρότερους πληθυσμούς και μεγέθη δειγμάτων, όπως στο αρχικό μας παράδειγμα ανθρώπινου δυναμικού. Σε αυτές τις περιπτώσεις, πρέπει να προσαρμόσουμε τους υπολογισμούς μας με το μέγεθος του δείγματος, σε σχέση με τον πληθυσμό.

Τύπος περιθωρίου σφάλματος #1

Ας δούμε ένα παράδειγμα για την περίπτωση #1:

Διεξάγετε μια έρευνα για να προσδιορίσετε το μέσο ύψος των ενήλικων ανδρών στις Ηνωμένες Πολιτείες. Συλλέγετε δεδομένα από ένα τυχαίο δείγμα 500 ανδρών και διαπιστώνετε ότι το μέσο ύψος είναι 68 ίντσες με τυπική απόκλιση 3 ίντσες. Ποιο είναι το περιθώριο σφάλματος για τα αποτελέσματα της έρευνας σε επίπεδο εμπιστοσύνης 95%;

Σε αυτό το παράδειγμα, πρέπει να χρησιμοποιήσουμε αυτόν τον τύπο:

Περιθώριο σφάλματος τύπος #1

Η βαθμολογία z για ένα επίπεδο εμπιστοσύνης 95% είναι 1,96, η τυπική απόκλιση είναι 3 ίντσες και το μέγεθος του δείγματος είναι 500 άνδρες. Συνδέοντας αυτές τις τιμές στον τύπο, παίρνουμε: 0,34

Αυτό σημαίνει ότι μπορούμε να είμαστε 95% σίγουροι ότι το πραγματικό μέσο ύψος των ενήλικων ανδρών στις Ηνωμένες Πολιτείες είναι μεταξύ 67,66 ίντσες (68 – 0,34) και 68,34 ίντσες (68 + 0,34).

Τύπος περιθωρίου σφάλματος #2

Ακολουθεί ένα άλλο παράδειγμα για την περίπτωση #2, με αναλογίες:

Διεξάγετε μια έρευνα για να προσδιορίσετε το ποσοστό των ανθρώπων που προτιμούν τους σκύλους από τις γάτες. Συλλέγετε δεδομένα από ένα τυχαίο δείγμα 1000 ατόμων και διαπιστώνετε ότι 600 από αυτούς προτιμούν τους σκύλους, ενώ οι 400 προτιμούν τις γάτες. Ποιο είναι το περιθώριο σφάλματος για τα αποτελέσματα της έρευνας σε επίπεδο εμπιστοσύνης 90%;

Για να το λύσουμε χρειαζόμαστε έναν άλλο τύπο:

Περιθώριο σφάλματος τύπος #2

Σε αυτόν τον τύπο, η αναλογία δείγματος σημαίνει την αναλογία που επέλεξε μια συγκεκριμένη επιλογή. Σε αυτή την περίπτωση, το ποσοστό των ανθρώπων που τους αρέσουν τα σκυλιά είναι 600/1000 = 0,6

Το z-score για ένα επίπεδο εμπιστοσύνης 90% είναι 1.645, το ποσοστό των ατόμων που προτιμούν τους σκύλους είναι 0.6 (600 στα 1000) και το μέγεθος του δείγματος είναι 1000 άτομα. Συνδέοντας αυτές τις τιμές στον τύπο, παίρνουμε: 0,008

Αυτό σημαίνει ότι μπορούμε να είμαστε 90% σίγουροι ότι το πραγματικό ποσοστό των ανθρώπων που προτιμούν τους σκύλους από τις γάτες είναι μεταξύ 0,592 (0,6 – 0,008) και 0,608 (0,6 + 0,008). Άρα 59,2% και 60,8%

Τύπος περιθωρίου σφάλματος #3

Και περίπτωση #3 (μικρός πληθυσμός):

Τώρα ας δούμε το αρχικό μας παράδειγμα έρευνας ανθρώπινου δυναμικού, όπου έχουμε έναν σχετικά μικρό πληθυσμό (3.000 εργαζόμενους), επομένως πρέπει να προσαρμόσουμε λίγο τον τύπο.

Περιθώριο σφάλματος τύπος #3

Το z-score για ένα επίπεδο εμπιστοσύνης 95% είναι 1,96, το ποσοστό των ατόμων που ήταν ικανοποιημένοι με την εργασία τους είναι 0,85, το μέγεθος του δείγματος είναι 550 άτομα και ο πληθυσμός είναι 3000. Προσθέτοντας αυτές τις τιμές στον τύπο, παίρνουμε 0,02697 2,7%

Αυτό σημαίνει ότι η πραγματική τιμή για τον πληθυσμό το 2021 είναι μεταξύ 85+-2,7% άρα 82,3% – 87,7%

Χρησιμοποιώντας τον ίδιο τύπο για τη δεύτερη έρευνα το 2022, παίρνουμε 2,36% MoE. Η πραγματική ικανοποίηση του πληθυσμού είναι μεταξύ 89 +- 2,36%, άρα 86,64% – 91,36%

Όπως μπορείτε να δείτε από τα αποτελέσματα, η ικανοποίηση από τους μισθούς μπορεί να μειωθεί, εάν ήταν 87,7% το 2021 και 86,64% το 2022.

Είναι σημαντικό να χρησιμοποιείται το Περιθώριο Σφάλματος (MoE) κατά την ερμηνεία των αποτελεσμάτων ερευνών ή δημοσκοπήσεων, καθώς δίνει μια ένδειξη για το πόσο αξιόπιστη είναι η εκτίμηση του δείγματος. Χωρίς αυτές τις πληροφορίες, είναι εύκολο να παρερμηνευθούν τα αποτελέσματα.

Εκτός από τη σαφή επικοινωνία και την κατανόηση των αποτελεσμάτων, το Υπουργείο Οικονομικών μπορεί να βοηθήσει στη λήψη αποφάσεων παρέχοντας μια ιδέα για το πόσο ακριβής είναι η εκτίμηση του δείγματος και δείχνει το επίπεδο αβεβαιότητας. Μας επιτρέπει επίσης να συγκρίνουμε τα αποτελέσματα διαφορετικών ερευνών ή δημοσκοπήσεων.

Το μέγεθος του δείγματος έχει τη μεγαλύτερη επίδραση στο MoE. Ένα μεγαλύτερο μέγεθος δείγματος παρέχει περισσότερες πληροφορίες για τον πληθυσμό και επομένως είναι πιο πιθανό να παράγει μια ακριβή εκτίμηση.

Μπορείτε επίσης να επηρεάσετε το αποτέλεσμα εάν προσαρμόσετε το επίπεδο εμπιστοσύνης. Όπως συζητήσαμε η αύξηση (μείωση) του επιπέδου εμπιστοσύνης θα αυξήσει (μειώσει) το MoE και ως εκ τούτου το διάστημα εμπιστοσύνης.

Μην είστε όπως ο διευθυντής ανθρώπινου δυναμικού και επικοινωνείτε πάντα την αβεβαιότητα των αποτελεσμάτων σας!

Στην υγειά σας,
Λεβί Κουλτσάρ

Πόροι: