Μετάβαση στο περιεχόμενο

Ανάλυση διακύμανσης

Από τη Βικιπαίδεια, την ελεύθερη εγκυκλοπαίδεια

Ανάλυση Διακύμανσης ή Ανάλυση Διασποράς (ANOVA) ονομάζεται μια στατιστική μέθοδος πειραματικού σχεδιασμού, κατά την οποία, πραγματοποιείται έλεγχος υποθέσεων με στόχο να ανιχνευθούν εάν υπάρχουν διαφορές στις μέσες τιμές περισσότερων από δύο πληθυσμών. Για να δοθεί απάντηση στο συγκεκριμένο ερώτημα, κατασκευάζουμε έναν έλεγχο υποθέσεων με μηδενική υπόθεση H0 ότι όλα τα δείγματα προέρχονται από πληθυσμούς με την ίδια μέση τιμή έναντι μιας εναλλακτικής υπόθεσης ότι τουλάχιστον δύο μέσες τιμές είναι διαφορετικές. Ουσιαστικά πρόκειται για μια γενίκευση του T-test που εφαρμόζεται σε δύο πληθυσμούς. Θεωρητικά, θα μπορούσαν να εφαρμοστούν πολλαπλοί ανεξάρτητοι έλεγχοι, αλλά η συγκεκριμένη μεθοδολογία δεν ενδείκνυται καθότι με αυτό τον τρόπο αυξάνεται η πιθανότητα να οδηγηθούμε σε σφάλμα τύπου Ι. Συνεπώς, η ANOVA είναι η κατάλληλη μεθοδολογία διότι, πρόκειται για συντομότερη διαδικασία ανάλυσης ενώ έχει και ακρίβεια διάγνωσης

Η ανάλυση διακύμανσης εισήχθη για πρώτη φορά από τον Sir Ronald A. Fisher το 1918 στο άρθρο του The Correlation Between Relatives on the Supposition of Mendelian Inheritance.[1] Η ανάλυση διασποράς όμως, έγινε ευρέως γνωστή μετά το 1925 όταν εκδόθηκε το βιβλίο του R. A. Fisher, Statistical Methods for Research Workers, στο οποίο την είχε συμπεριλάβει.

Η ανάλυση της διακυμάνσης προέκυψε από τον Fisher, κατά την προσπάθεια επίλυσης πολύπλοκων προβλημάτων γεωργικού πειραματισμού.[2] Η προσέγγιση της λύσης τέτοιου είδους προβλημάτων που πρότεινε, βασίζεται στην τυχαιοποίηση και στην επανάληψη του πειράματος.

Οι προϋποθέσεις που θα χρειαστεί να ισχύουν για να μπορέσουμε να εφαρμόσουμε την ανάλυση διακύμανσης, είναι [3] :

Ανάλυση Διακύμανσης κατά ένα παράγοντα (one-way ANOVA)

[Επεξεργασία | επεξεργασία κώδικα]

Το πιο απλό πειραματικό σχέδιο είναι ο πλήρως τυχαιοποιημένος σχεδιασμός (Completely Randomized Design) σύμφωνα με τον οποίο, εργαζόμαστε με k ανεξάρτητα τυχαία δείγματα, ένα από κάθε πληθυσμό (η διαφορετικά έναν από κάθε στάθμη του παράγοντα (factor) και το οποίο αποτελεί γενίκευση του ελέγχου των μέσων τιμών μ1 και μ 2 , δύο κανονικών πληθυσμών με δύο ανεξάρτητα τυχαία δείγματα.

Έστω, ότι από καθέναν από k>2 κανονικούς πληθυσμούς με κοινή διασπορά, σ2, και μέσες τιμές αντίστοιχα μ1, μ2,....., μk παίρνουμε ένα τυχαίο δείγμα μεγέθους, αντίστοιχα, n1, n2,....., nk για να κάνουμε, με βάση τα k δείγματα, τον έλεγχο:

  • Η0: μ1 = μ2 =.....= μk
  • Η1: μi ≠ μj (για ένα τουλάχιστον ζεύγος i,j)
  1. The Correlation Between Relatives on the Supposition of Mendelian Inheritance. Ronald A. Fisher. Philosophical Transactions of the Royal Society of Edinburgh. 1918. (volume 52, pages 399–433)
  2. http://www.aua.gr/gpapadopoulos/files/anova12-13a.p[νεκρός σύνδεσμος]df. (pages 192-193)
  3. http://www.actuar.aegean.gr/notes/ANALUSH%20DIAKUMANSHS%203.pdf Αρχειοθετήθηκε 2016-09-10 στο Wayback Machine. (pages 15/41)