Cours 1
Cours 1
Cours 1
L ’ANALYSE DE VARIANCE
à un facteur
(Analysis Of Variance - ANOVA)
1
Plan de la séance
Introduction
ANOVA à un facteur
Comparaisons multiples
Analyse des résidus
Transformations
Calcul de la taille d ’échantillon
Exemples avec SPSS
Design Supermarché
de l’emballage 1 2 3 4 5
1 11 17 16 14 15
2 12 10 15 19 11
3 23 20 18 17 .
4 27 33 22 26 28
H0 : 1 = 2 = 3 = 4
Ha : au moins deux de ces moyennes sont différentes
H 0 : 1 = 2 = … = k
Ha : au moins deux de ces moyennes sont différentes
Facteur (SCTR) n (
i 1
i )(Y i . Y .. ) 2
k-1
(Traitements)
k n (i )
Erreur (SCE) ij
(Y Y
i 1 j 1
i . ) 2
N-k
k n (i )
Totale (SCTO) ij
(Y Y
i 1 j 1
.. ) 2
N-1
Yij i ij i 1, , k et j 1, , ni
où
Yij =: réponse du sujet j dans le groupe i
i =: moyenne du groupe i
ij =: erreur aléatoire
Posons: i i
i i où i i
Alors le modèle devient:
Yij i ij i 1, , k et j 1, , ni
où
=: moyenne globale
i =: effet du niveau i du facteur
ij =: erreur aléatoire.
Devis expérimentaux pour la recherche en gestion 6-697-01
15
ANOVA à un facteur… Statistique du test
Pour confronter les hypothèses H0 et Ha , la
statistique du test est :
SCTR (k - 1)
F
SCE (N - k)
Erreur de Type I:
Rejeter H0 en faveur de Ha (c.-à-d. prendre la décision
Ha) lorsque en réalité H0 est vraie.
La probabilité d ’une erreur de Type I est la probabilité
qu’on a d ’observer la « valeur » obtenue dans notre
échantillon, ou une valeur encore plus « éloignée » de
H0 , si H0 est vraie. Cette probabilité est souvent
appelée «p-value » dans le jargon statistique.
Erreur de Type II:
Ne pas rejeter H0 en faveur de Ha lorsque en réalité Ha
est vraie.
H0 H1
H0 Erreur
de
Décision Type II
H1 Erreur
de
Type I
30
3
20
# de caisses vendues
1
10
0
N= 5 5 4 5
1 2 3 4
design
Devis expérimentaux pour la recherche en gestion 6-697-01
22
Exemple 1… suite
Descriptives
# de caisses vendues
95% Confidence Interval for
Mean
N Mean Std. Deviation Std. Error Lower Bound Upper Bound Minimum Maximum
1 5 14,60 2,30 1,03 11,74 17,46 11 17
2 5 13,40 3,65 1,63 8,87 17,93 10 19
3 4 19,50 2,65 1,32 15,29 23,71 17 23
4 5 27,20 3,96 1,77 22,28 32,12 22 33
Total 19 18,63 6,44 1,48 15,53 21,74 10 33
Tableau d’ANOVA
ANOVA
# de caisses vendues
Sum of
Squares df Mean Square F Sig.
Between Groups 588,221 3 196,074 18,591 ,000
Within Groups 158,200 15 10,547
Total 746,421 18
Descriptives
# de caisses vendues
95% Confidence Interval for
Mean
N Mean Std. Deviation Std. Error Lower Bound Upper Bound Minimum Maximum
1 5 14,60 2,30 1,03 11,74 17,46 11 17
2 5 13,40 3,65 1,63 8,87 17,93 10 19
3 4 12,75 1,71 ,85 10,03 15,47 11 15
4 5 13,60 1,82 ,81 11,34 15,86 11 16
Total 19 13,63 2,41 ,55 12,47 14,79 10 19
ANOVA
# de caisses vendues
Sum of
Squares df Mean Square F Sig.
Between Groups 8,071 3 2,690 ,419 ,742
Within Groups 96,350 15 6,423
Total 104,421 18
ni j 1 ni j 1 ni j 1 ni
Une estimation de Var yi. est données par
MCE
S yi .
2
ni
Devis expérimentaux pour la recherche en gestion 6-697-01
27
Intervalle de confiance pour les différents
niveaux du facteur
La statistique yi . i
s yi .
suit une loi de Student avec N-k degrés de liberté,
notée t(N-k), ou N est le nombre total d’observations.
Donc, un intervalle de confiance au niveau 1- pour
la moyenne i est donné par :
yi. t (1 ; N k ) s yi .
2
Devis expérimentaux pour la recherche en gestion 6-697-01
28
Estimation de la différence entre deux
niveaux du facteur
Un estimateur sans biais de la différence D entre les
moyenne i et i’ :
2 1 1
Var D Var yi. - yi '. Var yi. Var yi '.
ˆ
ni ni '
2 ˆ
1 1
S D MCE
ni ni '
Devis expérimentaux pour la recherche en gestion 6-697-01
29
Intervalle de confiance pour la différence
entre deux niveaux du facteur
La statistique ˆ D
D
ˆ)
s( D
suit une loi de Student avec N-k degrés de liberté,
notée t(N-k), ou N est le nombre total d’observations.
Donc, un intervalle de confiance au niveau 1- pour
la différence D est donné par :
ˆ ˆ
D t (1 ; N k ) s D
2
Devis expérimentaux pour la recherche en gestion 6-697-01
30
Exemple 1 … Comparaison multiples
Comparaisons de toutes les moyennes deux à deux :
Multiple Comparisons
Mean
Difference 95% Confidence Interval
(I) design (J) design (I-J) Std. Error Sig. Lower Bound Upper Bound
1 2 1,20 2,05 ,568 -3,18 5,58
3 -4,90* 2,18 ,040 -9,54 -,26
4 -12,60* 2,05 ,000 -16,98 -8,22
2 1 -1,20 2,05 ,568 -5,58 3,18
3 -6,10* 2,18 ,013 -10,74 -1,46
4 -13,80* 2,05 ,000 -18,18 -9,42
3 1 4,90* 2,18 ,040 ,26 9,54
2 6,10* 2,18 ,013 1,46 10,74
4 -7,70* 2,18 ,003 -12,34 -3,06
4 1 12,60* 2,05 ,000 8,22 16,98
2 13,80* 2,05 ,000 9,42 18,18
3 7,70* 2,18 ,003 3,06 12,34
*. The mean difference is significant at the .05 level.
Mean
Difference 95% Confidence Interval
(I) design (J) design (I-J) Std. Error Sig. Lower Bound Upper Bound
1 2 1,20 2,05 1,000 -5,04 7,44
3 -4,90 2,18 ,240 -11,51 1,71
4 -12,60* 2,05 ,000 -18,84 -6,36
2 1 -1,20 2,05 1,000 -7,44 5,04
3 -6,10 2,18 ,081 -12,71 ,51
4 -13,80* 2,05 ,000 -20,04 -7,56
3 1 4,90 2,18 ,240 -1,71 11,51
2 6,10 2,18 ,081 -,51 12,71
4 -7,70* 2,18 ,018 -14,31 -1,09
4 1 12,60* 2,05 ,000 6,36 18,84
2 13,80* 2,05 ,000 7,56 20,04
3 7,70* 2,18 ,018 1,09 14,31
*. The mean difference is significant at the .05 level.
1,5
1,0
Standardized Residual for CAISSES
,5
0,0
-,5
-1,0
-1,5
-2,0
12 14 16 18 20 22 24 26 28
,50
,25
0,00
0,00 ,25 ,50 ,75 1,00