Anova GC

Télécharger au format pdf ou txt
Télécharger au format pdf ou txt
Vous êtes sur la page 1sur 5

Loi de Fisher

P
r
df = (29, 28)
! Famille de distributions F. o
! Chaque membre de la famille est déterminé par b
deux paramètres: le nombre de degrés de liberté du a
b df = (19, 6)
numérateur et le nombre de degrés de liberté du
i
dénominateur.
l df = (6, 6)
! F est continue et positive. i
! F est positivement asymétrique. t
! Ses valeurs vont de 0 à ∞. Quand F → ∞, la courbe é
se rapproche de l ’axe des abscisses. F

© Guy Cucumel 2001 1 © Guy Cucumel 2001 2

Test de Fisher Exemple

! Pour un test bilatéral, la statistique de test est


Un courtier rapporte que le taux de rendement
donnée par:
2 2
moyen pour un échantillon d’actions de 10
F = Max(S21,S22) compagnies pétrolière est de 12.6% avec un écart-
Min(S1,S2)
type de 3.9%. Le taux de rendement moyen des
! L'hypothèse nulle est rejetée si la statistique de test actions de 8 compagnies de service est de 10.9%
est plus grande qu'une valeur critique lue dans une avec un écart-type de 3.5%. Avec un risque de 5%
table de Fisher. peut-on conclure que les actions des compagnies
! Pour un test unilatéral, la statistique de test est pétrolières sont plus volatiles que celles de
donnée par: compagnies de service?
2
S1 2 2
F= 2 si H1 : ó1 > ó2
© Guy Cucumel 2001
S2 3 © Guy Cucumel 2001 4

Solution ANOVA à un facteur

! Etape 1: Etablir l ’hypothèse nulle et l’hypothèse


1. Test d'égalité de deux moyennes ou plus
alternative.
! H0: σp = σs H1: σp > σs
2. Variables
! Etape 2: Etablir la règle de décision. " une variable indépendante nominale
! 2 catégories ou plus
! H0 est rejetée si F > 3.68, dl= (9, 7), α = 0.05.
" une variable dépendante de niveau
! Etape 3: Calculer la statistique de test.
intervalle ou proportionnel
! F = (3.9)2/(3.5)2 = 1.2416.
3. Généralisation du test de Student
! Etape 4: Décision sur H0?
! H0 n ’est pas rejetée.
© Guy Cucumel 2001 5 © Guy Cucumel 2001 6
Conditions d'application
Hypothèses de l'ANOVA
de l'ANOVA
H0: µ1 = µ2 = µ3 = ... = µk
1. Les échantillons sont tirés aléatoirement " Toutes les moyennes f(X)
des poulations sont
et sont indépendants égales
2. Les populations sont normalement H1: Les moyennes des X
µ1 = µ2 = µ3
distribuées (ou approximativement populations ne sont pas
normalement) toutes égales f(X)
" Au moins une des
3. Les populations ont même variance moyennes est différente
Le test de Fisher est sensible à la violation de " Ne signifie pas: X
s µ1 = µ 2 µ 3
ces hypothèses - il n'est pas robuste. µ1 ≠ µ2 ≠ ... ≠ µk
© Guy Cucumel 2001 7 © Guy Cucumel 2001 8

Décomposition de la
Principe
variation totale
On estime la variance selon deux approches:
1. La variance intra-groupes (MCE) qui demeure correcte
Variation totale
que les moyennes des populations soient égales ou
pas
Basée sur la moyenne des estimations des écart-types
des populations = Variation inter-
classes + Variation intra-
classes
2. La variance inter-groupes (MCF) qui est sans biais si et
seulement si l'hypothèse d'égalité des moyennes est " Somme des carrés du " Somme des carrés des
vraie modèle erreurs
" Somme des carrés due au
s Basée sur la variation des moyennes échantillonnales " Sum of Squares Within
3. Si l'hypothèse nulle est vraie, les deux estimations facteur
" Sum of Squares Between
devraient être proches 9 10
© Guy Cucumel 2001 © Guy Cucumel 2001

Tableau d'analyse de la
Formules (1)
variance
2

(x − x )
Source de Degrés Somme F k ni
SCT = ∑∑
Moyenne
variation de Des carrés des carrés ij
i =1 j=1
liberté (Variance)
2
Facteur k-1 SCF MCF = MCF ni
SCF = ∑∑ (xi − x )
k
SCF/(k - 1) MCE
i=1 j =1
Erreur n-k SCE MCE =
SCE/(n - k) 2

(x − x )
k ni
Total n-1 SCT = SCE = ∑∑ ij i
SCF+SCE s i=1 j=1

© Guy Cucumel 2001 11 © Guy Cucumel 2001 12


Formules (2) Exemple

k  
2 2

SCF = ∑  Ti  − T Un manufacturier souhaite voir M1 M2 M3


i=1  n 
 i n si trois machine à remplissage 25.40 23.40 20.00
ont des rendements différents.
26.31 21.80 22.20
ni  2 Il assigne aléatoirement 15
SCE = ∑∑ xij − ∑  Ti 
k k
2
travailleurs entraînés de la 24.10 23.50 19.75
i=1  n  23.74 22.75 20.60
i=1 j=1
 i même manière aux trois
machines (5 par machine). 25.10 21.60 20.40
SCT = SCF + SCE Avec un risque de 5%, les trois
machines ont-elles un
Ti représente la somme des observations de l’échantillon i
rendement différent?
(i=1,…,k), ni la taille de l’échantillon i et T le nombre total
s
d’observations.

© Guy Cucumel 2001 13 © Guy Cucumel 2001 14

Solution Calculs

H0: µ1 = µ2 = µ3 Statistique de test: Source de Degrés de Somme Moyenne F


H1: pas toutes égales MCF 23.58 variation liberté des des carrés
α = .05 F= = = 25.6 carrés (variance)
MCE . 92
dl1= 2 dl2 = 12 Facteur 3-1=2 47.1640 23.5820 25.60
Valeurs critiques:
Décision: Erreur 15 - 3 = 12 11.0532 .9211
Rejet à α = 0.05
α = 0.05
Conclusion: Total 15 - 1 = 14 58.2172
Au moins une des moyennes
0 3.89 F µ
i diffère des autres. 15 16
© Guy Cucumel 2001 © Guy Cucumel 2001

Tests de Bonferroni
Quelle moyenne diffère
et de Scheffé
1. Lorsqu'on fait plusieurs comparaisons impliquant les
1. Quelles sont les moyennes qui sont mêmes moyennes, la probabilité qu'une comparaison
indique un test de Student statistiquement significatif
significativement différentes
croit avec le nombre de comparaisons
" ex : µ1 = µ2 ≠ µ3
ex: 5 groupes, 10 paires de moyennes. Si l'hypothèse
f(X)
2. Analyse Post Hoc nulle de l'ANOVA n'est pas rejetée, la probabilité qu'au
" faite après le rejet moins un des 10 tests soit significatif avec un risque de
" de l'hypothèse nulle 5% est de 0,29.
X
µ 1 = µ2 µ 3 2. Le test de Bonferroni permet de corriger le problème.
Pour 5 comparaisons la correction de Bonferroni
2 groupements s indiquera que le test est significatif à 5% si on est à un
degré de significativité de moins de 0.05/5 soit 0.01.
© Guy Cucumel 2001 17 3. Le test de Scheffé est encore plus conservateur
© Guy Cucumel 2001 18
Hypothèses de l’ANOVA à
ANOVA à deux facteurs
deux facteurs
1. Test de l’égalité de la moyenne pour 2
1. Normalité
populations ou plus pour plusieurs
" Les populations sont normalement
variables indépendantes (facteurs). distribuées
2. Hypothèses - Différences entre: 2. Homogénéité des variances
(1) les moyennes selon le premier facteur, (2) les " Les populations ont des variances égales
moyennes selon le deuxième facteur 3. Indépendance des termes d’erreurs
et (3) les interactions entre les facteurs (1) et (2) " Les échantillons sont aléatoires et
indépendants

© Guy Cucumel 2001 19 © Guy Cucumel 2001 20

Décomposition de la variation totale Tableau d’analyse de la variance


dans une ANOVA à deux facteurs à deux facteurs sans interaction
Source de Degrés de Somme Moyenne F
Variation totale variation liberté des carrés des carrés
SCT = F1 k-1 SCF1 MCF1 MCF1
(lignes) MCE
Variation due au Variation due au F2 n-1 SCF2 MCF2 MCF2
facteur 1 facteur 2 (colonnes) MCE

SCF1 + SCF2 +

Variation due à Variation due à Erreur (k-1)(n-1) SCE MCE


l’interaction l’erreur Total kn - 1 SCT
SCI + SCE
© Guy Cucumel 2001 21 © Guy Cucumel 2001 22

Tableau d’analyse de la variance Modèle d’ANOVA à un


à deux facteurs avec interaction facteur
Source de Degrés de Somme Moyenne F

F1
variation

(lignes)
liberté
k-1
des carrés des carrés
SCF1 MCF1 MCF1
MCE
Xij = µ + αi + εij
F2 n-1 SCF2 MCF2 MCF2
k
∑α = 0
(colonnes) MCE
F1xF2 (k-1)(n-1) SCI MCI MCI
(interaction) MCE
Erreur kn(r-1) SCE MCE
i
Total knr - 1 SCT s i=1
© Guy Cucumel 2001 23 © Guy Cucumel 2001 24
Modèle d’ANOVA à deux Modèle d’ANOVA à deux
facteurs sans interaction facteurs avec interaction

Xij = µ + αi + βj + εij Xijh = µ + αi + βj + γij + εijh


k n k n
∑ α = ∑β = ∑ γ = ∑ γ
k n
∑ αi = ∑ βj = 0
i=1 j=1
i=1
i
j=1
j
i=1
ij
j=1
ij =0

s s

© Guy Cucumel 2001 25 © Guy Cucumel 2001 26

Vous aimerez peut-être aussi