ST 2 Avar
ST 2 Avar
ST 2 Avar
ANALYSE DE
LA VARIANCE
EXTRAIT DE
PRÉAMBULE
PLAN
-2-
Chapitre 9
L’analyse de la variance
à un critère de classification
Sommaire
⊕ 9.1 Introduction
⊕ 9.2 Les aspects descriptifs
⊕ 9.3 Les aspects inférentiels
⊕ 9.4 La puissance et la détermination des nombres d’observations
Exercices
238 ANALYSE DE LA VARIANCE À UN CRITÈRE 9.1
⊕ 9.1 Introduction
1◦ D’une manière tout à fait générale, l’analyse de la variance 1 a comme
objectif de comparer des ensembles de plus de deux moyennes, en identifiant les
sources de variation qui peuvent expliquer les différences existant entre elles. À ce
titre, l’analyse de la variance est un des principaux outils de l’inférence statistique.
Dans le cas le plus simple, l’analyse de la variance à un critère de classifica-
tion ou à un facteur ou à une voie 2 concerne des ensembles de moyennes qui ne
présentent aucune structure particulière, liée par exemple à l’existence de deux ou
plusieurs facteurs sous-jacents 3 (§ 1.2.2.2◦ ).
2◦ Bien que l’analyse de la variance ait été conçue essentiellement dans l’op-
tique de la réalisation d’estimations et de tests d’hypothèses, elle peut également
être considérée dans une certaine mesure comme une méthode descriptive. En
vue de clarifier au maximum l’exposé, nous distinguerons les deux approches, en
présentant dans un premier temps les aspects descriptifs (§ 9.2), puis les aspects
inférentiels (§ 9.3). Nous envisagerons en outre les questions de détermination de
la puissance de l’analyse et des nombres d’observations à effectuer (§ 9.4).
Les exemples 9.2.1 et 9.3.3 sont des illustrations des problèmes envisagés ici.
la variance à deux composantes, en raison du fait que la variation totale y est divisée en deux
parties (variation factorielle et variation résiduelle).
9.2.2 ASPECTS DESCRIPTIFS 239
effectuées selon des échelles comportant au moins cinq degrés (appréciations sen-
sorielles pouvant aller de 1 à 5 ou de 1 à 7, par exemple) [Rayner et al., 1986 ;
Tricker, 1992].
L’exemple 9.3.2 sera exclusivement consacré, à titre d’illustration, à la question
du contrôle des conditions d’application de l’analyse de la variance.
ni p ni p
1 X 1 XX 1 X
x̄i = xik et x̄ = xik = (ni x̄i ) .
ni n. i=1 n. i=1
k=1 k=1
p X
X ni p
X p X
ni
£ § X
ou (xik − x̄)2 = ni (x̄i − x̄)2 + (xik − x̄i )2 .
i=1 k=1 i=1 i=1 k=1
On constate ainsi que la somme des carrés des écarts par rapport à la moyenne
générale, également appelée somme des carrés des écarts totale 4 , peut elle aussi
être divisée en deux composantes additives : une somme des carrés des écarts fac-
torielle ou entre échantillons 5 , et une somme des carrés des écarts résiduelle ou
dans les échantillons 6 . En désignant la somme totale par SCEt et ses deux com-
posantes respectivement par SCEa et SCEr , on peut résumer l’équation d’analyse
4 En anglais : total sum of squares.
5 En anglais : factorial sum of squares, between-group sum of squares.
6 En anglais : residual sum of squares, within-group sum of squares, error sum of squares.
9.2.2 ASPECTS DESCRIPTIFS 241
Les trois sommes des carrés des écarts sont des mesures globales des varia-
tions existant, d’une part, entre l’ensemble des observations indépendamment des
échantillons auxquels elles appartiennent, d’autre part, entre les différents échan-
tillons, et enfin, entre les observations à l’intérieur des différents échantillons.
d On notera qu’aucun double produit, pouvant résulter de l’élévation au carré,
n’apparaı̂t dans l’équation d’analyse de la variance, la somme des doubles produits
étant nulle, en vertu de la propriété de nullité de la somme des écarts par rapport
à la moyenne [STAT1, § 3.5.1.2◦ ] :
p X
X ni p ∑
X ni
X ∏
£ §
2 (x̄i − x̄) (xik − x̄i ) = 2 (x̄i − x̄) (xik − x̄i ) = 0 .
b i=1 k=1 i=1 k=1
n. − 1 = (p − 1) + (n. − p) .
6◦ Enfin, en divisant les sommes des carrés des écarts par leurs nombres de
degrés de liberté respectifs, on définit des quantités appelées carrés moyens 7 , à
savoir un carré moyen total 8 , un carré moyen factoriel ou entre échantillons 9 , et
un carré moyen résiduel ou dans les échantillons 10 :
Ces carrés moyens sont aussi appelés variances et ils possèdent d’ailleurs certaines
des propriétés des variances, notamment en ce qui concerne leurs distributions
d’échantillonnage. Comme les sommes des carrés des écarts, les carrés moyens
constituent des mesures globales des variations existant aux trois niveaux consi-
dérés.
7◦ L’ensemble des résultats peut être présenté sous la forme d’un tableau d’ana-
lyse de la variance (tableau 9.2.1).
En pratique, de tels tableaux sont obtenus le plus souvent à l’aide de logiciels
qui font intervenir soit des commandes ou des procédures spécifiques à l’analyse
7 En anglais : mean square.
8 En anglais : total mean square.
9 En anglais : factorial mean square, between-group mean square.
10 En anglais : residual mean square, within-group mean square, error mean square.
242 ANALYSE DE LA VARIANCE À UN CRITÈRE 9.2.2
de la variance et souvent dénommées ✭✭ anova ✮✮, soit des commandes plus générales
relatives au modèle linéaire et fréquemment appelées ✭✭ glm ✮✮.
d 8◦ Le quotient des sommes des carrés des écarts factorielle et totale permet de
définir facilement le rapport de corrélation, aussi appelé coefficient de corrélation
non linéaire 11 :
p
η = SCEa /SCEt .
D’une manière générale, ce paramètre joue, dans le cas d’une relation liant une
caractéristique nominale et une variable quantitative, un rôle semblable à celui
du coefficient de corrélation dans le cas de deux variables quantitatives [STAT1,
§ 4.6.3.5◦ ]. La caractéristique nominale correspond ici aux différents échantillons
et la variable quantitative correspond aux différentes observations.
Le rapport de corrélation est toujours compris entre 0 et 1 . Il est égal à 0
quand toutes les moyennes x̄i sont égales entre elles, et il est égal à 1 quand les
variances des différents échantillons sont toutes nulles.
Certains logiciels associent systématiquement le carré du rapport de corrélation
à toutes les analyses de la variance, en utilisant la notation r2 ou R2 , et non pas η 2
ou tout autre symbole particulier. S’il s’agit bien là d’un paramètre jouant un rôle
comparable à celui du coefficient de détermination [STAT1, § 4.6.1.5◦ ], il y a lieu
toutefois d’être attentif au fait qu’il ne s’agit nullement, d’une façon générale, du
b carré d’un coefficient de corrélation classique.
Exemple 9.2.1. Comparaison des hauteurs moyennes des arbres de trois types
de hêtraies : analyse de la variance.
Nous avons examiné antérieurement, à diverses reprises, un ensemble de don-
nées relatives à des hauteurs d’arbres observées dans trois types de hêtraies (exem-
ple 2.3.1). Nous en venons maintenant à l’objectif réel de l’étude, à savoir vérifier
s’il existe ou non, en moyenne, des différences significatives de hauteurs entre les
trois types de forêts, et chiffrer éventuellement ces différences.
11 En anglais : correlation ratio, non-linear correlation coefficient.
9.2.2 ASPECTS DESCRIPTIFS 243
Les valeurs relatives aux 37 endroits où les mesures ont été réalisées sont don-
nées dans le tableau 2.3.1. Les moyennes correspondantes sont :
Cette façon de procéder n’est pas celle qui est habituellement suivie, mais elle peut
être utile au point de vue didactique, pour bien saisir le mécanisme de l’analyse
de la variance. Nous verrons au paragraphe 9.2.3 comment les calculs peuvent
éventuellement être réalisés en pratique.
Le tableau 9.2.2 présente les sommes des carrés des écarts qui sont ainsi obte-
nues, les nombres de degrés de liberté et les carrés moyens. Le carré moyen total,
égal à 4,598 , n’est toutefois pas repris dans ce tableau, afin d’éviter de suggérer,
à tort, qu’il pourrait être égal à la somme des deux autres carrés moyens.
Tableau 9.2.2. Comparaison des hauteurs moyennes des arbres de trois types
de hêtraies : tableau d’analyse de la variance.
Ce carré moyen total (ou cette variance totale), auquel correspond un écart-
type égal à 2,14 m, mesure globalement l’hétérogénéité des hauteurs, sans tenir
compte de la subdivision en trois types de forêts. Le carré moyen résiduel (ou
la variance résiduelle), auquel est associé un écart-type égal à 1,85 m, mesure,
244 ANALYSE DE LA VARIANCE À UN CRITÈRE 9.2.3
2◦ En ce qui concerne la somme des carrés des écarts résiduelle, on peut calcu-
ler séparément les sommes des carrés des écarts relatives aux différents échantillons
ou séries d’observations, et sommer ensuite les résultats ainsi obtenus. Si on désigne
par Xi. et SCEi , respectivement, les sommes et les sommes des carrés des écarts
relatives aux différentes séries d’observations, on a :
ni
X ni
X
Xi. = xik et SCEi = x2ik − Xi.2 /ni (pour tout i) ,
k=1 k=1
ainsi que :
p
X
SCEr = SCEi .
i=1
3◦ Quant à la somme des carrés des écarts totale, on a, toujours par analogie
avec le cas d’une seule série d’observations :
Xp X ni
SCEt = x2ik − X..2 /n. ,
i=1 k=1
Exemple 9.2.2. Comparaison des hauteurs moyennes des arbres de trois types
de hêtraies : réalisation de l’analyse de la variance.
En ce qui concerne l’exemple 9.2.1, les différentes sommes des carrés des écarts
de l’analyse de la variance (tableau 9.2.2) peuvent être obtenues de la manière
suivante, à partir des données du tableau 3.2.1 :
SCE1 = 8.789,36 − 337,62 /13 = 22,15 , SCE2 = 9.062,96 − 355,42 /14 = 40,88 ,
SCE3 = 5.408,22 − 231,42 /10 = 53,62 , SCEr = 22,15 + 40,88 + 53,62 = 116,65 ,
Le modèle fixe ou modèle I 12 , qui est le plus classique, a pour objet la com-
paraison d’un nombre limité p de populations, pour chacune desquelles peut être
prélevé un échantillon. Le modèle aléatoire ou modèle II 13 a trait, au contraire,
à la comparaison d’une infinité ou d’un très grand nombre (une quasi-infinité) de
populations, pour toutes lesquelles il n’est pas possible, en pratique, de prélever
chaque fois un échantillon.
Dans ce deuxième cas, l’échantillonnage est un échantillonnage à deux degrés
[STAT1, § 2.2.4.4◦ ]. Dans un premier temps, on choisit de façon complètement aléa-
toire un nombre réduit p de populations, et dans un deuxième temps, on choisit
un échantillon à l’intérieur de chacune de ces seules p populations.
Comme nous l’avons déjà signalé (§ 9.1.3◦ ), et cela pour les deux modèles, les
échantillons choisis au sein des p populations doivent être aléatoires, simples et
indépendants les uns des autres.
Dans l’interprétation des résultats fournis par le modèle aléatoire, on doit être
particulièrement attentif au fait qu’on ne s’intéresse pas spécifiquement aux p po-
pulations pour lesquelles on dispose d’observations. Ces quelques populations ne
sont en fait prises en considération que comme une image de l’ensemble plus vaste
des populations, en nombre infini ou quasi infini, au sujet duquel on s’interroge.
L’exemple 9.3.3 est une illustration de cette situation.
d D’autres modèles, intermédiaires ou plus généraux, ont également été proposés,
b mais sont très peu utilisés [Plackett, 1960].
2◦ Nous consacrerons les paragraphes 9.3.2 et 9.3.3 à ces deux modèles et nous
présenterons ensuite quelques compléments relatifs à l’application de ces modèles
à deux problèmes d’échantillonnage (§ 9.3.4), quelques autres compléments plus
mathématiques (§ 9.3.5), et quelques informations relatives aux méthodes non pa-
ramétriques et robustes, dont le test des rangs ou de Kruskal et Wallis (§ 9.3.6).
Une distinction sera faite également, à certains moments, entre le cas des échan-
tillons de même effectif, dit aussi équilibré 14 , et le cas des échantillons d’effectifs
inégaux, dit non équilibré 15 .
les quantités ai étant les écarts factoriels, non aléatoires, liés au facteur contrôlé,
et les quantités Dik les écarts résiduels, aléatoires, indépendants les uns des autres,
de moyenne nulle et de même variance σ 2 . Une autre écriture encore :
Xik = m + ai + Dik ,
met en évidence le fait que toute observation, aléatoire, peut être considérée comme
résultant de l’addition d’une moyenne générale, d’un effet non aléatoire dû au
facteur pris en considération, aussi appelé effet principal 16 , et d’un écart ou d’un
résidu 17 aléatoire relatif spécifiquement à l’individu envisagé.
On notera qu’en raison de leurs relations avec les moyennes, les effets princi-
paux ai sont de somme pondérée nulle :
p
X
(ni ai ) = 0 ,
i=1
et aussi, que c’est bien aux écarts résiduels Dik que s’appliquent les hypothèses
de normalité, d’égalité des variances et d’indépendance émises antérieurement
(§ 9.1.3◦ ).
H0 : m1 = m2 = . . . = mp ou a1 = a2 = . . . = ap = 0 .
et E(CMr ) = σ 2 .
5◦ On peut aussi démontrer que, quand l’hypothèse nulle est vraie, les distri-
butions d’échantillonnage des différentes sommes des carrés des écarts sont, à la
constante σ 2 près, des distributions χ2 . Les variables :
sont en effet des variables χ2 dont les nombres de degrés de liberté sont ceux qui
ont été présentés au paragraphe 9.2.2.5◦ , à savoir n. − 1 , p − 1 et n. − p .
En outre, les deux dernières variables sont indépendantes l’une de l’autre, au
même titre que la moyenne, ou la différence de deux moyennes, et la variance sont
indépendantes l’une de l’autre dans le cas d’un ou de deux échantillons [STAT1,
§ 8.3.2.4◦ ].
La démonstration de ces différentes propriétés est également donnée au para-
graphe 9.3.5.
6◦ Sur base de ce qui vient d’être dit, le rapport des variables χ2a et χ2r , divisées
par leurs nombres de degrés de liberté :
£ 2 §±£ §
χa /(p − 1) χ2r /(n. − p) = CMa /CMr ,
m
b i = x̄i et b2 = CMr ,
σ
d 9◦ Dans le test présenté ci-dessus, nous avons supposé implicitement que l’hy-
pothèse alternative H englobe toutes les situations où au moins une des égalités
définies par l’hypothèse nulle n’est pas vérifiée, et cela quel que soit le sens de la
ou des différences existant entre les moyennes.
On envisage parfois aussi des alternatives ordonnées 18 , pour lesquelles le sens
des différences éventuelles, ou de certaines d’entre elles, est spécifié a priori
[McDermott et Mudholkar, 1993 ; Miwa et al., 2000 ; Mudholkar et
McDermott, 1989]. Il peut s’agir par exemple de l’alternative suivante :
H : m1 ≤ m2 ≤ . . . ≤ mp ,
pour autant qu’elle comporte au moins une inégalité stricte. De telles hypothèses
alternatives correspondent à des ensembles non décroissants de moyennes.
D’autre part, comme dans le cas de deux populations (§ 8.4.2.8◦ ), le test d’éga-
lité des moyennes peut céder la place à un test d’équivalence des moyennes, dans
lequel l’hypothèse nulle n’implique pas que les moyennes sont toutes strictement
18 En anglais : ordered alternative.
250 ANALYSE DE LA VARIANCE À UN CRITÈRE 9.3.2
égales, mais bien que leur variance est inférieure ou égale à une certaine limite
suffisamment petite [Chen et al., 2000 ; Wellek, 2003] :
p
1X
H0 : (mi − m)2 ≤ ∆2 .
b p i=1
Exemple 9.3.1. Comparaison des hauteurs moyennes des arbres de trois types
de hêtraies : suite de l’analyse de la variance.
Nous pouvons maintenant clôturer l’analyse de la variance que nous avons
entamée à l’exemple 9.2.1.
À partir du tableau 9.2.2, on obtient :
La conclusion finale serait ainsi qu’il n’y a pas de différence significative de hau-
teur des arbres entre les deux premiers types de hêtraies, qu’il existe au contraire
9.3.2 ASPECTS INFÉRENTIELS 251
une différence hautement significative de hauteur entre ces deux types et le troi-
sième, et que cette différence peut être estimée à 2,5 m , avec des limites de
confiance égales à 1,1 et 3,9 m , au degré de confiance habituel (1 − α = 0,95).
d En vue de tenir compte du fait qu’on procède en réalité à trois comparaisons,
dans la détermination des trois intervalles de confiance initiaux, on aurait pu
remplacer la valeur t classique (t0,975 = 2,032), par une valeur t définie au sens de
Bonferroni [STAT1, § 10.3.5.2◦ ] :
Cette façon de faire aurait conduit à étendre assez sensiblement les différents
b intervalles de confiance, sans modifier, dans le cas présent, les conclusions finales.
Exemple 9.3.2. Comparaison des hauteurs moyennes des arbres de trois types
de hêtraies : contrôle des conditions d’application de l’analyse de la variance.
Nous avons déjà examiné antérieurement les données de l’exemple précédent
sous l’angle du respect des conditions de normalité et d’égalité des variances. Il
nous paraı̂t cependant opportun de revoir globalement la question, en vue d’en
faire la synthèse et d’émettre certains suggestions qui peuvent être étendues à
l’ensemble du domaine d’application de l’analyse de la variance.
Dans un but purement didactique, nous avons en fait procédé à l’examen initial
des données, y compris l’étude des écarts réduits (exemple 2.3.1), vérifié la nor-
malité des distributions par la réalisation de diagrammes de probabilité (exemple
3.3.1), par le test de Shapiro et Wilk (exemple 3.3.3) et par le test de conformité
des coefficients de Pearson et de Fisher (exemple 3.4.1), recherché d’éventuel-
les observations aberrantes par la méthode de Grubbs (exemple 3.5.2), et vérifié
l’égalité des variances par les tests de Bartlett, de Hartley et de Levene
(exemple 7.5.1). Comme nous l’avons déjà signalé, l’emploi d’un tel ✭✭ arsenal ✮✮ de
méthodes ne se justifie bien sûr absolument pas en pratique.
Une procédure générale, applicable aux divers cas d’analyse de la variance, peut
consister par exemple en un examen initial des données tout à fait classique (§ 2.3.2
et 2.3.3), un contrôle rapide de la normalité des distributions par la méthode des
diagrammes de probabilité (§ 3.3.2), une identification des éventuelles observations
aberrantes par la méthode de Grubbs (§ 3.5.3), et un contrôle de l’égalité des
variances par la méthode de Levene (§ 7.5.2.6◦ et 7.5.3).
Dans cette optique, la méthode des diagrammes de probabilité peut être ap-
pliquée globalement aux résidus xik − x̄i ou aux résidus réduits correspondants,
l’identification des éventuelles observations aberrantes peut se faire à partir des
résidus réduits, et la méthode de Levene peut aussi être appliquée indifféremment
aux résidus ou aux résidus réduits.
Pour l’exemple considéré ici, les résidus et les résidus réduits de l’analyse de la
variance sont donnés dans le tableau 3.5.1, sous les appellations d’écarts et écarts
réduits par rapport aux moyennes. Le diagramme de probabilité correspondant est
252 ANALYSE DE LA VARIANCE À UN CRITÈRE 9.3.3
Tableau 9.3.1. Comparaison des hauteurs moyennes des arbres de trois types de
hêtraies : tableau d’analyse de la variance relatif aux valeurs absolues des résidus.
La moyenne générale m est relative à l’ensemble infini ou quasi infini des popu-
lations considérées, et non pas à l’ensemble beaucoup plus limité des p populations
pour lesquelles on dispose d’observations.
Ai = Mi − m ,
Ces écarts factoriels sont aussi indépendants des écarts résiduels Dik .
E(CMt ) = σ 2 + n0 (p − 1) σA
2
/(n. − 1) , E(CMa ) = σ 2 + n0 σA
2
et E(CMr ) = σ 2 ,
2
σA et σ 2 étant les deux variances, respectivement entre les populations et dans
les populations, et la quantité n0 étant définie de la manière suivante, à partir des
effectifs des échantillons et de l’effectif total :
≥ p
X ¥.£ §
0 2
n = n. − n2i n. (p − 1) .
i=1
Quand les échantillons sont de même effectif, la quantité n0 est égale à l’effectif
commun n .
Nous donnerons la démonstration de ces différentes propriétés au paragra-
phe 9.3.5.
et non pas seulement des moyennes des p populations pour lesquelles on dispose
d’observations. L’hypothèse nulle concerne donc bien l’infinité ou la quasi-infinité
des populations prises en considération.
en se limitant aux situations où le carré moyen factoriel CMa est supérieur au
carré moyen résiduel CMr .
d On notera qu’il s’agit en fait d’estimations basées sur le principe de la méthode
◦
b des moments [STAT1, § 9.3.3.2 ].
7◦ Comme pour le modèle fixe, des limites de confiance peuvent être détermi-
nées facilement pour σ 2 , par les formules habituelles (§ 9.3.2.8◦ ).
2
Le problème est plus délicat pour σA . Une solution approchée et relativement
simple est fournie par les expressions suivantes, dans le cas des effectifs égaux :
(p − 1) CMr (Fobs − F1−α/2 )/(n χ21−α/2 ) et (p − 1) CMr (Fobs − Fα/2 )/(n χ2α/2 ) ,
0
et Fobs par une valeur modifiée Fobs définie de la manière suivante :
0
±£ §
Fobs = n00 SCEx̄i (p − 1) CMr ,
SCEx̄i étant la somme des carrés des écarts non pondérée des moyennes x̄i [Tho-
mas et Hultquist, 1978].
On remarquera que ces expressions peuvent donner des résultats négatifs. On
peut éviter cet inconvénient en remplaçant les valeurs négatives par zéro, mais
cette solution conduit à certains biais, relativement importants quand les carrés
moyens CMa et CMr sont peu différents l’un de l’autre.
19 En anglais : variance component.
9.3.3 ASPECTS INFÉRENTIELS 255
CMa /(σ 2 + n0 σA
2
)
Fα/2 < < F1−α/2 ,
CMr /σ 2
puisque la partie centrale de cette inégalité est toujours une valeur observée d’une
variable de Fisher-Snedecor, même si l’hypothèse nulle est fausse.
2
On obtient ainsi, comme limites de confiance de σA /σ 2 :
La probabilité de dépasser la valeur 4,23 étant égale à 0,041 , pour une va-
riable F de Fisher-Snedecor à 2 et 12 degrés de liberté, les différences entre
prairies doivent être considérées comme juste significatives. C’est ce qu’indique
d’ailleurs l’astérisque qui est associée, conventionnellement, à la valeur Fobs .
On peut alors procéder comme suit aux estimations des composantes de la
variance :
2
σ
bA b2 = 0,1559 .
= (0,6591 − 0,1559)/5 = 0,1006 et σ
9.3.4 ASPECTS INFÉRENTIELS 257
En termes d’écarts-types, on observe donc une variabilité de 0,32 t/ha d’une prai-
rie à l’autre, et de 0,39 t/ha d’une parcelle à l’autre à l’intérieur des différentes
prairies.
Les différences entre prairies n’étant que juste significatives, on doit s’attendre
à ce que la première estimation soit très peu précise. Pour un degré de confiance
égal à 0,95 , on obtient en effet, comme limites de confiance (tables III et IV) :
±£ §
2 (0,1559) (4,23 − 5,10) 5 (7,38) = − 0,0074 ,
±£ §
et 2 (0,1559) (4,23 − 0,0254) 5 (0,0506) = 5,18 ,
0 et 2,28 t/ha .
La deuxième estimation est par contre nettement meilleure, les limites de confiance
étant, dans les mêmes conditions (table III) :
p ni
1 XX
m
b = x̄ = xik .
n. i=1
k=1
Dans les conditions définies au paragraphe 9.1.3◦ , les limites de confiance sui-
vantes peuvent être associées à cette estimation :
p
x̄ ± t1−α/2 CMr /n. ,
4◦ C’est donc du carré moyen résiduel CMr , et non pas du carré moyen total
CMt , que dépend la précision de l’estimation de m . S’il existe des différences entre
strates, le carré moyen résiduel est en moyenne inférieur au carré moyen total,
et l’échantillonnage stratifié est en conséquence plus précis que l’échantillonnage
complètement aléatoire. L’efficacité relative de l’un par rapport à l’autre est donnée
par le quotient CMt /CMr .
Le gain de précision de l’échantillonnage stratifié par rapport à l’échantillon-
nage complètement aléatoire est d’autant plus grand que ce quotient est élevé,
c’est-à-dire aussi d’autant plus grand que le carré moyen factoriel et donc les dif-
férences entre les moyennes des strates sont importants.
F1−α = t21−α/2 ,
E(SCEi ) = (ni − 1) σ 2 .
Il en résulte que, pour la somme des carrés des écarts résiduelle, qui n’est autre
que la somme des p quantités SCEi , et pour le carré moyen résiduel, on a :
p
X £ §
E(SCEr ) = (ni − 1) σ 2 = (n. − p) σ 2 et E(CMr ) = σ 2 .
i=1
Dans le cas du modèle fixe, on a en outre, en désignant par X̄i et X̄ les variables
aléatoires qui correspondent respectivement aux moyennes x̄i et x̄ :
1 X
ni ≥ 1 X
ni ¥2
X̄i = m + ai + Dik et X̄i2 = m + ai + Dik .
ni ni
k=1 k=1
En développant X̄i2
, qui est le carré d’une somme de 2 + ni termes, en une somme
de carrés et de doubles produits, en appliquant les propriétés relatives à l’espérance
mathématique des sommes et des produits de variables aléatoires [STAT1, § 5.7.2],
et en se souvenant du fait que la somme des produits ni ai est nulle tandis que
2
l’espérance mathématique de Dik et l’espérance mathématique de Dik sont res-
2
pectivement nulle et égale à σ , on obtient :
hX
p i p
X
E(X̄i2 ) =m 2
+a2i +σ 2 /ni +2 m ai et E 2 2
(ni X̄i ) = n. m + (ni a2i )+p σ 2 .
i=1 i=1
1 X
p
1 XX
p ni ≥ 1 XX
p ni ¥2
X̄ = m + (ni ai ) + Dik , X̄ 2 = m + Dik
n. i=1 n. i=1 n. i=1
k=1 k=1
et E(X̄ 2 ) = m2 + σ 2 /n. .
264 ANALYSE DE LA VARIANCE À UN CRITÈRE 9.3.5
Il en découle que :
p
X p
X
E(SCEa ) = n. m2 + (ni a2i ) + p σ 2 − n. m2 − σ 2 = (p − 1) σ 2 + (ni a2i ) ,
i=1 i=1
≥ 1
p
X 1
p X
X ni ¥2 2 X
σA
p
2 2 2
X̄ = m + (ni Ai ) + Dik , E(X̄ ) = m + 2 n2 + σ 2 /n.
n. i=1
n. i=1 k=1
n. i=1 i
2 Xp
σA
et E(SCEa ) = n. m + 2 2
n. σA 2
+ p σ − n. m − 2
n2 − σ 2
n. i=1 i
≥ 1 X 2¥ 2
p
= (p − 1) σ 2 + n. − n σ .
n. i=1 i A
◦
b Les relations du paragraphe 9.3.3.4 en découlent immédiatement.
Ces variables étant indépendantes les unes des autres, puisque les échantillons
sont eux-mêmes indépendants les uns des autres, leur somme, c’est-à-dire aussi la
somme des carrés des écarts résiduelle divisée par σ 2 , est une variable χ2 à n. − p
degrés de liberté [STAT1, § 6.8.1.3◦ ].
9.3.6 ASPECTS INFÉRENTIELS 265
Enfin, par une procédure analogue à celle qui intervient dans la recherche
de la distribution d’échantillonnage de la variance [STAT1, § 8.3.2.5◦ ], on peut
démontrer que la différence entre χ2t et χ2r , c’est-à-dire la somme des carrés des
écarts factorielle divisée par σ 2 , est elle aussi une variable χ2 , à p − 1 degrés de
b liberté, à condition à nouveau que toutes les moyennes mi soient égales.
Exemple 9.3.6. Comparaison des hauteurs moyennes des arbres de deux types
de hêtraies : analyse de la variance.
Pour illustrer la relation qui existe entre l’analyse de la variance à un critère
de classification et le test t , il suffit de traiter les données de l’exemple 8.4.1 par
l’analyse de la variance. On obtient ainsi :
Fobs = 0,91 ,
tobs = 0,95 .
On peut vérifier également que la valeur F0,95 (soit 4,24) est égale au carré de
t0,975 (soit 2,06), ou encore que, dans les deux cas, la probabilité correspondant
aux valeurs observées est égale à 0,35 .
d Exemple 9.3.7. Comparaison des hauteurs moyennes des arbres de trois types de
hêtraies : analyse de la variance avec variances quelconques.
Pour les données des exemples 9.2.1 et 9.3.1, sans hypothèse d’égalité des va-
riances et dans l’optique d’un ajustement du nombre de degrés de liberté selon le
principe du test de Welch, on obtient, pour la somme des carrés des écarts et le
carré moyen résiduels, la valeur :
au lieu de 34 .
La probabilité associée à la valeur Fobs serait alors égale à 0,0044 , au lieu de
0,0026 , et la conclusion de l’analyse de la variance ne serait donc pas modifiée.
La réduction relativement importante du nombre de degrés de liberté est liée
au fait que la variance observée la plus élevée est relative à l’échantillon d’effectif
b le plus réduit.
les rangs. Ce test est connu sous le nom de test de Kruskal et Wallis 26 , et il
constitue une généralisation du test de Mann et Whitney ou de Wilcoxon.
Quand l’hypothèse d’égalité des moyennes, ou des médianes, est vraie, cette
quantité est approximativement une valeur observée d’une variable χ2 de Pearson
à p − 1 degrés de liberté, et l’hypothèse d’identité des distributions des p popu-
lations-parents doit en conséquence être rejetée, au niveau de probabilité α , si :
P(χ2 ≥ χ2obs ) ≤ α ou χ2obs ≥ χ21−α ,
le test étant unilatéral.
L’approximation est satisfaisante dès qu’on dispose d’un total de 15 à 20 obser-
vations au moins et des tables particulières sont disponibles pour des effectifs plus
limités. De telles tables, de même que des procédures de calcul, qui sont intégrées
dans divers logiciels, peuvent être trouvées dans les principaux ouvrages relatifs
aux méthodes non paramétriques et dans les publications de Di Bucchianico et
van de Wiel [2005], Iman et al. [1975], et Owen [1962].
d 3◦ On notera que la quantité χ2obs est à un facteur près le carré moyen factoriel
qu’on obtiendrait en soumettant les rangs à l’analyse de la variance. La somme
des carrés des écarts factorielle serait en effet, pour les rangs (§ 9.2.3.4◦ ) :
p
X p
X
£ §2 ±
SCEa = (Xi.2 /ni ) − n. (n. + 1)/2 n. = (Xi.2 /ni ) − n. (n. + 1)2 /4 .
i=1 i=1
D’autre part, dans le cas de deux populations, la valeur χ2obs du test de Krus-
kal et Wallis est aussi le carré de la quantité uobs relative au test de Mann et
b Whitney ou de Wilcoxon, ce qui rend les deux tests strictement équivalents.
4◦ Des commentaires semblables à ceux des paragraphes 8.4.3.4◦ , 8.4.3.5◦ et
8.4.3.6◦ peuvent également être formulés ici.
C’est ainsi qu’une correction doit être apportée en présence d’ex aequo, pour
autant que ceux-ci soient particulièrement nombreux. Cette correction se réalise
alors en divisant la valeur χ2obs par :
nX£ §o±£ §
1− k (k2 − 1) n. (n2. − 1) ,
la sommation étant relative aux différentes séries d’ex aequo communs à deux ou
plusieurs échantillons, et k désignant le nombre de termes de ces différentes séries.
C’est ainsi également que, dans les conditions d’application de l’analyse de la
variance, l’efficacité asymptotique du test de Kruskal et Wallis, par rapport à
l’analyse de la variance, est égale à 3/π ou 95,5 %.
d 5◦ Comme pour deux populations aussi, d’autres tests non paramétriques ont
été proposés. On peut citer notamment un test général basé sur les médianes,
une variante du test de Kolmogorov et Smirnov (§ 3.2.1.3◦ ), et différents tests
relatifs au cas des hypothèses alternatives ordonnées (§ 9.3.2.9◦ ), dont le test de
Jonckheere ou de Terpstra et Jonckheere 27 [Büning, 1999 ; Neuhäuser
et al., 1998 ; Zhang et Wu, 2007].
De même, diverses méthodes robustes ont été proposées [Babu et al., 1999 ;
Büning, 1997 ; Routledge, 1997]. Et des méthodes robustes existent aussi en
matière d’estimation des composantes de la variance [Müller et Uhlig, 2001 ;
b Stahel et Welsh, 1997 ; Zhou et Zhu, 2003].
Exemple 9.3.8. Comparaison des hauteurs des arbres de trois types de hêtraies :
test de Kruskal et Wallis.
Le tableau 9.3.4 reprend les données de hauteurs d’arbres qui nous ont servi
à illustrer l’analyse de la variance à un critère de classification (exemples 9.2.1 et
9.3.1), ainsi que les rangs qui peuvent être associés à ces données.
Á partir des sommes des rangs, on obtient :
12
χ2obs = (316,52 /13 + 280,52 /14 + 1062 /10) − 3 (38) = 9,32 ,
(37) (38)
et avec deux degrés de liberté :
P(χ2 ≥ 9,32) = 0,0095 .
Tableau 9.3.4. Comparaison des hauteurs des arbres de trois types de hêtraies :
hauteurs observées, en mètres, et rangs.
Hauteurs Rangs
Type 1 Type 2 Type 3 Type 1 Type 2 Type 3
23,4 22,5 18,9 8 5,5 1
24,4 22,9 21,1 12,5 7 2
24,6 23,7 21,2 16,5 10 3
24,9 24,0 22,1 18 11 4
25,0 24,4 22,5 19 12,5 5,5
26,2 24,5 23,6 23 14,5 9
26,3 25,3 24,5 25 20 14,5
26,8 26,0 24,6 29,5 21 16,5
26,8 26,2 26,2 29,5 23 23
26,9 26,4 26,7 31,5 26 27,5
27,0 26,7 – 33 27,5 –
27,6 26,9 – 35 31,5 –
27,7 27,4 – 36 34 –
– 28,5 – – 37 –
Totaux 316,5 280,5 106
La puissance est alors directement fonction de δ , qui est une mesure très simple
du degré de fausseté de l’hypothèse nulle [STAT1, § 10.4.2].
9.4.2 PUISSANCE ET NOMBRES D’OBSERVATIONS 269
Il n’en est pas de même pour l’analyse de la variance, les hypothèses alternatives
étant beaucoup plus diversifiées, en raison de la multiplicité des signes d’égalité qui
interviennent dans l’hypothèse nulle. Une même différence de moyennes n’implique
d’ailleurs pas toujours, dans ce cas, un même degré de fausseté de l’hypothèse nulle.
Ainsi, pour quatre populations par exemple, les hypothèses :
H1 : m1 6= m2 = m3 = m4 et H2 : m1 = m2 6= m3 = m4 ,
3◦ Des tables, des abaques et des procédures de calcul, qui se basent sur de tels
paramètres, permettent de déterminer la puissance du test. On peut se référer à ce
propos à certains recueils de tables, tel que celui de Pearson et Hartley [1966-
1972], et à diverses autres publications [Guenther, 1979 ; Hager et Möller,
1986 ; Tiku, 1967, 1972].
Comme dans le cas de deux populations [STAT1, § 10.4.3.1◦ ], la puissance est
non seulement une fonction croissante du degré de fausseté de l’hypothèse nulle,
mais aussi une fonction croissante des effectifs des échantillons et du risque de
première espèce, et une fonction décroissante de la variance résiduelle σ 2 .
Exemple 9.4.1. Comparaison des hauteurs moyennes des arbres de trois types
de hêtraies : puissance du test.
Nous repartons ici des conclusions de l’exemple 9.3.1 pour déterminer, dans ce
cas, la puissance du test d’égalité des moyennes. Nous simplifions toutefois quelque
peu le problème, en considérant que les échantillons sont tous trois d’effectif 12 ,
et non pas respectivement d’effectifs 13 , 14 et 10 .
L’alternative à laquelle conduit l’exemple 9.3.1 est du type :
H : m1 = m2 6= m3 ,
avec une différence de moyennes qui pourrait être, en fonction des résultats ob-
servés :
δ = m1 − m3 = m2 − m3 = 2,5 .
On a dans ces conditions :
a1 = a2 = 0,8333 , a3 = − 1,6667 et s2a = 1,3889 .
d 2◦ En vue de faire intervenir ces deux éléments de façon précise, il faut établir
la relation qui les lie au paramètre de décentrage défini au paragraphe 9.4.2.4◦ .
À cette fin, nous considérons quatre répartitions particulières, en les illustrant
chacune par un exemple relatif à cinq moyennes. Ces répartitions sont :
I . les p moyennes sont divisées en deux groupes d’effectifs égaux si p est pair, ou
presque égaux si p est impair, tels que :
m1 = m2 > m3 = m4 = m5 et m1 − m3 = δ ;
m1 > m2 = m3 = m4 = m5 et m1 − m2 = δ ;
III . les p moyennes sont réparties uniformément entre les deux valeurs extrêmes,
soit par exemple :
IV. toutes les moyennes sauf deux sont égales, les deux moyennes isolées étant
supposées équidistantes du groupe principal, comme :
k = sa /δ .
On peut constater que la première répartition est celle dont les rapports sa /δ sont
b les plus élevés, et la dernière celle dont les rapports sa /δ sont les plus petits.
d 3◦ La figure 9.4.1, déduite notamment des abaques de Pearson et Hartley
[1966-1972], donne une représentation graphique de la relation qui lie l’effectif n
au nombre p de populations et à la répartition des moyennes, pour un risque de
première espèce α égal à 0,05 et un risque de deuxième espèce β égal à 0,5 et 0,1 .
Cette figure fait également intervenir, à titre intermédiaire le rapport sa /σ :
∏0 = sa /σ = k δ/σ = k δr /cv .
272 ANALYSE DE LA VARIANCE À UN CRITÈRE 9.4.3
Répartitions
p
I II III IV
2 0,500 0,500 0,500 –
3 0,471 0,471 0,408 0,408
4 0,500 0,433 0,373 0,354
5 0,490 0,400 0,354 0,316
6 0,500 0,373 0,342 0,289
7 0,495 0,350 0,333 0,267
8 0,500 0,331 0,327 0,250
Cette quantité est aussi une mesure du degré de fausseté de l’hypothèse nulle et
est étroitement liée au paramètre ∏ des distributions F non centrales (§ 9.4.2.4◦ ).
L’exemple 9.4.2 illustre les principales possibilités d’utilisation de cette figure.
Des indications relatives à d’autres valeurs de α et β sont fournies notamment
b par Kastenbaum et al. [1970a].
d 4◦ La figure 9.4.1, de même que les abaques à partir desquels elle a été établie,
permet de constater que la solution simple présentée au début de ce paragraphe est
en général relativement satisfaisante pour les structures intermédiaires II et III ,
mais qu’elle ne convient pas pour les structures extrêmes I et IV, et cela d’autant
plus que le nombre de moyennes envisagées est élevé.
Par comparaison avec le cas de deux moyennes, on peut considérer, en première
approximation, que le nombre d’observations nécessaires diminue proportionnelle-
ment à la racine carrée du nombre de moyennes pour la structure I et augmente
b proportionnellement à cette même racine carrée pour la structure IV.
Figure 9.4.1. Relation, d’une part, entre l’effectif n de chacun des échantillons
et le degré de fausseté ∏0 de l’hypothèse nulle, et d’autre part, entre ce degré
de fausseté et le quotient δr /cv (ou δ/σ), pour différents nombres de
populations (2 à 8) et différentes répartitions des moyennes (I à IV),
la signification des symboles I à IV étant rappelée schématiquement
dans la partie supérieure droite de la figure.
274 ANALYSE DE LA VARIANCE À UN CRITÈRE 9.4.3
que ces résultats confirment le fait que la solution simple déduite du cas de deux
moyennes (n = 35) est bien une solution approximative intermédiaire.
Utilisée en sens inverse, la figure 9.4.1 permet également de déterminer des
valeurs de δr (ou δ), en fonction des effectifs n . Pour des lots de 20 poulets par
exemple, et toujours avec un risque de deuxième espèce égal à 0,1 , la valeur du
paramètre ∏0 serait égale à 0,43 et le rapport δr /cv se situerait approximativement
entre 0,86 et 1,22 . À ces deux valeurs extrêmes, correspondraient des différen-
ces δr égales respectivement à 11 et 16 %. On pourrait donc espérer mettre ainsi
en évidence, au niveau de signification 0,05 et avec une probabilité égale à 0,9 ,
d’éventuelles différences de poids de l’ordre de 12 à 15 % seulement.
En utilisant les lignes pointillées de la figure 9.4.1 (β = 0,5), on pourrait aussi
montrer que d’éventuelles différences de poids de l’ordre de 8 à 9 % seraient alors
b mises en évidence dans un cas sur deux.
n ' 4 (7,5/2)2 = 56 .
Dans l’hypothèse d’une égalité des variances à l’intérieur des différentes strates,
ces 56 observations devraient en outre être réparties au prorata de l’étendue des
strates, soit par exemple, pour trois strates représentant respectivement 35 , 40 et
25 % de l’étendue totale, respectivement 20 , 22 et 14 observations.
2
quantité (n σA + σ 2 )/(n p) , c’est-à-dire aussi :
2 2
σX̄ = σA /p + σ 2 /(n p) .
2
Pour un même nombre total n p d’observations et pour autant que σA soit différent
de zéro, cette variance est d’autant plus petite que p est grand, et donc que n est
petit.
On doit en conséquence choisir, au deuxième degré de l’échantillonnage, un
effectif n aussi réduit que possible. Un effectif de deux unités du deuxième degré
(n = 2) pour chacune des unités du premier degré est toujours, théoriquement, la
solution la plus favorable. Un tel effectif permet en effet, à la fois, de contrôler la
validité des résultats obtenus, en facilitant la recherche d’éventuelles observations
aberrantes, d’estimer l’importance des deux sources de variation, et d’obtenir l’es-
timation la plus précise possible de la moyenne générale.
On pourrait être tenté de réduire l’effectif n à la valeur 1 , mais cela consisterait
en fait en un retour à l’échantillonnage complètement aléatoire.
c = c1 p + c2 n p = (c1 + c2 n) p .
c’est-à-dire des marges réduites de moitié environ, par rapport à la marge d’erreur
initiale (0,90 t/ha).
En supposant que rien ne s’oppose au principe de ne faire que deux observations
par prairie (n = 2), on peut alors s’efforcer de déterminer le nombre de prairies à
prendre en considération, en vue d’aboutir à une marge d’erreur égale par exemple
à 10 % de la moyenne générale. La variance des moyennes par prairie peut être
estimée à :
0,1006 + 0,1559/2 = 0,1786 ,
278 ANALYSE DE LA VARIANCE À UN CRITÈRE 9.4.5
dans lequel Fmin et Fmax désignent respectivement la plus petite et la plus grande
des deux valeurs Fobs . Au niveau de signification α , ce rapport doit être comparé
à une valeur théorique w1−α/2 et l’hypothèse d’égale sensibilité doit être rejetée
quand :
wobs ≥ w1−α/2 .
Les valeurs théoriques w1−α/2 sont données notamment par Schumann et Brad-
ley [1959], en fonction du niveau de signification choisi, de deux paramètres a et b ,
qui dépendent eux-mêmes des valeurs Fmin et Fmax , et des nombres de degrés de
liberté k1 et k2 :
±£ §
a = k1 (Fmin + Fmax )2 8 (Fmin + Fmax − 1) et b = k2 /2 .
On obtient ici :
wobs = 24,2/18,9 = 1,28 ,
±£ 2
§
a = 9 (24,2 + 18,9) 8 (24,2 + 18,9 − 1) = 49,6 et b = 240/2 = 120 .
Les tables de Schumann et Bradley [1959] donnent approximativement, pour
de telles valeurs de a et b :
w0,975 = 1,51 .
La différence entre les deux valeurs Fobs et donc aussi la différence de sensibilité
entre les deux indices envisagés ne doivent, en conséquence, pas être considérées
comme significatives, au niveau de probabilité 0,05 .
Exercices
⊕ 9.1. Comparez, quant aux différences de moyennes, les observations relatives aux diffé-
rentes durées de traitement de l’exercice 4.2.
⊕ 9.2. Quinze veaux ont été répartis au hasard en trois lots, recevant chacun une alimenta-
tion particulière. Les gains de poids, observés au cours d’une même période et exprimés
en kg, sont présentés ci-dessous, une donnée étant manquante. Doit-on considérer que
les différences de moyennes entre alimentations sont significatives ? Dans l’affirmative,
estimez ces différences de moyennes et déterminez-en les limites de confiance.
9.3. Quatre échantillons de chocolat, prélevés au hasard dans une production importante,
ont été analysés en ce qui concerne leur teneur en lactose, chaque échantillon étant l’objet
de trois mesures. En fonction des observations suivantes, exprimées en pourcentages,
estimez la variabilité propre aux échantillons (écart-type entre échantillons) et la variabi-
lité analytique (écart-type entre mesures, pour un même échantillon), et déterminez les
limites de confiance correspondantes.
9.4. Dans les conditions de l’exercice 9.2, quel est l’ordre de grandeur du nombre de
veaux dont il faudrait disposer pour pouvoir espérer mettre en évidence des différences
éventuelles de croissance en poids de 5 kg ?
9.5. Dix échantillons de fourrage ont été prélevés au hasard dans un silo et chacun d’eux
a été l’objet de quatre déterminations de la teneur en calcium. Les 40 observations, expri-
mées en pourcentages de la matière sèche, ont été soumises à l’analyse de la variance à un
critère de classification, et ont conduit notamment à l’obtention d’un carré moyen factoriel
égal à 0,2961 et un carré moyen résiduel égal à 0,00664 . Quelle est, dans ces conditions,
l’erreur standard estimée de la moyenne générale des 40 observations ? À quelle valeur de
l’erreur standard devrait-on s’attendre, dans les mêmes conditions, si on avait effectué
10 prélèvements et seulement deux analyses par prélèvement, et si on avait effectué 10
prélèvements et une seule analyse par prélèvement ? Combien d’observations devrait-
on effectuer, toujours dans les mêmes conditions, si on souhaitait aboutir à une erreur
standard égale à 0,1 % ?
Chapitre 10
L’analyse de la variance à
deux critères de classification
Sommaire
10.1 Introduction
10.2 Les modèles croisés à effectifs égaux : aspects descriptifs
10.3 Les modèles croisés à effectifs égaux : aspects inférentiels
10.4 Les modèles croisés à effectifs inégaux
10.5 Les modèles hiérarchisés
10.6 La puissance et la détermination des nombres d’observations
Exercices
284 ANALYSE DE LA VARIANCE À DEUX CRITÈRES 10.1
10.1 Introduction
1◦ L’analyse de la variance à deux critères de classification 1 peut être considé-
rée comme une généralisation de l’analyse à un critère, qui permet de tenir compte
simultanément de deux facteurs sous-jacents, et non plus d’un seul facteur.
Les deux facteurs envisagés peuvent être soit placés sur pied d’égalité, soit au
contraire subordonnés l’un à l’autre. Dans le premier cas, les modèles d’analyse
de la variance sont dits croisés 2 , alors que dans le deuxième cas, ils sont dits
hiérarchisés 3 . Le cas hiérarchique est parfois qualifié aussi de multi-niveaux 4 .
Dans les différents cas, on doit également faire la distinction entre les modèles
fixes, les modèles aléatoires et les modèles mixtes 5 . Enfin, une distinction im-
portante intervient entre le cas des effectifs égaux, parfois qualifié d’équilibré ou
orthogonal, et le cas des effectifs inégaux, parfois qualifié de non équilibré ou non
orthogonal.
Les exemples 10.2.1, 10.3.4 et 10.5.1 sont des illustrations de quelques-unes de
ces situations.
une moyenne pour chacune des modalités de chacun des deux critères de classifi-
cation (i = 1 , . . . , p d’une part, et j = 1 , . . . , q d’autre part) :
q n q p n p
1 XX 1X 1 XX 1X
x̄i.. = xijk = x̄ij. et x̄.j. = xijk = x̄ij. ,
q n j=1 q j=1 p n i=1 p i=1
k=1 k=1
p q n p q p q
1 XXX 1 XX 1X 1X
x̄... = xijk = x̄ij. = x̄i.. = x̄.j. .
p q n i=1 j=1 p q i=1 j=1 p i=1 q j=1
k=1
Les deux premières composantes sont des sommes de carrés d’écarts factorielles,
la troisième est une somme de carrés d’écarts liée à l’interaction, et la quatrième
est une somme de carrés d’écarts résiduelle.
En affectant les lettres a et b , respectivement, à chacun des deux critères de
classification, et en désignant les différents termes par SCEt , SCEa , SCEb , SCEab
et SCEr , on peut écrire aussi, de façon simplifiée :
4◦ Aux différentes sommes des carrés des écarts, peuvent être associés des
nombres de degrés de liberté, qui sont liés par la relation :
p q n − 1 = (p − 1) + (q − 1) + (p − 1) (q − 1) + p q (n − 1) .
10.2.2 MODÈLES CROISÉS À EFFECTIFS ÉGAUX : ASPECTS DESCRIPTIFS 287
Il s’agit de p q n−1 degrés de liberté pour la somme totale, puisqu’elle fait intervenir
globalement les p q n observations individuelles, p−1 et q −1 degrés de liberté pour
les deux sommes factorielles, puisqu’elles sont calculées respectivement à partir de
p et de q moyennes, p q (n−1) degrés de liberté pour la somme résiduelle, puisqu’elle
fait intervenir p q échantillons de n observations, et par différence, (p − 1) (q − 1)
degrés de liberté pour la somme des carrés des écarts de l’interaction.
5◦ Enfin, en divisant les différentes sommes des carrés des écarts par leurs
nombres de degrés de liberté, on obtient les carrés moyens CMt , CMa , CMb ,
CMab et CMr .
L’ensemble des résultats peut alors être présenté sous la forme d’un tableau
d’analyse de la variance (tableau 10.2.1).
Exemple 10.2.1. Comparaison de trois types de sondes dans deux types de sols :
analyse de la variance.
Au cours d’une étude relative aux problèmes d’échantillonnage du sol, on a
comparé, dans plusieurs types de sols, différents types de sondes destinées à préle-
ver des échantillons de terre, en effectuant chaque fois diverses analyses chimiques
[Hanotiaux, 1966]. On s’intéresse principalement aux différences qui pourraient
exister d’un type de sondes à l’autre et aux interférences éventuelles des types de
sondes avec les types de sols.
Le tableau 10.2.2 est relatif à deux types de sols, à trois types de sondes,
et aux teneurs en P2 O5 , exprimées en milligrammes par 100 grammes de terre
sèche, chacune des combinaisons sol-sonde ayant été l’objet de quatre prélève-
ments indépendants les uns des autres. Ce tableau présente à la fois les données
initiales xijk , et les moyennes par type de sols et type de sondes x̄ij. , par type
de sols x̄i.. , par type de sondes x̄.j. , et générale x̄... , toutes les moyennes étant
volontairement calculées avec une précision quelque peu abusive.
Le tableau 10.2.3 donne les résultats de l’analyse de la variance, sous l’angle
descriptif. Ce tableau peut être obtenu à l’aide de l’un ou l’autre logiciel statistique
ou selon la procédure qui sera l’objet du paragraphe 10.2.3.
288 ANALYSE DE LA VARIANCE À DEUX CRITÈRES 10.2.2
Tableau 10.2.3. Comparaison de trois types de sondes dans deux types de sols :
tableau partiel d’analyse de la variance (aspects descriptifs).
2◦ Les différentes sommes des carrés des écarts peuvent alors être obtenues à
l’aide des relations suivantes, qui généralisent celles que nous avons présentées au
paragraphe 9.2.3 :
p X
X q X
n p
1 X 2
SCEt = x2ijk − 2
X... /(p q n) , SCEa = 2
X − X... /(p q n) ,
i=1 j=1 k=1
q n i=1 i..
q p q
1 X 2 2
XX
SCEb = X.j. − X... /(p q n) et SCEr = SCEij ,
p n j=1 i=1 j=1
la somme des carrés des écarts relative à l’interaction pouvant être calculée par
différence.
Exemple 10.2.2. Comparaison de trois types de sondes dans deux types de sols :
réalisation de l’analyse de la variance.
Pour les données du tableau 10.2.2, les différentes sommes sont :
X11. = 187, X12. = 170 , X13. = 180 , X21. = 163 , X22. = 152 , X23. = 156 ,
X1.. = 537, X2.. = 471 , X.1. = 350 , X.2. = 322 , X.3. = 336 , X... = 1.008 .
Calculées selon les principes habituels, les sommes des carrés des écarts relatives
aux six séries d’observations sont aussi :
De même, les termes d’interaction sont nuls quand les écarts x̄ij. − x̄i.. , relatifs
au deuxième facteur, sont indépendants de i , c’est-à-dire du premier facteur. En
outre, ces deux conditions de nullité des termes d’interaction sont strictement
équivalentes, la première entraı̂nant toujours la seconde et réciproquement.
Quand tous les termes d’interaction x̄ij. − x̄i.. − x̄.j. + x̄... sont nuls, on dit que
l’interaction est nulle ou qu’il n’y a pas d’interaction.
c’est-à-dire que l’effet conjoint des deux facteurs est égal à la somme de leurs deux
effets individuels. Le modèle d’analyse de la variance est alors dit additif 8 .
La notion de non-interaction, ou d’absence d’interaction, se confond donc avec
celle d’additivité 9 , de même que la notion d’interaction, ou de présence d’une
interaction, se confond avec celle de non-additivité 10 .
3◦ Quand certains des termes d’interaction ne sont pas nuls, et surtout dans
le cas particulier 2 × 2 (p = q = 2), on parle parfois de synergie ou d’antagonisme,
selon que l’interaction est positive ou négative.
Si par exemple, l’apport simultané d’une fumure azotée et d’une fumure potas-
sique provoque, par comparaison avec un témoin sans engrais, un accroissement
de rendement supérieur à la somme des accroissements de rendement qui seraient
7 En anglais : interaction.
8 En anglais : additive model.
9 En anglais : additivity.
10 En anglais : non-additivity.
10.2.4 MODÈLES CROISÉS À EFFECTIFS ÉGAUX : ASPECTS DESCRIPTIFS 291
liés, séparément, aux deux fumures, on peut dire qu’il y a synergie entre les deux
fumures.
Si au contraire, l’accroissement de rendement lié à la double fumure est infé-
rieur à la somme des accroissements de rendement liés aux deux fumures simples,
on peut dire qu’il y a un certain antagonisme entre les fumures.
Exemple 10.2.3. Comparaison de trois types de sondes dans deux types de sols :
absence d’interaction entre les deux facteurs.
À partir des moyennes qui figurent dans la partie inférieure du tableau 10.2.2,
on peut facilement calculer les six termes d’interaction, qui sont égaux à :
0,25 , – 0,50 , 0,25 ,
– 0,25 , 0,50 , – 0,25 ,
les deux lignes étant toujours relatives aux deux types de sols et les trois colonnes
aux trois types de sondes. On notera que les sommes de ces termes sont toutes
nulles, tant horizontalement que verticalement, et bien sûr globalement.
Ces valeurs, toutes très faibles, témoignent de la quasi-absence d’interaction.
À peu de chose près, les différences entre types de sondes sont donc identiques
d’un type de sols à l’autre, et les différences entre types de sols ne dépendent pas
non plus des sondes utilisées pour effectuer les prélèvements de terre.
Durées Gibbérelline
x̄i..
d’éclair. Absence Dose 1 Dose 2
8h 63,8 102,5 106,7 91,0
16 h 75,3 93,1 100,3 89,6
x̄.j. 69,6 97,8 103,5 90,3
110 8 heures
100
Hauteur (mm)
90 16 heures
80
70
60
Absence Dose 1 Dose 2
Gibbérelline
xij − x̄.. = (x̄i. − x̄.. ) + (x̄.j − x̄.. ) + (xij − x̄i. − x̄.j + x̄.. ) .
d 2◦ D’autres modèles que ceux auxquels nous venons de faire allusion ont
également été proposés, en vue de tenir compte notamment d’effets multiplica-
tifs et non plus additifs, et de nombres de modalités finis et non plus infinis ou
quasi infinis, pour certains critères de classification aléatoires [Dias et Krza-
nowski, 2003 ; Gauch et al., 2008 ; Sabaghnia et al., 2008 ; Searle et Fawcett,
1970]. Il s’agit en particulier des modèles à effets principaux additifs et interac-
tion multiplicative 11 , utilisés notamment dans l’étude des interactions génotype-
12
b environnement .
Les termes cij , parfois désignés aussi par (ab)ij , sont également des constantes,
et représentent l’interaction des deux critères de classification. Ces valeurs sont
définies de la manière suivante, par analogie avec le modèle observé (§ 10.2.2.2◦ ) :
cij = (ab)ij = mij − mi. − m.j + m.. .
Elles doivent être interprétées comme précédemment (§ 10.2.4), et en particulier,
elles sont également de sommes nulles, tant pour les sommations portant sur un
indice à la fois, que pour la sommation globale sur les deux indices.
Enfin, les quantités Dijk sont des variables aléatoires qui, dans les conditions
du paragraphe 10.1.3◦ , sont normales, indépendantes, de moyennes nulles et de
même variance σ 2 .
4◦ Toujours dans les mêmes conditions que ci-desssus, et par une procédure
semblable à celle que nous avons adoptée dans le cas de l’analyse de la variance à
un critère de classification (§ 9.3.5), on peut démontrer que les espérances mathé-
matiques des carrés moyens sont :
p q
qn X 2 pn X 2
E(CMa ) = σ 2 + a , E(CMb ) = σ 2 + b ,
p − 1 i=1 i q − 1 j=1 j
XXp q
n
E(CMab ) = σ 2 + c2 et E(CMr ) = σ 2 .
(p − 1) (q − 1) i=1 j=1 ij
5◦ Quand les différentes hypothèses nulles sont vraies, les distributions d’échan-
tillonnage des sommes des carrés des écarts, divisées par σ 2 , sont toutes des dis-
tributions χ2 , indépendantes les unes des autres et dont les nombres de degrés de
liberté sont ceux que nous avons donnés au paragraphe 10.2.2.4◦ . On peut donc
procéder facilement aux différents tests d’hypothèses.
6◦ Pour éviter tout risque d’interprétation erronée au sujet des facteurs prin-
cipaux, il est préférable de réaliser pour commencer le test relatif à l’interaction.
296 ANALYSE DE LA VARIANCE À DEUX CRITÈRES 10.3.2
Exemple 10.3.1. Comparaison de trois types de sondes dans deux types de sols :
suite de l’analyse de la variance.
Nous poursuivons ici l’analyse de la variance qui a été l’objet de l’exemple
10.2.1, en effectuant les tests d’hypothèses et en calculant les estimations et les
limites de confiance qui s’imposent. En ce qui concerne les tests, le tableau 10.3.1
complète le tableau 10.2.1, en en donnant les résultats.
10.3.2 MODÈLES CROISÉS À EFFECTIFS ÉGAUX : ASPECTS INFÉRENTIELS 297
Tableau 10.3.1. Comparaison de trois types de sondes dans deux types de sols :
tableau complet d’analyse de la variance.
On constate tout d’abord que l’interaction est non significative. Le test confirme
donc la conclusion intuitive de l’exemple 10.2.3, à savoir que les différences entre
types de sondes ne dépendent pas des types de sols et vice versa 13 .
Par contre, les différences observées sont très hautement significatives en ce
qui concerne les types de sols, et juste significatives en ce qui concerne les types
de sondes.
L’estimation et les limites de confiance de la différence existant entre les deux
types de sols seraient, pour un degré de confiance égal à 0,95 (table II) :
Cette information n’est cependant pas essentielle, en regard des objectifs de l’étude
(exemple 10.2.1).
La comparaison, plus intéressante, des trois types de sondes est un problème qui
peut être traité notamment par la méthode de Newman et Keuls (§ 12.4.3). Cette
méthode permet de montrer que les résultats obtenus à l’aide du premier type de
sondes sont significativement supérieurs aux résultats fournis par le deuxième type
de sondes, le troisième type conduisant à des résultats intermédiaires, qui ne sont
pas significativement différents des deux autres. La différence entre les moyennes
extrêmes, qui concernent le premier et le deuxième type de sondes, et les limites
de confiance correspondantes sont (table II) :
13 Ainsi que nous l’avons déjà signalé dans le ✭✭ mode d’emploi ✮✮ qui suit la table des matières, la
Exemple 10.3.2. Comparaison de trois types de sondes dans deux types de sols :
contrôle des conditions d’application de l’analyse de la variance.
À titre d’exemple, nous procédons une nouvelle fois de façon assez détaillée au
contrôle des conditions d’application de l’analyse de la variance, dans le cas que
nous venons d’envisager (exemple 10.3.1). Nous considérons ce contrôle dans l’op-
tique que nous avons présentée antérieurement (exemple 9.3.2), à savoir un rapide
examen des données initiales, un contrôle de la normalité, une identification des
éventuelles observations aberrantes, et un contrôle de l’égalité des variances.
L’examen des données initiales ne met en évidence aucune anomalie flagrante
(tableau 10.2.2).
Le contrôle de la condition de normalité peut être réalisé par le calcul des
résidus ou des résidus réduits de l’analyse de la variance, et la préparation d’un
diagramme de probabilité relatif à ces résidus (figure 10.3.1). Ce diagramme est
globalement linéaire, à l’exception dans une certaine mesure d’une valeur extrême
particulièrement élevée.
2
Quantiles normaux
-1
-2
-2 -1 0 1 2 3
Résidus réduits
Figure 10.3.1. Comparaison de trois types de sondes dans deux types de sols :
diagramme de probabilité relatif aux résidus réduits de l’analyse de la variance
à deux critères de classification.
Cette valeur ne dépasse toutefois pas la valeur limite 3,049 ou 3,05 , relative au
niveau de probabilité 0,01 .
Enfin, le contrôle de l’égalité des variances peut être réalisé par la méthode
de Levene (§ 7.5.3), c’est-à-dire par l’analyse de la variance relative aux valeurs
absolues des résidus ou des résidus réduits. Cette analyse se présente exactement
10.3.2 MODÈLES CROISÉS À EFFECTIFS ÉGAUX : ASPECTS INFÉRENTIELS 299
comme celle de l’exemple 10.3.1 (tableau 10.3.1) et donne les valeurs suivantes des
variables F de Fisher-Snedecor :
Pour les mêmes nombres de degrés liberté que précédemment, les probabilités
correspondantes sont respectivement égales à 0,21 , 0,53 et 0,077. Aucune anomalie
significative n’apparaı̂t donc à ce sujet.
La seule question qui se pose est celle de savoir s’il y a lieu d’écarter ou non
la valeur 53 de l’analyse finale. En l’absence d’éléments objectifs, résultant d’un
retour à l’origine de cette valeur (contrôle de la localisation du prélèvement de
l’échantillon de terre concerné, recherche d’éventuelles anomalies observées lors de
la préparation de l’échantillon ou de la réalisation de l’analyse chimique, recherche
d’éventuelles erreurs de transcription, etc.), nous aurions tendance à conserver
cette valeur.
On pourrait nous rétorquer que, dans un autre cas, nous avons préconisé au
contraire l’élimination de valeurs aberrantes, sans aucune base objective extérieure
aux données observées elles-mêmes (exemple 3.6.2). Il faut noter que les anomalies
constatées étaient beaucoup plus importantes dans ce cas, les écarts réduits maxi-
mums observés dépassant non seulement la limite relative au niveau de probabilité
0,05 , mais aussi, très largement, la limite relative au niveau de probabilité 0,01 .
Nous reviendrons ultérieurement sur ce problème, en montrant quelle peut
être l’influence de la valeur suspecte sur les résultats de l’analyse de la variance
(exemple 10.4.1).
d Nous avons signalé antérieurement que le recours aux valeurs limites de la
table VI ne constitue qu’une solution approchée, surtout pour des effectifs aussi
réduits que ceux qui sont considérés ici (§ 3.5.3.4◦ ). Pour mesurer la qualité de
cette approximation, on peut noter que les valeurs limites exactes, données par
Lund [1975] ou calculées à l’aide de la relation du paragraphe 3.5.3.4◦ , sont 2,80
et 3,09 , au lieu de 2,75 et 3,05 .
De même, l’utilisation de la méthode de Levene, avec des nombres de degrés
de liberté non corrigés, est aussi une approximation, qui ne prête toutefois pas à
◦
b conséquence (§ 7.5.3.3 ).
présence d’une interaction significative implique en effet que l’action de chacun des
facteurs dépend des modalités prises en considération pour l’autre facteur. L’in-
fluence de chacun des facteurs doit alors être envisagée de manière séparée pour
chacune des modalités de l’autre facteur.
Dans cette optique, on peut construire le tableau 10.3.3, qui présente deux
subdivisions alternatives de la somme des carrés des écarts totale.
Dans la première partie de ce tableau, on retrouve tout d’abord les deux lignes
du tableau 10.3.2 qui sont relatives au facteur durées d’éclairement et à la variation
résiduelle.
Les lignes qui concernent le facteur gibbérelline et l’interaction ont par contre
été regroupées, puis subdivisées d’une autre manière. La ligne ✭✭ gibbérelline /
8 heures ✮✮ est relative à l’influence de la gibbérelline pour la durée d’éclairement
10.3.2 MODÈLES CROISÉS À EFFECTIFS ÉGAUX : ASPECTS INFÉRENTIELS 301
de 8 heures. Elle correspond à ce que serait la ligne ✭✭ gibbérelline ✮✮ dans le cas d’une
analyse de la variance à un critère de classification limitée aux seules informations
relatives à la durée d’éclairement de 8 heures.
La ligne ✭✭ gibbérelline / 16 heures ✮✮ caractérise de la même manière l’influence
de la gibbérelline pour la durée d’éclairement de 16 heures.
Inversement, le regroupement des lignes ✭✭ durées d’éclairement ✮✮ et ✭✭ interac-
tion ✮✮ du tableau 10.3.2 et la subdivision des totaux ainsi obtenus en trois com-
posantes permettent d’obtenir les trois lignes centrales de la deuxième partie du
tableau 10.3.3. Ces trois lignes mettent en évidence l’importance du facteur durées
d’éclairement, séparément, pour les trois niveaux d’application de gibbérelline (ab-
sence de gibbérelline, dose 1 et dose 2).
Il apparaı̂t ainsi clairement que la gibbérelline a une influence très hautement si-
gnificative pour les deux durées d’éclairement, et que la durée d’éclairement n’inter-
vient de façon significative qu’en l’absence de gibbérelline et pour la dose inférieure
de cette substance de croissance. Nous affinerons encore cette interprétation au
cours de l’exemple 12.2.1, en utilisant alors la notion de contraste.
d Le tableau 10.3.4 donne en outre les totaux relatifs aux différents traitements
et groupes de traitements, à raison de 12 observations pour chacune des cellules de
la partie centrale du tableau, et respectivement 36 et 24 observations pour chacune
des lignes et chacune des colonnes du tableau. Ces totaux, qui correspondent aux
moyennes présentées dans le tableau 10.2.4, permettent de bien comprendre, si on
le souhaite, l’origine des différents éléments qui figurent dans le tableau 10.3.3.
Durées Gibbérelline
Xi..
d’éclair. Absence Dose 1 Dose 2
8h 766 1.230 1.280 3.276
16 h 904 1.117 1.204 3.225
X.j. 1.670 2.347 2.484 6.501
On peut vérifier que le total de ces deux composantes est bien égal au total des
lignes du tableau 10.3.2 relatives au facteur gibbérelline et à l’interaction.
302 ANALYSE DE LA VARIANCE À DEUX CRITÈRES 10.3.3
2◦ Dans ces conditions, les moyennes théoriques relatives aux populations qui
sont l’objet d’observations doivent être considérées comme aléatoires. Nous les
désignerons par Mij , Mi. et M.j .
Dans l’exemple qui vient d’être considéré, Mij serait la moyenne théorique
de l’ensemble des mesures qui pourraient être réalisées par l’opérateur j à l’aide
de l’appareil i , Mi. serait la moyenne théorique de l’ensemble des mesures qui
pourraient être réalisées à l’aide de l’appareil i , pour l’ensemble des opérateurs,
et M.j serait la moyenne théorique de l’ensemble des mesures qui pourraient être
réalisées par l’opérateur j , pour l’ensemble des appareils. La moyenne générale
de l’ensemble de toutes les mesures qui pourraient être réalisées, quel que soit
l’appareil et quel que soit l’opérateur, reste une constante, que nous continuerons
à désigner par m.. .
En plus des conditions définies au paragraphe 10.1.3◦ , on doit supposer que les
variables aléatoires Ai , Bj et Cij sont toutes normales, indépendantes les unes
des autres, de moyennes nulles, et de variances constantes, respectivement égales à
2 2 2
σA , σB et σC . En raison des hypothèses formulées quant au caractère aléatoire et
simple de l’échantillonnage, ces variables sont également indépendantes des écarts
résiduels Dijk .
Comme pour le modèle fixe, les deux premières ont trait, séparément, aux deux
critères de classification, tandis que la troisième est relative à l’interaction des deux
critères.
Toutefois, une nuance importante doit être introduite, dans la mesure où ces
hypothèses concernent, non pas seulement les p q populations pour lesquelles des
observations sont disponibles, mais bien la double infinité ou quasi-infinité des
populations considérées au départ. Comme en analyse de la variance à un critère
de classification, la nullité de la variance implique dans chaque cas l’égalité des
moyennes de toutes les populations considérées (§ 9.3.3.5◦ ).
E(CMa ) = σ 2 + n σC
2 2
+ q n σA , E(CMb ) = σ 2 + n σC
2 2
+ p n σB ,
E(CMab ) = σ 2 + n σC
2
et E(CMr ) = σ 2 .
2
On observe que la composante σC , relative à l’interaction, intervient ici, non seule-
ment dans l’espérance mathématique du carré moyen de l’interaction, mais aussi
dans les espérances mathématiques des deux carrés moyens factoriels. Pour s’as-
2 2
surer de la nullité de σA et de σB , il faudra donc comparer les carrés moyens
factoriels CMa et CMb , non pas au carré moyen résiduel CMr , mais bien au carré
moyen de l’interaction CMab .
7◦ En fonction de tout ce qui vient d’être dit, le test de l’hypothèse H000 , relative
à l’interaction, doit être réalisé comme dans le cas du modèle fixe (§ 10.3.2.6◦ ).
Les tests relatifs aux deux autres hypothèses doivent être réalisés, par contre, en
304 ANALYSE DE LA VARIANCE À DEUX CRITÈRES 10.3.4
2 2
σ
bA = (CMa − CMab )/(q n) , σ
bB = (CMb − CMab )/(p n) ,
2
σ
bC = (CMab − CMr )/n et b2 = CMr ,
σ
en se limitant chaque fois aux cas où les différences de carrés moyens sont positives.
Des limites de confiance peuvent également être déterminées par des procédures
analogues à celles que nous avons présentées en analyse de la variance à un critère
de classification (§ 9.3.3.7◦ ).
d On notera que l’expression modèle mixte est souvent utilisée pour désigner, non
pas spécifiquement le modèle d’analyse de la variance dont il est question ici, mais
bien le modèle linéaire mixte, qui permet de prendre en considération, dans un
contexte beaucoup plus général, un ou plusieurs facteurs fixes et un ou plusieurs
b facteurs aléatoires (§ 16.5.3).
2◦ Dans les conditions qui viennent d’être définies, les moyennes théoriques
Mij et M.j , qui sont liées au critère de classification aléatoire, sont des variables
aléatoires, tandis que les moyennes mi. , qui ne dépendent que du critère de clas-
sification fixe, sont des constantes, tout comme la moyenne générale m.. .
Les effets principaux et les termes d’interaction sont en conséquence :
ai = mi. − m.. , Bj = M.j − m.. et Cij = (aB)ij = Mij − mi. − M.j + m.. .
Les uns (ai ) sont fixes, et les autres (Bj et Cij ) sont aléatoires.
H00 : σB
2
= 0 et H000 : σC
2
= 0.
Bien qu’il n’y ait pas de changement d’écriture, par comparaison avec le modèle
fixe pour la première, et par comparaison avec le modèle aléatoire pour les deux
dernières, ces hypothèses n’ont pas exactement la même signification que précé-
demment. La première hypothèse, par exemple, implique qu’il n’y a pas de dif-
férences de moyennes entre les p modalités du facteur fixe, les moyennes étant
relatives à l’infinité ou la quasi-infinité de modalités du facteur aléatoire, et pas
seulement aux q modalités pour lesquelles des observations sont réalisées.
Dans l’exemple évoqué ci-dessus, cette hypothèse a trait à l’égalité des résultats
obtenus par les p méthodes de mesures, pour l’ensemble supposé infini ou quasi in-
fini des individus qui pourraient être mesurés, et pas seulement pour les q individus
qui ont été ou qui seront effectivement l’objet de mesures.
306 ANALYSE DE LA VARIANCE À DEUX CRITÈRES 10.3.4
p
2 2 qn X 2
E(CMa ) = σ + n σC + a ,
p − 1 i=1 i
E(CMb ) = σ 2 + p n σB
2
, E(CMab ) = σ 2 + n σC
2
et E(CMr ) = σ 2 .
Ces résultats sont intermédiaires entre ceux qui concernent le modèle fixe et
ceux qui ont trait au modèle aléatoire (§ 10.3.2.4◦ et 10.3.3.5◦ ), mais ils peuvent
paraı̂tre quelque peu surprenants. On constate en effet que le terme aléatoire d’in-
2
teraction σC intervient ici dans l’espérance mathématique du carré moyen relatif
au facteur fixe (CMa ), mais pas dans l’espérance mathématique du carré moyen
relatif au facteur aléatoire (CMb ), alors qu’on aurait pu attendre le contraire. Nous
justifierons intuitivement ces résultats au paragraphe 10.3.5.2◦ .
2
Pour s’assurer de la nullité de tous les ai d’une part, et de σB d’autre part,
il faut donc comparer le carré moyen du facteur fixe (CMa ) au carré moyen de
l’interaction (CMab ), et le carré moyen du facteur aléatoire (CMb ) au carré moyen
résiduel (CMr ). La comparaison relative au facteur fixe est réalisée comme pour
le modèle aléatoire, tandis que la comparaison relative au facteur aléatoire est
réalisée comme pour le modèle fixe.
6◦ Rien ne doit être ajouté à ce qui a été dit antérieurement au sujet des
distributions d’échantillonnage et du test relatif à l’interaction.
Quant aux tests qui concernent les deux autres hypothèses, ils doivent être
effectués, en fonction de ce qui vient d’être exposé, en calculant les quantités :
7◦ Des estimations et des limites de confiance peuvent être calculées pour les
différences de moyennes, comme dans le cas du modèle fixe (§ 10.3.2.7◦ ), mais en
substituant le carré moyen de l’interaction CMab au carré moyen résiduel CMr ,
et en modifiant en conséquence le nombre de degrés de liberté de la variable t de
Student.
La composante de variance relative au facteur aléatoire doit, quant à elle, être
estimée comme suit :
2
σ
bB = (CMb − CMr )/(p n) ,
10.3.4 MODÈLES CROISÉS À EFFECTIFS ÉGAUX : ASPECTS INFÉRENTIELS 307
tandis que les deux autres composantes de variances peuvent être estimées comme
dans le cas du modèle aléatoire (§ 10.3.3.8◦ ).
L’ensemble de ces informations, de même que celles qui concernent les modèles
fixe et aléatoire, peut être déduit également du tableau 10.3.7, qui sera présenté
au paragraphe suivant.
Échantillons
Moulins
1 2 3 4 5
1 13,33 13,62 13,53 13,60 13,97
13,43 13,33 13,75 13,44 13,32
2 13,04 13,26 13,49 13,05 13,28
13,34 13,49 13,59 13,44 13,67
3 13,24 13,33 13,07 13,47 13,46
13,25 13,46 13,33 13,04 13,32
dans un cas d’analyse de la variance à trois critères de classification, avec une seule
b observation par cellule (§ 11.2.4).
CMa 1 + 1 n + 1 n qn
CMb 1 + 1 pn 1 n pn
CMab 1 + 1 n 1 n
CMr 1 1 1
Dans un but d’allègement des notations, les coefficients relatifs aux composan-
tes fixes n’ont toutefois pas été intégralement retranscrits, le signe + indiquant
seulement que telle ou telle composante intervient dans telle ou telle espérance
mathématique, et cela toujours comme une fonction croissante des carrés des
termes ai , bj , etc. En outre, pour bien mettre en évidence les distinctions entre
les différents modèles et pour bien identifier les différentes interactions, nous avons
2 2 2
utilisé les notations (ab)ij , σaB et σAB , de préférence à cij et σC .
Ce tableau permet de repérer facilement, dans chaque cas, les comparaisons
qui doivent être réalisées, en vue de tester la nullité de l’un ou l’autre élément,
ainsi que la manière dont les différentes composantes de la variance doivent être
estimées.
2◦ Le fait que les espérances mathématiques puissent conduire à des tests diffé-
rents d’un cas à l’autre surprend souvent les utilisateurs de l’analyse de la varian-
ce, qui ont tendance à n’y voir qu’une subtilité mathématique, sans justification
pratique. En réalité, les différentes procédures ne font que confirmer le bon sens, et
310 ANALYSE DE LA VARIANCE À DEUX CRITÈRES 10.3.5
c’est pour le modèle mixte, dont les tests sont apparemment les plus inattendus,
que les résultats déduits du raisonnement mathématique s’expliquent intuitive-
ment le mieux.
Reprenons par exemple l’étude des différents types de sondes (exemples 10.2.1
et 10.3.1), en supposant qu’on veuille effectuer la comparaison, non pas dans deux
types de sols donnés, mais bien dans l’ensemble d’une certaine région. L’étude ne
pouvant être réalisée en tous les points de la région considérée, qui constituent
un ensemble infini, on doit alors choisir un certain nombre de points de façon
complètement aléatoire et, en ces quelques points, on peut effectuer chaque fois un
même nombre de prélèvements de terre à l’aide de chacune des sondes. Le facteur
sondes est en conséquence un facteur fixe et le facteur lieux un facteur aléatoire.
Supposons en outre qu’il existe une certaine interaction sondes-lieux, c’est-à-dire
que les différences entre sondes puissent être différentes d’un point d’observation
à l’autre.
Dans ces conditions, les différences de moyennes observées entre les sondes
dépendent des lieux qui sont choisis et le facteur lieux intervient donc, par l’in-
termédiaire de l’interaction, dans l’espérance mathématique du facteur sondes. Par
contre, les différences de moyennes observées entre les lieux ne dépendent pas des
types de sondes mis en œuvre, puisque tous les types de sondes sont chaque fois
pris en compte : le facteur types de sondes n’intervient donc aucunement, même
pas indirectement, dans l’espérance mathématique du facteur lieux.
On notera enfin qu’on peut aussi résumer la situation en disant que le choix de
la base de comparaison (interaction ou variation résiduelle), relative à un facteur
donné, ne dépend pas de la nature de ce facteur lui-même, mais bien de la nature
du facteur qui lui est associé.
alors tous deux des estimations non biaisées de σ 2 et que c’est par rapport à σ 2
que toutes les comparaisons doivent être réalisées.
Le carré moyen CM0r est une moyenne pondérée de CMab et CMr , les coef-
ficients de pondération étant les nombres de degrés de liberté et, en l’absence
d’interaction, ce carré moyen constitue la meilleure estimation non biaisée de σ 2 .
Cette opération de regroupement de deux sources de variation doit cependant
être réalisée avec prudence. Une interaction peut en effet être non significative tout
en étant caractérisée par un carré moyen qui diffère largement du carré moyen
résiduel. Une précaution utile consiste à adopter en conséquence un niveau de si-
gnification relativement élevé (par exemple 0,20 ou 0,25 , voire même 0,50), pour le
test préalable 17 relatif à l’interaction [Hines, 1996 ; Mead et al., 1975 ; Wolde-
Tsadik et Afifi, 1980].
On peut également déterminer sur cette base des limites de confiance pour les
différences de moyennes entre moulins, la demi-longueur des intervalles de confian-
ce des différences étant, pour un degré de confiance égal à 0,95 et avec 23 degrés
de liberté en ce qui concerne la variable t de Student (§ 10.3.2.7◦ ) :
p
2,069 2 (0,03491)/10 = 0,17 % .
Ce modèle montre que les termes cij et Dij , tous deux identifiés par les mêmes
indices i et j , ne peuvent plus être dissociés.
Quant aux modèles mixte et aléatoire correspondants, ils peuvent être obtenus
de la même façon en remplaçant, selon les cas, ai , bj et cij , par Ai , Bj et Cij .
2◦ Les hypothèses nulles, les espérances mathématiques des carrés moyens et les
distributions d’échantillonnage ne sont pas modifiées, par comparaison avec le cas
général, si ce n’est bien sûr que l’effectif n est toujours égal à l’unité, et que, comme
pour les aspects descriptifs, tout ce qui a trait à la variation résiduelle disparaı̂t
(§ 10.2.5.2◦ ). Le tableau 10.3.8 résume l’ensemble des informations relatives aux
espérances mathématiques, selon le même principe que le tableau 10.3.7 pour le
cas général.
3◦ Ce tableau met tout d’abord en évidence le fait que, quel que soit le mo-
dèle considéré, aucun test n’est possible, selon la procédure habituelle, en ce qui
concerne l’interaction.
Il montre aussi qu’aucun test ne peut être réalisé non plus pour les deux critères
de classification dans le cas du modèle fixe, ni pour le facteur aléatoire dans le cas
du modèle mixte, sauf précisément en l’absence d’interaction, c’est-à-dire pour le
10.3.6 MODÈLES CROISÉS À EFFECTIFS ÉGAUX : ASPECTS INFÉRENTIELS 313
CMa 1 + 1 1 + 1 1 q
CMb 1 + 1 p 1 1 p
CMab 1 + 1 1 1 1
modèle additif (§ 10.2.4.2◦ ). Rien n’est modifié par contre pour le facteur fixe du
modèle mixte, ni pour les deux critères de classification du modèle aléatoire.
À ce propos, nous voudrions mettre le lecteur en garde contre le fait que, dans
le cas envisagé ici, certains logiciels statistiques fournissent indistinctement les
rapports F relatifs aux deux critères de classification, sans émettre aucune réserve
à leur sujet [Schwarz, 1993].
de variable, qui prend en compte prioritairement cet élément, plutôt que l’égalité
des variances ou la normalité des distributions [Cressie, 1978 ; Fuchs, 1979 ;
b Schlesselman, 1973].
5◦ Très souvent, le facteur aléatoire du modèle mixte est un facteur subsidiaire,
qui intervient dans le seul but de rendre plus puissant le test relatif au facteur fixe.
Il n’y a alors aucun inconvénient à ne pas pouvoir en tester la signification.
Il en est ainsi par exemple quand on compare diverses méthodes ou divers
instruments de mesure, en soumettant aux différentes méthodes ou aux différents
instruments les mêmes individus, choisis au hasard dans une population donnée,
plutôt que des individus distincts d’une méthode ou d’un instrument à l’autre. Il
en est fréquemment ainsi également dans le cas des expériences en blocs aléatoires
complets 20 , dites aussi en dispositif stratifié 21 , c’est-à-dire des expériences au sein
desquelles les individus observés sont réunis en groupes aussi homogènes que pos-
sible, tels que des ensembles de parcelles voisines dans un essai en champ [STAT1,
§ 2.3.5.2◦ ; Dagnelie, 2003].
Exemple 10.3.6. Comparaison des résultats obtenus par trois méthodes d’analyse
chimique : analyse de la variance à deux critères de classification.
Nous avons présenté antérieurement les résultats obtenus par trois méthodes
d’analyse chimique, pour 30 échantillons de matières fécales, et nous avons comparé
deux de ces méthodes à l’aide notamment du test t par paires (exemple 8.5.1). Nous
nous proposons de comparer ici l’ensemble des trois méthodes par l’analyse de la
variance à deux critères de classification.
Le modèle envisagé est un modèle mixte, si on considère que les trois méthodes
d’analyse sont des méthodes bien définies (critère fixe) et, au contraire, que les
30 prélèvements de matières fécales sont représentatifs de l’ensemble des prélève-
ments qui auraient pu être soumis à l’analyse (critère aléatoire).
Les résultats de l’analyse de la variance sont donnés dans le tableau 10.3.9. Ils
amènent à conclure à l’existence de différences significatives de moyennes entre les
trois méthodes d’analyse, au niveau de probabilité 0,05 .
que, est très important. Si des échantillons différents avaient été pris en considéra-
tion, l’étude statistique des résultats aurait consisté en une analyse de la variance
à un critère de classification, dont le carré moyen résiduel aurait pu être :
d Exemple 10.3.7. Comparaison des résultats obtenus par trois méthodes d’analyse
chimique : test d’additivité.
L’analyse de la variance de l’exemple précédent n’implique pas que la condi-
tion d’additivité doit être satisfaite, puisque le test réalisé concerne uniquement
le facteur fixe d’un modèle mixte. Les données considérées permettent toutefois
d’illustrer l’emploi du test de Tukey.
À partir des observations initiales (tableau 8.5.1) et des différentes moyennes
qu’on peut en déduire, on obtient :
±£ §
SCEadd = (− 8,2703)2 (1,1919) (5.113,9) = 0,011 .
Cette somme des carrés des écarts, qui se confond avec le carré moyen correspon-
dant, puisqu’elle ne possède qu’un seul degré de liberté, doit être comparée au
carré moyen résiduel obtenu par différence (tableau 10.3.9) :
1◦ Une attention toute particulière doit être accordée aux problèmes que sou-
lève l’analyse des observations successives, effectuées sur les mêmes individus à
plusieurs dates ou à plusieurs moments différents. De telles observations sont aussi
qualifiées de mesures répétées ou de données longitudinales 23 . Il peut s’agir en
particulier de la comparaison de courbes de croissance 24 .
L’étude des données de ce type est souvent réalisée dans l’optique du modèle
linéaire général et de ses extensions (modèle linéaire mixte notamment), dont il
sera question aux paragraphes 16.4 et 16.5. Nous ne présentons ici que quelques
notions plus élémentaires.
4◦ Une autre solution, beaucoup plus simple, mais souvent largement satisfai-
sante, a pour principe de condenser l’ensemble des données qui concernent chacun
des individus en un ou, éventuellement, en quelques paramètres, et de soumettre
ensuite ce ou ces paramètres à une analyse de la variance qui ne fait pas intervenir
le facteur temps.
Dans des études de croissance par exemple, on peut calculer par régression,
pour chacun des individus, une vitesse ou un taux de croissance, et soumettre les
différentes vitesses ou les différents taux de croissance à l’analyse de la variance.
Nous supposons tout d’abord qu’on a étudié trois variétés et observé huit arbres
pour chacune des trois variétés, de telle sorte que le nombre total de mesures est
égal à 216, pour l’ensemble des neuf années d’observations.
On pourrait alors être tenté de réaliser une analyse de la variance à deux critè-
res de classification, à savoir les facteurs variétés et années. Une telle analyse est
esquissée dans la partie supérieure gauche du tableau 10.3.10.
En considérant les deux critères comme fixes, on devrait effectuer dans ce cas
toutes les comparaisons par rapport à la variation résiduelle, avec 189 degrés de
liberté (§ 10.3.2.6◦ ou 10.3.5.1◦ ). Cette analyse est cependant tout à fait incor-
recte, car on ne dispose évidemment pas de 189 résidus indépendants les uns des
autres, puisque seuls 24 arbres ont été observés, et que les résidus relatifs à un
même arbre ont toute raison d’être, pour chacun d’eux, fortement corrélés d’une
année à l’autre.
Une deuxième solution consiste à subdiviser l’analyse de la variance en deux
parties, comme l’indique la moitié droite du tableau 10.3.10. La première partie
de l’analyse ne fait alors intervenir que les différences entre arbres, à l’exclusion
de toute influence du facteur années, la composante ✭✭ variation résiduelle 1 ✮✮ étant
en fait la variation ✭✭ entre arbres dans les variétés ✮✮. La deuxième partie réunit
au contraire tous les éléments qui, d’une manière ou d’une autre, dépendent de la
répétition des mesures au cours des différentes années successives.
Seule la première partie de cette analyse peut être réalisée, d’une manière gé-
nérale, sans restriction.
320 ANALYSE DE LA VARIANCE À DEUX CRITÈRES 10.3.7
b = (− 4 x1 − 3 x2 − 2 x3 − x4 + x6 + 2 x7 + 3 x8 + 4 x9 )/60 .
Ainsi, les analyses de la variance réalisées année par année ou sur des coef-
ficients de régression seraient des analyses à deux critères de classification si on
considérait, par exemple, non pas seulement trois variétés, mais bien trois variétés
greffées chacune sur deux porte-greffe différents.
Xp
12
χ2obs = X 2 − 3 q (p + 1) ,
p q (p + 1) i=1 i.
D’autre part, en présence d’ex aequo, la valeur χ2obs définie ci-dessus doit être
corrigée en la divisant par :
nX£ §o±£ §
1− k (k2 − 1) p q (p2 − 1) ,
d 4◦ On peut vérifier que la quantité χ2obs est, à une constante près, le carré moyen
factoriel qu’on obtiendrait pour le premier critère de classification, en soumettant
les rangs à l’analyse de la variance à un ou à deux critères.
La valeur χ2obs est aussi une mesure de la concordance entre les classements
qui sont réalisés pour le premier critère de classification, séparément pour les
différentes modalités du deuxième critère. Il pourrait s’agir, plus spécifiquement,
des préférences 30 ou des classements qui pourraient être établis, pour différents
produits, par différents juges ou par les différents membres d’un jury [Taplin,
1997]. À ce titre, la valeur χ2obs est étroitement liée au coefficient de concordance
de Kendall, dont il sera question au paragraphe 13.5.4.
En outre, quand le critère de classification considéré ne possède que deux mo-
dalités, le test de Friedman se confond avec le test des signes, que nous avons
évoqué antérieurement, sans le présenter explicitement (§ 8.5.3.5◦ ).
Enfin, on pourrait également formuler ici des commentaires semblables à ceux
que nous avons émis précédemment, entre autres choses en ce qui concerne l’effi-
◦
b cacité asymptotique du test (§ 8.4.3.6 ).
Exemple 10.3.9. Comparaison des résultats obtenus par trois méthodes d’analyse
chimique : test de Friedman.
Nous illustrons l’emploi du test de Friedman en reprenant les données de
l’exemple 10.3.6, relatives à la comparaison des résultats obtenus par trois métho-
des d’analyse chimique.
Les données initiales du tableau 8.5.1 et les rangs correspondants figurent par-
tiellement dans le tableau 10.3.11. On en déduit :
12
χ2obs = (69,52 + 512 + 59,52 ) − (3) (30) (4) = 5,72 ,
(3) (30) (4)
et avec deux degrés de liberté :
P(χ2 ≥ 5,72) = 0,058 .
Teneurs Rangs
Échant.
1 2 3 1 2 3
1 133 129 138 2 1 3
2 131 132 138 1 2 3
3 119 121 121 1 2,5 2,5
4 124 124 121 2,5 2,5 1
5 123 124 124 1 2,5 2,5
.. .. .. .. .. .. ..
. . . . . . .
30 137 136 134 3 2 1
Totaux 69,5 51 59,5
Les différences entre les trois méthodes d’analyse apparaı̂traient ainsi, à pre-
mière vue, comme non significatives. Il faut noter toutefois que la proportion des
ex aequo est importante (11 cas sur 30), et que la correction qui les concernent ne
doit donc pas être négligée.
Cette correction conduit à diviser la valeur obtenue ci-dessus par :
±£ §
1 − (11) (6) (30) (3) (8) = 0,9083 .
On en déduit alors :
χ2obs = 6,29 et P(χ2 ≥ 6,29) = 0,043 .
2◦ L’inégalité des effectifs peut être liée tout d’abord au fait qu’une ou plu-
sieurs observations sont manquantes 31 , dans un ensemble de données qui, nor-
malement, aurait dû être caractérisé par des effectifs égaux. Une telle situation
peut résulter par exemple de la mortalité de certaines plantes ou de certains ani-
maux, ou d’autres accidents susceptibles de survenir au cours de toute expérience
planifiée, initialement, de telle sorte que les effectifs soient en principe égaux.
Dans ce cas, et pour autant que la proportion des données manquantes ne soit
pas trop élevée, il est possible de procéder à une estimation de ces données, ce
qui conduit à des solutions relativement simples. Nous envisagerons cette question
d’une part pour les échantillons de plus d’une observations (§ 10.4.2) et d’autre
part pour les échantillons d’une seule observation (§ 10.4.3).
3◦ L’inégalité des effectifs peut être liée également à la nature même des don-
nées ou des phénomènes observés. Il peut s’agir par exemple de données d’enquêtes,
collectées sans qu’on ait voulu assurer l’égalité des effectifs ou sans qu’il ait été
possible d’assurer une telle égalité. Mais il peut s’agir aussi d’expériences pour les-
quelles le matériel disponible n’a pas permis une organisation équilibrée (nombres
inégaux de graines ou d’animaux disponibles pour différentes provenances ou dif-
férentes races, par exemple).
Si on désigne par nij les effectifs des différents échantillons, qui correspondent
aux différentes modalités des deux critères de classification, et par ni. et n.j les
effectifs totaux calculés séparément pour chacun des deux critères, les données
sont, le plus souvent, telles que la condition de proportionnalité :
nij = ni. n.j /n.. ,
31 En anglais : missing data, missing value.
10.4.1 MODÈLES CROISÉS À EFFECTIFS INÉGAUX 325
n’est pas satisfaite pour toutes les valeurs de i et de j . De telles données sont dites
non orthogonales 32 et nécessitent l’emploi de procédures particulières d’analyse,
qui sont plus complexes.
Ce problème est généralement traité dans l’optique du modèle linéaire, dont
il sera question ultérieurement (§ 16.4.4). Nous nous contenterons ici d’illustrer
cette situation par la présentation de deux exemples, sans donner d’informations
théoriques détaillées (§ 10.4.4).
d 4◦ Une situation intermédiaire entre le cas des effectifs égaux et le cas non or-
thogonal est celle des effectifs proportionnels 33 . Cette situation correspond au cas
où les effectifs des échantillons ne diffèrent qu’en fonction d’un seul critère de clas-
sification (effectifs ni dépendant uniquement du premier critère ou nj dépendant
uniquement du deuxième critère).
Les effectifs totaux sont alors égaux pour un des deux critères et inégaux pour
l’autre, de telle sorte que le modèle d’analyse de la variance est équilibré pour un
critère et non équilibré pour l’autre. En outre, la condition de proportionnalité des
effectifs, présentée ci-dessus, est satisfaite.
Cette situation est relativement proche du cas des effectifs égaux et peut être
traitée par des méthodes peu différentes de celles que nous avons exposées au
b paragraphe 10.3 [Dagnelie, 1970].
Exemple 10.4.1. Comparaison de trois types de sondes dans deux types de sols :
analyse de la variance avec estimation préalable d’une donnée.
L’exemple 10.3.2, relatif au contrôle des conditions d’application de l’analyse
de la variance, pour trois types de sondes et deux types de sols, a mis en évidence la
présence d’une donnée suspecte, qui figure dans le tableau 10.2.2 (x114 = 53). Pour
voir quelle peut être l’influence de cette valeur, il suffit de l’éliminer de l’analyse
en la remplaçant, comme si elle était manquante, par une valeur estimée basée sur
les trois autres observations du même échantillon :
x
b114 = (43 + 45 + 46)/3 = 44,67.
Le tableau 10.4.1 présente les résultats obtenus de cette façon. Dans ce tableau,
les nombres de degrés de liberté de la variation résiduelle et de la variation totale
ont été réduits d’une unité.
Par comparaison avec le tableau 10.3.1, on constate tout d’abord que l’élimi-
nation de la valeur suspecte provoque une réduction de plus de 40 % du carré
moyen résiduel. On peut observer aussi que l’influence du facteur types de sols
est toujours considérable et que la composante d’interaction reste largement non
significative.
10.4.3 MODÈLES CROISÉS À EFFECTIFS INÉGAUX 327
Tableau 10.4.1. Comparaison de trois types de sondes dans deux types de sols :
tableau d’analyse de la variance, après estimation d’une donnée.
les sommes Xi.0 , X.j0 et X..0 ne faisant évidemment pas intervenir la valeur man-
quante.
Quand deux ou plusieurs observations sont manquantes, cette relation peut
être utilisée par approximations successives, comme le montre l’exemple 10.4.2. Il
328 ANALYSE DE LA VARIANCE À DEUX CRITÈRES 10.4.3
est également possible, dans ce cas, de traiter le problème sans itérations, par la
résolution de systèmes d’équations linéaires comportant autant d’équations qu’il
y a de données manquantes.
De plus, tant pour une que pour deux ou plusieurs données manquantes, le
problème peut être résolu aussi par l’analyse de la covariance (§ 17.3.3.3◦ ).
Dans tous les cas, les nombres de degrés de liberté de l’interaction et de la
variation totale doivent être réduits d’autant d’unités qu’on a estimé de valeurs
manquantes.
2◦ Ces diverses approches, qui sont toutes basées sur le principe des moindres
carrés, fournissent des estimations non biaisées pour les moyennes et pour le carré
moyen de l’interaction, mais elle donne par contre des valeurs surestimées en ce
qui concerne les carrés moyens factoriels.
L’erreur systématique correspondante est d’autant plus importante que le nom-
bre de données estimées est plus élevé. En conséquence, on n’emploiera ces procé-
dures que quand les données manquantes ne représentent qu’une faible proportion
de l’ensemble. Une limite de 10 % de données manquantes, maximum, paraı̂t rai-
sonnable.
d D’autres approches sont présentées notamment par Hunt et Triggs [1989],
b et Kala [1998].
Exemple 10.4.2. Comparaison des résultats obtenus par trois méthodes d’analyse
chimique : analyse de la variance avec estimation préalable d’une ou deux données.
On peut illustrer les procédures qui viennent d’être présentées en supposant
par exemple que, pour les données relatives à la comparaison de trois méthodes
d’analyse chimique (exemple 10.3.6), la dernière observation (x3,30 ) est manquante
ou a dû être éliminée.
On aurait alors (tableau 8.5.1) :
0 0
X3. = 3.478 , X.30 = 273 , X..0 = 10.683
£ §±£ §
et x
b3,30 = 3 (3.478) + 30 (273) − 10.683 (2) (29) = 136,91 .
Le tableau 10.4.2 présente les résultats de l’analyse de la variance qui ont été ob-
tenus en substituant cette dernière valeur à celle qui intervenait antérieurement
(x3,30 = 134), et en réduisant d’une unité les nombres de degrés de liberté de
l’interaction et de la variation totale.
Ce tableau n’est guère différent du tableau initial (tableau 10.3.9), ce qui n’a
rien de surprenant si on tient compte du fait qu’une seule valeur sur 90 a ainsi été
estimée.
d De même, on peut illustrer la question de l’estimation de deux données man-
quantes en supposant qu’en outre, l’observation x1,13 est manquante ou a dû être
éliminée.
10.4.4 MODÈLES CROISÉS À EFFECTIFS INÉGAUX 329
Il faut alors donner à titre provisoire une valeur quelconque, telle que la valeur
de la moyenne générale ou une valeur proche de la moyenne générale, à une des
deux observations manquantes, c’est-à-dire par exemple :
x
b1,13 = 120 .
x
b1,13 = 93,85 et x
b3,30 = 136,95 .
rien d’anormal. On obtient en effet, par ce test (§ 6.2.2), une valeur χ2obs égale à 5,04 , avec deux
degrés de liberté, et une probabilité P(χ2 ≥ 5,04) égale à 0,080 .
10.4.4 MODÈLES CROISÉS À EFFECTIFS INÉGAUX 331
D’autre part, en calculant et en additionnant les sommes des carrés des écarts
relatives aux six groupes d’individus (§ 10.2.3.2◦ ), on aurait, pour la somme rési-
duelle :
SCEr = 42,8 + 74,0 + 98,7 + 44,9 + 17,3 + 26,8 = 304,5 .
SCEt = 1.014,3 ,
la somme des carrés des écarts de l’interaction devrait être, par différence :
Exemple 10.4.4. Comparaison des résultats obtenus par trois méthodes d’analyse
chimique : analyse de la variance non orthogonale.
L’exemle 10.4.2 a été consacré à la comparaison de trois méthodes d’analyse
chimique, pour lesquelles une ou deux observations auraient été manquantes. On
peut envisager le même problème sous l’angle de l’analyse de la variance non
orthogonale.
Sans donner plus de détails, nous présentons dans le tableau 10.4.5 les résultats
qui peuvent être obtenus en supposant, comme dans l’exemple 10.4.2, que la
dernière observation (x3,30 ) est manquante. Nous nous limitons en outre, dans
ce tableau, à la seule décomposition de la somme des carrés des écarts totale qui
est utile en vue de comparer les différentes méthodes d’analyse.
Comme dans l’exemple précédent, la première ligne provient d’un calcul direct
de la somme des carrés des écarts relative au facteur prélèvements, tandis que la
deuxième ligne est liée, pour le facteur méthodes d’analyse, à la détermination de
moyennes ajustées (§ 16.4.4).
On peut constater la très grande similitude avec les résultats antérieurs, déduits
de l’estimation de la donnée manquante (tableau 10.4.2).
3◦ Dans la suite, et comme pour les modèles croisés, nous envisagerons sé-
parément les aspects descriptifs (§ 10.5.2) et les aspects inférentiels (§ 10.5.3) de
l’analyse.
ni. = q n et n.. = p q n .
nij qi nij qi
1 X 1 XX 1 X
x̄ij. = xijk , x̄i.. = xijk = (nij x̄ij.)
nij ni. j=1 ni. j=1
k=1 k=1
p qi nij p qi p
1 XXX 1 XX 1 X
et x̄... = xijk = (nij x̄ij. ) = (ni. x̄i.. ) .
n.. i=1 j=1 n.. i=1 j=1 n.. i=1
k=1
Ces différentes relations se simplifient bien sûr sensiblement dans le cas équilibré.
ou encore :
SCEt = SCEa + SCEb|a + SCEr .
Tous les termes de cette équation sont identiques à ceux qui concernent les
modèles croisés (§ 10.2.2.3◦ ), à l’exception du terme SCEb|a . Celui-ci désigne la
somme des carrés des écarts entre les différentes modalités du deuxième critère
de classification, à l’intérieur des différentes modalités du premier critère. Dans
l’exemple considéré ci-dessus, il s’agirait de la variation entre exploitations agri-
coles, à l’intérieur des régions.
Ce terme prend la place, à la fois, de la variation factorielle relative au deuxième
critère de classification et de la variation de l’interaction. Dans le cas équilibré et
en supposant qu’on calcule, comme pour les modèles croisés, des moyennes x̄.j. ,
on aurait d’ailleurs strictement :
p q n − 1 = (p − 1) + p (q − 1) + p q (n − 1) .
X = A B A*B ,
X = A B,
Les données disponibles concernent en fait, non pas un seul ensemble de prai-
ries, mais bien deux types de prairies [Calembert, 1962]. Dans chacun d’eux, trois
prairies ont été choisies au hasard et indépendamment, et les rendements fourragers
ont été déterminés chaque fois en cinq endroits différents, eux-mêmes choisis au
hasard et indépendamment dans chacune des six prairies. Ces données permettent,
à la fois, de comparer les deux types de prairies et d’étudier l’homogénéité des
rendements à l’intérieur de ces deux types de prairies (variabilité d’une prairie à
l’autre et variabilité à l’intérieur des prairies).
Le tableau 10.5.2 réunit l’ensemble des données et le tableau 10.5.3 présente
les résultats de l’analyse de la variance, y compris les tests F , dont il sera question
ultérieurement (exemple 10.5.2).
Type 1 Type 2
Parcelles
Prairie 1 Prairie 2 Prairie 3 Prairie 1 Prairie 2 Prairie 3
1 2,06 1,59 1,92 2,91 1,57 2,43
2 2,99 2,63 1,85 3,27 1,82 2,17
3 1,98 1,98 2,14 3,45 2,69 2,37
4 2,95 2,25 1,33 3,92 3,25 2,89
5 2,70 2,09 1,83 4,34 3,11 2,24
2◦ Dans ces conditions, les différentes moyennes théoriques sont mi. , Mj|i et
m.. pour le modèle mixte, Mi. , Mj|i et m.. pour le modèle aléatoire.
Les effets principaux correspondants sont, d’une part :
ai = mi. − m.. et Bj|i = Mj|i − mi. ,
et d’autre part :
Ai = Mi. − m.. et Bj|i = Mj|i − Mi. .
Toutes les variables aléatoires Ai , Bj|i et Dijk sont supposées normales, indépen-
2 2
dantes les unes des autres, de moyennes nulles, et de variances respectives σA , σB
2
et σ .
Comme dans le cas du modèle observé (§ 10.5.2.4◦ ), le terme relatif au deuxième
critère de classification (Bj|i ) prend la place de deux termes présents dans les mo-
dèles croisés (Bj et Cij ).
la notation Dijk pour désigner les écarts résiduels. Nous aurions aussi pu spécifier clairement la
hiérarchie en introduisant, au contraire, la notation Dk|j|i , de même que nous aurions pu utiliser
le symbole Dk|ij pour les modèles croisés.
340 ANALYSE DE LA VARIANCE À DEUX CRITÈRES 10.5.3
p
qn X 2
E(CMa ) = σ 2 + n σB
2
+ a ou E(CMa ) = σ 2 + n σB
2 2
+ q n σA ,
p − 1 i=1 i
E(CMb|a ) = σ 2 + n σB
2
et E(CMr ) = σ 2 .
De même, dans les conditions qui viennent d’être définies, les distributions
d’échantillonnage des sommes des carrés des écarts, divisées par σ 2 , sont toujours
des distributions χ2 , indépendantes les unes des autres.
Une deuxième remarque concerne le choix des effectifs, aux différents niveaux
de l’échantillonnage.
Nous avons souligné antérieurement l’intérêt qu’il y aurait eu à augmenter
le nombre de prairies, en le portant de 3 à 5 ou à 7 par exemple, et à réduire
éventuellement le nombre de parcelles par prairies, en le ramenant de 5 à 3 ou
à 2 par exemple, dans l’optique de l’estimation des composantes de la variance
(exemple 9.4.4). Ce principe reste entièrement d’application en ce qui concerne la
comparaison des rendements moyens des deux types de prairies.
Sans aucun calcul de puissance et sans réaliser ici aucune détermination précise
des effectifs, on peut en effet constater tout simplement qu’avec 5 ou 7 prairies
pour chacun des deux types, le nombre de degrés de liberté relatif aux différences
entre prairies aurait été égal à 8 ou à 12 , au lieu de 4 . En conséquence, pour une
même valeur numérique de cette variable, la probabilité associée à la variable F
aurait été sensiblement plus réduite, les valeurs critiques correspondantes F0,95
étant d’ailleurs égales à 4,75 ou 5,32 , au lieu de 7,71 (table IV), soit une réduction
de l’ordre de 30 ou 40 %. Nous reviendrons sur ce point au cours de l’exemple
10.6.2.
3◦ Enfin, dans le cas du modèle croisé aléatoire, le principe est toujours d’aug-
menter au maximum les nombres p et q de variantes, en diminuant autant que
possible l’effectif n .
Exemple 10.6.1. Comparaison de trois types de sondes dans deux types de sols :
détermination des nombres d’observations.
Reprenons encore en considération les données de l’exemple 10.2.1, dans l’op-
tique cette fois de la détermination des nombres d’observations, et envisageons
plus particulièrement le problème de la comparaison des trois types de sondes.
Le coefficient de variation correspondant au carré moyen résiduel est pratique-
ment égal à 6 % (tableaux 10.2.2 et 10.2.3) :
p ±
cv = 6,25 42,00 = 6,0 % .
344 ANALYSE DE LA VARIANCE À DEUX CRITÈRES 10.6.3
q = 2 et n = 6 ou 15 ,
On peut tout d’abord constater que cette base de comparaison serait réduite
de moitié si le nombre de parcelles observées par prairie était ramené à 3 , au lieu
de 5 , et des deux tiers si ce nombre de parcelles était ramené à 2 , puisque :
Cet effectif de 80 prairies pour chacun des deux types de prairies, avec deux mesures
de rendement par prairie, peut paraı̂tre exorbitant. C’est cependant le ✭✭ prix à
payer ✮✮ pour atteindre l’objectif fixé, tenant compte de la très grande variabilité
observée. Une réduction à un quart de cet effectif, soit q = 20 , conduirait à un
doublement de la différence de rendement qu’on peut espérer mettre en évidence,
soit 20 % au lieu de 10 %.
Exercices
10.1. Les résultats suivants, exprimés en µA , ont été obtenus en analysant une substance
herbicide par polarographie, à deux températures différentes, au cours de quatre journées,
considérées comme aléatoires, et chaque fois avec deux répétitions. Procédez à l’analyse
de ces résultats, de manière à mettre en évidence l’existence éventuelle d’une différence
346 ANALYSE DE LA VARIANCE À DEUX CRITÈRES
significative due au facteur température et, le cas échéant, estimez cette différence et
déterminez ses limites de confiance.
10.2. Une expérience en blocs aléatoires complets a été réalisée dans le but de vérifier
s’il y a, parmi dix variétés d’orge, des différences significatives de rendements et, le cas
échéant, d’identifier les variétés les plus productives. Procédez à l’analyse des résultats
donnés ci-dessous, qui sont des rendements exprimés en tonnes par hectare.
Variétés
Blocs
1 2 3 4 5 6 7 8 9 10
1 5,57 6,09 6,21 7,06 6,52 6,24 6,09 6,76 6,65 7,95
2 5,79 6,57 6,73 7,36 6,31 7,69 6,83 7,27 7,48 6,77
3 6,14 7,51 6,86 7,02 5,90 7,41 6,54 6,81 8,35 7,59
4 5,83 7,27 6,84 7,25 6,14 7,55 7,35 6,35 8,33 7,49
10.3. Vingt-quatre porcelets, appartenant à six nichées différentes, ont été soumis à
quatre traitements différents, un porcelet de chacune des nichées étant soumis à chacun
des traitements. En fonction des accroissements en poids suivants, observés au cours
d’une même période et exprimés en kg, une donnée étant manquante, peut-on admettre
qu’il n’y a pas de différences significatives de croissance d’un traitement à l’autre ?
Nichées
Traitements
1 2 3 4 5 6
1 59,0 69,4 75,0 71,2 60,3 68,6
2 64,9 71,4 72,2 78,0 68,2 77,0
3 69,2 72,0 74,1 81,7 58,3 –
4 67,0 77,4 74,7 81,3 64,6 78,5
10.4. Les résultats suivants sont relatifs à la vitesse moyenne de croissance, en mm par
jour, des pédoncules floraux observés sur huit plantes de cyclamen, réparties au hasard
entre deux milieux de culture. Peut-on conclure sur cette base à l’existence d’une diffé-
rence significative de vitesse de croissance entre les deux milieux ?
Milieu 1 Milieu 2
Pl. 1 Pl. 2 Pl. 3 Pl. 4 Pl. 1 Pl. 2 Pl. 3 Pl. 4
0,76 0,97 0,58 0,86 0,81 1,07 0,62 0,93
0,66 0,74 0,57 0,93 0,77 0,82 0,99 1,07
0,61 0,51 1,02 0,95
0,65 0,62 0,79
0,66
L’analyse de la variance à
trois et plus de trois critères
de classification
Sommaire
11.1 Introduction
11.2 L’analyse de la variance à trois critères de classification :
modèles croisés à effectifs égaux
11.3 L’analyse de la variance à trois critères de classification :
modèles hiérarchisés à effectifs égaux
11.4 L’analyse de la variance à plus de trois critères de classification
348 ANALYSE DE LA VARIANCE À TROIS ET PLUS DE TROIS CRITÈRES 11.1
11.1 Introduction
Ces moyennes sont relatives, respectivement, aux différentes combinaisons des mo-
dalités des trois facteurs considérés simultanément (p q r moyennes x̄ijk. ), aux dif-
férentes combinaisons des modalités des trois facteurs considérés deux à deux
(p q moyennes x̄ij.. , p r moyennes x̄i.k. , et q r moyennes x̄.jk. ), aux différentes mo-
dalités des trois facteurs considérés individuellement (p moyennes x̄i... , q moyen-
nes x̄.j.. , et r moyennes x̄..k. ), et à l’ensemble des p q r n observations (moyenne
générale x̄.... ).
xijkl − x̄.... =
(x̄i... − x̄.... ) + (x̄.j.. − x̄.... ) + (x̄..k. − x̄.... ) + (x̄ij.. − x̄i... − x̄.j.. + x̄.... )
+ (x̄i.k. − x̄i... − x̄..k. + x̄.... ) + (x̄.jk. − x̄.j.. − x̄..k. + x̄.... )
+ (x̄ijk. − x̄ij.. − x̄i.k. − x̄.jk. + x̄i... + x̄.j.. + x̄..k. − x̄.... ) + (xijkl − x̄ijk. ) .
p q r n − 1 = (p − 1) + (q − 1) + (r − 1) + (p − 1) (q − 1) + (p − 1) (r − 1)
+ (q − 1) (r − 1) + (p − 1) (q − 1) (r − 1) + p q r (n − 1) .
4◦ Comme précédemment toujours, la division des sommes des carrés des écarts
par les nombres de degrés de liberté permet de définir les carrés moyens, et l’en-
semble des résultats peut être présenté sous la forme d’un tableau d’analyse de la
variance. Le tableau 11.2.2, relatif à l’exemple 11.2.1, en est une illustration, pour
des valeurs de p , q , r et n égales respectivement à 2 , 2 , 3 et 5 .
d 6◦ On notera aussi que tout ce qui a été dit au paragraphe 10.4.2 en matière
d’estimation des données manquantes peut être appliqué aux modèles croisés
b d’analyse de la variance à trois critères de classification.
Enfin, les différentes sommes des produits permettent d’estimer les effets princi-
paux et les termes d’interaction, qui seront définis au paragraphe 11.2.3 :
Les termes ai , bj et ck sont les effets principaux des trois facteurs. Les expressions
(ab)ij , (ac)ik et (bc)jk désignent les valeurs théoriques des interactions de deux
facteurs. Et les quantités (abc)ijk sont les différents termes de l’interaction des
trois facteurs.
4◦ De même, les deux modèles théoriques mixtes sont, d’une part, pour deux
facteurs fixes (a et b) et un facteur aléatoire (C) :
8◦ Des regroupements de sommes des carrés des écarts peuvent parfois être réa-
lisés, comme en analyse de la variance à deux critères de classification (§ 10.3.5.3◦ ).
De tels regroupements se justifient d’ailleurs plus ici, dans la mesure où les nombres
de degrés de liberté associés aux différentes interactions sont généralement d’autant
plus réduits que le nombre de critères de classification est plus élevé.
À cet égard, on peut recommander de procéder, dans toute la mesure du pos-
sible, à des regroupements suffisamment importants pour éviter d’effectuer des
tests F avec moins de 10 degrés de liberté au dénominateur.
Tableau 11.2.5. Espérances mathématiques des carrés moyens, pour les différents modèles croisés d’analyse
de la variance à trois critères de classification.
Carrés Modèle fixe Modèle mixte (a et b fixes)
2 2 2 2 2 2 2 2 2
moyens σ2 (abc)ijk (bc)jk (ac)ik (ab)ij ck2 bj2 ai2 σ2 σabC σbC σaC (ab)ij σC bj2 ai2
CMa 1 + 1 qn +
CMb 1 + 1 pn +
CMc 1 + 1 pqn
CMab 1 + 1 n +
CMac 1 + 1 qn
CMbc 1 + 1 pn
CMabc 1 + 1 n
CMr 1 1
Carrés Modèle mixte (a fixe) Modèle aléatoire
2 2 2 2 2 2 2 2 2 2 2 2 2
moyens σ2 σaBC σBC σaC σaB σC σB ai2 σ2 σABC σBC σAC σAB σC σB σA
CMa 1 n qn rn + 1 n qn rn qrn
CMb 1 pn prn 1 n pn rn prn
CMc 1 pn pqn 1 n pn qn pqn
CMab 1 n rn 1 n rn
MODÈLES CROISÉS À TROIS CRITÈRES
CMac 1 n qn 1 n qn
CMbc 1 pn 1 n pn
CMabc 1 n 1 n
CMr 1 1
357
358 ANALYSE DE LA VARIANCE À TROIS ET PLUS DE TROIS CRITÈRES 11.2.3
si on désigne par kab , kac et kabc , respectivement, les nombres de degrés de liberté
b de CMab , CMac et CMabc .
d 10◦ D’une manière plus générale, pour une fonction linéaire quelconque
c1 CM1 + . . . + ch CMh , de h carrés moyens, dont les nombres de degrés de li-
berté individuels sont k1 , . . . , kh , le nombre de degrés de liberté approché est :
±
(c1 CM1 + . . . + ch CMh )2 (c21 CM21 /k1 + . . . + c2h CM2h /kh ) .
Fumures Blocs
P2 O5 CaO 1 2 3
1 1 1,30 0,80 2,01
1 2 2,05 2,37 2,52
1 3 2,07 2,60 2,25
2 1 – 2,36 2,71
2 2 2,99 2,92 3,63
2 3 2,62 2,89 3,43
3 1 2,61 2,06 3,29
3 2 3,22 2,93 3,85
3 3 3,15 3,35 3,67
Les critères de classification phosphore et calcium sont des critères fixes, tandis
que le facteur blocs doit être considéré comme aléatoire, les blocs étant représen-
tatifs de l’ensemble du territoire auquel on souhaite pouvoir appliquer les résultats
obtenus. Le modèle d’analyse de la variance est donc un modèle mixte, du premier
type présenté au paragraphe 11.2.3.4◦ , mais avec un effectif n égal à 1 .
La deuxième partie du tableau des espérances mathématiques (tableau 11.2.5)
montre que les deux facteurs principaux et leur interaction doivent être testés par
11.2.4 MODÈLES CROISÉS À TROIS CRITÈRES 363
rapport aux interactions correspondantes avec le facteur blocs. Les résultats des
différents tests figurent dans la partie supérieure du tableau 11.2.7.
Toutefois, ces tests sont très peu puissants, car ils sont caractérisés par de très
faibles nombres de degrés de liberté aux dénominateurs (respectivement quatre,
quatre et sept degrés de liberté). Il y a donc lieu d’envisager de regrouper certaines
sources de variation.
Un tel regroupement est possible pour les trois interactions qui font intervenir
le facteur blocs, puisque les carrés moyens de ces interactions sont tous du même
ordre de grandeur (0,0523 , 0,1266 et 0,0666). Ce regroupement donne naissance à
la ✭✭ variation résiduelle ✮✮ qui apparaı̂t dans la partie inférieure du tableau 11.2.7,
les trois tests devant alors être réalisés par rapport à cette base de comparaison
commune. L’augmentation du nombre de degrés qui résulte de ce regroupement a
comme conséquence de mettre en évidence des différences nettement plus signifi-
catives, pour les deux facteurs.
Très souvent, dans le cas des expériences en blocs aléatoires complets, cette
deuxième présentation de l’analyse de la variance est envisagée seule, sans pas-
ser par la première présentation. Cette deuxième présentation peut d’ailleurs être
considérée aussi comme une analyse de la variance à deux critères de classification,
complétée par une décomposition de la somme des carrés des écarts factorielle. Il
s’agit en effet de l’analyse de la variance qui fait intervenir, dans un premier temps,
un facteur fumures global, avec huit degrés de liberté pour les neuf fumures, un
facteur blocs, avec deux degrés de liberté pour les trois blocs, et une interaction
fumures-blocs, avec normalement 16 degrés de liberté, cette dernière composante
correspondant à la ✭✭ variation résiduelle ✮✮ du tableau 11.2.7. Dans un deuxième
temps, la composante globale fumures peut être divisée en trois composantes in-
dividuelles, relatives à chacun des deux facteurs principaux, chaque fois avec deux
degrés de liberté, et à l’interaction de ces deux facteurs, avec quatre degrés de
liberté.
L’estimation de la donnée manquante a en fait été réalisée ici dans cette op-
tique, à l’aide de la formule du paragraphe 10.4.3.1◦ , le résultat obtenu étant 2,25 .
Quant au facteur blocs, on peut en mesurer l’importance en termes d’efficacité
relative (§ 10.3.6.6◦ ). On obtient :
(1,9191 + 1,1820)/(2 + 15) = 0,1824 et 0,1824/0,0788 = 2,31 ,
soit une efficacité relative d’environ 230 %, pour l’expérience en blocs aléatoires
complets, par comparaison avec une expérience complètement aléatoire.
Enfin, en ce qui concerne le contrôle des conditions d’application de l’analyse
de la variance, on peut remarquer que les résidus diffèrent sensiblement, en valeur
absolue, d’un niveau de fumure phosphorique à l’autre, et aussi d’un bloc à l’autre.
Cette inégalité de variances ne prête toutefois pas à conséquence, en ce qui concerne
les résultats des différents tests F .
On remarquera que l’analyse de la variance ne permet pas de résoudre le problè-
me posé au départ, à savoir la détermination d’une fumure optimale, mais permet
364 ANALYSE DE LA VARIANCE À TROIS ET PLUS DE TROIS CRITÈRES 11.2.4
seulement de voir dans quelle mesure les différences observées sont significatives.
Nous reviendrons ultérieurement au problème initial (exemples 12.2.2 et 15.2.1).
l’importance du facteur séances pour les différents fournisseurs. Ces deux appro-
ches mettent effectivement en évidence des différences de comportement entre les
fournisseurs, et en particulier la plus grande régularité de l’un d’entre eux.
En raison du degré de signification de l’interaction fournisseurs-séances, la réa-
lisation du test du facteur fournisseurs, auquel on s’intéresse cependant principa-
lement, ne se justifie guère. En principe, ce test devrait être effectué par rapport à
l’une ou l’autre des deux interactions fournisseurs-juges et fournisseurs-séances, si
ces interactions étaient non significatives, ou par rapport au résultat d’un regrou-
pement de l’une ou l’autre, ou de l’une et l’autre de ces deux interactions, avec
l’interaction fournisseurs-juges-séances (tableau 11.2.5).
La méthode de Satterthwaite pourrait aussi conduire à considérer la quan-
tité suivante comme base de comparaison relative au facteur fournisseurs :
différences importantes entre les juges, l’un d’entre eux étant caractérisé par des
résidus nettement inférieurs aux quatre autres.
Un retour aux données initiales permet de constater que ce juge a toujours
donné des appréciations relativement élevées et limitées à un domaine de variation
fort étroit (allant de 4,0 à 6,1), par comparaison avec les autres juges (respective-
ment de 1,0 à 5,0 , de 1,0 à 5,8 , de 1,8 à 6,4 , et de 2,0 à 6,8). Cet élément explique
dans une très large mesure, à la fois, les différences de moyennes et les différences
de variances entre juges. Il peut suggérer de recommencer l’analyse en éliminant
les observations relatives au juge en question.
Cet exemple, dont nous ne pousuivons pas plus loin la discussion, met bien en
évidence les difficultés que peut soulever l’interprétation des résultats d’une analyse
de la variance, même tout à fait classique, surtout en présence d’interactions. Il
souligne l’attention qu’il faut donc toujours accorder à de telles interprétations. On
peut ajouter aussi que, dans le cas considéré, le problème réel peut éventuellement
être plus complexe encore, ou au contraire être simplifié, du fait de l’existence
d’analyses de la variance relatives à d’autres caractéristiques (tendreté, saveur,
b etc.).
2◦ Les quatre cas qui viennent d’être évoqués sont présentés sous forme de
schémas dans la figure 11.3.1. Les lignes accompagnées des lettres a , b et c dési-
gnent chaque fois les trois critères de classification, tandis que les petites lignes
isolées indiquent dans chaque cas la position d’éventuelles répétitions des observa-
tions, pour des effectifs n supérieurs à 1 .
On notera que de telles répétitions sont indispensables dans les cas I et III,
pour qu’ils s’agissent bien d’analyses à trois critères de classification. L’absence
de répétitions réduirait en effet ces modèles à des analyses de la variance à deux
critères de classification, de type hiérarchisé dans le cas I et de type croisé dans le
cas III.
On remarquera aussi qu’à ce stade, nous ne faisons aucune distinction entre
critères fixes et critères aléatoires, les lettres a , b et c devant donc être considérées
comme étant, selon les cas, soit des minuscules, soit des majuscules.
xijkl − x̄.... = (x̄i... − x̄.... ) + (x̄ij.. − x̄i... ) + (x̄ijk. − x̄ij.. ) + (xijkl − x̄ijk. ) ,
et p q r n − 1 = (p − 1) + p (q − 1) + p q (r − 1) + p q r (n − 1) .
Exemple 11.3.1. Comparaison des hauteurs moyennes des arbres de trois types
de hêtraies : analyse de la variance à trois critères de classification.
Au cours du chapitre 9, nous avons comparé les hauteurs moyennes des arbres
de trois types de hêtraies, par l’analyse de la variance à un critère de classification
(exemples 9.2.1 et 9.3.1). Les données de base que nous avons prises en considé-
ration étaient des hauteurs moyennes observées en 37 endroits différents (tableau
2.3.1). Nous avions aussi signalé que ces hauteurs moyennes avaient été obtenues
en repérant chaque fois les cinq arbres les plus gros, au sein d’une parcelle d’une
dimension donnée, et en mesurant deux fois la hauteur de chacun de ces cinq arbres
(exemple 2.3.1).
Dans ces conditions, l’étude détaillée des 370 mesures initiales peut conduire
à la réalisation d’une analyse de la variance complètement hiérarchisée à trois cri-
tères de classification, qui correspond au premier schéma de la figure 11.3.1. Les
trois critères, tous hiérarchisés les uns par rapport aux autres, sont les types de
hêtraies, les points d’observation, aussi appelés ✭✭ stations ✮✮, et les arbres. Les deux
mesures réalisées pour chacun des arbres constituent les répétitions. Le critère
types de hêtraies est fixe, tandis que les deux autres critères de classification sont
aléatoires, de telle sorte que le modèle d’analyse de la variance est mixte.
Le tableau 11.3.2 présente les résultats de cette analyse. Comme l’indique le
tableau 11.3.1, chacun des critères de classification doit être testé par rapport au
critère qui lui est immédiatement subordonné. On peut constater ainsi que toutes
les différences sont au moins hautement significatives.
Tableau 11.3.2. Comparaison des hauteurs moyennes des arbres de trois types
de hêtraies : tableau d’analyse de la variance à trois critères de classification.
b2 = 0,5788 , σ
σ 2
bC|B|a = (3,639 − 0,5788)/2 = 1,530
2
et σ
bB|a = (34,28 − 3,639)/10 = 3,064 ,
370 ANALYSE DE LA VARIANCE À TROIS ET PLUS DE TROIS CRITÈRES 11.3.3
soit aussi en termes d’écarts-types, respectivement pour les différences entre me-
sures relatives à un même arbre, entre arbres dans une même station, et entre
stations dans un même type de hêtraies :
σ
b = 0,76 , σ
bC|B|a = 1,24 et σ
bB|a = 1,75 m .
Quant aux différences entre types de hêtraies, on peut observer que le résultat
du test est pratiquement identique à celui qui a été obtenu antérieurement (exemple
9.3.1). En fait, les deux premières sommes des carrés des écarts factorielles (485,71
et 1.165,41) sont à peu de chose près égales à 10 fois celles calculées précédemment
(tableau 9.2.2 : 48,88 et 116,65). Le facteur 10 provient du fait que ces sommes de
carrés d’écarts sont calculées ici à partir de 10 fois plus d’observations (cinq arbres
× deux mesures, dans chaque station), et les différences mineures, par rapport aux
résultats antérieurs multipliés par 10 , découlent du fait que les premiers calculs ont
été réalisés en partant de hauteurs moyennes par station arrondies à une décimale.
L’analyse de la variance à trois critères de classification n’apporte donc aucune
information complémentaire, par comparaison avec l’analyse à un critère, en ce
qui concerne le principal objectif de l’étude. Sa réalisation ne se justifie que dans
l’optique de la détection d’éventuelles valeurs aberrantes, en ce qui concerne les
données initiales, et de l’estimation des composantes de la variance 10 .
10 On pourra aussi remarquer que le problème envisagé n’est pas strictement équilibré, puisque
les effectifs qui concernent les différents types de hêtraies ne sont pas égaux. Ce fait ne modifie
toutefois pas la manière dont le test relatif aux types de hêtraies doit être réalisé, et n’a aucune
incidence sur les estimations des composantes de la variance relatives aux facteurs subordonnés
stations et arbres, et à la variation résiduelle.
11.3.3 MODÈLES HIÉRARCHISÉS À TROIS CRITÈRES 371
et p q r n − 1 = (p − 1) + p (q − 1) + p (r − 1) + p (q − 1) (r − 1) + p q r (n − 1) .
Ces relations sont intermédiaires entre celles qui concernent les modèles croi-
sés (§ 11.2.2) et celles qui sont relatives aux modèles complètement hiérarchisés
(§ 11.3.2.1◦ ).
Les deuxième et troisième termes du second membre du modèle observé ont
trait, respectivement, à l’effet du facteur b et à l’effet du facteur c , pour les différen-
tes modalités du facteur a . Par comparaison avec le modèle croisé (§ 11.2.2.2◦ ),
ces deux termes prennent la place, d’une part, de l’effet du facteur b et de son
l’interaction avec le facteur a , et d’autre part, de l’effet du facteur c et de son
interaction avec, aussi, le facteur a .
De même, le quatrième terme du second membre représente l’interaction des
facteurs b et c , pour les différentes modalités du facteur a . Il remplace le terme
d’interaction des facteurs b et c et le terme d’interaction des trois facteurs.
3◦ Toujours dans le même cas (schéma II de la figure 11.3.1), deux modèles
théoriques, l’un mixte et l’autre aléatoire, doivent être considérés. Le modèle mixte
(a fixe et B et C aléatoires) est :
Un autre modèle mixte, à un facteur fixe (a) et deux facteurs aléatoires (B et C),
et un modèle aléatoire peuvent être obtenus en remplaçant soit uniquement b , soit
a et b par des majuscules.
Ces trois modèles sont très proches des modèles croisés à deux critères de
classification (§ 10.3.2.2◦ , 10.3.3.3◦ et 10.3.4.3◦ ). Comme nous l’avons déjà signa-
lé (§ 11.3.1.2◦ ), ils s’y ramènent d’ailleurs dans le cas d’échantillons d’une seule
observation.
372 ANALYSE DE LA VARIANCE À TROIS ET PLUS DE TROIS CRITÈRES 11.3.3
6◦ Les espérances mathématiques des carrés moyens sont données, pour les
différents cas et de la même manière que précédemment, dans les tableaux 11.3.3
à 11.3.5. Elles indiquent la façon dont les tests d’hypothèses et les estimations
des composantes de la variance doivent être réalisés, éventuellement moyennant
certains regroupements des sommes des carrés des écarts (§ 10.3.5.3◦ et 11.2.3.8◦ ).
Degrés
Sources de variation
de liberté
Niveaux 1
Stations 44
Niveaux-stations 44
Arbres (dans stations) 45
Niveaux-arbres (dans stations) 45
Répétitions (éprouvettes) 180
Total 359
11.4.2 ANALYSE À PLUS DE TROIS CRITÈRES 375
Ces différents termes concernent les h facteurs principaux, les h (h − 1)/2 in-
teractions de deux facteurs, les h (h − 1) (h − 2)/6 interactions de trois facteurs,
. . . , les h (h − 1) (h − 2)/6 interactions de h − 3 facteurs, les h (h − 1)/2 interactions
de h − 2 facteurs, les h interactions de h − 1 facteurs, l’interaction des h facteurs,
et la variation résiduelle.
Dans le cas des échantillons de même effectif, on peut aussi déterminer aisé-
ment les différents nombres de degrés de liberté, en faisant intervenir des quantités
(p1 − 1), (p2 − 1), . . . , à la place de (p − 1), (q − 1), . . . (§ 11.2.2.3◦ ), les symboles
p1 , p2 , . . . désignant les nombres de modalités des différents facteurs.
3◦ Le cas des échantillons d’une seule observation présente aussi des difficul-
tés semblables à celles de l’analyse de la variance à trois critères de classification
(§ 11.2.4).
d Ce cas particulier est important, en vue notamment d’étudier des nombres
relativement élevés de critères de classification, qui possèdent alors généralement
chacun deux modalités seulement (cas 2h ). La méthode de Yates (§ 11.2.2.5◦ ),
qui s’étend facilement à un nombre quelconque de critères de classification, est
particulièrement intéressante dans ce dernier cas.
Il y a toutefois lieu de tenir compte du fait que le nombre de tests aug-
mente très rapidement en fonction du nombre de critères de classification. En
l’absence de toute correction, il peut en résulter une augmentation considérable
du risque de première espèce, comme dans toute réalisation de tests multiples
[STAT1, § 10.3.5.1◦ ]. Des tables particulières, basées notamment sur le principe
de Bonferroni, et le recours à des diagrammes apparentés aux diagrammes de
probabilité (§ 3.3.2) permettent de surmonter cette difficulté [Lawson et al., 1998 ;
11
b Ludwig et al., 1986 ; Pearson et Hartley, 1966-1972 ; Taylor, 1994] .
11 Des informations complémentaires et un exemple sont présentés à ce sujet dans Dagnelie
[2003].
11.4.2 ANALYSE À PLUS DE TROIS CRITÈRES 377
Gaz. Ess. Plaq. Hum. Rdt Gaz. Ess. Plaq. Hum. Rdt
1 1 1 1 74,4 2 1 1 1 78,6
1 1 1 2 71,3 2 1 1 2 80,5
1 1 1 3 69,6 2 1 1 3 74,9
1 1 1 4 56,4 2 1 1 4 63,4
1 1 2 1 66,1 2 1 2 1 72,4
1 1 2 2 72,0 2 1 2 2 72,7
1 1 2 3 67,1 2 1 2 3 63,6
1 1 2 4 55,1 2 1 2 4 57,6
1 1 3 1 63,4 2 1 3 1 67,2
1 1 3 2 65,6 2 1 3 2 62,4
1 1 3 3 61,8 2 1 3 3 64,6
1 1 3 4 61,0 2 1 3 4 62,0
1 2 1 1 76,8 2 2 1 1 78,7
1 2 1 2 72,0 2 2 1 2 74,5
1 2 1 3 67,7 2 2 1 3 67,1
1 2 1 4 61,0 2 2 1 4 64,8
1 2 2 1 76,3 2 2 2 1 76,0
1 2 2 2 69,5 2 2 2 2 79,9
1 2 2 3 66,9 2 2 2 3 73,3
1 2 2 4 59,9 2 2 2 4 58,8
1 2 3 1 76,0 2 2 3 1 65,7
1 2 3 2 72,7 2 2 3 2 67,3
1 2 3 3 71,7 2 2 3 3 60,6
1 2 3 4 61,6 2 2 3 4 58,8
On peut noter aussi que, dans les différents cas, les résidus des analyses de la
variance ne présentent aucune anomalie particulière. Le principal point auquel il y
11.4.2 ANALYSE À PLUS DE TROIS CRITÈRES 379
a lieu d’être attentif, en ce qui concerne les conditions d’application de l’analyse, est
la répartition complètement aléatoire des 48 essais qui ont été réalisés. L’exemple
suivant a trait à cette condition (exemple 11.4.2).
380 ANALYSE DE LA VARIANCE À TROIS ET PLUS DE TROIS CRITÈRES 11.4.2
au lieu de :
36,32 , 36,32 , 4,78 et 0,038 ,
teur considéré et toutes les composantes relatives aux facteurs qui lui sont subor-
donnés (§ 11.3.2.3◦ ). Toutes les comparaisons doivent donc être réalisées, chaque
fois, par rapport à la composante de niveau immédiatement inférieur.
2◦ La situation se complique au contraire très rapidement en ce qui concerne
les modèles partiellement hiérarchisés. Pour quatre critères de classification par
exemple, Harter et Lum [1955] dénombrent déjà 49 modèles différents.
Comme pour trois critères, des schémas semblables à ceux de la figure 11.3.1
peuvent être fort utiles, en vue d’identifier les termes qui doivent figurer dans
les différents modèles observés et théoriques et dans les équations d’analyse de la
variance correspondantes.
Quant aux espérances mathématiques des carrés moyens, elles peuvent être ob-
tenues selon les principes évoqués au paragraphe 11.4.2.2◦ . Les tables de Harter
et Lum [1955] donnent également les résultats relatifs aux différents modèles à
quatre critères de lassification.
d 3◦ Dans le cas des modèles complètement hiérarchisés et, dans une moindre
mesure, des modèles partiellement hiérarchisés, les nombres de degrés de liberté
diffèrent considérablement d’un critère de classification à l’autre. Ainsi, pour les
modèles complètement hiérachisés dont les différents critères de classification ne
comportent chacun que deux modalités (p = q = r = . . . = 2), les nombres de
degrés de liberté sont les puissances succesives de 2 , à savoir un degré de liberté
pour le premier critère de classification, deux degrés de liberté pour le deuxième
critère, quatre degrés de liberté pour le troisième critère, etc. Il en résulte de
grandes différences de précision en ce qui concerne les estimations des composantes
de la variance.
Certains modèles particuliers, connus sous le nom de modèles échelonnés 13 ,
permettent de remédier à cette situation [Cheol Jung et al., 2008 ; Khattree
b et al., 1997 ; Ojima, 1998, 2000].
Dans ces conditions, les facteurs fumures, années et lieux sont croisés, puisque
les mêmes fumures sont appliquées au cours des deux années et dans les différents
lieux, et qu’en outre, les mêmes lieux sont pris en considération au cours des deux
années. Le facteur blocs, par contre, est croisé avec le facteur fumures, puisque
les mêmes fumures se retrouvent dans les différents blocs, mais il est subordonné
aux facteurs années et lieux, puisque des blocs différents (et aussi des parcelles
différentes) sont observés d’une année à l’autre et d’un lieu à l’autre. Le modèle
d’analyse de la variance est donc un modèle partiellement hiérarchisé à quatre
critères de classification, dans le cas d’échantillons d’une seule observation, en
l’occurrence une observation de rendement par parcelle (n = 1).
Ce modèle est présenté de manière schématique dans la partie gauche de la
figure 11.4.1, les différentes lettres étant les initiales des quatre critères de classi-
fication. À l’examen des intersections qui apparaissent dans cette figure, on cons-
tate que le modèle observé et le modèle théorique de l’analyse de la variance
doivent contenir les interactions fumures-années, fumures-lieux, années-lieux, et
donc fumures-années-lieux, ainsi que l’interaction fumures-blocs (dans les années
et les lieux). L’analyse de la variance correspondante est esquissée dans le tableau
11.4.6.
Si on considère en outre que le facteur fumures est fixe et que les facteurs
années, lieux et blocs (dans les années et les lieux) sont aléatoires, le modèle
d’analyse de la variance est un modèle mixte, ce que souligne aussi la première
partie de la figure 11.4.1, par la présence d’une lettre minuscule pour le premier
facteur et de lettres majuscules pour les trois autres facteurs. Par analogie avec
ce qui a été vu antérieurement (troisième partie du tableau 11.2.5), le critère de
classification fumures, auquel on s’intéresse principalement, doit être testé autant
que possible par rapport à l’interaction fumures-années ou à l’interaction fumures-
lieux, ou encore à un regroupement de l’une ou l’autre de ces deux composantes,
ou de l’ensemble de ces deux composantes et de l’interaction fumures-années-lieux.
En vue de la réalisation des calculs, le modèle peut être présenté par exemple
de la façon suivante pour le logiciel Minitab :
Degrés
Sources de variation
de liberté
Fumures 7
Années 1
Lieux 5
Fumures-années 7
Fumures-lieux 35
Années-lieux 5
Fumures-années-lieux 35
Blocs (dans années et lieux) 12
Fumures-blocs (dans années et lieux) 84
Total 191
Mais le problème réel est en fait sensiblement plus complexe, si on tient compte
de ce que les huit fumures étudiées n’étaient pas indépendantes les unes des autres,
mais étaient les combinaisons de deux doses (ou de l’absence et de la présence)
d’azote, de deux doses (ou de l’absence et de la présence) de phosphore, et de deux
doses (ou de l’absence et de la présence) de potassium, c’est-à-dire un ensemble
de 23 fumures de type NPK. Dans ces conditions, l’analyse de la variance fait
intervenir six critères de classification, au lieu de quatre, toujours dans le cadre
d’un modèle partiellement hiérarchisé mixte à effectifs unitaires. Le schéma de
cette analyse est présenté dans la partie droite de la figure 11.4.1, les trois matières
fertilisantes étant désignées par des lettres minuscules, de manière à maintenir la
distinction entre les critères fixes et les critères aléatoires.
La ligne fumures du tableau 11.4.6 doit alors être subdivisée en sept compo-
santes individuelles, à savoir les trois facteurs principaux azote, phosphore et potas-
sium, et leurs quatre interactions (azote-phosphore, azote-potassium, phosphore-
potassium et azote-phosphore-potassium). Il en est de même pour chacune des
lignes fumures-années, fumures-lieux et fumures-années-lieux. On est ainsi amené
à augmenter considérablement, a priori, le nombre de composantes, mais celles-ci
ne possèdent évidemment que de très petits nombres de degrés de liberté (un degré
de liberté dans tous les cas où le facteur lieux n’intervient pas et cinq degrés de
liberté chaque fois que le facteur lieux intervient). Il s’avérera donc indispensable
d’effectuer des regroupements d’interactions, en fonction des résultats observés 15 .
15 On notera que le problème dont nous nous inspirons ici était en réalité plus complexe encore,
dans la mesure où un facteur supplémentaire magnésium était également pris en considération,
et où le dispositif expérimental était un dispositif en blocs incomplets, basé sur le principe du
✭✭ confounding ✮✮ [Dagnelie, 2003 ; Van Renterghem et Dagnelie, 1963].
386 ANALYSE DE LA VARIANCE À TROIS ET PLUS DE TROIS CRITÈRES 11.4.3
Mais en outre, aux deux niveaux pris en considération dans chacun des arbres,
les deux éprouvettes n’avaient pas non plus été choisies de manière complètement
aléatoire et indépendamment d’un niveau à l’autre. À chaque niveau en effet, une
éprouvette avait été prélevée systématiquement dans la partie centrale du tronc et
une autre éprouvette dans la partie extérieure du tronc.
Il y a donc lieu de considérer la position des éprouvettes comme un sixième
critère de classification, mais alors sans répétitions, puisqu’on ne dispose plus que
d’une éprouvette pour chaque combinaison des différentes modalités des six fac-
teurs. Le modèle d’analyse de la variance correspondant est esquissé dans la partie
droite de la figure 11.4.2 16 .
Pour les deux cas envisagés, on peut déduire de cette figure les interactions qui
doivent apparaı̂tre dans les modèles d’analyse de la variance, ainsi que les schémas
des tableaux d’analyse de la variance. Toujours selon les mêmes conventions, re-
latives notamment au logiciel Minitab, le premier modèle par exemple peut être
présenté sous la forme :
Les deux derniers exemples, que nous n’avons fait qu’esquisser, accompagnés de
leurs notes de bas de page, illustrent la grande diversité des situations auxquelles
on peut être confronté en analyse de la variance.
16 Ici également, le problème original était en fait plus complexe encore, dans la mesure où