ST 2 Avar

Télécharger au format pdf ou txt
Télécharger au format pdf ou txt
Vous êtes sur la page 1sur 154

Pierre Dagnelie

ANALYSE DE
LA VARIANCE

EXTRAIT DE
PRÉAMBULE

Statistique théorique et appliquée,


de Pierre Dagnelie, est un ouvrage en
deux volumes publié par les Éditions
De Boeck, à Louvain-la-Neuve, Belgi-
que (3e édit., 2011-2013, 517+736 p.
– <www.dagnelie.be/stpres.html>).
Le présent document réunit les trois
chapitres du tome 2 qui sont relatifs à
l'analyse de la variance.
La mise en ligne de ce texte partiel
est réalisée avec l'aimable autorisation
des Éditions De Boeck.

Le site wseb des Éditions De Boeck est :


<www.deboecksuperieur.com>.

Les publications des Éditions De Boeck sont diffusées par :


Dilisco, Rue du Limousin, BP 25, F-23220 Cheniers (France).
Tél. : +33 (0)555 51 80 22 ou +33 (0)555 51 80 06
Fax : +33 (0)555 62 17 39
E-mail : <[email protected]>
Site web : <www.dilisco-diffusion-distribution.fr>

PLAN

Chapitre 9 – L’analyse de la variance à un critère de


classification Page 237
Chapitre 10 – L’analyse de la variance à deux critères
de classification Page 283
Chapitre 11 – L’analyse de la variance à trois et plus
de trois critères de classification Page 347

-2-
Chapitre 9

L’analyse de la variance
à un critère de classification

Sommaire
⊕ 9.1 Introduction
⊕ 9.2 Les aspects descriptifs
⊕ 9.3 Les aspects inférentiels
⊕ 9.4 La puissance et la détermination des nombres d’observations
Exercices
238 ANALYSE DE LA VARIANCE À UN CRITÈRE 9.1

⊕ 9.1 Introduction
1◦ D’une manière tout à fait générale, l’analyse de la variance 1 a comme
objectif de comparer des ensembles de plus de deux moyennes, en identifiant les
sources de variation qui peuvent expliquer les différences existant entre elles. À ce
titre, l’analyse de la variance est un des principaux outils de l’inférence statistique.
Dans le cas le plus simple, l’analyse de la variance à un critère de classifica-
tion ou à un facteur ou à une voie 2 concerne des ensembles de moyennes qui ne
présentent aucune structure particulière, liée par exemple à l’existence de deux ou
plusieurs facteurs sous-jacents 3 (§ 1.2.2.2◦ ).

2◦ Bien que l’analyse de la variance ait été conçue essentiellement dans l’op-
tique de la réalisation d’estimations et de tests d’hypothèses, elle peut également
être considérée dans une certaine mesure comme une méthode descriptive. En
vue de clarifier au maximum l’exposé, nous distinguerons les deux approches, en
présentant dans un premier temps les aspects descriptifs (§ 9.2), puis les aspects
inférentiels (§ 9.3). Nous envisagerons en outre les questions de détermination de
la puissance de l’analyse et des nombres d’observations à effectuer (§ 9.4).
Les exemples 9.2.1 et 9.3.3 sont des illustrations des problèmes envisagés ici.

3◦ En ce qui concerne l’approche inférentielle, l’analyse de la variance s’appli-


que dans les mêmes conditions que le test t de Student, à savoir des populations
normales et de même variance, et des échantillons aléatoires, simples et indépen-
dants (§ 8.1.2◦ ).
Les mêmes remarques qu’au paragraphe 8.1.2◦ peuvent être formulées à ce
sujet. Comme le test t de Student, l’analyse de la variance est en effet peu
sensible à la non-normalité des populations-parents et, pour des échantillons de
même effectif, à l’inégalité des variances [Donaldson, 1968 ; Kanji et Liu, 1983 ;
Krutchkoff, 1988 ; Tiku, 1971].
Une réserve doit cependant être formulée en ce qui concerne ce dernier point.
En effet, si l’analyse de la variance est peu sensible à une éventuelle inégalité des
variances dans le cas des échantillons de même effectif, il n’en est pas de même pour
les méthodes de comparaisons particulières et multiples de moyennes, qui sont très
fréquemment utilisées en complément à l’analyse de la variance (chapitre 12). Il y a
donc lieu, le plus souvent, d’être malgré tout attentif à cette condition, notamment
par la réalisation de transformations de variables (chapitre 4).
On notera aussi qu’en particulier, l’analyse de la variance peut être appliquée
sans inconvénients majeurs à des données discontinues, telles que des notations
1 En anglais : analysis of variance, ANOVA.
2 En anglais : one-way analysis of variance.
3 L’analyse de la variance à un critère de classification est parfois appelée aussi analyse de

la variance à deux composantes, en raison du fait que la variation totale y est divisée en deux
parties (variation factorielle et variation résiduelle).
9.2.2 ASPECTS DESCRIPTIFS 239

effectuées selon des échelles comportant au moins cinq degrés (appréciations sen-
sorielles pouvant aller de 1 à 5 ou de 1 à 7, par exemple) [Rayner et al., 1986 ;
Tricker, 1992].
L’exemple 9.3.2 sera exclusivement consacré, à titre d’illustration, à la question
du contrôle des conditions d’application de l’analyse de la variance.

4◦ La bibliographie relative à l’analyse de la variance est extrêmement abon-


dante. De nombreux livres y sont notamment consacrés, souvent en relation avec
les questions de régression ou d’expérimentation. On peut citer, entre autres, les
livres de Christensen [1998], Lindman [1992], Mickey et al. [2004], Miller
[1997], et Sahai et Ageel [2000].
Certains de ces ouvrages présentent l’analyse de la variance comme un cas par-
ticulier du modèle linéaire ou modèle linéaire général, qui englobe également la
régression linéaire. Nous introduirons ce type de présentation au paragraphe 16.4,
en utilisant alors des notations matricielles.

9.2 Les aspects descriptifs


⊕ 9.2.1 Principes généraux
Nous considérerons successivement les notions de modèle observé et de tableau
d’analyse de la variance (§ 9.2.2), et la réalisation pratique de l’analyse en l’absence
de tout recours au calcul automatique (§ 9.2.3), même si l’emploi de l’ordinateur
est en fait la solution adoptée le plus souvent. Il nous paraı̂t en effet important, tant
pour la compréhension que pour l’utilisation de l’analyse de la variance, de conser-
ver une certaine aptitude au calcul ✭✭ manuel ✮✮, en particulier en ce qui concerne la
détermination des sommes des carrés des écarts.

⊕ 9.2.2 La décomposition de la variation totale


1◦ Nous supposerons qu’on dispose au départ de p échantillons ou séries d’ob-
servations, d’effectifs ni (i = 1 , . . . , p), et nous désignerons l’effectif total par n. :
p
X
n. = ni .
i=1

On remarquera que, d’une manière générale, au cours de ce chapitre et des


chapitres suivants, les points qui figurent en indices remplacent des indices selon
lesquels une sommation a été réalisée.

2◦ Nous désignerons aussi les différentes observations par le symbole xik


(i = 1 , . . . , p et k = 1 , . . . , ni ), la valeur xik étant donc la kème observation
du ième échantillon.
240 ANALYSE DE LA VARIANCE À UN CRITÈRE 9.2.2

On peut en déduire p moyennes x̄i , relatives aux p échantillons, et une moyenne


générale x̄ :

ni p ni p
1 X 1 XX 1 X
x̄i = xik et x̄ = xik = (ni x̄i ) .
ni n. i=1 n. i=1
k=1 k=1

3◦ En fonction de ces différents éléments, il est possible de subdiviser les écarts


entre les observations individuelles et la moyenne générale en deux composantes
additives :
xik − x̄ = (x̄i − x̄) + (xik − x̄i ) .

Cette décomposition constitue le modèle observé de l’analyse de la variance.


Elle implique simplement, sans faire aucune hypothèse, que les écarts entre les
observations et la moyenne générale peuvent être considérés comme constitués de
façon additive, d’une part, des écarts entre les moyennes des différents échantillons
et la moyenne générale, et d’autre part, des écarts entre les observations elles-
mêmes et les moyennes respectives des échantillons auxquels les observations ap-
partiennent.
La composante globale est appelée variation totale et les deux composantes
partielles sont appelées, d’une part, variation factorielle ou liée au facteur contrôlé,
ou encore entre échantillons, et d’autre part, variation résiduelle ou dans les échan-
tillons.

4◦ En élevant au carré les deux membres de la relation précédente, et en som-


mant pour toute les valeurs observées, on obtient l’équation d’analyse de la va-
riance :
Xp Xni Xp Xni p X
X ni
2 2
(xik − x̄) = (x̄i − x̄) + (xik − x̄i )2
i=1 k=1 i=1 k=1 i=1 k=1

p X
X ni p
X p X
ni
£ § X
ou (xik − x̄)2 = ni (x̄i − x̄)2 + (xik − x̄i )2 .
i=1 k=1 i=1 i=1 k=1

On constate ainsi que la somme des carrés des écarts par rapport à la moyenne
générale, également appelée somme des carrés des écarts totale 4 , peut elle aussi
être divisée en deux composantes additives : une somme des carrés des écarts fac-
torielle ou entre échantillons 5 , et une somme des carrés des écarts résiduelle ou
dans les échantillons 6 . En désignant la somme totale par SCEt et ses deux com-
posantes respectivement par SCEa et SCEr , on peut résumer l’équation d’analyse
4 En anglais : total sum of squares.
5 En anglais : factorial sum of squares, between-group sum of squares.
6 En anglais : residual sum of squares, within-group sum of squares, error sum of squares.
9.2.2 ASPECTS DESCRIPTIFS 241

de la variance sous la forme condensée :

SCEt = SCEa + SCEr .

Les trois sommes des carrés des écarts sont des mesures globales des varia-
tions existant, d’une part, entre l’ensemble des observations indépendamment des
échantillons auxquels elles appartiennent, d’autre part, entre les différents échan-
tillons, et enfin, entre les observations à l’intérieur des différents échantillons.
d On notera qu’aucun double produit, pouvant résulter de l’élévation au carré,
n’apparaı̂t dans l’équation d’analyse de la variance, la somme des doubles produits
étant nulle, en vertu de la propriété de nullité de la somme des écarts par rapport
à la moyenne [STAT1, § 3.5.1.2◦ ] :
p X
X ni p ∑
X ni
X ∏
£ §
2 (x̄i − x̄) (xik − x̄i ) = 2 (x̄i − x̄) (xik − x̄i ) = 0 .
b i=1 k=1 i=1 k=1

5◦ En relation avec les variables χ2 dont il sera question ultérieurement


(§ 9.3.2.5◦ ), des nombres de degrés de liberté peuvent être associés aux différentes
sommes des carrés des écarts. Ces nombres de degrés de liberté sont aussi additifs
et se présentent de la manière suivante :

n. − 1 = (p − 1) + (n. − p) .

6◦ Enfin, en divisant les sommes des carrés des écarts par leurs nombres de
degrés de liberté respectifs, on définit des quantités appelées carrés moyens 7 , à
savoir un carré moyen total 8 , un carré moyen factoriel ou entre échantillons 9 , et
un carré moyen résiduel ou dans les échantillons 10 :

CMt = SCEt /(n. − 1) , CMa = SCEa /(p − 1) et CMr = SCEr /(n. − p) .

Ces carrés moyens sont aussi appelés variances et ils possèdent d’ailleurs certaines
des propriétés des variances, notamment en ce qui concerne leurs distributions
d’échantillonnage. Comme les sommes des carrés des écarts, les carrés moyens
constituent des mesures globales des variations existant aux trois niveaux consi-
dérés.

7◦ L’ensemble des résultats peut être présenté sous la forme d’un tableau d’ana-
lyse de la variance (tableau 9.2.1).
En pratique, de tels tableaux sont obtenus le plus souvent à l’aide de logiciels
qui font intervenir soit des commandes ou des procédures spécifiques à l’analyse
7 En anglais : mean square.
8 En anglais : total mean square.
9 En anglais : factorial mean square, between-group mean square.
10 En anglais : residual mean square, within-group mean square, error mean square.
242 ANALYSE DE LA VARIANCE À UN CRITÈRE 9.2.2

Tableau 9.2.1. Tableau d’analyse de la variance à un critère de classification.

Degrés Sommes des carrés Carrés


Sources de variation
de liberté des écarts moyens
Différences entre échantillons p−1 SCEa CMa
Différences entre observations
(dans les échantillons) n. − p SCEr CMr
Totaux n. − 1 SCEt

de la variance et souvent dénommées ✭✭ anova ✮✮, soit des commandes plus générales
relatives au modèle linéaire et fréquemment appelées ✭✭ glm ✮✮.

d 8◦ Le quotient des sommes des carrés des écarts factorielle et totale permet de
définir facilement le rapport de corrélation, aussi appelé coefficient de corrélation
non linéaire 11 :
p
η = SCEa /SCEt .

D’une manière générale, ce paramètre joue, dans le cas d’une relation liant une
caractéristique nominale et une variable quantitative, un rôle semblable à celui
du coefficient de corrélation dans le cas de deux variables quantitatives [STAT1,
§ 4.6.3.5◦ ]. La caractéristique nominale correspond ici aux différents échantillons
et la variable quantitative correspond aux différentes observations.
Le rapport de corrélation est toujours compris entre 0 et 1 . Il est égal à 0
quand toutes les moyennes x̄i sont égales entre elles, et il est égal à 1 quand les
variances des différents échantillons sont toutes nulles.
Certains logiciels associent systématiquement le carré du rapport de corrélation
à toutes les analyses de la variance, en utilisant la notation r2 ou R2 , et non pas η 2
ou tout autre symbole particulier. S’il s’agit bien là d’un paramètre jouant un rôle
comparable à celui du coefficient de détermination [STAT1, § 4.6.1.5◦ ], il y a lieu
toutefois d’être attentif au fait qu’il ne s’agit nullement, d’une façon générale, du
b carré d’un coefficient de corrélation classique.

Exemple 9.2.1. Comparaison des hauteurs moyennes des arbres de trois types
de hêtraies : analyse de la variance.
Nous avons examiné antérieurement, à diverses reprises, un ensemble de don-
nées relatives à des hauteurs d’arbres observées dans trois types de hêtraies (exem-
ple 2.3.1). Nous en venons maintenant à l’objectif réel de l’étude, à savoir vérifier
s’il existe ou non, en moyenne, des différences significatives de hauteurs entre les
trois types de forêts, et chiffrer éventuellement ces différences.
11 En anglais : correlation ratio, non-linear correlation coefficient.
9.2.2 ASPECTS DESCRIPTIFS 243

Les valeurs relatives aux 37 endroits où les mesures ont été réalisées sont don-
nées dans le tableau 2.3.1. Les moyennes correspondantes sont :

x̄1 = 25,97, x̄2 = 25,39 , x̄3 = 23,14 et x̄ = 24,98 m .

Appliqué à la première observation du premier échantillon (x11 = 23,4), le


modèle observé d’analyse de la variance s’écrit :

(23,4 − 24,98) = (25,97 − 24,98) + (23,4 − 25,97) ou − 1,58 = 0,99 − 2,57.

L’écart négatif de 1,58 m entre cette observation particulière et la moyenne générale


provient, à la fois, du fait que l’endroit considéré appartient à un type de forêts
dont la moyenne est supérieure de 0,99 m, par rapport à la moyenne générale,
et que cet endroit présente une hauteur inférieure de 2,57 m, par rapport à la
moyenne de toutes les observations relatives à ce type de forêts.
Un calcul similaire pourrait être réalisé pour chacune des 36 autres valeurs du
tableau 2.3.1, et en sommant les carrés des écarts ainsi obtenus, on aboutirait aux
trois sommes des carrés des écarts définies précédemment :

SCEt = (− 1,58)2 + . . . , SCEa = (0,99)2 + . . . et SCEr = (− 2,57)2 + . . .

Cette façon de procéder n’est pas celle qui est habituellement suivie, mais elle peut
être utile au point de vue didactique, pour bien saisir le mécanisme de l’analyse
de la variance. Nous verrons au paragraphe 9.2.3 comment les calculs peuvent
éventuellement être réalisés en pratique.
Le tableau 9.2.2 présente les sommes des carrés des écarts qui sont ainsi obte-
nues, les nombres de degrés de liberté et les carrés moyens. Le carré moyen total,
égal à 4,598 , n’est toutefois pas repris dans ce tableau, afin d’éviter de suggérer,
à tort, qu’il pourrait être égal à la somme des deux autres carrés moyens.

Tableau 9.2.2. Comparaison des hauteurs moyennes des arbres de trois types
de hêtraies : tableau d’analyse de la variance.

Degrés Sommes des carrés Carrés


Sources de variation
de liberté des écarts moyens
Différences entre types de hêtraies 2 48,88 24,44
Différences entre observations
(dans les types de hêtraies) 34 116,65 3,431
Totaux 36 165,53

Ce carré moyen total (ou cette variance totale), auquel correspond un écart-
type égal à 2,14 m, mesure globalement l’hétérogénéité des hauteurs, sans tenir
compte de la subdivision en trois types de forêts. Le carré moyen résiduel (ou
la variance résiduelle), auquel est associé un écart-type égal à 1,85 m, mesure,
244 ANALYSE DE LA VARIANCE À UN CRITÈRE 9.2.3

toujours globalement, l’hétérogénéité des hauteurs à l’intérieur des trois types de


forêts.
Enfin, le carré moyen factoriel, qui est de loin supérieur aux deux autres, met
en évidence l’existence de différences importantes de hauteur d’un type de hêtraies
à l’autre. Nous vérifierons ultérieurement la signification statistique de ces diffé-
rences (exemple 9.3.1).
d En outre, on peut compléter l’analyse par le calcul du rapport de corrélation
ou de son carré :
η 2 = 48,88/165,53 = 0,30 .

Ce paramètre mesure le degré de dépendance de la variable quantitative ✭✭ hauteur


des arbres ✮✮ en fonction de la caractéristique nominale ✭✭ type de hêtraies ✮✮. Comme
un coefficient de détermination, il indique que 30 % de la variation totale peut être
b expliquée par les différences entre types de forêts.

9.2.3 La réalisation de l’analyse de la variance


1◦ Comme nous l’avons signalé au paragraphe 9.2.1, nous donnons ici, à titre
indicatif, quelques informations relatives à la réalisation de l’analyse de la variance
en l’absence de tout recours à l’un ou l’autre moyen de calcul automatique. Cette
réalisation consiste essentiellement en une suite de déterminations de sommes de
carrés d’écarts, semblables à celle qui peut être effectuée pour toute série d’obser-
vations [STAT1, § 3.8.1].

2◦ En ce qui concerne la somme des carrés des écarts résiduelle, on peut calcu-
ler séparément les sommes des carrés des écarts relatives aux différents échantillons
ou séries d’observations, et sommer ensuite les résultats ainsi obtenus. Si on désigne
par Xi. et SCEi , respectivement, les sommes et les sommes des carrés des écarts
relatives aux différentes séries d’observations, on a :
ni
X ni
X
Xi. = xik et SCEi = x2ik − Xi.2 /ni (pour tout i) ,
k=1 k=1

ainsi que :
p
X
SCEr = SCEi .
i=1

En réalité, la détermination des sommes des carrés des écarts individuelles


SCEi n’est pas indispensable, en vue de calculer la somme des carrés des écarts
résiduelle, mais cette détermination permet d’obtenir facilement les variances des
différentes séries d’observations et donc de comparer ces variances, préalablement
à toute inférence statistique.
9.3.1 ASPECTS INFÉRENTIELS 245

3◦ Quant à la somme des carrés des écarts totale, on a, toujours par analogie
avec le cas d’une seule série d’observations :
Xp X ni
SCEt = x2ik − X..2 /n. ,
i=1 k=1

le symbole X.. désignant la somme de l’ensemble des n. observations :


p X
X ni p
X
X.. = xik = Xi. .
i=1 k=1 i=1

On remarquera que le premier terme qui intervient dans la relation relative à la


somme des carrés des écarts totale SCEt n’est autre que la somme des premiers
termes qui se présentent dans l’expression relative aux sommes des carrés des écarts
individuelles SCEi .
4◦ Enfin, la somme des carrés des écarts factorielle peut être obtenue soit par
différence :
SCEa = SCEt − SCEr ,
soit par la relation :
p
X
SCEa = (Xi.2 /ni ) − X..2 /n. .
i=1

Diverses simplifications peuvent être apportées à certaines de ces formules


quand les effectifs ni sont égaux.

Exemple 9.2.2. Comparaison des hauteurs moyennes des arbres de trois types
de hêtraies : réalisation de l’analyse de la variance.
En ce qui concerne l’exemple 9.2.1, les différentes sommes des carrés des écarts
de l’analyse de la variance (tableau 9.2.2) peuvent être obtenues de la manière
suivante, à partir des données du tableau 3.2.1 :
SCE1 = 8.789,36 − 337,62 /13 = 22,15 , SCE2 = 9.062,96 − 355,42 /14 = 40,88 ,

SCE3 = 5.408,22 − 231,42 /10 = 53,62 , SCEr = 22,15 + 40,88 + 53,62 = 116,65 ,

SCEt = 23.260,54 − 924,42 /37 = 165,53 et SCEa = 165,53 − 116,65 = 48,88 .


Les autres éléments du tableau 9.2.2 découlent alors immédiatement de ces
différentes sommes des carrés des écarts et des effectifs des échantillons.

9.3 Les aspects inférentiels


⊕ 9.3.1 Principes généraux
1◦ En ce qui concerne les aspects inférentiels, l’analyse de la variance à un
critère de classification se présente sous la forme de deux modèles distincts.
246 ANALYSE DE LA VARIANCE À UN CRITÈRE 9.3.2

Le modèle fixe ou modèle I 12 , qui est le plus classique, a pour objet la com-
paraison d’un nombre limité p de populations, pour chacune desquelles peut être
prélevé un échantillon. Le modèle aléatoire ou modèle II 13 a trait, au contraire,
à la comparaison d’une infinité ou d’un très grand nombre (une quasi-infinité) de
populations, pour toutes lesquelles il n’est pas possible, en pratique, de prélever
chaque fois un échantillon.
Dans ce deuxième cas, l’échantillonnage est un échantillonnage à deux degrés
[STAT1, § 2.2.4.4◦ ]. Dans un premier temps, on choisit de façon complètement aléa-
toire un nombre réduit p de populations, et dans un deuxième temps, on choisit
un échantillon à l’intérieur de chacune de ces seules p populations.
Comme nous l’avons déjà signalé (§ 9.1.3◦ ), et cela pour les deux modèles, les
échantillons choisis au sein des p populations doivent être aléatoires, simples et
indépendants les uns des autres.
Dans l’interprétation des résultats fournis par le modèle aléatoire, on doit être
particulièrement attentif au fait qu’on ne s’intéresse pas spécifiquement aux p po-
pulations pour lesquelles on dispose d’observations. Ces quelques populations ne
sont en fait prises en considération que comme une image de l’ensemble plus vaste
des populations, en nombre infini ou quasi infini, au sujet duquel on s’interroge.
L’exemple 9.3.3 est une illustration de cette situation.
d D’autres modèles, intermédiaires ou plus généraux, ont également été proposés,
b mais sont très peu utilisés [Plackett, 1960].
2◦ Nous consacrerons les paragraphes 9.3.2 et 9.3.3 à ces deux modèles et nous
présenterons ensuite quelques compléments relatifs à l’application de ces modèles
à deux problèmes d’échantillonnage (§ 9.3.4), quelques autres compléments plus
mathématiques (§ 9.3.5), et quelques informations relatives aux méthodes non pa-
ramétriques et robustes, dont le test des rangs ou de Kruskal et Wallis (§ 9.3.6).
Une distinction sera faite également, à certains moments, entre le cas des échan-
tillons de même effectif, dit aussi équilibré 14 , et le cas des échantillons d’effectifs
inégaux, dit non équilibré 15 .

⊕ 9.3.2 Le modèle fixe


1◦ Pour le modèle fixe de l’analyse de la variance à un critère de classification,
nous désignerons par Xik les variables aléatoires qui correspondent aux valeurs
observées xik , par mi les moyennes des p populations, et par m une moyenne
générale, pondérée par les effectifs des échantillons :
p
1 X
m= (ni mi ) .
n. i=1
12 En anglais : fixed model, fixed effects model, model I.
13 En anglais : random model, random effects model, model II.
14 En anglais : balanced model.
15 En anglais : unbalanced model.
9.3.2 ASPECTS INFÉRENTIELS 247

2◦ Par analogie avec le modèle observé (§ 9.2.2.3◦ ), on peut définir un modèle


théorique, qui se présente comme suit :

Xik − m = (mi − m) + (Xik − mi ) ou Xik − m = ai + Dik ,

les quantités ai étant les écarts factoriels, non aléatoires, liés au facteur contrôlé,
et les quantités Dik les écarts résiduels, aléatoires, indépendants les uns des autres,
de moyenne nulle et de même variance σ 2 . Une autre écriture encore :

Xik = m + ai + Dik ,

met en évidence le fait que toute observation, aléatoire, peut être considérée comme
résultant de l’addition d’une moyenne générale, d’un effet non aléatoire dû au
facteur pris en considération, aussi appelé effet principal 16 , et d’un écart ou d’un
résidu 17 aléatoire relatif spécifiquement à l’individu envisagé.
On notera qu’en raison de leurs relations avec les moyennes, les effets princi-
paux ai sont de somme pondérée nulle :
p
X
(ni ai ) = 0 ,
i=1

et aussi, que c’est bien aux écarts résiduels Dik que s’appliquent les hypothèses
de normalité, d’égalité des variances et d’indépendance émises antérieurement
(§ 9.1.3◦ ).

3◦ Dans ces conditions, l’hypothèse nulle à laquelle on s’intéresse est à la fois


l’hypothèse d’égalité des moyennes et l’hypothèse de nullité des effets principaux :

H0 : m1 = m2 = . . . = mp ou a1 = a2 = . . . = ap = 0 .

4◦ En fonction du modèle théorique défini ci-dessus, on peut rechercher les


espérances mathématiques des sommes des carrés des écarts et des carrés moyens.
On obtient :
p p
1 X 1 X
E(CMt ) = σ + 2
(ni a2i ) , E(CMa ) = σ + 2
(ni a2i )
n. − 1 i=1 p − 1 i=1

et E(CMr ) = σ 2 .

La démonstration de ces différentes relations, qui ne fait intervenir que des


propriétés simples de l’espérance mathématique, est donnée au paragraphe 9.3.5.
16 En anglais : main effect.
17 En anglais : residual.
248 ANALYSE DE LA VARIANCE À UN CRITÈRE 9.3.2

Les espérances mathématiques ainsi obtenues montrent que le carré moyen


résiduel est toujours égal, en moyenne, à la variance théorique σ 2 , tandis que les
deux autres carrés moyens ne sont égaux, en moyenne, à cette variance que si
l’hypothèse d’égalité des moyennes est vraie. Dans tous les autres cas, ces carrés
moyens sont en moyenne supérieurs à σ 2 .

5◦ On peut aussi démontrer que, quand l’hypothèse nulle est vraie, les distri-
butions d’échantillonnage des différentes sommes des carrés des écarts sont, à la
constante σ 2 près, des distributions χ2 . Les variables :

χ2t = SCEt /σ 2 , χ2a = SCEa /σ 2 et χ2r = SCEr /σ 2 ,

sont en effet des variables χ2 dont les nombres de degrés de liberté sont ceux qui
ont été présentés au paragraphe 9.2.2.5◦ , à savoir n. − 1 , p − 1 et n. − p .
En outre, les deux dernières variables sont indépendantes l’une de l’autre, au
même titre que la moyenne, ou la différence de deux moyennes, et la variance sont
indépendantes l’une de l’autre dans le cas d’un ou de deux échantillons [STAT1,
§ 8.3.2.4◦ ].
La démonstration de ces différentes propriétés est également donnée au para-
graphe 9.3.5.

6◦ Sur base de ce qui vient d’être dit, le rapport des variables χ2a et χ2r , divisées
par leurs nombres de degrés de liberté :
£ 2 §±£ §
χa /(p − 1) χ2r /(n. − p) = CMa /CMr ,

est une variable F de Fisher-Snedecor, dont les nombres de degrés de liberté


sont p − 1 et n. − p [STAT1, § 6.9.2.1◦ ]. L’examen des espérances mathématiques
montre en outre que, quand l’hypothèse d’égalité des moyennes n’est pas vérifiée,
le rapport CMa /CMr fournit en moyenne des valeurs plus élevées que celles des
distributions de Fisher-Snedecor.
On peut alors procéder facilement au test et aux estimations, en fonction des
espérances mathématiques et des distributions d’échantillonnage.

7◦ Le test de l’hypothèse nulle émise ci-dessus nécessite le calcul de la quantité :

Fobs = CMa /CMr .

Le rejet de l’hypothèse, au niveau de probabilité α , intervient quand cette quantité


est trop élevée, c’est-à-dire quand :

P(F ≥ Fobs ) ≤ α ou Fobs ≥ F1−α ,

avec p − 1 et n. − p degrés de liberté. Le caractère unilatéral du test résulte de ce


que, dans tous les cas où l’hypothèse nulle est fausse, les valeurs Fobs dépassent
9.3.2 ASPECTS INFÉRENTIELS 249

en moyenne les valeurs que donnent normalement les distributions F de Fisher-


Snedecor.
Le rejet de l’hypothèse nulle, relative à un ensemble de p moyennes, soulève la
question de savoir quelles sont les moyennes qui diffèrent significativement les unes
des autres. Nous envisagerons cette question subsidiaire au cours du chapitre 12.

8◦ En matière d’estimations, on a, pour les moyennes des différentes popula-


tions et pour la variance commune aux différentes populations :

m
b i = x̄i et b2 = CMr ,
σ

ces estimateurs étant non biaisés.


En outre, on peut calculer comme suit des limites de confiance, pour les moyen-
nes mi et pour les différences de moyennes mi − mi0 :
p p
x̄i ± t1−α/2 CMr /ni et x̄i − x̄i0 ± t1−α/2 CMr (1/ni + 1/ni0 ) ,

la variable t de Student étant une variable à n. −p degrés de liberté. Ces formules


sont semblables à celles qui concernent une ou deux populations, la seule différence
étant que les estimations antérieures de la variance σ 2 sont remplacées ici par CMr
(§ 8.2.2.1◦ et 8.4.2.6◦ ).
Des limites de confiance relatives à la variance σ 2 et à l’écart-type σ peuvent
également être obtenues selon les procédures habituelles, à partir de la somme des
carrés des écarts ou du carré moyen résiduel, et grâce à la distribution χ2 à n. − p
degrés de liberté (§ 7.2.2.1◦ ).

d 9◦ Dans le test présenté ci-dessus, nous avons supposé implicitement que l’hy-
pothèse alternative H englobe toutes les situations où au moins une des égalités
définies par l’hypothèse nulle n’est pas vérifiée, et cela quel que soit le sens de la
ou des différences existant entre les moyennes.
On envisage parfois aussi des alternatives ordonnées 18 , pour lesquelles le sens
des différences éventuelles, ou de certaines d’entre elles, est spécifié a priori
[McDermott et Mudholkar, 1993 ; Miwa et al., 2000 ; Mudholkar et
McDermott, 1989]. Il peut s’agir par exemple de l’alternative suivante :

H : m1 ≤ m2 ≤ . . . ≤ mp ,

pour autant qu’elle comporte au moins une inégalité stricte. De telles hypothèses
alternatives correspondent à des ensembles non décroissants de moyennes.
D’autre part, comme dans le cas de deux populations (§ 8.4.2.8◦ ), le test d’éga-
lité des moyennes peut céder la place à un test d’équivalence des moyennes, dans
lequel l’hypothèse nulle n’implique pas que les moyennes sont toutes strictement
18 En anglais : ordered alternative.
250 ANALYSE DE LA VARIANCE À UN CRITÈRE 9.3.2

égales, mais bien que leur variance est inférieure ou égale à une certaine limite
suffisamment petite [Chen et al., 2000 ; Wellek, 2003] :
p
1X
H0 : (mi − m)2 ≤ ∆2 .
b p i=1

Exemple 9.3.1. Comparaison des hauteurs moyennes des arbres de trois types
de hêtraies : suite de l’analyse de la variance.
Nous pouvons maintenant clôturer l’analyse de la variance que nous avons
entamée à l’exemple 9.2.1.
À partir du tableau 9.2.2, on obtient :

Fobs = 24,44/3,431 = 7,12 et P(F ≥ 7,12) = 0,0026 ,

avec 2 et 34 degrés de liberté. L’hypothèse d’égalité des hauteurs moyennes des


arbres dans les trois types de hêtraies doit donc être rejetée, même au niveau de
probabilité 0,01 : les différences observées sont hautement significatives.
Les limites de confiance des différences sont (table II), pour un degré de con-
fiance égal à 0,95 , et pour les deux premiers types de forêts :
p
25,97 − 25,39 ± 2,032 3,431 (1/13 + 1/14) = 0,58 ± 1,45 = − 0,87 et 2,03 m ,

pour le premier et le troisième type de forêts :


p
25,97 − 23,14 ± 2,032 3,431 (1/13 + 1/10) = 2,83 ± 1,58 = 1,25 et 4,41 m ,

et pour les deux derniers types de forêts :


p
25,39 − 23,14 ± 2,032 3,431 (1/14 + 1/10) = 2,25 ± 1,56 = 0,69 et 3,81 m .

Le fait que le premier intervalle de confiance englobe la valeur zéro indique


qu’il n’y a pas de différence significative entre les deux premiers types de hêtraies,
ce qui était déjà la conclusion de l’exemple 8.4.1. On peut en conséquence calculer
éventuellement une moyenne globale pour l’ensemble de ces deux types :
£ §±
x̄12 = (337,6 + 355,4)/27 ou 13 (25,97) + 14 (25,39) 27 = 25,67 m ,

et déterminer des limites de confiance relatives à la différence entre cette nouvelle


moyenne et la moyenne du troisième type de forêts :
p
25,67 − 23,14 ± 2,032 3,431 (1/27 + 1/10) = 2,53 ± 1,39 = 1,14 et 3,92 m .

La conclusion finale serait ainsi qu’il n’y a pas de différence significative de hau-
teur des arbres entre les deux premiers types de hêtraies, qu’il existe au contraire
9.3.2 ASPECTS INFÉRENTIELS 251

une différence hautement significative de hauteur entre ces deux types et le troi-
sième, et que cette différence peut être estimée à 2,5 m , avec des limites de
confiance égales à 1,1 et 3,9 m , au degré de confiance habituel (1 − α = 0,95).
d En vue de tenir compte du fait qu’on procède en réalité à trois comparaisons,
dans la détermination des trois intervalles de confiance initiaux, on aurait pu
remplacer la valeur t classique (t0,975 = 2,032), par une valeur t définie au sens de
Bonferroni [STAT1, § 10.3.5.2◦ ] :

t1−0,05/6 = t0,99167 = 2,518 .

Cette façon de faire aurait conduit à étendre assez sensiblement les différents
b intervalles de confiance, sans modifier, dans le cas présent, les conclusions finales.

Exemple 9.3.2. Comparaison des hauteurs moyennes des arbres de trois types
de hêtraies : contrôle des conditions d’application de l’analyse de la variance.
Nous avons déjà examiné antérieurement les données de l’exemple précédent
sous l’angle du respect des conditions de normalité et d’égalité des variances. Il
nous paraı̂t cependant opportun de revoir globalement la question, en vue d’en
faire la synthèse et d’émettre certains suggestions qui peuvent être étendues à
l’ensemble du domaine d’application de l’analyse de la variance.
Dans un but purement didactique, nous avons en fait procédé à l’examen initial
des données, y compris l’étude des écarts réduits (exemple 2.3.1), vérifié la nor-
malité des distributions par la réalisation de diagrammes de probabilité (exemple
3.3.1), par le test de Shapiro et Wilk (exemple 3.3.3) et par le test de conformité
des coefficients de Pearson et de Fisher (exemple 3.4.1), recherché d’éventuel-
les observations aberrantes par la méthode de Grubbs (exemple 3.5.2), et vérifié
l’égalité des variances par les tests de Bartlett, de Hartley et de Levene
(exemple 7.5.1). Comme nous l’avons déjà signalé, l’emploi d’un tel ✭✭ arsenal ✮✮ de
méthodes ne se justifie bien sûr absolument pas en pratique.
Une procédure générale, applicable aux divers cas d’analyse de la variance, peut
consister par exemple en un examen initial des données tout à fait classique (§ 2.3.2
et 2.3.3), un contrôle rapide de la normalité des distributions par la méthode des
diagrammes de probabilité (§ 3.3.2), une identification des éventuelles observations
aberrantes par la méthode de Grubbs (§ 3.5.3), et un contrôle de l’égalité des
variances par la méthode de Levene (§ 7.5.2.6◦ et 7.5.3).
Dans cette optique, la méthode des diagrammes de probabilité peut être ap-
pliquée globalement aux résidus xik − x̄i ou aux résidus réduits correspondants,
l’identification des éventuelles observations aberrantes peut se faire à partir des
résidus réduits, et la méthode de Levene peut aussi être appliquée indifféremment
aux résidus ou aux résidus réduits.
Pour l’exemple considéré ici, les résidus et les résidus réduits de l’analyse de la
variance sont donnés dans le tableau 3.5.1, sous les appellations d’écarts et écarts
réduits par rapport aux moyennes. Le diagramme de probabilité correspondant est
252 ANALYSE DE LA VARIANCE À UN CRITÈRE 9.3.3

tout à fait comparable à celui de la figure 3.3.3. L’identification d’éventuelles obser-


vations aberrantes a été réalisée dans le cadre de l’exemple 3.5.2. Et la méthode de
Levene, dont nous avons déjà donné les résultats antérieurement (exemple 7.5.1),
consiste à effectuer une analyse de la variance portant sur les valeurs absolues des
résidus ou des résidus réduits. Le tableau 9.3.1 présente les résultats obtenus à
partir des résidus, la probabilité correspondant à la valeur 2,23 étant égale à 0,12 .

Tableau 9.3.1. Comparaison des hauteurs moyennes des arbres de trois types de
hêtraies : tableau d’analyse de la variance relatif aux valeurs absolues des résidus.

Degrés Sommes des carrés Carrés


Sources de variation F
de liberté des écarts moyens
Différences entre types de hêtraies 2 3,8003 1,9002 2,23
Différences entre observations
(dans les types de hêtraies) 34 29,0206 0,8535
Totaux 36 32,8209

Aucune anomalie importante, de non-normalité ou d’inégalité des variances,


ne met donc en cause le recours à l’analyse de la variance en vue de comparer les
hauteurs moyennes des arbres des trois types de hêtraies.
d La probabilité 0,12 est toutefois l’indice d’une certaine inégalité des variances.
Une solution qui tient compte de cet élément est envisagée au paragraphe 9.3.5,
b dans le cadre de l’exemple 9.3.7.

9.3.3 Le modèle aléatoire


1◦ Au cours du paragraphe 9.3.2, nous avons volontairement exposé en détail
le raisonnement relatif au modèle fixe d’analyse de la variance à un critère de
classification. Cela devrait nous permettre d’aller sensiblement plus vite pour le
modèle aléatoire et aussi, ultérieurement, pour l’analyse de la variance à deux et
plus de deux critères de classification. Nous nous contenterons en effet, à l’avenir,
de mettre en évidence les différences par rapport au modèle le plus simple et le
plus classique, en exposant seulement les principaux résultats.
2◦ Comme nous l’avons signalé au paragraphe 9.3.1.1◦ , dans le cas du modèle
aléatoire, les populations pour lesquelles des observations sont réalisées sont choi-
sies au hasard au sein d’un ensemble très vaste, infini ou quasi infini. Les moyennes
de ces populations doivent donc être considérées comme des variables aléatoires et
nous les désignerons par des lettres majuscules :
M1 , M2 , . . . , Mp .

En plus des hypothèses formulées antérieurement (§ 9.1.3◦ ), nous supposerons


que ces moyennes possèdent elles aussi une distribution normale, de moyenne m et
2
de variance σM , et que les écarts résiduels Dik sont indépendants de ces moyennes.
9.3.3 ASPECTS INFÉRENTIELS 253

La moyenne générale m est relative à l’ensemble infini ou quasi infini des popu-
lations considérées, et non pas à l’ensemble beaucoup plus limité des p populations
pour lesquelles on dispose d’observations.

3◦ Le modèle théorique s’écrit alors :

Xik − m = Ai + Dik ou Xik = m + Ai + Dik .

Dans ce modèle, les écarts factoriels :

Ai = Mi − m ,

sont également aléatoires, de distribution normale, de moyenne nulle et de varian-


2 2
ce σA , égale à σM :
2 2
mA = 0 et σA = σM .

Ces écarts factoriels sont aussi indépendants des écarts résiduels Dik .

4◦ En fonction de ce modèle, les espérances mathématiques des carrés moyens


définis au paragraphe 9.2.2.6◦ sont :

E(CMt ) = σ 2 + n0 (p − 1) σA
2
/(n. − 1) , E(CMa ) = σ 2 + n0 σA
2

et E(CMr ) = σ 2 ,

2
σA et σ 2 étant les deux variances, respectivement entre les populations et dans
les populations, et la quantité n0 étant définie de la manière suivante, à partir des
effectifs des échantillons et de l’effectif total :
≥ p
X ¥.£ §
0 2
n = n. − n2i n. (p − 1) .
i=1

Quand les échantillons sont de même effectif, la quantité n0 est égale à l’effectif
commun n .
Nous donnerons la démonstration de ces différentes propriétés au paragra-
phe 9.3.5.

5◦ Les distributions d’échantillonnage et la réalisation du test d’hypothèse se


présentent exactement comme dans le cas du modèle fixe.
Toutefois, l’hypothèse à tester est sensiblement différente. Elle s’écrit ici :
2 2
H0 : σM = 0 ou σA = 0.

La nullité de la variance des moyennes Mi , ou de la variance des effets princi-


paux Ai , implique l’égalité des moyennes de toutes les populations considérées,
254 ANALYSE DE LA VARIANCE À UN CRITÈRE 9.3.3

et non pas seulement des moyennes des p populations pour lesquelles on dispose
d’observations. L’hypothèse nulle concerne donc bien l’infinité ou la quasi-infinité
des populations prises en considération.

6◦ Dans le cas du modèle aléatoire, les problèmes d’estimation concernent


2
essentiellement les variances σA et σ 2 , aussi appelées composantes de la varian-
19
ce , et les écarts-types correspondants. Les espérances mathématiques des carrés
moyens montrent que des estimations non biaisées peuvent être obtenues à l’aide
des relations suivantes :
2
σ
bA = (CMa − CMr )/n0 et b2 = CMr ,
σ

en se limitant aux situations où le carré moyen factoriel CMa est supérieur au
carré moyen résiduel CMr .
d On notera qu’il s’agit en fait d’estimations basées sur le principe de la méthode

b des moments [STAT1, § 9.3.3.2 ].

7◦ Comme pour le modèle fixe, des limites de confiance peuvent être détermi-
nées facilement pour σ 2 , par les formules habituelles (§ 9.3.2.8◦ ).
2
Le problème est plus délicat pour σA . Une solution approchée et relativement
simple est fournie par les expressions suivantes, dans le cas des effectifs égaux :

(p − 1) CMr (Fobs − F1−α/2 )/(n χ21−α/2 ) et (p − 1) CMr (Fobs − Fα/2 )/(n χ2α/2 ) ,

la variable F possédant p − 1 et n. − p degrés de liberté et la variable χ2 ayant


p − 1 degrés de liberté [Boardman, 1974].
Cette approximation peut être étendue au cas des effectifs inégaux en rem-
plaçant n par la moyenne harmonique n00 des effectifs ni :
p
00
±X 1
n =p ,
n
i=1 i

0
et Fobs par une valeur modifiée Fobs définie de la manière suivante :
0
±£ §
Fobs = n00 SCEx̄i (p − 1) CMr ,

SCEx̄i étant la somme des carrés des écarts non pondérée des moyennes x̄i [Tho-
mas et Hultquist, 1978].
On remarquera que ces expressions peuvent donner des résultats négatifs. On
peut éviter cet inconvénient en remplaçant les valeurs négatives par zéro, mais
cette solution conduit à certains biais, relativement importants quand les carrés
moyens CMa et CMr sont peu différents l’un de l’autre.
19 En anglais : variance component.
9.3.3 ASPECTS INFÉRENTIELS 255

d 8◦ Un problème connexe est celui de la recherche de limites de confiance pour


2
le rapport σA /σ 2 . De telles limites peuvent être déduites de la double inégalité :

CMa /(σ 2 + n0 σA
2
)
Fα/2 < < F1−α/2 ,
CMr /σ 2

puisque la partie centrale de cette inégalité est toujours une valeur observée d’une
variable de Fisher-Snedecor, même si l’hypothèse nulle est fausse.
2
On obtient ainsi, comme limites de confiance de σA /σ 2 :

(Fobs /F1−α/2 − 1)/n0 et (Fobs /Fα/2 − 1)/n0 ,

b les nombres de degrés de liberté de la variable F étant encore p − 1 et n. − p .

d 9◦ Le modèle aléatoire d’analyse de la variance à un critère de classification


intervient en particulier en génétique quantitative 20 . La variation totale est alors
souvent qualifiée de variation phénotypique 21 , la variation factorielle de variation
génotypique ou génétique 22 , et la variation résiduelle est parfois appelée variation
environnementale 23 .
Dans cette optique, l’héritabilité 24 est le rapport de la variation génétique à
la variation phénotypique. Elle correspond au quotient CMa /CMt . Ce concept
peut être mis en relation aussi avec la notion de corrélation intraclasse [STAT1,
§ 4.6.3.7◦ ].
Des informations complémentaires sont fournies notamment par Donner
b [1986] et Jacquard [1983].

d 10◦ En réalité, les problèmes d’estimation des composantes de la variance et de


détermination de leurs limites de confiance dépassent très largement ce que nous
venons d’en exposer, en particulier pour les échantillons d’effectifs inégaux. Nous
reviendrons ultérieurement sur ce sujet, en donnant un certain nombre d’infor-
mations et de références bibliographiques générales (§ 16.4.5). Mais des solutions
particulières ont aussi été envisagées dans le cas du modèle aléatoire à un critère
de classification [Hartung et Knapp, 2005 ; Lee et Khuri, 2002 ; Li et Li, 2007 ;
Rao, 2001].
2
D’autre part, le test de nullité de la composante de la variance σA peut éven-
tuellement être généralisé, en devenant un test de conformité à une valeur positive
quelconque σ02 [Chistensen et al., 2007 ; Hartung et Argaç, 2002]. L’hypothèse
nulle est alors :
2
b H0 : σA = σ02 .
20 En anglais : quantitative genetics.
21 En anglais : phenotypic variation.
22 En anglais : genotypic variation, genetic variation.
23 En anglais : environmental variation.
24 En anglais : heritability.
256 ANALYSE DE LA VARIANCE À UN CRITÈRE 9.3.3

Exemple 9.3.3. Étude de l’homogénéité des rendements fourragers d’un ensemble


de prairies : analyse de la variance.
On s’intéresse à l’ensemble des prairies d’une région donnée et on souhaite
identifier l’importance, absolue ou relative, de la variabilité de la production four-
ragère, d’une part d’une prairie à l’autre, et d’autre part d’un endroit à l’autre à
l’intérieur des différentes prairies. Dans ce but, on a tout d’abord choisi au hasard
trois prairies dans l’ensemble du territoire considéré, puis au sein de chacune de
ces trois prairies, cinq petites parcelles de 2 m2 [Calembert, 1962]. Dans l’op-
tique d’un échantillonnage à deux degrés [STAT1, § 2.2.4.4◦ ], les trois prairies
constituent trois unités du premier degré et les 15 petites parcelles 15 unités du
deuxième degré.
Dans chacune des 15 parcelles, on a mesuré les rendements en matière sèche à
une date donnée. Les valeurs observées, exprimées en tonnes par hectare, figurent
dans le tableau 9.3.2 et les résultats de l’analyse de la variance dans le tableau 9.3.3.

Tableau 9.3.2. Étude de l’homogénéité des rendements fourragers d’un ensemble


de prairies : rendements observés, en tonnes de matière sèche par hectare.

Parcelles Prairie 1 Prairie 2 Prairie 3


1 2,06 1,59 1,92
2 2,99 2,63 1,85
3 1,98 1,98 2,14
4 2,95 2,25 1,33
5 2,70 2,09 1,83

Tableau 9.3.3. Étude de l’homogénéité des rendements fourragers d’un ensemble


de prairies : tableau d’analyse de la variance.

Degrés Sommes des carrés Carrés


Sources de variation F
de liberté des écarts moyens
Différences entre prairies 2 1,3182 0,6591 4,23 *
Différences entre parcelles
(dans les prairies) 12 1,8711 0,1559
Totaux 14 3,1893

La probabilité de dépasser la valeur 4,23 étant égale à 0,041 , pour une va-
riable F de Fisher-Snedecor à 2 et 12 degrés de liberté, les différences entre
prairies doivent être considérées comme juste significatives. C’est ce qu’indique
d’ailleurs l’astérisque qui est associée, conventionnellement, à la valeur Fobs .
On peut alors procéder comme suit aux estimations des composantes de la
variance :
2
σ
bA b2 = 0,1559 .
= (0,6591 − 0,1559)/5 = 0,1006 et σ
9.3.4 ASPECTS INFÉRENTIELS 257

En termes d’écarts-types, on observe donc une variabilité de 0,32 t/ha d’une prai-
rie à l’autre, et de 0,39 t/ha d’une parcelle à l’autre à l’intérieur des différentes
prairies.
Les différences entre prairies n’étant que juste significatives, on doit s’attendre
à ce que la première estimation soit très peu précise. Pour un degré de confiance
égal à 0,95 , on obtient en effet, comme limites de confiance (tables III et IV) :
±£ §
2 (0,1559) (4,23 − 5,10) 5 (7,38) = − 0,0074 ,
±£ §
et 2 (0,1559) (4,23 − 0,0254) 5 (0,0506) = 5,18 ,

soit, en remplaçant la valeur négative par zéro et en termes d’écart-type :

0 et 2,28 t/ha .

La deuxième estimation est par contre nettement meilleure, les limites de confiance
étant, dans les mêmes conditions (table III) :

1,8711/23,3 = 0,080 et 1,8711/4,40 = 0,425 ,

soit aussi, en termes d’écart-type :

0,28 et 0,65 t/ha .

Comme nous l’avons indiqué ci-dessus, on pourrait également rechercher les


2
limites de confiance du rapport σA /σ 2 , et donc du rapport des écarts-types σA /σ .
On constaterait que les intervalles de confiance ainsi définis sont, eux aussi, extrê-
mement étendus.
En ce qui concerne les conditions d’application, les résidus de l’analyse de la
variance permettent de réaliser des vérifications semblables à celles dont il a été
question à l’exemple 9.3.2. Toutes sont largement satisfaisantes.

9.3.4 Application à différents problèmes d’échantillonnage


1◦ Au cours des paragraphes précédents, nous avons envisagé l’analyse de la
variance à un critère de classification dans l’optique habituelle de la comparaison
des moyennes des différentes populations considérées. Nous voudrions en examiner
aussi les utilisations possibles dans le cas de deux méthodes d’échantillonnage
parmi les plus courantes, à savoir l’échantillonnage stratifié et l’échantillonnage à
deux degrés, et subsidiairement dans le cas de l’estimation d’une même moyenne,
commune à deux ou plusieurs populatons.

2◦ L’échantillonnage stratifié a pour principe de subdiviser la population à


laquelle on s’intéresse en plusieurs parties, appelées strates, au sein desquelles
on prélève des échantillons indépendants [STAT1, § 2.2.4.3◦ ]. Ce type d’échantil-
lonnage peut être assimilé au cas du modèle fixe d’analyse de la variance, si on
258 ANALYSE DE LA VARIANCE À UN CRITÈRE 9.3.4

considère que les différentes strates de l’échantillonnage correspondent aux dif-


férentes populations de l’analyse de la variance, et que la population globale à
laquelle on s’intéresse est constituée de l’ensemble des populations de l’analyse de
la variance. Le but poursuivi n’est plus de comparer les moyennes mi des différentes
populations ou strates, mais bien d’estimer la moyenne générale m .

3◦ Dans le cas d’un échantillonnage aléatoire et simple à l’intérieur des strates


et pour autant que les effectifs des différents échantillons soient proportionnels aux
effectifs ou aux étendues des différentes strates, cette moyenne peut être estimée
sans biais par la moyenne générale observée x̄ :

p ni
1 XX
m
b = x̄ = xik .
n. i=1
k=1

Dans les conditions définies au paragraphe 9.1.3◦ , les limites de confiance sui-
vantes peuvent être associées à cette estimation :
p
x̄ ± t1−α/2 CMr /n. ,

la variable t étant une variable de Student à n. − p degrés de liberté, c’est-à-dire


le nombre de degrés de liberté de CMr .
d L’application du modèle théorique de l’analyse de la variance permet en effet
de montrer que la variance de la moyenne générale est égale à σ 2 /n. , et CMr est
2 ◦ ◦
b bien une estimation non biaisée de σ (§ 9.3.2.2 et 9.3.2.8 ).

4◦ C’est donc du carré moyen résiduel CMr , et non pas du carré moyen total
CMt , que dépend la précision de l’estimation de m . S’il existe des différences entre
strates, le carré moyen résiduel est en moyenne inférieur au carré moyen total,
et l’échantillonnage stratifié est en conséquence plus précis que l’échantillonnage
complètement aléatoire. L’efficacité relative de l’un par rapport à l’autre est donnée
par le quotient CMt /CMr .
Le gain de précision de l’échantillonnage stratifié par rapport à l’échantillon-
nage complètement aléatoire est d’autant plus grand que ce quotient est élevé,
c’est-à-dire aussi d’autant plus grand que le carré moyen factoriel et donc les dif-
férences entre les moyennes des strates sont importants.

5◦ Comme nous l’avons rappelé en présentant le problème considéré dans


l’exemple 9.3.3, l’échantillonnage à deux degrés a, au contraire, pour principe
d’effectuer deux échantillonnages successifs, à deux niveaux différents [STAT1,
§ 2.2.4.4◦ ]. Ce type d’échantillonnage peut être assimilé au modèle aléatoire d’ana-
lyse de la variance, si on considère que les unités du premier degré correspondent
aux différentes populations de l’analyse de la variance, que les unités du deuxième
degré correspondent aux observations de l’analyse de la variance, et que la popula-
tion globale à laquelle on s’intéresse correspond à l’ensemble infini ou quasi infini
9.3.4 ASPECTS INFÉRENTIELS 259

des populations de l’analyse de la variance. Le but poursuivi est ici également


d’estimer la moyenne générale m .

6◦ Nous n’envisageons ce problème que dans le cas d’effectifs ni égaux (nombre


constant n d’unités du deuxième degré, pour les différentes unités du premier
degré). On a alors, dans les mêmes conditions que ci-dessus :
p
m
b = x̄ et x̄ ± t1−α/2 CMa /(n p) ,

la variable t possédant p − 1 degrés de liberté, c’est-à-dire le nombre de degrés de


liberté de CMa .
d L’application du modèle théorique de l’analyse de la variance permet en effet
2
de montrer que la variance de la moyenne générale est égale à (n σA + σ 2 )/(n p),
2 2
et la quantité n σA + σ est précisément l’espérance mathématique du carré moyen
◦ ◦
b factoriel (§ 9.3.3.2 et 9.3.3.4 ).

7◦ Cette fois, la précision de l’estimation de la moyenne générale est fonction du


carré moyen factoriel, dont on sait qu’il est en moyenne supérieur ou égal au carré
moyen total (§ 9.3.3.4◦ ). D’une façon générale, la précision de l’échantillonnage à
deux degrés est donc inférieure à la précision de l’échantillonnage complètement
aléatoire, et la perte de précision est d’autant plus importante que les unités du
premier degré sont plus différentes les unes des autres. Cette perte de précision
est le prix à payer pour pouvoir utiliser une méthode d’échantillonnage qui est
généralement moins coûteuse ou qui demande moins de temps.

d 8◦ Un problème comparable aux deux précédents est celui de l’estimation d’une


même moyenne, commune 25 à deux ou plusieurs populations. Ce problème se
présente en particulier quand des analyses relatives à une même caractéristique
sont réalisées par différentes méthodes ou à l’aide de différents appareils de mesure,
ou encore dans différents laboratoires, et qu’il s’impose de combiner l’ensemble
des résultats en vue d’obtenir une seule estimation de moyenne. Diverses solutions
sont envisagées notamment par Krishnamoorthy et Lu [2003], Mitra et Sinha
b [2007], et Pal et et al. [2007].

Exemple 9.3.4. Estimation de la hauteur moyenne des arbres d’un ensemble de


forêts : échantillonnage stratifié.
Nous reprenons à nouveau les données de l’exemple 2.3.1, non plus dans l’op-
tique de la comparaison des trois types de forêts, mais bien dans l’optique de
l’estimation de la moyenne générale de la hauteur des arbres, pour l’ensemble des
trois types.
La hauteur étant une bonne caractéristique de la productivité des forêts, il
peut en effet se justifier pleinement de vouloir en estimer la valeur moyenne, pour
25 En anglais : common mean.
260 ANALYSE DE LA VARIANCE À UN CRITÈRE 9.3.4

l’ensemble du territoire considéré. En outre, si on a connaissance de l’existen-


ce de différents types de forêts, auxquels peuvent correspondre différentes hau-
teurs moyennes, il se justifie également de tenir compte de cette information dans
l’organisation de l’échantillonnage. Il est donc naturel, dans une telle situation,
de prévoir un échantillonnage stratifié, les différentes strates correspondant aux
différents types qui peuvent être identifiés.
Pour autant que les nombres d’observations par type de forêts soient propor-
tionnels aux étendues des différents types, l’échantillonnage stratifié donne, comme
estimation de la moyenne générale :
m
b = x̄ = 24,98 ou 25,0 m ,
comme erreur standard de cette moyenne (tableau 9.2.2) :
p
3,431/37 = 0,30 ou 0,3 m ,
et comme limites de confiance de cette moyenne, pour un degré de confiance égal
à 0,95 et avec 34 degrés de liberté (table II) :
p
24,98 ± 2,032 3,431/37 = 24,98 ± 0,62 ou 24,4 et 25,6 m .

L’efficacité relative de cet échantillonnage, par rapport à l’échantillonnage com-


plètement aléatoire, est (exemple 9.2.1) :
4,598/3,431 = 134 % .
Cette valeur signifie que l’échantillonnage stratifié apporte dans ce cas un sup-
plément d’information d’environ 34 %, par comparaison avec l’échantillonnage
complètement aléatoire.
En d’autres termes, le recours à l’échantillonnage stratifié donne une informa-
tion complémentaire équivalente à celle que fourniraient des observations réalisées
en 12 ou 13 endroits supplémentaires sur le terrain, ce qui revient aussi à dire que
les 37 points d’observation de l’échantillonnage stratifié sont équivalents à 49 ou
50 points d’observation d’un échantillonnage complètement aléatoire.

Exemple 9.3.5. Estimation de la production fourragère moyenne d’un ensemble


de prairies : échantillonnage à deux degrés.
De même, nous reprenons les données de l’exemple 9.3.3, pour illustrer la ques-
tion de l’estimation d’une moyenne générale par échantillonnage à deux degrés.
Il peut en effet se justifier, ici également, de vouloir estimer la moyenne générale
de la production fourragère d’un vaste ensemble de prairies et, à cette fin, pour
des raisons de facilité, on peut être tenté de concentrer la collecte des observations
dans un petit nombre de prairies, par échantillonnage à deux degrés.
Cet échantillonnage à deux degrés donne, comme estimation de la moyenne
générale :
m
b = x̄ = 2,153 ou 2,15 t/ha ,
9.3.5 ASPECTS INFÉRENTIELS 261

comme erreur standard de cette moyenne (tableau 9.3.3) :


p
0,6591/15 = 0,210 ou 0,21 t/ha ,

et comme limites de confiance de cette moyenne, toujours pour un degré de con-


fiance égal à 0,95 et avec deux degrés de liberté (table II) :
p
2,153 ± 4,303 0,6591/15 = 2,153 ± 0,902 ou 1,25 et 3,05 t/ha .

La perte de précision, par comparaison avec un échantillonnage complètement


aléatoire, est considérable. En effet, si on avait effectué 15 observations entièrement
indépendantes les unes des autres, dans l’ensemble de toutes les prairies envisagées,
et si on avait observé les mêmes rendements, on aurait eu comme erreur standard
de la moyenne générale :
p
0,2278/15 = 0,123 ou 0,12 t/ha ,

et comme limites de confiance de cette moyenne :


p
2,153 ± 2,145 0,2278/15 = 2,153 ± 0,264 ou 1,89 et 2,42 t/ha ,

soit donc un intervalle de confiance plus de trois fort plus court.


La perte de précision liée à l’échantillonnage à deux degrés résulte non seule-
ment de la substitution du carré moyen factoriel au carré moyen total (0,6591 au
lieu de 0,2278), mais aussi de la réduction importante du nombre de degrés de
liberté de la variable t (2 au lieu de 14), et en conséquence, de l’augmentation
sensible de la valeur t0,975 (4,303 au lieu de 2,145). Nous verrons ultérieurement
comment il aurait été possible de limiter fortement cette perte de précision, tout
en effectuant malgré tout un même type d’échantillonnage (exemple 9.4.4).

9.3.5 Quelques notions complémentaires


1◦ Nous introduisons ici quelques notions complémentaires, à savoir la relation
qui existe entre l’analyse de la variance à un critère de classification et le test t de
Student, une extension de l’analyse de la variance comparable au test de Welch,
et un ensemble de démonstrations relatives aux espérances mathématiques et aux
distributions d’échantillonnage des carrés moyens.

2◦ La relation entre l’analyse de la variance et le test de Student revient à dire


que, pour deux populations, l’analyse de la variance à un critère de classification
est toujours strictement équivalente au test t bilatéral (§ 8.4.2.1◦ ). Les deux mé-
thodes conduisent en effet à des conclusions identiques, car les valeurs Fobs et F1−α
de l’analyse de la variance sont égales, respectivement, aux carrés des valeurs tobs
et t1−α/2 du test t , les probabilités associées aux valeurs tobs et Fobs étant elles
aussi égales.
262 ANALYSE DE LA VARIANCE À UN CRITÈRE 9.3.5

d On peut justifier cette propriété en considérant l’analyse de la variance dans le


cas particulier de deux populations. La moyenne générale x̄ et la somme des carrés
des écarts factorielles SCEa sont alors :

x̄ = (n1 x̄1 + n2 x̄2 )/(n1 + n2 ) et SCEa = n1 (x̄1 − x̄)2 + n2 (x̄2 − x̄)2 .

En remplaçant x̄ par sa valeur dans cette dernière relation, on obtient :

SCEa = n1 n2 (x̄1 − x̄2 )2 /(n1 + n2 ) ,


et aussi :
n1 n2 (x̄1 − x̄2 )2 /(n1 + n2 ) (x̄1 − x̄2 )2
Fobs = = = t2obs .
SCEr /(n1 + n2 − 2) SCE1 + SCE2 ≥ 1 1¥
+
n1 + n2 − 2 n1 n2

Comme on peut établir également que [STAT1, § 6.9.2.2◦ ] :

F1−α = t21−α/2 ,

b les deux méthodes sont bien strictement équivalentes.

d 3◦ D’autre part, différentes solutions, autres que le recours à des transforma-


tions de variables (chapitre 4), ont été proposées pour pouvoir procéder à l’analyse
de la variance quand les populations-parents sont de variances inégales [Argaç,
2004 ; Krishnamoorthy et al., 2007 ; Lee et Ahn, 2003].
Ces solutions impliquent en général un ajustement du nombre de degrés de
liberté relatif au carré moyen résiduel, dans une optique comparable à celle de la
méthode de Welch pour deux populations (§ 8.4.2.3◦ ), et en se basant également
sur la formule de Satterthwaite (§ 11.2.3.10◦ ). Mais certaines de ces solutions
imposent en outre une modification du mode de calcul de la valeurs Fobs de la
variable de Fisher-Snedecor.
Une solution simple et relativement équilibrée consiste à ne modifier que le
nombre de degrés de liberté du carré moyen résiduel, en appliquant la version
généralisée suivante de la formule de Welch :
h SCE SCEp i2
1
+ ... +
n1 (n1 − 1) np (np − 1)
.
1 h SCE1 i2 1 h SCEp i2
+ ... +
n1 − 1 n1 (n1 − 1) np − 1 np (np − 1)

L’utilisation de transformations de variables nous paraı̂t néanmoins préférable


b chaque fois qu’elle est possible.

d 4◦ En ce qui concerne la recherche des espérances mathématiques des carrés


moyens (§ 9.3.2.4◦ et 9.3.3.4◦ ), nous traitons pour commencer le cas de la compo-
sante résiduelle.
9.3.5 ASPECTS INFÉRENTIELS 263

On a, pour chacun des p échantillons [STAT1, § 8.3.2.2◦ ] :

E(SCEi ) = (ni − 1) σ 2 .

Il en résulte que, pour la somme des carrés des écarts résiduelle, qui n’est autre
que la somme des p quantités SCEi , et pour le carré moyen résiduel, on a :
p
X £ §
E(SCEr ) = (ni − 1) σ 2 = (n. − p) σ 2 et E(CMr ) = σ 2 .
i=1

Cette démonstration s’applique indifféremment au modèle fixe et au modèle


b aléatoire d’analyse de la variance.

d 5◦ Quant à la composante factorielle, on peut écrire :


p
X p p p
£ 2
§ X 2
X
2
X
SCEa = ni (x̄i − x̄) = (ni x̄i ) + (ni x̄ ) − 2 (ni x̄i x̄) ,
i=1 i=1 i=1 i=1

c’est-à-dire aussi, après simplification :


p
X
SCEa = (ni x̄2i ) − n. x̄2 .
i=1

Dans le cas du modèle fixe, on a en outre, en désignant par X̄i et X̄ les variables
aléatoires qui correspondent respectivement aux moyennes x̄i et x̄ :

1 X
ni ≥ 1 X
ni ¥2
X̄i = m + ai + Dik et X̄i2 = m + ai + Dik .
ni ni
k=1 k=1

En développant X̄i2
, qui est le carré d’une somme de 2 + ni termes, en une somme
de carrés et de doubles produits, en appliquant les propriétés relatives à l’espérance
mathématique des sommes et des produits de variables aléatoires [STAT1, § 5.7.2],
et en se souvenant du fait que la somme des produits ni ai est nulle tandis que
2
l’espérance mathématique de Dik et l’espérance mathématique de Dik sont res-
2
pectivement nulle et égale à σ , on obtient :
hX
p i p
X
E(X̄i2 ) =m 2
+a2i +σ 2 /ni +2 m ai et E 2 2
(ni X̄i ) = n. m + (ni a2i )+p σ 2 .
i=1 i=1

Un raisonnement analogue relatif à X̄ conduit aux résultats suivants :

1 X
p
1 XX
p ni ≥ 1 XX
p ni ¥2
X̄ = m + (ni ai ) + Dik , X̄ 2 = m + Dik
n. i=1 n. i=1 n. i=1
k=1 k=1

et E(X̄ 2 ) = m2 + σ 2 /n. .
264 ANALYSE DE LA VARIANCE À UN CRITÈRE 9.3.5

Il en découle que :
p
X p
X
E(SCEa ) = n. m2 + (ni a2i ) + p σ 2 − n. m2 − σ 2 = (p − 1) σ 2 + (ni a2i ) ,
i=1 i=1

et on en déduit facilement les relations données au paragraphe 9.3.2.4◦ , pour le


b carré moyen factoriel et pour le carré moyen total.

d 6◦ La situation n’est pas la même pour le modèle aléatoire, en raison du fait


que les constantes ai cèdent la place à des variables aléatoires Ai , de moyennes
2
nulles et de variance σA , indépendantes entre elles et indépendantes des Dik .
Selon des principes tout à fait semblables, on obtient successivement dans ce
cas :
hX
p i
E(X̄i2 ) = m2 + σA
2
+ σ 2 /ni , E (ni X̄i2 ) = n. m2 + n. σA
2
+ p σ2 ,
i=1

≥ 1
p
X 1
p X
X ni ¥2 2 X
σA
p
2 2 2
X̄ = m + (ni Ai ) + Dik , E(X̄ ) = m + 2 n2 + σ 2 /n.
n. i=1
n. i=1 k=1
n. i=1 i

2 Xp
σA
et E(SCEa ) = n. m + 2 2
n. σA 2
+ p σ − n. m − 2
n2 − σ 2
n. i=1 i
≥ 1 X 2¥ 2
p
= (p − 1) σ 2 + n. − n σ .
n. i=1 i A


b Les relations du paragraphe 9.3.3.4 en découlent immédiatement.

d 7◦ Quant aux distributions d’échantillonnage des carrés moyens, on peut noter


tout d’abord que, dans les conditions du paragraphe 9.1.3◦ , et si les moyennes mi
sont égales entre elles, et donc égales à m , les n. variables Xik sont toutes des
variables normales indépendantes de même moyenne m et de même variance σ 2 .
Leur somme des carrés d’écarts par rapport à la moyenne générale, qui n’est autre
que la somme des carrés des écarts totale, divisée par σ 2 , est alors une variable χ2
à n. − 1 degrés de liberté [STAT1, § 8.3.2.5◦ ].
De même, pour les différents échantillons considérés individuellement, et cette
fois indépendamment du fait que les moyennes mi sont égales ou non, les sommes
des carrés des écarts SCEi permettent de définir p variables χ2 à ni − 1 degrés de
liberté :
χ2i = SCEi /σ 2 .

Ces variables étant indépendantes les unes des autres, puisque les échantillons
sont eux-mêmes indépendants les uns des autres, leur somme, c’est-à-dire aussi la
somme des carrés des écarts résiduelle divisée par σ 2 , est une variable χ2 à n. − p
degrés de liberté [STAT1, § 6.8.1.3◦ ].
9.3.6 ASPECTS INFÉRENTIELS 265

Enfin, par une procédure analogue à celle qui intervient dans la recherche
de la distribution d’échantillonnage de la variance [STAT1, § 8.3.2.5◦ ], on peut
démontrer que la différence entre χ2t et χ2r , c’est-à-dire la somme des carrés des
écarts factorielle divisée par σ 2 , est elle aussi une variable χ2 , à p − 1 degrés de
b liberté, à condition à nouveau que toutes les moyennes mi soient égales.

Exemple 9.3.6. Comparaison des hauteurs moyennes des arbres de deux types
de hêtraies : analyse de la variance.
Pour illustrer la relation qui existe entre l’analyse de la variance à un critère
de classification et le test t , il suffit de traiter les données de l’exemple 8.4.1 par
l’analyse de la variance. On obtient ainsi :

Fobs = 0,91 ,

avec 1 et 25 degrés de liberté, et cette valeur est bien le carré de :

tobs = 0,95 .

On peut vérifier également que la valeur F0,95 (soit 4,24) est égale au carré de
t0,975 (soit 2,06), ou encore que, dans les deux cas, la probabilité correspondant
aux valeurs observées est égale à 0,35 .

d Exemple 9.3.7. Comparaison des hauteurs moyennes des arbres de trois types de
hêtraies : analyse de la variance avec variances quelconques.
Pour les données des exemples 9.2.1 et 9.3.1, sans hypothèse d’égalité des va-
riances et dans l’optique d’un ajustement du nombre de degrés de liberté selon le
principe du test de Welch, on obtient, pour la somme des carrés des écarts et le
carré moyen résiduels, la valeur :

(22,15/156 + 40,88/182 + 53,62/90)2


= 21 ,
(22,15/156)2 /12 + (40,88/182)2 /13 + (53,62/90)2 /9

au lieu de 34 .
La probabilité associée à la valeur Fobs serait alors égale à 0,0044 , au lieu de
0,0026 , et la conclusion de l’analyse de la variance ne serait donc pas modifiée.
La réduction relativement importante du nombre de degrés de liberté est liée
au fait que la variance observée la plus élevée est relative à l’échantillon d’effectif
b le plus réduit.

9.3.6 Les méthodes non paramétriques et robustes


1◦ Comme dans le cas de deux populations (§ 8.4.3.1◦ ), le test non paramétri-
que utilisé le plus couramment pour comparer p populations est un test basé sur
266 ANALYSE DE LA VARIANCE À UN CRITÈRE 9.3.6

les rangs. Ce test est connu sous le nom de test de Kruskal et Wallis 26 , et il
constitue une généralisation du test de Mann et Whitney ou de Wilcoxon.

2◦ Ce test nécessite le classement de l’ensemble des n. observations par ordre


croissant, la détermination des rangs des différentes observations, le calcul des
sommes des rangs Xi. , relatives aux p échantillons, et la détermination de la
quantité :
Xp
12
χ2obs = (X 2 /ni ) − 3 (n. + 1) .
n. (n. + 1) i=1 i.

Quand l’hypothèse d’égalité des moyennes, ou des médianes, est vraie, cette
quantité est approximativement une valeur observée d’une variable χ2 de Pearson
à p − 1 degrés de liberté, et l’hypothèse d’identité des distributions des p popu-
lations-parents doit en conséquence être rejetée, au niveau de probabilité α , si :
P(χ2 ≥ χ2obs ) ≤ α ou χ2obs ≥ χ21−α ,
le test étant unilatéral.
L’approximation est satisfaisante dès qu’on dispose d’un total de 15 à 20 obser-
vations au moins et des tables particulières sont disponibles pour des effectifs plus
limités. De telles tables, de même que des procédures de calcul, qui sont intégrées
dans divers logiciels, peuvent être trouvées dans les principaux ouvrages relatifs
aux méthodes non paramétriques et dans les publications de Di Bucchianico et
van de Wiel [2005], Iman et al. [1975], et Owen [1962].

d 3◦ On notera que la quantité χ2obs est à un facteur près le carré moyen factoriel
qu’on obtiendrait en soumettant les rangs à l’analyse de la variance. La somme
des carrés des écarts factorielle serait en effet, pour les rangs (§ 9.2.3.4◦ ) :
p
X p
X
£ §2 ±
SCEa = (Xi.2 /ni ) − n. (n. + 1)/2 n. = (Xi.2 /ni ) − n. (n. + 1)2 /4 .
i=1 i=1

D’autre part, dans le cas de deux populations, la valeur χ2obs du test de Krus-
kal et Wallis est aussi le carré de la quantité uobs relative au test de Mann et
b Whitney ou de Wilcoxon, ce qui rend les deux tests strictement équivalents.
4◦ Des commentaires semblables à ceux des paragraphes 8.4.3.4◦ , 8.4.3.5◦ et
8.4.3.6◦ peuvent également être formulés ici.
C’est ainsi qu’une correction doit être apportée en présence d’ex aequo, pour
autant que ceux-ci soient particulièrement nombreux. Cette correction se réalise
alors en divisant la valeur χ2obs par :
nX£ §o±£ §
1− k (k2 − 1) n. (n2. − 1) ,

26 En anglais : Kruskal-Wallis’s test.


9.4.1 PUISSANCE ET NOMBRES D’OBSERVATIONS 267

la sommation étant relative aux différentes séries d’ex aequo communs à deux ou
plusieurs échantillons, et k désignant le nombre de termes de ces différentes séries.
C’est ainsi également que, dans les conditions d’application de l’analyse de la
variance, l’efficacité asymptotique du test de Kruskal et Wallis, par rapport à
l’analyse de la variance, est égale à 3/π ou 95,5 %.

d 5◦ Comme pour deux populations aussi, d’autres tests non paramétriques ont
été proposés. On peut citer notamment un test général basé sur les médianes,
une variante du test de Kolmogorov et Smirnov (§ 3.2.1.3◦ ), et différents tests
relatifs au cas des hypothèses alternatives ordonnées (§ 9.3.2.9◦ ), dont le test de
Jonckheere ou de Terpstra et Jonckheere 27 [Büning, 1999 ; Neuhäuser
et al., 1998 ; Zhang et Wu, 2007].
De même, diverses méthodes robustes ont été proposées [Babu et al., 1999 ;
Büning, 1997 ; Routledge, 1997]. Et des méthodes robustes existent aussi en
matière d’estimation des composantes de la variance [Müller et Uhlig, 2001 ;
b Stahel et Welsh, 1997 ; Zhou et Zhu, 2003].

Exemple 9.3.8. Comparaison des hauteurs des arbres de trois types de hêtraies :
test de Kruskal et Wallis.
Le tableau 9.3.4 reprend les données de hauteurs d’arbres qui nous ont servi
à illustrer l’analyse de la variance à un critère de classification (exemples 9.2.1 et
9.3.1), ainsi que les rangs qui peuvent être associés à ces données.
Á partir des sommes des rangs, on obtient :
12
χ2obs = (316,52 /13 + 280,52 /14 + 1062 /10) − 3 (38) = 9,32 ,
(37) (38)
et avec deux degrés de liberté :
P(χ2 ≥ 9,32) = 0,0095 .

Comme l’analyse de la variance, le test de Kruskal et Wallis met donc en


évidence des différences hautement significatives de hauteur entre les trois types
de forêts. La prise en compte des ex aequo ne modifierait guère les résultats et
aucunement la conclusion du test.

9.4 La puissance et la détermination des nombres


d’observations
⊕ 9.4.1 Principes généraux
1◦ Les problèmes de calcul de la fonction de puissance et de détermination des
nombres d’observations présentent, en analyse de la variance, de multiples aspects.
27 En anglais : Jonckheere’s test, Terpstra-Jonckheere’s test.
268 ANALYSE DE LA VARIANCE À UN CRITÈRE 9.4.2

Tableau 9.3.4. Comparaison des hauteurs des arbres de trois types de hêtraies :
hauteurs observées, en mètres, et rangs.

Hauteurs Rangs
Type 1 Type 2 Type 3 Type 1 Type 2 Type 3
23,4 22,5 18,9 8 5,5 1
24,4 22,9 21,1 12,5 7 2
24,6 23,7 21,2 16,5 10 3
24,9 24,0 22,1 18 11 4
25,0 24,4 22,5 19 12,5 5,5
26,2 24,5 23,6 23 14,5 9
26,3 25,3 24,5 25 20 14,5
26,8 26,0 24,6 29,5 21 16,5
26,8 26,2 26,2 29,5 23 23
26,9 26,4 26,7 31,5 26 27,5
27,0 26,7 – 33 27,5 –
27,6 26,9 – 35 31,5 –
27,7 27,4 – 36 34 –
– 28,5 – – 37 –
Totaux 316,5 280,5 106

Nous envisagerons tout d’abord la question du calcul de la fonction de puis-


sance dans le cas du modèle fixe (§ 9.4.2), en négligeant le cas du modèle aléatoire,
ce dernier ayant plus pour objet de réaliser des estimations que des tests d’hypo-
thèses. Nous considérerons ensuite les questions de détermination des nombres
d’observations pour chacun des deux modèles (§ 9.4.3 et 9.4.4). Enfin, nous consa-
crerons un paragraphe à la question de la comparaison de la sensibilité de deux
ou plusieurs expériences, relatives par exemple à différentes méthodes de mesure
ou d’analyse (§ 9.4.5).

d 2◦ Des informations complémentaires relatives aux déterminations de puis-


sances et de nombres d’observations, y compris pour les méthodes non paramétri-
ques, sont données par Argaç [2004], Büning et Kössler [1999], Lee [2003a],
b et Mahoney et Magel [1996].

9.4.2 La fonction de puissance dans le cas du modèle fixe


1◦ Dans le cas des tests d’égalité de deux moyennes, le calcul de la fonction de
puissance est relativement aisé, car les hypothèses alternatives sont toujours du
type :
H : m1 − m2 = δ (6= 0) .

La puissance est alors directement fonction de δ , qui est une mesure très simple
du degré de fausseté de l’hypothèse nulle [STAT1, § 10.4.2].
9.4.2 PUISSANCE ET NOMBRES D’OBSERVATIONS 269

Il n’en est pas de même pour l’analyse de la variance, les hypothèses alternatives
étant beaucoup plus diversifiées, en raison de la multiplicité des signes d’égalité qui
interviennent dans l’hypothèse nulle. Une même différence de moyennes n’implique
d’ailleurs pas toujours, dans ce cas, un même degré de fausseté de l’hypothèse nulle.
Ainsi, pour quatre populations par exemple, les hypothèses :

H1 : m1 6= m2 = m3 = m4 et H2 : m1 = m2 6= m3 = m4 ,

constituent deux hypothèses alternatives distinctes, et une même différence entre


les deux groupes de moyennes ne revêt pas, dans les deux cas, la même importance.

2◦ En ce qui concerne le modèle fixe de l’analyse de la variance à un critère


de classification, une mesure globale du degré de fausseté de l’hypothèse nulle est
donnée par l’expression :
Xp
(ni a2i ) ,
i=1

qui intervient notamment dans l’espérance mathématique du carré moyen factoriel


(§ 9.3.2.4◦ ). Pour des effectifs ni égaux, ce paramètre est, à une constante près, la
variance des effets principaux ai , et aussi des moyennes mi :
p p
1X 2 1X
s2a = a = (mi − m)2 ,
p i=1 i p i=1

puisque la moyenne générale m est alors la moyenne arithmétique simple des


moyennes individuelles mi .

3◦ Des tables, des abaques et des procédures de calcul, qui se basent sur de tels
paramètres, permettent de déterminer la puissance du test. On peut se référer à ce
propos à certains recueils de tables, tel que celui de Pearson et Hartley [1966-
1972], et à diverses autres publications [Guenther, 1979 ; Hager et Möller,
1986 ; Tiku, 1967, 1972].
Comme dans le cas de deux populations [STAT1, § 10.4.3.1◦ ], la puissance est
non seulement une fonction croissante du degré de fausseté de l’hypothèse nulle,
mais aussi une fonction croissante des effectifs des échantillons et du risque de
première espèce, et une fonction décroissante de la variance résiduelle σ 2 .

d 4◦ D’une manière générale, la détermination de la puissance du test F est basée


sur les distributions F non centrales [STAT1, § 6.10.3.2◦ ].
Pour le modèle fixe de l’analyse de la variance à un critère de classification, le
paramètre de décentrage ou de non-centralité ∏ relatif à ces distributions est :
p
1 X
∏= (ni a2i ) ,
σ 2 i=1
270 ANALYSE DE LA VARIANCE À UN CRITÈRE 9.4.3

et est donc étroitement lié à la mesure du degré de fausseté de l’hypothèse nulle


b que nous avons présentée ci-dessus.

Exemple 9.4.1. Comparaison des hauteurs moyennes des arbres de trois types
de hêtraies : puissance du test.
Nous repartons ici des conclusions de l’exemple 9.3.1 pour déterminer, dans ce
cas, la puissance du test d’égalité des moyennes. Nous simplifions toutefois quelque
peu le problème, en considérant que les échantillons sont tous trois d’effectif 12 ,
et non pas respectivement d’effectifs 13 , 14 et 10 .
L’alternative à laquelle conduit l’exemple 9.3.1 est du type :
H : m1 = m2 6= m3 ,
avec une différence de moyennes qui pourrait être, en fonction des résultats ob-
servés :
δ = m1 − m3 = m2 − m3 = 2,5 .
On a dans ces conditions :
a1 = a2 = 0,8333 , a3 = − 1,6667 et s2a = 1,3889 .

En considérant en outre la valeur observée du carré moyen résiduel comme


valeur de la variance résiduelle (CMr = 3,431), on obtient la puissance suivante,
par calcul ou à l’aide des tables de Tiku [1967] par exemple :
1 − β(2,5) = P(RH0 |δ = 2,5) = 0,91 .
De même, on obtiendrait une puissance égale à 0,75 pour une différence de deux
mètres et une puissance égale à 0,24 pour une différence d’un mètre.
Ces valeurs montrent qu’en fonction des observations dont on dispose et pour
les effectifs considérés, on ne peut raisonnablement espérer mettre en évidence des
différences significatives que si ces différences sont de l’ordre de 2 ou 3 mètres au
moins.
d Pour une différence de moyennes de 2,5 mètres, la distribution non centrale qui
est à la base de la détermination de la puissance est la distribution F à 2 et 33
degrés de liberté, dont le paramètre de décentrage est :
b ∏ = (12) (3) (1,3889)/3,431 = 14,57.

9.4.3 La détermination des nombres d’observations


dans le cas du modèle fixe
1◦ Une solution simple, très souvent largement satisfaisante, du problème de
la détermination du nombre d’observations dans le cas du modèle fixe d’ana-
lyse de la variance à un critère de classification consiste à utiliser les formules et
9.4.3 PUISSANCE ET NOMBRES D’OBSERVATIONS 271

éventuellement l’abaque relatifs au test t d’égalité de deux moyennes (§ 8.4.4.1◦ ).


Le coefficient de variation cv est alors le coefficient de variation qui correspond au
carré moyen résiduel, et la différence δr est l’amplitude des moyennes, exprimée
en valeur relative.
Cette façon de procéder ne tient toutefois aucun compte du nombre de moyen-
nes qui sont comparées, ni de la répartition de ces moyennes, certaines d’entre elles
pouvant être égales tandis que d’autres ne le sont pas.

d 2◦ En vue de faire intervenir ces deux éléments de façon précise, il faut établir
la relation qui les lie au paramètre de décentrage défini au paragraphe 9.4.2.4◦ .
À cette fin, nous considérons quatre répartitions particulières, en les illustrant
chacune par un exemple relatif à cinq moyennes. Ces répartitions sont :
I . les p moyennes sont divisées en deux groupes d’effectifs égaux si p est pair, ou
presque égaux si p est impair, tels que :

m1 = m2 > m3 = m4 = m5 et m1 − m3 = δ ;

II . toutes les moyennes sauf une sont supposées égales, comme :

m1 > m2 = m3 = m4 = m5 et m1 − m2 = δ ;

III . les p moyennes sont réparties uniformément entre les deux valeurs extrêmes,
soit par exemple :

m1 > m2 > m3 > m4 > m5 et m1 −m2 = m2 −m3 = m3 −m4 = m4 −m5 = δ/4 ;

IV. toutes les moyennes sauf deux sont égales, les deux moyennes isolées étant
supposées équidistantes du groupe principal, comme :

m1 > m2 = m3 = m4 > m5 et m1 − m2 = m2 − m5 = δ/2 .

Le tableau 9.4.1 donne, pour des nombres de populations allant de 2 à 8 , et


pour chacune des répartitions qui viennent d’être définies, les valeurs des rapports k
entre l’écart-type des moyennes et leur amplitude :

k = sa /δ .

On peut constater que la première répartition est celle dont les rapports sa /δ sont
b les plus élevés, et la dernière celle dont les rapports sa /δ sont les plus petits.
d 3◦ La figure 9.4.1, déduite notamment des abaques de Pearson et Hartley
[1966-1972], donne une représentation graphique de la relation qui lie l’effectif n
au nombre p de populations et à la répartition des moyennes, pour un risque de
première espèce α égal à 0,05 et un risque de deuxième espèce β égal à 0,5 et 0,1 .
Cette figure fait également intervenir, à titre intermédiaire le rapport sa /σ :

∏0 = sa /σ = k δ/σ = k δr /cv .
272 ANALYSE DE LA VARIANCE À UN CRITÈRE 9.4.3

Tableau 9.4.1. Rapport de l’écart-type à l’amplitude, pour différents nombres p


de populations et différentes répartitions des moyennes (I à IV).

Répartitions
p
I II III IV
2 0,500 0,500 0,500 –
3 0,471 0,471 0,408 0,408
4 0,500 0,433 0,373 0,354
5 0,490 0,400 0,354 0,316
6 0,500 0,373 0,342 0,289
7 0,495 0,350 0,333 0,267
8 0,500 0,331 0,327 0,250

Cette quantité est aussi une mesure du degré de fausseté de l’hypothèse nulle et
est étroitement liée au paramètre ∏ des distributions F non centrales (§ 9.4.2.4◦ ).
L’exemple 9.4.2 illustre les principales possibilités d’utilisation de cette figure.
Des indications relatives à d’autres valeurs de α et β sont fournies notamment
b par Kastenbaum et al. [1970a].

d 4◦ La figure 9.4.1, de même que les abaques à partir desquels elle a été établie,
permet de constater que la solution simple présentée au début de ce paragraphe est
en général relativement satisfaisante pour les structures intermédiaires II et III ,
mais qu’elle ne convient pas pour les structures extrêmes I et IV, et cela d’autant
plus que le nombre de moyennes envisagées est élevé.
Par comparaison avec le cas de deux moyennes, on peut considérer, en première
approximation, que le nombre d’observations nécessaires diminue proportionnelle-
ment à la racine carrée du nombre de moyennes pour la structure I et augmente
b proportionnellement à cette même racine carrée pour la structure IV.

5◦ D’une façon plus particulière, dans le cas de l’échantillonnage stratifié, le


problème de la détermination du nombre d’observations en vue de l’estimation
d’une moyenne peut être résolu à l’aide des diverses relations qui ont trait à
l’échantillonnage complètement aléatoire (§ 8.2.3). Il faut noter toutefois que la
variance et le coefficient de variation qui apparaissent dans ces relations sont ceux
qui concernent la composante résiduelle de l’analyse de la variance (variance et
coefficient de variation à l’intérieur des strates), tandis que l’effectif n qui inter-
vient dans ces relations est l’effectif total (n. ou éventuellement p n , si les effectifs
relatifs aux p strates sont égaux).
En ce qui concerne le nombre et la constitution des strates, rappelons également
que l’objectif à atteindre est d’assurer une variabilité aussi réduite que possible à
l’intérieur des strates, c’est-à-dire également des différences aussi importantes que
possible entre les strates (§ 9.3.4.4◦ ).
9.4.3 PUISSANCE ET NOMBRES D’OBSERVATIONS 273

Figure 9.4.1. Relation, d’une part, entre l’effectif n de chacun des échantillons
et le degré de fausseté ∏0 de l’hypothèse nulle, et d’autre part, entre ce degré
de fausseté et le quotient δr /cv (ou δ/σ), pour différents nombres de
populations (2 à 8) et différentes répartitions des moyennes (I à IV),
la signification des symboles I à IV étant rappelée schématiquement
dans la partie supérieure droite de la figure.
274 ANALYSE DE LA VARIANCE À UN CRITÈRE 9.4.3

En outre, on peut démontrer que, si les variances à l’intérieur des différentes


strates sont égales, la répartition des observations entre les strates doit être réalisée
de façon telle que la fraction sondée, c’est-à-dire le rapport entre l’effectif de
l’échantillon prélevé et l’effectif ou la taille de la strate, soit constante. Si par
contre, les variances à l’intérieur des différentes strates sont inégales, la solution la
plus favorable consiste à adopter des fractions sondées qui sont proportionnelles
aux produits des effectifs ou des tailles des strates par leurs écarts-types [Ardilly,
2006 ; Dussaix et Grosbras, 1993 ; Tillé, 2001].

Exemple 9.4.2. Comparaison des poids moyens de quatre populations de poulets :


détermination du nombre d’observations.
Nous poursuivons la discussion des exemples 8.2.2 et 8.4.4, relatifs à l’estima-
tion et à la comparaison de poids de poulets, en supposant que, dans les mêmes
conditions, on souhaite comparer quatre ensembles de poulets, qui pourraient être
liés par exemple à quatre alimentations différentes.
Pour un coefficient de variation semblable à celui qui a été observé, soit 13 %, et
si on souhaite mettre en évidence d’éventuelles différences de poids égales à 10 %,
avec des risques d’erreur de première et de deuxième espèce α et β égaux res-
pectivement à 0,05 et 0,1 , la solution la plus simple est celle qui est donnée par
l’exemple 8.4.4. Elle conduit à prélever quatre échantillons d’environ 35 poulets.
d Pour disposer d’informations plus précises, il y a lieu de tenir compte du nombre
de populations comparées et de la répartition supposée des moyennes.
Le tableau 9.4.1 donne, pour les quatre répartitions théoriques envisagées
(I à IV), les valeurs suivantes du paramètre ∏0 :

∏0 = 0,500 (10)/13 = 0,38 , ∏0 = 0,433 (10)/13 = 0,33 ,

∏0 = 0,373 (10)/13 = 0,29 et ∏0 = 0,354 (10)/13 = 0,27.


Ces valeurs peuvent également être trouvées, de manière approchée, sur l’axe ∏0
de la figure 9.4.1, en joignant par des segments de droite le point :

δr /cv = 10/13 = 0,77,

et les points I.4 , II.4 , III.4 et IV.4 .


La figure 9.4.1 permet ensuite de déterminer les effectifs nécessaires en vue
d’atteindre l’objectif poursuivi, en lisant sur l’axe des ordonnées les valeurs n qui
correspondent, pour la courbe β = 0,1 et p = 4 , aux différentes valeurs de ∏0 .
On obtient ainsi, approximativement, un effectif égal à 25 dans le cas le plus fa-
vorable (I), à 50 dans le cas le plus défavorable (IV), et à 35 et 45 dans les cas
intermédiaires (II et III).
L’observation de quatre lots constitués chacun d’une quarantaine de poulets
serait donc une solution vraisemblablement satisfaisante. On remarquera aussi
9.4.4 PUISSANCE ET NOMBRES D’OBSERVATIONS 275

que ces résultats confirment le fait que la solution simple déduite du cas de deux
moyennes (n = 35) est bien une solution approximative intermédiaire.
Utilisée en sens inverse, la figure 9.4.1 permet également de déterminer des
valeurs de δr (ou δ), en fonction des effectifs n . Pour des lots de 20 poulets par
exemple, et toujours avec un risque de deuxième espèce égal à 0,1 , la valeur du
paramètre ∏0 serait égale à 0,43 et le rapport δr /cv se situerait approximativement
entre 0,86 et 1,22 . À ces deux valeurs extrêmes, correspondraient des différen-
ces δr égales respectivement à 11 et 16 %. On pourrait donc espérer mettre ainsi
en évidence, au niveau de signification 0,05 et avec une probabilité égale à 0,9 ,
d’éventuelles différences de poids de l’ordre de 12 à 15 % seulement.
En utilisant les lignes pointillées de la figure 9.4.1 (β = 0,5), on pourrait aussi
montrer que d’éventuelles différences de poids de l’ordre de 8 à 9 % seraient alors
b mises en évidence dans un cas sur deux.

Exemple 9.4.3. Estimation de la hauteur moyenne des arbres d’un ensemble de


forêts : détermination des nombres d’observations.
Pour illustrer ce qui a trait à l’échantillonnage stratifié, nous reprenons égale-
ment les données de l’exemple 9.3.4.
Si, pour l’ensemble de forêts considéré dans cet exemple, on souhaite estimer
la hauteur moyenne des arbres avec une marge d’erreur égale à 2 % (soit par
exemple une erreur de 0,5 m pour une hauteur moyenne de 25 m), avec un degré
de confiance égal à 0,95 , et si le coefficient de variation à l’intérieur des strates
peut être considéré comme étant de l’ordre de 7 à 8 %, le nombre d’observations
à réaliser serait approximativement :

n ' 4 (7,5/2)2 = 56 .

Dans l’hypothèse d’une égalité des variances à l’intérieur des différentes strates,
ces 56 observations devraient en outre être réparties au prorata de l’étendue des
strates, soit par exemple, pour trois strates représentant respectivement 35 , 40 et
25 % de l’étendue totale, respectivement 20 , 22 et 14 observations.

9.4.4 La détermination des nombres d’observations


dans le cas du modèle aléatoire
1◦ Nous ne considérerons les questions de détermination des nombres d’obser-
vations, dans le cas du modèle aléatoire d’analyse de la variance à un critère de
classification, que dans l’optique de l’échantillonnage à deux degrés et pour des
effectifs n égaux. La détermination des effectifs doit alors se faire à chacun des
deux degrés.

2◦ Comme nous l’avons signalé antérieurement (§ 9.3.4.6◦ ), la variance de


la moyenne générale estimée par échantillonnage à deux degrés est égale à la
276 ANALYSE DE LA VARIANCE À UN CRITÈRE 9.4.4

2
quantité (n σA + σ 2 )/(n p) , c’est-à-dire aussi :
2 2
σX̄ = σA /p + σ 2 /(n p) .
2
Pour un même nombre total n p d’observations et pour autant que σA soit différent
de zéro, cette variance est d’autant plus petite que p est grand, et donc que n est
petit.
On doit en conséquence choisir, au deuxième degré de l’échantillonnage, un
effectif n aussi réduit que possible. Un effectif de deux unités du deuxième degré
(n = 2) pour chacune des unités du premier degré est toujours, théoriquement, la
solution la plus favorable. Un tel effectif permet en effet, à la fois, de contrôler la
validité des résultats obtenus, en facilitant la recherche d’éventuelles observations
aberrantes, d’estimer l’importance des deux sources de variation, et d’obtenir l’es-
timation la plus précise possible de la moyenne générale.
On pourrait être tenté de réduire l’effectif n à la valeur 1 , mais cela consisterait
en fait en un retour à l’échantillonnage complètement aléatoire.

3◦ Quand le nombre n d’observations à effectuer pour chacune des unités du


premier degré est ainsi fixé au minimum indispensable, on peut déterminer le
nombre p d’unités à observer au premier degré. Cette détermination peut être
réalisée comme dans le cas de l’échantillonnage complètement aléatoire (§ 8.2.3),
mais en remplaçant toutefois la variance σ 2 par σA2
+ σ 2 /n .
Cette dernière quantité est en effet la variance des moyennes observées pour
chacune des unités du premier degré.

d 4◦ Le raisonnement suivi ci-dessus ne tient pas compte du fait que l’observation


des unités du premier degré peut représenter une dépense ou un travail important,
et est parfois beaucoup plus coûteuse, en argent ou en temps, que l’observation des
unités du deuxième degré. S’il en est ainsi, il peut être intéressant de déterminer les
effectifs n et p en recherchant, non plus le nombre minimum d’observations n p ,
mais bien le coût minimum de l’ensemble des opérations ou le temps de travail
minimum.
Si on désigne par c1 le coût relatif à chaque unité du premier degré et par c2
le coût relatif à chaque unité du deuxième degré, le coût total des p unités du
premier degré et des n p unités du deuxième degré est :

c = c1 p + c2 n p = (c1 + c2 n) p .

Pour une précision donnée, mesurée par exemple en termes de variance de la


moyenne générale :
2 2
σX̄ = (σA + σ 2 /n)/p ,
on peut écrire :
2
c = (c1 + c2 n) (σA + σ 2 /n)/σX̄
2
.
9.4.4 PUISSANCE ET NOMBRES D’OBSERVATIONS 277

On démontre sans difficultés que le minimum de cette fonction de coût corres-


pond à : q
2 ).
n = (c1 /c2 ) (σ 2 /σA

Cette relation permet de calculer l’effectif optimal n relatif au deuxième degré


de l’échantillonnage. Quand cet effectif est fixé, il est possible de déterminer comme
b ci-dessus l’effectif p relatif au premier degré.

Exemple 9.4.4. Estimation de la production fourragère moyenne d’un ensemble


de prairies : détermination des nombres d’observations.
En ce qui concerne l’estimation de la production moyenne d’un ensemble de
prairies, l’exemple 9.3.5 a montré que la substitution de l’échantillonnage à deux
degrés à l’échantillonnage complètement aléatoire provoque une perte de précision
considérable, la marge d’erreur étant de 0,90 t/ha dans le premier cas et de
0,26 t/ha dans le deuxième cas, pour un même nombre total d’observations. Cette
grande différence de précision est liée au fait que, dans l’exemple considéré, le
nombre p d’unités du premier degré est réduit à 3 , le nombre d’unités du deuxième
degré étant au contraire relativement élevé (n = 5).
On peut facilement observer que la perte de précision aurait été sensiblement
moins importante, toujours pour un même nombre total d’observations, si les ef-
fectifs avaient été choisis différemment. En conservant les mêmes valeurs pour les
deux composantes de la variance (exemple 9.3.3) :
2
σ
bA b2 = 0,1559 ,
= 0,1006 et σ

on a en effet, pour cinq prairies et trois observations par prairie (p = 5 et n = 3),


une marge d’erreur égale à :
p
2,776 0,1006/5 + 0,1559/15 = 0,48 t/ha ,

et aussi, pour sept prairies et deux observations par prairie (p = 7 et n = 2),


c’est-à-dire un total de 14 observations au lieu de 15 :
p
2,447 0,1006/7 + 0,1559/14 = 0,39 t/ha ,

c’est-à-dire des marges réduites de moitié environ, par rapport à la marge d’erreur
initiale (0,90 t/ha).
En supposant que rien ne s’oppose au principe de ne faire que deux observations
par prairie (n = 2), on peut alors s’efforcer de déterminer le nombre de prairies à
prendre en considération, en vue d’aboutir à une marge d’erreur égale par exemple
à 10 % de la moyenne générale. La variance des moyennes par prairie peut être
estimée à :
0,1006 + 0,1559/2 = 0,1786 ,
278 ANALYSE DE LA VARIANCE À UN CRITÈRE 9.4.5

ce qui correspond à un coefficient de variation égal à :


p
100 0,1786/2,153 = 19,6 ou 20 % .
On en déduit le nombre de prairies que voici :
p ' 4 (20/10)2 = 16 ,
soit un total de 32 observations.
Ce résultat n’est toutefois qu’indicatif, car les valeurs des composantes de la
variance n’ont été estimées qu’avec de très petits nombres de degrés de liberté, et
donc avec une très faible précision.
d Le fait d’effectuer plus de deux observations par prairie peut être justifié par un
coût élevé de prise en considération de prairies supplémentaires (frais de transport
et pertes de temps), par comparaison avec le coût des observations individuelles
(frais de prélèvement, de séchage et de pesée des échantillons de fourrages).
Si par exemple, le rapport des coûts c1 /c2 des deux types d’opérations était de
l’ordre de 5 , le nombre optimal d’observations par prairie serait :
p
n = 5 (0,1559/0,1006) = 2,78 ou 3 .
De même, le rapport des coûts devrait être de l’ordre de 15 à 20 , pour justifier le
b fait de porter à 5 le nombre d’observations par prairie.

9.4.5 La comparaison de la sensibilité de deux ou plusieurs


expériences
1◦ Un problème étroitement lié à la notion de puissance de l’analyse de la va-
riance est celui de la comparaison de la sensibilité de deux ou plusieurs expériences,
faisant intervenir par exemple différentes méthodes de mesure ou d’analyse. Le but
poursuivi dans ce cas est de voir si une méthode de mesure ou d’analyse s’avère
significativement plus efficace qu’une autre, pour mettre en évidence d’éventuelles
différences de moyennes.
Nous envisageons cette question en présentant la méthode ou le test de Brad-
ley et Schumann 28 , qui est relatif au cas de deux expériences indépendantes,
réalisées dans des conditions identiques.
2◦ Par l’analyse de la variance, chacune des expériences donne naissance à une
valeur Fobs , qui est une mesure de la sensibilité de l’expérience en question. La
comparaison des deux valeurs ainsi obtenues permet de tester l’hypothèse d’égale
sensibilité, c’est-à-dire l’hypothèse d’égalité des deux quantités :
p
1 X 2
a ,
σ 2 i=1 i
tous les effectifs étant supposés égaux.
28 En anglais : Bradley-Schumann’s test of sensitivity.
9.4.5 PUISSANCE ET NOMBRES D’OBSERVATIONS 279

Un test bilatéral peut être réalisé en calculant le rapport :

wobs = Fmax /Fmin ,

dans lequel Fmin et Fmax désignent respectivement la plus petite et la plus grande
des deux valeurs Fobs . Au niveau de signification α , ce rapport doit être comparé
à une valeur théorique w1−α/2 et l’hypothèse d’égale sensibilité doit être rejetée
quand :
wobs ≥ w1−α/2 .

Les valeurs théoriques w1−α/2 sont données notamment par Schumann et Brad-
ley [1959], en fonction du niveau de signification choisi, de deux paramètres a et b ,
qui dépendent eux-mêmes des valeurs Fmin et Fmax , et des nombres de degrés de
liberté k1 et k2 :
±£ §
a = k1 (Fmin + Fmax )2 8 (Fmin + Fmax − 1) et b = k2 /2 .

d 3◦ Ce test a été l’objet de diverses extensions, relatives au cas de plus de deux


expériences, au cas d’expériences non indépendantes et au cas du modèle aléatoire
d’analyse de la variance à un critère de classification [Dar, 1962, 1964 ; Schoeman
et Schumann, 1969 ; Schumann et Bradley, 1959]. Dans ce dernier cas, il s’agit
plus particulièrement de tester l’égalité des rapports des composantes de variance
2 2
b σA /σ .

Exemple 9.4.5. Étude morphométrique de grains de sable : comparaison de la


sensibilité de deux indices.
Au cours d’une étude relative à la forme de grains de sable, on a comparé
la sensibilité de différents indices morphométriques, caractérisant la forme plus
ou moins anguleuse ou arrondie des grains, et par là-même leur degré d’érosion
[Tonnard, 1960]. Nous nous limitons ici à l’examen des résultats relatifs à deux
de ces indices, à savoir ceux de Cailleux et de Kuenen.
Deux échantillons de 25 grains de sable ont été constitués au hasard et indé-
pendamment, pour chacun des 10 types de sable qu’on désirait caractériser par
l’intermédiaire de ces indices. Dans chaque cas, un échantillon a été étudié à l’aide
d’un indice et l’autre échantillon à l’aide de l’autre indice. Les résultats obtenus
par l’analyse de la variance, après une transformation logarithmique réalisée en
vue de stabiliser les variances, sont présentés de façon condensée dans le tableau
9.4.2.
À première vue, l’indice de Cailleux (Fobs = 24,2) semble préférable à celui
de Kuenen (Fobs = 18,9), pour mettre en évidence les différences qui existent
entre les dix types de sable considérés. Le test de Bradley et Schumann permet
de contrôler la validité de cette appréciation.
280 ANALYSE DE LA VARIANCE À UN CRITÈRE

Tableau 9.4.2. Étude morphométrique de grains de sable : résumé des tableaux


d’analyse de la variance relatifs aux indices de Cailleux et de Kuenen.

Degrés de Indice Cailleux Indice Kuenen


Sources de variation
liberté CM F CM F
Différences entre types de sable 9 1,03832 24,2 *** 0,68918 18,9 ***
Différences entre grains de sable 240 0,04296 0,03646
Total 249

On obtient ici :
wobs = 24,2/18,9 = 1,28 ,
±£ 2
§
a = 9 (24,2 + 18,9) 8 (24,2 + 18,9 − 1) = 49,6 et b = 240/2 = 120 .
Les tables de Schumann et Bradley [1959] donnent approximativement, pour
de telles valeurs de a et b :
w0,975 = 1,51 .
La différence entre les deux valeurs Fobs et donc aussi la différence de sensibilité
entre les deux indices envisagés ne doivent, en conséquence, pas être considérées
comme significatives, au niveau de probabilité 0,05 .

Exercices
⊕ 9.1. Comparez, quant aux différences de moyennes, les observations relatives aux diffé-
rentes durées de traitement de l’exercice 4.2.

⊕ 9.2. Quinze veaux ont été répartis au hasard en trois lots, recevant chacun une alimenta-
tion particulière. Les gains de poids, observés au cours d’une même période et exprimés
en kg, sont présentés ci-dessous, une donnée étant manquante. Doit-on considérer que
les différences de moyennes entre alimentations sont significatives ? Dans l’affirmative,
estimez ces différences de moyennes et déterminez-en les limites de confiance.

Alimentation 1 : 42,1 , 37,7 , 45,1 , 43,2 ;


alimentation 2 : 45,2 , 54,2 , 38,1 , 48,3 , 55,1 ;
alimentation 3 : 48,3 , 44,1 , 56,9 , 42,2 , 54,0 .

9.3. Quatre échantillons de chocolat, prélevés au hasard dans une production importante,
ont été analysés en ce qui concerne leur teneur en lactose, chaque échantillon étant l’objet
de trois mesures. En fonction des observations suivantes, exprimées en pourcentages,
estimez la variabilité propre aux échantillons (écart-type entre échantillons) et la variabi-
lité analytique (écart-type entre mesures, pour un même échantillon), et déterminez les
limites de confiance correspondantes.

Échantillon 1 : 8,02 , 8,36 , 8,24 ; échantillon 2 : 7,27 , 7,04 , 7,35 ;


échantillon 3 : 7,38 , 7,52 , 7,69 ; échantillon 4 : 7,99 , 7,79 , 7,98 .
EXERCICES 281

9.4. Dans les conditions de l’exercice 9.2, quel est l’ordre de grandeur du nombre de
veaux dont il faudrait disposer pour pouvoir espérer mettre en évidence des différences
éventuelles de croissance en poids de 5 kg ?

9.5. Dix échantillons de fourrage ont été prélevés au hasard dans un silo et chacun d’eux
a été l’objet de quatre déterminations de la teneur en calcium. Les 40 observations, expri-
mées en pourcentages de la matière sèche, ont été soumises à l’analyse de la variance à un
critère de classification, et ont conduit notamment à l’obtention d’un carré moyen factoriel
égal à 0,2961 et un carré moyen résiduel égal à 0,00664 . Quelle est, dans ces conditions,
l’erreur standard estimée de la moyenne générale des 40 observations ? À quelle valeur de
l’erreur standard devrait-on s’attendre, dans les mêmes conditions, si on avait effectué
10 prélèvements et seulement deux analyses par prélèvement, et si on avait effectué 10
prélèvements et une seule analyse par prélèvement ? Combien d’observations devrait-
on effectuer, toujours dans les mêmes conditions, si on souhaitait aboutir à une erreur
standard égale à 0,1 % ?
Chapitre 10

L’analyse de la variance à
deux critères de classification

Sommaire
10.1 Introduction
10.2 Les modèles croisés à effectifs égaux : aspects descriptifs
10.3 Les modèles croisés à effectifs égaux : aspects inférentiels
10.4 Les modèles croisés à effectifs inégaux
10.5 Les modèles hiérarchisés
10.6 La puissance et la détermination des nombres d’observations
Exercices
284 ANALYSE DE LA VARIANCE À DEUX CRITÈRES 10.1

10.1 Introduction
1◦ L’analyse de la variance à deux critères de classification 1 peut être considé-
rée comme une généralisation de l’analyse à un critère, qui permet de tenir compte
simultanément de deux facteurs sous-jacents, et non plus d’un seul facteur.
Les deux facteurs envisagés peuvent être soit placés sur pied d’égalité, soit au
contraire subordonnés l’un à l’autre. Dans le premier cas, les modèles d’analyse
de la variance sont dits croisés 2 , alors que dans le deuxième cas, ils sont dits
hiérarchisés 3 . Le cas hiérarchique est parfois qualifié aussi de multi-niveaux 4 .
Dans les différents cas, on doit également faire la distinction entre les modèles
fixes, les modèles aléatoires et les modèles mixtes 5 . Enfin, une distinction im-
portante intervient entre le cas des effectifs égaux, parfois qualifié d’équilibré ou
orthogonal, et le cas des effectifs inégaux, parfois qualifié de non équilibré ou non
orthogonal.
Les exemples 10.2.1, 10.3.4 et 10.5.1 sont des illustrations de quelques-unes de
ces situations.

2◦ Comme pour l’analyse de la variance à un critère de classification, nous


considérerons tout d’abord les aspects descriptifs (§ 10.2), puis les aspects inféren-
tiels (§ 10.3) de l’analyse à deux critères, en nous limitant dans un premier temps
aux modèles croisés à effectifs égaux. Nous envisagerons ensuite les modèles croisés
à effectifs inégaux (§ 10.4) et les modèles hiérarchisés (§ 10.5). Nous terminerons
par quelques informations relatives à la notion de puissance et à la détermination
des nombres d’observations (§ 10.6).
Nous travaillerons toujours par analogie avec l’analyse de la variance à un cri-
tère, ce qui devrait nous permettre de ne pas être trop long. C’est ainsi que nous
éviterons au maximum de donner des démonstrations, en matière d’espérances
mathématiques et de distributions d’échantillonnage notamment.

3◦ Globalement, les conditions d’application sont, en analyse de la variance


à deux critères de classification, de la même nature qu’à un critère : populations
normales et de même variance, et échantillons aléatoires, simples et indépendants.
Les mêmes remarques que précédemment peuvent être formulées ici également à
ce sujet (§ 8.1.2◦ et 9.1.3◦ ).
À ces conditions de base, s’ajoute parfois une condition d’additivité, que nous
définirons ultérieurement (§ 10.2.4.2◦ ).
Comme en analyse de la variance à un critère de classification (exemple 9.3.2),
nous illustrerons par un exemple le contrôle des conditions d’application (exemple
10.3.2).
1 En anglais : two-way analysis of variance.
2 En anglais : cross-classification.
3 En anglais : hierarchical classification.
4 En anglais : multilevel analysis.
5 En anglais : mixed model, mixed effects model.
10.2.2 MODÈLES CROISÉS À EFFECTIFS ÉGAUX : ASPECTS DESCRIPTIFS 285

d 4◦ Les références bibliographiques mentionnées au paragraphe 9.1.4◦ peuvent


être utiles aussi pour compléter l’information relative à l’analyse de la variance à
deux critères de classification. Éventuellement, on pourra consulter en outre les

b publications relatives au modèle linéaire qui sont citées au paragraphe 16.1.5 .

10.2 Les modèles croisés à effectifs égaux :


aspects descriptifs
10.2.1 Principes généraux
Au cours du paragraphe 10.2.2, nous présenterons le modèle observé et les
différents éléments du tableau d’analyse de la variance, en suivant le même chemi-
nement qu’au paragraphe 9.2.2. Nous donnerons ensuite, très rapidement, quelques
indications relatives à la réalisation des calculs (§ 10.2.3) et nous développerons
les notions d’interaction et d’additivité (§ 10.2.4). Nous terminerons par la pré-
sentation du cas particulier des échantillons d’une seule observation, dit aussi cas
d’une observation par cellule 6 (§ 10.2.5).

10.2.2 La décomposition de la variation totale


1◦ Considérons p q échantillons ou séries d’observations de même effectif n ,
et désignons les observations individuelles par xijk , les indices i , j et k étant
relatifs respectivement aux différentes modalités du premier critère de classification
(i = 1 , . . . , p), aux différentes modalités du deuxième critère de classification
(j = 1 , . . . , q), et aux différentes observations d’un même échantillon ou d’une
même série (k = 1 , . . . , n).
À partir de telles données, on peut calculer différentes moyennes, à savoir
une moyenne pour chacun des échantillons ou séries d’observations (i = 1 , . . . , p
et j = 1 , . . . , q) :
n
1X
x̄ij. = xijk ,
n
k=1

une moyenne pour chacune des modalités de chacun des deux critères de classifi-
cation (i = 1 , . . . , p d’une part, et j = 1 , . . . , q d’autre part) :

q n q p n p
1 XX 1X 1 XX 1X
x̄i.. = xijk = x̄ij. et x̄.j. = xijk = x̄ij. ,
q n j=1 q j=1 p n i=1 p i=1
k=1 k=1

6 En anglais : one observation per cell.


286 ANALYSE DE LA VARIANCE À DEUX CRITÈRES 10.2.2

et une moyenne générale :

p q n p q p q
1 XXX 1 XX 1X 1X
x̄... = xijk = x̄ij. = x̄i.. = x̄.j. .
p q n i=1 j=1 p q i=1 j=1 p i=1 q j=1
k=1

2◦ On peut alors subdiviser les écarts par rapport à la moyenne générale en


deux, puis en quatre composantes :

xijk − x̄... = (x̄ij. − x̄... ) + (xijk − x̄ij. )


= (x̄i.. − x̄... ) + (x̄.j. − x̄... ) + (x̄ij. − x̄i.. − x̄.j. + x̄... ) + (xijk − x̄ij. ) .

La première décomposition est identique à celle qui a été réalisée en analyse


de la variance à un critère de classification (§ 9.2.2.3◦ ). La seconde décomposition,
qui constitue le modèle observé de l’analyse de la variance à deux critères de clas-
sification, fait apparaı̂tre deux termes de variation factorielle, relatifs à l’un et
l’autre des deux facteurs, un terme dit d’interaction, et un terme de variation ré-
siduelle. Nous examinerons le terme d’interaction de façon plus précise au cours
du paragraphe 10.2.4.

3◦ Par élévation au carré et sommation pour les n p q observations, on obtient


ensuite l’équation d’analyse de la variance :
p X
X q X
n p
X q
X
(xijk − x̄... )2 = q n (x̄i.. − x̄... )2 + p n (x̄.j. − x̄... )2
i=1 j=1 k=1 i=1 j=1
p X
X q p X
X q X
n
+n (x̄ij. − x̄i.. − x̄.j. + x̄... )2 + (xijk − x̄ij. )2 .
i=1 j=1 i=1 j=1 k=1

Les deux premières composantes sont des sommes de carrés d’écarts factorielles,
la troisième est une somme de carrés d’écarts liée à l’interaction, et la quatrième
est une somme de carrés d’écarts résiduelle.
En affectant les lettres a et b , respectivement, à chacun des deux critères de
classification, et en désignant les différents termes par SCEt , SCEa , SCEb , SCEab
et SCEr , on peut écrire aussi, de façon simplifiée :

SCEt = SCEa + SCEb + SCEab + SCEr .

4◦ Aux différentes sommes des carrés des écarts, peuvent être associés des
nombres de degrés de liberté, qui sont liés par la relation :

p q n − 1 = (p − 1) + (q − 1) + (p − 1) (q − 1) + p q (n − 1) .
10.2.2 MODÈLES CROISÉS À EFFECTIFS ÉGAUX : ASPECTS DESCRIPTIFS 287

Il s’agit de p q n−1 degrés de liberté pour la somme totale, puisqu’elle fait intervenir
globalement les p q n observations individuelles, p−1 et q −1 degrés de liberté pour
les deux sommes factorielles, puisqu’elles sont calculées respectivement à partir de
p et de q moyennes, p q (n−1) degrés de liberté pour la somme résiduelle, puisqu’elle
fait intervenir p q échantillons de n observations, et par différence, (p − 1) (q − 1)
degrés de liberté pour la somme des carrés des écarts de l’interaction.

5◦ Enfin, en divisant les différentes sommes des carrés des écarts par leurs
nombres de degrés de liberté, on obtient les carrés moyens CMt , CMa , CMb ,
CMab et CMr .
L’ensemble des résultats peut alors être présenté sous la forme d’un tableau
d’analyse de la variance (tableau 10.2.1).

Tableau 10.2.1. Tableau d’analyse de la variance à deux critères


de classification, dans le cas des modèles croisés à effectifs égaux.

Sources Degrés Sommes des carrés Carrés


de variation de liberté des écarts moyens
Facteur a p−1 SCEa CMa
Facteur b q−1 SCEb CMb
Interaction (p − 1) (q − 1) SCEab CMab
Variation résiduelle p q (n − 1) SCEr CMr
Totaux pqn − 1 SCEt

Exemple 10.2.1. Comparaison de trois types de sondes dans deux types de sols :
analyse de la variance.
Au cours d’une étude relative aux problèmes d’échantillonnage du sol, on a
comparé, dans plusieurs types de sols, différents types de sondes destinées à préle-
ver des échantillons de terre, en effectuant chaque fois diverses analyses chimiques
[Hanotiaux, 1966]. On s’intéresse principalement aux différences qui pourraient
exister d’un type de sondes à l’autre et aux interférences éventuelles des types de
sondes avec les types de sols.
Le tableau 10.2.2 est relatif à deux types de sols, à trois types de sondes,
et aux teneurs en P2 O5 , exprimées en milligrammes par 100 grammes de terre
sèche, chacune des combinaisons sol-sonde ayant été l’objet de quatre prélève-
ments indépendants les uns des autres. Ce tableau présente à la fois les données
initiales xijk , et les moyennes par type de sols et type de sondes x̄ij. , par type
de sols x̄i.. , par type de sondes x̄.j. , et générale x̄... , toutes les moyennes étant
volontairement calculées avec une précision quelque peu abusive.
Le tableau 10.2.3 donne les résultats de l’analyse de la variance, sous l’angle
descriptif. Ce tableau peut être obtenu à l’aide de l’un ou l’autre logiciel statistique
ou selon la procédure qui sera l’objet du paragraphe 10.2.3.
288 ANALYSE DE LA VARIANCE À DEUX CRITÈRES 10.2.2

Tableau 10.2.2. Teneurs en P2 O5 , en mg par 100 g de terre sèche, et moyennes


observées, pour deux types de sols et trois types de sondes.

Sonde 1 Sonde 2 Sonde 3


(j = 1) (j = 2) (j = 3)
43 41 42
Sol 1 45 42 44
(i = 1) 46 43 46
53 44 48
40 35 37
Sol 2 40 37 39
(i = 2) 40 40 40
43 40 40
x̄ij. x̄i..
Sol 1 46,75 42,50 45,00 44,75
Sol 2 40,75 38,00 39,00 39,25
x̄.j. 43,75 40,25 42,00 42,00
(x̄... )

Tableau 10.2.3. Comparaison de trois types de sondes dans deux types de sols :
tableau partiel d’analyse de la variance (aspects descriptifs).

Sources Degrés Sommes des carrés Carrés


de variation de liberté des écarts moyens
Types de sols 1 181,5 181,5
Types de sondes 2 49,0 24,5
Interaction 2 3,0 1,5
Variation résiduelle 18 112,5 6,25
Totaux 23 346,0

Ce tableau met immédiatement en évidence une composante particulièrement


importante liée aux types de sols et basée sur les écarts :

x̄1.. − x̄... = 2,75 et x̄2.. − x̄... = − 2,75 .

De même, la composante, moins importante, relative aux types de sondes fait


intervenir les écarts :

x̄.1. − x̄... = 1,75 , x̄.2. − x̄... = − 1,75 et x̄.3. − x̄... = 0,00 .

Nous compléterons ultérieurement cette interprétation (exemple 10.3.1).


10.2.3 MODÈLES CROISÉS À EFFECTIFS ÉGAUX : ASPECTS DESCRIPTIFS 289

10.2.3 La réalisation de l’analyse de la variance


1◦ Comme pour un critère de classification (§ 9.2.2.7◦ ), l’analyse de la variance
à deux critères de classification est réalisée le plus souvent à l’aide de logiciels
qui font appel à des commandes de type ✭✭ anova ✮✮ ou ✭✭ glm ✮✮. Mais les différentes
sommes des carrés des écarts peuvent éventuellement être déterminées aussi de
manière ✭✭ manuelle ✮✮, par le calcul de sommes de carrés dont on doit soustraire des
termes correctifs.
Dans cette optique, nous désignerons par Xij. et SCEij , respectivement, les
sommes et les sommes des carrés des écarts relatives aux différentes séries d’obser-
vations, et aussi par Xi.. , X.j. et X... les sommes relatives aux différentes modalités
des deux critères de classification et la somme générale de toutes les observations.

2◦ Les différentes sommes des carrés des écarts peuvent alors être obtenues à
l’aide des relations suivantes, qui généralisent celles que nous avons présentées au
paragraphe 9.2.3 :
p X
X q X
n p
1 X 2
SCEt = x2ijk − 2
X... /(p q n) , SCEa = 2
X − X... /(p q n) ,
i=1 j=1 k=1
q n i=1 i..

q p q
1 X 2 2
XX
SCEb = X.j. − X... /(p q n) et SCEr = SCEij ,
p n j=1 i=1 j=1

la somme des carrés des écarts relative à l’interaction pouvant être calculée par
différence.

Exemple 10.2.2. Comparaison de trois types de sondes dans deux types de sols :
réalisation de l’analyse de la variance.
Pour les données du tableau 10.2.2, les différentes sommes sont :

X11. = 187, X12. = 170 , X13. = 180 , X21. = 163 , X22. = 152 , X23. = 156 ,

X1.. = 537, X2.. = 471 , X.1. = 350 , X.2. = 322 , X.3. = 336 , X... = 1.008 .

Calculées selon les principes habituels, les sommes des carrés des écarts relatives
aux six séries d’observations sont aussi :

SCE11 = 56,8 , SCE12 = 5,0 , SCE13 = 20,0 ,

SCE21 = 6,8 , SCE22 = 18,0 , SCE23 = 6,0 .

La somme des carrés des 24 observations individuelles est égale à 42.682 , et on


obtient alors très facilement le contenu du tableau 10.2.3 à l’aide des différentes
relations données ci-dessus.
290 ANALYSE DE LA VARIANCE À DEUX CRITÈRES 10.2.4

10.2.4 Les notions d’interaction et d’additivité


1◦ Les termes d’interaction 7 , à savoir x̄ij. − x̄i.. − x̄.j. + x̄... , apparaissent tout
naturellement dans le modèle observé d’analyse de la variance à deux critères de
classification, lorsqu’on veut équilibrer ce modèle après y avoir fait figurer les écarts
factoriels et résiduel x̄i.. − x̄... , x̄.j. − x̄... et xijk − x̄ij. (§ 10.2.2.2◦ ).
Ces termes d’interaction sont nuls quand les différences liées à l’action d’un des
deux facteurs ne dépendent pas de l’autre facteur, c’est-à-dire quand, par exemple,
les écarts x̄ij. − x̄.j. , relatifs au premier facteur, sont indépendants des modalités j
du deuxième facteur. En effet, quand ces écarts ne dépendent pas de j , ils sont tous
égaux entre eux, pour chaque valeur de i , et donc égaux aussi à leur moyenne :

x̄i1. − x̄.1. = . . . = x̄ij. − x̄.j. = . . . = x̄iq. − x̄.q. = x̄i.. − x̄... .

On a alors, pour tout i et tout j :

x̄ij. − x̄i.. − x̄.j. + x̄... = 0 .

De même, les termes d’interaction sont nuls quand les écarts x̄ij. − x̄i.. , relatifs
au deuxième facteur, sont indépendants de i , c’est-à-dire du premier facteur. En
outre, ces deux conditions de nullité des termes d’interaction sont strictement
équivalentes, la première entraı̂nant toujours la seconde et réciproquement.
Quand tous les termes d’interaction x̄ij. − x̄i.. − x̄.j. + x̄... sont nuls, on dit que
l’interaction est nulle ou qu’il n’y a pas d’interaction.

2◦ Dans ce cas, on peut aussi écrire que, pour tout i et tout j :

x̄ij. − x̄... = (x̄i.. − x̄... ) + (x̄.j. − x̄... ) ,

c’est-à-dire que l’effet conjoint des deux facteurs est égal à la somme de leurs deux
effets individuels. Le modèle d’analyse de la variance est alors dit additif 8 .
La notion de non-interaction, ou d’absence d’interaction, se confond donc avec
celle d’additivité 9 , de même que la notion d’interaction, ou de présence d’une
interaction, se confond avec celle de non-additivité 10 .

3◦ Quand certains des termes d’interaction ne sont pas nuls, et surtout dans
le cas particulier 2 × 2 (p = q = 2), on parle parfois de synergie ou d’antagonisme,
selon que l’interaction est positive ou négative.
Si par exemple, l’apport simultané d’une fumure azotée et d’une fumure potas-
sique provoque, par comparaison avec un témoin sans engrais, un accroissement
de rendement supérieur à la somme des accroissements de rendement qui seraient
7 En anglais : interaction.
8 En anglais : additive model.
9 En anglais : additivity.
10 En anglais : non-additivity.
10.2.4 MODÈLES CROISÉS À EFFECTIFS ÉGAUX : ASPECTS DESCRIPTIFS 291

liés, séparément, aux deux fumures, on peut dire qu’il y a synergie entre les deux
fumures.
Si au contraire, l’accroissement de rendement lié à la double fumure est infé-
rieur à la somme des accroissements de rendement liés aux deux fumures simples,
on peut dire qu’il y a un certain antagonisme entre les fumures.

d 4◦ La notion d’interaction et son interprétation sont l’objet d’une bibliographie


importante, dont on peut citer notamment Berrington de González et Cox
b [2007], Corsten et Denis [1990], et Goodman et Haberman [1990].

Exemple 10.2.3. Comparaison de trois types de sondes dans deux types de sols :
absence d’interaction entre les deux facteurs.
À partir des moyennes qui figurent dans la partie inférieure du tableau 10.2.2,
on peut facilement calculer les six termes d’interaction, qui sont égaux à :
0,25 , – 0,50 , 0,25 ,
– 0,25 , 0,50 , – 0,25 ,
les deux lignes étant toujours relatives aux deux types de sols et les trois colonnes
aux trois types de sondes. On notera que les sommes de ces termes sont toutes
nulles, tant horizontalement que verticalement, et bien sûr globalement.
Ces valeurs, toutes très faibles, témoignent de la quasi-absence d’interaction.
À peu de chose près, les différences entre types de sondes sont donc identiques
d’un type de sols à l’autre, et les différences entre types de sols ne dépendent pas
non plus des sondes utilisées pour effectuer les prélèvements de terre.

Exemple 10.2.4. Étude de l’influence de la durée d’éclairement et de la gibbé-


relline sur la croissance en hauteur de Bryophyllum : interaction entre les deux
facteurs.
En vue de présenter une situation tout à fait différente, nous considérons aussi
les résultats de mesures de hauteur effectuées sur 72 individus d’une mousse du
genre Bryophyllum. Ces 72 individus avaient été affectés au hasard et en nombres
égaux (n = 12) à six traitements, correspondant à deux durées d’éclairement
(8 h et 16 h d’éclairement par jour) et trois niveaux d’application d’une subs-
tance de croissance, la gibbérelline, dont on souhaite étudier l’influence (absence
de gibbérelline, dose 1 et dose 2) [Marcelle, 1969].
Les différentes moyennes, exprimées en millimètres, sont présentées sous forme
numérique dans le tableau 10.2.4 et sous forme graphique dans la figure 10.2.1, les
observations individuelles allant de 52 à 118 mm. Les résultats de l’analyse de la
variance seront discutés ultérieurement (exemple 10.3.3).
Les différences entre les lignes ✭✭ 8 h ✮✮ et ✭✭ 16 h ✮✮ du tableau 10.2.4, de même
que la représentation graphique et les termes d’interaction qui pourraient être
calculés comme dans l’exemple précédent, tout concourt à mettre en évidence une
interaction très marquée entre les deux facteurs. La différence de croissance en
292 ANALYSE DE LA VARIANCE À DEUX CRITÈRES 10.2.4

Tableau 10.2.4. Étude de l’influence de la durée d’éclairement et


de la gibbérelline sur la croissance en hauteur de Bryophyllum :
hauteurs moyennes observées, en millimètres.

Durées Gibbérelline
x̄i..
d’éclair. Absence Dose 1 Dose 2
8h 63,8 102,5 106,7 91,0
16 h 75,3 93,1 100,3 89,6
x̄.j. 69,6 97,8 103,5 90,3

110 8 heures

100
Hauteur (mm)

90 16 heures

80

70

60
Absence Dose 1 Dose 2
Gibbérelline

Figure 10.2.1. Étude de l’influence de la durée d’éclairement et


de la gibbérelline sur la croissance en hauteur de Bryophyllum :
représentation graphique des hauteurs moyennes observées,
en fonction des deux facteurs considérés.

hauteur, due à la différence de durée d’éclairement, est en effet positive et de


l’ordre de 12 mm, en l’absence de gibbérelline, alors qu’elle est négative et de
l’ordre de 8 mm en moyenne, en présence de gibbérelline, pour les deux doses
envisagées.
On remarquera aussi que ces différences positive et négative se compensent
très largement, puisque la différence marginale liée au facteur durées d’éclairement
est quasi nulle (1,4 mm). Il s’agit d’un exemple typique d’antagonisme entre les
deux facteurs considérés (augmentation de la durée d’éclairement et application
de gibbérelline).
Graphiquement, l’absence d’interaction serait caractérisée par le fait que les
deux lignes brisées de la figure 10.2.1 seraient confondues, en l’absence d’effet de
la durée d’éclairement, ou simplement décalées l’une par rapport à l’autre, mais
en conservant le parallélisme de leurs différents segments, en présence d’un effet de
la durée d’éclairement. Au contraire, l’intersection des lignes brisées est un indice
flagrant de l’existence d’une interaction.
10.3.1 MODÈLES CROISÉS À EFFECTIFS ÉGAUX : ASPECTS INFÉRENTIELS 293

10.2.5 Le cas des échantillons d’une seule observation


1◦ Très souvent, on ne dispose que d’une seule observation (n = 1), pour cha-
cune des combinaisons des différentes modalités des deux critères de classification.
Aucun terme résiduel n’apparaı̂t alors dans le modèle observé, puisque les
moyennes x̄ij. se confondent avec les observations individuelles xij1 . En vue d’al-
léger les notations, on peut d’ailleurs supprimer le troisième indice, devenu super-
flu, et supprimer aussi le point qui remplace cet indice dans les symboles relatifs
aux moyennes. Par analogie avec le cas général (§ 10.2.2.2◦ ), on peut écrire en
conséquence :

xij − x̄.. = (x̄i. − x̄.. ) + (x̄.j − x̄.. ) + (xij − x̄i. − x̄.j + x̄.. ) .

2◦ De même, l’équation d’analyse de la variance devient :

SCEt = SCEa + SCEb + SCEab .

Aucune autre modification n’intervient en ce qui concerne les aspects descriptifs de


l’analyse, si ce n’est le fait que la ligne ✭✭ variation résiduelle ✮✮ disparaı̂t du tableau
d’analyse de la variance (tableau 10.2.1), et que le nombre de degrés de liberté de
la variation totale est égal à p q − 1 , au lieu de p q n − 1 .

d 3◦ Quant à la réalisation des calculs, les formules du paragraphe 10.2.3 peuvent


toujours être utilisées, en remplaçant éventuellement les symboles Xi.. , X.j. et X... ,
par Xi. , X.j et X.. , et en ne faisant pas intervenir de somme de carrés d’écarts
b résiduelle.

10.3 Les modèles croisés à effectifs égaux :


aspects inférentiels
10.3.1 Principes généraux
1◦ Nous consacrerons tout d’abord trois paragraphes distincts aux trois mo-
dèles croisés d’analyse de la variance à deux critères de classification : le modèle
fixe, qui correspond au cas où les deux critères de classification sont des critères
fixes (§ 10.3.2), le modèle aléatoire, qui correspond au cas où les deux critères de
classification sont des critères aléatoires, constitués chacun d’une infinité ou une
quasi-infinité de modalités (§ 10.3.3), et le modèle mixte, qui correspond au cas où
les deux critères de classification sont l’un fixe et l’autre aléatoire (§ 10.3.4). Nous
suivrons chaque fois le même raisonnement que pour l’analyse de la variance à un
critère de classification (§ 9.3.2 et 9.3.3).
À ce stade, nous ne considérerons toutefois que le cas général, relatif à des
échantillons de plus d’une observation (n > 1). Nous présenterons aussi, à ce
294 ANALYSE DE LA VARIANCE À DEUX CRITÈRES 10.3.2

propos, un tableau récapitulatif accompagné d’un certain nombre de commentaires


(§ 10.3.5).
Nous envisagerons ensuite le cas des échantillons d’une seule observation
(§ 10.3.6), le problème particulier des observations successives, réalisées sur les
mêmes individus à différentes dates ou à différents moments (§ 10.3.7), et les
méthodes non paramétriques et robustes (§ 10.3.8).

d 2◦ D’autres modèles que ceux auxquels nous venons de faire allusion ont
également été proposés, en vue de tenir compte notamment d’effets multiplica-
tifs et non plus additifs, et de nombres de modalités finis et non plus infinis ou
quasi infinis, pour certains critères de classification aléatoires [Dias et Krza-
nowski, 2003 ; Gauch et al., 2008 ; Sabaghnia et al., 2008 ; Searle et Fawcett,
1970]. Il s’agit en particulier des modèles à effets principaux additifs et interac-
tion multiplicative 11 , utilisés notamment dans l’étude des interactions génotype-
12
b environnement .

10.3.2 Le modèle fixe : échantillons de plusieurs observations


1◦ Si on suppose que les p q séries d’observations dont il a été question au
paragraphe 10.2.2.1◦ proviennent de p q populations, on peut désigner les moyennes
de ces populations par mij . On peut en déduire aussi les moyennes suivantes,
relatives aux différentes modalités des deux critères de classification :
q p
1X 1X
mi. = mij et m.j = mij ,
q j=1 p i=1

ainsi que la moyenne générale :


p q p q
1 XX 1X 1X
m.. = mij = mi. = m.j .
p q i=1 j=1 p i=1 q j=1

2◦ Le modèle théorique, correspondant au modèle observé du paragraphe


10.2.2.2◦ , s’écrit alors :

Xijk − m.. = ai + bj + cij + Dijk .

Dans ce modèle, les effets principaux ai et bj sont des constantes, de sommes


nulles, définies à partir des différentes moyennes :

ai = mi. − m.. et bj = m.j − m.. .


11 En anglais : additive main effects and multiplicative interaction model, AMMI model.
12 En anglais : genotype-environment interaction.
10.3.2 MODÈLES CROISÉS À EFFECTIFS ÉGAUX : ASPECTS INFÉRENTIELS 295

Les termes cij , parfois désignés aussi par (ab)ij , sont également des constantes,
et représentent l’interaction des deux critères de classification. Ces valeurs sont
définies de la manière suivante, par analogie avec le modèle observé (§ 10.2.2.2◦ ) :
cij = (ab)ij = mij − mi. − m.j + m.. .
Elles doivent être interprétées comme précédemment (§ 10.2.4), et en particulier,
elles sont également de sommes nulles, tant pour les sommations portant sur un
indice à la fois, que pour la sommation globale sur les deux indices.
Enfin, les quantités Dijk sont des variables aléatoires qui, dans les conditions
du paragraphe 10.1.3◦ , sont normales, indépendantes, de moyennes nulles et de
même variance σ 2 .

3◦ Les hypothèses nulles auxquelles on s’intéresse sont ici au nombre de trois.


Les deux premières ont trait à l’absence d’effet des deux facteurs, considérés sépa-
rément :
H0 : a1 = a2 = . . . = ap = 0 ou m1. = m2. = . . . = mp.

et H00 : b1 = b2 = . . . = bq = 0 ou m.1 = m.2 = . . . = m.q ,

tandis que la troisième concerne l’absence d’interaction :


H000 : c11 = c12 = . . . = cpq = 0 .

4◦ Toujours dans les mêmes conditions que ci-desssus, et par une procédure
semblable à celle que nous avons adoptée dans le cas de l’analyse de la variance à
un critère de classification (§ 9.3.5), on peut démontrer que les espérances mathé-
matiques des carrés moyens sont :

p q
qn X 2 pn X 2
E(CMa ) = σ 2 + a , E(CMb ) = σ 2 + b ,
p − 1 i=1 i q − 1 j=1 j

XXp q
n
E(CMab ) = σ 2 + c2 et E(CMr ) = σ 2 .
(p − 1) (q − 1) i=1 j=1 ij

5◦ Quand les différentes hypothèses nulles sont vraies, les distributions d’échan-
tillonnage des sommes des carrés des écarts, divisées par σ 2 , sont toutes des dis-
tributions χ2 , indépendantes les unes des autres et dont les nombres de degrés de
liberté sont ceux que nous avons donnés au paragraphe 10.2.2.4◦ . On peut donc
procéder facilement aux différents tests d’hypothèses.

6◦ Pour éviter tout risque d’interprétation erronée au sujet des facteurs prin-
cipaux, il est préférable de réaliser pour commencer le test relatif à l’interaction.
296 ANALYSE DE LA VARIANCE À DEUX CRITÈRES 10.3.2

À cette fin, on calcule la quantité :

Fab = CMab /CMr ,

et on rejette l’hypothèse H000 , au niveau de probabilité α , quand cette quantité est


trop élevée, c’est-à-dire quand :

P(F ≥ Fab ) ≤ α ou Fab ≥ F1−α ,

avec (p − 1) (q − 1) et p q (n − 1) degrés de liberté.


En l’absence d’interaction, les tests relatifs aux deux critères de classification
peuvent ensuite être réalisés en calculant les valeurs :

Fa = CMa /CMr et Fb = CMb /CMr ,

et en rejetant éventuellement les hypothèses H0 et H00 , dans des conditions sem-


blables, mais avec des nombres de degrés de liberté égaux respectivement à p − 1
et p q (n − 1) d’une part, q − 1 et p q (n − 1) d’autre part.
En présence d’une interaction significative, il faut au contraire éviter d’effectuer
ces tests et procéder à une ou plusieurs décompositions alternatives de la somme
des carrés des écarts totale, ainsi que le montre notamment l’exemple 10.3.3. De
telles décompositions peuvent être considérées comme des cas particuliers d’utili-
sations de contrastes (§ 12.2.1) [Schabenberger et al., 2000].

7◦ Comme en analyse de la variance à un critère de classification (§ 9.3.2.8◦ ),


les moyennes observées sont des estimations non biaisées des moyennes théoriques
correspondantes, de même que le carré moyen résiduel est toujours une estimation
non biaisée de σ 2 . On peut en déduire, selon les mêmes principes, des limites de
confiance pour les moyennes, pour les différences de moyennes et pour la variance.
On a par exemple, pour la moyenne relative à une modalité donnée du premier
facteur et pour une différence de deux moyennes relatives à ce facteur :
p p
x̄i.. ± t1−α/2 CMr /(q n) et x̄i.. − x̄i0 .. ± t1−α/2 2 CMr /(q n) ,

la variable t de Student étant une variable à p q (n − 1) degrés de liberté. Le divi-


seur q n qui apparaı̂t dans les deux cas correspond en fait au nombre d’observations
qui interviennent dans le calcul de chacune des moyennes considérées.

Exemple 10.3.1. Comparaison de trois types de sondes dans deux types de sols :
suite de l’analyse de la variance.
Nous poursuivons ici l’analyse de la variance qui a été l’objet de l’exemple
10.2.1, en effectuant les tests d’hypothèses et en calculant les estimations et les
limites de confiance qui s’imposent. En ce qui concerne les tests, le tableau 10.3.1
complète le tableau 10.2.1, en en donnant les résultats.
10.3.2 MODÈLES CROISÉS À EFFECTIFS ÉGAUX : ASPECTS INFÉRENTIELS 297

Tableau 10.3.1. Comparaison de trois types de sondes dans deux types de sols :
tableau complet d’analyse de la variance.

Sources Degrés Sommes des carrés Carrés


F P
de variation de liberté des écarts moyens
Types de sols 1 181,5 181,5 29,0 *** 0,0000
Types de sondes 2 49,0 24,5 3,92 * 0,039
Interaction 2 3,0 1,5 0,24 0,79
Variation résiduelle 18 112,5 6,25
Totaux 23 346,0

On constate tout d’abord que l’interaction est non significative. Le test confirme
donc la conclusion intuitive de l’exemple 10.2.3, à savoir que les différences entre
types de sondes ne dépendent pas des types de sols et vice versa 13 .
Par contre, les différences observées sont très hautement significatives en ce
qui concerne les types de sols, et juste significatives en ce qui concerne les types
de sondes.
L’estimation et les limites de confiance de la différence existant entre les deux
types de sols seraient, pour un degré de confiance égal à 0,95 (table II) :

x̄1.. − x̄2.. = 44,75 − 39,25 = 5,50 ou 5,5 mg/100 g


p
et 5,50 ± 2,101 2 (6,25)/12 = 5,50 ± 2,14 = 3,4 et 7,6 mg/100 g .

Cette information n’est cependant pas essentielle, en regard des objectifs de l’étude
(exemple 10.2.1).
La comparaison, plus intéressante, des trois types de sondes est un problème qui
peut être traité notamment par la méthode de Newman et Keuls (§ 12.4.3). Cette
méthode permet de montrer que les résultats obtenus à l’aide du premier type de
sondes sont significativement supérieurs aux résultats fournis par le deuxième type
de sondes, le troisième type conduisant à des résultats intermédiaires, qui ne sont
pas significativement différents des deux autres. La différence entre les moyennes
extrêmes, qui concernent le premier et le deuxième type de sondes, et les limites
de confiance correspondantes sont (table II) :

x̄.1. − x̄.2. = 43,75 − 40,25 = 3,50 ou 3,5 mg/100 g


p
et 3,50 ± 2,101 2 (6,25)/8 = 3,50 ± 2,63 = 0,9 et 6,1 mg/100 g .

13 Ainsi que nous l’avons déjà signalé dans le ✭✭ mode d’emploi ✮✮ qui suit la table des matières, la

présence simultanée d’astérisques et de valeurs de probabilités dans certains tableaux d’analyse


de la variance ne s’impose absolument pas. Nous faisons cependant figurer ces deux types de
mentions en parallèle, afin de permettre au lecteur de comparer les deux approches et d’en
adopter l’une ou l’autre en pleine connaissance de cause.
298 ANALYSE DE LA VARIANCE À DEUX CRITÈRES 10.3.2

Exemple 10.3.2. Comparaison de trois types de sondes dans deux types de sols :
contrôle des conditions d’application de l’analyse de la variance.
À titre d’exemple, nous procédons une nouvelle fois de façon assez détaillée au
contrôle des conditions d’application de l’analyse de la variance, dans le cas que
nous venons d’envisager (exemple 10.3.1). Nous considérons ce contrôle dans l’op-
tique que nous avons présentée antérieurement (exemple 9.3.2), à savoir un rapide
examen des données initiales, un contrôle de la normalité, une identification des
éventuelles observations aberrantes, et un contrôle de l’égalité des variances.
L’examen des données initiales ne met en évidence aucune anomalie flagrante
(tableau 10.2.2).
Le contrôle de la condition de normalité peut être réalisé par le calcul des
résidus ou des résidus réduits de l’analyse de la variance, et la préparation d’un
diagramme de probabilité relatif à ces résidus (figure 10.3.1). Ce diagramme est
globalement linéaire, à l’exception dans une certaine mesure d’une valeur extrême
particulièrement élevée.

2
Quantiles normaux

-1

-2
-2 -1 0 1 2 3
Résidus réduits

Figure 10.3.1. Comparaison de trois types de sondes dans deux types de sols :
diagramme de probabilité relatif aux résidus réduits de l’analyse de la variance
à deux critères de classification.

Le résidu suspect est égal à 6,25 et correspond à la valeur observée de 53 mg


de P2 O5 par 100 g de terre sèche (x114 ). La valeur réduite de ce résidu est égale
à 2,89 , et au sens de la méthode de Grubbs, dépasse le maximum admissible au
niveau de probabilité 0,05 (table VI) :

(d0max )0,975 = 2,754 ou 2,75 .

Cette valeur ne dépasse toutefois pas la valeur limite 3,049 ou 3,05 , relative au
niveau de probabilité 0,01 .
Enfin, le contrôle de l’égalité des variances peut être réalisé par la méthode
de Levene (§ 7.5.3), c’est-à-dire par l’analyse de la variance relative aux valeurs
absolues des résidus ou des résidus réduits. Cette analyse se présente exactement
10.3.2 MODÈLES CROISÉS À EFFECTIFS ÉGAUX : ASPECTS INFÉRENTIELS 299

comme celle de l’exemple 10.3.1 (tableau 10.3.1) et donne les valeurs suivantes des
variables F de Fisher-Snedecor :

Fa = 1,69 , Fb = 0,66 et Fab = 2,96 .

Pour les mêmes nombres de degrés liberté que précédemment, les probabilités
correspondantes sont respectivement égales à 0,21 , 0,53 et 0,077. Aucune anomalie
significative n’apparaı̂t donc à ce sujet.
La seule question qui se pose est celle de savoir s’il y a lieu d’écarter ou non
la valeur 53 de l’analyse finale. En l’absence d’éléments objectifs, résultant d’un
retour à l’origine de cette valeur (contrôle de la localisation du prélèvement de
l’échantillon de terre concerné, recherche d’éventuelles anomalies observées lors de
la préparation de l’échantillon ou de la réalisation de l’analyse chimique, recherche
d’éventuelles erreurs de transcription, etc.), nous aurions tendance à conserver
cette valeur.
On pourrait nous rétorquer que, dans un autre cas, nous avons préconisé au
contraire l’élimination de valeurs aberrantes, sans aucune base objective extérieure
aux données observées elles-mêmes (exemple 3.6.2). Il faut noter que les anomalies
constatées étaient beaucoup plus importantes dans ce cas, les écarts réduits maxi-
mums observés dépassant non seulement la limite relative au niveau de probabilité
0,05 , mais aussi, très largement, la limite relative au niveau de probabilité 0,01 .
Nous reviendrons ultérieurement sur ce problème, en montrant quelle peut
être l’influence de la valeur suspecte sur les résultats de l’analyse de la variance
(exemple 10.4.1).
d Nous avons signalé antérieurement que le recours aux valeurs limites de la
table VI ne constitue qu’une solution approchée, surtout pour des effectifs aussi
réduits que ceux qui sont considérés ici (§ 3.5.3.4◦ ). Pour mesurer la qualité de
cette approximation, on peut noter que les valeurs limites exactes, données par
Lund [1975] ou calculées à l’aide de la relation du paragraphe 3.5.3.4◦ , sont 2,80
et 3,09 , au lieu de 2,75 et 3,05 .
De même, l’utilisation de la méthode de Levene, avec des nombres de degrés
de liberté non corrigés, est aussi une approximation, qui ne prête toutefois pas à

b conséquence (§ 7.5.3.3 ).

Exemple 10.3.3. Étude de l’influence de la durée d’éclairement et de la gibbé-


relline sur la croissance en hauteur de Bryophyllum : analyse de la variance.
Le tableau 10.3.2 présente les résultats de l’analyse de la variance relative
au problème que nous avons évoqué, en matière d’interaction, dans le cadre de
l’exemple 10.2.4. Comme l’examen des moyennes nous l’avait fait supposer, ce
tableau met en évidence une interaction très significative entre les facteurs durées
d’éclairement et gibbérelline.
Une telle conclusion relative à l’interaction enlève toute valeur aux tests qui
pourraient être réalisés globalement pour chacun des deux facteurs principaux. La
300 ANALYSE DE LA VARIANCE À DEUX CRITÈRES 10.3.2

Tableau 10.3.2. Étude de l’influence de la durée d’éclairement et


de la gibbérelline sur la croissance en hauteur de Bryophyllum :
premier tableau d’analyse de la variance.

Degrés S. des carrés Carrés


Sources de variation F P
de liberté des écarts moyens
Durées d’éclairement 1 36 36 0,48 0,49
Gibbérelline 2 15.829 7.915 105 *** 0,0000
Interaction 2 1.530 765 10,1 *** 0,0001
Variation résiduelle 66 4.988 75,6
Totaux 71 22.383

présence d’une interaction significative implique en effet que l’action de chacun des
facteurs dépend des modalités prises en considération pour l’autre facteur. L’in-
fluence de chacun des facteurs doit alors être envisagée de manière séparée pour
chacune des modalités de l’autre facteur.
Dans cette optique, on peut construire le tableau 10.3.3, qui présente deux
subdivisions alternatives de la somme des carrés des écarts totale.

Tableau 10.3.3. Étude de l’influence de la durée d’éclairement et


de la gibbérelline sur la croissance en hauteur de Bryophyllum :
deuxième tableau d’analyse de la variance.

Degrés S. des carrés Carrés


Sources de variation F P
de liberté des écarts moyens
Durées d’éclairement 1 36 36
Gibbérelline / 8 heures 2 13.389 6.694 88,6 *** 0,0000
Gibbérelline / 16 heures 2 3.970 1.985 26,3 *** 0,0000
Variation résiduelle 66 4.988 75,6
Gibbérelline 2 15.829 7.915
Éclairement / absence 1 793 793 10,5 ** 0,0019
Éclairement / dose 1 1 532 532 7,04 ** 0,010
Éclairement / dose 2 1 241 241 3,18 0,079
Variation résiduelle 66 4.988 75,6
Totaux 71 22.383

Dans la première partie de ce tableau, on retrouve tout d’abord les deux lignes
du tableau 10.3.2 qui sont relatives au facteur durées d’éclairement et à la variation
résiduelle.
Les lignes qui concernent le facteur gibbérelline et l’interaction ont par contre
été regroupées, puis subdivisées d’une autre manière. La ligne ✭✭ gibbérelline /
8 heures ✮✮ est relative à l’influence de la gibbérelline pour la durée d’éclairement
10.3.2 MODÈLES CROISÉS À EFFECTIFS ÉGAUX : ASPECTS INFÉRENTIELS 301

de 8 heures. Elle correspond à ce que serait la ligne ✭✭ gibbérelline ✮✮ dans le cas d’une
analyse de la variance à un critère de classification limitée aux seules informations
relatives à la durée d’éclairement de 8 heures.
La ligne ✭✭ gibbérelline / 16 heures ✮✮ caractérise de la même manière l’influence
de la gibbérelline pour la durée d’éclairement de 16 heures.
Inversement, le regroupement des lignes ✭✭ durées d’éclairement ✮✮ et ✭✭ interac-
tion ✮✮ du tableau 10.3.2 et la subdivision des totaux ainsi obtenus en trois com-
posantes permettent d’obtenir les trois lignes centrales de la deuxième partie du
tableau 10.3.3. Ces trois lignes mettent en évidence l’importance du facteur durées
d’éclairement, séparément, pour les trois niveaux d’application de gibbérelline (ab-
sence de gibbérelline, dose 1 et dose 2).
Il apparaı̂t ainsi clairement que la gibbérelline a une influence très hautement si-
gnificative pour les deux durées d’éclairement, et que la durée d’éclairement n’inter-
vient de façon significative qu’en l’absence de gibbérelline et pour la dose inférieure
de cette substance de croissance. Nous affinerons encore cette interprétation au
cours de l’exemple 12.2.1, en utilisant alors la notion de contraste.
d Le tableau 10.3.4 donne en outre les totaux relatifs aux différents traitements
et groupes de traitements, à raison de 12 observations pour chacune des cellules de
la partie centrale du tableau, et respectivement 36 et 24 observations pour chacune
des lignes et chacune des colonnes du tableau. Ces totaux, qui correspondent aux
moyennes présentées dans le tableau 10.2.4, permettent de bien comprendre, si on
le souhaite, l’origine des différents éléments qui figurent dans le tableau 10.3.3.

Tableau 10.3.4. Étude de l’influence de la durée d’éclairement et


de la gibbérelline sur la croissance en hauteur de Bryophyllum :
totaux relatifs aux différents traitements, en millimètres.

Durées Gibbérelline
Xi..
d’éclair. Absence Dose 1 Dose 2
8h 766 1.230 1.280 3.276
16 h 904 1.117 1.204 3.225
X.j. 1.670 2.347 2.484 6.501

En ce qui concerne le facteur gibbérelline, on a successivement, selon la procé-


dure indiquée au paragraphe § 9.2.3.4◦ :

(7662 + 1.2302 + 1.2802 )/12 − 3.2762 /36 = 13.389

et (9042 + 1.1172 + 1.2042 )/12 − 3.2252 /36 = 3.970 .

On peut vérifier que le total de ces deux composantes est bien égal au total des
lignes du tableau 10.3.2 relatives au facteur gibbérelline et à l’interaction.
302 ANALYSE DE LA VARIANCE À DEUX CRITÈRES 10.3.3

Quant au facteur durées d’éclairement, on a par exemple, pour la première


colonne du tableau 10.3.4 :

b (7662 + 9042 )/12 − 1.6702 /24 = 793 .

10.3.3 Le modèle aléatoire : échantillons de plusieurs


observations
1◦ Dans le cas du modèle aléatoire, on considère une double infinité ou quasi-
infinité de populations et, en vue de comparer les moyennes de ces populations,
on réalise un échantillonnage à deux degrés, semblable à celui dont il a été ques-
tion au paragraphe 9.3.1.1◦ . On choisit tout d’abord au hasard p q populations
(unités du premier degré), correspondant à p variantes du premier critère de clas-
sification et q variantes du deuxième critère de classification. On choisit ensuite,
indépendamment dans chacune de ces p q populations, un échantillon d’un effectif
que nous supposerons constant et égal à n (unités du deuxième degré).
Tel pourrait être le cas par exemple si on souhaitait chiffrer, simultanément,
l’importance des écarts entre les résultats obtenus à l’aide de différents appareils
de mesure d’un même type et par différents opérateurs susceptibles d’utiliser ces
appareils. On pourrait alors choisir au hasard, d’une part, p exemplaires de l’appa-
reil auquel on s’intéresse, et d’autre part, q opérateurs, auxquels on demanderait
d’effectuer chacun un même nombre n de mesures à l’aide de chacun des appareils.

2◦ Dans ces conditions, les moyennes théoriques relatives aux populations qui
sont l’objet d’observations doivent être considérées comme aléatoires. Nous les
désignerons par Mij , Mi. et M.j .
Dans l’exemple qui vient d’être considéré, Mij serait la moyenne théorique
de l’ensemble des mesures qui pourraient être réalisées par l’opérateur j à l’aide
de l’appareil i , Mi. serait la moyenne théorique de l’ensemble des mesures qui
pourraient être réalisées à l’aide de l’appareil i , pour l’ensemble des opérateurs,
et M.j serait la moyenne théorique de l’ensemble des mesures qui pourraient être
réalisées par l’opérateur j , pour l’ensemble des appareils. La moyenne générale
de l’ensemble de toutes les mesures qui pourraient être réalisées, quel que soit
l’appareil et quel que soit l’opérateur, reste une constante, que nous continuerons
à désigner par m.. .

3◦ En conséquence, les effets principaux et les termes d’interaction sont eux


aussi aléatoires et deviennent :
Ai = Mi. − m.. , Bj = M.j − m.. et Cij = (AB)ij = Mij − Mi. − M.j + m.. .

Le modèle théorique est alors :

Xijk − m.. = Ai + Bj + Cij + Dijk .


10.3.3 MODÈLES CROISÉS À EFFECTIFS ÉGAUX : ASPECTS INFÉRENTIELS 303

En plus des conditions définies au paragraphe 10.1.3◦ , on doit supposer que les
variables aléatoires Ai , Bj et Cij sont toutes normales, indépendantes les unes
des autres, de moyennes nulles, et de variances constantes, respectivement égales à
2 2 2
σA , σB et σC . En raison des hypothèses formulées quant au caractère aléatoire et
simple de l’échantillonnage, ces variables sont également indépendantes des écarts
résiduels Dijk .

4◦ Les trois hypothèses nulles sont dans ces conditions :


2
H0 : σA = 0 , H00 : σB
2
= 0 et H000 : σC
2
= 0.

Comme pour le modèle fixe, les deux premières ont trait, séparément, aux deux
critères de classification, tandis que la troisième est relative à l’interaction des deux
critères.
Toutefois, une nuance importante doit être introduite, dans la mesure où ces
hypothèses concernent, non pas seulement les p q populations pour lesquelles des
observations sont disponibles, mais bien la double infinité ou quasi-infinité des
populations considérées au départ. Comme en analyse de la variance à un critère
de classification, la nullité de la variance implique dans chaque cas l’égalité des
moyennes de toutes les populations considérées (§ 9.3.3.5◦ ).

5◦ Les espérances mathématiques des carrés moyens sont alors :

E(CMa ) = σ 2 + n σC
2 2
+ q n σA , E(CMb ) = σ 2 + n σC
2 2
+ p n σB ,

E(CMab ) = σ 2 + n σC
2
et E(CMr ) = σ 2 .

2
On observe que la composante σC , relative à l’interaction, intervient ici, non seule-
ment dans l’espérance mathématique du carré moyen de l’interaction, mais aussi
dans les espérances mathématiques des deux carrés moyens factoriels. Pour s’as-
2 2
surer de la nullité de σA et de σB , il faudra donc comparer les carrés moyens
factoriels CMa et CMb , non pas au carré moyen résiduel CMr , mais bien au carré
moyen de l’interaction CMab .

6◦ Toujours dans les conditions définies ci-dessus, on peut démontrer que,


quand les différentes hypothèses nulles sont vraies, les distributions d’échantillon-
nage des sommes des carrés des écarts, divisées par σ 2 , sont des distributions χ2 ,
indépendantes les unes des autres et de mêmes nombres de degrés de liberté que
précédemment.

7◦ En fonction de tout ce qui vient d’être dit, le test de l’hypothèse H000 , relative
à l’interaction, doit être réalisé comme dans le cas du modèle fixe (§ 10.3.2.6◦ ).
Les tests relatifs aux deux autres hypothèses doivent être réalisés, par contre, en
304 ANALYSE DE LA VARIANCE À DEUX CRITÈRES 10.3.4

calculant les valeurs :

Fa = CMa /CMab et Fb = CMb /CMab ,

et en se référant aux distributions F de Fisher-Snedecor à p−1 et (p−1) (q −1)


degrés de liberté d’une part, q − 1 et (p − 1) (q − 1) degrés de liberté d’autre part.

8◦ Il est en outre possible d’estimer comme suit les différentes composantes de


la variance :

2 2
σ
bA = (CMa − CMab )/(q n) , σ
bB = (CMb − CMab )/(p n) ,

2
σ
bC = (CMab − CMr )/n et b2 = CMr ,
σ

en se limitant chaque fois aux cas où les différences de carrés moyens sont positives.
Des limites de confiance peuvent également être déterminées par des procédures
analogues à celles que nous avons présentées en analyse de la variance à un critère
de classification (§ 9.3.3.7◦ ).

10.3.4 Le modèle mixte : échantillons de plusieurs


observations

1◦ Dans le cas du modèle mixte, on considère une simple infinité ou quasi-


infinité de populations, l’un des critères de classification, par exemple le premier,
possédant un nombre fini p de modalités, et l’autre possédant un nombre infini,
ou au moins un très grand nombre de modalités. Pour comparer les moyennes de
l’ensemble des populations, on réalise également un échantillonnage à deux degrés,
mais au premier degré, l’échantillonnage ne concerne que le critère de classification
qui possède une infinité ou une quasi-infinité de modalités. On choisit au hasard un
nombre fini q de ces modalités et on y associe les p modalités du critère fixe. Comme
précédemment, on choisit ensuite, indépendamment dans chacune des p q popula-
tions ainsi définies, un échantillon d’un effectif que nous supposerons également
constant et égal à n .
Une telle situation se présente par exemple quand on souhaite comparer les
résultats de p méthodes de mesures données, qui peuvent être appliquées à un
ensemble infini ou quasi infini d’objets ou d’individus. Les méthodes de mesures
constituent un critère de classification fixe, et les objets ou les individus suscep-
tibles d’être mesurés un critère de classification aléatoire. On peut alors choisir
au hasard un sous-ensemble de q individus à mesurer, et soumettre ces q indivi-
dus à chacune des p méthodes, en effectuant chaque fois un même nombre n de
répétitions des mesures.
10.3.4 MODÈLES CROISÉS À EFFECTIFS ÉGAUX : ASPECTS INFÉRENTIELS 305

d On notera que l’expression modèle mixte est souvent utilisée pour désigner, non
pas spécifiquement le modèle d’analyse de la variance dont il est question ici, mais
bien le modèle linéaire mixte, qui permet de prendre en considération, dans un
contexte beaucoup plus général, un ou plusieurs facteurs fixes et un ou plusieurs
b facteurs aléatoires (§ 16.5.3).

2◦ Dans les conditions qui viennent d’être définies, les moyennes théoriques
Mij et M.j , qui sont liées au critère de classification aléatoire, sont des variables
aléatoires, tandis que les moyennes mi. , qui ne dépendent que du critère de clas-
sification fixe, sont des constantes, tout comme la moyenne générale m.. .
Les effets principaux et les termes d’interaction sont en conséquence :

ai = mi. − m.. , Bj = M.j − m.. et Cij = (aB)ij = Mij − mi. − M.j + m.. .

Les uns (ai ) sont fixes, et les autres (Bj et Cij ) sont aléatoires.

3◦ Le modèle théorique s’écrit donc :

Xijk − m.. = ai + Bj + Cij + Dijk .

Comme dane le cas du modèle aléatoire, on suppose, en plus des conditions du


paragraphe 10.1.3◦ , que les variables aléatoires Bj et Cij sont toutes normales,
indépendantes les unes des autres, de moyennes nulles et de variances constantes,
2 2
respectivement égales à σB et σC . Ces variables sont également indépendantes des
écarts résiduels Dijk .

4◦ Les hypothèses nulles sont alors :

H0 : a1 = a2 = . . . = ap = 0 ou m1. = m2. = . . . = mp. ,

H00 : σB
2
= 0 et H000 : σC
2
= 0.

Bien qu’il n’y ait pas de changement d’écriture, par comparaison avec le modèle
fixe pour la première, et par comparaison avec le modèle aléatoire pour les deux
dernières, ces hypothèses n’ont pas exactement la même signification que précé-
demment. La première hypothèse, par exemple, implique qu’il n’y a pas de dif-
férences de moyennes entre les p modalités du facteur fixe, les moyennes étant
relatives à l’infinité ou la quasi-infinité de modalités du facteur aléatoire, et pas
seulement aux q modalités pour lesquelles des observations sont réalisées.
Dans l’exemple évoqué ci-dessus, cette hypothèse a trait à l’égalité des résultats
obtenus par les p méthodes de mesures, pour l’ensemble supposé infini ou quasi in-
fini des individus qui pourraient être mesurés, et pas seulement pour les q individus
qui ont été ou qui seront effectivement l’objet de mesures.
306 ANALYSE DE LA VARIANCE À DEUX CRITÈRES 10.3.4

5◦ Comme précédemment, on peut démontrer que les espérances mathémati-


ques des carrés moyens sont dans ces conditions :

p
2 2 qn X 2
E(CMa ) = σ + n σC + a ,
p − 1 i=1 i

E(CMb ) = σ 2 + p n σB
2
, E(CMab ) = σ 2 + n σC
2
et E(CMr ) = σ 2 .

Ces résultats sont intermédiaires entre ceux qui concernent le modèle fixe et
ceux qui ont trait au modèle aléatoire (§ 10.3.2.4◦ et 10.3.3.5◦ ), mais ils peuvent
paraı̂tre quelque peu surprenants. On constate en effet que le terme aléatoire d’in-
2
teraction σC intervient ici dans l’espérance mathématique du carré moyen relatif
au facteur fixe (CMa ), mais pas dans l’espérance mathématique du carré moyen
relatif au facteur aléatoire (CMb ), alors qu’on aurait pu attendre le contraire. Nous
justifierons intuitivement ces résultats au paragraphe 10.3.5.2◦ .
2
Pour s’assurer de la nullité de tous les ai d’une part, et de σB d’autre part,
il faut donc comparer le carré moyen du facteur fixe (CMa ) au carré moyen de
l’interaction (CMab ), et le carré moyen du facteur aléatoire (CMb ) au carré moyen
résiduel (CMr ). La comparaison relative au facteur fixe est réalisée comme pour
le modèle aléatoire, tandis que la comparaison relative au facteur aléatoire est
réalisée comme pour le modèle fixe.

6◦ Rien ne doit être ajouté à ce qui a été dit antérieurement au sujet des
distributions d’échantillonnage et du test relatif à l’interaction.
Quant aux tests qui concernent les deux autres hypothèses, ils doivent être
effectués, en fonction de ce qui vient d’être exposé, en calculant les quantités :

Fa = CMa /CMab et Fb = CMb /CMr ,

et en se référant aux distributions F de Fisher-Snedecor à p−1 et (p−1) (q −1)


degrés de liberté d’une part, q − 1 et p q (n − 1) degrés de liberté d’autre part.

7◦ Des estimations et des limites de confiance peuvent être calculées pour les
différences de moyennes, comme dans le cas du modèle fixe (§ 10.3.2.7◦ ), mais en
substituant le carré moyen de l’interaction CMab au carré moyen résiduel CMr ,
et en modifiant en conséquence le nombre de degrés de liberté de la variable t de
Student.
La composante de variance relative au facteur aléatoire doit, quant à elle, être
estimée comme suit :
2
σ
bB = (CMb − CMr )/(p n) ,
10.3.4 MODÈLES CROISÉS À EFFECTIFS ÉGAUX : ASPECTS INFÉRENTIELS 307

tandis que les deux autres composantes de variances peuvent être estimées comme
dans le cas du modèle aléatoire (§ 10.3.3.8◦ ).
L’ensemble de ces informations, de même que celles qui concernent les modèles
fixe et aléatoire, peut être déduit également du tableau 10.3.7, qui sera présenté
au paragraphe suivant.

d 8◦ Les modèles mixtes d’analyse de la variance à deux et plus de deux critères


de classification sont parfois présentés sous deux formes différentes, l’une dite res-
treinte 14 et l’autre dite non restreinte 15 [Hocking, 1973 ; Schwarz, 1993 ; Voss,
b 1999]. La présentation que nous avons adoptée est celle du modèle restreint.

Exemple 10.3.4. Étude de la variabilité des résultats en spectrométrie infra-


rouge : analyse de la variance.
Les responsables d’un laboratoire d’analyse chimique par spectrométrie dans le
proche infrarouge se sont intéressés à la variabilité des résultats qu’ils obtenaient,
en matière de teneurs en protéines du blé. En particulier, ils se sont interrogés
sur l’importance des différences qui pouvaient découler des étapes successives de
préparation des matières à analyser. Nous considérons ici le problème du broyage,
en examinant les résultats obtenus à l’aide de trois moulins.
Cinq échantillons de grains de blé ont été prélevés au hasard dans un arrivage
relativement important et divisés chacun en trois sous-échantillons. Pour chacun
des échantillons, les sous-échantillons ont ensuite été affectés au hasard aux trois
moulins et deux analyses chimiques ont été effectuées dans chaque cas [Dardenne,
1990]. Les tableaux 10.3.5 et 10.3.6 présentent, d’une part les données initiales, à
savoir les teneurs en protéines, exprimées en pourcentages de la matière sèche, et
d’autre part les résultats de l’analyse de la variance.

Tableau 10.3.5. Teneurs en protéines, en pourcentages de la matière sèche,


observées pour cinq échantillons de blé broyés à l’aide de trois moulins.

Échantillons
Moulins
1 2 3 4 5
1 13,33 13,62 13,53 13,60 13,97
13,43 13,33 13,75 13,44 13,32
2 13,04 13,26 13,49 13,05 13,28
13,34 13,49 13,59 13,44 13,67
3 13,24 13,33 13,07 13,47 13,46
13,25 13,46 13,33 13,04 13,32

Le modèle d’analyse de la variance est un modèle mixte, si on considère que


les trois moulins constituent un facteur fixe et que les cinq échantillons de blé
14 En anglais : constrained model, restricted model.
15 En anglais : unconstrained model, unrestricted model.
308 ANALYSE DE LA VARIANCE À DEUX CRITÈRES 10.3.4

Tableau 10.3.6. Étude de la variabilité des résultats en spectrométrie


infrarouge : tableau d’analyse de la variance.

Sources Degrés Sommes des carrés Carrés


F P
de variation de liberté des écarts moyens
Moulins 2 0,2925 0,14623 8,70 ** 0,0098
Échantillons 4 0,2073 0,05183 1,16 0,37
Interaction 8 0,1345 0,01681 0,38 0,92
Variation résiduelle 15 0,6684 0,04456
Totaux 29 1,3027

constituent un facteur aléatoire. Le modèle aurait aussi pu être aléatoire si, au


lieu d’étudier les trois moulins disponibles dans le laboratoire envisagé, on avait
considéré trois moulins choisis au hasard dans une production de moulins dont on
aurait voulu étudier l’homogénéité.
Dans l’optique du modèle mixte, l’interaction des deux critères de classification
et les différences entre échantillons sont testées par rapport à la variation résiduelle,
tandis que les différences entre moulins sont testées par rapport à l’interaction. Les
tests mettent uniquement en évidence des différences hautement significatives entre
les moulins. Nous compléterons ultérieurement cette analyse (exemple 10.3.5).
On remarquera que le carré moyen de l’interaction (0,01681) est inférieur
au carré moyen résiduel (0,04456), alors qu’on pouvait attendre plus logique-
ment une différence se marquant dans l’autre sens, puisqu’en termes d’espérances
mathématiques, le premier est toujours supérieur ou égal au second.
Une telle constatation, qui n’a cependant rien d’exceptionnel, peut parfois
contribuer à mettre en évidence certaines anomalies (valeurs aberrantes de cer-
tains résidus par exemple). Dans le cas présent, aucune anomalie d’aucune sorte
n’apparaı̂t cependant.
d On pourra remarquer en outre que les données du tableau 10.3.5 sont également
celles qui, présentées d’une autre manière (tableau 7.3.1), nous ont déjà servi à
illustrer le test de conformité d’un écart-type, en l’occurrence un écart-type qui
correspond à l’écart-type résiduel de l’analyse de la variance considérée ici (exemple
7.3.1).
D’autre part, dans l’analyse de la variance que nous venons de présenter, nous
avons supposé que, pour chaque échantillon (au sens de l’expérimentateur) de blé,
les deux données initiales relatives à chaque moulin constituent un échantillon
(au sens du statisticien) aléatoire et simple de deux observations. Cette hypothèse
revient à supposer qu’il n’y a pas de différence systématique entre, dans chaque
cas, la première et la deuxième observation. On pourrait vérifier cette absence de
différence systématique en introduisant, dans l’analyse de la variance, un troisième
facteur correspondant à l’ordre de réalisation des mesures. On se trouverait alors
10.3.5 MODÈLES CROISÉS À EFFECTIFS ÉGAUX : ASPECTS INFÉRENTIELS 309

dans un cas d’analyse de la variance à trois critères de classification, avec une seule
b observation par cellule (§ 11.2.4).

10.3.5 Échantillons de plusieurs observations :


tableau récapitulatif et notions complémentaires
1◦ Les paragraphes précédents ont montré que la distinction entre les trois
modèles croisés d’analyse de la variance à deux critères de classification est essen-
tielle, non seulement en ce qui concerne l’interprétation des hypothèses nulles, et
donc les conclusions, mais aussi en ce qui concerne la manière dont les tests, les
estimations et les déterminations de limites de confiance doivent être réalisés.
Un tableau récapitulatif fait la synthèse de l’ensemble des informations relatives
aux espérances mathématiques (tableau 10.3.7). Ce tableau contient en effet, pour
les trois modèles, les coefficients des différentes composantes qui interviennent dans
les espérances mathématiques des carrés moyens.

Tableau 10.3.7. Tableau récapitulatif des espérances mathématiques des carrés


moyens, pour les modèles croisés à effectifs égaux d’analyse de la variance
à deux critères de classification : échantillons de plusieurs observations.

Carrés Modèle fixe Modèle mixte Modèle aléatoire


moyens σ2 (ab)2ij b2j a2i σ2 2
σaB 2
σB a2i σ 2 σAB
2
σB2
σA2

CMa 1 + 1 n + 1 n qn
CMb 1 + 1 pn 1 n pn
CMab 1 + 1 n 1 n
CMr 1 1 1

Dans un but d’allègement des notations, les coefficients relatifs aux composan-
tes fixes n’ont toutefois pas été intégralement retranscrits, le signe + indiquant
seulement que telle ou telle composante intervient dans telle ou telle espérance
mathématique, et cela toujours comme une fonction croissante des carrés des
termes ai , bj , etc. En outre, pour bien mettre en évidence les distinctions entre
les différents modèles et pour bien identifier les différentes interactions, nous avons
2 2 2
utilisé les notations (ab)ij , σaB et σAB , de préférence à cij et σC .
Ce tableau permet de repérer facilement, dans chaque cas, les comparaisons
qui doivent être réalisées, en vue de tester la nullité de l’un ou l’autre élément,
ainsi que la manière dont les différentes composantes de la variance doivent être
estimées.

2◦ Le fait que les espérances mathématiques puissent conduire à des tests diffé-
rents d’un cas à l’autre surprend souvent les utilisateurs de l’analyse de la varian-
ce, qui ont tendance à n’y voir qu’une subtilité mathématique, sans justification
pratique. En réalité, les différentes procédures ne font que confirmer le bon sens, et
310 ANALYSE DE LA VARIANCE À DEUX CRITÈRES 10.3.5

c’est pour le modèle mixte, dont les tests sont apparemment les plus inattendus,
que les résultats déduits du raisonnement mathématique s’expliquent intuitive-
ment le mieux.
Reprenons par exemple l’étude des différents types de sondes (exemples 10.2.1
et 10.3.1), en supposant qu’on veuille effectuer la comparaison, non pas dans deux
types de sols donnés, mais bien dans l’ensemble d’une certaine région. L’étude ne
pouvant être réalisée en tous les points de la région considérée, qui constituent
un ensemble infini, on doit alors choisir un certain nombre de points de façon
complètement aléatoire et, en ces quelques points, on peut effectuer chaque fois un
même nombre de prélèvements de terre à l’aide de chacune des sondes. Le facteur
sondes est en conséquence un facteur fixe et le facteur lieux un facteur aléatoire.
Supposons en outre qu’il existe une certaine interaction sondes-lieux, c’est-à-dire
que les différences entre sondes puissent être différentes d’un point d’observation
à l’autre.
Dans ces conditions, les différences de moyennes observées entre les sondes
dépendent des lieux qui sont choisis et le facteur lieux intervient donc, par l’in-
termédiaire de l’interaction, dans l’espérance mathématique du facteur sondes. Par
contre, les différences de moyennes observées entre les lieux ne dépendent pas des
types de sondes mis en œuvre, puisque tous les types de sondes sont chaque fois
pris en compte : le facteur types de sondes n’intervient donc aucunement, même
pas indirectement, dans l’espérance mathématique du facteur lieux.
On notera enfin qu’on peut aussi résumer la situation en disant que le choix de
la base de comparaison (interaction ou variation résiduelle), relative à un facteur
donné, ne dépend pas de la nature de ce facteur lui-même, mais bien de la nature
du facteur qui lui est associé.

3◦ Le fait de comparer un facteur principal avec l’interaction, dans le cas du


modèle mixte ou du modèle aléatoire, a pour conséquence de réduire, souvent de
manière drastique, le nombre de degrés de liberté du dénominateur de la variable F
correspondante. On a en effet toujours :
(p − 1) (q − 1) < p q (n − 1) .
Il peut en résulter une perte importante de puissance des tests et de précision des
estimations.
Quand l’interaction n’est pas significative, il est possible de remédier dans une
certaine mesure à cet inconvénient en procédant à un regroupement 16 des termes
d’interaction et résiduel, de manière à définir une nouvelle base de comparaison
pour les deux facteurs principaux :
SCEab + SCEr SCEab + SCEr
CM0r = = .
(p − 1) (q − 1) + p q (n − 1) pqn − p − q + 1
En l’absence de toute interaction et quel que soit le modèle d’analyse de la va-
riance, le tableau 10.3.7 montre en effet que les carrés moyens CMab et CMr sont
16 En anglais : pooling.
10.3.5 MODÈLES CROISÉS À EFFECTIFS ÉGAUX : ASPECTS INFÉRENTIELS 311

alors tous deux des estimations non biaisées de σ 2 et que c’est par rapport à σ 2
que toutes les comparaisons doivent être réalisées.
Le carré moyen CM0r est une moyenne pondérée de CMab et CMr , les coef-
ficients de pondération étant les nombres de degrés de liberté et, en l’absence
d’interaction, ce carré moyen constitue la meilleure estimation non biaisée de σ 2 .
Cette opération de regroupement de deux sources de variation doit cependant
être réalisée avec prudence. Une interaction peut en effet être non significative tout
en étant caractérisée par un carré moyen qui diffère largement du carré moyen
résiduel. Une précaution utile consiste à adopter en conséquence un niveau de si-
gnification relativement élevé (par exemple 0,20 ou 0,25 , voire même 0,50), pour le
test préalable 17 relatif à l’interaction [Hines, 1996 ; Mead et al., 1975 ; Wolde-
Tsadik et Afifi, 1980].

d 4◦ Diverses méthodes d’estimation des composantes de la variance et de leurs


rapports, semblables à celles auxquelles nous avons fait allusion au paragraphe
9.3.3, existent également pour les modèles mixte et aléatoire d’analyse de la va-
riance à deux critères de classification. On peut consulter à ce sujet les publications
de Lee et Kapadia [1984], et Ting et Graybill [1991], ainsi que, d’une manière

b plus générale, les références citées au paragraphe 16.4.5.3 .

Exemple 10.3.5. Étude de la variabilité des résultats en spectrométrie infra-


rouge : regroupement de deux sources de variation.
Les données de l’exemple 10.3.4 permettent d’illustrer l’opération de regroupe-
ment de deux sources de variation.
L’interaction n’étant pas significative dans ce cas, puisque son carré moyen est
même inférieur au carré moyen résiduel (tableau 10.3.6), on peut en effet écrire :

CM0r = (0,1345 + 0,6684)/(8 + 15) = 0,03491 .

On en déduit les nouvelles valeurs suivantes des variables F et les probabilités


correspondantes :

Fa0 = 0,1462/0,03491 = 4,19 et P(F ≥ 4,19) = 0,028 ,

Fb0 = 0,05183/0,03491 = 1,48 et P(F ≥ 1,48) = 0,24 ,


respectivement avec 2 et 23 degrés de liberté d’une part, 4 et 23 degrés de liberté
d’autre part.
On observe ainsi une certaine réduction du degré de signification des différences
entre les trois moulins, sans aucun changement de conclusion en ce qui concerne
les différences entre échantillons.
17 En anglais : preliminary test.
312 ANALYSE DE LA VARIANCE À DEUX CRITÈRES 10.3.6

On peut également déterminer sur cette base des limites de confiance pour les
différences de moyennes entre moulins, la demi-longueur des intervalles de confian-
ce des différences étant, pour un degré de confiance égal à 0,95 et avec 23 degrés
de liberté en ce qui concerne la variable t de Student (§ 10.3.2.7◦ ) :
p
2,069 2 (0,03491)/10 = 0,17 % .

De même, on peut éventuellement calculer, si cela présente un intérêt, des esti-


mations de composantes de la variance, à savoir, espectivement pour la variabilité
entre échantillons et pour la variabilité résiduelle (§ 10.3.4.7◦ ) :
2
σ
bB b2 = 0,0349 .
= (0,05183 − 0,03491)/6 = 0,0028 et σ

On pourrait aussi exprimer ces composantes en termes d’écarts-types ou de coef-


ficients de variation.

10.3.6 Le cas des échantillons d’une seule observation


1◦ Le cas des échantillons d’une seule observation (n = 1) doit être considéré
séparément, car il se distingue à divers points de vue du cas général des échantillons
de plusieurs observations (n > 1).
Dans ce cas particulier, le modèle fixe du paragraphe 10.3.2.2◦ devient en effet :

Xij − m.. = ai + bj + cij + Dij .

Ce modèle montre que les termes cij et Dij , tous deux identifiés par les mêmes
indices i et j , ne peuvent plus être dissociés.
Quant aux modèles mixte et aléatoire correspondants, ils peuvent être obtenus
de la même façon en remplaçant, selon les cas, ai , bj et cij , par Ai , Bj et Cij .

2◦ Les hypothèses nulles, les espérances mathématiques des carrés moyens et les
distributions d’échantillonnage ne sont pas modifiées, par comparaison avec le cas
général, si ce n’est bien sûr que l’effectif n est toujours égal à l’unité, et que, comme
pour les aspects descriptifs, tout ce qui a trait à la variation résiduelle disparaı̂t
(§ 10.2.5.2◦ ). Le tableau 10.3.8 résume l’ensemble des informations relatives aux
espérances mathématiques, selon le même principe que le tableau 10.3.7 pour le
cas général.

3◦ Ce tableau met tout d’abord en évidence le fait que, quel que soit le mo-
dèle considéré, aucun test n’est possible, selon la procédure habituelle, en ce qui
concerne l’interaction.
Il montre aussi qu’aucun test ne peut être réalisé non plus pour les deux critères
de classification dans le cas du modèle fixe, ni pour le facteur aléatoire dans le cas
du modèle mixte, sauf précisément en l’absence d’interaction, c’est-à-dire pour le
10.3.6 MODÈLES CROISÉS À EFFECTIFS ÉGAUX : ASPECTS INFÉRENTIELS 313

Tableau 10.3.8. Tableau récapitulatif des espérances mathématiques des carrés


moyens, pour les modèles croisés à effectifs égaux d’analyse de la variance
à deux critères de classification : échantillons d’une seule observation.
Carrés Modèle fixe Modèle mixte Modèle aléatoire
moyens σ2 (ab)2ij b2j a2i σ2 2
σaB 2
σB a2i σ 2 σAB
2
σB2
σA2

CMa 1 + 1 1 + 1 1 q
CMb 1 + 1 p 1 1 p
CMab 1 + 1 1 1 1

modèle additif (§ 10.2.4.2◦ ). Rien n’est modifié par contre pour le facteur fixe du
modèle mixte, ni pour les deux critères de classification du modèle aléatoire.
À ce propos, nous voudrions mettre le lecteur en garde contre le fait que, dans
le cas envisagé ici, certains logiciels statistiques fournissent indistinctement les
rapports F relatifs aux deux critères de classification, sans émettre aucune réserve
à leur sujet [Schwarz, 1993].

d 4◦ Plusieurs tests d’absence d’interaction ou tests d’additivité 18 ont été pro-


posés en vue de remédier à la situation qui vient d’être décrite, en particulier dans
le cas du modèle fixe [Alin et Kurt, 2006 ; Boik, 1993 ; Kharrati-Kopaei et
Sadooghi-Alvandi, 2007]. Le test de Tukey 19 est le plus couramment utilisé.
Le principe de ce test est de subdiviser la somme des carrés des écarts de
l’interaction en une composante de non-additivité, à un degré de liberté, et une
variation ✭✭ résiduelle ✮✮, à p q−p−q degrés de liberté, et de tester ensuite la première
par rapport à la deuxième, selon les procédures habituelles. La composante de non-
additivité est définie de la manière suivante :
µXp Xq ∂
£ § 2
xij (x̄i. − x̄.. ) (x̄.j − x̄.. )
i=1 j=1
SCEadd = ∑X
p ∏∑X
q ∏ .
2 2
(x̄i. − x̄.. ) (x̄.j − x̄.. )
i=1 j=1

Le test de signification de cette composante peut être considéré comme un test


de signification du coefficient de régression β , qui interviendrait dans un modèle
où l’interaction éventuelle cij correspondrait au produit des effets principaux ai
et bj :
Xij − m.. = ai + bj + β (ai bj ) + Dij .

Si une interaction est présente, il est parfois possible aussi de l’éliminer, ou


au moins d’en réduire l’importance, en effectuant l’une ou l’autre transformation
18 En anglais : test of additivity.
19 En anglais : Tukey’s test.
314 ANALYSE DE LA VARIANCE À DEUX CRITÈRES 10.3.6

de variable, qui prend en compte prioritairement cet élément, plutôt que l’égalité
des variances ou la normalité des distributions [Cressie, 1978 ; Fuchs, 1979 ;
b Schlesselman, 1973].
5◦ Très souvent, le facteur aléatoire du modèle mixte est un facteur subsidiaire,
qui intervient dans le seul but de rendre plus puissant le test relatif au facteur fixe.
Il n’y a alors aucun inconvénient à ne pas pouvoir en tester la signification.
Il en est ainsi par exemple quand on compare diverses méthodes ou divers
instruments de mesure, en soumettant aux différentes méthodes ou aux différents
instruments les mêmes individus, choisis au hasard dans une population donnée,
plutôt que des individus distincts d’une méthode ou d’un instrument à l’autre. Il
en est fréquemment ainsi également dans le cas des expériences en blocs aléatoires
complets 20 , dites aussi en dispositif stratifié 21 , c’est-à-dire des expériences au sein
desquelles les individus observés sont réunis en groupes aussi homogènes que pos-
sible, tels que des ensembles de parcelles voisines dans un essai en champ [STAT1,
§ 2.3.5.2◦ ; Dagnelie, 2003].

6◦ Le test de signification du facteur subsidiaire est alors avantageusement


remplacé par la détermination du gain de puissance lié à ce facteur, en termes
d’efficacité relative 22 . Le principe de cette détermination est le suivant.
Si on n’avait pas tenu compte du facteur subsidiaire individus ou blocs, l’ana-
lyse de la variance aurait été une analyse à un critère de classification. La somme
des carrés des écarts résiduelle de cette analyse aurait ainsi pris la place, à la fois,
de la somme des carrés des écarts entre individus ou entre blocs SCEb et de la
somme des carrés des écarts de l’interaction SCEab . Le quotient :
±£ §
(SCEb + SCEab ) (q − 1) + (p − 1) (q − 1) ,
±£ §
c’est-à-dire aussi (SCEb +SCEab ) p (q −1) , est donc l’équivalent du carré moyen
résiduel de l’analyse de la variance à un critère de classification.
On peut en conséquence obtenir une estimation de l’efficacité relative en divi-
sant ce quotient par le carré moyen de l’interaction. En effet, on obtient bien, de
cette manière, le rapport des bases de comparaison des deux analyses.
d On notera que le fait de tester ou ne pas tester la signification du facteur
subsidiaire, notamment dans le cas des expériences en blocs aléatoires complets,
b est l’objet d’avis parfois divergents [Gates, 1995 ; Samuels et al., 1991].
7◦ L’introduction d’un facteur contrôlé subsidiaire, destiné à augmenter la
sensibilité des comparaisons, est une généralisation du principe du test t par paires
(§ 8.5.2).
Il est bon de savoir à cet égard que, dans le cas particulier des échantillons d’une
seule observation, l’analyse de la variance à deux critères de classification est une
20 En anglais : randomized complete block.
21 En anglais : stratified design.
22 En anglais : relative efficiency.
10.3.6 MODÈLES CROISÉS À EFFECTIFS ÉGAUX : ASPECTS INFÉRENTIELS 315

généralisation du test t par paires, au même titre que l’analyse de la variance à un


critère de classification peut être considérée comme une généralisation du test t
relatif aux échantillons indépendants (§ 9.3.5.2◦ ). Les valeurs F sont en effet égales,
ici aussi, aux carrés des valeurs t correspondantes, tant pour les valeurs observées
que pour les valeurs théoriques.
Il faut noter toutefois que les conditions sous-jacentes, de normalité et d’égalité
des variances, qui sont émises en analyse de la variance sont plus restrictives que
celles qui concernent le test t par paires.

Exemple 10.3.6. Comparaison des résultats obtenus par trois méthodes d’analyse
chimique : analyse de la variance à deux critères de classification.
Nous avons présenté antérieurement les résultats obtenus par trois méthodes
d’analyse chimique, pour 30 échantillons de matières fécales, et nous avons comparé
deux de ces méthodes à l’aide notamment du test t par paires (exemple 8.5.1). Nous
nous proposons de comparer ici l’ensemble des trois méthodes par l’analyse de la
variance à deux critères de classification.
Le modèle envisagé est un modèle mixte, si on considère que les trois méthodes
d’analyse sont des méthodes bien définies (critère fixe) et, au contraire, que les
30 prélèvements de matières fécales sont représentatifs de l’ensemble des prélève-
ments qui auraient pu être soumis à l’analyse (critère aléatoire).
Les résultats de l’analyse de la variance sont donnés dans le tableau 10.3.9. Ils
amènent à conclure à l’existence de différences significatives de moyennes entre les
trois méthodes d’analyse, au niveau de probabilité 0,05 .

Tableau 10.3.9. Comparaison des résultats obtenus par trois méthodes


d’analyse chimique : tableau d’analyse de la variance.

Sources Degrés Sommes des carrés Carrés


F P
de variation de liberté des écarts moyens
Méthodes d’analyse 2 35,76 17,88 3,62 * 0,033
Prélèvements 29 15.341,79 529,03
Interaction 58 286,24 4,935
Totaux 89 15.663,79

Il faut noter que, si les valeurs individuelles et la distribution des résidus de


l’analyse de la variance ne présentent aucune anomalie particulière, la méthode de
Levene met cependant en évidence une certaine hétérogénéité des variances. Cet
élément ne met pas en cause la conclusion de l’analyse de la variance, mais devrait
inciter à une certaine prudence dans la réalisation d’éventuelles comparaisons deux
à deux des moyennes relatives aux trois méthodes d’analyse.
On remarquera aussi que le gain de précision, qui résulte du fait que les mêmes
échantillons de matières fécales ont été soumis aux trois méthodes d’analyse chimi-
316 ANALYSE DE LA VARIANCE À DEUX CRITÈRES 10.3.6

que, est très important. Si des échantillons différents avaient été pris en considéra-
tion, l’étude statistique des résultats aurait consisté en une analyse de la variance
à un critère de classification, dont le carré moyen résiduel aurait pu être :

CMr = (15.341,79 + 286,24)/(29 + 58) = 179,63 .

Comparée au carré moyen de l’interaction, qui sert de dénominateur dans l’analyse


de la variance à deux critères de classification (CMab = 4,935), cette valeur fait
apparaı̂tre une efficacité relative de la méthode adoptée de l’ordre de 36 ou 3.600 %,
par rapport à un échantillonnage qui aurait été indépendant pour les trois métho-
des d’analyse.
Il aurait donc fallu disposer de trois ensembles d’environ 1.100 échantillons et
réaliser près de 3.300 analyses, pour obtenir, avec des échantillons indépendants,
une précision équivalente à celle que fournit l’analyse des 30 mêmes échantillons
par les trois méthodes.
En outre, on peut aussi vérifier empiriquement l’équivalence entre l’analyse de
la variance relative à deux modalités et le test t par paires. En se limitant aux
deux premières méthodes d’analyse chimique, on obtient en effet une valeur Fobs
égale à 10,4 , avec 1 et 29 degrés de liberté, alors que la valeur tobs correspondante
est égale à 3,23 , avec 29 degrés de liberté (exemple 8.5.1).

d Exemple 10.3.7. Comparaison des résultats obtenus par trois méthodes d’analyse
chimique : test d’additivité.
L’analyse de la variance de l’exemple précédent n’implique pas que la condi-
tion d’additivité doit être satisfaite, puisque le test réalisé concerne uniquement
le facteur fixe d’un modèle mixte. Les données considérées permettent toutefois
d’illustrer l’emploi du test de Tukey.
À partir des observations initiales (tableau 8.5.1) et des différentes moyennes
qu’on peut en déduire, on obtient :
±£ §
SCEadd = (− 8,2703)2 (1,1919) (5.113,9) = 0,011 .

Cette somme des carrés des écarts, qui se confond avec le carré moyen correspon-
dant, puisqu’elle ne possède qu’un seul degré de liberté, doit être comparée au
carré moyen résiduel obtenu par différence (tableau 10.3.9) :

CMr = (286,24 − 0,011)/57 = 5,022 .

La valeur observée de la variable F , à 1 et 57 degrés de liberté, est donc


quasi nulle, et on peut accepter sans hésiter l’hypothèse d’additivité, ou d’absence
d’interaction, du modèle d’analyse de la variance. Il serait donc possible, dans ce
cas, de tester la signification des deux critères de classification, si cela s’avérait
b nécessaire.
10.3.7 MODÈLES CROISÉS À EFFECTIFS ÉGAUX : ASPECTS INFÉRENTIELS 317

10.3.7 L’analyse des observations successives

1◦ Une attention toute particulière doit être accordée aux problèmes que sou-
lève l’analyse des observations successives, effectuées sur les mêmes individus à
plusieurs dates ou à plusieurs moments différents. De telles observations sont aussi
qualifiées de mesures répétées ou de données longitudinales 23 . Il peut s’agir en
particulier de la comparaison de courbes de croissance 24 .
L’étude des données de ce type est souvent réalisée dans l’optique du modèle
linéaire général et de ses extensions (modèle linéaire mixte notamment), dont il
sera question aux paragraphes 16.4 et 16.5. Nous ne présentons ici que quelques
notions plus élémentaires.

2◦ On peut tout d’abord être tenté de considérer le facteur temps comme un


critère de classification supplémentaire, dans une analyse de la variance classique.
L’analyse serait alors une analyse à deux critères de classification si on étudie un
seul facteur, autre que le facteur temps, à trois critères de classification si on étudie
simultanément deux facteurs, autres que le facteur temps, etc.
Cette approche n’est cependant pas correcte d’une manière générale, car les
résidus observés aux différents moments, pour un même individu, ne sont le plus
souvent pas indépendants les uns des autres.
Ainsi, dans un phénomène de croissance, un individu nettement inférieur à la
moyenne de son groupe à un moment donné est en général inférieur aussi à la
moyenne de son groupe à d’autres moments. Les résidus relatifs à un tel individu
ont donc tendance à être tous ou presque tous négatifs, un raisonnement analogue
pouvant bien sûr être tenu également pour tout individu qui serait nettement
supérieur à la moyenne de son groupe.
d Une analyse qui serait réalisée de cette façon est parfois assimilée à celle qui
concerne les expériences avec parcelles divisées 25 [Dagnelie, 2003]. Les individus
observés sont alors considérés comme l’équivalent des grandes parcelles, et les
observations effectuées aux différents moments sur chacun des individus comme
b l’équivalent des petites parcelles (ou sous-parcelles).

3◦ L’analyse de la variance qui fait intervenir le temps comme un critère de


classification supplémentaire peut néanmoins être réalisée dans certaines condi-
tions ou moyennant certaines adaptations.
d On peut en effet démontrer que l’analyse de la variance reste applicable, en
l’absence d’indépendance des résidus, pour autant que certaines conditions, moins
restrictives que les conditions habituelles, soient satisfaites. Ces conditions sont
connues sous les noms de conditions de symétrie composée ou de sphéricité ou de
23 En anglais : successive measurements, repeated measurements, longitudinal data.
24 En anglais : growth curve.
25 En anglais : split-plot.
318 ANALYSE DE LA VARIANCE À DEUX CRITÈRES 10.3.7

circularité 26 , ou encore conditions de Greenhouse et Geisser ou de Huynh et


Feldt 27 .
La condition de symétrie composée, par exemple, implique que, pour les dif-
férentes populations qui sont comparées, les matrices de variances et covariances
relatives aux observations effectuées aux différents moments sont égales entre elles,
et telles que d’une part toutes les variances sont égales, et d’autre part toutes les
covariances sont aussi égales.
En outre, quand de telles conditions ne sont pas remplies, il est possible d’ap-
porter à l’analyse de la variance certaines corrections, qui consistent en des réduc-
tions des nombres de degrés de liberté. Ces réductions, auxquelles sont également
associés les noms de Geisser et Greenhouse et de Huynh et Feldt, sont fonc-
tion du degré de non-sphéricité des matrices de variances et covariances [Bathke
b et al., 2009 ; Greenhouse et Geisser, 1959 ; Huynh et Feldt, 1970].

4◦ Une autre solution, beaucoup plus simple, mais souvent largement satisfai-
sante, a pour principe de condenser l’ensemble des données qui concernent chacun
des individus en un ou, éventuellement, en quelques paramètres, et de soumettre
ensuite ce ou ces paramètres à une analyse de la variance qui ne fait pas intervenir
le facteur temps.
Dans des études de croissance par exemple, on peut calculer par régression,
pour chacun des individus, une vitesse ou un taux de croissance, et soumettre les
différentes vitesses ou les différents taux de croissance à l’analyse de la variance.

d 5◦ On trouvera des informations complémentaires relatives aux différentes ap-


proches dans l’abondante littérature spécialisée, sous forme de livres [Davis 2002 ;
Diggle et al., 2002 ; Fitzmaurice et al., 2004 ; Hand et Crowder, 1996 ; Ver-
b beke et Molenberghs, 2001] et d’articles [Everitt, 1995 ; Omar et al., 1999].

Exemple 10.3.8. Étude de la croissance de différentes variétés de pruniers : prin-


cipes de diverses analyses de la variance relatives à des observations successives.
La croissance en grosseur (diamètre ou circonférence) des tiges des arbres frui-
tiers est un bon indicateur de leur vigueur avant qu’ils n’entrent en production.
Une étude a été réalisée dans cette optique pour diverses variétés de pruniers, des
mesures de circonférence ayant été effectuées arbre par arbre à une hauteur don-
née, au cours des neuf années qui ont suivi la plantation [Liard et Rolin, 1966].
Comme nous ne ferons que présenter différents modèles d’analyse de la variance,
sans traiter effectivement des valeurs numériques, nous ajoutons simplement, pour
concrétiser les choses, que les circonférences étaient en moyenne de l’ordre de 8 à
10 cm au cours de la première année et de 20 à 25 cm au cours de la neuvième
année.
26 En anglais : compound symmetry, sphericity, circularity.
27 En anglais : Greenhouse-Geisser’s condition, Huynh-Feldt’s condition.
10.3.7 MODÈLES CROISÉS À EFFECTIFS ÉGAUX : ASPECTS INFÉRENTIELS 319

Nous supposons tout d’abord qu’on a étudié trois variétés et observé huit arbres
pour chacune des trois variétés, de telle sorte que le nombre total de mesures est
égal à 216, pour l’ensemble des neuf années d’observations.
On pourrait alors être tenté de réaliser une analyse de la variance à deux critè-
res de classification, à savoir les facteurs variétés et années. Une telle analyse est
esquissée dans la partie supérieure gauche du tableau 10.3.10.

Tableau 10.3.10. Étude de la croissance de trois variétés de pruniers :


schémas de trois tableaux d’analyse de la variance.

Sources Degrés Sources Degrés


de variation de liberté de variation de liberté
Variétés 2 Variétés 2
Années 8 Variation résiduelle 1 21
Interaction 16 Total partiel 23
Variation résiduelle 189
Années 8
Total 215 Interaction 16
Variation résiduelle 2 168
Sources Degrés Total général 215
de variation de liberté
Variétés 2
Variation résiduelle 21
Total 23

En considérant les deux critères comme fixes, on devrait effectuer dans ce cas
toutes les comparaisons par rapport à la variation résiduelle, avec 189 degrés de
liberté (§ 10.3.2.6◦ ou 10.3.5.1◦ ). Cette analyse est cependant tout à fait incor-
recte, car on ne dispose évidemment pas de 189 résidus indépendants les uns des
autres, puisque seuls 24 arbres ont été observés, et que les résidus relatifs à un
même arbre ont toute raison d’être, pour chacun d’eux, fortement corrélés d’une
année à l’autre.
Une deuxième solution consiste à subdiviser l’analyse de la variance en deux
parties, comme l’indique la moitié droite du tableau 10.3.10. La première partie
de l’analyse ne fait alors intervenir que les différences entre arbres, à l’exclusion
de toute influence du facteur années, la composante ✭✭ variation résiduelle 1 ✮✮ étant
en fait la variation ✭✭ entre arbres dans les variétés ✮✮. La deuxième partie réunit
au contraire tous les éléments qui, d’une manière ou d’une autre, dépendent de la
répétition des mesures au cours des différentes années successives.
Seule la première partie de cette analyse peut être réalisée, d’une manière gé-
nérale, sans restriction.
320 ANALYSE DE LA VARIANCE À DEUX CRITÈRES 10.3.7

d La deuxième partie de cette analyse ne pourrait être réalisée que moyennant


une des conditions auxquelles il a été fait allusion ci-dessus ou, sinon, moyennant
28
b une réduction des nombres de degrés de liberté .
La solution la plus simple consiste cependant à n’utiliser que l’analyse de la
variance à un critère de classification, en effectuant une ou plusieurs analyses du
type esquissé dans la partie inférieure gauche du tableau 10.3.10. De telles analyses
peuvent être réalisées année par année, soit sur les circonférences observées elles-
mêmes, soit sur les accroissements de circonférences, c’est-à-dire les différences
entre les circonférences observées au cours des années consécutives. De telles ana-
lyses permettent de voir à quel moment des différences apparaissent de manière
significative ou se marquent le plus.
Mais des analyses de la variance de ce type peuvent également être réalisées
sur des paramètres tels que l’accroissement annuel moyen. Un tel accroissement
peut être calculé arbre par arbre, soit en fonction des seules valeurs extrêmes
(différences entre, dans chaque cas, la dernière et la première observation, divisées
par 8), soit en fonction de l’ensemble des observations, comme un coefficient de
régression, pour autant bien sûr que la croissance en circonférence soit relativement
constante, de telle sorte que la régression soit relativement linéaire.
À cet égard, on notera que le coefficient de régression est en fait une simple
fonction linéaire des différentes observations. Pour un arbre donné, observé pen-
dant neuf années consécutives, et si on désigne les observations par x1 , . . . , x9 , le
coefficient de régression est en effet :

b = (− 4 x1 − 3 x2 − 2 x3 − x4 + x6 + 2 x7 + 3 x8 + 4 x9 )/60 .

Il en résulte notamment que, si les conditions d’application de l’analyse de la va-


riance sont satisfaites pour les différentes observations annuelles, elles le sont éga-
lement pour les accroissements annuels moyens qui seraient estimés par régression.
Ce principe s’applique évidemment aussi à toute autre fonction des différentes
observations, comme par exemple la moyenne ou des contrastes, dont nous parle-
rons au paragraphe 12.2.2 et qui permettent d’aborder la régression non linéaire
(§ 12.2.3).
Nous n’avons considéré jusqu’à présent que la situation la plus simple, qui ne
fait intervenir au départ qu’un seul facteur (trois variétés dans le cas envisagé).
Le problème peut évidemment être étendu à un plus grand nombre de facteurs,
chaque facteur supplémentaire donnant naissance à un critère de classification
supplémentaire dans les différents types d’analyses de la variance que nous avons
envisagés.
28 On notera que cette deuxième solution peut être considérée aussi comme un cas particulier

(n = 1) du modèle IV d’analyse de la variance partiellement hiérarchisée à trois critères de


classification, dont il est question au paragraphe 11.3.3, la ✭✭ variation résiduelle 1 ✮✮ étant la
variation ✭✭ entre arbres dans variétés ✮✮ et la ✭✭ variation résiduelle 2 ✮✮ étant l’interaction ✭✭ années-
arbres dans variétés ✮✮. Comme nous l’avons déjà signalé, cette analyse de la variance s’apparente
en outre à celle qui concerne les expériences aléatoires avec parcelles divisées [Dagnelie, 2003].
10.3.8 MODÈLES CROISÉS À EFFECTIFS ÉGAUX : ASPECTS INFÉRENTIELS 321

Ainsi, les analyses de la variance réalisées année par année ou sur des coef-
ficients de régression seraient des analyses à deux critères de classification si on
considérait, par exemple, non pas seulement trois variétés, mais bien trois variétés
greffées chacune sur deux porte-greffe différents.

10.3.8 Les méthodes non paramétriques et robustes


1◦ Quand les conditions de normalité et d’égalité des variances énoncées au
paragraphe 10.1.3◦ ne sont pas satisfaites, l’analyse de la variance à deux critères
de classification peut céder la place à différentes méthodes non paramétriques
et robustes. Parmi celles-ci, nous ne présentons de façon détaillée que le test de
Friedman 29 , qui concerne le cas des échantillons d’une seule observation, dans
l’optique des expériences en blocs aléatoires complets (§ 10.3.6.5◦ ).
Comme le test de Kruskal et Wallis (§ 9.3.6), pour l’analyse de la variance
à un critère de classification, il s’agit d’une méthode basée sur l’étude des rangs.

2◦ Nous envisageons cette méthode en considérant le test relatif au premier


critère de classification. Dans ce cas, on doit déterminer les rangs des observations
séparément pour les différentes modalités du deuxième critère, puis calculer les
sommes Xi. de ces rangs pour les différentes modalités du premier critère. On en
déduit ensuite la quantité :

Xp
12
χ2obs = X 2 − 3 q (p + 1) ,
p q (p + 1) i=1 i.

p et q désignant comme précédemment, respectivement, le nombre de modalités


du premier et le nombre de modalités du deuxième critère de classification.
Cette quantité est approximativement une valeur observée d’une variable χ2
à p − 1 degrés de liberté, et l’hypothèse d’identité des distributions relatives aux
différentes modalités du premier critère de classification doit être rejetée, au niveau
de signification α , quand :

P(χ2 ≥ χ2obs ) ≤ α ou χ2obs ≥ χ21−α .

3◦ L’approximation est très rapidement satisfaisante, mais il y a lieu néanmoins


d’effectuer des calculs plus précis ou d’utiliser des tables particulières quand les
nombres de modalités des deux critères de classification sont très réduits (p = 3
et q < 10 , ou p = 4 et q < 5).
Des tables sont données notamment par Likeš et Laga [1980] et Owen [1962],
et figurent dans les principaux ouvrages relatifs aux méthodes non paramétriques.
Une adaptation du test de Friedman est également suggérée par Sepanski [2007].
29 En anglais : Friedman’s test.
322 ANALYSE DE LA VARIANCE À DEUX CRITÈRES 10.3.8

D’autre part, en présence d’ex aequo, la valeur χ2obs définie ci-dessus doit être
corrigée en la divisant par :
nX£ §o±£ §
1− k (k2 − 1) p q (p2 − 1) ,

la sommation s’étendant aux différentes séries d’ex aequo et k désignant le nombre


de termes de ces différentes séries.

d 4◦ On peut vérifier que la quantité χ2obs est, à une constante près, le carré moyen
factoriel qu’on obtiendrait pour le premier critère de classification, en soumettant
les rangs à l’analyse de la variance à un ou à deux critères.
La valeur χ2obs est aussi une mesure de la concordance entre les classements
qui sont réalisés pour le premier critère de classification, séparément pour les
différentes modalités du deuxième critère. Il pourrait s’agir, plus spécifiquement,
des préférences 30 ou des classements qui pourraient être établis, pour différents
produits, par différents juges ou par les différents membres d’un jury [Taplin,
1997]. À ce titre, la valeur χ2obs est étroitement liée au coefficient de concordance
de Kendall, dont il sera question au paragraphe 13.5.4.
En outre, quand le critère de classification considéré ne possède que deux mo-
dalités, le test de Friedman se confond avec le test des signes, que nous avons
évoqué antérieurement, sans le présenter explicitement (§ 8.5.3.5◦ ).
Enfin, on pourrait également formuler ici des commentaires semblables à ceux
que nous avons émis précédemment, entre autres choses en ce qui concerne l’effi-

b cacité asymptotique du test (§ 8.4.3.6 ).

d 5◦ Dans le cas des échantillons de plusieurs observations, différents tests basés


sur le principe des rangs alignés peuvent être utilisés. Les rangs sont alors calculés
globalement, pour l’ensemble des observations, puis ils sont corrigés ou ✭✭ alignés ✮✮
de manière à éliminer dans chaque cas l’influence des éléments autres que celui
qu’on souhaite tester.
Ainsi, pour réaliser le test relatif à l’interaction, on élimine l’influence des deux
facteurs principaux, et pour effectuer le test relatif par exemple au premier facteur,
on élimine l’influence de l’interaction et du deuxième facteur [Mansouri, 1998 ;
Mansouri et Chang, 1995 ; O’Gorman, 2001 ; Richter et Payton, 1999].
Cette façon de procéder peut être considérée comme une extension du test de
Kruskal et Wallis (§ 9.3.6).
D’autres approches ont aussi été envisagées, notamment par randomisation et
dans l’optique des hypothèses alternatives ordonnées [Gao et Alvo, 2005 ; Luh
b et Guo, 2004 ; Manly et Francis, 1999 ; Nelson, 2000b].
30 En anglais : preference.
10.3.8 MODÈLES CROISÉS À EFFECTIFS ÉGAUX : ASPECTS INFÉRENTIELS 323

Exemple 10.3.9. Comparaison des résultats obtenus par trois méthodes d’analyse
chimique : test de Friedman.
Nous illustrons l’emploi du test de Friedman en reprenant les données de
l’exemple 10.3.6, relatives à la comparaison des résultats obtenus par trois métho-
des d’analyse chimique.
Les données initiales du tableau 8.5.1 et les rangs correspondants figurent par-
tiellement dans le tableau 10.3.11. On en déduit :
12
χ2obs = (69,52 + 512 + 59,52 ) − (3) (30) (4) = 5,72 ,
(3) (30) (4)
et avec deux degrés de liberté :
P(χ2 ≥ 5,72) = 0,058 .

Tableau 10.3.11. Comparaison des résultats obtenus par trois méthodes


d’analyse chimique : teneurs en lutécium, en microgrammes par gramme
de cendres, et rangs (données partielles).

Teneurs Rangs
Échant.
1 2 3 1 2 3
1 133 129 138 2 1 3
2 131 132 138 1 2 3
3 119 121 121 1 2,5 2,5
4 124 124 121 2,5 2,5 1
5 123 124 124 1 2,5 2,5
.. .. .. .. .. .. ..
. . . . . . .
30 137 136 134 3 2 1
Totaux 69,5 51 59,5

Les différences entre les trois méthodes d’analyse apparaı̂traient ainsi, à pre-
mière vue, comme non significatives. Il faut noter toutefois que la proportion des
ex aequo est importante (11 cas sur 30), et que la correction qui les concernent ne
doit donc pas être négligée.
Cette correction conduit à diviser la valeur obtenue ci-dessus par :
±£ §
1 − (11) (6) (30) (3) (8) = 0,9083 .
On en déduit alors :
χ2obs = 6,29 et P(χ2 ≥ 6,29) = 0,043 .

Les différences observées doivent donc être considérées, au contraire, comme


significatives, ce qui ne fait d’ailleurs que confirmer la conclusion de l’analyse de
la variance à deux critères de classification (exemple 10.3.6).
324 ANALYSE DE LA VARIANCE À DEUX CRITÈRES 10.4.1

10.4 Les modèles croisés à effectifs inégaux


10.4.1 Principes généraux
1◦ Quand les effectifs des différents échantillons ne sont pas égaux, l’analyse
de la variance à deux critères de classification peut se compliquer sensiblement.
D’une part, en ce qui concerne le volet descriptif de l’analyse, les effets des
deux critères de classification ne sont plus nettement séparés. Ainsi, les moyennes
relatives aux différentes modalités du premier critère de classification par exemple
peuvent être influencées par le deuxième critère, en raison du fait que les inégalités
d’effectifs attribuent, dans ces différentes moyennes, des poids inégaux aux diffé-
rentes modalités de ce deuxième critère. L’exemple 10.4.3 illustre très bien ce
phénomène.
D’autre part, en ce qui concerne le volet inférentiel, il en résulte notamment
que, d’une manière générale, les variables χ2 relatives aux différentes sources de
variation ne sont plus indépendantes les unes des autres, ce qui peut affecter la
réalisation des tests d’hypothèses.

2◦ L’inégalité des effectifs peut être liée tout d’abord au fait qu’une ou plu-
sieurs observations sont manquantes 31 , dans un ensemble de données qui, nor-
malement, aurait dû être caractérisé par des effectifs égaux. Une telle situation
peut résulter par exemple de la mortalité de certaines plantes ou de certains ani-
maux, ou d’autres accidents susceptibles de survenir au cours de toute expérience
planifiée, initialement, de telle sorte que les effectifs soient en principe égaux.
Dans ce cas, et pour autant que la proportion des données manquantes ne soit
pas trop élevée, il est possible de procéder à une estimation de ces données, ce
qui conduit à des solutions relativement simples. Nous envisagerons cette question
d’une part pour les échantillons de plus d’une observations (§ 10.4.2) et d’autre
part pour les échantillons d’une seule observation (§ 10.4.3).

3◦ L’inégalité des effectifs peut être liée également à la nature même des don-
nées ou des phénomènes observés. Il peut s’agir par exemple de données d’enquêtes,
collectées sans qu’on ait voulu assurer l’égalité des effectifs ou sans qu’il ait été
possible d’assurer une telle égalité. Mais il peut s’agir aussi d’expériences pour les-
quelles le matériel disponible n’a pas permis une organisation équilibrée (nombres
inégaux de graines ou d’animaux disponibles pour différentes provenances ou dif-
férentes races, par exemple).
Si on désigne par nij les effectifs des différents échantillons, qui correspondent
aux différentes modalités des deux critères de classification, et par ni. et n.j les
effectifs totaux calculés séparément pour chacun des deux critères, les données
sont, le plus souvent, telles que la condition de proportionnalité :
nij = ni. n.j /n.. ,
31 En anglais : missing data, missing value.
10.4.1 MODÈLES CROISÉS À EFFECTIFS INÉGAUX 325

n’est pas satisfaite pour toutes les valeurs de i et de j . De telles données sont dites
non orthogonales 32 et nécessitent l’emploi de procédures particulières d’analyse,
qui sont plus complexes.
Ce problème est généralement traité dans l’optique du modèle linéaire, dont
il sera question ultérieurement (§ 16.4.4). Nous nous contenterons ici d’illustrer
cette situation par la présentation de deux exemples, sans donner d’informations
théoriques détaillées (§ 10.4.4).

d 4◦ Une situation intermédiaire entre le cas des effectifs égaux et le cas non or-
thogonal est celle des effectifs proportionnels 33 . Cette situation correspond au cas
où les effectifs des échantillons ne diffèrent qu’en fonction d’un seul critère de clas-
sification (effectifs ni dépendant uniquement du premier critère ou nj dépendant
uniquement du deuxième critère).
Les effectifs totaux sont alors égaux pour un des deux critères et inégaux pour
l’autre, de telle sorte que le modèle d’analyse de la variance est équilibré pour un
critère et non équilibré pour l’autre. En outre, la condition de proportionnalité des
effectifs, présentée ci-dessus, est satisfaite.
Cette situation est relativement proche du cas des effectifs égaux et peut être
traitée par des méthodes peu différentes de celles que nous avons exposées au
b paragraphe 10.3 [Dagnelie, 1970].

d 5◦ En outre, au problème des données manquantes, peuvent être associés les


problèmes de données mélangées et permutées, parfois dites aussi, plus globale-
ment, données altérées ou faussées 34 . Il s’agit de données mélangées quand un
résultat unique a été observé accidentellement à la place de deux ou plusieurs ré-
sultats distincts (rendement global relatif à deux ou plusieurs arbres ou parcelles, à
la place des rendements individuels relatifs aux différents arbres ou aux différentes
parcelles). Il s’agit de données permutées si deux ou plusieurs traitements ont été
appliqués par inadvertance à la place l’un de l’autre.
Ces problèmes particuliers peuvent être résolus notamment par l’analyse de la

b covariance (§ 17.3.3.3 ).

d 6◦ D’une manière plus générale, on trouvera des informations complémentaires


relatives aux questions de données manquantes dans divers livres et articles tels
que ceux de Allison [2001], Little et Rubin [2002], McKnight et al. [2007], et
b Spilke et al. [2005].

32 En anglais : non-orthogonal data.


33 En anglais : proportionate sample sizes.
34 En anglais : spoilt data, messy data.
326 ANALYSE DE LA VARIANCE À DEUX CRITÈRES 10.4.2

10.4.2 L’estimation des données manquantes :


échantillons de plusieurs observations
1◦ Dans le cas des échantillons de plusieurs observations, initialement de même
effectif, l’estimation d’une ou plusieurs données manquantes peut être réalisée
très facilement en utilisant chaque fois, comme valeur estimée, la moyenne des
observations qui sont disponibles pour l’échantillon considéré.
Cette façon de procéder a pour conséquence d’annuler les résidus relatifs aux
observations estimées, ce qui conduit à réduire la somme des carrés des écarts
résiduelle au prorata du nombre de données estimées. On peut compenser cette
réduction en diminuant les nombres de degrés de liberté de la variation résiduelle
et de la variation totale d’autant d’unités qu’il y a de données estimées.

2◦ Cette approche peut être suivie quand la proportion de données manquantes


n’est pas trop élevée (moins de 10 % du nombre total d’observations par exemple),
et pour autant que la répartition des données manquantes soit indépendante des
deux critères de classification. En particulier, la procédure générale relative au cas
non orthogonal (§ 10.4.4 et 16.4.4), ou d’autres procédures, doivent être utilisées
lorsque toutes les observations d’un ou plusieurs échantillons sont manquantes.
Quand la répartition des données manquantes est étroitement liée à un ou
aux deux critères de classification, on peut aussi envisager dans certains cas de
résoudre le problème en éliminant toutes les données relatives à la ou aux mo-
dalités pour laquelle ou pour lesquelles la proportion de données manquantes est
particulièrement élevée.

Exemple 10.4.1. Comparaison de trois types de sondes dans deux types de sols :
analyse de la variance avec estimation préalable d’une donnée.
L’exemple 10.3.2, relatif au contrôle des conditions d’application de l’analyse
de la variance, pour trois types de sondes et deux types de sols, a mis en évidence la
présence d’une donnée suspecte, qui figure dans le tableau 10.2.2 (x114 = 53). Pour
voir quelle peut être l’influence de cette valeur, il suffit de l’éliminer de l’analyse
en la remplaçant, comme si elle était manquante, par une valeur estimée basée sur
les trois autres observations du même échantillon :

x
b114 = (43 + 45 + 46)/3 = 44,67.

Le tableau 10.4.1 présente les résultats obtenus de cette façon. Dans ce tableau,
les nombres de degrés de liberté de la variation résiduelle et de la variation totale
ont été réduits d’une unité.
Par comparaison avec le tableau 10.3.1, on constate tout d’abord que l’élimi-
nation de la valeur suspecte provoque une réduction de plus de 40 % du carré
moyen résiduel. On peut observer aussi que l’influence du facteur types de sols
est toujours considérable et que la composante d’interaction reste largement non
significative.
10.4.3 MODÈLES CROISÉS À EFFECTIFS INÉGAUX 327

Tableau 10.4.1. Comparaison de trois types de sondes dans deux types de sols :
tableau d’analyse de la variance, après estimation d’une donnée.

Sources Degrés Sommes des carrés Carrés


F P
de variation de liberté des écarts moyens
Types de sols 1 138,6 138,6 39,0 *** 0,0000
Types de sondes 2 25,6 12,8 3,61 * 0,049
Interaction 2 4,6 2,3 0,65 0,53
Variation résiduelle 17 60,4 3,55
Totaux 22 229,2

La situation est plus délicate en ce qui concerne le facteur types de sondes,


auquel on s’intéresse en réalité plus particulièrement. La probabilité afférente à
ce critère de classification passe en effet de 0,039 (tableau 10.3.1) à 0,049 (ou de
façon plus précise 0,0495). Le facteur types de sondes reste donc significatif, mais
dans des conditions tout à fait limites.
Ce cas concret met bien en évidence l’importance des conséquences possibles de
toute décision, souvent subjective, d’éliminer ou non une ou plusieurs observations
suspectes.
d Il est intéressant de noter que la solution proposée au paragraphe 10.4.4, en ce
qui concerne le cas non orthogonal (effectifs inégaux), donnerait une valeur Fobs
égale à 3,58 au lieu de 3,61 , et une probabilité correspondante égale à 0,0504 au
lieu de 0,0495 . Selon cette procédure, les différences observées ne seraient donc
pas significatives, mais de façon tout aussi limite, ce qui souligne mieux encore
la prudence avec laquelle il y a lieu d’aborder la question de l’élimination ou la
b non-élimination de valeurs suspectes.

10.4.3 L’estimation des données manquantes :


échantillons d’une seule observation
1◦ Dans le cas des échantillons d’une seule observation, le même principe qu’au
paragraphe précédent, à savoir l’annulation des résidus relatifs aux valeurs qui doi-
vente être estimées, peut être adopté en vue de procéder à l’estimation d’éventuelles
données manquantes. Pour une seule observation manquante, ce principe conduit
à la relation suivante :
±£ §
bij = (p Xi.0 + q X.j0 − X..0 ) (p − 1) (q − 1) ,
x

les sommes Xi.0 , X.j0 et X..0 ne faisant évidemment pas intervenir la valeur man-
quante.
Quand deux ou plusieurs observations sont manquantes, cette relation peut
être utilisée par approximations successives, comme le montre l’exemple 10.4.2. Il
328 ANALYSE DE LA VARIANCE À DEUX CRITÈRES 10.4.3

est également possible, dans ce cas, de traiter le problème sans itérations, par la
résolution de systèmes d’équations linéaires comportant autant d’équations qu’il
y a de données manquantes.
De plus, tant pour une que pour deux ou plusieurs données manquantes, le
problème peut être résolu aussi par l’analyse de la covariance (§ 17.3.3.3◦ ).
Dans tous les cas, les nombres de degrés de liberté de l’interaction et de la
variation totale doivent être réduits d’autant d’unités qu’on a estimé de valeurs
manquantes.

2◦ Ces diverses approches, qui sont toutes basées sur le principe des moindres
carrés, fournissent des estimations non biaisées pour les moyennes et pour le carré
moyen de l’interaction, mais elle donne par contre des valeurs surestimées en ce
qui concerne les carrés moyens factoriels.
L’erreur systématique correspondante est d’autant plus importante que le nom-
bre de données estimées est plus élevé. En conséquence, on n’emploiera ces procé-
dures que quand les données manquantes ne représentent qu’une faible proportion
de l’ensemble. Une limite de 10 % de données manquantes, maximum, paraı̂t rai-
sonnable.
d D’autres approches sont présentées notamment par Hunt et Triggs [1989],
b et Kala [1998].

Exemple 10.4.2. Comparaison des résultats obtenus par trois méthodes d’analyse
chimique : analyse de la variance avec estimation préalable d’une ou deux données.
On peut illustrer les procédures qui viennent d’être présentées en supposant
par exemple que, pour les données relatives à la comparaison de trois méthodes
d’analyse chimique (exemple 10.3.6), la dernière observation (x3,30 ) est manquante
ou a dû être éliminée.
On aurait alors (tableau 8.5.1) :
0 0
X3. = 3.478 , X.30 = 273 , X..0 = 10.683
£ §±£ §
et x
b3,30 = 3 (3.478) + 30 (273) − 10.683 (2) (29) = 136,91 .

Le tableau 10.4.2 présente les résultats de l’analyse de la variance qui ont été ob-
tenus en substituant cette dernière valeur à celle qui intervenait antérieurement
(x3,30 = 134), et en réduisant d’une unité les nombres de degrés de liberté de
l’interaction et de la variation totale.
Ce tableau n’est guère différent du tableau initial (tableau 10.3.9), ce qui n’a
rien de surprenant si on tient compte du fait qu’une seule valeur sur 90 a ainsi été
estimée.
d De même, on peut illustrer la question de l’estimation de deux données man-
quantes en supposant qu’en outre, l’observation x1,13 est manquante ou a dû être
éliminée.
10.4.4 MODÈLES CROISÉS À EFFECTIFS INÉGAUX 329

Tableau 10.4.2. Comparaison des résultats obtenus par trois méthodes


d’analyse chimique : tableau d’analyse de la variance,
après estimation d’une donnée.

Sources Degrés Sommes des carrés Carrés


F P
de variation de liberté des écarts moyens
Méthodes d’analyse 2 37,17 18,59 3,77 * 0,029
Prélèvements 29 15.434,60 532,23
Interaction 57 280,77 4,926
Totaux 88 15.752,54

Il faut alors donner à titre provisoire une valeur quelconque, telle que la valeur
de la moyenne générale ou une valeur proche de la moyenne générale, à une des
deux observations manquantes, c’est-à-dire par exemple :

x
b1,13 = 120 .

En fonction de cette valeur, on obtient pour x3,30 :


0 0
X3. = 3.478 , X.30 = 273 , X..0 = 10.707
£ §±£ §
et x
b3,30 = 3 (3.478) + 30 (273) − 10.707 (2) (29) = 136,50 .

Ensuite, selon le même processus et en repartant de cette dernière valeur, on


a pour x1,13 :
0 0
X1. = 3.529 , X.13 = 186 , X..0 = 10.723,50
£ §±£ §
et x
b1,13 = 3 (3.529) + 30 (186) − 10.723,50 (2) (29) = 93,85 .

Et on peut poursuivre ce calcul itératif, en estimant successivement à tour de


rôle chacune des deux valeurs manquantes, la convergence étant toujours extrê-
mement rapide. Le résultat final, qui est indépendant de la valeur choisie comme
point de départ, est :

x
b1,13 = 93,85 et x
b3,30 = 136,95 .

L’analyse de la variance peut ensuite être réalisée comme ci-dessus, mais en


réduisant cette fois de deux unités les nombres de degrés de liberté de l’interaction
b et de la variation totale.

10.4.4 Le cas non orthogonal


Comme nous l’avons signalé au paragraphe 10.4.1.3◦ , nous n’envisageons ici
l’analyse de la variance à deux critères de classification, dans le cas non orthogonal,
330 ANALYSE DE LA VARIANCE À DEUX CRITÈRES 10.4.4

que par la présentation de deux exemples. Nous reviendrons ultérieurement sur


cette question de manière plus détaillée, dans le cadre de l’étude du modèle linéaire
(§ 16.4.4).
Le premier exemple n’est pas relatif à des données réelles. Il est en fait inspiré
d’un exemple classique dû à Yates [1933] et déjà repris notamment par Finney
[1980]. Cet exemple a l’avantage d’être particulièrement parlant.

Exemple 10.4.3. Étude de la croissance en poids de poussins en fonction du sexe


et de trois traitements : analyse de la variance.
Un ensemble de 45 œufs de poules a été subdivisé de façon complètement
aléatoire en trois lots de 15 œufs, au moment de la mise en incubation, et des
traitements différents (par exemple différentes températures d’incubation) ont été
appliqués aux différents lots. Après éclosion, les poussins ont tous été élevés dans
des conditions identiques, puis pesés à un même âge de référence. Le sexe des
poussins, dont on sait a priori qu’il induit de fortes différences de poids, pouvait
alors être aussi observé.
Les poids obtenus, exprimés en décagrammes, ainsi que les effectifs, les sommes
et les moyennes des poids, figurent dans le tableau 10.4.3. Il n’est évidemment pas
surprenant que, dans de telles conditions, les effectifs relatifs aux différentes combi-
naisons des deux critères de classification (sexes et traitements) soient inégaux 35 .
On remarquera que les moyennes marginales, dont les symboles sont affectés ici
du signe ✭✭ prime ✮✮ (x̄0i.. et x̄0.j. ) sont à la fois des moyennes arithmétiques simples de
l’ensemble des observations considérées, et des moyennes arithmétiques pondérées
des moyennes x̄ij. correspondantes, les coefficients de pondération étant les effectifs
nij relatifs à ces dernières moyennes. Ainsi, la valeur 22,7, qui apparaı̂t dans la
dernière ligne du tableau, est à la fois la moyenne arithmétique simple des poids
des 15 poussins relatifs au traitement 1 (soit 340/15), et une moyenne pondérée
des moyennes 28,2 et 19,9 , les coefficients de pondération étant les effectifs 5 et 10 :

[5 (28,2) + 10 (19,9)]/15 = 22,7.

Un rapide examen des moyennes marginales confirme tout d’abord la grande


différence de poids entre les animaux des deux sexes (x̄01.. = 26,8 et x̄02.. = 19,1).
Un tel examen semble indiquer également que le traitement 3 (x̄0.3. = 25,1) a
induit des poids sensiblement supérieurs aux deux autres traitements (x̄0.1. = 22,7
et x̄0.2. = 22,3).
Cette conclusion est toutefois en contradiction avec ce que montrent les moyen-
nes x̄ij. . Ces moyennes ne sont en effet pas globalement supérieures pour le trai-
tement 3 (x̄13. = 27,5 et x̄23. = 18,2), par comparaison avec les traitements 1 et 2
(x̄11. = 28,2 et x̄21. = 19,9 d’une part, x̄12. = 25,0 et x̄22. = 18,3 d’autre part). En
35 On peut éventuellement vérifier, par un test d’indépendance, que les effectifs considérés n’ont

rien d’anormal. On obtient en effet, par ce test (§ 6.2.2), une valeur χ2obs égale à 5,04 , avec deux
degrés de liberté, et une probabilité P(χ2 ≥ 5,04) égale à 0,080 .
10.4.4 MODÈLES CROISÉS À EFFECTIFS INÉGAUX 331

Tableau 10.4.3. Poids de 45 poussins, en décagrammes, effectifs, totaux


et moyennes, en fonction des deux sexes et de trois traitements.

Traitement 1 Traitement 2 Traitement 3


(j = 1) (j = 2) (j = 3)
25 30 21 26 23 28
Mâles 26 33 22 27 24 29
(i = 1) 27 22 28 25 31
24 30 26 32
25 26 32
27
15 20 16 18 15 19
Femelles 18 21 17 20 17 22
(i = 2) 19 21 18 21
20 22
20 23
Effectifs : nij ni.
Mâles 5 9 11 25
Femelles 10 6 4 20
n.j 15 15 15 45
Totaux : Xij. Xi..
Mâles 141 225 303 669
Femelles 199 110 73 382
X.j. 340 335 376 1.051
Moyennes : x̄ij. x̄0i..
Mâles 28,2 25,0 27,5 26,8
Femelles 19,9 18,3 18,2 19,1
x̄0.j. 22,7 22,3 25,1 23,4

réalité, la supériorité apparente du traitement 3 , par rapport aux traitements 1


et 2 , résulte essentiellement de la plus forte proportion d’individus mâles, de poids
plus élevés, dans le cas de ce traitement (n13 = 11 , par comparaison avec n11 = 5
et n12 = 9), et n’est nullement liée au traitement lui-même.
À ces problèmes d’interprétation des moyennes, s’ajouterait une incohérence
relative aux sommes des carrés des écarts, si on appliquait sans précautions, à ce
cas non orthogonal, les procédures classiques de calcul de l’analyse de la variance
à un et à deux critères.
En utilisant la relation générale relative aux effectifs éventuellement inégaux,
telle qu’elle est présentée en analyse de la variance à un critère de classification
(§ 9.2.3.4◦ ), on obtiendrait en effet les sommes des carrés des écarts factorielles :

SCEa = 652,0 et SCEb = 66,7.


332 ANALYSE DE LA VARIANCE À DEUX CRITÈRES 10.4.4

D’autre part, en calculant et en additionnant les sommes des carrés des écarts
relatives aux six groupes d’individus (§ 10.2.3.2◦ ), on aurait, pour la somme rési-
duelle :
SCEr = 42,8 + 74,0 + 98,7 + 44,9 + 17,3 + 26,8 = 304,5 .

Enfin, la somme des carrés des écarts totale étant :

SCEt = 1.014,3 ,

la somme des carrés des écarts de l’interaction devrait être, par différence :

SCEab = 1.014,3 − 652,0 − 66,7 − 304,5 = − 8,9 .

Cette valeur négative est bien sûr tout à fait inadmissible.


Le tableau 10.4.4, qui présente deux décompositions distinctes de la somme des
carrés des écarts totale, montre comment on peut résoudre ce problème de manière
relativement simple.

Tableau 10.4.4. Étude de la croissance en poids de poussins en fonction du sexe


et de trois traitements : tableau d’analyse de la variance non orthogonale.

Degrés S. des carrés Carrés


Sources de variation F P
de liberté des écarts moyens
Sexes 1 652,0 652,0
Trait. : moy. ajustées 2 46,2 23,1 2,96 0,064
Interaction 2 11,6 5,8 0,74 0,48
Variation résiduelle 39 304,5 7,81
Traitements 2 66,7 33,4
Sexes : moy. ajustées 1 631,5 631,5 80,9 *** 0,0000
Interaction 2 11,6 5,8 0,74 0,48
Variation résiduelle 39 304,5 7,81
Totaux 44 1.014,3

Outre les lignes d’interaction et de variation résiduelle, la première partie de ce


tableau contient une ligne relative au facteur sexes, obtenue comme ci-dessus sans
tenir compte de l’existence du facteur traitements, et une ligne relative au facteur
traitements, obtenue au contraire en éliminant l’influence du facteur sexes, par le
calcul de moyennes ajustées. Il apparaı̂t ainsi que, comme l’interaction, le facteur
traitements est non significatif, bien qu’il soit proche de la limite de signification.
De même, la deuxième partie du tableau 10.4.4 contient une ligne relative
aux traitements, ignorant les différences entre sexes, et une ligne relative aux
sexes, avec élimination de l’effet des traitements. Cette deuxième partie ne présente
toutefois guère d’intérêt dans le cadre du problème envisagé ici, les différences entre
sexes étant bien connues, et l’objectif poursuivi étant essentiellement l’étude des
traitements.
10.5.1 MODÈLES HIÉRARCHISÉS 333

Nous donnerons plus d’informations à ce sujet, notamment quant au concept


de moyenne ajustée et en suggérant d’autres options, au paragraphe 16.4.4.

Exemple 10.4.4. Comparaison des résultats obtenus par trois méthodes d’analyse
chimique : analyse de la variance non orthogonale.
L’exemle 10.4.2 a été consacré à la comparaison de trois méthodes d’analyse
chimique, pour lesquelles une ou deux observations auraient été manquantes. On
peut envisager le même problème sous l’angle de l’analyse de la variance non
orthogonale.
Sans donner plus de détails, nous présentons dans le tableau 10.4.5 les résultats
qui peuvent être obtenus en supposant, comme dans l’exemple 10.4.2, que la
dernière observation (x3,30 ) est manquante. Nous nous limitons en outre, dans
ce tableau, à la seule décomposition de la somme des carrés des écarts totale qui
est utile en vue de comparer les différentes méthodes d’analyse.

Tableau 10.4.5. Comparaison des résultats obtenus par trois méthodes


d’analyse chimique : tableau d’analyse de la variance non orthogonale.

Degrés Sommes des carrés Carrés


Sources de variation F P
de liberté des écarts moyens
Prélèvements 29 15.153,07 522,52
Méthodes : moy. ajust. 2 37,06 18,53 3,76 * 0,029
Interaction 57 280,77 4,926
Totaux 88 15.470,90

Comme dans l’exemple précédent, la première ligne provient d’un calcul direct
de la somme des carrés des écarts relative au facteur prélèvements, tandis que la
deuxième ligne est liée, pour le facteur méthodes d’analyse, à la détermination de
moyennes ajustées (§ 16.4.4).
On peut constater la très grande similitude avec les résultats antérieurs, déduits
de l’estimation de la donnée manquante (tableau 10.4.2).

10.5 Les modèles hiérarchisés


10.5.1 Principes généraux
1◦ Les modèles hiérarchisés d’analyse de la variance à deux critères de classi-
fication correspondent à des situations où un des deux critères est subordonné à
l’autre.
Il en est ainsi par exemple quand on compare les productions laitières d’une
même race bovine dans deux ou plusieurs régions, en choisissant au hasard et
334 ANALYSE DE LA VARIANCE À DEUX CRITÈRES 10.5.2

indépendamment plusieurs exploitations agricoles dans chaque région, et en me-


surant dans chacune d’elles les productions de plusieurs bêtes, elles aussi choisies
au hasard et indépendamment. Le facteur exploitations est alors subordonné au
facteur régions, puisque le choix des exploitations est réalisé à l’intérieur de cha-
cune des régions, sans qu’il n’y ait aucune correspondance entre les différentes
exploitations des différentes régions.
Dans ces conditions, il ne se justifie pas, en particulier, de calculer la moyen-
ne x̄.1. , qui serait relative aux premières exploitations des différentes régions, la
moyenne x̄.2. , qui serait relative aux deuxièmes exploitations des différentes ré-
gions, etc., c’est-à-dire les moyennes x̄.j. , relatives au deuxième critère de classi-
fication. Il se justifie par contre toujours de calculer les moyennes relatives aux
différentes régions, c’est-à-dire les moyennes x̄i.. relatives au premier critère de
classification.

2◦ Dans ce type de problèmes, le critère de classification subordonné est gé-


néralement aléatoire, tandis que le critère de classification principal peut être,
indifféremment, fixe ou aléatoire. Les modèles d’analyse de la variance à prendre
en considération sont donc un modèle mixte et un modèle aléatoire.
Le modèle mixte correspond à un ensemble d’échantillonnages à deux degrés,
réalisés indépendamment les uns des autres, pour les différentes modalités du pre-
mier critère de classification. Le modèle aléatoire correspond à un échantillonnage
à trois degrés 36 , qui généralise l’échantillonnage à deux degrés.
En outre, on peut distinguer ici également des modèles équilibrés, à effectifs
constants aux différents niveaux de l’échantillonnage, et des modèles non équili-
brés, à effectifs inégaux.

3◦ Dans la suite, et comme pour les modèles croisés, nous envisagerons sé-
parément les aspects descriptifs (§ 10.5.2) et les aspects inférentiels (§ 10.5.3) de
l’analyse.

10.5.2 Les aspects descriptifs


1◦ Comme précédemment (§ 10.2.2.1◦ ), nous représenterons les observations
initiales par le symbole xijk et nous adopterons en outre les conventions suivantes
en ce qui concerne les effectifs.
Nous désignerons par p le nombre de modalités du premier critère de classifi-
cation, par qi (i = 1 , . . . , p) les nombres de modalités, éventuellement inégaux,
du deuxième critère de classification, pour les différentes modalités du premier
critère, et par nij (i = 1 , . . . , p et j = 1 , . . . , qi ) les effectifs, éventuellement
inégaux aussi, des différents échantillons. Dans l’exemple auquel nous avons fait
allusion ci-dessus, il s’agirait respectivement du nombre p de régions étudiées, des
36 En anglais : three-stage sampling.
10.5.2 MODÈLES HIÉRARCHISÉS 335

nombres qi d’exploitations agricoles observées dans les différentes régions, et des


nombres nij de bêtes observées dans les différentes exploitations.

2◦ On peut alors désigner aussi par q. le nombre total de modalités du deuxième


critère de classification, par ni. (i = 1 , . . . , p) les effectifs totaux des échantillons
relatifs à chacune des modalités du premier critère de classification, et par n.. l’ef-
fectif total de tous les échantillons. Il s’agirait, dans notre exemple, du nombre
total q. d’exploitations agricoles observées, des nombres totaux ni. de bêtes ob-
servées dans les différentes régions, et du nombre total n.. de bêtes observées pour
l’ensemble des différentes régions.
Dans le cas équilibré, les effectifs q et n sont constants, et on a en particulier :

ni. = q n et n.. = p q n .

3◦ Dans le cas général, les moyennes relatives aux différents niveaux de la


hiérarchie sont, du niveau inférieur au niveau supérieur :

nij qi nij qi
1 X 1 XX 1 X
x̄ij. = xijk , x̄i.. = xijk = (nij x̄ij.)
nij ni. j=1 ni. j=1
k=1 k=1

p qi nij p qi p
1 XXX 1 XX 1 X
et x̄... = xijk = (nij x̄ij. ) = (ni. x̄i.. ) .
n.. i=1 j=1 n.. i=1 j=1 n.. i=1
k=1

Ces différentes relations se simplifient bien sûr sensiblement dans le cas équilibré.

4◦ Dans ces conditions, le modèle observé s’écrit :

xijk − x̄... = (x̄i.. − x̄... ) + (x̄ij. − x̄i.. ) + (xijk − x̄ij. ) .

Il contient un terme de moins que le modèle croisé, le deuxième terme du deuxième


membre remplaçant, à la fois, le terme relatif au deuxième facteur et le terme d’in-
teraction (§ 10.2.2.2◦ ).

5◦ L’équation d’analyse de la variance est en conséquence :


p X nij
qi X p p X
qi
X X £ § X £ §
(xijk − x̄... )2 = ni. (x̄i.. − x̄... )2 + nij (x̄ij. − x̄i.. )2
i=1 j=1 k=1 i=1 i=1 j=1
p X nij
qi X
X
+ (xijk − x̄ij. )2 ,
i=1 j=1 k=1
336 ANALYSE DE LA VARIANCE À DEUX CRITÈRES 10.5.2

ou encore :
SCEt = SCEa + SCEb|a + SCEr .

Tous les termes de cette équation sont identiques à ceux qui concernent les
modèles croisés (§ 10.2.2.3◦ ), à l’exception du terme SCEb|a . Celui-ci désigne la
somme des carrés des écarts entre les différentes modalités du deuxième critère
de classification, à l’intérieur des différentes modalités du premier critère. Dans
l’exemple considéré ci-dessus, il s’agirait de la variation entre exploitations agri-
coles, à l’intérieur des régions.
Ce terme prend la place, à la fois, de la variation factorielle relative au deuxième
critère de classification et de la variation de l’interaction. Dans le cas équilibré et
en supposant qu’on calcule, comme pour les modèles croisés, des moyennes x̄.j. ,
on aurait d’ailleurs strictement :

SCEb|a = SCEb + SCEab .

6◦ Les nombres de degrés de liberté qui correspondent aux différentes sommes


des carrés des écarts sont tels que :

n.. − 1 = (p − 1) + (q. − p) + (n.. − q. ) ,

c’est-à-dire aussi, dans le cas équilibré :

p q n − 1 = (p − 1) + p (q − 1) + p q (n − 1) .

Comme précédemment, on peut en déduire les différents carrés moyens et


constituer ensuite le tableau d’analyse de la variance (tableau 10.5.1).

Tableau 10.5.1. Tableau d’analyse de la variance à deux critères


de classification, dans le cas des modèles hiérarchisés.

Sources Degrés Sommes des carrés Carrés


de variation de liberté des écarts moyens
Facteur a p−1 SCEa CMa
Facteur b (dans a) q. − p SCEb|a CMb|a
Variation résiduelle n.. − q. SCEr CMr
Totaux n.. − 1 SCEt

d 7◦ Lors de la réalisation des calculs à l’aide de logiciels statistiques, le modèle


présenté ici doit être clairement distingué des modèles considérés antérieurement.
En ce qui concerne par exemple les commandes ✭✭ anova ✮✮ et ✭✭ glm ✮✮ du logiciel
Minitab, et en utilisant exclusivement des lettres majuscules, le modèle croisé
10.5.2 MODÈLES HIÉRARCHISÉS 337

relatif au cas des échantillons de plusieurs observations s’écrit (§ 10.2) :

X = A B A*B ,

A et B désignant les deux facteurs principaux et A*B désignant l’interaction, la


composante résiduelle ne devant pas être mentionnée. De même, pour le modèle
croisé relatif au cas des échantillons d’une seule observation (§ 10.3.6), on a :

X = A B,

l’analyse de la variance ne comportant pas de terme d’interaction à proprement


parler.
Quant au modèle hiérarchisé dont il est question ici, l’écriture correspondante
est :
X = A B(A) ,

B(A) désignant le facteur B subordonné à A.


Les mêmes présentations ou d’autres formes plus ou moins semblables doivent
b être utilisées pour d’autres logiciels.
d 8◦ Quant à l’éventuelle réalisation ✭✭ manuelle ✮✮ des calculs, la meilleure solu-
tion consiste à effectuer tout d’abord une analyse de la variance à un critère de
classification pour chacune des p modalités du premier facteur.
La somme des carrés des écarts résiduelle de l’analyse à deux critères de clas-
sification peut alors être obtenue très facilement en additionnant les sommes des
carrés des écarts résiduelles des p analyses à un critère. De même, la somme des
carrés des écarts relative au deuxième critère de classification peut être obtenue
en additionnant les sommes des carrés des écarts factorielles des p analyses à un
critère.
Enfin, si on désigne par Xi.. et X... , respectivement, les sommes relatives aux
différentes modalités du premier critère de classification et la somme générale, la
somme des carrés des écarts relative à ce critère est :
p
X
2 2
SCEa = (Xi.. /ni. ) − X... /n.. .
i=1

Cette formule est identique à celle du paragraphe 9.2.3.4◦ , en ajoutant toutefois un


point en indice à chaque symbole, puisqu’une sommation supplémentaire intervient
b pour chacun des éléments pris en considération.

Exemple 10.5.1. Comparaison et étude de l’homogénéité des rendements four-


ragers de deux types de prairies : analyse de la variance.
Nous avons étudié antérieurement, par l’analyse de la variance à un critère de
classification, l’homogénéité des rendements fourragers d’un ensemble de prairies
(exemple 9.3.3).
338 ANALYSE DE LA VARIANCE À DEUX CRITÈRES 10.5.2

Les données disponibles concernent en fait, non pas un seul ensemble de prai-
ries, mais bien deux types de prairies [Calembert, 1962]. Dans chacun d’eux, trois
prairies ont été choisies au hasard et indépendamment, et les rendements fourragers
ont été déterminés chaque fois en cinq endroits différents, eux-mêmes choisis au
hasard et indépendamment dans chacune des six prairies. Ces données permettent,
à la fois, de comparer les deux types de prairies et d’étudier l’homogénéité des
rendements à l’intérieur de ces deux types de prairies (variabilité d’une prairie à
l’autre et variabilité à l’intérieur des prairies).
Le tableau 10.5.2 réunit l’ensemble des données et le tableau 10.5.3 présente
les résultats de l’analyse de la variance, y compris les tests F , dont il sera question
ultérieurement (exemple 10.5.2).

Tableau 10.5.2. Comparaison et étude de l’homogénéité des rendements


fourragers de deux types de prairies : rendements observés,
en tonnes de matière sèche par hectare.

Type 1 Type 2
Parcelles
Prairie 1 Prairie 2 Prairie 3 Prairie 1 Prairie 2 Prairie 3
1 2,06 1,59 1,92 2,91 1,57 2,43
2 2,99 2,63 1,85 3,27 1,82 2,17
3 1,98 1,98 2,14 3,45 2,69 2,37
4 2,95 2,25 1,33 3,92 3,25 2,89
5 2,70 2,09 1,83 4,34 3,11 2,24

Tableau 10.5.3. Comparaison et étude de l’homogénéité des rendements


fourragers de deux types de prairies : tableau d’analyse de la variance.

Degrés S. des carrés Carrés


Sources de variation F P
de liberté des écarts moyens
Différences entre types
de prairies 1 3,4273 3,4273 2,47 0,19
Différences entre prairies
(dans les types de prairies) 4 5,5410 1,3852 5,79 ** 0,0021
Différences entre parcelles
(dans les prairies) 24 5,7419 0,2392
Totaux 29 14,7102

Au point de vue purement descriptif, on se contentera de constater l’augmen-


tation progressive des valeurs des carrés moyens du niveau inférieur (✭✭ dans les
prairies ✮✮) au niveau supérieur (✭✭ entre types de prairies ✮✮).
10.5.3 MODÈLES HIÉRARCHISÉS 339

10.5.3 Les aspects inférentiels


1◦ Comme nous l’avons signalé au paragraphe 10.5.1.2◦ , deux modèles d’analy-
se de la variance, l’un mixte et l’autre aléatoire, doivent être pris en considération
dans le cas hiérarchisé.
En ce qui concerne le modèle mixte, on s’intéresse à un nombre fini p de mo-
dalités du premier critère de classification, et à une infinité ou une quasi-infinité
de variantes du deuxième critère de classification, pour chacune des modalités du
premier critère. Un nombre fini q. de ces variantes sont choisies pour être obser-
vées, les nombres de variantes observées par modalité du premier critère étant
égaux à qi . Le choix de ces variantes est effectué de manière aléatoire et simple,
et indépendamment d’une modalité à l’autre.
Quant au modèle aléatoire, par contre, le nombre de modalités est considéré
comme infini ou quasi infini pour les deux critères de classification. Les p modalités
observées du premier critère de classification sont tout d’abord choisies de manière
aléatoire et simple, puis les q. modalités du deuxième critère de classification sont
choisies comme pour le modèle mixte.

2◦ Dans ces conditions, les différentes moyennes théoriques sont mi. , Mj|i et
m.. pour le modèle mixte, Mi. , Mj|i et m.. pour le modèle aléatoire.
Les effets principaux correspondants sont, d’une part :
ai = mi. − m.. et Bj|i = Mj|i − mi. ,
et d’autre part :
Ai = Mi. − m.. et Bj|i = Mj|i − Mi. .

3◦ Le modèle théorique s’écrit alors 37 :

Xijk − m.. = ai + Bj|i + Dijk ou Xijk − m.. = Ai + Bj|i + Dijk .

Toutes les variables aléatoires Ai , Bj|i et Dijk sont supposées normales, indépen-
2 2
dantes les unes des autres, de moyennes nulles, et de variances respectives σA , σB
2
et σ .
Comme dans le cas du modèle observé (§ 10.5.2.4◦ ), le terme relatif au deuxième
critère de classification (Bj|i ) prend la place de deux termes présents dans les mo-
dèles croisés (Bj et Cij ).

4◦ Les hypothèses nulles sont ici, pour le modèle mixte :


H0 : a1 = a2 = . . . = ap = 0 ou m1. = m2. = . . . = mp. et H00 : σB
2
= 0,
37 Par souci de concordance avec ce que nous avons fait précédemment, nous conservons ici

la notation Dijk pour désigner les écarts résiduels. Nous aurions aussi pu spécifier clairement la
hiérarchie en introduisant, au contraire, la notation Dk|j|i , de même que nous aurions pu utiliser
le symbole Dk|ij pour les modèles croisés.
340 ANALYSE DE LA VARIANCE À DEUX CRITÈRES 10.5.3

et pour le modèle aléatoire :


2
H0 : σA = 0 et H00 : σB
2
= 0.

Les hypothèses relatives au premier critère de classification doivent être inter-


2
prétées comme précédemment. Par contre, l’hypothèse relative à σB doit être
considérée comme une hypothèse d’égalité des moyennes des infinités ou quasi-
infinités de modalités du deuxième critère de classification, à l’intérieur des p ou
de l’infinité ou quasi-infinité de modalités du premier critère.

5◦ En vue de simplifier la présentation, nous ne considérons dans la suite que


le cas des modèles équilibrés, à effectifs q et n constants.
Les espérances mathématiques des carrés moyens sont alors :

p
qn X 2
E(CMa ) = σ 2 + n σB
2
+ a ou E(CMa ) = σ 2 + n σB
2 2
+ q n σA ,
p − 1 i=1 i

E(CMb|a ) = σ 2 + n σB
2
et E(CMr ) = σ 2 .

De même, dans les conditions qui viennent d’être définies, les distributions
d’échantillonnage des sommes des carrés des écarts, divisées par σ 2 , sont toujours
des distributions χ2 , indépendantes les unes des autres.

6◦ Les tests d’hypothèses peuvent être effectués en conséquence en calculant


les quantités :

Fa = CMa /CMb|a et Fb = CMb|a /CMr ,

et par comparaison avec les distributions F de Fisher-Snedecor à p−1 et p (q−1)


degrés de liberté d’une part, p (q − 1) et p q (n − 1) degrés de liberté d’autre part.
Éventuellement, il peut être utile de regrouper, comme dans le cas des modèles
croisés (§ 10.3.5.3◦ ), les deux dernières sources de variation.

7◦ Enfin, des estimations de moyennes, de différences de moyennes et de com-


posantes de la variance, ainsi que des déterminations de limites de confiance,
peuvent être réalisées selon les mêmes principes que précédemment (§ 10.3.2.7◦
et 10.3.3.8◦ ).
d Des informations complémentaires, relatives notamment au cas non équilibré
et à l’estimation des composantes de la variance, peuvent être trouvées dans les
ouvrages cités au paragraphe 16.4.5.3◦ , ainsi que dans certains articles spécifiques,
tels ceux de Hernandez et al. [1992], Rao et Heckler [1997], et Sen et al.
b [1992].
10.5.3 MODÈLES HIÉRARCHISÉS 341

Exemple 10.5.2. Comparaison et étude de l’homogénéité des rendements four-


ragers de deux types de prairies : suite de l’analyse de la variance.
En ce qui concerne le problème étudié au cours de l’exemple 10.5.1, s’il s’agit
bien de deux types donnés de prairies, le modèle d’analyse de la variance doit
être considéré comme mixte, les types de prairies constituant un facteur fixe et les
prairies elles-mêmes un facteur aléatoire.
Le test de l’hypothèse d’égalité des rendements des deux types de prairies doit
être réalisé par rapport aux différences entre prairies, avec 1 et 4 degrés de liberté,
et le test de l’hypothèse de nullité de ces différences, par rapport aux différences
entre parcelles, avec 4 et 24 degrés de liberté. Le premier test conduit à un résultat
non significatif, et le second fait apparaı̂tre des différences hautement significatives
(tableau 10.5.3). Ce dernier test confirme en fait, en l’amplifiant, la conclusion
antérieure, relative aux prairies du premier type (exemple 9.3.3).
Le contrôle de l’hypothèse d’égalité des variances par la méthode de Levene
met toutefois en évidence une certaine inégalité des variances entre prairies, les
valeurs extrêmes de ces variances étant dans le rapport de 1 à 7. Les effectifs étant
constants aux différents niveaux de l’échantillonnage, cette situation ne met pas
en cause les conclusions des tests, et ne devrait pas empêcher la détermination
éventuelle de limites de confiance pour la différence de rendements entre les deux
types de prairies. Il y aurait par contre lieu d’être prudent et d’envisager le recours
à l’une ou l’autre transformation de variable en vue de l’estimation éventuelle de
composantes de la variance.
Cet exemple permet aussi de formuler quelques remarques complémentaires
d’intérêt général. La première, que nous avons déjà évoquée dans le cadre de
l’exemple 2.2.1, à trait au choix de la base de comparaison relative aux différences
entre types de prairies.
Á cet égard, on peut voir facilement ce que les mêmes observations auraient
donné comme résultats si on avait négligé le facteur prairies, en considérant qu’on
dispose de 15 observations aléatoires et indépendantes pour chacun des deux types.
On aurait alors réalisé une analyse de la variance à un critère de classification, dont
la composante factorielle aurait été identique à la première composante de l’analyse
à deux critères, et dont la composante résiduelle aurait réuni les deux dernières
composantes de cette analyse.
On aurait obtenu de cette manière :
Fobs = 3,4273/0,4030 = 8,50 et P(F ≥ 8,50) = 0,0069 ,
avec 1 et 28 degrés de liberté, l’analyse mettant en évidence, indûment, une diffé-
rence hautement significative de rendement entre les deux types de prairies. Cette
approche aurait aussi donné une précision tout à fait illusoire à d’éventuelles limites
de confiance de la différence de moyennes.
Cet exemple souligne donc bien la nécessité de toujours prendre en considéra-
tion toutes les sources de variation qui interviennent dans le problème étudié, et
de choisir dans chaque cas les bases de comparaison qui s’imposent.
342 ANALYSE DE LA VARIANCE À DEUX CRITÈRES 10.6.1

Une deuxième remarque concerne le choix des effectifs, aux différents niveaux
de l’échantillonnage.
Nous avons souligné antérieurement l’intérêt qu’il y aurait eu à augmenter
le nombre de prairies, en le portant de 3 à 5 ou à 7 par exemple, et à réduire
éventuellement le nombre de parcelles par prairies, en le ramenant de 5 à 3 ou
à 2 par exemple, dans l’optique de l’estimation des composantes de la variance
(exemple 9.4.4). Ce principe reste entièrement d’application en ce qui concerne la
comparaison des rendements moyens des deux types de prairies.
Sans aucun calcul de puissance et sans réaliser ici aucune détermination précise
des effectifs, on peut en effet constater tout simplement qu’avec 5 ou 7 prairies
pour chacun des deux types, le nombre de degrés de liberté relatif aux différences
entre prairies aurait été égal à 8 ou à 12 , au lieu de 4 . En conséquence, pour une
même valeur numérique de cette variable, la probabilité associée à la variable F
aurait été sensiblement plus réduite, les valeurs critiques correspondantes F0,95
étant d’ailleurs égales à 4,75 ou 5,32 , au lieu de 7,71 (table IV), soit une réduction
de l’ordre de 30 ou 40 %. Nous reviendrons sur ce point au cours de l’exemple
10.6.2.

10.6 La puissance et la détermination


des nombres d’observations

10.6.1 Principes généraux

1◦ Les principes que nous avons présentés antérieurement à propos de l’ana-


lyse de la variance à un critère de classification (§ 9.4) restent d’application,
d’une manière générale, pour l’analyse à deux critères. Nous nous contenterons
donc de les rappeler brièvement, en considérant successivement les modèles croisés
(§ 10.6.2) et les modèles hiérarchisés (§ 10.6.3), et en nous limitant aux problèmes
de détermination des nombres d’observations dans le cas des échantillons de même
effectif.

d 2◦ En ce qui concerne la puissance des tests, on peut se référer éventuellement


aux publications citées au paragraphe 9.4.2.3◦ .
Le cas échéant, il faudra être particulièrement attentif à la détermination des
paramètres de décentrage. Pour le premier facteur d’un modèle fixe d’analyse de la
variance à deux critères de classification, par exemple, le paramètre qui remplace
la valeur ∏ définie au paragraphe 9.4.2.4◦ est :
p
qn X 2
∏= a .
b σ 2 i=1 i
10.6.2 PUISSANCE ET NOMBRES D’OBSERVATIONS 343

10.6.2 Le cas des modèles croisés


1◦ Pour le modèle croisé fixe, les nombres de modalités p et q des deux critères
de classification sont déterminés a priori, et seul l’effectif n doit être fixé.
Les formules et l’abaque relatifs au test t d’égalité de deux moyennes (§ 8.4.4.1◦ )
restent applicables en première approximation, toujours en considérant que le coef-
ficient de variation cv est le coefficient de variation correspondant au carré moyen
résiduel, et que la différence δr est l’amplitude des moyennes, exprimée en valeur
relative (§ 9.4.3.1◦ ). Il faut noter toutefois que les effectifs qui sont donnés par ces
formules et cet abaque ne sont plus ici les effectifs n des différents échantillons,
mais bien les effectifs totaux relatifs aux différentes modalités des deux critères de
classification, c’est-à-dire le produit q n en ce qui concerne le premier critère et le
produit p n en ce qui concerne le deuxième critère.
d De même, l’abaque présenté à la figure 9.4.1 peut toujours être utilisé, en vue
d’obtenir des informations plus précises, pour autant que le nombre de degrés de
b liberté du carré moyen résiduel soit au moins de l’ordre de 15 à 20.

2◦ Dans le cas du modèle croisé mixte, le problème de la détermination des


nombres d’observations est double, puisqu’il faut fixer, non seulement l’effectif n ,
mais aussi le nombre de modalités q du facteur aléatoire. Le principe de base est, ici
également, d’augmenter au maximum cette dernière valeur, en diminuant autant
que possible l’effectif n (§ 9.4.4.2◦ ). On notera que le cas extrême n = 1 conduirait
à ne disposer que d’une observation par population, avec toutes les limitations
qu’une telle situation impliquerait (§ 10.3.6.3◦ ).
En outre, en ce qui concerne la détermination du nombre d’observations relatif
au facteur fixe, il ne faut pas perdre de vue que la base de comparaison n’est plus
la composante résiduelle, mais bien la composante d’interaction.
d Des tables particulières, relatives au cas des blocs aléatoires complets, avec une
b observation par cellule, sont fournies notamment pas Kastenbaum et al. [1970b].

3◦ Enfin, dans le cas du modèle croisé aléatoire, le principe est toujours d’aug-
menter au maximum les nombres p et q de variantes, en diminuant autant que
possible l’effectif n .

Exemple 10.6.1. Comparaison de trois types de sondes dans deux types de sols :
détermination des nombres d’observations.
Reprenons encore en considération les données de l’exemple 10.2.1, dans l’op-
tique cette fois de la détermination des nombres d’observations, et envisageons
plus particulièrement le problème de la comparaison des trois types de sondes.
Le coefficient de variation correspondant au carré moyen résiduel est pratique-
ment égal à 6 % (tableaux 10.2.2 et 10.2.3) :
p ±
cv = 6,25 42,00 = 6,0 % .
344 ANALYSE DE LA VARIANCE À DEUX CRITÈRES 10.6.3

Si on souhaite mettre en évidence des différences de moyennes de l’ordre de 5 %,


entre les trois types de sondes, les formules et l’abaque du paragraphe 8.4.4.1◦ in-
diquent qu’il faut disposer de 12 observations pour des risques d’erreur de première
et de deuxième espèce α et β égaux respectivement à 0,05 et 0,5 , et de 30 observa-
tions pour des risques d’erreur égaux à 0,05 et 0,1 . Tenant compte de l’existence
du facteur types de sols, qui comporte deux modalités, ces résultats doivent être
interprétés de la manière suivante :

q = 2 et n = 6 ou 15 ,

soit respectivement 6 ou 15 observations pour chacune des six combinaisons des


trois types de sondes et deux types de sols.
Inversement, on peut aussi déterminer, à l’aide des mêmes relations, les diffé-
rences qui peuvent être mises en évidence à partir des observations dont on dispose,
c’est-à-dire pour des effectifs n égaux à 4 . On obtient ainsi 6 %, soit environ 2,5 mg
de P2 O5 par 100 gr de terre sèche, pour des risques d’erreur égaux à 0,05 et 0,5 ,
et 9,7 ou 10 %, soit environ 4 mg de P2 O5 par 100 gr de terre sèche, pour des
risques d’erreur égaux à 0,05 et 0,1 .
On pourra remarquer que ces différents résultats sont très proches de ceux que
donnerait l’abaque de la figure 9.4.1.

10.6.3 Le cas des modèles hiérarchisés

1◦ En ce qui concerne le modèle hiérarchisé mixte, on a toujours intérêt à


diminuer le plus possible l’effectif n . On peut même envisager de réduire cet effectif
à 1 , ce qui a comme conséquence de revenir à une analyse de la variance à un cri-
tère de classification, en perdant alors toute information relative au dernier niveau
de variation, mais en disposant d’un maximum de puissance pour comparer les
différentes modalités du facteur fixe.
Le nombre p de ces modalités étant connu et l’effectif n ayant été fixé à sa
valeur minimum possible, il reste à déterminer le nombre q de modalités du facteur
aléatoire. Cette détermination peut être réalisée comme pour le modèle croisé
mixte (§ 10.6.2.2◦ ), mais en faisant intervenir ici la composante relative au facteur
aléatoire comme base de comparaison.

2◦ Enfin, en ce qui concerne le modèle hiérarchisé aléatoire, le principe de base


est de réduire à la fois les valeurs de q et de n aux minimums possibles, mais sans
jamais descendre à 1 si on souhaite pouvoir identifier toutes les composantes de la
variance.
EXERCICES 345

Exemple 10.6.2. Comparaison et étude de l’homogénéité des rendements four-


ragers de deux types de prairies : détermination des nombres d’observations.
Pour le problème envisagé dans le cadre des exemples 10.5.1 et 10.5.2, les
composantes de la variance peuvent être estimées comme suit (tableau 10.5.3) :
2
σ
bB b2 = 0,2392 ,
= (1,3852 − 0,2392)/5 = 0,2292 et σ

et la base de comparaison relative au critère types de prairies est :

CMb|a = 1,3852 ou 1,39 .

On peut tout d’abord constater que cette base de comparaison serait réduite
de moitié si le nombre de parcelles observées par prairie était ramené à 3 , au lieu
de 5 , et des deux tiers si ce nombre de parcelles était ramené à 2 , puisque :

0,2392 + 2 (0,2292) = 0,6976 ou 0,70 et 0,2392 + 0,2292 = 0,4684 ou 0,47.

Pour un même nombre total d’observations, et tenant compte en outre de l’accrois-


sement du nombre de degrés de liberté qui en résulterait pour le facteur prairies
(exemple 10.5.2), la puissance du test serait alors considérablement augmentée.
En supposant qu’on puisse adopter la valeur la plus réduite (n = 2), et qu’on
souhaite, par exemple, mettre en évidence une différence de rendement de l’ordre
de 10 % entre les deux types de prairies, pour des risques d’erreur de première et
de deuxième espèce α et β égaux respectivement à 0,05 et 0,1 , on peut déterminer
la valeur de q de la manière suivante :
p ±
x̄... = 2,491 , cv = 0,4684 2,491 = 27,5 % ,

q n = 21 (0,2752 )/0,102 = 159 et q = 80 .

Cet effectif de 80 prairies pour chacun des deux types de prairies, avec deux mesures
de rendement par prairie, peut paraı̂tre exorbitant. C’est cependant le ✭✭ prix à
payer ✮✮ pour atteindre l’objectif fixé, tenant compte de la très grande variabilité
observée. Une réduction à un quart de cet effectif, soit q = 20 , conduirait à un
doublement de la différence de rendement qu’on peut espérer mettre en évidence,
soit 20 % au lieu de 10 %.

Exercices
10.1. Les résultats suivants, exprimés en µA , ont été obtenus en analysant une substance
herbicide par polarographie, à deux températures différentes, au cours de quatre journées,
considérées comme aléatoires, et chaque fois avec deux répétitions. Procédez à l’analyse
de ces résultats, de manière à mettre en évidence l’existence éventuelle d’une différence
346 ANALYSE DE LA VARIANCE À DEUX CRITÈRES

significative due au facteur température et, le cas échéant, estimez cette différence et
déterminez ses limites de confiance.

Températures Jour 1 Jour 2 Jour 3 Jour 4


25◦ 3,58 et 3,48 3,50 et 3,44 3,48 et 3,52 3,54 et 3,60
40◦ 3,55 et 3,58 3,55 et 3,63 3,59 et 3,57 3,63 et 3,60

10.2. Une expérience en blocs aléatoires complets a été réalisée dans le but de vérifier
s’il y a, parmi dix variétés d’orge, des différences significatives de rendements et, le cas
échéant, d’identifier les variétés les plus productives. Procédez à l’analyse des résultats
donnés ci-dessous, qui sont des rendements exprimés en tonnes par hectare.

Variétés
Blocs
1 2 3 4 5 6 7 8 9 10
1 5,57 6,09 6,21 7,06 6,52 6,24 6,09 6,76 6,65 7,95
2 5,79 6,57 6,73 7,36 6,31 7,69 6,83 7,27 7,48 6,77
3 6,14 7,51 6,86 7,02 5,90 7,41 6,54 6,81 8,35 7,59
4 5,83 7,27 6,84 7,25 6,14 7,55 7,35 6,35 8,33 7,49

10.3. Vingt-quatre porcelets, appartenant à six nichées différentes, ont été soumis à
quatre traitements différents, un porcelet de chacune des nichées étant soumis à chacun
des traitements. En fonction des accroissements en poids suivants, observés au cours
d’une même période et exprimés en kg, une donnée étant manquante, peut-on admettre
qu’il n’y a pas de différences significatives de croissance d’un traitement à l’autre ?

Nichées
Traitements
1 2 3 4 5 6
1 59,0 69,4 75,0 71,2 60,3 68,6
2 64,9 71,4 72,2 78,0 68,2 77,0
3 69,2 72,0 74,1 81,7 58,3 –
4 67,0 77,4 74,7 81,3 64,6 78,5

10.4. Les résultats suivants sont relatifs à la vitesse moyenne de croissance, en mm par
jour, des pédoncules floraux observés sur huit plantes de cyclamen, réparties au hasard
entre deux milieux de culture. Peut-on conclure sur cette base à l’existence d’une diffé-
rence significative de vitesse de croissance entre les deux milieux ?

Milieu 1 Milieu 2
Pl. 1 Pl. 2 Pl. 3 Pl. 4 Pl. 1 Pl. 2 Pl. 3 Pl. 4
0,76 0,97 0,58 0,86 0,81 1,07 0,62 0,93
0,66 0,74 0,57 0,93 0,77 0,82 0,99 1,07
0,61 0,51 1,02 0,95
0,65 0,62 0,79
0,66

10.5. Procédez à l’analyse des données de l’exemple 4.3.1 (tableau 4.3.1).


Chapitre 11

L’analyse de la variance à
trois et plus de trois critères
de classification

Sommaire
11.1 Introduction
11.2 L’analyse de la variance à trois critères de classification :
modèles croisés à effectifs égaux
11.3 L’analyse de la variance à trois critères de classification :
modèles hiérarchisés à effectifs égaux
11.4 L’analyse de la variance à plus de trois critères de classification
348 ANALYSE DE LA VARIANCE À TROIS ET PLUS DE TROIS CRITÈRES 11.1

11.1 Introduction

1◦ L’analyse de la variance à trois critères de classification 1 et, d’une manière


plus générale, l’analyse de la variance à un nombre quelconque de critères de clas-
sification 2 présentent la même diversité de modèles que l’analyse à deux critères
(§ 10.1.1◦ ) : modèles croisés et hiérarchisés, modèles fixes, aléatoires et mixtes, et
modèles à effectifs égaux et inégaux. Cette diversité s’accentue même, en raison
de l’existence dans chaque cas de plusieurs modèles mixtes et de différents types
de modèles hiérarchisés.
Nous envisagerons successivement l’analyse à trois critères de classification, en
ce qui concerne les modèles croisés (§ 11.2) et les modèles hiérarchisés (§ 11.3),
puis l’analyse à un nombre quelconque de critères de classification (§ 11.4). Nous
procéderons toujours par analogie avec ce qui a été vu antérieurement, mais
de manière sensiblement plus rapide, et nous nous en tiendrons ici au cas des
échantillons de même effectif, en considérant ultérieurement le cas des effectifs
inégaux, sous l’angle du modèle linéaire (§ 16.4.5).
Les exemples 11.2.1, 11.2.4 et 11.3.2 sont des illustrations des problèmes con-
sidérés au cours de ce chapitre.

2◦ Les mêmes principes que précédemment restent en vigueur en ce qui con-


cerne les conditions d’application de l’analyse de la variance : populations normales
et de mêmes variances, et échantillons aléatoires, simples et indépendants (§ 9.1.3◦
et 10.1.3◦ ).

d 3◦ Les références bibliographiques générales du paragraphe 9.1.4◦ peuvent


toujours être consultées ici également, en plus de celles qui sont citées dans le
texte. Elles peuvent être complétées par les références relatives au modèle linéaire
(§ 16.1.5◦ ).
Il faut noter en outre que nous nous limitons à la présentation de l’analyse
de la variance classique, à l’exclusion d’autres possibilités, telles que les modèles
à effets principaux additifs et interactions multiplicatives (modèles AMMI) et les
méthodes non paramétriques et robustes. Certaines des références données aux
paragraphes 10.3.1.2◦ et 10.3.8.5◦ peuvent éventuellement fournir des indications
relatives à ces diverses possibilités, dans le cas de trois ou plus de trois critères
de classification. On peut y ajouter le travail de van Eeuwijk et Kroonenberg
b [1998].

1 En anglais : three-way analysis of variance.


2 En anglais : multi-way analysis of variance.
11.2.2 MODÈLES CROISÉS À TROIS CRITÈRES 349

11.2 L’analyse de la variance à trois critères


de classification : modèles croisés
à effectifs égaux
11.2.1 Principes généraux
Comme en analyse de la variance à un et à deux critères de classification,
nous présenterons successivement les aspects descriptifs (§ 11.2.2) et les aspects
inférentiels (§ 11.2.3) de l’analyse à trois critères, en nous limitant, dans un premier
temps, aux échantillons de plusieurs observations. Nous envisagerons ensuite le cas
particulier des échantillons d’une seule observation (§ 11.2.4).

11.2.2 Les aspects descriptifs : échantillons de plusieurs


observations
1◦ Pour trois critères de classification et dans le cas des effectifs égaux,
on peut considérer qu’on a p q r échantillons ou séries d’observations d’effectif n ,
et désigner les observations individuelles par xijkl (i = 1 , . . . , p , j = 1 , . . . , q ,
k = 1 , . . . , r , et l = 1 , . . . , n).
À partir de ces observations, on peut calculer les différentes moyennes sui-
vantes :
x̄ijk. , x̄ij.. , x̄i.k. , x̄.jk. , x̄i... , x̄.j.. , x̄..k. et x̄.... .

Ces moyennes sont relatives, respectivement, aux différentes combinaisons des mo-
dalités des trois facteurs considérés simultanément (p q r moyennes x̄ijk. ), aux dif-
férentes combinaisons des modalités des trois facteurs considérés deux à deux
(p q moyennes x̄ij.. , p r moyennes x̄i.k. , et q r moyennes x̄.jk. ), aux différentes mo-
dalités des trois facteurs considérés individuellement (p moyennes x̄i... , q moyen-
nes x̄.j.. , et r moyennes x̄..k. ), et à l’ensemble des p q r n observations (moyenne
générale x̄.... ).

2◦ Dans ces conditions, le modèle observé s’écrit :

xijkl − x̄.... =
(x̄i... − x̄.... ) + (x̄.j.. − x̄.... ) + (x̄..k. − x̄.... ) + (x̄ij.. − x̄i... − x̄.j.. + x̄.... )
+ (x̄i.k. − x̄i... − x̄..k. + x̄.... ) + (x̄.jk. − x̄.j.. − x̄..k. + x̄.... )
+ (x̄ijk. − x̄ij.. − x̄i.k. − x̄.jk. + x̄i... + x̄.j.. + x̄..k. − x̄.... ) + (xijkl − x̄ijk. ) .

Le deuxième membre de ce modèle contient successivement trois termes de varia-


tion factorielle liés individuellement aux trois critères de classification, trois termes
d’interaction des différents facteurs considérés deux à deux, un terme d’interaction
des trois facteurs considérés simultanément, et un terme de variation résiduelle.
350 ANALYSE DE LA VARIANCE À TROIS ET PLUS DE TROIS CRITÈRES 11.2.2

Les interactions des différents facteurs considérés deux à deux se présentent


et doivent être interprétées comme en analyse de la variance à deux critères de
classification (§ 10.2.4). Ces interactions simples sont appelées interactions de deux
facteurs ou interactions du premier ordre 3 .
Le terme d’interaction des trois facteurs ou interaction du deuxième ordre 4
apparaı̂t ici pour la première fois. Ce terme est nul, pour toutes les valeurs de i ,
de j et de k , quand les interactions de deux des facteurs, quels qu’ils soient, ne
dépendent pas du troisième facteur. Nous reviendrons sur ce point au paragraphe
11.2.3.3◦ .

3◦ L’équation d’analyse de la variance relative à ce modèle observé est :

SCEt = SCEa + SCEb + SCEc + SCEab + SCEac + SCEbc + SCEabc + SCEr ,

les lettres a , b et c étant associées, respectivement, à chacun des trois facteurs.


Aux différentes sommes des carrés des écarts, correspondent des nombres de
degrés de liberté liés par la relation :

p q r n − 1 = (p − 1) + (q − 1) + (r − 1) + (p − 1) (q − 1) + (p − 1) (r − 1)
+ (q − 1) (r − 1) + (p − 1) (q − 1) (r − 1) + p q r (n − 1) .

Ces différentes relations se justifient comme en analyse de la variance à deux


critères de classification (§ 10.2.2.3◦ et 10.2.2.4◦ ).

4◦ Comme précédemment toujours, la division des sommes des carrés des écarts
par les nombres de degrés de liberté permet de définir les carrés moyens, et l’en-
semble des résultats peut être présenté sous la forme d’un tableau d’analyse de la
variance. Le tableau 11.2.2, relatif à l’exemple 11.2.1, en est une illustration, pour
des valeurs de p , q , r et n égales respectivement à 2 , 2 , 3 et 5 .

d 5◦ En généralisant ce qui a été dit au paragraphe 10.5.2.7◦ , le modèle croisé


d’analyse de la variance à trois critères de classification peut être présenté de la
manière suivante, en vue de la réalisation des calculs à l’aide, par exemple, du
logiciel Minitab :
X = A B C A*B A*C B*C A*B*C ,

l’expression A*B*C désignant l’interaction des trois facteurs.


Ici comme ailleurs, les simples lettres A , B , C , etc. peuvent être remplacées
par d’autres symboles, pour assurer dans chaque cas une certaine adaptation au
problème considéré. Ainsi, en ce qui concerne l’exemple 11.2.1, qui fait intervenir
des facteurs clous, anneaux et vitesses, on pourrait écrire :
X = CL ANN VIT CL*ANN CL*VIT ANN*VIT CL*ANN*VIT .
3 En anglais : two-factor interaction, first-order interaction.
4 En anglais : three-factor interaction, second-order interaction.
11.2.2 MODÈLES CROISÉS À TROIS CRITÈRES 351

D’autre part, nous ne donnons plus aucune information générale quant à la


réalisation ✭✭ manuelle ✮✮ des calculs, les données étant pratiquement toujours trai-
tées par ordinateur.
Seule la méthode de Yates 5 , relative au cas des facteurs qui ne possèdent
chacun que deux modalités, est encore utilisée assez couramment ✭✭ à la main ✮✮.
Son emploi est particulièrement simple à l’aide de tableurs et cette méthode est
b illustrée par l’exemple 11.2.2.

d 6◦ On notera aussi que tout ce qui a été dit au paragraphe 10.4.2 en matière
d’estimation des données manquantes peut être appliqué aux modèles croisés
b d’analyse de la variance à trois critères de classification.

Exemple 11.2.1. Étude de la résistance de panneaux de particules à l’arrachage


des clous : analyse de la variance.
Une des qualités essentielles qui sont exigées des panneaux agglomérés, consti-
tués de particules ou de fibres de bois, est la résistance de ces panneaux à l’arra-
chage des clous. Au cours d’un essai préliminaire, destiné à préciser les conditions
de mesure de cette propriété, on a étudié simultanément l’influence de trois fac-
teurs : la grosseur des clous, le diamètre des anneaux sur lesquels sont déposées
les éprouvettes soumises aux essais, et la vitesse d’arrachage [Carré, 1963].
Les essais ont été effectués sur des éprouvettes carrées de 50 mm de côté, les
modalités des trois facteurs étant : 6,5 et 8 mm de diamètre en ce qui concerne
les têtes des clous (i = 1 et 2), 22 et 30 mm de diamètre en ce qui concerne les
diamètres des anneaux servant de supports (j = 1 et 2), 22 , 45 et 90 mm par
minute en ce qui concerne les vitesses d’arrachage (k = 1 , 2 et 3). En outre, cinq
éprouvettes ont été utilisées pour chacune des 12 combinaisons des modalités des
trois facteurs (l = 1 , . . . , 5). Le tableau 11.2.1 réunit l’ensemble des observations
réalisées, exprimées en kilogrammes.
La présentation de ce tableau, qui contient non seulement les valeurs observées,
mais aussi les valeurs de tous les indices, correspond aux exigences de la plupart
des logiciels statistiques. La présentation la plus classique est en effet, dans le cas
envisagé ici, un tableau de 60 lignes et cinq colonnes, ou éventuellement quatre
colonnes, la colonne l n’étant pas indispensable.
Le tableau 11.2.2 donne les résultats de l’analyse de la variance, y compris les
résultats des tests F , dont il sera question ultérieurement (exemple 11.2.3).

d Exemple 11.2.2. Étude de la résistance de panneaux de particules à l’arrachage


des clous : réalisation de l’analyse de la variance par la méthode de Yates.
En vue d’illustrer la méthode de calcul de Yates, on peut reprendre les mêmes
données, en éliminant par exemple les observations relatives à la troisième vitesse
5 En anglais : Yates’s method.
352 ANALYSE DE LA VARIANCE À TROIS ET PLUS DE TROIS CRITÈRES 11.2.2

Tableau 11.2.1. Résistance de panneaux de particules à l’arrachage des clous


(xijkl ), en kg, pour deux grosseurs de clous (i), deux diamètres d’anneaux (j),
trois vitesses d’arrachage (k), et dans chaque cas cinq éprouvettes (l).

i j k l xijkl i j k l xijkl i j k l xijkl i j k l xijkl


1 1 1 1 54 1 2 1 1 54 2 1 1 1 67 2 2 1 1 67
1 1 1 2 56 1 2 1 2 51 2 1 1 2 71 2 2 1 2 66
1 1 1 3 58 1 2 1 3 47 2 1 1 3 72 2 2 1 3 62
1 1 1 4 51 1 2 1 4 51 2 1 1 4 70 2 2 1 4 71
1 1 1 5 57 1 2 1 5 59 2 1 1 5 81 2 2 1 5 69
1 1 2 1 57 1 2 2 1 52 2 1 2 1 79 2 2 2 1 72
1 1 2 2 58 1 2 2 2 56 2 1 2 2 80 2 2 2 2 67
1 1 2 3 61 1 2 2 3 52 2 1 2 3 81 2 2 2 3 75
1 1 2 4 59 1 2 2 4 52 2 1 2 4 80 2 2 2 4 70
1 1 2 5 55 1 2 2 5 53 2 1 2 5 85 2 2 2 5 71
1 1 3 1 60 1 2 3 1 63 2 1 3 1 78 2 2 3 1 78
1 1 3 2 68 1 2 3 2 54 2 1 3 2 78 2 2 3 2 81
1 1 3 3 61 1 2 3 3 65 2 1 3 3 77 2 2 3 3 67
1 1 3 4 61 1 2 3 4 62 2 1 3 4 83 2 2 3 4 76
1 1 3 5 67 1 2 3 5 60 2 1 3 5 79 2 2 3 5 75

Tableau 11.2.2. Étude de la résistance de panneaux de particules à l’arrachage


des clous : tableau d’analyse de la variance.

Sources Degrés S. des carrés Carrés


F P
de variation de liberté des écarts moyens
Grosseurs des clous 1 4.403,3 4.403,3 344 *** 0,0000
Diamètres des anneaux 1 355,3 355,3 27,8 *** 0,0000
Vitesses d’arrachage 2 632,1 316,0 24,7 *** 0,0000
Clous-anneaux 1 29,4 29,4 2,30 0,14
Clous-vitesses 2 86,2 43,1 3,37 * 0,043
Anneaux-vitesses 2 54,0 27,0 2,11 0,13
Clous-anneaux-vitesses 2 10,3 5,1 0,40 0,67
Variation résiduelle 48 614,0 12,79
Totaux 59 6.184,6

d’arrachage (k = 3). On se trouve bien, alors, en présence de trois facteurs possé-


dant chacun deux modalités. Une telle situation est dite 2 × 2 × 2 , ou encore 23 .
Le tableau 11.2.3 contient les observations en question, les valeurs 1 et 2 des
trois indices étant remplacées, respectivement, par − 1 et 1 , et la colonne l , qui
n’a aucune utilité ici, ayant été supprimée.
11.2.2 MODÈLES CROISÉS À TROIS CRITÈRES 353

Tableau 11.2.3. Résistance de panneaux de particules à l’arrachage des clous


(xijkl ), en kg, pour deux grosseurs de clous (i), deux diamètres d’anneaux (j),
deux vitesses d’arrachage (k), et dans chaque cas cinq éprouvettes.

i j k xijkl i j k xijkl i j k xijkl i j k xijkl


– 1 – 1 – 1 54 – 1 1 – 1 54 1 – 1 – 1 67 1 1 – 1 67
– 1 – 1 – 1 56 – 1 1 – 1 51 1 – 1 – 1 71 1 1 – 1 66
– 1 – 1 – 1 58 – 1 1 – 1 47 1 – 1 – 1 72 1 1 – 1 62
– 1 – 1 – 1 51 – 1 1 – 1 51 1 – 1 – 1 70 1 1 – 1 71
– 1 – 1 – 1 57 – 1 1 – 1 59 1 – 1 – 1 81 1 1 – 1 69
– 1 – 1 1 57 – 1 1 1 52 1 – 1 1 79 1 1 1 72
– 1 – 1 1 58 – 1 1 1 56 1 – 1 1 80 1 1 1 67
– 1 – 1 1 61 – 1 1 1 52 1 – 1 1 81 1 1 1 75
– 1 – 1 1 59 – 1 1 1 52 1 – 1 1 80 1 1 1 70
– 1 – 1 1 55 – 1 1 1 53 1 – 1 1 85 1 1 1 71

Ce tableau permet de calculer facilement les sommes de produits suivantes :


X X X
(i xijkl ) = 363 , (j xijkl ) = − 115 , (k xijkl ) = 81 ,
i, j, k, l i, j, k, l i, j, k, l
X X X
(i j xijkl ) = − 37, (i k xijkl ) = 47, (j k xijkl ) = − 35 ,
i, j, k, l i, j, k, l i, j, k, l
X
et (i j k xijkl ) = − 13 ,
i, j, k, l

les différentes sommes étant toutes étendues à l’ensemble des 40 observations. Du


fait de la conversion des valeurs des indices i , j et k , en − 1 et 1 , ces sommes de
produits permettent elles-mêmes de calculer aisément les sommes des carrés des
écarts factorielles et d’interactions :

SCEa = (363)2 /40 = 3.294,2 , SCEb = (− 115)2 /40 = 330,6 ,

SCEc = (81)2 /40 = 164,0 , SCEab = (− 37)2 /40 = 34,2 ,

SCEac = (47)2 /40 = 55,2 , SCEbc = (− 35)2 /40 = 30,6 ,

et SCEabc = (− 13)2 /40 = 4,2 .

Ces différentes valeurs figurent dans le tableau 11.2.4.


En outre, la somme des carrés des écarts totale peut être calculée tout à fait
normalement pour l’ensemble des observations, et la somme des carrés des écarts
résiduelle peut être calculée par différence. Les résultats ainsi obtenus figurent
également dans le tableau 11.2.4. Le tout est très comparable au contenu du tableau
11.2.2.
354 ANALYSE DE LA VARIANCE À TROIS ET PLUS DE TROIS CRITÈRES 11.2.3

Tableau 11.2.4. Étude de la résistance de panneaux de particules à l’arrachage


des clous : tableau d’analyse de la variance dans le cas 23 .

Sources Degrés S. des carrés Carrés


F P
de variation de liberté des écarts moyens
Grosseurs des clous 1 3.294,2 3.294,2 297 *** 0,0000
Diamètres des anneaux 1 330,6 330,6 29,8 *** 0,0000
Vitesses d’arrachage 1 164,0 164,0 14,8 *** 0,0005
Clous-anneaux 1 34,2 34,2 3,09 0,088
Clous-vitesses 1 55,2 55,2 4,98 * 0,033
Anneaux-vitesses 1 30,6 30,6 2,76 0,11
Clous-anneaux-vitesses 1 4,2 4,2 0,38 0,54
Variation résiduelle 32 355,0 11,09
Totaux 39 4.268,0

Les trois premières sommes de produits déterminées ci-dessus permettent de


calculer aussi très facilement les différences de moyennes liées aux trois facteurs
principaux :

x̄2... − x̄1... = 363/20 = 18,2 kg , x̄.2.. − x̄.1.. = − 115/20 = − 5,8 kg

et x̄..2. − x̄..1. = 81/20 = 4,0 kg .

Enfin, les différentes sommes des produits permettent d’estimer les effets princi-
paux et les termes d’interaction, qui seront définis au paragraphe 11.2.3 :

a2 = 363/40 = 9,1 kg , bb2 = − 115/40 = − 2,9 kg , b


b c2 = 81/40 = 2,0 kg ,
b 22 = − 37/40 = − 0,9 kg , (ac)
(ab) b 22 = 47/40 = 1,2 kg ,
b 22 = − 35/40 = − 0,9 kg et (abc)
(bc) c 222 = − 13/40 = − 0,3 kg .
b

11.2.3 Les aspects inférentiels : échantillons de plusieurs


observations
1◦ Dans le cas de l’analyse de la variance à trois critères de classification, quatre
modèles croisés différents doivent être considérés : un modèle fixe, deux modèles
mixtes et un modèle aléatoire. Ces modèles correspondent respectivement à trois,
deux, un et zéro facteurs fixes d’une part, et simultanément zéro, un, deux et trois
facteurs aléatoires d’autre part.

2◦ Par analogie avec le modèle fixe à deux critères de classification (§ 10.3.2.2◦ )


et avec le modèle observé à trois critères (§ 11.2.2.2◦ ), le modèle théorique fixe à
11.2.3 MODÈLES CROISÉS À TROIS CRITÈRES 355

trois critères s’écrit :

Xijkl − m... = ai + bj + ck + (ab)ij + (ac)ik + (bc)jk + (abc)ijk + Dijkl .

Les termes ai , bj et ck sont les effets principaux des trois facteurs. Les expressions
(ab)ij , (ac)ik et (bc)jk désignent les valeurs théoriques des interactions de deux
facteurs. Et les quantités (abc)ijk sont les différents termes de l’interaction des
trois facteurs.

3◦ En ce qui concerne ce dernier point, nous avons dit antérieurement que


l’interaction des trois facteurs est nulle quand les interactions de deux facteurs
ne dépendent pas du troisième facteur (§ 11.2.2.2◦ ). Nous pouvons préciser ici
que la nullité de l’interaction, ou l’absence d’interaction des trois facteurs, corres-
pond au fait que les termes (ab)ij d’interaction des deux premiers facteurs, qui
pourraient être calculés séparément pour les différentes modalités k du troisième
facteur, ne diffèrent pas d’une modalité à l’autre de ce facteur ; ou ce qui est stric-
tement équivalent, que les quantités (ac)ik qui seraient calculées séparément pour
les différentes modalités j du deuxième facteur ne varient pas d’une modalité à
l’autre de ce facteur ; ou encore, ce qui est toujours strictement équivalent, que
les termes (bc)jk calculés séparément pour les différentes modalités i du premier
facteur ne diffèrent pas non plus d’une modalité à l’autre de ce facteur.

4◦ De même, les deux modèles théoriques mixtes sont, d’une part, pour deux
facteurs fixes (a et b) et un facteur aléatoire (C) :

Xijkl − m... = ai + bj + Ck + (ab)ij + (aC)ik + (bC)jk + (abC)ijk + Dijkl ,

et d’autre part, pour un facteur fixe (a) et deux facteurs aléatoires (B et C) :

Xijkl − m... = ai + Bj + Ck + (aB)ij + (aC)ik + (BC)jk + (aBC)ijk + Dijkl .

Enfin, le modèle théorique aléatoire est :

Xijkl − m... = Ai + Bj + Ck + (AB)ij + (AC)ik + (BC)jk + (ABC)ijk + Dijkl .

En ce qui concerne ces divers modèles, on doit être spécialement attentif à


la distinction qui est faite entre les lettres minuscules et les lettres majuscules,
notamment dans les différentes interactions. On remarquera aussi que ces trois
modèles comportent respectivement trois, un et zéro termes non aléatoires, alors
que le modèle fixe en comporte sept.
Dans chaque cas, on suppose que les différentes composantes aléatoires sont
normales, indépendantes les unes des autres, de moyennes nulles et de variance
chaque fois constante.

5◦ Les hypothèses nulles auxquelles on s’intéresse sont, pour chaque modèle,


au nombre de sept. Pour les composantes non aléatoires, elles concernent la nullité
356 ANALYSE DE LA VARIANCE À TROIS ET PLUS DE TROIS CRITÈRES 11.2.3

des effets principaux ou des termes d’interaction (§ 10.3.2.3◦ et 10.3.4.4◦ ), tandis


que pour les composantes aléatoires, elles s’expriment en termes de nullité des
variances (§ 10.3.3.4◦ et 10.3.4.4◦ ).

6◦ Comme en analyse de la variance à deux critères de classification, le choix des


comparaisons à réaliser dépend des espérances mathématiques des carrés moyens.
Celles-ci sont présentées dans le tableau 11.2.5, selon les mêmes principes que pré-
cédemment (§ 10.3.5.1◦ ). En particulier, le signe + indique, comme précédemment,
que les espérances mathématiques sont, selon les cas, des fonctions croissantes des
carrés des termes ai , bj , etc.
d On notera que nous nous en tenons ici également à la présentation de la
forme restreinte de l’analyse de la variance, qui nous paraı̂t la plus pertinente

b (§ 10.3.4.8 ).
7◦ Quand on dispose d’échantillons de plusieurs observations, tous les tests
peuvent être facilement réalisés dans le cas du modèle fixe, et cela toujours par
rapport au carré moyen résiduel. Il en est de même pour le premier modèle mixte
(facteurs a et b fixes), mais alors soit par rapport au carré moyen résiduel, soit par
rapport aux diverses interactions qui font intervenir le facteur aléatoire (C).
Des difficultés nouvelles apparaissent par contre en ce qui concerne le deuxième
modèle mixte, qui ne comporte qu’un facteur fixe (a), et le modèle aléatoire. Ainsi,
dans ces deux cas, le premier facteur, qu’il soit fixe (a) ou aléatoire (A), ne possède
aucune base de comparaison qui soit adéquate d’une manière générale. Ce facteur
peut toutefois être testé par rapport à son interaction avec le deuxième facteur
(aB ou AB), si son interaction avec le troisième facteur (aC ou AC) est nulle,
ou inversement, par rapport à son interaction avec le troisième facteur, si son
interaction avec le deuxième facteur est nulle. Il en est de même pour le deuxième
et le troisième facteur dans le cas du modèle aléatoire.

8◦ Des regroupements de sommes des carrés des écarts peuvent parfois être réa-
lisés, comme en analyse de la variance à deux critères de classification (§ 10.3.5.3◦ ).
De tels regroupements se justifient d’ailleurs plus ici, dans la mesure où les nombres
de degrés de liberté associés aux différentes interactions sont généralement d’autant
plus réduits que le nombre de critères de classification est plus élevé.
À cet égard, on peut recommander de procéder, dans toute la mesure du pos-
sible, à des regroupements suffisamment importants pour éviter d’effectuer des
tests F avec moins de 10 degrés de liberté au dénominateur.

d 9◦ On peut envisager aussi de réaliser certaines comparaisons en faisant inter-


venir d’autres fonctions linéaires des carrés moyens. Ainsi, le tableau 11.2.5 montre
par exemple que la quantité CMab + CMac − CMabc pourrait être une base de com-
paraison adéquate pour le carré moyen CMa relatif au premier facteur, dans le cas
du deuxième modèle mixte et du modèle aléatoire. Un problème se pose toutefois
en ce qui concerne la détermination des nombres de degrés de liberté à affecter à
de telles fonctions de deux ou plusieurs carrés moyens.
11.2.3

Tableau 11.2.5. Espérances mathématiques des carrés moyens, pour les différents modèles croisés d’analyse
de la variance à trois critères de classification.
Carrés Modèle fixe Modèle mixte (a et b fixes)
2 2 2 2 2 2 2 2 2
moyens σ2 (abc)ijk (bc)jk (ac)ik (ab)ij ck2 bj2 ai2 σ2 σabC σbC σaC (ab)ij σC bj2 ai2
CMa 1 + 1 qn +
CMb 1 + 1 pn +
CMc 1 + 1 pqn
CMab 1 + 1 n +
CMac 1 + 1 qn
CMbc 1 + 1 pn
CMabc 1 + 1 n
CMr 1 1
Carrés Modèle mixte (a fixe) Modèle aléatoire
2 2 2 2 2 2 2 2 2 2 2 2 2
moyens σ2 σaBC σBC σaC σaB σC σB ai2 σ2 σABC σBC σAC σAB σC σB σA
CMa 1 n qn rn + 1 n qn rn qrn
CMb 1 pn prn 1 n pn rn prn
CMc 1 pn pqn 1 n pn qn pqn
CMab 1 n rn 1 n rn
MODÈLES CROISÉS À TROIS CRITÈRES

CMac 1 n qn 1 n qn
CMbc 1 pn 1 n pn
CMabc 1 n 1 n
CMr 1 1
357
358 ANALYSE DE LA VARIANCE À TROIS ET PLUS DE TROIS CRITÈRES 11.2.3

La solution la plus couramment utilisée est connue sous le nom de méthode


ou test F approché de Satterthwaite 6 . Cette méthode implique le calcul de
nombres de degrés de liberté approximatifs, comme pour le test de Welch, relatif
à l’égalité de deux moyennes (§ 8.4.2.3◦ ). Dans le cas considéré ici, ce nombre de
degrés de liberté est :

(CMab + CMac − CMabc )2 /(CM2ab /kab + CM2ac /kac + CM2abc /kabc ) ,

si on désigne par kab , kac et kabc , respectivement, les nombres de degrés de liberté
b de CMab , CMac et CMabc .

d 10◦ D’une manière plus générale, pour une fonction linéaire quelconque
c1 CM1 + . . . + ch CMh , de h carrés moyens, dont les nombres de degrés de li-
berté individuels sont k1 , . . . , kh , le nombre de degrés de liberté approché est :
±
(c1 CM1 + . . . + ch CMh )2 (c21 CM21 /k1 + . . . + c2h CM2h /kh ) .

On retrouve en particulier le cas du test de Welch (§ 8.4.2.3◦ ), en tenant


compte des relations suivantes :

CM1 = SCE1 /(n1 − 1) , c1 = 1/n1 et k1 = n1 − 1 ,

CM2 = SCE2 /(n2 − 1) , c2 = 1/n2 et k2 = n2 − 1 .

Des informations complémentaires et d’autres solutions sont présentées par


Chiang [2001], Khuri [1995], Mosier et Graybill [1995], et Zhou et Mathew
b [1994].

11◦ Des estimations de moyennes, de différences de moyennes et de com-


posantes de la variance, ainsi que des calculs de limites de confiance, peuvent
être réalisés comme en analyse de la variance à deux critères de classification
(§ 10.3.2.7◦ , 10.3.3.8◦ et 10.3.4.7◦ ).
d En outre, les formules données ci-dessus permettent de déterminer de façon
approchée les limites de confiance de fonctions linéaires de carrés moyens, et donc
de fonctions linéaires ou de rapports de fonctions linéaires de composantes de la
variance, qui généralisent le rapport de composantes de la variance considéré en
analyse à un critère de classification (§ 9.3.3.8◦ ).
En matière de composantes de la variance, on peut éventuellement se référer

b aussi aux indications bibliographiques du paragraphe 16.4.5.3 .

Exemple 11.2.3. Étude de la résistance de panneaux de particules à l’arrachage


des clous : suite de l’analyse de la variance.
En ce qui concerne les conditions d’application, l’examen des données du ta-
bleau 11.2.1 et des résidus de l’analyse de la variance réalisée dans le cadre de
6 En anglais : Satterthwaite’s approximate F -test.
11.2.3 MODÈLES CROISÉS À TROIS CRITÈRES 359

l’exemple 11.2.1 (tableau 11.2.2) ne met en évidence aucune anomalie importante.


Le seul point quelque peu préoccupant est l’existence d’une certaine différence de
variance entre les résidus relatifs aux trois vitesses d’arrachage des clous, les va-
leurs absolues des résidus étant, en moyenne, sensiblement moins élevées pour la
vitesse intermédiaire que pour les deux vitesses extrêmes (moyennes des valeurs
absolues des résidus égales à 2,8 , 1,6 et 2,9 kg, respectivement pour 22 , 45 et
90 mm par minute).
Mais un autre élément auquel il y a lieu d’être tout spécialement attentif dans
une telle situation est l’ordre de réalisation des différents essais. Les hypothèses
d’identité des distributions et d’indépendance des résidus, sous-jacentes à l’analyse
de la variance, impliquent en effet que les 60 mesures ont été effectuées dans un
ordre complètement aléatoire.
Or, en pratique, on pourrait être tenté de réaliser les manipulations dans un
ordre systématique, en modifiant le moins souvent possible le réglage des appareils.
Dans le cas considéré ici, il pourrait être plus facile, par exemple, d’effectuer en
premier lieu les 20 mesures relatives à la vitesse inférieure, puis les 20 mesures
relatives à la vitesse intermédiaire, et enfin seulement les 20 mesures relatives à la
vitesse supérieure.
Une telle façon de faire peut toutefois engendrer des interférences difficilement
prévisibles entre les facteurs dont on veut estimer l’effet et d’autres facteurs qui ne
sont pas contrôlés. Il en serait ainsi, notamment, si les trois vitesses d’arrachage
étaient prises en considération successivement, comme nous venons de l’évoquer,
si les éprouvettes subissaient au cours du temps une dessiccation progressive non
contrôlée, et si le degré d’humidité des éprouvettes avait une influence sur la ré-
sistance à la traction. Les facteurs vitesse d’arrachage, dont l’étude est un des
objectifs de l’expérience, et humidité des éprouvettes, dont on ignore l’importance,
seraient alors totalement confondus, en s’additionnant ou en s’annulant peut-être,
au moins dans une certaine mesure.
La répartition aléatoire, éventuellement avec certaines restrictions dont on tient
compte au moment de l’analyse, comme dans le cas des blocs aléatoires complets,
est toujours une condition essentielle des expériences dont les résultats sont soumis
à l’analyse de la variance. Les conséquences possibles d’une répartition systéma-
tique des traitements sont illustrées de façon plus concrète par l’exemple 11.4.2,
ainsi que dans Dagnelie [2003].
Cela étant, comme les trois critères de classification sont fixes, le modèle d’ana-
lyse de la variance est lui aussi fixe, et tous les tests doivent être réalisés par rapport
au carré moyen résiduel (tableau 11.2.5).
L’examen des résultats des tests montre tout d’abord que l’interaction des
trois facteurs et les interactions des facteurs grosseurs des clous et diamètres des
anneaux d’une part, diamètres des anneaux et vitesses d’arrachage d’autre part,
ne sont pas significatives (tableau 11.2.2). L’interaction des facteurs grosseurs des
clous et vitesses d’arrachage est, par contre, tout juste significative. L’absence
d’interaction entre les trois facteurs doit être interprétée comme étant le fait que
360 ANALYSE DE LA VARIANCE À TROIS ET PLUS DE TROIS CRITÈRES 11.2.4

l’interaction grosseurs des clous-vitesses d’arrachage est, aux fluctuations aléatoires


près, la même pour les deux diamètres d’anneaux.
Quant aux facteurs principaux, ils font tous trois apparaı̂tre des différences très
hautement significatives. Mais en raison de l’existence d’une interaction significa-
tive en ce qui les concerne, il faudrait en principe tester les facteurs grosseurs des
clous et vitesses d’arrachage séparément pour leurs différentes modalités. Les va-
leurs respectives des deux probabilités (P = 0,043 pour l’interaction et P = 0,0000
pour les deux facteurs) indiquent toutefois que les conclusions des tests relatifs
aux facteurs principaux ne peuvent pas être influencées de façon sensible par cette
interaction.
On peut alors rechercher éventuellement, en fonction des besoins, des limites
de confiance pour les moyennes et les différences de moyennes, à savoir, en ce qui
concerne les grosseurs des clous :

x̄(6,5) = 57,1 et x̄(8) = 74,3 kg ,

les diamètres des anneaux :

x̄(22) = 68,1 et x̄(30) = 63,3 kg ,

et les vitesses d’arrachage :

x̄(22) = 61,7, x̄(45) = 65,8 et x̄(90) = 69,6 kg .

En raison de l’interaction significative grosseurs des clous-vitesses d’arrachage,


on pourrait aussi avoir intérêt à considérer les moyennes qui sont relatives simul-
tanément à ces deux facteurs :

x̄(6,5; 22) = 53,8 , x̄(6,5; 45) = 55,5 et x̄(6,5; 90) = 62,1 kg ,

x̄(8; 22) = 69,6 , x̄(8; 45) = 76,0 et x̄(8; 90) = 77,2 kg .

11.2.4 Le cas des échantillons d’une seule observation


1◦ Comme en analyse de la variance à deux critères de classification (§ 10.2.5),
quand les différents échantillons ne sont constitués chacun que d’une seule observa-
tion, toutes les mentions relatives à la variation résiduelle disparaissent du modèle
observé, de l’équation d’analyse de la variance, des nombres de degrés de liberté,
etc.

2◦ Les mentions CMr disparaissent aussi des tableaux d’espérances mathéma-


tiques des carrés moyens, ce qui réduit, parfois considérablement, les possibilités
de comparaison.
Ainsi, le tableau 11.2.5 montre que plus aucune comparaison n’est possible dans
le cas du modèle fixe, si ce n’est en supposant la nullité de certaines interactions.
11.2.4 MODÈLES CROISÉS À TROIS CRITÈRES 361

De même, les comparaisons relatives au facteur aléatoire (C) et à ses interac-


tions avec les facteurs fixes (a et b) ne sont pas possibles non plus pour le premier
modèle mixte, et la comparaison relative à l’interaction des deux facteurs aléatoires
(B et C) n’est pas possible pour le deuxième modèle mixte.
d Aucune difficulté n’apparaı̂t cependant si on peut supposer que le modèle est
additif, c’est-à-dire qu’il ne fait intervenir aucune interaction. Cette hypothèse peut
être vérifiée dans une certaine mesure par une généralisation du test d’additivité
de Tukey (§ 10.3.6.4◦ ) et par divers autres tests qui poursuivent le même objectif
b [Marasinghe et Boik, 1993 ; Zafar-Yab, 1993].

d 3◦ Différents cas particuliers d’analyse de la variance à trois critères de clas-


sification, relatifs à des échantillons d’une seule observation, peuvent être pris en
considération en relation avec divers dispositifs expérimentaux. Il en est ainsi par
exemple pour les modèles relatifs aux dispositifs en carré latin, en ✭✭ cross-over ✮✮
b et en parcelles divisées [Dagnelie, 1970, 2003].

d 4◦ Enfin, le problème de l’estimation des données manquantes doit aussi être


abordé, le cas échéant. Ce problème soulève souvent plus de difficultés qu’en ana-
lyse de la variance à deux critères de classification (§ 10.4.3), et il peut nécessiter
l’emploi de formules particulières, liées aux différents dispositifs expérimentaux
dont il vient d’être question.
Ce problème peut également être résolu par l’analyse de la covariance

b (§ 17.3.3.3 ) ou par l’utilisation du modèle linéaire (§ 16.4.5).

Exemple 11.2.4. Détermination d’une fumure optimale pour le blé : analyse de


la variance.
Une expérience en blocs aléatoires complets a été réalisée sur blé au Rwanda,
en vue de déterminer autant que possible une fumure phospho-calcique opti-
male [Neel et De Prins, 1973]. Trois doses d’acide phosphorique (100 , 200 et
300 kg/ha) et trois doses de chaux (1.000 , 4.500 et 8.000 kg/ha) ont été comparées,
les neuf combinaisons des deux engrais ayant été affectées chacune au hasard et in-
dépendamment à une parcelle, au sein de chacun des blocs, qui étaient au nombre
de trois 7 .
Le tableau 11.2.6 donne les rendements observés, en kg par parcelle de 18 m2 ,
les différents niveaux de fumures étant représentés par les valeurs 1 , 2 et 3 des
indices i et j qui leur sont affectés. Le tableau 11.2.7 présente aussi les résultats
de deux analyses de la variance. On remarquera qu’une des données initiales est
manquante et a dû être estimée, comme il est indiqué ci-dessous. Ceci a notamment
pour conséquence de réduire d’une unité les nombres de degrés de liberté de la
dernière composante et du total, dans chacune des deux analyses (§ 10.4.3.1◦ ).
7 D’autres fumures ont également été étudiées au cours de cette expérience, mais elles peuvent

être négligées ici sans aucun inconvénient [Dagnelie, 2003].


362 ANALYSE DE LA VARIANCE À TROIS ET PLUS DE TROIS CRITÈRES 11.2.4

Tableau 11.2.6. Détermination d’une fumure optimale pour le blé : rendements


observés pour neuf fumures et trois blocs, en kg par parcelle de 18 m2 .

Fumures Blocs
P2 O5 CaO 1 2 3
1 1 1,30 0,80 2,01
1 2 2,05 2,37 2,52
1 3 2,07 2,60 2,25
2 1 – 2,36 2,71
2 2 2,99 2,92 3,63
2 3 2,62 2,89 3,43
3 1 2,61 2,06 3,29
3 2 3,22 2,93 3,85
3 3 3,15 3,35 3,67

Tableau 11.2.7. Détermination d’une fumure optimale pour le blé :


tableaux d’analyse de la variance.

Degrés S. des carrés Carrés


Sources de variation F P
de liberté des écarts moyens
Phosphore 2 6,2949 3,1474 60,2 ** 0,0010
Calcium 2 3,5022 1,7511 13,8 * 0,016
Blocs 2 1,9191 0,9596
Phosphore-calcium 4 0,1525 0,0381 0,57 0,69
Phosphore-blocs 4 0,2093 0,0523
Calcium-blocs 4 0,5062 0,1266
Phosphore-calcium-blocs 7 0,4665 0,0666
Totaux 25 13,0507
Phosphore 2 6,2949 3,1474 39,9 *** 0,0000
Calcium 2 3,5022 1,7511 22,2 *** 0,0000
Interaction 4 0,1525 0,0381 0,48 0,75
Blocs 2 1,9191 0,9596
Variation résiduelle 15 1,1820 0,0788
Totaux 25 13,0507

Les critères de classification phosphore et calcium sont des critères fixes, tandis
que le facteur blocs doit être considéré comme aléatoire, les blocs étant représen-
tatifs de l’ensemble du territoire auquel on souhaite pouvoir appliquer les résultats
obtenus. Le modèle d’analyse de la variance est donc un modèle mixte, du premier
type présenté au paragraphe 11.2.3.4◦ , mais avec un effectif n égal à 1 .
La deuxième partie du tableau des espérances mathématiques (tableau 11.2.5)
montre que les deux facteurs principaux et leur interaction doivent être testés par
11.2.4 MODÈLES CROISÉS À TROIS CRITÈRES 363

rapport aux interactions correspondantes avec le facteur blocs. Les résultats des
différents tests figurent dans la partie supérieure du tableau 11.2.7.
Toutefois, ces tests sont très peu puissants, car ils sont caractérisés par de très
faibles nombres de degrés de liberté aux dénominateurs (respectivement quatre,
quatre et sept degrés de liberté). Il y a donc lieu d’envisager de regrouper certaines
sources de variation.
Un tel regroupement est possible pour les trois interactions qui font intervenir
le facteur blocs, puisque les carrés moyens de ces interactions sont tous du même
ordre de grandeur (0,0523 , 0,1266 et 0,0666). Ce regroupement donne naissance à
la ✭✭ variation résiduelle ✮✮ qui apparaı̂t dans la partie inférieure du tableau 11.2.7,
les trois tests devant alors être réalisés par rapport à cette base de comparaison
commune. L’augmentation du nombre de degrés qui résulte de ce regroupement a
comme conséquence de mettre en évidence des différences nettement plus signifi-
catives, pour les deux facteurs.
Très souvent, dans le cas des expériences en blocs aléatoires complets, cette
deuxième présentation de l’analyse de la variance est envisagée seule, sans pas-
ser par la première présentation. Cette deuxième présentation peut d’ailleurs être
considérée aussi comme une analyse de la variance à deux critères de classification,
complétée par une décomposition de la somme des carrés des écarts factorielle. Il
s’agit en effet de l’analyse de la variance qui fait intervenir, dans un premier temps,
un facteur fumures global, avec huit degrés de liberté pour les neuf fumures, un
facteur blocs, avec deux degrés de liberté pour les trois blocs, et une interaction
fumures-blocs, avec normalement 16 degrés de liberté, cette dernière composante
correspondant à la ✭✭ variation résiduelle ✮✮ du tableau 11.2.7. Dans un deuxième
temps, la composante globale fumures peut être divisée en trois composantes in-
dividuelles, relatives à chacun des deux facteurs principaux, chaque fois avec deux
degrés de liberté, et à l’interaction de ces deux facteurs, avec quatre degrés de
liberté.
L’estimation de la donnée manquante a en fait été réalisée ici dans cette op-
tique, à l’aide de la formule du paragraphe 10.4.3.1◦ , le résultat obtenu étant 2,25 .
Quant au facteur blocs, on peut en mesurer l’importance en termes d’efficacité
relative (§ 10.3.6.6◦ ). On obtient :
(1,9191 + 1,1820)/(2 + 15) = 0,1824 et 0,1824/0,0788 = 2,31 ,
soit une efficacité relative d’environ 230 %, pour l’expérience en blocs aléatoires
complets, par comparaison avec une expérience complètement aléatoire.
Enfin, en ce qui concerne le contrôle des conditions d’application de l’analyse
de la variance, on peut remarquer que les résidus diffèrent sensiblement, en valeur
absolue, d’un niveau de fumure phosphorique à l’autre, et aussi d’un bloc à l’autre.
Cette inégalité de variances ne prête toutefois pas à conséquence, en ce qui concerne
les résultats des différents tests F .
On remarquera que l’analyse de la variance ne permet pas de résoudre le problè-
me posé au départ, à savoir la détermination d’une fumure optimale, mais permet
364 ANALYSE DE LA VARIANCE À TROIS ET PLUS DE TROIS CRITÈRES 11.2.4

seulement de voir dans quelle mesure les différences observées sont significatives.
Nous reviendrons ultérieurement au problème initial (exemples 12.2.2 et 15.2.1).

d Exemple 11.2.5. Comparaison de quatre provenances de viande par analyse sen-


sorielle : analyse de la variance.
Les responsables d’un réseau de magasins d’alimentation ont mis en place un
système de contrôle permanent de la qualité des viandes livrées par différents
fournisseurs. À cette fin, ils organisent régulièrement des séances de dégustation,
au cours desquelles un certain nombre de juges expérimentés sont appelés à donner,
pour les différentes provenances, des notes relatives à plusieurs propriétés particu-
lières (tendreté, saveur, etc.), ainsi qu’une appréciation globale. Nous considérons
ici les appréciations globales fournies par cinq juges, au cours de quinze séances
de dégustation, à propos de viandes provenant de quatre fournisseurs différents
[Delvaux, 1991].
Les notes émises par les juges peuvent varier de façon continue de 1 à 7, res-
pectivement pour les appréciations ✭✭ mauvais ✮✮ et ✭✭ excellent ✮✮, mais l’examen des
données initiales, que nous ne reproduisons pas ici, montre que la majorité des
notes sont en fait des valeurs entières allant de 1 à 6 , les valeurs extrêmes ob-
servées étant 1,0 et 6,8 , et la moyenne générale étant égale à 3,95 . Nous avons
signalé antérieurement que l’analyse de la variance pouvait être appliquée sans
inconvénients majeurs à de telles données (§ 9.1.3◦ ), et ce fait est confirmé notam-
ment par Rayner et Seyb [1988] en ce qui concerne l’analyse à trois critères de
classification.
Si on considère que les juges sont représentatifs de l’ensemble des consomma-
teurs potentiels, et que les séances sont représentatives des différents moments
auxquels des contrôles pourraient être réalisés, le modèle d’analyse de la variance
à prendre en considération est un modèle croisé mixte à un critère de classification
fixe (fournisseurs) et deux critères aléatoires (juges et séances de dégustation).
Il s’agit du deuxième modèle du paragraphe 11.2.3.4◦ , dans le cas d’un effectif n
égal à 1 .
Le tableau 11.2.8 donne les résultats de l’analyse de la variance, y compris les
résultats des tests qui sont immédiatement réalisables, conformément à ce qu’in-
dique la partie inférieure gauche du tableau 11.2.5.
On note tout d’abord l’importance de l’interaction fournisseurs-séances, qui
pourrait être l’indice d’une moindre régularité dans le temps de la qualité des
produits de l’un ou l’autre fournisseur. Un examen attentif de cette interaction se
justifie donc.
Deux approches au moins sont possibles. Une première approche consiste à
déterminer les termes d’interaction x̄i.k. − x̄i... − x̄..k. + x̄.... (i = 1 , . . . , 4 et
k = 1 , . . . , 15), et à examiner ces termes par la réalisation de tests de normalité
et par la recherche d’éventuelles valeurs aberrantes (chapitre 3). Une deuxième
approche a pour principe d’effectuer des analyses de la variance à deux critères
de classification, séparément pour chacun des fournisseurs, de manière à identifier
11.2.4 MODÈLES CROISÉS À TROIS CRITÈRES 365

Tableau 11.2.8. Comparaison de quatre provenances de viande


par analyse sensorielle : tableau d’analyse de la variance.

Sources Degrés S. des carrés Carrés


F P
de variation de liberté des écarts moyens
Fournisseurs 3 12,7627 4,2542
Juges 4 162,8542 40,7136 31,9 *** 0,0000
Séances 14 27,1909 1,9422 1,52 0,13
Fournisseurs-juges 12 16,0730 1,3394 1,92 * 0,035
Fournisseurs-séances 42 61,1243 1,4553 2,08 *** 0,0006
Juges-séances 56 71,4598 1,2761
Fourn.-juges-séances 168 117,4050 0,6988
Totaux 299 468,8699

l’importance du facteur séances pour les différents fournisseurs. Ces deux appro-
ches mettent effectivement en évidence des différences de comportement entre les
fournisseurs, et en particulier la plus grande régularité de l’un d’entre eux.
En raison du degré de signification de l’interaction fournisseurs-séances, la réa-
lisation du test du facteur fournisseurs, auquel on s’intéresse cependant principa-
lement, ne se justifie guère. En principe, ce test devrait être effectué par rapport à
l’une ou l’autre des deux interactions fournisseurs-juges et fournisseurs-séances, si
ces interactions étaient non significatives, ou par rapport au résultat d’un regrou-
pement de l’une ou l’autre, ou de l’une et l’autre de ces deux interactions, avec
l’interaction fournisseurs-juges-séances (tableau 11.2.5).
La méthode de Satterthwaite pourrait aussi conduire à considérer la quan-
tité suivante comme base de comparaison relative au facteur fournisseurs :

1,3394 + 1,4553 − 0,6988 = 2,0959 ,

et cela avec un nombre de degrés de liberté qui serait approximativement :

2,09592 /(1,33942 /12 + 1,45532 /42 + 0,69882 /168) = 22 .

Cette méthode conduirait à une conclusion de non-signification des différences


entre fournisseurs (Fobs = 2,03 et P = 0,14).
Un autre élément qui doit retenir l’attention est le caractère très hautement
significatif des différences entre juges (tableau 11.2.8).
À cet égard, l’examen des résidus de l’analyse de la variance et de leur dis-
tribution ne met en évidence, à première vue, aucune anomalie particulière, les
valeurs extrêmes des résidus réduits étant égales à − 3,16 et + 2,64 , et leur dis-
tribution pouvant être considérée comme très proche d’une distribution normale.
Toutefois, l’analyse de la variance qui peut être réalisée pour les valeurs absolues
des résidus, dans l’optique du test de Levene (§ 7.5.3.3◦ ), montre l’existence de
366 ANALYSE DE LA VARIANCE À TROIS ET PLUS DE TROIS CRITÈRES 11.3.1

différences importantes entre les juges, l’un d’entre eux étant caractérisé par des
résidus nettement inférieurs aux quatre autres.
Un retour aux données initiales permet de constater que ce juge a toujours
donné des appréciations relativement élevées et limitées à un domaine de variation
fort étroit (allant de 4,0 à 6,1), par comparaison avec les autres juges (respective-
ment de 1,0 à 5,0 , de 1,0 à 5,8 , de 1,8 à 6,4 , et de 2,0 à 6,8). Cet élément explique
dans une très large mesure, à la fois, les différences de moyennes et les différences
de variances entre juges. Il peut suggérer de recommencer l’analyse en éliminant
les observations relatives au juge en question.
Cet exemple, dont nous ne pousuivons pas plus loin la discussion, met bien en
évidence les difficultés que peut soulever l’interprétation des résultats d’une analyse
de la variance, même tout à fait classique, surtout en présence d’interactions. Il
souligne l’attention qu’il faut donc toujours accorder à de telles interprétations. On
peut ajouter aussi que, dans le cas considéré, le problème réel peut éventuellement
être plus complexe encore, ou au contraire être simplifié, du fait de l’existence
d’analyses de la variance relatives à d’autres caractéristiques (tendreté, saveur,
b etc.).

11.3 L’analyse de la variance à trois critères


de classification : modèles hiérarchisés
à effectifs égaux

11.3.1 Principes généraux

1◦ Pour trois critères de classification, les modèles hiérarchisés d’analyse de


la variance sont plus nombreux encore que les modèles croisés. Non seulement les
différents critères peuvent être fixes ou aléatoires, mais en outre, leur hiérarchisa-
tion peut se présenter de différentes façons.
Ainsi, si on désigne les trois critères par a , b et c , le critère c peut tout d’abord
être subordonné au critère b , ce dernier étant lui-même subordonné au critère a .
Le modèle est alors complètement hiérarchisé 8 .
Mais il peut arriver également que deux des trois critères, par exemple b et c ,
soient à la fois croisés entre eux et subordonnés au troisième (a). De même, deux
des trois critères, par exemple a et b , peuvent être croisés entre eux, le troisième (c)
leur étant subordonné. Enfin, deux des trois critères, par exemple b et c , peuvent
être à la fois subordonnés l’un à l’autre et croisés avec le troisième (a). Tous ces
modèles sont dits partiellement hiérarchisés 9 . Ils sont en fait à la fois partiellement
croisés et partiellement hiérarchisés.
8 En anglais : completely hierarchical model.
9 En anglais : partially hierarchical model.
11.3.2 MODÈLES HIÉRARCHISÉS À TROIS CRITÈRES 367

2◦ Les quatre cas qui viennent d’être évoqués sont présentés sous forme de
schémas dans la figure 11.3.1. Les lignes accompagnées des lettres a , b et c dési-
gnent chaque fois les trois critères de classification, tandis que les petites lignes
isolées indiquent dans chaque cas la position d’éventuelles répétitions des observa-
tions, pour des effectifs n supérieurs à 1 .

Figure 11.3.1. Représentation schématique des différents modèles


complètement hiérarchisé (I) et partiellement hiérarchisés (II, III et IV)
d’analyse de la variance à trois critères de classification.

On notera que de telles répétitions sont indispensables dans les cas I et III,
pour qu’ils s’agissent bien d’analyses à trois critères de classification. L’absence
de répétitions réduirait en effet ces modèles à des analyses de la variance à deux
critères de classification, de type hiérarchisé dans le cas I et de type croisé dans le
cas III.
On remarquera aussi qu’à ce stade, nous ne faisons aucune distinction entre
critères fixes et critères aléatoires, les lettres a , b et c devant donc être considérées
comme étant, selon les cas, soit des minuscules, soit des majuscules.

3◦ Dans la suite, nous envisagerons successivement les modèles complètement


hiérarchisés (§ 11.3.2) et les modèles partiellement hiérarchisés (§ 11.3.3), en nous
limitant toujours ici aux cas où les nombres de modalités sont constants aux
différents niveaux, et où les échantillons sont de même effectif.

11.3.2 Les modèles complètement hiérarchisés


1◦ En ce qui concerne les modèles complètement hiérarchisés, toutes les interac-
tions disparaissent. Et par analogie avec l’analyse à deux critères de classification
368 ANALYSE DE LA VARIANCE À TROIS ET PLUS DE TROIS CRITÈRES 11.3.2

(§ 10.5.2), les aspects descriptifs de l’analyse de la variance peuvent être résumés


de la manière suivante :

xijkl − x̄.... = (x̄i... − x̄.... ) + (x̄ij.. − x̄i... ) + (x̄ijk. − x̄ij.. ) + (xijkl − x̄ijk. ) ,

SCEt = SCEa + SCEb|a + SCEc|b|a + SCEr

et p q r n − 1 = (p − 1) + p (q − 1) + p q (r − 1) + p q r (n − 1) .

2◦ Les critères de classification subordonnés étant en général tous aléatoires,


deux modèles théoriques, l’un mixte et l’autre aléatoire, doivent être pris en con-
sidération. Ils s’écrivent :

Xijkl − m... = ai + Bj|i + Ck|j|i + Dijkl

et Xijkl − m... = Ai + Bj|i + Ck|j|i + Dijkl .

3◦ Les espérances mathématiques des carrés moyens sont présentées dans le


tableau 11.3.1, toujours selon les mêmes principes que précédemment (§ 10.3.5.1◦
et 11.2.3.6◦ ). Ces espérances indiquent la manière dont les tests d’hypothèses et
les estimations des composantes de la variance doivent être réalisés.

Tableau 11.3.1. Espérances mathématiques des carrés moyens,


pour les modèles complètement hiérarchisés d’analyse de la variance
à trois critères de classification.
Carrés Modèle mixte (a fixe) Modèle aléatoire
moyens σ 2 σC|B|a
2 2
σB|a a2i σ2 2
σC|B|A 2
σB|A 2
σA
CMa 1 n rn + 1 n rn qrn
CMb|a 1 n rn 1 n rn
CMc|b|a 1 n 1 n
CMr 1 1

d 4◦ Quant à l’exécution des calculs, les modèles d’analyse de la variance consi-


dérés ici peuvent être présentés par exemple de la manière suivante, pour le logiciel
Minitab, par extension de ce qui a été dit au paragraphe 10.5.2.7◦ :
X = A B(A) C(B) ou X = A B(A) C(A B) ,
B(A) indiquant que le facteur B est subordonné au facteur A , tandis que C(B) et
C(A B) indiquent que le facteur C est subordonné au facteur B ou, plus explicite-
b ment, aux facteurs A et B .
11.3.2 MODÈLES HIÉRARCHISÉS À TROIS CRITÈRES 369

Exemple 11.3.1. Comparaison des hauteurs moyennes des arbres de trois types
de hêtraies : analyse de la variance à trois critères de classification.
Au cours du chapitre 9, nous avons comparé les hauteurs moyennes des arbres
de trois types de hêtraies, par l’analyse de la variance à un critère de classification
(exemples 9.2.1 et 9.3.1). Les données de base que nous avons prises en considé-
ration étaient des hauteurs moyennes observées en 37 endroits différents (tableau
2.3.1). Nous avions aussi signalé que ces hauteurs moyennes avaient été obtenues
en repérant chaque fois les cinq arbres les plus gros, au sein d’une parcelle d’une
dimension donnée, et en mesurant deux fois la hauteur de chacun de ces cinq arbres
(exemple 2.3.1).
Dans ces conditions, l’étude détaillée des 370 mesures initiales peut conduire
à la réalisation d’une analyse de la variance complètement hiérarchisée à trois cri-
tères de classification, qui correspond au premier schéma de la figure 11.3.1. Les
trois critères, tous hiérarchisés les uns par rapport aux autres, sont les types de
hêtraies, les points d’observation, aussi appelés ✭✭ stations ✮✮, et les arbres. Les deux
mesures réalisées pour chacun des arbres constituent les répétitions. Le critère
types de hêtraies est fixe, tandis que les deux autres critères de classification sont
aléatoires, de telle sorte que le modèle d’analyse de la variance est mixte.
Le tableau 11.3.2 présente les résultats de cette analyse. Comme l’indique le
tableau 11.3.1, chacun des critères de classification doit être testé par rapport au
critère qui lui est immédiatement subordonné. On peut constater ainsi que toutes
les différences sont au moins hautement significatives.

Tableau 11.3.2. Comparaison des hauteurs moyennes des arbres de trois types
de hêtraies : tableau d’analyse de la variance à trois critères de classification.

Sources Degrés S. des carrés Carrés


F P
de variation de liberté des écarts moyens
Types de hêtraies 2 485,71 242,86 7,08 ** 0,0027
Stations 34 1.165,41 34,28 9,42 *** 0,0000
Arbres 148 538,57 3,639 6,29 *** 0,0000
Mesures 185 107,08 0,5788
Totaux 369 2.296,77

Les carrés moyens relatifs aux facteurs stations et arbres, et à la variation


résiduelle (différences entre mesures), permettent d’estimer les composantes de la
variance suivantes :

b2 = 0,5788 , σ
σ 2
bC|B|a = (3,639 − 0,5788)/2 = 1,530
2
et σ
bB|a = (34,28 − 3,639)/10 = 3,064 ,
370 ANALYSE DE LA VARIANCE À TROIS ET PLUS DE TROIS CRITÈRES 11.3.3

soit aussi en termes d’écarts-types, respectivement pour les différences entre me-
sures relatives à un même arbre, entre arbres dans une même station, et entre
stations dans un même type de hêtraies :

σ
b = 0,76 , σ
bC|B|a = 1,24 et σ
bB|a = 1,75 m .

Quant aux différences entre types de hêtraies, on peut observer que le résultat
du test est pratiquement identique à celui qui a été obtenu antérieurement (exemple
9.3.1). En fait, les deux premières sommes des carrés des écarts factorielles (485,71
et 1.165,41) sont à peu de chose près égales à 10 fois celles calculées précédemment
(tableau 9.2.2 : 48,88 et 116,65). Le facteur 10 provient du fait que ces sommes de
carrés d’écarts sont calculées ici à partir de 10 fois plus d’observations (cinq arbres
× deux mesures, dans chaque station), et les différences mineures, par rapport aux
résultats antérieurs multipliés par 10 , découlent du fait que les premiers calculs ont
été réalisés en partant de hauteurs moyennes par station arrondies à une décimale.
L’analyse de la variance à trois critères de classification n’apporte donc aucune
information complémentaire, par comparaison avec l’analyse à un critère, en ce
qui concerne le principal objectif de l’étude. Sa réalisation ne se justifie que dans
l’optique de la détection d’éventuelles valeurs aberrantes, en ce qui concerne les
données initiales, et de l’estimation des composantes de la variance 10 .

11.3.3 Les modèles partiellement hiérarchisés

1◦ L’étude des modèles partiellement hiérarchisés d’analyse de la variance est


plus complexe que celle des modèles croisés et des modèles complètement hiérar-
chisés. Contrairement à ces derniers, les modèles partiellement hiérarchisés font en
effet intervenir certaines interactions, mais contrairement aux modèles croisés, ils
ne les contiennent pas toutes.
Les schémas de la figure 11.3.1 facilitent cependant grandement les choses. Les
intersections des lignes qui apparaissent dans ces schémas indiquent en effet les in-
teractions qui sont présentes dans les différents modèles. Ainsi, en ce qui concerne
le schéma II de cette figure, l’interaction (bc)jk , relative aux deux facteurs qui sont
croisés, doit être présente dans le modèle, alors que les trois autres interactions,
qui feraient toutes intervenir au moins deux facteurs subordonnés l’un à l’autre
(a et b , a et c , ou a , b et c), ne doivent pas y figurer.

10 On pourra aussi remarquer que le problème envisagé n’est pas strictement équilibré, puisque

les effectifs qui concernent les différents types de hêtraies ne sont pas égaux. Ce fait ne modifie
toutefois pas la manière dont le test relatif aux types de hêtraies doit être réalisé, et n’a aucune
incidence sur les estimations des composantes de la variance relatives aux facteurs subordonnés
stations et arbres, et à la variation résiduelle.
11.3.3 MODÈLES HIÉRARCHISÉS À TROIS CRITÈRES 371

2◦ Dans ces conditions, le modèle observé, l’équation d’analyse de la variance


et les nombres de degrés de liberté sont :

xijkl − x̄.... = (x̄i... − x̄.... ) + (x̄ij.. − x̄i... ) + (x̄i.k. − x̄i... )


+ (x̄ijk. − x̄ij.. − x̄i.k. + x̄i... ) + (xijkl − x̄ijk. ) ,

SCEt = SCEa + SCEb|a + SCEc|a + SCEbc|a + SCEr

et p q r n − 1 = (p − 1) + p (q − 1) + p (r − 1) + p (q − 1) (r − 1) + p q r (n − 1) .

Ces relations sont intermédiaires entre celles qui concernent les modèles croi-
sés (§ 11.2.2) et celles qui sont relatives aux modèles complètement hiérarchisés
(§ 11.3.2.1◦ ).
Les deuxième et troisième termes du second membre du modèle observé ont
trait, respectivement, à l’effet du facteur b et à l’effet du facteur c , pour les différen-
tes modalités du facteur a . Par comparaison avec le modèle croisé (§ 11.2.2.2◦ ),
ces deux termes prennent la place, d’une part, de l’effet du facteur b et de son
l’interaction avec le facteur a , et d’autre part, de l’effet du facteur c et de son
interaction avec, aussi, le facteur a .
De même, le quatrième terme du second membre représente l’interaction des
facteurs b et c , pour les différentes modalités du facteur a . Il remplace le terme
d’interaction des facteurs b et c et le terme d’interaction des trois facteurs.
3◦ Toujours dans le même cas (schéma II de la figure 11.3.1), deux modèles
théoriques, l’un mixte et l’autre aléatoire, doivent être considérés. Le modèle mixte
(a fixe et B et C aléatoires) est :

Xijkl − m... = ai + Bj|i + Ck|i + (BC)jk|i + Dijkl ,

et le modèle aléatoire peut être obtenu en remplaçant a par A .


4◦ De même, sans en développer les aspects descriptifs, on peut écrire comme
suit le modèle mixte relatif au troisième cas (schéma III) de la figure 11.3.1, pour
deux facteurs fixes (a et b) et un facteur aléatoire (C) :

Xijkl − m... = ai + bj + (ab)ij + Ck|ij + Dijkl .

Un autre modèle mixte, à un facteur fixe (a) et deux facteurs aléatoires (B et C),
et un modèle aléatoire peuvent être obtenus en remplaçant soit uniquement b , soit
a et b par des majuscules.
Ces trois modèles sont très proches des modèles croisés à deux critères de
classification (§ 10.3.2.2◦ , 10.3.3.3◦ et 10.3.4.3◦ ). Comme nous l’avons déjà signa-
lé (§ 11.3.1.2◦ ), ils s’y ramènent d’ailleurs dans le cas d’échantillons d’une seule
observation.
372 ANALYSE DE LA VARIANCE À TROIS ET PLUS DE TROIS CRITÈRES 11.3.3

5◦ Enfin, pour le schéma IV de la figure 11.3.1, on a comme premier modèle


mixte :
Xijkl − m... = ai + bj + (ab)ij + Ck|j + (aC)ik|j + Dijkl .

On peut en déduire deux autres modèles mixtes et un modèle aléatoire, en rem-


plaçant soit uniquement a , soit uniquement b , soit a et b par des majuscules.

6◦ Les espérances mathématiques des carrés moyens sont données, pour les
différents cas et de la même manière que précédemment, dans les tableaux 11.3.3
à 11.3.5. Elles indiquent la façon dont les tests d’hypothèses et les estimations
des composantes de la variance doivent être réalisés, éventuellement moyennant
certains regroupements des sommes des carrés des écarts (§ 10.3.5.3◦ et 11.2.3.8◦ ).

Tableau 11.3.3. Espérances mathématiques des carrés moyens,


pour deux modèles d’analyse de la variance correspondant
au schéma II de la figure 11.3.1.

Carrés Modèle mixte (a fixe) Modèle aléatoire


moyens σ2 2
σBC|a 2
σC|a 2
σB|a a2i σ2 2
σBC|A 2
σC|A 2
σB|A 2
σA
CMa 1 n qn rn + 1 n qn rn qrn
CMb|a 1 n rn 1 n rn
CMc|a 1 n qn 1 n qn
CMbc|a 1 n 1 n
CMr 1 1

Tableau 11.3.4. Espérances mathématiques des carrés moyens,


pour trois modèles d’analyse de la variance correspondant
au schéma III de la figure 11.3.1.

Carrés Modèle mixte (a et b fixes) Modèle mixte (a fixe)


moyens σ2 2
σC|ab (ab)2ij b2j a2i σ2 2
σC|aB 2
σaB σB2
a2i
CMa 1 n + 1 n rn +
CMb 1 n + 1 n prn
CMab 1 n + 1 n rn
CMc|ab 1 n 1 n
CMr 1 1
Carrés Modèle aléatoire
moyens σ2 2
σC|AB 2
σAB 2
σB 2
σA
CMa 1 n rn qrn
CMb 1 n rn prn
CMab 1 n rn
CMc|ab 1 n
CMr 1
11.3.3 MODÈLES HIÉRARCHISÉS À TROIS CRITÈRES 373

Tableau 11.3.5. Espérances mathématiques des carrés moyens,


pour quatre modèles d’analyse de la variance correspondant
au schéma IV de la figure 11.3.1.

Carrés Modèle mixte (a et b fixes) Modèle mixte (a fixe)


moyens σ2 2
σaC|b 2
σC|b (ab)2ij b2j a2i σ2 2
σaC|B 2
σC|B 2
σaB 2
σB a2i
CMa 1 n + 1 n rn +
CMb 1 pn + 1 pn prn
CMab 1 n + 1 n rn
CMc|b 1 pn 1 pn
CMac|b 1 n 1 n
CMr 1 1
Carrés Modèle mixte (b fixe) Modèle aléatoire
moyens σ2 2
σAC|b 2
σC|b 2
σAb b2j 2
σA σ2 2
σAC|B 2
σC|B 2
σAB 2
σB 2
σA
CMa 1 n qrn 1 n rn qrn
CMb 1 n pn rn + 1 n pn rn prn
CMab 1 n rn 1 n rn
CMc|b 1 n pn 1 n pn
CMac|b 1 n 1 n
CMr 1 1

d Ces espérances mathématiques indiquent également les comparaisons pour les-


quelles l’utilisation de fonctions linéaires des carrés moyens doit être envisagée, en

b l’absence de sources de variation adéquates (§ 11.2.3.9 ).

7◦ Les différents modèles relatifs au schéma IV de la figure 11.3.1 présentent


un intérêt particulier, dans la mesure où ils correspondent au cas relativement fré-
quent des expériences en blocs aléatoires complets répétées en différents endroits
ou à différents moments (par exemple au cours de plusieurs années ou de plusieurs
périodes de culture). Dans ce cas, le facteur blocs (C) est subordonné au facteur
lieux ou moments (b ou B), tandis que le facteur principal qui justifie l’organisation
de l’expérience (a ou A) est croisé, à la fois, avec le facteur lieux ou moments et
avec le facteur blocs.

d 8◦ En vue de la réalisation des calculs à l’aide du logiciel Minitab par exemple,


les différents modèles partiellement hiérarchisés qui viennent d’être envisagés peu-
vent être présentés de la manière suivante, par extension de ce qui a été dit anté-
rieurement (§ 11.2.2.5◦ et 11.3.2.4◦ ) :

X = A B(A) C(A) B*C(A) , X = A B A*B C(A B)

et X = A B A*B C(B) A*C(B) .

On notera la parfaite correspondance entre ces différentes présentations et les sché-


b mas II à IV de la figure 11.3.1.
374 ANALYSE DE LA VARIANCE À TROIS ET PLUS DE TROIS CRITÈRES 11.3.3

Exemple 11.3.2. Étude des qualités technologiques du bois d’épicéa : principes


de l’analyse de la variance.
Au cours d’une vaste étude relative aux qualités technologiques du bois d’épicéa
commun (Picea abies Karst.), 45 emplacements représentatifs d’une région don-
née ont été choisis et, en chacun de ces emplacements, deux arbres ont également
été choisis et abattus. Dans chacun de ces arbres, quatre éprouvettes de 1 m de
longueur et 5 cm sur 5 cm de section ont ensuite été prélevées, à raison de deux
éprouvettes dans la partie inférieure des arbres et deux éprouvettes dans la partie
médiane des arbres. Les 360 éprouvettes ont enfin été l’objet d’une série d’obser-
vations, physiques, anatomiques et mécaniques, telles que des mesures de densité
(ou masse volumique), de largeur des cernes (croissance annuelle), de résistance à
la flexion, etc. [Dupont, 1984 ; Grayet, 1980].
Le facteur arbres est nécessairement subordonné au facteur emplacements (ou
stations), les arbres étant bien sûr totalement indépendants les uns des autres
d’un endroit à l’autre. Le facteur niveaux (partie inférieure ou partie médiane des
arbres) est par contre croisé, tant avec le facteur arbres qu’avec le facteur stations,
puisque les mêmes niveaux existent pour chacun des arbres, dans chacune des
stations. Le modèle d’analyse de la variance correspond donc au schéma IV de la
figure 11.3.1, les trois critères de classification étant les niveaux (a), les stations (b)
et les arbres (c), et les éprouvettes constituant les répétitions.
De plus, les critères stations et arbres doivent être considérés comme aléatoires,
puisque ces éléments sont représentatifs de l’ensemble d’une région, tandis que le
critère niveaux est fixe. Le modèle est donc semblable à celui qui est présenté
au paragraphe 11.3.3.5◦ , en affectant une lettre minuscule aux niveaux (a) et des
lettres majuscules aux stations et aux arbres (B et C).
Le schéma de l’analyse de la variance qui correspond à cette situation, pour
chacune des caractéristiques qui ont été mesurées, est présenté dans le tableau
11.3.6.

Tableau 11.3.6. Étude des qualités technologiques du bois d’épicéa :


schéma de l’analyse de la variance.

Degrés
Sources de variation
de liberté
Niveaux 1
Stations 44
Niveaux-stations 44
Arbres (dans stations) 45
Niveaux-arbres (dans stations) 45
Répétitions (éprouvettes) 180
Total 359
11.4.2 ANALYSE À PLUS DE TROIS CRITÈRES 375

Les espérances mathématiques qui sont résumées dans la deuxième partie du


tableau 11.3.5 montrent que les différences entre niveaux doivent être comparées
à l’interaction niveaux-stations, les différences entre stations aux différences entre
arbres (dans les stations), les différences entre arbres (dans les stations) aux dif-
férences entre éprouvettes, l’interaction niveaux-stations à l’interaction niveaux-
arbres (dans les stations), et cette dernière aux différences entre éprouvettes.
d Au vu du tableau 11.3.6, on pourrait faire remarquer que, sauf pour le facteur
niveaux, les nombres de degrés de liberté sont tous relativement importants, et
que le matériel expérimental aurait pu être mieux utilisé en prenant en compte
un ou plusieurs facteurs supplémentaires. Nous verrons à l’exemple 11.4.4 que tel
b était bien le cas en réalité.

11.4 L’analyse de la variance à plus de trois


critères de classification
11.4.1 Principes généraux
1◦ Nous envisagerons assez rapidement, d’une manière générale, les modèles
croisés (§ 11.4.2) et les modèles hiérarchisés (§ 11.4.3) d’analyse de la variance à
un nombre quelconque de critères de classification. Nous nous limiterons cependant
toujours au cas des échantillons de même effectif, le cas des échantillons d’effectifs
inégaux pouvant être abordé dans l’optique du modèle linéaire (§ 16.4.5).

2◦ Si les principes de base de l’analyse de la variance à deux et à trois critères de


classification sont bien compris, leur extension à quatre et plus de quatre critères
est relativement simple. De plus, la réalisation des calculs par ordinateur ne pose
pas de problème particulier.
Il faut noter toutefois que l’interprétation des résultats de l’analyse de la va-
riance se complique souvent de plus en plus, au fur et à mesure de l’augmentation
du nombre de critères de classification. En pratique, il ne faut donc s’engager
qu’avec prudence dans la planification et la réalisation d’analyses de la variance à
quatre et plus de quatre critères de classification.

11.4.2 Les modèles croisés à effectifs égaux


1◦ Nous avons vu antérieurement que, pour l’analyse à un critère de classifica-
tion et pour les modèles croisés à deux et à trois critères, dans le cas des échantillons
de plusieurs observations, le modèle observé et l’équation d’analyse de la variance
comportent l’un et l’autre, successivement, deux, quatre et huit termes (§ 9.2.2,
10.2.2 et 11.2.2). Par extension, on en déduit facilement que, pour les modèles
croisés à h critères de classification, et toujours dans le cas des échantillons de
plusieurs observations, le nombre de termes est égal à 2h .
376 ANALYSE DE LA VARIANCE À TROIS ET PLUS DE TROIS CRITÈRES 11.4.2

Ces différents termes concernent les h facteurs principaux, les h (h − 1)/2 in-
teractions de deux facteurs, les h (h − 1) (h − 2)/6 interactions de trois facteurs,
. . . , les h (h − 1) (h − 2)/6 interactions de h − 3 facteurs, les h (h − 1)/2 interactions
de h − 2 facteurs, les h interactions de h − 1 facteurs, l’interaction des h facteurs,
et la variation résiduelle.
Dans le cas des échantillons de même effectif, on peut aussi déterminer aisé-
ment les différents nombres de degrés de liberté, en faisant intervenir des quantités
(p1 − 1), (p2 − 1), . . . , à la place de (p − 1), (q − 1), . . . (§ 11.2.2.3◦ ), les symboles
p1 , p2 , . . . désignant les nombres de modalités des différents facteurs.

2◦ Toujours par extension de ce qui concerne les analyses de la variance à un,


deux et trois critères de classification, le nombre de modèles théoriques différents
est égal à h + 1 , à savoir un modèle fixe, h − 1 modèles mixtes, et un modèle
aléatoire.
La principale question est alors la détermination, pour les différents modèles,
des espérances mathématiques des carrés moyens. Diverses procédures ont été pro-
posées à ce sujet [Boyd, 1980 ; Gaylor et al., 1970 ; Hartley, 1967 ; Schultz,
1955], et des tables sont données notamment par Abt [1963], pour quatre critères
de classification. Le problème est aussi résolu par divers logiciels statistiques.
Le choix des tests d’hypothèses et des estimations des composantes de la va-
riance, en fonction des espérances mathématiques des carrés moyens, soulève les
mêmes problèmes qu’en analyse de la variance à trois critères de classification
(§ 11.2.3.7◦ ). Les mêmes solutions, de regroupement de sommes des carrés des
écarts et d’utilisation de fonctions linéaires des carrés moyens, doivent être envi-
sagées (§ 11.2.3.8◦ et 11.2.3.9◦ ).

3◦ Le cas des échantillons d’une seule observation présente aussi des difficul-
tés semblables à celles de l’analyse de la variance à trois critères de classification
(§ 11.2.4).
d Ce cas particulier est important, en vue notamment d’étudier des nombres
relativement élevés de critères de classification, qui possèdent alors généralement
chacun deux modalités seulement (cas 2h ). La méthode de Yates (§ 11.2.2.5◦ ),
qui s’étend facilement à un nombre quelconque de critères de classification, est
particulièrement intéressante dans ce dernier cas.
Il y a toutefois lieu de tenir compte du fait que le nombre de tests aug-
mente très rapidement en fonction du nombre de critères de classification. En
l’absence de toute correction, il peut en résulter une augmentation considérable
du risque de première espèce, comme dans toute réalisation de tests multiples
[STAT1, § 10.3.5.1◦ ]. Des tables particulières, basées notamment sur le principe
de Bonferroni, et le recours à des diagrammes apparentés aux diagrammes de
probabilité (§ 3.3.2) permettent de surmonter cette difficulté [Lawson et al., 1998 ;
11
b Ludwig et al., 1986 ; Pearson et Hartley, 1966-1972 ; Taylor, 1994] .
11 Des informations complémentaires et un exemple sont présentés à ce sujet dans Dagnelie

[2003].
11.4.2 ANALYSE À PLUS DE TROIS CRITÈRES 377

Exemple 11.4.1. Étude des conditions de gazéification du bois de hêtre et d’épi-


céa : analyse de la variance.
Une étude a été menée en vue d’identifier l’importance de différents facteurs
susceptibles d’influencer la production de gaz par carbonisation du bois de hêtre
et d’épicéa. Quatre facteurs ont été pris en considération : deux types différents
de gazogènes, les deux essences (hêtre et épicéa), trois types de plaquettes de
bois qui sont introduites dans les gazogènes (ces trois types de plaquettes étant
caractérisés essentiellement par leurs dimensions), et quatre degrés d’humidité de
ces plaquettes (bois frais et bois séché à trois degrés d’humidité différents). Toutes
les combinaisons des différentes modalités des quatre facteurs ont été envisagées et
une mesure a été réalisée pour chaque combinaison de ces modalités. La principale
variable observée était le rendement de l’opération, exprimé en proportion du ren-
dement théorique qui pouvait être calculé à partir des caractéristiques de la matière
première [Lacrosse, 1990]. Les résultats obtenus figurent dans le tableau 11.4.1.
Les modalités des différents facteurs étant toutes définies a priori par l’expéri-
mentateur, le modèle d’analyse de la variance est un modèle croisé fixe à quatre
critères de classification, avec une observation pour chaque combinaison des diffé-
rentes modalités (n = 1). Les résultats de l’analyse sont donnés dans le tableau
11.4.2.
La détermination des espérances mathématiques des carrés moyens montre
que, comme pour deux et pour trois critères de classification (première partie du
tableau 10.3.7 et première partie du tableau 11.2.5), tous les tests devraient être
réalisés par rapport à la variation résiduelle. Toutefois, cette composante n’étant
pas connue, en l’absence de répétitions, on doit envisager d’effectuer les tests par
rapport à certaines interactions. De plus, les interactions sont toutes caractérisées
par de faibles nombres de degrés de liberté, ce qui incite aussi à procéder à des
regroupements.
Cette situation, qui peut paraı̂tre surprenante au premier abord, est en fait
très courante dans les études qui font intervenir plus de deux ou trois facteurs.
L’examen des résultats de l’analyse de la variance montre que les carrés moyens
des interactions ✭✭ gaz.-hum. ✮✮, ✭✭ ess.-hum. ✮✮, ✭✭ gaz.-ess.-hum. ✮✮, ✭✭ gaz.-plaq.-hum. ✮✮,
✭✭ ess.-plaq.-hum. ✮✮ et ✭✭ gaz.-ess.-plaq.-hum. ✮✮ sont du même ordre de grandeur (ta-
bleau 11.4.2). Ces différentes composantes peuvent donc être regroupées, en don-
nant naissance à une ✭✭ variation résiduelle ✮✮, à laquelle est associé un total de
27 degrés de liberté. Tous les tests peuvent alors être réalisés par rapport à cette
composante, comme le montre le tableau 11.4.3.
L’interprétation des résultats ainsi obtenus est délicate, en raison de la pré-
sence d’un nombre important d’interactions significatives. Un examen attentif des
moyennes permet cependant de montrer que, d’une part, le troisième type de pla-
quettes, dont les dimensions sont très différentes des deux autres, et d’autre part,
le bois frais ont des comportements fort particuliers. Ces deux modalités ont aussi,
globalement, des rendements nettement inférieurs aux autres.
378 ANALYSE DE LA VARIANCE À TROIS ET PLUS DE TROIS CRITÈRES 11.4.2

Tableau 11.4.1. Rendements observés au cours de la gazéification du bois


de hêtre et d’épicéa, en pourcentages, pour deux types de gazogènes,
les deux essences, trois types de plaquettes et quatre degrés d’humidité
de la matière première.

Gaz. Ess. Plaq. Hum. Rdt Gaz. Ess. Plaq. Hum. Rdt
1 1 1 1 74,4 2 1 1 1 78,6
1 1 1 2 71,3 2 1 1 2 80,5
1 1 1 3 69,6 2 1 1 3 74,9
1 1 1 4 56,4 2 1 1 4 63,4
1 1 2 1 66,1 2 1 2 1 72,4
1 1 2 2 72,0 2 1 2 2 72,7
1 1 2 3 67,1 2 1 2 3 63,6
1 1 2 4 55,1 2 1 2 4 57,6
1 1 3 1 63,4 2 1 3 1 67,2
1 1 3 2 65,6 2 1 3 2 62,4
1 1 3 3 61,8 2 1 3 3 64,6
1 1 3 4 61,0 2 1 3 4 62,0
1 2 1 1 76,8 2 2 1 1 78,7
1 2 1 2 72,0 2 2 1 2 74,5
1 2 1 3 67,7 2 2 1 3 67,1
1 2 1 4 61,0 2 2 1 4 64,8
1 2 2 1 76,3 2 2 2 1 76,0
1 2 2 2 69,5 2 2 2 2 79,9
1 2 2 3 66,9 2 2 2 3 73,3
1 2 2 4 59,9 2 2 2 4 58,8
1 2 3 1 76,0 2 2 3 1 65,7
1 2 3 2 72,7 2 2 3 2 67,3
1 2 3 3 71,7 2 2 3 3 60,6
1 2 3 4 61,6 2 2 3 4 58,8

On peut donc considérer, sans inconvénients majeurs, la possibilité d’écarter


de l’analyse l’une ou l’autre de ces deux modalités, ce qui peut conduire à réaliser
deux analyses de la variance du même type que ci-dessus, portant l’une sur 32 ob-
servations (en l’absence des observations relatives au troisième type de plaquettes),
et l’autre sur 36 observations (en l’absence des observations relatives au bois frais).

La première de ces deux analyses fournit des conclusions extrêmement simples.


En effet, après regroupement de certaines interactions, trois des quatre facteurs
principaux apparaissent comme significatifs, à des degrés divers, et seule l’interac-
tion essences-plaquettes est légèrement significative (tableau 11.4.4).

On peut noter aussi que, dans les différents cas, les résidus des analyses de la
variance ne présentent aucune anomalie particulière. Le principal point auquel il y
11.4.2 ANALYSE À PLUS DE TROIS CRITÈRES 379

Tableau 11.4.2. Étude des conditions de gazéification du bois de hêtre


et d’épicéa : premier tableau d’analyse de la variance.

Sources Degrés S. des carrés Carrés


de variation de liberté des écarts moyens
Gazogènes 1 18,13 18,13
Essences 1 60,52 60,52
Plaquettes 2 249,20 124,60
Humidités 3 1.187,56 395,85
Gaz.-ess. 1 37,98 37,98
Gaz.-plaq. 2 119,49 59,74
Gaz.-hum. 3 10,34 3,45
Ess.-plaq. 2 57,93 28,96
Ess.-hum. 3 22,94 7,65
Plaq.-hum. 6 132,23 22,04
Gaz.-ess.-plaq. 2 60,26 30,13
Gaz.-ess.-hum. 3 23,68 7,89
Gaz.-plaq.-hum. 6 19,73 3,29
Ess.-plaq.-hum. 6 61,61 10,27
Gaz.-ess.-plaq.-hum. 6 66,86 11,14
Totaux 47 2.128,46

Tableau 11.4.3. Étude des conditions de gazéification du bois de hêtre


et d’épicéa : deuxième tableau d’analyse de la variance.

Sources Degrés S. des carrés Carrés


F P
de variation de liberté des écarts moyens
Gazogènes 1 18,13 18,13 2,39 0,13
Essences 1 60,52 60,52 7,97 ** 0,0088
Plaquettes 2 249,20 124,60 16,4 *** 0,0000
Humidités 3 1.187,56 395,85 52,1 *** 0,0000
Gaz.-ess. 1 37,98 37,98 5,00 * 0,034
Gaz.-plaq. 2 119,49 59,74 7,86 ** 0,0020
Ess.-plaq. 2 57,93 28,96 3,81 * 0,035
Plaq.-hum. 6 132,23 22,04 2,90 * 0,026
Gaz.-ess.-plaq. 2 60,26 30,13 3,97 * 0,031
Variation résiduelle 27 205,16 7,598
Totaux 47 2.128,46

a lieu d’être attentif, en ce qui concerne les conditions d’application de l’analyse, est
la répartition complètement aléatoire des 48 essais qui ont été réalisés. L’exemple
suivant a trait à cette condition (exemple 11.4.2).
380 ANALYSE DE LA VARIANCE À TROIS ET PLUS DE TROIS CRITÈRES 11.4.2

Tableau 11.4.4. Étude des conditions de gazéification du bois de hêtre


et d’épicéa : troisième tableau d’analyse de la variance.

Sources Degrés S. des carrés Carrés


F P
de variation de liberté des écarts moyens
Gazogènes 1 93,50 93,50 12,6 ** 0,0016
Essences 1 23,63 23,63 3,20 0,086
Plaquettes 1 61,88 61,88 8,37 ** 0,0080
Humidités 3 1.183,50 394,50 53,3 *** 0,0000
Essences-plaquettes 1 51,26 51,26 6,93 * 0,015
Variation résiduelle 24 177,49 7,395
Totaux 31 1.591,26

d Pour de telles analyses de la variance, la question de savoir comment réaliser


les regroupements de manière aussi objective que possible est souvent posée. Une
solution fréquemment adoptée consiste à tester toutes les composantes de l’analyse
de la variance initiale par rapport à l’interaction d’ordre supérieur, même si les
tests ainsi réalisés n’ont aucun fondement rigoureux, et à regrouper les interactions
qui sont non significatives, à un niveau égal par exemple à 0,20 ou 0,25 , voire même
0,50 (§ 10.3.5.3◦ ).
Dans le cas du tableau 11.4.2 par exemple, il s’agirait d’effectuer tous les tests
par rapport à l’interaction ✭✭ gaz.-ess.-plaq.-hum. ✮✮, et on peut effectivement cons-
tater que toutes les interactions que nous avons regroupées sont non significatives
de cette manière, même au niveau 0,50 . On peut aussi remarquer que, sur base du
niveau de signification 0,20 , l’interaction ✭✭ plaq.-hum. ✮✮ aurait également pu être
intégrée à la variation résiduelle. Il en aurait résulté une augmentation de cette
dernière, dont le carré moyen aurait alors été égal à 10,22 , au lieu de 7,598 , et
en conséquence, une moindre signification de toutes les composantes, ainsi qu’une
plus grande simplicité d’interprétation.
Cet exemple met ainsi en évidence le caractère malgré tout assez subjectif de
b telles procédures de regroupement.

Exemple 11.4.2. Étude des conditions de gazéification du bois de hêtre et d’épi-


céa : importance de la randomisation.
Dans des situations semblables à celle de l’exemple précédent, ou de l’exemple
11.2.1 (étude de la résistance de panneaux de particules à l’arrachage des clous), la
répartition complètement au hasard ou randomisation 12 de l’ensemble des mani-
pulations peut s’avérer très difficile à réaliser, voire même être quasi insurmontable
en pratique. Dans de telles situations, une répartition complètement aléatoire im-
plique en effet des contraintes telles que passer à tout moment d’un type de ga-
12 En anglais : randomization.
11.4.2 ANALYSE À PLUS DE TROIS CRITÈRES 381

zogène à l’autre (exemple précédent) ou modifier à tout moment des réglages de


vitesse (exemple 11.2.1).
Certains dispositifs expérimentaux particuliers, dont les dispositifs avec parcel-
les divisées [Dagnelie, 2003], permettent de faire face, au moins dans une certaine
mesure, à ces difficultés. Mais, pour des raisons de facilité, certains expérimenta-
teurs peuvent être tentés de réaliser l’ensemble des manipulations dans un ordre
systématique, tout en effectuant l’analyse des résultats comme si la succession des
manipulations avait été déterminée de manière complètement aléatoire. Nous vou-
drions illustrer les conséquences possibles d’une telle attitude, à l’aide des données
de l’exemple précédent.
Dans ce but, nous supposerons que les 48 observations présentées dans le ta-
bleau 11.4.1 ont été obtenues, non pas de façon complètement aléatoire, mais dans
l’ordre selon lequel elles figurent dans ce tableau, ce qui revient à dire que tout ce
qui concerne le premier type de gazogène a été réalisé avant tout ce qui concerne
le deuxième type de gazogène, que pour chacun de ces deux types d’appareil, tout
ce qui concerne la première essence a été réalisé avant tout ce qui concerne la
deuxième essence, etc. Nous supposerons en outre qu’en raison de facteurs qui
ne sont pas maı̂trisés (évolution des caractéristiques des matériaux utilisés ou des
réglages de certains appareils de mesure, par exemple), les résultats subissent dans
le temps une très légère évolution systématique, positive ou négative, qu’on peut
qualifier de gradient ou de dérive.
Plus concrètement, nous supposerons que la dérive a été linéaire et égale à 1 %
sur l’ensemble de l’expérience, la première observation restant égale à 74,4 % et
la dernière observation devenant 59,8 %, au lieu de 58,8 %. De façon tout à fait
arbitraire, la deuxième observation deviendrait ainsi 71,3213 , au lieu de 71,3 , la
trosième observation 69,6426 , au lieu de 69,6 , etc., la dérive étant égale à 0,0213
d’une ligne à l’autre du tableau 11.4.1. On notera qu’une telle dérive est très faible,
par comparaison avec l’amplitude des valeurs observées, qui vont de 55,1 à 80,5 %.
Le tableau 11.4.5 indique ce que deviendrait dans ces conditions le contenu
du tableau 11.4.3. On remarquera tout d’abord, et on pourrait démontrer, que la
dérive envisagée, c’est-à-dire une dérive linéaire, ne modifie pas les termes d’inter-
action, ce qui justifie d’ailleurs le fait de procéder ici aux mêmes regroupements que
pour les données initiales. Mais on peut remarquer aussi que la dérive considérée
conduit à une modification des résultats de l’analyse de la variance pour l’ensemble
des quatre facteurs principaux, les changements étant surtout importants pour le
premier facteur.
Il s’agit, pour ce facteur, d’un quasi-doublement de la somme des carrés des
écarts, du carré moyen et de la valeur Fobs , la probabilité P étant réduite dans un
rapport de l’ordre de 3,5 à 1 . Ce facteur, initialement non significatif (P = 0,13),
deviendrait ainsi significatif (P = 0,038).
Une dérive deux fois plus importante conduirait aussi aux résultats suivants,
pour la première ligne du tableau :
60,77, 60,77, 8,00 et 0,0087,
382 ANALYSE DE LA VARIANCE À TROIS ET PLUS DE TROIS CRITÈRES 11.4.3

Tableau 11.4.5. Étude des conditions de gazéification du bois de hêtre


et d’épicéa : tableau d’analyse de la variance avec dérive linéaire.

Sources Degrés S. des carrés Carrés


F P
de variation de liberté des écarts moyens
Gazogènes 1 36,32 36,32 4,78 * 0,038
Essences 1 75,07 75,07 9,88 ** 0,0040
Plaquettes 2 234,24 117,12 15,4 *** 0,0000
Humidités 3 1.176,84 392,28 51,6 *** 0,0000
Gaz.-ess. 1 37,98 37,98 5,00 * 0,034
Gaz.-plaq. 2 119,49 59,74 7,86 ** 0,0020
Ess.-plaq. 2 57,92 28,96 3,81 * 0,035
Plaq.-hum. 6 132,23 22,04 2,90 * 0,026
Gaz.-ess.-plaq. 2 60,26 30,13 3,97 * 0,031
Variation résiduelle 27 205,16 7,598
Totaux 47 2.135,51

au lieu de :
36,32 , 36,32 , 4,78 et 0,038 ,

le facteur gazogènes apparaissant alors comme hautement significatif. Et d’autres


résultats pourraient être obtenus en considérant que les 48 observations ont été
réalisées selon d’autres ordres systématiques, ou encore en considérant une dérive
négative au lieu d’une dérive positive [Dagnelie, 2000]. On constate ainsi qu’une
dérive même peu importante peut influencer de façon très sensible les résultats de
l’analyse de la variance.

11.4.3 Les modèles hiérarchisés à effectifs égaux


1◦ Les problèmes posés par les modèles complètement hiérarchisés à effectifs
égaux sont dans l’ensemble extrêmement simples, même pour un nombre quel-
conque de critères de classification.
En effet, pour h critères, le modèle observé, l’équation d’analyse de la varian-
ce et les modèles théoriques comportent toujours h + 1 termes seulement. Ces
différents termes sont relatifs aux h facteurs principaux, subordonnés les uns aux
autres de proche en proche, et à la variation résiduelle.
D’autre part, si on suppose comme précédemment que seul le premier critère de
classification peut être fixe ou aléatoire (§ 11.3.2.2◦ ), tous les critères subordonnés
étant aléatoires, deux modèles seulement doivent être considérés. L’un est mixte
et l’autre aléatoire.
Enfin, pour ces deux modèles, les espérances mathématiques des carrés moyens
font toujours intervenir, pour chacun des facteurs, la composante relative au fac-
11.4.3 ANALYSE À PLUS DE TROIS CRITÈRES 383

teur considéré et toutes les composantes relatives aux facteurs qui lui sont subor-
donnés (§ 11.3.2.3◦ ). Toutes les comparaisons doivent donc être réalisées, chaque
fois, par rapport à la composante de niveau immédiatement inférieur.
2◦ La situation se complique au contraire très rapidement en ce qui concerne
les modèles partiellement hiérarchisés. Pour quatre critères de classification par
exemple, Harter et Lum [1955] dénombrent déjà 49 modèles différents.
Comme pour trois critères, des schémas semblables à ceux de la figure 11.3.1
peuvent être fort utiles, en vue d’identifier les termes qui doivent figurer dans
les différents modèles observés et théoriques et dans les équations d’analyse de la
variance correspondantes.
Quant aux espérances mathématiques des carrés moyens, elles peuvent être ob-
tenues selon les principes évoqués au paragraphe 11.4.2.2◦ . Les tables de Harter
et Lum [1955] donnent également les résultats relatifs aux différents modèles à
quatre critères de lassification.
d 3◦ Dans le cas des modèles complètement hiérarchisés et, dans une moindre
mesure, des modèles partiellement hiérarchisés, les nombres de degrés de liberté
diffèrent considérablement d’un critère de classification à l’autre. Ainsi, pour les
modèles complètement hiérachisés dont les différents critères de classification ne
comportent chacun que deux modalités (p = q = r = . . . = 2), les nombres de
degrés de liberté sont les puissances succesives de 2 , à savoir un degré de liberté
pour le premier critère de classification, deux degrés de liberté pour le deuxième
critère, quatre degrés de liberté pour le troisième critère, etc. Il en résulte de
grandes différences de précision en ce qui concerne les estimations des composantes
de la variance.
Certains modèles particuliers, connus sous le nom de modèles échelonnés 13 ,
permettent de remédier à cette situation [Cheol Jung et al., 2008 ; Khattree
b et al., 1997 ; Ojima, 1998, 2000].

Exemple 11.4.3. Interprétation des résultats d’un ensemble d’essais d’engrais :


principes de l’analyse de la variance.
Nous considérons un ensemble d’essais d’engrais faisant tous intervenir les huit
mêmes fumures, et réalisés de façon indépendante en six lieux différents et au
cours de deux années consécutives, chaque fois en deux blocs aléatoires complets
[Van Renterghem et Dagnelie, 1963]. Nous insistons tout spécialement sur
le fait qu’il s’agit bien d’essais indépendants, non seulement d’un lieu à l’autre,
mais aussi d’une année à l’autre, les essais ayant été organisés dans six stations
de recherche et, chaque fois, dans des champs d’expériences différents d’une année
à l’autre 14 . Les observations effectuées sont des rendements par parcelle, et plus
particulièrement dans le cas présent, des rendements en coton.
13 En anglais : staggered model.
14 Si au contraire, les mêmes champs d’expériences et les mêmes parcelles avaient été observés
au cours de deux années consécutives, dans chacune des stations de recherche, le problème aurait
été un problème de mesures répétées, au sens où il en a été question au paragraphe 10.3.7.
384 ANALYSE DE LA VARIANCE À TROIS ET PLUS DE TROIS CRITÈRES 11.4.3

Dans ces conditions, les facteurs fumures, années et lieux sont croisés, puisque
les mêmes fumures sont appliquées au cours des deux années et dans les différents
lieux, et qu’en outre, les mêmes lieux sont pris en considération au cours des deux
années. Le facteur blocs, par contre, est croisé avec le facteur fumures, puisque
les mêmes fumures se retrouvent dans les différents blocs, mais il est subordonné
aux facteurs années et lieux, puisque des blocs différents (et aussi des parcelles
différentes) sont observés d’une année à l’autre et d’un lieu à l’autre. Le modèle
d’analyse de la variance est donc un modèle partiellement hiérarchisé à quatre
critères de classification, dans le cas d’échantillons d’une seule observation, en
l’occurrence une observation de rendement par parcelle (n = 1).
Ce modèle est présenté de manière schématique dans la partie gauche de la
figure 11.4.1, les différentes lettres étant les initiales des quatre critères de classi-
fication. À l’examen des intersections qui apparaissent dans cette figure, on cons-
tate que le modèle observé et le modèle théorique de l’analyse de la variance
doivent contenir les interactions fumures-années, fumures-lieux, années-lieux, et
donc fumures-années-lieux, ainsi que l’interaction fumures-blocs (dans les années
et les lieux). L’analyse de la variance correspondante est esquissée dans le tableau
11.4.6.

Figure 11.4.1. Interprétation des résultats d’un ensemble d’essais d’engrais :


représentation schématique de deux modèles d’analyse de la variance.

Si on considère en outre que le facteur fumures est fixe et que les facteurs
années, lieux et blocs (dans les années et les lieux) sont aléatoires, le modèle
d’analyse de la variance est un modèle mixte, ce que souligne aussi la première
partie de la figure 11.4.1, par la présence d’une lettre minuscule pour le premier
facteur et de lettres majuscules pour les trois autres facteurs. Par analogie avec
ce qui a été vu antérieurement (troisième partie du tableau 11.2.5), le critère de
classification fumures, auquel on s’intéresse principalement, doit être testé autant
que possible par rapport à l’interaction fumures-années ou à l’interaction fumures-
lieux, ou encore à un regroupement de l’une ou l’autre de ces deux composantes,
ou de l’ensemble de ces deux composantes et de l’interaction fumures-années-lieux.
En vue de la réalisation des calculs, le modèle peut être présenté par exemple
de la façon suivante pour le logiciel Minitab :

X = F A L F*A F*L A*L F*A*L B(A L) .


11.4.3 ANALYSE À PLUS DE TROIS CRITÈRES 385

Tableau 11.4.6. Interprétation des résultats d’un ensemble d’essais d’engrais :


schéma du tableau d’analyse de la variance.

Degrés
Sources de variation
de liberté
Fumures 7
Années 1
Lieux 5
Fumures-années 7
Fumures-lieux 35
Années-lieux 5
Fumures-années-lieux 35
Blocs (dans années et lieux) 12
Fumures-blocs (dans années et lieux) 84
Total 191

Mais le problème réel est en fait sensiblement plus complexe, si on tient compte
de ce que les huit fumures étudiées n’étaient pas indépendantes les unes des autres,
mais étaient les combinaisons de deux doses (ou de l’absence et de la présence)
d’azote, de deux doses (ou de l’absence et de la présence) de phosphore, et de deux
doses (ou de l’absence et de la présence) de potassium, c’est-à-dire un ensemble
de 23 fumures de type NPK. Dans ces conditions, l’analyse de la variance fait
intervenir six critères de classification, au lieu de quatre, toujours dans le cadre
d’un modèle partiellement hiérarchisé mixte à effectifs unitaires. Le schéma de
cette analyse est présenté dans la partie droite de la figure 11.4.1, les trois matières
fertilisantes étant désignées par des lettres minuscules, de manière à maintenir la
distinction entre les critères fixes et les critères aléatoires.
La ligne fumures du tableau 11.4.6 doit alors être subdivisée en sept compo-
santes individuelles, à savoir les trois facteurs principaux azote, phosphore et potas-
sium, et leurs quatre interactions (azote-phosphore, azote-potassium, phosphore-
potassium et azote-phosphore-potassium). Il en est de même pour chacune des
lignes fumures-années, fumures-lieux et fumures-années-lieux. On est ainsi amené
à augmenter considérablement, a priori, le nombre de composantes, mais celles-ci
ne possèdent évidemment que de très petits nombres de degrés de liberté (un degré
de liberté dans tous les cas où le facteur lieux n’intervient pas et cinq degrés de
liberté chaque fois que le facteur lieux intervient). Il s’avérera donc indispensable
d’effectuer des regroupements d’interactions, en fonction des résultats observés 15 .

15 On notera que le problème dont nous nous inspirons ici était en réalité plus complexe encore,

dans la mesure où un facteur supplémentaire magnésium était également pris en considération,
et où le dispositif expérimental était un dispositif en blocs incomplets, basé sur le principe du
✭✭ confounding ✮✮ [Dagnelie, 2003 ; Van Renterghem et Dagnelie, 1963].
386 ANALYSE DE LA VARIANCE À TROIS ET PLUS DE TROIS CRITÈRES 11.4.3

Exemple 11.4.4. Étude des qualités technologiques du bois d’épicéa : principes


de l’analyse de la variance (suite).
Un retour à l’exemple 11.3.2 permet de donner brièvement d’autres illustrations
des modèles partiellement hiérarchisés d’analyse de la variance à plus de trois
critères de classification. En effet, la présentation que nous avons adoptée dans cet
exemple, en ce qui concerne l’étude des qualités technologiques du bois d’épicéa,
était volontairement simplifiée, par rapport à la réalité.
Pour rappel, il s’agissait d’un ensemble de 45 stations, de deux arbres par
station et de quatre éprouvettes par arbre, à raison de deux éprouvettes à deux
niveaux différents (partie inférieure et partie médiane des arbres). Dans la présen-
tation de l’exemple 11.3.2, nous avons implicitement supposé, d’une part, que les
45 stations avaient été choisies de manière complètement aléatoire dans la région
considérée, et d’autre part, que les deux éprouvettes constituaient elles aussi, dans
chaque arbre et à chaque niveau, un échantillon aléatoire et simple, ces échantillons
étant indépendants les uns des autres.
En réalité, les 45 stations avaient été choisies de manière à représenter trois
classes de production des peuplements (forêts peu productives, forêts moyenne-
ment productives et forêts très productives) et trois catégories de grosseur des
arbres (arbres de moins de 90 cm de circonférence, arbres de 90 à 120 cm de
circonférence et arbres de plus de 120 cm de circonférence), chacune des neuf com-
binaisons de ces deux critères étant représentée par cinq stations, considérées à ce
stade comme choisies tout à fait au hasard.
Dans ces conditions, le modèle d’analyse de la variance serait un modèle par-
tiellement hiérarchisé mixte à cinq critères de classification, avec des échantillons
de deux observations (deux éprouvettes). Une représentation schématique de ce
modèle est donnée dans la partie gauche de la figure 11.4.2, les différents critères
étant désignés par leurs initiales, toujours minuscules pour les facteurs fixes (ni-
veaux, classes de production et catégories de grosseur des arbres) et majuscules
pour les facteurs aléatoires (stations, dans les classes de production et les catégories
de grosseur des arbres, et arbres, dans les stations).

Figure 11.4.2. Étude des qualités technologiques du bois d’épicéa :


représentation schématique de deux modèles d’analyse de la variance.
11.4.3 ANALYSE À PLUS DE TROIS CRITÈRES 387

Mais en outre, aux deux niveaux pris en considération dans chacun des arbres,
les deux éprouvettes n’avaient pas non plus été choisies de manière complètement
aléatoire et indépendamment d’un niveau à l’autre. À chaque niveau en effet, une
éprouvette avait été prélevée systématiquement dans la partie centrale du tronc et
une autre éprouvette dans la partie extérieure du tronc.
Il y a donc lieu de considérer la position des éprouvettes comme un sixième
critère de classification, mais alors sans répétitions, puisqu’on ne dispose plus que
d’une éprouvette pour chaque combinaison des différentes modalités des six fac-
teurs. Le modèle d’analyse de la variance correspondant est esquissé dans la partie
droite de la figure 11.4.2 16 .
Pour les deux cas envisagés, on peut déduire de cette figure les interactions qui
doivent apparaı̂tre dans les modèles d’analyse de la variance, ainsi que les schémas
des tableaux d’analyse de la variance. Toujours selon les mêmes conventions, re-
latives notamment au logiciel Minitab, le premier modèle par exemple peut être
présenté sous la forme :

X = N C G N*C N*G C*G N*C*G S(C G) N*S(C G)


A(S C G) N*A(S C G) .

Les deux derniers exemples, que nous n’avons fait qu’esquisser, accompagnés de
leurs notes de bas de page, illustrent la grande diversité des situations auxquelles
on peut être confronté en analyse de la variance.

16 Ici également, le problème original était en fait plus complexe encore, dans la mesure où

l’étude prenait en considération un troisième niveau (correspondant à la partie supérieure des


arbres), toujours avec prélèvement de deux éprouvettes, mais avec un positionnement des deux
éprouvettes différent de celui des autres niveaux [Dupont, 1984 ; Grayet, 1980].

Vous aimerez peut-être aussi