Analyse Statistique M2 Plan D'experiences
Analyse Statistique M2 Plan D'experiences
Analyse Statistique M2 Plan D'experiences
4-1 Moyenne
Par définition, la moyenne arithmétique d’un ensemble de valeurs est la somme de toutes les
valeurs divisées par le nombre de valeurs. Ici, la moyenne arithmétique est égale à :
n
1
Ý = ∑ Y i
n i=1
4-2 Écart-type
L’écart type est une mesure de la dispersion des valeurs par rapport à la moyenne
n
σ= √ ∑ ¿¿¿¿¿
i=1
On prend la racine carrée pour exprimer la dispersion dans la même unité que les données
d’origine et la moyenne.
4.3 Population
Supposons que nous fassions plusieurs mesures dans les mêmes conditions expérimentales.
Nous obtenons une suite de valeurs qui sont proches les unes des autres mais qui sont
légèrement différentes. Imaginons que nous poursuivions les mesures jusqu’à en obtenir une
infinité. L’ensemble de toutes ces valeurs forme une population de grandeurs aléatoires
caractérisée par :
– la valeur centrale des mesures, appelée moyenne de la population et notée µ ;
– l’écart-type de la population, noté σ population,
– la distribution.
4.3 Échantillon
D’un point de vue statistique, obtenir un échantillon de n valeurs, c’est tirer au hasard n
valeurs dans la population de toutes les valeurs possibles. Un échantillon de n valeurs est
caractérisé par :
– la valeur moyenne des mesures ; soit un échantillon de n réponses, yi ; la moyenne Ý est
calculée grâce à la relation :
:
n
1
Ý = ∑ Y i
n i=1
– l’écart-type de l’échantillon, noté σ échantillon ;
– l’histogramme des valeurs.
– La meilleure estimation de l’écart-type de la population est notée par la lettre s. Elle est
donnée par la relation :
n
s = Meilleure estimation de σ population =
√ ∑ ¿¿¿¿¿
i=1
Soit n réponses mesurées indépendamment les unes des autres. Il n’y a donc que n − 1 écarts
indépendants. On dit que la série des n écarts à la moyenne possède n − 1 degrés de liberté
(ou ddl). Le nombre de degrés de liberté est important car il intervient dans de nombreuses
formules de statistique.
4.5 Distribution
Au fur et à mesure que l’on ajoute des valeurs à un échantillon, on obtient un histogramme de
plus en plus régulier et, pour un nombre infini de valeurs, c’est-à dire pour une population, on
a une répartition qui s’appelle une distribution. Il est possible de décrire la distribution d’une
population par une relation mathématique. Par exemple, la distribution la plus souvent
rencontrée dans les plans d’expériences est la distribution normale ou distribution de Laplace-
Gauss. Cette distribution est illustrée par une courbe ayant l’aspect d’une cloche et elle est
définie par la relation :
2
(Y −μ )
1 2
2 σ population
f (Y )= e
σ population √ 2 π
- Il a été démontré que 68 % des valeurs de la population sont comprises entre moins un
écart-type et plus un écart-type autour de la moyenne de la population.
- 95 % des valeurs de la population sont comprises entre moins 2 écart-type et plus 2 écart-
type autour de la moyenne de la population.
L’objectif de l’analyse globale des résultats est de définir la qualité descriptive du modèle au
moyen d’un tableau d’analyse de la variance (tableau ANOVA). Pour ce faire, plusieurs
grandeurs doivent être préalablement définies. Soit SCT la somme des carrés totale, c’est-à-
dire la somme des carrés des écarts entre les mesures de la réponse et leur moyenne :
yi-y
n 2
SCT=
i=1 (I.4)
Cette somme peut être décomposée en deux sommes, SCM, la somme des carrés due à la
régression ou variation expliquée par le modèle et SCE, la somme des carrés des résidus ou
variation inexpliquée par le modèle :
SCM est la somme des carrés des erreurs entre les réponses estimées et la moyenne des réponses
mesurées :
yˆ i-y
n 2
SCM=
i=1 (I.6)
SCE est la somme du carré des écarts entre les réponses mesurées et estimées :
yi-yˆ i
n 2
SCE=
i=1 (I.7)
On effectue alors le test de Fisher. F cal est une valeur calculée d’une valeur F de Fisher, à (p-1)
et (n - p) degrés de liberté. On calcule le ratio :
SCM
p−1
F cal= (I.8)
SCE
n− p
Source de
ddl Variation Carré moyen Fisher
variation
yˆ -y yˆ -y / p-1
n 2 n 2
Régression p-1 i i
yˆ -y /p-1
i=1 i=1 n 2
y -y
n 2 i=1
Totale n-1 i
i=1
On n–
On note Fcrit (p–1, note
p) Flacritvaleur
(p–1, n– p) la valeur
critique au seuilcritique
α d’uneauloi
seuil α d’uneà loi
de Fisher de et
(p–1) Fisher
(n–p)à degrés
(p–1) et (n–p) degrés
de liberté avec une probabilité α si : Fcal>Fcrit (p-1 ; n-p)
Les différents paramètres du modèle peuvent aussi être analysés statistiquement. L’hypothèse
nulle (H0) est alors étudiée pour chacun des coefficients, selon laquelle ceux-ci sont nuls.
Pour ce faire, la statistique tcal qui dépend de l’estimation de l’écart type de ai, σ (ai) est alors
calculée :
ai
t cal =
σ(a i ) (I.9)
n 2
1 i=1
y i -yˆ i
σ(a i ) =
n n-p
(I.10)
Pour réaliser ce test au seuil α, il faut comparer la valeur de t de Student avec la valeur
critique d’un Student à (n–p) degrés de liberté.
On utilise une table de Student à (n–p) degré de liberté, α étant choisi, on lit dans cette table
de Student la valeur t critique (α, n–p). On rejette Ho lorsque tcal > tcrit.
Si l’hypothèse H0 est acceptée, cela veut dire que l’effet en question n’est pas, au risque de
0,05, significativement différent de «0» et donc que la variable qui lui est associée n’a pas
d’influence sur la réponse.
SCM SCE
R2 = = 1-
SCT SCT (I.11)
R² = 1, indique un ajustement parfait, par contre un R² qui vaut 0 indique l’absence de relation
entre la variable dépendante et la variable explicative. Cependant, dans le contexte de la
régression multiple, cela pose le problème de la paramétrisation du modèle. Plus l’on ajoute
de variables explicatives, plus le R2 augmente. Pour éviter ce phénomène, on calcule le
coefficient de détermination ajusté :
SCE
n-p
R ajusté = 1-
2
SCT
n-1 (I.12)
La qualité du modèle sera donc d’autant meilleure que R2ajusté sera proche de 1.
[ ]
I 3= 0 1 0
0 0 1
I3 est une matrice identité d’ordre 3
Soit A une matrice carrée d’ordre n. On dit que la matrice A est inversible s’il existe une matrice
carrée B d’ordre n telle que : A × B = In.
Remarque: Si on admet sous les hypothèses précédentes que A × B = B × A = In.
3 2 6 3 7 3
[ ]
A= 7 8 9
3 2 6 [ ]
AT = 2 8 2
6 9 6