Analyse Statistique M2 Plan D'experiences

FGMGP COURS PLAN D’EXPERIENCES 2020/2021
4 Notions de statistique appliquées aux plans d’expériences
4-1 Moyenne
Par définition, la moyenne arithmétique d’un ensemble de valeurs est la somme de toutes les
valeurs divisées par le nombre de valeurs. Ici, la moyenne arithmétique est égale à :
n
1
Ý = ∑ Y i
n i=1
4-2 Écart-type
L’écart type est une mesure de la dispersion des valeurs par rapport à la moyenne
n
σ= √ ∑ ¿¿¿¿¿
i=1
On prend la racine carrée pour exprimer la dispersion dans la même unité que les données
d’origine et la moyenne.
4.3 Population
Supposons que nous fassions plusieurs mesures dans les mêmes conditions expérimentales.
Nous obtenons une suite de valeurs qui sont proches les unes des autres mais qui sont
légèrement différentes. Imaginons que nous poursuivions les mesures jusqu’à en obtenir une
infinité. L’ensemble de toutes ces valeurs forme une population de grandeurs aléatoires
caractérisée par :
– la valeur centrale des mesures, appelée moyenne de la population et notée µ ;
– l’écart-type de la population, noté σ population,
– la distribution.
4.3 Échantillon
D’un point de vue statistique, obtenir un échantillon de n valeurs, c’est tirer au hasard n
valeurs dans la population de toutes les valeurs possibles. Un échantillon de n valeurs est
caractérisé par :
– la valeur moyenne des mesures ; soit un échantillon de n réponses, yi ; la moyenne Ý est
calculée grâce à la relation :
:
n
1
Ý = ∑ Y i
n i=1
– l’écart-type de l’échantillon, noté σ échantillon ;
– l’histogramme des valeurs.
Mme N.AZOUAOU Page 18

Un histogramme est une représentation graphique de l’ensemble de toutes les valeurs de

l’échantillon. En abscisse on porte les limites de classe et en ordonnée le pourcentage qu’on
attribue à la classe dans l’échantillon.
– La meilleure estimation de la moyenne de la population, c’est la moyenne de l’échantillon :

Meilleure estimation de µ =Ý de l’échantillon.
– La meilleure estimation de l’écart-type de la population est notée par la lettre s. Elle est
donnée par la relation :
n
s = Meilleure estimation de σ population =
√ ∑ ¿¿¿¿¿
i=1
4.4 Degrés de liberté
Soit n réponses mesurées indépendamment les unes des autres. Il n’y a donc que n − 1 écarts
indépendants. On dit que la série des n écarts à la moyenne possède n − 1 degrés de liberté
(ou ddl). Le nombre de degrés de liberté est important car il intervient dans de nombreuses
formules de statistique.
4.5 Distribution
Au fur et à mesure que l’on ajoute des valeurs à un échantillon, on obtient un histogramme de
plus en plus régulier et, pour un nombre infini de valeurs, c’est-à dire pour une population, on
a une répartition qui s’appelle une distribution. Il est possible de décrire la distribution d’une
population par une relation mathématique. Par exemple, la distribution la plus souvent
rencontrée dans les plans d’expériences est la distribution normale ou distribution de Laplace-
Gauss. Cette distribution est illustrée par une courbe ayant l’aspect d’une cloche et elle est
définie par la relation :
2
(Y −μ )
1 2
2 σ population
f (Y )= e
σ population √ 2 π
- Il a été démontré que 68 % des valeurs de la population sont comprises entre moins un
écart-type et plus un écart-type autour de la moyenne de la population.
- 95 % des valeurs de la population sont comprises entre moins 2 écart-type et plus 2 écart-
type autour de la moyenne de la population.
- Enfin dans l’intervalle µ ± 3σ population, il y a 99,7 % des valeurs de la population.
2. Analyse statistique des résultats

2.1. Test de Fisher
L’objectif de l’analyse globale des résultats est de définir la qualité descriptive du modèle au
moyen d’un tableau d’analyse de la variance (tableau ANOVA). Pour ce faire, plusieurs
grandeurs doivent être préalablement définies. Soit SCT la somme des carrés totale, c’est-à-
dire la somme des carrés des écarts entre les mesures de la réponse et leur moyenne :
 yi-y 
n 2
SCT= 
i=1 (I.4)
Cette somme peut être décomposée en deux sommes, SCM, la somme des carrés due à la
régression ou variation expliquée par le modèle et SCE, la somme des carrés des résidus ou
variation inexpliquée par le modèle :
SCT  SCE  SCM (I.5)
SCM est la somme des carrés des erreurs entre les réponses estimées et la moyenne des réponses
mesurées :
 yˆ i-y 
n 2
SCM= 
i=1 (I.6)
SCE est la somme du carré des écarts entre les réponses mesurées et estimées :
  yi-yˆ i 
n 2
SCE=
i=1 (I.7)
On effectue alors le test de Fisher. F cal est une valeur calculée d’une valeur F de Fisher, à (p-1)
et (n - p) degrés de liberté. On calcule le ratio :
SCM
p−1
F cal= (I.8)
SCE
n− p
En pratique, le modèle utilisé contient un terme constant a o, correspondant à la moyenne des

réponses mesurées. Cette composante n’étant d’aucun intérêt dans l’analyse de la variance,
elle est supprimée et donc on prend (p-1) degré de liberté pour le modèle de régression.
Pour réunir ces informations, on utilise le tableau de la variance suivant :

Tableau I.1. Analyse de la variance (ANOVA).
Source de
ddl Variation Carré moyen Fisher
variation
  yˆ -y    yˆ -y  / p-1
n 2 n 2
Régression p-1 i i
  yˆ -y  /p-1
i=1 i=1 n 2
  y -yˆ i    y -yˆ i  /n-p

n 2 n 2 i
i=1
Résiduelle n-p
  y -yˆ i  /n-p
i i n 2
i=1 i=1
i
  y -y 
n 2 i=1
Totale n-1 i
i=1
On n–
On note Fcrit (p–1, note
p) Flacritvaleur
(p–1, n– p) la valeur
critique au seuilcritique
α d’uneauloi
seuil α d’uneà loi
de Fisher de et
(p–1) Fisher
(n–p)à degrés
(p–1) et (n–p) degrés
de liberté avec une probabilité α si : Fcal>Fcrit (p-1 ; n-p)
2.1. Analyse statistique des coefficients (Test de Student)
Les différents paramètres du modèle peuvent aussi être analysés statistiquement. L’hypothèse
nulle (H0) est alors étudiée pour chacun des coefficients, selon laquelle ceux-ci sont nuls.
Pour ce faire, la statistique tcal qui dépend de l’estimation de l’écart type de ai, σ (ai) est alors
calculée :
ai
t cal =
σ(a i ) (I.9)
σ (a i ) : Ecart type des coefficients
 n 2 
 
1 i=1
 y i -yˆ i  
σ(a i ) =  
n n-p 
 
  (I.10)
Pour réaliser ce test au seuil α, il faut comparer la valeur de t de Student avec la valeur
critique d’un Student à (n–p) degrés de liberté.
On utilise une table de Student à (n–p) degré de liberté, α étant choisi, on lit dans cette table
de Student la valeur t critique (α, n–p). On rejette Ho lorsque tcal > tcrit.

Si l’hypothèse H0 est acceptée, cela veut dire que l’effet en question n’est pas, au risque de
0,05, significativement différent de «0» et donc que la variable qui lui est associée n’a pas
d’influence sur la réponse.
2.1. Coefficient de détermination (R²)
Le coefficient de détermination R² est à la fois la fraction des variations de la réponse

expliquée par le modèle et un indice de la qualité de la régression :
SCM SCE
R2 = = 1-
SCT SCT (I.11)
R² = 1, indique un ajustement parfait, par contre un R² qui vaut 0 indique l’absence de relation
entre la variable dépendante et la variable explicative. Cependant, dans le contexte de la
régression multiple, cela pose le problème de la paramétrisation du modèle. Plus l’on ajoute
de variables explicatives, plus le R2 augmente. Pour éviter ce phénomène, on calcule le
coefficient de détermination ajusté :
SCE
n-p
R ajusté = 1-
2
SCT
n-1 (I.12)
La qualité du modèle sera donc d’autant meilleure que R2ajusté sera proche de 1.

Rappels sur les matrices
1.4. Matrice identité

On appelle matrice identité d’ordre n, la matrice carrée dont les éléments de la diagonale sont
égaux à 1 et tous les autres sont égaux à 0. on la note In.
1 0 0
[ ]
I 3= 0 1 0
0 0 1
I3 est une matrice identité d’ordre 3
2.6. Matrices inversibles
Soit A une matrice carrée d’ordre n. On dit que la matrice A est inversible s’il existe une matrice
carrée B d’ordre n telle que : A × B = In.
Remarque: Si on admet sous les hypothèses précédentes que A × B = B × A = In.
1.5. Transposée d’une matrice

Soit M une matrice m×n. La transposée de la matrice M est la matrice n×m notée MT dont les
lignes sont les colonnes de M et les colonnes sont les lignes de M.
3 2 6 3 7 3
[ ]
A= 7 8 9
3 2 6 [ ]
AT = 2 8 2
6 9 6
AT est la transposée de la matrice A.

Analyse Statistique M2 Plan D'experiences

Transféré par

Droits d'auteur :

Formats disponibles

Analyse Statistique M2 Plan D'experiences

Transféré par

Informations du document

Description originale:

Titre original

Copyright

Formats disponibles

Partager ce document

Partager ou intégrer le document

Options de partage

Avez-vous trouvé ce document utile ?

Ce contenu est-il inapproprié ?

Droits d'auteur :

Formats disponibles

Analyse Statistique M2 Plan D'experiences

Transféré par

Droits d'auteur :

Formats disponibles

FGMGP COURS PLAN D’EXPERIENCES 2020/2021

4 Notions de statistique appliquées aux plans d’expériences

Mme N.AZOUAOU Page 18

Un histogramme est une représentation graphique de l’ensemble de toutes les valeurs de

– La meilleure estimation de la moyenne de la population, c’est la moyenne de l’échantillon :

4.4 Degrés de liberté

- Enfin dans l’intervalle µ ± 3σ population, il y a 99,7 % des valeurs de la population.

2. Analyse statistique des résultats

Mme N.AZOUAOU Page 19

2.1. Test de Fisher

SCT  SCE  SCM (I.5)

En pratique, le modèle utilisé contient un terme constant a o, correspondant à la moyenne des

Pour réunir ces informations, on utilise le tableau de la variance suivant :

Mme N.AZOUAOU Page 20

Tableau I.1. Analyse de la variance (ANOVA).

  y -yˆ i    y -yˆ i  /n-p

2.1. Analyse statistique des coefficients (Test de Student)

σ (a i ) : Ecart type des coefficients

Mme N.AZOUAOU Page 21

2.1. Coefficient de détermination (R²)

Le coefficient de détermination R² est à la fois la fraction des variations de la réponse

Mme N.AZOUAOU Page 22

Rappels sur les matrices

1.4. Matrice identité

2.6. Matrices inversibles

1.5. Transposée d’une matrice

AT est la transposée de la matrice A.

Mme N.AZOUAOU Page 23

Vous aimerez peut-être aussi