Analyse Statistique M2 Plan D'experiences

Télécharger au format docx, pdf ou txt
Télécharger au format docx, pdf ou txt
Vous êtes sur la page 1sur 6

FGMGP COURS PLAN D’EXPERIENCES 2020/2021

4 Notions de statistique appliquées aux plans d’expériences

4-1 Moyenne

Par définition, la moyenne arithmétique d’un ensemble de valeurs est la somme de toutes les
valeurs divisées par le nombre de valeurs. Ici, la moyenne arithmétique est égale à :

n
1
Ý = ∑ Y i
n i=1

4-2 Écart-type
L’écart type est une mesure de la dispersion des valeurs par rapport à la moyenne

n
σ= √ ∑ ¿¿¿¿¿
i=1
On prend la racine carrée pour exprimer la dispersion dans la même unité que les données
d’origine et la moyenne.

4.3 Population

Supposons que nous fassions plusieurs mesures dans les mêmes conditions expérimentales.
Nous obtenons une suite de valeurs qui sont proches les unes des autres mais qui sont
légèrement différentes. Imaginons que nous poursuivions les mesures jusqu’à en obtenir une
infinité. L’ensemble de toutes ces valeurs forme une population de grandeurs aléatoires
caractérisée par :
– la valeur centrale des mesures, appelée moyenne de la population et notée µ ;
– l’écart-type de la population, noté σ population,
– la distribution.

4.3 Échantillon
D’un point de vue statistique, obtenir un échantillon de n valeurs, c’est tirer au hasard n
valeurs dans la population de toutes les valeurs possibles. Un échantillon de n valeurs est
caractérisé par :
– la valeur moyenne des mesures ; soit un échantillon de n réponses, yi ; la moyenne Ý est
calculée grâce à la relation :
:
n
1
Ý = ∑ Y i
n i=1
– l’écart-type de l’échantillon, noté σ échantillon ;
– l’histogramme des valeurs.

Mme N.AZOUAOU Page 18


FGMGP COURS PLAN D’EXPERIENCES 2020/2021

Un histogramme est une représentation graphique de l’ensemble de toutes les valeurs de


l’échantillon. En abscisse on porte les limites de classe et en ordonnée le pourcentage qu’on
attribue à la classe dans l’échantillon.

– La meilleure estimation de la moyenne de la population, c’est la moyenne de l’échantillon :


Meilleure estimation de µ =Ý de l’échantillon.

– La meilleure estimation de l’écart-type de la population est notée par la lettre s. Elle est
donnée par la relation :
n
s = Meilleure estimation de σ population =
√ ∑ ¿¿¿¿¿
i=1

4.4 Degrés de liberté

Soit n réponses mesurées indépendamment les unes des autres. Il n’y a donc que n − 1 écarts
indépendants. On dit que la série des n écarts à la moyenne possède n − 1 degrés de liberté
(ou ddl). Le nombre de degrés de liberté est important car il intervient dans de nombreuses
formules de statistique.

4.5 Distribution

Au fur et à mesure que l’on ajoute des valeurs à un échantillon, on obtient un histogramme de
plus en plus régulier et, pour un nombre infini de valeurs, c’est-à dire pour une population, on
a une répartition qui s’appelle une distribution. Il est possible de décrire la distribution d’une
population par une relation mathématique. Par exemple, la distribution la plus souvent
rencontrée dans les plans d’expériences est la distribution normale ou distribution de Laplace-
Gauss. Cette distribution est illustrée par une courbe ayant l’aspect d’une cloche et elle est
définie par la relation :
2
(Y −μ )
1 2
2 σ population
f (Y )= e
σ population √ 2 π

- Il a été démontré que 68 % des valeurs de la population sont comprises entre moins un
écart-type et plus un écart-type autour de la moyenne de la population.

- 95 % des valeurs de la population sont comprises entre moins 2 écart-type et plus 2 écart-
type autour de la moyenne de la population.

- Enfin dans l’intervalle µ ± 3σ population, il y a 99,7 % des valeurs de la population.

2. Analyse statistique des résultats

Mme N.AZOUAOU Page 19


FGMGP COURS PLAN D’EXPERIENCES 2020/2021

2.1. Test de Fisher

L’objectif de l’analyse globale des résultats est de définir la qualité descriptive du modèle au
moyen d’un tableau d’analyse de la variance (tableau ANOVA). Pour ce faire, plusieurs
grandeurs doivent être préalablement définies. Soit SCT la somme des carrés totale, c’est-à-
dire la somme des carrés des écarts entre les mesures de la réponse et leur moyenne :

 yi-y 
n 2
SCT= 
i=1 (I.4)

Cette somme peut être décomposée en deux sommes, SCM, la somme des carrés due à la
régression ou variation expliquée par le modèle et SCE, la somme des carrés des résidus ou
variation inexpliquée par le modèle :

SCT  SCE  SCM (I.5)

SCM est la somme des carrés des erreurs entre les réponses estimées et la moyenne des réponses
mesurées :

 yˆ i-y 
n 2
SCM= 
i=1 (I.6)

SCE est la somme du carré des écarts entre les réponses mesurées et estimées :

  yi-yˆ i 
n 2
SCE=
i=1 (I.7)

On effectue alors le test de Fisher. F cal est une valeur calculée d’une valeur F de Fisher, à (p-1)
et (n - p) degrés de liberté. On calcule le ratio :

SCM
p−1
F cal= (I.8)
SCE
n− p

En pratique, le modèle utilisé contient un terme constant a o, correspondant à la moyenne des


réponses mesurées. Cette composante n’étant d’aucun intérêt dans l’analyse de la variance,
elle est supprimée et donc on prend (p-1) degré de liberté pour le modèle de régression.

Pour réunir ces informations, on utilise le tableau de la variance suivant :

Mme N.AZOUAOU Page 20


FGMGP COURS PLAN D’EXPERIENCES 2020/2021

Tableau I.1. Analyse de la variance (ANOVA).

Source de
ddl Variation Carré moyen Fisher
variation

  yˆ -y    yˆ -y  / p-1
n 2 n 2
Régression p-1 i i

  yˆ -y  /p-1
i=1 i=1 n 2

  y -yˆ i    y -yˆ i  /n-p


n 2 n 2 i
i=1
Résiduelle n-p
  y -yˆ i  /n-p
i i n 2
i=1 i=1
i

  y -y 
n 2 i=1

Totale n-1 i
i=1

On n–
On note Fcrit (p–1, note
p) Flacritvaleur
(p–1, n– p) la valeur
critique au seuilcritique
α d’uneauloi
seuil α d’uneà loi
de Fisher de et
(p–1) Fisher
(n–p)à degrés
(p–1) et (n–p) degrés
de liberté avec une probabilité α si : Fcal>Fcrit (p-1 ; n-p)

2.1. Analyse statistique des coefficients (Test de Student)

Les différents paramètres du modèle peuvent aussi être analysés statistiquement. L’hypothèse
nulle (H0) est alors étudiée pour chacun des coefficients, selon laquelle ceux-ci sont nuls.
Pour ce faire, la statistique tcal qui dépend de l’estimation de l’écart type de ai, σ (ai) est alors
calculée :

ai
t cal =
σ(a i ) (I.9)

σ (a i )  : Ecart type des coefficients

 n 2 
 
1 i=1
 y i -yˆ i  
σ(a i ) =  
n n-p 
 
  (I.10)

Pour réaliser ce test au seuil α, il faut comparer la valeur de t de Student avec la valeur
critique d’un Student à (n–p) degrés de liberté.

On utilise une table de Student à (n–p) degré de liberté, α étant choisi, on lit dans cette table
de Student la valeur t critique (α, n–p). On rejette Ho lorsque tcal > tcrit.

Mme N.AZOUAOU Page 21


FGMGP COURS PLAN D’EXPERIENCES 2020/2021

Si l’hypothèse H0 est acceptée, cela veut dire que l’effet en question n’est pas, au risque de
0,05, significativement différent de «0» et donc que la variable qui lui est associée n’a pas
d’influence sur la réponse.

2.1. Coefficient de détermination (R²)

Le coefficient de détermination R² est à la fois la fraction des variations de la réponse


expliquée par le modèle et un indice de la qualité de la régression :

SCM SCE
R2 = = 1-
SCT SCT (I.11)

R² = 1, indique un ajustement parfait, par contre un R² qui vaut 0 indique l’absence de relation
entre la variable dépendante et la variable explicative. Cependant, dans le contexte de la
régression multiple, cela pose le problème de la paramétrisation du modèle. Plus l’on ajoute
de variables explicatives, plus le R2 augmente. Pour éviter ce phénomène, on calcule le
coefficient de détermination ajusté :

SCE
n-p
R ajusté = 1-
2

SCT
n-1 (I.12)

La qualité du modèle sera donc d’autant meilleure que R2ajusté sera proche de 1.

Mme N.AZOUAOU Page 22


FGMGP COURS PLAN D’EXPERIENCES 2020/2021

Rappels sur les matrices

1.4. Matrice identité


On appelle matrice identité d’ordre n, la matrice carrée dont les éléments de la diagonale sont
égaux à 1 et tous les autres sont égaux à 0. on la note In.
1 0 0

[ ]
I 3= 0 1 0
0 0 1
I3 est une matrice identité d’ordre 3

2.6. Matrices inversibles

Soit A une matrice carrée d’ordre n. On dit que la matrice A est inversible s’il existe une matrice
carrée B d’ordre n telle que : A × B = In.
Remarque: Si on admet sous les hypothèses précédentes que A × B = B × A = In.

1.5. Transposée d’une matrice


Soit M une matrice m×n. La transposée de la matrice M est la matrice n×m notée MT dont les
lignes sont les colonnes de M et les colonnes sont les lignes de M.

3 2 6 3 7 3

[ ]
A= 7 8 9
3 2 6 [ ]
AT = 2 8 2
6 9 6

AT est la transposée de la matrice A.

Mme N.AZOUAOU Page 23

Vous aimerez peut-être aussi