Cour 02 Statistique A Deux Variables Converti

Télécharger au format pdf ou txt
Télécharger au format pdf ou txt
Vous êtes sur la page 1sur 7

Université Hassiba BenBouali Chlef

Faculté des Sciences de la Nature et de la Vie


Département de Biotechnologie

Série statistique à deux variables


Niveau: 2ème année

Pr : KEHAILI ABDELKADER

Définition : On appelle série statistique à deux variables (ou série statistique doubles) une
série statistique à deux caractères sont étudiés simultanément.

Exemple 01:

On a relevé, pour un modèle de voiture, la consommation en carburant (en L/100 km) pour
différentes vitesse (en km/h) sur le cinquième rapport :

Vitesse 𝑥𝑖 (en km/h) 60 70 90 110 130 150


Consommation 𝑦𝑖 (en L/100 km) 3 3.1 3.7 4.7 6 9

Définition : Dans un repère orthogonal, l’ensemble des points 𝑀𝑖 de coordonnées (𝑥𝑖 , 𝑦𝑖 )


constitue le nuage de points associé à la série statistique à deux variables.

Nuage de points de la serie statistique de l'exemple 01


10
9
8
7
6
5
4
3
2
1
0
0 20 40 60 80 100 120 140 160

1
Point moyen
Définition : le Point moyen d’un nuage de points 𝐺 de coordonnées (𝑥̅ , 𝑦̅)o𝑢̀ :

𝑥̅ représente la moyenne des 𝑥𝑖 :


𝒏
𝒙𝟏 + 𝒙𝟐 + ⋯ + 𝒙𝒏 𝟏
𝑥̅ = = ∑ 𝑥𝑖
𝒏 𝑵
𝒊=𝟏

𝑦̅ représente la moyenne des 𝑦𝑖 :


𝒏
𝒚𝟏 + 𝒚𝟐 + ⋯ + 𝒚𝒏 𝟏
𝑦̅ = = ∑ 𝑦𝑖
𝑵 𝑵
𝒊=𝟏

Exemple : le Point moyen de l’exemple 01 est

𝟔𝟎 + 𝟕𝟎 + 𝟗𝟎 + 𝟏𝟏𝟎 + 𝟏𝟑𝟎 + 𝟏𝟓𝟎


𝑥̅ = = 𝟏𝟎𝟏. 𝟔𝟔
𝟔
𝟑 + 𝟑. 𝟏 + 𝟑. 𝟕 + 𝟒. 𝟕 + 𝟔 + 𝟗
𝑦̅ = = 𝟒. 𝟗𝟏
𝟔
Donc le point moyen 𝑮(𝟏𝟎𝟏. 𝟔𝟔, 𝟒. 𝟗𝟏).

Ajustement affine par la méthode des moindres carrés


Définition : On appelle covariance de 𝑥 et de 𝑦 le nombre
𝒏 𝒏
𝟏 𝟏
𝒄𝒐𝒗(𝒙, 𝒚) = ∑(𝑥𝑖 − 𝑥̅ ) (𝑦𝑖 − 𝑦̅) = ( ∑ 𝑥𝑖 𝑦𝑖 ) − 𝑥̅ 𝑦̅
𝑵 𝑵
𝒊=𝟏 𝒊=𝟏

Rappel : La variance de caractère 𝑥 est :


𝒏 𝒏
𝟏 𝟏
𝑽(𝒙) = ∑(𝑥𝑖 − 𝑥̅ )𝟐 = ( ∑ 𝑥𝑖 𝟐 ) − 𝑥̅ 2 = 𝒄𝒐𝒗(𝒙, 𝒙)
𝑵 𝑵
𝒊=𝟏 𝒊=𝟏

La variance de caractère 𝑦 est :


𝒏 𝒏
𝟏 𝟏
𝑽(𝒚) = ∑(𝑦𝑖 − 𝑦̅)𝟐 = ( ∑ 𝑦𝑖 𝟐 ) − 𝑦̅ 2 = 𝒄𝒐𝒗(𝒚, 𝒚)
𝑵 𝑵
𝒊=𝟏 𝒊=𝟏

Elle est utilisée pour le calcul de l’écart type : 𝜎(𝑥) = √𝑽(𝒙) , 𝜎(𝑦) = √𝑽(𝒚) .

2
Exemple : Calculer dans l’exemple 01 𝒄𝒐𝒗(𝒙, 𝒚), 𝒄𝒐𝒗(𝒙, 𝒙), 𝒄𝒐𝒗(𝒚, 𝒚), 𝜎(𝑥), 𝜎(𝑦).

On a

Somme
𝑥𝑖 60 70 90 110 130 150
𝑦𝑖 3 3.1 3.7 4.7 6 9
𝑥𝑖 𝑦𝑖 180 217 333 517 780 1350 3377
𝑥𝑖 𝟐 3600 4900 8100 12100 16900 22500 68100
𝑦𝑖 𝟐 9 9.61 13.69 22.09 36 81 171.39

𝑥̅ = 𝟏𝟎𝟏. 𝟔𝟔, 𝑦̅ = 𝟒. 𝟗𝟏.


𝟏 3377
𝒄𝒐𝒗(𝒙, 𝒚) = (𝑵 ∑𝒏𝒊=𝟏 𝑥𝑖 𝑦𝑖 ) − 𝑥̅ 𝑦̅ = − 499.15 = 63.68.
6

𝟏 𝟔𝟖𝟏𝟎𝟎
𝑽(𝒙) = (𝑵 ∑𝒏𝒊=𝟏 𝑥𝑖 𝟐 ) − 𝑥̅ 2 = − (𝟏𝟎𝟏. 𝟔𝟔)𝟐 = 𝟏𝟎𝟏𝟓. 𝟐𝟒𝟒𝟒.
𝟔

𝟏 𝟏𝟕𝟏.𝟑𝟗
𝑽(𝒚) = (𝑵 ∑𝒏𝒊=𝟏 𝑦𝑖 𝟐 ) − 𝑦̅ 2 = − (𝟒. 𝟗𝟏)𝟐 = 𝟒. 𝟒𝟓𝟔𝟗.
𝟔

𝜎(𝑥) = √𝑽(𝒙) = √𝟏𝟎𝟏𝟓. 𝟐𝟒𝟒𝟒 = 31.86.

𝜎(𝑦) = √𝑽(𝒚) = √𝟒. 𝟒𝟓𝟔𝟗 = 2.11.

Théorème : Lors d’un ajustement affine par la méthode des moindres carrés.

1. La droite de régression 𝐷 de 𝑌 en 𝑋 a pour équation 𝐷(𝑌⁄𝑋) 𝑌 = 𝑎𝑋 + 𝑏 o𝑢̀ :

𝒄𝒐𝒗(𝒙, 𝒚)
𝑎=
𝑽(𝒙)

Passe par le point moyen du nuage 𝐺(𝑥̅ , 𝑦̅) c’est-à-dire vérifié 𝑌̅ = 𝑎𝑋̅ + 𝑏 , donc 𝑏=
𝑌̅ − 𝑎𝑋̅.

2. La droite de régression 𝐷 de 𝑋 en 𝑌 a pour équation 𝐷(𝑋⁄𝑌) 𝑋 = 𝑎′ 𝑌 + 𝑏 ′ o𝑢̀ :

𝒄𝒐𝒗(𝒙, 𝒚)
𝑎′ =
𝑽(𝒚)

Passe par le point moyen du nuage 𝐺(𝑥̅ , 𝑦̅) c’est-à-dire vérifié 𝑋̅ = 𝑎′ 𝑌̅ + 𝑏 ′ , donc 𝑏′ =
𝑋̅ − 𝑎′ 𝑌̅.

Exemple : Calculer dans l’exemple 01 La droite de régression 𝐷 de 𝑌 en 𝑋

On a

𝑥̅ = 𝟏𝟎𝟏. 𝟔𝟔, 𝑦̅ = 𝟒. 𝟗𝟏, 𝒄𝒐𝒗(𝒙, 𝒚) = 63.68, 𝑽(𝒙) = 𝟏𝟎𝟏𝟓. 𝟐𝟒𝟒𝟒, 𝑽(𝒚) = 𝟒. 𝟒𝟓𝟔𝟗.

3
1. 𝐷(𝑌⁄𝑋) 𝑌 = 𝑎𝑋 + 𝑏
𝒄𝒐𝒗(𝒙,𝒚)
𝑎= = 0.0627, 𝑏 = 𝑌̅ − 𝑎𝑋̅ = −1.46 .
𝑽(𝒙)

Donc 𝐷(𝑌⁄𝑋) 𝑌 = 𝑎𝑋 + 𝑏 = 0.0627𝑋 − 1.46

2. 𝐷(𝑋⁄𝑌) 𝑋 = 𝑎′ 𝑌 + 𝑏 ′
𝒄𝒐𝒗(𝒙,𝒚)
𝑎′ = = 14.287, 𝑏 ′ = 𝑋̅ − 𝑎′ 𝑌̅ = 31.51
𝑽(𝒚)

Donc 𝐷(𝑋⁄𝑌) 𝑋 = 𝑎′ 𝑌 + 𝑏 ′ = 14.287𝑌 + 31.51

Coefficient de corrélation linéaire


Définition : le Coefficient de corrélation linéaire d’une série statistique à deux variables 𝑥 et
𝑦 est le nombre 𝑟 défini par :

𝒄𝒐𝒗(𝒙, 𝒚) 𝒄𝒐𝒗(𝒙, 𝒚)
𝒓= =
√𝑽(𝒙)√𝑽(𝒚) 𝜎(𝑥)𝜎(𝒚)

Remarque :
1. −1 ≤ 𝑟 ≤ 1.
2. Si r = 1 ou r = −1 alors il ya une corrélation positive ou négative parfaite entre X et Y
et les points (xi , yi ) sont tous sur la droite de régression.
Une corrélation positive c’est-à-dire une augmentation de X entraîne une augmentation
de Y.
Une corrélation négative c’est-à-dire une augmentation de X entraîne une diminution de
Y ou le contraire.
3. Si r = 0 alors il n’ya pas de corrélation entre X et Y et les points (xi , yi ) sont dispersés
au hasard.
4. Si 0 < 𝑟 < 1 alors il y a une corrélation positive faible, moyenne ou forte entre X et Y.
5. Si −1 < 𝑟 < 0 alors il y a une corrélation négative faible, moyenne ou forte entre X et
Y.

Exemple : Calculer dans l’exemple 01 le Coefficient de corrélation linéaire.

On a 𝒄𝒐𝒗(𝒙, 𝒚) = 63.68 , 𝜎(𝑥) = 31.86, 𝜎(𝑦) = 2.11.

Donc
𝒄𝒐𝒗(𝒙,𝒚)
𝒓 = 𝜎(𝑥)𝜎(𝒚) =0.947

alors il y a une corrélation positive forte entre X et Y

4
Coefficient de détermination
Définition : le Coefficient de détermination d’une série statistique à deux variables 𝑥 et 𝑦
est le nombre 𝑹𝟐 défini par :

∑𝑛𝑖=1(ŷ𝑖 − ̅
Y) 2
𝑅2 =
∑𝑛𝑖=1(yi − Y̅) 2

Tel que ŷ𝑖 = 𝑎𝑥𝑖 + 𝑏

Exemple : Calculer dans l’exemple 01 le Coefficient de détermination.

Somme
xi 60 70 90 110 130 150
yi 3 3.1 3.7 4.7 6 9
(yi − ̅ Y)2 3.65 3.27 1.46 0.044 1.188 16.72 26.332
ŷi = axi + b 2.3 2.92 4.18 5.43 6.69 7.94
(ŷi − Y̅) 2 6.8 3.92 0.53 0.28 3.17 9.21 23.92

∑𝑛𝑖=1(ŷ𝑖 − ̅
Y)2 23.92
𝑅2 = = = 0.9.
𝑛
∑𝑖=1(yi − Y ̅) 2 26.332

Exercice : Dans la série statistique suivante, X représente le nombre de jours d’exposition au


soleil d’une feuille et Y le nombre de stomates aérifères au millimètre carré:

X 2 4 8 10 24 40 52
y 6 11 15 20 39 62 85

1. Tracer le nuage des points.


2. Calculer le coefficient de corrélation linéaire entre X et Y. Conclusion?
3. Déterminer l’équation de la droite de régression de Y en fonction de X.
4. Si on expose au soleil une feuille 15 jours; quel est le nombre de stomates aérifères peut-
on prévoir ?

Corrigé type
1. Le nuage des points

5
Nuage de points
90
80
70
60
50
40
30
20
10
0
0 10 20 30 40 50 60

2. Le coefficient de corrélation linéaire entre X et Y.

Somme
𝑥𝑖 2 4 8 10 24 40 52 140
𝑦𝑖 6 11 15 20 39 62 85 238
𝑥𝑖 𝑦𝑖 12 44 120 200 936 2480 4420 8212
𝑥𝑖 𝟐 4 16 64 100 576 1600 2704 5064
𝑦𝑖 𝟐 36 121 225 400 1521 3844 7225 13372

On a
140 𝟐𝟑𝟖
𝑥̅ = = 𝟐𝟎 𝑦̅ = = 𝟑𝟒.
𝟕 𝟕

𝟏 8212
𝒄𝒐𝒗(𝒙, 𝒚) = (𝑵 ∑𝒏𝒊=𝟏 𝑥𝑖 𝑦𝑖 ) − 𝑥̅ 𝑦̅ = − 680 = 493.14.
7

𝟏 𝟓𝟎𝟔𝟒
𝑽(𝒙) = (𝑵 ∑𝒏𝒊=𝟏 𝑥𝑖 𝟐 ) − 𝑥̅ 2 = − (𝟐𝟎)𝟐 = 𝟑𝟐𝟑. 𝟒𝟑.
𝟕

𝟏 𝟏𝟑𝟑𝟕𝟐
𝑽(𝒚) = (𝑵 ∑𝒏𝒊=𝟏 𝑦𝑖 𝟐 ) − 𝑦̅ 2 = − (𝟑𝟒)𝟐 = 𝟕𝟓𝟒. 𝟐𝟖.
𝟕

𝜎(𝑥) = √𝑽(𝒙) = √𝟑𝟐𝟑. 𝟒𝟑 = 17.98.

𝜎(𝑦) = √𝑽(𝒚) = √𝟕𝟓𝟒. 𝟐𝟖 = 27.46.

Donc le coefficient de corrélation linéaire entre X et Y.


𝒄𝒐𝒗(𝒙,𝒚)
𝒓 = 𝜎(𝑥)𝜎(𝒚) =0.99

alors il y a une corrélation positive forte entre X et Y

3. L’équation de la droite de régression de Y en fonction de X.

6
𝐷(𝑌⁄𝑋) 𝑌 = 𝑎𝑋 + 𝑏
𝒄𝒐𝒗(𝒙,𝒚)
𝑎= = 1.52, 𝑏 = 𝑌̅ − 𝑎𝑋̅ = 3.6 .
𝑽(𝒙)

Alors 𝐷(𝑌⁄𝑋) 𝑌 = 1.52 𝑋 + 3.6

4. le nombre de stomates aérifères


On a 𝑌 = 1.52 𝑋 + 3.6 = 1.52 × 15 + 3.6 = 26.4

Somme
𝑥𝑖 2 4 8 10 24 40 52 140
𝑦𝑖 6 11 15 20 39 62 85 238
(yi − Y ̅) 2 784 529 361 196 25 784 2601
ŷi = axi + b 6.64 9.68 15.76 18.8 40.08 64.4 82.64
(ŷi − ̅Y) 2 748.57 591.46 332.69 231.04 36.96 924.16 2365.84

𝑌 = 1.52 𝑋 + 3.6

Vous aimerez peut-être aussi