Cour 02 Statistique A Deux Variables Converti
Cour 02 Statistique A Deux Variables Converti
Cour 02 Statistique A Deux Variables Converti
Pr : KEHAILI ABDELKADER
Définition : On appelle série statistique à deux variables (ou série statistique doubles) une
série statistique à deux caractères sont étudiés simultanément.
Exemple 01:
On a relevé, pour un modèle de voiture, la consommation en carburant (en L/100 km) pour
différentes vitesse (en km/h) sur le cinquième rapport :
1
Point moyen
Définition : le Point moyen d’un nuage de points 𝐺 de coordonnées (𝑥̅ , 𝑦̅)o𝑢̀ :
Elle est utilisée pour le calcul de l’écart type : 𝜎(𝑥) = √𝑽(𝒙) , 𝜎(𝑦) = √𝑽(𝒚) .
2
Exemple : Calculer dans l’exemple 01 𝒄𝒐𝒗(𝒙, 𝒚), 𝒄𝒐𝒗(𝒙, 𝒙), 𝒄𝒐𝒗(𝒚, 𝒚), 𝜎(𝑥), 𝜎(𝑦).
On a
Somme
𝑥𝑖 60 70 90 110 130 150
𝑦𝑖 3 3.1 3.7 4.7 6 9
𝑥𝑖 𝑦𝑖 180 217 333 517 780 1350 3377
𝑥𝑖 𝟐 3600 4900 8100 12100 16900 22500 68100
𝑦𝑖 𝟐 9 9.61 13.69 22.09 36 81 171.39
𝟏 𝟔𝟖𝟏𝟎𝟎
𝑽(𝒙) = (𝑵 ∑𝒏𝒊=𝟏 𝑥𝑖 𝟐 ) − 𝑥̅ 2 = − (𝟏𝟎𝟏. 𝟔𝟔)𝟐 = 𝟏𝟎𝟏𝟓. 𝟐𝟒𝟒𝟒.
𝟔
𝟏 𝟏𝟕𝟏.𝟑𝟗
𝑽(𝒚) = (𝑵 ∑𝒏𝒊=𝟏 𝑦𝑖 𝟐 ) − 𝑦̅ 2 = − (𝟒. 𝟗𝟏)𝟐 = 𝟒. 𝟒𝟓𝟔𝟗.
𝟔
Théorème : Lors d’un ajustement affine par la méthode des moindres carrés.
𝒄𝒐𝒗(𝒙, 𝒚)
𝑎=
𝑽(𝒙)
Passe par le point moyen du nuage 𝐺(𝑥̅ , 𝑦̅) c’est-à-dire vérifié 𝑌̅ = 𝑎𝑋̅ + 𝑏 , donc 𝑏=
𝑌̅ − 𝑎𝑋̅.
𝒄𝒐𝒗(𝒙, 𝒚)
𝑎′ =
𝑽(𝒚)
Passe par le point moyen du nuage 𝐺(𝑥̅ , 𝑦̅) c’est-à-dire vérifié 𝑋̅ = 𝑎′ 𝑌̅ + 𝑏 ′ , donc 𝑏′ =
𝑋̅ − 𝑎′ 𝑌̅.
On a
𝑥̅ = 𝟏𝟎𝟏. 𝟔𝟔, 𝑦̅ = 𝟒. 𝟗𝟏, 𝒄𝒐𝒗(𝒙, 𝒚) = 63.68, 𝑽(𝒙) = 𝟏𝟎𝟏𝟓. 𝟐𝟒𝟒𝟒, 𝑽(𝒚) = 𝟒. 𝟒𝟓𝟔𝟗.
3
1. 𝐷(𝑌⁄𝑋) 𝑌 = 𝑎𝑋 + 𝑏
𝒄𝒐𝒗(𝒙,𝒚)
𝑎= = 0.0627, 𝑏 = 𝑌̅ − 𝑎𝑋̅ = −1.46 .
𝑽(𝒙)
2. 𝐷(𝑋⁄𝑌) 𝑋 = 𝑎′ 𝑌 + 𝑏 ′
𝒄𝒐𝒗(𝒙,𝒚)
𝑎′ = = 14.287, 𝑏 ′ = 𝑋̅ − 𝑎′ 𝑌̅ = 31.51
𝑽(𝒚)
𝒄𝒐𝒗(𝒙, 𝒚) 𝒄𝒐𝒗(𝒙, 𝒚)
𝒓= =
√𝑽(𝒙)√𝑽(𝒚) 𝜎(𝑥)𝜎(𝒚)
Remarque :
1. −1 ≤ 𝑟 ≤ 1.
2. Si r = 1 ou r = −1 alors il ya une corrélation positive ou négative parfaite entre X et Y
et les points (xi , yi ) sont tous sur la droite de régression.
Une corrélation positive c’est-à-dire une augmentation de X entraîne une augmentation
de Y.
Une corrélation négative c’est-à-dire une augmentation de X entraîne une diminution de
Y ou le contraire.
3. Si r = 0 alors il n’ya pas de corrélation entre X et Y et les points (xi , yi ) sont dispersés
au hasard.
4. Si 0 < 𝑟 < 1 alors il y a une corrélation positive faible, moyenne ou forte entre X et Y.
5. Si −1 < 𝑟 < 0 alors il y a une corrélation négative faible, moyenne ou forte entre X et
Y.
Donc
𝒄𝒐𝒗(𝒙,𝒚)
𝒓 = 𝜎(𝑥)𝜎(𝒚) =0.947
4
Coefficient de détermination
Définition : le Coefficient de détermination d’une série statistique à deux variables 𝑥 et 𝑦
est le nombre 𝑹𝟐 défini par :
∑𝑛𝑖=1(ŷ𝑖 − ̅
Y) 2
𝑅2 =
∑𝑛𝑖=1(yi − Y̅) 2
Somme
xi 60 70 90 110 130 150
yi 3 3.1 3.7 4.7 6 9
(yi − ̅ Y)2 3.65 3.27 1.46 0.044 1.188 16.72 26.332
ŷi = axi + b 2.3 2.92 4.18 5.43 6.69 7.94
(ŷi − Y̅) 2 6.8 3.92 0.53 0.28 3.17 9.21 23.92
∑𝑛𝑖=1(ŷ𝑖 − ̅
Y)2 23.92
𝑅2 = = = 0.9.
𝑛
∑𝑖=1(yi − Y ̅) 2 26.332
X 2 4 8 10 24 40 52
y 6 11 15 20 39 62 85
Corrigé type
1. Le nuage des points
5
Nuage de points
90
80
70
60
50
40
30
20
10
0
0 10 20 30 40 50 60
Somme
𝑥𝑖 2 4 8 10 24 40 52 140
𝑦𝑖 6 11 15 20 39 62 85 238
𝑥𝑖 𝑦𝑖 12 44 120 200 936 2480 4420 8212
𝑥𝑖 𝟐 4 16 64 100 576 1600 2704 5064
𝑦𝑖 𝟐 36 121 225 400 1521 3844 7225 13372
On a
140 𝟐𝟑𝟖
𝑥̅ = = 𝟐𝟎 𝑦̅ = = 𝟑𝟒.
𝟕 𝟕
𝟏 8212
𝒄𝒐𝒗(𝒙, 𝒚) = (𝑵 ∑𝒏𝒊=𝟏 𝑥𝑖 𝑦𝑖 ) − 𝑥̅ 𝑦̅ = − 680 = 493.14.
7
𝟏 𝟓𝟎𝟔𝟒
𝑽(𝒙) = (𝑵 ∑𝒏𝒊=𝟏 𝑥𝑖 𝟐 ) − 𝑥̅ 2 = − (𝟐𝟎)𝟐 = 𝟑𝟐𝟑. 𝟒𝟑.
𝟕
𝟏 𝟏𝟑𝟑𝟕𝟐
𝑽(𝒚) = (𝑵 ∑𝒏𝒊=𝟏 𝑦𝑖 𝟐 ) − 𝑦̅ 2 = − (𝟑𝟒)𝟐 = 𝟕𝟓𝟒. 𝟐𝟖.
𝟕
6
𝐷(𝑌⁄𝑋) 𝑌 = 𝑎𝑋 + 𝑏
𝒄𝒐𝒗(𝒙,𝒚)
𝑎= = 1.52, 𝑏 = 𝑌̅ − 𝑎𝑋̅ = 3.6 .
𝑽(𝒙)
Somme
𝑥𝑖 2 4 8 10 24 40 52 140
𝑦𝑖 6 11 15 20 39 62 85 238
(yi − Y ̅) 2 784 529 361 196 25 784 2601
ŷi = axi + b 6.64 9.68 15.76 18.8 40.08 64.4 82.64
(ŷi − ̅Y) 2 748.57 591.46 332.69 231.04 36.96 924.16 2365.84
𝑌 = 1.52 𝑋 + 3.6