Exercices Supplementaires Tests Regression
Exercices Supplementaires Tests Regression
Exercices Supplementaires Tests Regression
Exercice n° 1 :
Dans un certain type d'éprouvette métallique, la contrainte normale sur une éprouvette
est connue pour être fonctionnellement liée à la résistance au cisaillement. Voici un ensemble
de données expérimentales codées sur les deux variables :
Contrainte, x cisaillement, y Contrainte, x cisaillement, y
26.8 26.5 24.7 26.3
25.4 27.3 28.1 22.5
28.9 24.2 26.9 21.7
23.6 27.1 27.4 21.4
27.7 23.6 22.6 25.8
23.9 25.9 25.6 24.9
a) Estimer la droite de régression μY | x = α + β * x.
b) Estimer la résistance au cisaillement pour une contrainte normale de 24,5.
c) Evaluer 𝜎̂ 2 .
d) Tester l’hypothèse H0 : α = 0 avec un risque de 1 %.
e) Construire un intervalle de confiance à 99% pour α.
f) Tester l’hypothèse H0 : = 0 avec un risque de 1 %
g) Construire un intervalle de confiance de 99% pour .
h) Utiliser 𝜎̂ 2 pour calculer un intervalle de confiance à 95% pour la résistance moyenne
au cisaillement lorsque x = 24,5.
i) Utiliser 𝜎̂ 2 pour calculer un intervalle de prédiction de 95% pour une seule valeur
prédite de la résistance au cisaillement lorsque x = 24,5.
Solution :
La calculatrice a donné : A = 42.58180269 B = – 0.686077125 x̅ = 25.96666667
r = – 0.655567185 r² = 0.429768335 ∑ xi2 = 8134.26
x = 3.587222222
2
2y = 3.928888889 Sxy = n Cov(x ; y) = – 29.53333333
SSE = ∑ yi2 – A ∑ yi – B ∑ xi yi = 26.88452222 Syy = n 2y = 47.14666667
Sxx = n * 2x = 43.046666667
a) Estimer la droite de régression μ(Y | x) = α + β * x = 42.582 – 0.686 x.
b) Estimer ŷ (24.5) = A + 24.5 * B 𝐲̂ (24.5) = 25.77291312
c) Syy – B Sxy = 47.14666667 – (– 0.686077125)(– 29.53333333) = 26.88452222
Syy − B Sxy SSE
Evaluation de 𝜎̂ 2 = = n−2 = 2.688452222 𝝈
̂ = 1.63965003
n−2
d) Test d’hypothèse sur l’ordonnée à l’origine α de la droite de régression de Y en X.
Testez l’hypothèse H0 = {α = 0} contre H1 = {α ≠ 0} en prenant un risque de 1 %.
C’est un test bilatéral (égal contre inégal) ; le seuil critique t (0.01 ; 10) = 3.169
Si To > 3.169 ou To < – 3.169 alors il y a Rejet de H0
1 𝑥̅ 2 1 25.9666666672
Calcul de Se(A) =
̂ √𝑛 + S = 1.63965003√12 + = 6.506635437
𝑥𝑥 43.046666667
A 42.58180269
Calcul de la statistique de test To = Se(A) = 6.506635437 = 6.544466422 To 6.544
Comme To = 6.544 > 2.262 alors on doit rejeter H0. On conclut que α ≠ 0.
1
Exercices supplémentaires sur les tests
L. BENAGGOUN De la Régression Linéaire
̂
σ
e) Intervalle de confiance pour α : IC0.99(α) = [A ± t (𝛼) √∑ x2i ]
2 √n Sxx
1.63965003
IC0.99(α) = [42.58180269 ± 3.169 √8134.26] =
√12 ∗ 43.046666667
[42.58180269 ± 20.61921081] = [21.96259189 ; 63.2010135]
f) Test d’hypothèse sur la de la droite de régression de Y en X.
H0 = { = 0} ; contre H1 = { ≠ 0}, avec un risque de 1 %
C’est un test bilatéral (égal contre inégal) et le seuil critique t (0.01 ; 10) = 3.169
𝑆𝑆𝐸
̂
𝜎 √
𝑛−2 𝟏.𝟔𝟑𝟗𝟔𝟓𝟎𝟎𝟑
Se(B) = = = √43.046666667 = 0.249908712 B = – 0.686077125
√𝑆𝑥𝑥 √𝑆𝑥𝑥
𝐵− – 0.686077125 − 0
Calcul de To = 𝑆𝑒 = = – 2.745310946 To – 2.7453
(𝐵) 0.249908712
1 (𝑥 − x̅)²
E (Yx ) = ŷ (x) ± t (𝛼) σ
̂ √𝑛 + = ŷ(24.5) ±1.312368746
2 Sxx
1 (24.5−25.96666667)²
E (Yx = 24.5) = ŷ (24.5) ± 2.228 * 1.63965003 √𝑛 + =
47.04666667
E (Yx = 24.5) = 25.77291312 ± 1.312368746 = [24.46054437 ; 27.08528186]
i) Calcul d’un intervalle de prédiction de 95% pour une seule valeur prédite du
cisaillement lorsque la contrainte x = 24.5
1 (𝑥 − x̅)²
E (Yx ) = ŷ (x) ± t (𝛼) σ
̂ √1 + + = ŷ(24.5) ± 3.881719404
2 𝑛 Sxx
1 (24.5−25.96666667)²
E (Yx = 24.5) = ŷ (24.5) ±2.228*1.63965003 √1 + + =
𝑛 47.04666667
E (Yx = 24.5) = 25.77291312 ± 3.881719404 = [21.89119371 ; 29.65463252]
Exercice n° 2 :
Une étude a été réalisée sur une quantité de sucre converti par un certain procédé à
différentes températures. Les données ont été codées et enregistrées comme suit :
Température, x sucre converti, y Température, x sucre converti, y
1.0 8.1 1.6 8.6
1.1 7.8 1.7 10.2
1.2 8.5 1.8 9.3
1.3 9.8 1.9 9.2
1.4 9.5 2.0 10.5
1.5 8.9
a) Estimer la droite de régression linéaire de Y en X.
b) Estimer la quantité moyenne de sucre converti produite lorsque la température codée x
est de 1,75.
c) évaluer σ̂
d) Tester l’hypothèse H0 : α = 0 avec un risque de 5 %.
e) Construire un intervalle de confiance à 95 % pour α.
f) Tester l’hypothèse H0 : = 0 avec un risque de 5 %.
g) Construire un intervalle de confiance à 95 % pour β.
h) Construire un intervalle de confiance à 95 % pour la quantité de sucre converti
correspondant à x = 1,6 pouces.
i) Trouver un intervalle de prédiction à 0.95 de contenir non pas un paramètre mais une
future valeur prédite y0 de la variable aléatoire Y0 lorsque x = 1,6 pouces.
Solution :
La calculatrice a donné : A = 6.413636364 B = 1.809090909 r = 0.707026443
r² = 0.499886392 x̅ = 1.5 x = 0.1
2 2
∑ xi = 25.85 2y = 0.654710743
Sxx = n * 2x = 1.1 Syy = n 2y = 7.201818182 Sxy = n Cov(x ; y) = 1.99
SSE = ∑ yi2 – A ∑ yi – B ∑ xi yi = 3.601727273
a) Estimer la droite de régression μ(Y | x) = α + β * x = 6.414 + 1.809 x.
b) Estimer ŷ (1.75) = A + 1.75 * B 𝐲̂ (1.75) = 9.579545455
c) Syy – B Sxy = 7.201818182 – (1.809090909)(1.99) = 3.601727273
Syy − B Sxy SSE
Evaluation de 𝜎̂ 2 = = n−2 = 0.400191919 𝝈
̂ = 0.632607239
n−2
3
Exercices supplémentaires sur les tests
L. BENAGGOUN De la Régression Linéaire
d) Testez l’hypothèse H0 = {α = 0} contre H1 = {α ≠ 0} en prenant un risque de 5 %.
C’est un test bilatéral (égal contre inégal) ; le seuil critique t (0.05 ; 9) = 2.262
Si To > 2.262 ou To < – 2.262 alors il y a Rejet de H0
1 𝑥̅ 2 1 1.52
Calcul de Se(A) =
̂ √𝑛 + S = 0.632607239√11 + = 0.924638017
𝑥𝑥 1.1
A 6.413636364
Calcul de la statistique de test To = Se(A) = 0.924638017 = 6.936375364 To 6.936
Comme To = 6.936 > 2.262 alors on doit rejeter H0. On conclut donc que α ≠ 0.
̂
σ
e) Intervalle de confiance pour α : IC0.95(α) = [A ± t 𝛼 √∑ x2i ]
2 √n Sxx
0.632607239
IC0.95(α) = [6.413636364 ± 2.262 √25.85] =
√11 ∗ 1.1
[6.413636364 ± 2.091531195] = [4.322105169 ; 8.505167559]
f) Tester l’hypothèse H0 = { = 0} ; contre H1 = { ≠ 0}, avec un risque de 5 %
C’est un test bilatéral (égal contre inégal) et le seuil critique t (0.05 ; 9) = 2.262
𝑆𝑆𝐸
̂
𝜎 √
𝑛−2 𝟎.𝟔𝟑𝟐𝟔𝟎𝟕𝟐𝟑𝟗
Se(B) = = = = 0.603167336 B = 1.809090909
√𝑆𝑥𝑥 √𝑆𝑥𝑥 √1.1
𝐵− 1.809090909− 0
Calcul de To = 𝑆𝑒 = = 2.999318433 To 2.999
(𝐵) 0.603167336
1 (𝑥 − x̅)²
E (Yx) = ŷ (x) ± t (𝛼) σ
̂ √𝑛 + = ŷ(1.6) ± 0.452508517
2 Sxx
1 (1.6 −1.5)²
E (Yx = 1.6) = ŷ (1.6) ± 2.262 * 0.632607239 √11 + =
1.1
E (Yx = 1.6) = 9.308181818 ± 0.452508517 = [8.855673301 ; 9.760690335]
i) Calcul de l’intervalle de prédiction à 0.95 qui contient non pas un paramètre de la
population mais une future valeur prédite y0 de la variable aléatoire Y0 lorsque x = 1.6
t (0.05 ; 9) = t 𝛼 = 2.262 y0 = ŷ (1.6) = 9.308181818 n = 11
2
1 (𝑥 − x̅)²
E (Yx) = ŷ (x) ± t 𝛼 σ
̂ √1 + + = ŷ(1.6) ±1.500800966
2 𝑛 Sxx
1 (1.6 −1.5)²
E (Yx = 1.6) = ŷ (1.6) ± 2.262 * 0.632607239 √1 + + =
11 1.1
E (Yx = 1.6) = 9.308181818 ± 1.500800966 = [7.807380853 ; 10.80898278]
4
Exercices supplémentaires sur les tests
L. BENAGGOUN De la Régression Linéaire
Solution de vérification avec EXCEL :
Rapport détaillé
Statistiques de la régression
Coefficient de corrélation : r = 0,70702644
Coefficient de détermination : r² = 0,49988639
Erreur-type ̂
σ 0,63260724
Observations n= 11
Test sur la signification de la régression avec l’analyse de la variance
DDL Somme des carrés Moyenne des carrés F P-Valeur
Régression 1 B * Sxy = 3,60009091 MSR = 3,60009091 8,99591105 0,0149729
Résidus 9 SSE = 3,60172727 MSE = 0,40019192
Total 10 SST = 7,20181818
Test sur les coefficients de la droite de régression linéaire
inférieure IC supérieure IC
Coefficients Erreur-type Stat t0 P-valeur = 95% = 95%
A= 6,413636364 0,92463802 6,936375364 6,7865E-05 4,32195985 8,50531288
B= 1,809090909 0,60316734 2,999318433 0,0149729 0,4446316 3,17355022
Exercice n° 3 :
L’examen final a donné les notes des 20 étudiants sélectionnés au hasard qui suivent un
cours de statistiques et un cours de recherche opérationnelle. Supposons que les notes finales
soient distribuées normalement conjointement.
Stat y 86 75 69 75 90 94 83 86 71 65
OR x 80 81 75 81 92 95 80 81 76 72
Stat y 84 71 62 90 83 75 71 76 84 97
OR x 85 72 65 93 81 70 73 72 80 98
a) Trouvez la droite de régression liant la note finale des statistiques à la note finale de RO.
b) Estimer le coefficient de corrélation.
c) Testez la signification de la régression en utilisant un risque de 5%.
d) Testez l'hypothèse que = 0 en utilisant un risque de 5%
e) Testez l'hypothèse que = 0,5 en utilisant un risque de 5%
f) Construire un intervalle de confiance de 95% pour le coefficient de corrélation.
Solution :
La calculatrice a donné : A = – 0.028041126 B = 0.99098678 r = 0.903339735
r² = 0.816022678 x̅ = 80.1 x = 74.89
2 ∑ xi2 = 129 818
Sxx = n * 2x = 1497.8 Syy = n 2y = 1802.55 Sxy = n Cov(x ; y) = 1484.3
SSE = ∑ yi2 – A ∑ yi – B ∑ xi yi = 331.6283215 2y = 90.1275
a) L’estimation de la droite de régression μ(Y | x) = α + β * x = – 0.028 + 0.991 x.
b) L’estimation du coefficient de corrélation est : r = 0.903339735
5
Exercices supplémentaires sur les tests
L. BENAGGOUN De la Régression Linéaire
c) Test de la signification de la régression
Calcul de SST = Syy = n 2y = 1802.55
Calcul de SSR = B Sxy = 0.99098678 * 1484.3 = 1470.921678 MSR = SSR/1
SSE
Calcul de SSE = SST – SSR = 331.6283224 MSE = n−2 = 18.42379564
MSR 1470.921678
Calcul de la statistique de test To = Fo = MSE = 18.42379564 = 79.83814556
Le seuil critique f (α ; 1 ; 2) = f (0.05 ; 1 ; 18) = 4.4139
Test de la signification de la régression avec EXCEL (pour vérifier les calculs)
6
Exercices supplémentaires sur les tests
L. BENAGGOUN De la Régression Linéaire
1+R 1+R 1+0.903339735 1+0.5
Calcul de To = [½ Ln 1−R – ½ Ln 1−R] √n − 3 = [½ Ln 1−0.903339735 – ½ Ln 1−0.5] √20 − 3 =
zα z α
( ) ( )
arctanh r – 2
= 1.080196282 arctanh r + 2
= 1.899966695
√n−3 √n−3
z α z α
1+r ( ) 1+r ( )
IC0.95 () = tanh (arctanh ½ Ln 1−r – 2
) < < tanh (arctanh ½ Ln 1−r + 2
)
√n−3 √n−3
inférieure = supérieure =
Coefficients Erreur-type Stat t0 P-valeur IC 95% IC 95%
A= – 0,02804113 8,93542266 – 0,0031382 0,9975306 – 18,8006675 18,7445853
B= 0,99098678 0,11090794 8,93521939 4,9037E-08 0,75797784 1,22399572
7
Exercices supplémentaires sur les tests
L. BENAGGOUN De la Régression Linéaire
Exercice n° 4 :
Les valeurs x et y des variables aléatoires X et Y sont données dans le tableau ci-dessous :
x 23.1 32.8 31.8 32 30.4 24 39.5 24.2
y 10.5 16.7 18.2 17 16.3 10.5 23.1 12.4
52.5 37.9 30.5 25.1 12.4 35.1 31.5 21.1 27.6
24.9 22.8 14.1 12.9 8.8 17.4 14.9 10.5 16.1
a) Estimer la corrélation entre Y et X.
b) Testez l'hypothèse que = 0 en utilisant un risque de 5%.
c) Ajuster un modèle de régression linéaire pour cet échantillon et tester la signification de
la régression avec un risque de 5%.
d) Quelles conclusions pouvez-vous tirer ? Comment le test de signification de la régression
est-il lié au test sur dans la partie (b)?
e) Testez l'hypothèse H0 : α = 0 contre H1 : α ≠ 0 et tirez des conclusions. Utilisez un risque
de 5%.
f) Analyser les résidus et commenter l'adéquation du modèle.
Solution :
La calculatrice a donné : A = 0.725380435 B = 0.498081197 r = 0.933202938
r² = 0.870867723 x̅ = 30.08823529 2x = 72.85397924 y̅ = 15.71176471
2y = 20.75397924 ∑ xi2 = 16 628.65 Sxx = n * 2x = 1238.517647
Syy = n 2y = 352.8176471 Sxy = n Cov(x ; y) = 616.8823529
SSE = ∑ yi2 – A ∑ yi – B ∑ xi yi = 45.5601459
a) L’estimation du coefficient de corrélation est : r = 0.933202938
b) Test de l’hypothèse que = 0.
H0 = { = 0} ; contre H1 = { ≠ 0}, avec un risque de 5 %
C’est un test bilatéral (égal contre inégal) et le seuil critique t (0.025 ; 15) = 2.131
𝑟 0.933202938
Calcul de To = = = 10.05783076 To 10.058
1− 𝑟2 1− 0.933202938 ²
√ √
𝑛−2 17 − 2
8
Exercices supplémentaires sur les tests
L. BENAGGOUN De la Régression Linéaire
Test de la signification de la régression avec EXCEL (pour vérifier les calculs)
d) Les conclusions tirées indiquent que le coefficient de corrélation linéaire est non nul et
que le test de la signification de la régression est très significatif ce qui valide le premier
test sur la corrélation.
Le test de signification de la régression de la question (c) est lié au test sur dans la
question (b) par le fait qu’il y a une relation de carré entre les deux statistiques de test
observé : la statistique de test observé To au carré de la question (b) = To² =
(10.05783076)² = la statistique de test observé de la question (c) To = F = 101.1599595
e) Testez l’hypothèse H0 = {α = 0} contre H1 = {α ≠ 0} en prenant un risque de 5 %.
C’est un test bilatéral (égal contre inégal) ; le seuil critique t (0.05 ; 15) = 2.131
Si To > 2.131 ou To < – 2.131 alors il y a Rejet de H0
1 𝑥̅ 2 1 30.088235292
Calcul de Se(A) =
̂ √𝑛 + S = 1.742797482√17 + = 1.548816119
𝑥𝑥 1238.517647
A 0.725380435
Calcul de la statistique de test To = Se(A) = 1.548816119 = 0.468345097 To 0.468
Comme To = 0.468 < 2.131 alors on doit accepter H0. On conclut donc que α = 0
Test sur les coefficients de la droite de régression linéaire
Inférieure supérieure
Coefficients Erreur-type Stat t0 P-Valeur IC = 95 % IC = 95 %
A= 0,725380436 1,548816118 0,4683451 0,64627111 – 2,57584298 4,02660385
B= 0,498081198 0,049521732 10,0578308 4,6316E-08 0,39252812 0,60363427
f) Analyse des résidus et commentaire sur l'adéquation du modèle.
0
0 10 20 30 40 50 60
-10
xi
Il y a une parfaite adéquation du modèle choisi (y = 0.72538 + 0.49808 x) car les résidus sont
répartis d’une manière aléatoire dans le graphique et ei < 2 sauf les observations 2 et 10.
6 12,6793292 – 2,17932918 10 19,6026578 3,19734217
9
Exercices supplémentaires sur les tests
L. BENAGGOUN De la Régression Linéaire