TD Test With Solution

Télécharger au format pdf ou txt
Télécharger au format pdf ou txt
Vous êtes sur la page 1sur 16

Faculté Sciences Exactes Université Djillali Liabès

Département Informatique Mod:Probabilités-Statistique


Fiche TD Statistique

1 Estimation ponctuelle

Exercice 1. 
Soient X1 , . . . , Xn i.i.d. de loi de Poisson de moyenne λ. Déterminez le MLE pour le
paramètre λ.
Solution :
5. Pour X ∼ Poisson(λ), et x ∈ N
λx −λ
P(X = x) = e
x!
Donc pour X1 , . . . , Xn i.i.d ∼ Poisson (λ), (il s’git d’une loi discrète ici) pour un échantillor
(x1 , · · · , xn ) donné, la vraisemblance s’écrit
n
Y
L (λ; x1 , · · · , xn ) = P (Xi = xi )
i=1
n
Y λ xi
= e−λ
xi !
i=1
e−nλ
= λx1 +···+xn
x1 ! · · · xn !
La log-vraisemblance s’écrit

` (λ; x1 , · · · , xn ) = log L (λ; x1 , · · · , xn )


= −nλ − log (x1 ! · · · xn !) + (x1 + · · · + xn ) log(λ)

On cherche a maximiser ` (λ; x1 , . . . , xn ) pour λ > C. On remarque que ` → −∞ quand


λ −→ 0, et ` → −∞ quand λ −→ +∞. En plus,
∂` 1
= 0 → −n + (x1 + · · · + xn ) = 0
∂λ λ
On obtient l’estimation de maximum de vraisemblance
1
λ̂MV = (x1 + · · · + xn )
n
1
λ̂MV = (X1 + · · · + Xn )
n
et nous retrouvons donc
λ̂MV = X̄n .

Exercice 2. 
Soient X1 , . . . , Xn i.i.d. Bin(1, p). Déterminez le MLE pour le paramètre p.
Solution :

Licence Informatique Page 1/16 24 février 2021


Faculté Sciences Exactes Université Djillali Liabès
Département Informatique Mod:Probabilités-Statistique

L’ensemble des valeurs possibles est {0, 1}. Le paramètre inconnu est p. Si (x1 , . . . , xn ) ∈
{0, 1}n est un échantillon, la vraisemblance vaut :
P P
xi
L(x1 , . . . , xn , p) = p (1 − p)n− xi
.
Son logarithme est :
X X
log(L(x1 , . . . , xn , p)) = ( xi ) log p + (n − xi ) log(1 − p) .
La dérivée par rapport à p est :
∂ log(L(x1 , . . . , xn , p)) X 1 X 1
=( xi ) − (n − xi ) .
∂p p 1−p
Elle s’annule pour : P
xi
pb = .
n
La dérivée seconde est :
∂ 2 log(L(x1 , . . . , xn , p)) X 1 X 1
2
= −( xi ) 2 − (n − xi ) .
∂p p (1 − p)2
Elle est strictement négative, la valeur pb est bien un maximum. Si (X1 , . . . , Xn ) est un
échantillon de la loi de Binomiale (Bernoulli) de paramètre p, l’estimateur du maximum
de vraisemblance de p est : P
Xi
,
n
à savoir la fréquence empirique.
Exercice 3. 
Soit (X1 , . . . , Xn ) un échantillon aléatoire simple issu d’une population de densité
 1 e− θ1 (x−γ) si x > γ

fθ (x) = θ
0 sinon

où θ > 0. Déterminez une estimation des paramètres θ et γ par la méthode du MLE.


Solution :
n
Y 1
exp −θ−1 (Xi − γ) I[γ,+∞[ (Xi )

Lθ,γ (X) =
θ
i=1
1 
−1
X   
= n
exp −θ (Xi − γ) I[γ,+∞ X(1) .
θ
En se limitant à X(1) > γ,
1X
log Lθ,γ (X) = −n log θ − (Xi − γ)
θ
i
1 1 X
∂θ log Lθ,γ (X) = −n + 2 (Xi − γ)
θ θ
i
X
∂θ log Lθ,γ (X) = 0 ⇔ −nθ + Xi − nγ = 0
i
⇔ θ = X̄ − γ
n
∂γ log Lθ,γ (X) = .
θ

Licence Informatique Page 2/16 24 février 2021


Faculté Sciences Exactes Université Djillali Liabès
Département Informatique Mod:Probabilités-Statistique

Cette dernière quantité n’est jamais nulle. Souhaitant maximiser la vraisemblance, on re-
marque qu’à θ fixé, la vraisemblance est une fonction croissante de γ. Quand γ prend sa
valeur maximale, la vraisemblance sera maximale. Or, γ ≤ X(1) .
On trouve alors
γ̂ = X(1) = Xmin et θ̂ = X̄ − X(1)

Exercice 4. 
Soit X1 , . . . , Xn un échantillon aléatoire simple issu d’une population de densité
( 2θ−1
θ
x 1−θ si 0 < x < 1
fθ (x) = 1−θ
0 sinon

où 1/2 < θ < 1. Déterminez le MLE pour θ.


Solution :
Immédiatement, en supposant X1 . . . , Xn dans le support de fθ
n
Y
Lθ (X) = fθ (Xi )
i=1
n 2θ−1
Y θ
= Xi 1−θ I0<X<1 (Xi )
1−θ
i=1
n Y n
! 2θ−1 n
 1−θ Y
θ
= Xi I0<X<1 (Xi )
1−θ
i=1 i=1
1
∂θ log Lθ (X) = 0 ⇔ θ = 1 P
1− n i log (Xi )

Exercice 5. 
Les éléments d’une population possèdent un caractère X qui suit une loi de densité
θ+1
fθ (x) = (1 − |x|)θ , x ∈ (−1, 1)
2
où on suppose le paramètre θ > −1. On en extrait un échantillon simple X1 , . . . , Xn .
Déterminez l’estimateur du maximum de vraisemblance θ̂ de θ.
Solution :
Comme d’habitude, en supposant que les indicatrices sont vérifiées (le support ne dépen-
dant pas de θ ),
n
Y
Lθ (X) = fθ (Xi )
i=1
n

θ+1 n Y
 
 
= (1 − |Xi |) I{X≥−1} X(1) I{X≤1} X(n)
2
i=1
  n
θ+1 X
log Lθ (X) = n log +θ log (1 − |Xi |)
2
i=1
n
n X
∂θ log Lθ (X) = + log (1 − |Xi |)
θ+1
i=1
n
∂θ log Lθ (X) = 0 ⇔ θ = − P −1
ln (1 − |Xi |)

Licence Informatique Page 3/16 24 février 2021


Faculté Sciences Exactes Université Djillali Liabès
Département Informatique Mod:Probabilités-Statistique


Exercice 6. 
Les éléments d’une population possèdent un caractère X qui suit une loi de densité

θ 2
fθ (x) = √ e−θx /2

où θ > 0. Pour étudier le paramètre θ, on a effectué une suite de n expériences indépen-
dantes qui ont donné les réalisations x1 , . . . , xn de n v.a. X1 , . . . , Xn i.i.d. de même loi que
X.
1. Déterminez un estimateur θ̂ du paramètre θ par la méthode du maximum de vrai-
semblance.
2. θ̂ est-il exhaustif ?
3. Calculez la moyenne et la variance de θ̂. Déduisez-en un estimateur θ̂1 de θ non
biaisé. Quelle est la variance de θ̂1 ? Est-il convergent ?

Exercice 7. 
Les éléments d’une population possèdent un caractère X qui suit une loi de densité
2 2
fθ (x) = √ 3/2
x2 e−x /θ
πθ

où θ > 0. Une suite de n expériences indépendantes a donné les valeurs x1 , . . . , xn .


1. Déterminez un estimateur θ̂ du paramètre θ par la méthode du maximum de vrai-
semblance.
2. Examinez les qualités suivantes de θ̂ : efficacité, biais, convergence, exhaustivité.

Exercice 8. 
Les éléments d’une population possèdent un caractère X qui suit une loi de probabilité
dont la densité est (
θe−θ(x−a) si x ≥ a
fa,θ (x) =
0 sinon
où θ, a > 0. Une suite de n expériences indépendantes a donné les valeurs x1 , . . . , xn .
Inférence sur a, en supposons que θ est connu. Proposez un estimateur â de a par la
méthode du maximum de vraisemblance.

2 Tests statistique

Exercice 9. 
On veut savoir si la résistance moyenne de composants produits dans une usine est 400Ω.
On considère que la distribution des résistances est normale, et on mesure pour 16 compo-
sants les valeurs 392, 396, 386, 389, 388, 387, 403, 397, 401, 391, 400, 402, 394, 406, 406, 400.
(a) Donner les estimations ponctuelles des moyenne et variance.
(b) Peut-on considérer, au seuil de signification α = 5%, que le lot respecte la norme
de 400 ? Même question avec un seuil de α = 1%.
Solution :

(a) On trouve x̄ = 396.125, s = 6.742 et s2 = 45.45.

Licence Informatique Page 4/16 24 février 2021


Faculté Sciences Exactes Université Djillali Liabès
Département Informatique Mod:Probabilités-Statistique

b) Si l’on fait l’hypothèse H0 : "le lot respecte la norme de 400Ω00 , alors dans 95% des
cas la moyenne sur un échantillon d’effectif 16 se trouve dans l’intervalle

[400 − t ∗ 6.742/4, 400 + t ∗ 6.742/4],

t étant lu dans la table de la loi de Student à 15 degrés de liberté : t = 2.1314.


Ainsi l’intervalle de confiance 95% pour la résistance est [396.40, 403.59], et on peut
donc, au risque 5%, rejeter l’hypothèse.
Au seuil α = 1%, on a dans l’hypothèse H0 un intervalle de confiance pour la
moyenne [400 − t ∗ 6.742/4, 400 + t ∗ 6.742/4], avec t = 2.9467. Ainsi, l’intervalle est
[395.03, 404.97]. Au risque 1%, on ne rejette pas H0 .

Exercice 10. 
Un fabricant se vante de proposer des tubes à essai d’une durée de vie supérieure à
2000h de chauffage. A l’aide d’un échantillon de 100 tubes testés, on estime la durée de
vie moyenne à 1975h, avec un écart-type de 130h. Peut-on affirmer, au risque 5%, que le
fabriquant ment ?
Solution :
Il s’agit ici d’un test unilatéral... H0 est l’hypothèse : "la durée de vie moyenne vérifie

µ ≥ 200000 . On peut supposer, l’effectif de l’échantillon étudié étant grand, que n X̄−µ
s
suit une loi normale centrée réduite. Si H0 est vérifiée, on cherche t tel que

P(µ − ts/ n ≤ X̄) = 0.95,

soit
√ X̄ − µ
 
P −t ≤ n = 0.95, et donc 1 − F (−t) = F (t) = 0.95 : t = 1.64
s
Ainsi, dans I’ hypothèse H0 , la durée de vie moyenne d’un échantillon d’effectif 100se
trouve, dans 95% des cas, dans l’intervalle [2000 − 1.64 ∗ 130/10, +∞[= [1978.68, +∞[. La
mesure de 1975 h sur l’échantillon n’ étant pas dans cet intervalle,
 H0 doit être rejetée : il est probable que le fabriquant mente.
Exercice 11. 
Un fabricant annonce que la masse d’un composant de l’un de ses produits est de
75mg. Les mesures pour le vérifier étant coûteuses, trois seulement sont réalisées, dont les
résultats sont 70, 72 et 74mg. Peut-on, au risque de 5% de se tromper, dénoncer la publicité
du fabriquant ?
Solution :
Notons X la variable aléatoire correspondante. (on doit supposer que la loi de X est une loi
normale pour pouvoir appliquer les méthodes du cours). On note µ = E(X) : il s’agit donc
icl d’effectuer un test bilatéral de l’hypothèse H0 : µ = 75. On obtient sur un échantillon
de 3 mesures : n = 3, x̄ = 72, σ 02 = 8/3 et s2 = 8/2 = 4 donc l’estimation ponctuelle de

l’écart-type est s = 2. On sait que n X̄−µ s suit une loi de Student à 2 degrés de liberté,
donc si α = 0.05,
t(α) = 4.3027
Ainsi, la moyenne des durées de vie mesurées
√ sur un échantillon√ d’effectif 3 sera, dans 95%
des cas, dans l’intervalle [75−4.3027×s/ 3, 75+4.3027×s/ 3] = [70.03, 79.97]. La valeur
moyenne 72 mesurée sur l’échantillon étant bien dans cet intervalle, on n’ a pas de raisons,
au vu de ces mesures, de rejeter H0 .
Exercice 12. 

Licence Informatique Page 5/16 24 février 2021


Faculté Sciences Exactes Université Djillali Liabès
Département Informatique Mod:Probabilités-Statistique

Un laboratoire pharmaceutique désire étudier les effets secondaires potentiels d’un mé-
dicament sur le taux de cholestérol des patients. Cent volontaires sains sont donc choisis
pour tester le médicament.
(a) Avant l’expérience, le taux de cholestérol moyen de ces volontaires est de 2.02 ±
0.2g/l. Le taux de cholestérol moyen dans la population étant de 2 g/l, vérifier que
cet échantillon est représentatif au risque 5
(b) Après un mois de traitement, seuls 97 volontaires reviennent faire un test. Leur
taux moyen de cholestérol est passé à 2.09g/l avec un écart-type d’échantillon de
0.25g/l.
La différence est-elle significative au risque 5% ? Au risque 1% ?
Solution :

(a) Soit X1 la variable aléatoire qui mesure le taux de cholestérol d’un individu ; E (X1 ) =
µ1 = 2 X1 est le taux moyen mesuré sur un échantillon de taille n1 = 100 Alors

n1 étant plus grand que 30, on peut considérer que n1 Xs11−2 suit une loi normale,
avec s1 = 0.2 estimation ponctuelle de l’écart-type de X1 . Ainsi, dans 95% des cas
le taux moyen observé sur un échantillon sera compris dans [2 − 1.96 × 0.2/10, 2 +
1.96 × 0.2/10] = [1.961, 2.039].
Le taux de cholestérol moyen des volontaires étant bien dans cet intervalle, on peut
considérer que cet échantillon est représentatif.
b) Soit X2 la variable aléatoire mesurant le taux de cholestérol d’un individu après
un mois de traitement ; son espérance µ2 est inconnue. X2 est le taux moyen d’un
échantillon de taille n2 = 97.
On fait l’hypothèse H0 : "est les taux de cholestérol moyens sont les mêmes avant
et après traitement".
Alors µ1 = µ2 , et on peut considérer que

X1 − X2
p ∼ N (0, 1)
s1 /n1 + s22 /n2
2

(avec s1 = 0.2, s2 = 0.25 ), et par conséquent on détermine l’intervalle de confiance


au risque 5% de
 q q 
X1 − X2 : −1.96 s21 /n1 + s22 /n2 , 1.96 s21 /n1 + s22 /n2 = [−0.063, 0.063]

Comme la différence entre les taux moyens mesurés 2.02−2.09 = 0.07 n’est pas dans
cet intervalle, elle est significative, et on rejette H0 donc on considère, au risque 5%
de se tromper, que le médicament a un effet.
En revanche, l’intervalle de confiance au risque 1% est
 q q 
2 2 2 2
−2.57 s1 /n1 + s2 /n2 , 2.57 s1 /n1 + s2 /n2 = [−0.083, 0.083],

intervalle qui contient la valeur 2.02 − 2.09 = 0.07, donc la différence n’est pas
significative au risque de 1%.

Licence Informatique Page 6/16 24 février 2021


Faculté Sciences Exactes Université Djillali Liabès
Département Informatique Mod:Probabilités-Statistique


Exercice 13. 
Pour étudier un nouvel alliage métallique, on a soumis un échantillon aléatoire de 16
tiges aux essais pour obtenir les résistances suivantes en kg/cm2 :
1895, 1920, 1886, 1890, 1864, 1880, 1875, 1915, 1850, 1927, 1910, 1912, 1886, 1903, 1854, 1880.
On suppose la résistance distribuée normalement.
(a) Estimer par intervalle avec un niveau de confiance de 95%, la résistance moyenne à
la rupture.
(b) Avant l’introduction de ce nouvel alliage la résistance moyenne à la rupture des
tiges était de 1840kg/cm2 . Que peut-on conclure des essais effectués avec le nouvel
alliage ?

Exercice 14. 
Les habitants d’une région aéroportuaire se plaignent que le bruit des avions dépasse
la limite autorisée de 80 décibels en moyenne imposée par la législation. On admet que
I’intensité du bruit causé par les avions est une variable aléatoire X de loi gaussienne
d’espérance µ et de variance 64 .
On mesure un échantillon journalier de n = 16 variables aléatoires indépendantes
X1 , . . . , Xn de I’intensité du bruit, et on effectue le test statistique suivant.

H0 : µ = µ0 = 80 décibels
H1 : µ = µ1 = 85 décibels

1. Expliciter les risques de première et deuxième espèces. De quel point de vue est fait
ce test ? Celui des habitant ou celui des responsables de I’aéroport ?
2. Quelle variable de décision faut-il choisir et quelle est sa loi ?
3. Calculer le seuil de la région critique pour un risque α = 5%.
4. Calculer la puissance du test.
5. Enoncer les règles de décision avec les probabilités d’erreur.
6. La moyenne calculée sur l’échantillon est x̄ = 83 décibels. Les habitants ont-ils raison
de se plaindre ? Le test d’hypothèses ainsi établi leur est-il favorable ou défavorable ?
7. Combien faudrait-il faire de relevés journaliers, pour que le risque de deuxième
espèce soit de 5% ?
8. Quelle serait alors le seuil de décision ?

Exercice 15. 
Sur un échantillon de 900 naissances, on constate qu’il y a 470 garçons. Un généticien
décide d’utiliser ces données pour effectuer le test suivant relatif aux proportions p et 1 -p
de naissances respectivement masculines et féminines :

H0 : p = 0.5
H1 : p = 0.55

1) Construire un test pour ces hypothèses avec un risque α = 5%. Peut-on être satisfait
du test ? Si non comment peut-on I’améliorer ?
2) Ce généticien effectue une nouvelle étude sur un échantillon de même taille. II sou-
haite cette fois tester les hypothèses :

H0 : p = 0.5
H1 : p 6= 0.5

Licence Informatique Page 7/16 24 février 2021


Faculté Sciences Exactes Université Djillali Liabès
Département Informatique Mod:Probabilités-Statistique

Solution :
1)
HO : p = 0.5
H1 : p = 0.55
Variable de décision La fréquence empirique Fn est un estimateur de p et avec un
échantillon de taille 900, on peut considérer grâce au TCL que Fn suit une loi normale
N (p, p(1 − p)/n) où p = 0.5 sous I’hypothèse H0 et p = 0.55 sous I’hypothèse H1 .
La région critique W est la région d’acceptation de H1 d’où W = {Fn ≥ C}. (c)
Calcul du seuil On sait que α = P (W | H0 vraie ) = P (Fn ≥ C | H0 vraie ). Supposons
2 2
H0 vraie alors Fn suit une
√ √  N 0.5, σ0 où σ0 = 0.5 ∗ 0.5/n, d’où α = P (Fn ≥ C) =
n −0.5
P √F0.5∗0.5 n ≥ C−0.5
0.5 n ⇔ P (Z ≥ C 0 ) = 0.05 où Z suit une loi N (0, 1)

0.5
⇒ C 0 = 1.64 ⇒ C = 0.5 + 1.64 ∗ √
n

⇒ C ≈ 0.5 + 1.64 0.5/30 ≈ 0.53
(d) Calcul de la puissance On sait que 1 − β = P (W | H1 vraie ) = P (Fn ≥ C | H0 vraie
). Supposons H1 vraie alors Fn suit une N 0.55, σ12 où σ 2 = 0.45∗ 0.55/n, d0 où
Fn − 0.55 √ C − 0.55 √
 
1−β = P (Fn ≥ C) = P √ n≥ √ n = P (Z ≥ −1.21) = P (Z < 1.21) = 0.89
0.55 ∗ 0.45 0.55 ∗ 0.45
⇒ B = 0.11
(d) Règles de décision Si fn ≥ 0.53 alors on accepte H1 , i.e on considère qu’il y a plus
de garçons que de filles avec 5% de risque de se tromper. Si fn < 0.53 alors on garde H0 ,
i.e on considère qu’il y a autant de filles que de garçons avec 11% de risque se tromper.
L’échantillon considéré indique fn = 470/900 = 0.52 donc le généticien conclut qu’il y
autant de garçons que de filles avec 11% de risque de se tromper. (e) Taille échantillon Le
risque de 2ème espèce n’est pas acceptable. Pour le réduire nous allons jouer sur la taille
de I’échantillon. L’erreur de première espèce donne une première équation
0.5
C = 0.5 + 1.64∗ √
n
Et si on impose une erreur de seconde espèce de 0.05 alors on obtient une deuxième équation
Fn − 0.55 √ C − 0.55 √
 
1 − β = P (Fn ≥ C) = P √ n≥ √ n
0.55∗ 0.45 0.55∗ 0.45
⇔ 0.95 = P Z ≥ C 2 ⇔ 0.95 = P Z ≤ −C t ⇒ −C 0 = 1.64
 


∗ 0.55 0.45
C = 0.55 − 1.64 √
n
d0 ou √

C = 0.55 − 1.64 ∗ 0.55
√ 0.45 = 0.5 + 1.64 ∗ √
n
0.5
n

⇔ 0.55 − 0.5 = 1.64
√ (0.5 + 0.55 ∗ 0.45)
n

⇔ n = 32.72 ⇒ n = 1070
Si on souhaite diminuer I’erreur de 2ème espèce, il faut tester un échantillon de taille au
moins 1070 . 2)
HO : p = 0.5
H1 : p 6= 0.5

Licence Informatique Page 8/16 24 février 2021


Faculté Sciences Exactes Université Djillali Liabès
Département Informatique Mod:Probabilités-Statistique

Le test est maintenant bilatéral. Même estimateur, même lois. (a) Région critique La région
critique W est la région d’acceptation de H1 d’où W = {F < C1 ouF> C2 }
et West la région d’acceptation de H0 d’où W = {C1 ≤ F ≤ C2 } (cf. dessin). (b)
Calcul des seuils On sait que α = P (W | H0 vraie ) = P (F < C1 ou F > C2 | H0
vraie). Afin de simplifier le calcul de probabilité, on passe à 1 − α = P W̄ | H0 vraie
) = P (C1 ≤ F ≤ C2 | H0 vraie ). Supposons H0 vraie alors F suit une N 0.5, σ0 2 où


σ0 2 = 0.5∗ 0.5/n, d0 où
C1 − 0.5 √ F − 0.5 √ C2 − 0.5 √
 
1 − α = P (C1 ≤ F ≤ C2 ) = P √ n≤ √ n≤ √ n
0.5∗ 0.5 0.5∗ 0.5 0.5∗ 0.5
⇔ P (C1 ≤ Z ≤ C20 ) = 0.05 On suppose que le risque est symétrique, or la loi normale
centrée est aussì symétrique par rapport à 0, on a donc C01 = −C02 . D’où P (C01 ≤ Z ≤ C02 ) =
0.05 ⇔
P (−C02 ≤ Z ≤ C02 ) = 0.05 ⇔ F (C0 2 ) − F (−C0 2 ) = 0.05 où F est la fonction de répar-
tition de z ⇔ F (C 0 2) √ − [1 − F (C 0 2)] = 0.05 ⇔ F (C 0 2) =√ 1.95/2 = 0.975 ⇒ C 0 2 =
∗ √ ∗ √
1.96 ⇒ C2 = 0.5 + 1.96 0.5 0.5/ n = 0.53 et C1 = 0.5 − 1.96 0.5∗ 0.5/ n = 0.47

(c) Règles de décision


- Si fn < 0.47 ou fn > 0.53, on accepte H1 , i.e on considère que la cóte du président a
changé avec 5% de chance de se tromper.
- Dans le cas contraire, on accepte H0 , i.e on considère que sa côte est stable, mais on ne
connait
 pas le risque encourus car on ne connait pas Ia loi sous H1 .
Exercice 16. 
On s’interroge sur la comparaison des tailles moyennes des garçons et des filles de 6
ans dans une population, pour cela on a pris comme échantillon, jugé représentatif de cette
tranche d’âge, et on a observé : 16 garçons : moyenne 126.5 cm, écart-type estimé 12.9 cm
15 filles : moyenne 136.9 cm, écart-type estimé 11.9 cm. On admet que la distribution des
tailles dans chacune des sous-populations (garcons, filles) suit une loi gaussienne.
1. Donner des intervalles de confiance à 95% pour les tailles moyennes des garcons et
des filles.
2. Donner un intervalle de confiance à 95% pour l’écart-type de la taille des garçons.
Meme question pour les filles.
3. Donner un intervalle de confiance à 95% pour le rapport des deux écart-types. Peut-
on conclure que les variances des deux populations sont différentes ? (On donne, pour
la loi de Fisher-Snedecor à (15,14) degrés de libertés, les quantiles f0.975 = 2.95 et
1
f0.025 = f0.975 = 0.339
Solution :
Corrigé : Soit X = (X1 , . . . , Xm ) un m -échantillon de loi normale N µ, σ 2 représentant la


taille des garçons mesurés et X 0 = (X10 , . . . , Xn0 ) m -échantillon de loi normale N µ0 , σ 02


représentant la tailles P des filles mesuréesP avec X et X 0 indépendants. (Ici, m = 16 et
m n 0
Xi 0 = i=1 Xi
n = 15 ). Soit X̄m = i=1 m et X̄ n n , les moyennes empiriques associées. Soit
Pm 2 Pn 0 −X̄ 0 2
(X −X̄m ) (X )
et Sn02 = i=1 n−1
2 = i=1 i i n
Sm m−1 , les variances estimées associés.
1. Comme σ est inconnu, pour déterminer un intervalle de confiance pour µ, on va
utiliser une statistique de Student. (Si σ était connu, on utiliserait directement la
loi normale).

m(X̄m −µ) 2
Propriété du cours sur les lois normales : Les statistiques σ et (m−1)S
σ 2
m

sont indépendantes et de lois respectives N (0, 1) et χ2 (m − 1) On en déduit que

Licence Informatique Page 9/16 24 février 2021


Faculté Sciences Exactes Université Djillali Liabès
Département Informatique Mod:Probabilités-Statistique

l’estimateur :

m(X̄m −µ) √ 
σ m X̄m − µ
Tm = q = ∼ T (m − 1)
2
(m−1)Sm Sm
σ2
/(m − 1)

suit une√loi de student de paramètre (m − 1). Remaryue : Lorsque σ est connue, on


utilise m(Xσm −µ) ∼ N (0, 1). Si σ est inconnu, "ion par son écart-type estúné Sm
pour obtenir la statistique Tm ∼ T (m − 1).
 
On a donc P |Tm | ≤ tm−11−α/2 = 1 − α. D’où l’intervalle de confiance de niveau 1 − α
pour µ :
tm−1
1−α/2 Sm tm−1
1−α/2 Sm
X̄m − √ ≤ µ ≤ X̄m + √
m m
De même, on obtient l’intervalle de confiance pour µ0 :

tn−1 0
1−α/2 Sn
n−1
t1−α/2 Sn0
X̄n0 − √ ≤ µ0 ≤ X̄n0 + √
n n

Application Numérique : On lit sur la table de statistique pour α = 0.05 : t15


0.975 =
2.1314 et Application Numérique : On lit sur la table de statistique pour
t0.975 =2.1448 d’où les intervalles de confiance de niveau 95%

µ ∈ [119.63, 133.37], µ0 ∈ [130.31, 143.49].


2 et une
2. Pour déterminer un intervalle de confiance pour σ, on utilise l’estimateur Sm
2
loi du χ2 . On sait que (m−1)S
σ2
m
∼ χ2 (m − 1) d’ou
2
 
m−1 (m − 1)Sm m−1
P kα/2 ≤ ≤ k1−α/2 = 1 − α
σ2
En isolant σ. on obtient lintervalle de confiance de niveay 1 − α
s s
m−1 m−1
Sm m−1 ≤ σ ≤ Sm m−1
k1−α/2 kα/2

et de même, on obtint l’intervalle de confiance pour σ 0 :


s s
0 n−1 0 0 n−1
Sn n−1 ≤ σ ≤ Sn n−1
k1−α/2 kα/2
15
Application Numérique : On lit sur la table de statistique k0.025 15
=6.2621.k0.975 =27.4884
14
k0.025 14
=5.6287 et k0.975 =26.1186 d’ou les intervalles de confiance de niveau 95%:

σ ∈ [9.53, 19.97], σ 0 ∈ [8.712, 18.77]

3. Pour déterminer un intervalle de confiance de σ 0 /σ, on utilise l’estimateur Sn0 /Sm


2 02
et une loi de Fisher-Snedecor. On sait que (m−1)Sσ2
m
et (n−1)S
σ 02
n
sont indépendantes
et de lois respectives χ2 (m − 1) et χ2 (n − 1). On en déduit que la statistique :
(m−1)Sm 2

σ2
/(m − 1) σ 2 Sm2
Fm,n = 02 = ∼ F(m − 1, n − 1),
(n−1)Sn
/(n − 1) σ 2 Sn02
σ 02

Licence Informatique Page 10/16 24 février 2021


Faculté Sciences Exactes Université Djillali Liabès
Département Informatique Mod:Probabilités-Statistique

suit une loi de Fisher-Snederor a (m − 1, n − 1) degrís de libertés. Donc


 h i
m−1,n−1 m−1,n−1
P Fm,n ∈ fα/2 , f1−α/2 = 1 − α.

D’où l’intervalle de confiance pour σ 0 /σ de niveau 1 − α :


Sn0 q m−1,n−1 S 0 q m−1,n−1
fα/2 ≤ σ 0 /σ ≤ n f1−α/2
Sm Sm
15,14 15,14
Application Numérigue : On nous donne f0.025 = 0.339 et f0.975 = 2.95 d’où l’in-
tervalle de confiance de niveau 95%

σ 0 /σ ∈ [0.537, 1.58]

Conclusion : la valeur σ 0 /σ = 1 appartient a lintervalle de confiance de niveau 95%


ci-dessus done on ne peut pas rejeter l’hypothèse σ 0 = σ.

3 Intervalle de Confiance

Exercice 17.  Des essais en laboratoire sur 20 lampes miniatures donnent les durées de
vie suivantes, en heures :

451, 412, 412, 375, 407, 454, 375, 393, 355, 364, 414, 413, 345, 432, 392, 329, 439, 381, 451, 413.

On suppose la durée de vie distribuée normalement. Estimer par un intervalle de confiance


95% la durée de vie moyenne.
Solution :

corrigé succint : Les estimations ponctuelles de l’espéance, de l’écart-type et de la


variance sont respectivement

x = 400.35 s = 36.01 s2 = 1297.



Alors n X̄−µ suit une loi de Student à 19 degrés de liberté, et donc l’espérance de X̄ sera
s √ √
dans 95% des cas dans l’intervalle [x̄ − t(0.95)s/ n, x̄ + t(0.95)s/ n], et on lit à partir
de la table de la loi de Student à 19 degrés de liberté, t(0.95) = 2.093, donc l’intervalle
cherché est :
µ ∈ [383.5 , 417.2]
(complément hors-programme : estimation de l’écart-type par intervalle de confiance :
X suit une loi normale, donc (n − 1)s2 /σ 2 suit une loi du χ2 à n − 1 degré de liberté, donc
σ 2 est avec une probabilité de 95% dans l’intervalle

(n − 1)s2 /c21 , (n − 1)s2 /c22


 

pour c21 ' 32.8523 et c22 ' 8.9065 (lus dans la table du χ2 à 19 degrés de liberté), soit
2
σ ∈ [750.11, 2766.86], et donc l’écart-type a 95% de chances de vérifier σ ∈ [27.39, 52.6]
Exercice 18. 
Une machine fabrique des billes métalliques dont le poids, mesuré en grammes, suit
une loi normale. Nous prélevons au hasard 10 billes. Leurs poids sont

19, 6; 20; 20, 2; 20, 1; 20; 19, 9; 20; 20, 3; 20, 1; 19, 8.

Licence Informatique Page 11/16 24 février 2021


Faculté Sciences Exactes Université Djillali Liabès
Département Informatique Mod:Probabilités-Statistique

1. Quel est l’intervalle de confiance à 95% du poids des billes métalliques fabriquées ?
2. En réalité, l’écart-type σ de la population est connu et égal à 0, 2. Quel est l’intervalle
de confiance à 95% du poids des billes métalliques fabriquées ?
Solution :

1. On calcule la moyenne µ
b de l’échantillon :

µ
b = 20

Calculons la variance corrigée puis l’écart-type corrigé de l’échantillon à partir de


la moyenne de l’échantillon

10 19, 62 + 202 + · · · + 19, 82


 
2 2
sc = − 20 = 0, 04
9 10

puis p
sc = 0, 04 = 0, 2
Dans la table de la loi de Student, pour 9ddl, on trouve

P[|T | > 2, 26] = 0, 05 ou P[|T | < 2, 26] = 0, 95.

L’intervalle de confiance pour le poids moyen est donc


h i
20 − 2, 26 × √0,2
10
; 20 + 2, 26 × 0,2

10
' [19, 86; 20, 14].

2. Si l’écart-type de la population est connu, on utilise la loi normale :

P[|U | > 1, 96] = 0, 05 ou P||U |< 1, 96] = 0, 95.

L’intervalle de confiance pour le poids moyen est donc :


h i
20 − 1, 96 × √0,2
10
; 20 + 1, 96 × 0,2

10
' [19, 88; 20, 12].

Exercice 19. 
Voulant évaluer rapidement les résultats obtenus par ses 200 étudiants ingénieurs lors
d’un partiel, un professeur décide de corriger quelques copies tirées au hasard. Il admet
par ailleurs que les notes de ses étudiants suivent une loi normale de variance 4 .
1. Le professeur corrige un échantillon de 7 copies et trouve une moyenne de 11 . Quel
est l’intervalle de confiance à 95% de la moyenne des 200 copies ?
2. Combien de copies le professeur doit-il corriger s’il veut situer la moyenne générale
de ses étudiants dans un intervalle de confiance d’amplitude 2, avec un risque de
5%?
3. En trouvant une moyenne égale à 11, combien de copies le professeur devraitil cor-
riger pour pouvoir dire, avec un risque de 1%, que la moyenne de tous les étudiants
est supérieure à 10?

Licence Informatique Page 12/16 24 février 2021


Faculté Sciences Exactes Université Djillali Liabès
Département Informatique Mod:Probabilités-Statistique

Solution :
La moyenne des notes
1. L’intervalle de confiance de la moyenne des 200 copies est :
h i
11 − 1, 96 × √27 ; 11 + 1, 96 × √27
' [9, 52; 12, 48].
1
2. Si l’amplitude de l’intervalle de confiance est égale à 2, on doit avoir
2
1, 96 × √ = 1
n
ce qui donne
n ' 15, 4
En corrigeant 16 copies, l’enseignant peut situer la moyenne de ses étudiants.
3. Il faut que l’intervalle de confiance à 99% soit égal à [10; 12]. On doit donc avoir :
2
2, 575 × √ = 1
n
ce qui donne
n ' 26, 5
Si l’enseignant corrige 27 copies et qu’il trouve une moyenne égale à 11, il peut dire
que la moyenne de ses étudiants est supérieure à 10 , avec un risque d’erreur de 1%.

Exercice 20. 
Une entreprise fabrique un certain type de composants électroniques dont la durée
de vie X, exprimée en heures, est une variable aléatoire. Des mesures effectuées sur un
échantillon aléatoire de taille 50 ont donné les résultats suivants :
50
X 50
X
xi = 60000; x2i = 74 × 106
i=1 i=1

1.Donner une estimation ponctuelle de la durée de vie moyenne des composants.


2.Donner une estimation ponctuelle de l’écart-type de cette durée de vie.
3.Donner l’intervalle de confiance à 95%, puis à 99% de cette durée de vie moyenne.
4.Quelle aurait du être la taille de l’échantillon pour que l’intervalle de confiance à
95% de la durée de vie moyenne des composants ait une amplitude de 60 heures ?
Solution :

1. La moyenne µ de la population est estimée par la moyenne de l’échantillon


60000
µ
b= = 1200
50
2. L’écart-type σ de la population est estimé à partir de l’écart-type sc de l’échantillon :
6
s2 = 74×10
50 − 12002 = 40000
s2c = s2 × 50
49 = 40816

D’où
sc ' 202

Licence Informatique Page 13/16 24 février 2021


Faculté Sciences Exactes Université Djillali Liabès
Département Informatique Mod:Probabilités-Statistique

3. La variance de la population étant estimée, on utilise la loi de Student. On trouve


dans la table pour 49 ddl :
P||T |> 2, 01] = 0, 05 ou P[|T | < 2, 01] = 0, 95.
L’intervalle de confiance à 95% de la moyenne est :

' [1143; 1257].


On trouve dans la table pour 49ddl :
P||T |> 2, 68] = 0, 01 ou P[|T | < 2, 68] = 0, 99
L’intervalle de confiance à 99% de la moyenne est :
h i
202 202
1200 − 2, 68 × √ 50
; 1200 + 2, 68 × √
50
' [1123; 1277].

4. Puisque l’on souhaite avoir une amplitude de 60 heures, la taille de l’échantillon est
nécessairement supérieure à 50 et nous sommes dans les conditions d’utilisation de
la loi normale. On doit avoir :
202
1, 96 × √ = 30
n
ce qui donne
n ' 175

Exercice 21. 
À la veille d’une consultation électorale, nous effectuons un sondage.
1. Dans un échantillon représentatif de 1000 personnes, 500 personnes déclarent vouloir
voter pour X, 250 pour Y et 50 pour Z. Donner les intervalles de confiance à 95%
et 99% du pourcentage de personnes ayant l’intention de voter X, Y ou Z.
2. Nous évaluons le pourcentage de personnes ayant l’intention de voter pour un qua-
trième candidat, H, à 17% ? Combien faut-il interroger de personnes pour obtenir
un intervalle de confiance à 95% du pourcentage de personnes ayant l’intention de
voter H, avec une précision de 1%?
Solution :

1. Avec 1000 personnes, on peut déterminer un intervalle de confiance. L’intervalle


de confiance à 95% de la proportion de personnes ayant l’intention de voter pour
Monsieur Dupont est :
 q q 
0,5×0,5 0,5×0,5
0, 5 − 1, 96 × 1000 ; 0, 5 + 1, 96 × 1000

' [0, 469; 0, 531].


L’intervalle de confiance a 95% de la proportion de personnes ayant l’intention de
voter pour Monsieur Durand est :
 q q 
0,25×0,75 0,25×0,75
0, 25 − 1, 96 × 1000 ; 0, 25 + 1, 96 × 1000

' [0, 223; 0, 277].

Licence Informatique Page 14/16 24 février 2021


Faculté Sciences Exactes Université Djillali Liabès
Département Informatique Mod:Probabilités-Statistique

L’intervalle de confiance à 95% de la proportion de personnes ayant l’intention de


voter pour Monsieur Duroc est
 q q 
0,05×0,95 0,05×0,95
0, 05 − 1, 96 × 1000 ; 0, 05 + 1, 96 × 1000

' [0, 036; 0, 064].

L’intervalle de confiance à 99% de la proportion de personnes ayant l’intention de


voter pour Monsieur Dupont est
 q q 
0,5×0,5 0,5×0,5
0, 5 − 2, 575 × 1000 ; 0, 5 + 2, 575 × 1000

' [0, 459; 0, 541].

L’intervalle de confiance à 99% de la proportion de personnes ayant l’intention de


voter pour Monsieur Durand est :
 q q 
0,25×0,75 0,25×0,75
0, 25 − 2, 575 × 1000 ; 0, 25 + 2, 575 × 1000

' [0, 215; 0, 285].

L’intervalle de confiance a 99% de la proportion de personnes ayant l’intention de


voter pour Monsieur Duroc est :
 q q 
0, 05 − 2, 575 × 0,05×0,95
1000 ; 0, 05 + 2, 575 × 0,05×0,95
1000

' [0, 032; 0, 068].

2. Pour un échantillon de taille n (on suppose n > 1000 ), l’intervalle de confiance à


95% du pourcentage de personness ayant l’intention de voter Duval est
" r r #
0, 17 × 0, 83 0, 17 × 0, 83
0, 17 − 1, 96 × ; 0, 17 + 1, 96 ×
n n

Puisque l’on veut une précision de 1%, cet intervalle de confiance doit être l’intervalle
[0, 16; 0, 18] Et on doit avoir
r
0, 17 × 0, 83
1, 96 × = 0, 01
n
ce qui donne
n ' 5420.

Exercice 22. 
On veut étudier la proportion p de gens qui vont au cinéma chaque mois. On prend
donc un échantillon de taille n = 100. Soit N le nombre de personnes dans l’échantillon
qui vont au cinéma mensuellement.
1. Quelle est la loi de N ? Par quelle loi peut-on l’approcher et pourquoi ? En déduire
une approximation de la loi de F = N/n.
2. On observe une proportion f de gens qui vont chaque mois au cinéma. Donner la
forme d’un intervalle de confiance pour p, de niveau de confiance 1 − α.

Licence Informatique Page 15/16 24 février 2021


Faculté Sciences Exactes Université Djillali Liabès
Département Informatique Mod:Probabilités-Statistique

3. Applications numériques : f = 0, 1, 1 − α = 90%, 95%, 98%.


Solution :

1. On suppose que les personnes ont bien été interrogées indépendamment. Ainsi, on
a un schéma de Bernoulli : une personne interrogée va au cinéma chaque mois −→
SUCCES, sinon, ECHEC. Et donc N suit une loi binomiale B(n = 100, p)
 
100
P[X = k] = pk (1 − p)100−k , k = 0, . . . , 100
k

Comme n ≥ 20, si np > 5 et n(1−p) > 5 (à vérifier lorspde l’application numérique),


on peut approcher cette loi par
 q la loi normale
 N (np, np(1 − p)), et donc F suit
p(1−p)
approximativement la loi N p, n
 q q 
p(1−p) p(1−p)  
2. IC f − zα/2 n , f + zα/2 n où P Z ≥ zα/2 = α/2, Z de loi normale
centrée réduite, 1 − α est le niveau de confiance.
3. f = 0.1
−1 − α = 90%, zα/2 = 1.645, IC [0.05,0.15]
−1 − α = 95%, zα/2 = 1.96, IC [0.04,0.16]
−1 − α = 98%, zα/2 = 2.326, IC [0.03,0.17].

Exercice 23. 
On suppose que le poids d’un nouveau né est une variable normale d’écart-type égal à
0, 5 kg. Le poids moyen des 49 enfants nés au mois de Décembre 2019 dans l’hôpital de la
ville a été de 3, 6 kg.
1. Déterminer un intervalle de confiance à 95% pour le poids moyen d’un nouveau né
dans cet hôpital.
2. Quel serait le niveau de confiance d’un intervalle de longueur 0,1 kg centré en 3,6
pour ce poids moyen ?
Solution :

1. IC de niveau de confiance 95% pour le poids moyen (zα/2 = 1.96) :


h σ σi
x̄ − 1.96 , x̄ + zα/2 = [3.46, 3.74]
7 7
2.
h i
−0.05
P[X̄ − 0.05 ≤ m ≤ X̄ + 0.05] = P ≤ X̄−m
√ ≤ 0.05
σ/7  σ/ n σ/7
0.05
= 2F 0.5/7 = 2F (0.7) − 1 = 2 ∗ 0.758 − 1 = 0.516.

Le niveau de confiance est donc 0.516.

Licence Informatique Page 16/16 24 février 2021

Vous aimerez peut-être aussi