Statistique Cours-2-1-39-1

Université Abdelmalek Essaâdi
Ecole Nationale des Sciences Appliquées

Tanger
Statistique Inférentielle
GINF1& GSTR1& GSEA1
Ahmed DRISSI
[email protected]
Ahmed DRISSI ENSA Tanger Page 1

Préambule
Ces notes de cours sont destinées aux étudiants de la première année du cycle des ingénieurs,
des filières : Génie Informatique, Génie des Systèmes de Télécommunications et Réseaux ;
Génie des Systèmes Electroniques et Automatique de l’Ecole Nationale des Sciences
Appliquées, Tanger. Elles ont été rédigées, conformément au programme accrédité, dans le
but d’aider les étudiants à consolider leurs acquis en statistiques et probabilités et à maitriser
les nouvelles notions introduites dans ce cours. Les démonstrations de certains résultats de ce
polycopié, ainsi que plusieurs exemples et exercices seront données au tableau pendant les
séances de cours. Il est donc indispensable que l’étudiant assiste au cours et prend des notes,
pour qu’il puisse bien assimiler ce cours de statistiques inférentielle. Je serai reconnaissant à
tout lecteur qui aura l’amabilité de me signaler des erreurs que peut comporter ce manuscrit
ou de me suggérer une idée pour le parfaire.
Ahmed DRISSI
Pré-requis
1. La statistique descriptive (programmé à l’AP1)

2. Les probabilités (programmé à l’AP2)
Ouvrages Conseillés
1. Les fondements probabilistes des méthodes statistiques. Composé par Economica. Paris. France
janvier 1989. Europe Media Duplication SA.
2. FOUNDATIONS OF DESCRIPTIVE AND INFERENTIAL STATISTICS. HENK VAN ELST
August 30, 2019
3. An Introduction to Statistical Inference and Data Analysis. Michael W. Trosset1 April 3, 2001

Contenu
Préambule ......................................................................................................................................... 2
Pré-requis .......................................................................................................................................... 2
Ouvrages Conseillés .......................................................................................................................... 2
Chapitre 1 : Rappel sur les lois des variables aléatoires ...................................................................... 5
I- Les variables aléatoires .......................................................................................................... 5
II- Les lois des variables aléatoires discrètes ............................................................................ 6
1. La loi de Bernoulli ............................................................................................................. 6
2. La loi binomiale ................................................................................................................. 7
3. La loi de poisson ................................................................................................................ 7
III- Les lois des variables aléatoires continues .......................................................................... 7
1. La loi uniforme .................................................................................................................. 7
2. La loi exponentielle ............................................................................................................ 8
3. La loi normale (ou de Gauss).............................................................................................. 9
4. La loi khi-deux ................................................................................................................. 10
5. La loi de Student .............................................................................................................. 10
6. Loi de Fisher .................................................................................................................... 11
IV- Convergence et Approximations des lois .......................................................................... 11
1. Définitions ....................................................................................................................... 11
2. La convergence vers la loi normale................................................................................... 11
3. La convergence de la loi binomiale vers la loi de poisson ................................................. 13
Chapitre 2 : L’Échantillonnage ........................................................................................................ 14
I- Étude de la moyenne/écart type d'un échantillon ................................................................... 14
II- Étude d'une proportion dans un échantillon ....................................................................... 15
Chapitre 3 : L’Estimation ................................................................................................................ 17
I- Généralités sur les estimateurs ............................................................................................. 17
II- Estimation de la moyenne/écart type d’une population...................................................... 17
1- Estimation ponctuelle ....................................................................................................... 17
2- Estimation par intervalle de confiance .............................................................................. 20
III- Estimation d’une proportion ............................................................................................. 22
1- Estimation ponctuelle ....................................................................................................... 22
2- Estimation par intervalle de confiance .............................................................................. 23
Chapitre 4 : Les tests statistiques ..................................................................................................... 24
I- Généralités ........................................................................................................................... 24

II- Test de conformité ........................................................................................................... 26
A- Test de conformité de la moyenne ................................................................................ 27
B- Test de conformité de la variance ................................................................................. 28
C- Test de conformité de la proportion .............................................................................. 28
III- Test de comparaison ......................................................................................................... 29
A- Comparaison de deux moyennes ................................................................................... 29
B- Comparaisons de deux variances .................................................................................. 29
C- Comparaisons de deux proportions ............................................................................... 29
IV- Test de khi-deux ............................................................................................................... 30
A- Test du χ2 d’adéquation à une loi théorique ................................................................. 30
B- Test du χ2 d’indépendance .......................................................................................... 33
C- Test du χ2 d’homogénéité ........................................................................................... 34
Exercices ......................................................................................................................................... 36

Chapitre 1 : Rappel sur les lois des
variables aléatoires
I- Les variables aléatoires
1. Définitions
- Une variable aléatoire est une variable associée à une expérience ou un ensemble
d’expériences aléatoires et servant à caractériser le résultat de cette expérience ou cet
ensemble d’expériences.
- On note 𝑝(𝑋 = 𝑘) la probabilité que la variable aléatoire 𝑋 prenne la valeur 𝑘.
- L’ensemble des valeurs admissibles 𝑘 et probabilités 𝑝(𝑋 = 𝑘) constitue une distribution
de probabilité.
- La relation entre 𝑘 et 𝑝(𝑋 = 𝑘) est appelé une loi de probabilité.
- La fonction 𝐹 (𝑥 ) = 𝑝(𝑋 ≤ 𝑥 ) est dite fonction de répartition de la variable aléatoire 𝑋.
2. Les variables aléatoires continues
Définition
Soit 𝑋 une variable aléatoire de fonction de répartition 𝐹. 𝑋 est dite Variable aléatoire
𝑥
continue s’il existe une fonction positive 𝑓 tell que 𝐹 (𝑥 ) = ∫−∞ 𝑓 (𝑡)𝑑𝑡 , ∀𝑥 ∈ 𝑅.
La fonction 𝑓 est appelée la densité de probabilité de 𝑋.
Propriété
Toute fonction de densité de probabilité 𝑓 d’une variable aléatoire 𝑋 vérifie les conditions
suivantes :
+∞
i. ∫−∞ 𝑓 (𝑡)𝑑𝑡 = 1
𝑏
ii. 𝑝(𝑎 ≤ 𝑋 ≤ 𝑏) = 𝐹 (𝑏) − 𝐹(𝑎) = ∫𝑎 𝑓(𝑡)𝑑𝑡
iii. Si f est continue en 𝑥0 alors on a
- 𝐹 est derivable en 𝑥0
- 𝐹 ′ (𝑥0 ) = 𝑓(𝑥0 )
Remarque
La fonction de densité de probabilité 𝑓 est appelé aussi la loi de 𝑋.
Exercice d’application
Soit 𝑋 une variable aléatoire continue qui représente la durée de vie (exprimée en heures)
d’un équipement dont la fonction de densité est donnée par
𝑎
𝑓 (𝑥 ) = {𝑥 3 𝑠𝑖 𝑥 ≥ 100
0 𝑠𝑖𝑛𝑜𝑛
a) Déterminer 𝑎
b) Calculer la probabilité pour que l’équipement fonctionne encore après 200h
+∞ +∞ 𝑎 𝑎
1 = ∫−∞ 𝑓(𝑥 )𝑑𝑥 = ∫100 𝑑𝑥 = 200000 ⇒ 𝑎 = 200000 .
𝑥3
200 1 1
𝑝(𝑋 > 200) = 1 − 𝑝(𝑋 ≤ 200) = 1 − 𝐹 (200) = 1 − 200000 ∫−∞ 𝑑𝑥 = 4.
𝑥3
Après 200heures on aura environ 25% de chance que l’équipement fonctionne.
3. Les caractéristiques d’une variable aléatoire

i) L’espérance mathématique
Définition

On appelle espérance mathématique la valeur moyenne de la variable aléatoire, elle remplace
la moyenne arithmétique dans le cas d’une variable statistique.
Cas discret : 𝐸 (𝑋) = ∑ 𝑘𝑝(𝑋 = 𝑘)
+∞
Cas continu : 𝐸 (𝑋) = ∫−∞ 𝑥𝑓 (𝑥 )𝑑𝑥
ii) La variance
Définition
La variance d’une variable aléatoire 𝑋 notée 𝑉 (𝑋) = 𝐸 (𝑋 2 ) − (𝐸(𝑋))2
+∞
Avec 𝐸 (𝑋 2 ) = ∫−∞ 𝑥 2 𝑓 (𝑥 )𝑑𝑥 dans le cas continu et 𝐸 (𝑋 2 ) = ∑ 𝑘 2 𝑝(𝑋 = 𝑘) dans le cas
discret.
𝜎(𝑋) = √𝑉(𝑋) : l’écart type de la variable aléatoire 𝑋.
Propriétés
Soient 𝑎 et 𝑏 deux canstantes et 𝑋 une variable aléatoire
1. 𝐸 (𝑎) = 𝑎 et 𝑉 (𝑎) = 0
2. 𝐸 (𝑎𝑋 + 𝑏) = 𝑎𝐸 (𝑋) + 𝑏
3. 𝑉 (𝑎𝑋 + 𝑏𝑌) = 𝑎2 𝑉 (𝑋) + 𝑏2 𝑉 (𝑌) + 2𝑎. 𝑏. 𝑐𝑜𝑣(𝑋, 𝑌) où 𝑐𝑜𝑣 (𝑋, 𝑌) = 𝐸(𝑋 −
𝐸 (𝑋))(𝑌 − 𝐸 (𝑌)) = 𝐸 (𝑋𝑌) − 𝐸 (𝑋). 𝐸(𝑌) et 𝑌 une variable aléatoire continue.
Exemple
1 2
𝑥 𝑠𝑖 0 < 𝑥 < 3
Soit 𝑋 une variable aléatoire de fonction de densité 𝑓 définie par 𝑓(𝑥 ) = {9
2 2
𝐸 (𝑋) = 2.25. 𝑉 (𝑋) = 𝐸 (𝑋 ) − (𝐸(𝑋)) = 5.4 − 5.06 = 0.34
Exercice 1
Soit 𝑋 une variable aléatoire qui désigne la demande mensuelle d’un produit dont la fonction
de densité est définie par :
𝑎𝑒 −𝑎𝑥 𝑠𝑖 𝑥 ≥ 0
𝑓 (𝑥 ) = {
i) Vérifie que 𝑓 est une densité de probabilité de 𝑋.

ii) Calculer la demande mensuelle moyenne
iii) Calculer la variance de cette demande
iv) Donner l’expression de la fonction de répartition
Exercice 2
Le producteur de certaines lampes d’éclairage affirme que ses lampes durent en moyenne 3
ans avec un écart type de 0.4 ans. Une lampe a été choisie au hasard dans sa production. Que
peut on peut dire de la probabilité que cette lampe dure :
1- Moins de 24 mois ou plus de 48 mois.
2- Plus de 18 mois et moins de 54 mois.
II- Les lois des variables aléatoires discrètes
1. La loi de Bernoulli
La loi de Bernoulli intervient dans le cas d’une seule expérience aléatoire à laquelle on
associe un évènement aléatoire quelconque. On dit que 𝑋~𝐵(𝑝) = 𝐵 (1, 𝑝) si la variable
aléatoire 𝑋 caractérise le nombre de succès au cours d’une seule expérience, elle prend les
valeurs 0 (échec) ou 1 (succès) avec 𝑝(𝑋 = 1) = 𝑝 et 𝑝(𝑋 = 0) = 1 − 𝑝

𝐸 (𝑋) = 𝑝; 𝑉 (𝑋) = 𝑝(1 − 𝑝); 𝜎 (𝑋) = √𝑝(1 − 𝑝)
2. La loi binomiale
Soit 𝑋 une variable aléatoire qui caractérise le nombre de succès au cours de n expériences
aléatoires indépendantes 𝑋 prend une valeur 𝑘 ∈ {0,1, … 𝑛} avec la probabilité 𝑝(𝑋 = 𝑘) =
𝐶𝑛𝑘 𝑝𝑘 (1 − 𝑝)𝑛−𝑘 . On dit que 𝑋 suit la loi binomiale de paramétre (𝑛, 𝑝). On note 𝑋~𝐵(𝑛, 𝑝).
𝐸 (𝑋) = 𝑛𝑝; 𝑉 (𝑋) = 𝑛𝑝(1 − 𝑝); 𝜎(𝑋) = √𝑛𝑝(1 − 𝑝).
Exemples
- Le lancement d’une pièce de monnaie n fois (pile ou face) ;
- La qualité d’un produit (bon ou défectueux) dans un échantillon de n pièces.
- Sondage électorale (pour ou contre) sur un échantillon de n voix.
3. La loi de poisson
Elle convient pour la description des événements, dont les chances de réalisation sont faibles
et le nombre de réalisations varie de 0 à l’infini, ainsi que la fréquence moyenne est connue.
Exemples
Nombre de naissances dans un intervalle de temps.
Nombre d’appels reçus par un standard téléphonique.
Nombre de visiteurs d’un centre commercial.
𝜆𝑘 𝑒 −𝜆
𝑝( 𝑋 = 𝑘 ) = , 𝑘 = 0,1,2 … ; 𝑋~𝑃(𝜆) ; 𝐸 (𝑋) = 𝜆 = 𝑣𝑎𝑟(𝑋)
𝑘!
Le nombre moyen de patients qui arrivent à la salle d’urgence d’un hôpital par heure est de
10. Quelle est la probabilité que dans la prochaine heure moins de 4 patients arrivent ?
10
𝑋~𝑃(10) ; 𝑝(𝑋 < 4) = 𝑝(𝑋 = 0) + 𝑝(𝑋 = 1) + 𝑝(𝑋 = 2) + 𝑝(𝑋 = 3) = 𝑒 −10 (1 + 1! +
102 103
+ ) ≈ 0.01
2! 3!
III- Les lois des variables aléatoires continues

1. La loi uniforme
Définition
Une variable aléatoire continue 𝑋 suit une loi uniforme sur un intervalle [𝑎, 𝑏], si sa fonction
de densité est donnée par
1
𝑠𝑖 𝑎 ≤ 𝑥 ≤ 𝑏
𝑓 (𝑥 ) = {𝑏−𝑎 , on écrit 𝑋~𝑈([𝑎, 𝑏])
Sa fonction de répartition est
0 𝑠𝑖 𝑥 ≤ 𝑎
𝑥−𝑎
𝐹 (𝑥 ) = { 𝑠𝑖 𝑎 ≤ 𝑥 ≤ 𝑏
𝑏−𝑎
1 𝑠𝑖 𝑥 > 𝑏
𝑎+𝑏 (𝑎+𝑏)2
𝐸 (𝑋 ) = ; 𝑉 (𝑋 ) = .
2 12
Exemple

Un étudiant qui se trouve dans un arrêt de bus et qui s’interroge sur le temps qu’il doit rester
en attente du prochain bus. Sachant que le bus passe toute les 60 min et qu’il n’y a aucune
information ni sur l’heure du dernier bus ni sur l’heure du prochain. Quelle est le temps
moyen que cet étudiant doit attendre jusqu’à l’arrivée du prochain bus ?
𝑥−0
𝑠𝑖 0 ≤ 𝑥 ≤ 60 60+0 (60−0)2
𝐹(𝑥 ) = {60−0 et 𝐸 (𝑋) = 2 = 30 𝑚𝑖𝑛 ; 𝑣𝑎𝑟(𝑋) = 12 = 300; 𝜎 =
√300 ≈ 17 𝑚𝑖𝑛
2. La loi exponentielle
Description
La loi exponentielle est l’intervalle de temps qui sépare deux événements par exemple :
- L’intervalle de temps séparant deux pannes consécutives.
- Durée de vie d’une pièce
- Intervalle de temps séparant deux arrivés consécutifs à un guichet.
Définition
Une variable aléatoire 𝑋 suit une loi exponentielle de paramétre 𝜆 si sa fonction de densité 𝑓
est définie par
−𝜆𝑥
𝑓 (𝑥 ) = {𝜆𝑒 𝑠𝑖 𝑥 ≥ 0 et on écrit 𝑋~𝐸𝑥𝑝(𝜆)
Les caractéristiques de la loi exponentielle
−𝜆𝑥
Fonction de répartition 𝐹(𝑥 ) = {1 − 𝑒 𝑠𝑖 𝑥 ≥ 0
1 1
L’espérance 𝐸 (𝑋) = 𝜆 ; la variance 𝑉 (𝑋) = 𝜆2
Exemple
Soit 𝑋 une variable aléatoire continue qui désigne la durée d’une conversation téléphonique
1
mesurée en min (i.e 𝑋~𝐸𝑥𝑝(𝜆) où 𝜆 = 10. Supposons qu’un étudiant arrive à un cabinet
téléphonique et quelqu’un passe juste devant lui. Quelle est la probabilité d’attente par cet
étudiant
i) Plus de 10min
ii) Entre 10 et 12 min.
𝑝(𝑋 > 10) = 1 − 𝑝(𝑋 ≤ 10) = 1 − 𝐹(10) = 𝑒 −1 .
𝑝(10 ≤ 𝑋 ≤ 12) = 𝐹(20) − 𝐹 (10) = 𝑒 −1 − 𝑒 −2 .
Soit 𝑋 une variable aléatoire continue qui représente la durée de vie d’un système
électronique. Supposons que la durée de vie moyenne est 400h.
i) Quelle est la loi de 𝑋 ?
ii) Donner la fonction de répartition de 𝑋.
iii) Calculer 𝐸(𝑋) et 𝑉(𝑋).
1
𝐸 (𝑋) = 400ℎ = 𝜆.
𝑋~𝑒 1/400 .

1
𝑥
𝐹(𝑥 ) = {1 − 𝑒 400 𝑠𝑖 𝑥 ≥ 0 ;
1
𝐸 (𝑋) = = 400ℎ ;
𝜆
1
𝑣 (𝑋) = 𝜆2 = 4002 = 1600ℎ.
3. La loi normale (ou de Gauss)

Description
La loi normale caractérise un phénomène résultant de l’additionnement de plusieurs facteurs
qui sont indépendants. A titre d’exemple les cours d’une action dans la bourse.
Définition
Une variable aléatoire 𝑋 suit une loi normale de paramètres 𝜇 et 𝜎 si sa fonction de densité
1 𝑥−𝜇 2
1
𝑒 −2( )
est définie par 𝑓 (𝑥 ) = 𝜎 , ∀𝑥 ∈ 𝑅 ; on écrit 𝑋~𝑁(𝜇, 𝜎).
𝜎 √2𝜋
Les caractéristiques de 𝑁(𝜇, 𝜎).
+∞ 1 𝑥−𝜇 2
1
𝐸 (𝑋 ) = ∫ 𝑥𝑒 −2( 𝜎
)
𝑑𝑥 =𝜇
−∞𝜎√2𝜋
𝑉 (𝑋 ) = 𝐸 (𝑋 2 ) − 𝐸 (𝑋 )2 = 𝜎 2
Remarque1
𝑋−𝜇
- 𝑋~𝑁(𝜇, 𝜎) ⇔ 𝜎 ~𝑁(0,1)
- Si 𝑌~𝑁(0,1) on dit que 𝑌 suit une loi normale centré réduite.
Preuve de la remarque 1
𝑋−𝜇 𝑎−𝜇
𝑋≤𝑎⇔ ≤ .
𝜎 𝜎
1 𝑥−𝜇 2
𝑋−𝜇 𝑎−𝜇 1 𝑎 − ( )
⇔ 𝑝( ≤ ) = 𝑝 (𝑋 ≤ 𝑎 ) = 𝜎 ∫ 𝑒 2 𝜎 𝑑𝑥 .
𝜎 𝜎 √ 2𝜋 −∞
𝑥−𝜇 1 𝑥−𝜇 1
1 − (𝑢)2 1 − (𝑢)2
=𝜎 ∫𝜎 𝑒 2 𝜎𝑑𝑢 = ∫ 𝜎 𝑒 2 𝑑𝑢 (par changement
√ 𝜋 −∞ √ 𝜋 −∞
variable).
Remarque 2
La loi normale est symétrique : le mode=la moyenne= la médiane.
Remarque 3
La loi normale centrée réduite est tabulée.
1 −𝑎 −1𝑡 2
𝑝(𝑋 ≤ −𝑎) = ∫ 𝑒 2 𝑑𝑡
√𝜋 −∞
1 𝑎 −1𝑡 2 1 +∞ −1𝑡 2
=− ∫ 𝑒 2 𝑑𝑡 = ∫ 𝑒 2 𝑑𝑡 = 𝑝(𝑋 ≥ 𝑎) = 1 − 𝑝(𝑋 ≤ 𝑎)
√𝜋 +∞ √𝜋 𝑎
On note ∅(𝑎) = 𝐹 (𝑎) = 𝑝(𝑋 ≤ 𝑎) = l’aire hachurée sur le graphe.
La valeur de ∅(𝑎) est déterminée à partir de la table normale centré réduite.
Exemple

Soit 𝑋 une variable aléatoire qui représente le résultat d’exploitation mensuel d’une
entreprise. Supposons que 𝑋~𝑁(100,40).
- Calculer la probabilité que 𝑋 soit inféreure à 120.
- Calculer la probabilité que 𝑋 soit compris entre 120 et 180.
𝑋−100 120−100
𝑝(𝑋 < 120) = 𝑝 ( < ) = 𝑝(𝑇 < 0.5) = ∅(0.5) = 0.6915 ; selon la table
40 40
𝑋−100
normale. (∅ la fonction de répartition de 𝑇 = ~𝑁(0,1)).
40
Cette probabilité est représenté par l’aire hachurée.

120 − 100 𝑋 − 100 180 − 100
𝑝(120 < 𝑋 < 180) = 𝑝 ( < < ) = 𝑃(0.5 < 𝑇 < 2)
40 40 40
= ∅(2) − ∅(0.5) = 0.2857
Soit 𝑋 une variable aléatoire qui désigne le poids en kg d’un type de poisson. On suppose que
1 2
1
𝑋 suit la loi normale de fonction de densité 𝑓(𝑥 ) = 𝜎 𝑒 −18(𝑥−10) .
√ 18𝜋
- Donner 𝐸(𝑋) et 𝑉(𝑋)
- Donner la probabilité pour le poids d’un poisson donné est inférieur à 12kg.
- Sachant que le poids d’un type de poisson donné est supérieur à 8kg, donner la probabilité
pour que son poids soit inférieur à 12kg.
- 𝐸 (𝑋) = 10; 𝜎 (𝑋) = 3 ; d’après la formule de la fonction de densité.

𝑋−10 12−10 2 2
- 𝑝(𝑋 ≤ 12) = 𝑝 ( ≤ ) = 𝑝 (𝑇 ≤ 3) = ∅(3) ≈ selon la table 𝑁(0,1).
3 3
4. La loi khi-deux
Définition
Soient 𝑋1 , 𝑋2 , … . 𝑋𝑛 une suite de variable aléatoires indépendantes et identiquement
distribués (iid) tel que 𝑋𝑖 ~𝑁(0,1), ∀𝑖 = 1 … 𝑛 ; on dit que 𝑋 = 𝑋12 + 𝑋22 + ⋯ + 𝑋𝑛2 suit la loi
khi-deux à 𝑛 degrés de liberté et on écrit 𝑋~𝜒𝑛2 .
Les caractéristiques de la loi Khi-deux

𝐸 (𝑋𝑛2 ) = 𝑛.
𝑉 (𝑋𝑛2 ) = 2𝑛.
Remarque
- La loi de 𝜒𝑛2 est tabulée.
5. La loi de Student

Définition
Soient 𝑋, 𝑌1 , 𝑌2 , … . 𝑌𝑛 une suite de variable aléatoires indépendantes et identiquement
𝑋
distribués (iid) tel que 𝑌𝑖 ~𝑁(0,1), ∀𝑖 = 1 … 𝑛 ; et ~𝑁(0,1) . On dit que 𝑇 = 2 2 2
suit
√𝑌1 +𝑌2 +⋯+𝑌𝑛
𝑛
la loi de Student à 𝑛 degré de liberté 𝑇𝑛 .
Remarque
La loi de Student est tabulée.
6. Loi de Fisher
𝑋1
La loi de Fisher 𝐹(𝑢,𝑣) de paramètres (𝑢, 𝑣) est la loi 𝑌 = 𝑢
𝑋2 lorsque 𝑋1 ~𝜒𝑢2 et 𝑋2 ~𝜒𝑣2 et 𝑋1 et
𝑣
𝑋2 sont indépendantes.
𝑣
La moyenne 𝐹(𝑢,𝑣) est 𝑣−2 pour 𝑣 ≥ 3. Une valeur proche de 1 lorsque v est grand.
Une variable qui suit la loi de Fisher ne prend que les valeurs positives.
IV- Convergence et Approximations des lois

1. Définitions
On considère une suite (𝑋𝑛 )𝑛 des variables aléatoires définies sur Ω. 𝑋 une autre variable
aléatoire sur Ω.
- On dit que 𝑋𝑛 converge en probabilité vers 𝑋 si ∀𝜀 > 0 lim 𝑝(|𝑋𝑛 − 𝑋| > 𝜀 ) = 0.
𝑛→∞
𝐿
- On dit que 𝑋𝑛 converge en loi vers 𝑋 (on note 𝑋𝑛 → 𝑋) si pour tout point 𝑥 où 𝐹 est
continue 𝐹𝑛 (𝑥) converge vers 𝐹(𝑥) avec 𝐹𝑛 fonction de répartition de 𝑋𝑛 et 𝐹 fonction de
répartition de 𝑋.
Propriété (admise)
La convergence en probabilité entraine la convergence en loi.
2. La convergence vers la loi normale

i) Théorème centrale limite
Théorème
Si 𝑋1 , 𝑋2 , … . 𝑋𝑛 une suite de variables aléatoires indépendantes et identiquement distribuées
(iid) alors .𝑆𝑛 = 𝑋1 + 𝑋2 + ⋯ + 𝑋𝑛 converge en loi vers la loi normale 𝑁(𝑛𝜇, 𝜎√𝑛) avec
𝐸 (𝑋𝑖 ) = 𝜇 et 𝑉 (𝑋𝑖 ) = 𝜎, ∀𝑖 = 1, … 𝑛.
Preuve (à admettre)
E(Sn ) = E(X1 ) + E(X2 ) + ⋯ . E(Xn ) = nμ . V(Sn ) = V(X1 ) + V(X2 ) + ⋯ . V(Xn ) = nσ2
donc σ(Sn ) = σ√n
Idée : Utilisant le Développement Limité de la fonction caractéristique.
Exemple
Considérons 400 étudiants qui se sont présentés au guichet de la photocopie de
l’établissement pour faire des copies de cours. Sachant que chacun d’eux a payé à la caisse un
montant 𝑀𝑖 , 𝑖 = 1 … 𝑛. Supposons que les 𝑀𝑖 sont des variables aléatoires indépendantes de

même loi inconnue, de moyenne égale à 10 DHs et de variance égale à 25DHs. Donner la
probabilité que la recette totale de service de la photocopie soit supérieur à 4200 DHs.
Soit 𝑅1 = 𝑀1 + 𝑀2 + ⋯ 𝑀400 alors 𝐸 (𝑅) = 400𝜇 = 400 × 10 = 4000.
𝑉 (𝑅) = 𝑛𝜎 2 = 400 × 252 = 10000 ; d’après le théorème centrale limite on aura
𝑅−𝑛𝜇 𝑅−4000 𝑅−4000
= ~𝑁(0,1) donc 𝑝(𝑅 > 4200) = 𝑝 ( > 4200) = 𝑝(𝑇 > 2) = 1 −
√𝑛𝜎 2 100 100
∅(2) = 0.288 selon le tableau des probabilités de la loi normale centré réduite.
ii) La convergence de la loi binomiale vers la loi normale
Théorème
Soit Xn une suite de variable aléatoire. Si X n ~β(𝑛, 𝑝), ∀𝑛 alors Xn converge en loi normale
𝑁(𝑛𝑝, √𝑛𝑝(1 − 𝑝)).
Preuve
On a Xn ~β(𝑛, 𝑝) alors on peut écrire Xn = Y1 + ⋯ + Y𝑛 avec Y𝑖 ~𝛽(𝑃) Bernouilli on a
𝐸 (Xi ) = 𝑛𝐸 (Yi ) = 𝑛𝑝 et 𝑉 (Xn ) = 𝑉 (Y1 ) + ⋯ + 𝑉 (Y𝑛 ) = 𝑝(1 − 𝑝) + ⋯ + 𝑝(1 − 𝑝) =
𝑛𝑝(1 − 𝑝) en effet 𝐸 (Yi ) = 𝑝 et 𝑉(Yi ) = 𝑝(1 − 𝑝). D’après le théorème central limite
𝐿
𝑋𝑛 → 𝑁(𝑛𝑝, √𝑛𝑝(1 − 𝑝)).
Application pratique
𝑛 est suffisamment grande si 𝑛 ≥ 50 ; c’est pourquoi les tables de la loi binominales
s’arrêtent en général à 𝑛 = 50 .
Remarque
On peut assimiler une loi binominale à une loi normale dès que 𝑛𝑝 > 15 et 𝑛𝑝(1 − 𝑝) > 15
ou 𝑛 > 30, 𝑛𝑝 > 5; 𝑛(1 − 𝑝) > 5.
Exemple 1
Etant donné une entreprise qui a distribué des produits de publicité à 1000 ménages. Sachant
que la probabilité pour qu’un ménage ayant reçu le produit soit intéressé par celui-ci est égale
à 0,45. Quelle est la probabilité d’avoir parmi les 1000 ménage 470 ménages intéressés par le
produit da publicité.
Soit 𝑋 le nombre de ménages intéressés par le produit parmi les 1000 ménages. On écrit
𝑋~𝛽 (1000; 0.45).
470
La probabilité recherché est égale à 𝑝(𝑋 = 470) = 𝐶1000 0.45470 0.55530 . vu de la difficulté
du calcul de cette probabilité on sera amené à utiliser l’approximation d’une loi binomiale par
la loi normale.
La probabilité 𝑝 = 0.45 est ni proche de 1 ni proche de 0 or 𝑛 = 100 ≥ 20 donc 𝑛𝑝 ≥ 10 et
𝑛(1 − 𝑝) ≥ 10 alors 𝑋~𝑁(𝑛𝑝; 𝑛(1 − 𝑝)𝑝) = 𝑁(450; 1553) on obtient 𝑝(𝑋 = 470) =
0.0113.
Exemple 2
On lance une pièce de monnaie 1000 fois. Quelle est la probabilité d’obtenir au moins 548
piles ?
Soit 𝑋 la variable aléatoire qui désigne le nombre de piles obtenues ; 𝑝(𝑋 ≥ 548) = 1 −
𝑝(𝑋 < 548) = 1 − 𝑝(𝑋 ≤ 547) ; on peut approcher par la loi normale car 𝑛 = 1000, 𝑛𝑝 =
500 et 𝑛𝑝(1 − 𝑝) = 250 donc
547.5−500
𝑝(𝑋 ≤ 547) = 𝑝 (𝑁(0,1) ≤ 5 10 ) = 0.99863 d’où 𝑝(𝑋 ≥ 548) = 0.00135 une chance
√
sur 1000.

iii) L’approximation de la loi de poisson par la loi normale
Théorème
Si 𝑋𝑛 une suite de variables aléatoires indépendantes de même loi de poisson 𝑃 (𝜆) alors 𝑆𝑛 =
𝐿
𝑋1 + ⋯ + 𝑋𝑛 ~𝑃(𝑛𝜆) et 𝑆𝑛 → 𝑁(𝑛𝜆, √𝑛𝜆).
Preuve
Par récurrence sur 𝑛.
Pour 𝑛 = 1, 𝑆1 = 𝑋1 ~𝑃(𝜆).
Si 𝑆𝑛 ~𝑃(𝑛𝜆) et 𝑋𝑛+1 ~𝑃(𝜆) et puisque 𝑆𝑛 et 𝑋𝑛+1 sont indépendants, 𝑆𝑛+1 = 𝑆𝑛 +
𝑋𝑛+1 ~𝑃(𝑛𝜆 + 𝜆) = 𝑃((𝑛 + 1)𝜆). D’après un résultat précédent on aura
𝐸 (𝑆𝑛 ) = 𝐸 (𝑋1 ) + ⋯ + 𝐸 (𝑋𝑛 ) = 𝑛𝜆 et 𝑉 (𝑆𝑛 ) = 𝑉 (𝑋1 ) + ⋯ + 𝑉 (𝑋𝑛 ) = 𝑛𝜆 Et d’après le
𝐿
théorème central limite 𝑆𝑛 → 𝑁(𝑛𝜆, √𝑛𝜆).
En pratique
Lorsque 𝜆 ≥ 15, on peut approximer la loi de poisson 𝑃(𝜆) par la loi normale 𝑁(𝜆, √𝜆).
Exemple
16!
Si 𝑋~𝑝(16), 𝑝(𝑋 = 16) ≈ 𝑒 −16 16! ≈ 0.0992 ;
En approximant la loi 𝑝(16) par 𝑁(16,4) on obtient 𝑝(𝑋 = 16) ≈ 𝐹(16.5) − 𝐹(15,5) =
0.5 0.5
𝜙 ( 4 ) − 𝜙 (− ) = 2𝜙(0.125) − 1 = 0.0995 .
4
3. La convergence de la loi binomiale vers la loi de poisson
Théorème
Soit 𝑋𝑛 une suite de variable aléatoire. Si 𝑋𝑛 ~𝛽 (𝑛, 𝑝𝑛 ) , lim 𝑛𝑝𝑛 = 𝜆 et lim 𝑝𝑛 = 0 alors
𝑛→+∞ 𝑛→+∞
𝐿
𝑋𝑛 → 𝑋~𝑃(𝜆).
Preuve
∀𝑛, 𝑝(𝑋𝑛 = 𝑘) = 𝐶𝑛𝑘 𝑝𝑛𝑘 (1 − 𝑝𝑛 )𝑛−𝑘 .
𝑛𝑝𝑛
(1 − 𝑝𝑛 )𝑛 = exp 𝑛 ln(1 − 𝑝𝑛 ) = exp 𝑛 ln (1 − ) ; Comme lim 𝑛𝑝𝑛 = 𝜆 on pose 𝑛𝑝𝑛 =
𝑛 𝑛→+∞
𝜆
𝑛𝑝𝑛 𝜆
𝜆 + 𝜀𝑛 avec 𝜀𝑛 → 0 ainsi ln (1 − ̃ − 𝑛 donc lim(1 − 𝑝𝑛 )𝑛 = 𝑒 𝑛(−𝑛) = 𝑒 −𝜆
)∞
𝑛
𝑛(𝑛−1)…(𝑛−𝑘+1) (𝑛𝑝𝑛 )𝑘 1
𝑝(𝑋𝑛 = 𝑘) = 𝑝𝑛𝑘 (1 − 𝑝𝑛 )𝑛−𝑘 = (1 − 𝑝𝑛 )𝑘 (1 − ) … (1 −
𝑘! 𝑘! 𝑛
𝑘−1 𝜆𝑘
) (1 − 𝑝𝑛 )−𝑘 d’où lim 𝑝(𝑋𝑛 = 𝑘) = 𝑒 −𝜆 . 1 ce qui correspond à la probabilité
𝑛 𝑘!
ponctuelle d’une variable aléatoire qui suit la loi de poisson 𝑃(𝜆).
En pratique
On peut remplacer 𝛽(𝑛, 𝑝) par 𝑃 (𝜆) avec 𝜆 = 𝑛𝑝 pour 𝑛 très grande (𝑛 > 50) et 𝑝 très petite
(𝑝 < 0.1).
Exemple
Parmi la production de pièces d’une machine 4% sont défectueuses. On prélève un
échantillon de 100 pièces. 𝑋 : le nombre de pièces défectueuse dans cet échantillon.
𝑋~𝛽 (100,0.04) ≈ 𝑃(𝜆) avec 𝜆 = 100𝑥0.04 = 4.
Calculons 𝑝(𝑋 = 0), 𝑝(< 10) et 𝑝(𝑋 > 5).

Chapitre 2 : L’Échantillonnage
Considérons une population de taille 𝑁 assez importante, dans laquelle on s’interesse à
étudier deux caracteres : l’un quantitatif 𝑋 de moyenne 𝜇 et de variance 𝜎 2 , l’autre qualitatif
𝑌 de paramètre 𝑝. L'objectif de ce chapitre est de répondre à la problématique suivante :
comment, à partir d'informations (couple moyenne-écart-type ou proportion) connues sur une
population, peut-on prévoir celles d'un échantillon ?
L’échantillonnage aléatoire simple sans remise est sans doute plus naturel, mais
L’échantillonnage avec remise offre des propriétés plus intéressantes et surtout plus
commodes mathématiquement. Considérons X1 et X2 les variables aléatoires pour deux
tirages. Dans un échantillonnage sans remise, la valeur que prendra X2 dépend de la valeur
qui aura été prise par X1 par contre pour l’échantillonnage avec remise, X1 et X2 sont
indépendantes et ont la même loi que la loi du caractère étudié X. Si la population était de
taille infinie (en pratique si la population est très grande), tirer au hasard avec ou sans remise
revient à toute fin pratique au même.
I- Étude de la moyenne/écart type d'un échantillon

On considère une population sur laquelle est définie une variable aléatoire X, dont on connaît
l'espérance (ou la moyenne) 𝜇 et l'écart-type 𝜎 .On s'intéresse aux échantillons de taille n.
Auront-ils tous la même moyenne ? Non, certains peuvent être constitués d'éléments
atypiques et avoir une moyenne très différente de celle de la population (surtout si
l'échantillon est de petite taille). Notons 𝑋̅ la variable aléatoire qui, à chaque échantillon de
taille n, associe sa moyenne (𝑋̅ s'appelle encore la distribution des moyennes des
échantillons). Que peut-on dire de cette variable aléatoire 𝑋̅ ?
Théorème Central Limite (Version faible)
Soit une variable aléatoire 𝑋 qui suit une loi normale sur la population 𝑋 ∼ 𝑁(𝜇, 𝜎). On
prélève, au hasard, un échantillon (tirage avec remise) de taille n de moyenne 𝑋̅. Alors la
𝜎
variable aléatoire 𝑋̅ suit également une loi normale: 𝑋̅ ∼ 𝑁 (𝜇, 𝑛).
√
Démonstration
Notons 𝐸 = {𝑥1 , … 𝑥𝑛 } un échantilloa de n éléments prélevés au hasard dans la population.
Pour tout i compris entre 1 et n, notons 𝑋𝑖 , la variable aléatoire correspondant à la valeur du i-
éme élément 𝑥𝑖 , de l'échantillon. Nous savons, par hypothèse, que: 𝐸 (𝑋𝑖 ) = 𝜇 et 𝜎 (𝑋𝑖 ) = 𝜎.
𝑋 +⋯+𝑋
La moyenne 𝑋̅ des n valeurs de l'échantillon est: 𝑋̅ = 1 𝑛 𝑛 . D'après les propriétés de la
loi normale, nous savons qu'une combinaison linéaire de variables aléatoire qui suivent la loi
normale est encore une variable aléatoire qui suit la loi normale. Comme chaque variable
aléatoire 𝑋𝑖 ∼ 𝑁(𝜇, 𝜎) ; la variable aléatoire moyenne 𝑋̅ suit donc également une loi normale.
Calculons ses paramètres.
𝐸(𝑋 )+⋯+𝐸(𝑋𝑛 ) 𝑛𝜇
D'après la propriété de linéarité de l'espérance :𝐸 (𝑋̅) = 1 𝑛 = 𝑛 =𝜇
𝑉(𝑋 )+⋯+𝑉(𝑋 ) 𝑛𝜎 2 𝜎2 𝜎
D'après la propriété de variance, 𝑉 (𝑋̅) = 1 𝑛
= 𝑛2 = 𝑛 𝑑’où 𝜎 (𝑋̅) = 𝑛.
𝑛2 √
Théorème Central Limite (Version forte)
Soit une variable aléatoire 𝑋 qui suit une loi quelconque sur la population avec 𝐸 (𝑋) = μ et
σ(X) = σ. On prélève, au hasard, un échantillon (tirage avec remise) de taille n assez grande,

de moyenne 𝑋̅. Alors la variable aléatoire 𝑋̅ suit approximativement une loi normale: 𝑋̅ ∼
𝜎
𝑁 (𝜇, 𝑛).
√
Remarque
En pratique dans le théorème centrale limite, l’infinie est traduit par 𝑛 assez grande
(généralement si 𝑛 > 30).
𝜎
Il ne faut pas confondre l'écart-type 𝑛 de la variable aléatoire 𝑋̅ (qui est définie sur
√
l'ensemble des échantillons possibles de taille n) avec l'écart-type d'un échantillon prélevé
𝜎
(écart type empirique). Pour éviter cette confusion, la quantité 𝑛 parfois appelée "erreur
√
type".
Résumé
σ
̅~N (μ,
Si la distribution de la population est normale X~N(μ, σ) alors X ).
√n
σ
̅~N (μ,
Si la distribution de la population est inconnue et si n ≥ 30 on aura X ).
√n
Exemple
Les statistiques des notes obtenues en mathématiques au BAC professionnel pour l'année
2014 sont : Moyenne nationale: 𝜇 =10,44 ; Écart-type : 𝜎 = 1,46 ; Une classe de BTS
comporte 35 élèves en 2014/2015 issus d'un BAC professionnel en 2014. Calculer la
probabilité que la moyenne de cette classe soit supérieure à 10.
Ici, nous ne connaissons pas la loi sur la population, mais l'effectif n de l'échantillon est
supérieur à 30. Nous allons donc pouvoir utiliser la version forte du théorème central limite.
Notons 𝑋̅ la variable aléatoire qui, à tout échantillon de taille n=35, fait correspondre sa
𝜎 1.46 𝑋̅−10.44
moyenne. Alors 𝑋̅ ∼ 𝑁 (𝜇, ) = 𝑁 (10.44; ) ; posons 𝑇 = 1.46 ainsi 𝑇 ∼ 𝑁(0; 1).
√𝑛 √35
√35
𝑋̅−10.44 10−10.44
Nous obtenons alors par centrage et réduction:𝑝(𝑋̅ ≥ 10) = 𝑝 ( 1.46 ≥ 1.46 )=
√35 √35
𝑝(𝑇 ≥ −1.78) = 𝑝(𝑇 ≤ 1.78) = 𝜙 (1.78)
Et par lecture directe de la table de la loi normale centrée-réduite : 𝜙(1.87)= 0,9625
Conclusion: il y a environ 96% de chance que, dans cette classe de BTS, la moyenne des
notes au baccalauréat de Mathématiques soit supérieure à 10.
II- Étude d'une proportion dans un échantillon
Cette fois-ci, on suppose une population sur laquelle on étudie un caractère (ou attribut) A
dont on connaît la proportion 𝑝 dans la population. On s'intéresse aux échantillons de taille 𝑛.
La proportion du caractère A dans les échantillons sera-t-elle toujours la même ?
Evidemment non, cette proportion varie en fonction de l'échantillon choisi. Notons 𝐹 la
variable aléatoire qui, à chaque échantillon de taille 𝑛, associe sa proportion du caractère A (F
s'appelle distribution des fréquences des échantillons). Que peut-on dire de cette variable
aléatoire 𝐹?
Théorème
Une population sur laquelle on étudie un caractère A répandu avec une fréquence 𝑝. On
prélève, au hasard, un échantillon (tirage avec remise de taille ≥ 30 ). On note 𝐹 la variable
aléatoire correspondante à la fréquence du caractère A dans l'échantillon. Alors la variable
𝑝(1−𝑝)
aléatoire F suit approximativement une loi normale : 𝐹~𝑁 (𝑝; √ ).
𝑛
Démonstration
Nous allons avoir ici un modèle binomial dont on sait qu'il converge vers la loi normale. Pour
tout 𝑖 compris entre 1 et , notons 𝑋𝑖 , la variable aléatoire définie par :

1 𝑠𝑖 𝑙𝑒 𝑖é𝑚𝑒 é𝑙é𝑚𝑒𝑛𝑡 𝑑𝑒 𝑙 ′ é𝑐ℎ𝑎𝑛𝑡𝑖𝑙𝑙𝑜𝑛 𝑝𝑜𝑠𝑠é𝑑𝑒 𝑙 ′ 𝑎𝑡𝑡𝑟𝑖𝑏𝑢 𝐴
𝑋𝑖 = {
La variable aléatoire 𝑋𝑖 , suit une loi de Bernoulli de paramètre 𝑝 . La variable aléatoire
𝑋 = 𝑋1 + ⋯ + 𝑋𝑛 est donc binomiale de paramètres 𝑛 et 𝑝 : 𝑋~𝐵(𝑛, 𝑝) en conséquence
𝐸 (𝑋) = 𝑛𝑝 et 𝜎(𝑋) = √𝑛𝑝(1 − 𝑝).
𝑋
La variable aléatoire 𝐹 = 𝑛 correspond ainsi à la fréquence de l'attribut A dans l'échantillon
𝐸(𝑋) 𝜎(𝑋)
D'après les propriétés de l'espérance et de l'écart - type : 𝐸 (𝐹 ) = = 𝑝 et 𝜎 (𝐹 ) = =
𝑛 𝑛
𝑝(1−𝑝)
√ .
𝑛
Exemple
Une élection a eu lieu et un candidat a eu 40 % des voix. On prélève un échantillon de 100
bulletins de vote. Quelle est la probabilité que, dans l'échantillon, le candidat ait entre 35 % et
45% des voix ?
Ici , nous avons n = 100 et p = 0,4 . La variable aléatoire F correspondant à la fréquence des
0,4𝑥0,6 0,24
votes pour le candidat dans l'échantillon vérifie donc : 𝐹~𝑁 (0,4; √ ) = 𝑁 (0,4; √ 10 )
100
𝐹−0,4
Posons 𝑇 = √0,24
ainsi 𝑇~𝑁(0,1). Nous obtenons alors par centrage et réduction : 𝑝(0,35 ≤
10
𝐹 ≤ 0,45) = 𝑝(−1,02 ≤ 𝑇 ≤ 1,02) = 2∅(1,02) − 1 et par lecture directe de la table de la
loi normale centrée – réduite ∅(1,02) = 0,84361 d’où 𝑝(0,35 ≤ 𝐹 ≤ 0,45) = 0,6922 . Il y
a donc environ 69 % de chance que, dans un échantillon de taille n = 100, le candidat ait entre
35 et 45 % des voix.
En analysant l’exercice ci-dessus on constate que l’on dispose des informations sur la
population (ici l’ensemble des votes) parce que l’élection a déjà eu lieu. On en déduit des
informations sur l’échantillon. Mais dans la pratique, c’est souvent le phénomène réciproque
que nous étudierons : les élections n’ont pas encore eu lieu et on voudrait retrouver les
informations sur la population grâce un sondage réalisé sur un échantillon. D’où la deuxième
partie de ce polycopié est consacrée à l’estimation.

Chapitre 3 : L’Estimation
L'objectif de ce chapitre est de répondre à la problématique suivante : comment à partir
d'information moyenne/écart-type ou proportion calculées sur un échantillon, retrouver ou
plutôt estimer celles de la population mère ? Et ce avec une précision la plus élevée possible.
L’estimation est le problème réciproque de l'échantillonnage ; c’est l’évaluation d’un
paramètre inconnu 𝜃 de la population par une ou plusieurs valeurs possibles. Quand on
estime 𝜃 par une valeur unique, on parle d’estimation ponctuelle. Quand on estime 𝜃 par un
intervalle de valeurs, on parle d’estimation par intervalle de confiance. La distribution exacte
d’une variable aléatoire 𝑋 modélisant le caractère qui intéresse le staticien est généralement
partiellement connu. Souvent la loi de 𝑋 dépend d’un paramètre inconnu. On cherche à se
faire une idée sur ce paramètre de données observées sur l’échantillon.
I- Généralités sur les estimateurs

Soit 𝑋 une variable aléatoire dont la loi dépend d’un paramètre inconnu 𝜃. Soit
(𝑋1 , 𝑋2 , … . 𝑋𝑛 ) un 𝑛 −échantillon et (𝑥1 , 𝑥2 , … . 𝑥𝑛 ) sa réalisation. Il s’agit d’estimer le
paramètre 𝜃.
Définitions
- Un estimateur d’un paramètre 𝜃 d’une population est une fonction de valeurs
observées 𝑋1 , 𝑋2 , … . 𝑋𝑛 susceptibles de servir à estimer 𝜃 ; on écrit 𝑇𝜃 =
𝑓 (𝑋1 , 𝑋2 , … . 𝑋𝑛 ).
- On appelle erreur d’estimation 𝑇 − 𝜃 ; on écrit 𝑇 − 𝜃 = 𝑇 − 𝐸 [𝑇] + 𝐸 [𝑇] − 𝜃 ; le
terme 𝑇 − 𝐸 [𝑇] traduit la fluctuation de 𝑇 autour de son espérance. Le terme 𝐵(𝑇) =
𝐸 [𝑇] − 𝜃 représente l’erreur systématique et s’appelle biais de l’estimateur.
- Un estimateur 𝑇 de 𝜃 est dit sans biais si 𝐵(𝑇) = 0 (𝐸 [𝑇] = 𝜃 ).
- Un estimateur 𝑇 de 𝜃 est dit asymptotiquement sans biais si 𝐸 [𝑇] → 𝜃, 𝑛 → ∞.
- Si 𝑇 et 𝑇0 deux estimateurs sans biais de 𝜃 ; on dit que 𝑇 est plus efficace que 𝑇0 si
𝑉(𝑇) ≤ 𝑉 (𝑇0 ).
- L’estimateur sans biais et de variance minimale est appelé estimateur efficace.
Remarque
Pour un même paramètre, il peut y avoir plusieurs estimateurs possibles. Par exemple le
paramètre 𝜆 d’une loi de poisson admet comme estimateurs possible la moyenne empirique et
la variance empirique.
II- Estimation de la moyenne/écart type d’une population

1- Estimation ponctuelle
a) Estimateur de la moyenne
Soit 𝑋 une variable aléatoire dont on veut estimer la moyenne 𝜇 = 𝐸[𝑋] à partir d’un n-
échantillon (𝑋1 , 𝑋2 , … . 𝑋𝑛 ) de 𝑋 .
Théorème
𝑋 +𝑋 +⋯+𝑋𝑛
La moyenne empirique 𝑋̅ = 1 2 est un estimateur efficace de 𝜇.
𝑛
Preuve
𝑋̅ est sans biais car 𝐸[𝑋̅] = 𝜇.
𝑉(𝑋)
𝑉 (𝑋̅) = 𝑛 → 0, 𝑛 → ∞. Si 𝑇 un autre estimateur de 𝜇 on aura 𝑉(𝑋̅) < 𝑉(𝑇) .

b) Estimateur de la variance
Le cas 1 : 𝜇 connue
Théorème
Soit 𝑋 une variable aléatoire qui suit une loi de paramètres 𝜇, 𝜎 avec 𝜇 connue.
∑𝑛 (𝑋𝑖 −𝜇)2
𝑇𝑛2 = 𝑖=1 est un estimateur efficace de 𝜎 2 .
𝑛
Preuve
∑𝑛
𝑖=1(𝑋𝑖 −𝜇)
2 ∑𝑛 2 2
𝑖=1((𝑋𝑖 ) −2𝑋𝑖 𝜇+𝜇 ) ∑𝑛 2 2
𝑖=1(𝐸((𝑋𝑖 ) )−2𝐸(𝑋𝑖 )𝜇+𝜇 )
𝐸 (𝑇𝑛2 ) = 𝐸 ( )=𝐸( )= .
𝑛 𝑛 𝑛
∑𝑛 2 2 2
𝑖=1(𝐸((𝑋𝑖 ) )−2𝜇 +𝜇 ) ∑𝑛 2 2
𝑖=1(𝐸((𝑋𝑖 ) )−𝜇 ) ∑𝑛 2
𝑖=1 𝐸((𝑋𝑖 ) )−𝑛𝜇
2
= = = ..
𝑛 𝑛 𝑛
𝑛
1
= ∑(𝑉(𝑋𝑖 ) + (𝐸(𝑋𝑖 ))2 ) − 𝜇2 = 𝜎 2 +𝜇2 − 𝜇2 = 𝜎 2
𝑛
𝑖=1
∑𝑛
𝑖=1(𝑋𝑖 −𝜇)
2 1 1
𝑉 (𝑇𝑛2 ) = 𝑉 ( )= ∑𝑛𝑖=1 𝑉 ((𝑋𝑖 − 𝜇)2 ) = ∑𝑛𝑖=1 𝐸 ((𝑋𝑖 − 𝜇)4 ) − (𝐸((𝑋𝑖 −
𝑛 𝑛2 𝑛2
2
𝜇)2 )) .
=⋯→0
Le cas 2 : 𝜇 inconnue
Théorème
Soit 𝑋 une variable aléatoire qui suit une loi de paramètres 𝜇, 𝜎 avec 𝜇 inconnue. La
∑𝑛 ̅ 2
𝑖=1(𝑋𝑖 −𝑋 )
variance empirique 𝑆𝑛2 = est un estimateur biaisé de 𝜎 2 mais asymptotiquement
𝑛
sans biais.
Preuve
∑𝑛 ̅ 2
𝑖=1(𝑋𝑖 −𝑋 ) 1
𝐸 (𝑆𝑛2 ) = 𝐸 ( ) = 𝐸 (𝑛 ∑𝑛𝑖=1(𝑋𝑖2 − 2𝑋𝑖 𝑋̅ + 𝑋̅ 2 )).
𝑛
𝑛 𝑛
1 1 1
= 𝐸 ( ∑ 𝑋𝑖2 − 2𝑋̅ ∑ 𝑋𝑖 + 𝑛 𝑋̅ 2 )
𝑛 𝑛 𝑛
𝑖=1 𝑖=1
𝑛
1
= 𝐸 ( ∑ 𝑋𝑖2 − 2𝑋̅ 2 + 𝑋̅ 2 )
𝑛
𝑖=1
𝑛
1
= 𝐸 ( ∑ 𝑋𝑖2 − 𝑋̅ 2 )
𝑛
𝑖=1
𝑛
1
= ∑ 𝐸(𝑋𝑖2 ) − 𝐸(𝑋̅ 2 )
𝑛
𝑖=1
𝑛
1 2 2
= ∑ 𝜎 2 + (𝐸(𝑋𝑖 )) − (𝜎𝑋2̅ + (𝐸(𝑋̅)) )
𝑛
𝑖=1
1
= (𝑛𝜎 2 ) + 𝜇2 − 𝜎𝑋2̅ − 𝜇2
𝑛
𝜎2
= 𝜎 2 − 𝜎𝑋2̅ = 𝜎 2 −
𝑛
𝑛−1 2
= 𝜎 .
𝑛
𝑛−1 1
𝐵(𝑆𝑛2 )
= 𝐸 (𝑆𝑛2 )
−𝜎 = 2
𝜎 − 𝜎 = − 𝑛 𝜎2.
2 2
𝑛
𝐵(𝑆𝑛2 )
→ 0; 𝑛 → +∞.
Théorème

Soit𝑋 une variable aléatoire qui suit une loi de paramètres 𝜇, 𝜎 avec 𝜇 inconnue. La variance
𝑛 ∑𝑛 (𝑋 −𝑋̅)2
empirique 𝑆𝑛′2 = 𝑛−1 𝑆 2 = 𝑖=1𝑛−1 𝑖
est un estimateur sans biais de 𝜎 2 .
Preuve
𝑛 𝑛 𝑛−1
𝐸(𝑆′2𝑛 ) = 𝑛−1 𝐸 (𝑆𝑛2 ) = 𝑛−1 𝑛 𝜎 2 = 𝜎 2 donc sans biais.
Remarque
Si 𝑛 est assez grande on aura 𝐸(𝑆′2𝑛 ) ≈ 𝐸 (𝑆𝑛2 ), on préfère 𝑆 2 .
Si 𝑛 est assez petite, on préfère 𝑆𝑛′2 .
Remarque
n
Le coefficient √n−1 s'appelle correction de biais. Lorsque la taille de l'échantillon est assez
grande (en pratique > 30), ce coefficient est très voisin de 1, si bien que, dans ce cas, on peut
estimer par σ0 .
Exemple 1
Un club de sport comporte 1500 membres. On mesure la taille de 20 d'entre eux. La moyenne
𝜇0 , et l'écart - type 𝜎0 calculés à partir de cet échantillon sont : 𝜇0 = 176𝑐𝑚 et 𝜎0 = 6𝑐𝑚
20
Nous pouvons donc estimer les paramètres de la population : F = 176 cm et√19 6 ≈ 6,16𝑐𝑚.
Exemple 2
Lors d’un concours radiophonique , on note 𝑋 le nombre de réponses reçues chaque jour. On
suppose 𝑋~𝑁(𝜇, 𝜎).
Durant 10 jours on a obtenu les 𝑥𝑖 : 200,240,190,150,220,180,170,230,210 ,210.
Donner une estimation ponctuelle de 𝜇 et de 𝜎 2 .
𝑋 +𝑋 +⋯+𝑋
Dans ce cas, la taille de l’échantillon 𝑛 = 10 ; 𝑋̅ = 1 210 10 est un estimateur de 𝜇. Sa
𝑥 +𝑥 +⋯+𝑥 200
réalisation 𝑥̅ = 1 210 10 = 10 = 200 est une estimation ponctuelle efficace de 𝜇.
On est dans le cas ou la moyenne 𝜇 n’est pas connue.
𝑋 2 +𝑋 2+⋯+𝑋10 2
𝑆 2 = 1 2 10 − 𝑋̅ 2 est un estimateur biaisé de 𝜎 2 . Sa réalisation 𝑠 2 =
𝑥1 2 +𝑥2 2 +⋯+𝑥10 2
− 𝑥̅ 2 = 40700 − 40000 = 700 est une estimation ponctuelle biaisé de 𝜎 2 .
10
𝑛 10 10
𝑆′2 = 𝑛−1 𝑆 2 = 9
𝑆 2 est un estimateur sans biais de 𝜎 2 . Sa réalisation 𝑆′2 = 9
𝑆2 =
10
700 = 778 est une estimation ponctuelle sans biais de 𝜎 2 .
9
Exemple 3
On considère l’échantillon statistique (1,0,2,1,1,0,1,0,0) ;
a. Calculer sa moyenne et sa variance empirique.
b. En supposant que les données de cet échantillon sont des réalisations d’une variable
de loi inconnue, donner une estimation non biaisée de l’espérance de la variance de
cette loi.
c. On choisit de modéliser les valeurs de cet échantillon par une loi binomiale 𝛽 (2, 𝑝).
Utiliser la moyenne empirique pour proposer une estimation ponctuelle 𝑝.
a) La moyenne et la variance empirique de cet échantillon sont données comme suit :

𝑥 +𝑥 +⋯+𝑥9 6 2
𝑥̅ = 1 2 = = .
9 9 3
𝑋1 2 +𝑋2 2+⋯+𝑋9 2 12 +02 +22 +12 +12 +02 +12 +02 +02 2 2 4
𝑆2 = − 𝑋̅ 2 = − (3) = 9 .
9 9
b) L’estimation non biaisé de l’espérance et de la variance de cette loi inconnue est
déterminée comme suit :

- L’estimation non biaisé de l’espérance de cette loi inconnue est donnée par la
2
moyenne empirique 𝑥̅ déjà calculé dans la question précédente 𝐸 (𝑋) = 𝑥̅ = 3.
- L’estimation non biaisé de la variance de cette loi inconnue est donnée par 𝑆′2 =
𝑛 2 2 49 1
𝑆 , on trouve 𝑆′ = = ;
𝑛−1 98 2
c) Puisque 𝑋~𝛽 (2, 𝑝) → 𝐸 (𝑋) = 𝑛𝑝 = 2𝑝. L’espérance mathématique de cette loi
2
binomiale est estimée par la moyenne empirique (ici 𝑥̅ = 3) donc l’estimation de la
𝑥̅ 2/3 1
probabilité 𝑝 peut etre déterminée comme suit : 𝐸 (𝑋) = 2𝑝 = 𝑥̅ ⇒ 𝑝 = 2 = 2 = 3
Remarque
Nous n’avons fait qu'une estimation, il est bien sûr impossible de retrouver les vraies
caractéristiques 𝜇0 et 𝜎0 de la population. L'estimation ponctuelle permet surtout de disposer
d'une valeur de référence pour poursuivre/affiner les calculs. On souhaiterait notamment
pouvoir faire une estimation par intervalle, en contrôlant le risque pris.
2- Estimation par intervalle de confiance

Il est plus réaliste de fournir une estimation de type 𝑡1 < 𝜃 < 𝑡2 plutôt que décrire sèchement
𝜃 = 𝑡, car on sait que la valeur estimée 𝑡 différe toujours de la valeur exacte du paramètre
recherché 𝜃. Il est donc souhaitable de donner la précision de l’estimation en acceptant de
faire une erreur 𝛼 sur celle-ci.
Définition
Soit 𝑋 une variable aléatoire dont la loi dépend d’un paramètre inconnue 𝜃, on appelle
intervalle de confiance pour 𝜃 de niveau 1 − 𝛼 (ou risque 𝛼), l’intervalle [𝑡1 , 𝑡2 ] qui a la
probabilité 1 − 𝛼 de constater la vraie valeur de 𝜃. 𝑝(𝑡1 < 𝜃 < 𝑡2 ) = 1 − 𝛼.
Remarque
Si on augmente le niveau de confiance 1 − 𝛼, on augmente la longueur de l’intervalle [𝑡1 , 𝑡2 ].
A- Intervalle de confiance pour une moyenne

Nous avons vu, dans la théorie de l’échantillonnage, que si 𝑋̅ est la variable aléatoire
correspondant à la moyenne d'un échantillon de taille n pris au hasard, alors le Théorème
Central Limite permet d'affirmer que sous certaines conditions 𝑋̅ suit approximativement une
𝜎
loi normale : 𝑋̅~𝑁 (𝜇, ). Nous allons chercher un intervalle qui contient 𝜇 avec une
√𝑛
confiance arbitraire de 1 − 𝛼 (1 − 𝛼 pourrait être, en général, 95 % ou 99% ou un autre
coefficient de confiance). Nous cherchons donc un rayon 𝑟 tel que : 𝑝(𝑋̅ − 𝑟 ≤ 𝜇 ≤ 𝑋̅ + 𝑟) =
1 − 𝛼. Cette disposition des inégalités n’est pas pratique mais il y a une correspondance
remarquable entre deux événements qui va nous faciliter les calculs :
𝑋̅ − 𝑟 ≤ 𝜇 ≤ 𝑋̅ + 𝑟 ⟺ 𝑋̅ − 𝑟 − (𝑋̅ + 𝜇) ≤ 𝜇 − (𝑋̅ + 𝜇) ≤ 𝑋̅ + 𝑟 − (𝑋̅ + 𝜇)
⟺ −𝑟 − 𝜇 ≤ −𝑋̅ ≤ 𝑟 − 𝜇
⟺ 𝜇 − 𝑟 ≤ 𝑋̅ ≤ 𝜇 + 𝑟
Alors 𝑝(𝑋 − 𝑟 ≤ 𝜇 ≤ 𝑋̅ + 𝑟) = 𝑝(𝜇 − 𝑟 ≤ 𝑋̅ ≤ 𝜇 + 𝑟) = 1 − 𝛼
̅
Nous somme ainsi amenés à calculer 𝑝(𝜇 − 𝑟 ≤ 𝑋̅ ≤ 𝜇 + 𝑟) = 1 − 𝛼 la probabilité que la
moyenne 𝑋̅ de l’échantillon tombe dans un intervalle centré en 𝜇. On sait que la variable
𝑋̅−𝜇 𝜇−𝑟−𝜇
aléatoire 𝑇~ ~𝑁(0,1). Nous obtenons donc par centrage et réduction 𝑝 ( ≤
𝜎/√𝑛 𝜎/√𝑛
𝑋̅−𝜇 𝜇+𝑟−𝜇 𝑟 √𝑛 𝑟 √𝑛
≤ ) = 1 − 𝛼 ce entraine que 𝑝 (− ≤ T≤ ) = 1 − 𝛼, il s’ensuit que
𝜎/√𝑛 𝜎/√𝑛 𝜎 𝜎
𝑟 √𝑛 𝑟 √𝑛 𝛼
2∅ ( ) − 1 = 1 − 𝛼 d’où ∅ ( ) = 1 − 2 . Nous cherchons donc par lecture inverse de la
𝜎 𝜎

𝛼 𝑟 √𝑛
table de la loi normale centré réduite une borne 𝑡 tel que ∅(t) = 1 − 2 . c’est-à-dire = 𝑡 le
𝜎
𝜎
rayon 𝑟 de l’intervalle cherché est 𝑟 = 𝑡 . Pour calculer les bornes de cet intervalle, deux
√𝑛
cas qui se présentent :
 Si l’écart type 𝜎 de la population est connu, il n’y a rien à faire.
 Si l’écart type 𝜎 de la population n’est pas connu, on le remplace par son estimation
n 𝜎 n σX
̅ σX
̅
ponctuelle √n−1 σX̅ . Dans ce cas, nous obtenons r = 𝑡 = t√n−1 =t .
√𝑛 √n √n−1
Remarque
On constate ici que le fait de ne pas connaitre 𝜇 n’est pas gênant.
On ne retient pas ces formules. Dans la pratique on refait les calculs.
Exemple
Un club de sport comporte 1500 membres. On mesure la taille de 20 d’entre eux. La moyenne
𝜇0 et l’écart type 𝜎0 calculé à partir de cet échantillon sont 𝜇0 = 176 𝑐𝑚 et 𝜎0 = 6 𝑐𝑚. Nous
avons déjà estimé ponctuellement les paramètres de la population 𝜇̅ = 176 𝑐𝑚 et 𝜎̅ =
20
√19 6 ≈ 6.16 𝑐𝑚. Déterminons maintenant une estimation de 𝜇 par intervalle de confiance à
95% (ou au risque de 5%). Notons 𝑋̅ la variable aléatoire correspondant à la moyenne d’un
𝜎 𝜎
échantillon de taille 20 pris au hasard. On sait que 𝑋̅ ~𝑁 (𝜇, ) = 𝑁 (𝜇, ) ; on calcule un
√𝑛 √20
𝑋̅−𝑟
rayon r tel que 𝑝(𝜇 − 𝑟 ≤ 𝑋̅ ≤ 𝜇 + 𝑟) = 0.95. on pose 𝑇 = 𝜎/ ainsi 𝑇~𝑁(0,1) et donc
√20
√20 √20 √20 √20
𝑝 (−𝑟 ≤𝑇≤𝑟 ) = 0.95 donc 2∅ (𝑟 ) − 1 = 0,95 alors ∅ (𝑟 ) = 0,975 où
𝜎 𝜎 𝜎 𝜎
√20
𝑡= 𝑟 𝜎 .Nous cherchons donc, par lecture inverse de la table de la loi normale centré
réduite une borne t tel que ∅(𝑡) = 0,975 la borne t=1,96 convient. Ainsi notre réel r cherché
√20 𝜎
est tel que 𝑟 = 1.96 et 𝑟 = 1.96 mains une fois l’échantillon tiré, nous avons obtenu
𝜎 √20
un écart type estimant 𝜎̅ = 6.16 𝑐𝑚 d’où 𝑟 ≈ 2.7. la réalisation de l’intervalle de confiance à
95% sur cet échantillon est 𝐼𝐶 = [12.776 − 2.7; 176 +] + [173.3; 178.7] . Nous pouvons
donc estimer, avec une confiance de 95% que la taille moyenne de la population est comprise
entre 173.3 et 178.7 cm.
B- Intervalle de confiance pour la variance d’une variable gaussienne

On suppose 𝑋~𝑁(𝜇, 𝜎)
Le cas 1 : 𝜇 est connue (peu fréquent)
1 1
𝑇𝑛2 = 𝑛 ∑𝑛𝑖=1(𝑋𝑖 − 𝜇)2 est un estimateur efficace de 𝜎 2 , sa réalisation est 𝑡 2 = 𝑛 ∑𝑛𝑖=1(𝑥𝑖 −
𝜇) 2 .
𝑛
𝑋𝑖 − 𝜇 𝑋𝑖 − 𝜇 2
𝑋~𝑁(𝜇, 𝜎) ⇒ 𝑋𝑖 ~𝑁(𝜇, 𝜎), ∀𝑖 = 1 … 𝑛 ⇒ ~𝑁(0,1) ⇒ ∑ ( ) ~𝜒𝑛2
𝜎 𝜎
𝑖=1
𝑋𝑖 −𝜇 𝑋 −𝜇 2
En effet comme ~𝑁(0,1) alors ∑𝑛𝑖=1 ( 𝑖 ) est une somme de n variables aléatoires
𝜎 𝜎
𝑛𝑇𝑛2 𝑋𝑖 −𝜇 2 𝑛𝑇𝑛2
indépendantes qui suivent 𝑁(0,1), or = ∑𝑛𝑖=1 ( ) donc ~𝜒𝑛2 . L’erreur 𝛼 étant
𝜎2 𝜎 𝜎2
𝑛𝑇𝑛2
fixé, on cherche dans la table de 𝜒𝑛2 les valeurs de 𝑡1 et 𝑡2 tel que 𝑝 (𝑡1 < < 𝑡2 ) = 1 − 𝛼.
𝜎2

𝑛𝑇𝑛2 1 𝜎2 1 𝑛𝑇𝑛2 𝑛𝑇𝑛2
On a 𝑡1 < < 𝑡2 ⇔ 𝑡 < 𝑛𝑇 < 𝑡 ⇔ < 𝜎2 < .
𝜎2 2 1 𝑡2 𝑡1
𝑛𝑇𝑛2 𝑛𝑇𝑛2 𝑛𝑇𝑛2 𝑛𝑇 2 𝑛𝑇 2
1 − 𝛼 = 𝑝 (𝑎 = < 𝜎2 < = 𝑏) = 𝑝 (𝑡1 < < 𝑡2 ) = 𝑝 ( 𝜎2𝑛 < 𝑡2 ) − ( 𝜎2𝑛 < 𝑡1 ) =
𝑡2 𝑡1 𝜎2
𝛼 𝛼
1 − 2 − 2.
𝛼 𝛼
A partir du tableau 𝜒𝑛2 on extrait 𝑡1 et 𝑡2 tel que ∅(𝑡1 ) = et ∅(𝑡2 ) = 1 − 2 . On déduit que
2
[𝑎, 𝑏] est un intervalle de confiance de 𝜎 2 avec un risque 𝛼.
Le cas 2 : 𝜇 est inconnue
Théorème (Admis)
Si 𝑋1 , 𝑋2 , … 𝑋𝑛 sont des variables aléatoires indépendantes identiquement distribuées (qui
𝑛 𝑛 2
𝑋̅−𝜇 (𝑛−1)𝑆′2 ∑ 𝑋𝑖 ∑ (𝑋𝑖 −𝑋̅)
suivent 𝑁(𝜇, 𝜎)) alors 𝜎/ ~𝑁(0,1) et 2
~𝜒𝑛−1 avec 𝑋̅ = 𝑖=1 et 𝑆′ = 𝑖=1𝑛−1 .
√ 𝑛 𝜎2 𝑛
Explication
1
𝑆′ = 𝑛−1 ∑𝑛𝑖=1(𝑋𝑖 − 𝑋̅ )2 est un estimateur sans biais de 𝜎 2 , et d’après ce dernier théorème,
(𝑛−1)𝑆′2 2 2
On a ~𝜒𝑛−1 . On cherche dans la table de 𝜒𝑛−1 les valeurs de 𝑡1 et 𝑡2 tel que 𝑝 (𝑡1 <
𝜎2
(𝑛−1)𝑆′2
𝜎2
< 𝑡2 ) = 1 − 𝛼 (par la même méthode que le cas 1).
III- Estimation d’une proportion

1- Estimation ponctuelle
Nous avons vu, dans la théorie de l’échantillonnage, que si F est la variable aléatoire
correspondante à la proportion d’un caractère dans un échantillon de taille n pris au hasard,
𝑝(1−𝑝)
alors F suit approximativement une loi normale 𝐹~𝑁(𝑝, 𝜎𝑝 ) où 𝜎𝑝 = √ .
𝑛
Remarque
La condition « 𝐹 converge vers 𝑁(𝑝, 𝜎𝑝 ) »est traduit en pratique par « si 𝑛𝑝 > 5 𝑒𝑡 𝑛(1 −
𝑝) > 5 ou 𝑛 > 30 alors 𝐹~𝑁(𝑝, 𝜎𝑝 ) ».
Lemme
𝐸 (F) = p donc F est un estimateur sans biais de p.
p(1−p)
V(F) = donc F est un estimateur convergent de p.
n
Exemple 1
Deux sondages différents portant sur la même caractéristique d’une population sont effectués.
Dans le premier sondage, on a pris un petit échantillon de taille 𝑛 = 5, on a trouvé X = 3
𝑋 3
donc 𝑝̅ = 𝑛 = 5 = 60%. Dans le second sondage, on a pris un petit échantillon de taille 𝑛 =
100, cet échantillon a donné 𝑋 = 60 donc 𝑝̅ = 60%. Ces deux sondages donnent-ils la même
information ?
Réponse : Non, le second résultat est beaucoup plus précis que le premier. (Comparant les
variances des deux cas).
Exemple
A quelques jours d’une élection, un candidat fait effectuer un sondage. Sur les 150 personnes
interrogées, 45 se disent prêtes à voter pour lui aux prochaines élections. La proportion

45
d’individus prête à voter pour ce candidat dans l’échantillon est ici de 𝑝0 = 150 = 0.3. on
estime donc qu’il en est de même dans la population (comment pourrait-on faire
autrement ?) : 𝑝̅ = 𝑝0 = 0.3. Quant à l’indication 𝜎𝑝 , on peut ici l’estimer par : ̅̅̅
𝜎𝑝 =
𝑝0 (1−𝑝0 ) 0.3×0.7
√ =√ ≈ 0.037.
𝑛 150
On voudrait aller plus loin et, au lieu d’une simple proportion, calculer un intervalle
contenant, avec une confiance arbitraire fixée au départ, la proportion 𝑝 d’individus prêts à
voter pour ce candidat.
2- Estimation par intervalle de confiance

Cherchons un intervalle qui contient 𝑝 avec une confiance arbitraire de 1 − 𝛼. Nous
cherchons donc un rayon r tel que : 𝑝(𝐹 − 𝑟 ≤ 𝑝 ≤ 𝐹 + 𝑟) = 1 − 𝛼. On sait que la variable
𝐹−𝑝
aléatoire 𝑇 = suit la loi normale centrée réduite 𝑁(0.1). Nous obtenons donc, par
𝜎𝑝
𝑝−𝑟−𝑝 𝐹−𝑝 𝑝+𝑟−𝑝
centrage et réduction : 𝑝 ( ≤ ≤ ) = 1 − 𝛼.
𝜎𝑝 𝜎𝑝 𝜎𝑝
−𝑟 𝑟 𝑟 𝑟 𝛼
𝑝 ( 𝜎 ≤ 𝑇 ≤ 𝜎 ) = 1 − 𝛼 , 2∅ (𝜎 ) − 1 = 1 − 𝛼, ∅ (𝜎 ) = 1 − 2 . On cherche une borne t
𝑝 𝑝 𝑝 𝑝
𝛼 𝑟
telle que : ∅(𝑡) = 1 − 2 avec 𝑡 = 𝜎 . Par lecture inverse de la table de la loi normale centré
𝑝
réduite 𝑁(0.1). Ce qui nous permet de calculer 𝑟 = 𝑡𝜎𝑝 . Supposons maintenant l’échantillon
𝑝(1−𝑝) p0(1−p0 )
prélevé. Or on 𝜎𝑝 = √ on le remplace par √ .
𝑛 n
Nous avons donc une estimation ponctuelle de p et σp . Ainsi, la réalisation de l’intervalle de
p0 (1−p0 ) p0 (1−p0 )
confiance dans l’échantillon est : IC = [p0 − t√ ; p0 + t√ ] (on ne retiendra
n−1 n−1
pas cette formule. Dans la pratique, on refait les calculs).
Exemple
A quelques jours d’une élection, un candidat a effectué un sondage. Sur 150 personnes
interrogées. 45se disent prêtes à voter pour lui aux prochaines élections. La proportion
45
d’individus prête à voter pour ce candidat dans l’échantillon est ici de 𝑝0 = 150 = 0.3. On a
déjà estimé ponctuellement 𝑝̅ = 𝑝0 = 0.3 et ̅̅̅ 𝜎𝑝 ≈ 0.037., Déterminons maintenant une
estimation de p par intervalle de confiance à 80%. Notons F la variable aléatoire
correspondante à la proportion d’individus prêts à voter pour ce candidat dans un échantillon
de taille 150 pris au hasard. Nous avons vu qu‘approximativement : 𝐹~𝑁(𝑝, 𝜎𝑝 ) où 𝜎𝑝 =
𝑝(1−𝑝) 𝑟
√ . On cherche un rayon r tel que 𝑝 (𝑝 − 𝑟 ≤ 𝐹 ≤ 𝑝 + 𝑟) = 0.8. 2∅ (𝜎 ) − 1 = 0.8 ;
𝑛 𝑝
𝑟
∅ (𝜎 ) = 0.9. Par lecture inverse de la table de la loi normale centré-réduite, on cherche une
𝑝
𝑟
borne 𝑡 telle que : ∅(𝑡) = 0.9 avec 𝑡 = 𝜎 . La valeur 𝑡 ≈ 1.28 convient donc 𝑟 = 1.28𝜎𝑝 .
𝑝
Supposons maintenant l’échantillon prélevé. Une estimation ponctuelle de 𝜎𝑝 est ̅̅̅ 𝜎𝑝 ≈
0.037 d’où la réalisation de l’intervalle de confiance dans cet échantillon est alors 𝐼𝐶 =
[0.3 − 0.047; 0.3 + 0.047] = [0.253; 0.347] . Nous pouvons estimer, avec une confiance de
80% que la proportion d’individus dans la proportion prête à voter pour le candidat en
question est comprise entre 25.3% et 34.7%.

Chapitre 4 : Les tests statistiques
I- Généralités
Un test statistique est une procédure permettant de trancher entre deux hypothèses en prenant
une décision à partir d’informations fournies par un échantillon. L’hypothèse nulle, notée 𝐻0 ,
qui est supposée vraie en faveur du décideur jusqu’à preuve du contraire, dont on cherche à
vérifier par un raisonnement statistique. C’est l’hypothèse principal que l’on considère vraie à
priori. L’hypothèse alternative, notée 𝐻1 , est l’hypothèse qui sera acceptée si 𝐻0 est
{𝐻0 }
rejetée. {𝐻1 } ⊆ 𝐶 .
1. Concept de risque
Toute décision statistique comporte des risques d’erreur :
 Risque de première espèce
C’est le risque de rejeter 𝐻0 alors qu’elle est vraie. Ce risque est appelé aussi le seuil de
signification du test et noté 𝛼. 𝛼 = 𝑝(𝑟𝑒𝑗𝑒𝑡 𝑑𝑒 𝐻0 / 𝐻0 𝑒𝑠𝑡 𝑣𝑟𝑎𝑖𝑒).
 Risque de deuxième espèce
C’est le risque de ne pas rejeter 𝐻0 alors qu’elle est fausse. 𝛽 = 𝑝(𝑟𝑒𝑗𝑒𝑡 𝐻1 / 𝐻1 𝑒𝑠𝑡 𝑣𝑟𝑎𝑖𝑒).
La décision
𝐻0 𝐻1
𝐻0 Conclusion correcte Risque de première espèce 𝛼
La vérité Niveau de confiance 1 − 𝛼
𝐻1 Risque de deuxième espèce 𝛽 Conclusion correcte
Puissance de test 1 − 𝛽
Exemple
Soit 𝜇 la moyenne du niveau de radioactivité en picocuries par litre. La valeur 𝜇0 = 5 est
considérée comme la valeur critique entre eau potable et non potable. Considérons les deux
hypothèses 𝐻0 vs 𝐻1 :
𝐻0 : 𝜇0 ≥ 5 (eau toxique).et 𝐻1 : 𝜇0 < 5 (eau potable).
𝛼 = 𝑝(𝑟𝑒𝑗𝑒𝑡𝑒𝑟 𝐻0 / 𝐻0 𝑣𝑟𝑎𝑖𝑒 ) ce qui correspond à laisser boire de l’eau toxique
𝛽 = 𝑝(𝑎𝑐𝑐𝑒𝑝𝑡𝑒𝑟 𝐻0 / 𝐻0 𝑓𝑎𝑢𝑠𝑠𝑒 ) ce qui conduit seulement à rejeter de l’eau potable
1 − 𝛽 représente la puissance de test.
Remarque
Les tests ne sont pas faits pour «démontrer» H0 mais pour «rejeter» H0 . L’aptitude d’un test
à rejeter H0 alors qu’elle est fausse constitue la puissance du test.
Pour quantifier le risque 𝛽, il faut connaître la loi de probabilité de la statistique sous
l’hypothèse 𝐻1 .
2. La variable de décision

Soit 𝑋 une variable aléatoire d’une population donnée. Considérons un 𝑛-échantillon
(𝑋1 , 𝑋2 , … 𝑋𝑛 ). On nomme une variable de décision 𝑍, ou une statistique, une variable
aléatoire construite à partir d’un échantillon permettant de formuler une règle décision. Et
construite de telle façon à connaitre sa loi si 𝐻0 est vraie. Elle n’est pas unique.
La valeur numérique de la statistique obtenue pour l’échantillon considéré permet de
distinguer entre 𝐻0 vraie et 𝐻0 fausse.
3. La région d’acceptation et la région critique

a) Définition
La région d’acceptation est la partie de l’espace des échantillons 𝐸 qui permet d’accepter 𝐻0 ;
C’est-à-dire l’ensemble des valeurs observées de la statistique provoquant l’acceptation de
l’hypothèse nulle. 𝐴 = {(𝑥1 , 𝑥2 … 𝑥𝑛 ) ∈ 𝐸 / 𝐻0 𝑒𝑠𝑡 𝑣𝑟𝑎𝑖𝑒}.
La région critique ou de rejet est l’espace des échantillons 𝐸′ permettant de rejeter 𝐻0 ;c’est à
dire l’ensemble des valeurs observées de la statistique provoquant le rejet de l’hypothèse
nulle.𝑅 = {(𝑥1 , 𝑥2 … 𝑥𝑛 ) ∈ 𝐸′ / 𝐻0 𝑒𝑠𝑡 𝑓𝑎𝑢𝑠𝑠𝑒}.
b) La détermination des deux régions
On calcule la valeur de Z à partir de l’observation de l’échantillon. La région de rejet est
déterminée par 𝛼 = 𝑝(𝑍 ∈ 𝑅 𝑎𝑣𝑒𝑐 𝐻0 𝑒𝑠𝑡 𝑣𝑟𝑎𝑖𝑒) ce qui équivaut à « si 𝐻0 est vraie 1 − 𝛼 =
𝑝(𝑍 ∈ 𝐴) ».
c) La p-value
En pratique, plutôt que calculer la région critique en fonction de 𝛼, on prefere donner un seuil
𝛼 ∗ , appelée p-value. La p-value est la plus grande valeur de 𝛼 conduisant à ne pas rejeter 𝐻0 .
Cette information permet au lecteur de conclure l’acceptation de 𝐻0 pour tout risque de
première espèce 𝛼 ≤ 𝛼 ∗ et son rejet pour tout 𝛼 > 𝛼 ∗.
4. Formulation des tests statistiques

Dans tous les tests on travaille de la même façon en procédant comme suit :
a. Formulation de 𝐻0 et 𝐻1 .
b. Précision des conditions d’application (seuil de signification, taille de l’échantillon)
c. Détermination de la variable de décision et sa loi de probabilité.
d. Détermination de l’intervalle d’acceptation.
e. La prise de décision : acceptation de 𝐻0 si la valeur de Z est dans la région
d’acceptation, et le rejet sinon.
Exemple
Supposons qu’on cherche à tester l’hypothèse qu’une pièce de monnaie n’est pas « truquée »,
Soit 𝑋 la variable aléatoire correspondante au nombre de faces obtenus en lançant 100 fois la
pièce. On adopte la règle de décision suivante : « 𝐻0 est acceptée si 𝑋 ∈ [40,60] » et « 𝐻0
rejetée si 𝑋 ∉ [40,60] (donc 𝑋 < 40 ou 𝑋 > 60 ».
1
𝐻0 : La pièce n’est pas truquée. 𝑋~𝛽 (100, 2 )
Le risque d’erreur de première espèce est α avec 1 − α = p(X ∈ [40,60]) .
Si on reprend le même exemple on suppose la probabilité d’obtenir face est de 0.6 pour une
pièce truquée. En adoptant toujours la même règle de décision. 𝐻1 : la pièce est truquée

𝑋~𝛽 (100; 0.6). Le risque de seconde espèce est β avec 1 − β = p(X ∈ [40,60]). Pour
X~β(100; 0.6).
5. Les types de tests

On distingue deux classes de tests
a. Les tests paramétriques
Un test est dit paramétrique si la population mère (parente) est de distribution connue ; c’est-
à-dire les hypothèses sont relatives à un paramètre statistique associé à la loi de probabilité
décrivant la variable étudiée. Soit une population au sein de laquelle un échantillon aléatoire
est extrait. Cette population est caractérisée par un paramètre θ (moyenne, variance,
proportion …) qui est estimé par un estimateur (moyenne empirique, variance empirique,
fréquence…) en utilisant cet échantillon. Supposons que la vraie valeur de θ est inconnue.
Attribuons une valeur θ0 à θ et testons la validité de cette hypothèse. L’objectif de ce test est
de vérifier si θ est égale ou non la valeur θ0 . Donc l’hypothèse nulle est H0 : θ = θ0 .
Règle de décision : si l’échantillon appartient à A on accepte H0 , si l’échantillon appartient à
R on rejette H0 .
b. Formes des tests statistiques paramétriques
Test bilatéral
𝐻 : 𝜃 = 𝜃0
{ 0 ; On peut chercher 𝐴 = [𝑡1 , 𝑡2 ] tel que 𝑝(𝑡1 ≤ 𝑍 ≤ 𝑡2 𝑎𝑣𝑒𝑐 𝜃 = 𝜃0 ) = 1 − 𝛼
𝐻1 : 𝜃 ≠ 𝜃0
Test unilatéral à gauche (𝑅 =] − ∞, 𝑎[) 𝐴 =]𝑏, +∞[
𝐻 : 𝜃 = 𝜃0
{ 0 ; On peut chercher 𝐴 tel que 𝑝(𝑍 > 𝑏 𝑎𝑣𝑒𝑐 𝜃 = 𝜃0 ) = 𝛼
𝐻1 : 𝜃 < 𝜃0
Test unilatéral à droite (𝑅 =]𝑏 , +∞[) 𝐴 =] − ∞, 𝑏[
𝐻 : 𝜃 = 𝜃0
{ 0 ; On peut chercher R tel que 𝑝(𝑍 < 𝑏 𝑎𝑣𝑒𝑐 𝜃 = 𝜃0 ) = 𝛼.
𝐻1 : 𝜃 > 𝜃0
a. Les tests non paramétriques
Les tests non paramétriques sont des tests dont le modèle ne précise pas les conditions que
doivent remplir les paramètres de la population dont a été extrait l’échantillon. Un test non
paramétrique compare globalement la répartition des observations et n’exige aucune
connaissance sur la loi de probabilité décrivant la variable étudiée. On cherche l’écart entre la
distribution théorique et la distribution observée si cet écart est significativement grand,
l’hypothèse 𝐻0 rejeté au seuil considéré. On cite le test khi-deux, le test Kolmogorov
Smirnov, …
Remarque
Les tests paramétriques, quand leurs conditions sont remplies, sont les plus puissants que les
tests non paramétriques. Les tests non paramétriques s’emploient lorsque les conditions
d’applications des autres méthodes ne sont pas satisfaites, ils peuvent s’utiliser même pour
des échantillons de taille très faible. Si toutes les hypothèses nécessaires, à un test
paramétrique, sont vérifiées, on perd de l’information en utilisant un test non paramétrique.
II- Test de conformité

Le test de conformité consiste à confronter un paramètre calculé sur l’échantillon à une valeur
préétablie. Les plus connus sont certainement les tests portant sur la moyenne, la variance ou
sur les proportions. On connaît la loi théorique (en général la loi normale).
Exemple
Dans un jeu de dés à 6 faces, on sait que la face 3 a une probabilité de 1/6 d’apparaître. On
demande à un joueur de lancer 100 fois le dé, on teste alors si la fréquence d’apparition de la
face 3 est compatible avec la probabilité 1/6. Si ce n’est pas le cas, on peut se poser des
questions sur l’intégrité du dé.
A- Test de conformité de la moyenne

Soit 𝜇 la moyenne de la population et 𝑋̅ la moyenne de l’échantillon, la vraie valeur de 𝜇 est
inconnue. Attribuons une valeur 𝜇0 à 𝜇 et testons la validité de cette hypothèse.
L’hypothèse nulle 𝐻0 : 𝜇 = 𝜇0 .
La variable de décision est l’estimateur 𝑋̅.
La règle de décision : si 𝑥̅ ∈ 𝐴, on accepte 𝐻0 et si 𝑥̅ ∉ 𝐴, on rejette 𝐻0 .
Etant donné 𝛼 le seuil de signification et 𝑛 la taille de l’échantillon . Le calcul de l’intervalle
d’acceptation se fait à partir de 1 − 𝛼 = 𝑝(𝑋̅ ∈ 𝐴) et il dépend de 𝐻1 en effet 𝐴 = [𝐵, 𝐵′]
dans le cas bilatéral, 𝐴 =] − ∞, 𝐵]dans le cas unilatéral à droite et 𝐴 = [𝐵, ∞[ pour le cas
unilatéral à gauche.
Exemple
On veut tester si le salaire hebdomadaire moyen des employés d’une entreprise est 𝜇0 = 2500DH
avec un risque d’erreur de première espèce 𝛼 = 0.05. On prélève un échantillon aléatoire avec remise
de taille 𝑛 = 100 de l'ensemble des employés. Pour cet échantillon, on trouve une moyenne de 2000
DH de salaire hebdomadaire et un écart type de 400DH.
- Formuler les hypothèses 𝐻0 et 𝐻1 (bilatéral, unilatéral à droite et à gauche)
- Déterminer la variable de décision.
- Déterminer l’intervalle d’acceptation.
- Déterminer la décision prise.
Test bilatéral
 Formulation des hypothèses
L’hypothèse nulle 𝐻0 : 𝜇 = 𝜇0 = 2500DH
L’hypothèse alternative 𝐻1 : 𝜇 ≠ 𝜇0 alors l’intervalle de l’acceptation est de la forme [𝑎, 𝑏]
 La variable de décision
La variable de décision n’est que 𝑋̅ l’estimateur de 𝜇
 L’intervalle d’acceptation
[𝑎, 𝑏] est centré par 𝜇 donc 1 − 𝛼 = 𝑝(𝑋 ̅ ∈ [𝑎, 𝑏]) = 𝑝(𝜇 − 𝑟 ≤ 𝑋 ̅ ≤ 𝜇 + 𝑟)
𝑟√𝑛 ̅ −𝜇
𝑋 𝑟√𝑛
= 𝑝(− ≤ ≤ )
𝜎 𝜎/√𝑛 𝜎
𝜎
Puisque 𝑛 = 100 ≥ 30 et d’après le théorème centrale limite on aura 𝑋̅~𝑁(𝜇, ).
√𝑛
̅ −𝜇
𝑋
Par changement de variable (𝜎/√𝑛 ~𝑁(0,1) et à partir des tableaux des probabilités de la loi
𝑟√𝑛
normale centrée réduite, on déduit que 𝜎
= 1.96.

𝑛
Remplaçant 𝜎 par sen estimation ponctuelle 𝑆′ = √ 𝑆 = 400 = 402.015 on obtient 𝑟 = 78.79
𝑛−1
d’où l’intervalle d’acceptation est 𝐴 = [𝜇0 − 𝑟; 𝜇0 + 𝑟] = [2421.2; 2578.

 La décision
𝑥̅ = 2000 ∉ 𝐴 d’où le rejet de 𝐻0
Test unilatéral à droite
 Formulation des hypothèses

L’hypothèse nulle 𝐻0 : 𝜇 = 𝜇0 = 2500DH
L’hypothèse alternative 𝐻1 : 𝜇 > 𝜇0 alors l’intervalle de l’acceptation est de la forme
𝐴 =] − ∞, 𝑎[=] − ∞, 𝜇0 + 𝑟[
 La variable de décision
La variable de décision n’est que 𝑋̅ l’estimateur de 𝜇
 L’intervalle d’acceptation
1 − 𝛼 = 𝑝(𝑋̅ ∈ 𝐴) = 𝑝(𝑋 ̅ ≤ 𝜇 + 𝑟)
̅ −𝜇
𝑋 𝑟√𝑛
= 𝑝( ≤ )
𝜎/√𝑛 𝜎
𝜎
Puisque 𝑛 = 100 ≥ 30 et d’après le théorème centrale limite on aura 𝑋̅~𝑁(𝜇, ).
√𝑛
̅ −𝜇
𝑋
Par changement de variable ( 𝜎/√𝑛 ~𝑁(0,1) et à partir du tableau des probabilités de la loi
𝑟√𝑛
normale centrée réduite, on déduit que = 1.65.
𝜎
𝑛
Remplaçant 𝜎 par sen estimation ponctuelle 𝑆′ = √𝑛−1 𝑆 = 400 = 402.015 on obtient 𝑟 =
66.332475 d’où l’intervalle d’acceptation est 𝐴 =] − ∞, 𝜇0 + 𝑟[=] − ∞, 2566.33[.
 La décision
𝑥̅ = 2000 ∈ 𝐴 d’où l’acceptation de 𝐻0 .
Test unilatéral à gauche

On procède de la même manière que dans le cas du test unilatéral à droite.
B- Test de conformité de la variance

L’objectif de test est de vérifier si la variance 𝜎 2 est égale ou non à une valeur donnée 𝜎02 .
(c’est-à-dire 𝐻0 : 𝑠 = 𝜎02 ). La variable de décision est l’estimateur 𝑆 de 𝜎 2 . Cherchons 𝐴
vérifiant 1 − 𝛼 = 𝑝(𝑆 ∈ 𝐴)sachant que 𝐴 dépend de 𝐻1 (𝐻1 : 𝑠 ≠ 𝜎02 , 𝐻1 : 𝑠 > 𝜎02 , 𝐻1 : 𝑠 < 𝜎02 )
C- Test de conformité de la proportion

Nous proposons de tester si la proportion 𝑝 d’éléments dans la population présentant un
certain caractère qualitatif, peut-être ou non considérée comme égale à une valeur
hypothétique p0 . Le test de la proportion 𝑝 consiste à décider si celle-ci est égale ou non à
une valeur 𝑝0 . C’est-à-dire l’hypothèse nulle (𝐻0 : 𝑝 = 𝑝0 ) et l’hypothèse alternative est en
général de la forme 𝐻1 : 𝑝 ≠ 𝑝0 ou 𝐻1 : 𝑝 > 𝑝0 ou 𝐻1 : 𝑝 < 𝑝0 . Nous disposons pour ce faire
de la proportion 𝑓 d’éléments possédant ce caractère dans un échantillon de taille n

Etant donné 𝛼 le seuil de signification; La variable de décision est l’estimateur 𝐹 de 𝑝 (la
variable aléatoire qui désigne la proportion d’éléments possédant le caractère considéré). Le
calcul de l’intervalle d’acceptation se fait à partir de la relation 1 − 𝛼 = 𝑝(𝐹 ∈ 𝐴) sachant
que 𝐴 dépend de 𝐻1 .
III- Test de comparaison

A- Comparaison de deux moyennes
L’objectif de ce test est de comparer les moyennes inconnues de deux populations.
𝐻0 : 𝜇1 = 𝜇2 ; 𝐻1 : 𝜇1 ≠ 𝜇2 ;
La variable de décision est la différence des moyens des deux échantillons c’est-à-dire
𝑋̅1 − 𝑋̅2 .
Cherchons l’intervalle d’acceptation 𝐴 vérifiant 1 − 𝛼 = 𝑝(̅̅̅
𝑋1 − ̅̅̅
𝑋2 ∈ 𝐴).
Le lemme suivant nous permet de déterminer la loi de probabilité de cette variable de
décision.
Lemme
σ2 σ2
si X1 ~N(μ1 , σ1 ) et X2 ~N(μ2 , σ2 ) et indépendantes alors ̅̅̅
X1 − ̅̅̅
X2 ~N (μ1 − μ2 , √n1 + n2 ).
1 2
Preuve
σ σ
On a ̅̅̅
X1 ~N (μ1 , 1 ) et X2 ~N (μ2 , 1 ) et ona E(̅̅̅
X1 − ̅̅̅
X2 ) = E(̅̅̅
X1 ) − E(̅̅̅
X2 ) = μ1 − μ2 et
n1 n2
σ21 σ22
V(̅̅̅
X1 − ̅̅̅
X2 ) = V(̅̅̅
X1 ) + V(̅̅̅
X2 ) = n + n (puisque les deux variables ̅̅̅
X1 et ̅̅̅
X2 sont
1 2
indépendantes).
Remarque
Dans le cas où la distribution de la population est inconnue, on utilise le théorème central
̅̅̅1̅−X
X ̅̅̅2̅
limite pour déterminer la loi de ̅̅̅
X1 − ̅̅̅
X2 avec ~N(0,1)
σ2 σ2
√ 1+ 2
n1 n2
B- Comparaisons de deux variances

Considérons deux populations de variances 𝜎12 et 𝜎22 , dont deux échantillons sont extraits de
variances empiriques 𝑆12 et 𝑆22 . L’objectif de ce test est de comparer 𝜎12 et 𝜎22 à l’aide des
deux échantillons.
Les hypothèses nulle et alternatives peuvent être formulés comme suit : 𝐻0 : 𝜎12 = 𝜎22 et
𝐻1 : 𝜎12 ≠ 𝜎22 , 𝐻1 : 𝜎12 > 𝜎22 , 𝐻1 : 𝜎12 < 𝜎22 .
𝑆12
La variable de décision est le quotient des deux estimateurs . La région d’acceptation peut
𝑆22
𝑆2
être déterminée à partir la relation 1 − 𝛼 = 𝑝 (𝑆12 ∈ 𝐴).
2
Le théorème suivant nous permet de déterminer sa loi de probabilité de la variable de
décision.
Théorème (Admis)
𝑈/𝑘
Si 𝑈 et 𝑉 deux variables aléatoires indépendantes et si 𝑈~𝜒𝑘2 et 𝑉~𝜒𝑙2 alors ~𝐹 (𝑘, 𝑙 ).
𝑉/𝑙
C- Comparaisons de deux proportions

Considérons deux populations de proportions 𝑝1 et 𝑝2 . Dans ce test, on s’intéresse à comparer
les proportions 𝑝1 et 𝑝2 à l’aide de deux échantillons extraits à partir ces deux populations.
Les hypothèses peuvent être formulés comme suit : (𝐻0 : 𝑝1 = 𝑝2 ) et [(𝐻1 : 𝑝1 ≠ 𝑝2 ) ou
(𝐻1 : 𝑝1 > 𝑝2 ) ou (𝐻1 : 𝑝1 < 𝑝2 ).
La variable de décision est la différence entre les fréquences observées des deux
𝑋 𝑋
échantillons.𝐹1 − 𝐹2 où 𝐹1 = 𝑛1 et 𝐹2 = 𝑛2 avec 𝑋1 et 𝑋2 deux variables qui désignent
1 2
l’effectif des éléments ayant le caractère considéré, sur respectivement l’échantillon 1 et
l’échantillon 2.
Lemme
𝑝1 (1−𝑝1 )
Si 𝑛1 ≥ 30 , 𝑛1 𝑝1 ≥ 5 et le tirage est non exhaustif on a 𝐹1 ~𝑁 (𝑝1 , √ ), et si 𝑛2 ≥
𝑛1
𝑝2 (1−𝑝2 )
30 , 𝑛2 𝑝2 ≥ 5 et le tirage est non exhaustif on a 𝐹2 ~𝑁 (𝑝2 , √ ), alors
𝑛2
𝑝1 (1−𝑝1 ) 𝑝2(1−𝑝2 )
𝐹1 − 𝐹2 ~𝑁 (𝑝1 − 𝑝2 , √ +√ )
𝑛1 𝑛2
La région d’acceptation est extraite à partir de la relation 1 − 𝛼 = 𝑝(𝐹1 − 𝐹2 ∈ 𝐴).
IV- Test de khi-deux

Le test 𝜒 2 permet de tester l’adéquation d’une série de données à une famille de lois de
probabilités ou de tester l’indépendance entre deux variables aléatoires. Il concerne
uniquement les lois discrètes, mais on peut l’utiliser aussi pour des échantillons continus
regroupés en classes. Ce test est pratiqué sur les valeurs discrètes de la fonction de répartition
empirique et les valeurs discrètes de la fonction de répartition théorique. Le rejet est
évidemment une réponse négative dans les tests d’adéquation et d’homogénéité mais il
apporte une information positive dans les tests d’indépendance.
A- Test du χ2 d’adéquation à une loi théorique

Le test d’ajustement ou d’adéquation consiste à vérifier la compatibilité des données avec une
distribution choisie a priori. Ce qui permet ensuite d’appliquer un test paramétrique. On a un
phénomène aléatoire représenté par une variable aléatoire notée 𝑋. Généralement, on ne
connait ni la forme de la loi de probabilité suivie par ce phénomène, ni les paramètres de cette
loi. Pour remédier cette ignorance, on tire un n–échantillon que l’on analyse selon les
méthodes de statistiques descriptives. Cela nous permettra de choisir parmi les lois de
probabilité classiques (binomiale, poisson, normale…) celle qui semble être le plus proche de
la distribution expérimentale induite par l’échantillon.
- Formulation des hypothèses

(𝐻0 ): 𝑋 suit 𝑄 vs (𝐻1 ): 𝑋 ne suit pas 𝑄 .avec 𝑄 est l’une des lois de probabilités choisie à
priori (normale, binomiale, de poisson, uniforme…).
- Détermination de la variable de décision
On dispose de 𝑛 réalisations de 𝑋. Ces observations peuvent être groupés en 𝑘 classes ou

modalités notées 𝐶1 , 𝐶2 … 𝐶𝑘 , à chaque 𝐶𝑖 correspond un effectif observé noté 𝑛𝑖 (𝑛 =
∑𝑘𝑖=1 𝑛𝑖 ). On peut calculer la probabilité de la classe 𝐶𝑖 , notée 𝑝𝑖 = 𝑝(𝑋 ∈ 𝐶𝑖 ) car 𝑋~𝑄 et 𝑄

supposé connu. On appelle effectif théorique le produit 𝑛𝑝𝑖 (pas forcément un entier). L’écart
entre la distribution théorique et expérimentale est mesuré par la distance 𝑑 =
(𝑛 −𝑛𝑝 )2 (𝑁 −𝑛𝑝 )2
∑𝑘𝑖=1 𝑖 𝑖 ; A cette distance. On associe la statistique 𝐷 = ∑𝑘𝑖=1 𝑖 𝑖 dont la
𝑛𝑝𝑖 𝑛𝑝𝑖
réalisation est 𝑑 et 𝑁𝑖 la variable aléatoire qui compte l’effectif de la classe 𝐶𝑖 et dont la
réalisation est 𝑛𝑖 . On choisira comme variable de décision 𝐷.
- Détermination de la zone d’acceptation
Etant donné le risque 𝛼, on va rejetter 𝐻0 si l’écart 𝐷 est trop grand. Ainsi on déterminera la
zone de rejet de la forme 𝑅 = [𝑑 ∗ , +∞[ à partir de la table de loi on détermine le réel 𝑡 tel que
1 − 𝛼 = 𝑝( 𝐷 < 𝑡 ) .
Théorème fondamental (admis)
(𝑁 −𝑛𝑝 )2
Si 𝑋~𝑄, alors 𝐷 = ∑𝑘𝑖=1 𝑖 𝑖 ~𝜒𝑘−1 2
approximativement (𝑘 le nombre de classes de 𝑋).
𝑛𝑝𝑖
En pratique «la convergence» est traduite par «𝑛𝑝𝑖 ≥ 5 ».
La preuve
Montrons tout d’abord que les variables aléatoires 𝑁1 , 𝑁2 … 𝑁𝑘 obéissent à la loi
𝑛 𝑛
𝑝1 1 𝑝𝑘 𝑘
multinomiale :𝑝( 𝑁1 = 𝑛1 , 𝑁2 = 𝑛2 … 𝑁𝑘 = 𝑛𝑘 ) = 𝑛! … ou 𝑝𝑗
𝑛1 𝑛𝑘
Soient 𝑋 la variable aléatoire étudiée et (𝑋1 , 𝑋2 … 𝑋𝑛 ) un n-échantillon de 𝑋. Et 𝑄 la loi qui
suit 𝑋 lorsque 𝐻0 est vraie.
Pour tout 𝑗 = 1 … 𝑘, on note 𝑝𝑗 la probabilité théorique de la classe 𝐶𝑗 donnée la loi 𝑄 avec
𝑝𝑗 = 𝑝(𝑋 ∈ 𝐶𝑗 ).
On note 𝑁𝑗 le nombre de variable 𝑋𝑗 prenant leur valeur dans 𝐶𝑗 si 𝐻0 est vraie.
1 𝑠𝑖 𝑋𝑙 ∈ 𝐶𝑗
On suppose que 𝑌𝑗𝑙 = { alors 𝑁𝑗 = ∑𝑛𝑙=1 𝑌𝑗𝑙 et on a 𝑝(𝑌𝑗𝑙 ) = 𝑝𝑗 . 𝑙 étant fixé , la
fonction caractéristique de (𝑌1𝑙 , 𝑌2𝑙 … 𝑌𝑘𝑙 ) est 𝐸 (𝑒𝑥𝑝(∑𝑘𝑗=1 𝑡𝑗 𝑌𝑗𝑙 )).
Si 𝑌𝑗𝑙 = 1 i.e 𝑋𝑙 ∈ 𝐶𝑗 donc tous les autres 𝑌𝑚𝑙 sont nuls est cet événement a pour probabilité
𝑝𝑗 et pour conséquent la fonction caractéristique pour 𝑙 fixé est ∑𝑘𝑗=1 𝑝𝑗 exp(i𝑡𝑗 ).
Les 𝑌𝑗𝑙 pour les valeurs différentes de 𝑙 sont indépendants d’où la fonction caractéristique de
l’ensemble de 𝑌𝑗𝑙 est ∏𝑛𝑙=1(∑𝑘𝑗=1 𝑝𝑗 exp(i𝑡𝑗 ) ) donc la fonction caractéristique de
(𝑁1 , 𝑁2 … 𝑁𝑘 ) est
𝐸 (𝑒𝑥𝑝(𝑖 ∑𝑘𝑗=1 𝑁𝑗 𝑡𝑗 )) = 𝐸 (𝑒𝑥𝑝(𝑖 ∑𝑗𝑙 𝑌𝑗𝑙 𝑡𝑗 )) = ∏𝑛𝑙=1(∑𝑘𝑗=1 𝑝𝑗 exp(i𝑡𝑗 ) ) =
𝑛
(∑𝑘𝑗=1 𝑝𝑗 exp(i𝑡𝑗 )) qui est la fonction caractéristique de la loi multinomiale.
𝑛 𝑛
𝑝1 1 𝑝𝑘 𝑘
En conclusion 𝑝( 𝑁1 = 𝑛1 , 𝑁2 = 𝑛2 … 𝑁𝑘 = 𝑛𝑘 ) = 𝑛! … .
𝑛1 𝑛𝑘
Maintenant montrons que lorsque 𝑛 tend vers l’infini, la loi de probabilité des variables 𝑈𝑗 =
𝑁𝑗 −𝑛𝑝𝑗
, 𝑗 = 1 … 𝑘 tend vers une loi normale 𝑁(0,1).
√𝑛𝑝𝑗
En effet, la fonction caractéristique des 𝑈𝑗 est
𝑁𝑗 −𝑛𝑝𝑗
𝐸 (𝑒𝑥𝑝(𝑖 ∑𝑘𝑗=1 𝑡𝑗 𝑈𝑗 )) = 𝐸 (𝑒𝑥𝑝 (𝑖 ∑𝑘𝑗=1 𝑡𝑗 ))
√𝑛𝑝𝑗
𝑘 𝑘
𝑡𝑗
= exp (−𝑖 ∑ √𝑛𝑝𝑗 𝑡𝑗 ) 𝐸 (𝑒𝑥𝑝 (𝑖 ∑ 𝑁𝑗 ))
𝑗=1 𝑗=1
√𝑛𝑝𝑗

𝑛
𝑘 𝑘
𝑡𝑗
= exp (−𝑖 ∑ √𝑛𝑝𝑗 𝑡𝑗 ) (∑ 𝑝𝑗 exp(𝑖 ))
𝑗=1 𝑗=1
√𝑛𝑝𝑗
1
Ecrivons le développement limité à l’ordre 2 en .
√𝑛
𝑡𝑗 𝑡𝑗 𝑡 2 𝑡𝑗 𝑡 2
𝑗 1 1 𝑗 1 1
On a exp (𝑖 )=1+𝑖 + 𝑖 2 2𝑛𝑝 + 𝑛 𝜀 (𝑛 ) = 1 + 𝑖 − 2𝑛𝑝 + 𝑛 𝜀 (𝑛) avec
√𝑛𝑝𝑗 √𝑛𝑝𝑗 𝑗 √𝑛𝑝𝑗 𝑗
1
𝜀 (𝑛 ) → 0
D’où
𝑘 𝑘
𝑡𝑗 𝑡𝑗 𝑡𝑗 2 1 1
∑ 𝑝𝑗 exp(𝑖 ) = ∑ 𝑝𝑗 (1 + 𝑖 − + 𝜀 ( ))
√𝑛𝑝𝑗 √𝑛𝑝𝑗 2𝑛𝑝𝑗 𝑛 𝑛
𝑗=1 𝑗=1
𝑘 𝑘
𝑝𝑗 1 1 1
= 1 + 𝑖 ∑ 𝑡𝑗 √ − ∑ 𝑡𝑗2 + 𝜀 ( )
𝑛 2𝑛 𝑛 𝑛
𝑗=1 𝐽=1
De même
𝑝 𝑝 1 2 1 1
𝑒𝑥𝑝 (−𝑖 ∑𝑘𝑗=1 𝑡𝑗 √ 𝑛𝑗 ) = 1 − 𝑖 ∑𝑘𝑗=1 𝑡𝑗 √ 𝑛𝑗 − 2𝑛 (∑𝑘𝐽=1 𝑡𝑗 √𝑝𝑗 ) + 𝑛 𝜀 (𝑛)
A l’ordre 2 le produit vaut
𝑝 𝑡𝑗 1 2 1 2
𝑒𝑥𝑝 (−𝑖 ∑𝑘𝑗=1 𝑡𝑗 √ 𝑛𝑗 ) ∑𝑘𝑗=1 𝑒𝑥𝑝 (𝑖 ) = 1 − 2𝑛 (∑𝑘𝑗=1 𝑡𝑗 √𝑝𝑗 ) + 𝑛 (∑𝑘𝑗=1 𝑡𝑗 √𝑝𝑗 ) −
√𝑛𝑝𝑗
1 1 1
∑𝑘𝑗=1 𝑡𝑗2 + 𝜀 ( )
2𝑛 𝑛 𝑛
1 2 1 1
= 1 − 2𝑛 ∑𝑘𝑗=1 𝑡𝑗2 − (∑𝑘𝑗=1 𝑡𝑗 √𝑝𝑗 ) + 𝑛 𝜀 (𝑛)
1
Lorsque 𝑛 tend vers l’infini, la puissance 𝑛 de ce produit tend vers 𝑒𝑥𝑝 (− 2 [∑𝑘𝑗=1 𝑡𝑗2 −
2
(∑𝑘𝑗=1 𝑡𝑗 √𝑝𝑗 ) ]) qui est la fonction, caractéristique d’un vecteur d’une loi normale 𝑁(0,1).
Lorsque 𝑛 tend vers l’infini 𝑈𝑗 tend vers 𝑁(0,1)
Exemple (Ajustement par la loi de Poisson)
Le responsable des stocks d’un laboratoire de produits pharmaceutiques souhaite savoir
combien de doses de vaccin il doit tenir en stock. Il relève donc les ventes de ce vaccin sur les
100 derniers jours, supposés représentatifs, à savoir :
Nombre de doses vendues 0 1 2 3 4 5 6

Nombre de jours 14 27 26 18 9 4 2
Peut-on dire que les ventes de vaccin sont distribuées selon une loi de Poisson ?
Solution
Formulation des hypothèses
Soit 𝑋 une variable aléatoire qui désigne le nombre de doses de vaccin vendues par jour.
𝐻0 : 𝑋~𝑃(𝜆).
𝐻1 : 𝑋 ne suit pas la loi de poisson.
Si 𝑋~𝑃(𝜆) alors 𝐸 (𝑋) = 𝜆.
𝑋̅ est un estimateur efficace de 𝐸 (𝑋) c’est-à-dire de 𝜆.
0𝑋14+1𝑋27+⋯6𝑋2
Alors on peut estimer 𝜆 par son estimation ponctuelle 𝜆 = 𝑥̅ = ≈ 2.01
100

𝜆𝑘 𝑒 −𝜆 2𝑘 𝑒 −2
Donc pour 𝑋 ∈ {0,1,2 … 7, … } ; 𝑝(𝑋 = 𝑘) = =
𝑘! 𝑘!
Calcul des effectifs théoriques
2𝑖 𝑒 −2
𝑇𝑖 = 𝑛𝑝𝑖 = 𝑛𝑝(𝑋 = 𝑖 ) = 100
𝑖!
X 0 1 2 3 4 5 6
𝑛𝑖 14 27 26 18 9 4 2
𝑇𝑖 13.4 26.93 27.07 18.13 9.11 3.66 1.70
On constate que 𝑇5 et 𝑇6 <5 or la condition du lemme est que 𝑛𝑝𝑖 > 5 pour tout i. donc on
regroupe les deux classes 5 et 6 en une le tableau ci-dessus devient
X 0 1 2 3 4 >=5 Total
𝑛𝑖 14 27 26 18 9 6 100
𝑇𝑖 13.4 26.93 27.07 18.13 9.11 5 .36 100
(𝑛𝑖 −𝑇𝑖 )2
On calcule 𝑑 = ∑6𝑖=1 = 0.15
𝑇𝑖
Le seuil critique 1 − 𝛼 = 0.95 et à partir du tableau des probabilités de la loi 𝜒52 on extrait t
vérifiant 𝑝(𝐷 ≤ 𝑡) = 0.95 on obtient t=11.07 or d=0.15<t=11.07 alors on accepte
l’hypothèse nulle ; c’est-à-dire les ventes de vaccin sont distribués selon la loi de poisson.
B- Test du χ2 d’indépendance
Le test d’indépendance ou d’association consiste à prouver l’existence d’une liaison entre 2
variables. On considère deux variables aléatoires 𝑋 et 𝑌 et on souhaite tester le fait que ces
deux variables sont indépendantes.
Exemple
Est-ce que la distribution de la couleur des yeux observée dans la population européenne est
indépendante du sexe des individus ?
On calcule la distance entre les valeurs observées (ou les valeurs empiriques) et les valeurs
2
attendues s’il y avait indépendance. On montre que la loi de 𝜒𝑜𝑏𝑠 suit asymptotiquement une
2
loi du 𝜒𝑘−1 . Supposons que 𝑋 et 𝑌 deux variables aléatoires définies sur la même population
Ω mesurant deux caractères.𝑋: Ω → M, M étant un ensemble de modalités divisé en 𝑘 classes
𝐶1 , 𝐶2 … 𝐶𝑘 ; 𝑌: Ω → M′, M′ étant un ensemble de modalités divisé en 𝑙 classes 𝐷1 , 𝐷2 … 𝐷𝑙 .
On veut savoir s’il existe une liaison significative entre 𝑋 et 𝑌
𝐻0 : 𝑋 et 𝑌 sont indépendantes vs 𝐻1 : 𝑋 et 𝑌 sont dépendantes.
Détermination de la variable de décision
On dispose d’un échantillon 𝑋 et d’un échantillon de 𝑌 dont les résultats peuvent se mettre
sous la forme du tableau de contingence suivant :
𝐷1 𝐷𝑗 𝐷𝑙 Effectif des 𝐶𝑖
𝐶1 𝑛1∗
𝐶𝑖 𝑛𝑖𝑗 𝑛𝑖∗
𝐶𝑘 𝑛𝑘∗
Effectif des 𝑛∗1 𝑛∗𝑗 𝑛∗𝑙 𝑛
𝐷𝑖

Avec 𝑛∗𝑗 = ∑𝑘𝑖=1 𝑛𝑖𝑗 ; 𝑛𝑖∗ = ∑𝑙𝑗=1 𝑛𝑖𝑗 et 𝑛 = ∑𝑘𝑖=1 ∑𝑙𝑗=1 𝑛𝑖𝑗
Si 𝐻0 est vraie alors 𝑝 ((𝑋 ∈ 𝐶𝑖 ) ∩ (𝑌 ∈ 𝐷𝑗 )) = 𝑝(𝑋 ∈ 𝐶𝑖 ). 𝑝(𝑌 ∈ 𝐷𝑗 ), ∀ 𝑖, 𝑗. Puisque on ne
connait pas les probabilités théoriques de 𝑋 et 𝑌, on peut traduire cette propriété par 𝑓𝑖𝑗 =
𝑛𝑖𝑗 𝑛𝑖∗ 𝑛∗𝑗
𝑓𝑖∗ × 𝑓∗𝑗 ∀𝑖, 𝑗 avec 𝑓𝑖𝑗 = ; 𝑓𝑖∗ = ; 𝑓∗𝑗 = . On appelle effectif théorique la quantité
𝑛 𝑛 𝑛
𝑛𝑖∗ ×𝑛∗𝑗
𝑡𝑖𝑗 = ; 𝑓𝑖𝑗 = 𝑓𝑖∗ × 𝑓∗𝑗 ∀𝑖, 𝑗 ⇔ 𝑛𝑖𝑗 = 𝑡𝑖𝑗 ∀𝑖, 𝑗. On définit la quantité 𝑑 =
𝑛
2
(𝑛𝑖𝑗 −𝑡𝑖𝑗 )
∑𝑘𝑖=1 ∑𝑙𝑗=1 , c’est normal de décider le rejet de 𝐻0 si 𝑑 est trop grand.
𝑡𝑖𝑗
On choisit la variable aléatoire de décision la variable aléatoire 𝐷 associée à 𝑑. Si 𝐻0 est vraie
2
(𝑁𝑖𝑗 −𝑇𝑖𝑗) 2
𝐷 = ∑𝑘𝑖=1 ∑𝑙𝑗=1 ~𝜒(𝑘−1)(𝑙−1) où 𝑁𝑖𝑗 et 𝑇𝑖𝑗 sont les variables aléatoires dont les
𝑇𝑖𝑗
réalisations sont respectivement 𝑛𝑖𝑗 et 𝑡𝑖𝑗 .
Remarque
Tous les effectifs doivent être supérieurs à 5.
Les techniques utilisées diffèrent selon que les variables sont qualitatives nominales,
ordinales ou quantitatives.
C- Test du χ2 d’homogénéité
On considère 𝑟 populations 𝑃2 … . 𝑃𝑟 chacune divisées en 𝑘 classes distinctes 𝐶1 , 𝐶2 … . 𝐶𝑘
selon une même variable aléatoire 𝑋. On dira que les populations sont homogènes si la
distribution est la même dans les 𝑟 populations.
𝐻0 : Les 𝑟 populations sont de même distributions vs 𝐻1 : les 𝑟 populations ne sont pas
homogènes.
On note 𝑝𝑖𝑗 la probabilité de la classe 𝐶𝑗 dans la population 𝑃𝑖 . les 𝑟 populations sont
homogènes si les 𝑝𝑖𝑗 ne dépendent pas de la population 𝑃𝑖 ce qui se traduit par 𝐻0 𝑝𝑖𝑗 =
𝑝𝑗 ∀𝑖 = 1 … 𝑟 , ∀𝑗 = 1 … 𝑘 avec ∑𝑘𝑗=1 𝑝𝑗 = 1 mais les 𝑝𝑗 sont inconnues puisque on ne
connait pas la loi de probabilité théorique de 𝑋. (𝑝𝑗 = 𝑝(𝑋 ∈ 𝐶𝑗 )). On dispose d’un
𝑛-échantillon de 𝑋 dans chacune des r populations dont les résultats peuvent se mettre sous la
forme du tableau de contingence suivant :
𝐶1 ⋯ 𝐶𝑗 ⋯ 𝐶𝐾 Taille des
échantillons
𝑃1 𝑛11 ⋯ 𝑛1𝑗 ⋯ 𝑛1𝑘 𝑛1∗
⋮ ⋮ ⋮
𝑃𝑖 𝑛𝑖1 𝑛𝑖𝑗 𝑛𝑖𝑘 𝑛𝑖∗
⋮ ⋮ ⋮
𝑃𝑟 𝑛
𝑛𝑟1 ⋯ 𝑟𝑗 ⋯ 𝑛𝑟𝑘 𝑛𝑟∗
Effectif 𝑛∗1 ⋯ 𝑛∗𝑗 ⋯ 𝑛∗𝑘 𝑛
des 𝐶𝑗
Avec 𝑛∗𝑗 = ∑𝑟𝑖=1 𝑛𝑖𝑗 ; 𝑛𝑖∗ = ∑𝑘𝑗=1 𝑛𝑖𝑗 et 𝑛 = ∑𝑟𝑖=1 ∑𝑘𝑗=1 𝑛𝑖𝑗 . On estimera naturellement le
𝑛
paramètre 𝑝𝑗 par la proportion correspondante dans l’échantillon 𝑝𝑗 ≈ 𝑛∗𝑗 ainsi si 𝐻0 est
vraie, l’effectif théorique de la classe 𝐶𝑗 dans la population 𝑃𝑖 est à peu près 𝑡𝑖𝑗 = 𝑛𝑖∗ × 𝑝𝑗 =

2
𝑛𝑖∗ ×𝑛∗𝑗 (𝑛𝑖𝑗−𝑡𝑖𝑗 )
. On définit la quantité 𝑑 = ∑𝑘𝑖=1 ∑𝑙𝑗=1 . Il est naturel de décider, si 𝑑 est trop
𝑛 𝑡𝑖𝑗
grand, le rejet de 𝐻0
Détermination de la variable de décision
On choisit comme variable de décision la variable aléatoire 𝐷 associée à 𝑑. Si 𝐻0 est vraie
2
(𝑁𝑖𝑗 −𝑇𝑖𝑗) 2
𝐷 = ∑𝑘𝑖=1 ∑𝑙𝑗=1 ~𝜒(𝑘−1)(𝑟−1) avec 𝑁𝑖𝑗 et 𝑇𝑖𝑗 sont les variables aléatoires dont les
𝑇𝑖𝑗
réalisations sont respectivement 𝑛𝑖𝑗 et 𝑡𝑖𝑗 .
Remarque
Les notations et la mise en place sont les mêmes que dans les tests d’indépendance, mais les
significations sont différentes.
Exemple 1
Y a-t-il une différence entre le taux de glucose moyen mesuré pour deux échantillons
d’individus ayant reçu des traitements différents ?

Exercices
Exercice 1
Au contrôle de la qualité d’un institut de beauté, on analyse le PH d’un certain parfum. On
sait que ce facteur maintient un aspect normal de moyenne 2.8. Afin de connaitre sa variance,
on effectue un prélèvement de 25 unités de ce parfum dont on mesure PH. Pour certain
échantillon, la valeur de ∑𝑛𝑖=1(𝑥𝑖 − 𝜇)2 (où 𝜇 = 2.8) est de 0.0625.
Bâtir un intervalle de confiance qui permettra d’estimer la variance du PH de ce parfum avec
un degré de certitude de 95%.
Exercice 2
La consommation d’essence en (L/100km) d’un certain modèle d’automobile est distribué
selon une loi normale. On note la consommation de 25 voitures de ce modèle. On obtient une
moyenne d’échantillon de 8.7L /100km et un écart type corrigé d’échantillon de 0.09L/km.
Estimer la variance de la population par intervalle avec 90%.
Exercice 3
Une entreprise comporte un grand nombre d’employés avec un système de pointage des
heures d’arrivée. Chaque employé doit arriver à 8h. On a relevé le retard d’un échantillon de
25 employés. On a obtenu un retard moyen de 6.47 min pour un écart type moyen 1.12 min. a
partir de ces informations, donner un intervalle de confiance au seuil de 0.9 pour l’écart type
du temps de retard
Exercice 4
Dans une population d’étudiants en License on a prélevé indépendamment deux échantillons
de tailles 𝑛1 = 120 et 𝑛2 = 150 ; On considère que les 48 étudiants du premier échantillon et
66 du deuxième ont une formation scientifique secondaire. Soit 𝜋 la proportion d’étudiants
ayant suivi une formation scientifique. Calculer 3 estimations ponctuelles de 𝜋.
Exercice 6
L’entreprise BOX, spécialisée dans la commercialisation de pomme de qualité, adresse à l’un
de ses clients un envoi massif de fruits. Au préalable, un contrôle de qualité portant sur un
échantillon de 1000 pommes a permis de dénombrer 80 fruits défectueux. On se propose de
calculer au seuil de confiance 90% et 95% entre quelles limites est compris le pourcentage de
fruits défectueux dans l’envoi.
Exercice 7
Le montant annuel versé à un régime d'épargne retraite par les 35 000 contribuables d'une région
donnée du pays varie selon une distribution inconnue. La moyenne par individu vaut 2 000 $ et l'écart
type est de 500 $. Un échantillon aléatoire et avec remise de 80 contribuables est prélevé parmi la
population de la région.
a) Calculer la probabilité pour que le montant versé moyen de l'échantillon soit compris
entre 1950 $ et 2100 $
b) Calculer la probabilité pour que le montant total annuel versé par l'ensemble des
contribuables de l'échantillon soit supérieur à 170 000 $ :
Exercice 8

Une compagnie qui exploite une flotte de taxis veut connaître le nombre moyen de km pour
l'ensemble de ses chauffeurs. Pour l'ensemble des chauffeurs, l'écart type = 4800 km. Un échantillon
de taille 100 donne une moyenne de 45110 km. Suite aux précédentes, le statisticien obtient
l'intervalle de confiance [44169.2 - 46 050.8].
a. Quel était le niveau de confiance utilisé ?
b. Si on veut une moyenne de 500 km, quelle taille minimale doit avoir l'échantillon
même niveau de confiance que celui trouvé en a) ?
Exercice 9
Afin d'évaluer la durée moyenne d'une certaine opération critique, le responsable technique choisit au
hasard 5 cas de réalisation de cette opération ; il trouve 30, 50,60, 70 et 90 minutes. On suppose que la
durée est une v. écart type est égal à celui calculé pour l'échantillon. Construire un intervalle bilatéral
de niveau 0,9 pour la durée moyenne de cette opération.
Exercice 10
On a tiré au hasard un échantillon de 100 employés à pourboire de Mon suivant résume les
données concernant cet échantillon :
Montant de pourboire en dollars Nb de cas

25 5
30 17
35 25
40 27
45 18
50 8
Estimer, à l’aide d’un intervalle de confiance bilatéral de 90% le montant moyen reçu en
pourboire par un employé à pourboire de Montréal.
Exercice 11
Le Bureau du tourisme du Nouveau - Brunswick souhaite estimer la proportion de touristes
qui prévoient faire du camping dans la province cette année. Les études antérieures estiment
la proportion de campeurs à 35%. Pour obtenir la nouvelle estimation, un sondage est
effectué dans les centres d'information touristique situés aux frontières de la province ...
Quelle taille l'échantillon doit - il avoir pour que la marge d'erreur de l'estimation soit d'au
plus 2 %, au niveau de confiance de 95% ?
Exercice 12
Une firme de recherche mène un sondage afin de déterminer le montant hebdomadaire moyen
consacré à l'achat de cigarettes par les fumeurs réguliers. Un échantillon de 49 fumeurs révèle que =
54 $ et s = 10 $.
a- Donnez une estimation ponctuelle de la moyenne de la population.
b- Donnez une estimation par intervalle de confiance de niveau 95 %, pour μ.
Exercice 13
Un sondage doit être effectué dans une région rurale du Québec, afin de déterminer le revenu familial
moyen des ménages. Un échantillon témoin de 10 familles a permis d'observer un écart type de 500 $.
Le commanditaire du sondage exige une marge d'erreur maximale de 100 $ et un niveau de confiance
de 95 % pour l'estimation de la moyenne. Combien de familles devraient faire partie du sondage ?
Exercice 14
Un inspecteur des viandes de Calgary a la responsabilité d'estimer le poids net moyen des
emballages de viande hachée dont l'étiquette indique 1 kg. Il réalise que tous les emballages
ne peuvent évidemment avoir un poids exact de 1 kg. Un échantillon de 36 emballages donne
un poids moyen de 1,01 kg avec un écart type de 0,02 kg.

a- Donnez une estimation ponctuelle de la moyenne de la population.
b- Déterminez une estimation par intervalle, au niveau de confiance de 95 %, pour la
moyenne de la population.
Exercice 15
Dans un sondage effectué par Ipsos - Reid en août 2001, 63 % des 1 000 adultes canadiens interrogés
sont opposés aux aliments génétiquement modifiés (OGM).
a. Donnez une estimation par intervalle de confiance de niveau 95 % de la proportion de
Canadiens qui sont opposés aux OGM.
b. D'après les résultats du sondage, quelle serait votre réaction si on prétendait que
moins 60 % des Canadiens sont opposés aux aliments génétiquement modifiés ?
Exercice 16
À l'occasion de la vérification annuelle de ses comptes, un agent de courtage sélectionne
aléatoirement un échantillon de 36 clients. Il vérifie la valeur totale de leurs comptes et observe une
moyenne de 32 000 $ avec un écart type de 8 200 $. Estimez, à l'aide d'un intervalle confiance à 90 %,
la valeur moyenne des comptes de tous ses clients ?
Exercice 17
On veut estimer la proportion de comptables qui ont changé d'employeur depuis les trois
dernières années. On utilise un niveau de confiance de 95 %, et la marge d'erreur de
l'estimation ne doit pas excéder 3 %. Une étude menée il y a plusieurs années révélait que 21
% des comptables avaient changé d'employeur sur une période de trois ans.
a) Afin de mettre à jour cette étude, combien de dossiers de comptables devrait - on
examiner (utiliser la proportion de l'étude antérieure pour le calcul) ?
b) Combien de comptables devraient être contactés si on ne disposait d'aucune
information préliminaire concernant la proportion de la population ?
Exercice 18
Une psychologue industrielle étudie actuellement le niveau de stress des cadres œuvrant dans
des entreprises spécialisées en services Internet. Elle a mis au point un questionnaire
permettant, croit - elle, de mesurer le niveau de stress. Un résultat supérieur à 80 indique
niveau de stress alarmant. Un échantillon aléatoire de 15 cadres a donné les résultats suivants
: 94 78 83 90 78 99 97 90 97 90 93 94 100 75 84
(Supposez que la distribution est approximativement normale dans la population de
référence).
a) Déterminez le niveau moyen de stress des cadres de cet échantillon et donnez estimation
ponctuelle de la moyenne de la population.
b) Calculez un intervalle de confiance de niveau 95 % pour estimer le niveau moyen de
stress dans la population étudiée.
c) Est –il raisonnable de conclure que les cadres des entreprises spécialisées en services
internet ont un niveau moyen stress alarmant, d'après le test la psychologue ?
Exercice 19
Un sondage réalisé par L'Association canadienne des restaurateurs et des services
alimentaires (CRFA) auprès de 60 couples de jeunes mariés a révélé que le nombre moyen de
repas pris au restaurant était de 2.76 repas par semaine avec un écart type de 0.75. Donnez
une estimation par intervalle, au niveau de confiance 98 %, pour la moyenne de la population
considérée
Exercice 20
Une compagnie de téléphone note dans son rapport annuel que le client moyen dépense 60 $
par mois pour les appels locaux et interurbains ». Un échantillon de 12 clients, a permis
d'observer les montants mensuels suivants :

64 66 64 66 59 62
67 61 64 58 54 66
Supposez que la distribution du montant dépensé en appels locaux et interurbains est
approximativement normale dans la population de référence
a) Donnez une estimation ponctuelle de la moyenne de la population ?
b) Donnez une estimation par intervalle, au niveau de confiance 90 %, pour la moyenne
de la population
c) Est –il raisonnable, comme le note de rapport de la compagne, que le client moyen
dépenses 60 dollars par mois en appels locaux et interurbains ? expliquez votre
réponse.

Statistique Cours-2-1-39-1

Transféré par

Droits d'auteur :

Formats disponibles

Statistique Cours-2-1-39-1

Transféré par

Informations du document

Titre original

Copyright

Formats disponibles

Partager ce document

Partager ou intégrer le document

Options de partage

Avez-vous trouvé ce document utile ?

Ce contenu est-il inapproprié ?

Droits d'auteur :

Formats disponibles

Statistique Cours-2-1-39-1

Transféré par

Droits d'auteur :

Formats disponibles

Université Abdelmalek Essaâdi

Ecole Nationale des Sciences Appliquées

Ahmed DRISSI ENSA Tanger Page 1

1. La statistique descriptive (programmé à l’AP1)

Ahmed DRISSI ENSA Tanger Page 2

Ahmed DRISSI ENSA Tanger Page 3

Ahmed DRISSI ENSA Tanger Page 4

Après 200heures on aura environ 25% de chance que l’équipement fonctionne.

3. Les caractéristiques d’une variable aléatoire

Ahmed DRISSI ENSA Tanger Page 5

i) Vérifie que 𝑓 est une densité de probabilité de 𝑋.

II- Les lois des variables aléatoires discrètes

Ahmed DRISSI ENSA Tanger Page 6

III- Les lois des variables aléatoires continues

Ahmed DRISSI ENSA Tanger Page 7

Ahmed DRISSI ENSA Tanger Page 8

3. La loi normale (ou de Gauss)

Ahmed DRISSI ENSA Tanger Page 9

Cette probabilité est représenté par l’aire hachurée.

- 𝐸 (𝑋) = 10; 𝜎 (𝑋) = 3 ; d’après la formule de la fonction de densité.

Les caractéristiques de la loi Khi-deux

Ahmed DRISSI ENSA Tanger Page 10

IV- Convergence et Approximations des lois

2. La convergence vers la loi normale

Idée : Utilisant le Développement Limité de la fonction caractéristique.

Ahmed DRISSI ENSA Tanger Page 11

Ahmed DRISSI ENSA Tanger Page 12

Ahmed DRISSI ENSA Tanger Page 13

I- Étude de la moyenne/écart type d'un échantillon

Ahmed DRISSI ENSA Tanger Page 14

Ahmed DRISSI ENSA Tanger Page 15

Ahmed DRISSI ENSA Tanger Page 16

I- Généralités sur les estimateurs

II- Estimation de la moyenne/écart type d’une population

Ahmed DRISSI ENSA Tanger Page 17

Ahmed DRISSI ENSA Tanger Page 18

a) La moyenne et la variance empirique de cet échantillon sont données comme suit :

Ahmed DRISSI ENSA Tanger Page 19

2- Estimation par intervalle de confiance

A- Intervalle de confiance pour une moyenne

Ahmed DRISSI ENSA Tanger Page 20

B- Intervalle de confiance pour la variance d’une variable gaussienne

Ahmed DRISSI ENSA Tanger Page 21

III- Estimation d’une proportion

Ahmed DRISSI ENSA Tanger Page 22

2- Estimation par intervalle de confiance

Ahmed DRISSI ENSA Tanger Page 23

Ahmed DRISSI ENSA Tanger Page 24

3. La région d’acceptation et la région critique

4. Formulation des tests statistiques

Ahmed DRISSI ENSA Tanger Page 25

5. Les types de tests

II- Test de conformité

Ahmed DRISSI ENSA Tanger Page 26

A- Test de conformité de la moyenne

Ahmed DRISSI ENSA Tanger Page 27

d’où l’intervalle d’acceptation est 𝐴 = [𝜇0 − 𝑟; 𝜇0 + 𝑟] = [2421.2; 2578.

 Formulation des hypothèses

Test unilatéral à gauche