Fin Statisique Inductive Ecopo

Télécharger au format docx, pdf ou txt
Télécharger au format docx, pdf ou txt
Vous êtes sur la page 1sur 18

1.

RAPPEL SUR LES INTERVALLES DE CONFIANCE

1.1 INTERVALLE DE CONFIANCE DE LA DIFFERENCE DE DEUX


MOYENNES.

Supposons deux populations quelconques étudiées par rapport aux


mêmes caractères quantitatifs de moyennes respectives µ 1 et µ2 inconnues et des
2 2
variances respectives σ 1 et σ 2 connues et deux échantillons de tailles respectives
n1 et n2 extraits au hasard d’elles.
a) Si les tailles des échantillons sont élevées, les moyennes
d’échantillons X̄ 1 et X̄ 2 sont des variables normales. Il en est de
même de leur différence X̄ 1 – X̄ 2 dont les paramètres sont :
E( X̄ 1 – X̄ 2 ) = E( X̄ 1 ) + E( X̄ 2 ) = µ - µ 1 2
σ 21 σ 22
+
V( X̄ 1 – X̄ 2 ) = V( X̄ 1 ) + V( X̄ 2 ) = n 1 n2
Etant donné un seuil de confiance (1 -  fixé a priori, il existe un
Z α
1-
nombre 2 obtenu à partir de la table de la loi normale centrée

réduite, telle que :

P
[ ( X̄ 1 - { X̄ ¿ ¿ 2 ) - z
1-
α
2 √ σ 12 σ 22
+ < µ 1 - µ 2 <( X̄ 1 - { X̄ ¿ ¿ 2 )+ z
n 1 n2 1-
α
2 √ ]
σ 21 σ 22
+
n 1 n2
=1 -

D’où l’intervalle de confiance de la différence de deux moyennes au


seuil de confiance (1 –  est :

µ1 - µ2 = ( X̄ 1 – X̄ 2 ) ± 2
1-
α z
√ σ 21 σ 22
+
n1 n2
b) Lorsque les variances sont inconnues, elles peuvent être estimées
par :
n
∑ ( X ij - { X̄ i )²
j=1
S2i = ¿
ni - 1
Si n1 et n2 sont très faibles (< 30), alors la variable T =
( X̄ 1 − X̄ 2 )

S
1 1
+

n1 n2 suit la loi T-Student à (n + n – 2) degré de liberté
2 2
(n1 - 1 )S1 +(n 2 - 1 )S 2
1 2

Avec S² = n1 + n 2 - 2
Exemple :
Soient deux lots d’ampoules A et B dont les durées de vie sont
supposées distribuées normalement de moyennes respectives µ A et µB
inconnues et d’écarts types respectifs A = 120h et B = 80h. Deux
échantillons de tailles respectives n A et nB sont prélevés et donnent
les résultats ci-après :
X̄ A = 1.400h et X̄ B = 1.200h
Estimer par intervalle de confiance à 90% la différence de vie
moyenne de deux lots d’ampoules.

Solution.

µA - µB = ( X̄ A – X̄ B ) ± 2
1-

X̄ A – X̄ B = 1.400 – 1.200 = 200


√ σ 2A σ 2B
+
nA nB ;

z α z α z α
1- 1- 1-
P(– 2 < U < 2 ) = 90% = 0,90 ⇒ 2 = 1,65
120² 80²
+
150 200 = 128
µA - µB Є 200 ± 1,65√ 128 = 200 ± 18,66762
µA - µB Є [181,33 ; 218,66]

1.2. INTERVALLE DE CONFIANCE DE LA DIFFERENCE DE DEUX


PROPORTIONS.
Soient deux échantillons de tailles respectives n 1 et n2 extraits au hasard
de deux populations différentes respectivement de proportions p 1 et p2 inconnues
satisfaisant à un même caractère quantitatif.

Si n1 et n2 sont élevées, les proportions d’échantillonnage f 1 et f2 suivent


une loi normale. Par suite :
E(f1 – f2) = E(f1) – E(f2) = p1 – p2 ; et
p 1 (1 - p1 ) p2 (1 - p2 )
+
V(f1– f2) = V(f1) – V(f2) = n1 n2
( f 1 - f2 ) - ( p 1 - p 2 )

La variable Z = √ p1 ( 1 - p 1 ) p 2 ( 1 - p 2 )
n1
+
n2 → N(0, 1)
Etant donné un seuil de confiance (1 -  fixé a priori ; il existe un
nombre u obtenu à partir de la taille de la loi normale centrée réduite telle que :
P
[ ( f 1 - f2 ) - z
1-
α
2 √ p1 (1 - p 1 ) p2 ( 1 - p 2 )
n1
+
n2
< p1 - p2 <( f 1 - f 2 )+ z α
1-
2 √ p1 ( 1 - p1 ) p2 ( 1 - p2 )
n1
+
n2 ] =1 -

Les limites de confiance à 100% de (p1 – p2) s’écrivent :

f –f ±u
1 2
n √
f 1 (1 - f 1 ) f 2 (1 - f2 )
1
+
n2

Exemple :
Dans un échantillon de 1.000 personnes résidant dans une ville A, on a observé
100 étrangers ; dans un autre échantillon de 2.000 personnes d’une ville B, on a
observé 100 étrangers. Le calcul des limites de confiance à 99% de la différence
des pourcentages d’étrangers résidant dans chacun de ville se fait de la manière
suivante :
100
n1 = 1.000 f1 = 1. 000 = 0,1
100
n2 = 2.000 f2 = 2. 000 = 0,05
 = 99%= 0,99
z α z α z α
1- 1-
P(– 2 < U < 2 ) = 99% = 0,99 ⇒ 1 - 2 = 2.57

p –p Єf –f ±
1 2
z α 1
1-
1 2 n 1 2
+
n2√
f (1 - f 1 ) f 2 (1 - f2 )

0,1 x 0,9 0,05 x 0,95


p1 – p2 Є (0,1 – 0,05) ± 2,57 1. 000
p1 – p2 Є [0,013 ; 0,087]
+
2 . 000 √
2. LES PROBLEMES DE COMPARAISON : TESTS D’HYPOTHESES.

1. INTRODUCTION.

Les tests d’hypothèses (appelés aussi tests statistiques) comme


l’estimation par intervalle de confiance sont des techniques utilisées dans la
recherche en statistique. La seule différence entre les deux techniques est que
dans l’estimation des paramètres aucune prédiction n’est faite sur la valeur du
paramètre.
Les tests consistent à vérifier si la valeur prédite est significativement égale
(hypothèse nulle) ou significativement différente de la valeur réelle (hypothèse
alternative).
Suivant la forme de l’hypothèse alternative, on distingue deux sortes des
tests :
 Les tests bilatéraux.
L’hypothèse alternative est de la forme : θ ≠ θ0. En d’autres termes,
la valeur réelle du paramètre θ dans la population est différente de la
valeur prédite (inférieure ou supérieure).
Ce type de test est utilisé dans beaucoup d’applications notamment
dans le contrôle de qualité où la dimension moyenne des pièces
fabriquées dans une usine doit être égale à une valeur fixe avec un
écart type bien déterminé. Si à l’issu du test, l’hypothèse alternative
est acceptée, on conclut que la dimension moyenne est
significativement différente de la valeur normale, d’où les pièces
fabriquées ne sont plus d’une bonne qualité.

 Les tests unilatéraux.


Dans ce genre de test, l’hypothèse alternative est posée dans le sens
soit d’une supériorité, soit d’une infériorité de la valeur réelle du
paramètre par rapport à la valeur prédite :
θ > θ0 (test unilatéral à droite) ;
θ < θ0 (test unilatéral à gauche).
Un exemple d’application de ces tests est celui où la valeur du
paramètre doit dépasser ou ne doit pas dépasser une certaine norme
H0 : θ = θ0
H1 : θ > θ0
2. PRINCIPES DU TEST D’HYPOTHESES.

Un échantillon de n pièces comptables a été tiré pour procéder à cette


vérification et on estime qu’une proportion p0 d’erreurs dans la comptabilité est
acceptable. En effet, si l’on voulait absolument s’assurer qu’il n’y a aucune
erreur, un contrôle exhaustif serait nécessaire.
En général, la proportion d’erreurs observée sur l’échantillon sera
différente de p0. Elle pourra, en particulier, lui être supérieure. Cet écart peut
avoir deux origines :
- la proportion d’erreurs p dans la comptabilité est bien égale (ou
inférieure) à p0 et la différence observée est due aux seules
fluctuations aléatoires, c’est-à-dire au fait que la mesure ait été
effectuée sur un échantillon ;
- la proportion d’erreurs dans la comptabilité est effectivement
supérieure à p0.

Il s’agit donc de choisir entre ces deux hypothèses et de décider si


l’écart observé est significatif (au seuil  de probabilité fixé), ou au contraire,
n’est pas significatif et la marque d’une différence réelle est due seulement au
hasard
1. On définit deux hypothèses antagonistes H 0 et H1 que l’on désire
tester :
- H0 : le pourcentage d’erreurs figurant dans la comptabilité est égal
au pourcentage considéré comme acceptable : H0 : p = p0
- H1 : le pourcentage d’erreurs est supérieur au pourcentage
acceptable : H1 : p > p0.
Le test a pour but de fournir une règle de décision permettant de
choisir entre les deux hypothèses H0 et H1.
2. On considère l’hypothèse H0 comme exacte. Dans ces conditions, la
loi de probabilité de la proportion d’erreurs f mesurée sur
l’échantillon est déterminée : c’est suivant le mode de tirage de
l’échantillon, une loi binomiale (ou une loi hypergéométrique) de
moyenne p0. l’écart f - p0 observée ne peut être dû, dans cette
hypothèse, qu’aux seules fluctuations d’échantillonnage, c’est-à-
dire au fait que le contrôle n’a été effectué que sur une fraction des
pièces comptables, et non sur la totalité, et qu’il s’ensuit, par
conséquent, une certaine imprécision.
3. On se fixe un seuil de probabilité , parfois appelé seuil de
signification qui correspond au risque de se tromper que l’on
accepte de courir ; plus précisément  est la probabilité de retenir
H1 alors que H0 est vraie :
 =P{choisir H1/ H0 vraie}
Si, par exemple, on prend  = 0,05, cela signifie que l’on accepte 5
chances sur 100 de refuser la comptabilité comme ayant un
pourcentage d’erreurs supérieur à p0 alors que, en réalité, celui-ci
est au plus égal à p0.
A ce seuil de signification, on fait correspondre une région critique
R de probabilité  et une région (complémentaire) d’acceptation R̄
de probabilité 1 – .
4. La proportion d’erreurs f observée sur l’échantillon appartient soit à
la région critique R, soit à la région d’acceptation R̄
Le raisonnement est le suivant :
f appartient à la région critique ; Dans l’hypothèse où la
proposition H0 est exacte, il n’y a qu’une probabilité faible 
d’observer un tel résultat. Il est donc beaucoup plus probable que
H0 soit erronée et que l’écart f - p 0 observé ne soit pas dû aux seules
fluctuations d’échantillonnage, on rejette, par conséquent,
l’hypothèse H0 et on retient H1
f appartient à la région d’acceptation ; Dans l’hypothèse où la
proposition H0 est exacte, la probabilité d’observer un tel résultat
est élevée et égale à 1 – . Rien ne s’oppose donc à ce qu’on
accepte l’hypothèse H0. Ceci ne prouve pas, cependant, que
l’hypothèse faite est vraie, mais signifie seulement que les données
dont on dispose ne sont pas en contradiction avec celle-ci.

La règle de décision se présente donc ainsi :


- Si le pourcentage f observé sur l’échantillon appartient à la région
critique R, on rejette l’hypothèse H0 pour choisir H1.
- Si le pourcentage f observé sur l’échantillon appartient à la région
d’acceptation R̄ , on accepte l’hypothèse H0.

3. COMPARAISON A UN STANDARD.

Ce problème, comparaison de la valeur d’une caractéristique θ à un


standard θ0, revient au test de deux hypothèses antagonistes H 0 et H1.
L’hypothèse H1 peut prendre des formes différentes suivant la nature de la
question posée :

H0 : θ = θ0 H0 : θ = θ0 H0 : θ = θ0
H1 : θ > θ0 H1 : θ < θ0 H1 : θ ≠ θ0

Chacun de ces trois cas conduits à des règles de test différentes : dans
le premier, la région critique est tout entière à droite de l’intervalle de variation
de θ (test unilatéral à droite) ; dans le second, entièrement à gauche (test
unilatéral à gauche) ; dans le troisième, systématiquement à droite et à gauche de
l’intervalle de variation (ce cas est en pratique rare).

A. TEST RELATIF A UNE FREQUENCE.


Soit une population composée d’individus dont certains possèdent
le caractère A. sur un échantillon de taille n prélevé dans cette
population, on a observé une fréquence « f » d’individus présentant
ce caractère.
La proportion « p » d’individus A dans la population est inconnue
et « f » peut en différer en raison des fluctuations
d’échantillonnage. Sur base de la valeur « f » observée, on se
propose de tester si la proportion « p » peut être considérée ou non,
comme égale à une valeur p0 fixée a priori.
Il convient de rappeler que les résultats obtenus à l’issue du test ne
seront fiables que lorsque la taille de l’échantillon est très grande.
Dans la plupart des cas, dans le domaine de la recherche en
statistique, le genre de tests qui convient le mieux dans la
comparaison d’une proportion à un standard est le test unilatéral.

1. Hypothèse à tester.
H0 : p = p0 H0 : p = p0 H0 : p = p0
H1 : p > p0 H1 : p < p0 H1 : p ≠ p0

2. La statistique de test.
La fréquence « f » suit, selon le mode de tirage de l’échantillon,
une loi binomiale ou une loi hypergéométrique ayant pour
paramètre, en supposant que l’hypothèse H0 soit exact p = p0.
Sous certaines conditions assez souvent remplies (effectif « n »)
de l’échantillon suffisamment grand et, pour un échantillon
n
exhaustif, taux de sondage N faible, ces lois peuvent être
correctement approchées par une loi normale de moyenne
X̄ = p =
X
n et d’écart type  =
f n- p
√p(1 - p)
n

Z= √ p(1 - p )
n
f n- p0
comme p n’est pas connu, on aura :

Z= √ p0 (1 - p0 )
n → N(0, 1)
Z qui est la statistique de test, est une variable normale centrée
réduite.

3. La région d’acceptation.
Quand est-ce qu’on accepte H0 ?
A un seuil de confiance  on accepte H0 (Hypothèse nulle)
lorsque :

| Z |< Z α
1-
1° 2 test bilatéral

2° Z > –Z1- (test unilatéral à gauche) ;


3° Z < Z1- (test unilatéral à droite)

Exemple :
Une machine de fabrication d’une certaine catégorie de pièces
est réparée si elle produit plus de 10% de pièces défectueuses
par jour. Un échantillon de 1000 pièces d’une certaine
production journalière contient 150 pièces défectueuses. A un
seuil de signification de 1%, testez s’il faut réparer la machine
ou non ?

Solution.
150
fn = 1. 000 = 0,15

a) Hypothèse à tester.
H0 : p = 0,10 (p ≤ 10%) : La machine ne doit pas être réparée
H1 : p > 0,10 (p ≤ 10%) : La machine doit être réparée.
b) Statistique de test.
n ≥ 30 n = 1.000
f n- p0 0,15- 0,10

Z= √ p0 (1 - p0 )
n
c) Région d’acceptation.
= √
0,10 x 0,90
1 . 000 = 5,27

1-  = 0,99 seuil de confiance


 = 1% seuil de signification
P(Z > Z0,01 ) = 0,01 → Z0,01 = 2,33
Z = 5,27 > Z0,01 = 2,33
Conclusion : on rejette H0, la machine doit être réparée

B. TEST RELATIF A UNE MOYENNE.


Par ce test, on veut vérifier si la moyenne µ d’une population est
significativement égale (supérieure ou inférieure) à une valeur
prédite µ0.
Ce test se fera alors de la manière suivante :

1. Hypothèse à tester.

H0 : µ = µ0 H0 : µ = µ0 H0 : µ = µ0
H1 : µ > µ0 H1 : µ < µ0 H1 : µ ≠ µ0

2. La statistique de test.
On distingue trois cas :
1er cas : L’écart type  de la population est connu.
X̄ - µ0
σ
Z= √n suit une loi normale centrée réduite.
X̄ = moyenne de l’échantillon de la variable aléatoire X ;
µ0 = moyenne de la population connue ;
 = écart type de l’échantillon connu ;
n = taille de l’échantillon connue.

2ème cas : L’écart type  de la population est inconnu.


La taille de l’échantillon supérieure ou égale à 30
On remplace alors  par son estimation S déduite des
observations :
n
1
n - 1
∑ ( X i - { X̄ )2 ¿
S² = i=1

Et la statistique de test est :


X̄ - µ0
S
Z = √ n qui suit la loi normale centrée réduite.

3ème cas : L’écart type  de la population est inconnu.


La taille de l’échantillon inférieure à 30
 sera estimé par S, mais la statistique de test est une variable
« t » de Student :
X̄ - µ0
S
T = √ n suit la loi T – Student à (n – 1) degrés de liberté.
3. Région d’acceptation.
L’hypothèse nulle est acceptée si :


| Z |< Z
1-
α
2
(
| T |< t
1-
2 )
α (n- 1)
tests bilatéraux
2° Z > –Z1- ( T < -t 1 - α (n- 1 ) ) pour les tests unilatéraux à gauche ;
3° Z < Z1- → ( T < t1 - α (n- 1 )) pour les tests unilatéraux à droite.
Z α T α
1- 1-
2 , Z1– , 2 , T1– , sont lues respectivement dans les tables

de la loi normale et T-Student de façon que :


Pour les tests bilatéraux :
α
P
( Z>Z
)1-
α
2
= 1-
2
α
P
( ) 2
T > T =1-
1−
α
2
Pour les tests unilatéraux.
P(Z > Z1- ) = 1 –  à gauche
P(T > t1- ) = 1- 
Exemple :
Un fabricant des produits électriques affirme que ces tubes
florissants peuvent brûler en moyenne 1.000 heures.
Un échantillon de 10 tubes tirés au hasard donne les résultats ci-
après :
974 ; 796 ; 1.093 ; 839 ; 824 ; 1.157 ; 879 ; 747 ; 1.044 ; 897.
Vérifier au seuil de signification de 5% si l’affirmation du
fabricant est vraie.
Solution.
Comme les paramètres de la population sont inconnus, il faut les
estimés :
1 1
X̄ =
n
∑ X i = 9 . 250
10 = 925 heures.
1 167 x 432
∑ ( X i - { X̄ )2 = ¿
S² = n - 1 9 =18.603,56
S = 136,40 heures.

Test d’hypothèses.
a) hypothèse à tester.

H0 : µ = 1.000 H0 : µ = 1.000 H0 : µ = 1.000


H1 : µ > 1.000 H1 : µ < 1.000 H1 : µ ≠ 1.000
Si on veut que les produits fabriqués soient durables :µ >
1.000
Lorsque les produits sont non viables : µ < 1.000

b) Statistique de test.
Comme n < 30
X̄ - µ0
S
T = √ n suit la loi T – Student à (n – 1) degrés de liberté.
925 - 1. 000
136,4
T= √ 9 = – 1,79 → t(9)

c) Région d’acceptation.
Elle dépend du genre de test.
Tests unilatéraux.
T est telle que P(T > t0,05(9)) = 0,05
A gauche : on accepte l’hypothèse nulle H0 si la valeur de T
est supérieure à l’opposé de t, c’est-à-dire T > – t (t = 1,833)
– 1,79 > – 1,833
Conclusion : Alors l’hypothèse nulle est acceptée : la
moyenne de temps de brûlure de tubes est
significativement égale à 1.000 heures
A droite : on accepte l’hypothèse nulle si la valeur de T est
inférieure à t : T < t (t = 1,833)
– 1,79 < 1,833
Conclusion : L’hypothèse nulle H0 est acceptée : la moyenne
de temps de brûlure de tubes est significativement
égale à 1.000 heures.

Test bilatéral.

P( | t | > t0,025) = 0,025 → t0,025(9)


t = 2.262
On accepte H0 lorsque| t |< t
1,79 < 2,262
Conclusion : L’hypothèse nulle est acceptée : la moyenne est
significativement égale à 1.000 heures de
brûlure

4. COMPARAISON D’ECHANTILLONS.

Considérons deux populations P1 et P2 dans lesquelles on a tiré deux


échantillons qui peuvent être de tailles différentes. A partir des résultats
observés sur les échantillons, on se propose de décider si les valeurs d’une
caractéristique θ peuvent être considérées comme égales ou différentes dans les
deux populations.

Les valeurs observées seront généralement différentes. Cette différence


peut être imputée à deux causes :
- les valeurs θ1 et θ2 sont effectivement différentes dans les deux
populations ;
- les valeurs θ1 et θ2 de la caractéristiques étudiée sont les mêmes dans
les deux populations et l’écart observé est dû aux seules fluctuations
d’échantillonnage.
Il s’agit de choisir entre ces deux hypothèses. Le problème revient au
test de l’hypothèse H0 : θ1 – θ2 = 0, contre H1 : θ1 – θ2 ≠ 0.
Nous serons conduits à former la différence des résultats observés sur les
deux échantillons et à nous demander si celle-ci est, ou non, significative.

A. COMPARAISON DE DEUX FREQUENCES.


Etant donné deux populations A et B dont les proportions respectives
p1 et p2 des individus satisfaisant à un même caractère aléatoires sont
inconnues. On peut, à partir des échantillons aléatoires et
indépendants des tailles respectives n 1 et n2 et des fréquences
respectives f1 et f2 des individus satisfaisant au même caractère, tirés
chacun de l’une de deux populations, vérifier si les proportions p 1 et
p2 sont significativement différentes ou non.
Un des cas concrets d’application de ce test est la pharmacologie.
Soient deux médicaments M1 et M2 pour combattre une même
maladie.
Le médicament le plus efficace sera celui dont la proportion des
individus guéris sera supérieure à celle de l’autre.
Le test se fera alors de la manière suivante :
a) Hypothèses à tester.
H0 : p1 – p2 = 0
H1 : p1 – p2 ≠ 0

b) Statistique de test.
Si les effectifs n1 et n2 sont assez grands, l’approximation
normale est valable. Dans ces conditions, et sous réserve que les
tirages d’échantillon puissent être assimilés à des tirages
indépendants :
(f 1 - f 2 ) - ( p1 - p 2 ) ( f 1 - f2 )

Z= √ f 1 (1 - f1 ) f 2 (1 - f 2 )
n1
+
n2 = √ f 1 (1 - f1 ) f 2 (1 - f 2 )
n1
+
n2

c) Région d’acceptation.
Elle est la même que pour le test de comparaison d’une proportion
à un standard.

Exemple :
Après une vaccination, on a observé les résultats suivants : 720
personnes n’ont pas été vaccinées, dont 117 ont contracté la
maladie et 790 ont été vaccinées dont 95 ont contracté la maladie.
Tester l’efficacité du vaccin au seuil de signification de 5%

Solution.
p1 p2
P1 n’ont pas contracté la maladie et n’ont pas été vaccinées ;
P2 ont contracté la maladie et ont été vaccinées.
Si p1 < p2 le vaccin est efficace.
603
n1 = 720 ; f1 = 720 = 0,84
695
n2 =790 ; f2 = 790 = 0,89

a) Hypothèses à tester.
H0 : p1 – p2 = 0 : le vaccin n’est pas efficace ;
H1 : p1 < p2 le vaccin est efficace

b) Statistique de test.
( f 1 - f2 ) (0,89 - 0,84 )

Z= √
Z = 2,23
n1
+
n2 √
f 1 (1 - f1 ) f 2 (1 - f 2 ) 0,89(1 - 0,89 ) 0,84(1 - 0,84 )
= 790
+
720 = -2,23

c) Région d’acceptation.
On cherche Z0,05/ P(Z > Z0,05) = 0,05
Z0,05 = 1,65
Z = -2,23 < - Z0,05 = -1,65
Conclusion : On rejette l’hypothèse nulle H0, en d’autres
termes le vaccin est efficace.

B. COMPARAISON DE DEUX MOYENNES


On considère deux populations P1 et P2. On prélève :
- un échantillon de taille n1 dans P1 ;
- un échantillon de taille n2 dans P2.
Soient X̄ 1 et X̄ 2 , les moyennes de la variable statistique X, relatives à
chaque échantillon. Sur base de ces observations, on se propose de tester si la
variable X a ou non la même moyenne dans les deux populations.
Désignons respectivement par : 1, 1 2, 2, la moyenne et l’écart
type de X dans P1 et P2.
Le test se fait de la même manière que celui de la comparaison à un
standard.

a) Hypothèse.
H0 : µ1 = µ2 → µ1 – µ2 = 0 ; la différence n’est pas
significative.
H1 : µ1 ≠ µ2 → µ1 – µ2 ≠ 0 ; la différence de deux moyennes est
significative.

b) Statistique de test.
2 2
1er cas : Les variances σ 1 et σ 2 de deux populations sont connues.
On sait que :
E(X̄ 1 - { X̄ 2 ¿ ) = µ – µ 1 2
σ 21 σ 22
+
V( X̄ 1 - { X̄ 2 ¿ ) = n 1 n 2
( X̄ 1 − X̄ 2 ) - (µ 1 -µ 2 )

Pour ce cas, Z = √ σ 21 σ 22
+
n1 n2
Supposons que la proposition : H0 : µ1 = µ2 → µ1 – µ2 = 0 soit
vraie, alors
( X̄ 1 − X̄ 2 )

Z= √ σ 21 σ 22
+
n1 n2

2 2
2ème cas : Les variances σ 1 et σ 2 de deux populations sont
inconnues et n1 et n2 ≥ 30, alors les variances seront estimées
par :
ni
1
n j - 1 i∑
S2j = ( X ij - { X̄ j )2 ¿
=1 ;
( X̄ 1 − X̄ 2 )

on aura : Z = √ S 21 S 22
+
n1 n2 → N(0, 1)

2 2
3ème cas : Les variances σ 1 et σ 2 de deux populations sont
inconnues et nj < 30 pour tout j, alors la loi normale ne peut
pas être utilisée, on préconise la loi T-Student.
( X̄ 1 − X̄ 2 )

On a : T =
S
n
1 1
1
+

n2 → t(n + n – 2)
2
1
2
(n1 - 1 )S1 +(n 2 - 1 )S 2
2

Avec S² = n1 + n 2 - 2

c) Région d’acceptation.
La région d’acceptation de l’hypothèse nulle est la même que
pour le test de comparaison d’une moyenne à un standard.

Exemple :
Une étude est menée pour comparer la capacité moyenne des
bouteilles d’une même marque de vin fabriquées par deux
industries différentes.
Deux échantillons aléatoires et indépendants de 50 bouteilles
chacun sont employés pour cette expérience et les résultats
obtenus sont les suivants :
X̄ 1 = 3,6 dl ; X̄ 2 = 3,8 dl
S21 = 0,18 ; S22 = 0,18
Comparer les moyennes de ces deux populations à un seuil de
signification de 5%.

Solution.
a) Hypothèse à tester.
H0 : µ1 = µ2 → µ1 – µ2 = 0 ;
H1 : µ1 ≠ µ2 → µ1 – µ2 ≠ 0.

b) Statistique de test.
( X̄ 1 − X̄ 2 )
( 3,6- 3,8 )

Z= √ S 21
n1
+

c) Région d’acceptation.
S 22
n2 = √ 0,18 0,14
50
+
50 = –2,5

Le seuil de signification  = 0,05

Conclusion.
| Z |=| -2,5 |= 2,5
| Z |= 2,5 > Z0,025 = 1,96
On rejette l’hypothèse nulle, en d’autres termes les capacités
moyennes des bouteilles de vin produites par les deux
industries sont significativement différentes.
EXERCICES
1. En février 1995, le coût moyen d’un voyage aller-retour par avion avec un
billet à tarif réduit était de 258 dollars. Un échantillon aléatoire de 15 billets
aller-retour à tarif réduit, vendus au cours du mois de mars, a fourni les
données suivantes sur les prix :
310 260 265 255 300 310 230 250 265 280 290 240 285 250 260
a) Quel est le prix moyen d’échantillon d’un billet aller-retour en mars ?
b) Quel est l’écart type de l’échantillon ?
c) En utilisant  = 0,05, testez si le prix moyen d’un billet aller-retour à tarif
réduit a augmenté en mars. Quelle est votre conclusion ?
d) Quelle est la valeur p ?
2. Le ménage américain moyen dépense 90 dollars par jour. Supposez qu’un
échantillon de 25 ménages de Corning, dans l’Etat de New York, révèle une
dépense journalière moyenne de 84,50 dollars, avec un écart type
d’échantillon de 14,50 dollars
a) Testez H0 :  = 90 et H1 :  ≠ 90 pour voir si la moyenne de la population
de Corning, dans l’Etat de New York, diffère de la moyenne américaine.
Utilisez un seuil de signification de 0,05. Quelle est votre conclusion ?

3. La pépinière Joan est spécialisée dans l’aménagement des zones


résidentielles. L’estimation du coût du travail associé à une proportion
d’aménagement particulière est basée sur le nombre de plantations d’arbres,
d’arbustes, etc. Dans le but d’estimer les coûts, les responsables estiment à
deux heures de travail, le temps nécessaire pour planter un arbre de taille
moyenne. Les temps réels d’un échantillon de 10 plantations au cours du
mois dernier (en heures) sont :
1,9 1,7 2,8 2,4 2,6 2,5 2,8 3,2 1,6 2,5
Utilisez un seuil de signification de 0,05 pour tester si la durée moyenne de
plantation d’un arbre dépasse deux heures. Quelle est votre conclusion et
quelles recommandations feriez-vous aux responsables ?
4. Soit le test d’hypothèses suivant :
H0 : 1 – 2 = 0
H1 : 1 – 2 ≠ 0
Les statistiques descriptives de deux échantillons aléatoires indépendants
issus de deux populations sont présentées ci-dessous :
Echantillon 1 Echantillon 2
n1 = 80 n2 = 70
X̄ 1 = 104 X̄ 2 = 106
S1 = 8,4 S2 = 7,6
a) Avec  = 0,05, quelle est votre conclusion concernant le test
d’hypothèses ?
b) Quelle est la valeur critique ?
5. Un groupe urbain souhaiterait estimer l’écart entre les revenus moyens des
ménages habitant dans deux quartiers différents d’une grande agglomération.
Les statistiques descriptives des échantillons aléatoires indépendants de
ménages, habitant dans un ou l’autre quartier, sont présentées dans le tableau
ci-dessous.
Quartier 1 Quartier 2
n1 = 8 n2 = 12
X̄ 1 = 15 700F X̄ 2 = 14 500F
S1 = 700F S2 = 850F
a) Construisez un estimateur ponctuel de l’écart entre les revenus moyens
des ménages habitant dans les deux quartiers.
b) Construisez un intervalle de confiance à 95% pour estimer l’écart entre les
revenus moyens des ménages habitant dans les deux quartiers.
c) Quelles hypothèses a-t-il fallu faire pour calculer l’estimation par
intervalle de la question (b) ?

6. Dans un centre de renseignements téléphoniques, une étude statistique a


montré que l’attente (en secondes) avant que la communication soit amorcée suit
une loi normale de moyenne 18 et d’écart type 7,2.
Après une réorganisation du service une étude est effectuée pour contrôler s’il y
a eu une amélioration du temps d’attente.
Attente 2- 6-10 10-12 12- 14-18 18- 26-34
6 14 26
Effectif 8 14 9 11 30 16 12
1. Construire un test permettant de décider si le temps d’attente a diminué
depuis la réorganisation du service (seuil de risque 2%)
2. Calculer la probabilité critique liée à ce test
3. Conclure à l’aide du sondage effectué

7. Une entreprise fabrique pour l’industrie, des pièces en sous traitance.


La direction décide de mettre en place une politique de recherche de qualité.
Pour ce faire, toutes les machines ont été systématiquement révisées et on a
défini une nouvelle organisation dans l’atelier : les taches de contrôle sont
reparties à chaque étape du processus de fabrication et le taux de pièces
défectueuses est tombé à 1%.
Quelques mois plus tard, une opération de contrôle est effectuée pour vérifier si
la norme de 1% (hypothèse nulle) des pièces défectueuses reste valable. Sur les
5000 pièces controlées100 s’avèrent défectueuses, soit 2% (hypothèse
alternative).
Le chef d’entreprise décide que si l’hypothèse nulle est vérifiée, il ne modifiera
plus son processus de production (décision D 0) et au contraire, si c’est
l’hypothèse alternative, il entreprendra une action de sensibilisation des salariés
de cet atelier au problème de la qualité (décision D1).
Pour choisir entre ces deux hypothèses, il tire un échantillon de 1500 pièces.
1. Si le chef d’entreprise se fixe un risque de 1% d’entreprendre une action
de sensibilisation des salariés à tort, formuler la règle de décision du test
unilatéral ?
2. Si dans un échantillon prélevé, le nombre de pièces défectueuses est 18,
quelle sera la décision du chef d’entreprise ?
3. Calculer alors le risque de l’acheteur, c’est-à-dire ne pas modifier le
processus de production alors qu’on le devait. Comment s’appelle ce
risque ?

Vous aimerez peut-être aussi