Fin Statisique Inductive Ecopo
Fin Statisique Inductive Ecopo
Fin Statisique Inductive Ecopo
P
[ ( X̄ 1 - { X̄ ¿ ¿ 2 ) - z
1-
α
2 √ σ 12 σ 22
+ < µ 1 - µ 2 <( X̄ 1 - { X̄ ¿ ¿ 2 )+ z
n 1 n2 1-
α
2 √ ]
σ 21 σ 22
+
n 1 n2
=1 -
µ1 - µ2 = ( X̄ 1 – X̄ 2 ) ± 2
1-
α z
√ σ 21 σ 22
+
n1 n2
b) Lorsque les variances sont inconnues, elles peuvent être estimées
par :
n
∑ ( X ij - { X̄ i )²
j=1
S2i = ¿
ni - 1
Si n1 et n2 sont très faibles (< 30), alors la variable T =
( X̄ 1 − X̄ 2 )
S
1 1
+
√
n1 n2 suit la loi T-Student à (n + n – 2) degré de liberté
2 2
(n1 - 1 )S1 +(n 2 - 1 )S 2
1 2
Avec S² = n1 + n 2 - 2
Exemple :
Soient deux lots d’ampoules A et B dont les durées de vie sont
supposées distribuées normalement de moyennes respectives µ A et µB
inconnues et d’écarts types respectifs A = 120h et B = 80h. Deux
échantillons de tailles respectives n A et nB sont prélevés et donnent
les résultats ci-après :
X̄ A = 1.400h et X̄ B = 1.200h
Estimer par intervalle de confiance à 90% la différence de vie
moyenne de deux lots d’ampoules.
Solution.
µA - µB = ( X̄ A – X̄ B ) ± 2
1-
zα
z α z α z α
1- 1- 1-
P(– 2 < U < 2 ) = 90% = 0,90 ⇒ 2 = 1,65
120² 80²
+
150 200 = 128
µA - µB Є 200 ± 1,65√ 128 = 200 ± 18,66762
µA - µB Є [181,33 ; 218,66]
La variable Z = √ p1 ( 1 - p 1 ) p 2 ( 1 - p 2 )
n1
+
n2 → N(0, 1)
Etant donné un seuil de confiance (1 - fixé a priori ; il existe un
nombre u obtenu à partir de la taille de la loi normale centrée réduite telle que :
P
[ ( f 1 - f2 ) - z
1-
α
2 √ p1 (1 - p 1 ) p2 ( 1 - p 2 )
n1
+
n2
< p1 - p2 <( f 1 - f 2 )+ z α
1-
2 √ p1 ( 1 - p1 ) p2 ( 1 - p2 )
n1
+
n2 ] =1 -
Les limites de confiance à 100% de (p1 – p2) s’écrivent :
f –f ±u
1 2
n √
f 1 (1 - f 1 ) f 2 (1 - f2 )
1
+
n2
Exemple :
Dans un échantillon de 1.000 personnes résidant dans une ville A, on a observé
100 étrangers ; dans un autre échantillon de 2.000 personnes d’une ville B, on a
observé 100 étrangers. Le calcul des limites de confiance à 99% de la différence
des pourcentages d’étrangers résidant dans chacun de ville se fait de la manière
suivante :
100
n1 = 1.000 f1 = 1. 000 = 0,1
100
n2 = 2.000 f2 = 2. 000 = 0,05
= 99%= 0,99
z α z α z α
1- 1-
P(– 2 < U < 2 ) = 99% = 0,99 ⇒ 1 - 2 = 2.57
p –p Єf –f ±
1 2
z α 1
1-
1 2 n 1 2
+
n2√
f (1 - f 1 ) f 2 (1 - f2 )
1. INTRODUCTION.
3. COMPARAISON A UN STANDARD.
H0 : θ = θ0 H0 : θ = θ0 H0 : θ = θ0
H1 : θ > θ0 H1 : θ < θ0 H1 : θ ≠ θ0
Chacun de ces trois cas conduits à des règles de test différentes : dans
le premier, la région critique est tout entière à droite de l’intervalle de variation
de θ (test unilatéral à droite) ; dans le second, entièrement à gauche (test
unilatéral à gauche) ; dans le troisième, systématiquement à droite et à gauche de
l’intervalle de variation (ce cas est en pratique rare).
1. Hypothèse à tester.
H0 : p = p0 H0 : p = p0 H0 : p = p0
H1 : p > p0 H1 : p < p0 H1 : p ≠ p0
2. La statistique de test.
La fréquence « f » suit, selon le mode de tirage de l’échantillon,
une loi binomiale ou une loi hypergéométrique ayant pour
paramètre, en supposant que l’hypothèse H0 soit exact p = p0.
Sous certaines conditions assez souvent remplies (effectif « n »)
de l’échantillon suffisamment grand et, pour un échantillon
n
exhaustif, taux de sondage N faible, ces lois peuvent être
correctement approchées par une loi normale de moyenne
X̄ = p =
X
n et d’écart type =
f n- p
√p(1 - p)
n
Z= √ p(1 - p )
n
f n- p0
comme p n’est pas connu, on aura :
Z= √ p0 (1 - p0 )
n → N(0, 1)
Z qui est la statistique de test, est une variable normale centrée
réduite.
3. La région d’acceptation.
Quand est-ce qu’on accepte H0 ?
A un seuil de confiance on accepte H0 (Hypothèse nulle)
lorsque :
| Z |< Z α
1-
1° 2 test bilatéral
Exemple :
Une machine de fabrication d’une certaine catégorie de pièces
est réparée si elle produit plus de 10% de pièces défectueuses
par jour. Un échantillon de 1000 pièces d’une certaine
production journalière contient 150 pièces défectueuses. A un
seuil de signification de 1%, testez s’il faut réparer la machine
ou non ?
Solution.
150
fn = 1. 000 = 0,15
a) Hypothèse à tester.
H0 : p = 0,10 (p ≤ 10%) : La machine ne doit pas être réparée
H1 : p > 0,10 (p ≤ 10%) : La machine doit être réparée.
b) Statistique de test.
n ≥ 30 n = 1.000
f n- p0 0,15- 0,10
Z= √ p0 (1 - p0 )
n
c) Région d’acceptation.
= √
0,10 x 0,90
1 . 000 = 5,27
1. Hypothèse à tester.
H0 : µ = µ0 H0 : µ = µ0 H0 : µ = µ0
H1 : µ > µ0 H1 : µ < µ0 H1 : µ ≠ µ0
2. La statistique de test.
On distingue trois cas :
1er cas : L’écart type de la population est connu.
X̄ - µ0
σ
Z= √n suit une loi normale centrée réduite.
X̄ = moyenne de l’échantillon de la variable aléatoire X ;
µ0 = moyenne de la population connue ;
= écart type de l’échantillon connu ;
n = taille de l’échantillon connue.
1°
| Z |< Z
1-
α
2
(
| T |< t
1-
2 )
α (n- 1)
tests bilatéraux
2° Z > –Z1- ( T < -t 1 - α (n- 1 ) ) pour les tests unilatéraux à gauche ;
3° Z < Z1- → ( T < t1 - α (n- 1 )) pour les tests unilatéraux à droite.
Z α T α
1- 1-
2 , Z1– , 2 , T1– , sont lues respectivement dans les tables
Test d’hypothèses.
a) hypothèse à tester.
b) Statistique de test.
Comme n < 30
X̄ - µ0
S
T = √ n suit la loi T – Student à (n – 1) degrés de liberté.
925 - 1. 000
136,4
T= √ 9 = – 1,79 → t(9)
c) Région d’acceptation.
Elle dépend du genre de test.
Tests unilatéraux.
T est telle que P(T > t0,05(9)) = 0,05
A gauche : on accepte l’hypothèse nulle H0 si la valeur de T
est supérieure à l’opposé de t, c’est-à-dire T > – t (t = 1,833)
– 1,79 > – 1,833
Conclusion : Alors l’hypothèse nulle est acceptée : la
moyenne de temps de brûlure de tubes est
significativement égale à 1.000 heures
A droite : on accepte l’hypothèse nulle si la valeur de T est
inférieure à t : T < t (t = 1,833)
– 1,79 < 1,833
Conclusion : L’hypothèse nulle H0 est acceptée : la moyenne
de temps de brûlure de tubes est significativement
égale à 1.000 heures.
Test bilatéral.
4. COMPARAISON D’ECHANTILLONS.
b) Statistique de test.
Si les effectifs n1 et n2 sont assez grands, l’approximation
normale est valable. Dans ces conditions, et sous réserve que les
tirages d’échantillon puissent être assimilés à des tirages
indépendants :
(f 1 - f 2 ) - ( p1 - p 2 ) ( f 1 - f2 )
Z= √ f 1 (1 - f1 ) f 2 (1 - f 2 )
n1
+
n2 = √ f 1 (1 - f1 ) f 2 (1 - f 2 )
n1
+
n2
c) Région d’acceptation.
Elle est la même que pour le test de comparaison d’une proportion
à un standard.
Exemple :
Après une vaccination, on a observé les résultats suivants : 720
personnes n’ont pas été vaccinées, dont 117 ont contracté la
maladie et 790 ont été vaccinées dont 95 ont contracté la maladie.
Tester l’efficacité du vaccin au seuil de signification de 5%
Solution.
p1 p2
P1 n’ont pas contracté la maladie et n’ont pas été vaccinées ;
P2 ont contracté la maladie et ont été vaccinées.
Si p1 < p2 le vaccin est efficace.
603
n1 = 720 ; f1 = 720 = 0,84
695
n2 =790 ; f2 = 790 = 0,89
a) Hypothèses à tester.
H0 : p1 – p2 = 0 : le vaccin n’est pas efficace ;
H1 : p1 < p2 le vaccin est efficace
b) Statistique de test.
( f 1 - f2 ) (0,89 - 0,84 )
Z= √
Z = 2,23
n1
+
n2 √
f 1 (1 - f1 ) f 2 (1 - f 2 ) 0,89(1 - 0,89 ) 0,84(1 - 0,84 )
= 790
+
720 = -2,23
c) Région d’acceptation.
On cherche Z0,05/ P(Z > Z0,05) = 0,05
Z0,05 = 1,65
Z = -2,23 < - Z0,05 = -1,65
Conclusion : On rejette l’hypothèse nulle H0, en d’autres
termes le vaccin est efficace.
a) Hypothèse.
H0 : µ1 = µ2 → µ1 – µ2 = 0 ; la différence n’est pas
significative.
H1 : µ1 ≠ µ2 → µ1 – µ2 ≠ 0 ; la différence de deux moyennes est
significative.
b) Statistique de test.
2 2
1er cas : Les variances σ 1 et σ 2 de deux populations sont connues.
On sait que :
E(X̄ 1 - { X̄ 2 ¿ ) = µ – µ 1 2
σ 21 σ 22
+
V( X̄ 1 - { X̄ 2 ¿ ) = n 1 n 2
( X̄ 1 − X̄ 2 ) - (µ 1 -µ 2 )
Pour ce cas, Z = √ σ 21 σ 22
+
n1 n2
Supposons que la proposition : H0 : µ1 = µ2 → µ1 – µ2 = 0 soit
vraie, alors
( X̄ 1 − X̄ 2 )
Z= √ σ 21 σ 22
+
n1 n2
2 2
2ème cas : Les variances σ 1 et σ 2 de deux populations sont
inconnues et n1 et n2 ≥ 30, alors les variances seront estimées
par :
ni
1
n j - 1 i∑
S2j = ( X ij - { X̄ j )2 ¿
=1 ;
( X̄ 1 − X̄ 2 )
on aura : Z = √ S 21 S 22
+
n1 n2 → N(0, 1)
2 2
3ème cas : Les variances σ 1 et σ 2 de deux populations sont
inconnues et nj < 30 pour tout j, alors la loi normale ne peut
pas être utilisée, on préconise la loi T-Student.
( X̄ 1 − X̄ 2 )
On a : T =
S
n
1 1
1
+
√
n2 → t(n + n – 2)
2
1
2
(n1 - 1 )S1 +(n 2 - 1 )S 2
2
Avec S² = n1 + n 2 - 2
c) Région d’acceptation.
La région d’acceptation de l’hypothèse nulle est la même que
pour le test de comparaison d’une moyenne à un standard.
Exemple :
Une étude est menée pour comparer la capacité moyenne des
bouteilles d’une même marque de vin fabriquées par deux
industries différentes.
Deux échantillons aléatoires et indépendants de 50 bouteilles
chacun sont employés pour cette expérience et les résultats
obtenus sont les suivants :
X̄ 1 = 3,6 dl ; X̄ 2 = 3,8 dl
S21 = 0,18 ; S22 = 0,18
Comparer les moyennes de ces deux populations à un seuil de
signification de 5%.
Solution.
a) Hypothèse à tester.
H0 : µ1 = µ2 → µ1 – µ2 = 0 ;
H1 : µ1 ≠ µ2 → µ1 – µ2 ≠ 0.
b) Statistique de test.
( X̄ 1 − X̄ 2 )
( 3,6- 3,8 )
Z= √ S 21
n1
+
c) Région d’acceptation.
S 22
n2 = √ 0,18 0,14
50
+
50 = –2,5
Conclusion.
| Z |=| -2,5 |= 2,5
| Z |= 2,5 > Z0,025 = 1,96
On rejette l’hypothèse nulle, en d’autres termes les capacités
moyennes des bouteilles de vin produites par les deux
industries sont significativement différentes.
EXERCICES
1. En février 1995, le coût moyen d’un voyage aller-retour par avion avec un
billet à tarif réduit était de 258 dollars. Un échantillon aléatoire de 15 billets
aller-retour à tarif réduit, vendus au cours du mois de mars, a fourni les
données suivantes sur les prix :
310 260 265 255 300 310 230 250 265 280 290 240 285 250 260
a) Quel est le prix moyen d’échantillon d’un billet aller-retour en mars ?
b) Quel est l’écart type de l’échantillon ?
c) En utilisant = 0,05, testez si le prix moyen d’un billet aller-retour à tarif
réduit a augmenté en mars. Quelle est votre conclusion ?
d) Quelle est la valeur p ?
2. Le ménage américain moyen dépense 90 dollars par jour. Supposez qu’un
échantillon de 25 ménages de Corning, dans l’Etat de New York, révèle une
dépense journalière moyenne de 84,50 dollars, avec un écart type
d’échantillon de 14,50 dollars
a) Testez H0 : = 90 et H1 : ≠ 90 pour voir si la moyenne de la population
de Corning, dans l’Etat de New York, diffère de la moyenne américaine.
Utilisez un seuil de signification de 0,05. Quelle est votre conclusion ?