Biostatistiques. Sakrani
Biostatistiques. Sakrani
Biostatistiques. Sakrani
Polycopié de cours :
Biostatistiques
Guelma 2017
Table des matières
2 Variables Aléatoires 26
2.1 Loi de probabilité, Fonction de répartition . . . . . . . . . . . 27
2.2 Loi d’une variable aléatoire discrète . . . . . . . . . . . . . . . 27
2.3 Loi d’une variable aléatoire à densité . . . . . . . . . . . . . . 28
2.4 Espérance et variance d’une variable aléatoire . . . . . . . . . 29
2.5 Variance et écart type . . . . . . . . . . . . . . . . . . . . . . 30
2.6 Exemples de variables aléatoires discrètes . . . . . . . . . . . . 31
2.7 Exemples de variables aléatoires continues . . . . . . . . . . . 31
2.8 Exercices sur le chapitre 2 . . . . . . . . . . . . . . . . . . . . 35
2.9 Série de TD N0 2 (2015-2016) . . . . . . . . . . . . . . . . . . . 38
i
3 Théorie d’estimation 40
3.1 Estimation ponctuelle . . . . . . . . . . . . . . . . . . . . . . . 40
3.1.1 Méthode de maximum de vraisemblance . . . . . . . . 41
3.2 Estimation par intervalle . . . . . . . . . . . . . . . . . . . . . 43
3.2.1 Intervalle de con…ance de la moyenne . . . . . . . . . . 44
3.2.2 Intervalle de con…ance de la di¤érence de deux moyennes 47
3.2.3 Intervalle de con…ance d’une proportion . . . . . . . . . 47
3.2.4 Intervalle de con…ance de la variance . . . . . . . . . . 48
3.3 Exercices sur le chapitre 3 . . . . . . . . . . . . . . . . . . . . 49
3.4 Série de TD N0 3 (2015-2016) . . . . . . . . . . . . . . . . . . . 52
4 Tests statistiques 54
4.1 Test de Student (comparaison de deux moyennes) . . . . . . 54
4.2 Comparaison de deux proportions . . . . . . . . . . . . . . . . 57
4.3 Test de Fisher (comparaison de deux variances) . . . . . . . . 58
4.4 Les Tests du Khi-deux . . . . . . . . . . . . . . . . . . . . . 59
4.5 Test de Kruskal-wallis (Test sur échantillons indépendants) . 61
4.6 Exercices sur le chapitre 4 . . . . . . . . . . . . . . . . . . . . 64
4.7 Série de TD N0 4 (2015-2016) . . . . . . . . . . . . . . . . . . . 65
4.8 Tables statistiques . . . . . . . . . . . . . . . . . . . . . . . . 66
ii
Chapitre 1
Statistiques descriptives à 1 ou
2 variables
1.1 Statistique
Le terme statistique désigne à la fois un ensemble de données d’observa-
tions, et l’activité qui consiste en leur recueil, leur traitement et leur inter-
prétation. Les termes statistiques, ou statistiques (au pluriel) englobent ainsi
plusieurs notions distinctes :
a. D’une part le recensement de grandeurs d’intérêt comme le nombre
d’habitants d’un pays, le revenu moyen par habitant, le nombre de séropositifs
dans la population Algérienne. Nous voyons que la notion fondamentale qui
se dégage de cette énumération est celle de population. Une population est un
ensemble d’objets, d’êtres vivants ou d’objets abstraits (ensemble des mains
de 5 cartes distribuées au bridge...) de même nature.
b. La statistique en tant que science s’intéresse aux propriétés des popula-
tions naturelles. Plus précisément elle traite de nombres obtenus en comptant
ou en mesurant les propriétés d’une population. Cette population d’objets
doit en outre être soumise à une variabilité, qui est due à de très nombreux
facteurs inconnus (pour les populations d’objets biologiques qui nous inté-
ressent ces facteurs sont les facteurs génétiques et les facteurs environnemen-
taux).
c. A ces deux acceptions du terme statistiques (au pluriel) il faut ajouter
le terme statistique (au singulier) qui dé…nit toute grandeur calculée à partir
d’observations. Ce peut être la plus grande valeur de la série statistique
1
CHAPITRE 1. STATISTIQUES DESCRIPTIVES À 1 OU 2 VARIABLES
2
1.3. SÉRIES STATISTIQUES À UNE VARIABLE
Variables discrètes
a) Tableau
Soit ni l’e¤ectif de la valeur xi de la variable X.
p
X
On a ni = n et fi = nni la fréquence correspondante.
i=1
Un tableau statistique est présenté sous la forme :
xi x1 x2 ..........xp total
ni n1 n2 ..........np n
fi f1 f2 ..........fp 1
b) Représentation graphique
Diagramme en batons : On porte fi (ou ni ) en ordonnée en fonctionde xi
Diagramme en batons
3
CHAPITRE 1. STATISTIQUES DESCRIPTIVES À 1 OU 2 VARIABLES
4
1.3. SÉRIES STATISTIQUES À UNE VARIABLE
2- La moyenne ( X ou m)
3- La médiane ou le médian (Me ou M d)
4- Les fractiles (Quantiles) (Qn )
Parmi ces valeurs les trois premières sont des valeurs de position centrales :
a) Le mode
Le mode : est la valeur la plus fréquente d’une distribution. Cette valeur
se calcule toujours à partir d’un dénombrement des modalités du caractère. Il
faut donc distinguer le cas des caractères discrets et des caractères continus.
- Caractère qualitatif et caractère discret : Pour un caractère quali-
tatif, ou pour un caractère quantitatif discret ayant un nombre de modalités
inférieur au nombre d’éléments, le mode est la modalité ou la valeur qui a la
fréquence simple la plus élevée (ou l’e¤ectif le plus élevé, ce qui revient au
même).
- Caractère quantitatif continu : Les modalités étant en nombre in…ni,
il est peu probable que deux éléments aient la même valeur. Dans ce cas, le
mode ne peut pas être dé…ni directement, il faut au préalable établir une
partition en classes. Le mode est alors le centre de la classe modale, c’est à
dire de la classe qui a la fréquence moyenne la plus élevée.
Le mode correspond à la valeur lue en abscisse du sommet de l’histo-
gramme. Lorsque celui-ci présente deux pics séparés par un creux, on dit que
la distribution est bimodale.
Application : Cas de calcul des modes :
- Cas 1 : Données rangées : le mode est la valeur de la donnée qui apparaît
le plus fréquemment (celle qui a le plus d’occurrences) :
Le mode est 152 car il possède le plus grand nombre d’occurrences (il est
référencé 3 fois).
- Cas 2 : Données condensées : le mode est la valeur de la donnée qui
possède la fréquence la plus élevée (relative ou absolue).
5
CHAPITRE 1. STATISTIQUES DESCRIPTIVES À 1 OU 2 VARIABLES
où
: di¤érence entre l’e¤ectif de la classe modale et l’e¤ectif de la classe
1
précédente.
2 : di¤érence entre l’e¤ectif de la classe modale et l’e¤ectif de la classe
qui suit.
ai : Borne inférieur de la classe modale
L : largeur de la classe modale
b) La moyenne arithmétique
Formalisation mathématique de la moyenne arithmétique, noté X ou m,
est la mesure la plus commune de tendance centrale, elle se dé…nit comme la
somme des scores divisée par le nombre de scores. Par exemple, en biologie
la moyenne peut être résumée par la somme des observations divisée par
l’e¤ectif de l’échantillon étudié :
1X
n
m= xi
n i=1
Exemples
1-Soit les valeurs de quatre notes : 10; 12; 13 et 16, la moyenne arithmé-
tique est :
(11 + 12 + 13 + 16)=4 = 13
2-Soit la série statistique suivante :
valeurs 0 1 2 3 4
e¤ectifs 1 2 1 4 2
6
1.3. SÉRIES STATISTIQUES À UNE VARIABLE
valeurs 12 13 14 15 16
f requences 0:05 0:17 0:43 0:30 0:05
7
CHAPITRE 1. STATISTIQUES DESCRIPTIVES À 1 OU 2 VARIABLES
8
1.3. SÉRIES STATISTIQUES À UNE VARIABLE
Exemple 2
(0:5 0:36)
Me = 8 + 4 = 10: 333
0:24
Remarque 2 Autre méthode de calcul de la médiane : il est aussi possible
de déterminer la médiane à l’aide des polygones des e¤ectifs cumulés.
d) Quantiles
Il a été vu précédemment que la médiane partage la distribution des
fréquences en 2 parties égales. Il est possible de partager une distribution de
fréquence en 4 parties égales (quartiles), en 10 parties égales (déciles), en 100
parties égales (centiles), en n parties égales. . . .
9
CHAPITRE 1. STATISTIQUES DESCRIPTIVES À 1 OU 2 VARIABLES
10
1.3. SÉRIES STATISTIQUES À UNE VARIABLE
11
CHAPITRE 1. STATISTIQUES DESCRIPTIVES À 1 OU 2 VARIABLES
a) L’étendue de la variation
L’étendue d’une distribution est égale à la di¤érence entre la plus grande
et la plus petite valeur de la distribution :
b) Variance et écart-type :
La variance et écart-type servent à évaluer la dispersion d’une distribu-
tion autour d’une valeur centrale, la moyenne. Soit deux séries de microscopes
produits dans deux usines di¤érentes. Nous désirons juger de la standardisa-
tion de chacune des deux séries. Je choisis de comparer le poids maximal de
chaque microscope.
- Si les écarts à la moyenne sont faibles la production est standardisée.
- Si les écarts à la moyenne sont élevés, la production est peu standardisée.
12
1.3. SÉRIES STATISTIQUES À UNE VARIABLE
1X
k
S2 = ni (xi m)2
n i=1
où ni désigne les e¤ectifs de chaque donnée ou de chaque classe.
b - Ecart-type : L’écart type, noté S est la racine carré de la moyenne
du carré des écarts à la moyenne, c’est à dire la racine carrée de la variance.
c- Simpli…cation des écritures des variances
La formule de la variance peut être remplacée par une formule plus facile
à utiliser (formule pratique de calcul) à savoir :
1X
k
S 2
= ni (xi m)2
n i=1
1X
k
= ni x2i m2
n i=1
13
CHAPITRE 1. STATISTIQUES DESCRIPTIVES À 1 OU 2 VARIABLES
m Mo
P =
S
Si : p = 0 )symétrie parfaite.
p > 0 )oblique à gauche (ou étalement à droite)= dissymétrie à droite.
p < 0 )oblique à droite (ou étalement à gauche)= dissymétrie à gauche.
14
1.3. SÉRIES STATISTIQUES À UNE VARIABLE
(Q3 Q2 ) (Q2 Q1 )
Y = = 0:03;
(Q3 Q2 ) + (Q2 Q1 )
X Mo 79:8 75
P = = = 0:31
S 15:44
et
m3 (x) 1337:31
= 3 = = 0:36
[S] (15:44)3
La distribution est donc légèrement oblique à gouche.
15
CHAPITRE 1. STATISTIQUES DESCRIPTIVES À 1 OU 2 VARIABLES
16
1.4. SÉRIES STATISTIQUES À 2 VARIABLES
1X 2 1X 2
n n
2
V (x) = x x et V (y) = y y2
n i=1 i n i=1 i
1.4.1 Covariance
Une première approche entre de la relation éventuelle des valeurs d’une
variable X avec des valeurs d’une variable Y est donnée par le calcul de la
covariance
1X
n
Cov(x; y) = (xi x)2 (yi y)2
n i=1
1X
n
Cov(x; y) = xi yi xy
n i=1
Propriétés de la covariance
- Cov(x; x) = Sx2
- Cov(x; y) Sx Sy
- Le signe de la Cov est un indicateur de la tendance de la relation sens
positif ou négatif (direction d’étirement du nuage de point). Une covariance
positive indique une tendance « croissante » des valeurs de Y en fonction de
X, une covariance négative une tendance « décroissante »
17
CHAPITRE 1. STATISTIQUES DESCRIPTIVES À 1 OU 2 VARIABLES
cov(x; y)
r=
S x Sy
y = ax + b
18
1.4. SÉRIES STATISTIQUES À 2 VARIABLES
19
CHAPITRE 1. STATISTIQUES DESCRIPTIVES À 1 OU 2 VARIABLES
1 X 2
12
Sx2 = x x2
12 i=1 i
319:46
= 4:972 = 1:95
12
) Sx = 1:4
1 X 2
12
Sy2 = y y2
12 i=1 i
146:41
= 10: 582 = 12:62
12
) Sy = 3:55 (3:55 103 calories)
1 X
12
Cov(x; y) = xi yi xy
12 i=1
682:06
= 4:97 10:58 = 4: 26
12
20
1.5. EXERCICES SUR LE CHAPITRE 1
21
CHAPITRE 1. STATISTIQUES DESCRIPTIVES À 1 OU 2 VARIABLES
Exercice 3
On a relevé l’âga et la pression systolique de 5 patients qui se sont pré-
sentés dans laboratoire :
x : âge 56 42 72 36 63
y : tension 14:7 12:5 16 11:8 14:9
22
1.6. SÉRIE DE TD N0 1 (2015-2016)
Série 1
Exercice 1
Soit le tableau statistique donnant le nombre d’enfants dans 116 familles
Nombre d’enfants 0 1 2 3 4 6
Nombre de familles ni 6 18 25 33 21 13
23
CHAPITRE 1. STATISTIQUES DESCRIPTIVES À 1 OU 2 VARIABLES
x 1 2 3 4 5 6
y 12 13 15 19 21 22
78
y= x + 9:2
35
5-Calculer une estimation du chi¤re d’a¤aire à la …n du 7ème mois.
Exercice 4
Le tableau suivant donne l’âge x et la moyenne y des maxima de tension
artérielle en fonction de l’âge d’une population féminine.
x 36 42 48 54 60 66
y 11:8 14 12:6 15 15:5 15:1
x 1:3 1:6
y 4 5 5 6
24
1.6. SÉRIE DE TD N0 1 (2015-2016)
25
Chapitre 2
Variables Aléatoires
X: ! R:
(x; y) ! x + y
avec = f(1; 1); (1; 2); :::; (6; 5); (6; 6)g
L’ensemble des valeurs possibles de X est f2; 3; :::; 12g:
26
2.1. LOI DE PROBABILITÉ, FONCTION DE RÉPARTITION
Remarque 1 On a P (X 2 R) = 1, car P (X 2 R) = P ( ) = 1:
X
k
F (x) = P (X = xi )
i=1
27
CHAPITRE 2. VARIABLES ALÉATOIRES
nombre de piles P (X = xi ) FX
0 1=8 1=8
1 3=8 1=2
2 3=8 7=8
3 1=8 1
Exercice
Soit X une variable aléatoire discrète tel que
= f3; 4; 5; 6g
28
2.4. ESPÉRANCE ET VARIANCE D’UNE VARIABLE ALÉATOIRE
On ne verra dans ce cours que des variables qui sont soit discrètes soit
continues même s’il existe des variables plus complexes
Dé…nition 3 Une variable aléatoire X est à densité, ou continue, s’il
existe une fonction f dé…nie sur R telle que la fonction de répartition de X
s’écrit
Zx
FX (x) = f (t)dt
1
k 3 1 2
P 1=6 1=2 1=3
29
CHAPITRE 2. VARIABLES ALÉATOIRES
Le joueur gagne donc en moyenne 2=3 de dinars pour une mise de 1 dinar.
Dé…nition 4 L’espérance d’une variable aléatoire X est notée E[X].
Elle représente la valeur moyenne prise par la variable X :
1-Si X est une variable discrète à valeurs dans l’ensemble D = fx1 ; x2 ; :::; xn g,
lorsque la somme est bien dé…nie, son espérance est
X
n
E[X] = xi P (X = xi )
i=1
2-Si X est une variable à densité f , lorsque l’intégrale est bien dé…nie,
son espérance est
Z+1
E[X] = xf (x)dx
1
30
2.6. EXEMPLES DE VARIABLES ALÉATOIRES DISCRÈTES
S 2 = E[X 2 ] E[X]2
= p p2
= p(1 p):
31
CHAPITRE 2. VARIABLES ALÉATOIRES
On dit que la distribution est centrée si son espérance m est nulle ; elle
est dite réduite si sa variance 2 (et son écart-type ) est égale à 1. La
distribution normale centrée réduite N (0; 1) est donc dé…nie par la formule
x2
f (x) = p12 exp 2
;x 2 R
Les probabilités correspondant aux divers intervalles ont été calculées et
regroupées dans une table numérique. Ainsi la table de la loi normale centrée
réduite permet, à partir d’une probabilité donnée, de trouver les bornes
q; +q d’un intervalle symétrique autour de 0, tel que
P( q X q) = 1
et
P (X < q) = P (X > q) =
2
X m
Z=
32
2.7. EXEMPLES DE VARIABLES ALÉATOIRES CONTINUES
F (a) = P (X a)
X m a m
= P( )
a m
= P (Z )
a m
=
est les valeurs de sont donnés par la table de la loi N (0; 1).
C’est une loi très importante pour plusieurs raisons :
-Elle apparait dans de nombreux problèmes courants (pour les modéliser),
-Bien souvent, on peut approcher une loi par une loi normale.
-De plus, on dispose de la table de ses valeurs à laquelle on se réfere pour
des calculs approchés.
Remarque 2 Soit Z suit une loi normale N (0; 1) et la fonction de
répartition, comme la fonction est symétrique par rapport à l’axe (x = 0)
alors
( x) = 1 (x)
Exemple 5 Soit X une v.a de loi normale N (20; 5), calculer les proba-
bilités
P (X 28); P (X > 28) et P (12 X 28)
m = 20 et = 5
Transformation de X en Z où Z suit une loi normale N (0; 1).
X 20 28 20
P (X 28) = P ( )
5 5
= P (Z 1:6)
= (1:6)
= 0:9452
33
CHAPITRE 2. VARIABLES ALÉATOIRES
b = 28
12 20 X 20 28 20
P (12 X 28) = P ( )
5 5 5
= P ( 1:6 Z 1:6)
= (1:6) ( 1:6)
= (1:6) (1 (1:6))
= 2 (1:6) 1
= 0:8904
a = 12 et b = 28
34
2.8. EXERCICES SUR LE CHAPITRE 2
35
CHAPITRE 2. VARIABLES ALÉATOIRES
36
2.8. EXERCICES SUR LE CHAPITRE 2
37
CHAPITRE 2. VARIABLES ALÉATOIRES
Série 2
Exercice 1
On jette deux dés réguliers à quatre fases et on fait la somme X des points
obtenus
1- Donner la loi de la variable aléatoire X obtenue ?
2- Quelle est sa moyenne ? Sa variance ?
3-Calculer : P [X 6 5],P [X > 5] ; P [3 6 X < 5] :
4- Quelle est la fonction de répartition de X ?
Exercice 2 (espérance de vie d’une population)
On suppose que la durée de vie d’un individu dans une population donnée
est modélisée par une v.a.continue X dont la fonction densité de probabilité
est donnée par :
38
2.9. SÉRIE DE TD N0 2 (2015-2016)
39
Chapitre 3
Théorie d’estimation
40
3.1. ESTIMATION PONCTUELLE
1X
n
m
^ = Xi
n i=1
1X
n
S^2 = (Xi m)2
n i=1
1 X
n
S^2 = (Xi ^ 2
m)
n 1 i=1
41
CHAPITRE 3. THÉORIE D’ESTIMATION
@L(x1 ; x2 ; :::; xn ; )
=0
@
ou
@l(x1 ; x2 ; :::; xn ; )
=0
@
où l(x1 ; x2 ; :::; xn ; ) = ln(L(x1 ; x2 ; :::; xn ; ))
Remarque 1 Dans le cas discrète :
42
3.2. ESTIMATION PAR INTERVALLE
donc
@l(x1 ; x2 ; :::; xn ; ) X 1
n
= xi : n
@ i=1
1X
n
@l(x1 ; x2 ; :::; xn ; )
=0) = xi = m
@ n i=1
alors estimateur de est m:
P (a < < b) = 1
43
CHAPITRE 3. THÉORIE D’ESTIMATION
telle que
- a et b dits limites de con…ance
-1 : niveau de con…ance
- : risque d’erreur
44
3.2. ESTIMATION PAR INTERVALLE
45
CHAPITRE 3. THÉORIE D’ESTIMATION
m 2 [9:535; 15:964]
46
3.2. ESTIMATION PAR INTERVALLE
et la valeur u est lue dans la table normale centrée réduite N (0; 1) telle que
(u) = 1 2 :
Exemple 8 Douze des 75 arbres d’un échantillon aléatoire sont contami-
nés par une maladie. Déterminer un intervalle de con…ance au niveau 95%
pour p la proportion d’arbres malades.
12
T = 75 = 0:16 et niveau de con…ance 1 = 0:95 et n = 75.
0:05
(u) = 1 = 0:975
2
on a
p 2 [0:077; 0:243]
48
3.3. EXERCICES SUR LE CHAPITRE 3
2:4 3:4 3:6 4:1 4:3 4:7 5:4 5:9 6:5 6:9
On modélise le poids de raisin produit par une souche de cette vigne par
une variable aléatoire de loi N (m; ).
1. Calculer la moyenne et la variance empiriques de l’échantillon ?
2. Donner un intervalle de con…ance de niveau 0:95 pour m.
3. Donner un intervalle de con…ance de niveau 0:95 pour 2 .
49
CHAPITRE 3. THÉORIE D’ESTIMATION
50
3.3. EXERCICES SUR LE CHAPITRE 3
51
CHAPITRE 3. THÉORIE D’ESTIMATION
Série 3
Exercice 1
Soient X1 ; X2 ; :::; Xn n variables aléatoires indépendantes suivant une loi
géométrique de paramètre p 2 [0; 1] dé…nie par :
Ci 6 8 10 12 14 16 18 20 22 24 26
ni 2 6 13 17 17 38 10 17 6 5 2
52
3.4. SÉRIE DE TD N0 3 (2015-2016)
Exercice 4
Le sta¤ médical d’une grande entreprise fait ses petites statistiques sur le
taux de cholestérol de ses employés ; les observations sur 100 employés tirés
au sort sont les suivantes.
taux de cholestérol en cg : e¤ectif d’employés :
120 9
160 22
200 25
240 21
280 16
320 7
53
Chapitre 4
Tests statistiques
Soit une hypothèse H0 concernant une population. Sur la base des résul-
tats d’échantillons extraits de cette population on est amené à accepter ou
rejeter l’hypothèse H0 . Les règles de décision sont appelées tests statistiques.
H0 désigne l’hypothèse dite hypothèse nulle et par H1 on note l’hypothèse
dite hypothèse alternative.
On a H0 vraie et H1 fausse ou bien H0 fausse et H1 vraie.
Tests d’homogénéité
A partir d’un échantillon de taille n1 extrait d’une population P1 et d’un
échantillon de taille n2 extrait d’une population P2 , le test permet de décider :
H0 : 0 = 1
H1 : 0 6 = 1
où 0 et 1 sont les deux valeurs d’un même paramètre des deux populations
P1 et P2 .
54
4.1. TEST DE STUDENT (COMPARAISON DE DEUX MOYENNES)
H0 : m 1 = m 2
H1 : m1 6= m2
-On accepte H0 (c.à.d il n’ya pas di¤érance signi…cative entre les moyennes
de deux échantillons) si
z 2 ] u; u[
où z = rx y et la valeur u est lue dans la table normale centrée réduite
2 2
1+ 2
n1 n2
x y
z=q 2
S^1 S^2
n1
+ n22
Echantillon 1 Echantillon 2
n1 = 120 n2 = 270
x = 48:53 y = 50:08
1 = 2:8 2 = 3:1
Il s’agit du test H0 : m1 = m2
48:53 50:08
z = q
(2:8)2 2
120
+ (3:1)
270
= 4:88
55
CHAPITRE 4. TESTS STATISTIQUES
0:05
(u) = 1
2
= 0:975
où
x y
z= q
1 1
S n1
+ n2
avec s
(n1 1) S^12 + (n2 1) S^22
S=
n1 + n2 2
et la valeur tn1 +n2 2; 2 est lue dans la table de Student à k = n1 + n2 2
dégrées de liberté (ddl) et = 2 .
-On rejette H0 si z 2 = tn1 +n2 2; 2 ; tn1 +n2 2; 2 (Il ya une di¤érance signi-
…cative).
Exemple 2 Le poids d’un médicament conditionné en boites est réparti
suivant une loi normale N (m; ). Deux échantillons de tailles respectives
n1 = 12 et n2 = 18 ont pour moyennes x = 22:235 g et y = 21:988 g et écart
type ( estimateur) S^1 = 0:18 g et S^2 = 0:23 g
Qu’il existe une di¤érance signi…cative entre les poids moyens des deux
échantillons pour un seuil de signi…cation de 5% ?
Echantillon 1 Echantillon 2
n1 = 12 n2 = 18
x = 22:235 y = 21:988
^
S1 = 0:18 S^2 = 0:23
Il s’agit du test H0 : m1 = m2
s
(12 1) (0:18)2 + (18 1) (0:23)2
S= = 0:211 77
12 + 18 2
56
4.2. COMPARAISON DE DEUX PROPORTIONS
donc
(22:235 21:988)
z= q = 3: 129
1 1
0:211 77 12
+ 18
z 2 ] u; u[
où
f1 f2
z=r
1 1
f (1 f) n1
+ n2
avec
n1 f1 + n2 f2
f=
n1 + n2
et la valeur u est lue dans la table normale centrée réduite N (0; 1) telle que
(u) = 1 2 :
-On rejette H0 si z 2= ] u; u[ (Il ya une di¤érance signi…cative entre les
proportions des deux échantillons).
Exemple 3 On expérimente un vaccin contre une maladie M sur des
animaux. Un échantillon aléatoire de taille n1 = 80 animaux vaccinés montre
que 42 d’entre eaux ont contracté la maladie. Un échantillon aléatoire de taille
57
CHAPITRE 4. TESTS STATISTIQUES
n2 = 113 animaux non vaccinés montre que 76 d’entre eaux ont contacté la
maladie.
Peut-on dire au seuil de signi…cation de 5% que le vaccin est ine¢ cace ?
On décide : H0 : p1 = p2
n1 = 80; n2 = 113; f1 = 42
80
76
et f2 = 113 , donc on a :
42 76
80 80
+ 113 113
f= = 0:611
80 + 113
alors
42 76
80 113
z=q = 2: 071 6
1 1
0:611 (1 0:611 ) 80
+ 113
S^ 1
Si F < Fn1 1;n2 1 on accepte H0 (on admet alors l’égalité des variances)
58
4.4. LES TESTS DU KHI-DEUX
Ech 1 7 18 9 9 18 27 12 10 32 6 37
Ech 2 12 15 14 16 22 17 25 9 18 = =
Qu’il existe une di¤érance signi…cative entre les variances des deux échan-
tillons pour un seuil de signi…cation de 5%.
On pose l’hypothèse H0 : 1 = 2
Ech 1 Ech 2
n1 = 11 n2 = 9
x = 16:82 y = 16:44
S12 = 114:96 S22 = 23:78
donc on a
S12 114:96
F = 2
= = 4: 834
S2 23:78
Dans la table de Fisher, on trouve :
0:05
F10;8 = 3:347
0:05
F > F10;8 donc on rejette H0 , il ya une di¤érance signi…cative entre les
variances de deux échantillons.
59
CHAPITRE 4. TESTS STATISTIQUES
couleur e¤ectifs
rouges 141
roses 315
blanches 144
Peut-on a¢ rmer que les résultats sont conformes aux lois de Mendel ?
Il s’agit donc de tester
H0 : prouges = 0:25; proses = 0:5; pblanches = 0:25 au risque disons = 0; 05.
On dresse alors le tableau suivant :
60
4.5. TEST DE KRUSKAL-WALLIS (TEST SUR ÉCHANTILLONS
INDÉPENDANTS)
X
k
(ni ni;th )2
h =
i=1
ni;th
(141 150)2 (315 300)2 (144 150)2
= + +
150 300 150
= 1: 53
donc h 2]5:99;
= +1[ .
On ne rejette pas H0 au risque d’erreur = 0; 05 (On accepte H0 ), on ne
peut pas dire que les observations contredisent la loi de Mendel.
61
CHAPITRE 4. TESTS STATISTIQUES
na = 5; nb = 6; nc = 6
2/Ranger les données en fonction de leur fréquence dans chaque
série
Dans notre série
Nombre de colonies 1 2 3 4 5 6 7
Fréquence dans A 0 1 1 2 0 0 1
Fréquence dans B 1 0 1 2 2 0 0
Fréquence dans C 0 0 0 0 1 3 2
Nombre de colonies 1 2 3 4 5 6 7
Fréquence dans A 0 1 1 2 0 0 1
Fréquence dans B 1 0 1 2 2 0 0
Fréquence dans C 0 0 0 0 1 3 2
Somme des fréquences 1 1 2 4 3 3 3
Nombre de colonies 1 2 3 4 5 6 7
Fréquence dans A 0 1 1 2 0 0 1
Fréquence dans B 1 0 1 2 2 0 0
Fréquence dans C 0 0 0 0 1 3 2
Somme des fréquences 1 1 2 4 3 3 3
RANG 1 1-2 3-4 5-6-7-8 9-10-11 12-13-14 15-16-17
62
4.5. TEST DE KRUSKAL-WALLIS (TEST SUR ÉCHANTILLONS
INDÉPENDANTS)
12 X Ri
H= 3 (N + 1)
N (N + 1) ni
N étant l’e¤ectif total
Ri étant le total des rangs corriges
ni étant l’e¤ectif de chaque série
Dans notre exemple :
na = 5; Ra = 34:5; nb = 6; Rb = 37:5; nc = 6; Rc = 81
!
12 (34:5)2 (37:5)2 (81)2
H = + + 3 18
17 18 5 6 6
= 7:40
63
CHAPITRE 4. TESTS STATISTIQUES
64
4.7. SÉRIE DE TD N0 4 (2015-2016)
65
CHAPITRE 4. TESTS STATISTIQUES
66
4.8. TABLES STATISTIQUES
67
CHAPITRE 4. TESTS STATISTIQUES
68
4.8. TABLES STATISTIQUES
69
CHAPITRE 4. TESTS STATISTIQUES
70
4.8. TABLES STATISTIQUES
71
CHAPITRE 4. TESTS STATISTIQUES
72
4.8. TABLES STATISTIQUES
73
Bibliographie
74