MethStats Seance 11 Doc PDF
MethStats Seance 11 Doc PDF
MethStats Seance 11 Doc PDF
Méthodes Statistiques
2 Exemples 5
3 Table de Kolmogorov-Smirnov 7
1 Test de Kolmogorov-Smirnov
Le test de Kolmogorov-Smirnov est un test d’ajustement. La différence avec le
test du χ2 est qu’il est fondé sur les fonctions de répartition plutôt que sur les
densités.
1
Pour cela, on commence par trier par ordre croissant les valeurs Xi de
l’échantillon. On les appelle traditionnellement des statistiques d’ordre.
La fonction de répartition empirique est définie par:
0 pour x < X1
Fb(x) = i
pour Xi ≤ x < Xi+1
n
1 pour x ≥ Xn
2
Fonction de répartition empirique
1.0
0.8
0.6
0.4
0.2
0.0
|| | | | | | | |
0 1 2 3 4
3
Distance de Kolmogorov−Smirnov
1.0
0.8
0.6
0.4
0.2
xi
0.0
|| | | | | | | |
0 1 2 3 4
1.2 Procédure
Voici une description détaillée de la procédure d’exécution du test de Kolmogorov-
Smirnov
1. classer les valeurs observées par ordre croissant ;
i
2. calculer les nombres , c’est-à-dire les valeurs supérieures de la distribu-
n
tion empirique ;
i
3. calculer les valeurs absolues des écarts F (Xi ) − entre F et les valeurs
n
précédentes ;
i−1
4. calculer les nombres , c’est-à-dire les valeurs inférieures de la distri-
n
bution empirique ;
i − 1
5. calculer les valeurs absolues des écarts F (Xi ) − entre F et les
n
valeurs précédentes ;
6. la distance de Kolmogorov-Smirnov est le plus grand de tous ces écarts ;
4
7. on conclut le test en acceptant l’hypothèse H0 si la distance calculée est
inférieure à la valeur critique donnée dans la table et en la rejetant sinon.
2 Exemples
Exercice 1
On a testé un échantillon de 5 appareils et noté leurs durées de vie en heures :
Appareil 1 2 3 4 5
Durée de vie 133 169 8 122 58
On voudrait savoir si la durée de vie suit une loi de probabilité exponentielle.
On dispose de n = 5 observations.
On estime le paramètre λ de la loi exponentielle par la moyenne empirique
X̄ de l’échantillon car X̄ est un estimateur de E(X) = λ1 .
F (x) = 1 − e−λ x
i 1 2 3 4 5
Xi 8 58 122 133 169
F (Xi ) 0.078 0.447 0.712 0.743 0.822
i
n 0.2 0.4 0.6 0.8 1.0
i
|F (Xi ) − n| 0.122 0.047 0.112 0.057 0.178
i−1
n 0.0 0.2 0.4 0.6 0.8
i−1
|F (Xi ) − n | 0.078 0.247 0.312 0.143 0.022
5
data: duree
D = 0.312, p-value = 0.6165
alternative hypothesis: two-sided
Exercice 2
Un calculateur a simulé un échantillon de n = 10 valeurs distribuées selon
une loi normale. Les valeurs Xi produites sont rangées par ordre croissant :
X 10.8 10.9 11.9 13.5 15.9 16.6 17.4 17.9 18.7 23.0
Il faut calculer les quantités F (Xi ) pour la loi normale N (15.66 , 3.90). On
Xi − 15.66
doit donc centrer et réduire les observations en calculant Zi = :
3.90
Zi -1.25 -1.22 -0.96 -0.55 0.06 0.24 0.45 0.57 0.78 1.88
F 0.106 0.111 0.167 0.290 0.525 0.595 0.672 0.717 0.782 0.970
i 1 2 3 4 5 6 7 8 9 10
Xi 10.8 10.9 11.9 13.5 15.9 16.6 17.4 17.9 18.7 23.0
F (Xi ) 0.106 0.111 0.167 0.290 0.525 0.595 0.672 0.717 0.782 0.970
i
n 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1.0
i
|F (Xi ) − n| 0.007 0.089 0.132 0.110 0.025 0.005 0.028 0.083 0.118 0.030
i−1
n 0.0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9
i−1
|F (Xi ) − n | 0.107 0.011 0.032 0.010 0.125 0.095 0.072 0.017 0.018 0.070
6
La table de Kolmogorov-Smirnov pour n = 10 au seuil α = 0.05 donne la
valeur critique 0,410.
Puisque 0, 132 < 0, 410, on accepte l’hypothèse H0 .
Voici la sortie du logiciel R pour le test précédent :
One-sample Kolmogorov-Smirnov test
data: obs
D = 0.1322, p-value = 0.9851
alternative hypothesis: two-sided
3 Table de Kolmogorov-Smirnov
Seuils critiques Dα (n)
n α = 0.20 α = 0.15 α = 0.10 α = 0.05 α = 0.01
1 0.900 0.925 0.950 0.975 0.995
2 0.684 0.726 0.776 0.842 0.929
3 0.565 0.597 0.642 0.708 0.828
4 0.494 0.525 0.564 0.624 0.733
5 0.446 0.474 0.510 0.565 0.669
6 0.410 0.436 0.470 0.521 0.618
7 0.381 0.405 0.438 0.486 0.577
8 0.358 0.381 0.411 0.457 0.543
9 0.339 0.360 0.388 0.432 0.514
10 0.322 0.342 0.368 0.410 0.490
11 0.307 0.326 0.352 0.391 0.468
12 0.295 0.313 0.338 0.375 0.450
13 0.284 0.302 0.325 0.361 0.433
14 0.274 0.292 0.314 0.349 0.418
15 0.266 0.283 0.304 0.338 0.404
7
Seuils critiques Dα (n)
n α = 0.20 α = 0.15 α = 0.10 α = 0.05 α = 0.01
16 0.258 0.274 0.295 0.328 0.392
17 0.250 0.266 0.286 0.318 0.381
18 0.244 0.259 0.278 0.309 0.371
19 0.237 0.252 0.272 0.301 0.363
20 0.231 0.246 0.264 0.294 0.356
25 0.210 0.220 0.240 0.270 0.320
30 0.190 0.200 0.220 0.240 0.290
35 0.180 0.190 0.210 0.230 0.270
√ √ √ √ √
> 35 1.07/ n 1.14/ n 1.22/ n 1.36/ n 1.63/ n