Statnp
Statnp
Statnp
Pr.Ghizlane Lakhnati
ENSA AGADIR
2018-2019
Plan 2
Log-vraisemblance:
δ
2
δθ
E(θn )
V ar(θn ) ≥
In (θ)
Appelée la borne de Cramer-Rao. La variance d’un estimateur
quelconque de θ est forcément supérieure à cette borne.
Estimation par maximum de vraisemblance 13
On appelle efficacité d’un estimateur θn , la quantité :
δ
2
δθ
E(θn )
Ef f (θn ) =
In (θ).V (θn )
On a 0 ≤ Ef f (θn ) ≤ 1.
θn est dit estimateur efficace si
Ef f (θn ) = 1;
lim Ef f (θn ) = 1;
n→∞
Propriétés:
P.S
• Θ̂n → θ;
• limn→∞ E(Θ̂n ) = 0 asympt ss biais;
• limn→∞ V (Θ̂n ) = In1(θ) asympt efficace;
p L
• In (θ) Θ̂n − θ →n→∞ N (0, 1);
√ L
• n(Θ̂n − θ) → N (0, √ 1 )
I1 (θ)
Estimation par maximum de vraisemblance 17
En pratique:
δ
• Condition nécessaire: δθ
ln L(θ̂) = 0;
δ2
• δ2 θ
ln L(θ̂) ≤ 0;
Exemple:
• Poisson;
• Normale
Estimation par maximum de vraisemblance 18
Déroulement du test :
1. On crée le tableau des effectifs qui est un tableau à
double-entrée.
A l’intersection de la i-ème ligne et de la j-ième colonne, on
écrit l’effectif Nij .
Pk
On calcule les effectifs marginaux : Si = j=1 Nij est la somme
des termes sur la i-ème ligne,
Pl
Ti = i=1 Nij est la somme des termes sur la j-ième colonne.
2. On calcule les effectifs théoriques:
Si × Tj
Cij =
n
Sous H0 , Cij = Nij
Tests d’indépendance 22
Estimation de la covariance
Soit un échantillon de taille n composée des observations Xi , Yi ,
1 ≤ i ≤ n.
La covariance empirique est
Pn
i=1 (Xi − X̄)(Yi − Ȳ )
SXY =
n
n−1
E(SXY ) = n
Cov(X, Y )
Pn
n i=1 (Xi − X̄)(Yi − Ȳ )
Cov(X,
d Y)= SXY =
n−1 n−1
Tests d’indépendance 25
Ou encore
P
Xi Yi − X̄ Ȳ
i
R̂XY = p Pn Pn
( i=1 Xi − nX̄ )( i=1 Yi2 − nȲ 2 )
2 2
Décision du test:
1. On calcule t;
2. On cherche la valeur de tα ou t α2 sur la table de la loi de student
pour le degré de liberté α;
3. Si l’hypothèse alternative est H1 : r 6= 0 (cas bilatéral) : rejet
de H0 au risque α si t ∈/ −t α2 ,n−2 , t α2 ,n−2 .
Si l’hypothèse alternative est H1 : r > 0 (cas unilatéral) : rejet
de H0 au risque α si t > tα,n−2
Si l’hypothèse alternative est H1 : r < 0 (cas unilatéral) : rejet
de H0 au risque α si t < −tα,n−2
Tests d’indépendance 29
Candidat A B C D E Total
H 25 75 105 130 75 410
F 147 116 17 80 105 465
Total 172 191 122 210 180 875
Tests d’indépendance 31
Exercice 3: Sur un échantillon de 200 ménages choisis au hasard, on a étudié
la propension moyenne à épargner (variable Y ) en fonction du revenu
disponible (variable X).
Pour la variable X, on a distingué 3 classes : x1 : faibles revenus, x2 : revenus
intermédiaires, x3 : revenus élevés.
De même, les taux d’épargne ont été classés en 3 niveaux : y1 : faibles taux, y2
: taux intermédiaires, y3 : taux élevés.
Les résultats sont présentés dans la table de contingence :
R-E y1 y2 y3 Total
x1 53 14 6 73
x2 15 58 8 81
x3 7 10 29 46
Total 75 82 43 200
Existe t-il une relation entre le taux d’épargne et le niveau de revenu
disponible?
Tests d’indépendance 32
1 2 3 4 5 6 7 8 9 10 11 12
X 123 144 105 110 98 138 131 90 119 109 125 100
Y 102 138 126 133 95 146 115 100 142 105 130 120
Tests de conformité en loi 33
Test d’adéquation du χ2
Soit X une variable aléatoire de loi L (inconnue). On souhaite
tester l’ajustement de cette loi à une loi connue L0 (Poisson,
Exponentielle, normale,...) retenue comme étant un modèle
convenable.
On teste donc H0 : L = L0 contre H1 : L = 6 L0 .
Les n observations de X sont partagées en k classes. On désigne
par Oi l’effectif observé de la classe i.
Pk
i=1 Oi = n
Remarque:
-Dans le cas discret, on prend les k observations distinctes;
-Dans le cas continu: Il faut regrouper les observations en classe et
npi ≥ 5.
Tests de conformité en loi 34
Théorème de Pearson:
k
X (Oi − ci )2 L
→ χ2k−1−r
i=1
ci
Décision:
- On calcule la valeur de χ2c ;
- On lit sur la table de χ2 la valeur observée χ2obs,α tq
P (χ2 ≤ χ2obs,α ) = 1 − α;
- Si χ2c ≤ χ2obs,α , on accepte H0 ;
Si χ2c > χ2obs,α , on accepte H1 .
Tests de conformité en loi 37
Exemple:
Un portefeuille de crédit aux particuliers d’une banque contient
trois catégories de salariés: fonctionnaires, salariés du secteur privé
et les indépendants.
On veut savoir si on peut considérer que le portefeuille contient
autant de clients de chaque catégorie.
Catégorie Fon Priv Indep
Effectif 144 118 136
On cherche s’il y a équirépartition des clients entres les 3
cataégories.
Tests de conformité en loi 38
limn P supx∈R |Fn (x) − F (x)| > √cn → α(c) =
P∞ k−1 −2k2 c2
2 k=1 (−1) e
P∞ k−1 −2k2 c2
FKS (c) = 1 + 2 k=1 (−1) e
Tests de conformité en loi 42
Alors on considère DKS
i (i − 1)
DKS = max F (xi ) − , F (xi ) −
n n
• On calcule la valeur de DKS .
• On compare la valeur obtenue à une valeur critique Dα (n)
fournie par les tables de Kolmogorov-Smirnov. Si
DKS < Dα (n), on accepte H0 .
• Pour n grand, la valeur critique est une approximation de la
forme √cn ,
Les valeurs usuelles de c en fonction de α sont
α 0.2 0.1 0.05 0.02 0.01
c 1.073 1.223 1.358 1.518 1.629
si DKS > √c on rejette H0 .
n
Tests de conformité en loi 43
Exemple:
Pour 5 assurés indépendants, on a calculé le temps (en jours)
jusqu’à leur première réclamation:
1 2 3 4 5
133 169 8 122 58
On voudrait tester si le temps suit une loi de probabilité
exponentielle.
Tests de conformité en loi 44
Tests de normalité: Méthodes graphiques (Droite de
Henry)
La droite de Henry est une méthode pour visualiser les chances
qu’une distribution est gaussienne. Elle permet de lire rapidement
la moyenne et l’écart-type de cette distribution.
Principe: On représente les quantiles théoriques en fonction des
quantiles observés.
Soit X une v.a gaussienne de moyenne x̄ et de variance σ 2 et Z une
v.a normale centrée réduite, on a
P (X < xi ) = P (Z < xiσ−x̄ ) = FZ ( xiσ−x̄ ) = FZ (zi )=p
Alors zi = FZ−1 (p).
Pour chaque valeur xi de X, on peut calculer P (X < xi ) puis on
déduit à l’aide de la table de la loi normale zi
Si la variable est gaussienne les points (xi , zi ) sont alignés sur la
droite d’équation z = x−x̄σ
Tests de conformité en loi 45
Exemple:
Lors d’un examen, on obtient les résultats suivants:
10% des étudiants ont obtenu une note < 4;
30% des étudiants ont obtenu une note < 8;
60% des étudiants ont obtenu une note < 12;
80% des étudiants ont obtenu une note < 16.
Exemple:
Montrer que la série est moins aplatie qu’une distribution normale
0
(K < 0)
Revenus ni fi
]0, 100] 3 0.3
]100, 200] 5 0.5
]200, 300] 2 0.2
Tests de conformité en loi 50
Faces xi 1 2 3 4 5 6
Effectifs ni 15 7 4 11 6 17
Peut-on admettre que les arrivées sont régies par une loi de Poisson de
paramètre 2 (au seuil 0.05)?.
Tests de conformité en loi 53
Exercice 3: Une enquête sur les chiffres d’affaires mensuels de 103 magasins
de détail a donné les résultats suivants
Classes de chiffres d’affaires Centres de classes Nombre de magasins
5.5 à moins de 6.5 6 2
6.5 à moins de 7.5 7 3
7.5 à moins de 8.5 8 12
8.5 à moins de 9.5 9 27
9.5 à moins de 10.5 10 23
10.5 à moins de 11.5 11 15
11.5 à moins de 12.5 12 12
12.5 à moins de 13.5 13 5
13.5 à moins de 14.5 14 2
14.5 à moins de 15.5 15 2
Propriétés:
1. Estimateur sans biais: E F̂n (x) = F (x);
2. Convergent: V ar F̂n (x) = F (x)(1−F
n
(x))
→n→∞ 0;
∀n ∈ N, ∀ > 0;
P sup F̂n (x) − F (x) > ≤ 2. exp(−2n2 )
x∈R
Estimation fonctionnelle 62
Construction
d’intervalles
h de confiance i exacts de F (x):
∀x ∈ R, P F (x) ∈ F̂n (x) − e, F̂n (x) + e =
1 − P F̂n (x) − F (x) > e ≥
1 − P supx∈R F̂n (x) − F (x) > e ≥ 1 − 2. exp(−2ne2 )
Pour tout α > 0,qon choisit alors e > 0 tq exp(−2ne2 ) = α, on
prend alors e = log( α2 )/2n
" r r #!
2 2
P F (x) ∈ F̂n (x) − log( )/2n, F̂n (x) + log( )/2n ≥ 1−α
α α
h q q i
Donc F̂n (x) − log( α2 )/2n, F̂n (x) + log( α2 )/2n est IC de F au
niveau de risque α.
Comme
h Fq(x) ∈ [0, 1], si n est petit
q i
F̂n (x) − log( α2 )/2n, F̂n (x) + log( α2 )/2n ∩ [0, 1]
Estimation fonctionnelle 63
Le TCL permet également d’obtenir un IC pour F (x), à condition
d’estimer la variance F (x)(1 − F (x)). Mais cet intervalle est
asymptotique uniquement:
Construction d’intervalles de confiance (IC) de F (x) par
TCL
√
loi
p
On a n F̂n (x) − F (x) → N 0, F (x)(1 − F (x))
√ F̂n (x)−F (x) loi
n√ → N (0, 1)
F (x)(1−F (x))
√ F̂n (x)−F (x) loi
Alors n √ → N (0, 1)
F̂n (x)(1−F̂n (x))
Aors
pour nh suffisamment grand i
P F (x) ∈ F̂n (x) − e, F̂n (x) + e = P F̂n (x) − F (x) ≤ e =
√ √
F̂n (x)−F (x)
P n√ ≤ n√ e
=1−α
F̂n (x)(1−F̂n (x)) F̂n (x)(1−F̂n (x))
√
Donc n √ e
= α2 .
F̂n (x)(1−F̂n (x))
Estimation fonctionnelle 64
q
Par suite e = α2 F̂n (x)(1−
n
F̂n (x))
On obtient finalement
s s
F̂n (x)(1 − F̂n (x)) F̂n (x)(1 − F̂n (x))
IC = F̂n (x) − α2
, F̂n (x) + α2
n n
Estimation fonctionnelle 65
Estimation de la densité
On suppose que la loi de l’échantillon est continue et on cherche à estimer sa
densitée f . f est la dérivéee de F , mais la fonction de réepartition empirique
Fn n’est pas dérivable, puisque c’est une fonction en escalier. On ne peut donc
pas utiliser directement les résultats sur la fonction de répartition empirique
pour estimer la densité.
On peut se demander quelle est l’utilité d’estimer la densité alors que l’on a
déjà un très bon estimateur de la fonction de répartition. La principale raison
est que la forme d’une densité est beaucoup plus facile à interprêter que celle
d’une fonction de répartition. Par exemple, on pourra facilement avoir, grâce à
une estimation de densité, des informations sur la symétrie de la loi de
l’échantillon, alors que ce n’est pas du tout facile au seul vu de la fonction de
répartition empirique. De même, une estimation de densité est une aide
importante au choix d’un modèle approprié pour la loi de l’échantillon.
Par exemple, une densité estimée en forme de cloche symétrique peut conduire
à l’adoption d’un modèle de loi normale.
Estimation fonctionnelle 66
La méthode du noyau:
Les histogrammes et les polygones des fréquences ne sont pas des
estimations très satisfaisantes de la densité de l’échantillon car ce
sont des fonctions en escalier et des lignes brisées alors que la
densité à estimer est en général plus lisse, avec au moins sa dérivée
continue.
D’autre part, l’aléa du au choix du nombre de classes et des bornes
des classes est un élément très perturbant de l’analyse, puisque des
choix différents peuvent aboutir à des histogrammes d’allures
différentes.
L’estimation par noyau a pour but de répondre à ces deux écueils et
de proposer des estimations de densité ayant de bonnes propriétés.
Estimation fonctionnelle 69
Pour cela, on commence par remarquer que la densité est la dérivée
de la fonction de répartition, ce qui permet d’écrire pour tout x:
0
f (x) = F (x) = limh→0 F (x+h)−F
h
(x)
= limh→0
F (x+h)−F (x−h)
2h
.
Donc pour un h > 0 assez petit, on peut penser à estimer f (x) par :
n
ˆ Fn (x + h) − Fn (x − h) 1 X
f (x) = = 1]x−h;x+h] (Xi )
2h 2nh i=1
2
ˆ h4n σ 2 R +∞ 00 1
R +∞
• E f (x) − f (x) ≈ 4 −∞ f (x) dx + nhn −∞ K(u)2 du
2
Estimation fonctionnelle 75
On voit que, dans l’erreur quadratique moyenne, le terme de biais
est une fonction croissante de hn , alors que le terme de variance est
une fonction décroissante de hn . Si hn est grand, la variance sera
faible, mais le biais sera fort. Si hn est petit, c’est l’inverse. La
valeur de hn optimale, qui minimise l’EQM, réalise donc un
compromis entre biais et variance.
Cette valeur optimale est une fonction de f , qui est inconnue. On
ne peut donc en donner qu’une valeur approchée. En pratique, on
choisit souvent:
4 1 −1 1
hn = ( ) n min sn ;
5 5 Q̃n,3 − Q̃n,1
3 1.34
Q̃n,3 et Q̃n,1 Quantiles d’ordre 3 et 1 de la distribution empirique;
sn est l’écart-type estimé de la distribution.
on a plutôt tendance en pratique à choisir le noyau le plus facile à
utiliser, qui est le noyau gaussien.