Public2015 A2
Public2015 A2
Public2015 A2
(Texte public)
Résumé : Nous abordons certaines questions relatives à l’inférence statistique de données
issues de modèles de survie, lorsque ces données sont censurées, c’est à-dire partiellement
observées.
Mots clefs : Loi exponentielle, loi du Chi-deux, simulation de variables aléatoires, intervalle
de confiance, test.
I Il est rappelé que le jury n’exige pas une compréhension exhaustive du texte. Vous êtes
laissé(e) libre d’organiser votre discussion comme vous l’entendez. Des suggestions de
développement, largement indépendantes les unes des autres, vous sont proposées en fin
de texte. Vous n’êtes pas tenu(e) de les suivre. Il vous est conseillé de mettre en lumière
vos connaissances à partir du fil conducteur constitué par le texte. Le jury appréciera
que la discussion soit accompagnée d’exemples traités sur ordinateur.
1. Introduction
On souhaite mesurer l’influence d’un traitement médical sur des malades. Pour cela, on
observe la réalisation de n variables aléatoires qui mesurent l’intervalle de temps entre la
prise du traitement et la rechute de la maladie (ou pire) de chaque patient d’un groupe de n
personnes malades. L’efficacité du traitement peut se "lire" sur la fonction de risque instan-
tané de ce temps de "survie", selon la terminologie, que l’on définit ci-dessous. On va s’inté-
resser plus particulièrement au cas où, pour des raisons expérimentales, certaines données
sont "censurées", dans un sens que l’on précisera ci-dessous.
Page 1/5
(Texte public) Option A : Probabilités et Statistiques
Page 2/5
(Texte public) Option A : Probabilités et Statistiques
où Z est une variable aléatoire qui suit la loi du Chi-deux à 2n degrés de liberté. Alors, les
intervalles
1
[0, λ̂n (T1 , . . . , Tn )χ21−α (2n)],
2n
1
[ λ̂n (T1 , . . . , Tn )χ2α (2n), +∞[,
2n
et
1 1
[ λ̂n (T1 , . . . , Tn )χ2α/2 (2n), λ̂n (T1 , . . . , Tn )χ21−α/2 (2n)]
2n 2n
sont des intervalles de confiance pour λ au niveau de confiance 1 − α.
λd n! h i
L cn,d (λ; T(1,n) , . . . , T(d ,n) ) = c
exp −λVn,d (T(1,n) , . . . , T(d ,n) ) ,
(n − d )!
où
d
c
X
Vn,d (t 1 , . . . , t d ) = t i + (n − d )t d .
i =1
De, plus, l’estimateur du maximum de vraisemblance est bien défini et vaut
d
λ̂cn,d (T(1,n) , . . . , T(d ,n) ) = c .
Vn,d (T(1,n) , . . . , T(d ,n) )
Page 3/5
(Texte public) Option A : Probabilités et Statistiques
La transformation (4) du paragraphe précédent permet d’aller plus loin dans l’analyse de
la fonction de risque instantané. En écrivant, pour i = 1, . . . , d
U1 U2 Ui
T(i ,n) = + +...+ ,
n n −1 n −i +1
on montre que
1X i 1
E{T(i ,n) } = .
λ j =1 n − j + 1
Ceci suggère une méthode simple pour tester l’hypothèse que la fonction de risque instan-
tanée λ(t ) est constante en présence de censure : le nuage de points des variables T(i ,n) en
fonction des ij =1 (n − j + 1)−1 pour i = 1, . . . , d est grossièrement sur une droite.
P
Page 4/5
(Texte public) Option A : Probabilités et Statistiques
Page 5/5