Chapitre 3:série Statistique À Deux Caractères (Ou À Deux Variables)
Chapitre 3:série Statistique À Deux Caractères (Ou À Deux Variables)
Chapitre 3:série Statistique À Deux Caractères (Ou À Deux Variables)
I- Tableau de contingence.
Y Y1 Y2 _ _ _ Yj ___ Yp ni
X
x1 n11 n12 - n1 j - n1 p n1
x2 n21 n22 - n2 j - n2 p n2
- - - - - - - -
- - - - - -
xi ni1 ni 2 - nij - nip ni
- - - - - - - -
- - - - - - - -
xr nr1 nr 2 - nrj - nrp nr
n j n1 n2 ___ n j ___ n p n
nij
A partir de ce tableau, nous en pouvons définir la fréquence du couple xi ; y j par : f ij
n
r p
où n nij et n étant l’effectif total. Cette fréquence représente la proportion
i 1 j 1
d’individus vérifiant à la fois la modalité xi et la modalité y j . Les paramètres utilisés pour
caractériser les séries statistiques à deux variables sont de deux types :
Ceux qui ne concernent qu’une variable à la fois à partir des distributions des variables
sont appelés « marginales et conditionnelles ».
Ceux qui s’intéressent à la distribution globale et qui servent à décrire les relations qui
existe entre les deux variables d’observation.
1) Distribution marginale.
p
ni
Fréquences marginales : la fréquence marginale associé a xi est : fi avec i 1,...., r .
n
n j
La fréquence marginale associé a y j est : f j avec
n
j 1,...., p .
Tableau des distributions marginales :
Pour X : Pour Y :
ni n j
X ni fi Y n j f j
n n
x1 n1 f1 y1 n1 f 1
x2 n2 f2 y2 n2 f 2
- - - - - -
- - - - - -
xi ni
fi yi ni f i
- - - - - -
- - - - - -
xr nr fr yp n p f p
n 1 n 1
r
j
y f j y j yj nij y j f ij y j .
j 1 j 1 n n j 1 i 1 j 1 i 1
Variances marginales : En notant respectivement par x et y ces variances, on a :
2 2
n
r 2 r 2
x2 fi xi x i xi x
i 1 i 1 n
p
y2 f j y j y
2
j 1
Tableau de contingence :
Y ni
25 35 45 55
X
3 3 1 1 0 5
5 1 5 0 0 6
7 0 1 3 0 4
9 0 0 1 2 3
11 0 0 2 0 2
n j 4 7 7 2 20
Pour X : Pour Y :
ni
X ni fi
n n j
Y n j f j
3 5 5 n
20 25 4 4
5 6 6 20
20 35 7 7
7 4 4 20
20 45 7 7
9 3 3 20
20 55 2 2
11 2 2 20
20 20 1
20 1
Moyennes marginales :
5
5 3 6 5 4 7 3 9 2 11
x fi xi 6.10
i 1 20
4
4 25 7 35 7 45 2 55
y f j y j 38.5
j 1 20
Variances marginales :
5 2 5 32 6 52 4 7 2 3 92 2 112
5 2 2
x2 fi xi x fi xi x 6.10 6.59
2
i 1 i 1 20
4
4 25 7 35 7 45 2 55
2 2 2 2
y2 f j yj y 38.5 82.75
2 2
i 1 20
2) Distributions conditionnelles.
nij
j
donnée du couple xi , fi , i 1,....., r avec f i
j
n j
(lire fi si j ).
nij
famille, et : y j , f j , j 1,...., p avec f j
i i
ni
(lire f j si i ).
Moyennes conditionnelles :
r
X
Pour Y y j , j fi xi , il y a donc p moyennes conditionnelles x j .
j
x
i 1
p
Variances conditionnelles :
X
Pour Y y j , on notera cette variance conditionnelle par V j x , ou par y et
2
x x
r
V j x fi j
i j avec j 1,...., p .
i 1
p
i j 1
Application numérique :
Supposons que l’on veut étudier la distributions du salaire horaire des individus ages de 35
ans, la variable étudiée est la variable conditionnelle X Y 35 ans .
Tableau de cette distribution :
ni 2
X ni 2 fi 2
n2
Moyenne conditionnelle :
3 1 1 5
1 5 5 1 7
7 x 2 f i 2 xi 5€
i 1 7
5 5 5
7
7 1 1 Variance conditionnelle :
5 2 5 2
7 V2 (x) fi 2 xi2 x 2 fi 2 xi2 x 2
9 0 0 i 1 i 1 .
1 3 5 5 1 7
2 2 2
52 1.143 € 2
11 0 0 7
7 1
Etudions maintenant la distribution de l’age des salaires gagnant un salaire horaire égal a 3€.
La variable étudiée est la variable conditionnelle Y X 3€ .
n1 j
Y ni j f j1 Moyenne conditionnelle :
n1
25 3 3 4
3 25 1 35 1 45
y1 f j1 y j 31 ans
7 j 1 5
35 1 1
7 Variance conditionnelle :
45 1 1
4
7 V1 ( y ) f j1 y 2j y1
2
55 0 0 j 1 .
3 252 1 352 1 452
7 1 312 64 ans 2
5
La moyenne marginale est la moyenne des moyennes conditionnelles, pondérée par les fi ou
les f j selon la variable considérée.
p r
D’où : x f j x j et y fi yi
j 1 i 1
j 1 j 1
r r
V ( y) y2 fi Vi y fi yi y .
2
i 1 i 1
c) Rapport de corrélation.
x
r
fi y y
2
i
moyennes conditionnelles de X , c’est-à-dire : .
y2 i 1
x V ( y)
f j x x
2
2
x , on a : j 1
j
.
y 2x
y V ( x)
x y
- 0 1 (cf propriété de 2 )
Si 2
y 1 , on dit que Y est lié fonctionnellement à X . De même, si x2 1 , on dit que X
x y
est lié fonctionnellement à Y .
Remarque : y x =0 x y 0 .
2 2
Si y 0 , alors on dit que Y est carrelée avec X .
2
Application numérique :
Y ni yi
25 35 45 55
X
3 3 1 1 0 5 31
5 1 5 0 0 6 33.33
7 0 1 3 0 4 42.5
9 0 0 1 2 3 51.66
1 0 0 2 0 2 45
n j 4 7 7 2 20
xj 3.5 5 7.86 9
4 n
4
j 4 3.5 7 5 7 7.86 2 9
x fij x j xj 6.10 .
j 1 j 1 n 20
5
5 312 6 33.332 4 42.52 3 51.662 2 452 38.52
y fi yi 0.67 .
i 1 82.750
L’âge est donc corrélé avec le salaire horaire.
4 3.52 7 52 7 7.862 2 9 2
f j x j x 6.102
2
4
2x 20 0.561 .
y j 1 V ( x) 6.59
Le salaire horaire est corrélé avec l’âge comme y x y , la corrélation de Y avec X est
2 2
x
plus forte que celle de X avec Y .
1) Définition :
X
Pour chaque valeur y j de Yi , la distribution conditionnelle de Y y j est identique à la
distribution marginale de X , on dit que X est statistiquement indépendante de Y .
nij ni
X est statistiquement indépendant de Y si et seulement si : f i j fi i, j .
n j n
2) Propriétés :
Si X est statistiquement indépendant de Y , alors :
nij n n j ni
En effet, nij n n j ni .
n n n n
1) Covariance.
2) Coefficient de corrélation :
Application numérique :
Y 25 35 45 55
X
3 3 1 1 0
75 105 135
5 1 5 0 0
125 175
7 0 1 3 0
245 315
9 0 0 1 2
405 495
11 0 0 2 0
495
On a alors :
5 4
nij x y i j
cov X , Y i 1 j 1
xy
n
3 75 1105 1125 5 175 1 245 3 315 1 405 2 495
cov X , Y 17.15 0
20
En moyenne X et Y évoluent dans le même sens .
Calcul du coefficient de corrélation linéaire :
cov X , Y 17.15
r x, y 0.73 .
x y 6.59 82.75
V- La liaison fonctionnelle.
1) Définition :
Y y1 y2 y3 y4 ni
X
x1 0 0 5 3 8
x2 0 6 0 0 6
x3 9 0 0 0 9
n j 9 6 5 3 23
X est liée fonctionnellement à Y , cette liaison n’est pas réciproque car Y n’est pas liée
fonctionnellement à X .
Y y1 y2 y3 y4 ni
X
x1 4 0 0 0 4
x2 0 0 0 5 5
x3 0 0 6 0 6
x4 0 5 0 0 5
n j 4 5 6 5 20
VI-Courbes de régression.
1) Définition :
a) Nuage de points d’une série statistique à 2 variables.
Application numérique :
Y ni yi
25 35 45 55
X
3 3 1 1 0 5 31
5 1 5 0 0 6 33.33
7 0 1 3 0 4 42.5
9 0 0 1 2 3 51.66
1 0 0 2 0 2 45
n j 4 7 7 2 20
xj 3.5 5 7.86 9
Courbe de régression
70
60
50
40 C(X/Y)
C(Y/X)
30 Mij(xi,yj)
20
10
0
0 2 4 6 8 10 12
points.
b) Courbes de régression.
- la courbe de régression de Y en X notée CY X est la courbe des points M i xi , y j .
- la courbe de régression de X en Y notée C X Y est la courbe des points M j xi , y j .
- Les surfaces des points M i et M j sont proportionnelles respectivement à ni et n j .
2) Relation entre courbes de régressions et le rapport de corrélation.
r p
fi y y f j x x sont les
2 2
Les variances des moyennes conditionnelles i et j
i 1 j 1
yi y CY
X
xj x
CX
Y
On cherche à résumer au mieux le nuage de points M ij par une droite. Le critère utilisé est
celui « des moindres carrés ». Le problème de sa détermination relève de la méthode dite de
l’ajustement linéaire.
Préliminaires graphiques :
M i xi , axi b
yj ij
M ij xi , yi
xi
ij
ij
ij
y j axi b soit minimale. La solution des problèmes pour
2 2
i 1 j 1 n i 1 j 1 n
l’écart ij compté parallèlement à l’axe des Y est la droite de régression de y en x que l’on
note par Dy x .
1) Equation de la droite Dy x .
On notera cette équation par y ax ˆ bˆ , car les valeurs exactes de a et de b ne seront jamais
connues, car dans les problèmes statistiques, on travaille surtout avec des échantillons.
â et b̂ sont donc, pour un échantillon donné, des valeurs approchées de a et de b , c’est-à-
dire des valeurs « estimées ».
cov X , Y
aˆ , c’est la pente ou le coefficient directeur de Dy x .
V (x)
ˆ , c’est l’ordonnée à l’origine de Dy .
bˆ y ax x
Dy
x
y G
nij nij
r p r p
xi ay j b
2
2
La droite D x y est la droite qui rend minimale : eij
i 1 j 1 n i 1 j 1 n
eij Dx
y
yj M ij Mj
xi
i 1
n
cov X , Y
i1
xi yi n xy
- Pour D x y : aˆ .
V (Y ) n 2
yi n y
2
i 1
Application numérique :
cov X , Y 17.15 x2 6.59 y2 82.75 x 6.1 y 38.5
3) Coefficient de détermination.
R 2
.
y2 x2
R 2 est le coefficient de détermination de l’ajustement linéaire ; plus il est fort, meilleur est
l’ajustement.
b) 0 R 2 1 , car r x, y 1
c) Si R 2 1 , il existe une relation affine entre X et Y , les points M ij sont
alignés.
d) Si R 2 1 , les deux droites d’ajustement sont parallèles aux axes.
e) R 2 aˆ aˆ
Preuve du e) :
cov X , Y cov X , Y
aˆ et aˆ ,
x2 y2
cov X , Y cov X , Y cov X , Y
2
Donc on a : aˆ aˆ R2 .
x 2
y 2
x y
2 2
Application numérique :
17.15
2
6.59 82.75
Donc, on a : y x x y R , alors c’est al courbe de régression CY X qui est la meilleure pour
2 2 2