Statistique Descriptive Travaux Dirigés Correction:Td #3: Semestre 2

Télécharger au format pdf ou txt
Télécharger au format pdf ou txt
Vous êtes sur la page 1sur 11

Statistique Descriptive

Travaux dirigés
CORRECTION :TD N° 3

Semestre 2

Responsables :

Pr. Omar RAJAA

Pr. Abdelkarim AAZZAB

Pr. Asma SAIDI

Année Universitaire : 2018-2019


ENCG-Agadir Statistique Descriptive

Exercice 1

1) E = 80

2) Pour répondre aux questions de cet exercice, on considère le tableau statistique


suivant :
salaires𝑥𝑖 𝑛𝑖 𝑐𝑖 𝑛𝑖 𝑐𝑖 𝑛𝑖 ↑
90-100 5 95 475 5
100-110 9 105 945 14
110-120 16 115 1840 30
120-130 25 125 3125 55
130-140 13 135 1755 68
140-150 7 145 1015 75
150-160 3 155 465 78
160-170 2 165 330 80
Total 80 9950

𝑸𝟏 : la valeur de la variable statistique dont 25% des observations lui sont ≤ et 75%
des observations lui sont ≥.
𝑸𝟐 : c’est la médiane.
𝑸𝟑 :la valeur de la variable statistique dont 75% des observations lui sont ≤ et 25% des
observations lui sont ≥.

Pour déterminer les quartiles on suit la même démarche que celle utilisée dans le
calcul de la médiane.
Donc, la classe où se trouve 𝑸𝟏 est : [110-120[ et
𝑁
− 𝑛𝑖−1 ↑
𝑄1 = 𝑏𝑜𝑟𝑛𝑒𝑖𝑛𝑓𝑖 + 𝑎𝑖 4
𝑛𝑖
80
− 14
𝑸𝟏 = 110 + 10 4 = 𝟏𝟏𝟑, 𝟕𝟓
16
𝑸𝟏 = 𝟏𝟏𝟑, 𝟕𝟓 signifie que 25% des salaires journaliers sont ≤ 113,75𝑑ℎ𝑠, alors que
75% qui reste sont ≥ 113,75𝑑ℎ𝑠.

La classe médiane est [120,130[ et donc :


𝑁
− 𝑛𝑖−1 ↑
𝑸2 = 𝑀𝑒 = 𝑏𝑜𝑟𝑛𝑒𝑖𝑛𝑓𝑖 + 𝑎𝑖 2
𝑛𝑖
40 − 30
𝑸2 = 120 + 10 = 𝟏𝟐𝟒
25

1
ENCG-Agadir Statistique Descriptive

𝑸2 = 𝟏𝟐𝟒𝒅𝒉𝒔 Signifie que 50% des salaires journaliers pour cette population sont
inferieurs à 124dhs et les 50% qui restent lui sont supérieurs.
3𝑁
La classe où se trouve 𝑸3 est [130,140[ (car = 60). Donc :
4
3𝑁
− 𝑛𝑖−1 ↑ 60 − 55
𝑸3 = 𝑏𝑜𝑟𝑛𝑒𝑖𝑛𝑓𝑖 + 𝑎𝑖 4 = 130 + 10
𝑛𝑖 13
𝑸3 = 133,85

𝑸3 = 𝟏𝟑𝟑, 𝟖𝟓 signifie que 75% des salaires sont ≤ à 133,85 dhs et 25% qui restent lui
sont ≥.

3) l’intervalle interquartile 𝑄1 , 𝑄3 = [113,75; 133,85]


L’intervalle [113,75; 133,85] englobe 50% des salaires observés dans cette
80
population, c.-à-d. = 40 d’entre eux qui sont exactement au centre laissant 25% à
2
droite et 25% à gauche.
𝑸𝟑 − 𝑸𝟏
𝑰. 𝑸 = = 𝟎, 𝟏𝟔𝟐
𝑸𝟐
4)
Ecart absolu moyen :

𝟖
𝟏
𝑬. 𝑨. 𝑴𝑿 = 𝒏𝒊 ⎢𝒄𝒊 − 𝑿 ⎢
𝑵
𝟏
Calculons la moyenne 𝑿 :
𝟖
𝟏
𝑿 = 𝒏𝒊 𝒄𝒊 = 𝟏𝟐𝟒, 𝟑𝟕𝟓
𝑵
𝟏

Donc, 𝑬. 𝑨. 𝑴𝑿 = 𝟏𝟏, 𝟕𝟖.

𝑬.𝑨.𝑴𝑿
D’où, 𝑰. 𝑬. 𝑨. 𝑴𝑿 = = 0,094
𝑿

5) A partir des résultats précédents, on peut dire que cette distribution des salaires est
moins dispersée vu que les quartiles ne sont pas trop éloignés entre eux et cette faible
distance entre les trois quartiles fait que l’écart interquartile soit aussi faible (𝑄3 −
𝑄1 = 20,1 𝑑ℎ𝑠.). L’indice de l’écart absolu moyen est aussi très faible et égal à 0,094,
ce qui explique que les salaires observés dans cette population sont faiblement
distancés.

2
ENCG-Agadir Statistique Descriptive

Exercice 2

1)

𝒙𝒊 𝒏𝒊 𝒏𝒊 ↑
1 5 5
2 5 10
3 4 14
4 4 18
5 3 21
Total 21

𝑁
𝑸𝟏 : d’après la colonne des effectifs cumulés croissants on a 𝑸𝟏 = 𝟐. En effet, = 5,25 ,
4
et donc 𝑸𝟏 correspond à la première valeur de 𝒙𝒊 relative à 𝒏𝒊 ↑ ≥ 𝟓, 𝟐𝟓.

Ceci signifie que 25% des ménages enquêtés ont un nombre de pièces inférieur ou égal
à 2 , les 75% qui restent ont un nombre de pièces supérieur ou égal à 2.
3𝑁
𝑸𝟑 : on a = 𝟏𝟓, 𝟕𝟓, donc d’après la colonne des effectifs cumulés croissant 𝑸𝟑 = 𝟒.
4

Ceci signifie que 75% des ménages ont un nombre de pièces inférieur ou égal à 4 et les
25% qui restent ont un nombre de pièces supérieur ou égal à 4

Intervalle interquartile : [𝑸𝟏 , 𝑸𝟑 ]=[2,4] et l’écart interquartile : 𝑸𝟑 − 𝑸𝟏 = 𝟐


Donc :
𝑸𝟑 − 𝑸𝟏 2
𝑰. 𝑸 = = = 0,66
𝑸𝟐 3

2) On a déjà calculé la moyenne et la médiane (exercice 1 série 2) : 𝑿 = 𝟐, 𝟕𝟔 ; 𝑴𝒆 = 𝟑

𝒙𝒊 𝒏𝒊 ⎢𝑥𝑖 − 𝑀𝑒 ⎢ 𝑛𝑖 ⎢𝑥𝑖 ⎢𝑥𝑖 − 𝑋⎢ 𝑛𝑖 ⎢𝑥𝑖 − 𝑋 ⎢ 𝑛𝑖 (𝑥𝑖 − 𝑋)2

− 𝑀𝑒 ⎢
1 5 2 10 1,76 8,8 15,48
2 5 1 5 0,76 3,8 2,88
3 4 0 0 0,24 0,96 0,23
4 4 1 4 1,24 4,96 6,15
5 3 2 6 2,24 6,72 15,05
Total 21 25 25,24 39,79

Ecart absolu moyen par rapport à la moyenne :


𝟓
𝟏 𝟐𝟓, 𝟐𝟒
𝑬𝑨𝑴(𝑿) = 𝒏𝒊 ⎢ 𝑥𝑖 − 𝑋 ⎢ =
𝑵 𝟐𝟏
𝟏

3
ENCG-Agadir Statistique Descriptive

𝑬𝑨𝑴(𝑿) = 𝟏, 𝟐𝟎 .

𝑬𝑨𝑴 (𝑿)
Donc, 𝑰𝑬𝑨𝑴 (𝑿) = = 0,43
𝑿

Ecart absolu moyen par rapport à la médiane :


𝟓
𝟏 𝟐𝟓
𝑬𝑨𝑴(𝑴𝒆) = 𝒏𝒊 ⎢ 𝑥𝑖 − 𝑀𝑒 ⎢ =
𝑵 𝟐𝟏
𝟏
𝑬𝑨𝑴(𝑴𝒆) = 𝟏, 𝟏𝟗.

𝑬𝑨𝑴 (𝑴𝒆 )
Donc, 𝑰𝑬𝑨𝑴 (𝑴𝒆 ) = = 0,39
𝑴𝒆

3)
Ecart type :
𝝈𝒙 = 𝒗𝒂𝒓(𝒙)
1 5 39,79
Avec 𝑣𝑎𝑟 𝑥 = 𝑁 1 𝑛𝑖 (𝑥𝑖 − 𝑋)2 = 21

𝑣𝑎𝑟 𝑥 = 1,89

D’où
𝝈𝒙 = 𝟏, 𝟖𝟗 =1,374

Coefficient de variation :
𝝈𝒙
𝑪𝑽 = = 𝟎, 𝟒𝟗
𝑿
4) Le 𝑪𝑽 = 𝟎, 𝟒𝟗 signifie que l’écart type représente près de 50% de la moyenne
arithmétique de cette distribution. La dispersion des 21 ménages classés selon le
nombre de pièces est donc relativement élevée.

Exercice 3

1) Avant de calculer les revenus annuels moyen et médian, il faut tout d’abord
déterminer les bornes qui manquent :
 Puisque aucune personne ne touche moins de 1666,67 dhs par mois, alors le
revenu annuel minimum dans cette population est de : 1666,67× 𝟏𝟐 =
𝟐𝟎𝟎𝟎𝟎, 𝟎𝟒 𝑫𝑯𝑺.
 Puisque le maximum de revenu mensuel dans cette population est de
9166,67dhs, alors le maximum de revenu annuel est de : 9166,67× 𝟏𝟐 =
𝟏𝟏𝟎𝟎𝟎𝟎, 𝟎𝟒.
 On prend donc 20000dhs comme borne inférieure et 110000dhs comme borne
supérieure.

4
ENCG-Agadir Statistique Descriptive

𝒙𝒊 𝒏𝒊 𝒄𝒊 𝒏𝒊 𝒄𝒊 𝒏𝒊 ↑
20-40 45 30 1350 45
40-50 12 45 540 57
50-60 23 55 1265 80
60-70 46 65 2990 126
70-80 25 75 1875 151
80-90 30 85 2550 181
90-110 15 100 1500 196
Total 196 12070

Revenu annuel moyen :

On a :
1 7 12070
𝑿= 1 𝑛𝑖 𝑐𝑖 = = 𝟔𝟏, 𝟓𝟖
𝑁 196

Donc le revenu annuel moyen est 61580 DHS, (c-à-d que chaque personne observé
dans cette population reçoit un revenu moyen de 61580 dhs).

Revenu annuel médian :


𝑁 196
On a : = = 98, donc la classe médiane est : [60-70[
2 2

98−80
On a alors : 𝑀𝑒 = 60 + 10
46

𝑴𝒆 = 𝟔𝟑, 𝟗𝟏.

Donc le revenu annuel médian est d’environ 63910 dhs, ce qui signifie que 50% des
personnes observées dans cette population reçoit un revenu annuel inférieur à
63910dhs, alors que 50% des personnes reçoit un revenu annuel supérieur à 63910
dhs.

2)
Ecart type :
𝝈𝒙 = 𝒗𝒂𝒓(𝒙)

1 7 92808 ,44
Avec 𝑣𝑎𝑟 𝑥 = 𝑁 1 𝑛𝑖 (𝑥𝑖 − 𝑋)2 = 196

𝑣𝑎𝑟 𝑥 = 473,51

D’où,
𝝈𝒙 = 𝟒𝟕𝟑, 𝟓𝟏 = 21,76

5
ENCG-Agadir Statistique Descriptive

Ceci signifie qu’en moyen, le revenu annuel de chaque personne de cette population s’éloigne
du revenu annuel moyen (61580 DHS) d’environ 21760 dhs soit d’une façon négative ou
positive.

Coefficient de variation :
𝝈𝒙
𝑪𝑽 =
= 𝟎, 𝟑𝟓
𝑿
D’après le CV on peut dire que la dispersion est relativement peu élevée.

3) L’intervalle qui doit contenir 40% des revenus existant au centre de la série est
limité par les déciles 𝒅𝟑 et 𝒅𝟕 car c’est entre ces deux déciles qu’on aura 40%
des observations en laissant exactement 30% des observations à gauche de 𝒅𝟑
et 30% des observations à droite de 𝒅𝟕 .
Calculons alors 𝒅𝟑 et 𝒅𝟕 :
3𝑁 588
Pour 𝒅𝟑 , on a = = 58,8 , ce qui correspond à la classe [50,60[ (la classe
10 10
relative au premier effectif cumulé croissant ≥ 58,8).
𝟑𝑵
− 𝒏𝒊−𝟏 ↑
𝒅𝟑 = 𝒃𝒐𝒓𝒏𝒆𝒊𝒏𝒇𝒊 + 𝒂𝒊 𝟏𝟎
𝒏𝒊

𝟓𝟖, 𝟖 − 𝟓𝟕
𝒅𝟑 = 𝟓𝟎 + 𝟏𝟎 = 𝟓𝟎, 𝟕𝟖
𝟐𝟑
7𝑁 1372
Pour𝒅𝟕 , on a = = 137,2 , ce qui correspond à la classe [70,80[ .
10 10

𝟕𝑵
− 𝒏𝒊−𝟏 ↑
𝒅𝟕 = 𝒃𝒐𝒓𝒏𝒆𝒊𝒏𝒇𝒊 + 𝒂𝒊 𝟏𝟎
𝒏𝒊

𝟏𝟑𝟕, 𝟐 − 𝟏𝟐𝟔
𝒅𝟕 = 𝟕𝟎 + 𝟏𝟎 = 𝟕𝟒, 𝟒𝟖
𝟐𝟓
Donc l’intervalle qui centralise 40% des observations est [50,78 - 74,48].

4) Si les revenus annuels augmentent de 20% cela veut dire que les modalités de la
variable « revenus annuels » augmentent aussi de 20%. Ceci mène à avoir une
nouvelle variable : x’= x+20%x. d’où l’effet sur certaine caractéristiques
notamment la moyenne et l’écart type :

 La moyenne :
On a 𝑥 ′ = 𝑥 + 20%𝑥 donc 𝑋′= 𝑋+20%𝑋
𝑿′= 𝑿 + 𝟎, 𝟐𝑿 = 𝟏, 𝟐𝑿
Donc : 𝑿′=1,2× 𝟔𝟏, 𝟓𝟖 = 𝟕𝟑, 𝟖𝟗𝟔.
6
ENCG-Agadir Statistique Descriptive

Le nouveau revenu annuel moyen en considérant une augmentation de 20% est donc
73896 DHS .

 L’écart type :

On a 𝑥 ′ = 1,2𝑥 , donc 𝝈𝒙′ = 1,2𝝈𝒙 = 𝟐𝟔, 𝟏𝟏𝟐

 Coefficient de variation :
𝝈𝒙′
 𝑪𝑽 = = 𝟎, 𝟑𝟓.
𝑿′

On conclut que la moyenne et l’écart type sont automatiquement influencés de même


pourcentage, alors que le CV garde la même valeur.

Exercice 4

1)

Classes de valeurs 𝒏𝒊 𝒄𝒊 𝒏𝒊 𝒄𝒊
possibles
[5,10[ 23 7,5 172,5
[10,15[ 25 12,5 312,5
[15,25[ 31 20 620
[25,35[ 11 30 330
[35,65[ 6 50 300
Total 96 1735

 La moyenne :
1735
𝑋= = 18,07
96
 Ecart type :
𝜎𝑥 = 10,77
2)
𝑿’= 𝑿 + 𝟒 = 𝟐𝟐, 𝟎𝟕 et l’écart type reste inchangé (voir le cours) :
𝝈𝒙′ = 𝝈𝒙 = 𝟏𝟎, 𝟕𝟕
3) Dans le cas d’une augmentation de 30% on aura la nouvelle variable 𝑥 ′ = 𝑥 +
30%𝑥 = 1,3𝑥 et donc :
 La moyenne :
𝑿′ = 𝟏, 𝟑𝑿 = 𝟐𝟑, 𝟒𝟗

 L’écart type :
𝝈𝒙′ = 𝟏, 𝟑𝝈𝒙 = 𝟏𝟒

4) Pour la construction de la courbe, on considère le tableau :

7
ENCG-Agadir Statistique Descriptive

Classes 𝑛𝑖 𝑐𝑖 𝑛𝑖 𝑐𝑖 𝑓𝑖 % 𝑛𝑖 𝑐𝑖 𝑛𝑖 𝑐𝑖
de 𝑓𝑖 𝑛𝑖 𝑐𝑖
𝑛𝑖 𝑐𝑖 𝑛𝑖 𝑐𝑖
valeurs ↑ ↑
possibles

[5,10[ 23 7,5 172,5 24 24 172,5 9,94% 9,94%
[10,15[ 25 12,5 312,5 26 50 485 18,01% 27,95
[15,25[ 31 20 620 32, 3 82,3 1105 35,73 63,68%
[25,35[ 11 30 330 11,45 93,75 1435 19,02% 82,7%
[35,65[ 6 50 300 6,25 100 1735 17,3 100%
Total 96 1735 100

Construire la courbe.

5) Indice de Gini

Classes de 𝑛𝑖 𝑛𝑖 𝑐𝑖 𝑓𝑖 𝑛𝑖 𝑐𝑖 𝑓𝑖 (𝑄𝑖 + 𝑄𝑖−1 )


𝑛𝑖 ↑ 𝑛𝑖 𝑐𝑖 ↑ 𝑄𝑖 = ↑
valeurs 𝑛𝑖 𝑐𝑖
possibles
[5,10[ 23 172,5 0,24 23 172,5 0,0994 0,2385
[10,15[ 25 312,5 0,26 48 485 0,2795 0,0985
[15,25[ 31 620 0,32 79 1105 0,6368 0,2932
[25,35[ 11 330 0,11 90 1435 0,827 0,161
[35,65[ 6 300 0,0625 96 1735 1 0,1141
Total 96 1735 1 0,9053

𝑰𝑮 = 𝟏 − 𝑓𝑖 𝑄𝑖 + 𝑄𝑖−1 = 0,0947.
𝟏
Indice de concentration :
𝑴𝒍 − 𝑴𝒆
𝑰=
𝑬

 Calculons la médiale :
𝑛 𝑖 𝑐𝑖
On a =867,5 correspond à la classe [15,25[ au niveau des effectifs
2
cumulés croissant 𝑛𝑖 𝑐𝑖 ↑ , donc :

𝟖𝟔𝟕,𝟓−𝟒𝟖𝟓
𝑴𝒍 = 𝟏𝟓 + 𝟏𝟎 = 21,16.
𝟔𝟐𝟎
 Calculons la médiane :
 La classe médiane est : [10,15[ , donc :

𝟒𝟖−𝟐𝟑
 𝑴𝒆 = 𝟏𝟎 + 𝟓 = 𝟏𝟓
𝟐𝟓

 Etendu : 𝑬 = 𝟔𝟓 − 𝟓 = 𝟔𝟎.

8
ENCG-Agadir Statistique Descriptive

D’où,
𝟐𝟏, 𝟏𝟔 − 𝟏𝟓
𝑰= 𝟎, 𝟏𝟎𝟐 > 𝟎
𝟔𝟎
6) D’après l’analyse de l’indice de Gini et l’indice de concentration, on remarque
que la concentration des salaires est relativement faible ( on peut donc dire qu’il
y a une certaine égalité au niveau de la répartition des salaires au sein de cette
entreprise).

Exercice 5

1) Tout d’abord il faut noter que cette distribution est continue malgré les valeurs qui
manquent au niveau des classes (entre [1500,`1970[ et [1800,2090[ , …). Ces valeurs
qui manquent peuvent être considérées comme non observées dans cette population.
D’autre part toutes les classe ont la même amplitude 290.

Pour la représentation graphiquement, afin de garder la continuité de cette répartition,


il faut augmenter la valeur supérieure de chaque classe au même niveau de la valeur de
la borne inférieure de la classe suivante ( [1500, 1800[, [1800,[2090[…). Ce
changement n’aura aucun impact sur la représentation ou sur les effectifs observés.
2)

Les classes 𝑛𝑖 𝑐𝑖 𝑛𝑖 ↑ 𝑛𝑖 𝑐𝑖 𝑛𝑖 𝑐𝑖 ↑
𝑥𝑖
[1500,1790[ 20 1645 20 32900 32900
[1800,2090[ 50 1945 70 97250 130150
[2100,2390[ 67 2245 137 150415 280565
[2400,2690[ 36 2545 173 91620 372185
[2700,2990[ 22 2845 195 62590 434775
[3000,3290[ 40 3145 235 125800 560575
[3300,3590[ 35 3445 270 120575 681150
[3600, 3890[ 40 3745 310 149800 830950
Total 310 830950

 Le mode :
La classe modale est [2100,2390[, donc :
67−50
𝑀𝑜 = 2100 + 290 = 2202,71 𝑑ℎ𝑠,
67−50 +(67−36)

Cela signifie qu’une grande partie des appartements observés dans cette
population est loué à environ 2202,71dhs.
 La médiane :
La classe médiane est : [2400,2690[ , donc :

155 − 137
𝑀𝑒 = 2400 + 290 = 2545𝑑ℎ𝑠.
36

9
ENCG-Agadir Statistique Descriptive

Ce qui signifie que la moitié des appartements observés est louée à moins de
2545 dhs alors que l’autre moitié est louée à plus de 2545dhs.
 La médiale :
𝑛 𝑖 𝑐𝑖
On a = 415475 correspond à la classe [2700,2990[ au niveau des
2
effectifs cumulés croissant 𝑛𝑖 𝑐𝑖 ↑ , donc :
415475 −372185
𝑀𝑙 = 2700 + 290 = 2900,57dhs
62590

Ce qui signifie que la moitié de la masse des loyers des appartements observés dans cette
population est constituée des loyers inférieurs à 2900,57dhs alors que l’autre moitié de la
masse des loyers supérieurs à 2900,57dhs.

3)

Les classes 𝑛𝑖 𝑐𝑖 𝑓𝑖 𝑛𝑖 𝑐𝑖 𝑛𝑖 𝑐𝑖 𝑄𝑖 :=
𝑛 𝑖 𝑐𝑖
↑ 𝑓𝑖 (𝑄𝑖
8𝑛 𝑐
8
1 𝑛𝑖 𝑐𝑖
1 𝑖 𝑖
𝑥𝑖 + 𝑄𝑖−1 )
[1500,1790[ 20 1645 0,06 32900 0,039 0,039 0,002
[1800,2090[ 50 1945 0,16 97250 0,117 0,156 0,031
[2100,2390[ 67 2245 0,22 150415 0,181 0,337 0,108
[2400,2690[ 36 2545 0,12 91620 0,11 0,447 0,094
[2700,2990[ 22 2845 0,07 62590 0,075 0,522 0,067
[3000,3290[ 40 3145 0,13 125800 0,151 0,673 0,155
[3300,3590[ 35 3445 0,11 120575 0,145 0 ,818 0,164
[3600, 3890[ 40 3745 0,13 149800 0,18 1 0,236
Total 310 1 830950 0,857

8
On a 𝐼 = 1 − 1 𝑓𝑖 (𝑄𝑖
+ 𝑄𝑖−1 )= 1- 0,857
𝐼 = 0,143
D’après l’indice de Gini, on constate que la concentration est plutôt faible et que la
répartition tend à être égalitaire.

10

Vous aimerez peut-être aussi