Définition Stat Descriptive Chap 2

Télécharger au format pdf ou txt
Télécharger au format pdf ou txt
Vous êtes sur la page 1sur 16

Chapitre II : Les paramètres de

position d’une série statistique


Pour confirmer certaines impressions sur la série et pour en donner plus de
précision, nous serons amenés à trouver une ou plusieurs valeurs centrales
de la variable, capables de résumer la série en caractérisant l’ordre de
grandeur des observations.
De telles valeurs centrales sont appelées paramètres de tendance centrale ou
caractéristiques de position.

Le mode
On appelle mode ou valeur dominante d’une série statistique la valeur
observée de la variable ayant le plus grand effectif (ou la fréquence la
plus élevée). On note généralement le mode MO.
Remarques :
Le mode est exprimé dans la même unité que la variable.
 Si toutes les modalités ont la même fréquence alors la distribution
statistique ne possède pas de mode. On parle alors de distribution
uniforme.
 Lorsqu’une série possède un seul mode, on dit que la distribution est
unimodale. En revanche, lorsqu’elle en possède deux ou plusieurs elle est
respectivement qualifiée de bimodale et multimodale.
Le calcul du mode dépend de la nature de la variable, discrète ou continue.

Cas d’une variable continue


Dans le cas d’une variable continue groupée en classes, on parle plutôt
de classe modale. La classe modale est la base du rectangle ayant la
hauteur la plus élevée.
Cependant, on distingue deux cas selon que les amplitudes des classes
sont égales ou inégales.

Cas d’amplitudes identiques


Dans ce cas, la classe modale est la classe d’effectif ni le plus élevé, soit
[bi 1  bi [ . L’effectif de la classe qui précède la classe modale est ni 1 et
celui de la classe qui suit la classe modale est ni 1 . La détermination du
mode à partir de la classe modale se fait de la façon générale suivante :
 m1  bi 1  m2  bi  m1
M 0  bi 1  ai   
 1
m  m2 
m1  m2
avec :

bi-1 : borne inférieure de la classe modale


bi : borne supérieure de la classe modale
ai : amplitude de la classe modale
m1  ni  ni 1
m2  ni  ni 1
Exemple : Soit la distribution de la population de 20 ménages selon le
revenu des deux parents :

Classe de Amplitudes Effectifs Fréquences


Revenu en DT ni fi
[200-300[ 100 40 0,20
 m1 
[300-400[ 100 60 0,30

 m2 
[400-500[ 100 30 0,15
[500-600[ 100 50 0,25
[600-700[ 100 20 0,10
Total 200 1

La classe modale est la classe ayant la fréquence la plus élevée. C’est la


classe [300  400[ dans notre exemple. Dans ce cas, le mode est calculé
par :
 60  40 
M 0  300  100   340 DT.
 (60  40)  (60  30) 
On interprète en disant que le salaire le plus fréquent est de 340 Dinars.
Remarque : On peut aussi utiliser les fréquences relatives au lieu des
effectifs.
Dans ce cas, on aura :
 0,30  0,20 
M 0  300  100   340 DT.
 (0,30  0,20)  (0,30  0,15) 
Cas d’amplitudes inégales
Dans le cas où les amplitudes sont différentes, la classe modale est la
classe de densité (ou de fréquence corrigée) la plus élevée, ou encore
d’effectif corrigé le plus élevé.

 m1  bi 1  m2  bi  m1
Le mode est donné par : M 0  bi 1  ai   
 m1  m2  m1  m2

bi-1 : borne inférieure de la classe modale


bi : borne supérieure de la classe modale
ai : amplitude de la classe modale
m1  hi  hi 1 , ( m1  nic  nic1 );
m2  hi  hi 1 , ( m2  nic  nic1 )
où hi , hi 1 et hi 1 sont les effectifs corrigés

Classes Amplitudes Effectifs Fréquences


numérotée corrigées
[bi 1 bi [ ai nic
f i c ou hi
[b0 b1[ a1 n1 f1c ou h1
[b1 b2 [ a2 n2 f 2c ou h2

. nic1 f i c1ou hi 1
 m1 
[bi 1 bi [ ai n c
i
f i c ou hi
 m2 
. nic1 f i c1 ou hi 1

[bp1 bp [ ap n cp f pc ou hp
Ensemble N 1
Effectif corrigés

Densités ou effectifs corrigés


ou fréquences corrigées

Détermination graphique du mode

hi
m2
m1
hi+1

hi-1

0
bi-1 Mo bi Classes

Exemple : Soit la répartition de 100 personnes selon leur âge :

Classes Effectifs Amplitudes Densités Effectifs corrigés


d’âges
ni ai di nic ou hi
[5 , 10[ 11 5 2,2 22
[10 , 15[ 10 5 2 20
[15 , 20[ 15 5 3 30
[20 , 30[ 20 10 2 20
[30 , 40[ 18 10 1,8 18
[40 , 60[ 16 20 0,8 8
[60 , 80[ 10 20 0,5 5
total 100
La plus grande hauteur appartient à la classe [15  20[ . Donc :
M 0 [15  20[
 30  20  15  10  20  10
et M 0  15  5   17,5 
 (30  20)  (30  20)  10  10
On interprète en disant que l’âge observé le plus fréquemment est d’environ
17ans et 6mois.
Remarque : On peut aussi utiliser les fréquences corrigées à la place
des effectifs corrigés. Dans ce cas on aura
 0,3  0,2  15  0,10  20  0,10
M 0  15  5   17,5 
 (0,3  0,2)  (0,3  0,2)  0,1  0,1
La médiane
Soit une série statistique ordonnée par valeurs croissantes ou
décroissante. La médiane, notée généralement Me , est la valeur de la
variable qui partage la population en deux groupes d’effectifs égaux. En
d’autres termes, la médiane est la valeur de la variable située au
« milieu » d’une série ordonnée telle que la moitié des individus prenne
une valeur qui lui soit inférieure, l’autre moitié prenant par conséquent
une valeur qui lui soit supérieure.

Cas d’une variable discrète


La détermination de la médiane d’une série statistique nécessite d’abord
de ranger par ordre croissant (ou décroissant) les valeurs observées.
 Si la série comporte un nombre impair de valeurs, soit N valeurs, la
N 1
médiane sera la valeur de rang ( )
2 .
 Si la série comporte un nombre pair de valeurs, on parle d’intervalle
médian. Ce dernier est défini par :
N N
]la ( ) ième valeur , la (  1) ième valeur].
2 2
Toute valeur appartenant à cet intervalle fait fonction de médiane.
Remarque : certains proposent de choisir comme médiane le centre de
l’intervalle médian. La médiane, dans ce cas, n’est pas forcément une
valeur observée.
Exemple 1 :
On considère la répartition de 9 ménages selon le nombre d’enfants par
ménage.
nombre d’enfants
par ménage
0 0 1 1 2 3 3 3 4

Rang (ordre
croissant)
1 2 3 4 5ième 6 7 8 9

4 observations Mé 4 observations

La médiane, dans ce cas, correspond à la cinquième valeur : Mé  2


enfants par ménage. On dit qu’il y a autant de ménage qui ont moins de
2 enfants que de ménage qui ont plus de 2 enfants.
Exemple 2 :
On considère la répartition de 10 ménages selon le nombre d’enfants
par ménage.
nombre d’enfants
par ménage
0 0 1 1 2 3 3 3 4 4

Rang (ordre
croissant)
1 2 3 4 5ième 6ième 7 8 9 10

4 observations Intervalle 4 observations


médian

Dans ce cas on parle plutôt d’intervalle médian ]2 , 3], correspondant à


la ]cinquième valeur , sixième valeur].
Remarque : certains retiennent comme valeur médiane le centre de
23
l’intervalle médian, soit Mé   2,5 enfants. Cette valeur ne
2
correspond pas à une valeur réellement observée.
Exemple 3 :
nombre d’enfants
par ménage
0 0 1 1 2 2 3 3 3 4

Rang (ordre
croissant)
1 2 3 4 5ième 6ième 7 8 9 10

4 observations Intervalle 4 observations


médian

Dans le cas de cette distribution statistique, l’intervalle médian est :


]2 , 2]. La valeur médiane est donc égale à 2 .
Les représentation groupée des données des exemple 2 et 3 nous
donnent les deux tableaux suivants :

Exemple 2

xi Effectifs Fréquences Fréquences cumulées

ni fi Fi 
0 2 0,2 0
1 2 0,2 0,2
2 1 0,1 0,4
3 3 0,3 0,5
4 2 0,2 0,8
Ensemble 10 1
Fi
1
0,8

0,5

0,4

0,2

0 1 2 3 4 xi
Intervalle médian

Exemple 3

xi Effectifs Fréquences Fréquences cumulées

ni fi Fi 
0 2 0,2 0
1 2 0,2 0,2
2 2 0,2 0,4
3 3 0,3 0,6
4 1 0,1 0,9
Ensemble 10 1

Fi
1
0,9

0,6
0,5
0,4

0,2

0 1 Mé =2 3 4 xi
Cas d’une variable continue
Il n’y a aucune différence de calcul pour la médiane selon que les
classes sont d’amplitudes constantes ou variables.
Le calcul de la médiane dans le cas de variable continue passe, d’abord,
par la détermination de la classe médiane. Ensuite, par interpolation
linéaire, on peut calculer la valeur précise de la médiane à l’intérieur de
la classe médiane.
Soit [bi 1 bi [ la classe médiane, ai l’amplitude de la classe médiane,
L’expression de la médiane est donnée par :

 0,5  Fi 1 
Mé  bi 1  ai  ,
 i
F  Fi 1 

où Fi désigne la fréquence cumulée croissante de la classe médiane,


Fi  1 la fréquence cumulée croissante de la classe qui précède la classe
médiane.
Exemple : En reprenant notre exemple sur la répartition des 100
individus selon leur âge :
Classes Effectifs Effectifs cumulée Fréquences Fréquences
d’âges ni croissants fi cumulées
croissantes
ni 
Fi 
[5 , 10[ 11 11 0,11 0,11
[10 , 15[ 10 21 0,10 0,21
[15 , 20[ 36
 Mé  N 
  50
2
[20 , 30 [ 20 56
[30 , 40[ 18 74 0,18 0,74
[40 , 60[ 16 90 0,16 0,9
[60 , 80[ 10 100 0,10 1
Total 100 1

Le calcul, par interpolation linéaire, de la médiane donne :


20 ------ 0,36
Mé  20 0,50  0,36
Mé ------ 0,50 
30  20 0,56  0,36
30 ---- ---- 0,56
Ou encore, en utilisant les effectifs cumulés croissants :
20 -------- 36
Mé  20 50  36
Mé ------- 50 
30  20 56  36
30 --------- 56

N
Dans notre exemple :  50 . La classe médiane est la classe à laquelle
2
appartient la valeur médiane, c’est à dire la classe [20  30[ , d’où :

 50  36 
Mé  20  10   27ans
 56  36 
C’est à dire que 50% des individus sont âgés de moins de 27 ans.

La moyenne arithmétique
La moyenne arithmétique, dite simplement moyenne est notée x , est la
caractéristique de tendance centrale la plus usuelle.

Cas de données non groupées


En entend par données non groupées, celles qui ne sont pas présentées
dans un tableau statistique.
Soit une série statistique de N observations : x1, x2 , x3 ,, xn . La
moyenne arithmétique (appelée simple) de ces observations est donnée
par :
iN

x1  x2  x3    xn 
xi
x  i 1

N N

Cas de données groupées


Dans le cas d’une variable discrète :
i p

n1 x1  n2 x2  n3 x3    n p x p n x i i
x  i 1

N N

où xi , et ni , i  1, 2,, p représentent respectivement la valeur du


caractère et l’effectif correspondant, et p est le nombre de valeurs prises
par la variable.
Dans le cas d’une variable continue, où les données sont groupées en
classes, on applique la même formule, en remplaçant les valeurs xi par
i p i p

n c
i 1
i i n x
i 1
i i

les centres de classes. Dans ce cas on a : x  


N N

Remarques :
La somme des écarts à la moyenne arithmétique est nulle :
N
 pour des données non groupées  xi  x   0 . En effet :
i i
iN iN iN

 x  x    xi   x  xi  N .x  N .x  N .x  0
N

i
i i i 1 i 1 i 1

 n c  x  0.
N
 pour des données groupées en classes, On a i i
i i
iN
En effet : n c
i 1
i i
 N .x  N .x  N .x  0

La moyenne arithmétique x d’une population d’effectif N composée de k


sous-populations d’effectifs N k et de moyenne x k est égale à :
i p

N1 x1  ....N p x p N x i i
x  i 1

N N

La moyenne arithmétique est le critère le plus fréquemment utilisé pour


définir une valeur moyenne d’observations d’une variable additive comme
par exemple : la taille, le poids, l’âge, ...etc. Il y a d’autres variables dont
le calcul de la moyenne se traite autrement, comme, par exemple, le taux
de chômage ou d’inflation, le taux de change, la vitesse sur différents
parcours, ...etc.
Autres moyennes
La moyenne géométrique
La moyenne géométrique d’une variable, notée généralement G , est
égale à la racine N-ième du produit des N valeurs observées de cette
variable. Elle est utilisée souvent dans le calcul des taux de croissance
moyens et de certains indices statistiques synthétiques.

Cas de données non groupées


La moyenne géométrique simple est donnée par :

G  N x1.x2 .x3 ..xn

Cas de données groupées


La moyenne géométrique pondérée est définie par :

 
1

G  N x1n .x2n .x3n ..x p  x1n .x2n .x3n ..x p


1 2 3
np 1 2 3
np N

La moyenne géométrique peut être exprimée en fonction des fréquences


relatives de la manière suivante :
n1 n2 n3 np

G  x .x .x ..x pN  x1f .x2f .x3f ..x p


N N N 1 2 3
fp
1 2 3

Remarques :
Le logarithme de la moyenne géométrique est égale à la moyenne
arithmétique des logarithmes des xi .
En pratique, le calcul de la moyenne géométrique passe par le
logarithme. Ainsi, dans le cas des données non groupées, on a :
1 N
ln G   lnxi
N i 1
et dans le cas des données groupées par classes, on a :
1 p
ln G   ni lnxi
N i 1
La moyenne géométrique est utilisée quand les valeurs de la variable sont
liées de façon multiplicative les unes aux autres.
La moyenne géométrique d’un produit de deux variables est égale au
produit de leurs moyennes géométriques.
La moyenne géométrique d’un rapport de deux variables (  0 ) est égale au
rapport de leurs moyennes géométriques.
Exemple :
L’étude des bénéfices d’une entreprise sur 5 ans montre que les
bénéfices ont augmenté de 6% pendant les deux premières années, de
10% pendant les deux années suivantes et de 8% pendant la dernière
année. Quel est l’augmentation moyenne sur 5 ans ?
En utilisant la moyenne arithmétique des taux observés, et en
désignant par x , le taux moyen ainsi défini, on obtient :
2  6%  2  10%  1  8%
x  8%
5
Mais ce résultat est un résultat erroné. En effet :
Soit F0 le bénéfice de l’entreprise au début de la période d’étude.
- A la fin de la première année le bénéfice augmente de 6%. Il est égal
à F1  F0  1,06

- A la fin de la deuxième année : F2  F1  1,06  F0  (1,06)


2

- A la fin de la troisième année : F3  F2  1,10  F0  (1,06)  1,1


2

- A la fin de la quatrième année : F4  F3  1,10  F0  (1,06)  (1,1)


2 2

- A la fin de la 5ième année : F5  F4  1,08  F0  (1,06)  (1,1)  1,08


2 2

Le taux de croissance annuel moyen, c , doit satisfaire la relation :

F5  F0 (1  c) 5
On peut alors écrire :
F5  F0  (1,06) 2  (1,1) 2  1,08  F0 (1  c) 5
 (1,06) 2  (1,1) 2  1,08  (1  c) 5

 (1,06) 2  (1,1) 2  1,085  1  c


1

(C’est l’écriture de la moyenne géométrique des augmentations)


2 2 1
 ln(1,06)  ln(1,1)  ln(1,08)  ln(1  c)
5 5 5
2 ln(1,06)  2 ln(1,1)  ln(1,08)
  ln(1  c)
5
 0,07682  ln(1  c )
 e 0,07682  1  c
 c  0,0798
ln(1  c) apparaît ainsi comme la moyenne arithmétique des
logarithmes des taux de croissance. (1  c ) est donc la moyenne
géométrique des différents taux de croissance du bénéfice.
On peut dire que l’augmentation annuelle moyenne est de 7,98%

La moyenne harmonique
La moyenne harmonique, notée H, est égale à l’inverse de la moyenne
arithmétique des inverses des valeurs :

Cas de données non groupées

N 1
H  
iN
1 1 iN 1
 ( )
i 1 xi

N i 1 xi

Cas de données groupées

1 1
H  
1 i  p  ni  i p
 fi 
 
N i 1  xi 
  
i 1  xi 

Remarques :
L’inverse de la moyenne harmonique est égale à la moyenne arithmétique
des inverses des xi .
La moyenne harmonique est généralement employée lorsque la variable
observée est égale au rapport de deux variables exprimées dans deux
unités différentes, par exemple le prix d’un bien exprimé en unités
monétaires par unité de bien, la vitesse exprimée en unités de distance
par unité de temps.
Exemple :
Un étudiant a consacré la même somme de 36 D pendant trois ans à
l’achat de livres aux prix respectifs de 4 D, 6 D et 9 D le livre.
Dans ce cas le prix d’achat moyen d’un livre n’est pas la moyenne
469
arithmétique des prix : x   6,33 D
3
En effet, l’étudiant a dépensé durant les trois ans 3  36  108D. Il a
acheté :
36
 9 livres pendant la première année,
4
36
 6 durant la deuxième année
6
36
et  4 au cours de la troisième année.
9
1 1 1
Il a donc acheté : 36     9  6  4  19 livres
 4 6 9
et le prix moyen d’un livre est donc :
3  36 3  36 3
H     5,68D.
19 1 1 1 1 1 1
36       
4 6 9 4 6 9
H est donc la moyenne harmonique des différents prix 4, 6 et 9.

La moyenne quadratique
La moyenne quadratique d’une variable statistique, notée Q , est égale à
la racine carrée de la moyenne arithmétique des carrées des valeurs de
la variable.

Cas de données non groupées

1 i N 2
Q  xi
N i 1
Cas de données groupées

1 i p 2 i p
Q  ni xi 
N i 1
fx
i 1
i i
2

Exemple :
Quelle est la mesure du « côté moyen » de trois plaques métalliques
carrées dont les côtés mesurent 3 cm, 6 cm et 9 cm.
369
x  6 cm
3
Le calcul de la moyenne arithmétique des côtés est faux. En effet, les
superficies des plaques sont : 9 cm2, 36 cm2 et 81 cm2.
La superficie moyenne est de :
9  36  81
x  42 cm
3
Ainsi, le côté moyen mesure : c  42 . Il s’agit de la moyenne
quadratique des côtés :
1 2
c (3  6 2  9 2 )  42 cm.
3
Remarques :
La moyenne quadratique est souvent utilisée dans le calcul de la variance
(voir le section suivante).
Les moyennes quadratique et arithmétique tiennent compte davantage des
valeurs les plus élevées de la série statistique. En revanche, Les
moyennes géométrique et harmonique réduisent l’influence des
observations les plus élevées.
Les relations existantes entre les différentes moyennes est :
xmin  H  G  x  Q  xmax
Exemple :
Calculer les moyennes arithmétique, géométrique, harmonique et
quadratique de la série suivante :2, 5, 11, 18.
2  5  11  18
 9 ; G  4 2  5  11  18  2  5  11  18 4  6,67
; 1
x
4
4 ; 1 2
H  4,72 ; Q  (2  5 2  112  18 2 )  10,88
1 1 1 1 4
  
2 5 11 18
On peut vérifier la relation établie entre les différentes moyennes :
2  4,72  6,67  9  10,88  18

Vous aimerez peut-être aussi