Chapitre 2 Statistiques Et Probabilités

Télécharger au format pdf ou txt
Télécharger au format pdf ou txt
Vous êtes sur la page 1sur 14

CHAPITRE 2 : LES CARACTÉRISTIQUES DE POSITION ET DE DISPERSION D’UNE SÉRIE STATISTIQUE

CHAPITRE 2 : LES CARACTÉRISTIQUES DE

POSITION ET DE DISPERSION D’UNE SÉRIE STATISTIQUE

Dans ce chapitre, nous franchirons un pas supplémentaire en caractérisant la distribution


par sa forme générale et par deux paramètres ou valeurs typiques

• Un nombre caractéristique de la position de l'histogramme;


• un nombre caractéristique de sa dispersion ou de son étalement.

Section I : les caractéristiques de position

Les paramètres de position caractérisent l'ordre de grandeur des observations.

1- LE MODE

1.1- Définition
Le mode d’une distribution statistique, noté Mo, est la valeur de la variable la plus
fréquente, c’est-à-dire, la valeur de la variable qui admet l’effectif (fréquence) le (a) plus
élevé(e).

1.2- Application
Une étude propose de déterminer le nombre des internautes dans un échantillon de
« Publinets ». Le résultat se présente dans le tableau suivant :

Nombre d’internautes xi 2 3 4 5 6 7 8
Nombre de Publinets ni 12 20 15 30 8 20 10

Déterminons le mode.

Effectif ni
30 -

25 –
20 -
15 –

10 –

5 –

2 3 4 M 0= 5 6 7 8 xi
Donc le mode est égal à 5

1
CHAPITRE 2 : LES CARACTÉRISTIQUES DE POSITION ET DE DISPERSION D’UNE SÉRIE STATISTIQUE

Remarque :
Si la variable est continue, sa représentation graphique ne détermine pas le mode mais
une classe modale ayant la fréquence ou l’effectif le plus élevé.
Cependant, le mode peut être approximé en utilisant la formule suivante

( − )
(2.1)
= +
( − )+( − )

Avec :
xi : la borne inférieure de la classe modale.
ai : l’amplitude de la classe modale.
ni : l’effectif de la classe modale.
ni-1 : l’effectif de la classe inférieure la plus proche de la classe modale.
ni+1 : l’effectif de la classe supérieure la plus proche de la classe modale.

Exemple n°1:
La propriété des superficies cultivées, exprimées en hectares, est la suivante :

Superficie en hectares : xi Nombre des exploitants : ni Fréquence : fi


[05 ; 10 [ 4 0,043
[10 ; 15[ 10 0,109
[15 , 20[ 24 0,261
[20 ; 25[ 32 0,348
[25 ; 30[ 13 0,141
[30 ; 35[ 9 0,098
Totaux 92 1,000

1- Représenter graphiquement cette distribution et en déduire la classe modale.


2- Calculer le mode. Interpréter ?

Corrigé
1- La superficie cultivée est un caractère quantitatif continu, alors il sera représenté
graphiquement par un histogramme :

2
CHAPITRE 2 : LES CARACTÉRISTIQUES DE POSITION ET DE DISPERSION D’UNE SÉRIE STATISTIQUE

0.35 –

0.30 – Classe modale

0.25 –
Fréquence fi

0.20 –

0.15 –

0.10 –

0.05 –

0 5 10 15 20 25 30 35 Superficie (en hectares)

On remarque que le mode M0∈ [20 ; 25 [. En appliquant la formule (2.1), on aura :


(0.348 − 0.261)
= 20 + 5 × = .
(0.348 − 0.261) + (0.348 − 0.141)

Remarque :
Si les amplitudes des classes sont inégales, il est nécessaire d’utiliser les fréquences ou
les effectifs corrigés au niveau de la formule précédente

2- LA MOYENNE ARITHMETIQUE

2.1- Définition
La moyenne arithmétique d’une variable statistique X de k modalités, notée, , est
définie comme étant la somme des variables xi divisée par le nombre d’observations N. Elle
est donnée par l’expression suivante:

1
*

= ' (" )"


&
(2.2)
"+,

Avec :
N : la taille de la population
xi: la modalité i.
ni : l’effectif de la modalité i.
Or, la fréquence !" =
#$
%
donc la formule (2.2) s’écrit :
3
CHAPITRE 2 : LES CARACTÉRISTIQUES DE POSITION ET DE DISPERSION D’UNE SÉRIE STATISTIQUE

= ' !" )" (2.3)


"+,

Exemple n°2 :
Soit le tableau statistique suivant :
Nombre d’unités Nombre de lots Fréquence produit :
défectueuses : xi ni fi fi × xi
0 15 0,300 0,000
1 14 0,280 0,280
2 12 0,240 0,480
3 5 0,100 0,300
4 3 0,060 0,240
5 1 0,020 0,100
Totaux 50 1,000 1,400

Alors = 1.4
Remarque
Si la variable étudiée est une variable continue, il suffit de remplacer xi par le centre ci
de la classe [xi, xi+1[dans les formules précédentes.

Exemple 2:
La propriété des superficies cultivées, exprimées en hectares, est la suivante :
Superficie en Centre des Nombre des Fréquence : produit :
hectares : xi classes ci exploitants : ni fi fi× × ci
[05 , 10 [ 7,5 4 0,043 0,323
[10 , 15[ 12,5 10 0,109 1,363
[15 , 20[ 17,5 24 0,261 4,568
[20 , 25[ 22,5 32 0,348 7,830
[25 , 30[ 27,5 13 0,140 3,878
[30 , 35[ 32,5 9 0,099 3,185
Totaux 92 1,000 21.147

= ∑*"+, !" × ." = 21.147

4
CHAPITRE 2 : LES CARACTÉRISTIQUES DE POSITION ET DE DISPERSION D’UNE SÉRIE STATISTIQUE

Remarque :

Pour les classes ayant une amplitude infinie (par exemple [100 ,+ ∞ [ ; [1000 , + ∞ [ ;
]- ∞ , 20 [ , les centres de ces classes sont déterminés arbitrairement en considérant que les
amplitudes de ces classes devraient être égales aux amplitudes des classes immédiatement précédentes
ou suivantes
Exemple n°3:
D'un échantillon de 160 étudiantes, on a mesuré la masse de chacune. Les données ont
été groupées en 8 classes :
Masse en Amplitude Centre des Nombre des Fréquence produit :
kg ai classes ci exploitants ni fi f i × ci
Moins 45 10 40 5 0,031 1,240
[45 , 55[ 10 50 14 0,088 4,400
[55 , 60[ 5 57,5 37 0,231 13,283
[60 , 65[ 5 62,5 50 0,313 19,563
[65 , 70[ 5 67,5 26 0,163 11,003
[70 , 75[ 5 72,5 13 0,081 5,873
[75 , 80[ 5 77,5 9 0,056 4,340
80 et plus 5 82,5 6 0,037 3,053
Totaux 160 1 62.755

On a deux classes d’amplitudes infinies : la première (moins 45 kg) et la dernière classe


(80 et plus) ; dans ce cas, on va supposer que ces classes vont avoir la même amplitude que la
classe immédiatement suivante pour la première (10) ou précédente pour la dernière (5):

• moins 45 deviendrait [35 , 45[ → ci = 40


• 80 et plus deviendrait [80 , 85 [ → ci = 82,5
= ∑*"+, !" × ." = 62.755

3- LA MEDIANE

3.1- Définition
Soit une série statistique ordonnée dont les n valeurs sont x1 <x2<x3< ….xn.
La médiane est un nombre M qui permet de diviser cette série en deux sous-groupes
de même effectif.
• Si n est impair, M est la valeur de cette série qui est située au milieu, à savoir la valeur
dont le rang est (n+1)/2, notée x(n+1)/2 .

5
CHAPITRE 2 : LES CARACTÉRISTIQUES DE POSITION ET DE DISPERSION D’UNE SÉRIE STATISTIQUE

• Si n est pair, M est le centre l’intervalle médian, qui est l’intervalle formé par les deux
nombres situés « au milieu » de la série, à savoir xn/2et x(n/2)+1.
Exemple n°4 :
Soit A la série de données relatives au notes obtenues des 11 étudiants dans un devoir
de contrôle : (3 ; 5 ; 5 ; 11 ; 5 ; 8 ; 2 ; 14 ; 17 ; 12 ; 10). Déterminer la médiane de cette série
Correction:
Il est nécessaire d’ordonner la série par ordre croisant
A : ( 2 – 3 – 5 – 5 – 5 – 8 – 10 – 11 – 12 – 14 – 17 )
Comme le nombre d’observations est impaire n =11 → la médiane correspond à la valeur
dont le rang est (n+1)/2 c'est-à-dire dans notre cas = (11 +1)/2 = 6ème observation
M=8
Exemple n°5 :
Soit B la série de données relatives au notes obtenues des 12 étudiants dans un devoir de
contrôle : (3 ; 5 ; 5 ; 11 ; 5 ; 8 ; 2 ; 14 ; 17 ; 9 ; 12 ; 10). Déterminer la médiane de cette série
Correction:
Il est nécessaire d’ordonner la série par ordre croisant
B : ( 2 – 3 – 5 – 5 – 5 – 8 – 9 – 10 – 11 – 12 – 14 – 17 )
Comme le nombre d’observations est impaire n = 12 → la médiane est le centre de
l’intervalle médian formé par l’observation d’ordre n/2 = 12/2 = 6ème observation = 8 et l’observation
d’ordre (n/2)+ 1 = 12/2 + 1 = 7ème observation = 9
D’où M = (8 + 9) / 2 = 8.5
Exemple n°6 :
Soit C la série de données relatives au notes obtenues des 12 étudiants dans un devoir
de contrôle : (3 ; 5 ; 5 ; 11 ; 5 ; 8 ; 2 ; 14 ; 17 ; 8 ; 12 ; 10). Déterminer la médiane de cette
série
Correction:
Il est nécessaire d’ordonner la série par ordre croisant
B : ( 2 – 3 – 5 – 5 – 5 – 8 – 8 – 10 – 11 – 12 – 14 – 17 )
Comme le nombre d’observations est impaire n = 12 → la médiane est le centre de
l’intervalle médian formé par l’observation d’ordre n/2 = 12/2 = 6ème observation = 8 et l’observation
d’ordre (n/2)+ 1 = 12/2 + 1 = 7ème observation = 8
D’où M = (8 + 8) / 2 = 8

6
CHAPITRE 2 : LES CARACTÉRISTIQUES DE POSITION ET DE DISPERSION D’UNE SÉRIE STATISTIQUE

3.2- Détermination de la médiane dans le cas où les données sont regroupées


3.2.1- Cas des variables discrètes
Pour déterminer la médiane, il est nécessaire de calculer au niveau du tableau
statistique les effectifs ou les fréquences cumulées croissantes :
• Lorsque n est impair, la médiane correspond à la 1èrevaleur xi ayant l’effectif cumulé
≥ ( n+1)/2 ou la fréquence cumulée ≥ 0.5
• Lorsque n est pair, les bornes de l’intervalle médian sont déterminés de la manière
suivante : la borne inférieure est la 1ère valeur xi ayant l’effectif cumulé ≥ ( n / 2) ou
la fréquence cumulée ≥ 0.5 ; la borne supérieure étant la 1ère valeur xi ayant
l’effectif cumulé ≥ ( n / 2) +1 ou la fréquence cumulée > 0.5

Exemple n°7 :
Soit le tableau statistique suivant :

Notes obtenues lors Nombre des Effectif cumulé Fréquence ; Fréquence cumulée
d’un examen oral : xi élèves : ni Croissant : E(x) fi Croissante : F(x)

0 1 1 0,023 0,023
1 4 5 0,093 0,116
2 5 10 0,116 0,233
3 2 12 0,047 0,279
4 5 17 0,116 0,395
5 8 25 0,186 0,581
6 7 32 0,163 0,744
7 5 37 0,116 0,860
8 3 40 0,070 0,930
9 2 42 0,047 0,977
10 1 43 0,023 1,000
Totaux 43 1,000

Vu que n = 43, la médiane correspond à la 1ère valeur xi ayant l’effectif cumulé ≥


(n+1) / 2 = (43 +1) / 2 = 22 → M = 5 ; en effet la 1ère valeur xi ayant l’effectif cumulé
croissant E(x) ≥ 22 est 5 car son E(x) = 25

7
CHAPITRE 2 : LES CARACTÉRISTIQUES DE POSITION ET DE DISPERSION D’UNE SÉRIE STATISTIQUE

Exemple n°8 :
Soit le tableau statistique suivant :
Nombre d’unités Nombre de Effectif Cumulé Fréquence : Fréquence cumulée
défectueuses : xi lots : ni croissant : E(x) fi Croissante :F(x)
0 15 15 0,300 0,300
1 14 29 0,280 0,580
2 12 41 0,240 0,820
3 5 46 0,100 0,920
4 3 49 0,060 0,980
5 1 50 0,020 1,000
Totaux 50 1,000

Vu que n = 50, il est nécessaire de déterminer les bornes de l’intervalle médian


• La borne inférieure est 1 car son E(x) = 29 > n/2 = 25
• La borne supérieure est 1 car son E(x) = 29 > (n/2) +1 = 26
→ La médiane M est le centre de l’intervalle médian = (1 + 1) /2 = 1

Exemple n°9 :
Soit le tableau statistique suivant :
Nombre d’unités Nombre de Effectif Cumulé Fréquence : Fréquence cumulée
défectueuses : xi lots : ni croissant : E(x) fi Croissante :F(x)
0 15 15 0,300 0,300
1 10 25 0,200 0,500
2 9 34 0,180 0,680
3 7 41 0,140 0,820
4 5 46 0,100 0,920
5 4 50 0,080 1,000
Totaux 50 1,000

Vu que n = 50, il est nécessaire de déterminer les bornes de l’intervalle médian


• La borne inférieure est 1 car son E(x) = 25 ≥ n/2 = 25
• La borne supérieure est 2 car son E(x) = 34 ≥ (n/2) +1 = 26
→ La médiane M est le centre de l’intervalle médian = (1 + 2) /2 = 1,5

8
CHAPITRE 2 : LES CARACTÉRISTIQUES DE POSITION ET DE DISPERSION D’UNE SÉRIE STATISTIQUE

3.2.2- Cas des variables continues


Pour déterminer la médiane, il est nécessaire de calculer au niveau du tableau statistique
les effectifs ou les fréquences cumulées croissantes ; par la suite, on détermine la classe
médiane qui correspond à la 1èreclasse ayant la fréquence cumulée croissante F(x) ou FCC
≥ 0.5

Une fois déterminée la classe médiane, il est possible d’approximer la valeur médiane
par interpolation linéaire en utilisant la formule suivante :

( . 6 − 788 )
= +
(9 ) (2.5)

xi : la borne inférieure de la classe médiane.


ai : l’amplitude de la classe modale.
fi : la fréquence de la classe modale.
FCCi-1 : la fréquence cumulée croissante de la classe précédente de la classe médiane.

Exemple n°10 :
Soit le tableau statistique relatif à la répartition salariale de 200 employés d’une société
de textile, donnez une approximation de la médiane

Nombre Effectif Cumulé Fréquence Fréquence Cumulée


Classe salariale
d’employés Croissant : E(x) fi Croissante
[0500 , 1000[ 80 80 0,400 0,400
[1000 , 1200[ 60 140 0,300 0,700
[1200 , 1500[ 30 170 0,150 0,850
[1500 , 2000[ 20 190 0,100 0,950
[2000 , 3000[ 10 200 0,050 1,000
Totaux 200 1,000

La classe médiane est [1000 , 1200[

La Médiane M = )" + /" = 1000 + 200 ×


( .0 122$34 ) 0.5 − 0.4
(5$ )
=1 066.667
0 .3

9
CHAPITRE 2 : LES CARACTÉRISTIQUES DE POSITION ET DE DISPERSION D’UNE SÉRIE STATISTIQUE

Section II : les caractéristiques de dispersion

Les paramètres de dispersion caractérisent l'étalement des valeurs autour d'un


paramètre de position

1- ETENDUE
L'étendue d'une distribution est égale à la différence entre la plus grande et la plus petite
valeur de la distribution

Exemple n°11 :
Soit A la série de données relatives au notes obtenues des 11 étudiants dans un devoir
de contrôle : (3 ; 5 ; 5 ; 11 ; 5 ; 8 ; 2 ; 14 ; 17 ; 12 ; 10). Déterminer l’étendue de cette série

Correction:
Il est nécessaire d’ordonner la série par ordre croisant
A : ( 2 – 3 – 5 – 5 – 5 – 8 – 10 – 11 – 12 – 14 – 17 )
L’étendue de cette série E = xi max – xi min = 17 – 2 = 15

Exemple n°12 :
Soit le tableau statistique suivant :
Nombre d’unités Nombre de Effectif Cumulé Fréquence : Fréquence cumulée
défectueuses : xi lots : ni croissant : E(x) fi Croissante :F(x)
0 15 15 0,300 0,300
1 10 25 0,200 0,500
2 9 34 0,180 0,680
3 7 41 0,140 0,820
4 5 46 0,100 0,920
5 4 50 0,080 1,000
Totaux 50 1,000

L’étendue de cette série = xi max – xi min = 5 – 0 = 5

10
CHAPITRE 2 : LES CARACTÉRISTIQUES DE POSITION ET DE DISPERSION D’UNE SÉRIE STATISTIQUE

Exemple n°13:
Soit le tableau statistique relatif à la répartition salariale de 200 employés d’une société
de textile
Nombre Effectif Cumulé Fréquence Fréquence Cumulée
Classe salariale
d’employés Croissant : E(x) fi Croissante
[0500 , 1000[ 80 80 0,400 0,400
[1000 , 1200[ 60 140 0,300 0,700
[1200 , 1500[ 30 170 0,150 0,850
[1500 , 2000[ 20 190 0,100 0,950
[2000 , 3000[ 10 200 0,050 1,000
Totaux 200 1,000

L’étendue de cette série = xi max – xi min = 3 000 – 500 = 2 500

2- ECART ABSOLU MOYEN (EAM)


L’écart absolu moyen est la moyenne de la valeur absolue des écarts à la moyenne.
Autrement dit, c'est la distance moyenne à la moyenne. Plus les écarts absolus sont grands,
plus la série est dispersée
1
EAM = × ∑ ni × x i − X = ∑ f i × x i − X
n
Exemple n°14 :
Soit le tableau statistique suivant :
Produit des xi − X Produit des
Nombre d’unités Nombre de Fréquence
xi × fi fi × xi − X
défectueuses : xi lots ni fi
0 15 0,300 0,000 1,780 0,534
1 10 0,200 0,200 0,780 0,156
2 9 0,180 0,360 0,220 0,040
3 7 0,140 0,420 1,220 0,170
4 5 0,100 0,400 2,220 0,222
5 4 0,080 0,400 3,220 0,258
Totaux 50 1,000 X = 1,780 1,380

1
EAM = × ∑ ni × xi − X = ∑ f i × xi − X =1.380
n

11
CHAPITRE 2 : LES CARACTÉRISTIQUES DE POSITION ET DE DISPERSION D’UNE SÉRIE STATISTIQUE

Remarque :
Si la variable étudiée est une variable continue, il suffit de remplacer xi par le centre ci
de la classe [xi, xi+1[dans les formules précédentes.

Exemple 15:
La propriété des superficies cultivées, exprimées en hectares, est la suivante :
Superficie Centre des Nombre des Fréquence : produit : ci − X Produit des
en classes : exploitants fi fi × ci fi × ci − X
hectares : xi ci ni
[05 , 10 [ 7,5 4 0,043 0,323 13,647 0,587
[10 , 15[ 12,5 10 0,109 1,363 8,647 0,943
[15 , 20[ 17,5 24 0,261 4,568 3,647 0,952
[20 , 25[ 22,5 32 0,348 7,830 1,353 0,470
[25 , 30[ 27,5 13 0,140 3,878 6,353 0,889
[30 , 35[ 32,5 9 0,099 3,185 11,353 1,124
Totaux 92 1 X = 21.147 4,965

1
EAM = × ∑ ni × ci − X = ∑ f i × ci − X = 4,965
n

3- LA VARIANCE ET L’ECART TYPE

3.2.3- Définition

La variance d’une variable statistique (X), notée par V(X), est la moyenne du carré des
écarts à la moyenne. C’est un paramètre positif défini par:

1
*

<(:) = ' (" ()" − :;)=


&
"+,

Avec ;
N: la taille de la population étudiée.
ni: l’effectif de la modalité i.

:;: la moyenne arithmétique de la variable X.


xi: la valeur prise par la modalité i.

Si on utilise des fréquences, la formule de la variance (3.3) s’écrit comme suit:


12
CHAPITRE 2 : LES CARACTÉRISTIQUES DE POSITION ET DE DISPERSION D’UNE SÉRIE STATISTIQUE

<(:) = ' !" ()" − :;)=


"+,
Remarques
La formule précédente peut s’écrire après développement comme suit:

<(:) = ' !" )"= − :; =


"+,

L’écart-type d’une distribution statistique X, noté σx, est la racine carrée de la variance,
qui est défini par:

?@ = B' !" ()" − :;)=


"+,

⇒ Plus l’écart-type (ou variance) est grand(e) et plus la série observée est dispersée.

Exemple n°16:
Soit le tableau statistique suivant :

Nombre d’unités Nombre de Fréquence : Produit des Valeur de : x 2 Produit des


défectueuses : xi lots : ni fi xi × fi i
fi × x i
2

0 15 0,300 0,000 0 0,000


1 10 0,200 0,200 1 0,200
2 9 0,180 0,360 4 0,720
3 7 0,140 0,420 9 1,260
4 5 0,100 0,400 16 1,600
5 4 0,080 0,400 25 2,000
Totaux 50 1,000 X = 1,780 5,780

La variance de la série <(:) = ∑*"+, !" )"= − :; = = 5.78 − 1.780= = 2.612

L’écart type de la série?@ = A∑*"+, !" ()" − :;)= = 2.612 = 1.616

13
CHAPITRE 2 : LES CARACTÉRISTIQUES DE POSITION ET DE DISPERSION D’UNE SÉRIE STATISTIQUE

Exemple n°17 :
Le service de maintenance d’une compagnie aérienne a relevé le nombre d’interventions
de ses équipes par jours durant le mois précédant et les résultats se présentent dans tableau
suivant:

Nombre d’intervention: xi Nombre de jours ni Fréquence :fi


[00 ; 05[ 5 0,167
[05 ; 10[ 10 0,333
[10 ; 15[ 8 0,267
[15 ; 20[ 4 0,133
[20 ; 25[ 2 0,067
[25 ; 30[ 1 0,033
Totaux 30 1,000

1- Calculer la moyenne arithmétique


2- Déterminer la variance et en déduire l’écart-type

Solution
Le tableau des calculs préliminaires est le suivant:

Nombre de Nombre de Fréquence : Centre : Produit Valeur Valeur


lots: xi jours : ni fi ci f i × ci ci2 fi × ci2
[00 ; 05[ 5 0,167 2,5 0,417 6,25 1,042
[05 ; 10[ 10 0,333 7,5 2,500 56,25 18,750
[10 ; 15[ 8 0,267 12,5 3,333 156,25 41,667
[15 ; 20[ 4 0,133 17,5 2,333 306,25 40,833
[20 ; 25[ 2 0,067 22,5 1,500 506,25 33,750
[25 ; 30[ 1 0,033 27,5 0,917 756,25 25,208
Totaux 30 1 ---- 11,000 ---- 161,250

*
1- L’intervention moyenne journalière est:

:; = ' !" ." = CDEFD C G H I/J KLMJ


"+,
2- La variance des interventions par jour est
*

<(:) = ' !" )"= − :; = = 161,25 − (11)= = , 6 CDEFD C G H


"+,

L’écart-type des interventions par jour est

?@ = A∑*"+, !" ()" − :;)= = 40.25 = 6.344 CDEFD C G H

14

Vous aimerez peut-être aussi