Statistiques Univariees
Statistiques Univariees
Statistiques Univariees
SEMESTRE 3
===============================================
===============================================
Email: tchandesso@gmail.com
HARMATTAN 2021-2022
Table des matières
Références bibliographiques 0
1.1 Vocabulaire . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
1.5.1 Classe . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
1.6.1 Mode . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9
1.6.2 Moyenne . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10
1.6.3 Percentile . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
1
1.6.4 Quartile . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
1.6.5 Médiane . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12
1.7.1 Etendue . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13
2
Chapter 1
variable
1.1 Vocabulaire
hommes, femmes,...
une femme,...
Variable: caractère ou propriété mesurée sur chaque individu notée X, Y ,... Ex-
Série statistique: suite des valeurs prises par une variable X notées x1 , x2 , x3 , ....
3
Variable quantitative continue: l’ensemble des modalités est un intervalle fini ou
Variable qualitative nominale: les modalités ne peuvent pas être ordonnées. Exem-
Variable qualitative ordinale: les modalités peuvent être ordonnées. Exemple: taille
statistique suivante : M D M C C M C C C M C M V M V D C C M C.
xi ni fi pi (%) Ni Fi
C 9 0.45 45 9 0.45
M 7 0.35 35 16 0.75
V 2 0.1 10 18 0.85
D 2 0.1 10 20 1
Il permet de visualiser la part relative des modalités d’une variable qualitative sur
4
seront représentées par des secteurs dont les surfaces sont proportionnelles aux effectifs
(ou fréquences ou pourcentages). Une telle représentation n’est possible que si la somme
modalité: θi = fi × 360.
Il est constitué d’une suite de rectangles dont les hauteurs sont proportionnelles à
l’effectif (ou à la fréquence ou au pourcentage) des modalités et dont les bases sont iden-
et U : Universitaire: Sd Sd Sd Sd P P P P P P P P P P P Se Se Su Se Se Se Se Se Se Se
Se Se Se Se Se Su Su Su Su Su Su Su U U U U U U U U U U U U Su.
xi ni Ni fi pi (%) Fi
Sd 4 4 0.08 8 0.08
P 11 15 0.22 22 0.30
Se 14 29 0.28 28 0.58
Su 9 38 0.18 18 0.76
U 12 50 0.24 24 1
5
1.3.2 Représentations graphiques
Diagramme en barre
2 2 2 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 4 4 4 4 4 4 4 4 4 4 5 5 5 5 5 5 6 6 6 8 8.
xi ni Ni fi Fi
1 5 5 0.10 0.10
2 9 14 0.18 0.28
3 15 29 0.30 0.58
4 10 39 0.20 0.78
5 6 45 0.12 0.90
6 3 48 0.06 0.96
8 2 50 0.04 1
Diagramme en bâton
6
valeur.
Très souvent, la prise en compte de toutes les valeurs observées ne permet pas de
donner une interprétation simple des résultats et conduit à des calculs inutiles. Ainsi, il
est nécessaire que les valeurs des variables continues soient regroupées en classes avant
tout traitement.
1.5.1 Classe
Elles ne doivent pas être trop nombreuses sinon il y aurait une difficulté de compréhension.
Elles ne doivent pas être trop peu nombreuses car il y aurait perte d’information.
population étudiée.
1 + 3.322 × log10 n.
b) Amplitude de classe
classe ne soient pas données. Pour estimer les bornes absentes, nous disposons des possi-
bilités suivantes:
7
Réfléchir à ce que pourrait être la valeur de cette borne.
Les classes peuvent avoir une amplitude variable ou constante. Par exemple, la variable
“âge” est souvent subdivisée en classes d’amplitude de 5 ans, 0 à moins de 5 ans, 5 ans à
moins de 10 ans, etc. 0, 5, 10, etc. sont les extrémités des classes.
c) Centre de classe
Pour effectuer des calculs statistiques sur des séries classées, les classes sont réduites à
une seule donnée, à savoir, le centre de classe. Cela revient à considérer que tous les
individus peuvent être décrits par ce centre de classe. Par définition, le centre ci de la
xi + xi+1
classe [xi ; xi+1 [ est donné par ci = .
2
[x1 ; x2 [ c1 n1 N1 n f1 p1 F1 1
.. .. .. .. .. .. .. .. ..
. . . . . . . . .
i
P m
P ni ni i
P m
P
[xi ; xi+1 [ ci ni nk nk × 100 fk fk
k=1 k=i n n k=1 k=i
.. .. .. .. .. .. .. .. ..
. . . . . . . . .
[xm ; xm+1 [ cm nm n nm fm pm 1 fm
Total n 1 100
Classe [20, 40[ [40, 60[ [60, 80[ [80, 100[ [100, 140[ [140, 200[
8
1.5.3 Représentations graphiques
a. Histogramme
Il est destiné aux séries regroupées en classes. L’histogramme est une représentation
graphique de la distribution des effectifs ou des fréquences d’une variable statistique con-
fréquence (ou l’effectif) par unité d’amplitude. Soit la distribution ([xi ; xi+1 [, ni ) d’une
variable statistique continue X. Pour chaque classe [xi ; xi+1 [, l’histogramme associe un
fi
rectangle de largeur ai = xi+1 − xi (amplitude da la classe) et de hauteur hi = .
ai
Remarque: La représentation graphique de la distribution des effectifs (respective-
ment, des fréquences) d’une variable statistique continue s’appelle l’histogramme des
Il lisse l’histogramme de façon à éliminer les ruptures qui dépendent du choix du découpage
en classe. Il respecte la compensation des aires; la surface incluse par la courbe est
par F (x) = Fi . En abscisse se trouvent les bornes supérieures des classes et en ordonnée,
1.6.1 Mode
Le mode est la valeur xi correspondant à l’effectif (ou fréquence) le plus élevé. Pour
9
Remarque: Le mode peut être calculé pour tous les types de variable, quantitative et
Pour une variable continue on définit la classe modale. C’est celle dont la fréquence
par unité d’amplitude hi = fi /ai est la plus élevée. Après la définition de la classe modale,
|∆i |
M o = xi + × ai
|∆i | + |∆i+1 |
classe précédant la classe modale, ∆i+1 = ni+1 − ni , différence entre l’effectif de la classe
Série 2: 8; 8; 8; 7; 4; 4; 4; 4; 4; 5; 5; 5; 5; 6.
Série 3: 8; 8; 8; 7; 4; 4; 4; 4; 4; 5; 5; 5; 5; 6; 5.
1.6.2 Moyenne
La moyenne x̄ ne peut être définie que sur une variable quantitative. x̄ = n1 ni=1 xi
P
s’il s’agit des données individuelles ou x̄ = n1 ni=1 ni xi s’il s’agit des données groupées.
P
Remarque: La moyenne peut être calculée pour une variable qualitative recodée en 0
et 1.
La moyenne arithmétique est sensible aux valeurs extrêmes (valeurs aberrantes) d’une
série statistique.
Etudiant 1: 10, 11, 11, 10, 12. Etudiant 2: 4.5, 20, 4.5, 20, 5. Quelle est la moyenne
Exemple: Considérons la série suivante: 10, 10, 10, 10, 150. Quelle est la moyenne
10
arithmétique de cette série. Que constatez-vous?
1.6.3 Percentile
Le p-ième percentile est la valeur telle qu’au moins p pour cent des observations ont une
valeur inférieure ou égale à cette valeur, et (100 − p) pour cent des observations ont une
correspond à l’entier E(i) + 1, où E(i) désigne la partie entière de i; si i est un nombre
Pour déterminer le p-ième percentile P e dans le cas d’une variable continue, on détermine
p̃ − Fi−1 p̃ − Fi−1
P e = x i + ai × = x i + ai × .
Fi − Fi−1 fi
1.6.4 Quartile
Les quartiles sont des percentiles particuliers. Les étapes de calcul des percentiles peuvent
Série 1: 8; 5; 9; 13; 25
11
Série 2: 13; 1; 9; 10; 2; 4; 12; 7
1.6.5 Médiane
en deux effectifs égaux les individus de la population rangés selon la valeur croissante du
Remarque: La médiane est peu sensible aux valeurs extrêmes et résume bien les dis-
tribution fortement dissymétriques mais elle est influencée par le nombre d’observations.
Exercice: Lors d’un examen de Statistique, 30 étudiants ont obtenu les notes suivantes:
Exemple: Considérons la série suivante: 10, 10, 10, 10, 150. Quelle est la médiane
Série xi 1 2 3 4 5
Série 1 ni 2 4 5 4 2
Série 2 ni 10 8 6 4 2
Série 3 ni 2 4 6 8 10
12
1.7 Paramètres de dispersion
Elles quantifient les fluctuations des valeurs autour de la valeur centrale, permettant
ainsi d’apprécier l’étalement des valeurs de la série (les unes par rapport aux autres ou à
la valeur centrale).
1.7.1 Etendue
m m m
1X X X
V (X) = ni (xi − x̄)2 = fi (xi − x̄)2 = fi x2i − x̄2 .
n i=1 i=1 i=1
p
σX = V (X).
Coefficient de variation
σX
CV (X) = .
x̄
observations. Il donne une bonne idée du degré d’homogénéité d’une série. Il faut qu’il
13