Stats Chap1
Stats Chap1
Stats Chap1
Septembre 2013
I
II TABLE DES MATIÈRES
Chapitre 1
1.1 Introduction
À l’origine (sans doute en Chine, plus de 2000 ans avant Jésus-Christ et en Égypte, vers 1700 avant J.-C.),
la statistique fournissait des renseignements intéressant l’État concernant la population (le nombre d’ha-
bitants d’un pays et leur répartition par sexe, par âge, par catégorie socio-professionnelle,...) et l’économie
(l’évaluation des ressources de l’État, des stocks,...). Il faut préciser que le mot statistique, traduction du
mot allemand “statistik” apparu au milieu du XV III e siècle, provient du mot latin “status” qui signifie
état.
Le premier bureau de statistique a été créé en France en 1800 par Napoléon. Cet organisme a pris en 1946
le nom d’Institut National de la Statistique et des Études Économiques (INSEE).
Définition 1.2.2 Un échantillon (ou lot) est une partie (ou sous-ensemble) de la population considérée.
On étudie un échantillon de la population notamment lorsque celle-ci est impossible à étudier dans son
ensemble ; c’est le cas pour les sondages d’opinion ou pour des mesures rendant inutilisables les objets
étudiés, par exemple la durée de vie de piles électriques d’un certain type.
Définition 1.2.3 Le caractère étudié est la propriété observée dans la population ou l’échantillon considéré.
On peut citer par exemple la région de résidence de chaque français observé lors d’un recensement, ou le
nombre d’enfants par famille observé à cette même occasion, ou encore la taille des élèves d’un lycée.
Dans ces deux derniers exemples, le caractère est dit quantitatif car il est mesurable : nombre d’enfants,
1
2 CHAPITRE 1. SÉRIES STATISTIQUES À UNE VARIABLE
taille. Ça n’est pas le cas du premier exemple où le caractère est dit qualitatif : région.
Dans le deuxième exemple, le caractère quantitatif est discret car il ne peut prendre que des valeurs
isolées (ici entières) alors que dans le troisième, le caractère quantitatif est continu car il peut prendre, au
moins théoriquement, n’importe quelle valeur d’un intervalle de nombres réels.
5,7,2,6,3,4,8,5,4,3,9,6,5,7,6,8,3,4,4,0,8,6,7,1,5,5,4,6,6,10,9,8,1,5,5,6,7,8,5,5
i 1 2 3 4 5 6 7 8 9 10 11
xi 0 1 2 3 4 5 6 7 8 9 10
ni 1 2 1 3 5 9 7 4 5 2 1
Définition 1.2.4 Une classe (ou modalité) est un sous-ensemble de la population correspondant à une
même valeur ou à des valeurs voisines prises par le caractère.
Ces classes peuvent donc être des valeurs ponctuelles (nombre d’enfants par famille, “2 enfants” est une
classe) ou des intervalles (salaires en euros des employés d’une entreprise, [700; 800] est une classe).
Ainsi, une série statistique à une variable peut être définie par un tableau de la forme :
i 1 2 ... ... p
Valeurs prises par le caractère
x1 x2 ... ... xp
(ou classes) xi
Effectifs correspondants ni n1 n2 ... ... np
n = n1 + n2 + . . . + np avec ni ≤ n, ∀ 1 ≤ i ≤ p.
∑
p
n= ni
i=1
∑
p ∑
p
n
On sait que ni = n donc fi = = 1.
n
i=1 i=1
Propriété 1.2.1 Les fréquences de classes d’une série statistique vérifient les propriétés suivantes :
∑
p
fi = 1
i=1
0 ≤ fi ≤ 1, ∀ 1 ≤ i ≤ p.
On considère l’exemple 1.2.1 : calculer les fréquences de chacune des modalités de la série statistique.
i 1 2 3 4 5 6 7 8 9 10 11 Total
xi 0 1 2 3 4 5 6 7 8 9 10 –
ni 1 2 1 3 5 9 7 4 5 2 1 40
fi 0,025 0,05 0,025 0,075 0,125 0,225 0,175 0,1 0,125 0,05 0,025 1
La propriété étudiée dans la population des étudiants est la ville d’origine. C’est un caractère qualitatif qui
prend trois valeurs ou modalités permettant ainsi de définir trois classes avec leur fréquence :
4 CHAPITRE 1. SÉRIES STATISTIQUES À UNE VARIABLE
– Diagramme en bandes
Exemple 1.2.3 Le responsable des ventes d’un magasin a noté le niveau de la demande journalière pour
un produit pendant cent jours ouvrables consécutifs en 2008 :
– Dans un repère orthogonal, on porte en abscisse les valeurs définissant les classes et en ordonnée les
effectifs. Pour rendre le diagramme plus lisible, on trace les segments de droite correspondant aux
ordonnées des points ainsi définis, et on obtient ce qu’on appelle un diagramme des effectifs en
bâtons.
On obtient le diagramme en bâtons des fréquences par simple changement d’échelle sur l’axe des
ordonnées. Par exemple, l’effectif “5” devient la fréquence “0,05”.
– Intéressons-nous maintenant au diagramme des effectifs cumulés croissants, en escalier : dans
un repère orthogonal, on porte en abscisse les valeurs définissant les classes et en ordonnée les effectifs
6 CHAPITRE 1. SÉRIES STATISTIQUES À UNE VARIABLE
cumulés croissants.
Exemple 1.2.4 On relève dans une banque à une date donnée les montants des économies de 1000 clients
en euros. Les résultats obtenus sont les suivants :
Toutes les autres classes ayant la même amplitude 500, on convient d’assimiler la classe “6000 et plus” à
[6000; 6500[.
Le graphique utilisé pour représenter ce type de données est appelé histogramme des effectifs. Les effectifs
des classes sont proportionnels aux aires des rectangles représentant les classes.
1.2. MÉTHODES DE REPRÉSENTATION 7
Imaginons maintenant qu’on modifie le tableau précédent afin d’obtenir des classes d’amplitudes différentes :
Il faut noter comme c’était le cas précédemment que l’histogramme des fréquences est obtenu par simple
changement d’échelle sur l’axe des ordonnées.
Reprenons l’exemple initial et tâchons de représenter graphiquement les effectifs cumulés croissants. Ceci
est réalisé à l’aide de ce qu’on nomme une courbe polygonale.
On remarquera que ce diagramme n’est pas à proprement parler une courbe mais bien une succession de
segments d’où la dénomination “courbe polygonale”.
Enfin, il est à noter que le diagramme des fréquences cumulées croissantes est obtenu à l’aide du diagramme
précédent par simple changement d’échelle sur l’axe des ordonnées.
On souhaite maintenant synthétiser davantage l’information pour les caractères quantitatifs en mettant
en évidence des nombres permettant de décrire au mieux la population observée.
Ces trois points de vue présentent de l’intérêt et conduisent à définir des caractéristiques de position
utilisées en statistique.
Remarque 1.3.1
1.3. CARACTÉRISTIQUES DE POSITION 9
• Considérons l’exemple 1.2.3. Le mode de la série statistique est égal à 2. En effet, c’est la valeur de la
série qui admet l’effectif le plus élevé c’est-à-dire 23. La série est unimodale.
• Considérons l’exemple 1.2.4. Les éléments de la série statistique sont répartis à l’aide de classes.
[3000; 3500[ est la classe modale puisque c’est elle qui admet l’effectif le plus élevé à savoir 185, le
mode étant égal à 3250. La série est unimodale.
1.3.2 La moyenne
Pour Pythagore (V e siècle avant J.-C.), “les nombres sont les éléments de toutes choses, tout est nombre,
l’harmonie est divine, elle consiste en rapports numériques”. On doit à cette école pythagoricienne plusieurs
sortes de moyennes (moyenne arithmétique, moyenne géométrique, moyenne harmonique). Cette dernière
fut d’ailleurs inventée par Hippase (un des premiers pythagoriciens) qui travaillait sur les différents types
de liens que trois nombres peuvent entretenir entre-eux et qu’on nommait alors “médiétés”.
1∑
n
y1 + y2 + . . . + yn
y= = yi .
n n
i=1
Les séries statistiques (à une variable quantitative) peuvent se présenter directement ou indirectement sous
l’une des trois formes suivantes :
– 1er cas : on dispose de la liste des n éléments x1 , x2 , . . . , xn . La moyenne est alors obtenue à l’aide de
la formule
1∑
n
x1 + x2 + . . . + xn
x= = xi
n n
i=1
Reprenons l’exemple 1.2.1 : la série consiste en une suite de 40 éléments, sa moyenne arithmétique
vaut
5 + 7 + 2 + 6 + 3 + ... + 6 + 7 + 8 + 5 + 5 216
x= = = 5, 4
40 40
– 2e cas : on dispose du tableau des effectifs ni des p classes xi .
1∑
p
n1 x1 + n2 x2 + . . . + np xp
x= = ni xi
n n
i=1
Considérons une fois encore l’exemple 1.2.1 une fois que la synthèse est réalisée, la moyenne arithmétique
vaut alors
1 × 0 + 2 × 1 + 1 × 2 + . . . + 5 × 8 + 2 × 9 + 1 × 10 216
x= = = 5, 4
40 40
ai + b i
– 3e cas : on dispose du tableau des effectifs ni des p classes [ai ; bi [ de centre ci = .
2
1∑
p
n1 c1 + n2 c2 + . . . + np cp
x= = ni ci
n n
i=1
On considère l’exemple 1.2.4 : on travaille dans ce cas avec un caractère quantitatif continu, on va
donc considérer pour chacune des classes son centre. La moyenne arithmétique vaut alors :
5 × 250 + 12 × 750 + . . . + 11 × 5750 + 5 × 6250 3243000
x= = = 3243
1000 1000
10 CHAPITRE 1. SÉRIES STATISTIQUES À UNE VARIABLE
Remarque 1.3.2
– Dans le deuxième cas, la population est donnée avec autant de précision que dans le premier. Au
contraire, dans le troisième cas, nous ne connaissons pas la valeur exacte de chaque élément à l’intérieur
de sa classe [ai , bi ].
– La formule donnée pour x dans le troisième cas est valable lorsque, dans chaque classe [ai , bi [, tous les
éléments sont concentrés au milieu ci de la classe mais cette hypothèse est rarement satisfaite.
En revanche, on peut admettre plus fréquemment que, dans chaque classe [ai , bi [, les ni éléments sont
uniformément répartis et dans ce cas, la formule est correcte.
1.3.3 La médiane
En économie, la moyenne arithmétique n’est pas toujours la caractéristique de position la plus pertinente ;
il en est de même des autres moyennes. C’est pour cette raison qu’on définit la médiane.
Définition 1.3.3 Dans une série statistique rangée en ordre de grandeur croissant (ou décroissant), la
médiane est la valeur qui occupe la position centrale.
Cette valeur coupe donc en deux sous-ensembles égaux l’ensemble de départ. Le calcul de cette valeur va
bien évidemment dépendre de la nature de la série et plus précisément de celle de la variable.
• 1er cas : la série comporte un nombre impair de valeurs, soit 2k +1 valeurs, la médiane sera la (k +1)-ième
valeur.
5,7,8,3,4,3,4,9,4,5,10,9,7
On vérifie que la série comporte 13 = 2 × 6 + 1 valeurs. Si la série est ordonnée, on peut affirmer que la
médiane est la 7-ième valeur. Rangeons cette série en ordre de grandeur croissant :
3,3,4,4,4,5,⃝,7,7,8,9,9,10
5
• 2e cas : la série comporte un nombre pair de valeurs, soit 2k valeurs, la médiane sera la 1/2 somme des
k-ième et (k + 1)-ième valeurs.
5,5,5,7,6,5,6,4,3,7
On vérifie que la série comporte 10 = 2 × 5 valeurs. Si la série est ordonnée, on peut affirmer que la médiane
est la 1/2 somme des 5-ième et 6-ième valeurs. Rangeons cette série en ordre de grandeur croissant :
3,4,5,5,⃝,
5 ⃝,6,6,7,7
5
5+5
la médiane vaut donc Mé= .
2
1.3. CARACTÉRISTIQUES DE POSITION 11
Dans ce cas, la détermination de la médiane est très différente. Il faut tout d’abord repérer la classe qui
n
contient la médiane à l’aide de la moitié de l’effectif total soit [xA , xB [. Cette classe peut également être
2
repérée sur le diagramme des effectifs (ou fréquences) cumulés croissants :
2 − nA − nA
n n
nB − nA Mé − xA
= ⇔ = 2
xB − xA Mé − xA xB − xA nB − nA
Il est assez simple de retenir cette formule à l’aide des encadrements suivants :
xA Mé xB
n
nA 2 nB
12 CHAPITRE 1. SÉRIES STATISTIQUES À UNE VARIABLE
( n2 − nA )
Mé = xA + (xB − xA )
(nB − nA )
Il est possible de travailler avec les fréquences plutôt que les effectifs. Dans ce cas, les seules modifications
n
à apporter concernent les effectifs nA , nB et . Cette dernière valeur devient 0, 5 si on travaille avec des
2
proportions, i.e.,
(0, 5 − fA )
Mé = xA + (xB − xA )
(fB − fA )
(50 − pA )
Mé = xA + (xB − xA )
(pB − pA )
2 − 415)
( 1000
Mé = 3000 + (3500 − 3000) (effectifs)
(600 − 415)
(0, 5 − 0, 415)
= 3000 + (3500 − 3000) (fréquences)
(0, 6 − 0, 415)
(50 − 41, 5)
= 3500 − (3500 − 3000) (pourcentages)
(60 − 41, 5)
≃ 3229, 73 à 10−2 près.
Remarque 1.3.3
– Lorsque la population est répartie en classes [ai , bi [, la médiane peut donc être évaluée soit graphi-
quement soit par une interpolation affine (ou linéaire) à l’aide d’une courbe des effectifs cumulés
en faisant l’hypothèse supplémentaire : les éléments de la classe contenant la médiane sont
uniformément répartis.
– On doit distinguer la médiane Mé et la moyenne x d’une population. Le calcul de la moyenne fait
intervenir toutes les données ce qui n’est pas le cas pour la détermination de la médiane. De plus, la
moyenne est sensible aux variations des valeurs extrêmes de la série statistique, ce qui n’est pas le cas
de la médiane.
Remarque 1.3.4
14 CHAPITRE 1. SÉRIES STATISTIQUES À UNE VARIABLE
On s’intéresse maintenant à la détermination pratique des quartiles dans le cas d’une variable continue. La
méthode est la même que celle utilisée pour calculer la médiane :
– le premier quartile Q1 correspond à l’abscisse du point d’ordonnée 0, 25 sur la courbe des fréquences cu-
n
mulées croissantes (ou sur la courbe des effectifs cumulés croissants), sa valeur exacte est déterminée
4
à l’aide de l’interpolation linéaire,
– le troisième quartile Q3 correspond à l’abscisse du point d’ordonnée 0, 75 sur la courbe des fréquences
3n
cumulées croissantes (ou sur la courbe des effectifs cumulés croissants).
4
Considérons l’exemple 1.2.4.
On rappelle que la taille de l’échantillon est égale à 1000.
n
– Le premier quartile correspond à l’abscisse du point d’ordonnée = 250. La valeur “250” n’apparaı̂t
4
pas explicitement dans le tableau, il faut donc réussir à l’extraire :
. 240 personnes ont une économie comprise entre 0 et 2500 euros. On est donc certain que le premier
quartile n’appartient pas à cet intervalle puisqu’il ne fait pas intervenir 250 personnes mais seulement
240.
. 415 personnes ont une économie comprise entre 0 et 3000 euros. On est donc certain que Q1 appar-
tient à cet intervalle puisqu’il fait intervenir au moins 250 personnes.
On en déduit que le premier quartile Q1 appartient à l’intervalle [2500; 3000[.
3n
– Le troisième quartile correspond à l’abscisse du point d’ordonnée = 750. La valeur “750” n’apparaı̂t
4
pas explicitement dans le tableau. Il faut donc réussir à l’extraire :
. 600 personnes ont une économie comprise entre 0 et 3500 euros. On est donc certain que le troisième
quartile n’appartient pas à cet intervalle puisqu’il ne fait pas intervenir 750 personnes mais seulement
600.
. 758 personnes ont une économie comprise entre 0 et 4000 euros. On est donc certain que Q3 appar-
tient à cet intervalle puisqu’il fait intervenir au moins 750 personnes.
On en déduit que le troisième quartile Q3 appartient à l’intervalle [3500; 4000[.
On peut vérifier ces propriétés à l’aide de la courbe des effectifs cumulés croissants.
1.4. CARACTÉRISTIQUES DE DISPERSION 15
On peut vérifier que les séries de notes de A et B ont la même médiane (12), la même moyenne (11) et le
même mode (13) et pourtant, ces deux séries de notes sont différentes : les notes de B sont plus dispersées
que celles de A.
Aussi, à côté des caractéristiques de position, on est amené à introduire des caractéristiques de dispersion
pour décrire plus précisément une population.
1.4.1 L’étendue
Afin de mesurer l’étalement des termes d’une série, on peut tout d’abord calculer l’étendue.
Définition 1.4.1 L’étendue d’une série est la différence de ses valeurs extrêmes.
Considérons EX5, on montre aisément que les étendues des séries de A et de B valent respectivement
eA = 13 − 7 = 6 et eB = 19 − 4 = 15. Les notes de B sont donc plus étalées que celles de A.
Définition 1.4.2 L’écart absolu moyen d’une série statistique est la moyenne des valeurs absolues des
écarts à la moyenne arithmétique x
1∑ 1∑
n p
em = |xi − x| = ni |xi − x|
n n
i=1 i=1
16 CHAPITRE 1. SÉRIES STATISTIQUES À UNE VARIABLE
Considérons l’exemple 1.4.1, supposons que l’on veuille mesurer la dispersion des valeurs des deux séries à
l’aide de l’écart moyen (non absolu). On obtient
1
– pour A : [(7 − 11) + (8 − 11) + . . . + (13 − 11)] = 0
7
1
– pour B : [(4 − 11) + (7 − 11) + . . . + (19 − 11)] = 0
7
En fait, ce résultat est général :
1∑
n
1
[(x1 − x) + (x2 − x) + . . . + (xn − x)] = (xi − x) = 0
n n
i=1
1∑ 1 ∑ ∑ 1∑ 1∑
n n n n n
1
Preuve : (xi − x) = [ xi − x] = = xi − x = x − nx = x − x = 0
n n n n n
i=1 i=1 i=1 i=1 i=1
Comme les écarts moyens sont nuls, on comprend l’intérêt de calculer l’écart absolu moyen.
Définition 1.4.3 La variance d’une série statistique est la moyenne des carrés des écarts à la moyenne
arithmétique x
1∑ 1∑
n p
V (X) = (xi − x)2 = ni (xi − x)2
n n
i=1 i=1
Toutefois, ce calcul n’est pas très commode : la somme nécessite le calcul de p soustractions, p mises au
carré, p multiplications et enfin p − 1 additions.
La variance peut être donnée sous une autre forme plus pratique :
1∑ 2 1∑
n p
V (X) = xi − x2 = ni x2i − x2
n n
i=1 i=1
Cete fois-ci, la somme ne nécessite plus les soustractions. Démontrons ce résultat pour la version par regrou-
pements.
Preuve :
1∑ 1∑
p p
V (X) = ni (xi − x)2 = ni [x2i − 2xi x + x2 ]
n n
i=1 i=1
1∑ 2 ∑ 1 ∑ 1∑ 1∑
p p p p p
V (X) = ni x2i − x ni xi + x2 ni ⇔ V (X) = ni x2i − 2x2 + x2 = ni x2i − x2
n n n n n
i=1 i=1 i=1 i=1 i=1
Définition 1.4.4 L’écart-type d’une série statistique est la racine carrée de sa variance V (X).
v v
u n u
√ u1 ∑ u1 ∑p
σ(X) = V (X) = t (xi − x) =
2 t ni (xi − x)2
n n
i=1 i=1
Cette caractéristique de dispersion est la plus utilisée. L’expérience montre que dans une distribution uni-
modale et symétrique,
Dans une distribution relativement symétrique, les résultats restent voisins de ceux indiqués.
Considérons une nouvelle fois l’exemple 1.2.4. Afin de calculer la variance et l’écart-type de la série, on
réalise un tableau contenant toutes les données nécessaires à leur calcul (voir page suivante).
La quatrième colonne nous permet de calculer la moyenne arithmétique de la série : sa dernière ligne nous
∑ p
1∑
p
3243000
donne le nombre ni xi = 3243000. Donc x = ni xi = = 3243. L’économie moyenne des 1000
n 1000
i=1 i=1
clients de la banque est de 3243 euros.
La cinquième colonne nous permet de calculer la variance de la série : sa dernière ligne nous donne le
∑ p
1∑
p
11662000000
nombre 2
ni xi = 11662000000. Donc V (X) = ni x2i − x2 = − (3243)2 = 1144951.
n 1000
i=1 i=1
√ √
On en déduit l’écart-type de la série : σ(X) = V (X) = 1144951 ≃ 1070, 02 à 10−2 près.
Ce nombre peut être interprété de la manière suivante :
– l’intervalle [x − σ(X), x + σ(X)] = [3243 − 1070, 02; 3243 + 1070, 02] = [2172, 98; 4313, 02] contient
environ 68% des valeurs de la série,
– l’intervalle [x − 2σ(X), x + 2σ(X)] = [3243 − 2 × 1070, 02; 3243 + 2 × 1070, 02] = [1102, 96; 5383, 04]
contient environ 95% des valeurs de la série.
18 CHAPITRE 1. SÉRIES STATISTIQUES À UNE VARIABLE
Remarque 1.4.1 Le calcul de la variance ne peut être réalisé avant celui de la moyenne arithmétique.
1.5.1 Définitions
Pour répondre à la question précédente, on considère une série statistique de forme générale (xi , ni )1≤i≤p .
On définit
∑
– la fréquence cumulée croissante pi = fj et
j≤i
– le coefficient qi comme étant le rapport entre la masse salariale cumulée divisée par la masse salariale
∑
nj xj
∑ j≤i
totale M = n j x j : qi = .
M
j≤p
Plus la courbe de Gini sera proche de la bissectrice, plus la concentration sera faible. Plus elle en sera
éloignée, plus la concentration sera forte. Néanmoins, cette mesure graphique n’est pas suffisante pour quan-
tifier précisément le niveau de concentration de la masse salariale. Pour pallier ce manque de précision on
calcule l’indice de Gini.
S
i=
S0
vérifie l’inégalité 0 ≤ i ≤ 1
Interprétation :
20 CHAPITRE 1. SÉRIES STATISTIQUES À UNE VARIABLE
– lorsque i est faible (ou proche de 0), la courbe est proche de la bissectrice, la série est peu concentrée,
la répartition de la masse salariale est assez homogène,
– lorsque i est proche de 1, la courbe de Gini reste longtemps proche de l’axe des abscisses, la série est
très concentrée, il y a une répartition très inégalitaire de la masse salariale.
740.25
On en déduit que i = = 0, 14805 et on peut affirmer ainsi que la concentration est faible puisque
5000
l’indice de Gini est proche de 0. La masse salariale est répartie de manière égalitaire.
1.5.5 La médiale
Il existe un autre moyen de mesurer la concentration de la masse salariale et qui se nomme la médiale.
Définition 1.5.2 On appelle médiale de la série statistique, notée Ml , la première valeur du caractère à
partir de laquelle la moitié de la masse salariale a été étudiée, c’est-à-dire la valeur du caractère qui partage
la masse salariale en deux parties égales. Dans une répartition par classes, on procède par interpolation
linéaire.
Considérons l’exemple 1.5.1. Le calcul de la médiale se fait de la même manière que celui de la médiane. On
1 1
repère tout d’abord dans la colonne qi . Si n’apparaı̂t pas explicitement dans le tableau, on utilise les
2 2
valeurs qui l’encadrent :
5000 Ml 7000
1
0,287 0,799
2
Il suit par interpolation linéaire que
0, 213
Ml = 5000 + 2000 × = 5832, 03
0, 512
Ainsi, 50% de la masse salariale est distribuée aux salariés gagnant moins de 5832,03 euros et 50% à ceux
gagnant plus de 5832,03 euros.
1.6 Exercices
Exercice
1 Dans le fichier du service ORL du centre hospitalier de Dunkerque, on trouve pour chaque
patient les informations suivantes :
– sexe,
– âge,
– profession,
– poids,
– taille,
– groupe sanguin.
1. Quelle est la population étudiée ? Quels sont les individus ?
2. Donner le type de chacune des variables statistiques ci-dessus, en précisant éventuellement leurs mo-
dalités.
Exercice 2 Pour chaque commune française de plus de 20000 habitants, on note
– le département auquel elle appartient,
– le nombre de ses habitants,
– le nombre de ses établissements d’enseignement secondaire.
Reprendre les questions de l’exercice précédent.
Exercice
3 D’après l’INSEE, la structure sociale de la population active du Littoral et de la région Nord-
Pas de Calais était en 1990 la suivante :
Exercice 4 On donne dans le tableau ci-dessous la répartition des étudiants inscrits à l’Université du
Littoral 1998/1999 par secteurs disciplinaires :
Lettres 5%
Langues 13%
Sciences humaines et sociales 10%
Science de la nature et de la vie 7%
Science et structure de la matière 13%
Sciences et technologies 8%
Sport 6%
Droit 11%
Sciences économiques et gestion 10%
SESA 17%
Exercice 6 Un syndicat de salariés a réalisé une enquête sur les salaires du personnel ouvrier d’un groupe
industriel. Il a obtenu, pour les personnes ayant travaillé toute l’année à temps complet, la distribution de
salaires annuels suivante :
1.6. EXERCICES 23
La masse des salaires correspondant à la première classe (moins de 5000 euros) s’élève à 10, 693 millions
d’euros tandis que celle correspondant à la dernière classe s’élève à 53, 363 millions d’euros.
Reprendre les questions de l’exercice précédent.
Exercice 7 En réponse à une offre d’emploi visant à recruter une secrétaire sténodactylo, 7 candidates
se sont présentées. Le test qui leur est proposé consiste à dactylographier un texte préalablement noté en
sténo. Le tableau suivant donne le nombre d’erreurs commises par chaque candidate.
Candidate 1 2 3 4 5 6 7
Nombre d’erreurs 1 5 4 3 7 6 10
Exercice 8 La distribution selon le nombre d’enfants des 110 familles inscrites sur la liste d’attente d’un
office de HLM est la suivante :
Exercice 9 Calculer la moyenne, la médiane, les quartiles, l’écart-type et donner la classe modale de
la variable statistique de l’exercice 5.
Calculer la proportion d’exploitations agricoles dont la superficie est inférieure à 45 hectares.
Exercice 10 Calculer la moyenne, la médiane, l’écart-type et donner la classe modale de la variable sta-
tistique de l’exercice 6.
Exercice 11 Le tableau suivant donne la répartition des entreprises d’au moins 20 salariés dans le secteur
de l’industrie, en France en 1994, ainsi que les parts respectives du chiffre d’affaires total de ce secteur.
hhhh
hhhh Nombre de salariés
hhhh [20, 50[ [50, 100[ [100, 200[ [200, 500[ 500 et plus
part (en %) hhhh
h
Nombre 59, 7% 18, 5% 10, 9% 7% 3, 9%
Chiffre d’affaires 8, 3% 6, 2% 8, 1% 13, 4% 64%
Notes xi 6 7 8 9 10 11 12 13 14 15 16 17 18
Effectifs ni 10 23 45 78 116 147 162 148 117 77 46 20 11
Effectifs cumulés
Salaires en euros Centres Effectifs Fréquences (%)
croissants
[900; 1100[ 5
[1100; 1200[ 8, 5
[1200; 1300[ 23, 75
[1300; [ 25
[ ; [ 1500
[1600; 1700[ 6, 75 400
1.6. EXERCICES 25
1. Compléter le tableau.
2. Combien d’employés ont un salaire inférieur à 1300 euros ?
3. Réaliser un histogramme des effectifs de la série statistique.
Exercice 14 Le personnel d’une entreprise se répartit ainsi :
Fonction Nombre
Manœuvres 96
Ouvriers
288
professionnels
Ouvriers qualifiés 184
Employé(s)s 40
Cadres et direction 32
Exercice
15 On considère la série statistique suivante :
3, 4, 9, 10, 7, 6, 5, 4, 4, 3, 7, 9, 8
10, 12, 17, 6, 13, 20, 18, 18, 16, 15, 15, 14, 7, 8, 9, 11, 11, 12, 9, 9,
12, 14, 15, 15, 10, 12, 7, 7, 13, 14, 14, 14, 16, 16, 15, 18, 8, 9, 8, 9.
1. Regrouper par modalités cette série statistique en complétant, après l’avoir reproduit, le tableau sui-
vant.
Nombre de
6 7 ...
pièces A
Effectif 1 3 ...
Exercice 17 Avant d’accepter un contrat de livraison de véhicules, une société d’équipements automobiles
établit une statistique de production journalière sur 100 jours.
Le nombre de véhicules équipés journellement se répartit comme suit :
Production journalière
Nombre de jours
de véhicules équipés
95 1
96 3
97 6
98 8
99 10
100 13
101 18
102 14
103 9
104 8
105 6
106 2
107 2
Total 100
Déterminer la valeur moyenne de la production journalière et une valeur approchée à 10−2 près de l’écart-type
de cette production.
Exercice
18 Un nouveau responsable de magasin a enregistré au cours de ses 40 premières semaines
d’activité le nombre X de tonnes de marchandises qu’il a stocké hebdomadairement. Il a obtenu les résultats
suivants :
5, 7, 2, 6, 3, 4, 8, 5, 4, 3, 9, 6, 5, 7, 6, 8, 3, 4, 4, 0, 8, 6, 7, 1, 5, 5, 4, 6, 6, 10, 9, 8, 1, 5, 5, 6, 7, 8, 5, 5
∑i
1. Déterminer la distribution de fréquences (ni ) et la distribution de fréquences cumulées nj de
j=1
cette variable X et représenter graphiquement ces deux distributions à l’aide respectivement d’un
diagramme en bâtons et d’un graphique en escaliers.
Exercice 19 On se donne le tableau de données suivantes :
1.6. EXERCICES 27
Distance (en km) [0; 5[ [5; 10[ [10; 15[ [15; 20[ [20; 25[ [25; 30[ [30; 35[ [35; 40[ Total
Effectifs 50 250 500 800 700 650 320 230 3500
4. Calculer le coefficient de Gini sachant que l’aire comprise entre la courbe de Gini et D vaut 415, 2.
Comment peut-on interpréter cette valeur ?
Exercice
25 On considère le salaire mensuel X de 200 salariés d’une petite entreprise, exprimé en milliers
d’euros :
Classes ni ni ↗ Pi % ni xi Qi %
[1; 1, 5[ 52 65 17, 45
[1, 5; 2[ 71 124, 25 50, 8
[2; 2, 5[ 57 85, 23
[2, 5; 3[ 20 100
Total — — —
Exercice
26 On s’intéresse à la distribution des salaires mensuels dans une entreprise de confection.
Les salariés de cette entreprise sont au nombre de 150. Les résultats obtenus sont les suivants :
Salaires en Centres de
ni ni ↗ pi (%) ni x i ni xi ↗ qi (%)
euros classes xi
[1000; 1200[ 80
[1200; 1400[ 43
[1400; 1600[ 17
[1600; 1800[ 10
Total – – – – –
1.6. EXERCICES 31
1. Compléter le tableau.
2. Construire la courbe de Lorenz.
3. Analyser la concentration de la masse salariale à l’aide du graphique.
32 CHAPITRE 1. SÉRIES STATISTIQUES À UNE VARIABLE