Statistiques: Un Peu D'histoire
Statistiques: Un Peu D'histoire
Statistiques: Un Peu D'histoire
3
Statistiques
Un peu d’histoire
La science statistique semble exister dès la naissance des faits sociaux qui définissent un état. ». Le nom désigne ensuite
premières structures sociales. D’ailleurs, les premiers textes (1862) l’objet des statistiques : « ensemble de données numé-
écrits retrouvés étaient des recensements du bétail, des infor- riques concernant une même catégorie de faits ».
mations sur son cours et des contrats divers. Aujourd’hui, les plus gros consommateurs de statistiques sont
On attribue souvent l’introduction du terme « statistique » au les assureurs (risques d’accidents, de maladie des assurés),
professeur Achenwall, qui aurait, en 1746, créé le mot Sta- les médecins (épidémiologie), les démographes (populations
tistik, dérivé de la notion Staatskunde. et leur dynamique), les économistes (emploi, conjoncture éco-
En revanche, l’étymologie du mot nous donne la définition sui- nomique), les météorologues. . .
vante : « étude méthodique par des procédés numériques des
25
Ce qu’il faut savoir
DÉFINITION : Fréquence
On considère une série statistique à caractère quantitatif, dont les p valeurs sont données
par : x1 , x2 , . . ., x p d’effectifs associés n1 , n2 , . . ., n p avec n1 ` n2 ` ... ` n p “ N.
n
Pour chaque valeur on peut calculer une fréquence f i grâce à la formule i : c’est un nombre
N
compris entre 0 et 1.
L’ensemble des fréquences de toutes les valeurs du caractère s’appelle la distribution des fréquences.
Exemple Voici les notes sur 20 obtenues à une évaluation dans une classe de 30 élèves :
Série A - 2 ´ 3 ´ 3 ´ 4 ´ 5 ´ 6 ´ 6 ´ 7 ´ 7 ´ 7 ´ 8 ´ 8 ´ 8 ´ 8 ´ 8 ´ 9 ´ 9 ´ 9 ´ 9 ´ 9 ´ 9 ´ 10 ´
10 ´ 11 ´ 11 ´ 11 ´ 13 ´ 13 ´ 15 ´ 16.
On obtient le tableau suivant avec des fréquences en pourcentages :
Notes 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19
Eff. 0 1 2 1 1 2 3 5 6 2 3 0 2 0 1 1 0 0 0
Fréq. 0 3 7 3 3 7 10 17 20 7 10 0 7 0 3 3 0 0 0
R EMARQUE : on peut vérifier que la somme des fréquences est égale à 1 ou à 100 si on les
exprime en pourcentages.
On peut également faire un regroupement par classes, ce qui rend l’étude moins précise, mais qui permet d’avoir
une vision plus globale.
Exemple Pour la série A, on peut regrouper les données par classes d’amplitude 5 points :
Notes r0; 5r r 5 ; 10 r r 10 ; 15 r r 15 ; 20 r
Effectif 4 17 7 2
Fréquence 0,13 0,57 0,23 0,07
2. Caractéristiques de position
A. Le mode et la classe modale
DÉFINITION : Mode
Le mode d’une série statistique est la valeur du caractère qui a le plus grand effectif.
Si le caractère est un caractère quantitatif continu, on regroupe ses valeurs en classes.
La classe qui a le plus grand effectif est appelée classe modale.
Exemple
‚ Dans la série A, le mode est égal à 9 (effectif 6) ;
‚ si on regroupe par classes d’amplitude 5 points, la classe modale est [ 5 ; 10 [ (effectif 17).
B. Moyenne arithmétique
DÉFINITION : Moyenne
Soit la série statistique à caractère quantitatif dont les p valeurs sont données par x1 , x2 , . . .,
x p d’effectifs n1 , n2 , . . ., n p avec n1 ` n2 ` ... ` n p “ N.
La moyenne arithmétique pondérée de cette série est le nombre :
p
n1 x1 ` n2 x2 ` ... ` n p x p 1 ÿ
x“ “ nx.
n1 ` n2 ` ... ` n p N i “1 i i
R EMARQUE :
Dans le cas où tous les ni valent 1, la moyenne de la série statistique est le quotient de la
x1 ` x2 ` ... ` xn
somme de toutes les valeurs par l’effectif total : x “ .
n
Lorsque la série est regroupée en classes, on calcule la moyenne en prenant pour valeur xi
le centre de chaque classe obtenu en faisant la moyenne des deux extrémités de la classe.
La calculatrice permet de déterminer les éléments statistiques en allant dans le mode « stats » :
Il suffit d’entrer les notes et les effectifs correspondants dans les listes 1 et 2, puis de choisir « 1-Var Stats » dans le
menu statistique.
Si on ajoute (respectivement soustrait) un même nombre k à toutes les valeurs d’une série,
alors la moyenne de cette série se trouve augmentée (respectivement diminuée) de k.
Si on multiplie (respectivement divise) par un même nombre (non nul pour la division) k
toutes les valeurs d’une série, alors la moyenne de cette série se trouve multipliée (respec-
tivement divisée) par k.
C. Médiane
DÉFINITION : Médiane
Soit la série statistique ordonnée dont les n valeurs sont x1 ď x2 ď ¨ ¨ ¨ ď xn . La médiane est
un nombre M qui permet de diviser cette série en deux sous-groupes de même effectif.
n`1
Si n est impair, M est la valeur de cette série dont le rang est , notée x n`1 .
2 2
Si n est pair, M appartient à l’intervalle fermé formé par les deux nombres situés « au
milieu » de la série, à savoir x n et x n `1 .
2 2
Exemple
‚ La médiane de la série « 2 ´ 5 ´ 6 ´ 8 ´ 9 ´ 9 ´ 10 » est 8.
‚ La médiane de la série « 2 ´ 5 ´ 6 ´ 8 ´ 9 ´ 9 » est n’importe quel nombre situé entre 6 et 8
inclus.
R EMARQUE : lorsque l’on a une grande série statistique et que l’on souhaite déterminer la
médiane, on peut faire le tableau des effectif cumulés croissants (ECC).
Exemple Pour la série A, d’effectif 30, la médiane est un nombre situé entre la 15ème et la
16ème valeur qui sont 8 et 9, on peut prendre par exemple M “ 8, 5.
Notes 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19
Eff. 0 1 2 1 1 2 3 5 6 2 3 0 2 0 1 1 0 0 0
ECC 0 1 3 4 5 7 10 15 21 23 26 26 28 28 29 30 30 30 30
D. Quartiles
DÉFINITION : Quartiles
On appelle quartiles un triplet de réels pQ1 ; Q2 ; Q3 q qui sépare la série en quatre groupes
de même effectif. Le premier [respectivement le troisième] quartile est la plus petite valeur
de la série telle que au moins 25 % [respectivement 75 %] des valeurs de la série lui soient
inférieures ou égales. Q2 correspond à la médiane de la série.
On peut représenter ces données grâce à une « boîte à moustaches », ou diagramme de Tuckey (de son inventeur
John Tukey, en 1977). Pour cela, il nous faut les valeurs suivantes : le minimum et le maximum ; les trois quartiles.
min Q1 M Q3 Max
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
La boîte à moustaches résume quelques caractéristiques de position du caractère étudié et est utilisé principalement
pour comparer un même caractère dans deux ou plusieurs populations de tailles différentes.
3. Caractéristiques de dispersion
DÉFINITION : Étendue
On appelle étendue d’une série discrète le réel égal à la différence entre la plus grande valeur
et la plus petite valeur de la série.
Son principal mérite est d’exister, et de fournir une information sur la dispersion.
M`a˚î˚tˇr˚i¯sfi`eˇrffl ˜l´es˙
˜bˆa¯sfi`es˙
`a‹vfle´c
1 Quelle chance !
Le digramme en bâtons ci-dessous représente le temps de trajet journalier en minutes de 36 personnes travaillant
dans l’entreprise kadubol.
nombre de personnes
7
6
5
4
3
2
1
0 temps en minutes
5 10 15 20 25 30 35 40 45 50 55 60
Notes 3 5 6 7 8 9 10 11 12 13 14 17 18
Eff. 1 2 1 3 3 5 6 4 2 1 2 2 1
1) Combien y a-t-il d’élèves dans cette classe ? Déterminer l’étendue de la série de notes.
2) Quel est le pourcentage d’élèves ayant obtenu une note inférieure ou égale à 8 ?
3) Déterminer la moyenne, la médiane et les quartiles de la série de notes.
4) Cette évaluation était le quatrième de la période. Toutes les évaluations ont le même coefficient et jusqu’alors
Bastien avait 9 de moyenne ; après ce devoir, il a 9,5 de moyenne. Quelle note a-t-il obtenue à ce devoir ?
3 Famille nombreuse
J’ai 7 enfants :
‚ l’âge modal est 5 ans ;
‚ Marie-Capucine a précisément l’âge médian, 7 ans ;
‚ les jumeaux ont l’âge moyen, 8 ans.
Mais quel âge a donc mon aîné ?
Devoirs 1 2 3 4 5 6 Moy.
Notes de Luc 12 5 18 11 19
Notes de Julie 20 15 4 9 x y 12,5
1) a) Calculez la moyenne de Luc, si la note obtenue au sixième devoir est égale à la moyenne des cinq premiers.
b) Une meilleure note au devoir 6 aurait-elle permis à Luc d’obtenir une moyenne de 15 ?
2) La note y obtenue par Julie au devoir 6 a augmenté de 25 % par rapport à la note x qu’elle a obtenue au devoir 5.
a) Exprimez y en fonction de x.
b) Calculez x et y.
5 CRPE 2014 G1
Le cross du collège a eu lieu. 200 élèves de troisième ont franchi la ligne d’arrivée. Voici les indicateurs des perfor-
mances réalisées en minutes.
Premier Troisième
Minimum Médiane Moyenne Étendue
quartile quartile
12,5 14,8 15,7 16,3 15,4 4,2
6 CRPE 2015 G2
Une petite entreprise emploie 7 personnes, dont 3 femmes.
Voici quelques informations sur le salaire mensuel des personnels :
‚ Salaires des hommes : 1 250 e ; 1 400 e ; 1 600 e ; 3 200 e.
‚ Salaires des femmes : salaire médian : 1 875 e ; salaire moyen : 1 700 e ; étendue des salaires : 1 000 e.
Le patron de l’entreprise veut embaucher une femme supplémentaire pour respecter la parité.
Calculer le salaire qu’il doit verser à cette nouvelle recrue pour que les salaires moyens des hommes et des femmes
soient égaux.
7 CRPE 2016 G2
Quatre-vingts archers d’un club de tir à l’arc A ont participé à un championnat. Le nombre de points obtenus par
chaque archer du club est donné par le diagramme ci-dessous.
Nombre d’archers
20
16
12
0
0 1 2 3 4 5 6 7 8 9 10
Nombre de points
a) Comparer les résultats des deux clubs selon leurs scores moyens.
b) Comparer les résultats des deux clubs selon les scores de leurs dix meilleurs archers.
8 CRPE 2017 G2
On considère une série statistique de moyenne égale à 5. On complète la série en ajoutant 5 comme valeur supplé-
mentaire.
Affirmation : la moyenne de la série ne change pas.
9 CRPE 2017 G2
Ce tableau présente la hauteur, en millimètre, des précipitations journalières au cours du mois d’avril 2016, sur
l’aéroport Roland Garros de l’île de La Réunion.
1) Calculer la valeur moyenne des précipitations journalières au cours du mois d’avril 2016, arrondie au dixième
de millimètre.
2) Déterminer la valeur médiane de ces précipitations journalières. Interpréter ce résultat par une phrase.
3) Quelle est l’étendue de cette série ?
4) Déterminer le nombre de jours où la hauteur des précipitations est supérieure ou égale à 13 mm, puis exprimer
ce nombre en pourcentage par rapport au nombre de jours dans le mois.
5) Sachant qu’une des pistes de décollage de l’aéroport Roland Garros est rectangulaire et mesure 3 200 m de long
et 50 m de large, calculer, en mètre cube, puis en litre, le volume de pluie tombé sur cette piste au cours du mois
d’avril 2016.
1) a) Expliquer pourquoi l’âge médian des chefs d’exploitation agricole est nécessairement entre 45 et 55 ans.
b) Pour déterminer l’âge médian, la répartition des âges dans la classe [ 45 ; 55 [ est donnée par le tableau suivant :
âge 45 46 47 48 49 50 51 52 53 54
effectif 18 21 24 31 30 31 30 27 28 20
exploitations de
Cowville
24 42 47 54 65
exploitations de
Pigville
18 43 57 60 63
Un journaliste a écrit : « Dans leur ensemble les chefs d’exploitation de Cowville sont plus jeunes que les chefs
d’exploitation de moins de Pigville. » Commenter cette affirmation en utilisant ces diagrammes en boîtes.