Cours Stat 2021 2022 Section 1
Cours Stat 2021 2022 Section 1
Cours Stat 2021 2022 Section 1
1- Définitions
* Les statistiques (avec s, au pluriel): tout ensemble de données chiffrées relatives à un phénomène donné et
recueillies en général par des organismes spécialisés. A titre d'exemple, les services des douanes tiennent des statistiques
sur la nature, le volume et la valeur des marchandises qui sont importés chaque année, l'INS (l'institut national de la
1
statistique de Tunisie) publie régulièrement des statistiques sur les naissances et les décès en Tunisie, les services de
santé publient des statistiques sur le nombre de personnes hospitalisées selon la maladie.
Les statistiques sont aujourd’hui utilisées dans tous les secteurs d’activité : l'industrie, l'économie et finance, la santé,
l'environnement et partout où l’on dispose de données. Elles ont connu un grand essor avec l’arrivage des ordinateurs
performants
* La statistique (sans s, au singulier): la science et l'ensemble de procédures (méthodes) avec lesquels on va pouvoir
étudier les statistiques et permettant ainsi de représenter les données traitées sous une forme utilisable et significative
c'est-à-dire des techniques qui consistent à étudier (décrire et analyser) ces données chiffrées afin de répondre à
certaines questions relatives au phénomène étudiés.==> Ensemble de méthodes d'analyse des données
==> La Statistique, c'est l'étude des variations observables. C'est une méthode qui consiste à réunir des données
chiffrées sur des ensembles nombreux, puis à les analyser et à les interpréter.
Si l'on s'intéresse par exemple aux statistiques sur les accidents de la route relevées par les services de la police de la
circulation, on peut se poser des questions du genre: Quelle est la principale cause des accidents? Quelle est la région ou
le tronçon routier le plus favorable aux accidents? Est-ce-que la gravité des accidents est la même selon que l'accident a
lieu la nuit ou le jour?.. La réponse à de telles questions permet de mieux comprendre le phénomène " accident de la
circulation" et par conséquent d'essayer d'y remédier. La statistique est la méthode utilisée pour répondre à ces
questions.
Si l'on s'intéresse, maintenant, aux récoltes de blé qu'a connues l'économie tunisienne depuis une centaine d'années, on
peut se poser des questions du type: Est-ce-que le volume de blé récolté en Tunisie a varié régulièrement d'une année à
une autre? Est-ce-qu'il ya un cycle du blé? Quels sont les phénomènes qui expliquent la variation des quantités récoltées
et des rendements?....Là encore la statistique permet d'apporter une réponse.
ISET-Kasserine--2022-2023
Cours Statistiques Descriptives
La statistique est l’étude de la collecte de données, leur analyse, leur traitement, l’interprétation des résultats et leur
présentation afin de rendre les données compréhensibles par tous. C’est à la fois une science, une méthode et un
ensemble de techniques. L’analyse des données est utilisée pour d’écrire les phénomènes étudiés, faire des prévisions et
prendre des décisions à leur sujet. En cela, la statistique est un outil essentiel pour la compréhension et la gestion des
phénomènes complexes. Les données étudiées peuvent être de toute nature, ce qui rend la statistique utile dans tous les
champs disciplinaires et explique pourquoi elle est enseignée dans toutes les filières universitaires, de l’économie à la
biologie en passant par la psychologie et bien sûr les sciences de l’ingénieur.
2
La statistique consiste à :
– Recueillir des données.
– Présenter et résumer ces données.
– Tirer des conclusions sur la population étudiée et d’aider à la prise de décision.
– En présence de données dépendant du temps, nous essayons de faire de la prévision.
On appelle Statistique Descriptive l’ensemble des méthodes et techniques mathématiques permettant de présenter, d
´écrire et résumer un ensemble de données.
* Données statistiques: un ensemble de mesure observées sur une population donnée relative à un ou plusieurs
caractères.
* Population : En statistique, on travaille sur des populations. Ce terme vient du fait que la démographie, étude des
populations humaines, a occupé une place centrale aux débuts de la statistique, notamment au travers des recensements
de population. Mais, en statistique, le terme de population s’applique à tout objet statistique étudié, qu’il s’agisse
d’étudiants (d’une université ou d’un pays), de ménages ou de n’importe quel autre ensemble sur lequel on fait des
observations statistiques. Nous définissons la notion de population.
Une population est un ensemble d’individus ou d’unités statistiques. Une population au sens statistique, n’est pas
nécessairement un ensemble d’être humains. Elle peut être constituée de n’importe quel ensemble d’objets concernés
par l’étude. Par exemples : La population des ménages d’une cité, des vaches laitières en Tunisie, des étudiants d’une
faculté, le parc des automobiles en circulation, un ensemble donné d'entreprises, etc. Cet ensemble est noté Ω.
Exemple
– On considère l’ensemble des étudiants de la section A. On s’intéresse aux nombre de frères et sœurs de chaque
étudiant. Dans ce cas Ω = ensemble des étudiants.
– Si l’on s’intéresse maintenant à la circulation automobile dans une ville, la population est alors constituée de
l’ensemble des véhicules susceptibles de circuler dans cette ville à une date donnée. Dans ce cas Ω = ensemble des
véhicules.
ISET-Kasserine--2022-2023
Cours Statistiques Descriptives
Une population comporte toujours des unités homogènes (de même type, même nature) dont le nombre est fini. Une
population ne peut pas comportée en même temps des voitures et des vaches.
Une population peut être un ensemble exhaustive c'est-à-dire qui couvre l’ensemble de touts les individus concernés
comme elle peut être une partie de cet ensemble, dans ce cas on parle d’échantillon. Si on revient à l’exemple des
étudiants d’une faculté, les étudiants de la première année de cette faculté représentent un échantillon de la population
totale.
==> ÉCHANTILLON : C'est un sous ensemble de la population considérée. Le nombre d'individus dans l’échantillon
est la taille de l'échantillon.
3
* un individus ou unité statistique: comme la population est l'ensemble que l'on observe et qui sera soumis à une
analyse statistique. Chaque élément de cet ensemble est un individu ou unité statistique: C’est un seul élément de
l’ensemble de la population. Une population est donc composée de plusieurs unités statistiques ou individus.
Une population est composée d’individus==>Les individus qui composent une population statistique sont appelés unités
statistiques.==>un individus ou unité statistique ==>Chaque objet d’une population On appelle individu tout
élément de la population Ω, il est noté ω (ω dans Ω).
-L’unité statistique est un objet pour lequel nous sommes intéressés à recueillir de l’information.
Dans l’exemple indiqué ci-dessus, un individu est tout étudiant de la section. Et, si on étudie la production annuelle
d’une usine de boîtes de boisson en métal (canettes). La population est l’ensemble des boîtes produites durant l’année et
une boîte constitue un individu.
Autres exemples:
1-
La population l’individu ou l'unités statistiques
Ensemble des élèves du Lycée Un élève du lycée
Ensemble des salarié du commerce Un salarié du commerce
Ensemble des automobile d’un parc de voitures . Une voiture de ce parc.
* La série d’observations recueillies s’appelle série statistique. Elle est généralement retranscrite dans un tableau de
données. La série statistique est l’ensemble des différentes données associées à un certain nombre d’individus.
Exemple : la série suivante résulte d’une courte enquête auprès de quelques personnes pour connaître leur âge : 18 21
19 19 17 22 27 18 18 17 20 20 23
ISET-Kasserine--2022-2023
Cours Statistiques Descriptives
Les données relatives à une populations sont des mesures (s’appellent des observations) portant sur un ensemble de
caractères . Un caractère : C'est la propriété ou l'aspect singulier que l'on se propose d'observer dans la population ou
l'échantillon. Un caractère qui fait le sujet d'une étude porte aussi le nom de variable statistique.
==> Un caractère est un aspect observable du phénomène étudié : c’est une dimension du phénomène
Si l'on s'intéresse par exemple au phénomène: " examen baccalauréat 1990", la population étudiée est alors l'ensemble
des élèves qui ont passé cet examen. On peut observer sur chaque individu plusieurs caractères: l'âge, le sexe, le
gouvernorat de résidence, la profession des parents, la moyenne de l'année précédente, la moyenne au bac, la note de la 4
première matière principale,.. Chaque caractère se définit par l’ensemble des modalités qui sont les différentes valeurs
possibles ou les différents états possibles ou les différentes situations possibles du caractère.
- le caractère la moyenne au bac a un nombre infini de modalités qui sont constituées par n'importe quelle
valeur possible de l'intervalle fermé [0,20]
Selon que les modalités d'un même caractère diffèrent entre elles par leur nature ou par leur intensité, nous distinguons
deux catégories de caractères : les caractères qualitatifs et les caractères quantitatifs:
** Caractère qualitatif: Lorsque la variable ne se prête pas à des valeurs numériques, elle est dite qualitative. Un
caractère qualitatif est alors un caractère dont les modalités diffèrent par leur nature. Ces modalités ne peuvent être
mesurées. Elles peuvent seulement être identifiées et constatées, comme les opinions politiques, les couleurs des yeux,
la nationalité, le sexe, la catégorie socioprofessionnelle des parents..).
Exemple: L’état d’une maison : on peut considérer les modalités suivantes – Ancienne. – Dégradée. – Nouvelle. –
Rénovée.
Pour chaque individu on ne peut qu'identifier son appartenance à l'une ou l'autre des modalités. Toutefois, les modalités
d'un caractère qualitatif sont des nombres: c'est le cas avec le rang à l'examen de gestion ou l'année d'études en
maîtrise ..Ces caractères ne sont pas portant des caractères quantitatifs car les nombres ici ne constituent pas une mesure
mais un symbole ou une numérotation (un repérage).
La liste des modalités d'un caractère qualitatif est appelée " Nomenclature".
** Caractère quantitatif: Lorsque la variable peut être exprimée numériquement, elle est dite quantitative et donc
mesurable . Un caractère quantitatif est alors un caractère dont les modalités ne diffèrent pas par leur nature mais par
leur intensité comme l’âge, la taille, le salaire d’un individu, la température, le poids, etc.
♦ Les caractères quantitatifs discrets (discontinus): Ce sont les caractères qui ne peuvent prendre que des
valeurs isolées dans un intervalle [a,b] donné (des valeurs entières) , exemple : nombre d'enfants d'une famille ou
nombre d'exemplaires vendus d'un manuel, etc.
♦ Les caractères quantitatifs continus Ce sont les caractères qui peuvent prendre n'importe quelle valeur dans un
intervalle [a,b] donné , exemple : le diamètre de pièces, les salaires, l'âge, le poids, la taille, etc.
ISET-Kasserine--2022-2023
Cours Statistiques Descriptives
Les caractères sont aussi appelés VARIABLES STATISTIQUES, donc on distingue trois types de variables à savoir :
variables qualitatives ou variables nominales qui correspondent aux caractères qualitatifs, variables quantitatives
discrètes qui correspondent aux caractères quantitatifs discrets et variables quantitatives continues qui correspondent
aux caractères quantitatifs continus.
Evaluation
- La variable statistique "couleur de maisons d’un quartier" est-elle :
qualitative quantitative
discrète continue
La variable statistique "revenu brut" est-elle :
qualitative quantitative 5
discrète continue
La variable statistique "nombre de maisons vendues par ville" est-elle :
qualitative quantitative
discrète continue
Solution :
Pour le premier cas, la variable statistique est qualitative.
Pour le deuxième cas, la variable statistique est quantitative continue.
Pour le troisième cas, la variable statistique est quantitative discrète.
L'effectif d'une classe ou d'une modalité est le nombre d'individu de cette classe ou de cette modalité. Généralement on
note ni est l'effectif de la classe n°i (ou de la modalité xi ). La somme des effectifs est la taille de l'échantillon ou la taille
de la population notée N. Il s'agit de la donnée de base d'une série statistique qui est reportée dans la deuxième ligne de
son tableau.
ISET-Kasserine--2022-2023
Cours Statistiques Descriptives
* Effectif total
L'effectif total, noté en général N, correspond au nombre d'individus qui composent la population étudiée, il peut être
Note sur 10 0 1 2 3 4 5 6 7 8 9 10
Nombre
0 1 1 0 3 4 5 3 3 1 2
d'élèves
0+1+1+0 0+1+1+0 0+1+1+0+ 0+1+1+0 0+1+1+0+3 0+1+1+0+ 0+1+1+0+3+
0+1 0+1+1 0+1+1+0
Effectifs +3 +3+4 3+4 +3+4 +4 3+4 4
0
cumulés +5 +5+3 +5+3+3 +5+3+3+1 +5+3+3+1+2
=1 =2 =2
=5 =9 = 14 = 17 = 20 = 21 = 23
L'effectif cumulé de la dernière classe vaut N (c'est-à-dire la somme des ni ).
Exemple
Supposons que l'on veut faire une étude statistique sur les 50 notes attribuées par un jury à un examen.
On peut regrouper ces notes par ordre croissant et construire le tableau suivant : (dans ce cas la distribution est discrète)
ISET-Kasserine--2022-2023
Cours Statistiques Descriptives
Ou bien regrouper ces notes par intervalle (classe ) : ( dans ce cas la distribution est continue )
ISET-Kasserine--2022-2023
Cours Statistiques Descriptives
* La fréquence
La fréquence associée à une valeur est la proportion d'individus associés à cette valeur. c'est est le quotient de l'effectif
(n) par l'effectif total (N).C'est un nombre entre 0 et 1, ou exprimé en pourcentage.
Si n est l'effectif d'une valeur et N l'effectif total de la population, la fréquence associée à cette valeur sera:
ISET-Kasserine--2022-2023
Cours Statistiques Descriptives
Remarque: La fréquence d'une valeur est toujours inférieure à 1 et la somme de toutes les fréquences est toujours
Voici le tableau de l'exemple précédent complété par une ligne supplémentaire pour la fréquence
Note sur 10 0 1 2 3 4 5 6 7 8 9 10
Nombre d'élèves 0 1 1 0 3 4 5 3 3 1 2
Effectifs cumulés 0 1 2 2 5 9 14 17 20 21 23
f =0/23 f =1/23 f =1/23 f =0/23 f =3/23 f =4/23 f =5/23 f =3/23 f =3/23 f =1/23 f =2/23
Fréquences
= 0 = 0,043 = 0,043 = 0 = 0,129 =0,172 = 0,215 = 0,129 = 0,129 = 0,043 = 0,086
9
* La fréquence cumulée
La fréquence cumulée d'une valeur est la somme des fréquences de la classe étudiée et des fréquences des classes qui lui
sont inférieures. Il est possible de la calculer de deux manières différentes:
= effectif de valeur n°1 + effectif de valeur n°2 + .......+ effectif de valeur n°m
effectif total N
- à partir des effectifs cumulés: La fréquence cumulée de la valeur N° m = effectif cumulé de la valeur n°m
effectif total
Si l'on reprend l'exemple précédent on peut ajouter une ligne pour les fréquences cumulées:
Note sur 10 0 1 2 3 4 5 6 7 8 9 10
Nombre d'élèves 0 1 1 0 3 4 5 3 3 1 2
Effectifs cumulés 0 1 2 2 5 9 14 17 20 21 23
Fréquences 0 0,043 0,043 0 0,129 0,172 0,215 0,129 0,129 0,043 0,086
0/23 1/23 2/23
Fréquences 2/23 = 5/23 = 9/23= 14/23= 17/23= 20/23= 21/23= 23/23=
= = =
cumulées 0,086 0,215 0,387 0,602 0,731 0,86 0,903 1
0 0,043 0,086
Les effectifs et fréquences donnent des renseignements sur une modalité donnée. Or, en statistique, on cherche souvent à
répondre à des questions du type :
« Pour combien d'individus dans la population la modalité du caractère étudié est-elle inférieure à une valeur
donnée ? »
« Quelle est la proportion d'individus dont le caractère étudié prend une valeur supérieure ou égale à tel
nombre ? »
Pour répondre à de telles questions, on définit :
ISET-Kasserine--2022-2023
Cours Statistiques Descriptives
** L'effectif cumulé croissant d'une modalité xi : Quand les valeurs du caractère sont rangées dans l'ordre croissant,
l'effectif cumulé croissant d'une valeur est la somme des effectifs de cette valeur et de ceux qui la précèdent. C'est la
somme des effectifs des modalités x1 à xi , c'est-à-dire n1+n2+.....+ni.
** L'effectif cumulé décroissant d'une modalité xi : Quand les valeurs du caractère sont rangées dans l'ordre croissant,
l'effectif cumulé décroissant d'une valeur est la somme des effectifs de cette valeur et de ceux qui la suivent. C'est la
somme des effectifs des modalités xi à xp , c'est-à-dire ni+ni+1+............+np .
** La fréquence cumulée croissante d'une modalité xi: Quand les valeurs du caractère sont rangées dans l'ordre
croissant, la fréquence cumulée croissante d'une valeur est la somme des fréquences de cette valeur et de celles qui la
précèdent. C'est la somme des fréquences des modalités x1 à xi , c'est-à-dire f1+f2+.....+fi .
10
** La fréquence cumulée décroissante d'une modalité xi : Quand les valeurs du caractère sont rangées dans l'ordre
croissant, la fréquence cumulée décroissante d'une valeur est la somme des fréquences de cette valeur et de celles qui
la suivent. C'est la somme des fréquences des modalités xi à xp , c'est-à-dire fi+fi+1+............+fp .
Suivant l'étude que l'on souhaite faire d'une série statistique, il peut être pertinent d'enrichir le tableau contenant les
modalités, effectifs et fréquences, de lignes (ou colonnes) supplémentaires comportant certains effectifs et/ou fréquences
cumulés.
Exemple:
Rajoutons une ligne contenant les effectifs cumulés croissants et une ligne contenant les fréquences cumulées
décroissantes au tableau résumant la série S1 des deux exemples précédents :
ISET-Kasserine--2022-2023