Probastat GP Chap 1

Télécharger au format pdf ou txt
Télécharger au format pdf ou txt
Vous êtes sur la page 1sur 44

Probabilités et Statistique

GP

Chapitre 1
2021

M. Merah
merah_mustapha@yahoo,fr

1
Objectifs du cours

 Connaître les grands aspects de la statistique et la


probabilité ainsi que leurs utilités,

Etre capable de mettre en oeuvre ces techniques de


manière appropriée dans un contexte donné.

2
Buts

 Ensembles de méthodes dont le but est de présenter


les données pour que l'on puisse en prendre
connaissance facilement.
 Cela peut concerner :
 une variable à la fois : statistique à une dimension,

 deux variables à la fois : statistique à deux

dimensions,
 plus de deux variables à la fois : statistique

multidimensionnelle.

3
Distinction Proba/Stat

La Théorie des probabilités :


•permet de mod´eliser des phénomènes aléatoires et d’y
effectuer des calculs théoriques
•concerne les populations : on ne peut donc pas faire de mesures.
La Statistique :
•concerne les ´echantillons, le monde réel, la pratique,
•on fait des mesures (observations) sur des individus,
•repose sur la mod´elisation probabiliste des observations.

4
Plan du cours

 Chapitre préliminaire: généralités


 . Les concepts usuels de la statistique descriptive.
 1. La population statistique ou unités statistiques.
 2. Variable ou caractère.
 3. Les modalités.
 . Les différentes sortes de caractères.
 1. Les caractères quantitatifs.
 1.1. Variables statistiques discrètes.
 1.2. Variables statistiques continues.
 2. Les caractères qualitatifs.
5
On commence !

6
Statistiques Définition de base

7
Historique
 Dénombrement de populations humaines pour les besoins de la guerre et de
l'impôt.
 Véritable début : 18ième siècle :
 Arithmétique politique : connaissance d'un état
 Calcul des probabilités en France (Pascal, Bernouilli, Laplace, Gauss,
Poisson)
 Statistiques mathématiques modernes 19ième siècle 1853 premier congrès
 Première moitié du 20ième siècle
 Statistiques biologiques et psychologiques
 Biométrie et Psychométrie

 1930 Econométrie, Contrôle de qualité industriel


 1940 Recherche opérationnelle
 Deuxième moitié du 20ième siècle
 Développement de l'informatique
 Test de rang, test « exact »
 Analyses multi variées ou multidimensionnelles
 Analyse des données
8
 Méthodes bayesiennes
A quoi servent les statistiques?

• Organiser, présenter et décrire des données.


• Vérifier des relations entre variables.
• Tester des hypothèses
• Généraliser à une population, des caractéristiques
observées sur des échantillons.
• Faire de “bonnes” prévisions.

9
Définition: la statistique

La statistique est une méthode scientifique qui consiste à réunir


des données chiffrées sur des ensembles nombreux, puis à
analyser, à commenter et à critiquer ces données.

Il ne faut pas confondre la statistique qui est la science définie


ci-dessus et une statistique qui est un ensemble de données
chiffrées sur un sujet précis.

• La statistique permet de résumer et d’interpréter une réalité


complexe
• Aide à la prise de décision

10
Définition: la statistique
Décrit et synthétise la réalité
 Outil de communication
 permet de faire passer un message

Comment ?

 Sous forme de tableaux


 Sous forme de graphiques
 Sous forme numérique : moyennes, indices, taux de
croissance…

11
Domaines d’utilisation
 Les méthodes statistiques sont utilisées dans presque
tous les secteurs.

 Parmi ses applications, citons

 - dans le domaine industriel: la fiabilité des matériels,


le contrôle de qualité, l’analyse des résultats de mesure
et leur planification, la prévision, et

 - dans le domaine de l’économie et des sciences de


l’homme: les modèles économétriques, les sondages, les
enquêtes d’opinion, les études quantitatives de marché.

12
LA DEMARCHE STATISTIQUE

 Après le recueil de données, la démarche


statistique consiste à traiter et interpréter les
informations recueillies.

 Elle comporte deux grands aspects: l’aspect


descriptif ou exploratoire et l’aspect inférentiel ou
décisionnel.

13
LA DEMARCHE STATISTIQUE

Recensement
Collecte des données

Sondage

Statistique Descriptive
Analyse des données

Inférence Statistique

Conclusions

Prise des décisions

14
Deux branches distinctes
La statistique au sens large comprend deux branches.
Statistique descriptive Statistique inférentielle
Ensemble des méthodes qui Population souvent trop importante
permettent de décrire les unités
statistiques qui composent une  Pour réduire le coût de collecte, on
population utilise un échantillon de la population
observée
Représentation par des tableaux,
des graphiques ou des données A partir de l’étude de cet échantillon,
numériques possibilité d’estimer les comportements ou
 Décrit une situation et permet caractéristiques pour toute la population
d’en tirer des enseignements (contrôle de la qualité)
Population ?
Echantillon Inférence

La statistique, qu’elle soit descriptive ou inférentielle, est employée


dans toutes les sciences, ainsi que dans la vie quotidienne. 15
Population et individus

 Individu ou unité statistique


 Une unité distincte chez
laquelle on peut observer une
ou plusieurs caractéristiques
données.

16
Population et individus
 Population
 Ensemble des individus (ou
unités statistiques ) pour
lequel on considère une ou
plusieurs caractéristiques
 Taille de la population
 Le nombre d'individus
constituant la population.

Notation : N

17
Échantillon

 Les résultats des observations, portant sur la variable à


l'étude, faites sur une partie des individus. (Une observation
par individu)

Taille de l'échantillon : le nombre d'observations dans l'échantillon.


Notation : n 18
Exemple

« Individu »
Un individu
en latin: « ce qui
est indivisible ».

Les ensembles étudiés sont appelés population. Les éléments de la


population sont appelés individus. La population est étudiée selon une ou
plusieurs variables (ou caractères).
19
L’échantillon
On parle d’échantillon d’une population quand les individus sont tirées
au sort ou choisies par une méthode qui permet d’assurer la
représentativité de l’échantillon par rapport à la population totale.

Le diagramme ci-après représente


la population statistique d'une
classe de 35 élèves. Supposons que
l'on y choisisse, par tirage au sort,
6 élèves. Ces 6 élèves constituent
alors un échantillon.

Cet échantillon représente 17% de


la population (6/35).

20
Population x
x x x
Ensemble de référence x x x x
x x x
x x
x x x x
x x x x x
Individu x
x x x x
Elément de la population x x x
x x x x x
x x
Echantillon x x x
x x x x
Sous-ensemble de la population.
x x
x x x
x

Remarquons qu'un échantillon peut être considéré comme une population


en elle-même, quoique beaucoup plus petite que la population dont il est
extrait. En tant que population, il peut faire l'objet d'une étude
statistique dont les conclusions, sous certaines conditions, sont
susceptibles d’être étendues à la population toute entière. (C'est l'objet
de la statistique inférentielle.) 21
Variable statistique

 Caractéristique susceptible de variations


observables.
 Notation : X , Y , W , ... (caractères)
 Valeurs: les mesures distinctes d'une
caractéristique donnée.
 Notation : x1 , x2 , ... (modalités)

22
Variable statistique

 Valeurs possibles
tous les résultats possibles a priori si on fait une
observation d'une variable
 Valeur observée
résultat a posteriori d'une observation d'une
variable

23
VOCABULAIRE STATISTIQUE

Population statistique :
Une population statistique est l'ensemble sur lequel on effectue
des observations.

Individu (ou unités statistiques) :


Les individus sont les éléments de la population statistique étudiée.

Caractère statistique ou variable statistique :


C'est ce qui est observé ou mesuré sur les individus d'une
population statistique.

24
Types de variables

VARIABLES QUANTITATIVES

Variable quantitative :
Une variable statistique est quantitative si ses valeurs
sont des nombres exprimant une quantité, sur lesquels les
opérations arithmétiques (somme, etc...) ont un sens.

Variable quantitative discrète: Variable quantitative continue:


Une variable quantitative est Une variable quantitative est
discrète si elle ne peut prendre continue si ses valeurs peuvent
que des valeurs isolées, être n'importe lesquelles d'un
généralement entières. intervalle réel.

25
Types de variables

VARIABLES QUALITATIVES

Variable qualitative :
Une variable statistique est qualitative si ses valeurs, ou
modalités, s'expriment de façon littérale ou par un codage sur
lequel les opérations arithmétiques telles que moyenne, somme, ... ,
n'ont pas de sens.

Variable qualitative nominale Variable qualitative ordinale :


: C'est une variable qualitative
C'est une variable qualitative dont les modalités sont
dont les modalités ne sont pas naturellement ordonnées
ordonnées.
26
27
Séries statistiques a une variable

28
VARIABLES QUALITATIVES NOMINALES

Noms Couleur des yeux Modalités Effectifs Fréquences %


M. Kada Vert Bleu 60 0,200 20,0
M. Nabil Noir Noir 160 0,533 53,3
Mme Bahia Noir Noisette 40 0,133 13,3
Melle Djamila Noisette Vert 40 0,133 13,3
M. Yahia Bleu Total : 300 1 100
M. Karim Noir
M. Bachir Noisette Modalités Effectifs Fréquences %
Mme Aicha Noir modalité 1 n1 f1= n1/n f1×100
Melle Djazia Bleu … … …
M. Faiçal Vert modalité i ni fi= ni/n f i ×100
M. Amine Bleu … … …
Mme Laila Noir modalité k nk fk= nk/n f k ×100
…. …. Total :  n i = n  f i =1 100

29
VARIABLES QUALITATIVES NOMINALES

Modalités Effectifs Fréquences %


Bleu 60 0.200 20,0
Noir 160 0,533 53,3
Noisette 40 0,133 13,3
Vert 40 0,133 13,3
Total : 300 1 100
Diagramme circulaire ou
Diagramme en barres
camembert Vert Bleu
180
160
13% 160
20%
140
Noisette
120
13%
100

80
60
60
40 40
40

20
Noir
54% 0
Bleu Noir Noisette Vert

30
VARIABLES QUALITATIVES ORDINALES

130 personnes ont été interrogées sur leur


addiction au chocolat
Modalités Effectifs = Nombre de personnes
Les Pas du tout (A) 10
modalités Un peu (B) 25
sont Beaucoup (C) 40
Passionnément (D) 32
présenté
A la folie (E) 23
es dans 45

l’ordre 40
40

35 32

30
25
25 23

20

15
10
10

0
A B C D E 31
VARIABLES QUANTITATIVES DISCRETES
EFFECTIFS ET FREQUENCES

Clients Nombre de produits Nombre de Nombre de clients


financiers produits financiers
Bredat 2 0 103
Gauguet 3 1 115
Leremboure 0
Coustere 0
2 95
Lalisou 1 3 35
Aussagne 0 4 10
Vittorello 1 5 2
Diaz 0
Etcheverry 2 Valeurs de Effectifs Fréquences %
Bernadet 4 la variable
Miramon 1 x1 n1 f1= n1/n f1×100
Jaime 3
Dartus 2
… … …
Domege 0 xi ni fi= ni/n f i ×100
Train 0 … … …
Piquemal 1 xk nk fk= nk/n f k ×100
 n i = n  fi =1
Laffargue 2
Total : 100
…… …….
32
VARIABLES QUANTITATIVES DISCRETES
REPRESENTATION GRAPHIQUE DES EFFECTIFS
ET FREQUENCES
Nbre de produits financiers Effectif Fréquence
xi ni fi
0 103 0,286
1 115 0,319
2 95 0,264
3 35 0,097
4 10 0,028
5 2 0,006
Diagramme en
140

120
bâtons
100

80

60

40

20

0
0 1 2 3 4 5 6

33
VARIABLES QUANTITATIVES DISCRETES

EFFECTIFS ET FREQUENCES CUMULES


Nbre Nombre de Effectifs cumulés Effectifs cumulés
produits Clients croissants décroissants
Effectifs cumulés croissants: financiers
Nombre d'individus pour lesquels la 0 103 103 360
1 115 218 257
variable est inférieure ou égale à xi. 2 95 313 142
Résultat de l'addition, de proche en 3 35 348 47
proche, des effectifs d'une 4 10 358 12
5 2
distribution observée en Total : 360
360 2
commençant par le 1er.
Valeurs de la Effectif Effectifs cumulés Effectifs cumulés
Effectifs cumulés décroissants: variable croissants décroissants
Nombre d'individus pour lesquels la xi ni Ni N’i
variable est supérieure ou égale à xi. x1 n1 N1 = n 1 N’1= nk+ ….+ n1= n
x2 n2 N2= n1+ n2 N’2= nk+ ….+ n2
Résultat de l'addition, de proche en x3 n3 N3= n1+ n2+ n3 N’3= nk+ ….+ n3
proche, des effectifs d'une … … …. ….
distribution observée en commençant xk-1 nk-1 Nk-1= n1+ ….+ nk-1 N’k-1= nk+ nk-1
xk nk Nk= n1+ ….+ nk= n N’k= nk
par le dernier. Total : n

34
VARIABLES QUANTITATIVES DISCRETES

EFFECTIFS ET FREQUENCES CUMULES

Nombre de Nombre de Effectifs Effectifs Fréquences Fréquences Fréquences


produits clients cumulés cumulés cumulées cumulées
financiers croissants décroissants croissantes décroissantes
xi ni Ni N’i fi Fi F’i
0 103 103 360 0,2861 0,2861 1
1 115 218 257 0,3194 0,6055 0,7139
2 95 313 142 0,2639 0,8694 0,3945
3 35 348 47 0,0972 0,9666 0,1306
4 10 358 12 0,0278 0,9944 0,0334
5 2 360 2 0,0056 1 0,0056
Total : 360 1

Il y a 313 clients possédant un nombre de produits financiers inférieur


ou égal à 2
Il y a 47 clients possédant un nombre de pro. fin. supérieur ou égal à 3
La proportion de clients possédant un nombre de pro. fin. inférieur ou
égal à 4 est de 99,44%
La proportion de clients possédant un nombre de pro. fin. supérieur ou
égal à 1 est de 71,39% 35
VARIABLES QUANTITATIVES DISCRETES

COURBES CUMULATIVES
400
x xi ni Ni N(x) N’i N ’(x)
 350

0 360 300
0 0 103 103 360
103 257 250
1 1 115 218 257
218 142 200
95 313 142
2 2 313
47
47 150
35 348
3 3 348 12 100
10 358 12
4 4 358 2 50
2 360 2 0
5 5 360 0
 -2 -1 0 1 2 3 4 5 6

On appelle courbe cumulative croissante le tracé de la fonction N (ou F


pour les fréquences) qui à tout réel x associe N( x ) = nombre
d'observations inférieur ou égal à x.
Les courbes cumulatives N(x) et N’(x) sont symétriques par rapport à n/2 : N(x) + N’(x) = n

Les courbes cumulatives F(x) et F’(x) sont symétriques par rapport à 0,5 : F(x) + F’(x) = 1
36
VARIABLES QUANTITATIVES CONTINUES

Variable observée: augmentation moyenne mensuelle du salaire, en €, des


employés d’une multinationale au cours de l’année 2005. Augmentation Effectif
18 38 10 35 0 4 (€)
4 11 27 2 41 16 0 257
2 25 43 22 26 11
34 34 1 28 5 5
1 318
21 0 2 30 1 8 2 255
9 37 22 39 11 0 3 307
36 16 6 42 42 1 4 308
8 33 31 33 4 4
9 19 15 2 21 0
5 159
12 18 …. …. …. …. 6 140
7 84
Remarque1 : la variable augmentation moyenne mensuelle peut être 8 72
considérée comme continue. En arrondissant à l’euro, on l’a discrétisée. 9 55
10 22
Une augmentation de 10 € est en fait une augmentation comprise entre 11 13
9,5 € et 10,5 €. 12 9
Remarque2 : Une variable continue ne prend pas des valeurs isolées, 13 7
mais des valeurs appartenant à des intervalles. C'est pourquoi, au lieu de 14 8
définir des effectifs par valeurs, on définira des effectifs par 15 21
16 6
intervalles, appelés classes. 17 2
Remarque3 : Une variable discrète comportant trop de valeurs est aussi ….. ….
traitée comme une variable continue. Total 37
2125
VARIABLES QUANTITATIVES CONTINUES

Augmentation (€) Effectifs


[0 – 3[ 830 Classes Effectifs
[3 – 5[ 615 [e 1 – e 2[ n1
[5 – 10[ 510 [e 2 – e 3[ n2
…. ….
[10 – 20[ 92
[e k – e k+1[ nk
[20 – 30[ 63
[30 – 50[ 15

Remarque 1: Le choix des classes et arbitraire, mais elles doivent être


contigües et recouvrir l’ensemble des valeurs.
Remarque 2: Il est préférable de prendre des classes d’amplitudes
égales.
Remarque 3: Il ne faut prendre ni trop ni trop peu de classes.
Remarque 4: Le choix et le nombre de classes influent sur les
représentations graphiques.
38
VARIABLES QUANTITATIVES CONTINUES
REPRESENTATION GRAPHIQUE DES EFFECTIFS
ET FREQUENCES
effectif 900
Classes Effectifs 800
[0 – 3[ 830 700
[3 – 5[ 615 600
[5 – 10[ 510 500
[10 – 20 [ 92 400

[20 – 30[ 63 300

[30 – 50[ 15 200


100
0

0
3

30

50
350
Effectif rectifié
Classes Effectifs Amplitude Effectifs
300
ni ai rectifiés
ni /ai 250
[0 – 3[ 830 3 276,7
200
HISTOGRAMME
[3 – 5[ 615 2 307,5
[5 – 10[ 510 5 102,0 150

[10 – 20 [ 92 10 9,2 100


[20 – 30[ 63 10 6,3
50
[30 – 50[ 15 20 0,75
0
39
0

30

50
VARIABLES QUANTITATIVES CONTINUES
REPRESENTATION GRAPHIQUE DES EFFECTIFS
ET FREQUENCES
Classes Effectifs Amplitude Effectifs
Effectif rectifié
350

ni ai rectifiés 300
ni /ai
250
[0 – 3[ 830 3 276,7
[3 – 5[ 615 2 307,5 200
HISTOGRAMME
[5 – 10[ 510 5 102,0 150
[10 – 20[ 92 10 9,2
100
[20 – 30[ 63 10 6,3
[30 – 50[ 15 20 0,75 50

30

50
La surface = ai ×(ni/ai) est de 830 unités

La surface = ai × (ni/ai) est de 615 unités

Dans un histogramme, ce sont les surfaces des rectangles (ce que l’œil voit),
qui sont proportionnelles aux effectifs, et non les hauteurs de ces rectangles
Remarque: Le tracé de l’histogramme des fréquences est identique. Il suffit
de porter en ordonnées la fréquence rectifiée di = fi/ai, appelée densité.
40
VARIABLES QUANTITATIVES CONTINUES

EFFECTIFS ET FREQUENCES CUMULES


Classes Effectifs Effectifs Effectifs Fréquences Fréquences
cumulés cumulés cumulées cumulées
Variable observée: croissants décroissants croissantes décroissantes
augmentation
[ei – ei+1[ ni Ni N’i Fi F’i
[0 – 3[ 830 830 2125 0,391 1,000
moyenne mensuelle [3-5[ 615 1445 1295 0,680 0,609
du salaire, en €, des [ 5 - 10 [ 510 1955 680 0,920 0,320
employés d’une [10 - 20 [
[20 - 30 [
92
63
2047
2110
170
78
0,963
0,993
0,080
0,037
multinationale au [30 – 50[ 15 2125 15 1,000 0,007
cours de l’année Total : 2125
2005.

Il y a 1445 employés dont l’augmentation est strictement inférieure à 5

Il y a 170 employés dont l’augmentation est supérieure ou égale à 10

Combien y-a-t-il d’employés dont l’augmentation est inférieure à 17 ?

41
VARIABLES QUANTITATIVES CONTINUES

x
COURBES CUMULATIVES
 [ei – ei+1[ Fi F(x)
F’i F’i F’(x)
?
?0 1 l’intérieur
0 A 1
[0-3[ 0,391 1,000
? 1,000 ? 0,9
3 0,391 0,609
de chaque
[3-5[ 0,680 0,609
? 0,609 0,8
Fi
5 0,680 classe, on fait
0,320 0,7
[ 5 - 10 [ 0,920 0,320 0,320
0,920 l’hypothèse
0,080
0,6 F’i
10 [10 - 20 [ 0,963 0,080 0,080 0,5
que la
20 0,963 0,037 0,4
[20 - 30 [ 0,993 0,037 0,037 répartition est 0,3
30 0,993 0,007
uniforme
[30 - 50 [ 1,000 0,007 0,007 0,2

50 1 0 0,1

 -10
0
0 10 20 30 40 50 60

On appelle courbe cumulative croissante le tracé de la fonction F (N pour les effectifs)


qui à tout réel x associe F( x ) = nombre d'observations inférieur ou égal à x.

Remarque:
On appelle courbe cumulative décroissante
Pour une variable le tracé
continue, il est de la fonction
indifférent deF’dire
(N’ «
pour les effectifs)
inférieur ou égal »
qui
oua«tout réel x associe
strictement F’( x».) =Ilnombre
inférieur d'observations
en est de même pour « supérieur
supérieur strictement
ou égal » ou à x.
« strictement supérieur ».
Les
Il courbes cumulatives
n’y a aucune F(x) etobservation
chance qu’une F’(x) sont symétriques parborne.
tombe sur une rapport à 0,5
C’est : F(x) + F’(x)
l’imprécision de = 1
l’instrument de mesure et un mauvais choix des bornes qui pourrait conduire à ce résultat.
42
VARIABLES QUANTITATIVES CONTINUES

COURBES CUMULATIVES
Quelle est la proportion p d’employés dont
x [ei – ei+1[ Fi F(x) l’augmentation est inférieure à 17 € ?
0 0
[0-3[ 0,391
3 0,391
0,95
1

[3-5[ 0,680 0,9

5 0,680 0,8
0,7
[ 5 - 10 [ 0,920 0,6
10 0,920 0,5

17 [10 - 20 [ 0,963 p 0,4


0,3
20 0,963 0,2

[20 - 30 [ 0,993 0,1

30 0,993 -10
0
0 10 20 30 40 50 60

[30 - 50 [ 1 17
50 1
17  10
17 - 10 p - 0,92 D'où p  0,92   0,963  0,920   95%
20  10

20 - 10 0,963-0,920 43
TABLEAUX ET GRAPHIQUES

RESUME

VARIABLE QUALITATIVE VARIABLE QUANTITATIVE


Nominale Ordinale Discrète Continue

Effectifs ou Fréquences Effectifs ou Fréquences

Diagramme en barres Diagramme en barres Diagramme en bâtons Histogramme

Modalités dans
l ’ordre
Diagramme circulaire Courbes cumulatives des effectifs ou des fréquences

44

Vous aimerez peut-être aussi