Probastat GP Chap 1
Probastat GP Chap 1
Probastat GP Chap 1
GP
Chapitre 1
2021
M. Merah
merah_mustapha@yahoo,fr
1
Objectifs du cours
2
Buts
dimensions,
plus de deux variables à la fois : statistique
multidimensionnelle.
3
Distinction Proba/Stat
4
Plan du cours
6
Statistiques Définition de base
7
Historique
Dénombrement de populations humaines pour les besoins de la guerre et de
l'impôt.
Véritable début : 18ième siècle :
Arithmétique politique : connaissance d'un état
Calcul des probabilités en France (Pascal, Bernouilli, Laplace, Gauss,
Poisson)
Statistiques mathématiques modernes 19ième siècle 1853 premier congrès
Première moitié du 20ième siècle
Statistiques biologiques et psychologiques
Biométrie et Psychométrie
9
Définition: la statistique
10
Définition: la statistique
Décrit et synthétise la réalité
Outil de communication
permet de faire passer un message
Comment ?
11
Domaines d’utilisation
Les méthodes statistiques sont utilisées dans presque
tous les secteurs.
12
LA DEMARCHE STATISTIQUE
13
LA DEMARCHE STATISTIQUE
Recensement
Collecte des données
Sondage
Statistique Descriptive
Analyse des données
Inférence Statistique
Conclusions
14
Deux branches distinctes
La statistique au sens large comprend deux branches.
Statistique descriptive Statistique inférentielle
Ensemble des méthodes qui Population souvent trop importante
permettent de décrire les unités
statistiques qui composent une Pour réduire le coût de collecte, on
population utilise un échantillon de la population
observée
Représentation par des tableaux,
des graphiques ou des données A partir de l’étude de cet échantillon,
numériques possibilité d’estimer les comportements ou
Décrit une situation et permet caractéristiques pour toute la population
d’en tirer des enseignements (contrôle de la qualité)
Population ?
Echantillon Inférence
16
Population et individus
Population
Ensemble des individus (ou
unités statistiques ) pour
lequel on considère une ou
plusieurs caractéristiques
Taille de la population
Le nombre d'individus
constituant la population.
Notation : N
17
Échantillon
« Individu »
Un individu
en latin: « ce qui
est indivisible ».
20
Population x
x x x
Ensemble de référence x x x x
x x x
x x
x x x x
x x x x x
Individu x
x x x x
Elément de la population x x x
x x x x x
x x
Echantillon x x x
x x x x
Sous-ensemble de la population.
x x
x x x
x
22
Variable statistique
Valeurs possibles
tous les résultats possibles a priori si on fait une
observation d'une variable
Valeur observée
résultat a posteriori d'une observation d'une
variable
23
VOCABULAIRE STATISTIQUE
Population statistique :
Une population statistique est l'ensemble sur lequel on effectue
des observations.
24
Types de variables
VARIABLES QUANTITATIVES
Variable quantitative :
Une variable statistique est quantitative si ses valeurs
sont des nombres exprimant une quantité, sur lesquels les
opérations arithmétiques (somme, etc...) ont un sens.
25
Types de variables
VARIABLES QUALITATIVES
Variable qualitative :
Une variable statistique est qualitative si ses valeurs, ou
modalités, s'expriment de façon littérale ou par un codage sur
lequel les opérations arithmétiques telles que moyenne, somme, ... ,
n'ont pas de sens.
28
VARIABLES QUALITATIVES NOMINALES
29
VARIABLES QUALITATIVES NOMINALES
80
60
60
40 40
40
20
Noir
54% 0
Bleu Noir Noisette Vert
30
VARIABLES QUALITATIVES ORDINALES
l’ordre 40
40
35 32
30
25
25 23
20
15
10
10
0
A B C D E 31
VARIABLES QUANTITATIVES DISCRETES
EFFECTIFS ET FREQUENCES
120
bâtons
100
80
60
40
20
0
0 1 2 3 4 5 6
33
VARIABLES QUANTITATIVES DISCRETES
34
VARIABLES QUANTITATIVES DISCRETES
COURBES CUMULATIVES
400
x xi ni Ni N(x) N’i N ’(x)
350
0 360 300
0 0 103 103 360
103 257 250
1 1 115 218 257
218 142 200
95 313 142
2 2 313
47
47 150
35 348
3 3 348 12 100
10 358 12
4 4 358 2 50
2 360 2 0
5 5 360 0
-2 -1 0 1 2 3 4 5 6
Les courbes cumulatives F(x) et F’(x) sont symétriques par rapport à 0,5 : F(x) + F’(x) = 1
36
VARIABLES QUANTITATIVES CONTINUES
0
3
30
50
350
Effectif rectifié
Classes Effectifs Amplitude Effectifs
300
ni ai rectifiés
ni /ai 250
[0 – 3[ 830 3 276,7
200
HISTOGRAMME
[3 – 5[ 615 2 307,5
[5 – 10[ 510 5 102,0 150
30
50
VARIABLES QUANTITATIVES CONTINUES
REPRESENTATION GRAPHIQUE DES EFFECTIFS
ET FREQUENCES
Classes Effectifs Amplitude Effectifs
Effectif rectifié
350
ni ai rectifiés 300
ni /ai
250
[0 – 3[ 830 3 276,7
[3 – 5[ 615 2 307,5 200
HISTOGRAMME
[5 – 10[ 510 5 102,0 150
[10 – 20[ 92 10 9,2
100
[20 – 30[ 63 10 6,3
[30 – 50[ 15 20 0,75 50
30
50
La surface = ai ×(ni/ai) est de 830 unités
Dans un histogramme, ce sont les surfaces des rectangles (ce que l’œil voit),
qui sont proportionnelles aux effectifs, et non les hauteurs de ces rectangles
Remarque: Le tracé de l’histogramme des fréquences est identique. Il suffit
de porter en ordonnées la fréquence rectifiée di = fi/ai, appelée densité.
40
VARIABLES QUANTITATIVES CONTINUES
41
VARIABLES QUANTITATIVES CONTINUES
x
COURBES CUMULATIVES
[ei – ei+1[ Fi F(x)
F’i F’i F’(x)
?
?0 1 l’intérieur
0 A 1
[0-3[ 0,391 1,000
? 1,000 ? 0,9
3 0,391 0,609
de chaque
[3-5[ 0,680 0,609
? 0,609 0,8
Fi
5 0,680 classe, on fait
0,320 0,7
[ 5 - 10 [ 0,920 0,320 0,320
0,920 l’hypothèse
0,080
0,6 F’i
10 [10 - 20 [ 0,963 0,080 0,080 0,5
que la
20 0,963 0,037 0,4
[20 - 30 [ 0,993 0,037 0,037 répartition est 0,3
30 0,993 0,007
uniforme
[30 - 50 [ 1,000 0,007 0,007 0,2
50 1 0 0,1
-10
0
0 10 20 30 40 50 60
Remarque:
On appelle courbe cumulative décroissante
Pour une variable le tracé
continue, il est de la fonction
indifférent deF’dire
(N’ «
pour les effectifs)
inférieur ou égal »
qui
oua«tout réel x associe
strictement F’( x».) =Ilnombre
inférieur d'observations
en est de même pour « supérieur
supérieur strictement
ou égal » ou à x.
« strictement supérieur ».
Les
Il courbes cumulatives
n’y a aucune F(x) etobservation
chance qu’une F’(x) sont symétriques parborne.
tombe sur une rapport à 0,5
C’est : F(x) + F’(x)
l’imprécision de = 1
l’instrument de mesure et un mauvais choix des bornes qui pourrait conduire à ce résultat.
42
VARIABLES QUANTITATIVES CONTINUES
COURBES CUMULATIVES
Quelle est la proportion p d’employés dont
x [ei – ei+1[ Fi F(x) l’augmentation est inférieure à 17 € ?
0 0
[0-3[ 0,391
3 0,391
0,95
1
5 0,680 0,8
0,7
[ 5 - 10 [ 0,920 0,6
10 0,920 0,5
30 0,993 -10
0
0 10 20 30 40 50 60
[30 - 50 [ 1 17
50 1
17 10
17 - 10 p - 0,92 D'où p 0,92 0,963 0,920 95%
20 10
20 - 10 0,963-0,920 43
TABLEAUX ET GRAPHIQUES
RESUME
Modalités dans
l ’ordre
Diagramme circulaire Courbes cumulatives des effectifs ou des fréquences
44