Cour L3 Josoa

Télécharger au format pdf ou txt
Télécharger au format pdf ou txt
Vous êtes sur la page 1sur 11

Introduction Quelques définitions

Statistiques descriptives Population:


Méthodes statistiques utilisées pour construire Ensemble des éléments qui forment le champ d’analyse
des tables, des graphiques et des résumés d’une étude particulière. Attention à la connotation
numériques des données. démographique!!
Taille notée : N
Statistiques inférentielles
ex : Ensemble de toutes les voitures immatriculées en 21
Tirer une conclusion (inférence) objective à
propos d’une population.
Basées sur l’information d’échantillons. Recensement:
Etude de tous les individus composant une population
finie (pas toujours facile bien sûr).

1 2

Quelques définitions (2) Introduction (quelques définitions)

Echantillon (sample) :
Individu: Sous-groupe d’une population donnée.
Élément composant la population. Taille notée : n

ex: Un sol prélevé à Fianarantsoa, Voiture ex : 20 étudiants de l’UA


immatriculée TAA
20 voitures passant devant la fac…

Caractère: Dans la plupart des cas, il est


Caractéristique propre à chacun des individus difficile d’obtenir l’information
à partir de la population dans
ex : Teneur en phosphore de ce sol, sa densité son ensemble. On utilise alors
apparente..., couleur de la voiture, puissance. Population un échantillon pour tirer des
conclusions sur la population.
Echantillon
3
4
Types de variables Variables qualitatives

Le choix de la méthode statistique se fait suivant la nature


de la variable. Variable qualitative:
1. Variables qualitatives
Modalité avec des mots ou des lettres
Echelle nominale (catégories).
Echelle ordinale
ex :‘homme’, ‘femme’, de la variable ‘ sexe ’,
2. Variables quantitatives
‘rouge’, ‘vert’… de la variable ‘ couleur ’; ‘non
Variables discrètes
qualifié ’, ‘ semi-qualifié ’, ‘ qualifié ’ de la variable
Variables continues
‘ qualification professionnelle ’ type de silex…

5 6

Variables qualitatives Variables qualitatives

Échelle nominale :
On dit d’une variable dont les catégories ne sont pas naturellement Une variable dichotomique est une variable qui ne
ordonnées, qu’elle est définie sur une échelle nominale. comporte que 2 catégories.
ex : sexe, types de haches, types d’amphores... ‘H’ ou ‘F’, ‘ présence ’ ou ‘ absence ’, ‘positif ’ ou ‘ négatif ’, ‘ marche ’
ou ‘ arrêt ’ ...
Échelle ordinale :
Si les catégories peuvent être ordonnées, on est en présence d’une
échelle ordinale.
ex : qualification professionnelle (travail d’un potier) ‘non qualifié’, ‘semi -
qualifié’, ‘qualifié ’
ATTENTION: On peut coder (0,1) des variables
dichotomiques, cela ne signifie pas que les catégories
ATTENTION: Indique la position dans une série ont un ordre logique. Ex. H/F!!
ordonnée mais
pas l’importance
de la différence. Pas de calculs algébriques!!

7 8
Variables quantitatives Variables quantitatives

Variables quantitatives : Variables discrètes:


Modalités avec valeurs numériques.

Ex: Teneur en Phosphore d’un sol, masse volumique du bois d’une Une variable quantitative est dite discrète si l’étendue des
espèce d’arbre, … valeurs possibles est dénombrable, c’est-à-dire si les
valeurs peuvent être énumérées sous la forme d’une liste
Attention à l’unité! de chiffre (a1, a2,…) ou plus souvent d’entiers naturels (0, 1,
2, 3,…).

ex : Nombre d’objets dans un dépôt, nombre de mots dans une phrase,


nombre de raisins sur une grappe,
Nombre de mots dans un texte…

9 10

Variables quantitatives Prospection des données: Méthodes tabulaires

Variables continues: Distribution de fréquences (absolues ou relatives)


Une variable quantitative est dite continue si les
valeurs possibles ne sont pas dénombrables. ƒ Un simple moyen et efficace pour organiser et
présenter les données tel qu’on peut avoir une image
Ex: poids d’un caprin, concentration en phosphore dans un sol,
globale de l’endroit ou les mesures sont concentrées
et dans quelle mesure elles sont dispersées.

ƒ Convient aux données qualitatives et quantitatives.

11 12
Prospection des données: Méthodes tabulaires (2)

Note /20 d’étudiants

Note examen/20 Effectif Fréquence relative (%)


10 1 1 Classes de notes n f
11 2 2
12 3 3 [10; 12] 6 0,062
13 8 8
14 14 14 [13; 15] 43 0,443
15 21 22
16 14 14 [16; 18] 41 0,423
17 15 15
18 12 12 >18 7 0,072
19 7 7
Total 97 100 97 1
13

Prospection des données: Méthodes tabulaires (3) Prospection des données: Méthodes graphiques

Distribution de fréquences cumulées Diagrammes en bâtons


Convient aux données quantitatives seulement. Diagrammes circulaires (pie-chart)
Histogrammes
Polygones de fréquences cumulées
Appréciati Borne
on Borne in sup n N f F
Passable 10 12 6 6 0,062 0,06
Assez-
bien 13 15 43 49 0,443 0,51
Bien 16 18 41 90 0,423 0,93
Très bien 19 20 7 97 0,072 1,00

15 16
Prospection des données: Méthodes graphiques (2) Prospection des données: Méthodes graphiques (3)

Diagrammes en bâtons (bar chart) Diagrammes circulaires

Convient (surtout et éventuellement) aux données


Variables qualitatives sur une échelle nominale ou
ordinale. QUALITATIVES
REMARQUES 60 n
50
•Aucun ordre n’est supposé 40

E ffe c tif
30
• Souvent les modalités Passable
20
ordonnées dans le sens des Assez-bien
10
fréquences croissantes ou Très bien
0
par ordre alphabétique
Passable Assez-bien Très bien
• Sur une échelle ordinale les Appréciation
données sont rangées suivant
leur ordre naturel.

17 18

Prospection des données: Méthodes graphiques (4)

Variables quantitatives discrètes

Modalités
25
discontinues mais suivant un ordre naturel. Note examen/20

20
Même règles que pour des variables qualitatives d’échelle
Effectif

15
ordinale. 1
10 2
3
5
Tableau statistique, diagramme en bâtons, diagramme 4
5
circulaire.
0 6
10 11 12 13 14 15 16 17 18 19 7
8
Dans le diagramme à bâtons,Note/20
modalités successives 9
10
contiguës.

19
Prospection des données: Méthodes graphiques (5) Prospection des données: Méthodes graphiques (6)

Histogrammes Polygones de fréquences cumulées


A ne pas confondre avec le diagramme baton!
• Tracé aux limites Tracé aux limites supérieures
• Convient aux données quantitatives seulement Convient aux données quantitatives seulement
•Superficie rectangleproportionnelle à l’effectif
ou fréquence
1,00

(%)
100

cumulée
cumulée
Fréquences
50 0,50
50

Fréquence
40
[10; 12]
Effectif

30 [13; 15]
[16; 18] 0,00
0
20
>18 10 [10; 12]12 [13;14
15] [16; 18]
16 18 >18 20
10
Classes de notes/20
Note/20
0
n
Classes de notes 21 22

Statistiques descriptives: paramètre de position (tendance centrale) Paramètre de position: MOYENNE

Moyenne
convient aux données quantitatives. Par individus
Médiane Moyenne arithmétique: Moyenne arithmétique pondérée:
convient aux données quantitatives et aux données d
qualitatives sur une échelle ordinale.
1 n ∑w x
x = ∑ xi
i i
Mode x= i =1
d
convient aux données quantitatives et aux données n i =1 ∑w i
qualitatives.
i =1

23 24
La tendance centrale (moyenne) La tendance centrale (moyenne)

Moyenne dans le cas continu (données catégorisées, groupées)


Classes [xi,xi+1[ Centres Effectifs Effectifs pondérés
On définit une subdivision de l’ensemble des valeurs donnant la [x0,x1[ m1 n1 n1.m1
distribution continue; soit ([xi,xi+1[,ni) avec i de 0 à p-1 cette [x1,x2[ m2 n2 n2.m2
subdivision. Soit mi le centre des classes, … …
[xp,xp-1[ mp np np.mp
p p
x + xi +1 ∑ ni ∑ ni mi
mi = i i =1 i =1
2 p p

On prend comme moyenne de x, la moyenne de la distribution


∑n m i i
En fait :
∑ n mˆ i i
m chapeau
discrète (mi,ni), avec i de 0 à p-1 x= i =1
p
x= i =1
p c’est une
∑n
i =1
i ∑n
i =1
i estimation!

25 26

Paramètre de position: MEDIANE


Paramètre de position: MEDIANE (2)
Médiane Pour des variables continues
Les données sont classées par ordre de magnitude.
Valeur pour laquelle la fréquence cumulée est égale à 0.50 ou point qui partage

n / 2 − ∑ ni (inf)
la distribution en 2 parties égales.
La médiane partage la série en 02 parties égales
med = L + ⋅c
Pour variables discrètes: ni ( med )
L: limite inférieure de la classe médiane
x⎛ n ⎞ + x⎛ n ⎞ n: nombre total d’observations
med = x⎛ n +1 ⎞ ⎜ ⎟ ⎜ +1 ⎟
∑ ni (inf) : somme des fréquences absolues des classes
⎜ ⎟ med = ⎝2⎠ ⎝2 ⎠
⎝ 2 ⎠ 2 se situant avant la classe médiane.
Pour n impair Pour n pair ni(med) : fréquence de la classe médiane
c: largeur de la classe médianec Paramètre de position:
MEDIANE
27 28
Paramètre de position: MEDIANE (3) Paramètre de position: MODE

Médiane :propriétés Le mode (mod) d’une variable qualitative (ou quantitative


discrète) est la valeur qui possède la fréquence la plus
Souvent utilisée pour les données démographiques. élevée.
Mode=valeur ou modalité la plus fréquente
Particulièrement adaptée pour décrire la tendance
centrale des échelles ordinales et des distributions
très étalées pour lesquelles la moyenne pondère
Quelques propriétés…
exagérément les valeurs extrêmes.
Le mode n’est pas toujours la valeur centrale de la
distribution.
La médiane est plus conservatrice. Donne l’individu
Une distribution peut avoir un ou plusieurs modes.
type.
N’est pas affecté par les valeurs exceptionnelles.
Bon indicateur des populations hétérogènes qui
présentent une ou plusieurs valeurs dominantes

29 30

Paramètre de position: MODE (2) La tendance centrale

Pour variables continues:


Chaque indicateur est sensible à un aspect de la
distribution...
R S
Δ1 P Mode corrigé
E F
Q Δ2
Ak:taille de l’intervalle mod med x
x med mod
contenant la classes modale
T

bk-1 X̂ bk ⎛ Δ1 ⎞ mod med x mod x , med mod


Mod corr . = bk −1 + ⎜⎜ ⎟⎟ Ak
Ak ⎝ Δ1 + Δ 2 ⎠ 31 32
Mesure de la dispersion Mesure de la dispersion: ETENDUE ou RANGE

Deux distributions de fréquence peuvent avoir la même Etendue de la variation (range) ou empan ou marge de
moyenne, la même médiane et le même mode et variation
présenter des formes très différentes:
C’est la différence entre la plus grande valeur et la plus
petite valeur de la variable.

Etendue = maximum - minimum

Exemple
Valeur maximum x = 174 mm
Valeur minimum x = 140 mm
Etendue de la variation = 174 - 140 = 34 mm

33 34

Mesure de la dispersion: ÉCARTS MOYEN, ÉCART MÉDIAN Mesure de la dispersion: VARIANCE

Ecart moyen : ∑x −x i
La variance est la moyenne arithmétique des carrés des
E.M . = i =1 écarts des valeurs à leur moyenne:
n
n

∑ x − med
i

∑x
Ecart médian : E.med . = i =1
n Moyenne : μ=
N

∑(x − μ)
i
2

Variance d’échantillon σ2 = i =1
N
35 36
Mesure de la dispersion: VARIANCE et ÉCART-TYPE Mesure de la dispersion: COEFFICIENT DE VARIATION

Propriétés:
• La variance est toujours > ou = à 0

• La variance est égale à 0 si toutes les valeurs sont identiques


échantillon
• En ajoutant une constante aux données, la variance ne change pas:
100 s x
V(X+cte)=V(X). C.V . =
x
• En multipliant par une constante, on modifie la variance par
un facteur multiplicatif égal au carré de la constante d ’origine
V(aX)=a²V(X)

L’écart type d’une distribution est égale à la racine de la


variance

σ = σ2
37 38

Mesure de la dispersion: QUANTILE Mesure de la dispersion: QUARTILE

L’intervalle interquartile est une mesure de dispersion


correspondant à l’intervalle comprenant 50% des
observations les plus au centre de la distribution. Organiser les n observations en distribution de
fréquence
Quartiles = observations pour lesquelles la fréquence
Quantiles: relative cumulée dépasse respectivement 25%, 50% et
• Quartiles : 4 parties égales 75%
• Déciles : 10 parties égales
• Centiles : 100 parties égales

25% 25% 25% 25%

1er quartile 2eme quartile 3eme quartile


médiane 39 40
Mesure de la dispersion: QUARTILE (2) Mesure de la dispersion (intervalle interquartile)

Pour variables continues


Groupement en classes (variable continue):
1er quartile : classe pour laquelle la freq. Rel. Cum. > 25% Conc Freq abs Freq abs cum Freq rel cum
100-200 10 10 0.1
2eme quartile : classe pour laquelle la freq. Rel. Cum. > 50%
200-300 20 30 0.3
•3eme quartile : classe pour laquelle la freq. Rel. Cum. > 75%
300-400 40 70 0.7
400-500 30 100 1
Total 100
⎡ (nq ) − ∑ ni (inf) ⎤
Q = L+⎢ ⎥⋅c Classe 1er quartile : 200-300
⎣ ni ( quartile) ⎦
⎡ (100 ⋅ 1 / 4 ) − 10 ⎤
Q1 = 200 + ⎢ ⎥⎦ ⋅ 100 = 275
L: borne inf de la classe du quartile
⎣ 20
n: nombre total d’observations Q2 = 350
q :1/4 pour 1er quartile, 1/2 pour Q2, 3/4 pour Q3
Q3 = 416.66
∑ ni (inf): Somme des effectifs. des classes se situant avant
la classe du quartile. IQ = 416.66 − 275 = 141.66
ni(quartile): Effectif de la classe du quartile.
c: largeur de la classe du quartile.
41 42

Vous aimerez peut-être aussi