0% ont trouvé ce document utile (0 vote)
710 vues17 pages

Stat Is Ti Que

Télécharger au format odt, pdf ou txt
Télécharger au format odt, pdf ou txt
Télécharger au format odt, pdf ou txt
Vous êtes sur la page 1/ 17

Statistiques descriptives

Exercice 1.
Soit la liste suivante des prénoms d’un groupe d’étudiants suivis entre parenthèses d’une
indication du nombre de livres lus dans l’année (A = peu, B = moyen, C = beaucoup, D =
exceptionnel) : Pierre (C), Paul (C), Jacques (A), Ralph (B), Abdel (A), Sidonie (B), Henri (C),
Paulette (B), Farida (B), Laure (C), Kevin (D), Carole (B), Marie-Claire (A), Jeanine (C), Julie
(C), Ernest (C), Cindy (C), Vanessa (D), José (C), Aurélien (C).
1. Définissez la distribution de ces étudiants suivant leur appétit de lecture (population,
caractère, etc.).
2. Construisez le tableau représentatif de cette distribution.
3. Représentez cette distribution à l’aide d’un diagramme en tuyaux d’orgue.

Corrigé

1. La population est constituée des 20 étudiants nommés, chacun constituant une unité
statistique. Le caractère est l’appétit de lecture, chaque étudiant étant caractérisé par un
appétit plus ou moins grand (ou égal) par rapport aux autres. Cet appétit serait un caractère
quantitatif s’il était mesuré par un nombre de livres lus. Une indication du nombre de livres lus
n’est pas une quantité mais une qualité, même s’il y a un ordre: moyen n’est pas un nombre.
Le caractère est donc qualitatif (et ordinal).Les modalités sont au nombre de quatre : A, B,
C ,D. Elles sont chacune une rubrique de la nomenclature des degrés de lecture.
2. Le tableau est alors constitué de quatre lignes (une par modalité) et deux colonnes (une
pour la nomenclature et une pour les effectifs), sans oublier le titre et la source des données :
Répartition du groupe en degrés de lecture

Degré de lecture Nombre d’étudiants

Peu 3

Moyen 5

Beaucoup 10

Exceptionnel 2

ou, si on veut gagner de la place, deux lignes et quatre colonnes :


Répartition du groupe en degrés de lecture

Degré de lecture Peu Moyen Beaucoup Exceptionnel


Nombre 3 5 10 2
d’étudiants

3. Le diagramme représentatif en tuyaux d’orgue consiste en 4 parallépipèdes rectangles droits


(un pour chaque modalité), tous de même largeur et d’aire (et donc de hauteur)
proportionnelle à l’effectif correspondant à chaque modalité :

Exercice 2.
1. Le bureau des statistiques du Cengio a mesuré les quantités produites par quatre secteurs
de sa zone de compétence, ce qui a donné les chiffres suivants (en unités de valeur) :

Produit Marbre Peaux Chimie Tourisme Total

Valeur 108 000 144 000 108 000 72 000 432 000

a- Caractérisez la distribution statistique correspondant à ces données (population, caractère,


etc.).
b- Représentez cette distribution par un diagramme en secteurs circulaires.

2. La même mesure effectuée par le bureau de Faggiana a donné ces chiffres (en unités de
valeur) :

Produit Marbre Peaux Chimie Tourisme Total

Valeur 86 400 115 200 86 400 57 600 345 600

a- Même travail que sur les données du Cengio.


b- Représentez les deux séries sur un même graphique, par deux demi-cercles opposés sur
une droite horizontale, l’aire de chaque demi-cercle étant dans la même proportion de la valeur
totale correspondante. (calculez les angles des secteurs pour une représentation par un
graphique en secteurs semi-circulaires et le rapport entre les rayons de chaque demi-cercle).

Corrigé

1. a- On pourrait certes définir une distribution des secteurs suivants leur niveau de production
(en faisant des classes : moins de 80 000 ; etc.), mais au vu des données (et aussi de la
question b- suivante !) il est naturel et habituel de considérer la distribution du produit suivant
les secteurs d’origine.
La population est constituée des 432000 UV de produit des quatre secteurs considérés, chaque
UV constituant une unité statistique : l’UV de produit.
Le caractère est le secteur productif d’origine, chacun correspondant à type de produit, ce qui
est une qualité. Le caractère est donc qualitatif.
Les modalités sont au nombre de quatre : Marbre, Peaux, Chimie, Tourisme. Elles sont
chacune une rubrique de la nomenclature des secteurs de production (en comptabilité
nationale on a les NAF, nomenclatures d’activités et de produits, dont NAF 60, 222 et 700 ; on
pourrait parler ici d’une NAF 4).

b- Le diagramme en secteurs circulaire représente les effectifs correspondant aux modalités


par des portions de cercle, des secteurs, dont les aires sont proportionnelles aux effectifs. On
trace donc un cercle de rayon quelconque et la proportionnalité des aires est obtenue par celle
des angles.
On construit le tableau suivant :

qi : angle du
fi : part du secteur
Secteur productif Valeur produite secteur (qi =
dans la valeur totale
fi.360°)
Marbre 108 000 0,25 90
Peaux 144 000 0,33 120
Chimie 108 000 0,25 90
Tourisme 72 000 0,16 60
Total
432 000 1 360

Il vient alors le diagramme ci-dessous (en utilisant un rapporteur, par exemple) :


2. a- On a évidemment la même distribution, la population étant cette fois constituée des 345
000 UV de produit des quatre secteurs considérés. On construit alors le tableau suivant :

Secteur productif Valeur fi : part du secteur qi : angle du


produite dans la valeur secteur (qi =
totale fi.360°)

Marbre 86 400 0,25 90

Peaux 115 200 0,33 120

Chimie 86 400 0,25 90

Tourisme 57 600 0,16 60

Total 345 600 1 360

On obtient les mêmes angles, c’est-à-dire qu’il y a juste une différence d’échelle entre les
mesures des deux bureaux des statistiques. Le diagramme est alors identique au précédent
(qui représente les données calculées par le bureau du Cengio).

b- Pour tracer un diagramme en secteurs semi-circulaire, on rapporte les effectifs à 180°, on


obtient donc les angles en divisant par deux ceux correspondants du diagramme circulaire.
Quant au rayons des deux demi-camemberts, ils doivent être dans un rapport tel que les aires
desdits demi-camemberts soient dans le rapport de 345 600 à 432 000.
Soien t A et r l’aire et le rayon du demi-camembert représentatif des données du bureau du
Cengio,
A’ et r’ ceux du demi-camembert représentatif des données du bureau de Faggiana.

Alors, on a :

Et il faut :
On en déduit :

d'où

On trace alors le diagramme demandé :

Exercice 3.
Dans la République du Cheutland , une enquête en vue de la réduction du montant des
allocations familiales, a été réalisée auprès d’une population de femmes de 40 ans. Cette
enquête a donné les résultats suivants :

Nombre d’enfants (xi) Nombre de femmes (ni)

0 10

1 20

2 20

3 30
4 20

1. Caractériser la distribution.
2. Tracer le diagramme différentiel.
3. Définir et représenter la fonction de répartition.
4. Donner la proportion des femmes ayant moins de 4 enfants.
5. Etablir la distribution des enfants selon le nombre de leurs frères et sœurs.

Corrigé

1. population : 100 femmes de 40 ans ; unité statistique : une femme ; caractère : le nombre d’enfants (caractère
quantitatif discret) ; modalités : au nombre de 5 (0,1,2,3,4).

2. La distribution statistique étant discrète, le diagramme différentiel est un


diagramme en bâtons. Dans ce diagramme, on porte en abscisse les
différentes modalités du caractère c’est à dire les différentes valeurs prises
par la variable (0,1,2,3,4) ; en ordonnée seront indiqués soit les effectifs soit
les fréquences relatives afférentes à chaque modalité.
3.

xi nombre d’enfants ni (effectif) fi (fréquence relative)

0 10 0,1

1 20 0,2

2 20 0,2

3 30 0,3

4 20 0,2

Total 100 1
3. La fonction de répartition d’une variable X notée F est une application de
l’ensemble R dans l’ensemble R, qui à toute valeur donnée x de R, associe le nombre
d’individus appartenant à la population pour lesquels la valeur de la variable est
strictement inférieure à x.
En termes de proportion, la fonction de répartition est une application de l’ensemble
R dans l’intervalle [0,1], qui à toute valeur donnée x de R, associe la proportion des
individus appartenant à l’ensemble statistique pour lesquels la valeur de la variable
est strictement inférieure à x.

xi nombre d’enfants Ni (effectif cumulé) Fi (fréquence cumulée)

0 10 0,1

1 30 0,3

2 50 0,5

3 80 0,8

4 100 1
4. La proportion des femmes ayant moins de 4 enfants se lit directement
dans le tableau : 0,8 ou 80%.

5. A partir de la distribution précédente, il faut construire une nouvelle


distribution des enfants selon le nombre de leurs frères et sœurs. La
variable x’i (nombre de frères et de sœurs) prend les valeurs i=1, 2, 3.
L’effectif correspondant est alors déterminé par les produits ni.xi.

Nombre de frères et sœurs (x’i) Nombre d’enfants (ni.xi)

1 40

2 90

3 80

Exercice 4.

La CIPRES (organisme d’enquête et de sondage) a réalisé une enquête, pour le compte du


syndicat CGBC, sur le nombre de salariés de 40 entreprises industrielles de la région
d’Aquitaine équatoriale. Le dépouillement des questionnaires a donné les résultats suivants :
32 58 59 52 53 43 37 39 86 40

51 30 52 50 51 36 79 63 64 48

82 53 24 59 20 44 45 45 41 75
90 61 55 22 56 47 76 62 66 99

1. Définir la population (ensemble statistique), l’unité statistique (individu), le caractère


et ses différentes modalités.
2. A partir des données de l’enquête, établir la distribution des entreprises selon le
nombre de salariés. Pour ce faire, on définit 5 classes de valeur de la variable
d’amplitudes respectives : 20, 10, 10, 20, 20. La borne inférieure de la distribution est
fixée à 20 et la borne supérieure à 100.
3. Tracer le diagramme différentiel.
4. Définir la fonction de répartition et tracer le diagramme intégral.

Corrigé

1. L’ensemble statistique est constitué par les 40 entreprises enquêtées. L’unité statistique
objet de l’observation est l’entreprise. Le caractère, le nombre de salariés, est un caractère
quantitatif. Les modalités sont les valeurs prises par le caractère, elles s’échelonnent de 20 à
99.
2. Les données brutes issues de l’enquête sont discrètes. En effet à chaque unité statistique
correspond un effectif entier spécifique de salariés. La transformation en distribution
continue répond à plusieurs préoccupations : simplification, clarté des représentations
graphiques... Il est à noter que cette transformation engendre une perte d’information par
rapport aux données brutes.

Nombre de salariés xi Dénombrement Nombre d’entreprises ni

[20, 40[ 8

[40, 50[ 8

[50, 60[ 12

[60, 80[ 8

[80, 100[ 4

3. La distribution étant continue, le diagramme différentiel est un histogramme.

xi ni ai a’i = ai/u d’i = ni/a’i

[20, 40[ 8.00 € 20.00 € 2.00 € 4.00 €

[40, 50[ 8.00 € 10.00 € 1.00 € 8.00 €

[50, 60[ 12.00 € 10.00 € 1.00 € 12.00 €


[60, 80[ 8.00 € 20.00 € 2.00 € 4.00 €

[80, 100[ 4.00 € 20.00 € 2.00 € 2.00 €

Les classes de valeur de la variable possèdent des amplitudes différentes, il convient


donc de rectifier les effectifs ou les fréquences en vue de la représentation graphique.
Le PGCD des amplitudes a pour valeur 10. Cette valeur constitue l’unité (u = 10) dans
laquelle sont exprimées les amplitudes des 5 classes. L’amplitude de la classe i a pour
nouvelle valeur : a’i = a i /u. On calcule ensuite la densité d’effectif ou de fréquence d’i
= ni/ a’i ou d’i = fi/ a’i. Ces valeurs sont portées sur l’axe des ordonnées.

4. Le diagramme intégral est la courbe des fréquences cumulées croissantes, représentative


de la fonction de répartition. Cette courbe est en fait une ligne brisée.

xi ni Ni Fi

[20, 40[ 8 8 0,2

[40, 50[ 8 16 0,4

[50, 60[ 12 28 0,7

[60, 80[ 8 36 0,9


[80, 100[ 4 40 1

Exercice 1.
Au cours des quatre dernières années, le chiffre d’affaires d’une entreprise a connu des taux de croissance respectifs de
r1, r2, r3, r4.

1. Exprimer le taux de croissance global du chiffre d’affaires (R), sur l’ensemble de la période en fonction de r1,
r2, r3, r4.
2. Exprimer le taux de croissance annuel moyen du chiffre d’affaires (r), en fonction de (R) et de r1, r2, r3, r4.
3. Quelle devrait être la valeur du taux de croissance annuel moyen du chiffre d’affaires relatif à la période
comprenant la troisième et la quatrième année, que l’on notera , r’3.4, pour que le chiffre d’affaires de la
quatrième année soit égal à celui de la première.
4. Le prix de vente des produits vendus par l’entreprise a connu des taux de croissance annuels respectifs de p1,
p2, p3, p4, au cours des quatre années considérées. Exprimer q, le taux de croissance annuel moyen des
quantités vendues en fonction de r1, r2, r3, r4 et de p1, p2, p3, p4.

Corrigé

1. Le multiplicateur (facteur de croissance) sur l’ensemble de la période est égal au produit des multiplicateur annuels :

2. Le multiplicateur annuel moyen est la moyenne géométrique des multiplicateurs annuels.


Le taux de croissance annuel moyen peut également s’exprimer en fonction du taux de croissance global

.
3. Il est tout d’abord possible de calculer le taux de croissance r3.4 afférent aux deux dernières années, qui annule R le
taux de croissance quadriennal.

L’hypothèse est R = 0, d’où

On en déduit r’3.4

4. Le chiffre d’affaires = prix * quantité, ce qui donne :

Exercice 2.
La valeur des ventes annuelles d’un bien par une entreprise commerciale est notée , où t désigne les années.

t 1 2 3 4 5

(en francs)
10000 9000 11000 15000 20000

log10 3,78 3,95 4,04 4,18 4,3

• 1. Rappelez l’intérêt analytique d’un graphique semi-logarithmique pour la représentation d’une série
chronologique, puis représentez la série de la valeur des ventes par un tel graphique.
2. Présentez deux méthodes possibles permettant d’obtenir le taux de croissance annuel moyen de la valeur des
ventes sur la période (aucun calcul n’est demandé).
3. On appelle volume des ventes pour l’année t, le produit des quantités vendues l’année t par le prix du bien de

l’année 1. Ce volume est noté . On suppose qu’il s’accroît de 10% chaque année.

Exprimez en fonction de t et représentez son évolution sur le même graphique semi-logarithmique que la
valeur des ventes (explicitez comment vous la tracez).
4. On appelle A le point représentatif de la valeur des ventes pour une année donnée t et B le point représentatif
du volume des ventes de la même année. La longueur AB sur le papier semi-logarithmique représente alors le
logarithme décimal d’une variable Zt.
Montrez ce qu’est exactement la variable Zt. Déterminez par une méthode graphique clairement explicitée (en
utilisant les graduations de l’échelle logarithmique et sans calcul numérique) la valeur (approchée) de Zt pour
l’année 5. Commentez ce résultat.

Corrigé

1. L’intérêt analytique d’une représentation semi-logarithmique est qu’elle met en valeur le


taux d’accroissement relatif de la variable. Des points alignés en semi-log traduisent une
croissance de la variable à taux (relatif) constant. Pour la représentation graphique,
l’utilisation la plus simple et la plus naturelle du papier fourni consiste à fixer la cote de
l’origine à 1000 (premier 1, origine de l’axe des ordonnées), le 2 à 2000, le 1 suivant à 10000…
Il n’est pas exclu cependant de choisir d’autres valeurs pour la cote d’origine. Par exemple :
5000 (cotes : 5000, 10000, 15000.…) ou 6000 (cotes : 6000, 12000, 18000…). La représentation
obtenue est identique dans tous les cas, sauf qu’elle subit une translation verticale.
2. Le facteur de croissance (ou multiplicateur) annuel moyen (1+rm) est la moyenne géométrique des facteurs de
croissance annuels de la période considérée :
(1+rm) = ((1+r1) (1+r2) (1+r3) (1+r4))1/4

et rm = ((1+r1) (1+r2) (1+r3) (1+r4))1/4-1

Chacun des facteurs annuels étant égal au rapport des valeurs des ventes de l’année courante et de l’année
précédente : Yt/Yt-1 .

Le facteur de croissance (ou multiplicateur) annuel moyen (1+rm) est aussi égal à la racine énième du facteur
de croissance relatif à l’ensemble de la période (1+R).
Dans notre exemple : (1+rm) = (1+R)1/4 = (Y5/Y1)1/4 .

La relation entre les deux méthodes apparaît très simplement :


(1+rm)4 = (Y2/Y1) (Y3/Y2) (Y4/Y3) (Y5/Y4) = (Y5/Y1)

Par hypothèse, le facteur de croissance (1+r) pour Yt est constant et égal à 1,1. De plus, X1 = Y1 = 6000, car
valeur et volume sont égaux en 1. On peut donc considérer que : Yt = 6000 * 1,1t-1 . Cette exponentielle est
représentée par une droite dans un graphique semi-logarithmique. Cette droite passe par (1, 6000). Il suffit de
calculer une autre valeur pour pouvoir tracer la droite. Le calcul complet des 5 valeurs (non nécessaire) donne :

t 1 2 3 4 5
Yt 6000 6600 7260 7986 8785

4. Posons : pt : prix du bien au cours de l’année t,

qt : quantité du bien vendue au cours de l’année t.

Zt représente le facteur de croissance du prix du bien par rapport à l’année 1. Pour donner une estimation de Z5,
il suffit d’utiliser en sens contraire la propriété de l’échelle logarithmique, et de retrouver un nombre à partir de
son logarithme décimal. Pour ce faire, il suffit de reporter la longueur AB à l’origine du graphique. La longueur
A’B’ correspond à la cote 2,3 qui est la valeur de Z5 (2,3 et pas 2300 car A’B’ doit être reporté à la vraie origine
de l’échelle logarithmique qui est le point de cote 1 (log1=0)).
On a donc p5/p1 = 2,3 ou (p5-p1)/p1 = 130%.

Au cours de la période considérée, le prix du bien a plus que doublé, il a augmenté de 130%.
Remarque : la détermination par le calcul de Zt donne 2,28.

Exercice 4. Soit la distribution de 40 entreprises selon le nombre de micro-ordinateurs utilisés.

Nombre de micro- Nombre


ordinateurs d’entreprises

1 5

2 15

3 10

4 10

• Calculez les valeurs des moyennes arithmétique, harmonique, quadratique et géométrique et vérifiez leurs positions
respectives.

Corrigé
Nombre de
micro-
Nombre
d’entreprises n i xi ni/xi log xi ni log xi xi² n i xi ²
ordinateurs
xi ni

1 5 5 5 0 0 1 5

2 15 30 7,5 0,30103 4,51545 4 60

3 10 30 3,33 0,47712 4,7712 9 90

4 10 40 2,5 0,60206 6,0206 16 160

S 40

La moyenne arithmétique :


La moyenne harmonique :

la moyenne géométrique:

La moyenne quadratique :

Les valeurs des moyennes s’échelonnent ainsi :


2,182 < 2,414 < 2,685 < 2,806
On obtient :

Vous aimerez peut-être aussi