TD Statistiq

Télécharger au format pdf ou txt
Télécharger au format pdf ou txt
Vous êtes sur la page 1sur 12

SPSE - Première année de Licence

PLPSTA12 - Médodologie de la mesure en sciences humaines

Exercices

Exercise 1 Préciser le type des variables statistiques suivantes :

Série du baccalauréat; Durée du trajet domicile-université; Mode de transport; Nombre de frères et soeurs;
Note en français au baccalauréat; Catégorie socio-professionnelle du père; Age des enfants; Couleur préférée;
Nationalité; PIB.
Réponses à la question Aimez-vous les stats ? : Pas du tout ; un peu; moyennement; beaucoup; je
ne sais pas.
Réponses à la question Aimez-vous les stats ? : Pas du tout ; un peu; moyennement; beaucoup.

Exercise 2 On a relevé pour vingt femmes sourant d'anémie certaines caractéristiques biologiques et soci-
ologiques. Le tableau ci-dessous résume les résultats obtenus.

Individu Groupe sanguin Âge Nombre d'enfants


1 B 38 3
2 AB 42 4
3 A 16 0
4 A 51 2
5 O 28 1
6 A 34 1
7 O 21 1
8 A 54 4
9 AB 35 0
10 A 22 3
11 A 18 0
12 B 40 2
13 O 41 1
14 O 31 2
15 A 25 1
16 AB 64 6
17 A 60 1
18 O 55 0
19 B 49 2
20 A 42 2

1. Déterminer la population. Quel est l'eectif total ?

2. Donner le type de chaque variable statistique.

3. Déterminer la distribution des eectifs puis celle des proportions des variables groupe sanguin et nombre
d'enfants.

4. Représenter graphiquement la variable groupe sanguin.

5. Quel est le mode de la variable groupe sanguin ?

Exercise 3 En 1990, lors du recensement eectué par l'INSEE, on a étudié la répartition des ménages français
selon leur type. Les résultats furent les suivants (en milliers)

Type de Homme Femme Homme + Femme + Couples Autres


ménage seul seule enfant(s) enfant(s)
Eectif 2171 3673 225 1325 13702 443

1. Déterminer la population étudiée et le type de la variable type de ménage.

2. Quel était le nombre de ménages en 1990 ?

1
3. Calculer la proportion de ménages composés d'un seul individu en 1990.

4. Quel est le mode de la variable type de ménage ?

5. Lors d'une enquête en 1999, on a de nouveau recensé la répartition des ménages français selon leur type.
Les résultats furent les suivants (en milliers)

Type de Homme Femme Homme + Femme + Couples Autres


ménage seul seule enfant(s) enfant(s)
Eectif 2942 4411 259 1444 14603 489

(a) Quel était le nombre de ménages en 1999 ?

(b) Calculer la proportion de ménages composés d'un seul individu en 1999.

6. Calculer les distributions des proportions en 90 et 99 et représenter sur un même graphique les résultats
observés pour les deux années.

Exercise 4 On a recensé en 1993 et 1998 la répartition du personnel enseignant du supérieur suivant leur
statut. Les résultats furent les suivants :

Statut Professeurs Maîtres de conférences et assistants ATER Autres Total


Eectif en 1993 17000 30700 6600 11200
Eectif en 1998 16600 31400 5500 25200

1. Déterminer les populations. Quel était le nombre d'enseignants du supérieur en 1993 et 1998 ?

2. Quel est le type de la variable statut ?

3. Déterminer les distributions des proportions de la variable statut en 1993 et 1998.

4. Quel est l'intérêt de travailler avec la distribution des proportions plutôt qu'avec la distribution des eectifs
?

5. Représenter sur le même graphique la distribution des proportions de la variable statut en 1993 et 1998.

Exercise 5 Pendant l'année universitaire 1998-99, la répartition des étudiants par discipline était :
Discipline Pourcentage
Sciences Humaines et Sociales 13,70%
Droit - Sciences Politiques 7,50%
Médecine - Pharmacie 9,20%
Langues 3,70%
Sciences et Structure de la matière - Sciences de la vie - Sciences de l'ingénieur 23,20%
Lettres - Sciences du Langage - Arts 17,10%
Administration Économique et Sociale 6,70%
Sciences et Techniques des Activités Physiques et Sportives 10,40%
Économie et Gestion 8,50%

1. Déterminer la population, la variable étudiée et son type.

2. Faire sa représentation graphique.

3. Quel est le mode de la variable ?

4. Sachant que le nombre d'inscrits en 1998-99 était de 1363000, déterminer la distribution des eectifs.

Exercise 6 Un sondage intitulé les français et la vie sans télévision a été réalisé les 5 et 6 septembre 1997
auprès de 1200 français de 18 ans et plus. Les réponses obtenues à la question Vous arrive-t-il de regretter
d'avoir la télévision ? ont permis d'établir la distribution suivante :

Réponse Pourcentage
Souvent 7%
De temps en temps 23%
Rarement 10%
Jamais 56%
N'a pas la télévision 4%

2
1. Déterminer la population, sa taille, la variable étudiée et son type.

2. Représenter graphiquement la distribution de la variable.

3. Quel est le mode de la variable réponse ?

Exercise 7 Lors d'une enquête menée au troisième trimestre 1999, on a étudié le niveau d'équipement infor-
matique des foyers français; ce niveau est codé: A (pas d'équipement informatique), B (Micro-ordinateur seul),
C (Micro-ordinateur + Imprimante) , D (Micro-ordinateur + Imprimante + Modem + Accès Internet). Les
résultats furent les suivants, en pourcentage :

Niveau d'équipement A B C D
Pourcentage 78,90% 5,70% 10,30% 5,10%

1. Déterminer la population, sa taille. Quel est le type de la variable niveau d'équipement informatique ?

2. Représenter graphiquement la distribution des proportions de cette variable.

Exercise 8 On reprend les données de l'exercice 2 et on s'intéresse à la variable nombre d'enfants.

1. Rappeler la population, sa taille et le type de la variable nombre d'enfants.

2. Déterminer la distribution des proportions de la variable nombre d'enfants.

3. Représenter graphiquement la variable nombre d'enfants.

4. Calculer le nombre d'enfants moyen

(a) à partir des données individuelles.

(b) à partir de la distribution des eectifs.

(c) à partir de la distribution des proportions.

5. Quel est le mode de la variable nombre d'enfants ?

6. Quelle est la proportion d'individus ayant plus de trois enfants ?

7. Déterminer la médiane.

8. Calculer l'écart-type de la variable nombre d'enfants

(a) à partir des données individuelles.

(b) à partir de la distribution des eectifs.

(c) à partir de la distribution des proportions.

Exercise 9 On a fait passer à des étudiants de première année un test de culture générale en leur posant dix
questions. On a alors relevé le nombre d'erreurs.

Nombre d'erreurs 0 1 2 3 4 5 6 7 8 9 Total


Eectif 1 5 12 57 60 103 89 129 99 12

1. Dénir la population. Quel est l'eectif total de la population ?

2. Quel est le type de la variable nombre d'erreurs ?

3. Déterminer la distribution des proportions de la variable nombre d'erreurset représenter la graphique-


ment.

4. Calculer le nombre moyen d'erreurs.

5. Calculer la médiane.

6. Quelle est la proportion d'étudiants ayant fait moins de deux erreurs ? Deux ou moins de deux erreurs ?

7. Quelle est la proportion d'étudiants ayant fait plus de sept erreurs ? Ayant fait sept erreurs et plus ?

8. Calculer l'écart-type de la variable nombre d'erreurs.

3
Exercise 10 Pour étudier les facteurs liés à la survenue d'un accouchement prématuré, on a réalisé une enquête
portant sur 203 femmes enceintes dont l'accouchement n'était pas arrivé à terme. Pour chaque femme, on a
recueilli son degré d'exposition à des événements stressants pendant la durée de sa grossesse (du début à 30
semaines de grossesse), mesuré par le score MOLES (Major Objective Life Event Score) noté en points entiers
de 0 (pas d'évènements stressants) à 3 (évènements stressants importants). Les résultats furent les suivants :

Score MOLES 0 1 2 3 Total


Eectif 165 16 12 10

1. Quel est le type de la variable score MOLES ?

2. Représenter graphiquement la distribution des proportions de la variable score MOLES.

3. Calculer le mode, la moyenne et la médiane de la variable score MOLES.

Exercise 11 Lors du recensement de 1996 au Canada, on a relevé par habitation le nombre de personnes vivant
sous le même toit. Les résultats furent les suivants :

Nombre de personnes par habitation 1 2 3 4 5 6 7 8 Total


Eectif en milliers 4482 3504 1768 1805 655 158 31 14

1. Quelle est la population étudiée ? Quel est l'eectif total de la population ? Quel est le type de la variable
nombre de personnes par habitation ?

2. Déterminer et représenter graphiquement la distribution des proportions de la variable nombre de per-


sonnes par habitation.

3. Donner le mode de la variable nombre de personnes par habitation.

4. Quel est le nombre moyen de personnes par habitation ?

5. Quelle est la médiane de la variable nombre de personnes par habitation ?

6. Quelle est la proportion d'habitations où vivent plus de six personnes ?

7. Quelle est la proportion d'habitations où vivent moins de quatre personnes ?

8. Calculer l'écart-type de la variable nombre de personnes par habitation.

Exercise 12 On étudie les ménages par la nationalité du chef de famille. On indique dans le tableau ci-
dessous l'eectif et le nombre moyen de personnes par ménage pour chaque nationalité. En déduire la moyenne
du nombre de personnes dans un ménage pour l'ensemble de la population.

Nationalité du chef de famille Français Union Européenne Autres Ensemble de la population


Eectifs 22 434 851 598 100 777 210 23 810 161
Moyenne 2,37 2,67 3,51

Exercise 13 On fait passer un test de vocabulaire à des enfants issus de milieu urbain ou rural. On relève pour
chaque enfant le nombre de mots diciles reconnus au cours du test. Les résultats sont les suivants :

Provenance des enfants milieu urbain milieu rural


Eectif 221 112
Nombre moyen de mots reconnus 6,7 7,6

1. Déterminer la population, son eectif, la variable étudiée et son type.

2. Quel est le nombre moyen de mots reconnus pour l'ensemble des enfants ?

Exercise 14 On a mesuré la teneur minérale des vertèbres lombaires de quarante femmes. Les mesures obtenues
2
furent (en g/dm ):

60 61 63 64 66 67 69 70
71 71 72 74 75 75 76 76
77 77 78 79 79 80 81 81
81 82 82 83 84 84 85 86
87 88 88 89 92 94 95 97

4
1. Déterminer la population étudiée, la variable statistique et le type de la variable.

2. On décide de regrouper les données individuelles suivant le découpage en classes :

Teneur minérale [60,70] ]70,75] ]75,85] ]85,90] ]90,100]


Déterminer la distribution des eectifs de la variable teneur minérale associée à ce découpage en classes.

Exercise 15 On reprend les données de l'exercice 2.

On décide de regrouper les données individuelles de la variable âge selon le découpage suivant :

]0, 18] , ]18, 25] , ]25, 35] , ]35, 49] , ]49, 55] et ]55, 70].

1. Déterminer la distribution des eectifs puis des proportions de la variable âge associée à ce découpage
en classes..

2. Représenter graphiquement la variable âge.

3. Quelle est la classe de plus grande proportion ? Quelle est la classe modale ?

4. On cherche la proportion d'individus âgés de moins de 25 ans. Représenter sur l'histogramme cette
proportion et en donner une approximation.

5. De même, donner une approximation de la proportion d'individus de plus de 49 ans, qui ont entre 25 et
49 ans, entre 40 et 60 ans.

Exercise 16 En 1994, l'INSEE a recensé la répartition par âges des 15 840 000 actifs âgés de 18 ans à 65 ans
ayant une activité à temps complet. Le résultat de ce recensement fut le suivant :

Age ]18,25] ]25,30] ]30,35] ]35,40] ]40,45] ]45,50] ]50,55] ]55,65]


Eectif 2 960 000 2 610 000 2 350 000 2 180 000 2 110 000 1 760 000 1 130 000 740 000

1. Quelle est la population étudiée ? Quel est le type de la variable âge ?

2. Représenter graphiquement la distribution des proportions de la variable âge.

3. Représenter sur l'histogramme la proportion d'actifs ayant moins de 30 ans ou plus de 50 ans, puis calculer
cette proportion.

Quelle est la proportion d'actifs ayant entre 30 ans et 50 ans ?

4. Représenter sur l'histogramme la proportion d'actifs ayant entre 20 et 30 ans, puis calculer cette propor-
tion.

5. Déterminer la classe modale de la variable âge.

6. Déterminer la distribution des fréquences cumulées.

7. En utilisant la fonction de répartition, retrouver les résultats des questions 3 et 4. Puis calculer la propor-
tion d'actifs ayant entre 26 et 54 ans

8. Calculer l'âge moyen des actifs ayant une activité à temps complet en 1994. La moyenne calculée ainsi
est-elle exacte ou approchée ?

9. Calculer l'écart-type de la variable âge.

Exercise 17 En France, pour l'année 1990, le nombre de naissances hors mariage selon l'âge de la mère est
donné dans le tableau suivant :

Âge de la mère ]16,20] ]20,25] ]25,30] ]30,35] ]35,40] ]40,46] Total


Eectif 14000 69000 75000 46000 19000 5000

1. Déterminer la population et sa taille. Donner le type de la variable âge de la mère.

2. Déterminer la distribution des proportions de la variable âge de la mère et représenter la graphiquement.

3. Sur l'histogramme, représenter graphiquement la proportion de femmes ayant un enfant hors mariage
entre 21 ans et 34 ans. Calculer cette proportion.

5
4. Déterminer la classe modale de la variable âge de la mère.

5. Déterminer l'âge moyen de la mère.

6. Calculer l'étendue, l'écart-type de la variable.

Exercise 18 On reprend les données des exercices 2 et 15.

1. Calculer l'âge moyen des individus à partir des données individuelles, puis à partir de la distribution des
proportions.

2. Calculer l'écart-type de la variable âge à partir de la distribution des proportions.

3. Déterminer la distribution des proportions cumulées de la variable âge.

4. Calculer la médiane.

Exercise 19 Une compagnie de taxis s'intéresse au kilométrage eectué par ses véhicules. A cet eet, elle a
relevé le kilométrage de 50 de ses taxis pour une matinée de travail.

Classes (en km) ]10;20] ]20;30] ]30;40] ]40;60] ]60;90] ]90;130] Total
Nb de taxis 7 10 20 6 3 4

1. Tracer l'histogramme de cette distribution.

2. Donner la classe modale, la médiane, la moyenne et l'écart-type de la distribution.

3. On regroupe maintenant les données sur les classes (de même amplitude) ]10;40], ]40;70], ]70;100] et
]100;130]. Tracer l'histogramme. Recalculer les paramètres de la question 2 et comparer les résultats.

Exercise 20 Une machine emplit automatiquement les paquets de tabac. On prélève un échantillon de la
production, et après pesée, on obtient les résultats suivants :

Poids (en gr) ≤38 ≤39 ≤39.5 ≤40 ≤40.5 ≤41 ≤41.5 ≤42 ≤42.5 ≤43 ≤44
Eectifs cumulés 0 3 8 18 31 51 69 84 95 99 100

1. Reconstiuer les classes. Tracer l'histogramme de cette distribution.

2. Donner la classe modale, la médiane, la moyenne et l'écart-type de la distribution.

3. On regroupe maintenant les données sur les classes de même amplitude 2 grammes. Tracer l'histogramme.
Recalculer les paramètres de la question 2 et comparer les résultats.

Exercise 21 On reprend les données de l'exercice 14.

1. Rappeler la population, sa taille. Donner le type de la variable teneur minérale.

2. Déterminer la distribution des proportions de la variable teneur minérale associée à ce découpage en


classes.

3. Représenter graphiquement la distribution des proportions de la variable teneur minérale. Représenter


sur ce graphique la proportion de femmes dont la teneur minérale des vertèbres lombaires est inférieure
ou égale à 65. Calculer cette proportion à partir du graphique.

4. Calculer la proportion de femmes dont la teneur minérale des vertèbres lombaires est inférieure ou égale
à 65 à partir des données individuelles.

5. Calculer la moyenne et l'écart-type de la variable teneur minérale en utilisant

(a) les données individuelles sachant que la somme des données individuelles est égale à 3139 et que la
somme des carrés des données individuelles est égale à 249 725.

(b) les données regroupées en classes.

6. Déterminer la distribution des proportions cumulées de la variable teneur minérale.

7. Déterminer la médiane, le premier et le neuvième décile de la variable teneur minérale.

6
8. Déterminer les trois quartiles et représenter la boîte à moustaches.

Exercise 22 On reprend les données de l'exercice 16.

1. Rappeler la population, sa taille. Donner le type de la variable âge.

2. Déterminer la médiane de la variable âge.

3. Quel quantile peut-on déduire de l'information suivante : 75% des actifs sont âgés de plus de 27 ans ?

4. Déterminer le troisième quartile de la variable âge.

Exercise 23 On reprend les données de l'exercice 17.

1. Rappeler la population, sa taille. Donner le type de la variable âge de la mère.

2. Déterminer la distribution des proportions cumulées de la variable âge de la mère.

3. Déterminer les trois quartiles de la variable âge de la mère.

4. Représenter la boîte à moustaches.

5. Donner l'intervalle de variation à 99%.

Exercise 24 En 1994, en France, la répartition des 15 840 000 actifs ayant une activité à temps complet par
tranche de salaire net annuel (en milliers de Francs) était :

Salaire ]0,40] ]40,80] ]80,120] ]120,200] ]200,300] ]300,1000]


Proportion 6,40% 29,60% 33,60% 21,60% 5,70% 3,10%

1. Quelle est la population, donner sa taille.

2. Quel est le type de la variable salaire ?

3. Représenter graphiquement la distribution des proportions de la variable salaire. Représenter graphique-


ment et calculer la proportion de salariés gagnant plus de 100 000 F net par an.

4. Déterminer la classe modale de cette variable.

5. Calculer la moyenne et l'écart-type de la variable salaire . Les valeurs calculées sont-elles exactes ou
approchées ?

6. Déterminer la distribution des fréquences cumulées de la variable salaire.

7. Déterminer les trois quartiles de la variable salaire. Représenter la boîte à moustaches.

8. Donner l'intervalle de variation à 90%.

9. On décide de découper la classe ]80,120] en deux classes ]80,100] et ]100,120].

(a) Déterminer la distribution des proportions de la variable salaire associé à ce nouveau découpage
sachant que 2 131 000 actifs ont un salaire net annuel compris entre 80 000 F et 100 000 F.

(b) Calculer la proportion d'actifs gagnant moins de 100 000 F par an.

(c) Calculer la moyenne de la variable salaire en utilisant ce nouveau découpage en classes.

(d) Déterminer la médiane de la variable salaire associée à ce nouveau découpage en classes.

(e) Déterminer l'intervalle de variation à 90% associé à ce nouveau découpage en classes.

10. Convertir la moyenne, l'écart type, la médiane en euros (1 euro=6,56 francs).

Exercise 25 Les scores à un test d'estime de soi mesuré sur l'échelle S.E.I de Rosenberg on été relevés pour
246 salariés. On assimile la variable score à une variable quantitative continue. Les scores obtenus regroupés
par intervalle sont donnés dans le tableau suivant :

Score ]15,20] ]20,30] ]30,40] ]40,50] Total


Eectif 4 55 128 59

7
1. Quelle est la population, donner sa taille. Quel est le type de la variable score ?

2. Représenter graphiquement la distribution des proportions de la variable score.

3. Dans une autre population composée de 54 chômeurs, les scores d'estime de soi se répartissaient ainsi :
Score ]15,20] ]20,30] ]30,40] ]40,50] Total
Eectif 4 17 26 7

4. Déterminer la distribution des proportions de la variable score sur la population composée des 54
chômeurs et représenter la graphiquement (on utilisera le graphique tracé en 1).

5. Quelle est la classe modale de la variable score sur la population des 246 salariés ? Sur la population
des 54 chômeurs ?

6. Calculer le score moyen des 246 salariés et le score moyen des 54 chômeurs.

7. En utilisant seulement les scores moyens calculés à la question précédente, calculer le score moyen des 300
individus étudiés.

8. Calculer le score médian des 246 salariés puis le score médian des 54 chômeurs.

9. Peut-on, à partir des résultats de la question précédente, calculer directement le score médian des 246
salariés et 54 chômeurs considérés comme une même population ?

10. Calculer le score médian des 246 salariés et 54 chômeurs considérés comme une même population.

Exercise 26 On a mesuré la température corporelle de 65 hommes et 64 femmes. La température moyenne des


hommes est de 98,105 degrés F avec un écart type de 0,693. La température moyenne des femmes est de 98,356
degrés F avec un écart type de 0,679.

1. Quelle est la population, donner sa taille. Quel est le type de la variable température ?

2. Quelle est la température moyenne des 129 personnes ?

3. Convertir les résultats en degrés Celsius sachant que d◦ C = (d◦ F − 32) × 59 .

Exercise 27 On a mesuré le stress perçu par le sujet dans son cadre social et dans son environnement pour
108 étudiants de première année. Les scores obtenus, en considérant que la variable score est une variable
continue, sont donnés par le tableau suivant :

Score ]0,15] ]15,20] ]20,25] ]25,30] ]30,35] ]35,40] ]40,80] Total


Eectif 40 16 16 9 9 0 18

1. Quelle est la population, donner sa taille. Quel est le type de la variable score ?

2. Représenter graphiquement la distribution des proportions de la variable score.

3. Quelle est la classe modale de la variable score ?

4. Représenter graphiquement la proportion approchée d'étudiants ayant un score compris entre 5 et 19.

5. Calculer la moyenne et l'écart-type de la variable score.

6. Déterminer la distribution des proportions cumulées de la variable score.

7. Calculer la médiane, le quantile d'ordre 20% et le troisième quartile de la variable score.

8. Déterminer l'intervalle de variation de niveau 90%.

9. On veut normaliser le test de façon que la moyenne des scores soit égale à 100. Que faut-il faire ?

Exercise 28 On a enregistré chez 116 patients hospitalisés pour dépression, un échantillon de leur voix, an
de mesurer la fréquence fondamentale, plus simplement dénommée hauteur de voix. On a obtenu les résultats
suivants :

Hauteur de voix ]70,110] ]110,140] ]140,170] ]170,200] ]200,230] ]230,270]


Proportion 14,70% 26,70% 8,60% 14,70% 25,00% 10,30%

8
1. Quelle est la population, donner sa taille. Quel est le type de la variable hauteur de voix ?

2. Représenter graphiquement la distribution des proportions de la variable hauteur de voix

3. A partir du graphique de la question précédente, estimer la proportion de patients dont la hauteur de voix
est comprise entre 170 et 250.

4. Calculer la moyenne et l'écart-type de la variable hauteur de voix.

5. Quel quantile déduit-on de l'information suivante : 75% des patients ont une hauteur de voix supérieure
à 121,6 ?

6. Déterminer la médiane, le premier et le troisième quartile de la variable hauteur de voix.

7. Représenter la boîte à moustaches.

8. Donner l'intervalle de variation à 95%.

9. L'un des patients a une hauteur de voix mesurée à 200. De combien sa hauteur de voix s'écarte-t-elle de
la moyenne,

(a) en mesure absolue,

(b) en fraction d'écart-type ?

(c) Même question pour un patient dont la hauteur de voix est de 140.

10. Donner le changement de variable à faire pour centrer et réduire la variable. On note Y cette variable
déduite de X.
11. Si la hauteur de voix X est comprise entre 200 et 230, comment varie Y ?

Exercise 29 An d'étudier les disparités de salaires entre hommes et femmes, une enquête a été réalisée auprès
du personnel ouvrier d'un secteur industriel. Les résultats concernant les salaires annuels nets en francs sont
résumés dans les deux tableaux suivants (l'étendue considérée est la même dans les deux cas):

Hommes Femmes
Eectif 180
Salaire moyen 68 965
Salaire annuel (en F) Nombre d'ouvrières
Ecart-type 16 265
]45 000; 60 000] 82
1er décile 49 250
]60 000; 70 000] 34
1er quartile 57 300
]70 000; 80 000] 12
Médiane 66 750
]80 000; 105 000] 2
3ème quartile 79 500
9ème décile 95 500

Pour les questions 2 à 7, on arrondira les calculs des paramètres aux 5F les plus proches

1. Dénir les populations, la variable étudiée et sa nature.

2. Proposer et déterminer pour la distribution des hommes :

(a) Des indicateurs de tendance centrale

(b) Des indicateurs de dispersion

(c) L'intervalle de variation à 80%.

3. Sans faire de graphique, donner la position de la moyenne par rapport à la médiane pour la distribution
des femmes.

4. Déterminer le salaire annuel moyen, l'écart-type, la médiane, les premier et troisième quartiles pour la
distribution des femmes.

5. Calculer l'intervalle de variation à 80% pour les femmes.

6. Déterminer le salaire annuel moyen de l'ensemble des ouvriers hommes et femmes de l'enquête.

9
7. Convertir les résultats de la question précédente en euros (1 euro=6,56F).

8. Réaliser les deux boîtes à moustaches sur le même graphique.

9. Peut-on convertir les résultats des quantiles en euros ?

Exercise 30 Répondez par vrai ou faux. Corrigez éventuellement.

1. Pour une série d'observations d'une variable statistique quantitative continue :

(a) On peut calculer quatre quartiles

(b) L'intervalle interquartile contient 50% des observations

(c) Le cinquième décile est égal à la médiane

(d) 50% des observations sont supérieures au premier quartile

2. Si la distribution d'une variable quantitative continue est symétrique :

(a) La moyenne est égale à la médiane

(b) 50% des observations sont supérieures à la moyenne

(c) La boîte de la boîte à moustaches (sans les moustaches) contient toutes les observations

(d) Q3-Q1=2(Med-Q1)

3. Les notes obtenues à un examen de statistique sont toutes augmentées de 2 points :

(a) La moyenne sera augmentée de 2 points

(b) L'écart-type sera augmenté de 2 points

(c) La médiane sera augmentée de 2 points

(d) L'étendue sera augmentée de 2 points

4. On considère la distribution d'une variable continue :

(a) L'histogramme est la représentation graphique des proportions

(b) 15% des observations sont comprises entre le troisième quartile et le neuvième décile

(c) L'intervalle interdécile [D1;D9] contient 90% des observations.

5. On considère une variable continue et on veut minimiser l'inuence des valeurs extrêmes :

(a) On préfère la médiane à la moyenne

(b) On préfère l'étendue à l'intervalle interdécile [D1;D9].

Exercise 31 Dans le cadre d'une étude de médicaments pour le soulagement des symptômes du rhume, on
considère trois types X de médicament notés A, B et C. On étudie sur une population de 230 individus l'action
Y de chaque type de médicament en leur demandant de prendre un des médicaments et de qualier son action
après 2 jours. L'action de chaque médicament est qualiée de aucune", faible" ou ecace". Voici les résultats
sur les 230 individus de l'étude :

Y \X A B C
Aucune 42 35 31
Faible 25 20 30
Ecace 20 12 15

1. Quelle est la population, donner sa taille. Queles sont les variables étudiées et leur type ?

2. Quelle est la proportion d'individus pour lesquels les médicaments ont été ecaces ?

3. Parmi les individus ayant pris le médicament A, quelle est la proportion d'individus pour lesquels son
action est faible ?

4. Parmi les individus pour lesquels les médicaments n'ont aucune action, quelle est la proportion d'individus
ayant pris le médicament C ?

10
5. Représenter graphiquement la distribution des proportions des trois distributions conditionnelles de Y
sachant les modalités de X. Les deux caractères X et Y peuvent-ils être considérés comme indépendants
?

6. On décide d'éliminer les médicaments pour lesquels moins de 20% des individus déclarent qu'il est ecace.
Quel(s) médicament(s) retient-on au vu des résultats ?

Exercise 32 En 1992, la répartition par discipline (variable X) et par cycle (variable Y) des 10034 étudiants
inscrits à l'université de Montpellier I était

X \Y 1er cycle 2nd cycle 3ème cycle


AES 924 409 50
Economie 1168 772 257
ISEM 102 386 227
Droit 3518 1596 625

1. Dénir la population, sa taille, le type des variables étudiées.

2. Quelle est la proportion d'étudiants inscrits en Droit ?

3. Quelle est la proportion d'étudiants inscrits en premier cycle ?

4. Parmi les étudiants de troisième cycle, quelle est la proportion d'étudiants inscrits en Droit ?

5. Parmi les étudiants de deuxième cycle, quelle est la discipline la plus représentée ?

6. Parmi les étudiants d'économie, quelle est la proportion d'étudiants inscrits en premier cycle ?

7. Représenter graphiquement la distribution des proportions par discipline dans chaque cycle.

8. Comparer la distribution de la répartition par cycle des étudiants inscrits en ISEM avec celle des étudiants
inscrits en Droit. Que pensez-vous sur la liaison des deux variables ?

Exercise 33 En 1992 à l'université de Montpellier I, on a relevé la série du baccalauréat (variable X) et la


note en Economie des 653 étudiants inscrits en première année d'Economie (variable Y)

X \Y [0,7] ]7,10] ]10,12] ]12,15] ]15,20]


ES 102 45 49 67 12
S 34 26 99 56 45
L 34 12 5 1 3
STT 45 17 1 0 0

1. Dénir la population, sa taille, le type des variables étudiées.

2. Représenter graphiquement la distribution des proportions par série du baccalauréat.

3. Representer graphiquement la distribution des proportions des notes d'économie des étudiants de première
année d'Economie.

4. Parmi les bacheliers ES, quelle est la proportion d'étudiants ayant obtenu plus de la moyenne en Economie
? Même question avec les bacheliers STT.

5. Quelle est la proportion d'étudiants de première année ayant obtenu plus de la moyenne ?

6. Quelle est la note moyenne des étudiants de première année ?

7. Quelle est la note moyenne des bacheliers ES ? Des bacheliers S ?

8. Parmi les étudiants ayant obtenu une note en économie supérieure ou égale à 15, quelle est la proportion
de bacheliers L ? de bacheliers S ? de bacheliers ES ?

9. Représenter graphiquement la distribution de proportions par série du baccalauréat des étudiants ayant
obtenu une note en économie comprise entre 7 et 10. Quel est le mode de cette distribution ?

10. Représenter graphiquement la distribution des proportions des notes d'économie des bacheliers ES ? Quelle
est la classe modale ?

11
11. Quelle est la note médiane des étudiants de premier cycle ?

12. Quelle est la note médiane des bacheliers STT ?

Exercise 34 A l'oral d'un examen, chaque candidat est interrogé en statistiques (note X) et en sociologie (note
Y). Les résultats par un échantillon de 100 candidats sont les suivants :

X \Y [0,4] ]4,8] ]8,12] ]12,16] ]16,20]


[0,4] 3 4 2 0 0
]4,8] 6 10 8 2 0
]8,12] 1 8 20 12 3
]12,16] 0 0 8 7 3
]16,20] 0 0 1 0 2

1. Dénir la population, sa taille, le type des variables étudiées.

2. Déterminer les distributions marginales de X et de Y.


3. Déterminer la distribution conditionnelle de X sachant que Y est dans l'intervalle [0, 4], ainsi que celle de
Y sachant que X est dans l'intervalle ]4, 8].

4. Calculer les moyennes et variances marginales; la moyenne de la distribution conditionnelle de Y sachant


que X est dans l'intervalle ]4, 8].

Exercise 35 Dans une population composée de 110 ménages on considère deux caractères statistiques : le
nombre X de pièces que comporte l'habitation du ménage et le nombre Y d'enfants dans le ménage. Les
résultats observés sont les suivants :

X \Y 0 1 2 3 4 5
1 6 4 1 0 0 0
2 3 11 10 5 1 0
3 1 3 16 13 4 1
4 0 1 3 15 8 4

1. Dénir la population, sa taille, le type des variables étudiées.

2. Calculer le nombre moyen d'enfants des ménages habitant un deux-pièces.

3. Calculer le nombre de pièces moyen dans la population étudiée.

4. Calculer la covariance de X et Y, ainsi que le coecient de corrélation.

5. Les deux caractères peuvent-ils être considérés comme indépendants ?

Exercise 36 On donne pour les 6 premiers mois de l'année 1982 les nombres d'ores d'emploi (concernant des
emplois durables à plein temps) et de demandes d'emploi (déposées par des personnes sans emploi , immédi-
atement disponibles, à la recherche d'un emploi durable à plein temps). Les nombres sont exprimés en milliers.
Représenter le nuage de points; calculer le coecient de corrélation linéaire entre X et Y; qu'en pensez-vous ?

Ores X 61 66,7 75,8 78,6 82,8 87,2


Demandes Y 2034 2003,8 1964,5 1928,2 1885,3 1867,1

Exercise 37 Reprendre les données de l'exercice 2. On considère les variables âge (regroupée en classes) et
nombre d'enfants.

1. Déterminer la distribution du nombre d'enfants pour les individus ayant entre 18 et 25 ans. Quel est le
nombre d'enfants moyen pour cette classe d'âge ?

2. Déterminer la distribution du nombre d'enfants pour les individus ayant entre 35 et 49 ans. Quel est le
nombre moyen d'enfants pour cette classe d'âge ?

3. Comparer ces deux distributions.

4. Calculer la corrélation entre les variables âge et nombre d'enfants.

Les énoncés des examens de 2008 et 2009 seront en ligne sur la plate forme moodle.

12

Vous aimerez peut-être aussi