TD Statistiq
TD Statistiq
TD Statistiq
Exercices
Série du baccalauréat; Durée du trajet domicile-université; Mode de transport; Nombre de frères et soeurs;
Note en français au baccalauréat; Catégorie socio-professionnelle du père; Age des enfants; Couleur préférée;
Nationalité; PIB.
Réponses à la question Aimez-vous les stats ? : Pas du tout ; un peu; moyennement; beaucoup; je
ne sais pas.
Réponses à la question Aimez-vous les stats ? : Pas du tout ; un peu; moyennement; beaucoup.
Exercise 2 On a relevé pour vingt femmes sourant d'anémie certaines caractéristiques biologiques et soci-
ologiques. Le tableau ci-dessous résume les résultats obtenus.
3. Déterminer la distribution des eectifs puis celle des proportions des variables groupe sanguin et nombre
d'enfants.
Exercise 3 En 1990, lors du recensement eectué par l'INSEE, on a étudié la répartition des ménages français
selon leur type. Les résultats furent les suivants (en milliers)
1
3. Calculer la proportion de ménages composés d'un seul individu en 1990.
5. Lors d'une enquête en 1999, on a de nouveau recensé la répartition des ménages français selon leur type.
Les résultats furent les suivants (en milliers)
6. Calculer les distributions des proportions en 90 et 99 et représenter sur un même graphique les résultats
observés pour les deux années.
Exercise 4 On a recensé en 1993 et 1998 la répartition du personnel enseignant du supérieur suivant leur
statut. Les résultats furent les suivants :
1. Déterminer les populations. Quel était le nombre d'enseignants du supérieur en 1993 et 1998 ?
4. Quel est l'intérêt de travailler avec la distribution des proportions plutôt qu'avec la distribution des eectifs
?
5. Représenter sur le même graphique la distribution des proportions de la variable statut en 1993 et 1998.
Exercise 5 Pendant l'année universitaire 1998-99, la répartition des étudiants par discipline était :
Discipline Pourcentage
Sciences Humaines et Sociales 13,70%
Droit - Sciences Politiques 7,50%
Médecine - Pharmacie 9,20%
Langues 3,70%
Sciences et Structure de la matière - Sciences de la vie - Sciences de l'ingénieur 23,20%
Lettres - Sciences du Langage - Arts 17,10%
Administration Économique et Sociale 6,70%
Sciences et Techniques des Activités Physiques et Sportives 10,40%
Économie et Gestion 8,50%
4. Sachant que le nombre d'inscrits en 1998-99 était de 1363000, déterminer la distribution des eectifs.
Exercise 6 Un sondage intitulé les français et la vie sans télévision a été réalisé les 5 et 6 septembre 1997
auprès de 1200 français de 18 ans et plus. Les réponses obtenues à la question Vous arrive-t-il de regretter
d'avoir la télévision ? ont permis d'établir la distribution suivante :
Réponse Pourcentage
Souvent 7%
De temps en temps 23%
Rarement 10%
Jamais 56%
N'a pas la télévision 4%
2
1. Déterminer la population, sa taille, la variable étudiée et son type.
Exercise 7 Lors d'une enquête menée au troisième trimestre 1999, on a étudié le niveau d'équipement infor-
matique des foyers français; ce niveau est codé: A (pas d'équipement informatique), B (Micro-ordinateur seul),
C (Micro-ordinateur + Imprimante) , D (Micro-ordinateur + Imprimante + Modem + Accès Internet). Les
résultats furent les suivants, en pourcentage :
Niveau d'équipement A B C D
Pourcentage 78,90% 5,70% 10,30% 5,10%
1. Déterminer la population, sa taille. Quel est le type de la variable niveau d'équipement informatique ?
7. Déterminer la médiane.
Exercise 9 On a fait passer à des étudiants de première année un test de culture générale en leur posant dix
questions. On a alors relevé le nombre d'erreurs.
5. Calculer la médiane.
6. Quelle est la proportion d'étudiants ayant fait moins de deux erreurs ? Deux ou moins de deux erreurs ?
7. Quelle est la proportion d'étudiants ayant fait plus de sept erreurs ? Ayant fait sept erreurs et plus ?
3
Exercise 10 Pour étudier les facteurs liés à la survenue d'un accouchement prématuré, on a réalisé une enquête
portant sur 203 femmes enceintes dont l'accouchement n'était pas arrivé à terme. Pour chaque femme, on a
recueilli son degré d'exposition à des événements stressants pendant la durée de sa grossesse (du début à 30
semaines de grossesse), mesuré par le score MOLES (Major Objective Life Event Score) noté en points entiers
de 0 (pas d'évènements stressants) à 3 (évènements stressants importants). Les résultats furent les suivants :
Exercise 11 Lors du recensement de 1996 au Canada, on a relevé par habitation le nombre de personnes vivant
sous le même toit. Les résultats furent les suivants :
1. Quelle est la population étudiée ? Quel est l'eectif total de la population ? Quel est le type de la variable
nombre de personnes par habitation ?
Exercise 12 On étudie les ménages par la nationalité du chef de famille. On indique dans le tableau ci-
dessous l'eectif et le nombre moyen de personnes par ménage pour chaque nationalité. En déduire la moyenne
du nombre de personnes dans un ménage pour l'ensemble de la population.
Exercise 13 On fait passer un test de vocabulaire à des enfants issus de milieu urbain ou rural. On relève pour
chaque enfant le nombre de mots diciles reconnus au cours du test. Les résultats sont les suivants :
2. Quel est le nombre moyen de mots reconnus pour l'ensemble des enfants ?
Exercise 14 On a mesuré la teneur minérale des vertèbres lombaires de quarante femmes. Les mesures obtenues
2
furent (en g/dm ):
60 61 63 64 66 67 69 70
71 71 72 74 75 75 76 76
77 77 78 79 79 80 81 81
81 82 82 83 84 84 85 86
87 88 88 89 92 94 95 97
4
1. Déterminer la population étudiée, la variable statistique et le type de la variable.
On décide de regrouper les données individuelles de la variable âge selon le découpage suivant :
]0, 18] , ]18, 25] , ]25, 35] , ]35, 49] , ]49, 55] et ]55, 70].
1. Déterminer la distribution des eectifs puis des proportions de la variable âge associée à ce découpage
en classes..
3. Quelle est la classe de plus grande proportion ? Quelle est la classe modale ?
4. On cherche la proportion d'individus âgés de moins de 25 ans. Représenter sur l'histogramme cette
proportion et en donner une approximation.
5. De même, donner une approximation de la proportion d'individus de plus de 49 ans, qui ont entre 25 et
49 ans, entre 40 et 60 ans.
Exercise 16 En 1994, l'INSEE a recensé la répartition par âges des 15 840 000 actifs âgés de 18 ans à 65 ans
ayant une activité à temps complet. Le résultat de ce recensement fut le suivant :
3. Représenter sur l'histogramme la proportion d'actifs ayant moins de 30 ans ou plus de 50 ans, puis calculer
cette proportion.
4. Représenter sur l'histogramme la proportion d'actifs ayant entre 20 et 30 ans, puis calculer cette propor-
tion.
7. En utilisant la fonction de répartition, retrouver les résultats des questions 3 et 4. Puis calculer la propor-
tion d'actifs ayant entre 26 et 54 ans
8. Calculer l'âge moyen des actifs ayant une activité à temps complet en 1994. La moyenne calculée ainsi
est-elle exacte ou approchée ?
Exercise 17 En France, pour l'année 1990, le nombre de naissances hors mariage selon l'âge de la mère est
donné dans le tableau suivant :
3. Sur l'histogramme, représenter graphiquement la proportion de femmes ayant un enfant hors mariage
entre 21 ans et 34 ans. Calculer cette proportion.
5
4. Déterminer la classe modale de la variable âge de la mère.
1. Calculer l'âge moyen des individus à partir des données individuelles, puis à partir de la distribution des
proportions.
4. Calculer la médiane.
Exercise 19 Une compagnie de taxis s'intéresse au kilométrage eectué par ses véhicules. A cet eet, elle a
relevé le kilométrage de 50 de ses taxis pour une matinée de travail.
Classes (en km) ]10;20] ]20;30] ]30;40] ]40;60] ]60;90] ]90;130] Total
Nb de taxis 7 10 20 6 3 4
3. On regroupe maintenant les données sur les classes (de même amplitude) ]10;40], ]40;70], ]70;100] et
]100;130]. Tracer l'histogramme. Recalculer les paramètres de la question 2 et comparer les résultats.
Exercise 20 Une machine emplit automatiquement les paquets de tabac. On prélève un échantillon de la
production, et après pesée, on obtient les résultats suivants :
Poids (en gr) ≤38 ≤39 ≤39.5 ≤40 ≤40.5 ≤41 ≤41.5 ≤42 ≤42.5 ≤43 ≤44
Eectifs cumulés 0 3 8 18 31 51 69 84 95 99 100
3. On regroupe maintenant les données sur les classes de même amplitude 2 grammes. Tracer l'histogramme.
Recalculer les paramètres de la question 2 et comparer les résultats.
4. Calculer la proportion de femmes dont la teneur minérale des vertèbres lombaires est inférieure ou égale
à 65 à partir des données individuelles.
(a) les données individuelles sachant que la somme des données individuelles est égale à 3139 et que la
somme des carrés des données individuelles est égale à 249 725.
6
8. Déterminer les trois quartiles et représenter la boîte à moustaches.
3. Quel quantile peut-on déduire de l'information suivante : 75% des actifs sont âgés de plus de 27 ans ?
Exercise 24 En 1994, en France, la répartition des 15 840 000 actifs ayant une activité à temps complet par
tranche de salaire net annuel (en milliers de Francs) était :
5. Calculer la moyenne et l'écart-type de la variable salaire . Les valeurs calculées sont-elles exactes ou
approchées ?
(a) Déterminer la distribution des proportions de la variable salaire associé à ce nouveau découpage
sachant que 2 131 000 actifs ont un salaire net annuel compris entre 80 000 F et 100 000 F.
(b) Calculer la proportion d'actifs gagnant moins de 100 000 F par an.
Exercise 25 Les scores à un test d'estime de soi mesuré sur l'échelle S.E.I de Rosenberg on été relevés pour
246 salariés. On assimile la variable score à une variable quantitative continue. Les scores obtenus regroupés
par intervalle sont donnés dans le tableau suivant :
7
1. Quelle est la population, donner sa taille. Quel est le type de la variable score ?
3. Dans une autre population composée de 54 chômeurs, les scores d'estime de soi se répartissaient ainsi :
Score ]15,20] ]20,30] ]30,40] ]40,50] Total
Eectif 4 17 26 7
4. Déterminer la distribution des proportions de la variable score sur la population composée des 54
chômeurs et représenter la graphiquement (on utilisera le graphique tracé en 1).
5. Quelle est la classe modale de la variable score sur la population des 246 salariés ? Sur la population
des 54 chômeurs ?
6. Calculer le score moyen des 246 salariés et le score moyen des 54 chômeurs.
7. En utilisant seulement les scores moyens calculés à la question précédente, calculer le score moyen des 300
individus étudiés.
8. Calculer le score médian des 246 salariés puis le score médian des 54 chômeurs.
9. Peut-on, à partir des résultats de la question précédente, calculer directement le score médian des 246
salariés et 54 chômeurs considérés comme une même population ?
10. Calculer le score médian des 246 salariés et 54 chômeurs considérés comme une même population.
1. Quelle est la population, donner sa taille. Quel est le type de la variable température ?
Exercise 27 On a mesuré le stress perçu par le sujet dans son cadre social et dans son environnement pour
108 étudiants de première année. Les scores obtenus, en considérant que la variable score est une variable
continue, sont donnés par le tableau suivant :
1. Quelle est la population, donner sa taille. Quel est le type de la variable score ?
4. Représenter graphiquement la proportion approchée d'étudiants ayant un score compris entre 5 et 19.
9. On veut normaliser le test de façon que la moyenne des scores soit égale à 100. Que faut-il faire ?
Exercise 28 On a enregistré chez 116 patients hospitalisés pour dépression, un échantillon de leur voix, an
de mesurer la fréquence fondamentale, plus simplement dénommée hauteur de voix. On a obtenu les résultats
suivants :
8
1. Quelle est la population, donner sa taille. Quel est le type de la variable hauteur de voix ?
3. A partir du graphique de la question précédente, estimer la proportion de patients dont la hauteur de voix
est comprise entre 170 et 250.
5. Quel quantile déduit-on de l'information suivante : 75% des patients ont une hauteur de voix supérieure
à 121,6 ?
9. L'un des patients a une hauteur de voix mesurée à 200. De combien sa hauteur de voix s'écarte-t-elle de
la moyenne,
(c) Même question pour un patient dont la hauteur de voix est de 140.
10. Donner le changement de variable à faire pour centrer et réduire la variable. On note Y cette variable
déduite de X.
11. Si la hauteur de voix X est comprise entre 200 et 230, comment varie Y ?
Exercise 29 An d'étudier les disparités de salaires entre hommes et femmes, une enquête a été réalisée auprès
du personnel ouvrier d'un secteur industriel. Les résultats concernant les salaires annuels nets en francs sont
résumés dans les deux tableaux suivants (l'étendue considérée est la même dans les deux cas):
Hommes Femmes
Eectif 180
Salaire moyen 68 965
Salaire annuel (en F) Nombre d'ouvrières
Ecart-type 16 265
]45 000; 60 000] 82
1er décile 49 250
]60 000; 70 000] 34
1er quartile 57 300
]70 000; 80 000] 12
Médiane 66 750
]80 000; 105 000] 2
3ème quartile 79 500
9ème décile 95 500
Pour les questions 2 à 7, on arrondira les calculs des paramètres aux 5F les plus proches
3. Sans faire de graphique, donner la position de la moyenne par rapport à la médiane pour la distribution
des femmes.
4. Déterminer le salaire annuel moyen, l'écart-type, la médiane, les premier et troisième quartiles pour la
distribution des femmes.
6. Déterminer le salaire annuel moyen de l'ensemble des ouvriers hommes et femmes de l'enquête.
9
7. Convertir les résultats de la question précédente en euros (1 euro=6,56F).
(c) La boîte de la boîte à moustaches (sans les moustaches) contient toutes les observations
(d) Q3-Q1=2(Med-Q1)
(b) 15% des observations sont comprises entre le troisième quartile et le neuvième décile
5. On considère une variable continue et on veut minimiser l'inuence des valeurs extrêmes :
Exercise 31 Dans le cadre d'une étude de médicaments pour le soulagement des symptômes du rhume, on
considère trois types X de médicament notés A, B et C. On étudie sur une population de 230 individus l'action
Y de chaque type de médicament en leur demandant de prendre un des médicaments et de qualier son action
après 2 jours. L'action de chaque médicament est qualiée de aucune", faible" ou ecace". Voici les résultats
sur les 230 individus de l'étude :
Y \X A B C
Aucune 42 35 31
Faible 25 20 30
Ecace 20 12 15
1. Quelle est la population, donner sa taille. Queles sont les variables étudiées et leur type ?
2. Quelle est la proportion d'individus pour lesquels les médicaments ont été ecaces ?
3. Parmi les individus ayant pris le médicament A, quelle est la proportion d'individus pour lesquels son
action est faible ?
4. Parmi les individus pour lesquels les médicaments n'ont aucune action, quelle est la proportion d'individus
ayant pris le médicament C ?
10
5. Représenter graphiquement la distribution des proportions des trois distributions conditionnelles de Y
sachant les modalités de X. Les deux caractères X et Y peuvent-ils être considérés comme indépendants
?
6. On décide d'éliminer les médicaments pour lesquels moins de 20% des individus déclarent qu'il est ecace.
Quel(s) médicament(s) retient-on au vu des résultats ?
Exercise 32 En 1992, la répartition par discipline (variable X) et par cycle (variable Y) des 10034 étudiants
inscrits à l'université de Montpellier I était
4. Parmi les étudiants de troisième cycle, quelle est la proportion d'étudiants inscrits en Droit ?
5. Parmi les étudiants de deuxième cycle, quelle est la discipline la plus représentée ?
6. Parmi les étudiants d'économie, quelle est la proportion d'étudiants inscrits en premier cycle ?
7. Représenter graphiquement la distribution des proportions par discipline dans chaque cycle.
8. Comparer la distribution de la répartition par cycle des étudiants inscrits en ISEM avec celle des étudiants
inscrits en Droit. Que pensez-vous sur la liaison des deux variables ?
3. Representer graphiquement la distribution des proportions des notes d'économie des étudiants de première
année d'Economie.
4. Parmi les bacheliers ES, quelle est la proportion d'étudiants ayant obtenu plus de la moyenne en Economie
? Même question avec les bacheliers STT.
5. Quelle est la proportion d'étudiants de première année ayant obtenu plus de la moyenne ?
8. Parmi les étudiants ayant obtenu une note en économie supérieure ou égale à 15, quelle est la proportion
de bacheliers L ? de bacheliers S ? de bacheliers ES ?
9. Représenter graphiquement la distribution de proportions par série du baccalauréat des étudiants ayant
obtenu une note en économie comprise entre 7 et 10. Quel est le mode de cette distribution ?
10. Représenter graphiquement la distribution des proportions des notes d'économie des bacheliers ES ? Quelle
est la classe modale ?
11
11. Quelle est la note médiane des étudiants de premier cycle ?
Exercise 34 A l'oral d'un examen, chaque candidat est interrogé en statistiques (note X) et en sociologie (note
Y). Les résultats par un échantillon de 100 candidats sont les suivants :
Exercise 35 Dans une population composée de 110 ménages on considère deux caractères statistiques : le
nombre X de pièces que comporte l'habitation du ménage et le nombre Y d'enfants dans le ménage. Les
résultats observés sont les suivants :
X \Y 0 1 2 3 4 5
1 6 4 1 0 0 0
2 3 11 10 5 1 0
3 1 3 16 13 4 1
4 0 1 3 15 8 4
Exercise 36 On donne pour les 6 premiers mois de l'année 1982 les nombres d'ores d'emploi (concernant des
emplois durables à plein temps) et de demandes d'emploi (déposées par des personnes sans emploi , immédi-
atement disponibles, à la recherche d'un emploi durable à plein temps). Les nombres sont exprimés en milliers.
Représenter le nuage de points; calculer le coecient de corrélation linéaire entre X et Y; qu'en pensez-vous ?
Exercise 37 Reprendre les données de l'exercice 2. On considère les variables âge (regroupée en classes) et
nombre d'enfants.
1. Déterminer la distribution du nombre d'enfants pour les individus ayant entre 18 et 25 ans. Quel est le
nombre d'enfants moyen pour cette classe d'âge ?
2. Déterminer la distribution du nombre d'enfants pour les individus ayant entre 35 et 49 ans. Quel est le
nombre moyen d'enfants pour cette classe d'âge ?
Les énoncés des examens de 2008 et 2009 seront en ligne sur la plate forme moodle.
12