Le Cours de Biostatistiques
Le Cours de Biostatistiques
Le Cours de Biostatistiques
net/publication/329413025
Le cours de Biostatistiques
CITATIONS READS
0 3,123
4 authors, including:
Virgil Fievet
University of Bordeaux
26 PUBLICATIONS 554 CITATIONS
SEE PROFILE
All content following this page was uploaded by Virgil Fievet on 16 December 2019.
LE COURS DE
BIOSTATISTIQUE
110 FICHES DE COURS
120 SCHÉMAS
50 QCM
© Dunod, 2018
© Dunod, 2014
11, 5rue
ruePaul Bert, 92240
Laromiguière, 75005Malakoff
Paris
www.dunod.com
www.dunod.com
ISBN 978-2-10-070528-9
ISBN 978-2-10-076976-6
Avant-propos IX
Comment utiliser cet ouvrage ? XII
RemerciementsXIV
VI
Focus Les tests statistiques à l’épreuve des tests statistiques : crash test 270
QCM 273
VII
Focus L’ACP, les « véritables » analyses factorielles et les pistes pour la biologie 333
QCM 335
Exercices337
Corrigés347
Index357
VIII
Un grand nombre de personnes aiment remplir des grilles de mots croisés ou de sudokus,
nous pensons que le même plaisir peut être pris en apprenant les statistiques.
IX
XI
7 chapitres
des étudiants.
d. Parce que la maitrise des statistique
s devient indispensable pour
Réponse : en cas de doute, ce tout biologiste.
premier chapitre devrait vous
réponse. aider à trouver la bonne
2/16/18 11:04 AM
Des cas d’étude Les notions essentielles avec des renvois pour
naviguer d’une fiche à l’autre
c1 × x1 + c2 × x 2 + ... + cn × x n Σ(ci × xi )
fiche m ponderee = =
Paramètres de positions c1 + c2 + ... + cn Σci
14
Fiche 14
Cas d’étude
QCM
Mais nous pourrons également rencontrer des moyennes géométrique, glissante, tronquée... cha-
Le test de l’allée droite consiste à placer une souris dans le compartiment de départ d’un cune pouvant être pondérée.
couloir à l’extrémité duquel se trouve une friandise. Après plusieurs essais, la souris va
de plus en plus vite car elle a compris qu’elle allait trouver la récompense (ici symbo- 2. Mode
lisée par un bonbon). Après apprentissage, les temps de parcours de 15 souris sont (en
Le mode est la valeur dont la probabilité d’apparition est la plus élevée. Dans le cas d’une
secondes) :
variable discrète, c’est la valeur qui a la plus grande fréquence d’apparition. Dans le cas d’une
2,49 2,46 1,45 1,44 2,37 5,97 3,10 3,92 1,62 1,60 1,28 1,70 2,33 2,60 6,16 variable continue, il faut former des classes de valeurs et le mode sera la classe qui comprend le
Quelle est la durée qui représente le mieux le temps de parcours de ces souris ? plus de valeurs : c’est la classe modale. Étant donné que le choix des bornes lors d’un découpage
en classe est arbitraire, le mode dépendra de ce choix.
Sur un graphique montrant la distribution des données, le mode correspond au pic le plus
élevé. Lorsque la distribution comprend plusieurs pics de fréquence, la distribution est dite mul-
timodale (ou bimodale s’il n’y a que deux pics).
De nombreux
Figure 14.1 Souris dans une allée droite. schémas
Un paramètre de position se doit de représenter au mieux la position de la distribution sur
l’échelle des valeurs que peut prendre la variable. Figure 14.2 Distribution bimodale.
avec n = effectif de l’échantillon et xi = valeurs des individus sur la variable concernée. les données que la moyenne lorsque leur distribution est dissymétrique.
C’est la moyenne arithmétique qui est utilisée pour comparer les tendances centrales de groupes
lorsque les distributions des populations suivent une loi normale.
D’autres formes de moyennes existent. La moyenne arithmétique pondérée consiste à pré- Exemple
multiplier les valeurs des mesures pour la variable à moyenner par un coefficient, puis à diviser
le résultat par la somme des coefficients. Dans le cas des notes à un examen, les valeurs des
mesures sont les notes aux différentes matières et la variable est la note globale.
Pour les temps de parcours, m = 2,699 s ; H = 2,159 s ; médiane : 2,37 s et mode =
[1 s ; 2 s[ Des exemples
42 43
XII
ie avec les
un tour de mag QC M
Comment faire limite
FO CUS statistiques : le
théorème central
sqrt(runif(1
me =
00000, Indiquez la ou les
racineunifor réponses exactes.
un « truc ». Ici,
e ont toujours min=0, max=1)) ks=100) 1.1 L’hypothèse opéra
Fiche
Les tours de magi al limite (TCL) niforme, brea tionnelle
le théorème centr hist(racineu des valeurs
le truc, c’est que onques aboutit avec le carré
❑❑ a. est formulée
en fonction des résult
l de lois quelc rienc e
prédit qu’un cumu Refaites l’expé ❑❑ b. est une reform ats que l’on obtien
t, ce qui assure sa
alité. uniforme. ulation de l’hypothèse
toujours à la norm issues d’une loi 0, théorique et tient comp validation
(run if(1 00000, min= ❑❑ c. correspond à
l’hypothèse altern te des méthodes
e =
Le TCL nous dit
que :
e de variab les aléa- carreuniform 1.2 En statistiques, « unité
ative
de la somm 2
des distribu- max=1))^
statistique » est synon
La distribution me, breaks=10
0) yme :
tes qui suivent (carreunifor
❑❑ a. d’élément
toires indépendan vers une loi normale hist ❑❑ b. d’échantillo
tions quelconqu
es tend valeurs issues n
re augmente. rience avec des
QCM
lorsque leur nomb Refaites l’expé ❑❑ c. de variable
elle.
de 100 000 sujets d’une loi exponenti ❑❑ d. de sujet
tillon aléatoire rme : 7
Prenez un échan une loi unifo (100 000) /
lation qui suit expo <- rexp 0) # Notez
ici la ❑❑ e. d’individu
issus d’une popu
0, max=1) hist(expo, breaks=10 sera discutée ci-
f(100000, min= 1.3 À propos des variab
uniforme = runi bution au public division par
7 qui les :
❑❑ a. une variable
et montrez sa distri dessous
e, breaks=100)
aléatoire n’est soum
hist(uniform des ❑❑ b. une variable
qualitative s’opération
ise à aucune loi.
racine carrée
rience avec la ❑❑ c. les variables nalise en modalités.
Refaites l’expé dépendantes sont
loi uniforme. supposées dépendre
valeurs issues d’une ❑❑ d. « Facteur »
est synonyme de « des facteurs.
1.4 variable indépendan
Les effets des facteu te ».
rs secondaires :
❑❑ a. doivent être
neutralisés car ils
❑❑ b. sont secondaires sont susceptibles d’infl
par rapport à ceux uencer les résultats
❑❑ c. peuvent être des facteurs princi
neutralisés grâce à paux
tions expérimentales. une répartition aléato
ire dans les différentes
1.5 À propos des plans condi-
expérimentaux :
❑❑ a. un plan est
équilibré lorsqu’il
chaque condition y a le même nomb
expérimentale. re de sujets ou éléme
❑❑ b. un plan est nts dans
complet lorsqu’il
chaque condition y a le même nomb
expérimentale. re de sujets ou éléme
❑❑ c. un plan équili nts dans
bré est nécessaire
❑❑ d. un plan comp pour étudier une intera
let est nécessaire pour ction.
1.6 Il y a interaction statist étudier une interaction.
ique :
❑❑ a. lorsque l’effet
d’un facteur n’est
❑❑ b. lorsque l’effet pas le même que celui
d’un facteur chang de l’autre facteur
❑❑ c. lorsque les sujets e selon les modalités
d’une expérimentation de l’autre facteur
❑❑ d. lorsque le facteu s’influencent mutue
r interagit avec la llement
1.7 À propos de la quant variab le dépen dante
ité d’information véhicu
❑❑ a. une variable lée par les variables
quantitative contie :
❑❑ b. une variable nt plus d’informatio
catégorielle contie n qu’une variable
❑❑ c. une variable nt plus d’informatio qualitative.
Chapitre 1
quantitative peut être n qu’une variable
transformée en variab par rangs.
1.8 Sélectionnez les affirm le par rangs.
ations vraies :
❑❑ a. une approche
observationnelle est
❑❑ b. une approche moins valide qu’un
expérimentale teste e approche expériment
❑❑ c. les résultats des relations de causa ale.
d’une approche obser lité.
vationnelle sont facile
ment généralisables.
100 39
2/16/18 11:11 AM 9782100769766_
Ch01.indd 39
Corrigés
Exercices 1. La connais
sance des stat
• lors de la istiques est
conception mét nécessaire ou
utile :
Corrigés
expérimental hodologique
en expérime de l’étude, c’es
des données ntation et lors t-à-dire lors
pour une étud du choix et de de l’élaboration
• lors de la e observationn l’élaboration du plan
conception mét elle. des méthodes
statistiques de hodologique de recueil
traitement des de l’étude, pou
• lors du trait données car r procéder au
ement des donn c’est égaleme choix des mét
priée (savoir ées, afin de savo nt à cette étap hodes
présenter les ir utiliser un logi e qu’est fait
• éventuellem données, choi ciel de statistiqu ce choix.
ent lors du trait sir les bonnes es de manière
de remplaceme eme options...) et appro-
La démarche de recherche nt si des imp nt des données, afin de
en interpréter
les résultats.
QCM
9782100769
766_Exercic
es.indd 347
347
9782100769766_Exercices.indd 337 2/16/18 11:14 AM
XIII
2/16/18 11:14
AM
Nous tenons à remercier chaleureusement nos collègues qui ont accepté de participer au comité
de lecture, pour leurs relectures parfois très minutieuses, leur aide, leurs conseils et leurs encou-
ragements. Il a été très enrichissant d’avoir leur avis, tant sur la structure de l’ouvrage que pour
la diversité des approches et au sujet de la pédagogie des biostatistiques. Bien sûr, ces personnes
qui nous ont apporté leur aide ne sont pas responsables des erreurs qui pourraient persister dans
cet ouvrage, ni des avis, choix et arbitrages que nous avons dû faire tout au long de la rédaction.
Nous sommes donc très heureux de pouvoir remercier :
–– Leslie Regad, maître de conférences à l’université Paris Diderot,
–– Franck Brignolas, professeur à l’université d’Orléans,
–– Lionel Denis, professeur à l’université de Lille,
–– Léo Gerville-Réache, maître de conférences à l’université de Bordeaux,
–– Gilles Hunault, maître de conférences à l’université d’Angers,
–– Laurent Pezard, professeur à l’université de Provence.
Enfin, nous remercions Laëtitia Hérin et Vanessa Beunèche des éditions Dunod, avec qui nous
avons eu grand plaisir à travailler, et nos familles pour leur patience pendant ces huit mois de
rédaction.
XIV
9782100769766_FM.indd
View publication stats 14 2/16/18 4:49 PM