Doc 06

LA DERIVE GENETIQUE
Dans les chapitres précédents les modèles présentés reposaient sur l'hypothèse d'un
effectif infini de géniteurs dans les populations, n'induisant pas de variation de fréquences
alléliques liée au processus d'échantillonnage des gamètes. Dans ce type de modèles, dits
déterministes, le devenir de toute population peut être prédit de façon certaine. Cependant, dans
les populations réelles le nombre de géniteurs est toujours limité et, par le simple fait du
hasard, certains allèles seront plus (ou moins) représentés dans la génération suivante. Ce
processus de fluctuations aléatoires est appelé dérive génétique. On ne peut alors plus prédire
avec exactitude les fréquences alléliques au cours du temps, mais simplement établir des
modèles, dits stochastiques, qui fournissent les différentes probabilités de chacun des états
possibles. Un ensemble de ces modèles a été développé depuis S. Wright (1931, Genetics
16:97), pour tenir compte de ce processus (revues in Wright, 1969 et Kimura, 1983). Dans ce
chapitre, l'étude de l'évolution de populations d'effectif limité sera abordée, en supposant
l'absence de mutation, de migration et de sélection.
6.1 VARIATION ALEATOIRE DES FREQUENCES ALLELIQUES
Comme dans le modèle de Hardy-Weinberg, nous commencerons par étudier un cas

simplifié permettant de dégager les principaux effets de l'action de la dérive génétique.
Dans une espèce diploïde, soit une population idéale d'effectif N constant, ayant un taux
sexuel égal à l'unité et soumise à l'action de la seule dérive génétique. Pour un locus autosomal
diallélique soient x1 et x2 les fréquences à la génération t. Le nombre N d'individus de la
génération t + 1 sera constitué par un échantillon de zygotes, pris au hasard parmi tous ceux
que peuvent générer les individus de la génération t.
Un zygote est lui-même formé par tirage au sort de 2 gamètes. Dans l'urne des gamètes,
nous avons par définition x1 allèles A1 et x2 allèles A2. Le nombre de gamètes formés étant
toujours très grand, même pour une population limitée de reproducteurs, l'effectif de l'urne des
gamètes peut être considérée comme infini. Par conséquent, le fait de tirer un gamète ne
modifie pas la composition de l'urne, et donc les probabilités de tirage des gamètes suivants.
VI-2
Pour former les N zygotes de la génération t + 1 on doit ainsi tirer un nombre 2N de

gamètes dans une urne d'effectif infini et contenant x 1 A1 et x2 A2. La distribution des
fréquences alléliques suit une loi binomiale de paramètres x1 et 2N : B (x1 ; 2N).
Il y a 2N + 1 valeurs possibles pour les fréquences alléliques de la génération t + 1 soit:
0/2N, 1/2N, 2/2N, ....., (2N-1)/2N, 2N/2N, selon que sur les 2N gamètes tirés, A 1 ont été
obtenus 0 fois, 1 fois, 2 fois, ou ... 2N fois. La probabilité de tirer i allèles A 1 est donnée par :
P(i)= 2N x1i (1 - x1) 2N-i .

i
Si cette condition se réalise, la nouvelle fréquence de A 1 sera x1' = i/2N. Mais ce n'est là
qu'une éventualité, et une autre fréquence pourrait être atteinte, par exemple j/2N avec une
probabilité P(j).
Exemple : soit une population dans laquelle x1 = 3/4 à la génération t. L'effectif de la

génération suivante étant de 40 individus, quelle est la probabilité pour que la fréquence de A 1
reste exactement 3/4 ?
Avec 2N = 80, l'éventualité recherchée est la réalisation d'un tirage contenant 60 allèles A 1 sur
les 80 tirés, soit avec les notations ci-dessus :
P(i) = 2N x i (1-x )2N-i et 2N = (2N)!/(i!(2N-i)!),

1 1
i i
d'où :
P(60) = 80!/(60!20!) . (3/4)60 .(1/4)20 = 0,103.
La population n'a donc que 10,3 chances sur 100 de rester exactement à la même
fréquence. En revanche, tout écart (ici 9 sur 10) sera acquis pour la génération suivante. Ce
sera à partir de la nouvelle fréquence x1' de la génération t+1, et uniquement à partir d'elle, que
se fera le tirage de la génération n+2, avec des conséquences comparables. Un tel processus est
dit processus aléatoire en chaîne ou processus de Markoff.
On peut calculer, à partir de la loi binomiale, la probabilité de chacune des fréquences
possibles de la génération t+1. Les résultats d'un tel calcul sont présentés dans le tableau 6.1,
dans lequel les fréquences sont regroupées en classes.
VI-3
_____________________________________________________________________________
TABLEAU 6.1. Distribution des probabilités de la fréquence x' 1 de l'allèle A1 dans une
population soumise à la dérive génétique. La population est constituée de 50 individus issus
d'un tirage de 100 gamètes d'une urne gamétique infinie de fréquence x1 = 0,5.
_____________________________________________________________________________
Classes des fréquences de l'allèle A1 (x'1)
_____________________________________________________________________________
<0,35 0,35 0,40 0,45 0,50 0,55 0,60 >0,65

0,40 0,45 0,50 0,55 0,60 0,65 Total
Probabilité
de chaque
classe 0,002 0,021 0,136 0,341 0,341 0,136 0,021 0,002 1,000
_____________________________________________________________________________
La composition allélique atteinte à chaque génération est bien un événement aléatoire et

la variation entre deux générations, Dx1 = x'1 - x1, est a priori inconnue. Si aucun autre facteur
que la dérive n'intervient, cette différence sera nulle en moyenne. On aura donc pour moyenne
de la distribution des fréquences alléliques la valeur x1 :
M(x'1) = x1,
soit dans l'exemple choisi M(x'1) = x1 = 0,5.
Autour de cette moyenne les différentes valeurs de la fréquence allélique seront distribuée
en fonction de la variance de la loi B(x1 ; 2N) :
x1 (1 - x1)
Vx'1 = ------------ , soit ici Vx'1 = 0,25 x 10-2,
2N
avec évidemment ici Vx'2 = Vx'1.
Cette variance est une fonction inverse de la taille de l'échantillon. Dans le cas des petites
population, la composition allélique à chaque génération va largement fluctuer. Cette
fluctuation se fera dans n'importe quelle direction puisque nous n'avons supposé pour l'instant
ni sélection, ni mutation. Ces fluctuations aléatoires entraînent une dérive des fréquences
alléliques. Cette dérive fixera tôt ou tard la population à l'état homozygote.
VI-4
La figure 6.1 illustre ce processus pour quatre populations polymorphes évoluant

indépendamment. Tant que les fréquences alléliques restent dans l'intervalle [1/2N ;
(2N-1)/2N], la dérive génétique intervient dans le tirage des gamètes de la génération suivante
et les fréquences alléliques fluctuent aléatoirement. Mais si tous les gamètes tirés à une
génération possèdent l'allèle A1 (x1=1), aucun changement ultérieur ne sera possible ; la
population est dite fixée pour A1. De façon similaire, avec x1 = 0, la population sera fixée pour
A2. Ces deux états sont dits "états absorbants".
En conclusion : La dérive génétique conduit tôt ou tard toute population soumise à ce seul
facteur vers un état d'homozygotie totale, et ce quelle que soit la séquence d'ADN considérée
(codante ou non codante).
6.2 EVOLUTION DES FREQUENCES ALLELIQUES ET LOIS DE DISTRIBUTION
Si le devenir final des populations soumises à l'action de la dérive apparait clairement, on

peut se demander maintenant comment se produit l'évolution au cours du temps
Le traitement mathématique du processus markovien de la dérive génétique est simple à

aborder dans la mesure où il repose sur la loi binomiale. En fait, il s'agit de suivre au cours du
temps le devenir d'une loi de distribution, caractérisée par ses différentes classes (ou états) et
par les probabilités attachées à chaque état. Pour une population d'effectif constant de N
individus il existe 2N + 1 classes de fréquences alléliques (0, 1/2N, ... i/2N, ... 2N/2N) et
chacune d'entre elles se rencontre à une génération t avec une probabilité f t(x). Ainsi pour la
classe i on aura une fréquence allélique x = i/2N et
x=1
 ft(x) = 1, pour tout t.
x=0
Si l'on veut suivre l'évolution d'une population, il convient donc de calculer les vecteurs
des différentes probabilités au cours du temps telle que :
[f(0), f(1/2N), ..., f(1)]t => [f(0), f(1/2N), .., f(1)]t+1.

VI-5
La transition, symbolisée par la flèche entre les deux vecteurs, recouvre un ensemble
d'éventualités, toutes régies par la loi binomiale précédemment définie, et que nous pouvons
expliciter par le schéma suivant :
Classe (ou état) 0 1 i j 2N
Fréquence allélique 0/2N 1/2N i/2N j/2N 2N/2N

dans chaque classe
Probabilité de ft(0) ft(1/2N) ft(i/2N) ft(j/2N) ft(1)

chaque classe à la
génération t
Probabilité de
chaque classe à la ft+1(0) ................................ f t+1(j/2N) ...
génération t+1
Les classes fixes (0) et (1) ne peuvent donner que des gamètes A 1 ou A2, mais chacune
des autres classes de la génération t va concourrir, de façon spécifique symbolisée par chaque
flèche, à la probabilité de chacune des classes de la génération t+1. Or nous avons vu que si la
population est dans la classe i/2N, elle a une probabilité, régie par la loi binomale B(i, 2N), de
se trouver dans la classe j/2N, à la génération t+1. Cette probabilité est appelée probabilité de
transition de i vers j, et notée pi,j. Pour calculer la probabilité totale d'être dans la classe j à t+1,
il faut donc sommer toutes les contributions possibles de chaque classe de la génération t (les
pi,j), en les pondérant par la probabilité même d'existence de ces classes à la génération t (les
ft(i)).
On obtient ainsi :
ft+1(0) = p0,0 ft(0) + p1,0 ft( 1/2N) + ... + p2N,0 ft(1),
ft+1(1/2N) = p0,1ft(0) + p1,1ft(1/2N) + ... + p2N,1 ft(1),
ft+1(1) = p0,2N ft(0) + p1,2Nft(1/2N) + ... + p2N,2N ft(1).

VI-6
Une équation matricielle permet d'exprimer ce système d'équation simultanée de manière

plus simple, en écrivant ft comme vecteur colonne des probabilités de chaque classe et P la
matrice des probabilités de transition. On aura :
ft+1 = P ft,
avec :
p0,0 p1,0 ... p2N,0
p0,1 p1,1 ... p2N,1
P= . . ... .
. . ... .
p0,2N p1,2N ... p2N,2N
La récurence s'écrit :
ft = Pt f0.
Ce système d'équation peut se calculer aisément tant que la taille de la population n'est
pas trop élevée. Un tel résultat est illustré dans l'exemple suivant.
Soit une population d'effectif limité, où la dérive intervient seule. Chaque génération est
formée par tirage au sort de 2N = 4 gamètes. Examinons le devenir des allèles A 1 et A2, dont
les fréquences sont égales dans la population de départ. Le tableau 6.2 donne les probabilités
(ft) des différentes classes possibles de l'allèle A 1, au cours des premières générations,
calculées à partir des lois binomiales de transition.
_____________________________________________________________________________
TABLEAU 6.2. Lois de probabilités de l'allèle A1 dans une population reproduite par 4
gamètes à chaque génération. xt : fréquence allélique moyenne, Ht : hétérozygotie moyenne.
_____________________________________________________________________________
Classes des
fréquences
alléliques 0/2N 1/2N 2/2N 3/2N 2N/2N xt Ht
Fréquences
alléliques 0 1/4 1 /2 3/4 1
générations
_____________________________________________________________________________
0(départ) 1 0,5 0,5
1 0,0625 0,25 0,375 0,25 0,0625 0,5 0,375
2 0,1660 0,2109 0,2461 0,2109 0,1660 0,5 0,2812
3 0,2490 0,1604 0,1812 0,1604 0,2490 0,5 0,2109
4 0,3117 0,1205 0,1356 0,1205 0,3117 0,5 0,1582
5 0,3587 0,0904 0,1018 0,0904 0,3587 0,5 0,1187
VI-7
7 0,4206 0,0508 0,0572 0,0508 0,4206 0,5 0,0667

8 0,4404 0,0381 0,0430 0,0381 0,4404 0,5 0,0500
¥ 0,5 0 0 0 0,5 0,5 0

_____________________________________________________________________________
Plusieurs points fondamentaux, valables pour toute population d'effectif limité, peuvent
être discutés sur cet exemple, dont la représentation graphique est donnée par la figure 6.2.
1) Tendance vers l'homozygotie
Pour une fréquence initiale de A1 on a x0 = 0,5 et donc f0(0,5) = 1 et f0(x) = 0 pour tout
x ¹ 0,5. A la première génération, les fréquences alléliques sont distribuées selon une loi
binomiale de moyenne 0,5 et de variance (0,5) 2/4 = 1/16. Au cours des générations suivantes la
moyenne de la distribution ne change pas, mais sa variance augmente. On démontre qu'elle est
égale à :
Vx,t = x0 (1-x0) [1-(1-1/2N)t], ou,
avec l'approximation (1-a)b » e -ab, pour a petit devant 1,
Vx,t = x0 (1-x0) (1-e -t/2N).
La valeur de la variance augmente au cours des générations et tend vers la limite Vx =

x0(1-x0). Les probabilités des classes intermédiaires diminuent, alors que celles des classes
extrêmes (absorbantes) augmentent. Ceci traduit le fait que la probabilité de fixation des allèles
augmente avec le temps.
La probabilité d'hétérozygotie à la génération t étant :
2N
Ht = 2  (i/2N)(1-i/2N) ft(i),
i=0
on a la relation :
Ht+1 = Ht, ou  est le taux caractéristique de décroissance de l'hétérozygotie. On peut

démontrer que  est lié à l'effectif de la population par la relation =1-1/2N. Dans l'exemple
étudié les valeurs successives de H sont : H0 = 0,5 ; H1 = 0,375 ; H2 = 0,2812 ; .... H¥ = 0,
avec = 0,75. On note ici que les probabilités des classes extrêmes sont égales. Il s'agit d'un
cas particulier lié au fait que les fréquences des deux allèles sont égales au départ. La dérive
VI-8
tendra à fixer A1 aussi souvent qu'à le perdre, d'où f ¥(0) = f¥(1) = 0,5. Si la fréquence de
départ est plus proche de 1 (ou inversement de 0), la probabilité de fixation de la classe 1 (ou
inversement 0) sera la plus élevée.
2) Notion de distribution stationnaire
On remarque (fig.6.2) qu'à partir d'un certain nombre de générations (ici vers la huitième)
la forme générale de la distribution ne varie plus, (bien que les probabilités d'appartenance à
chacune des classes continuent à varier). Il s'agit là d'un phénomène général de ce type de
processus markovien, que l'on appelle une distribution stationnaire. Il est dû au fait qu'à partir
d'un certain nombre de générations, les transitions entre les différentes classes tendent à se
compenser mutuellement. Dans le cas où la dérive intervient seule les probabilités des classes
intermédiaires tendent vers une même valeur et la distribution de ces probabilités devient
pratiquement uniforme entre les classes 0 et 1 (non comprises).
Wright a démontré que la distribution des fréquences alléliques entre 0 et 1 tendait en

première approximation vers une loi stationnaire de distribution uniforme, où toutes les classes
ont la même probabilité. Cette tendance vers la distribution stationnaire est vraie quelle que
soit la distribution initiale. Il a également démontré que lorsque l'état stationnaire était atteint la
fixation des allèles se faisait à un taux fixe de k = 1/2N par génération.
Cette valeur se vérifie sur l'exemple de l'évolution de la population d'effectif 2N = 4.
L'état stationnaire étant atteint, soit L la probabilité des locus non fixés à la génération t. La
probabilité de fixation à la génération t+1 sera L/2N (probabilité L/4N de fixer A1 et L/4N de
le perdre). Il restera donc une probabilité de (L-L/2N) pour que la population demeure
polymorphe. A la génération 7, la probabilité des classes intermédiaires est de 0,0508 + 0,0572
+ 0,0508 = 0,1588. Le taux de fixation est : k = 1/2N = 1/4 par lequel nous multiplions la
probabilité 0,1588, soit : 0,1588/4 = 0,0397. Cette valeur est la probabilité de fixation entre la
7ème et la 8ème génération. D'après les calculs exacts effectués avec la distribution binomiale,
nous vérifions qu'effectivement la probabilité des classes terminales a augmenté de : (0,4404 x
2) - (0,4206 x 2) = 0,0396. Ainsi la théorie développée fournit de très bonnes approximations
pour l'étude des distributions de probabilités lorsque la dérive agit seule.
3) Augmentation de la consanguinité
Dans toute population d'effectif limité, et bien que les croisements se fassent au hasard,
un certain nombre de géniteurs participeront plus que d'autres à la formation des générations
suivantes par simple chance. Il en résultera une consanguinité (dite consanguinité d'état) qui est
directement liée au processus d'homogénéisation allélique de la population. Cette
homogénéisation concerne toujours l'ensemble du génome. D'une génération à la suivante seuls
VI-9
certains allèles seront représentés. En poursuivant dans le temps la population devient à la fois
plus homogène et plus consanguine. A la limite, toute la population sera composée d'individus
consanguins possèdant, à chaque locus, des copies identiques provenant d'un seul allèle
ancestral.
L'évolution du coefficient de consanguinité de la population (probabilité d'identité de

deux gènes homologues pris au hasard), au cours des générations, peut être établie de la
manière suivante. Soit une population idéale constituée de N individus monoïques dans
laquelle tous les croisements se font au hasard (y compris l'autofécondation). Tout individu de
la génération t résulte d'un tirage au sort dans l'urne des gamètes parentaux. Ici le tirage
s'effectue avec remise, dans une urne contenant 2N gènes du locus considéré. Un individu
possèdera 2 gènes identiques s'il a :
- soit 2 copies provenant d'un même gène parental (probabilité 1/2N)
- soit 2 copies provenant de 2 gènes indépendants (probabilités 1-1/2N), ceux-ci étant

cependant identiques par consanguinité de la génération t-1 (probabilité F t-1).
Les croisements se faisant au hasard, tous les individus ont le même coefficient de
consanguinité, et celui ci est égal au coefficient moyen de la population. On a donc :
Ft = 1/2N + (1 - 1/2N) Ft-1
soit en calculant 1-Ft,
1 - Ft = (1 - 1/2N)(1-Ft-1)
= (1 - 1/2N)t (1-F0)
et Ft = 1 - (1-F0)(1-1/2N)t.
Si la population de départ n'est pas consanguine on a F0= 0, et donc

Ft = 1-(1-1/2N)t.
Toute population d'effectif limité devient donc de plus en plus consanguine avec le temps,
et ceci d'autant plus rapidement que la taille de la population est petite (fig.6.3).
En se souvenant que (1-F) est proportionnel à la fréquence des hétérozygotes (cf.

Chapitre 5.1.4), soit Ht=k(1-Ft), on a, après remplacement et simplification par k :
VI-10
Ht = (1 - 1/2N) Ht-1
et Ht = (1 - 1/2N)t H0 d'ou Ht ~ H0e-t/2N.
A chaque génération l'hétérozygotie d'une population d'effectif N est réduite d'un facteur
(1-1/2N). Plus la population sera petite, plus la diminution des hétérozygotes sera rapide. Avec
2N = 4, on retrouve l = 0,75.
Si la population ne pratique pas l'autofécondation, ou appartient à une espèce dioïque, la
variation de la fréquence des hétérozygotes est donnée par la formule approchée :
Ht ~ (1 - 1/2N+1) Ht-1 ~ (1 - 1/2N+1)t H0 .
Dans une population d'effectif fini, la dérive conduit donc à l'élimination de toutes les
copies des différents allèles, à l'exception d'un seul type. Comme nous venons de le voir ceci
signifie que l'hétérogzygotie diminuera (jusqu'à H = 0) et que la consanguinité augmentera
(jusqu'à F = 1). Mais ce phénomène est différent de ce que l'on observe dans une population
consanguine d'effectif infini. En effet, dans cette dernière les fréquences alléliques ne varient
pas et seules les fréquences génotypiques sont modifiées. A l'infini, la population sera
constituée uniquement de génotypes homozygotes, mais les différents types d'allèles seront
conservés. En revanche lorsque la dérive agit seule les fréquences alléliques varient
aléatoirement, mais les croisements se faisant toujours au hasard les fréquences génotypiques
restent généralement proche de l'équilibre de Hardy-Weinberg. Si la fréquence des
hétérozygotes diminue alors, c'est à cause de la tendance à la fixation d'un des allèles,
processus qui entraine la raréfaction des autres allèles et donc la diminution globale de
l'hétérozygotie.
4) Interprétations des lois de distribution des fréquences alléliques
Le concept de dérive génétique tel que nous l'avons abordé peut-être généralisé. L'étude
de la dérive a été présentée en considérant une population d'effectif limité, dans laquelle nous
examinions l'évolution des fréquences alléliques en un seul locus et durant un nombre infini de
générations. On remarquera cependant que cette étude serait formellement identique si nous
considérions la distribution des fréquences d'un allèle donné dans une infinité de populations à
une même génération, puis au cours du temps.
De façon similaire nous pouvons considérer l'ensemble des locus d'une population, et
étudier la distribution des fréquences d'un allèle donné par locus, à une génération, puis au
cours du temps.
VI-11
L'étude de la distribution de fréquence d'un allèle dans plusieurs populations peut être
illustrée par une expérience classique due à Buri (1956, Evolution 10:367). Cet auteur
s'intéressa à l'évolution de deux allèles au locus brown (couleur de l'oeil) dans de petites
populations (N = 16) de Drosophila melanogaster. Les deux allèles choisis, bw et bw 75, ne
semblaient pas posséder de différences sélectives et déterminaient des phénotypes distinguables
en présence d'un autre allèle de coloration de l'oeil pour lequel tous les individus étaient
homozygotes.
La figure 6.4 présente le résultat d'une expérience réalisée sur 107 petites populations
ayant toutes au départ 50% d'allèles bw75. Dès la première génération, la distribution de
fréquence de bw75 dans les différentes populations s'étale autour de la moyenne 0,5 et ce
phénomène s'accentue au cours du temps. Les classes 0 et 1 correspondant aux populations
ayant fixées l'un des allèles ne sont pas représentées. A la génération 19, 30 populations avaient
fixé l'allèle bw et 28 l'allèle bw 75. Ce résultat correspond bien à l'équiprobabilité attendue sans
sélection. D'autre part, et bien que le nombre de populations ne soit plus très grand, on voit que
la distribution des classes intermédiaires s'est uniformisée vers la 17ème génération et que la
forme de cette distribution n'a plus varié dès lors de manière significative, ce qui illustre bien le
principe de la distribution stationnaire.
6.3 NOTION D'EFFECTIF EFFICACE
Dans l'expérience de Buri rapportée précédemment, l'analyse générale est bien en accord
avec ce que l'on attend sous l'action de la dérive. Cependant, l'analyse quantitative révèle que
les distributions observées ne correspondent pas aux distributions théoriques de populations de
16 individus mais plutôt à celles de populations de 9 individus. Il s'agit là d'un phénomène
général, l'effectif démographique d'une population n'est pas l'effectif qu'il convient d'utiliser
dans les équations de la dérive génétique. En réalité un certain nombre d'individus ne se
reproduisant pas, le taux sexuel peut varier au cours du temps ainsi que le nombre global
d'individus. Or les équations employées pour décrire le processus stochastique supposent que
l'effectif est constant au cours du temps et que le taux sexuel est équilibré. Afin d'utiliser ces
équations, on recherche alors un nombre N e, appelé effectif efficace de la population, sorte de
"moyenne pondérée" qui remplace N dans les formules. Une population d'effectif réel N se
comportera en fait comme une population "idéale" d'effectif Ne.
Le calcul de l'effectif efficace peut être entrepris de plusieurs manières. On recherche soit
un effectif donnant une évolution de consanguinité identique à celle de la population réelle, soit
un effectif ayant une distribution identique de la variance des fréquences alléliques. Les deux
VI-12
approches donnent des résultats identiques sauf dans quelques cas particuliers qui sont détaillés
dans l'ouvrage de Crow et Kimura (1970).
En cas de taux sexuel non équilibré, pour une population constituée de N f femelles et de
Nm mâles, on démontre que l'effectif efficace est, dans le cas d'allèles autosomiques
Ne = 4 NfNm/(Nf+Nm).
Ainsi dans un troupeau de 200 femelles et 50 mâles, l'hétérogénéité diminuera de la

même façon que dans un troupeau de 160 individus contenant autant de mâles que de femelles.
Si la variation concerne le nombre de reproducteurs par génération, on démontre que N e

est approximativement égal à la moyenne harmonique des effectifs réels (N i) sur la période
considérée, soit :
Ne = t/(1/Ni).
i
Ici encore l'effectif le plus faible influera le plus sur la population. Pour une population
ayant 5 générations annuelles d'effectifs : 50, 200, 800, 3200 et 12800, on obtient Ne = 188.
La variation du nombre de reproducteurs par génération est également un facteur

important. Rappelons que dans la population idéale, chaque individu contribue de façon
identique au pool des gamètes et donc à la formation des zygotes. Ceux-ci meurent au hasard.
La population étant stable, chaque couple fournit en moyenne 2 descendants. Dans ce cas idéal,
la distribution du nombre des descendants suit une loi de Poisson de moyenne et de variance 2.
Dans les populations naturelles, le nombre de descendants par couple varie d'une façon
importante. La moyenne ( k ) ne sera pas sensiblement différente de 2 si la population est en
équilibre avec son milieu. En revanche, les différences de fertilité et de viabilité entraîneront
des écarts plus importants pour la variance (Vk). Dans ces conditions on a :
N k (N k - 1)
Ne = ----------------------- .
(N-1)Vk + N k ( k -1)
Si la variance de la taille des familles est supérieure à 2, ceci signifie qu'une plus grande
proportion des individus de la génération suivante proviendra d'un nombre plus restreint de
parents. Dans ces conditions, le nombre efficace de parents sera plus faible que le nombre réel.
C'est le cas le plus probable dans les populations naturelles.
VI-13
Notons cependant que le cas inverse est théoriquement possible, une variance inférieure à
2 entraînant un Ne supérieur au nombre réel. Une application particulièrement utile de ce cas
concerne les espèces de très faible effectif dont on souhaite la protection et qu'un suivi
généalogique approprié peut ainsi permettre de mieux "gérer".
On remarque que pour une population dans laquelle les gamètes sont tirés au hasard dans
les urnes parentales, la distribution de k suit une loi de Poisson avec V k = k, on retrouve alors
Ne = N, l'effectif efficace étant confondu avec l'effectif réel pour toute population idéale.
Dans le cas particulier d'un élevage où le nombre de reproducteurs reste constant à chaque
génération, nous aurons k = 2. On remplace alors k par 2 et (N-1)V k par NVk. En effet, ici la
moyenne étant parfaitement connue, on économise 1 degré de liberté. Le dénominateur de la
variance de k est donc N et non N-1, soit :
 (ki - 2)2
i
Vk = ------------ ,
N
dont on déduit :
4N - 2
Ne = ------- .
Vk + 2
Enfin, la dispersion des individus, non plus d'une façon uniforme sur le terrain, mais en
groupes reproducteurs voisinant les uns avec les autres, influence également l'effectif efficace
de la population. Cet effectif dépend alors du nombre de reproducteurs par unité de surface ()
et de la dispersion effective entre le lieu de naissance d'un individu et celui de ses descendants.
Cette dispersion est estimée par la variance de la distance linéaire entre les lieux de naissance et
de reproduction (2). Si la dispersion suit une loi normale à deux dimensions, 39 % des
individus auront leurs descendants à l'intérieur d'un cercle, centré sur leur propre lieu de
naissance, et de rayon ; 87 % auront leurs descendants dans un cercle de rayon 2 et 99 %
dans un rayon de 3. L'effectif efficace de la population, appelé ici effectif de voisinage est
alors donné par l'équation :
Ne = 42.
Pour des populations de rongeurs dont les effectifs sont de 5 à 10 individus par hectare et
la variance de dispersion de 1 à 2 ha, les effectifs de voisinage sont de l'ordre de 60 à 250.
L'effectif efficace de ces animaux pourtant abondants peut ainsi paraître faible mais est
VI-14
cohérent avec des mesures obtenues à partir du taux de polymorphisme enzymatique (Avise et
al., 1979, J. Mamm. 60: 177).
6.4 ETUDE DES LOIS DE DISTRIBUTION DES FREQUENCES ALLELIQUES
Comme nous l'avons précédemment signalé, la méthode exacte permettant de traiter

l'évolution des lois de distribution des fréquences alléliques ne peut être numériquement
appliquée que pour de petites populations. Kimura (1955, Proc. Natl. Acad. Sci. USA 41:144)
a montré que le changement aléatoire des fréquences alléliques pouvait être analysé par la
méthode dite des équations de diffusion.
Le développement mathématique de cette méthode étant ici hors de propos, le lecteur

intéressé pourra consulter les références suivantes: Crow et Kimura (1970), Roughgarden
(1979), Ewens (1979) et Kimura (1983),
Nous présenterons seulement les notions permettant d'interpréter les résultats graphiques
de ces équations. Les lois de distributions sont des lois continues de densité de probabilité. Le
principe du traitement est en premier lieu d'ajuster une telle loi aux distributions discontinues
décrites jusqu'à présent. Kimura a ainsi obtenu le système complet d'équations permettant de
décrire l'évolution des distributions de fréquences alléliques pour une population d'effectif N et
de fréquences initiales x1, x2 quelconques. Les courbes de la figure 6.5 illustrent ces résultats.
Ces courbes doivent se "lire" comme des courbes de densités de probabilité, dont la loi de
Gauss est la plus connue. La surface comprise entre la courbe et l'axe des abscices (fréquence
allélique x comprise entre 0 et 1) représente la proportion des classes non fixées.
Dans la figure 6.5a, la fréquence initiale de l'allèle A 1 est de 0,5. La probabilité de

trouver des fréquences alléliques proche de cette valeur est grande au cours des premières
générations, puis va s'amenuisant. Après 2N générations la distribution est devenue horizontale
(distribution uniforme) et sa forme ne change plus au cours des générations successives
(distribution à l'état stationnaire). A ce moment chacun des deux allèles aura eu 50% chance
d'être fixé.
On notera que la modification de la forme des distributions au cours du temps est bien
fonction de l'effectif N. Pour une population de taille infinie la courbe se réduit à un "baton" en
abscisse 0,5; on retrouve la loi de Hardy-Weinberg et la population demeure en cet état. Pour
toute population de taille finie, les distributions évoluent vers des courbes en U (les branches
ascendantes à x=0 et x=1 ne sont pas représentées sur les figures 6.5a et 6.5b). Après un temps
infini, la distribution des fréquences intermédiaires aura une densité nulle (elle aura rejoint
VI-15
l'axe des abcisses) et on ne trouvera que deux batons en 0 et 1, signifiant que la population finit
par fixer A1 ou A2 avec la même probabilité (fig.6.5c).
Sur la figure 6.5b la fréquence initiale de A1 est de 0,1. Il faut alors de 4N à 5N

générations pour arriver à la distribution d'état stationnaire. A ce moment là, A 2 aura eu
environ 9 chances sur 10 d'être fixé.
Dans tous les cas, lorque la population a atteint l'état stationnaire de distribution, le taux
de fixation est de 1/2N comme nous l'avons vu précédemment. Ceci se généralise au cas du
multiallélisme (Kimura, 1955).
Ces distributions peuvent également être utilisées pour décrire le devenir, en probabilité,
d'un ensemble de populations. Soient 1000 populations de 100 individus chacune et de
fréquence initiale x1 = 0,5. Au bout de 200 générations, l'allèle A 1 sera fixé ou perdu dans la
moitié des populations. Pour les 500 populations restantes, la distribution de la fréquence de
A1 est pratiquement uniforme. A partir de ce stade, 1/200 des populations fixeront ou perdront
l'allèle A1 par génération, jusqu'à ce qu'elles deviennent toutes homogènes.
Ces distributions de fréquences en cours d'évolution, puis à l'état stationnaire peuvent être
étendues à des cas plus complexes dans lesquels la dérive interagit avec la sélection et/ou la
migration.
6.5 DERIVE GENETIQUE ET POPULATIONS NATURELLES
La réduction d'effectif peut provoquer des variations aléatoires des fréquences alléliques
qui modifient la constitution génétique aux générations ultérieures. Lorsque l'effectif reste
faible, mais à peu près constant, ces modifications se produiront progressivement. En revanche,
si l'effectif est extêmement réduit durant une ou quelques générations, l'impact de la dérive
peut être rapidement très important, et la constitution génétique de la population résultante très
différente de celle de la population mère.
De nombreux exemples de populations isolées ou semi-isolées présentant des

constitutions génétiques radicalement différentes des populations d'origine ont été rapportés
(Baker et Stebbins 1965; Dobzhansky 1970; Ford 1975). Dans plusieurs cas les observations
portent sur des populations insulaires (Gastéropodes, Reptiles, petits Mammifères), dont on
pense qu'elles ont été fondées par un petit nombre d'individus. Ce processus de dérive
génétique lié à une fondation par un petit échantillon de reproducteur est connu sous le terme
d'effet fondateur (Mayr 1942, 1963). Des situations similaires peuvent se rencontrer dans tout
système écologique isolé : forêt, lac, vallée terreste ou sous-marine ... Compte tenu du faible
VI-16
nombre de fondateurs (à la limite une seule femelle fécondée), les fréquences alléliques à de
nombreux locus ont toute chance d'être très différentes de celles de la population d'origine.
On notera cependant que la limitation d'effectif d'une population n'est pas obligatoirement
liée à un effet fondateur, mais que d'autres facteurs (épidémie, catastrophe naturelle, ...)
peuvent contribuer à une réduction locale de l'effectif (goulots d'étranglements des
populations).
Dans les populations humaines de l'Europe occidentale on connaît plusieurs exemples de

variations des fréquences alléliques dans des groupes plus isolés et ayant pu subir l'effet de la
dérive génétique (tableau 6.3). La population d'Islande présente de fortes différences avec les
autres populations européennes, différences attribuées à un effet fondateur suivies d'amples
fluctuations d'effectifs. Dans le cas de populations non-insulaires les variations d'effectif
pourraient suffire à induire les effets de la dérive.
VI-17
_____________________________________________________________________________
TABLEAU 6.3. Comparaisons des constitutions géniques pour divers groupes sanguins, entre
des populations d'Europe occidentale relativement isolées et leurs populations voisines. (Daprès
Mourant,1983, et Roychoudhury et Nei, 1988).
_____________________________________________________________________________
Pourcentage des allèles à différents locus

__________________________________
IA IB iO M d K
Populations
__________________________________________________________________________
Islandaise 20 5 75 58 37 5
Irlandaise 17 7 76 57 43 4
des îles Hébrides 18 7 75 70 37 5
Anglaise 27 5 68 54 40 5
Basque 24 2 74 63 56 5
Béarnaise 23 2 75 45 50 4
Corse 22 6 72 48 37 6
Française 26 6 68 52 42 4
Sarde 20 7 73 75 22 3
Italienne (Sud) 24 8 68 66 22 4
Bergamasque 24 6 70 56 43 5
Ladinienne 20 3 77 78 56 -
Allemande 28 9 63 54 43 4
Autrichienee 29 11 60 55 41 4
__________________________________________________________________________
VI-18
On remarquera cependant la particularité des modifications dans le système ABO, qui

vont toujours dans le sens d'une augmentation de la fréquence de l'allèle i O. Cette observation,
confirmée dans d'autres populations, a remis en question l'effet de la dérive sur cet allèle et a
été interprétée comme étant due à un effet sélectif. Il existe, dans toute population, une
tendance à une meilleure survie des foetus de groupe O par rapport aux groupes A et B. Au
niveau du continent, cette tendance serait (ou aurait été anciennement) contrecarrée par une
meilleure résistance des individus A et B à certaines maladies infectieuses, conduisant à un
équilibre entre les différentes fréquences alléliques. Dans les populations isolées, plus à l'abri
des épidémies, cette tendance serait moins contrecarrée, produisant en une augmentation de la
fréquence de l'allèle iO (Mourant, 1983). Cet examen montre combien il peut être délicat
d'attribuer un effet observé à l'action de la dérive dans les populations naturelles.
L'effet fondateur a cependant pu être clairement démontré par des expériences en

laboratoire (Dobzhansky et Pavlovsky, 1957, Evolution 11:311). 20 populations
expérimentales de Drosophila pseudoobscura ont été constituées ayant chacune 50 % de
chromosomes III possédant l'arrangement Arrowhead (AR) et 50 % le type Pikes Peak (PP). 10
de ces populations ont été fondées par 20 individus et les 10 autres par 4000. Après 18 mois
d'évolution séparée, chaque population avait atteint un effectif de plusieurs milliers et les
fréquences du type PP ont été observées (fig.6.6). Les fréquences moyennes étaient similaires
pour les populations petites à l'origine (0,27) et pour les grandes (0,33). Ce résultat était
conforme à des observations antérieures montrant que le génotype PP/AR présentait un
avantage sélectif par rapport aux deux autres (Cf. Chapitre 7).
Cependant, la variance des fréquences observées était quatre fois plus grande (118,91
contre 27,96) dans les populations issues d'un petit nombre de fondateurs. L'augmentation de la
diversité observée a été interprétée en supposant que les valeurs sélectives des génotypes
PP/PP, PP/AR, et AR/AR dépendent également du reste du génome dans lequel se trouve ces
chromosomes, et que cet "environnement génique" est d'autant plus différent entre populations
que celles-ci ont été fondées par un petit effectif. Cette plus grande variabilité ne masque pas
l'évolution moyenne vers une plus basse fréquence de chromosome PP, mais la module
considérablement.
L'importance de la dérive génétique sur la constitution génétique des populations et

notamment sur la possibilité d'établissement des nouvelles combinaisons géniques a été
mentionnée par Wright dès 1948 (Evolution 2:279), puis par Mayr (1954) sous le terme de
"révolution génétique", et plus récemment reprise par Carson et Templeton (1984, Ann Rev.
Ecol. Syst. 15:97), dans leur modèle des cycles fondateurs-expansions (The founder-flush
theory). Dans ce modèle la dérive génétique associée à l'effet fondateur détruit le système de
VI-19
coadaptation des gènes de la population mère. Dans son nouveau milieu la population connaît
une forte phase d'expansion permettant l'apparition et le maintien de nouvelles recombinaisons
qui auraient été éliminées auparavant. La population fondée posséde ainsi une variabilité
nouvelle, lui permettant un ensemble de réponses originales à d'autres types de sélection et
pouvant éventuellement conduire à la formation d'une nouvelle espèce. Sur ces différents
modèles le lecteur intéressé se reportera à la revue de Terzian et Biémont (1988, Génét. Sel.
Evol., 20:11).
On notera en conclusion, que lorsque la dérive agit seule sur une population, les
variations des fréquences alléliques résultant de l'échantillonage aléatoire des gamètes la
conduisent vers un état d'homozygotie totale. Pour des populations naturelles, où un tel
processus pourrait être extrêmement lent, une probabilité asymptotique n'aura d'intérêt que si
l'on précise une vitesse de fixation, par exemple le taux de fixation par génération.
Pour ces populations, un paramètre important est à prendre en compte, celui de l'effectif
efficace qui peut différer fortement de l'effectif démographique. Une population apparemment
grande peut se comporter comme une petite population selon ses caractéristiques biologiques
ou écologiques. Cette distinction entre grandes et petites populations n'a pas été quantifiée ici
d'une manière précise. Nous verrons au chapitre 10 que la séparation est assez diffuse et qu'elle
dépend des taux de mutation-migration et des intensités de sélection.
VI-20
Légende des figures

Exemple de figures dont le lecteur cherchera l’illustration
Fig.6.1 : Evolution de la fréquence allélique dans quatre repliques d'une population de 25

individus. Entre 1/2N et (2N-1)/2N, les fréquences varient de manière aléatoire. La moyenne
des fréquences est indiquée par la ligne en tirets. (D'après Hedrick, 1985).
Fig.6.2 : Distribution des probabilités de la fréquence de l'allèle A 1 au cours des générations,

dans une population soumise à la dérive génétique (2N=4).
Fig.6.3 : Augmentation du coefficient de consanguinité au cours du temps, en fonction de

l'effectif (N) de la population.
Fig.6.4 : Distribution de la fréquence de l'allèle bw 75 au cours du temps, dans 105 lignées de

Drosophila melanogaster reproduites par 16 individus à chaque génération. La fréquence
initiale de l'allèle bw75 était de 0,5. La hauteur de chaque barre donne le nombre de lignées
ayant la fréquence allélique indiquée en abscisse. Les lignées fixées aux générations
précédentes ne sont pas représentées (D'après Buri, 1956).
Fig.6.5 : Distributions de la densité de probabilité F(x) de la fréquence allèlique x, dans des

populations d'effectif N, soumises à la dérive génétique. En a et b, les fréquences alléliques
initiales sont respectivement de 0,5 et 0,1. Après N/10 générations la distribution de
probabilité est donnée par la courbe la plus élevée. Au cours des générations cette courbe tend
à s'aplanir. A partir de 2N générations (a), ou de 4N générations (b), la distribution devient
uniforme, toutes les fréquences alléliques dans l'intervalle [0;1] étant équiprobables. Les
probabilités de fixation, non indiquées sur les figures a et b, sont représentées sur la fig.c,
pour une population de fréquence initiale 0,5 et après 2N générations. Dans ces conditions les
classes non fixées décroissent à un taux de 1/2N, et chaque classe fixée (0 et 1) s'accroît à un
taux de 1/4N. (a et b d'après Kimura, 1955 ; c d'après Wright, 1931).
VI-21
Fig.6.6 : Impact de l'effectif initial des populations sur l'évolution de la fréquence du

chromosome portant l'inversion PP chez Drosophila pseudoobscura. Les abscisses sont
orientées en sens inverse pour montrer la plus grande dispersion des fréquences observées
dans les populations issues d'un petit nombre de fondateurs.

Doc 06

Transféré par

Droits d'auteur :

Formats disponibles

Doc 06

Transféré par

Informations du document

Titre original

Copyright

Formats disponibles

Partager ce document

Partager ou intégrer le document

Options de partage

Avez-vous trouvé ce document utile ?

Ce contenu est-il inapproprié ?

Droits d'auteur :

Formats disponibles

Doc 06

Transféré par

Droits d'auteur :

Formats disponibles

LA DERIVE GENETIQUE

6.1 VARIATION ALEATOIRE DES FREQUENCES ALLELIQUES

Comme dans le modèle de Hardy-Weinberg, nous commencerons par étudier un cas

Pour former les N zygotes de la génération t + 1 on doit ainsi tirer un nombre 2N de

P(i)= 2N x1i (1 - x1) 2N-i .

Exemple : soit une population dans laquelle x1 = 3/4 à la génération t. L'effectif de la

P(i) = 2N x i (1-x )2N-i et 2N = (2N)!/(i!(2N-i)!),

P(60) = 80!/(60!20!) . (3/4)60 .(1/4)20 = 0,103.

<0,35 0,35 0,40 0,45 0,50 0,55 0,60 >0,65

La composition allélique atteinte à chaque génération est bien un événement aléatoire et

avec évidemment ici Vx'2 = Vx'1.

La figure 6.1 illustre ce processus pour quatre populations polymorphes évoluant

6.2 EVOLUTION DES FREQUENCES ALLELIQUES ET LOIS DE DISTRIBUTION

Si le devenir final des populations soumises à l'action de la dérive apparait clairement, on

Le traitement mathématique du processus markovien de la dérive génétique est simple à

[f(0), f(1/2N), ..., f(1)]t => [f(0), f(1/2N), .., f(1)]t+1.

Classe (ou état) 0 1 i j 2N

Fréquence allélique 0/2N 1/2N i/2N j/2N 2N/2N

Probabilité de ft(0) ft(1/2N) ft(i/2N) ft(j/2N) ft(1)

ft+1(0) = p0,0 ft(0) + p1,0 ft( 1/2N) + ... + p2N,0 ft(1),

ft+1(1/2N) = p0,1ft(0) + p1,1ft(1/2N) + ... + p2N,1 ft(1),

ft+1(1) = p0,2N ft(0) + p1,2Nft(1/2N) + ... + p2N,2N ft(1).

Une équation matricielle permet d'exprimer ce système d'équation simultanée de manière

7 0,4206 0,0508 0,0572 0,0508 0,4206 0,5 0,0667

¥ 0,5 0 0 0 0,5 0,5 0

1) Tendance vers l'homozygotie

avec l'approximation (1-a)b » e -ab, pour a petit devant 1,

Vx,t = x0 (1-x0) (1-e -t/2N).

La valeur de la variance augmente au cours des générations et tend vers la limite Vx =

La probabilité d'hétérozygotie à la génération t étant :

Ht+1 = Ht, ou  est le taux caractéristique de décroissance de l'hétérozygotie. On peut

2) Notion de distribution stationnaire

Wright a démontré que la distribution des fréquences alléliques entre 0 et 1 tendait en

L'évolution du coefficient de consanguinité de la population (probabilité d'identité de

- soit 2 copies provenant d'un même gène parental (probabilité 1/2N)

- soit 2 copies provenant de 2 gènes indépendants (probabilités 1-1/2N), ceux-ci étant

Ft = 1/2N + (1 - 1/2N) Ft-1

soit en calculant 1-Ft,

Si la population de départ n'est pas consanguine on a F0= 0, et donc

En se souvenant que (1-F) est proportionnel à la fréquence des hétérozygotes (cf.

et Ht = (1 - 1/2N)t H0 d'ou Ht ~ H0e-t/2N.

Ht ~ (1 - 1/2N+1) Ht-1 ~ (1 - 1/2N+1)t H0 .

4) Interprétations des lois de distribution des fréquences alléliques

6.3 NOTION D'EFFECTIF EFFICACE

Ainsi dans un troupeau de 200 femelles et 50 mâles, l'hétérogénéité diminuera de la

Si la variation concerne le nombre de reproducteurs par génération, on démontre que N e

La variation du nombre de reproducteurs par génération est également un facteur

6.4 ETUDE DES LOIS DE DISTRIBUTION DES FREQUENCES ALLELIQUES

Comme nous l'avons précédemment signalé, la méthode exacte permettant de traiter

Le développement mathématique de cette méthode étant ici hors de propos, le lecteur

Dans la figure 6.5a, la fréquence initiale de l'allèle A 1 est de 0,5. La probabilité de

Sur la figure 6.5b la fréquence initiale de A1 est de 0,1. Il faut alors de 4N à 5N

6.5 DERIVE GENETIQUE ET POPULATIONS NATURELLES

De nombreux exemples de populations isolées ou semi-isolées présentant des

Dans les populations humaines de l'Europe occidentale on connaît plusieurs exemples de

Pourcentage des allèles à différents locus

On remarquera cependant la particularité des modifications dans le système ABO, qui

L'effet fondateur a cependant pu être clairement démontré par des expériences en

L'importance de la dérive génétique sur la constitution génétique des populations et