Doc 06
Doc 06
Doc 06
Dans les chapitres précédents les modèles présentés reposaient sur l'hypothèse d'un
effectif infini de géniteurs dans les populations, n'induisant pas de variation de fréquences
alléliques liée au processus d'échantillonnage des gamètes. Dans ce type de modèles, dits
déterministes, le devenir de toute population peut être prédit de façon certaine. Cependant, dans
les populations réelles le nombre de géniteurs est toujours limité et, par le simple fait du
hasard, certains allèles seront plus (ou moins) représentés dans la génération suivante. Ce
processus de fluctuations aléatoires est appelé dérive génétique. On ne peut alors plus prédire
avec exactitude les fréquences alléliques au cours du temps, mais simplement établir des
modèles, dits stochastiques, qui fournissent les différentes probabilités de chacun des états
possibles. Un ensemble de ces modèles a été développé depuis S. Wright (1931, Genetics
16:97), pour tenir compte de ce processus (revues in Wright, 1969 et Kimura, 1983). Dans ce
chapitre, l'étude de l'évolution de populations d'effectif limité sera abordée, en supposant
l'absence de mutation, de migration et de sélection.
Un zygote est lui-même formé par tirage au sort de 2 gamètes. Dans l'urne des gamètes,
nous avons par définition x1 allèles A1 et x2 allèles A2. Le nombre de gamètes formés étant
toujours très grand, même pour une population limitée de reproducteurs, l'effectif de l'urne des
gamètes peut être considérée comme infini. Par conséquent, le fait de tirer un gamète ne
modifie pas la composition de l'urne, et donc les probabilités de tirage des gamètes suivants.
VI-2
Si cette condition se réalise, la nouvelle fréquence de A 1 sera x1' = i/2N. Mais ce n'est là
qu'une éventualité, et une autre fréquence pourrait être atteinte, par exemple j/2N avec une
probabilité P(j).
La population n'a donc que 10,3 chances sur 100 de rester exactement à la même
fréquence. En revanche, tout écart (ici 9 sur 10) sera acquis pour la génération suivante. Ce
sera à partir de la nouvelle fréquence x1' de la génération t+1, et uniquement à partir d'elle, que
se fera le tirage de la génération n+2, avec des conséquences comparables. Un tel processus est
dit processus aléatoire en chaîne ou processus de Markoff.
On peut calculer, à partir de la loi binomiale, la probabilité de chacune des fréquences
possibles de la génération t+1. Les résultats d'un tel calcul sont présentés dans le tableau 6.1,
dans lequel les fréquences sont regroupées en classes.
VI-3
_____________________________________________________________________________
TABLEAU 6.1. Distribution des probabilités de la fréquence x' 1 de l'allèle A1 dans une
population soumise à la dérive génétique. La population est constituée de 50 individus issus
d'un tirage de 100 gamètes d'une urne gamétique infinie de fréquence x1 = 0,5.
_____________________________________________________________________________
Classes des fréquences de l'allèle A1 (x'1)
_____________________________________________________________________________
M(x'1) = x1,
soit dans l'exemple choisi M(x'1) = x1 = 0,5.
Autour de cette moyenne les différentes valeurs de la fréquence allélique seront distribuée
en fonction de la variance de la loi B(x1 ; 2N) :
x1 (1 - x1)
Vx'1 = ------------ , soit ici Vx'1 = 0,25 x 10-2,
2N
Cette variance est une fonction inverse de la taille de l'échantillon. Dans le cas des petites
population, la composition allélique à chaque génération va largement fluctuer. Cette
fluctuation se fera dans n'importe quelle direction puisque nous n'avons supposé pour l'instant
ni sélection, ni mutation. Ces fluctuations aléatoires entraînent une dérive des fréquences
alléliques. Cette dérive fixera tôt ou tard la population à l'état homozygote.
VI-4
En conclusion : La dérive génétique conduit tôt ou tard toute population soumise à ce seul
facteur vers un état d'homozygotie totale, et ce quelle que soit la séquence d'ADN considérée
(codante ou non codante).
x=1
ft(x) = 1, pour tout t.
x=0
Si l'on veut suivre l'évolution d'une population, il convient donc de calculer les vecteurs
des différentes probabilités au cours du temps telle que :
La transition, symbolisée par la flèche entre les deux vecteurs, recouvre un ensemble
d'éventualités, toutes régies par la loi binomiale précédemment définie, et que nous pouvons
expliciter par le schéma suivant :
Probabilité de
chaque classe à la ft+1(0) ................................ f t+1(j/2N) ...
génération t+1
Les classes fixes (0) et (1) ne peuvent donner que des gamètes A 1 ou A2, mais chacune
des autres classes de la génération t va concourrir, de façon spécifique symbolisée par chaque
flèche, à la probabilité de chacune des classes de la génération t+1. Or nous avons vu que si la
population est dans la classe i/2N, elle a une probabilité, régie par la loi binomale B(i, 2N), de
se trouver dans la classe j/2N, à la génération t+1. Cette probabilité est appelée probabilité de
transition de i vers j, et notée pi,j. Pour calculer la probabilité totale d'être dans la classe j à t+1,
il faut donc sommer toutes les contributions possibles de chaque classe de la génération t (les
pi,j), en les pondérant par la probabilité même d'existence de ces classes à la génération t (les
ft(i)).
On obtient ainsi :
La récurence s'écrit :
ft = Pt f0.
Ce système d'équation peut se calculer aisément tant que la taille de la population n'est
pas trop élevée. Un tel résultat est illustré dans l'exemple suivant.
Soit une population d'effectif limité, où la dérive intervient seule. Chaque génération est
formée par tirage au sort de 2N = 4 gamètes. Examinons le devenir des allèles A 1 et A2, dont
les fréquences sont égales dans la population de départ. Le tableau 6.2 donne les probabilités
(ft) des différentes classes possibles de l'allèle A 1, au cours des premières générations,
calculées à partir des lois binomiales de transition.
_____________________________________________________________________________
TABLEAU 6.2. Lois de probabilités de l'allèle A1 dans une population reproduite par 4
gamètes à chaque génération. xt : fréquence allélique moyenne, Ht : hétérozygotie moyenne.
_____________________________________________________________________________
Classes des
fréquences
alléliques 0/2N 1/2N 2/2N 3/2N 2N/2N xt Ht
Fréquences
alléliques 0 1/4 1 /2 3/4 1
générations
_____________________________________________________________________________
0(départ) 1 0,5 0,5
1 0,0625 0,25 0,375 0,25 0,0625 0,5 0,375
2 0,1660 0,2109 0,2461 0,2109 0,1660 0,5 0,2812
3 0,2490 0,1604 0,1812 0,1604 0,2490 0,5 0,2109
4 0,3117 0,1205 0,1356 0,1205 0,3117 0,5 0,1582
5 0,3587 0,0904 0,1018 0,0904 0,3587 0,5 0,1187
VI-7
Plusieurs points fondamentaux, valables pour toute population d'effectif limité, peuvent
être discutés sur cet exemple, dont la représentation graphique est donnée par la figure 6.2.
Pour une fréquence initiale de A1 on a x0 = 0,5 et donc f0(0,5) = 1 et f0(x) = 0 pour tout
x ¹ 0,5. A la première génération, les fréquences alléliques sont distribuées selon une loi
binomiale de moyenne 0,5 et de variance (0,5) 2/4 = 1/16. Au cours des générations suivantes la
moyenne de la distribution ne change pas, mais sa variance augmente. On démontre qu'elle est
égale à :
Vx,t = x0 (1-x0) [1-(1-1/2N)t], ou,
2N
Ht = 2 (i/2N)(1-i/2N) ft(i),
i=0
on a la relation :
tendra à fixer A1 aussi souvent qu'à le perdre, d'où f ¥(0) = f¥(1) = 0,5. Si la fréquence de
départ est plus proche de 1 (ou inversement de 0), la probabilité de fixation de la classe 1 (ou
inversement 0) sera la plus élevée.
On remarque (fig.6.2) qu'à partir d'un certain nombre de générations (ici vers la huitième)
la forme générale de la distribution ne varie plus, (bien que les probabilités d'appartenance à
chacune des classes continuent à varier). Il s'agit là d'un phénomène général de ce type de
processus markovien, que l'on appelle une distribution stationnaire. Il est dû au fait qu'à partir
d'un certain nombre de générations, les transitions entre les différentes classes tendent à se
compenser mutuellement. Dans le cas où la dérive intervient seule les probabilités des classes
intermédiaires tendent vers une même valeur et la distribution de ces probabilités devient
pratiquement uniforme entre les classes 0 et 1 (non comprises).
3) Augmentation de la consanguinité
Dans toute population d'effectif limité, et bien que les croisements se fassent au hasard,
un certain nombre de géniteurs participeront plus que d'autres à la formation des générations
suivantes par simple chance. Il en résultera une consanguinité (dite consanguinité d'état) qui est
directement liée au processus d'homogénéisation allélique de la population. Cette
homogénéisation concerne toujours l'ensemble du génome. D'une génération à la suivante seuls
VI-9
certains allèles seront représentés. En poursuivant dans le temps la population devient à la fois
plus homogène et plus consanguine. A la limite, toute la population sera composée d'individus
consanguins possèdant, à chaque locus, des copies identiques provenant d'un seul allèle
ancestral.
Les croisements se faisant au hasard, tous les individus ont le même coefficient de
consanguinité, et celui ci est égal au coefficient moyen de la population. On a donc :
1 - Ft = (1 - 1/2N)(1-Ft-1)
= (1 - 1/2N)t (1-F0)
et Ft = 1 - (1-F0)(1-1/2N)t.
Toute population d'effectif limité devient donc de plus en plus consanguine avec le temps,
et ceci d'autant plus rapidement que la taille de la population est petite (fig.6.3).
Ht = (1 - 1/2N) Ht-1
A chaque génération l'hétérozygotie d'une population d'effectif N est réduite d'un facteur
(1-1/2N). Plus la population sera petite, plus la diminution des hétérozygotes sera rapide. Avec
2N = 4, on retrouve l = 0,75.
Si la population ne pratique pas l'autofécondation, ou appartient à une espèce dioïque, la
variation de la fréquence des hétérozygotes est donnée par la formule approchée :
Dans une population d'effectif fini, la dérive conduit donc à l'élimination de toutes les
copies des différents allèles, à l'exception d'un seul type. Comme nous venons de le voir ceci
signifie que l'hétérogzygotie diminuera (jusqu'à H = 0) et que la consanguinité augmentera
(jusqu'à F = 1). Mais ce phénomène est différent de ce que l'on observe dans une population
consanguine d'effectif infini. En effet, dans cette dernière les fréquences alléliques ne varient
pas et seules les fréquences génotypiques sont modifiées. A l'infini, la population sera
constituée uniquement de génotypes homozygotes, mais les différents types d'allèles seront
conservés. En revanche lorsque la dérive agit seule les fréquences alléliques varient
aléatoirement, mais les croisements se faisant toujours au hasard les fréquences génotypiques
restent généralement proche de l'équilibre de Hardy-Weinberg. Si la fréquence des
hétérozygotes diminue alors, c'est à cause de la tendance à la fixation d'un des allèles,
processus qui entraine la raréfaction des autres allèles et donc la diminution globale de
l'hétérozygotie.
Le concept de dérive génétique tel que nous l'avons abordé peut-être généralisé. L'étude
de la dérive a été présentée en considérant une population d'effectif limité, dans laquelle nous
examinions l'évolution des fréquences alléliques en un seul locus et durant un nombre infini de
générations. On remarquera cependant que cette étude serait formellement identique si nous
considérions la distribution des fréquences d'un allèle donné dans une infinité de populations à
une même génération, puis au cours du temps.
De façon similaire nous pouvons considérer l'ensemble des locus d'une population, et
étudier la distribution des fréquences d'un allèle donné par locus, à une génération, puis au
cours du temps.
VI-11
L'étude de la distribution de fréquence d'un allèle dans plusieurs populations peut être
illustrée par une expérience classique due à Buri (1956, Evolution 10:367). Cet auteur
s'intéressa à l'évolution de deux allèles au locus brown (couleur de l'oeil) dans de petites
populations (N = 16) de Drosophila melanogaster. Les deux allèles choisis, bw et bw 75, ne
semblaient pas posséder de différences sélectives et déterminaient des phénotypes distinguables
en présence d'un autre allèle de coloration de l'oeil pour lequel tous les individus étaient
homozygotes.
La figure 6.4 présente le résultat d'une expérience réalisée sur 107 petites populations
ayant toutes au départ 50% d'allèles bw75. Dès la première génération, la distribution de
fréquence de bw75 dans les différentes populations s'étale autour de la moyenne 0,5 et ce
phénomène s'accentue au cours du temps. Les classes 0 et 1 correspondant aux populations
ayant fixées l'un des allèles ne sont pas représentées. A la génération 19, 30 populations avaient
fixé l'allèle bw et 28 l'allèle bw 75. Ce résultat correspond bien à l'équiprobabilité attendue sans
sélection. D'autre part, et bien que le nombre de populations ne soit plus très grand, on voit que
la distribution des classes intermédiaires s'est uniformisée vers la 17ème génération et que la
forme de cette distribution n'a plus varié dès lors de manière significative, ce qui illustre bien le
principe de la distribution stationnaire.
Dans l'expérience de Buri rapportée précédemment, l'analyse générale est bien en accord
avec ce que l'on attend sous l'action de la dérive. Cependant, l'analyse quantitative révèle que
les distributions observées ne correspondent pas aux distributions théoriques de populations de
16 individus mais plutôt à celles de populations de 9 individus. Il s'agit là d'un phénomène
général, l'effectif démographique d'une population n'est pas l'effectif qu'il convient d'utiliser
dans les équations de la dérive génétique. En réalité un certain nombre d'individus ne se
reproduisant pas, le taux sexuel peut varier au cours du temps ainsi que le nombre global
d'individus. Or les équations employées pour décrire le processus stochastique supposent que
l'effectif est constant au cours du temps et que le taux sexuel est équilibré. Afin d'utiliser ces
équations, on recherche alors un nombre N e, appelé effectif efficace de la population, sorte de
"moyenne pondérée" qui remplace N dans les formules. Une population d'effectif réel N se
comportera en fait comme une population "idéale" d'effectif Ne.
Le calcul de l'effectif efficace peut être entrepris de plusieurs manières. On recherche soit
un effectif donnant une évolution de consanguinité identique à celle de la population réelle, soit
un effectif ayant une distribution identique de la variance des fréquences alléliques. Les deux
VI-12
approches donnent des résultats identiques sauf dans quelques cas particuliers qui sont détaillés
dans l'ouvrage de Crow et Kimura (1970).
En cas de taux sexuel non équilibré, pour une population constituée de N f femelles et de
Nm mâles, on démontre que l'effectif efficace est, dans le cas d'allèles autosomiques
Ne = 4 NfNm/(Nf+Nm).
Ne = t/(1/Ni).
i
Ici encore l'effectif le plus faible influera le plus sur la population. Pour une population
ayant 5 générations annuelles d'effectifs : 50, 200, 800, 3200 et 12800, on obtient Ne = 188.
Dans les populations naturelles, le nombre de descendants par couple varie d'une façon
importante. La moyenne ( k ) ne sera pas sensiblement différente de 2 si la population est en
équilibre avec son milieu. En revanche, les différences de fertilité et de viabilité entraîneront
des écarts plus importants pour la variance (Vk). Dans ces conditions on a :
N k (N k - 1)
Ne = ----------------------- .
(N-1)Vk + N k ( k -1)
Si la variance de la taille des familles est supérieure à 2, ceci signifie qu'une plus grande
proportion des individus de la génération suivante proviendra d'un nombre plus restreint de
parents. Dans ces conditions, le nombre efficace de parents sera plus faible que le nombre réel.
C'est le cas le plus probable dans les populations naturelles.
VI-13
Notons cependant que le cas inverse est théoriquement possible, une variance inférieure à
2 entraînant un Ne supérieur au nombre réel. Une application particulièrement utile de ce cas
concerne les espèces de très faible effectif dont on souhaite la protection et qu'un suivi
généalogique approprié peut ainsi permettre de mieux "gérer".
On remarque que pour une population dans laquelle les gamètes sont tirés au hasard dans
les urnes parentales, la distribution de k suit une loi de Poisson avec V k = k, on retrouve alors
Ne = N, l'effectif efficace étant confondu avec l'effectif réel pour toute population idéale.
Dans le cas particulier d'un élevage où le nombre de reproducteurs reste constant à chaque
génération, nous aurons k = 2. On remplace alors k par 2 et (N-1)V k par NVk. En effet, ici la
moyenne étant parfaitement connue, on économise 1 degré de liberté. Le dénominateur de la
variance de k est donc N et non N-1, soit :
(ki - 2)2
i
Vk = ------------ ,
N
dont on déduit :
4N - 2
Ne = ------- .
Vk + 2
Enfin, la dispersion des individus, non plus d'une façon uniforme sur le terrain, mais en
groupes reproducteurs voisinant les uns avec les autres, influence également l'effectif efficace
de la population. Cet effectif dépend alors du nombre de reproducteurs par unité de surface ()
et de la dispersion effective entre le lieu de naissance d'un individu et celui de ses descendants.
Cette dispersion est estimée par la variance de la distance linéaire entre les lieux de naissance et
de reproduction (2). Si la dispersion suit une loi normale à deux dimensions, 39 % des
individus auront leurs descendants à l'intérieur d'un cercle, centré sur leur propre lieu de
naissance, et de rayon ; 87 % auront leurs descendants dans un cercle de rayon 2 et 99 %
dans un rayon de 3. L'effectif efficace de la population, appelé ici effectif de voisinage est
alors donné par l'équation :
Ne = 42.
Pour des populations de rongeurs dont les effectifs sont de 5 à 10 individus par hectare et
la variance de dispersion de 1 à 2 ha, les effectifs de voisinage sont de l'ordre de 60 à 250.
L'effectif efficace de ces animaux pourtant abondants peut ainsi paraître faible mais est
VI-14
cohérent avec des mesures obtenues à partir du taux de polymorphisme enzymatique (Avise et
al., 1979, J. Mamm. 60: 177).
Nous présenterons seulement les notions permettant d'interpréter les résultats graphiques
de ces équations. Les lois de distributions sont des lois continues de densité de probabilité. Le
principe du traitement est en premier lieu d'ajuster une telle loi aux distributions discontinues
décrites jusqu'à présent. Kimura a ainsi obtenu le système complet d'équations permettant de
décrire l'évolution des distributions de fréquences alléliques pour une population d'effectif N et
de fréquences initiales x1, x2 quelconques. Les courbes de la figure 6.5 illustrent ces résultats.
Ces courbes doivent se "lire" comme des courbes de densités de probabilité, dont la loi de
Gauss est la plus connue. La surface comprise entre la courbe et l'axe des abscices (fréquence
allélique x comprise entre 0 et 1) représente la proportion des classes non fixées.
On notera que la modification de la forme des distributions au cours du temps est bien
fonction de l'effectif N. Pour une population de taille infinie la courbe se réduit à un "baton" en
abscisse 0,5; on retrouve la loi de Hardy-Weinberg et la population demeure en cet état. Pour
toute population de taille finie, les distributions évoluent vers des courbes en U (les branches
ascendantes à x=0 et x=1 ne sont pas représentées sur les figures 6.5a et 6.5b). Après un temps
infini, la distribution des fréquences intermédiaires aura une densité nulle (elle aura rejoint
VI-15
l'axe des abcisses) et on ne trouvera que deux batons en 0 et 1, signifiant que la population finit
par fixer A1 ou A2 avec la même probabilité (fig.6.5c).
Dans tous les cas, lorque la population a atteint l'état stationnaire de distribution, le taux
de fixation est de 1/2N comme nous l'avons vu précédemment. Ceci se généralise au cas du
multiallélisme (Kimura, 1955).
Ces distributions peuvent également être utilisées pour décrire le devenir, en probabilité,
d'un ensemble de populations. Soient 1000 populations de 100 individus chacune et de
fréquence initiale x1 = 0,5. Au bout de 200 générations, l'allèle A 1 sera fixé ou perdu dans la
moitié des populations. Pour les 500 populations restantes, la distribution de la fréquence de
A1 est pratiquement uniforme. A partir de ce stade, 1/200 des populations fixeront ou perdront
l'allèle A1 par génération, jusqu'à ce qu'elles deviennent toutes homogènes.
Ces distributions de fréquences en cours d'évolution, puis à l'état stationnaire peuvent être
étendues à des cas plus complexes dans lesquels la dérive interagit avec la sélection et/ou la
migration.
La réduction d'effectif peut provoquer des variations aléatoires des fréquences alléliques
qui modifient la constitution génétique aux générations ultérieures. Lorsque l'effectif reste
faible, mais à peu près constant, ces modifications se produiront progressivement. En revanche,
si l'effectif est extêmement réduit durant une ou quelques générations, l'impact de la dérive
peut être rapidement très important, et la constitution génétique de la population résultante très
différente de celle de la population mère.
nombre de fondateurs (à la limite une seule femelle fécondée), les fréquences alléliques à de
nombreux locus ont toute chance d'être très différentes de celles de la population d'origine.
On notera cependant que la limitation d'effectif d'une population n'est pas obligatoirement
liée à un effet fondateur, mais que d'autres facteurs (épidémie, catastrophe naturelle, ...)
peuvent contribuer à une réduction locale de l'effectif (goulots d'étranglements des
populations).
_____________________________________________________________________________
TABLEAU 6.3. Comparaisons des constitutions géniques pour divers groupes sanguins, entre
des populations d'Europe occidentale relativement isolées et leurs populations voisines. (Daprès
Mourant,1983, et Roychoudhury et Nei, 1988).
_____________________________________________________________________________
IA IB iO M d K
Populations
__________________________________________________________________________
Islandaise 20 5 75 58 37 5
Irlandaise 17 7 76 57 43 4
des îles Hébrides 18 7 75 70 37 5
Anglaise 27 5 68 54 40 5
Basque 24 2 74 63 56 5
Béarnaise 23 2 75 45 50 4
Corse 22 6 72 48 37 6
Française 26 6 68 52 42 4
Sarde 20 7 73 75 22 3
Italienne (Sud) 24 8 68 66 22 4
Bergamasque 24 6 70 56 43 5
Ladinienne 20 3 77 78 56 -
Allemande 28 9 63 54 43 4
Autrichienee 29 11 60 55 41 4
__________________________________________________________________________
VI-18
coadaptation des gènes de la population mère. Dans son nouveau milieu la population connaît
une forte phase d'expansion permettant l'apparition et le maintien de nouvelles recombinaisons
qui auraient été éliminées auparavant. La population fondée posséde ainsi une variabilité
nouvelle, lui permettant un ensemble de réponses originales à d'autres types de sélection et
pouvant éventuellement conduire à la formation d'une nouvelle espèce. Sur ces différents
modèles le lecteur intéressé se reportera à la revue de Terzian et Biémont (1988, Génét. Sel.
Evol., 20:11).
On notera en conclusion, que lorsque la dérive agit seule sur une population, les
variations des fréquences alléliques résultant de l'échantillonage aléatoire des gamètes la
conduisent vers un état d'homozygotie totale. Pour des populations naturelles, où un tel
processus pourrait être extrêmement lent, une probabilité asymptotique n'aura d'intérêt que si
l'on précise une vitesse de fixation, par exemple le taux de fixation par génération.
Pour ces populations, un paramètre important est à prendre en compte, celui de l'effectif
efficace qui peut différer fortement de l'effectif démographique. Une population apparemment
grande peut se comporter comme une petite population selon ses caractéristiques biologiques
ou écologiques. Cette distinction entre grandes et petites populations n'a pas été quantifiée ici
d'une manière précise. Nous verrons au chapitre 10 que la séparation est assez diffuse et qu'elle
dépend des taux de mutation-migration et des intensités de sélection.
VI-20