Null 7

Pr. N.
HARICH Polymorphisme Moléculaire SVI-6_BCM 2019/2020
UNIVERSITE CHOUAIB DOUKKALI ANNEE UNIVERSITAIRE 2019-2020

DEPARTEMENT DE BIOLOGIE FILIERE SCIENCES DE LA VIE
FACULTE DES SCIENCES Semestre_6 - Option_BCM
EL JADIDA
TRAVAUX DIRIGES (2ème Séance)

POLYMORPHISME MOLECULAIRE
Exercice 1: EXAMEN 2011/2012 (1h30’).
La Séquence du brin sens du gène codant pour l’Apolipoprotéine E humaine (allèle Epsilon 4). (Genbank : HUMAPOE4)
a) Donner la définition d’un gène ?
Le gène est l'unité de la séquence d'ADN portant une information génétique dans le génome.
b) Certaines parties de cette séquence ont été soulignées d'un trait simple; qu’est ce qui les caractérise ? A quoi
correspondent-elles ?
Les parties de la séquence du gène de l'apolipoprotéine E4 soulignées correspondraient aux séquences codantes ou
exons, (elles représentent une moindre fraction de la séquence par rapport aux les séquences non soulignées ou introns),
elles contiennent le codon initiateur au niveau du 2ème exon (le 1er exon également souligné ferait partie de la région 5'
UTR de l'ARNm) et le codon de terminaison (dans ce cas TGA) se trouve dans le 4ème; seuls les exons 2 et 3 respectent la
séquence consensus de fin d'exon (vues dans le cours: (AG)) et seuls les exons 3 et 4 commencent par le nucléotide G.
c) Examinez avec soin le début et la fin des séquences qui sont situées entre ces séquences soulignées, et dites qu’est ce qui
les caractérise ?
Les régions non soulignées correspondraient aux introns ou séquences non codantes, elles sont caractérisées en gros par
les séquences consensus de début (GT) et de fin (GA) d'introns.
d) Donner le nombre d’introns et le nombre d’exons du gène ApoE4 ? 5 introns et 4 exons.
e) Quel est le pourcentage de la région codante de ce gène ? 1163 / 5515 ≈ 21%
f) Quelles sont les fonctions (rôles) des protéines qui se fixent en premier sur ce gène dans la région allant du nucléotide
975 au nucléotide 1046 ?
Les ARN polymérases des eucaryotes ne reconnaissent pas directement leurs séquences promotrices : 5 facteurs de
transcription généraux ("Transcription Factor" : TFII-B, TFII-D, TFII-E, TFII-F et TFII-H) jouent le rôle d'intermédiaire
pour permettre la fixation des ARN polymérases et l'initiation de la transcription.
Le complexe complet [ARN polymérase - facteurs de transcription - séquence ADN du promoteur] est appelé complexe de
pré-initiation de la transcription. Ce complexe assure :
- le chargement précis de l'ARN polymérase II (Pol II) sur le bon site de démarrage de la transcription
- la déshybridation (ouverture) de l'ADN au niveau du promoteur
- le relargage de la Pol II du promoteur.
g) Quel est le rôle du triplet de nucléotides en 1871-1873 ? Quelle est sa phase de lecture ?
Il s'agit du codon ATG ou codon initiateur; sa phase de lecture (lue à partir de la 1ère base de la région codante)= phase2
h) Orientez la séquence du gène ApoE4? Traduire la séquence 1847-1913 de ce gène ?
l'orientation du gène est une orientation sens = 5'------>3'
1847
ATG AAG GTT CTG TGG GCT GCG TTG CTG GTC ACA TTC CTG GCA G 1913
Met - Lys - Val - Leu - Trp - Ala - Ser - Leu - Leu - Leu - Thr - Phe - Leu - Ala -
Pr. N. HARICH Travaux Dirigés_Polymorphisme Moléculaire SVI-6_BCM_2019/2020 1

Pr. N. HARICH Polymorphisme Moléculaire SVI-6_BCM 2019/2020
i) Le nucléotide en position 1913 est un G qui fait partie de la séquence traduite : quelle est sa position dans le cadre de
lecture : N1, N2 ou N3 ? (encadrer la réponse juste) il s'agit de N1
j) Le nucléotide en position 3007 est un G qui fait partie de la séquence traduite : quelle est sa position dans le cadre de
lecture : N1, N2 ou N3 ? (encadrer la réponse juste) il s'agit de N2
k) Quelle sera la longueur après transcription et maturation (comprenant l'addition de 1000 AMP du côté 3'-OH) de l'ARN
messager de l'apolipoprotéine E ? La longueur de l'ARNm mature serait de 1163nt + 1000A = 2163 nt
l) Quel est le rôle du codon (souligné deux fois) TGA en 4496 ? c'est le codon stop qui permet l'arrêt de la traduction
m) Quels sont les numéros des nucléotides de la boîte de polyadénylation ?
il s'agit de la séquence AATAAA située entre 4616 et 4621
n) De combien d'acides aminés se compose l'apolipoprotéine E mature ? [1163 -(44+23+145)] = 951 nt / 3 = 317aa
o) On voudrait amplifier par PCR l’exon 4 de ce gène, quels sont les critères du choix des primers d’une manière générale ?
• Contenu en GC doit être entre 40-60%.

• Tm pour les deux primers, ne doit pas différer par plus de 5ºC et la Tm du produit d’amplification ne doit pas différer
des deux primers par plus de 10ºC.
• Temperature d’annealing est généralement 5ºC inférieure à la Tm la plus faible. (Plus devrait être testée).
• Eviter l’existence de hairpins (épingles à cheveux) auto-complémentaires internes de plus de 4bp et de dimères de
plus de 8bp.
• l’extrémité 3' est extrêmement sensible – éviter qu’elle soit complémentaire à n’importe quelle région de l’autre
primer et doit posséder un match exact avec le template (pour ne pas avoir la formation de dimères de primers)
p) Quels sont les primers que vous choisiriez pour amplifier cet exon ? (soulignés en noir foncé, et encadrées en rouge)
Forward : F : 5' CCA AAG TGC TGG GAT TAG AG 3'
Reverse : R : 5' ACA GAG CCA GAC TCC GTC TA 3'
q) Décrire brièvement mais précisément les différents ingrédients requis et le principe de base de la technique de PCR ?
 2 primers – 0.2 - 0.4 M
 4 dNTPs – 200 M
 DNA polymérase – 0.5 -1 U pour 25 L de volume final
 Tampon – 1x
 MgCl2 – 1.5 mM
 Echantillon d’ADN – 5-50 ng/vol. final
Principe de la PCR : «Polymerase Chain Reaction» ou encore ACP pour "Amplification en Chaîne par Polymérase", est une
technique de réplication ciblée in vitro. Il s'agit de réaliser une succession de réactions de réplication d'une matrice double
brin d'ADN. Elle permet d'obtenir, à partir d'un échantillon complexe et peu abondant, d'importantes quantités d'un fragment
d'ADN spécifique et de longueur définie. L'ordre de grandeur à retenir est celui du million de copies en quelques heures.
C'est, généralement suffisant pour une utilisation ultérieure.
r) Quel est le comportement des amorces à chacune de ses étapes ?

Les amorces ou «primers» en anglais définissent, en la bornant, la séquence à amplifier. Les extrémités 3' pointent l'une vers
l'autre et permettent à la polymérase de réaliser l'amplification, exacte de la région encadrée par les 2 amorces, grâce à ces
extrémités 3' libres.
s) Quelle expérience simple vous permettra de savoir si l'amplification spécifique de votre fragment a réussi ?
Réaliser une électrophorèse sur gel d'agarose dont la concentration dépendra de la taille des bandes à séparer.
t) Quelle technique proposerez vous pour étudier les deux mutations au niveau du 4 ème exon ? Donner le principe de la
technique ? Expliquer brièvement le protocole que vous adopterez ?
PCR/ RFLP : on en a parlé en cours à propos de ce polymorphisme, et de la technique utilisée. Elle consiste à :
- amplifier l'exon par PCR.
- vérifier l'amplification par électrophorèse.
- digérer les amplifiats réussis par une enzyme de restriction.
- séparer par électrophorèse sur gel de polyacrylamide pour déterminer le génotype de chaque individu.

===============================================================================
Exercice 2: EXAMEN RATTRAPAGE 2008/2009 (45’) :
-----------------------------------------------------------------------------------------------------------------------------------------
Recommandations : - Lire attentivement les questions, et répondre aux emplacements réservés à la réponse,
- Cocher ou encercler la lettre correspondante à ou aux réponse (s) justes pour les questions QCM,
Ne répondez que lorsque vous êtes sûrs de la réponse.
-----------------------------------------------------------------------------------------------------------------------------
5)_Exercice : On voudrait étudier un fragment d’ADN de 740 pb correspondant à la région régulatrice située en amont
d’un gène protéique. Sa séquence est la suivante :
Brin sens : 5’ GATTCAGGAGATTCACAC -- -- 704 nt -- -- TCGGTACAGCTATACAGG 3’

Brin antisens : 3’ CTAAGTCCTCTAAGTGTG -- -- 704 nt -- -- AGCCATGTCGATATGTCC 5’
5-1) Parmi les amorces suivantes, quelle est la paire qui permettra l’amplification de ce fragment par PCR ?
a) 5’ GATTCAGGAGATTCACAC 3’ e) 5’ AGCCATGTCGATATGTCC 3’
b) 5’ CTAAGTCCTCTAAGTGTG 3’ f) 5’ GTGTGAATCTCCTGAATC 3’
c) 5’ CACACTTAGAGGACTTAG 3’ g) 5’ CCTGTATAGCTGTACCGA 3’
d) 5’ TCGGTACAGCTATACAGG 3’ h) 5’ GGACATATCGACATGGCT 3’
5-2) Donner le principe de base de la technique PCR ?

Principe de la PCR : «Polymerase Chain Reaction» ou encore ACP pour "Amplification en Chaîne par Polymérase", est une
technique de réplication ciblée in vitro. Il s'agit de réaliser une succession de réactions de réplication d'une matrice double
brin d'ADN. Elle permet d'obtenir, à partir d'un échantillon complexe et peu abondant, d'importantes quantités d'un fragment
d'ADN spécifique et de longueur définie. L'ordre de grandeur à retenir est celui du million de copies en quelques heures.
C'est, généralement suffisant pour une utilisation ultérieure.
5-3) Décrire brièvement mais précisément les différents ingrédients utilisés et leur importance ?
 2 primers – 0.2 - 0.4 M : permettent de définir et de délimiter la région à amplifier
 4 dNTPs – 200 M : matière première pour la polymérase qui lui sert à fabriquer le brin complémentaire
 DNA polymérase – 0.5 -1 U pour 25 L de volume final : enzyme qui permet la réplication de l'ADN
 Tampon – 1x : c'est le tampon qui garantit le bon fonctionnement de la DNA polymérase
 MgCl2 – 1.5 mM : apporte l'ion Mg2+ à la réaction de PCR et améliore l'amplification de l'ADN en stimulant l'activité de la
Taq Polymérase et son rendement, en plus d'augmenter la fidélité et la spécificité de l'hybridation primer-ADN matrice en
diminuant la répulsion des deux brin d'ADN chargés négativement par la neutralisation de ses charges négatives.
 Echantillon d’ADN – 5-50 ng/vol. final : échantillon individuel d'ADN à amplifier.
5-4) Quelle expérience simple vous permettra de vérifier si l’amplification a eu lieu ou pas ?
Réaliser une électrophorèse sur gel d'agarose dont la concentration dépendra de la taille des bandes à séparer.
5-5) Un polymorphisme de restriction Hae III biallélique de ce gène, résulte d’une substitution C par T qui fait disparaître le site
de restriction Hae III (GGCC) qui coupe entre GG et CC. Sachant que l’enzyme coupe le fragment en deux morceaux égaux :
L'allèle fréquent contient le site de restriction (SR)
La mutation de l'allèle rare élimine le site de restriction

X
a) quel est le nombre de bandes et la taille de(s) fragment(s) obtenus par électrophorèse chez chacun des trois sujets suivants :
 Homozygote pour la version allélique fréquente : 1 bande foncée = 1/2 la taille du fragment......
 Homozygote pour la version allélique rare : 1 bande = la taille complète du fragment (2 x la taille du 1er)
 Hétérozygote : 2 bandes : 1 bande foncée = 1/2 la taille du fragment + 1 bande = la taille complète du fragment
b) En utilisant la même manière d’écriture de la séquence initiale (extrémités + nombre de nucléotides), écrivez les deux
séquences sens obtenues après digestion par l’enzyme Hae III ?
5' ACT AAG GCA AAA TTC CGA GAG G 3'
5' CCC TAG AAG ATA CAC G 3'
c) * Sachant que la version allélique rare se trouve à l’état homozygote chez 9% des sujets de la population Berbère du
Rif, calculez les fréquences alléliques ?
soit p = fréquence de la variante allélique fréquente = C

soit q = fréquence de la variante allélique rare = T
Si f (TT) = q2 = 9 % = 0,09 q = f(T) = 0,3 ; d'où p = f(C) = 0,7
* Calculez les effectifs théoriques des différents génotypes attendus dans un échantillon de 1000 individus ?
f (TT) = q2 = 0,09 Effectif de TT = 90

f (CT) = 2pq = 2x0,3x0,7 = 0,42 Effectif de CT = 420
f (CC) = p2 = 0,49 Effectif de CC = 490
=============================================================================
===========================================================================

Exercice 3 : EXAMEN 2013/2014 (2h) .
1) Le gène protéique (voir séquence ci-dessous) contient des régions en gras, comment les appelle-t-on d’une manière
générale ? Quel est le nom et le rôle joué par chacune d’entre-elles en précisant leur position sur la séquence ?
* les régions en gras correspondent aux séquences de reconnaissance indispensables pour l'expression des gènes et la
fixation des facteurs de transcription (début et fin du gène) et par les facteurs d'épissage lors de la maturation de l'ARNm.
* - GGCCAATCT : Boîte GC: chez les eucaryotes, elles représentent les séquences reconnues par les facteurs de
- TATATA : Boîte TATA: transcription qui vont permettre la fixation de l'ARN polymérase.
- AG: Séquence consensus de fin d'intron fait partie du site accepteur lors de l'épissage (formation du spiceosome).
- GT: Séquence consensus de début d'intron fait partie du site donneur lors de l'épissage (formation du spiceosome).
- ATG: Codon d'initiation, borne 5' de l'ORF, 1er codon traduit
- TGA: Codon stop, borne 3' de l'ORF, représente le codon de fin de la traduction, reconnu par les FT. de terminaison.
- AATAAA: Séquence signal de polyadénylation, précède le site de clivage et de polyadénylation.
- TATGTTTG: Site de clivage de l'ARNmt.
2) Ces séquences en gras ont elles des applications en bioinformatique ? si oui lesquelles ?
Oui, elles sont utilisées par les programmes bioinformatiques permettant l'annotation des gènes et donc de distinguer les
séquences géniques des non géniques.
3) Le gène protéique (voir séquence) contient des régions soulignées et d’autres non, que représentent-elles ? Justifier votre
réponse.
Les séquences soulignées représenteraient les régions codantes ou exons, (faible proportion par rapport aux séquences non
soulignées), les séquences non soulignées seraient les régions non codantes ou introns ; ces deux types de séquences se
caractérisent par des séquences consensus de début et de fin: pour les introns (GT au début et AG à la fin) et pour les exons
(G au début et GA à la fin).
4) Quels sont les principaux polymorphismes moléculaires que vous connaissez et quels sont leurs principaux domaines
d’applications?
- SNP : ou Single Nucléotide Polymorphism, les plus fréquents (applications: phylogénie, pharmacogénétique, ...)
- STR : microsatellites ou -Short Tandem repeat-, très polymorphiques, (applications: identification individuelle, génétique
population, épidémiologie, ...)
- VNTR: minisatellites -Variable Number of Tandem repeats-, les plus polymorphiques, (idem, ...)
- Alus : principal SINE du génome humain, Short INterspersed Elements (mobiles), (génétique des populations, phylogénie, ...)
5) Quels avantages présentent les polymorphismes plurialléliques par rapport aux bialléliques ?
leur grande variabilité et leur taux d'hétérozygotie élevé
6) Le gène protéique (voir séquence) contient deux régions polymorphiques, l’une située sur l’intron 1 et l’autre sur l’intron
3, de quel(s) type(s) de polymorphisme s’agit-il ? Encadrez-les par des parenthèses et donner la position, le nom et la
taille du bloc de chacun ?
Intron 1: STR trinucleotide repeat (AGC)14 = 14 AGC
Intron 2 : STR hexanucleotide repeat (TTAGGG)16 = 16 TTAGGG
7) Quel est le mode de mutation de ces polymorphismes ?
Les STRs mutent via des mécanismes favorisant des petits changements (généralement une unité de répétition) Modèle step-
wise. Le mécanisme admis est celui du glissement de la polymérase (qui répète (+1 unité) ou saute (-1 unité) lors de la
réplication de la région répétitive).
8) Quelle est la position du codon initiateur sur la séquence et sur le chromosome ? Quelle est sa phase ?
la position de ATG sur la séquence est 206-208 alors que sur le chromosome, elle est : 90,855,536 - 90,855,538
Sa phase est une phase 2.
9) Quelle est la position du codon stop sur la séquence et sur le chromosome ? ……….. , ……………
la position de TGA sur la séquence est 865-867 alors que sur le chromosome, elle est : 90,856,195 - 90,856,197
10) Quelle est la proportion de la région codante ? 401/1065 = 37,65%. (en considérant tous les exons).
11) Quelle sera la longueur après transcription et maturation (comprenant l'addition de 150 AMP du côté 3'-OH) de l'ARN
messager produit par ce gène ? Coiffe (1 pb) + Exons (=401pb) + 150 pb = 552 pb.
12) De combien d'acides aminés, sera composée la protéine mature produite à partir de ce gène ? 327 pb /3 = 109 aa
13) Le nucléotide G en position 477 fait partie de la séquence traduite : quelle est sa position dans le codon (N1, N2 ou N3)
? N2 , et quel le numéro du codon en question ? Codon 53 ; A quel acide aminé code ce codon ? codon AGG code pour
Arg , et quelle est sa position sur la chaine peptidique : il s'agit de l'aa N° 53.
14) Quel est le nucléotide en position 766 ? nt 766 = C, quelle est sa position dans le codon : N1, N2 ou N3 ? N1 , quel est
l’acide aminé codé par ce codon? codon CAG code pour Gln, et quelle est sa position dans la protéine ? aa= N° 77.
15) Les séquences grisées représentent les régions proposées par le logiciel primer3 à partir desquelles on peut choisir des
primers, quelles sont toutes les parties du gène qu’on peut amplifier grâce à ces primers?
P1 et P2 permettraient l'amplification de l'exon 1 ; P1 et P3 permettraient l'amplification des exons 1 et 2 ; P2 et P3 permettraient
l'amplification de l'exon 2 ; P3 et P4 permettraient l'amplification de l'exon 3 ; P2 et P4 permettraient l'amplification des exons 2 et 3 ; P1
et P4 permettraient l'amplification des exons 1,2 et 3.
La séquence de l’ADN chromosomique d’un gène protéique humain situé sur le chromosome 10
entre les positions chromosomiques 90,855,331 et 90,856,395 est :
1 5’.............................. CCTAGAGAAC TGTTCCTGGG GTCTGGGACC TCAGCAGCAG
3’.............................. GGATCTCTTG ACAAGGACCC CAGACCCTGG AGTCGTCGTC
41 CAGCAGCAGC AGCAGCAGCA GCAGCAGCAG CAGCAGTGCA GGGCCAATCT AGGCAAGTCC CCTGCGCCAT

GTCGTCGTCG TCGTCGTCGT CGTCGTCGTC GTCGTCACGT CCCGGTTAGA TCCGTTCAGG GGACGCGGTA
P1
111 GTCCCTTCGT CTCCTTCTTC CTATATACAG GCCTCCCTCC ACCTGTCTTC TCAGGACAGG TATAGGCAAG
CAGGGAAGCA GAGGAAGAAG GATATATGTC CGGAGGGAGG TGGACAGAAG AGTCTCTTCC ATATCCGTTC
181 CAGTGCTGCC GTGCTCACCT GGGCTATGGC TCTTCTTTCA GGTGGGTCTC CGACCCTGAC TTCAACGTGG

GTCACGACGG CACGAGTGGA CCCGATACCG AGAAGAAAGT CCACCCAGAG GCTGGGACTG AAGTTGCACC
P2
251 GGGTGTGGGT GGAGGCTGGC CAGAGGGCCC TGTCCACCCT GGGGGAGGAG AGCCCAGGCC CTGATTACCT
CCCACACCCA CCTCCGACCG GTCTCCCGGG ACAGGTGGGA CCCCCTCCTC TCGGGTCCGG GACTAATGGA
321 AGTCCCTCTC CACAGGCTTT TCGGCCACCC AGGCACGGAA GGGCTTCTGG GACTACTTCA GCCAGCAGCA

TCAGGGAGAG GTGTCGCAAA AGCCGGTGGG TCCGTGCCTT CCCGAAGACC CTGATGAAGT CGGTCGTCGT
391 GCAGCAGCAG CAGCAGCAGC AGCAGACCAG CGGGGACAAA GGCAGGGTTG AGCAGATCCA TCAGCAGAAG

CGTCGTCGTC GTCGTCGTCG TCGTCTGGTC GCCCCTGTTT CCGTCCCAAC TAGTCTAGGT AGTCGTCTTC
P3
461 ATGGCTCGCG AGCCCAGGTG AGTGCCCAGG GGAAGGGGTG TAGGCGAAGG GAGGAGACAG CTGGGCCATG
TACCGAGCGC TCGGGCGCAC TCACGGGTAA CCTTCCCCAC ATCCGCTTCC CTCCTCTGTC GACCCGGTAC
531 CCATGATGAC CTGCCTCTGC TGCCTCAACC GAGGATCGGA TCGGATCGGA TTAGGGTTAG GGTTAGGGTT

GGTACTACTG GACGGAGACG ACGGAGTTGGCTCCTAGCCT AGCCTAGCCT AATCCCAATC CCAATCCCAA
601 AGGGTTAGGG TTAGGGTTAG GGTTAGGGTT AGGGTTAGGG TTAGGGTTAG GGTTAGGGTT AGGGTTAGGG

TCCCAATCCC AATCCCAATC CCAATCCCAA TCCCAATCCC AATCCCAATC CCAATCCCAA TCCCAATCCC
671 TTAGGGATAG TGTCCCCTTC TCCAGGACCC AGAAAGACAG GCTGCAGGCC CGTCTGGATG ACCTGTGGGA

AATCCCTATC ACAGGGGAAG AGGTCCTGGG ACTTTCTGTC CGACGTCCGG GCAGACCTAC TGGACACCCT
741 AGACATCACT CACAGCCTTC AAGACCAGGG CCACAGCCAT CTGGGGGACC CCCGAGGATC TACCTGCCCA

TCTGTAGTGA GTGTCGGAAG TACTGGTCCC GGTGTCGGTA GACCCCCTGG GGACTCCTAG ATGGACGGGT
811 GGCCCATTCC TCTGGGGAGC ATACTGTGTG CTCTCCCCAT CTCCAGCCCC TCCCTGATGG TTCCTCAGTT

CCGGGTAAGG AGACCCCTCG TATGACACAC GAGAGGGGTA GAGGTCGGGG AGGGAGACCC AAGGGTTCAA
P4
881 GAAGCCTAGA CTTCTGGAAT AAATGAAATA GAGGTTTATG GCCTGGCGTG AGTATGTTTG ACTCTCATTT
CTTCGGATCA GAAGACCTTA TTTACTTTAT CTACAAATAC CGGACCGCAC TCATACAAAC TGAGAGTAAA
951 GGACCATGTC TGAAAGCAGT GGCCTCACCA CTATCCCCAA AGCACACCCA TCACCCACTC CATTCCCTTG

CCTGGTACAG ACTTTCGTCA CCGGAGTGGT GATAGGGGTT TCGTGTGGGT AGTGGGTGAG GTAAGGGAAC
1021 GACGAGAAAG CCAATCTCGT GGTGCGAGGG ACGATACACT GACTC ....3’

CTGCTCTTTC GGTTAGAGCA CCACGCTCCC TGCTATGTGA CTGAG ....5’
en bleu les régions STR polymorphiques; en bleuâtre clair les régions (P1 à P4) proposées par Primer 3 pour le choix des primers ; en vert
les primers choisis ; les régions soulignées = exons ; les régions non soulignées = introns ; en gras les séquences de reconnaissance.

16) quels sont les critères du choix des primers d’une manière générale ?
• Contenu en GC doit être entre 40-60%.
• Tm pour les deux primers, ne doit pas différer par plus de 5ºC et la Tm du produit d’amplification ne doit pas différer
des deux primers par plus de 10ºC.
• Temperature d’annealing est généralement 5ºC inférieure à la Tm la plus faible. (Plus devrait être testée).
• Eviter l’existence de hairpins (épingles à cheveux) auto-complémentaires internes de plus de 4bp et de dimères de
plus de 8bp.
• l’extrémité 3' est extrêmement sensible – éviter qu’elle soit complémentaire à n’importe quelle région de l’autre
primer et doit posséder un match exact avec le template (pour ne pas avoir la formation de dimères de primers)
17) On voudrait amplifier par PCR la région polymorphique de l’intron 3, à partir de quelles régions grisées choisiriez vous
vos primers ? P3 et P4 ; (Encadrez les sur la séquence tout en précisant le Forward et le Reverse) ?
F:5' CCATGATGAC CTGCCTCTGC 3'
R:5' GACATGGTCC AAATGAGAGT 3'
18) Quel est le principe de la technique PCR ? Quelle doit être la composition minimale du mélange réactionnel ?
19) Principe de la PCR : «Polymerase Chain Reaction» ou encore ACP pour "Amplification en Chaîne par Polymérase", est
une technique de réplication ciblée in vitro. Il s'agit de réaliser une succession de réactions de réplication d'une matrice
double brin d'ADN. Elle permet d'obtenir, à partir d'un échantillon complexe et peu abondant, d'importantes quantités
d'un fragment d'ADN spécifique et de longueur définie. L'ordre de grandeur à retenir est celui du million de copies en
quelques heures. C'est, généralement suffisant pour une utilisation ultérieure.
La composition minimale de la MIX est : les primers (0.2 - 0.4 M) ; 4 dNTPs (200 M) ; Taq polymérase ( 0.5 -1 U) ;
Tampon de la Taq (1x) ; MgCl2 (1.5 mM) ; ADN matrice (5-50 ng/vol. final).
20) 19-a) L’exon 3 contient en position 712 la CTGCAG qui représente le site de restriction de l’enzyme PstI, quelle
technique proposerez-vous pour étudier un polymorphisme nucléotidique changeant le G 714 en A? Donner son principe
et décrivez brièvement le protocole que vous adopterez ?
PCR/ RFLP : Elle consiste à : - amplifier l'exon par PCR
- vérifier l'amplification par électrophorèse
- digérer les amplifiats réussis par l'enzyme de restriction PstI
- séparer par électrophorèse sur gel de polyacrylamide ou agarose pour déterminer le génotype de chaque individu
19-b) Aurez-vous besoin des régions grisées ? si oui, quels seraient les primers F et R que vous choisirez?
Oui je peux utiliser les mêmes primers que ceux choisis pour amplifier l'exon 3.
=============================================================================
=============================================================================
=============================================================================

Exercice 4: EXAMEN RATTRAPAGE 2014/2015 (2h).

Exercice: On voudrait réaliser un diagnostic génétique d’une tare humaine causée par la déficience en une enzyme active. Le gène
responsable de la synthèse de cette enzyme (est autosomal) existe sous 2 formes alléliques : l’allèle A conduisant à une enzyme active et
l’allèle B conduisant à une enzyme inactive (figure 1).
Figure 1 : séquence
monobrin partielle
des allèles A et B.
* Quelle est la mutation responsable de la production d’une enzyme inactive ? SNP Quelle est sa position ? 242
L’analyse du profil de digestion de l’allèle A par l’enzyme de restriction HaeIII (voir les 3 sites) a permis de dresser une carte de
restriction qui peut être utilisée dans le diagnostic de la tare (figure 2) :
Site de restriction de HaeIII :

GG CC
CC GG
* Soulignez et indiquez les sites de coupure sur les deux allèles A et B de la figure 1 ? (voir figure)
* Dites comment ce profil de restriction permettra de distinguer entre les allèles actif (A) et inactif (B) ?
Le profil de l'allèle actif serait de deux bandes : A=42 pb et B=230 pb; celui de l'allèle inactif serait d'une seule bande C=272
* En choisissant une notation appropriée, donnez les génotypes possibles avec la longueur des fragments ?
Spécifier les sains, porteurs et malades ? Sains= AB (2 bandes), Sains porteurs= ABC (3 bandes) et les malades une seule bande
C ; si on note par rapport à la mutation SNP, le couple d'allèle serait C/T : les sains seraient de génotype CC ; les sains porteurs
seraient CT et les malades seraient TT.
* La technique utilisée pour la détermination de ce polymorphisme comporte les étapes suivantes, classez-les dans l’ordre de leur
exécution ? (Attribuer des chiffres de 1 à 6)
_3_- Electrophorèse
_5_- Hybridation avec sonde
_4_- Transfert sur membrane
_2_- Digestion de l’ADN par une enzyme de restriction
_6_- Autoradiographie
_1_- Extraction ADN
* Qu’appelle-t-on cette technique ? technique RFLP // Qu’est-ce qu’elle permet de distinguer ? Elle permet de distinguer le
polymorphisme à partir de la longueur des fragments de restriction.
On voudrait étudier ce polymorphisme par PCR.

* Qu’appelle-t-on la technique qui couple PCR et digestion enzymatique ? …PCR/RFLP...
* Quel est l’avantage de cette dernière technique par rapport à la première technique utilisée ?
elle a besoin d'une moindre quantité d'ADN et d'échantillon, elle est plus rapide et plus efficace, et non toxique car elle n'utilise pas des
sondes radioactives.
* L’analyse de la région encadrant les 3 sites de restriction, a permis de choisir les primers parmi les régions soulignées.
Quelle la paire qui permettra l’amplification de cette région du gène ?
5’GATTCAGGAGATTCAACCACTTGGG]198 - - - - - 470]CGAACATCGGTACAGCTATACAGG3’
3’CTAAGTCCTCTAAGTTGGTGAACCC]complémentaire]GCTTGTAGCCATGTCGATATGTCC5’
a) F: 5’ GATTCAGGAGATTCAACC 3’ e) 5’ CTAAGTCCTCTAAGTGTG 3’
b) 5’ CACACTTAGAGGACTTAG 3’ f) 5’ TCGGTACAGCTATACAGG 3’
c) 5’ GTGTGAATCTCCTGAATC 3’ g) 5’ GGACATATCGACATGGCT 3’
d) R: 5’ CCTGTATAGCTGTACCGA 3’ h) 5’ AGCCATGTCGATATGTCC 3’
(indiquez le F devant le primer Forward et le R devant le primer Reverse)
* Quels sont les ingrédients à mettre avec l’ADN matrice et ces primers pour amplifier cette région du gène ?
La composition minimale de la MIX est : En plus de l'ADN matrice (5-50 ng/vol. final) et les primers (0.2 - 0.4 M), on a
besoin des 4 dNTPs (200 M), la Taq polymérase ( 0.5 -1 U), le Tampon de la Taq (1x) et le MgCl2 (1.5 mM) .
* Quelle serait la taille des fragments après digestion des produits de PCR par l’enzyme HaeIII ? (choisir notation)
Quand il y a digestion, on a deux fragments A' et B': A' = 25 + A(=42) = 67pb ; B' = 24 + B(=230) = 254pb ;
Quand il n'y a pas de digestion, on n'a qu'un seul fragments C' = 49 + C (=272) = 321pb.
* Classer dans l’ordre les étapes de l’analyse diagnostique de cette tare grâce à la deuxième technique ?
1- Electrophorèse a) 4–3–1–2–5–6
2- Amplification par thermocycleur b) 3– 6 – 2 – 4 – 5 – 1
3- Extraction d’ADN c) 4–6–3–2–5–1
4- Digestion enzymatique
d) 2–5–6–3–4–1
5- Préparation du gel
6- Préparation de la Mix e) 1–2–4–5–6–3
* Le diagnostic réalisé chez les membres d’une famille atteinte de la tare par les deux
Sens de migration
techniques a permis d’obtenir les mêmes profils d’électrophorèse mais avec des tailles
de bandes (en pb) différentes. Quelles sont les tailles des bandes pour les 4 individus
analysés ?
(N.B. : les symboles pleins sont atteints et les clairs sont sains ou porteurs ;
rond=femelle et carré=mâle)
Quel est le diagnostic génétique de la tare chez l’enfant à naître (III-1) ?
L'enfant à naître sera Sain.
Taille bandes en pb Taille bandes en pb

Technique 1 Technique 2
III-1 II-1 II-3 I-2 III-1 II-1 II-3 I-2
272 272 272 321 321 321
230 230 230 254 254 254
42 42 42 67 67 67
en Biochimie=============================================================================
/ PCEM1 Biologie Moléculaire / 28
Exercice2004
SAINT-ANTOINE 5 : (cf. code génétique en annexe)
EXAMEN Rattrapage –2015/2016(durée : 1h30mn)
Chez l’homme, le schéma d’un gène de ménage (qui s’exprime dans tous les types cellulaires) codant une enzyme E, est :
st représenté un gène de
ont l’expression est, par
ubiquitaire) qui code une
maine E.
en ce gène comporte
s?
e de chaque intron est de
et celle du promoteur de
quelle est, sans compter
s séquences régulatrices
elles, la taille du gène ?
1/Ce gène
es exons sont conservés au comporte-t-il combien
cours de l’épissage, d’introns
quelle sera, ?sans
5 introns
compter si on comptabilise
la coiffe le 1er
et la queue ouA,
poly 4 si on ne le comptabilise pas .
2/Si la taille
1. la taille du transcrit primaire de chaque intron (I) est de 10 kpb, et celle du promoteur (P) de 100 pb, quelle est, sans compter d’autres
2. la taille de l’ARN messager
séquences régulatrices éventuelles, la taille du gène ?
tant la même représentation que celle+du(4xI=4x
Gène= [(P=100pb) gène de10kpb)
l’enzyme E, représentez
+ (E=110) :
(3xE=100pb) + (E=200pb)] = 40 710 pb = 40,71 kpb
1. la structure du 3/Si tous primaire
transcrit les exons sont conservés au cours de l’épissage, quelle sera, sans compter la coiffe et la queue polyA :
2. celle de l’ARNm 3.1. la taille du transcrit primaire ? 40,61 kpb.
3. celle d’un ARNm qui résulterait d’un
3.2. la taille deépissage alternatif?de
l’ARN messager 610votre
pb.choix
r chacune des trois 4/En adoptant la même représentation que celleladu
molécules, positionnez s’il y lieu, la coiffe et queue
gènepolyA, en abrégé.
de l’enzyme E, schématisez :
Quel est le nom (Pour
de la molécule
chacune complète qui constitue
des trois molécules la coiffe positionnez
suivantes, ? s’il y a lieu, la coiffe et la queue polyA, en abrégé).
Quel est le nom de chacune 4.1. Ledes molécules
transcrit simples
primaire qui composent
? Coiffe la --II--
- --I-- ---- coiffe ----
? --III-- ---- --IV-- ---- --V-- AAAAAAAAAAAAAA..............
Citez deux fonctions de la coiffe
4.2. L’ARNm ? Coiffe --I-- --II-- --III-- --IV-- --V-- AAAAAAAAAAAAAA..............
nifie polyA ?
4.3. L’ARNm qui résulterait d’un épissage alternatif de votre choix ?
st la taille totale des séquences codantes du gène qui code l’enzyme E ?
le nombre d’acides aminés de l’enzyme E ? Coiffe --I-- --II-- --IV-- AAAAAAAAAAAAAA..............
tenu des éléments dont vous disposez sur le schéma, quelle est la séquence d’acides aminés
en N-terminal de la protéine
en C-terminal de la protéine
5/ 5.1. Refaire le schéma du gènes en y insérant les nucléotides et séquences de reconnaissance suivantes :
CCAAT, ATG, AATAAA, A, GT, G, A, GGGCGG, GA, TGA, AG, TATAAA
------CCAAT----- GGGCGG-----TATAAA----- G--Ex.I---ATG----GAGT-----AG G--Ex.II----GAGT----AGG--Ex.III---- GAGT--
--AGG---Ex.IV----GAGT----AGG---Ex.V----TGA------AATAAA---------GA .
5.2. Quel est le nom de la molécule complète qui constitue la coiffe ? 7-Méthyl-Guanosine
5.3. Citez deux fonctions de la coiffe? permet de protéger l'extrémité 5' et le passage à travers la membrane nucléaire,
5.4. Que signifie polyA ? séquence polyadénine ou queue polyA.
5.5. Citez lui deux fonctions ? permet : de protéger l'extrémité 3' et le passage à travers la membrane nucléaire,
6/Quelle est la taille totale des séquences codantes du gène qui code l’enzyme E ? 330 pb
7/Quel est le nombre d’acides aminés de l’enzyme E ? 110 aa.
8/Une paire d’amorces correspondant aux deux séquences nucléotidiques indiquées sur le schéma, est utilisée pour réaliser
une amplification par PCR, de l’ADN complémentaire (ADNc).
8.1. Faites la commande des amorces ?
F : ATG GCA CCG GAC TGG ; R : TCA GTT GGT CGG CCA
8.2. Pouvez-vous utiliser l’ADNc de n’importe quel tissu de l’organisme ? Justifiez en une phrase ?
Oui, parce que c'est le même génome dans toutes les cellules, généralement on utilise soit le sang (fraction
leucocytaire) soit les cellules des frottis buccales.
8.3.Quelle est la taille attendue du fragment amplifié ? 330pb
8.4. Pour réaliser la PCR, quel est le mélange réactionnel que vous ajouterez aux amorces pour amplifier l’ADNc ?
La composition minimale de la MIX est : En plus de l'ADNc matrice (5-50 ng/vol. final) et les primers (0.2 - 0.4 M),
on a besoin des 4 dNTPs (200 M), la Taq polymérase ( 0.5 -1 U), le Tampon de la Taq (1x) et le MgCl2 (1.5 mM) .
8.5. Proposez un programme de PCR et justifiez-le ?

94°C ..... pendant 5' hot-Start
94°C ..... pendant 30'' dénaturation On calcule la Tm de chaque primer,
Ta°C ..... pendant 30'' hybridation Tm1= 64,9+41(10-16,4)/15 = 64,9 - 17,49 = 47,41°C
72°C ..... pendant 30'' extension Tm2= 64,9+41(9-16,4)/15 = 64,9 - 20,23 = 44,67°C
72°C ..... pendant 5' extension finale Ta = 41,67°C ≈ 42°C (Tm2 - 5°C=Ta)
9/Compte tenu des éléments dont vous disposez sur le schéma, quelle est la séquence d’acides aminés
9.1. en N-terminal de la protéine: ATG GCA CCG GAC TGG (Voir code génétique plus haut)
Nt Met - Ala - Pro - Asp - Trp
9.2. en C-terminal de la protéine : TTG CCG ACC AAC TGA Stop
Leu - Pro - Thr - Asn Ct .
10/ On connaît dans l’intron 3 de ce gène un polymorphisme Alu (I/D) qu’on a mis en évidence grâce à la carte de restriction
suivante :
10.1. A quoi sert l’enzyme Alu I ? Elle sert à détecter l'existence dans une séquence la présence d'une séquence Alu
10.2. Sachant que la séquence Alu peut être isolée spécifiquement grâce à l’enzyme BamHI, schématisez la séquence en absence de
l’insertion Alu ? (Donnez la taille du segment) Alu- = 87 + 104 = 191 pb
10.3. Avant l’ère de la PCR, ce polymorphisme Alu était analysé grâce à la technique RFLP, en utilisant différentes enzymes et
différentes sondes. Donnez les différentes étapes de cette technique ?
_1_-Extraction de l'ADN
_2_- Digestion de l’ADN par la ou les enzyme(s) de restriction
_3_- Électrophorèse
_4_- Transfert sur membrane
_5_- Hybridation avec sonde
_6_- Autoradiographie

10.4. Pour un individu homozygote pour l’insertion, de génotype II, quelle serait la taille des bandes obtenues grâce à cette
technique lorsque :
- l’enzyme et la sonde utilisées sont respectivement EcoRI et S1 ? une seule bande : 504pb
10.5. Pour un individu homozygote pour la délétion, de génotype DD, quelle serait la taille des bandes obtenues grâce à cette
technique lorsque :
10.6. Pour un individu hétérozygote de génotype ID, quelle serait la taille des bandes obtenues grâce à cette technique
lorsque :
- l’enzyme et la sonde utilisées sont respectivement EcoRI et S1 ? deux bandes: une de 504pb et une 191pb
- l’enzyme et la sonde utilisées sont respectivement EcoRI et S3 ? deux bandes: une de 504pb et une 191pb
10.7. Pour un individu homozygote pour l’insertion de génotype II, quelle serait la taille des bandes obtenues grâce à cette technique
lorsque :
- les enzymes EcoRI et AluI sont utilisées avec la sonde S2 ? deux bandes: une de 220pb et une 284pb
- les enzymes BamHI et AluI sont utilisées avec la sonde S2 ? deux bandes: une de 133pb et une 180pb
- les enzymes EcoRI et BamHI sont utilisées avec la sonde S2 ? une seule bande : 313pb
10.8. Pour un individu homozygote pour la délétion, de génotype DD, quelle serait la taille des bandes obtenues grâce à cette
technique lorsque :
- les enzymes EcoRI et AluI sont utilisées avec la sonde S1 ? une seule bande : 191 pb
- les enzymes BamHI et AluI sont utilisées avec la sonde S1 ? 0 bande car très lourde (dépend du gel).
- les enzymes EcoRI et BamHI sont utilisées avec la sonde S1 ? une seule bande : 87pb
10.9. Pour un individu homozygote pour l’insertion de génotype ID, quelle serait la taille des bandes obtenues grâce à cette
technique lorsque :
- les enzymes EcoRI et AluI sont utilisées avec les sonde S2 et S3 ? deux bandes: une de 220pb et une 284pb
- les enzymes BamHI et AluI sont utilisées avec les sonde S2 et S3 ? deux bandes: une de 133pb et une 180pb
- les enzymes EcoRI et BamHI sont utilisées avec les sonde S2 et S3 ? deux bandes: une de 313pb et une 104pb
11/ De nos jours, ce polymorphisme Alu est surtout analysé grâce à la technique PCR simple, donner le principe de cette technique
et donnez ses avantages par rapport à la technique RFLP ?
Principe de la PCR : «Polymerase Chain Reaction» ou ACP "Amplification en Chaîne par Polymérase", est une technique de
réplication ciblée in vitro. Il s'agit de réaliser une succession de réactions de réplication d'une matrice double brin d'ADN. Elle
permet d'obtenir, à partir d'un échantillon complexe et peu abondant, d'importantes quantités d'un fragment d'ADN spécifique et de
longueur définie. L'ordre de grandeur à retenir est celui du million de copies en quelques heures. C'est, généralement suffisant pour
une utilisation ultérieure.
Avantages: elle a besoin d'une moindre quantité d'ADN et d'échantillon, elle est plus rapide et plus efficace, et non toxique
car elle n'utilise pas des sondes radioactives.
11.1. Quelle est la paire d’amorces que vous choisirez pour amplifier par PCR la totalité du segment (504pb) lorsque l’intron
est digéré par l’enzyme EcoRI et que l’insertion Alu est présente, sachant que :
(504pb)
Brin sens : 5' GATTCAGGAGATTCACAC - - ??? nucléotides - - TCGGTACAGCTATACAGG 3'
Brin antisens: 3' CTAAGTCCTCTAAGTGTG - - ??? nucléotides - - AGCCATGTCGATATGTCC 5'
a) F: 5' GATTCAGGAGATTCACAC 3' b) 5' CTAAGTCCTCTAAGTGTG 3'

c) 5' CACACTTAGAGGACTTAG 3' d) 5' TCGGTACAGCTATACAGG 3'
e) 5' AGCCATGTCGATATGTCC 3' f) 5' GTGTGAATCTCCTGAATC 3'
g) R: 5' CCTGTATAGCTGTACCGA 3' h) 5' GGACATATCGACATGGCT 3'
11.2. Donnez le nombre de nucléotides encadré par les amorces :

- lorsque l’insertion Alu est présente ? 504 pb
- lorsque l’insertion Alu est absente ? 191 pb
11.3. Aurez-vous toujours besoin de l’une des enzymes de restriction pour étudier ce polymorphisme ? (dites
pourquoi ?) Non, car les amorces (primers) encadrent la région de présence/absence de la séquence Alu
11.4. Aurez-vous toujours besoin de l’une des sondes pour étudier ce polymorphisme ? (pourquoi ?)
Non car l'ADN sera teint avec un autre colorant au cours de l'électrophorèse.
11.5.Quel gel utiliserez-vous pour mettre en évidence ce polymorphisme ?................................................
- quelle serait la taille de la(les) bande(s) quand le génotypes est : II : 504 … ; ID : 504/191… ; DD : 191 …

12/ Certains laboratoires utilisent aussi la technique PCR/RFLP, donnez le principe de cette technique et donnez ses
avantages par rapport à la technique RFLP ? les avantages par rapport à la RFLP restent à part le cout des enzymes ceux de la
PCR: utilisation d'une moindre quantité d'ADN et d'échantillon, plus rapide et plus efficace, dont les produits digérés par les
enzymes de restriction sont ensuite séparés par électrophorèse; cette technique a l'avantage d'être non toxique car elle n'utilise pas
des sondes radioactives. Au vu du type de polymorphisme ins/del, la PCR/RFLP devient aussi inutile.
12.1. Quelle serait la taille des bandes, si vous soumettez le produit d’amplification à la digestion par BamHI +
AluI ?quand le génotypes est : II : 87/133/180/104 ; ID : 87/133/180/104 ; DD : 87/104.
12.2.Quelle serait la taille des bandes, si vous soumettez le produit d’amplification à la digestion par
AluI seulement ?quand le génotypes est : II : 220/284 ; ID : 220/284/191 ; DD : 191.
12.3.Vue la taille des bandes obtenues, Quel support utiliser pour les séparer ? gel d'agarose à 2%.
12.4.Quel est le protocole que vous finirez par adopter entre les deux précédents ? dites pourquoi ?
J'adopterais la PCR simple, car plus pratique, plus rapide, moins couteuse.Pour rester entre les 2 (PCR/RFLP).
12.5. Pensez-vous que dans le cas de ce polymorphisme, l’utilisation de la technique PCR/RFLP présente un
avantage quelconque par rapport à la technique PCR simple ? (justifier)
Aucun, au contraire elle ne permet pas de bien définir le polymorphisme Alu utilisé.
=============================================================================
=============================================================================
Exercice 6: Examen 2017/2018_1h15’
Exercice I : Le gène (APO E) humain est un membre de la famille multigénique codant les apoprotéines. Il est situé sur le bras
long du chromosome 19 en (19q13.2), comprend quatre exons séparés par trois introns et s’étend sur 3597 nucléotides (figure 1).
760 1092 582
Figure 1 : schéma du gène de l’apolipoprotéine E
I/ Analyse descriptive du gène :

En vous aidant des valeurs du schéma du gène de l’Apo E de la figure 1 et de sa séquence figure 2 :
- Quelles sont les tailles des régions flanquantes 5’ et 3’ ? 5'UTR: 131pb ; 3'UTR:145pb
Quelle est l’importance de chacune ? 5'UTR: contient séquence de reconnaissance par les ribosomes et protection de
l'information génétique ; 3'UTR: contient codon stop et séquence de protection.
- Donner la taille des différents exons et la taille des différents introns ? (voir schéma).
(pour les questions sur valeurs de taille, écrivez-les en dessous du schéma)
- Quelle serait la taille en pb de l’ARNm transcript ? 131+3597 =3728 pb
- Quelle serait la taille en pb de l’ARNm mature ? 1+(44+66+193+860) +polyA = 1+1163+polyA
- Quelle est la taille de la CDS ? 951 pb
- Quelles seraient les tailles des région 5’UTR et 3’UTR ? 5'UTR: (1+67)= 68 pb ; 3'UTR: (145 + polyA) pb
- A quoi correspondent les séquences soulignées en gras avec des ‘Â’? ons sur la séquence ? boite TATAA_ séquence promotrice -
position sur la séquence: 96-100 ; AATAAA_signal de polyadénylation - position sur la séquence: 3706-3711.
II/ Analyse du polymorphisme :

1) Sachant que le 1er exon du gène APO E est non codant, et que le 2 ème exon code pour la plus grande partie d’un peptide signal (de
18 acides aminés qui seront clivés au cours des modifications post-traductionnelles), le 3ème exon code pour les 61 premiers acides
aminés et le 4ème pour l'essentiel de la protéine mature (figure 2).
Quelle est la taille de la protéine immature ? 317 aa .
Quelle est la taille de la protéine mature ? 299 aa .
Le gène APO E existe sous différentes formes alléliques, dont les 3 principales : E2, E3 et E4 sont responsables de la synthèse des 3
isoformes les plus communes de la protéine ApoE : ε2, ε3 et ε4. La différence entre ces dernières résulte de différences
polymorphiques au niveau des acides aminés 112 et 158 de la protéine mature, résultant de mutations ponctuelles
polymorphiques ayant touché l’allèle ancestral E4 et qui ont donné les 2 autres allèles E2 et E3 (allèle le plus fréquent).
Position
112 158 Allèle
CGC / Arg CGC / Arg E4
(codon/acide aminé) TGC / Cys CGC / Arg E3
TGC / Cys TGC / Cys E2
- Quel est le type de mutation responsable du polymorphisme ? SNPs : codon 112 C > T ; codon 158 C > T.
- A quel allèle correspond la séquence de la figure 2 ? APOE4
- Quelle peut être la raison du presque remplacement de l’allèle ancestral E4 par un allèle muté E3 ?
Du point de vue évolutif, l'allèle E3 a permis une meilleure adaptation adapté à un régime alimentaire devenu de plus en plus
carnivore, et que peut l'allèle E4 était plus adéquat pour un régime végétarien et/ou frugivore.
2) Les nucléotides en gras et italiques des régions de la séquence (figure 2) correspondent à des insertions de type Alu qui ne sont
plus polymorphiques. A quoi correspondent les séquences grisées et encadrées qui les encadrent ?
Elles correspondent aux primers qui ont été choisis pour les amplifier.
- Pourquoi ces Alus ne sont plus polymorphiques ? Les Alus neutres anciennement insérés qui à travers des générations, elles ont
fini par se fixer et donc présents dans le génome de tous le individus.
- Donner les positions nucléotidiques des 2 séquences Alus sur la séquence figure 2 ?
Position_Alu1_(1192-1515) ; Position_Alu2_(1650-1942).
3) Afin d’analyser le polymorphisme moléculaire, on s’est proposé de faire une amplification par PCR suivie d’une digestion
enzymatique ; - Qu’appelle-t-on cette technique ? Justifier ce choix ? PRC/RFLP,
Elle a pour avantages ceux de la PCR: utilisation d'une moindre quantité d'ADN et d'échantillon, plus rapide et plus efficace, dont
les produits digérés par les enzymes de restriction sont ensuite séparés par électrophorèse; cette technique a l'avantage d'être non
toxique car elle n'utilise pas des sondes radioactives.
5' G C G C 3'
L’enzyme choisie est HhaI, dont le site de restriction est : 3' C G C G 5'
- Quelle est la condition pour le choix d’une enzyme de restriction ?
il faut que la mutation polymorphique crée une variation détectable par l'enzyme, soit que le site de restriction est créé par la
mutation soit qu'il est éliminé.
Pour amplifier la région polymorphique responsable des différents isoformes, on a choisi les primers au sein même de la région
codante (nucléotides et codons soulignés et encadrés au niveau de l’exon 4).
- Quelles sont les règles à suivre pour le choix des primers ? (voir réponse dans les autres exercices)
- Faites la commande de ces primers en précisant leurs séquences et orientations ? Précisez pour chacun sa position nucléotidique
sur la séquence ?
- Calculer les Tm et proposez une Ta ? dites pourquoi ?

La formule utilisée pour le calcul des primers > 14pb est : Tm = 64,9 °C + 41°C x [((NG) + (NC)) – 16,4]/NT
TmF = 64,9 + 41x(-3,6)/20 = 57,52 ≈ 58°C ; TmR = 64,9 + 41x(-2,4)/20 = 59,43 ≈ 59°C Ta = inf (TmF, TmR) - 5 = 53 °C
- Proposez un programme PCR pour amplifier ce polymorphisme ?

94 °C pendant 5 mn Hot start
94 °C pendant 1,5 mn
53 °C pendant 1,5 mn x 30 cycles
72 °C pendant 1 mn
72 °C pendant 5 mn Extention finale
4 °C for ever (Précaution de conservation).
- Quelle serait la taille du fragment (bande) obtenu directement par PCR ?

Vérification: sur gel d'agarose 1,5% , la bande à obtenir en cas d'amplification est de 260pb
- Quels seraient le nombre et la taille des fragments obtenus après digestion des produits PCR par l’enzyme HhaI ?
(localisez les sites de restriction sur la séquence) voir séquence: flèche rouge
- Quel support utiliserait-on pour les séparer ? gel de polyacrylamide
- Donnez les bandes (en précisant leur taille) des différents génotypes qu’on obtiendrait par électrophorèse, en se limitant
aux bandes ≥ à 20pb
E2E2 E3E3 E4E4 E2E3 E2E4 E3E4
Sens de la 91 91 91 91 91
migration 83 83 83
72 72 72
62 62 62 62 62 62
48 48 48 48 48
25 25 25 25 25
III/ Application :
Plusieurs études ont démontré l’implication du polymorphisme dans la démence sénile ou maladie d’Alzheimer (MA). Des analyses
de ce polymorphisme ont été réalisées chez un échantillon de patients âgés de plus de 60 ans, souffrant de MA et sur un échantillon
de personnes saines âgées de plus de 60 ans ; les résultats obtenus sont reportés sur le tableau suivant :
Tableau : Fréquences génotypiques obtenues chez les sains et les malades.

E2E2 E3E3 E4E4 E2E3 E2E4 E3E4 N Total
Témoins sains 0 58 5 11 2 24 100
Patients atteints MA 0 38 30 9 1 22 100
1- Calculez les fréquences alléliques chez les 2 échantillons ?
Soient p, q et r les fréquences alléliques respectivement de E2, E3 et E4 chez les témoins sains et p', q' et r' celles des patients MA
p = 11+2/200 = 0,065 ;;; q = (2x58 + 11+ 24)/200 = 0,755 ;;; r = (2x5 + 2 + 24)/200 = 0,18
p' = 9+1/200 = 0,05 ;;; q' = (2x38 + 9 + 22)/200 = 0,535 ;;; r' = (2x30 + 1+ 22)/200 = 0,415
………………………………………………………….............................………………………………………..………........................................…
2- Testez l’équilibre de Hardy-Weinberg chez les 2 échantillons ? Conclure ?

Calcul des effectifs théoriques:
Témoins sains 0 58 3 10 2 27 100
Chez les sains:
H0: les effectifs observés et théoriques ne sont pas statistiquement différents, la population est en équilibre de Hardy et Weinberg
ℵ2obs= ∑ (oi -ti)2 = (58-58)2+(5-(3+2))2+(11-10)2+(24-27)2 = 0,0+0,0+0,1+0,33=0,43 <<<ℵ2thé,5%,3ddd=7,82
ti 58 5 10 27
Conclusion: on accepte l'hypothèse d'équilibre de HW, les effectifs observés et théoriques ne sont pas significativement différents,
l'échantillon de sains est en équilibre de Hardy et Weinberg.
Chez les malades:

H0: les effectifs observés et théoriques ne sont pas statistiquement différents, la population est en équilibre de Hardy et Weinberg
ℵ2obs= ∑ (oi -ti)2 = (38-29)2+(30-(17+4))2+(9-5)2+(22-45)2 = 2,79+3,86+3,2+11,75=21,6 >>>ℵ2thé,5%,3ddd=7,82
ti 29 21 5 45
Conclusion: on rejette l'hypothèse d'équilibre de HW, les effectifs observés et théoriques sont significativement différents.
L'échantillon de malades n'est pas en équilibre de Hardy et Weinberg.
…………………………………………………………………………….............................……………………..………........................................…
3- Comparez les 2 distributions de fréquences génotypiques ?
Comparaison des sains et des malades : (j'ai toujours accepté cette approximation étant donné que les effectifs totaux sont égaux)
H0: les fréquences alléliques entre les deux échantillons ne sont pas significativement différents,
ℵ2obs= ∑ (oi -ti)2 = (58-38)2+(5-30)2+(9-5)2+(26-24)2 = 10,53+22,53+2+0,17=35,23 >>>ℵ2thé,5%,3ddd=7,82
ti 38 30 8 24
Ou aussi le tableau de contingence, utilisé surtout quand les effectifs ne sont pas égaux)
Tableau de contingence:
E2E2 E3E3 E4E4 E2E3 E2E4 E3E4 Total
Sains Oi 0 58 5 11 2 24 100
Sains ti 0 96*0,5=48 35*0,5=17,5 20*0,5=10 3*0,5=1,5 46*0,5=23
Malades Oi 0 38 30 9 1 22 100
Malades ti 0 96*0,5=48 35*0,5=17,5 20*0,5=10 3*0,5=1,5 46*0,5=23
0 96 35 20 3 46 200
ℵ2obs= ∑ (oi -ti)2 = (58-48)2+(38-48)2+ (5-17,5)2+(30-17,5)2+(11-10)2 +(9-10)2+(2-1,5)2+(1-1,5)2+(24-23)2+ (22-23)2

ti 48 48 17,5 17,5 10 10 1,5 1,5 23 23
= 2,08+2,08+8,93+8,93+0,1+0,1+0,17+0,17+0,04+0,04=22,45 >>>ℵ2thé,5%,9ddl=16,92
Conclusion: les effectifs des sains et des malades sont significativement différents, donc les fréquences alléliques sont
significativement différentes. essentiellement pour l'allèle E4 qui semble être impliqué dans la maladie.
4- Quelles sont vos conclusions relatives à l’implication de ce polymorphisme dans la CVD ? si oui quel serait l’allèle impliqué ?
Le polymorphisme au niveau du gène APOE, aboutissant aux allèles E2, E3 et E4, semble être impliqué dans la maladie
cardiovasculaire; en effet, c'est l'allèle E4 qui présente le plus de différence entre les deux échantillons et qui est statistiquement
plus fréquent chez les malades.

GCTGTGCCTGGGGCAGGGGGAGAACAGCCCACCTCGTGACTGGGGGCTGGCCCAGCCCGCCCTATCCCTGGGGGAGGGGG 80
CGGGCAGGGGGAGCCCTÃTÃÃTTGGACAAGTCTGGGATCCTTGAGTCCTÂG¶ACTCAGCCCAGCGGAGGTGAAGGACGTC 159
CTTCCCCAGGAGCCGÂ¶GTGAGAAGCGCAGTCGGGGGCACGGGGATGAGCTCAGGGGCCTCTAGAAAGAGCTGGGACCCT 238
GGGAAGCCCTGGCCTCCAGGTAGTCTCAGGAGAGCTACTCGGGGTCGGGCTTGGGGAGAGGAGGAGCGGGGGTGAGGCAA 318
GCAGCAGGGGACTGGACCTGGGAAGGGCTGGGCAGCAGAGACGACCCGACCCGCTAGAAGGTGGGGTGGGGAGAGCAGCT 398
GGACTGGGATGTAAGCCATAGCAGGACTCCACGAGTTGTCACTATCATTTATCGAGCACCTACTGGGTGTCCCCAGTGTC 478
CTCAGATCTCCATAACTGGGGAGCCAGGGGCAGCGACACGGTAGCTAGCCGTCGATTGGAGAACTTTAAAATGAGGACTG 558
AATTAGCTCATAAATGGAACACGGCGCTTAACTGTGAGGTTGGAGCTTAGAATGTGAAGGGAGAATGAGGAATGCGAGAC 638
TGGGACTGAGATGGAACCGGCGGTGGGGAGGGGGTGGGGGGATGGAATTTGAACCCCGGGAGAGGAAGATGGAATTTTCT 718
ATGGAGGCCGACCTGGGGATGGGGAGATAAGAGAAGACCAGGAGGGAGTTAAATAGGGAATGGGTTGGGGGCGGCTTGGT 798
AAATGTGCTGGGATTAGGCTGTTGCAGATAATGCAACAAGGCTTGGAAGGCTAACCTGGGGTGAGGCCGGGTTGGGGCCG 878
+1
GGCTGGGGGTGGGAGGAGTCCTCACTGGCGGTTGATTGACAGTTTCTCCTTCCCAGÂ¶ACTGGCCAATCACAGGCAGGAA 957
Met Lys Val Leu Trp Ala Ala Leu Leu Val Thr Phe Leu Ala G
G ATG AAG GTT CTG TGG GCT GCG TTG CTG GTC ACA TTC CTG GCA G¶GTATGGGGGCGGGGCTTGCT 1021
CGGTTCCCCCCGCTCCTCCCCCTCTCATCCTCACCTCAACCTCCTGGCCCCATTCAGACAGACCCTGGGCCCCCTCTTCT 1101
GAGGCTTCTGTGCTGCTTCCTGGCTCTGAACAGCGATTTGACGCTCTCTGGGCCTCGGTTTCCCCCATCCTTGAGATAGG 1181
AGTTAGAAGTTGTTTTGTTGTTGTTGTTTGTTGTTGTTGTTTTGTTTTTTTGAGATGAAGTCTCGCTCTGTCGCCCAGGC 1261
TGGAGTGCAGTGGCGGGATCTCGGCTCACTGCAAGCTCCGCCTCCCAGGTCCACGCCATTCTCCTGCCTCAGCCTCCCAA 1341
GTAGCTGGGACTACAGGCACATGCCACCACACCCGACTAACTTTTTTGTATTTTCAGTAGAGACGGGGTTTCACCATGTT 1421
GGCCAGGCTGGTCTGGAACTCCTGACCTCAGGTGATCTGCCCGTTTCGATCTCCCAAAGTGCTGGGATTACAGGCGTGAG 1501
CCACCGCACCTGGCTGGGAGTTAGAGGTTTCTAATGCATTGCAGGCAGATAGTGAATACCAGACACGGGGCAGCTGTGAT 1581
CTTTATTCTCCATCACCCCCACACAGCCCTGCCTGGGGCACACAAGGACACTCAATACATGCTTTTCCGCTGGGCGCGGT 1661
GGCTCACCCCTGTAATCCCAGCACTTTGGGAGGCCAAGGTGGGAGGATCACTTGAGCCCAGGAGTTCAACACCAGCCTGG 1741
GCAACATAGTGAGACCCTGTCTCTACTAAAAATACAAAAATTAGCCAGGCATGGTGCCACACACCTGTGCTCTCAGCTAC 1821
TCAGGAGGCTGAGGCAGGAGGATCGCTTGAGCCCAGAAGGTCAAGGTTGCAGTGAACCATGTTCAGGCCGCTGCACTCCA 1901
GCCTGGGTGACAGAGCAAGACCCTGTTTATAAATACATAATGCTTTCCAAGTGATTAAACCGACTCCCCCCTCACCCTGC 1981
CCACCATGGCTCCAAAGAAGCATTTGTGGAGCACCTTCTGTGTGCCCCTAGGTACTAGATGCCTGGACGGGGTCAGAAGG 2061
ly Cys Gln Ala Lys Val Glu Gln Ala Val Glu Thr
ACCTGACCCACCTTGAACTTGTTCCACACAGÂ¶ GA TGC CAG GCC AAG GTG GAG CAA GCG GTG GAG ACA 2128
Glu Pro Glu Pro Glu Leu Arg Gln Gln Thr Glu Trp Gln Ser Gly Gln Arg Trp Glu Leu A
GAG CCG GAG CCC GAG CTG CGC CAG CAG ACC GAG TGG CAG AGC GGC CAG CGC TGG GAA CTG G 2189
la Leu Gly Arg Phe Trp Asp Tyr Leu Arg Trp Val Gln Thr Leu Ser Glu Gln Val Gln Gl
CA CTG GGT CGC TTT TGG GAT TAC CTG CGC TGG GTG CAG ACA CTG TCT GAG CAG GTG CAG GA 2250
u Glu Leu Leu Ser Ser Gln Val Thr Gln Glu Leu Ar
G GAG CTG CTC AGC TCC CAG GTC ACC CAG GAA CTG AG¶GTGAGTGTCCCCATCCTGGCCCTTGACCCTC 2318
CTGGTGGGCGGCTATACCTCCCCAGGTCCAGGTTTCATTCTGCCCCTGTCGCTAAGTCTTGGGGGGCCTGGGTCTCTGCT 2398
GGTTCTAGCTTCCTCTTCCCATTTCTGACTCCTGGCTTTAGCTCTCTGGAATTCTCTCTCTCAGCTTTGTCTCTCTCTCT 2478
TCCCTTCTGACTCAGTCTCTCACACTCGTCCTGGCTCTGTCTCTGTCCTTCCCTAGCTCTTTTATATAGAGACAGAGAGA 2558
TGGGGTCTCACTGTGTTGCCCAGGCTGGTCTTGAACTTCTGGGCTCAAGCGATCCTCCCGCCTCGGCCTCCCAAAGTGCT 2638
GGGATTAGAGGCATGAGCCACCTTGCCCGGCCTCCTAGCTCCTTCTTCGTCTCTGCCTCTGCCCTCTGCATCTGCTCTCT 2718
GCATCTGTCTCTGTCTCCTTCTCTCGGCCTCTGCCCCGTTCCTTCTCTCCCTCTTGGGTCTCTCTGGCTCATCCCCATCT 2798
g Ala Le
CGCCCGCCCCATCCCAGCCCTTCTCCCCGCCTCCCCACTGTGCGACACCCTCCCGCCCTCTCGGCCGCAGA¶ G GCG CT 2876
u Met Asp Glu Thr Met Lys Glu Leu Lys Ala Tyr Lys Ser Glu Leu Glu Glu Gln Leu Thr
G ATG GAC GAG ACC ATG AAG GAG TTG AAG GCC TAC AAA TCG GAA CTG GAG GAA CAA CTG ACC 2938
Pro Val Ala Glu Glu Thr Arg Ala Arg Leu Ser Lys Glu Leu Gln Ala Ala Gln Ala Arg L
CCG GTG GCG GAG GAG ACG CGG GCA CGG CTG TCC AAG GAG CTG CAG GCG GCG CAG GCC CGG C 2999
eu Gly Ala Asp Met Glu Asp Val Arg Gly Arg Leu Val Gln Tyr Arg Gly Glu Val Gln Al
TG GGC GCG GAC ATG GAG GAC GTG CGC GGC CGC CTG GTG CAG TAC CGC GGC GAG GTG CAG GC 3060
a Met Leu Gly Gln Ser Thr Glu Glu Leu Arg Val Arg Leu Ala Ser His Leu Arg Lys Leu
C ATG CTC GGC CAG AGC ACC GAG GAG CTG CGG GTG CGC CTC GCC TCC CAC CTG CGC AAG CTG 3121
Arg Lys Arg Leu Leu Arg Asp Ala Asp Asp Leu Gln Lys Arg Leu Ala Val Tyr Gln Ala G
CGT AAG CGG CTC CTC CGC GAT GCC GAT GAC CTG CAG AAG CGC CTG GCA GTG TAC CAG GCC G 3182
ly Ala Arg Glu Gly Ala Glu Arg Gly Leu Ser Ala Ile Arg Glu Arg Leu Gly Pro Leu Va
GG GCC CGC GAG GGC GCC GAG CGC GGC CTC AGC GCC ATC CGC GAG CGG CTG GGG CCC CTG GT 3243
l Glu Gln Gly Arg Val Arg Ala Ala Thr Val Gly Ser Leu Ala Gly Gln Pro Leu Gln Glu
G GAA CAG GGC CGC GTG CGG GCC GCC ACT GTG GGC TCC CTG GCC GGC CAG CCG CTA CAG GAG 3304
Arg Ala Gln Ala Trp Gly Glu Arg Leu Arg Ala Arg Met Glu Glu Met Gly Ser Arg Thr A
CGG GCC CAG GCC TGG GGC GAG CGG CTG CGC GCG CGG ATG GAG GAG ATG GGC AGC CGG ACC C 3365
rg Asp Arg Leu Asp Glu Val Lys Glu Gln Val Ala Glu Val Arg Ala Lys Leu Glu Glu Gl
GC GAC CGC CTG GAC GAG GTG AAG GAG CAG GTG GCG GAG GTG CGC GCC AAG CTG GAG GAG CA 3426
n Ala Gln Gln Ile Arg Leu Gln Ala Glu Ala Phe Gln Ala Arg Leu Lys Ser Trp Phe Glu
G GCC CAG CAG ATA CGC CTG CAG GCC GAG GCC TTC CAG GCC CGC CTC AAG AGC TGG TTC GAG 3487
Pro Leu Val Glu Asp Met Gln Arg Gln Trp Ala Gly Leu Val Glu Lys Val Gln Ala Ala V
CCC CTG GTG GAA GAC ATG CAG CGC CAG TGG GCC GGG CTG GTG GAG AAG GTG CAG GCT GCC G 3548
al Gly Thr Ser Ala Ala Pro Val Pro Ser Asp Asn His ***
TG GGC ACC AGC GCC GCC CCT GTG CCC AGC GAC AAT CAC TGAACGCCGAAGCCTGCAGCCATGCGACCC 3616
CACGCCACCCCGTGCCTCCTGCCTCCGCGCAGCCTGCAGCGGGAGACCCTGTCCCCGCCCCAGCCGTCCTCCTGGGGTGGA 3697
CCCTAGTTÃÃTÃÃÃGATTCACCAAGTTTCACGCÂ¶ ATCTGCTGGCCTCCCC.............. 3747
=============================================================================
Exercice 7: Examen 2018/2019_1h 30’

Chez l’Homme, le gène APOE codant pour l’apolipoprotéine E a été impliqué dans un grand nombre de pathologies
telles certaines dyslipidémies, les pathologies cardiovasculaires, l’alzheimer, le diabète, … . Il comprend quatre exons
séparés par trois introns et s’étend sur 3597 nucléotides au niveau de la sous-bande 13.2 du bras long du chromosome
19, (figure 1).
760 1092 582
Figure 1 : schéma du gène de l’apolipoprotéine E
I/ Analyse descriptive du gène :

- Donner la taille des différents introns ? (écrivez-les en dessous sur la figure 1)====> voir figure 1
- Quelles seraient les tailles des régions 5’ UTR et 3’UTR, sachant que la traduction débute au nucléotide 828 (figure 2) ?
5’UTR : 827pb ; 3’UTR : 145pb .
- la figure 1, montre aussi les positions de deux séquences Alus (Alu1 et Alu2, en gras et italiques sur la figure 2). Donner leurs
tailles sur figure 1? taille des Alus, Alu1= 324pb et Alu2= 293pb
- Qu’indiquent les flèches et quelle est leur signification ?
le sens de l'insertion: Alu1 se trouverait sur le brin complémentaire alors que l'Alu2 se trouverait sens 5'--->3'.
II/ Analyse fonctionnelle :
- Quelle serait la taille en pb de l’ARNm transcript ? 3597pb

- Quelle serait la taille en pb de l’ARNm mature (sans coiffe et queue polyA)? 1063pb
- Quelle est la taille de la CDS réelle de la figure 2? 951pb
- Sachant que le 1er exon du gène APO E est non codant, et que le 2ème exon code pour la plus grande partie d’un peptide signal (de
18 acides aminés qui seront clivés par une peptidase au cours des modifications post-traductionnelles pendant sa translocation à
travers la membrane du réticulum endoplasmique). A partir de la figure 2, déterminer : - la taille de la protéine immature ? 317 aa
- la taille de la protéine mature fonctionnelle ? 299 aa.
II/ Analyse du polymorphisme :

1/ Trois isoformes de la protéine ApoE sont les plus communes à l’échelle mondiale, qui sont : ε2, ε3 et ε4. Chez certaines
populations nordiques, une isoforme ε1 n’existant ni chez les populations méditerranéennes ni chez les populations asiatiques,
paraît être commune. Les différences d’acides aminés se passent aux positions 112, 127 et 158 de la protéine mature.
Position
112 127 158 Allèle
CGC / Arg GGC / Gly CGC / Arg E4
(codon/ TGC / Cys GGC / Gly CGC / Arg E3
acide aminé) TGC / Cys GGC / Gly TGC / Cys E2
TGC / Cys GAC / Asp TGC / Cys E1
- Quel est le type de mutation responsable de ces polymorphismes, et quels sont ses différents types ?
Ce sont des SNPs (Single Nucletide Polymorphisms) ; on distingue les substitutions (remplacement d'un nucléotide par autre) qui
constituent les plus fréquentes parmi toutes les mutations (≈95%), les délétions (1 ou quelques nucléotides sont perdus par la
séquence et addition (1 ou quelques nucléotides sont ajoutés à la séquence).
- Donner la(es) position(s) nucléotidique(s) des différentes mutations pour chaque allèle, à partir de la figure 2, en utilisant la
notation internationale ?
Arg 112 = codon CGC mute en Cys =codon TGC : Arg 112>Cys (=1 er nuclétide du codon : 2889 C>T)
Gly 127 = codon GGC mute en Asp =codon GAC : Gly 127>Asp (=2 ème nuclétide du codon : 2935 G>A)
Arg 158 = codon CGC mute en Cys =codon TGC : Arg 158>Cys (=1 er nuclétide du codon : 3027 C>T)
- A quel allèle correspond la séquence de la figure 2 ? Allèle E4
........................................................................................................................................................................
2/La figure 3 montre les sites de restriction des deux enzymes HhaI et TaqI qui permettent de mettre en évidence les allèles E2, E3
et E4 en plus de E1. Les sites de restriction constants (avec les extrémités des séquences amplifiées) sont représentés par les flèches
continues alors que les sites de restriction polymorphiques sont représentés par les flèches hachurées. P1 et P2 représentent les
positions de la paire de primers qui sert à amplifier et à déterminer les différents allèles du gène APOE. (les sites de restriction des
enzymes sont mentionnées au dessus de la séquence)
J'ai choisi de changer

le primer R sur la
séquence afin de
diminuer son % en GC
(la bande 35 devient
25 pb); mais c'est un
choix, écrivez soit 35
(fig.3) soit 25
Figure 3 : sites de restriction constants et polymorphiques de la région polymorphique du gène APOE.
a) D’après les données de la figure 3, utilisez la séquence de la figure 2 pour déterminer la paire de primers, qui permettrait
d’amplifier la région du gène correspondant à la bande 270 nt ; Faites la commande de cette paire de primers sachant qu’ils
ont chacun une taille de 20 nt ? donnez leur position sur la séquence de la figure 2 ?
b)
F : 5' AACAACTGACCCCGGTGG 3' (position: 2794 2811). (avec: 3064 - 2794 = 270pb)
R : 5' CGCCTCGCGGGCCCCGGC 3' (position: 3045 3063).
b) En ne considérant que les fragments d’ADN de taille ≥ à 35 pb, donnez la taille des bandes qui caractériseraient chacun des
allèles, obtenus à partir de la digestion des produits de PCR par les 2 enzymes :
E1 E2 E3 E4
139 - - -
131 - - -
91 91 91 -
83 83 - -
- - - 72
62 62 62 62
- - 48 48
- - 35 35
c) Qu’appelle-t-on la technique utilisée pour l’analyse de ce polymorphisme ? Décrivez cette technique ?

PCR/ RFLP : Elle consiste à amplifier par PCR, la région encadrée par les 2 primers.
- vérifier l'amplification par électrophorèse sur gel d'agarose (en utilisant une partie de chaque amplifiat)
- digérer les amplifiats réussis par les 2 enzymes de restriction.
- séparer par électrophorèse sur gel de polyacrylamide ou agarose pour déterminer le génotype de chaque individu.
3/ Dans la séquence du gène APOE de la figure 2, existent deux insertions Alu : Alu1 et Alu2 (séquences en gras et italiques) qui
sont encadrées chacune par une paire de primers P 1 et P2 pour Alu1 ; P3 et P4 pour Alu2.
* Commander les primers F et R lorsqu’on veut amplifier la région comprise entre P1 et P2 ?

P1=F : 5' GACGCTCTCTGGGCCTCGG 3' (position: 1010 1028)
P2=R : 5' CGTGTCTGGTATTCACTAT 3' (position: 1419 1437)
* Commander les primers F et R lorsqu’on veut amplifier la région comprise entre P1 et P3 ?
P3=R : 5' GGGGGTGATGGAGAAT 3' (position: 1455 1470)
* Commander les primers F et R lorsqu’on veut amplifier la région comprise entre P 1 et P4 ?
P4=R : 5' CCAGGCATCTAGTACCTA 3' (position: 1899 1916)
P2=F : 5' ATAGTGAATACCAGACACG 3' (position: 1419 1437)
P3=F : 5' ATTCTCCATCACCCCC 3' (position: 1455 1470)
En supposant que les insertions Alu1 et Alu2 sont polymorphiques :

- Donner la taille en pb de l’Alu1 : 324pb ; et de l’Alu2 : 293pb . (utiliser figure 1 et/ou 2).
- Déterminer la taille des bandes obtenues en présence et en absence d’insertion(s), après électrophorèse des produits
d’amplification par PCR, grâce aux primers ci-dessous ?
P1 et P2 ? I : 428pb ; D : 104pb ; P1 et P3 ? I : 461pb ; D : 137pb ;
P1 et P4 ? Attention : dans ce cas le polymorphisme des 2 Alus ensemble est analysé, donnez les bandes correspondantes à :
I au 1er et I au 2ème : 907pb ; I au 1er et D au 2ème : 614pb ; D au 1er et I au 2ème : 583pb ; D au 1er et D au 2ème : 290pb; P2
et P4 ? I : 498pb ; D : 205pb ; P3 et P4 ? I : 462pb ; D : 169pb ;
III/ Application :
En utilisant le polymorphisme de restriction HhaI, plusieurs études ont démontré l’implication du polymorphisme du gène APOE
dans les maladies cardiovasculaires (CVD pour Cardio-Vascular Disease). L’analyse de ce polymorphisme chez un échantillon de
malades CVD et sur un échantillon témoin formé de personnes apparemment saines a donné les résultats suivants :

Témoins sains 0 58 4 12 0 26 100
Tableau : Fréquences génotypiques obtenues chez les sains et les malades.
1- Calculez les fréquences alléliques chez les 2 échantillons ?

Soient p, q et r les fréquences alléliques respectivement de E2, E3 et E4 chez les témoins sains et p', q' et r' celles des patients MA
p = 12/200 = 0,06 ;;; q = (2x58 + 12 + 26)/200 = 0,77 ;;; r = (2x4 + 26)/200 = 0,17
p' = 8/200 = 0,04 ;;; q' = (2x38 + 8 + 24)/200 = 0,54 ;;; r' = (2x30 + 24)/200 = 0,42
…………………………………………………………………………………………………..………........................................…
2- Testez l’équilibre de Hardy-Weinberg chez les 2 échantillons ? Conclure ?
Calcul des effectifs théoriques:
Témoins sains 0 59 3 9 0 26+3 100
Patients atteints MA 0 29 18 4+3 0 45 100
Chez les sains:
H0: les effectifs observés et théoriques ne sont pas statistiquement différents, la population est en équilibre de Hardy et Weinberg,
ℵ2obs= ∑ (oi -ti)2 = (58-59)2+(4-3)2+(12-9)2+(26-29)2 = 0,017+0,333+1+0,310=1,66 <<<ℵ2thé,5%,3ddd=7,82
ti 59 3 9 29
Conclusion: on accepte l'hypothèse d'équilibre de HW, les effectifs observés et théoriques ne sont pas significativement différents
Chez les malades:

H0: les effectifs observés et théoriques ne sont pas statistiquement différents, la population est en équilibre de Hardy et Weinberg,
ℵ2obs= ∑ (oi -ti)2 = (38-29)2+(30-18)2+(8-7)2+(24-45)2 = 2,793+8,0+0,02+9,80=20,613 >>>ℵ2thé,5%,3ddd=7,82
ti 29 18 7 45
Conclusion: on rejette l'hypothèse d'équilibre de HW, les effectifs observés et théoriques sont significativement différents.
................................................................................................................................................................................
3- Comparez les 2 distributions de fréquences génotypiques ?
Comparaison des sains et des malades : (Généralement j'accepte cette réponse qui est celle de la majorité des étudiants)
H0: les fréquences alléliques entre les deux échantillons ne sont pas significativement différents,
ℵ2obs= ∑ (oi -ti)2 = (58-38)2+(4-30)2+(12-8)2+(26-24)2 = 10,53+22,53+2+0,17=35,23 >>>ℵ2thé,5%,3ddd=7,82
ti 38 30 8 24
Conclusion: les effectifs des sains et des malades sont significativement différents, donc les fréquences alléliques sont
significativement différentes. essentiellement pour l'allèle E4 qui semble être impliqué dans la maladie.
................................................................................................................................................................................
4- Quelles sont vos conclusions relatives à l’implication de ce polymorphisme dans la CVD ? si oui quel serait l’allèle impliqué ?
Le polymorphisme au niveau du gène APOE, aboutissant aux allèles E2, E3 et E4, semble être impliqué dans la maladie
cardiovasculaire; en effet, c'est l'allèle E4 qui présente le plus de différence entre les deux échantillons
(Utiliser la séquence remodelée du gène APOE suivante, et les sites de restriction des enzymes Hha I et Taq I)
5' 5'
GCGC Hha I GCG + C
3' CGCG C 3' GCG
Pour Hha I : la mutation élimine le site de restriction.
5' 5'
TCGA Taq I T + CGA
3' AGCT A G C 5' T
Pour Taq I : la mutation crée le site de restriction.

112
X 127
158

Null 7

Transféré par

Droits d'auteur :

Formats disponibles

Null 7

Transféré par

Informations du document

Titre original

Copyright

Formats disponibles

Partager ce document

Partager ou intégrer le document

Options de partage

Avez-vous trouvé ce document utile ?

Ce contenu est-il inapproprié ?

Droits d'auteur :

Formats disponibles

Null 7

Transféré par

Droits d'auteur :

Formats disponibles

Pr. N.

HARICH Polymorphisme Moléculaire SVI-6_BCM 2019/2020

UNIVERSITE CHOUAIB DOUKKALI ANNEE UNIVERSITAIRE 2019-2020

TRAVAUX DIRIGES (2ème Séance)

Pr. N. HARICH Travaux Dirigés_Polymorphisme Moléculaire SVI-6_BCM_2019/2020 1

• Contenu en GC doit être entre 40-60%.

r) Quel est le comportement des amorces à chacune de ses étapes ?

Pr. N. HARICH Travaux Dirigés_Polymorphisme Moléculaire SVI-6_BCM_2019/2020 2

Brin sens : 5’ GATTCAGGAGATTCACAC -- -- 704 nt -- -- TCGGTACAGCTATACAGG 3’

5-2) Donner le principe de base de la technique PCR ?

L'allèle fréquent contient le site de restriction (SR)

La mutation de l'allèle rare élimine le site de restriction

soit p = fréquence de la variante allélique fréquente = C

f (TT) = q2 = 0,09 Effectif de TT = 90

Pr. N. HARICH Travaux Dirigés_Polymorphisme Moléculaire SVI-6_BCM_2019/2020 4

Exercice 3 : EXAMEN 2013/2014 (2h) .

41 CAGCAGCAGC AGCAGCAGCA GCAGCAGCAG CAGCAGTGCA GGGCCAATCT AGGCAAGTCC CCTGCGCCAT

181 CAGTGCTGCC GTGCTCACCT GGGCTATGGC TCTTCTTTCA GGTGGGTCTC CGACCCTGAC TTCAACGTGG

321 AGTCCCTCTC CACAGGCTTT TCGGCCACCC AGGCACGGAA GGGCTTCTGG GACTACTTCA GCCAGCAGCA

391 GCAGCAGCAG CAGCAGCAGC AGCAGACCAG CGGGGACAAA GGCAGGGTTG AGCAGATCCA TCAGCAGAAG

531 CCATGATGAC CTGCCTCTGC TGCCTCAACC GAGGATCGGA TCGGATCGGA TTAGGGTTAG GGTTAGGGTT

601 AGGGTTAGGG TTAGGGTTAG GGTTAGGGTT AGGGTTAGGG TTAGGGTTAG GGTTAGGGTT AGGGTTAGGG

671 TTAGGGATAG TGTCCCCTTC TCCAGGACCC AGAAAGACAG GCTGCAGGCC CGTCTGGATG ACCTGTGGGA

741 AGACATCACT CACAGCCTTC AAGACCAGGG CCACAGCCAT CTGGGGGACC CCCGAGGATC TACCTGCCCA

811 GGCCCATTCC TCTGGGGAGC ATACTGTGTG CTCTCCCCAT CTCCAGCCCC TCCCTGATGG TTCCTCAGTT

951 GGACCATGTC TGAAAGCAGT GGCCTCACCA CTATCCCCAA AGCACACCCA TCACCCACTC CATTCCCTTG

1021 GACGAGAAAG CCAATCTCGT GGTGCGAGGG ACGATACACT GACTC ....3’

Pr. N. HARICH Travaux Dirigés_Polymorphisme Moléculaire SVI-6_BCM_2019/2020 6

Pr. N. HARICH Travaux Dirigés_Polymorphisme Moléculaire SVI-6_BCM_2019/2020 7

Exercice 4: EXAMEN RATTRAPAGE 2014/2015 (2h).

Site de restriction de HaeIII :

On voudrait étudier ce polymorphisme par PCR.

Taille bandes en pb Taille bandes en pb

8.5. Proposez un programme de PCR et justifiez-le ?

Pr. N. HARICH Travaux Dirigés_Polymorphisme Moléculaire SVI-6_BCM_2019/2020 10

a) F: 5' GATTCAGGAGATTCACAC 3' b) 5' CTAAGTCCTCTAAGTGTG 3'

11.2. Donnez le nombre de nucléotides encadré par les amorces :

Pr. N. HARICH Travaux Dirigés_Polymorphisme Moléculaire SVI-6_BCM_2019/2020 11

760 1092 582

Figure 1 : schéma du gène de l’apolipoprotéine E

I/ Analyse descriptive du gène :

II/ Analyse du polymorphisme :

- Calculer les Tm et proposez une Ta ? dites pourquoi ?

- Proposez un programme PCR pour amplifier ce polymorphisme ?

- Quelle serait la taille du fragment (bande) obtenu directement par PCR ?

Tableau : Fréquences génotypiques obtenues chez les sains et les malades.

2- Testez l’équilibre de Hardy-Weinberg chez les 2 échantillons ? Conclure ?

Chez les malades:

ℵ2obs= ∑ (oi -ti)2 = (58-48)2+(38-48)2+ (5-17,5)2+(30-17,5)2+(11-10)2 +(9-10)2+(2-1,5)2+(1-1,5)2+(24-23)2+ (22-23)2

Pr. N. HARICH Travaux Dirigés_Polymorphisme Moléculaire SVI-6_BCM_2019/2020 14

Exercice 7: Examen 2018/2019_1h 30’

760 1092 582

Figure 1 : schéma du gène de l’apolipoprotéine E

I/ Analyse descriptive du gène :

II/ Analyse fonctionnelle :

- Quelle serait la taille en pb de l’ARNm transcript ? 3597pb

II/ Analyse du polymorphisme :

J'ai choisi de changer

Figure 3 : sites de restriction constants et polymorphiques de la région polymorphique du gène APOE.