Null 7
Null 7
Null 7
b) Certaines parties de cette séquence ont été soulignées d'un trait simple; qu’est ce qui les caractérise ? A quoi
correspondent-elles ?
Les parties de la séquence du gène de l'apolipoprotéine E4 soulignées correspondraient aux séquences codantes ou
exons, (elles représentent une moindre fraction de la séquence par rapport aux les séquences non soulignées ou introns),
elles contiennent le codon initiateur au niveau du 2ème exon (le 1er exon également souligné ferait partie de la région 5'
UTR de l'ARNm) et le codon de terminaison (dans ce cas TGA) se trouve dans le 4ème; seuls les exons 2 et 3 respectent la
séquence consensus de fin d'exon (vues dans le cours: (AG)) et seuls les exons 3 et 4 commencent par le nucléotide G.
c) Examinez avec soin le début et la fin des séquences qui sont situées entre ces séquences soulignées, et dites qu’est ce qui
les caractérise ?
Les régions non soulignées correspondraient aux introns ou séquences non codantes, elles sont caractérisées en gros par
les séquences consensus de début (GT) et de fin (GA) d'introns.
d) Donner le nombre d’introns et le nombre d’exons du gène ApoE4 ? 5 introns et 4 exons.
e) Quel est le pourcentage de la région codante de ce gène ? 1163 / 5515 ≈ 21%
f) Quelles sont les fonctions (rôles) des protéines qui se fixent en premier sur ce gène dans la région allant du nucléotide
975 au nucléotide 1046 ?
Les ARN polymérases des eucaryotes ne reconnaissent pas directement leurs séquences promotrices : 5 facteurs de
transcription généraux ("Transcription Factor" : TFII-B, TFII-D, TFII-E, TFII-F et TFII-H) jouent le rôle d'intermédiaire
pour permettre la fixation des ARN polymérases et l'initiation de la transcription.
Le complexe complet [ARN polymérase - facteurs de transcription - séquence ADN du promoteur] est appelé complexe de
pré-initiation de la transcription. Ce complexe assure :
- le chargement précis de l'ARN polymérase II (Pol II) sur le bon site de démarrage de la transcription
- la déshybridation (ouverture) de l'ADN au niveau du promoteur
- le relargage de la Pol II du promoteur.
g) Quel est le rôle du triplet de nucléotides en 1871-1873 ? Quelle est sa phase de lecture ?
Il s'agit du codon ATG ou codon initiateur; sa phase de lecture (lue à partir de la 1ère base de la région codante)= phase2
h) Orientez la séquence du gène ApoE4? Traduire la séquence 1847-1913 de ce gène ?
l'orientation du gène est une orientation sens = 5'------>3'
1847
ATG AAG GTT CTG TGG GCT GCG TTG CTG GTC ACA TTC CTG GCA G 1913
Met - Lys - Val - Leu - Trp - Ala - Ser - Leu - Leu - Leu - Thr - Phe - Leu - Ala -
i) Le nucléotide en position 1913 est un G qui fait partie de la séquence traduite : quelle est sa position dans le cadre de
lecture : N1, N2 ou N3 ? (encadrer la réponse juste) il s'agit de N1
j) Le nucléotide en position 3007 est un G qui fait partie de la séquence traduite : quelle est sa position dans le cadre de
lecture : N1, N2 ou N3 ? (encadrer la réponse juste) il s'agit de N2
k) Quelle sera la longueur après transcription et maturation (comprenant l'addition de 1000 AMP du côté 3'-OH) de l'ARN
messager de l'apolipoprotéine E ? La longueur de l'ARNm mature serait de 1163nt + 1000A = 2163 nt
l) Quel est le rôle du codon (souligné deux fois) TGA en 4496 ? c'est le codon stop qui permet l'arrêt de la traduction
m) Quels sont les numéros des nucléotides de la boîte de polyadénylation ?
il s'agit de la séquence AATAAA située entre 4616 et 4621
n) De combien d'acides aminés se compose l'apolipoprotéine E mature ? [1163 -(44+23+145)] = 951 nt / 3 = 317aa
o) On voudrait amplifier par PCR l’exon 4 de ce gène, quels sont les critères du choix des primers d’une manière générale ?
p) Quels sont les primers que vous choisiriez pour amplifier cet exon ? (soulignés en noir foncé, et encadrées en rouge)
Forward : F : 5' CCA AAG TGC TGG GAT TAG AG 3'
Reverse : R : 5' ACA GAG CCA GAC TCC GTC TA 3'
q) Décrire brièvement mais précisément les différents ingrédients requis et le principe de base de la technique de PCR ?
2 primers – 0.2 - 0.4 M
4 dNTPs – 200 M
DNA polymérase – 0.5 -1 U pour 25 L de volume final
Tampon – 1x
MgCl2 – 1.5 mM
Echantillon d’ADN – 5-50 ng/vol. final
Principe de la PCR : «Polymerase Chain Reaction» ou encore ACP pour "Amplification en Chaîne par Polymérase", est une
technique de réplication ciblée in vitro. Il s'agit de réaliser une succession de réactions de réplication d'une matrice double
brin d'ADN. Elle permet d'obtenir, à partir d'un échantillon complexe et peu abondant, d'importantes quantités d'un fragment
d'ADN spécifique et de longueur définie. L'ordre de grandeur à retenir est celui du million de copies en quelques heures.
C'est, généralement suffisant pour une utilisation ultérieure.
s) Quelle expérience simple vous permettra de savoir si l'amplification spécifique de votre fragment a réussi ?
Réaliser une électrophorèse sur gel d'agarose dont la concentration dépendra de la taille des bandes à séparer.
t) Quelle technique proposerez vous pour étudier les deux mutations au niveau du 4 ème exon ? Donner le principe de la
technique ? Expliquer brièvement le protocole que vous adopterez ?
PCR/ RFLP : on en a parlé en cours à propos de ce polymorphisme, et de la technique utilisée. Elle consiste à :
- amplifier l'exon par PCR.
- vérifier l'amplification par électrophorèse.
- digérer les amplifiats réussis par une enzyme de restriction.
- séparer par électrophorèse sur gel de polyacrylamide pour déterminer le génotype de chaque individu.
===============================================================================
Exercice 2: EXAMEN RATTRAPAGE 2008/2009 (45’) :
-----------------------------------------------------------------------------------------------------------------------------------------
Recommandations : - Lire attentivement les questions, et répondre aux emplacements réservés à la réponse,
- Cocher ou encercler la lettre correspondante à ou aux réponse (s) justes pour les questions QCM,
Ne répondez que lorsque vous êtes sûrs de la réponse.
-----------------------------------------------------------------------------------------------------------------------------
5)_Exercice : On voudrait étudier un fragment d’ADN de 740 pb correspondant à la région régulatrice située en amont
d’un gène protéique. Sa séquence est la suivante :
5-1) Parmi les amorces suivantes, quelle est la paire qui permettra l’amplification de ce fragment par PCR ?
a) 5’ GATTCAGGAGATTCACAC 3’ e) 5’ AGCCATGTCGATATGTCC 3’
b) 5’ CTAAGTCCTCTAAGTGTG 3’ f) 5’ GTGTGAATCTCCTGAATC 3’
c) 5’ CACACTTAGAGGACTTAG 3’ g) 5’ CCTGTATAGCTGTACCGA 3’
d) 5’ TCGGTACAGCTATACAGG 3’ h) 5’ GGACATATCGACATGGCT 3’
Pr. N. HARICH Travaux Dirigés_Polymorphisme Moléculaire SVI-6_BCM_2019/2020 3
Pr. N. HARICH Polymorphisme Moléculaire SVI-6_BCM 2019/2020
5-3) Décrire brièvement mais précisément les différents ingrédients utilisés et leur importance ?
2 primers – 0.2 - 0.4 M : permettent de définir et de délimiter la région à amplifier
4 dNTPs – 200 M : matière première pour la polymérase qui lui sert à fabriquer le brin complémentaire
DNA polymérase – 0.5 -1 U pour 25 L de volume final : enzyme qui permet la réplication de l'ADN
Tampon – 1x : c'est le tampon qui garantit le bon fonctionnement de la DNA polymérase
MgCl2 – 1.5 mM : apporte l'ion Mg2+ à la réaction de PCR et améliore l'amplification de l'ADN en stimulant l'activité de la
Taq Polymérase et son rendement, en plus d'augmenter la fidélité et la spécificité de l'hybridation primer-ADN matrice en
diminuant la répulsion des deux brin d'ADN chargés négativement par la neutralisation de ses charges négatives.
Echantillon d’ADN – 5-50 ng/vol. final : échantillon individuel d'ADN à amplifier.
5-4) Quelle expérience simple vous permettra de vérifier si l’amplification a eu lieu ou pas ?
Réaliser une électrophorèse sur gel d'agarose dont la concentration dépendra de la taille des bandes à séparer.
5-5) Un polymorphisme de restriction Hae III biallélique de ce gène, résulte d’une substitution C par T qui fait disparaître le site
de restriction Hae III (GGCC) qui coupe entre GG et CC. Sachant que l’enzyme coupe le fragment en deux morceaux égaux :
a) quel est le nombre de bandes et la taille de(s) fragment(s) obtenus par électrophorèse chez chacun des trois sujets suivants :
Homozygote pour la version allélique fréquente : 1 bande foncée = 1/2 la taille du fragment......
Homozygote pour la version allélique rare : 1 bande = la taille complète du fragment (2 x la taille du 1er)
Hétérozygote : 2 bandes : 1 bande foncée = 1/2 la taille du fragment + 1 bande = la taille complète du fragment
b) En utilisant la même manière d’écriture de la séquence initiale (extrémités + nombre de nucléotides), écrivez les deux
séquences sens obtenues après digestion par l’enzyme Hae III ?
5' ACT AAG GCA AAA TTC CGA GAG G 3'
5' CCC TAG AAG ATA CAC G 3'
c) * Sachant que la version allélique rare se trouve à l’état homozygote chez 9% des sujets de la population Berbère du
Rif, calculez les fréquences alléliques ?
* Calculez les effectifs théoriques des différents génotypes attendus dans un échantillon de 1000 individus ?
=============================================================================
===========================================================================
1) Le gène protéique (voir séquence ci-dessous) contient des régions en gras, comment les appelle-t-on d’une manière
générale ? Quel est le nom et le rôle joué par chacune d’entre-elles en précisant leur position sur la séquence ?
* les régions en gras correspondent aux séquences de reconnaissance indispensables pour l'expression des gènes et la
fixation des facteurs de transcription (début et fin du gène) et par les facteurs d'épissage lors de la maturation de l'ARNm.
* - GGCCAATCT : Boîte GC: chez les eucaryotes, elles représentent les séquences reconnues par les facteurs de
- TATATA : Boîte TATA: transcription qui vont permettre la fixation de l'ARN polymérase.
- AG: Séquence consensus de fin d'intron fait partie du site accepteur lors de l'épissage (formation du spiceosome).
- GT: Séquence consensus de début d'intron fait partie du site donneur lors de l'épissage (formation du spiceosome).
- ATG: Codon d'initiation, borne 5' de l'ORF, 1er codon traduit
- TGA: Codon stop, borne 3' de l'ORF, représente le codon de fin de la traduction, reconnu par les FT. de terminaison.
- AATAAA: Séquence signal de polyadénylation, précède le site de clivage et de polyadénylation.
- TATGTTTG: Site de clivage de l'ARNmt.
2) Ces séquences en gras ont elles des applications en bioinformatique ? si oui lesquelles ?
Oui, elles sont utilisées par les programmes bioinformatiques permettant l'annotation des gènes et donc de distinguer les
séquences géniques des non géniques.
3) Le gène protéique (voir séquence) contient des régions soulignées et d’autres non, que représentent-elles ? Justifier votre
réponse.
Les séquences soulignées représenteraient les régions codantes ou exons, (faible proportion par rapport aux séquences non
soulignées), les séquences non soulignées seraient les régions non codantes ou introns ; ces deux types de séquences se
caractérisent par des séquences consensus de début et de fin: pour les introns (GT au début et AG à la fin) et pour les exons
(G au début et GA à la fin).
4) Quels sont les principaux polymorphismes moléculaires que vous connaissez et quels sont leurs principaux domaines
d’applications?
- SNP : ou Single Nucléotide Polymorphism, les plus fréquents (applications: phylogénie, pharmacogénétique, ...)
- STR : microsatellites ou -Short Tandem repeat-, très polymorphiques, (applications: identification individuelle, génétique
population, épidémiologie, ...)
- VNTR: minisatellites -Variable Number of Tandem repeats-, les plus polymorphiques, (idem, ...)
- Alus : principal SINE du génome humain, Short INterspersed Elements (mobiles), (génétique des populations, phylogénie, ...)
5) Quels avantages présentent les polymorphismes plurialléliques par rapport aux bialléliques ?
leur grande variabilité et leur taux d'hétérozygotie élevé
6) Le gène protéique (voir séquence) contient deux régions polymorphiques, l’une située sur l’intron 1 et l’autre sur l’intron
3, de quel(s) type(s) de polymorphisme s’agit-il ? Encadrez-les par des parenthèses et donner la position, le nom et la
taille du bloc de chacun ?
Intron 1: STR trinucleotide repeat (AGC)14 = 14 AGC
Intron 2 : STR hexanucleotide repeat (TTAGGG)16 = 16 TTAGGG
7) Quel est le mode de mutation de ces polymorphismes ?
Les STRs mutent via des mécanismes favorisant des petits changements (généralement une unité de répétition) Modèle step-
wise. Le mécanisme admis est celui du glissement de la polymérase (qui répète (+1 unité) ou saute (-1 unité) lors de la
réplication de la région répétitive).
8) Quelle est la position du codon initiateur sur la séquence et sur le chromosome ? Quelle est sa phase ?
la position de ATG sur la séquence est 206-208 alors que sur le chromosome, elle est : 90,855,536 - 90,855,538
Sa phase est une phase 2.
9) Quelle est la position du codon stop sur la séquence et sur le chromosome ? ……….. , ……………
la position de TGA sur la séquence est 865-867 alors que sur le chromosome, elle est : 90,856,195 - 90,856,197
10) Quelle est la proportion de la région codante ? 401/1065 = 37,65%. (en considérant tous les exons).
11) Quelle sera la longueur après transcription et maturation (comprenant l'addition de 150 AMP du côté 3'-OH) de l'ARN
messager produit par ce gène ? Coiffe (1 pb) + Exons (=401pb) + 150 pb = 552 pb.
12) De combien d'acides aminés, sera composée la protéine mature produite à partir de ce gène ? 327 pb /3 = 109 aa
Pr. N. HARICH Travaux Dirigés_Polymorphisme Moléculaire SVI-6_BCM_2019/2020 5
Pr. N. HARICH Polymorphisme Moléculaire SVI-6_BCM 2019/2020
13) Le nucléotide G en position 477 fait partie de la séquence traduite : quelle est sa position dans le codon (N1, N2 ou N3)
? N2 , et quel le numéro du codon en question ? Codon 53 ; A quel acide aminé code ce codon ? codon AGG code pour
Arg , et quelle est sa position sur la chaine peptidique : il s'agit de l'aa N° 53.
14) Quel est le nucléotide en position 766 ? nt 766 = C, quelle est sa position dans le codon : N1, N2 ou N3 ? N1 , quel est
l’acide aminé codé par ce codon? codon CAG code pour Gln, et quelle est sa position dans la protéine ? aa= N° 77.
15) Les séquences grisées représentent les régions proposées par le logiciel primer3 à partir desquelles on peut choisir des
primers, quelles sont toutes les parties du gène qu’on peut amplifier grâce à ces primers?
P1 et P2 permettraient l'amplification de l'exon 1 ; P1 et P3 permettraient l'amplification des exons 1 et 2 ; P2 et P3 permettraient
l'amplification de l'exon 2 ; P3 et P4 permettraient l'amplification de l'exon 3 ; P2 et P4 permettraient l'amplification des exons 2 et 3 ; P1
et P4 permettraient l'amplification des exons 1,2 et 3.
La séquence de l’ADN chromosomique d’un gène protéique humain situé sur le chromosome 10
entre les positions chromosomiques 90,855,331 et 90,856,395 est :
1 5’.............................. CCTAGAGAAC TGTTCCTGGG GTCTGGGACC TCAGCAGCAG
3’.............................. GGATCTCTTG ACAAGGACCC CAGACCCTGG AGTCGTCGTC
en bleu les régions STR polymorphiques; en bleuâtre clair les régions (P1 à P4) proposées par Primer 3 pour le choix des primers ; en vert
les primers choisis ; les régions soulignées = exons ; les régions non soulignées = introns ; en gras les séquences de reconnaissance.
16) quels sont les critères du choix des primers d’une manière générale ?
• Contenu en GC doit être entre 40-60%.
• Tm pour les deux primers, ne doit pas différer par plus de 5ºC et la Tm du produit d’amplification ne doit pas différer
des deux primers par plus de 10ºC.
• Temperature d’annealing est généralement 5ºC inférieure à la Tm la plus faible. (Plus devrait être testée).
• Eviter l’existence de hairpins (épingles à cheveux) auto-complémentaires internes de plus de 4bp et de dimères de
plus de 8bp.
• l’extrémité 3' est extrêmement sensible – éviter qu’elle soit complémentaire à n’importe quelle région de l’autre
primer et doit posséder un match exact avec le template (pour ne pas avoir la formation de dimères de primers)
17) On voudrait amplifier par PCR la région polymorphique de l’intron 3, à partir de quelles régions grisées choisiriez vous
vos primers ? P3 et P4 ; (Encadrez les sur la séquence tout en précisant le Forward et le Reverse) ?
F:5' CCATGATGAC CTGCCTCTGC 3'
R:5' GACATGGTCC AAATGAGAGT 3'
18) Quel est le principe de la technique PCR ? Quelle doit être la composition minimale du mélange réactionnel ?
19) Principe de la PCR : «Polymerase Chain Reaction» ou encore ACP pour "Amplification en Chaîne par Polymérase", est
une technique de réplication ciblée in vitro. Il s'agit de réaliser une succession de réactions de réplication d'une matrice
double brin d'ADN. Elle permet d'obtenir, à partir d'un échantillon complexe et peu abondant, d'importantes quantités
d'un fragment d'ADN spécifique et de longueur définie. L'ordre de grandeur à retenir est celui du million de copies en
quelques heures. C'est, généralement suffisant pour une utilisation ultérieure.
La composition minimale de la MIX est : les primers (0.2 - 0.4 M) ; 4 dNTPs (200 M) ; Taq polymérase ( 0.5 -1 U) ;
Tampon de la Taq (1x) ; MgCl2 (1.5 mM) ; ADN matrice (5-50 ng/vol. final).
20) 19-a) L’exon 3 contient en position 712 la CTGCAG qui représente le site de restriction de l’enzyme PstI, quelle
technique proposerez-vous pour étudier un polymorphisme nucléotidique changeant le G 714 en A? Donner son principe
et décrivez brièvement le protocole que vous adopterez ?
PCR/ RFLP : Elle consiste à : - amplifier l'exon par PCR
- vérifier l'amplification par électrophorèse
- digérer les amplifiats réussis par l'enzyme de restriction PstI
- séparer par électrophorèse sur gel de polyacrylamide ou agarose pour déterminer le génotype de chaque individu
19-b) Aurez-vous besoin des régions grisées ? si oui, quels seraient les primers F et R que vous choisirez?
Oui je peux utiliser les mêmes primers que ceux choisis pour amplifier l'exon 3.
=============================================================================
=============================================================================
=============================================================================
Figure 1 : séquence
monobrin partielle
des allèles A et B.
* Quelle est la mutation responsable de la production d’une enzyme inactive ? SNP Quelle est sa position ? 242
L’analyse du profil de digestion de l’allèle A par l’enzyme de restriction HaeIII (voir les 3 sites) a permis de dresser une carte de
restriction qui peut être utilisée dans le diagnostic de la tare (figure 2) :
* Soulignez et indiquez les sites de coupure sur les deux allèles A et B de la figure 1 ? (voir figure)
* Dites comment ce profil de restriction permettra de distinguer entre les allèles actif (A) et inactif (B) ?
Le profil de l'allèle actif serait de deux bandes : A=42 pb et B=230 pb; celui de l'allèle inactif serait d'une seule bande C=272
* En choisissant une notation appropriée, donnez les génotypes possibles avec la longueur des fragments ?
Spécifier les sains, porteurs et malades ? Sains= AB (2 bandes), Sains porteurs= ABC (3 bandes) et les malades une seule bande
C ; si on note par rapport à la mutation SNP, le couple d'allèle serait C/T : les sains seraient de génotype CC ; les sains porteurs
seraient CT et les malades seraient TT.
* La technique utilisée pour la détermination de ce polymorphisme comporte les étapes suivantes, classez-les dans l’ordre de leur
exécution ? (Attribuer des chiffres de 1 à 6)
_3_- Electrophorèse
_5_- Hybridation avec sonde
_4_- Transfert sur membrane
_2_- Digestion de l’ADN par une enzyme de restriction
_6_- Autoradiographie
_1_- Extraction ADN
* Qu’appelle-t-on cette technique ? technique RFLP // Qu’est-ce qu’elle permet de distinguer ? Elle permet de distinguer le
polymorphisme à partir de la longueur des fragments de restriction.
* L’analyse de la région encadrant les 3 sites de restriction, a permis de choisir les primers parmi les régions soulignées.
Quelle la paire qui permettra l’amplification de cette région du gène ?
5’GATTCAGGAGATTCAACCACTTGGG]198 - - - - - 470]CGAACATCGGTACAGCTATACAGG3’
3’CTAAGTCCTCTAAGTTGGTGAACCC]complémentaire]GCTTGTAGCCATGTCGATATGTCC5’
a) F: 5’ GATTCAGGAGATTCAACC 3’ e) 5’ CTAAGTCCTCTAAGTGTG 3’
b) 5’ CACACTTAGAGGACTTAG 3’ f) 5’ TCGGTACAGCTATACAGG 3’
c) 5’ GTGTGAATCTCCTGAATC 3’ g) 5’ GGACATATCGACATGGCT 3’
d) R: 5’ CCTGTATAGCTGTACCGA 3’ h) 5’ AGCCATGTCGATATGTCC 3’
(indiquez le F devant le primer Forward et le R devant le primer Reverse)
Pr. N. HARICH Travaux Dirigés_Polymorphisme Moléculaire SVI-6_BCM_2019/2020 8
Pr. N. HARICH Polymorphisme Moléculaire SVI-6_BCM 2019/2020
* Quels sont les ingrédients à mettre avec l’ADN matrice et ces primers pour amplifier cette région du gène ?
La composition minimale de la MIX est : En plus de l'ADN matrice (5-50 ng/vol. final) et les primers (0.2 - 0.4 M), on a
besoin des 4 dNTPs (200 M), la Taq polymérase ( 0.5 -1 U), le Tampon de la Taq (1x) et le MgCl2 (1.5 mM) .
* Quelle serait la taille des fragments après digestion des produits de PCR par l’enzyme HaeIII ? (choisir notation)
Quand il y a digestion, on a deux fragments A' et B': A' = 25 + A(=42) = 67pb ; B' = 24 + B(=230) = 254pb ;
Quand il n'y a pas de digestion, on n'a qu'un seul fragments C' = 49 + C (=272) = 321pb.
* Classer dans l’ordre les étapes de l’analyse diagnostique de cette tare grâce à la deuxième technique ?
1- Electrophorèse a) 4–3–1–2–5–6
2- Amplification par thermocycleur b) 3– 6 – 2 – 4 – 5 – 1
3- Extraction d’ADN c) 4–6–3–2–5–1
4- Digestion enzymatique
d) 2–5–6–3–4–1
5- Préparation du gel
6- Préparation de la Mix e) 1–2–4–5–6–3
* Le diagnostic réalisé chez les membres d’une famille atteinte de la tare par les deux
Sens de migration
techniques a permis d’obtenir les mêmes profils d’électrophorèse mais avec des tailles
de bandes (en pb) différentes. Quelles sont les tailles des bandes pour les 4 individus
analysés ?
(N.B. : les symboles pleins sont atteints et les clairs sont sains ou porteurs ;
rond=femelle et carré=mâle)
Quel est le diagnostic génétique de la tare chez l’enfant à naître (III-1) ?
L'enfant à naître sera Sain.
en Biochimie=============================================================================
/ PCEM1 Biologie Moléculaire / 28
Exercice2004
SAINT-ANTOINE 5 : (cf. code génétique en annexe)
EXAMEN Rattrapage –2015/2016(durée : 1h30mn)
Chez l’homme, le schéma d’un gène de ménage (qui s’exprime dans tous les types cellulaires) codant une enzyme E, est :
st représenté un gène de
ont l’expression est, par
ubiquitaire) qui code une
maine E.
en ce gène comporte
s?
e de chaque intron est de
et celle du promoteur de
quelle est, sans compter
s séquences régulatrices
elles, la taille du gène ?
1/Ce gène
es exons sont conservés au comporte-t-il combien
cours de l’épissage, d’introns
quelle sera, ?sans
5 introns
compter si on comptabilise
la coiffe le 1er
et la queue ouA,
poly 4 si on ne le comptabilise pas .
2/Si la taille
1. la taille du transcrit primaire de chaque intron (I) est de 10 kpb, et celle du promoteur (P) de 100 pb, quelle est, sans compter d’autres
2. la taille de l’ARN messager
séquences régulatrices éventuelles, la taille du gène ?
tant la même représentation que celle+du(4xI=4x
Gène= [(P=100pb) gène de10kpb)
l’enzyme E, représentez
+ (E=110) :
(3xE=100pb) + (E=200pb)] = 40 710 pb = 40,71 kpb
1. la structure du 3/Si tous primaire
transcrit les exons sont conservés au cours de l’épissage, quelle sera, sans compter la coiffe et la queue polyA :
2. celle de l’ARNm 3.1. la taille du transcrit primaire ? 40,61 kpb.
3. celle d’un ARNm qui résulterait d’un
3.2. la taille deépissage alternatif?de
l’ARN messager 610votre
pb.choix
r chacune des trois 4/En adoptant la même représentation que celleladu
molécules, positionnez s’il y lieu, la coiffe et queue
gènepolyA, en abrégé.
de l’enzyme E, schématisez :
Quel est le nom (Pour
de la molécule
chacune complète qui constitue
des trois molécules la coiffe positionnez
suivantes, ? s’il y a lieu, la coiffe et la queue polyA, en abrégé).
Quel est le nom de chacune 4.1. Ledes molécules
transcrit simples
primaire qui composent
? Coiffe la --II--
- --I-- ---- coiffe ----
? --III-- ---- --IV-- ---- --V-- AAAAAAAAAAAAAA..............
Citez deux fonctions de la coiffe
4.2. L’ARNm ? Coiffe --I-- --II-- --III-- --IV-- --V-- AAAAAAAAAAAAAA..............
nifie polyA ?
4.3. L’ARNm qui résulterait d’un épissage alternatif de votre choix ?
st la taille totale des séquences codantes du gène qui code l’enzyme E ?
le nombre d’acides aminés de l’enzyme E ? Coiffe --I-- --II-- --IV-- AAAAAAAAAAAAAA..............
tenu des éléments dont vous disposez sur le schéma, quelle est la séquence d’acides aminés
en N-terminal de la protéine
Pr. N. HARICH Travaux Dirigés_Polymorphisme Moléculaire SVI-6_BCM_2019/2020 9
en C-terminal de la protéine
Pr. N. HARICH Polymorphisme Moléculaire SVI-6_BCM 2019/2020
5/ 5.1. Refaire le schéma du gènes en y insérant les nucléotides et séquences de reconnaissance suivantes :
CCAAT, ATG, AATAAA, A, GT, G, A, GGGCGG, GA, TGA, AG, TATAAA
------CCAAT----- GGGCGG-----TATAAA----- G--Ex.I---ATG----GAGT-----AG G--Ex.II----GAGT----AGG--Ex.III---- GAGT--
--AGG---Ex.IV----GAGT----AGG---Ex.V----TGA------AATAAA---------GA .
5.2. Quel est le nom de la molécule complète qui constitue la coiffe ? 7-Méthyl-Guanosine
5.3. Citez deux fonctions de la coiffe? permet de protéger l'extrémité 5' et le passage à travers la membrane nucléaire,
5.4. Que signifie polyA ? séquence polyadénine ou queue polyA.
5.5. Citez lui deux fonctions ? permet : de protéger l'extrémité 3' et le passage à travers la membrane nucléaire,
6/Quelle est la taille totale des séquences codantes du gène qui code l’enzyme E ? 330 pb
7/Quel est le nombre d’acides aminés de l’enzyme E ? 110 aa.
8/Une paire d’amorces correspondant aux deux séquences nucléotidiques indiquées sur le schéma, est utilisée pour réaliser
une amplification par PCR, de l’ADN complémentaire (ADNc).
8.1. Faites la commande des amorces ?
F : ATG GCA CCG GAC TGG ; R : TCA GTT GGT CGG CCA
8.2. Pouvez-vous utiliser l’ADNc de n’importe quel tissu de l’organisme ? Justifiez en une phrase ?
Oui, parce que c'est le même génome dans toutes les cellules, généralement on utilise soit le sang (fraction
leucocytaire) soit les cellules des frottis buccales.
8.3.Quelle est la taille attendue du fragment amplifié ? 330pb
8.4. Pour réaliser la PCR, quel est le mélange réactionnel que vous ajouterez aux amorces pour amplifier l’ADNc ?
La composition minimale de la MIX est : En plus de l'ADNc matrice (5-50 ng/vol. final) et les primers (0.2 - 0.4 M),
on a besoin des 4 dNTPs (200 M), la Taq polymérase ( 0.5 -1 U), le Tampon de la Taq (1x) et le MgCl2 (1.5 mM) .
9/Compte tenu des éléments dont vous disposez sur le schéma, quelle est la séquence d’acides aminés
9.1. en N-terminal de la protéine: ATG GCA CCG GAC TGG (Voir code génétique plus haut)
Nt Met - Ala - Pro - Asp - Trp
9.2. en C-terminal de la protéine : TTG CCG ACC AAC TGA Stop
Leu - Pro - Thr - Asn Ct .
10/ On connaît dans l’intron 3 de ce gène un polymorphisme Alu (I/D) qu’on a mis en évidence grâce à la carte de restriction
suivante :
10.1. A quoi sert l’enzyme Alu I ? Elle sert à détecter l'existence dans une séquence la présence d'une séquence Alu
10.2. Sachant que la séquence Alu peut être isolée spécifiquement grâce à l’enzyme BamHI, schématisez la séquence en absence de
l’insertion Alu ? (Donnez la taille du segment) Alu- = 87 + 104 = 191 pb
10.3. Avant l’ère de la PCR, ce polymorphisme Alu était analysé grâce à la technique RFLP, en utilisant différentes enzymes et
différentes sondes. Donnez les différentes étapes de cette technique ?
_1_-Extraction de l'ADN
_2_- Digestion de l’ADN par la ou les enzyme(s) de restriction
_3_- Électrophorèse
_4_- Transfert sur membrane
_5_- Hybridation avec sonde
_6_- Autoradiographie
10.4. Pour un individu homozygote pour l’insertion, de génotype II, quelle serait la taille des bandes obtenues grâce à cette
technique lorsque :
- l’enzyme et la sonde utilisées sont respectivement EcoRI et S1 ? une seule bande : 504pb
- l’enzyme et la sonde utilisées sont respectivement EcoRI et S3 ? une seule bande : 504pb
10.5. Pour un individu homozygote pour la délétion, de génotype DD, quelle serait la taille des bandes obtenues grâce à cette
technique lorsque :
- l’enzyme et la sonde utilisées sont respectivement EcoRI et S1 ? une seule bande : 191pb
- l’enzyme et la sonde utilisées sont respectivement EcoRI et S3 ? une seule bande : 191pb
10.6. Pour un individu hétérozygote de génotype ID, quelle serait la taille des bandes obtenues grâce à cette technique
lorsque :
- l’enzyme et la sonde utilisées sont respectivement EcoRI et S1 ? deux bandes: une de 504pb et une 191pb
- l’enzyme et la sonde utilisées sont respectivement EcoRI et S3 ? deux bandes: une de 504pb et une 191pb
10.7. Pour un individu homozygote pour l’insertion de génotype II, quelle serait la taille des bandes obtenues grâce à cette technique
lorsque :
- les enzymes EcoRI et AluI sont utilisées avec la sonde S2 ? deux bandes: une de 220pb et une 284pb
- les enzymes BamHI et AluI sont utilisées avec la sonde S2 ? deux bandes: une de 133pb et une 180pb
- les enzymes EcoRI et BamHI sont utilisées avec la sonde S2 ? une seule bande : 313pb
10.8. Pour un individu homozygote pour la délétion, de génotype DD, quelle serait la taille des bandes obtenues grâce à cette
technique lorsque :
- les enzymes EcoRI et AluI sont utilisées avec la sonde S1 ? une seule bande : 191 pb
- les enzymes BamHI et AluI sont utilisées avec la sonde S1 ? 0 bande car très lourde (dépend du gel).
- les enzymes EcoRI et BamHI sont utilisées avec la sonde S1 ? une seule bande : 87pb
10.9. Pour un individu homozygote pour l’insertion de génotype ID, quelle serait la taille des bandes obtenues grâce à cette
technique lorsque :
- les enzymes EcoRI et AluI sont utilisées avec les sonde S2 et S3 ? deux bandes: une de 220pb et une 284pb
- les enzymes BamHI et AluI sont utilisées avec les sonde S2 et S3 ? deux bandes: une de 133pb et une 180pb
- les enzymes EcoRI et BamHI sont utilisées avec les sonde S2 et S3 ? deux bandes: une de 313pb et une 104pb
11/ De nos jours, ce polymorphisme Alu est surtout analysé grâce à la technique PCR simple, donner le principe de cette technique
et donnez ses avantages par rapport à la technique RFLP ?
Principe de la PCR : «Polymerase Chain Reaction» ou ACP "Amplification en Chaîne par Polymérase", est une technique de
réplication ciblée in vitro. Il s'agit de réaliser une succession de réactions de réplication d'une matrice double brin d'ADN. Elle
permet d'obtenir, à partir d'un échantillon complexe et peu abondant, d'importantes quantités d'un fragment d'ADN spécifique et de
longueur définie. L'ordre de grandeur à retenir est celui du million de copies en quelques heures. C'est, généralement suffisant pour
une utilisation ultérieure.
Avantages: elle a besoin d'une moindre quantité d'ADN et d'échantillon, elle est plus rapide et plus efficace, et non toxique
car elle n'utilise pas des sondes radioactives.
11.1. Quelle est la paire d’amorces que vous choisirez pour amplifier par PCR la totalité du segment (504pb) lorsque l’intron
est digéré par l’enzyme EcoRI et que l’insertion Alu est présente, sachant que :
(504pb)
Brin sens : 5' GATTCAGGAGATTCACAC - - ??? nucléotides - - TCGGTACAGCTATACAGG 3'
Brin antisens: 3' CTAAGTCCTCTAAGTGTG - - ??? nucléotides - - AGCCATGTCGATATGTCC 5'
12/ Certains laboratoires utilisent aussi la technique PCR/RFLP, donnez le principe de cette technique et donnez ses
avantages par rapport à la technique RFLP ? les avantages par rapport à la RFLP restent à part le cout des enzymes ceux de la
PCR: utilisation d'une moindre quantité d'ADN et d'échantillon, plus rapide et plus efficace, dont les produits digérés par les
enzymes de restriction sont ensuite séparés par électrophorèse; cette technique a l'avantage d'être non toxique car elle n'utilise pas
des sondes radioactives. Au vu du type de polymorphisme ins/del, la PCR/RFLP devient aussi inutile.
12.1. Quelle serait la taille des bandes, si vous soumettez le produit d’amplification à la digestion par BamHI +
AluI ?quand le génotypes est : II : 87/133/180/104 ; ID : 87/133/180/104 ; DD : 87/104.
12.2.Quelle serait la taille des bandes, si vous soumettez le produit d’amplification à la digestion par
AluI seulement ?quand le génotypes est : II : 220/284 ; ID : 220/284/191 ; DD : 191.
12.3.Vue la taille des bandes obtenues, Quel support utiliser pour les séparer ? gel d'agarose à 2%.
12.4.Quel est le protocole que vous finirez par adopter entre les deux précédents ? dites pourquoi ?
J'adopterais la PCR simple, car plus pratique, plus rapide, moins couteuse.Pour rester entre les 2 (PCR/RFLP).
12.5. Pensez-vous que dans le cas de ce polymorphisme, l’utilisation de la technique PCR/RFLP présente un
avantage quelconque par rapport à la technique PCR simple ? (justifier)
Aucun, au contraire elle ne permet pas de bien définir le polymorphisme Alu utilisé.
=============================================================================
=============================================================================
Exercice 6: Examen 2017/2018_1h15’
Exercice I : Le gène (APO E) humain est un membre de la famille multigénique codant les apoprotéines. Il est situé sur le bras
long du chromosome 19 en (19q13.2), comprend quatre exons séparés par trois introns et s’étend sur 3597 nucléotides (figure 1).
Le gène APO E existe sous différentes formes alléliques, dont les 3 principales : E2, E3 et E4 sont responsables de la synthèse des 3
isoformes les plus communes de la protéine ApoE : ε2, ε3 et ε4. La différence entre ces dernières résulte de différences
polymorphiques au niveau des acides aminés 112 et 158 de la protéine mature, résultant de mutations ponctuelles
polymorphiques ayant touché l’allèle ancestral E4 et qui ont donné les 2 autres allèles E2 et E3 (allèle le plus fréquent).
Position
112 158 Allèle
CGC / Arg CGC / Arg E4
(codon/acide aminé) TGC / Cys CGC / Arg E3
TGC / Cys TGC / Cys E2
- Quel est le type de mutation responsable du polymorphisme ? SNPs : codon 112 C > T ; codon 158 C > T.
- A quel allèle correspond la séquence de la figure 2 ? APOE4
- Quelle peut être la raison du presque remplacement de l’allèle ancestral E4 par un allèle muté E3 ?
Du point de vue évolutif, l'allèle E3 a permis une meilleure adaptation adapté à un régime alimentaire devenu de plus en plus
carnivore, et que peut l'allèle E4 était plus adéquat pour un régime végétarien et/ou frugivore.
Pr. N. HARICH Travaux Dirigés_Polymorphisme Moléculaire SVI-6_BCM_2019/2020 12
Pr. N. HARICH Polymorphisme Moléculaire SVI-6_BCM 2019/2020
2) Les nucléotides en gras et italiques des régions de la séquence (figure 2) correspondent à des insertions de type Alu qui ne sont
plus polymorphiques. A quoi correspondent les séquences grisées et encadrées qui les encadrent ?
Elles correspondent aux primers qui ont été choisis pour les amplifier.
- Pourquoi ces Alus ne sont plus polymorphiques ? Les Alus neutres anciennement insérés qui à travers des générations, elles ont
fini par se fixer et donc présents dans le génome de tous le individus.
- Donner les positions nucléotidiques des 2 séquences Alus sur la séquence figure 2 ?
Position_Alu1_(1192-1515) ; Position_Alu2_(1650-1942).
3) Afin d’analyser le polymorphisme moléculaire, on s’est proposé de faire une amplification par PCR suivie d’une digestion
enzymatique ; - Qu’appelle-t-on cette technique ? Justifier ce choix ? PRC/RFLP,
Elle a pour avantages ceux de la PCR: utilisation d'une moindre quantité d'ADN et d'échantillon, plus rapide et plus efficace, dont
les produits digérés par les enzymes de restriction sont ensuite séparés par électrophorèse; cette technique a l'avantage d'être non
toxique car elle n'utilise pas des sondes radioactives.
5' G C G C 3'
L’enzyme choisie est HhaI, dont le site de restriction est : 3' C G C G 5'
- Quelle est la condition pour le choix d’une enzyme de restriction ?
il faut que la mutation polymorphique crée une variation détectable par l'enzyme, soit que le site de restriction est créé par la
mutation soit qu'il est éliminé.
Pour amplifier la région polymorphique responsable des différents isoformes, on a choisi les primers au sein même de la région
codante (nucléotides et codons soulignés et encadrés au niveau de l’exon 4).
- Quelles sont les règles à suivre pour le choix des primers ? (voir réponse dans les autres exercices)
- Faites la commande de ces primers en précisant leurs séquences et orientations ? Précisez pour chacun sa position nucléotidique
sur la séquence ?
III/ Application :
Plusieurs études ont démontré l’implication du polymorphisme dans la démence sénile ou maladie d’Alzheimer (MA). Des analyses
de ce polymorphisme ont été réalisées chez un échantillon de patients âgés de plus de 60 ans, souffrant de MA et sur un échantillon
de personnes saines âgées de plus de 60 ans ; les résultats obtenus sont reportés sur le tableau suivant :
4- Quelles sont vos conclusions relatives à l’implication de ce polymorphisme dans la CVD ? si oui quel serait l’allèle impliqué ?
Le polymorphisme au niveau du gène APOE, aboutissant aux allèles E2, E3 et E4, semble être impliqué dans la maladie
cardiovasculaire; en effet, c'est l'allèle E4 qui présente le plus de différence entre les deux échantillons et qui est statistiquement
plus fréquent chez les malades.
GCTGTGCCTGGGGCAGGGGGAGAACAGCCCACCTCGTGACTGGGGGCTGGCCCAGCCCGCCCTATCCCTGGGGGAGGGGG 80
CGGGCAGGGGGAGCCCTÃTÃÃTTGGACAAGTCTGGGATCCTTGAGTCCTÂG¶ACTCAGCCCAGCGGAGGTGAAGGACGTC 159
CTTCCCCAGGAGCCG¶GTGAGAAGCGCAGTCGGGGGCACGGGGATGAGCTCAGGGGCCTCTAGAAAGAGCTGGGACCCT 238
GGGAAGCCCTGGCCTCCAGGTAGTCTCAGGAGAGCTACTCGGGGTCGGGCTTGGGGAGAGGAGGAGCGGGGGTGAGGCAA 318
GCAGCAGGGGACTGGACCTGGGAAGGGCTGGGCAGCAGAGACGACCCGACCCGCTAGAAGGTGGGGTGGGGAGAGCAGCT 398
GGACTGGGATGTAAGCCATAGCAGGACTCCACGAGTTGTCACTATCATTTATCGAGCACCTACTGGGTGTCCCCAGTGTC 478
CTCAGATCTCCATAACTGGGGAGCCAGGGGCAGCGACACGGTAGCTAGCCGTCGATTGGAGAACTTTAAAATGAGGACTG 558
AATTAGCTCATAAATGGAACACGGCGCTTAACTGTGAGGTTGGAGCTTAGAATGTGAAGGGAGAATGAGGAATGCGAGAC 638
TGGGACTGAGATGGAACCGGCGGTGGGGAGGGGGTGGGGGGATGGAATTTGAACCCCGGGAGAGGAAGATGGAATTTTCT 718
ATGGAGGCCGACCTGGGGATGGGGAGATAAGAGAAGACCAGGAGGGAGTTAAATAGGGAATGGGTTGGGGGCGGCTTGGT 798
AAATGTGCTGGGATTAGGCTGTTGCAGATAATGCAACAAGGCTTGGAAGGCTAACCTGGGGTGAGGCCGGGTTGGGGCCG 878
+1
GGCTGGGGGTGGGAGGAGTCCTCACTGGCGGTTGATTGACAGTTTCTCCTTCCCAG¶ACTGGCCAATCACAGGCAGGAA 957
Met Lys Val Leu Trp Ala Ala Leu Leu Val Thr Phe Leu Ala G
G ATG AAG GTT CTG TGG GCT GCG TTG CTG GTC ACA TTC CTG GCA G¶GTATGGGGGCGGGGCTTGCT 1021
CGGTTCCCCCCGCTCCTCCCCCTCTCATCCTCACCTCAACCTCCTGGCCCCATTCAGACAGACCCTGGGCCCCCTCTTCT 1101
GAGGCTTCTGTGCTGCTTCCTGGCTCTGAACAGCGATTTGACGCTCTCTGGGCCTCGGTTTCCCCCATCCTTGAGATAGG 1181
AGTTAGAAGTTGTTTTGTTGTTGTTGTTTGTTGTTGTTGTTTTGTTTTTTTGAGATGAAGTCTCGCTCTGTCGCCCAGGC 1261
TGGAGTGCAGTGGCGGGATCTCGGCTCACTGCAAGCTCCGCCTCCCAGGTCCACGCCATTCTCCTGCCTCAGCCTCCCAA 1341
GTAGCTGGGACTACAGGCACATGCCACCACACCCGACTAACTTTTTTGTATTTTCAGTAGAGACGGGGTTTCACCATGTT 1421
GGCCAGGCTGGTCTGGAACTCCTGACCTCAGGTGATCTGCCCGTTTCGATCTCCCAAAGTGCTGGGATTACAGGCGTGAG 1501
CCACCGCACCTGGCTGGGAGTTAGAGGTTTCTAATGCATTGCAGGCAGATAGTGAATACCAGACACGGGGCAGCTGTGAT 1581
CTTTATTCTCCATCACCCCCACACAGCCCTGCCTGGGGCACACAAGGACACTCAATACATGCTTTTCCGCTGGGCGCGGT 1661
GGCTCACCCCTGTAATCCCAGCACTTTGGGAGGCCAAGGTGGGAGGATCACTTGAGCCCAGGAGTTCAACACCAGCCTGG 1741
GCAACATAGTGAGACCCTGTCTCTACTAAAAATACAAAAATTAGCCAGGCATGGTGCCACACACCTGTGCTCTCAGCTAC 1821
TCAGGAGGCTGAGGCAGGAGGATCGCTTGAGCCCAGAAGGTCAAGGTTGCAGTGAACCATGTTCAGGCCGCTGCACTCCA 1901
GCCTGGGTGACAGAGCAAGACCCTGTTTATAAATACATAATGCTTTCCAAGTGATTAAACCGACTCCCCCCTCACCCTGC 1981
CCACCATGGCTCCAAAGAAGCATTTGTGGAGCACCTTCTGTGTGCCCCTAGGTACTAGATGCCTGGACGGGGTCAGAAGG 2061
ly Cys Gln Ala Lys Val Glu Gln Ala Val Glu Thr
ACCTGACCCACCTTGAACTTGTTCCACACAG¶ GA TGC CAG GCC AAG GTG GAG CAA GCG GTG GAG ACA 2128
Glu Pro Glu Pro Glu Leu Arg Gln Gln Thr Glu Trp Gln Ser Gly Gln Arg Trp Glu Leu A
GAG CCG GAG CCC GAG CTG CGC CAG CAG ACC GAG TGG CAG AGC GGC CAG CGC TGG GAA CTG G 2189
la Leu Gly Arg Phe Trp Asp Tyr Leu Arg Trp Val Gln Thr Leu Ser Glu Gln Val Gln Gl
CA CTG GGT CGC TTT TGG GAT TAC CTG CGC TGG GTG CAG ACA CTG TCT GAG CAG GTG CAG GA 2250
u Glu Leu Leu Ser Ser Gln Val Thr Gln Glu Leu Ar
G GAG CTG CTC AGC TCC CAG GTC ACC CAG GAA CTG AG¶GTGAGTGTCCCCATCCTGGCCCTTGACCCTC 2318
CTGGTGGGCGGCTATACCTCCCCAGGTCCAGGTTTCATTCTGCCCCTGTCGCTAAGTCTTGGGGGGCCTGGGTCTCTGCT 2398
GGTTCTAGCTTCCTCTTCCCATTTCTGACTCCTGGCTTTAGCTCTCTGGAATTCTCTCTCTCAGCTTTGTCTCTCTCTCT 2478
TCCCTTCTGACTCAGTCTCTCACACTCGTCCTGGCTCTGTCTCTGTCCTTCCCTAGCTCTTTTATATAGAGACAGAGAGA 2558
TGGGGTCTCACTGTGTTGCCCAGGCTGGTCTTGAACTTCTGGGCTCAAGCGATCCTCCCGCCTCGGCCTCCCAAAGTGCT 2638
GGGATTAGAGGCATGAGCCACCTTGCCCGGCCTCCTAGCTCCTTCTTCGTCTCTGCCTCTGCCCTCTGCATCTGCTCTCT 2718
GCATCTGTCTCTGTCTCCTTCTCTCGGCCTCTGCCCCGTTCCTTCTCTCCCTCTTGGGTCTCTCTGGCTCATCCCCATCT 2798
g Ala Le
CGCCCGCCCCATCCCAGCCCTTCTCCCCGCCTCCCCACTGTGCGACACCCTCCCGCCCTCTCGGCCGCAGA¶ G GCG CT 2876
u Met Asp Glu Thr Met Lys Glu Leu Lys Ala Tyr Lys Ser Glu Leu Glu Glu Gln Leu Thr
G ATG GAC GAG ACC ATG AAG GAG TTG AAG GCC TAC AAA TCG GAA CTG GAG GAA CAA CTG ACC 2938
Pro Val Ala Glu Glu Thr Arg Ala Arg Leu Ser Lys Glu Leu Gln Ala Ala Gln Ala Arg L
CCG GTG GCG GAG GAG ACG CGG GCA CGG CTG TCC AAG GAG CTG CAG GCG GCG CAG GCC CGG C 2999
eu Gly Ala Asp Met Glu Asp Val Arg Gly Arg Leu Val Gln Tyr Arg Gly Glu Val Gln Al
TG GGC GCG GAC ATG GAG GAC GTG CGC GGC CGC CTG GTG CAG TAC CGC GGC GAG GTG CAG GC 3060
a Met Leu Gly Gln Ser Thr Glu Glu Leu Arg Val Arg Leu Ala Ser His Leu Arg Lys Leu
C ATG CTC GGC CAG AGC ACC GAG GAG CTG CGG GTG CGC CTC GCC TCC CAC CTG CGC AAG CTG 3121
Arg Lys Arg Leu Leu Arg Asp Ala Asp Asp Leu Gln Lys Arg Leu Ala Val Tyr Gln Ala G
CGT AAG CGG CTC CTC CGC GAT GCC GAT GAC CTG CAG AAG CGC CTG GCA GTG TAC CAG GCC G 3182
ly Ala Arg Glu Gly Ala Glu Arg Gly Leu Ser Ala Ile Arg Glu Arg Leu Gly Pro Leu Va
GG GCC CGC GAG GGC GCC GAG CGC GGC CTC AGC GCC ATC CGC GAG CGG CTG GGG CCC CTG GT 3243
l Glu Gln Gly Arg Val Arg Ala Ala Thr Val Gly Ser Leu Ala Gly Gln Pro Leu Gln Glu
G GAA CAG GGC CGC GTG CGG GCC GCC ACT GTG GGC TCC CTG GCC GGC CAG CCG CTA CAG GAG 3304
Arg Ala Gln Ala Trp Gly Glu Arg Leu Arg Ala Arg Met Glu Glu Met Gly Ser Arg Thr A
CGG GCC CAG GCC TGG GGC GAG CGG CTG CGC GCG CGG ATG GAG GAG ATG GGC AGC CGG ACC C 3365
rg Asp Arg Leu Asp Glu Val Lys Glu Gln Val Ala Glu Val Arg Ala Lys Leu Glu Glu Gl
GC GAC CGC CTG GAC GAG GTG AAG GAG CAG GTG GCG GAG GTG CGC GCC AAG CTG GAG GAG CA 3426
n Ala Gln Gln Ile Arg Leu Gln Ala Glu Ala Phe Gln Ala Arg Leu Lys Ser Trp Phe Glu
G GCC CAG CAG ATA CGC CTG CAG GCC GAG GCC TTC CAG GCC CGC CTC AAG AGC TGG TTC GAG 3487
Pro Leu Val Glu Asp Met Gln Arg Gln Trp Ala Gly Leu Val Glu Lys Val Gln Ala Ala V
CCC CTG GTG GAA GAC ATG CAG CGC CAG TGG GCC GGG CTG GTG GAG AAG GTG CAG GCT GCC G 3548
al Gly Thr Ser Ala Ala Pro Val Pro Ser Asp Asn His ***
TG GGC ACC AGC GCC GCC CCT GTG CCC AGC GAC AAT CAC TGAACGCCGAAGCCTGCAGCCATGCGACCC 3616
CACGCCACCCCGTGCCTCCTGCCTCCGCGCAGCCTGCAGCGGGAGACCCTGTCCCCGCCCCAGCCGTCCTCCTGGGGTGGA 3697
CCCTAGTTÃÃTÃÃÃGATTCACCAAGTTTCACGC¶ ATCTGCTGGCCTCCCC.............. 3747
Pr. N. HARICH Travaux Dirigés_Polymorphisme Moléculaire SVI-6_BCM_2019/2020 15
Pr. N. HARICH Polymorphisme Moléculaire SVI-6_BCM 2019/2020
=============================================================================
- la figure 1, montre aussi les positions de deux séquences Alus (Alu1 et Alu2, en gras et italiques sur la figure 2). Donner leurs
tailles sur figure 1? taille des Alus, Alu1= 324pb et Alu2= 293pb
- Qu’indiquent les flèches et quelle est leur signification ?
le sens de l'insertion: Alu1 se trouverait sur le brin complémentaire alors que l'Alu2 se trouverait sens 5'--->3'.
Position
112 127 158 Allèle
CGC / Arg GGC / Gly CGC / Arg E4
(codon/ TGC / Cys GGC / Gly CGC / Arg E3
acide aminé) TGC / Cys GGC / Gly TGC / Cys E2
TGC / Cys GAC / Asp TGC / Cys E1
- Quel est le type de mutation responsable de ces polymorphismes, et quels sont ses différents types ?
Ce sont des SNPs (Single Nucletide Polymorphisms) ; on distingue les substitutions (remplacement d'un nucléotide par autre) qui
constituent les plus fréquentes parmi toutes les mutations (≈95%), les délétions (1 ou quelques nucléotides sont perdus par la
séquence et addition (1 ou quelques nucléotides sont ajoutés à la séquence).
- Donner la(es) position(s) nucléotidique(s) des différentes mutations pour chaque allèle, à partir de la figure 2, en utilisant la
notation internationale ?
Arg 112 = codon CGC mute en Cys =codon TGC : Arg 112>Cys (=1 er nuclétide du codon : 2889 C>T)
Gly 127 = codon GGC mute en Asp =codon GAC : Gly 127>Asp (=2 ème nuclétide du codon : 2935 G>A)
Arg 158 = codon CGC mute en Cys =codon TGC : Arg 158>Cys (=1 er nuclétide du codon : 3027 C>T)
- A quel allèle correspond la séquence de la figure 2 ? Allèle E4
........................................................................................................................................................................
2/La figure 3 montre les sites de restriction des deux enzymes HhaI et TaqI qui permettent de mettre en évidence les allèles E2, E3
et E4 en plus de E1. Les sites de restriction constants (avec les extrémités des séquences amplifiées) sont représentés par les flèches
continues alors que les sites de restriction polymorphiques sont représentés par les flèches hachurées. P1 et P2 représentent les
positions de la paire de primers qui sert à amplifier et à déterminer les différents allèles du gène APOE. (les sites de restriction des
enzymes sont mentionnées au dessus de la séquence)
Pr. N. HARICH Travaux Dirigés_Polymorphisme Moléculaire SVI-6_BCM_2019/2020 16
Pr. N. HARICH Polymorphisme Moléculaire SVI-6_BCM 2019/2020
a) D’après les données de la figure 3, utilisez la séquence de la figure 2 pour déterminer la paire de primers, qui permettrait
d’amplifier la région du gène correspondant à la bande 270 nt ; Faites la commande de cette paire de primers sachant qu’ils
ont chacun une taille de 20 nt ? donnez leur position sur la séquence de la figure 2 ?
b)
F : 5' AACAACTGACCCCGGTGG 3' (position: 2794 2811). (avec: 3064 - 2794 = 270pb)
R : 5' CGCCTCGCGGGCCCCGGC 3' (position: 3045 3063).
b) En ne considérant que les fragments d’ADN de taille ≥ à 35 pb, donnez la taille des bandes qui caractériseraient chacun des
allèles, obtenus à partir de la digestion des produits de PCR par les 2 enzymes :
E1 E2 E3 E4
139 - - -
131 - - -
91 91 91 -
83 83 - -
- - - 72
62 62 62 62
- - 48 48
- - 35 35
3/ Dans la séquence du gène APOE de la figure 2, existent deux insertions Alu : Alu1 et Alu2 (séquences en gras et italiques) qui
sont encadrées chacune par une paire de primers P 1 et P2 pour Alu1 ; P3 et P4 pour Alu2.
III/ Application :
En utilisant le polymorphisme de restriction HhaI, plusieurs études ont démontré l’implication du polymorphisme du gène APOE
dans les maladies cardiovasculaires (CVD pour Cardio-Vascular Disease). L’analyse de ce polymorphisme chez un échantillon de
malades CVD et sur un échantillon témoin formé de personnes apparemment saines a donné les résultats suivants :
Le polymorphisme au niveau du gène APOE, aboutissant aux allèles E2, E3 et E4, semble être impliqué dans la maladie
cardiovasculaire; en effet, c'est l'allèle E4 qui présente le plus de différence entre les deux échantillons
(Utiliser la séquence remodelée du gène APOE suivante, et les sites de restriction des enzymes Hha I et Taq I)
5' 5'
GCGC Hha I GCG + C
3' CGCG C 3' GCG
Pour Hha I : la mutation élimine le site de restriction.
5' 5'
TCGA Taq I T + CGA
3' AGCT A G C 5' T
Pour Taq I : la mutation crée le site de restriction.
112
X 127
158