Bázový pár[1][2] alebo bp[1] je základná jednotka dvojvláknových nukleových kyselín pozostávajúca z dvoch dusíkatých báz navzájom viazaných vodíkovými väzbami. Bázové páry tvoria stavebné kamene dvojzávitnice (helixu) DNA a prispievajú k skladanej štruktúre DNA i RNA. „Watson–Crickove“ bázové páry adeníntymín a guaníncytozín (nazývané i „Watson–Crick–Franklinovej“), ktoré sú určené špecifickými vzormi vodíkových väzieb,[3] umožňujú špirále (helixu) DNA udržať pravidelnú štruktúru, ktorá je mierne závislá na jej poradí nukleotidov.[4] Komplementárna povaha tejto párovej štruktúry poskytuje nadbytočnú kópiu genetickej informácie kódovanú v každom vlákne DNA. Pravidelná štruktúra a nadbytočnosť údajov, ktoré poskytuje dvojzávitnica DNA, znamenajú, že DNA je vhodná na uchovávanie genetickej informácie, zatiaľ čo párovanie báz medzi DNA a príchodzími nukleotidmi poskytuje mechanizmus, prostredníctvom ktorého DNA polymeráza replikuje DNA a RNA polymeráza prepisuje DNA na RNA. Mnohé proteíny viažuce DNA dokážu rozpoznať špecifické vzory párovania báz, ktoré určujú konkrétne regulačné oblasti génov.

Zobrazenie Watson-Crickových bázových párov, hore pár tymín-adenín, dole pár guanín-cytozín

Intramolekulárne párovanie báz sa môže vyskytovať v jednovláknových nukleových kyselinách. To je obzvlášť dôležité v molekulách RNA (napr. transferovej RNA, tRNA), kde Watson-Crickove bázové páry (adenín-uracil a guanín-cytozín) umožňujú tvorbu krátkych dvojvláknových helixov a široká škála interakcií iných, než Watson-Crickovo párovanie (napríklad G–U alebo A–A), umožňujú skladanie RNA do mnohých špecifických trojrozmerných štruktúr. Okrem toho tvorí párovanie báz medzi transferovou RNA (tRNA) a mediátorovou RNA (mRNA) základ pre molekulárne rozpoznávanie, ktoré vedie k tomu, že sa nukleotidová sekvencia mRNA preloží do sekvencie aminokyselín bielkovín prostredníctvom genetického kódu.

Veľkosť konkrétneho génu alebo celého genómu organizmu je často meraná v bázových pároch, pretože DNA je zvyčajne dvojvláknová. Celkový počet bázových párov je teda rovnaký, ako počet nukleotidov v jednom vlákne (okrem nekódujúcich jednovláknových častí telomér). Haploidný ľudský genóm (23 chromozómov) má odhadom 3,2 miliardy báz a obsahuje asi 20 000 až 25 000 rôznych génov, ktoré kódujú proteíny.[5][6][7] Kilobáza je jednotka veľkosti používaná v molekulárnej biológii a je rovná 1 000 bázovým párom (bp) DNA alebo RNA.[8] Celkový počet bázových párov DNA na Zemi sa odhaduje na 5,0×1037 a celkovú hmotnosť 50 miliárd ton.[9] Pre porovnanie, odhaduje sa, že celková hmotnosť biosféry je až 4 bilióny ton uhlíka.[10]

Vodíkové väzby a stabilita

upraviť
 
 
Pár G.C (navrchu) má tri vodíkové väzby. Pár A.T (dole) má dve vodíkové väzby. Nekovalentné vodíkové väzby medzi bázami sú znázornené prerušovanými čiarami. Vlnovky znázorňujú väzbu na pentózu (cukor) a ukazujú smerom k malému žliabku.

Chemická interakcia zodpovedná za pravidlá párovania báz, ktoré sú popísané vyššie, je vodíková väzba. Vhodná geometria vodíkových väzieb donorov a akceptorov umožňuje stabilne vytvoriť len „správne“ páry. DNA s vysokým obsahom GC je stabilnejšia, než DNA s nízkym obsahom GC. Napriek domnienke, že vodíkové väzby významne stabilizujú DNA, stabilizácia vzniká hlavne skladaním báz na seba (tzv. stacking). [11]

Väčšie dusíkaté bázy, adenín a guanín, patria do skupiny chemických zlúčenín s dvoma kruhmi zvaných puríny. Menšie dusíkaté bázy, cytozín, tymín a uracil, ktoré majú len jeden kruh, patria medzi chemické zlúčeniny zvané pyrimidíny. Puríny sú komplementárne s len s pyrimidínmi. Páry pyrimidín-pyrimidín sú energeticky nevýhodné, pretože tieto báze sú príliš ďaleko od seba na tvorbu vodíkových väzieb. Naopak, páry purín-purín sú energeticky nevýhodné, pretože tieto molekuly sú navzájom príliš blízko, čo vedie k vzájomnému odpudzovaniu kvôli prekryvu. Párovanie báz purín-pyrimidín, teda AT, GC alebo UA (v RNA), tvorí adekvátnu duplexovú štruktúru. Tieto páry, A-T a G-C, sa nazývajú i Watson–Crickovo párovanie báz alebo kanonické párovanie báz. Jediné ďalšie páry purín-pyrimidín by boli AC, GT a UG (v RNA), ale tieto páry k sebe nepasujú kvôli polohám donorov a akceptorov vodíkových väzieb, ktoré si navzájom neodpovedajú. Pár UG, ktorý má dve vodíkové väzby, sa v RNA vykytuje relatívne často v rámci kolísavého párovania báz.

Spárované molekuly DNA a RNA sú relatívne stabilné pri izbovej teplote, ale jednotlivé nukleotidové vlákna sa od seba oddelia nad ich teplote topenia, ktorá je určená dĺžkou molekúl, množstvom nesprávnych párov (ak sú prítomné) a obsahom GC párov. Vyšší obsah GC znamená vyššiu teplotu topenia, takže nie je prekvapením, že genómy extrémofilov, ako je napríklad Thermus thermophilus, sú obzvlášť bohaté na GC páry. Naopak, regióny genómu, ktoré sa musia často oddeľovať, napríklad promótorový región často prepisovaných génov, obsahujú málo GC párov (napríklad TATA box). Pri dizajnovaní primérov pre PCR reakcie je nutné vziať do úvahy obsah GC a teplotu topenia.

Príklady

upraviť

Nasledujúce sekvencie DNA ukazujú príklady dvojvláknových sekvencií. Podľa dohody je horné vlákno v smere od 5'-konca k 3'-koncu, čo znamená, že spodné vlákno je v smere od 3' k 5'.

Sekvencia bázových párov DNA:
ATCGATTGAGCTCTAGCG
TAGCTAACTCGAGATCGC
Odpovedajúca RNA sekvencia, kde je vo vlákne RNA tymín nahradený za uracil:
AUCGAUUGAGCUCUAGCG
UAGCUAACUCGAGAUCGC

Analógy báz a interkalátory

upraviť
Bližšie informácie v hlavnom článku: Analóg nukleovej kyseliny

Chemické analógy nukleových kyselín môžu zaujať miesto správnych nukleotidov a vytvoriť nekanonické bázové páry, čo vedie k chybám (hlavne bodovým mutáciám) pri replikácii a transkripcii DNA. Tie vznikajú kvôli ich izosterickým vlastnostiam. Jedným bežným mutagénnym analógom bázy je 5-brómouracil, ktorý sa podobá na tymín, ale jeho enol forma sa páruje s guanínom.

Iné chemikálie, známe ako interkalátory DNA, sú schopné vyplniť medzeru medzi dvoma susednými bázami v jednom vlákne. Tým spôsobujú posunové mutácie, pretože sa „maskujú“ za bázy, na základe čoho na tomto mieste replikačný aparát preskočí alebo naopak doplní nukleotidy naviac.Väčšina interkalátorov veľké polyaromatické zlúčeniny, ktoré sú známe alebo predpokladané karcinogény. Medzi významné príklady patria etídiumbromid a akridín.

Umelý bázový pár (UBP)

upraviť

Umelý bázový pár (UBP) je vytvorená podjednotka (alebo dusíkatá báza) DNA, ktorá bola vytvorená v laboratóriu a nenachádza sa v prírode. Boli popísané sekvencie DNA, ktoré využívajú novovytvorené dusíkaté bázy na tvorbu tretieho bázového páru, popri dvoch, ktoré sa prirodzene vyskytujú v prírode, AT (adenín-tymín) a CG (cytozín-guanín). Niekoľko výskumných skupín sa pokúšalo nájsť tretí bázový pár pre DNA.[12] Tieto bázové páry sú založené na alternatívnych vodíkových väzbách, hydrofóbnych interakciách alebo koordinácii kovových iónov.[13][14][15][16]

V roku 1989 Steve Benner a jeho tím vytvorili modifikované formy cytozínu a guanínu, ktoré in vitro úspešne zabudovali do molekúl DNA.[17] Nukleotidy, ktoré kódovali RNA a proteíny, boli úspešné replikované in vitro. Odvtedy sa snaží Bennerov tím vytvoriť bunky, ktoré by vedeli nové bázy vytvoriť od základu, bez nutnosti tieto bázy dodávať.[18]

V roku 2022 skupina Ičira Hiraa v Japonsku vytvorila umelý bázový pár medzi 2-amino-8-(2-tienyl)purínom a pyridín-2-ónom (označené ako y a s), ktorý bol funkčný pri transkripcii a translácii a umožnil špecificky vložiť neštandardné aminokyseliny do proteínov.[19] V roku 2006 vytvorili 7-(2-tienyl)imidazo[4,5-b]pyridín a pyrol-2-karbaldehyd (označené ako Ds a Pa) ako tretí pár pre replikáciu a transkripciu.[20] Následne bolo pri PCR amplifikácii zistené, že Ds sa s veľkou presnosťou páruje s 4-[3-(6-aminohexánamido)-1-propínyl]-2-nitropyrolom (označené ako Px).[21][22] V roku 2013 aplikovali Ds-Px pár na generáciu DNA aptamérov pomocou in vitro selekcie (SELEX) a ukázali, že rozšírenie genetickej abecedy výrazne zvyšuje afinitu aptamérov na cielené proteíny.[23]

V roku 2012 skupina amerických vedcov pod vedením Floyda Romesberga, chemického biológa na Scrippsovom výskumnom inštitúte v San Diegu v Kalifornii, oznámila, že jeho tím nadizajnoval umelý bázový pár.[15] Dva nové nukleotidy boli nazvané d5SICS a dNaM. Tieto umelé nukleotidy, ktoré majú hydrofóbne nukleové báze, majú dva spojené aromatické kruhy, ktoré tvoria d5SICS–dNaM komplex alebo bázový pár v DNA.[18][24] Jeho tím nadizajnoval rôzne in vitro alebo „skúmavkové“ šablóny obsahujúce umelé bázové páry a potvrdil, že bázový pár bol s vysokou presnosťou v prakticky všetkých sekvenčných kontextoch účinne replikovaný štandardnými modernými technikami in vitro, hlavne pri amplifikiácii PCR a aplikáciách založených na PCR.[15] Ich výsledky ukázali, že pre PCR a aplikácie založené na PCR je umelý bázový pár d5SICS–dNaM funkčne ekvivalentný kanonickým párom a pri kombinácii s ostatnými bázovými pármi, A–T a G–C, ktoré sú používané všetkými organizmami, umožňujú použitie plne funkčnej rozšírenej šesťpísmenovej „genetickej abecedy“.[24]

V roku 2014 ten istý tím oznámil syntézu úseku cirkulárnej DNA známu ako plastid, ktorý obsahoval prirodzené A–T a G–C páry a k tomu umelý bázový pár s najlepšími výsledkami, ktoré pochádzali z Romesbergovho laboratória, a vložili ho do buniek E. coli, ktoré úspešne replikovali umelý bázový pár počas niekoľkých generácií.[12] Transfekcia nebránila rastu buniek E. coli a nevykazovala známky straty umelých bázových párov pôsobením mechanizmov na opravu DNA. Toto je prvý známy príklad žijúceho organizmu, ktorý preniesol rozšírený genetický kód na ďalšie generácie.[24][25] Rosemberg uviedol, že on a jeho kolegovia vytvorili 300 variantov na vylepšenie nukleotidov, ktoré by boli počas delenia buniek dostatočne stabilné a replikovateľné rovnako ľahko, ako prirodzené bázové pary. Sčasti sa im to poradilo dosiahnuť pridaním podporného génu z rias, ktorý exprimuje transportér nukleotidtrifosfátov, ktorý účinne importuje trifosfáty d5SICSTP i dNaMTP do baktérií E. coli.[24] Prirodzené replikačné dráhy ich následne boli schopné použiť na presnú replikáciu plazmidu, ktorá obsahoval bázový pár d5SICS–dNaM. Ostatní výskumníci boli prekvapení, že baktérie replikovali túto podjednotku DNA, ktorá bola vytvorená ľuďmi.[26]

Úspešné zabudovanie tretieho bázového páru je dôležitým prelomom na ceste k rozšíreniu počtu aminokyselín, ktoré sú kódované DNA, a to z existujúcich 20 na teoretických 172, čím by sa rozšíril potenciál živých organizmov produkovať nové proteíny.[12] Umelé vlákna DNA zatiaľ nič nekódujú, ale vedci uvažujú, že by mohli byť použité na vytváranie nových proteínov, ktoré by mohli mať priemyselné alebo farmaceutické použitie.[27] Experti vravia, že syntetická DNA s umelými bázovými pármi zvyšuje možnosť existencie foriem života založených na inom DNA kóde.[26][27]

Nekanonické párovanie báz

upraviť
Bližšie informácie v hlavnom článku: Nekanonické párovanie báz

Okrem kanonického párovania môžu niektoré podmienky uprednostniť párovanie báz s alternatívnou orientáciou báz či počtom a geometriou vodíkových väzieb. Tieto páry sú sprevádzané lokálnymi zmenami tvaru cukor-fosfátovej kostry.

Najbežnejšie nekanonické párovanie je kolísavé párovanie, ktoré nastáva medzi tRNA a mRNA na tretej pozícii mnohých kodónov pri transkripcii[28] a pri väzbe aminokyseliny na tRNA niektorými tRNA syntetázami.[29] Takisto boli pozorované v sekundárnych štrukútrach niektorých RNA sekvencií.[30]

Okrem toho existuje Hoogsteenovo párovanie báz (typicky písané ako A•U/T a G•C) v niektorých DNA sekvenciách (napr. CA a TA dinukleotidoch) v dynamickej rovnováhe so štandardným Watson-Crickovým párovaním.[31] Toto párovanie bolo pozorované i v niektorých komplexoch proteín-DNA.[32]

Naviac k týmto alternatívnym bázovým párom bolo pozorovaných mnoho vodíkových väzieb báza-báza v sekundárnej a terciárnej štruktúre RNA.[33] Tieto väzby sú často nutné pre presný komplexný tvar RNA, ako aj pre jej viazanie na jej interakčných partnerov.[33]

Dĺžková miera

upraviť

Nasledujúce skratky sa bežne používajú na popis dĺžky molekúl DNA/RNA:

  • bp = bázový pár — 1 bp odpovedá vzdialenosti približne 3,4 Å (340 pm)[34] pozdĺž vlákna a približne 618 (DNA) alebo 643 (RNA) daltonom
  • kb (= kbp) = kilobázový pár = 1 000 bp
  • Mb (= Mbp) = megabázový pár = 1 000 000 bp
  • Gb = gigabázový pár = 1 000 000 000 bp

Pre jednovláknové DNA/RNA sa používajú jednotky nukleotidov, skratka nt (prípadne knt, Mnt, Gnt), keďže nie sú párované. Na rozlíšenie od jednotiek úložného priestoru v počítačoch je možné použiť kbp, Mbp, Gbp, atď. pre bázové páry.

Centimorgan je často používaný na určenie dĺžky pozdĺž chromozómu, ale počet bázových párov, ktorým odpovedá, sa môže v rôznych aplikáciách líšiť. V ľudskom genóme je centimorgán asi 1 Mbp.[35][36]

Referencie

upraviť
  1. a b Sekvenovanie novej generácie [online]. Biopedia.sk, [cit. 2022-01-28]. Dostupné online.
  2. bázový [online]. Encyclopaedia Beliana, [cit. 2022-01-28]. Dostupné online.
  3. SPENCER, M.. The stereochemistry of deoxyribonucleic acid. II. Hydrogen-bonded pairs of bases. Acta Crystallographica, 1959-01-10, roč. 12, čís. 1, s. 66–71. Dostupné online [cit. 2022-01-29]. ISSN 0365-110X. DOI10.1107/S0365110X59000160. (po anglicky)
  4. [s.l.] : [s.n.]. ISBN 978-0-387-25579-8. DOI:10.1007/0-387-29148-2_2
  5. MORAN, Laurence A.. The total size of the human genome is very likely to be ~3,200 Mb [online]. Sandwalk.blogspot.com, 2011-03-24. Dostupné online.
  6. The finished length of the human genome is 2.86 Gb [online]. Strategicgenomics.com, 2006-06-12. Dostupné online.
  7. International Human Genome Sequencing Consortium. Finishing the euchromatic sequence of the human genome. Nature, October 2004, s. 931–45. DOI10.1038/nature03001. PMID 15496913.
  8. Organization of the ribosomal RNA genes of Dictyostelium discoideum: mapping of the nontranscribed spacer regions. Cell, December 1976, s. 605–13. DOI10.1016/0092-8674(76)90043-X. PMID 1034500.
  9. NUWER, Rachel. Counting All the DNA on Earth. The New York Times (New York), 18 July 2015. Dostupné online [cit. 2015-07-18]. ISSN 0362-4331.
  10. The Biosphere: Diversity of Life [online]. Basalt, CO: [cit. 2022-01-29]. Dostupné online. Archivované 2010-09-02 z originálu.
  11. Base-stacking and base-pairing contributions into thermal stability of the DNA double helix. Nucleic Acids Research, 2006-01-30, s. 564–74. DOI10.1093/nar/gkj454. PMID 16449200.
  12. a b c FIKES, Bradley J.. Life engineered with expanded genetic code. San Diego Union Tribune, May 8, 2014. Dostupné online [cit. 2014-05-08].
  13. Amplification, mutation, and sequencing of a six-letter synthetic genetic system. Journal of the American Chemical Society, September 2011, s. 15105–12. DOI10.1021/ja204910n. PMID 21842904.
  14. Highly specific unnatural base pair systems as a third base pair for PCR amplification. Nucleic Acids Research, March 2012, s. 2793–806. DOI10.1093/nar/gkr1068. PMID 22121213.
  15. a b c Efficient and sequence-independent replication of DNA containing a third base pair establishes a functional six-letter genetic alphabet. Proceedings of the National Academy of Sciences of the United States of America, July 2012, s. 12005–10. DOI10.1073/pnas.1205176109. PMID 22773812.
  16. Artificial DNA Base Pairing Mediated by Diverse Metal Ions. Chemistry Letters, 2017-05-05, s. 622–633. ISSN 0366-7022. DOI10.1246/cl.160985. (po anglicky)
  17. Enzymatic incorporation of a new base pair into DNA and RNA. J. Am. Chem. Soc., 1989, s. 8322–8323. DOI10.1021/ja00203a067.
  18. a b CALLAWAY, Ewan. Scientists Create First Living Organism With 'Artificial' DNA. Nature News (Huffington Post), May 7, 2014. Dostupné online [cit. 2014-05-08].
  19. An unnatural base pair for incorporating amino acid analogs into proteins. Nature Biotechnology, February 2002, s. 177–82. DOI10.1038/nbt0202-177. PMID 11821864.
  20. An unnatural hydrophobic base pair system: site-specific incorporation of nucleotide analogs into DNA and RNA. Nature Methods, September 2006, s. 729–35. DOI10.1038/nmeth915. PMID 16929319.
  21. Kimoto, M. et al. (2009) An unnatural base pair system for efficient PCR amplification and functionalization of DNA molecules. Nucleic acids Res. 37, e14
  22. Highly specific unnatural base pair systems as a third base pair for PCR amplification. Nucleic Acids Research, March 2012, s. 2793–806. DOI10.1093/nar/gkr1068. PMID 22121213.
  23. Generation of high-affinity DNA aptamers using an expanded genetic alphabet. Nature Biotechnology, May 2013, s. 453–7. DOI10.1038/nbt.2556. PMID 23563318.
  24. a b c d A semi-synthetic organism with an expanded genetic alphabet. Nature, May 2014, s. 385–8. DOI10.1038/nature13314. PMID 24805238.
  25. SAMPLE, Ian. First life forms to pass on artificial DNA engineered by US scientists. The Guardian, May 7, 2014. Dostupné online [cit. 2014-05-08].
  26. a b Scientists create first living organism containing artificial DNA. The Wall Street Journal (Fox News), May 8, 2014. Dostupné online [cit. 2014-05-08].
  27. a b POLLACK, Andrew. Scientists Add Letters to DNA's Alphabet, Raising Hope and Fear. New York Times, May 7, 2014. Dostupné online [cit. 2014-05-08].
  28. Structure of a purine-purine wobble base pair in the decoding center of the ribosome. Nature Structural & Molecular Biology, 2004-11-21, s. 1251–1252. Dostupné online. ISSN 1545-9993. DOI10.1038/nsmb866. PMID 15558050.
  29. Wobble puts RNA on target. Nature, June 2014, s. 480–481. Dostupné online. ISSN 1476-4687. DOI10.1038/nature13502. PMID 24919145. (po anglicky)
  30. A novel form of RNA double helix based on G·U and C·A+wobble base pairing. RNA, 2017-11-09, s. 209–218. Dostupné online. ISSN 1355-8382. DOI10.1261/rna.064048.117. PMID 29122970.
  31. Transient Hoogsteen base pairs in canonical duplex DNA. Nature, 2011, s. 498–502. DOI10.1038/nature09775. PMID 21270796.
  32. Jun Aishima, Rossitza K. Gitti, Joyce E. Noah, Hin Hark Gan, Tamar Schlick, Cynthia Wolberger. A Hoogsteen base pair embedded in undistorted B‐DNA. Nucleic Acids Res, 2002, s. 5244–5252. DOI10.1093/nar/gkf661. PMID 12466549.
  33. a b Analysis of RNA motifs. Current Opinion in Structural Biology, 2003, s. 300–308. Dostupné online. DOI10.1016/S0959-440X(03)00076-9. PMID 12831880. (po anglicky)
  34. Molecular Biology of the Cell. 6th. vyd. New York/Abingdon : Garland Science, Taylor & Francis Group, December 2014. ISBN 978-0-8153-4432-2. S. 177.
  35. NIH ORDR – Glossary – C [online]. Rarediseases.info.nih.gov, [cit. 2022-01-29]. Dostupné online. Archivované 2012-07-17 z originálu.
  36. Molecular Cell Biology. Fifth. vyd. San Francisco : W. H. Freeman, 2004. Dostupné online. ISBN 978-0-7167-4366-8. S. 396.

Literatúra

upraviť

Tento článok je čiastočný alebo úplný preklad článku Base pair na anglickej Wikipédii.