Poravnanje sekvenci
Poravnavanje sekvenci ili potravnjanje sekvenci, u bioinformatici, je obrazac raspoređivanja sekvenci DNK, RNK, ili proteina, u cilju identifikacije sličnih regija koje mogu biti posljedica funkcijskih, strukturnih, ili evolucijskih odnosa između sekvenci.[1] Poravnate sekvence nukleotida ili aminokiselina se tipski prikazuju kao redovi u matrici. Praznine se umeću između ostataka, tako da se identična ili slična slova poravnavaju u uzastopnim kolonama.
Poravnavanje sekvenci se isto tako koristi za sekvence koje nisu biološke prirode, kao što su sekvence u prirodnim jezicima ili u financijskim podacima.
Tumačenje
[uredi | uredi izvor]Ako dvije poravnate sekvence imaju zajedničkog pretka, neslaganja se mogu interpretirati kao tačkaste mutacije, a praznine kao mutacije umetanja ili delecije uvedene u jednu ili obe loze nakon njihove diobe. U poravnavanju sekvenci proteina, stepen sličnosti između aminokiselina u određenoj poziciji sekvence se može interpretirati kao gruba mjera konzervacije te regije ili motiva sekvence među lozama. Odsustvo ili prisustvo samo veoma konzerviranih supstitucija (odnosno, supstitucija aminokiselina čiji bočni lanci imaju slične biohemijske osobine) u određenom dijelu sekvence, sugerira da taj region ima strukturni ili funkcijski značaj.[3] Mada su DNK i RNK nukleotidne baze međusobno sličnije nego aminokiseline, konzervacija baznih parova indicira sličnu funkcionalnu ili strukturnu ulogu.
Reference
[uredi | uredi izvor]- ^ Mount DM. (2004). Bioinformatics: Sequence and Genome Analysis (2nd izd.). Cold Spring Harbor Laboratory Press: Cold Spring Harbor, NY. ISBN 0-87969-608-7.
- ^ "ClustalW2 FAQs".
- ^ Ng PC, Henikoff S. Predicting deleterious amino acid substitutions. Genome Res. 2001 May;11(5):863-74.