Guía 1 (Bases de Datos Biológicas - Completo) 2023
Guía 1 (Bases de Datos Biológicas - Completo) 2023
Guía 1 (Bases de Datos Biológicas - Completo) 2023
La base de datos del NCBI nos permite encontrar todo tipo de información desde literatura científica hasta
secuencias de genes o proteínas, genomas ensamblados y/o anotados, ESTs, etc. Sin embargo, dado que la
cantidad de información es grande y se encuentra interrelacionada, durante una búsqueda simple generalmente
se puede obtener resultados redundantes o de no interés. Para ello, el NCBI posee un sistema de filtros que nos
permite limitar nuestra búsqueda con mayor facilidad.
1. Ingresar al portal del NCBI (www.ncbi.nlm.nih.gov) y en la barra de búsquedas tipear “glutathione
peroxidase”. Observe las distintas bases de datos: literatura, genes, proteínas, mRNA, dominios
conservados, etc. De click a “protein”.
2. Descargar todas las secuencias de proteínas de glutathione peroxidase reportadas provenientes del humano:
Reformule la búsqueda a:
glutathione peroxidase[title] AND Homo sapiens[Organism]
Para descargar las secuencias en un archivo, de click en send, escoja la opción file y en formato escoja
la opción fasta.
Curso Bioinformática I Departamento Académico de Ciencias Celulares y Moleculares
2023-I LABORATORIO DE BIOINFORMÁTICA Y BIOLOGÍA MOLECULAR
Puede crear además una alerta para recibir notificaciones cuando se publican nuevas secuencias
De manera similar a los comandos que hemos explorado, existen muchos elementos que nos
permitirán filtrar los resultados en base a diversos criterios como número de acceso [ACCN], nombre
del gen [GENE], nombre de la revista o journal [JOUR], fecha de modificación [MDAT], peso
molecular (solo para proteínas) [MOLWT], entre otros. Diversos comandos de filtrado se pueden
encontrar en el siguiente link: http://www.ncbi.nlm.nih.gov/books/NBK49540/
acompañada con todas las bases disponibles que coinciden con el elemento de búsqueda.
Podemos ver que para el gen glk de la glucoquinasa existe información disponible tanto
a nivel genómico (Genomic), transcritos y proteínas (mRNA and protein).
Curso Bioinformática I Departamento Académico de Ciencias Celulares y Moleculares
2023-I LABORATORIO DE BIOINFORMÁTICA Y BIOLOGÍA MOLECULAR
EXPASY
El portal de recursos bioinformáticos ExPASy (https://www.expasy.org/) ofrece un aserie de
herramientas en línea para el análisis de secuencias primarias de nucleótidos y proteínas. La
siguiente secuencia corresponde a la Gastrina Humana:
MQRLCVYVLIFALALAAFSEASWKPRSQQPDAPLGTGANRDLELPWLEQQGPASHHRRQLGPQG
PPHLVADP SKKQGPWLEEEEEAYGWMDFGRRSAEDEN
n-region: The n-terminal region of the signal peptide. Reported for Sec/SPI, Sec/SPII, Tat/SPI
and Tat/SPII. Labeled as N
h-region: The center hydrophobic region of the signal peptide. Reported for Sec/SPI, Sec/SPII,
Tat/SPI and Tat/SPII. Labeled as H
c-region: The c-terminal region of the signal peptide, reported for Sec/SPI and Tat/SPI.
4. Por último, revisaremos otra herramienta útil de localización subcelular denominada Wolf
PSort (https://services.healthtech.dtu.dk/services/TargetP-2.0/). Predice la ubicación de
una proteína de acuerdo con el péptido señal que presenta.
5. Ponga la siguiente secuencia en el programa:
MAAPGSARRPLLLLLLLLLLGLMHCASAAMFMVKNGNGTACIMANFSAAFSVNYDTKSGPKN
MTFDLPSDATVVLNRSSCGKENTSDPSLVIAFGRGHTLTLNFTRNATRYSVQLMSFVYNLSDTHLF
PNASSKEIKTVESITDIRADIDKKYRCVSGTQVHMNNVTVTLHDATIQAYLSNSSFSRGETRCEQDR
PSPTTAPPAPPSPSPSPVPKSPSVDKYNVSGTNGTCLLASMGLQLNLTYERKDNTTVTRLLNINPN
KTSASGSCGAHLVTLELHSEGTTVLLFQFGMNASSSRFFLQGIQLNTILPDARDPAFKAANGSLRA
LQATVGNSYKCNAEEHVRVTKAFSVNIFKVWVQAFKVEGGQFGSVEECLLDENSMLIPIAVGGA
LAGLVLIVLIAYLVGRKRSHAGYQTI
Curso Bioinformática I Departamento Académico de Ciencias Celulares y Moleculares
2023-I LABORATORIO DE BIOINFORMÁTICA Y BIOLOGÍA MOLECULAR
Indicar lo siguiente:
Indicar lo siguiente:
Instrucciones:
TAREA OPCIONAL:
1. Descargue las secuencias del gen COX1 que contengan la secuencia codificante completa
(cds) del humano y el ratón en un solo formato fasta. Indique el criterio de su búsqueda.
2. Indique cuántas secuencias de nucleótidos ha publicado el Dr. Pablo Tsukayama en los
últimos 5 años. Indique su criterio de búsqueda.
3. En la base de datos Gene de NCBI ingresa al mejor resultado para ACE de Mus musculus
(por lo general el que aparece primero) y responde lo siguiente:
a. Número GeneID:
b. Fecha de última actualización (update):
c. Cromosoma en el que se ubica:
d. Número de exones:
e. Número de acceso en Genebank:
f. Tamaño en pares de bases (bp):
g. Título de la publicación que ingresó la secuencia:
h. Primer autor, Journal y año de publicación:
i. Dominio pfam identificado:
Curso Bioinformática I Departamento Académico de Ciencias Celulares y Moleculares
2023-I LABORATORIO DE BIOINFORMÁTICA Y BIOLOGÍA MOLECULAR
4. Hasta octubre del año pasado Pfam permitía la búsqueda de familias de proteínas
basados en una categoría denominada clanes. ¿Qué es un clan y cuál es el término
utilizado en Interpro actualmente?
5. Una vez entienda la nueva organización en Interpro
(https://xfam.wordpress.com/2022/08/04/pfam-website-decommission/) Realice la búsqueda
del clan lisozima y detalle la organización de este set de familias.
6. Guarda el archivo en formato de aminoácidos y con ayuda de la herramienta Compute
PI/Mw (http://www.expasy.ch/tools/pi_tool.html) responde lo siguiente:
a. ¿Cuál es el peso molecular (kDa) de la proteína?
b. ¿A qué pH puede alcanzarse el punto isoeléctrico?
7. En STRING, vuelva a realizar la búsqueda con la misma proteína de mioglobina,
pero en el pez zebra Danio rerio ¿Encuentra diferencias en el interactoma frente al
del humano?
8. Responda a las siguientes preguntas haciendo uso del SPDBV
Obtenga la estructura de Hexoquinasa humana (1QHA) del PDB (http://www.pdb.org/),
abra el programa SPDBV y cargue el archivo pdb obtenido.
Muestre una gráfica y responda ¿Cuántas cadenas polipeptídicas puede apreciar?
Descargue las estructuras cristalizadas de la Pirazinamidasa de Pyrococcus horikoshii en
complejo con zinc (1IM5) y sin zinc (1ILW).
Compare, mediante un alineamiento estructural, la estructura 3D de ambos estados de la
enzima. Describa los cambios estructurales producto de la coordinación con el zinc.