Bioinformatica Grupo 3
Bioinformatica Grupo 3
Bioinformatica Grupo 3
Universidad estatal de
milagro
Título: Introducción a los motivos
biológicos
MATERIA: Bioinformática
Docente: César Aníbal Barzola
Grupo: G3
Carrera: Biotecnología-B2
Integrantes:
• Se crea una secuencia de ADN pattern que contiene el patrón "ACG". Este es el
fragmento de ADN que queremos buscar en la secuencia más larga.
• Se define una secuencia de ADN más larga sequence, en la cual se buscará el patrón.
La secuencia es
"ATGCGCGACGGCGTGATCAGCTTATAGCCGTACGACTGCTGCAACGTGA
CTGAT".
• Se utiliza la función nt_search del módulo SeqUtils para buscar todas las ocurrencias
del patrón en la secuencia. La función convierte la secuencia y el patrón en cadenas de
texto (strings) para realizar la búsqueda.
• La función nt_search devuelve una lista donde el primer elemento es el patrón
buscado y los siguientes elementos son las posiciones (índices) en las que se
encuentra el patrón dentro de la secuencia.
Explicación:
• Se crea una secuencia de ADN pattern que contiene el patrón "TGA". Este es el
fragmento de ADN que queremos buscar en la secuencia más larga.
• Se define una secuencia de ADN más larga sequence, en la cual se buscará el patrón.
La secuencia es
"ATGCGCGACGGCGTGATCAGCTTATAGCCGTACGACTGCTGCAACGTGA
CTGAT".
• Se utiliza la función nt_search del módulo SeqUtils para buscar todas las ocurrencias
del patrón en la secuencia. La función convierte la secuencia y el patrón en cadenas de
texto (strings) para realizar la búsqueda.
• La función nt_search devuelve una lista donde el primer elemento es el patrón
buscado y los siguientes elementos son las posiciones (índices) en las que se
encuentra el patrón dentro de la secuencia.
• R: A o G
• G: G
• W: A o T
• Y: C o T
• V: A, C o G
Ejemplo #2
Definición de la secuencia consenso y la secuencia de ADN:
consensus: Define una secuencia consenso con el valor "NVADB". Aquí, los
caracteres no estándar representan las siguientes bases según el código IUPAC:
• N: G, A, T, C
• V: A, C, G
• A: A, C, T
• D: A, G, T
• B: C, G, T
5. Encontrar Motivos
Motivos en Biopython
Importaciones:
• from Bio import motifs: Importa el módulo motifs de Biopython, que se utiliza para
trabajar con motivos de secuencias.
• from Bio.Seq import Seq: Importa la clase Seq del módulo Bio.Seq, que se utiliza
para manejar secuencias de ADN, ARN o proteínas.
• instances: Define una lista de objetos Seq, cada uno representando una secuencia de
ADN. Estas secuencias son las instancias a partir de las cuales se creará el motivo.
Ejemplo #2
Importaciones:
• from Bio import motifs: Importa el módulo motifs de Biopython, que se utiliza para
trabajar con motivos de secuencias.
• from Bio.Seq import Seq: Importa la clase Seq del módulo Bio.Seq, que se utiliza
para manejar secuencias de ADN, ARN o proteínas.
Definición de las instancias de secuencias:
• instances: Define una lista de objetos Seq, cada uno representando una secuencia de
ADN. Estas secuencias son las instancias a partir de las cuales se creará el motivo.
• Motifs: Imprime el motivo completo, mostrando todas las secuencias instancias que
componen el motivo.
• Consensus: Imprime la secuencia consenso del motivo, que es la secuencia
representativa con las bases más comunes en cada posición del motivo.
• Degenerate consensus: Imprime la secuencia consenso degenerada del motivo,
utilizando el código IUPAC para representar posiciones en las que hay variabilidad
entre las secuencias de las instancias.
• Count: Imprime el conteo de cada base (A, C, G, T) en cada posición del motivo,
mostrando cuántas veces aparece cada base en cada posición de las secuencias
instancias.
Interpretación de resultados:
Consensus:
La secuencia consenso es TACGC, indicando que T es la base más común en la
primera posición, A en la segunda, C en la tercera, G en la cuarta y C en la quinta.
Degenerate Consensus:
La secuencia consenso degenerada es WACVC, donde:
• W representa A o T en la primera posición.
• A es fijo en la segunda posición.
• C es fijo en la tercera posición.
• V representa A, C o G en la cuarta posición.
• C es fijo en la quinta posición.
Count:
En la primera posición:
• A aparece 3 veces.
• T aparece 4 veces.
En la segunda posición:
• A aparece 7 veces.
En la tercera posición:
• C aparece 5 veces.
• T aparece 2 veces.
En la cuarta posición:
• A aparece 2 veces.
• C aparece 2 veces.
• G aparece 3 veces.
En la quinta posición:
• A aparece 1 vez.
• C aparece 6 veces.
Ejemplo #2
Impresión del motivo completo, la secuencia consenso, la secuencia consenso
degenerada y los conteos:
• Motifs: Imprime el motivo completo, mostrando todas las secuencias instancias que
componen el motivo.
• Consensus: Imprime la secuencia consenso del motivo, que es la secuencia
representativa con las bases más comunes en cada posición del motivo.
• Degenerate consensus: Imprime la secuencia consenso degenerada del motivo,
utilizando el código IUPAC para representar posiciones en las que hay variabilidad
entre las secuencias de las instancias.
• Count: Imprime el conteo de cada base (A, C, G, T) en cada posición del motivo,
mostrando cuántas veces aparece cada base en cada posición de las secuencias
instancias.
Interpretación de resultados:
Consensus:
La secuencia consenso es ACTGC, indicando que A es la base más común en la
primera posición, C en la segunda, T en la tercera, G en la cuarta y C en la quinta.
Degenerate Consensus:
La secuencia consenso degenerada es WACRN, donde:
• W representa A o T en la primera posición.
• A es fijo en la segunda posición.
• C es fijo en la tercera posición.
• R representa A o G en la cuarta posición.
• N representa A, C, G, T en la quinta posición.
Count:
En la primera posición:
• A aparece 3 veces.
• T aparece 4 veces.
En la segunda posición:
• A aparece 7 veces.
En la tercera posición:
• A aparece 1 vez.
• C aparece 5 veces.
• T aparece 1 vez.
En la cuarta posición:
• A aparece 2 veces.
• G aparece 4 veces.
• T aparece 1 vez.
En la quinta posición:
• A aparece 1 vez.
• C aparece 3 veces.
• G aparece 2 veces.
• T aparece 1 vez.
7. Sitios JASPAR
JASPAR (Just Another SPARql Endpoint) es una base de datos de matrices de sitios de unión
a ADN para factores de transcripción en eucariotas. Estas matrices representan los sitios
específicos de unión al ADN donde las proteínas reguladoras, como los factores de
transcripción, se unen para controlar la expresión génica. Los sitios JASPAR son importantes
porque:
1. Predicción de sitios de unión: Permiten predecir dónde pueden unirse los factores de
transcripción en el genoma, lo que es crucial para entender cómo se regula la
expresión génica.
2. Análisis de regulación génica: Ayudan a identificar y caracterizar los elementos
reguladores en secuencias de ADN, lo que proporciona información sobre cómo se
controlan los genes.
3. Investigación biológica: Son utilizados por los investigadores para estudiar la
regulación génica en diversos procesos biológicos, como el desarrollo, la
diferenciación celular y la respuesta a estímulos ambientales (Mathelier et al., 2014).
Ejemplo #1
El comando meme pleurotusSpp-v2.fas -dna -mod oops -nmotifs 3 -maxw 20 -o gt_6 ejecuta
el programa MEME Suite con ciertas opciones y parámetros.
Motivos Biológicos: Los motivos son patrones que tienen una función biológica
importante, como sitios de unión para factores de transcripción. Pueden ser utilizados en
estudios de regulación génica y en la identificación de elementos funcionales en secuencias
genómicas.
Bases de Datos: JASPAR es una base de datos que proporciona motivos de unión
conocidos, utilizados para estudios de regulación génica y análisis comparativo.
Conclusión
Recomendaciones
Bailey, T. L., Boden, M., Buske, F. A., Frith, M., Grant, C. E., Clementi, L., Ren, J., Li, W.
W., & Noble, W. S. (2009). MEME Suite: Tools for motif discovery and searching.
https://doi.org/10.1093/nar/gkp335
Cañedo Andalia, R., & Arencibia Jorge, R. (2004). Bioinformática: En busca de los secretos
Ferreira, J., & Porco, A. (2008). Vacunas derivadas del análisis de los genomas: Vacunología
Mathelier, A., Zhao, X., Zhang, A. W., Parcy, F., Worsley-Hunt, R., Arenillas, D. J.,
Buchman, S., Chen, C., Chou, A., Ienasescu, H., Lim, J., Shyr, C., Tan, G., Zhou, M.,
https://doi.org/10.1093/nar/gkt997