Formulario de Python
Formulario de Python
Operaciones y simbolos
Símbolo Significado
= Operador de asignación de valor
== Operador de para una comparación entre dos variables,
probando su igualdad
Tipos de datos:
Numéricos: Python crea enteros a partir de un tipo de datos integrado llamado int y de decimales (números de punto flotante) como
instancias de float.
Booleanos: Contiene el valor True o False, y son un caso particular del tipo entero, correspondiendo a 1 (verdadero) y 0 (falso).
Cadenas:Las cadenas son secuencias de caracteres, que se pueden definir mediante texto encerrado entre los caracteres " " (comillas
dobles) o ' ' (comillas simples).
Funciones:
Funciones como int(), float() y bool() nos ayudarán a convertir los valores de Python en cualquier tipo.
Interaccion del usuario:
La función input() se invoca con un argumento: es una cadena que contiene un mensaje;
El mensaje se mostrará en la consola antes de que el usuario tenga la oportunidad de ingresar algo; input() entonces hará su trabajo.
Rutas y Carpetas:
Windows:
Mac o Linux:
Nube
Bloques de construcción básicos:
• es igual a (==)
• mayor y menor que (> y = y <=)
• no igual (!=)
• está un valor en un contenedor (in)
• no se encuentra un valor en un contenedor (not in)
Los patrones en biología
Patrones fijos:
• Dominios de proteínas
• Motivos de unión del factor de transcripción de ADN
• Sitios de corte de enzimas de restricción
• Sitios de cebadores de PCR degenerados
• Series de mononucleótidos
Patrones más flexibles:
• Dada una secuencia de ADN, ¿Cuál es la longitud de la cola poli-A?
• Dado un nombre de acceso de gen, extraiga la parte entre el tercer carácter y el guion bajo.
• Dada una secuencia de proteína, determine si este contiene un motivo de dominio de proteína altamente redundante.
• Si queremos que un carácter en un patrón coincida con cualquier carácter en la entrada, podemos usar un punto (.)
• GC.GC coincidiría con las cuatro posibilidades en el ejemplo de BisI anterior.
• El patrón también coincidiría con cualquier carácter que no sea una base de ADN: GCFGC, GC&GC y GC9GC.
• Podemos especificar los caracteres que no queremos que coincidan: [^XYZ]
Cuantificadores
• ? Un signo de interrogación inmediatamente después de un carácter significa que ese carácter es opcional: puede no estar o coincidir
una vez:
• GAT?C la T es opcional y el patrón coincidirá con GATC o GAC.
• Aplicar un signo de interrogación a más de un carácter: GGG(AAA)?TTT el patrón coincidirá con GGGAAATTT o GGGTTT.
• + Un signo más inmediatamente después de un carácter o grupo significa que el carácter o grupo coincidirá una o más veces:
• GGGA+TTT coincidirá con tres G, seguidas de una o más A, seguidas de tres T: coincidirá con GGGATTT, GGGAATT,
GGGAAATT, etc.
• * Un asterisco inmediatamente después de un carácter o grupo significa que el carácter o grupo puede no estar o coincidir varias
veces.
• GGGA*TTT coincidirá con tres G, seguido de ninguna o más A, seguido de tres T. Entonces coincidirá con GGGTTT, GGGATTT,
GGGAATTT, etc.
• Si queremos hacer coincidir un número específico de repeticiones, podemos usar llaves {}.
• GA{5}T coincidirá con GAAAAAT.
• GA{2,4}T significa G, seguido de entre 2 y 4 As, seguido de T: coincidirá con GAAT , GAAAT y GAAAAT.
• Podemos omitir los límites inferior o superior.
• A{3,} coincidirá con tres o más As, y hasta que se acabe
• G{,7} coincidirá con hasta siete Gs.
Posiciones
• Conjunto de herramientas de expresión regular que representan posiciones en la cadena de entrada:
• El símbolo de intercalación ^ coincide con el comienzo de una cadena.
• El patrón ^AAA coincidirá con AAATTT pero no con GGGAAATTT.
• El símbolo de dólar $ coincide con el final de una cadena.
• El patrón GGG$ coincidirá con AAAGGG pero no con AAAGGGCCC.
Combinación
• Podemos usar cuantificadores junto con alternancias y grupos de caracteres para especificar patrones muy flexibles.
• Patrón complejo para identificar secuencias de ARN mensajero eucariótico de longitud completa: ^AUG[AUGC]{30,1000}A{5,10}$
• un codón de inicio AUG al comienzo de la secuencia,
• seguido de entre 30 y 1000 bases que pueden ser A, U, G o C
• seguido de una cola poli-A de entre 5 y 10 bases al final de la secuencia