Método de Hennig. Método Alternativo. 1) Definir La Raíz (Escogiendo Grupo Externo) 1) Identificar Caracteres Informat

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 6

Curso de Evolución 2016

Facultad de Ciencias
Método de Hennig Método “alternativo”
Montevideo, Uruguay
http://evolucion.fcien.edu.uy/ 1) Definir la raíz 1) Identificar caracteres
http://eva.universidad.edu.uy/
(escogiendo grupo externo) informativos

2) Establecer la polaridad de 2) Construir árboles sin raíz


los caracteres

3) Usar las sinapomorfías 3) Elegir el árbol más corto


Tema 2. Las filogenias como contexto de análisis de la
evolución. Métodos de inferencia filogenética. Análisis
para encontrar el árbol
filogenético según el principio de parsimonia. (o para comparar árboles)

4) Elegir el árbol más corto 4) Eventualmente colocar la


= más parsimonioso raíz, y con ello establecer
= con menor número de la polaridad
1
pasos 2

Árbol sin raíz Árbol con raíz


B A C D
A C
raíz
raíz

B D

B A C D
A C

árbol con raíz árbol sin raíz raíz


raíz
B D

3
Se pueden obtener varios árboles con raíz a partir de uno sin raíz 4

1
Caracteres informativos:
Número de árboles posibles con y sin raíz
Concepto:
Un carácter informativo es aquel para el cual hay al
Nº de OTUs Nº de árboles Nº de árboles menos dos conjuntos de árboles que implican distinto
con raíz sin raíz número de pasos (en términos de parsimonia).

2 1 1 Criterio operativo:
3 3 1 Un carácter es informativo cuando presenta al menos
4 15 3 dos estados para los que se cumple que cada uno es
5 105 15 compartido por al menos dos de los taxa en estudio.
6 954 105
7 10 395 954
8 135 135 10 395
9 2 027 025 135 135
10 34 459 425 2 027 025
5 6

Caracteres informativos: Análisis de un caso Sitio informativo


sitios
Taxa 1 2 3 4 5 6 7
Concepto:
1 A A G A G T G
Un carácter informativo es aquel para el cual hay al menos dos conjuntos de 2 T G C C G T G
árboles que implican distinto número de pasos (en términos de parsimonia). 3 A G A T A T C
4 T G A G A T C
Criterio operativo:
Un carácter es informativo cuando presenta al menos dos estados para los Número 1 1 2 3 1 0 1
que se cumple que cada uno es compartido por al menos dos de los taxa en mínimo
estudio. de pasos*

Ejercicio: identificar caracteres informativos, e ilustrar cómo existen árboles


que implican distinto número de pasos para dichos caracteres.
Especie A 0 0 0 0 0
Especie B 0 0 1 0 0 A
Especie C 1 0 1 0 1 otras
Especie D 1 0 1 1 1 B
Especie E 1 0 1 2 2
Especie F 1 1 2 3 2
7 8

2
Análisis de un caso Sitio informativo
sitios Ejemplo resuelto: sitio 1
Taxa 1 2 3 4 5 6 7
1 A A G A G T G
2 T G C C G T G Árbol 1 Árbol 2 Árbol 3
3 A G A T A T C
4 T G A G A T C 1A A3 1A T2 1A T2

Análisis de un caso: 3 árboles sin raíz posibles


Mapear cada carácter en cada árbol de el/los modos más parsimoniosos (en algunos
casos hay dos formas igualmente parsimoniosas)
2T T4 3A T4 4T A3

Árbol 1 Árbol 2 Árbol 3 1A A3 1A T2


1 3 1 2 1 2

2T T4 4T A3
2 4 3 4 4 3 2 pasos 1 paso 2 pasos
Notas: 1. el carácter requiere 1 paso en el árbol 2, y 2 pasos en los demás;
1 3 1 2 1 2 2. en los árboles 1 y 3, hay dos formas igualmente parsimoniosas de
ajustar el carácter, pero las dos requieren 2 pasos
3. en los árboles sin raíz, no se puede definir la polaridad (dirección de los
cambios), pero sí el número y ubicación (o ubicaciones) en el árbol.
2 4 3 4 4 3 9 10

Arbol 1 Arbol 2 Arbol 3 Método de Hennig Método “alternativo”


Sitio
1) Determinar la raíz 1) Determinar sitios
1 2 1 2 (escogiendo grupo externo)

5 1 2 2 2) Polaridad de los caracteres 2) Construir árboles sin raíz

7 1 2 2 3) Usar las sinapomorfías 3) Elegir el árbol (o árboles)


para encontrar el árbol más corto
Número (o para comparar árboles)
de pasos 4 5 6
(caracteres
informativos) 4) Elegir el árbol más corto 4) Eventualmente colocar la
El árbol 1 es el elegido como el más parsimonioso: = más parsimonioso raíz, y con ello establecer
requiere el mínimo número de cambios = con menor número de la polaridad
sumando para todos los sitios informativos (los sitios no informativos pasos
agregan el mismo número de pasos a todos los árboles). 11 12

3
Evaluando los árboles
Distribución de frecuencias de todos los árboles posibles, o
de una muestra de árboles al azar

Criterios “globales”

frecuencia
Criterios “por nodo”

longitud (número de pasos)

frecuencia
13 longitud (número de pasos) 14

Distribución de frecuencias de todos los árboles posibles, o BOOTSTRAP 1 Matriz de caracteres


de una muestra de árboles al azar

xN

N Pseudorréplicas
frecuencia

............
(muestreo al azar con reposición
de la matriz de caracteres)

longitud (número de pasos)


1 2 3 N
frecuencia

frecuencia

longitud (número de pasos) ÁRBOL DE CONSENSO


longitud (número de pasos)
por mayoría
15 16

4
Árboles a partir de pseudorréplicas
• El árbol de consenso es una especie de “árbol
promedio” A B C D E F A B C D E F A D C B E F A C B D E F

• Sólo se mantienen aquellos agrupamientos que se


repiten un cierto número de veces (predeterminado).

ÁRBOL DE CONSENSO
Por ejemplo:

Si el umbral predeterminado es 50%, en el árbol consenso sólo E F


A B C D
permanecerán aquellos agrupamientos que hayan aparecido en al
menos el 50% de los árboles construidos a partir de las N
pseudorréplicas. 50% 100%
• El bootstrap no evalúa la topología global, sino que
100%
proporciona el apoyo estadístico de los NODOS
individuales
17 18

Comentarios adicionales sobre los árboles de Árboles de genes y árbol de especies: posibles
consenso discordancias (entre árboles correctos)

Hay varios tipos de consensos; vimos el uso del criterio de la


mayoría introgresión

Otro muy usado es el consenso estricto: incluir solamente los


nodos presentes en el 100% de las pseudorréplicas (o, más en
general, de los árboles bajo consideración)

Importante:
Comúnmente del análisis de una matriz se obtienen más de un Reparto de genes
árbol más corto: (“gene sorting”)
necesidad de obtener
árbol de consenso
19

5
Árbol de genes en un árbol de especies Algunas conclusiones

• la parsimonia ilustra aspectos comunes a todos los métodos

• la magnitud del problema (muchos árboles posibles), la


Reparto incompleto de
linajes
inevitable complejidad de los procesos evolutivos, la parcialidad y
“ruido” de los datos, hacen que...

• ningún método puede garantizar la obtención del árbol correcto


(excepto bajo condiciones muy particulares)

• deberíamos retener una cuota de cautela al hablar de nuestras


hipótesis filogenéticas

• deberíamos considerar y evaluar hipótesis alternativas

Degnan & Rosenberg (2009) TREE 24: 332-340 22

Algunas conclusiones (cont.)

• en general, es deseable disponer de conjuntos de datos


independientes (genes y morfología, loci no ligados, etc.)
• debemos recordar que las discordancias entre distintas clases de
datos pueden tener múltiples causas:

• ruido (homoplasia) en una o varias clases de datos

• discordancia superficial: todos los datos son compatibles


con un único árbol (aunque distintos conjuntos resulten en
árboles diferentes)
• historias diferentes para las distintas clases de datos
(árbol de genes versus árbol de especies, introgresión, etc.)

23

También podría gustarte