Guia de Estudio

Nucleótidos y aminoácidos

Transiciones y transversiones

¿Porqué hay un sesgo en la proporción de transiciones y transversiones?

Marcas de lectura

Sustituciones sinónimos y no-sinónimos

El complemento reverso de una secuencia

DNA en el núcleo, la mitocondria y el cloroplasto

El tamaño del genoma de la mitocondria y de un plastidio

Las funciones principales y los origenes evolutivos de la mitocondria y de los plastidios

DNA ribosomal

Evolución concertada, intercruzamiento desegual y conversión génica

Transferencia lateral de genes

Bases de datos de secuencias

Los nombres de los principales tres bases de datos de secuencias

Supermatrices

¿Cómo se elaboran las supermatrices?

¿Cuáles son algunas posibles desventajas / ventajas de las supermatrices?

Alineamiento

Como funciona "nucleotide BLAST"

Dado un alineamiento de dos secuencias, una matriz de "castigo" y un peso para "gaps", aplica el algoritmo de Needleman-Wunsch para calcular similitud.

BLOSUM62

Las similtudes y diferences entre los métodos de alineamiento múltiple CLUSTAL, MAFFT y MUSCLE

Métodos de distancia

Árboles aditivos

Árboles ultramétricos

UPGMA

Neighbor-joining

La relación entre Neighbor-joining y mínima evolución

Parsimonia

Parsimonia de Camin-Sokal, de Wagner y de Dollo

Como calcular una matriz de Manhattan con optimización de Fitch o con optimización de Farris

Como distinguir entre sinapomorfías, autapomorfías y plesiomorfías en un árbol

Monofilia, parafilia y polifilia

Como codificar mediante "simple indel coding" los indels en un alineamiento que presentan un patron muy sencillo

Métodos o criterios aceptados y descalificados de como asignar la raíz a un árbol filogenético

Matrices de costo

Compatibilidad y la prueba de compatibilidad

Las contribuciones a la inferencia filogenética de Felsenstein, Swofford, Farris, Wilson, etc.

ACCTRAN y DELTRAN

Inequidad del triángulo

Atracción de ramas largas

La zona de Felsenstein

La zona de Farris

Consistencia, eficiencia y robustez

Expresiones de verosimilitud para parsimonia

Ningun mecanismo en común

Búsquedas para árboles optimas

Branch-and-bound

Métodos de intercambio de rama

Las islas de árboles

El "Parsimony Ratchet"

Máxima verosimilitud

Definición

Matrices Q para los modelos GTR y JC

Longitudes de ramas como fuente de información

Suposiciones de verosimilitud para datos moleculares

Longitudes de ramas como fuente de información

El Modelo de Markov

Ventajas y desventajas comparada con parsimonia

La prueba de razón de verosimilitud

Inferencia bayesiana

Definición

previos

distribuciónes posteriores

probabilidad posterior

Garli

Relojes moleculares

Definición

Evidencia empírica para un reloj molecular

Relojes relajados

Relojes locales

BEAST

Pruebas de topologías de árboles

Definición

La Prueba de Templeton

La Prueba de Kishino-Hasegawa

La Prueba de Shimodaira-Hasegawa

La Prueba de SOWH

bootstrap paramétrico

árboles escogidos a priori

Ejemplo de unas preguntas

Verdadero o Falso, marca según corresponda. Si son falsas, explica el porqué.

V F Adenina y citosina son purinas.

V F Guanina, una purina, forma enlaces triples con citosina, una pirimidina.

V F Las copias del DNA ribosomal del núcleo mantienen similitud entre sí mediante la conversión génica y el sobrecruzamiento desigual.

V F Se usa PSI-BLAST para realizar búsquedas de proteinas altamente divergentes.

V F MAFFT divide aminoácidos en 6 grupos por polaridad y volumen y se convierte la secuencia de aminoácidos en una secuencia de vectores.

V F Las sustituciones sinónimas causan un cambio en la secuencia de amino ácidos en las proteínas.

V F Un árbol de mayoría combina en un árbol, aquellas ramas que aparecen repetidas en más de 50% de los árboles.

V F Una búsqueda heurística siempre encuentra todos los árboles más parsimoniosos.

V F La incorporación secuencial de los taxones “simple” agrega taxones según su orden en la matriz.

V F Una simplesiomorfía es un estado de carácter derivado compartido.

V F Al aumentar la homoplasia de caracteres sobre un árbol, aumenta el índice de consistencia.

V F Se puede usar la optimización de Fitch para análisis de secuencias de DNA.

V F Se recomienda una búsqueda exaustiva para un matriz de 15 taxones.

V F ACCTRAN favorece paralelismos; ubica transformaciones más cerca de la raíz.

V F Parsimonia de Camin-Sokal no permite caracteres multiestados.

V F El método de intercambio de rama, "nearest neighbor interchange" investiga más árboles que "subtree pruning regrafting".

V F Una isla consiste en todos los árboles que se obtiene por re-arreglar cada árbol de la misma isla mediante intercambio de ramas.

V F Para detectar islas múltiples se puede emplear réplicas de adición secuencial simple.

V F La matraca de parsimonia es un método eficaz para encontrar árboles más parsimoniosos.

V F "Fusión de Árboles" involucra intercambio de subárboles entre árboles diferentes.

V F Farris, Felsenstein y Goldman han intentado relacionar parsimonia a máxima verosimilitud.

V F Los métodos de inferencia filogenética eficientes requieren relativamente pocos datos para encontrar la respuesta correcta.

V F La zona de Farris se refiere a cuando hay especies hermanas con ramas largas.

V F La adición secuencial us una manera codiciosa de buscar y puede quedar en un mínimo local.

V F La adición secuencial "simple" agrega los taxa según su orden en la matriz.

V F Igual como el problema de "Shortest Hamiltonian Path", las búsquedas para árboles bajo parsimonia son NP-hard.

V F El método de compatibilidad busca el árbol consistente con el mayor número de caracteres.

V F La matriz “Zilla” se refiere a un matriz de 500 secuencias de mitocondria para plantas.

V F La prueba de heterogeneidad de particiones (PHT) fue propuesta por Farris.

V F UPGMA es un método de distancias que usa un criterio de optimización.

V F Neighbor joining es un método de distancias que usa un algoritmo de agrupamiento.

V F Los árboles ultraméticos suponen una tasa de evolución constante.

V F UPGMA falla cuando los datos moleculares se aproximan a un reloj.

V F Neighbor joining genera un árbol empezando con un árbol estrella.

V F Los métodos de distancia como neighbor joining son más lentos que parsimonia y máxima verosimilitud.

V F Al transformar una matriz de caracteres a un matriz de distancias hay una pérdida de información.

V F Según Felsenstein, UPGMA es susceptible al problema de atracción de ramas cortas.

V F Bajo un modelo de Markov, la probabilidad de cambio entre dos estados no depende de estados anteriores.

V F La prueba de Kishino y Hasegawa es apropiada para comparar dos árboles escogidos a priori.

V F Alpha (α) es el parámetro de forma para la distribución Gamma (γ).

V F Se usa un bootstrap paramétrico en la prueba de SOWH.

V F Un ejemplo de un previo es un proceso de nacimiento y muerte.

 

 

2. Ilustra un árbol y reconstrucción de estados que viola las suposiciones de parsimonia de Dollo.

3. Explica porque un carácter puede tener un índice de consistenciá relativemente bajo mientras su índice de retención es relativamente elevado.

4. Explica qué son las islas de árboles, y menciona dos estrategias para escapar de las islas durante búsquedas heurísticas.

5. Menciona tres métodos de intercambio de rama, y cual de los tres considera menos posibilidades por árbol evaluado.

6. Explica como funciona el "Parsimony Ratchet" de Nixon (1999).

7. Considera la siguiente matriz:

taxón Caracteres

0 1 2 3 4 5 6 7 8


A T A G C A T A A

B C A A G C T A A

C T C G G C T A T

D T C G C A A A T

E C A A C A T A A


Indica 1) cuales sitios son variables, 2) cuales son informativos y 3) cuales son transiciones.

Dibuja el árbol (((D,C),A),(B,E)).

Mapea los caracteres 1 a 8 sobre el árbol.

Menciona la relevancia de los modelos de sustitución para la inferencia filogenética. ¿Cúales métodos de inferencia usan tales modelos? ¿Por qué no se debe siempre escoger el modelo con el mayor número de parámetros?

Explica la diferencia entre la distancia observada y la distancia esperada. Incluye un diagrama.

Indica cuales son homoplásicos. Indica el índice de consistencia para cada carácter.

Menciona dos pruebas de verosimilitud apropriadas para comparar un árbol de máxima verosimilitud con un árbol elegido a priori o a posteriori. ¿Cuáles son las similitudes y diferencias entre las dos pruebas?

Explica los pasos que se llevan a cabo en el algoritmo Metropolis-Hastings MCMC.