PAUP-Búsquedas

Hayasaka, K., T. Gojobori, and S. Horai. 1988. Molecular phylogeny and evolution of primate mitochondrial DNA. Mol. Biol. Evol. 5:626-644.

Swofford, D. L. 2003. PAUP*. Phylogenetic Analysis Using Parsimony (*and Other Methods). Version 4. Sinauer Associates, Sunderland, Massachusetts.

Búsquedas exactas, análisis de caracteres y árboles

PAUP* es uno de los programas más usadas para la inferencia filogenética. Hay versiones Beta disponibles para Mac, Unix, DOS y Windows. Es una muy buena opción para realizar análisis de parsimonia, de distancia y de máxima verosimilitud. Es relativamente estable, amigable, flexible y cuenta con buena documentación. Sin embargo, las licencias individuales del programa, disponibles a través de Sinauer, cuestan entre $85 y $150 USD. Nuevas versiones de PAUP estarán disponibles pronto y una será gratuita.

Para este ejercicio vamos a investigar las relaciones entre los primates mediante el programa PAUP* 4b10 para PC. Al final, usaremos FigTree para convertir los árboles en figuras.

1. Coloca el archivo "primate-mtDNA-interleaved.nex" en la carpeta "C:\Phylogenetics\PAUP\".

2. Abre PAUP*, y dentro del programa, elegir "File->Open". Verás una ventana típica de Windows que cuenta con dos casillas en la parte inferior que te permiten usar los modos de apertura "Execute" o "Edit".  Para ver el contenido del archivo, selecciona la casilla "Edit" y abre el archivo "primate-mtDNA-interleaved.nex".

3. Al abrir el archivo en modo "Edit" verás el archivo nexus que analizaremos hoy. La primera línea del archivo es "#NEXUS", la cual indica el formato del archivo. Posteriormente hay un bloque de taxones (que empieza con "begin taxa") seguido por un bloque de caracteres (que empieza con "begin characters"). Todas las líneas de instrucciones terminan con un ";". El siguiente bloque empieza con "matrix" y incluye la matriz de caracteres, en este caso un alineamiento de DNA mitocondrial para 12 especies de primates. El número de taxones y caracteres en esta matriz tiene que corresponder con los variables "ntax" y "nchar" en los bloques anteriores o PAUP* indicará un error al ejecutarse. El final de la matriz de caracteres está indicado por dos líneas: ";" y "end;". El siguiente bloque es para suposiciones "begin assumptions;" y indica el punto de inicio y terminación de dos regiones codificantes, y un espaciador, y dentro de la región codificante, la primera, segunda y tercera posición del codón. También hay dos matrices de paso que aplican pesos diferentes para transiciones y transversiones, y se especifica un variable "hominoids" que corresponde a Homo, Pan Gorilla, Pongo y Hylobates. La matriz termina con un bloque de paup "begin paup;" que en este caso sólo indica un par de restricciones topológicas.

4. Al revisar el archivo de nexus, se puede ejecutarlo mediante el comando "Ctrl+R". Esto debe seleccionar una segunda ventana, la ventana de visualización "Display".

Para ver los comandos principales en PAUP*, teclea "help". Revisa los comandos y trata de adivinar lo que hacen. Para más información sobre como usar el software, puedes bajar y revisar el manual de PAUP*.

5. Teclea "log file=primates-búsquedas-exactas.txt".

6. Antes de realizar la búsqueda, es una buena idea confirmar que la matriz activa es la correcta. Teclea "showm" para ver la matriz.

7. También se puede revisar la composición de bases en las matrices de DNA. Teclea "basef". ¿Cuál base está en menor frecuencia?

8. Para realizar una búsqueda exacta pero no exhaustiva, teclea "bandb". Debes observar que abre una nueva ventana pequeña que indica el avance de la búsqueda. También en la ventana "Display" se reporta el número de caracteres, el número de caracteres variables no-informativos, y el número de caracteres informativos para parsimonia (una peculariadad de parsimonia es que las autapomorfías no se toman en cuenta para estimar el mejor árbol--solo se toma en cuenta las sinapomorfías). Al terminar el análisis PAUP*, la ventana indica el número de árboles encontrados y su longitud en número de pasos. Cuándo termina dar clic en "Close".

9. Para designar el grupo externo, teclea "outgroup Lemur_catta Tarsius_syrichta".

10. Aún no se ve el árbol. El comando para ver uno de los árboles óptimos es "des"; sin embargo, normalmente uno también quiere especificar el tipo de árbol y como se debe de enraizar (los análisis de parsimonia por lo general generan árboles no enraizados). Para visualizar una filograma enraizado con el grupo externo teclea "des/plot=phylo root=outgroup outroot=monophyl".

¿Cómo están relacionados Homo, Pan y Gorila?

11. Para visualizar el segundo AMP, teclea "des 2 /tcompress". ¿Cómo cambia el segundo árbol? ¿Qué efecto tiene incluir la opción "tcompress"?

12. Teclea "set ?" y revisar las opciones.

13. Teclea "set to=right" y para ver el efecto de esta opción, teclea "des".

14. Teclea "set to=left" seguido por "des". ¿Cómo cambia el árbol?

15. Teclea "des ?" y revisar las opciones.

16. Para mapear los caracteres sobre el árbol, teclea "des 1 /apo".

17. Para ver los índices para cada carácter variable (y para dejar de ver el mapeo caracteres), teclea "des /diagnose apo=no". ¿Cuál es el índice de consistencia para un carácter variable pero no-informativo, y cuál es el valor reportado para el índice de retención?

18. Para desactivar la visualización de los índices, teclea "des /diagnose=no".

19. Para ver el árbol de consenso estricto, teclea "cont".

20. Para también ver el árbol de mayoría, teclea "cont /maj". Confirma que los valores en la tabla de biparticiones corresponde a los valores de porcentaje en el árbol de mayoría.

21. Para guardar los AMPs con longitudes de rama en un archivo en formato Newick, teclea "savetrees /brlens file=primatesp.tre".

22. Para guardar el árbol de consenso estricto y de mayoría, teclea "cont /maj file=primatesc.tre".

23. El otro tipo de búsqueda exacta es una búsqueda exhaustiva. Por evaluar todos los árboles posibles, esta búsqueda está muy limitada en el número de taxa que puede evaluar. La matriz actual cuenta con 12 taxa. Teclea "allt" para ver si es posible concluir este tipo de búsqueda en la matriz de primates. Observa los resultados.

24. Teclea "log stop". Acabamos de ejecutar un archivo nexus, resumir la frecuencia de bases, realizar una búsqueda exacta y descubrir la longitud y número de árboles óptimos, y guardar todos los árboles óptimos y el árbol de consenso estricto como archivos de formato newick. Todo esto se puede hacer de una manera más automática mediante un archivo "batch".

25. Teclea "quit".

26. Abre los archivos Newick en FigTree. Explora las opciones del programa, incluso como cambiar el orden de taxa, como ver los diferentes árboles y como exportarlos como un archivo gráfico.

27. Cierra los programas, limpia el escritorio y apaga la computadora.