PAUP-Ejercicio 7

Swofford, D. L. 2003. PAUP*. Phylogenetic Analysis Using Parsimony (*and Other Methods). Version 4. Sinauer Associates, Sunderland, Massachusetts.

PAUP es uno de los programas más usadas para la inferencia filogenética. Hay versiones Beta disponibles para Mac, Unix, DOS y Windows. PAUP es una muy buena opción para realizar análisis de parsimonia, de distancia y de máxima verosimilitud. Es relativamente estable, amigable, flexible y cuenta con buena documentación. Sin embargo, las licencias individuales del programa cuestan entre $85 y $150 USD. Parece que una nueva versión de PAUP estará disponible pronto y será gratuita. Por mientras, existen programas más rápidos y gratuitos para realizar búsquedas heurísticas con parsimonia (TnT) y con máxima verosimilitud (GARLI y RaxML).

En este ejercicio vamos a ocupar una alineación de secuencias que fue depositada en TreeBase. Posteriormente probaremos dos búsquedas heurísticas. Al final, usaremos FigTree para convertir los árboles en figuras.

1. Revisa el archivo M3675 y guardalo sobre tu escritorio.

2. Abre un shell en Unix y abre PAUP.

3. Teclea "exe M3675.txt".

Pregunta 1. ¿Cuántos taxa tiene la matriz y cuántos caracteres?

4. PAUP debe preguntar sí se quiere remover la raíz del árbol, teclea "N" (y da "enter").

5. Para ver un listado de comandos disponibles en PAUP, teclea "?". Se despliega un listado de los comandos básicos de PAUP. Entre ellos, hay comandos para revisar la matriz, exportar a otros formatos, calcular matrices de distancias, realizar búsquedas con parsimonia y máxima verosimilitud, calcular árboles de consenso, calcular árboles de distancia (p. ej. UPGMA, NJ, ME y LS), realizar análisis de bootstrap y jackknife y probar la homogeneidad de una matriz que tiene más de una partición.

6. Muchos de los comandos tienen más opciones. Por ejemplo, para ver como funciona el comando "dset" teclea "dset ?". El signo de interrogación indica que PAUP debe proporcionar las opciones asociadas con el comando. En el caso de "dset", el calculo por default es "P-distance"(distancias sin correcciones para sustituciones sobreimpuestas), pero existen otras opciones como "ABS" (el número absoluto de diferencias entre dos taxa) y "JC" (Jukes-Cantor).

7. Ahora para analizar la matriz, es recomendable mantener un archivo que guarde todos los pasos del análisis. Teclea "log file=Pinaceae.txt".

8. Puedes desplegar toda la matriz (por ejemplo, para revisar la alineación). Teclea "showm".

9. Para ver una matriz de distances-P en pares, teclea "showdist".

10. Teclea "dset /distance=abs".

11. Vuelve a teclear "showdist". Ahora la matriz de distancias tiene el número absoluto de cambios entre pares de taxa.

12. Para realizar una búsqueda heurística, teclea "hs". Debes recibir un aviso que PAUP encontró el número máximo de árboles permitidos bajo las opciones actuales, y si quieres subir el número de árboles guardados ("maxtrees"). Teclea "N" y espera que termina la búsqueda.

Pregunta 2. ¿Cuál tipo de secuencia de adición, y cuál tipo de intercambio de ramas, son los defaults en PAUP?

Pregunta 3. ¿Cuántos árboles fueron encontrados?

Pregunta 4. ¿Cuántos pasos tuvieron los árboles más parsimoniosos (AMPs)?

13. Ahora para intentar una búsqueda más cuidosa. Teclea "set maxtrees=10000 increase=no".

14. Teclea "hs addseq=rand nreps=500".

Pregunta 5. ¿Cambió la longitud de los AMPs encontrados?¿Hay un reporte sobre el número de islas que fueron encontradas?

15. Teclea "hs /addseq=rand nreps=5000 nchuck=10 chuckscore=1". Este método está recomendado en la página de ayuda de PAUP para realizar búsquedas en matrices con muchos taxa que frecuentemente alcanzan el número máximo de árboles guardados.

Pregunta 6.  ¿Cuántos AMPs fueron encontrados? Compara el número de AMPs y islas reportadas en tu análisis con los número de tus compañeros.

16. Teclea "des /plot=phylo". Se despliega el primer árbol más parsimonioso encontrado en la búsqueda anterior.

Pregunta 7. ¿Qué valor tiene el índice de consistencia y el índice de retención?

17. Actualmente el árbol está enraizado con Tsuga_canadiensis, el primer taxón en la matriz y un miembro de Pinaceae. Queremos enraizar el árbol con el grupo externo. La matriz cuenta con seis grupos externos, cinco provienen de otras familias de coníferas, y uno, Ginkgo biloba, se considera con base en información previa que no es una conífera. Teclea "outgroup 'Ginkgo_biloba'". Hay que incluir comillas sencillas (') antes y después del nombre del taxón porque la matriz proveniente de TreeBase las usa aunque no aparecen con los nombres en la pantalla de PAUP.

18. Para ver el árbol enraizado, teclea "des /root=outgroup". Examina la longitud de la rama para Cedrus_deodora.

19. Para guardar el árbol en formato Newick y conservar la longitud de ramas, teclea "savetrees /brlens file=Pinaceaep.tre".

20. Para desplegar y guardar el árbol de consenso estricto, teclea "cont /file=Pinaceaec.tre". Los AMPs y el árbol de consenso estricto pueden ser revisados en un editor de texto. En un paso posterior verémos los árboles en un programa gráfico.

Pregunta 8. ¿Cuántos árboles se tomaron en cuenta para generar el árbol de consenso estricto?

21. La manera más popular para estimar el apoyo de las ramas es mediante el bootstrap. El número de réplicas por default en PAUP es 100. Sin embargo, para publicaciones es muy común aumentar el número a valores como 1000 o 10,000. El bootstrap puede ser muy tardado para matrices con muchos taxa. Para el fin de este ejemplo, realizaremos un bootstrap de solo 100 réplicas y vamos a poner un límite en el número de árboles guardados por réplica. Para limitar el número de árboles guardados por réplica, teclea "set maxtrees=100 increase=no".

22. Teclea "bo nreps=100 /addseq=rand nreps=10 nchuck=100 chuckscore=1". El análisis puede tardar unos minutos. Al terminar, se despliega un árbol de consenso de mayoría. Los valores sobre las ramas son los valores bootstrap. Sólo aparecen las ramas presentes en 50% o más de las réplicas de bootstrap, y por eso se puede apreciar valores de bootstrap de 50% y por arriba. Abajo del árbol es tiene un resumen de las frecuencias de aparición de clados. En el parte superior hay un listado de los taxa (indicados con número según su orden en la matriz) seguido por la frecuencia y porcentaje de apoyo bootstrap. Esta tabla muestra todas las biparticiones que aparecen en uno o más árboles de bootstrap.

23. Por lo general no se usa el árbol de bootstrap para elaborar figuras. Los valores de bootstrap pueden ser transferidos a otro árbol, como uno de los AMPs o un árbol de consenso estricto. Sin embargo, se puede guardar el árbol de bootstrap junto con los valores de 50% o superior. Teclea "savetrees /file=Pinaceaebo.tre from=1 to=1". Ten cuidado--este método también guarda valores de bootstrap de 100% para las ramas terminales, lo cual no tiene ningún sentido.

24. Si te interesa, puedes comparar los resultados de parsimonia con un árbol de neighbor-joining. Teclea "dset distance=jc".

25. Teclea "NJ". Se despliega un árbol. Compara la diferencia en las longitudes de rama (p. ej. para Cedrus).

26. Teclea "savetrees /blrens file=Pinaceaenj.tre".

27. Teclea "log=stop".

28. Para generar árboles para presentaciones o para publicaciones, abre los archivo "*.tre" con uno u otro de los programas gratuitos, TreeView o FigTree. Abre FigTree (o TreeView) y revisa los árboles de parsimonia y de distancia. Los árboles en estos programas pueden ser exportados para elaborar figuras o presentaciones.

29. Cierra los programas. Por supuesto, el manual de PAUP incluye mucha más información pertinente a los análisis posibles con el software.