PartitionFinder

PartitionFinder
v1.1.1
Lanfear, R., B. Calcott, S.Y.W. Ho, and S. Guindon. 2012. PartitionFinder: combined selection of partitioning schemes and substitution models for phylogenetic analyses. Molecular Biology and Evolution 29: 1695–1701.
 
1. PartitionFinder es muy eficaz en elegir una esquema de particionamiento cuando piensas que tienes heterogeneidad en el proceso de sustitución entre diferentes sitios en un alineamiento. Esto puede ocurrir con secuencias de DNA cuando tu alineamiento incluye una región codificante, porque en este caso, la primera, segunda y tercera posición del codon comúnmente sufren diferentes tasas de sustitución (por ejemplo, debido a selección natural en los cambios no-sinónimos. También se puede aplicar diferentes modelos a genes no ligados, espaciadores y intrones.
 
2. Visita el sitio de PartitionFinder (http://www.robertlanfear.com/partitionfinder/). Baja la versión para tu sistema operativa y descomprimir el archivo.
 
3. Coloca la carpeta con el programa y otros archivos en la carpeta "Phylogenetics"
 
4. Usarás la línea de comando del sistema operativo. (Abra el programa "Símbolo de sistema" si tienes PC, o Terminal si tienes Mac.) Para verificar que tu computadora tiene instalada Python v. 2.7 (http://www.python.org/) y está incluido en tu PATH, teclea "python -V" en la línea de comando. Si devuelve "Python 2.7.5", tienes una versión adecuada para PartitionFinder. Si devuelve una versión que no es 2.7, hay que visitar la página de python y instalar la versión correcta.
 
5. Para este ejercicio, necesitas convertir el archivo de ejemplo: primate-mtDNA-interleave.nex de formato NEXUS a Phylip. Hay varias maneras de hacerlo. Por ejemplo, puedes abrir el archivo en Mesquite y exportarlo como Phylip. Otra manera es usar Geneious (http://www.geneious.com/).
 
6. Dentro de la carpeta de PartitionFinder crea una carpeta /runs/primates y coloca el archivo "primate-mtDNA-interleave.phy" adentro.
 
7. Hay que copiar y modificar un archivo de configuración existente para adecuarlo para este análisis. Copia el archivo examples/nucleotide/partition_finder.cgi a la misma carpeta "primates" junto con el alineamiento en formato Phylip.
 
8. Usa tu editor de texto (TextWrangler o Notepad++) para abrir el archivo dentro de la carpeta "primates" "partition_finder.cgi". Vamos a realizar tres modificaciones al archivo.
 
9. Modifica la línea 2 para indicar el nombre del archivo que queremos usar "alignment = primate-mtDNA-interleave.phy;" 
 
10. Queremos aplicar la prueba AIC en 56 modelos de sustitución de nucleótido para posteriormente llevar a cabo un análisis en máxima verosimilitud. Cambia el modelo en línea 12 a "model_selection = AIC".
 
11. En el archivo original de primate-mtDNA-interleave.nex (la versión incluida con PAUP*), hay un bloque de suposiciones que divide el alineamiento en bloques de datos:
 
begin assumptions;
charset coding = 2-457 660-896;
charset noncoding = 1 458-659 897-898;
charset 1stpos = 2-457\3 660-896\3;
charset 2ndpos = 3-457\3 661-896\3;
charset 3rdpos = 4-457\3 662-.\3; 
 
En este bloque, la primera línea "charset coding" se refiere a los mismos subjuegos "1stpos", "2ndpos" y "3rdpos". 
Queremos dividir la matriz en posiciones de codon, entonces no se requiere usar el subjuego "coding". Lo puedes borrar, o marcarlo con signos de comentario "## ". También hay que borrar "charset". El bloque final que se quiere incluir en el archivo de configuración es:
 
noncoding = 1 458-659 897-898;
1stpos = 2-457\3 660-896\3;
2ndpos = 3-457\3 661-896\3;
3rdpos = 4-457\3 662-896\3;
 
(También cambié "662-.\3" a "662-896\3 para "3rdpos").
 
12. Guarda el archivo de partition_finder.cgi. Debe de estar la versión modificada dentro de la matriz "primates" junto con "primate-mtDNA-interleave.phy".
 
13. Desde la línea de comando del sistema operativo, cambia al directorio "PartitionFinder" y teclea "python PartitionFinder.py primates/primate-mtDNA-interleaved.phy".
 
14. Espera los resultados del análisis. Una vez que termina, revisa los archivos que se produce en la carpeta "primates/results". ¿Qué método usó para generar el árbol de verosimilitud? El número óptimo de particiones bajo AIC es cuatro: noncoding GTR+G, 1stpos HKY+G, 2ndpos TVM+I, y 3rdpos TrN+G. Vamos a aplicar esta esquema de particionamiento en Garli. Si quieres, puedes comprobar que para este alineamiento, el número óptimo de particiones bajo BIC es diferente comparado con AIC.