garli-Ejercicio

Zwickl D.J. 2006. Genetic algorithm approaches for the phylogenetic analysis of large biological sequence datasets under the maximum likelihood criterion: The University of Texas at Austin.

Matriz de ejemplo: primate-interleave.nex.

Hayasaka, K., T. Gojobori, and S. Horai. 1988. Molecular phylogeny and evolution of primate mitochondrial DNA. Mol. Biol. Evol. 5:626-644.

Máxima verosimilitud con garli

GARLI (Genetic Algorithm for Rapid Likelihood Inference) permite realizar análisis de máxima verosimilitud bajo modelos de sustitución de nucleótidos, de aminoácidos (Dayhoff, Jones, Wag, mtRev, mtmam) y de codones (equal, F1x4, f3x4, observed).
 
1. Abre el archivo "primate-mtDNA-interleaved.nex" con un editor de texto como "TextWrangler" o "Notepad++". Revisa la información al final del archivo sobre los caracteres. Están designado conjuntos de caracteres como "coding", "noncoding", "1stpos", etc.
 
2. En un ejercicio anterior, aplicamos la prueba de AIC en jModelTest para elegir el mejor modelo para una esquema de particionamiento que escogimos a priori. Una esquema consistió en dividir los sitios entre lentos y rápidos. Puedes consultar los resultados aquí. Sin embargo, cuando aplicamos la prueba de AIC en PartitionFinder, descubrimos que es mejor dividir el alineamiento en cuatro subconjuntos.
 
Agrega una línea "charpartition" siguiendo este formato:
 
charset noncoding = 1 458-659 897-898;
charset 1stpos = 2-457\3 660-896\3;
charset 2ndpos = 3-457\3 661-896\3;
charset 3rdpos = 4-457\3 662-.\3; 
charpartition 4models = model1:noncoding, model2:1stpos, model3:2ndpos, model4:3rdpos;
 
3. Guarda "primate-mtDNA-4models.nex" en la misma carpeta de la computadora con el archivo de programa de Garli-2.0 (p. ej., en la carpeta garli2.0-Win/bin).
 
4. Se requiere un archivo de configuración "garli.conf" para cada nueva análisis. En este caso, hay un molde para aplicar una esquema de particionamiento dentro de la carpeta de "example/partition/exampleRuns/3parts.diffModelTypes". Abra el archivo en un editor de texto y revísalo.
 
5. También abre el archivo "garli.3diffModels.smallData.conf" y revísalo. También debes revisar la información sobre el uso de particiones en el sitio de garli.
 
6. En este archivo, cambia "datafname = YOURDATAFILE.nex" a "datafname = primate-mtDNA-4models.nex". También cambia "ofprefix = 3diffModels" a "ofprefix = primate-mtDNA-4diffModels".
 
7. Si quieres generar un archivo con las verosimilitudes por sitio, puedes cambiar "outputsitelikelihoods = 0" a "outputsitelikelihoods = 1".
 
8. Para aplicar uno de los 14 modelos evaluados en jModelTest hay que designar "ratematrix" y "statefrequencies" en cada bloque. At también aplicar o no G, I, o G+I para cada uno, el número de modelos suma a 56.
 
Las instrucciones para aplicar modelos según el sitio de red de garli:
 
Modelo ratematrix statefrequencies
JC 1rate equal
F81 1rate estimate
K80 2rate equal
HKY 2rate estimate
TrNef (0 1 0 0 2 0) equal
TrN (0 1 0 0 2 0) estimate
K3P (= K81) (0 1 2 2 1 0) equal
K3Puf (= K81uf) (0 1 2 2 1 0) estimate
TIMef (0 1 2 2 3 0) equal
TIM (0 1 2 2 3 0) estimate
TVMef (0 1 2 3 1 4) equal
TVM
(0 1 2 3 1 4) estimate
SYM
6rate equal
GTR
6rate estimate
 
9. Para aplicar el modelo GTR+G para el subconjunto "noncoding", en el bloque que corresponde a "[model1]" en la línea "ratematrix", cambia el modelo actual a "6rate". Confirma que "ratehetmodel = gamma" "invariant sites = none" a "invariant sites = estimate".
 
[model1]
datatype = nucleotide
ratematrix = 6rate
statefrequencies = estimate
ratehetmodel = gamma
numratecats = 4
invariantsites = none
 
 
10. Para aplicar el modelo HKY+G en el segundo bloque ("[model2]") para el subconjunto "1stpos", modifica el bloque así:
 
[model2]
datatype = nucleotide
ratematrix = 2rate
statefrequencies = estimate
ratehetmodel = gamma
numratecats = 4
invariantsites = none
 
 
11. Para aplicar el modelo TVM+I en el tercer bloque ("[model3]") para el subconjunto "2ndpos":
 
[model3]
datatype = nucleotide
ratematrix = (0 1 2 3 1 4)
statefrequencies = estimate
ratehetmodel = none
numratecats = 1
invariantsites = estimate
 
 
12. Para aplicar el modelo TrN+G en el cuarto bloque ("[model4]") para el subconjunto "3rdpos", agrega un cuarto bloque:
 
[model4]
datatype = nucleotide
ratematrix = (0 1 0 0 2 0)
statefrequencies = estimate
ratehetmodel = gamma
numratecats = 4
invariantsites = none
 
 
13. Guarda el archivo bajo el nombre "garli.conf" en garli2.0-Win/bin.
 
14. Haz doble clic en Garli.exe. Revisa la información que sale en la pantalla.
 
15. Cuando termine el análisis, revisa si las diferentes réplicas encontraron árboles diferentes. Usa FigTree para abrir el archivo "primate-mtDNA-4diffModels.best.all.tre".  
 
16. El mejor árbol de los 5 réplicas se encuentra en el archivo "primate-mtDNA-4diffModels.best.all.tre". ¿Cómo compara el mejor árbol con el árbol que se encuentra con parsimonia o con neighbor-joining?
 
17. Cierra los programas, limpia el escritorio y apaga la computadora.