MAFFT

En este laboratorio vas a bajar los resultados de una búsqueda en Blast y realizar una alineamiento en una versión en linea de MAFFT.

Katoh K., Kuma K., Toh H. and T. Miyata. 2005. MAFFT version 5: improvement in accuracy of multiple sequence alignment, Nucleic Acids Research 33: 511-518.

1. Visita la página http://blast.ncbi.nlm.nih.gov/Blast.cgi

2. Da clic en “Nucleotide BLAST”

3. Teclea el número de GenBank "KC157385" en la ventana "Enter accession number, gi, or FASTA sequence". Otra manera de llevar a cabo una búsqueda es pegar una secuencia en la misma ventana.

4. Para "Database" selecciona "Nucleotide collection".

5. Da clic en: "BLAST" y espera los resultados. ¿Cuál género aparece entre los resultados?

6. En la sección de "Descriptions" da clic en: "Genbank" y esperar que abre una nueva página con las primeras 20 secuencias.

7. Selecciona "Display settings", "Format Fasta" y "Items per page 50". Da clic en "Apply".

8. Espera mientras la página reformatea. Selecciona "Send File". Se quieres convertir los nombres de cada secuencia a número de GenBank más género y especie, selecciona "Format TinySeq XML". Si no quieres convertir los nombres, selecciona "FASTA" (o "GenBank", etc.). Da clic en "Create File".

9. Mueve el archivo "sequence.fasta.xml" a tu carpeta de "Phylogenetics".

10. Confirma que tienes en la misma carpeta el perl script xml_to_fasta_gb_genero_epiteto.pl.

11. Mediante "Símbolo de sistema" (PC) o "Terminal" (Mac) puedes realizar el cambio de nombre de los archivos. Una manera es abrir el programa y navegar a la misma carpeta donde están las secuencias y el script (pista, con "cd" y el nómbre de la carpeta). Teclea "perl xml_to_fasta_gb_genero_epiteto.pl" y seguir las instrucciones. Puedes guardar el archivo final como "Pinos.fas".

12. Puedes revisar el archivo en un editor de texto y realizar más modificaciones del nombre de cada secuencia mediante "buscar y reemplazar".

13. Visita la página http://align.bmr.kyushu-u.ac.jp/mafft/online/server/

14. Selecciona "Examinar" y carga el archivo en el escritorio "Pinos.fas".

15. ¿Cuál método se usa MAFFT por defecto? Para pedir que MAFFT usa un método iterativo en lugar de progresivo, selecciona "FFT-NS-i".

16. ¿Cuál "scoring matrix" se usa MAFFT por default para nucleótidos?

17. Da clic en "Submit".

18. Revisa las opciones y notar que hay forma de convertir el alineamiento en otros formatos de archivos. Da clic en “Fasta format”. Debe de abrir una nueva ventana con las secuencias en formato fasta.

19. Puedes guardar la página como un documento de texto desde el browser (e.g. "File" y "Save Page As..". Si no te gusta el resultado, puedes seleccionar todo el texto en la ventana, copiarlo, pegarlo en un editor de texto y guardarlo. 

20. Si guardaste el archivo directamente desde el browser, cambiar el nombre del archivo a "Pinos-MAFFT.fas".

21. Abre el archivo con Mesquite. Recuerda que tienes que indicar a Mesquite que es un archivo fasta para DNA/RNA.

22. ¿Qué es la longitud total del alineamiento?

23. Puedes además alinear las secuencias en Muscle. ¿Cómo compara el alineamiento con los dos realizados en Muscle?

24. Regresa a la página de MAFFT con el alineamiento en formato CLUSTAL.

25. Da clic en: "Tree".

26. Selecciona "Average linkage (UPGMA)".

27. Da clic en: "Go". Tal vez tendrás que descargar e instalar un plug-in para poder ver el resultado.

28. Da clic en: "Launch the Archaeopterix applet". Si no funciona, hay que actualizar la versión de Java en la computadora.

29. Cambia la fuente y explora las opciones.

30. ¿Las especies forman grupos monofiléticos?