BLAST

Carolina Brunner y David Gernandt 2014

BLAST es un acrónimo de Basic Local Alignment Search Tool, un programa escrito por S.F. Altschul et al. Usa un algoritmo heurístico de comparación de secuencias. Funciona encontrando regiones de similitud local entre secuencias, al comparar las secuencias de nucleótidos o proteínas con la base de datos del Genbank, y calcula la significancia estadística de la similitud entre pares de secuencias. Puede utilizarse para inferir las relaciones funcionales y evolutivas entre secuencias, además de ayudar a identificar a los miembros de las familias de genes.
 
 
1. Visita la página http://blast.ncbi.nlm.nih.gov/Blast.cgi y revisa la información disponible en la página principal. Existen diferentes programas de BLAST como Delta BLAST (una búsqueda sensible de proteína-proteína), BLAST Assembled RefSeq Genomes, Basic BLAST y Specialized BLAST.
 
Además en la pagina principal de BLAST encontraras una lista de especies de las que ya se cuenta con su genoma completo como: Arabidopsis thaliana, Apis mellifera, Homo sapiens, Ustilago maydis, Trypanosoma brucei.
 
 
2. Comenzaremos con Basic BLAST-> "nucleotide blast", que hace una búsqueda en una base de datos de nucleótidos con una consulta inicial de nucleótidos. 
 
3. Al dar click en nucleotide blast, aparece una nueva ventana. En el espacio en blanco puedes elegir una de las siguientes opciones que se ajuste mas a tus necesidades para el análisis con BLAST:
A. Ingresa el numero de acceso de la secuencia (e.g., DQ463994).
B. Copia y pega la secuencia de interés (e.g., AAGATTGGCGGTATT, o una secuencia más larga).
C. Sube el archivo donde se encuentre tu secuencia (e.g., secuencia.fasta).
 
4. Elige la base de datos que usaras para el BLAST, en este caso “Nucleotide collection (nr/nt)”.
 
5. Existen varias opciones para refinar la búsqueda. Puedes incluir o excluir un organismo en tu búsqueda o excluir secuencias de muestras ambientales u organismos modelos, así como limitar tu búsqueda aun mas usando la opción de Entrez Query.
 
6. Para la selección de la búsqueda que vas a utilizar, puedes utilizar diversos programas, ya sea para comparar secuencias alta o ligeramente similares (megablast y blastn) o secuencias divergentes (discontiguous megablast). En este caso elegiremos megablast (la opción por defecto).
 
 
7. Antes de dar click en BLAST, da click en “Algorithm parameters” y se despliegan mas opciones: “General Parameters”; “Scoring Parameters” y “Filters and Masking”. Revisa todas las opciones. 
 
8. En la parte superior de "Algorithm parameters", se puede modificar el número máximo de secuencias que quieres que sean mostradas. Aumenta el valor de 100 a 200.
 
9. Da click en el botón “BLAST”. Puede tardar varios minutes en reportar la consulta.
 
10. Aparecerá en una nueva ventana con los resultados de la búsqueda. En la parte superior  puedes ver que se generó un numero de tu búsqueda, con la descripción, tipo de molécula (e.g., DNA), longitud de la secuencia tomada para la consulta y en que base de datos se utilizó. El resumen de los resultados “Graphic Summary”, muestra el alineamiento de las secuencias de la base de datos con la secuencia de búsqueda inicial. Los alineamientos están codificados por color, dependiendo de la puntuación del alineamiento.
 
Al mover más abajo en la misma página, aparece una descripción de las secuencias que produjeron un alineamiento significativo. Reporta ligas a secuencias en GenBank e indica el nombre del organismo, cepa, la región molecular, etc. En las columnas al lado derecho reporta varias estadísticas, entre ellas, E value, el cual es el valor esperado que representa el numero de diferentes alineamientos, entre mas bajo sea el valor mas significativos son las puntuaciones y el alineamiento. La columna de identidad representa el porcentaje de similitud con tu secuencia, esto es un primer indicador de homología.
 
Al mover aún más abajo se encuentra la sección de alineamientos. Puedes ver inserciones/deleciones (“indels”), sustituciones , etc. En este caso es un indel. Revisa si ambas hebras  son plus/plus, en caso de que sea plus/minus indica que una de las secuencias  tiene el sentido invertido.
 
11. Para guardar las secuencias de tu búsqueda, regresemos a la sección de resultados “Descriptions”, y marca las casillas que aparecen del lado izquierdo de las secuencias de interés, o selecciona todas en un solo click, en la parte superior “Select All”.
 
12. En la parte superior izquierda se encuentra una pestaña “Download”, da click y se despliegan opciones de los diferentes formatos en los que puedes guardar tus secuencias, si solo te interesa la region que dio un resultado significativo en BLAST elige “FASTA (aligned sequences)”. En nuestro caso elegiremos “FASTA (complete sequence)" y da click en el botón “Continue”.
 
 
13. Dependiendo de la configuración de tu ordenador la descarga se guardará automáticamente en descargas o aparecerá una ventana para que guardes el archivo generado, titúlalo y elige su ubicación. Da click en el botón “Guardar”.
 
14. Puedes abrir tu archivo en un programa editor de texto TextWrangler o NotePad++ o en un programa de alineamiento de secuencias como: Mesquite o BioEdit.