Ensamblaje de Genomas

Ensamblar y extraer los genomas

El documento presenta 2 genomas bacterianos que corresponden a Bacillus thuringiensis y Streptomyces.sp. Se seleccionaron del grupo de 10 bacterias utilizadas para crear la comunidad artificial, que fue analizada en la primera parte de está guía. De esta manera, se podrá comparar la calidad del genoma secuenciado de manera individual con la calidad del mismo genoma secuenciado a partir de la mezcla artificial.

ENSAMBLAJE SPADES

Aplicación que permite ensamblar un genoma a partir de lecturas cortas, la aplicación solo toma la librería de un solo extremo emparejado como entrada. El usuario establece un parámetro básico para el tipo de ADN de entrada como por ejemplo el plásmido para ADN plasmídico. Después de configurar el parámetro de entrada y tipo de ADN, el usuario proporciona un nombre para el ensamblaje de salida.

Además, hay tres parámetros de entrada avanzados: 

  1. Longitud mínima de contig (por defecto 500).

  2. Una lista de tamaños k-mer para los gráficos de Bruijn. De manera predeterminada, SPAdes tiene sus propios métodos para elegir qué tamaños de k-mer usar, dependiendo del tipo de datos de secuencia de entrada. El usuario puede anular la selección automática del valor k-mer usando el segundo parámetro de entrada avanzado.

  3.  Solo ensamblaje, que evita cualquier corrección de errores. 

Comandos:

 spades.py -o assembly_BT28_spades --pe1-1 22240_Bt28_1_trimmed.fastq --pe1-2 22240_Bt28_2_trimmed.fastq

spades.py -o assembly_M12J_spades --pe1-1 22241_M12J_1_trimmed.fastq --pe1-2 22241_M12J_2_trimmed.fastq

FASTQC

FastQC tiene como objetivo proporcionar de forma simple algunas comprobaciones de control de calidad en datos de secuencia sin procesar que provienen de herramientas de análisis de secuenciación de alto rendimiento. Proporciona un conjunto modular de estudios que puede usar para dar una impresión rápida de si sus datos tienen algún problema que debe tener en cuenta antes de realizar cualquier análisis posterior.

Comandos:

 fastqc 22240_Bt28_1_trimmed.00.0_0.cor.fastq.gz 22240_Bt28_2_trimmed.00.0_0.cor.fastq.gz -o quality_FQC/

HTML adjunto

 

fastqc 22241_M12J_1_trimmed.00.0_0.cor.fastq.gz 22241_M12J_2_trimmed.00.0_0.cor.fastq.gz -o quality_FQC/

HTML adjunto

QUAST

Es una herramienta de evaluación de calidad que a la  vez compara conjuntos de genomas. QUAST puede evaluar ensamblajes tanto con un genoma de referencia como sin referencia, además produce informes, tablas de resumen y diagramas para ayudar a los científicos en su investigación y en sus publicaciones. En este estudio, se utiliza QUAST para comparar varios ensambladores de genomas en dos conjuntos de datos.

Comandos:

BT28 y M12J

Sin referencias

 quast.py scaffolds.fasta contigs.fasta -o quast_15-09

Con referencia

BT28

 quast.py contigs.fasta -R /home/vamora/BioSEA/genomas/20181221_Pinto1/contigs/22240_Bt28.fasta -G /home/vamora/BioSEA/genomas/20181221_Pinto1/contigs/22240_Bt28.gff

M12J

quast.py contigs.fasta -R /home/vamora/BioSEA/genomas/20181221_Pinto1/contigs/22241_M12J.fasta -G /home/vamora/BioSEA/genomas/20181221_Pinto1/contigs/22241_M12J.gff

Anotación de Genoma

Derechos de autor 2022-2023, Universidad de Costa Rica

Por favor publique modulos en la posición offcanvas.

Traducción Automática