Ngs Introduccion PDF
Ngs Introduccion PDF
Ngs Introduccion PDF
1. FUNDAMENTO DE LA TÉCNICA
La secuenciación de nucleótidos que conforman la molécula de ADN representa el análisis
más detallado de su estructura y una herramienta eficaz para identificar variantes en el ma-
terial genético. La secuenciación Sanger supuso en los años 70 una revolución importante
en Genética Humana, sentando precedente en el origen de la era genómica. Sin embargo,
en los últimos años se han desarrollado nuevas plataformas de secuenciación denominadas
de alto rendimiento o nueva generación (Next-Generation Sequencing o NGS) capaces de
generar paralelamente, y de forma masiva, millones de fragmentos de ADN en un único
proceso de secuenciación, elevando significativamente el rendimiento a un menor coste y
ofreciendo ventajas significativas respecto a los sistemas convencionales.
3. Ligación del material amplificado a una superficie sólida donde se llevará a cabo la
reacción de secuenciación.
34
Técnicas de secuenciación masiva (NGS) M. Santamaría, J. M. Lezana
tras lectura de la señal fluorescente. Las plataformas que utilizan esta técnica son
Illumina (https://www.illumina.com/) y Helicos BioSciences (http://seqll.com/).
• Secuenciación en tiempo real: estas técnicas son muy rápidas porque no frenan la se-
cuenciación tras la incorporación de cada base para llevar a cabo la lectura ni invier-
ten tiempo en ciclos de lavado. Tampoco requieren amplificación, ni sufren fenóme-
nos de desfase. Esta tecnología desarrollada por Pacific Biosciences (http://www.pacb.
com/products-and-services/) e incorporada en su plataforma SMRT (Single Molecule
Real Time) contiene un dispositivo que permite limitar el campo de observación lo
suficiente como para captar exclusivamente la fluorescencia emitida por la incorpo-
ración de nucleótidos marcados en tiempo real.
Las técnicas de secuenciación NGS generan principalmente, tres tipos de ficheros: FASTQ,
SAM/BAM (alineamiento) y VCF (anotación).
Fichero FASTQ: texto de entrada estándar que contiene los datos crudos (lecturas o reads)
obtenidos por el secuenciador. Permite almacenar la secuencia biológica junto con las ca-
lidades asociadas a cada nucleótido de la secuencia. Este fichero es reconocido por las he-
rramientas bioinformáticas encargadas del alineamiento.
Fichero BAM (Binary Alignment/Map format): versión comprimida del formato SAM. Per-
mite realizar un indexado para tener acceso directo a las posiciones genómicas.
35
Técnicas de secuenciación masiva (NGS) M. Santamaría, J. M. Lezana
Fichero VCF (Variant Call Format) se obtiene a partir de los ficheros SAM/BAM. Permite
almacenar las variaciones de la secuencia con respecto al genoma contra el que se alinea:
SNPs, inserciones, deleciones y variantes estructurales, junto con ciertas anotaciones opcio-
nales derivadas de diferentes bases de datos
Los pares de reads correctamente alineados se utilizan en la detección de SNP (Single Nu-
cleotide Polymorphism), pequeñas inserciones y deleciones y en la estimación del número
de copias. Los reads de un par no alineados que muestran una distancia o una orientación
inesperada, se analizan como indicadores potenciales de variantes estructurales. Por últi-
mo, el acoplamiento de novo de reads no alineados con la referencia proporciona predic-
ciones de variantes estructurales.
Un aspecto importante en la NGS es el número de veces que cada base del genoma está
presente en los reads de secuenciación producidos; es decir, el número de veces que se lee
cada nucleótido. Este valor se denomina cobertura y es uno de los factores determinantes
para evaluar la fiabilidad del nucleótido asignado a esa posición del genoma. El diseño de
paneles de NGS debe garantizar una adecuada cobertura en todos los genes analizados. La
gran capacidad de estas tecnologías para generar datos genómicos va a incrementar signi-
ficativamente la información genética asociada que disponemos en la actualidad.
2. ÁMBITO DE APLICACIÓN
Debido a su gran rendimiento, este tipo de plataformas es idóneo para un sin fin de es-
tudios a gran escala imposibles de abordar con ningún otro tipo de tecnología existente
hasta la fecha debido al enorme coste que ello supondría. Entre las principales aplicaciones
destacan:
o Diagnóstico molecular de enfermedades hereditarias: se pueden seguir varias estrategias
pero recae en el laboratorio la responsabilidad de realizar una gestión adecuada del mé-
todo a utilizar en cada caso.
36
Técnicas de secuenciación masiva (NGS) M. Santamaría, J. M. Lezana
Durante los próximos años, la lista de aplicaciones crecerá sin duda, al igual que la sofisti-
cación con las que se realizan las aplicaciones existentes.
37
Técnicas de secuenciación masiva (NGS) M. Santamaría, J. M. Lezana
3. LIMITACIONES DE LA TÉCNICA
Los factores que influyen en la calidad de los resultados obtenidos son muy variados y van
a influir de forma decisiva en el tipo de errores cometidos y en la fiabilidad de los datos
derivados del análisis, incluyen: conservación de la muestra (tejido fresco o fijado), pureza
de la muestra (en el caso de tumores, porcentaje de células no tumorales presentes en la
muestra), técnica de secuenciación, cobertura y herramientas de análisis e interpretación
de resultados.
Entre las limitaciones más importantes de estas técnicas a tener en cuenta, destacan:
38
Técnicas de secuenciación masiva (NGS) M. Santamaría, J. M. Lezana
BIBLIOGRAFÍA
Cock PJA, Fields CJ, Goto N, Heuer ML, Rice PM. The Sanger FASTQ file format for sequences
with quality scores, and the Solexa/Illumina FASTQ variants. Nucleic Acids Res [Internet]. Oxford
University Press; 2010 Apr [cited 2017 Feb 22];38(6):1767–71. Available from: http://www.ncbi.
nlm.nih.gov/pubmed/20015970
Danecek P, Auton A, Abecasis G, Albers CA, Banks E, DePristo MA, et al. The variant call
format and VCFtools. Bioinformatics [Internet]. Oxford University Press; 2011;27(15):2156–8.
Available from: https://academic.oup.com/bioinformatics/article-lookup/doi/10.1093/bioinforma-
tics/btr330
DePristo MA, Banks E, Poplin R, Garimella K V, Maguire JR, Hartl C, et al. A framework
for variation discovery and genotyping using next-generation DNA sequencing data. Nat Genet
[Internet]. Nature Research; 2011 Apr 10 [cited 2017 Feb 12];43(5):491–8. Available from: http://
www.nature.com/doifinder/10.1038/ng.806
Harismendy O, Ng PC, Strausberg RL, Wang X, Stockwell TB, Beeson KY, Schork NJ, Mu-
rray SS, Topol EJ, Levy S, Frazer KA. Evaluation of next generation sequencing platforms for
population targeted sequencing studies.Genome Biol.10(3):R32 (2009)
Li H, Durbin R. Fast and accurate short read alignment with Burrows-Wheeler transform. Bio-
informatics [Internet]. 2009 Jul 15 [cited 2017 Feb 12];25(14):1754–60. Available from: http://
www.ncbi.nlm.nih.gov/pubmed/19451168
Metzker ML. Sequencing technologies - the next generation. Nat Rev Genet. 11(1):31-46 (2010)
Plagnol V, Curtis J, Epstein M, Mok KY, Stebbings E, Grigoriadou S, et al. A robust model
for read count data in exome sequencing experiments and implications for copy number variant
calling. Bioinformatics [Internet]. Oxford University Press; 2012 Nov 1;28(21):2747–54. Availa-
ble from: https://academic.oup.com/bioinformatics/article-lookup/doi/10.1093/bioinformatics/
bts526
Robinson JT, Thorvaldsdóttir H, Winckler W, Guttman M, Lander ES, Getz G, et al. Inte-
grative genomics viewer. Nat Biotechnol [Internet]. Nature Research; 2011 Jan [cited 2017 Feb
14];29(1):24–6. Available from: http://www.nature.com/doifinder/10.1038/nbt.1754
Sanger F, Coulson AR. A rapid method for determining sequences in DNA by primed synthesis
with DNA polymerase. J Mol Biol. 94(3):441-8 (1975)
39
Técnicas de secuenciación masiva (NGS) M. Santamaría, J. M. Lezana
Sanger F, Nicklen S, Coulson AR. DNA sequencing with chain-terminating inhibitors. Proc Natl
Acad Sci U S A. 74(12):5463-7 (1977)
Thorvaldsdóttir H, Robinson JT, Mesirov JP. Integrative Genomics Viewer (IGV): high-perfor-
mance genomics data visualization and exploration. Brief Bioinform [Internet]. Oxford University
Press; 2013;14(2):178–92. Available from: http://www.ncbi.nlm.nih.gov/pubmed/22517427
COMISIÓN DE GENÉTICA
Presidenta: Pilar Carrasco Salas.
Miembros: Concepción Alonso Cerezo, Ana Cuesta Peredo, Orland Diez Gibert, Begoña Ezquieta
Zubicaray, Hada Macher Manzano, Jesús Molano Mateos, Josep Oriola Ambròs, Raquel RodrÍguez
López, Atocha Romero Alfonso, Ana Mª Sánchez de Abajo, María Santamaría González (coordinadora),
Cristina Torreira Banzas.
ACTIVIDADES FORMATIVAS DEL COMITÉ DE EDUCACIÓN
D. Balsells, B. Battikhi (Residente), R. Deulofeu, M. Gassó, N. Giménez, A. Merino, A. Moreno,
A. Peña, N. Rico, M. Rodríguez (Presidente), MC. Villà.
ISBN 978-84-697-4013-2 – Febrero 2018 (recibido para publicación Junio 2017).
40