Crean un algoritmo que detecta errores en la secuenciación masiva del ADN

26/nov./15 - 18:50

Gracias a las actuales plataformas de secuenciación masiva, se pueden producir millones de lecturas en poco tiempo y por un bajo coste

Científicos del Centro de Astrobiología (INTA) y del Centro Nacional de Biotecnología (CNB) han desarrollado un nuevo algoritmo que permite filtrar con precisión las secuencias erróneas en los procesos de secuenciación masiva de ácidos nucleicos.

La secuenciación es una moderna técnica que permite leer la información contenida en las moléculas de ADN o ARN, es decir, se obtiene la lista de bases nitrogenadas (adenina, citosina, guanina, timina o uracilo) que componen el segmento leído.

Gracias a las actuales plataformas de secuenciación masiva, se pueden producir millones de lecturas en poco tiempo y por un bajo coste, lo que ha supuesto una revolución en muchas disciplinas científicas como la biología o la paleontología, entre otras.

Sin embargo, algunas de estas lecturas pueden contener errores de secuenciación que comprometen los resultados y conducen a interpretaciones imprecisas.

Los errores, que son frecuentes en estos estudios, repercuten en mayor medida en los procesos referidos a poblaciones microbianas.

Cuando los errores alcanzan, al menos, el 3 por ciento en toda una secuencia leída, que se supone pertenecen a una misma especie, aparecen lo que el investigador principal de esta investigación, Fernando Puente Sánchez, llama "especies fantasmas".

Por tanto, se produce una sobreestimación muy acusada de la diversidad microbiana presente en la muestra.

"Se trata de un problema que se aprecia sobre todo en la secuenciación masiva, porque al haber muchas más secuencias, el número total de errores también es mayor", comenta el científico.

Precisamente, Puente Sánchez necesitaba analizar poblaciones microbianas para su tesis y los errores que surgían de la secuenciación lo llevaron a desarrollar este estudio, que comenzó hace dos años, para identificarlos.

"Al hacer el análisis, el secuenciador te indica cuánto 'se fía' de cada base analizada. El algoritmo utiliza esa información para descartar las secuencias que tengan más probabilidad de contener errores, y obtener así un resultado más preciso", sostiene.

Los creadores de este algoritmo confían en que el uso de su método se extienda rápidamente en el campo de la ecología microbiana.

El Centro de Astrobiología (CAB), el primer centro del mundo dedicado únicamente a la investigación astrobiológica, es un centro de investigación mixto del CSIC y del Instituto Nacional de Técnica Aeroespacial (INTA), asociado al NASA Astrobiology Institute (NAI).