28/02/2019

Ciencia de los datos

Descifrar el ADN de un organismo vivo permite entender cómo funciona y cuáles son los mecanismos que se activan frente a una enfermedad

Conformado por dos hebras de ADN enrolladas en forma de hélice, que dan origen a cada uno de los 23 pares de cromosomas (cada cromosoma tiene entre 50.000.000 y 300.000.000 de pares de bases), el tamaño del genoma humano es de 32.000 millones de bases. Por el gran caudal de datos que implica su análisis, haber descifrado esa secuencia fue uno de los mayores logros biomédicos de los últimos años. Conocer el orden exacto de los pares de bases en un segmento de ADN permitirá, en el futuro, descifrar mecanismos que luego podrán ayudar a paliar o evitar enfermedades.

En 2003, la secuenciación del genoma humano revolucionó la manera de abordar el estudio del ADN. Su ordenamiento fue posible gracias a los avances en métodos usados para analizar ácidos nucleicos y al desarrollo de tecnologías cada vez más sofisticadas de secuenciación. Además, la bioinformática facilitó el análisis masivo de datos y su integración con conocimientos previos aportados por años de estudios de genética humana.

A pesar de los múltiples progresos en biología e informática, secuenciar todo el ADN de un organismo sigue siendo una tarea compleja. Sin embargo, gracias a nuevos métodos, ahora ordenar un genoma es mucho más rápido y menos costoso de lo que resultó en el Proyecto Genoma Humano.

Con el transcurrir de los años, los logros de la genética molecular y poblacional, sumado a la biología celular fueron acompañados de los avances computacionales necesarios para el procesamiento de la información genética, desde algoritmos o modelos computacionales capaces de responder preguntas relacionadas con la variación en las secuencias de los genes, hasta el desarrollo de equipos con la capacidad para almacenar la información y consultarla eficientemente. En la actualidad, resulta sencillo imaginarnos el trabajo en un laboratorio vinculado con las computadoras, pero esto no siempre fue así. De hecho, antes de 1990 no se conocía la secuencia del genoma de ningún organismo. Recién en 1995 se publicaron los códigos genéticos de las bacterias Haemophilus influenzae y Mycoplasma genitalium.

A 20 kilómetros de la Ciudad Autónoma de Buenos Aires, en la localidad de Hurlingham, funciona el Centro Nacional de Investigaciones Agropecuarias –CNIA– del INTA. Pocos saben a qué se dedican las más de 1.300 personas que trabajan en cuatro centros de investigación –divididos en 16 institutos–. Sin embargo, allí se concentra gran parte del trabajo científico que realiza el organismo.

En el marco del Centro de Investigación en Ciencias Veterinarias y Agronómicas –CICVyA–, funciona la Unidad de Bioinformática. En ese lugar, técnicos especializados e investigadores trabajan en red con pares de distintas unidades del INTA para desentrañar la información genética de especies forestales, frutales, cereales y oleaginosas, plagas, malezas y patógenos. Son detectives que buscan entender la arquitectura genética de organismos de interés agrícola.

Biólogos, matemáticos, técnicos de laboratorio y bioinformáticos articulan sus tareas diarias en busca de respuestas a estudios exhaustivos sobre un problema biológico determinado. En todos los casos, generan una gran cantidad de datos que demandan soluciones bioinformáticas, tanto para su ordenamiento como para su análisis.

Máximo Rivarola es biólogo molecular y trabaja en investigaciones vinculadas con el procesamiento masivo de datos de genómica en el ámbito de la agrobiotecnología. Como referente en bioinformática del INTA, integró consorcios internacionales para la secuenciación del genoma del trigo, girasol y bacterias de interés agrícola.

“La bioinformática es una disciplina que ha evolucionado rápidamente”, señaló Rivarola y agregó: “Responde al avance y a las necesidades de procesamiento, almacenamiento y análisis de datos biológicos derivados de áreas como genómica, proteómica, transcriptómica y metabolómica para generar nueva información y conocimientos”.

“Si bien existe desde los años 70, recién en el inicio de los 90 se diseñaron e implementaron nuevos algoritmos para el análisis comparativo de secuencias de proteínas y de genes o para la búsqueda de patrones o repeticiones”, graficó Rivarola quien planteó que, en el mundo de la bioinformática, este primer gran avance es conocido como el alineamiento de cadenas y de secuencias.

El acceso a las tecnologías de secuenciación de generación avanzada (NGS, por sus siglas en inglés), desde 2007 en adelante, no solo permitió obtener de manera rápida y con gran profundidad el detalle de la secuencia nucleotídica completa de un organismo y comprender su organización, sino que modificó la manera de abordar la genómica.

“Gracias a estos avances es posible tener una visión completa de un genoma determinado”, indicó Rivarola quien añadió: “Esto influyó de manera drástica en programas de mejoramiento genético, aportó mayor competitividad a laboratorios de mediana complejidad y posibilitó el descenso de los costos en la secuenciación de genomas o transcriptomas”.

Antes de 2003, fecha en la que se publicó el genoma humano ensamblado, era impensado resolver preguntas vinculadas a cómo enlazar genomas tan grandes. Básicamente, porque era imposible generar los datos y luego procesarlos. “Muchas operaciones informáticas biológicas requieren una gran carga computacional e infraestructura para el almacenamiento de datos debido a la suma y la combinación de información”, manifestó Rivarola.

“En los últimos 15 años, la bioinformática es un campo de investigación que explotó y, sin dudas, es la herramienta para las investigaciones del futuro”, aseguró Rivarola.

Fuente: INTA

Comentarios