miércoles, 12 de septiembre de 2012

Proyecto ENCODE ¿Quién dijo "basura"?



Una década después de descifrar el genoma humano, ahora que la sociedad por fin ha digerido intelectualmente lo que supuso este hito científico, nos llegan noticias sobre un nuevo reto en la investigación genómica: la publicación de resultados del proyecto “ENCODE”. Habréis oído y leído en los medios de comunicación que más o menos se trata de entender y catalogar lo que durante la elaboración del primer borrador de la secuencia se denominó “ADN basura”, una etiqueta que –claro– a los genetistas nunca gustó demasiado… ¡En la naturaleza no hay basura: todo se recicla!

Pero… ¿Qué es exactamente lo que revelan ahora los investigadores?
ENCODE, el verbo “codificar” en inglés, es en este caso también un acrónimo de “Encyclopedia of DNA Elements”. Eso es ni más ni menos lo que pretende ser, una enciclopedia de los elementos funcionales que hay en el vasto genoma acompañando al escaso de los 20.000 elementos codificantes propiamente dichos, es decir la parte de los genes con información traducible a proteínas. En pocas palabras, el hito que supone ENCODE ha sido concluir que más del 80% del genoma humano realmente sirve para algo, toda una vuelta de tuerca respecto a la visión no tan remota de que más del 98% de nuestro genoma era “basura”. Para eso han hecho falta 32 grupos con más de 440 investigadores realizando 1648 experimentos sobe células humanas de 147 tipos.
            Os preguntaréis qué hay en esa secuencia hasta ahora inexplorada. Podríamos poner un símil astronómico: gracias a una tecnología de exploración más refinada ahora vemos estrellas, cúmulos y galaxias donde antes el planisferio tenía grandes espacios vacíos entre las estrellas conocidas. Pero no es un símil 100% adecuado… Lo que se ha descubierto en el “vacío genómico” no son nuevos genes sino las claves que regulan el funcionamiento de los ya cartografiados anteriormente. Como dice Ewan Birney, coordinador del superproyecto en una editorial de Nature (aquí una entrevista al interfecto, in English), si imprimieran todos los datos que han obtenido a razón de 1000 bases de ADN por centímetro cuadrado (no se vería ni con lupa), el documento resultante sería de 16 metros de ancho por 30 km de largo… No es, pues, una enciclopedia de bolsillo. Esto, claro, rebasa un tanto la capacidad de almacenamiento y comprensión de la mente humana y sólo es posible gracias a herramientas bioinformáticas que permiten inquirir a tales bases de datos enciclopédicas.
No, no me he leído aún los 30 artículos simultáneos en las revistas Nature, Genome Research y Genome Biology, pero puedo daros unas pinceladas sobre las lineas generales sobre las que versan los principales hallazgos. He aquí una breve lista:

1. Elementos reguladores de la expresión de los genes, es decir, “dianas” de los denominados factores de transcripción. La información del genoma está silenciada hasta que es requerida la síntesis de las proteínas sus genes que codifican. Cada proteína se necesita en un momento concreto, en respuesta a estímulos concretos… Y la célula economiza al máximo. Los genes están “apagados” (en off, o casi mejor en stand by) y se “encienden” (on) cuando reciben la señal adecuada. Esto lo controlan unas proteínas que se unen a secuencias concretas fuera de las regiones codificantes, que se llaman factores de transcripción, que son diversos y tienen actividades tanto activadoras como represoras. Suelen ser caprichosos y cada uno se une a una determinada pequeña secuencia de bases. Pues bien, ahora se han cartografiado decenas de miles de sitios donde dichos factores se pegan en el genoma a hacer su trabajo.
2. Patrones de la cromatina en torno a los sitios de unión de los factores de transcripción. Los factores de transcripción reclutan a la enzima que transcribe el DNA a RNA mensajero, pero eso no es todo el trabajo. Para que esto sea físicamente posible la cromatina tiene que reestructurarse de manera dinámica. El ADN está compactado con proteínas de carga positiva, llamadas histonas, que compensan su fuerte carga negativa. Este conjunto organizado de ADN, histonas, etc., se llama cromatina. Tal compactación debe relajarse localmente para que la enzima polimerasa actúe y los genes se expresen, se copien a ARN. Esto también se ha estudiado de forma sistemática en ENCODE.
3. Regulación epigenética de la expresión de los genes. Precisamente la modificación de las histonas es objeto de estudio de la “epigenética”, es decir, el estudio de la función del genoma más allá de la propia información contenida en la secuencia, un campo en alza en la biología del s. XXI. Dichas modificaciones pueden condicionar la regulación de los genes de manera independiente de la información genómica. Además, las bases del ADN pueden “metilarse”, es decir, sufrir modificaciones heredables que alteran ligeramente sus propiedades sin afectar a la secuencia de bases. Estos matices están revelando muchos puntos oscuros de la función de nuestro genoma.
4. Caracterización de ARNs no codificantes. ¡Sorpresa para los biólogos de nuestro tiempo: No todos los ARNs que se expresan corresponden a genes!, es decir, no todo son mensajeros (ARNm) que se han de traducir a proteínas o las especies clásicas conocidas implicadas en la traducción de dichos mensajes (el ARN ribosómico –ARNr– con función estructural en el ribosoma, la fábrica de proteínas de la célula, o los pequeños ARNs de transferencia –ARNt– que trabaja allí incorporando un aminoácido por cada triplete del código genético). El genoma expresa con profusión otros ARNs no codificantes –ARNnc– que probablemente desempeñan funciones importantes regulatorias que estamos sólo comenzando a comprender.
5. Relaciones tridimensionales entre elementos del genoma. Tendemos a entender el genoma como una secuencia, una sucesión de bases… Al fin y al cabo pensamos en cada cromosoma como un enorme renglón de información en el que muchas palabras no tienen sentido. Pero el genoma no es unidimensional, sino que adquiere una estructura tridimensional en la cual regiones relativamente lejanas en la secuencia pueden encontrarse en contacto e influir sobre la función de los factores de trascripción o de la cromatina. Si supiéramos leer en tres dimensiones entenderíamos mucho más… A las 70.000 regiones promotoras (las esenciales para controlar la expresión de los genes) canónicas catalogadas en este proyecto hay que sumarle 400.000 nuevas regiones más distantes a los genes con implicaciones en su regulación.

Además, un examen tan exhaustivo ha depurado la primera anotación del genoma notablemente, discerniendo con exactitud los genes de los espacios vacíos entre ellos (regiones intergénicas). Toda esta información multiplica su posible utilidad cuando cartografiamos en ella las variaciones genéticas de la especie humana, lo que ha de permitir entender mejor su relación con los “fenotipos”, es decir, características apreciables, desde el color de los ojos hasta la predisposición a enfermedades complejas al cáncer, obesidad o enfermedades cardiovasculares o respuesta y tolerancia a los fármacos. Y, ¿por qué no? en términos evolutivos, comparando esta información con la equivalente en otros mamíferos, por ejemplo nuestros primos los primates, comprenderemos al fin en qué se basa nuestra complejidad, la capacidad de desarrollo neuronal que se asienta en la base del animal “racional” y le diferencia (si procede) del irracional, algo sobre lo que el análisis comparativo de los mapas previamente disponibles del genoma humano y el del chimpancé. La Ciencia dirá.

2 comentarios:

Dr. Litos dijo...

Saludos camarada!

Muy buen repaso de los hitos y logros del ya famoso ENCODE. Sin embargo, quisiera sacar a colación el poquito de polémica que este hallazgo trae detrás y del que se han hecho eco ya algunos medios sobretodo de divulgación. Al parecer, exista tanto una legión de gente totalmente en contra del concepto de ADN basura como totalmente a favor; los unos, para justificar que todo en la vida es obra de un ser superior que jamás dejará toneladas y toneladas de material informativo sin información, sólo como un mero colgajo sin sentido; en el otro bando, los que utilizan el argumento del ADN basura como unr esquicio evolutivo que demuestra la historia compleja y aleatoria de la evolución, y por tanto se contrapone a la visión teocentrista.

¿Qué aporta ENCODE a esta vieja (y fútil, cabe decirlo; no se puede estar "en contra" o "a favor" de evidencias científicas, no es cuetión de opinión)rencilla? Pues como bien se deduce de tu artículo, aboga más por aportar funcionalidad a todas esas zonas oscuras e ignotas. Por otro lado, esto no vale (al menos todavía, hay mucho trabajo por delante) para decir que TODO ese ADN de esotérica función valga para algo biológicamente relevante. La idea de material génico reminiscente y sin función sigue vigente, por mucha histona o factor de transcripción que se mezcle. Una cosa no quita la otra. Pero no se zanjará la cuestión hasta que se analice el total absoluto y completo del genoma y se otorgue una función a cada fragmento concreto; incluso entonces, cabrá preguntarse hasta qué punto una función es una función, y no un "accidente". Puede que sea una mera cuestión semántica, pero en cualquier caso creo que al campo de la evolución molecular le puede aportar un avance importantísimo todo este enfoque.

Perdón por el rollo! Espero leeros más a menudo. Un abrazo!

Víctor dijo...

Eh! Oh! Dr. Litos alias Kurtz (¡Qué tiempos aquellos!). Nuestro fiel lector... No nos abandones.
Creo que alguna vez he oído la anécdota de que cuando a David Baltimore le preguntaron si había visto el genoma y qué le parecía y tal y cual, exclamó algo así como: "¡Es un museo de todas la infecciones for retrovirus que ha sufrido el ser humano a lo largo de su evolución!" Para él, desde luego, no era basura.