martes, 8 de junio de 2010

Freaks de la Biología (y II): La hipótesis (errónea) más grande de la Historia

Francis Crick se limpió con una servilleta, se incorporó, y se dirigió hacia una amplia pizarra con aspecto de no haber sido usada en mucho tiempo:
- Bien, amigos, no os torturaré más con la espera. Vamos al meollo del asunto. Que no es otro que el desciframiento del código genético.
- Venga ya…
- ¿Nos estás diciendo que has descifrado el código, tú solo?
- ¿Es otra de tus payasadas, Crick?
- Amigos, por favor – intercedió Watson, – dejémosle terminar.
- Gracias, Jim – prosiguió Crick -. Nuestra pregunta es: ¿cuál es la relación entre la secuencia aparentemente arbitraria de adeninas, guaninas, citosinas y timinas en el ADN y la secuencia básica lineal de una proteína concreta? Como todos sabéis, se podría pensar, en primer lugar, que cada base nitrogenada correspondiera a un aminoácido: por ejemplo, A podría “significar” alanina, T, arginina, G, asparagina y C, ácido aspártico; de esta forma, la secuencia de ADN AGCTGG se traduciría en una pequeña proteína (un péptido, para hablar con propiedad) con la secuencia alanina – asparagina - ácido aspártico – arginina – asparagina - asparagina. Resulta obvio que este modelo es insuficiente: ¡nos faltan aún dieciséis aminoácidos que codificar en el ADN! Hagamos un nuevo intento: ¿y si son dos bases nitrogenadas consecutivas las que “significan” un aminoácido? Podemos calcular cuántas combinaciones de dos bases nitrogenadas se pueden obtener: en estricto lenguaje matemático, no son combinaciones, sino las variaciones con repetición de cuatro elementos tomados de dos en dos, es decir, 42, por tanto, dieciséis. ¡Nos siguen faltando cuatro aminoácidos! Pero no nos rindamos: ¿y si cada aminoácido fuera codificado no por una, ni dos, sino por tres bases nitrogenadas? Veamos… las variaciones totales serían 43, es decir, sesenta y cuatro. Mucho mejor. Ahora podemos obtener los veinte aminoácidos… ¡pero ahora nos sobran cuarenta y cuatro combinaciones! Es, coincidiréis conmigo, una pequeña pesadilla... Sigamos pensando, pues. Quizá cada aminoácido pueda ser codificado por más de una tríada de bases; por ejemplo, GAT, CGT y, digamos, TGA podrían significar, los tres, el aminoácido arginina. Es posible. Sin embargo, un código de este tipo, “degenerado”, a mi entender está bastante alejado de la elegancia con la que la Naturaleza resuelve sus retos: excesiva confusión, poca economía… Y ahora llega mi hipótesis; es sencilla: tan sólo veinte de esas sesenta y cuatro posibilidades son realmente útiles. Me entenderéis enseguida. Inventemos una porción de código genético completamente arbitraria; con diez tripletes de bases será suficiente para mi ejemplo:

ATG - Arginina
AGA - Leucina
AGC - Asparagina
ACA - Metionina
TGA - Prolina
TGT - Serina
CAG - Valina
GAC - Glicina
GTG - Isoleucina
GAG - Treonina

Y ahora imaginemos una secuencia muy corta de ADN: ATGTGACAGAGC. Por supuesto, el mecanismo que posee la célula para la lectura de esta secuencia - y la consiguiente fabricación de la proteína codificada en ella - interpretará la sucesión de bases como ATG TGA CAG AGC que, como todos podéis apreciar claramente, corresponde al péptido arginina – prolina – valina – asparagina. Sencillo, ¿verdad? Pero, ¡amigos míos!, no olvidemos que nos movemos en la vieja y querida Biología, no en las exactas e inefables Matemáticas: en los procesos biológicos pueden cometerse errores. Imaginad que el mecanismo de lectura comienza la secuencia obviando, por error, la primera base; leería algo diferente: A TGT GAC AGA GC, que corresponde al péptido serina – glicina – leucina, muy diferente al anterior. ¿Y si el mecanismo de lectura se equivocara en dos bases? Tendríamos AT GTG ACA GAG C, que corresponde a isoleucina – metionina - treonina. Evidentemente, la célula no puede permitirse, al cometer estos pequeños errores de lectura, que se produzcan tales catástrofes en la proteína resultante. La Naturaleza no puede ser tan chapucera. Tiene que haber otra solución… Debemos seleccionar veinte tríadas que hagan imposible, de manera automática, que se produzcan errores como los que os he mostrado. O, dicho de otro modo, tenemos que excluir todos los tripletes que se puedan interpretar mal si se comienzan a leer por el lugar equivocado. Parece más fácil decirlo que hacerlo, ¿verdad? Pero comprobaréis que no es complicado: en primer lugar, vamos a eliminar las posibilidades AAA, TTT, GGG y CCC, que son las que, obviamente, pueden resultar más confusas; y, a continuación, repartiremos el resto de los tripletes en grupos, de tal forma que cada grupo contenga tres tripletes con las mismas bases siguiendo un mismo orden rotatorio. Por ejemplo, ATG, TGA y GAT. Quedará algo así:

AAT, ATA, TAA
ATG, TGA, GAT
AGC, GCA, CAG
TCG, CGT, GTC
AAC, ACA, CAA
ACT, CTA, TAC
AGG, GGA, GAG
TGC, GCT, CTG
AAG, AGA, GAA
ACC, CCA, CAC
TTC, TCT, CTT
TGG, GGT, GTG
ATT, TTA, TAT
ACG, CGA, GAC
TTG, TGT, GTT
CCG, CGC, GCC
ATC, TCA, CAT
AGT, GTA, TAG
TCC, CCT, CTC
CGG, GGC, GCG

Y ahora, amigos… la magia: seleccionad tan sólo un triplete de cada grupo, dándole valor codificador de un aminoácido, y considerad que el resto de tripletes del grupo no tiene sentido, es decir, no “significan” ningún aminoácido. Haced la prueba, escoged como útil, por ejemplo, el primer triplete de cada grupo y fabricad una cadena de ADN a partir de, por ejemplo, los tripletes útiles de los primeros cinco grupos: AAT AAC AAG ATT ATC; si hay un error en la lectura y el mecanismo obvia una base, leerá A ATA ACA AGA TTA TC que, como podéis comprobar en la tabla, no tiene sentido y no codifica para ninguna proteína errónea. Si el mecanismo saltase dos bases, tendríamos AA TAA CAA GAT TAT C, que, de nuevo, no tiene sentido…
- Entonces… ¿tan sólo un triplete de cada grupo puede sobrevivir en el código?
- Exactamente. Y ahora, hacedme el favor de contar cuántos tripletes con sentido tendría nuestro código…
- Uno de cada grupo… Veinte… ¡Veinte! ¡Los veinte aminoácidos!
- ¡Es cierto!
- En realidad – continuó Crick - no es tan sencillo como he intentado que pareciera, y mi ejemplo ha sido, lo reconozco, bastante burdo. Para ser sincero, os confesaré que la elección de un triplete en cada grupo condiciona la elección de los siguientes, hecho que lo complica todo… Y, además, no existe un único código genético posible, sino muchos; he realizado los cálculos matemáticos necesarios y las posibilidades totales son doscientas ochenta y ocho, de las cuales tan sólo una habrá sido la elegida por la Naturaleza, pero…
- ¡… pero eso ya queda para los experimentadores, Crick! ¡Tú has descubierto la filosofía interna del problema! – exclamó un Feynman al borde de la lágrima.
- Lo reconozco: te has superado – admitió, entre admirado y derrotado, Delbrück.
- Te odio - reconoció Watson -. Todos te odiamos. Eres un jodido superdotado.

Sin embargo… Crick se equivocó. En el Congreso de Bioquímica de Moscú de 1961, Marshall Niremberg describió su diáfano experimento: había añadido un ARN constituido únicamente por uracilos (UUUU…; el uracilo en el ARN es el equivalente a la timina – T – en el ADN) a un sistema de ribosomas desprovisto de células. La proteína que se formó tan sólo contenía un tipo de aminoácido: fenilalanina. Se acababa de descifrar la primera palabra del código genético: el triplete UUU (o en ADN el TTT) significaba fenilalanina. Y si un triplete tan “confuso” como UUU tenía sentido para la célula, la charla de Niremberg era el primer clavo en el ataúd de la hipótesis de Crick.
La Naturaleza no parecía temer a la confusión: se decantaba por un código en el que, después de todo, quizá todas o casi todas las combinaciones de tres bases podrían tener sentido y, por ello, estaba más sujeto a los errores que cinco años atrás describiera Crick ante el Club de la Corbata de ARN. Francis Crick había errado el tiro por primera vez. Pero, incluso en el error, seguía dejando patente su brillantez: su código genético era, en algún sentido, más elegante, más práctico, mejor, en suma, que el de la propia Naturaleza.
Años más tarde, en el creciente mundo del ADN, la idea genial de Francis Crick sería conocida como la hipótesis (errónea) más grande de la Historia.

2 comentarios:

VictorJCid dijo...

Bravo, Chema! Ya está aquí tu largamente esperado relato sobre las elucubraciones de Crick. Lo celebro. Es de lo más granado que hemos publicado en Cellularium hasta la fecha. Espero que sea un éxito de taquilla.

Chema dijo...

Gracias, compañero celulario. Pero si esperas que sea un éxito de taquilla... espera sentado. Me temo.
(O bueno, quizá me equivoque y de repente las combinaciones cabalísticas de las cuatro letras A, T, C y G se conviertan en algo irresistiblemente de moda. Quién sabe. Crick seguro que lo sabría. Lo sabía todo.)