Vous êtes sur la page 1sur 8

El dogma central y el código genético

El código genético relaciona los grupos de nucleótidos en un ARNm con los aminoácidos
en una proteína. Codones de inicio, codones de terminación, marco de lectura.

Introducción

¿Alguna vez le has escrito un mensaje secreto a alguno de tus amigos? Si es así, tal vez
hayas usado algún código para mantener el mensaje oculto. Por ejemplo, tal vez hayas
reemplazado letras de las palabras con números o símbolos siguiendo un conjunto
particular de reglas. Para que tu amigo pueda entender el mensaje, es necesario que
conozca el código y aplique el mismo conjunto de reglas, en reversa, para decodificarlo.

Decodificar mensajes también es un paso clave en la expresión génica, donde la


información de un gen se lee para construir una proteína. En este artículo revisaremos
con más detalle el código genético, el cual permite que las secuencias de ADN y de ARN
se "decodifiquen" en los aminoácidos de una proteína.

Antecedentes: fabricación de una proteína

Los genes que contienen instrucciones para generar proteínas se expresan en un proceso
de dos pasos.

En la transcripción, la secuencia de ADN de un gen se "reescribe" en forma de ARN.


En eucariontes, el ARN debe someterse a etapas de procesamiento adicionales para
convertirse en ARN mensajero, o ARNm.

En la traducción, la secuencia de nucleótidos del ARNm se "traduce" en una secuencia


de aminoácidos de un polipéptido (cadena proteica).

Si esto es un nuevo concepto para ti, quizás quieras aprender más viendo el video sobre
transcripción y traducción.

Codones

Las células decodifican el ARNm al leer sus nucleótidos en grupos de tres, conocidos
como codones. A continuación, algunas características de los codones:

La mayoría de los codones especifican un aminoácido


Tres codones de "terminación" marcan el fin de una proteína

Un codon de "inicio", AUG, marca el comienzo de una proteína y además codifica para
el aminoácido metionina.

Los codones en un ARNm se leen durante la traducción; se comienza con un codón de


inicio, y se sigue hasta llegar a un codón de terminación. Los codones de ARNm se leen
de 5' a 3' y especifican el orden de los animoácidos en una proteína de N-terminal
(metionina) hasta C-terminal.

La secuencia del ARNm es:

5'-AUGAUCUCGUAA-5'

La traducción implica leer los nucleótidos del ARNm en grupos de tres, cada uno de los
cuales especifican un aminoácido (o proporciona una señal de terminación que indica que
ha finalizado la traducción).

3'-AUG AUC UCG UAA-5'

AUG →\rightarrow→right arrow metionina (inicio) AUC →\rightarrow→right arrow


isoleucina UCG →\rightarrow→right arrow serina UAA →\rightarrow→right arrow "alto"

Secuencia del polipéptido: (extremo-N) metionina-isoleucina-serina (extremo-C)

[¿Qué significan 5' y 3'?]

Los dos extremos de una cadena de ADN o ARN son diferentes entre sí. En otras
palabras, las moléculas de ADN y ARN tienen direccionalidad.

En el extremo 5' de la cadena, sobresale el grupo fosfato del primer nucleótido de la


cadena. El grupo fosfato se encuentra unido con el carbono 5' del anillo del azúcar y es
por lo que se llama extremo 5'.

En el otro extremo, llamado extremo 3', sobresale el hidroxilo del último nucleótido
añadido a la cadena. El grupo hidroxilo se encuentra unido con el carbono 3' del anillo del
azúcar y es por lo que se llama extremo 3'.

Muchos procesos, como la replicación de ADN y la transcripción, solo pueden ocurrir en


una dirección particular en relación con la direccionalidad en la cadena de ADN o ARN.

Puedes aprender más en el artículo sobre ácidos nucleicos.

[¿Qué son los extremos N-terminal y C-terminal?]


Los polipéptidos (cadenas de aminoácidos unidos) tienen dos extremos distintos:

Un extremo N-terminal que tiene un grupo amino expuesto

Un extremo C-terminal que tiene un grupo carboxilo expuesto

Durante la traducción, el polipéptido se construye del extremo N-terminal hacia el C-


terminal. Puedes aprender más acerca de los extremos N- y C-terminales en el artículo
sobre proteínas y aminoácidos.

La tabla del código genético

El conjunto completo de relaciones entre los codones y los aminoácidos (o señales de


terminación) se conoce como el código genético. Con frecuencia, el código genético se
resume como una tabla. [¿Cómo se lee la tabla de codones?]

A primera vista, la tabla de codones puede parecer un poco intimidante. Afortunadamente


se encuentra organizada de manera lógica y no es tan difícil de usar una vez que
entiendes cómo está organizada.

Para ver cómo funciona la tabla de codones vamos a hacer un ejemplo. Supongamos que
nos interesa el codón CAG y queremos saber qué aminoácido codifica.

Primero vemos el lado izquierdo de la tabla. El eje del lado izquierdo indica la primera
letra del codón, por lo que buscamos C en el eje izquierdo. Esto nos dice cuál es la fila
(amplia) de la tabla en la que estará nuestro codón.

Después vemos el borde superior de la tabla. El eje superior indica la segunda letra del
codón, por lo que buscamos A en dicho eje. Esto nos dice cuál es la columna de la tabla
en la que estará nuestro codón.

La fila y la columna de los pasos 1 y 2 intersectan en una sola casilla en la tabla de


codones, una que contiene 4 codones. Con frecuencia, lo más fácil es simplemente mirar
estos cuatro codones para saber cuál es el que estás buscando.

Sin embargo, si quieres usar la estructura de la tabla al máximo, puedes usar el tercer eje
(del lado derecho de la tabla) que corresponda con la casilla en la que intersectan las
primeras dos letras. Al encontrar el tercer nucleótido del codón en el eje puedes identificar
la fila exacta dentro de la casilla en la que se encuentra nuestro codón. Por ejemplo, si
buscamos G en este eje encontramos que CAG codifica el aminoácido glutamina (Gln).
Tabla del código genético. Cada secuencia de tres letras de nucleótidos de ARNm
corresponde a un aminoácido en específico o a un codón de terminación. UGA, UAG y
UAA son codones de terminación. AUG es el codón de metionina además de ser el codón
de inicio.

_Crédito de la imagen: "The genetic code", de OpenStax College, Biología (CC BY 3.0)_

Observa como en la tabla muchos aminoácidos están representados por más de un


codón. Como ejemplo, hay seis formas distintas de "escribir" leucina en el lenguaje del
ARNm (trata de ver si puedes encontrar las seis).

Una característica importante del código genético es que es universal. Es decir, con
pequeñas excepciones, prácticamente todas las especies (desde las bacterias hasta tú
mismo) usan el código genético que se muestra arriba para la síntesis de protéinas.

Marco de lectura

Para llegar de un ARNm a una proteína de manera fiable, necesitamos un concepto


adicional: el de marco de lectura. El marco de lectura determina cómo se divide la
secuencia de ARNm en codones durante la traducción.

Ese es un concepto bastante abstracto, así que examinemos un ejemplo para entenderlo
mejor. El ARNm a continuación puede codificar tres proteínas totalmente diferentes,
según el marco de lectura con el que se lea.

Secuencia de ARNm: 5'-UCAUGAUCUCGUAAGA-3'

Lectura en el marco 1:

5'-UCA UGA UCU CGU AAG A-3'

Ser-ALTO-Ser-Arg-Lys

Lectura en el marco 2:

5'-U CAU GAU CUC GUA AGA-3'

His-Asp-Leu-Val-Arg

Lectura en el marco 3:

5'-UC AUG AUC UCG UAA GA-3'

Met (inicio)-Ile-Ser-ALTO

La posición del codón de inicio asegura que se elija el marco 3 para traducir el ARNm.

Así, ¿cómo sabe una célula cuál de estas proteínas hacer? La clave es el codón de inicio.
Puesto que la traducción comienza en el codón de inicio y sigue en grupos sucesivos de
tres, la posición del codón de inicio asegura que el ARNm se lea en el marco correcto (en
el ejemplo anterior, el marco 3).

Las mutaciones (cambios en el ADN) que insertan o eliminan uno o dos nucleótidos
pueden cambiar el marco de lectura y causan la producción de una proteína incorrecta
"aguas abajo" del lugar de la mutación:

La ilustración muestra una mutación de marco de referencia donde el marco de lectura se


altera por la deleción de dos aminoácidos.

_Crédito de la imagen; "El código genético: Figura 3," por OpenStax College, Biology, CC
BY 4.0._

¿Cómo se descubrió el código genético?

La historia de cómo se descubrió el código genético es bastante genial y épica. Hemos


guardado nuestra versión en la siguiente sección emergente con el fin de no distraerte si
tienes prisa. Sin embargo, si tienes un poco de tiempo, sin duda es una lectura
interesante. [El descubrimiento del código genético]

Descubrimiento del código

Para descifrar el código genético, los investigadores necesitaban averiguar cómo las
secuencias de nucleótidos de una molécula de ADN o ARN podían codificar la secuencia
de aminoácidos de un polipéptido.

¿Por qué era esto un problema difícil? Imaginemos un código muy simple para darnos
una idea. En este código, cada nucleótido en la molécula de ADN o ARN puede codificar
un aminoácido en una proteína. Pero en realidad este código no puede funcionar ya que
comunmente existen 20202020 animoácidos en las proteínas y solo 4444 bases de
nucleótidos en el ADN o ARN.

Entonces, el código tenía que implicar algo más complejo que una correspondencia de
uno a uno entre los nucleótidos y los aminoácidos. ¿Pero qué?

La hipótesis del triplete

A mediados de la década de 1950, el físico George Gamow amplió esta línea de


pensamiento y predijo que probablemente el código genético estaba compuesto de
tripletes de nucleótidos1^11start superscript, 1, end superscript. En otras palabras,
propuso que un grupo de 3333 nucleótidos en un gen podrían codificar un aminoácido en
una proteína.

El razonamiento de Gamow era que incluso un código de dobletes (2222 nucelótidos por
aminoácido) tampoco funcionaría, puesto que solo permitiría 16161616 grupos ordenados
de nucleótidos (424^2424, start superscript, 2, end superscript), insuficientes para
representar los 20202020 aminoácidos que normalmente se usan para generar proteínas.
No obstante, un código basado en tripletes parecía prometedor: dicho código permite
64646464 secuencias únicas de nucleótidos (434^3434, start superscript, 3, end
superscript), más que suficientes para cubrir los 20202020 aminoácidos.

Gamow tenía algunas otras ideas no tan correctas sobre cómo se leería el código (por
ejemplo, pensaba que los tripletes se traslapaban, y ahora sabemos que no es el
caso)1^11start superscript, 1, end superscript. Sin embargo, su idea principal —que un
código de tripletes era lo "mínimo" que podría cubrir todos los aminoácidos— resultó ser
correcta.

There are 16161616 unique groups of nucleotides if a doublet code is used, and 64646464
unique groups if a triplet code is used. Why is this the case? Let's take a closer look at the
math behind these statements.

Doublet code

Let’s look at the doublet code first. In a doublet code, an ordered group of two nucleotides
codes for one amino acid. How many such groups of two nucleotides can we make? We
know that there are 4444 different possibilities for each of the 2222 nucleotides in the
doublet (A, T, C, and G, if we use DNA bases).

If we put an A in the first position, then any of the four other nucleotides can occupy the
second position, resulting in four combinations (AA, AT, AG, AC) that begin with an A. We
can repeat this for T (TT, TA, TC, TG), C (CC, CT, CA, CG), and G (GG, GC, GT, GA). If
we count all of these possibilities, we'll find that there are 16161616 of them in total.

You may find it faster and more foolproof to use a mathematical shortcut to quickly answer
this type of question. Because we know there are 4 possible nucleotides for each position
in the doublet, and because the order of the two slots matters, we can use the rules of
permutations to calculate the number of possible groups as follows:

(4444 possibilities for the first slot) ⋅\cdot⋅dot (4444 possibilities for the second slot)
===equals

4⋅4=164 \cdot4 = 164⋅4=164, dot, 4, equals, 16 possible ordered groups

Triplet code

What about the triplet code? In this case, we can use the same mathematical reasoning,
but must add an additional slot to our setup. There are now 3333 positions to fill, and each
can be occupied by any of the four bases (A, T, C, or G). Since there are 4444 possible
choices for each position, we can multiply as follows:

(4444 possibilities for the first slot) ⋅\cdot⋅dot (4444 possibilities for the second slot)
⋅\cdot⋅dot (4444 possibilities for the third slot) ===equals

4⋅4⋅4=644 \cdot 4 \cdot 4 =644⋅4⋅4=644, dot, 4, dot, 4, equals, 64 possible ordered groups

La correspondencia entre codones y aminoácidos


La hipótesis de tripletes de Gamow parecía lógica y se aceptó ampliamente. Sin embargo,
no se había probado experimentalmente y los investigadores seguían sin saber cuales
eran los tripletes de nucleótidos correspondientes a cada aminoácido.

En 1961 se comenzó a descifrar el código genético con el trabajo del bioquímico


estadounidense Marshall Nirenberg. Por primera vez, Nirenberg y sus colegas fueron
capaces de identificar los tripletes específicos de nucleótidos que correspondían a
aminoácidos en particular. Su éxito se debió a dos innovaciones experimentales:

Una manera de generar moléculas de ARNm artificial con secuencias específicas y


conocidas.

Un sistema para traducir ARNm en polipéptidos fuera de la célula (un sistema "libre de
células"). El sistema de Nirnberg estaba compuesto de citoplasma de células lisadas de E.
coli, las cuales contienen todos los materiales necesarios para la traducción.

Primero, Nirenberg sintetizó una molécula de ARNm compuesta únicamente del


nucleótido uracilo (llamada poli-U). Al añadir ARNm de poli-U al sistema libre de células,
encontró que los polipéptidos generados estaban compuestos exclusivamente del
aminoácido fenilalanina. Puesto que en el ARNm de poli-U solo hay tripletes UUU,
Nirenberg concluyó que UUU debía codificar para fenilalanina2^22start superscript, 2, end
superscript. Usando la misma técnica, demostró que el ARNm de poli-C se traducía en
polipéptidos compuestos exclusivamente del aminoácido prolina, lo que sugería que el
triplete CCC podría codificar para prolina2^22start superscript, 2, end superscript.

mRNA sequence: 5'-...UUUUUUUUUUUU...-3' (poly-U mRNA)

UUU →\rightarrow→right arrow phenylalanine (Phe)

Polypeptide sequence: (N terminus)...Phe-Phe-Phe-Phe...(C terminus)

Otros investigadores, como el bioquímico Har Gobind Khorana en la Universidad de


Wisconsin, ampliaron el experimento de Nirenberg al sintetizar ARNm artificiales con
secuencias más complejas. Por ejemplo, en un experimento Khorana generó un ARNm
poli-UC (UCUCUCUCUC…) y lo agregó a un sistema libre de células similar al de
Nirenberg3,4^{3,4}3,4start superscript, 3, comma, 4, end superscript.

El ARNm poli-UC se tradujo en polipéptidos con un patrón que alterna los


aminoácidos serina y leucina. Estos y otros resultados confirmaron que el código genético
se basa en tripletes o codones. Hoy sabemos que la serina está codificada por el codón
UCU, mientras que la leucina está codificada por CUC.

mRNA sequence: 5'-...UCUCUCUCUCUC...-3' (poly-UC mRNA)

UCU →\rightarrow→right arrow serine (Ser)

CUC →\rightarrow→right arrow leucine (Leu)


Polypeptide sequence: (N terminus)...Ser-Leu-Ser-Leu...(C terminus)

En 1965, con ayuda del sistema libre de células y otras técnicas, Nirenberg,
Khorana y sus colegas ya habían descifrado completamente el código genético. Esto es,
ya habían identificado el aminoácido o señal de "alto" correspondiente a cada uno de los
64646464 codones de nucleótidos. Por sus contribuciones, Nirenberg y Khorana (junto
con otro investigador del código genético, Robert Holley) recibieron el premio Nobel en
1968.

Siempre me gusta imaginar lo fabuloso que hubiera sido ser una de las personas que
descubrió el código molecular básico de la vida. Aunque ahora ya conocemos el código,
hay muchos otros misterios biológicos que esperan ser resueltos (¡tal vez por ti!).

Vous aimerez peut-être aussi