Académique Documents
Professionnel Documents
Culture Documents
El código genético relaciona los grupos de nucleótidos en un ARNm con los aminoácidos
en una proteína. Codones de inicio, codones de terminación, marco de lectura.
Introducción
¿Alguna vez le has escrito un mensaje secreto a alguno de tus amigos? Si es así, tal vez
hayas usado algún código para mantener el mensaje oculto. Por ejemplo, tal vez hayas
reemplazado letras de las palabras con números o símbolos siguiendo un conjunto
particular de reglas. Para que tu amigo pueda entender el mensaje, es necesario que
conozca el código y aplique el mismo conjunto de reglas, en reversa, para decodificarlo.
Los genes que contienen instrucciones para generar proteínas se expresan en un proceso
de dos pasos.
Si esto es un nuevo concepto para ti, quizás quieras aprender más viendo el video sobre
transcripción y traducción.
Codones
Las células decodifican el ARNm al leer sus nucleótidos en grupos de tres, conocidos
como codones. A continuación, algunas características de los codones:
Un codon de "inicio", AUG, marca el comienzo de una proteína y además codifica para
el aminoácido metionina.
5'-AUGAUCUCGUAA-5'
La traducción implica leer los nucleótidos del ARNm en grupos de tres, cada uno de los
cuales especifican un aminoácido (o proporciona una señal de terminación que indica que
ha finalizado la traducción).
Los dos extremos de una cadena de ADN o ARN son diferentes entre sí. En otras
palabras, las moléculas de ADN y ARN tienen direccionalidad.
En el otro extremo, llamado extremo 3', sobresale el hidroxilo del último nucleótido
añadido a la cadena. El grupo hidroxilo se encuentra unido con el carbono 3' del anillo del
azúcar y es por lo que se llama extremo 3'.
Para ver cómo funciona la tabla de codones vamos a hacer un ejemplo. Supongamos que
nos interesa el codón CAG y queremos saber qué aminoácido codifica.
Primero vemos el lado izquierdo de la tabla. El eje del lado izquierdo indica la primera
letra del codón, por lo que buscamos C en el eje izquierdo. Esto nos dice cuál es la fila
(amplia) de la tabla en la que estará nuestro codón.
Después vemos el borde superior de la tabla. El eje superior indica la segunda letra del
codón, por lo que buscamos A en dicho eje. Esto nos dice cuál es la columna de la tabla
en la que estará nuestro codón.
Sin embargo, si quieres usar la estructura de la tabla al máximo, puedes usar el tercer eje
(del lado derecho de la tabla) que corresponda con la casilla en la que intersectan las
primeras dos letras. Al encontrar el tercer nucleótido del codón en el eje puedes identificar
la fila exacta dentro de la casilla en la que se encuentra nuestro codón. Por ejemplo, si
buscamos G en este eje encontramos que CAG codifica el aminoácido glutamina (Gln).
Tabla del código genético. Cada secuencia de tres letras de nucleótidos de ARNm
corresponde a un aminoácido en específico o a un codón de terminación. UGA, UAG y
UAA son codones de terminación. AUG es el codón de metionina además de ser el codón
de inicio.
_Crédito de la imagen: "The genetic code", de OpenStax College, Biología (CC BY 3.0)_
Una característica importante del código genético es que es universal. Es decir, con
pequeñas excepciones, prácticamente todas las especies (desde las bacterias hasta tú
mismo) usan el código genético que se muestra arriba para la síntesis de protéinas.
Marco de lectura
Ese es un concepto bastante abstracto, así que examinemos un ejemplo para entenderlo
mejor. El ARNm a continuación puede codificar tres proteínas totalmente diferentes,
según el marco de lectura con el que se lea.
Lectura en el marco 1:
Ser-ALTO-Ser-Arg-Lys
Lectura en el marco 2:
His-Asp-Leu-Val-Arg
Lectura en el marco 3:
Met (inicio)-Ile-Ser-ALTO
La posición del codón de inicio asegura que se elija el marco 3 para traducir el ARNm.
Así, ¿cómo sabe una célula cuál de estas proteínas hacer? La clave es el codón de inicio.
Puesto que la traducción comienza en el codón de inicio y sigue en grupos sucesivos de
tres, la posición del codón de inicio asegura que el ARNm se lea en el marco correcto (en
el ejemplo anterior, el marco 3).
Las mutaciones (cambios en el ADN) que insertan o eliminan uno o dos nucleótidos
pueden cambiar el marco de lectura y causan la producción de una proteína incorrecta
"aguas abajo" del lugar de la mutación:
_Crédito de la imagen; "El código genético: Figura 3," por OpenStax College, Biology, CC
BY 4.0._
Para descifrar el código genético, los investigadores necesitaban averiguar cómo las
secuencias de nucleótidos de una molécula de ADN o ARN podían codificar la secuencia
de aminoácidos de un polipéptido.
¿Por qué era esto un problema difícil? Imaginemos un código muy simple para darnos
una idea. En este código, cada nucleótido en la molécula de ADN o ARN puede codificar
un aminoácido en una proteína. Pero en realidad este código no puede funcionar ya que
comunmente existen 20202020 animoácidos en las proteínas y solo 4444 bases de
nucleótidos en el ADN o ARN.
Entonces, el código tenía que implicar algo más complejo que una correspondencia de
uno a uno entre los nucleótidos y los aminoácidos. ¿Pero qué?
El razonamiento de Gamow era que incluso un código de dobletes (2222 nucelótidos por
aminoácido) tampoco funcionaría, puesto que solo permitiría 16161616 grupos ordenados
de nucleótidos (424^2424, start superscript, 2, end superscript), insuficientes para
representar los 20202020 aminoácidos que normalmente se usan para generar proteínas.
No obstante, un código basado en tripletes parecía prometedor: dicho código permite
64646464 secuencias únicas de nucleótidos (434^3434, start superscript, 3, end
superscript), más que suficientes para cubrir los 20202020 aminoácidos.
Gamow tenía algunas otras ideas no tan correctas sobre cómo se leería el código (por
ejemplo, pensaba que los tripletes se traslapaban, y ahora sabemos que no es el
caso)1^11start superscript, 1, end superscript. Sin embargo, su idea principal —que un
código de tripletes era lo "mínimo" que podría cubrir todos los aminoácidos— resultó ser
correcta.
There are 16161616 unique groups of nucleotides if a doublet code is used, and 64646464
unique groups if a triplet code is used. Why is this the case? Let's take a closer look at the
math behind these statements.
Doublet code
Let’s look at the doublet code first. In a doublet code, an ordered group of two nucleotides
codes for one amino acid. How many such groups of two nucleotides can we make? We
know that there are 4444 different possibilities for each of the 2222 nucleotides in the
doublet (A, T, C, and G, if we use DNA bases).
If we put an A in the first position, then any of the four other nucleotides can occupy the
second position, resulting in four combinations (AA, AT, AG, AC) that begin with an A. We
can repeat this for T (TT, TA, TC, TG), C (CC, CT, CA, CG), and G (GG, GC, GT, GA). If
we count all of these possibilities, we'll find that there are 16161616 of them in total.
You may find it faster and more foolproof to use a mathematical shortcut to quickly answer
this type of question. Because we know there are 4 possible nucleotides for each position
in the doublet, and because the order of the two slots matters, we can use the rules of
permutations to calculate the number of possible groups as follows:
(4444 possibilities for the first slot) ⋅\cdot⋅dot (4444 possibilities for the second slot)
===equals
Triplet code
What about the triplet code? In this case, we can use the same mathematical reasoning,
but must add an additional slot to our setup. There are now 3333 positions to fill, and each
can be occupied by any of the four bases (A, T, C, or G). Since there are 4444 possible
choices for each position, we can multiply as follows:
(4444 possibilities for the first slot) ⋅\cdot⋅dot (4444 possibilities for the second slot)
⋅\cdot⋅dot (4444 possibilities for the third slot) ===equals
4⋅4⋅4=644 \cdot 4 \cdot 4 =644⋅4⋅4=644, dot, 4, dot, 4, equals, 64 possible ordered groups
Un sistema para traducir ARNm en polipéptidos fuera de la célula (un sistema "libre de
células"). El sistema de Nirnberg estaba compuesto de citoplasma de células lisadas de E.
coli, las cuales contienen todos los materiales necesarios para la traducción.
En 1965, con ayuda del sistema libre de células y otras técnicas, Nirenberg,
Khorana y sus colegas ya habían descifrado completamente el código genético. Esto es,
ya habían identificado el aminoácido o señal de "alto" correspondiente a cada uno de los
64646464 codones de nucleótidos. Por sus contribuciones, Nirenberg y Khorana (junto
con otro investigador del código genético, Robert Holley) recibieron el premio Nobel en
1968.
Siempre me gusta imaginar lo fabuloso que hubiera sido ser una de las personas que
descubrió el código molecular básico de la vida. Aunque ahora ya conocemos el código,
hay muchos otros misterios biológicos que esperan ser resueltos (¡tal vez por ti!).