Académique Documents
Professionnel Documents
Culture Documents
Gramtica? y Gentica?
El estudio de la gramtica y la preparacin de normas
gramaticales han sido, desde los primeros estatutos
acadmicos, un complemento imprescindible a la
elaboracin de diccionarios: en el diccionario se
de-finen las palabras; en la gramtica se explica la
forma en que los elementos de la lengua se enlazan
para formar textos y se analizan los significados de
estas combinaciones.
http://www.rae.es/obras-academicas/gramatica#sthash.msVo2Ow3.dpuf
Elementos de la Gramtica
Nueva Gramtica de la Lengua Espaola
(2009-2011).
a. morfologa, analiza la estructura de las
palabras, su constitucin interna y
variaciones.
b. sintaxis, forma en que se ordenan y
combinan.
c. fontica y fonologa, sonidos del habla y su
organizacin lingstica.
SECUENCIAS PALNDROMAS
AACGAACGACTAGCATAGATAGAGATAGACATAGACA
TAGCATCAGCATCAGCATAGCAGCAGCATAGCATCAG
CAGCAGTCTACACAGACATAGATAGATAGCATAGATAG
ATGATACGATAGACTAGAGATCAGATCAGCACTAGCAC
TACGACTAGACTAGAGAAGAAACGACTACGAGGACT
ACGACAGCATCACAC
Buscar patrones
Interpretarlos biolgicamente
http://www.geneprediction.org/book/Comparative.ppt
ATAGGACTAGACTAGCATAGATGACG
AACGTGGGAGAGAGAGGAGAGTAGCA
Podemos identificar
Genes
Limites de exones
Sitios de splicing
Inicio y fin de la traduccin
Splicing alternativo
Elementos regulatorios
Mtodos experimentales
Objetivos primarios
Mtodos computacionales
Objetivos secundarios
La morfologa
Seal Shine-Delgarno
5'-TATAAT-3
Promotor
Secuencia
codificante
CDS
Terminador
ADN genmico
transcripcin
ARNm
Imagen superior from Purves et al., Life: The Science of Biology, 4th Edition, by Sinauer Associates (www.sinauer.com) and WH Freeman
(www.whfreeman.com)
La morfologa
SEAL
CONTENIDO
Codn de Inicio
Uso de Codn
dependiente de la especie
Frecuencia k-mers
dependiente de la especie
Codn Termino
La morfologa
La morfologa
SEAL
CONTENIDOS
Inicio Transcripcional
regiones circundantes a
Codn Start (CpG islands)
ATG, regiones circundantes
(Seq Kozak: CCGCCATGG)
dependiente de la especie
preferencia por un
nucletido especfico (G,C)
dependiente de la especie
GT(AAGT)
(Py)12NCAG
TGA, TAA, TAG
CAATAA(T/C)
Codn de Inicio
Uso de Codn
Tercera Posicin del Codn
Frecuencia k-mers
5' Splice Junction
3' Splice Junction
Codn de Termino
Seal Poly-A
Genoma
Procaritico
0.5 10 Mpb
Facilidad en el anlisis de
ORF.
Genoma
Eucaritico
10Mpb 670 Gpb
Baja densidad gnica : <3%
regiones codificantes
Alta frecuencia de secuencias
repetitivas y elementos
transposables
Organizacin exn intrn.
ORF
http://ghr.nlm.nih.gov/glossary=openreadingframe
http://www.kazusa.or.jp/codon/
Data source
NCBI-GenBank Flat File Release 160.0 [June 15 2007].
Data amount
35,799 organisms
3,027,973 complete protein coding genes (CDS's)
galago
chimpanzee human
rat
mouse
dog
human:
chimp:
cow:
dog:
galago:
rat:
mouse:
cow
AAGGGAAGACAGGTGAGGGTCAAGCCCCAGCAAGTGCACCCAG------------ACACC
AAGGGAAGACAGGTGAGGGTCAAGCCCCAGCAAGTGCACCCAG------------ACACC
AAGGGAAGACATTTACGAGTCAAGCCACAGAAAGAGCCCCTGAG-----------GTGCC
AAAGGAGGACATGTGAGGGCCAAACTACTGAAGGTTCAACCAGG-----------ATGCT
AAGGGGAGACAGGGGAGGGTCACACCATGGCAGAGG--CCAAG------------ACAGC
AAAGGAAACAATGGGAAGGTTA-TCAACTCCAAGTATGCCCAAGATCAAGGGAACCCCTT
AAAGGAAACCACTGGGAGGTTA-GAAATCACAGGTGCACCCAAGATCAAGGAA--CCCCT
Prediccin de Genes
aatgcatgcggctatgctaatgcatgcggctatgctaagctgggatccgatgacaatgcatgcggctatgc
taatgcatgcggctatgcaagctgggatccgatgactatgctaagctgggatccgatgacaatgcatgcg
gctatgctaatgaatggtcttgggatttaccttggaatgctaagctgggatccgatgacaatgcatgcggct
atgctaatgaatggtcttgggatttaccttggaatatgctaatgcatgcggctatgctaagctgggatccga
tgacaatgcatgcggctatgctaatgcatgcggctatgcaagctgggatccgatgactatgctaagctgcg
gctatgctaatgcatgcggctatgctaagctgggatccgatgacaatgcatgcggctatgctaatgcatgc
ggctatgcaagctgggatcctgcggctatgctaatgaatggtcttgggatttaccttggaatgctaagctg
ggatccgatgacaatgcatgcggctatgctaatgaatggtcttgggatttaccttggaatatgctaatgcat
gcggctatgctaagctgggaatgcatgcggctatgctaagctgggatccgatgacaatgcatgcggctat
gctaatgcatgcggctatgcaagctgggatccgatgactatgctaagctgcggctatgctaatgcatgcgg
ctatgctaagctcatgcggctatgctaagctgggaatgcatgcggctatgctaagctgggatccgatgaca
atgcatgcggctatgctaatgcatgcggctatgcaagctgggatccgatgactatgctaagctgcggctat
gctaatgcatgcggctatgctaagctcggctatgctaatgaatggtcttgggatttaccttggaatgctaag
ctgggatccgatgacaatgcatgcggctatgctaatgaatggtcttgggatttaccttggaatatgctaatg
catgcggctatgctaagctgggaatgcatgcggctatgctaagctgggatccgatgacaatgcatgcggc
tatgctaatgcatgcggctatgcaagctgggatccgatgactatgctaagctgcggctatgctaatgcatg
cggctatgctaagctcatgcgg
Gen!