Genómica

Genómica
• • • • • Introducción ¿Qué es el genoma? ¿Cómo se estudia? (actualmente) ¿Qué se ha ido aprendiendo? ¿Qué impacto tiene en la ciencia y en la biotecnología?

1

Introducción
¿qué vamos a estudiar? ES MUY IMPORTANTE TENER CLARO EL OBJETIVO DE LO QUE SE HACE O ESTUDIA ¿POR QUÉ? Y ¿PARA QUÉ?

Secuenciación de ADN

Obtención de la secuencia

Desarrollo tecnológico de secuenciadores

Anotación de la secuencia

Interpretación de los resultados

Desarrollo tecnológico de software

2

¿Qué es el genoma?
• Conjunto de todos el material genético de un organismo
– Material en forma de ADN (ARN en algunos virus) – Material en el núcleo (o en orgánulos como mitocondrias, cloroplastos, etc) – Diferencias en línea inmune – Diferencias en procesos oncogénicos – ¿existen otras diferencias?
• Acortamiento de telómeros • Mutaciones somáticas

• Material estable durante toda la vida del organismo

• Material igual en todos los individuos de la especie
– Mutaciones y polimorfismo – Haplotipos en un mismo individuo – Polimorfismos de tamaño cromosómico

Tamaño del material genético

3

Tamaño del material genético

(1 pg = aprox. 109 bp)

Tamaño del material genético
• • Tamaño de los genomas virales
– Virus 50.000 pb (50 Kb)

Tamaño de genomas nucleares
– Bacterias 3.500.000 pb (3.5 Mb ó 3.500 Kb)
• 580.074 Mycoplasma genitalium • 9.703.676 Burkhorderia xenovorans • Protozoos. 190 Mpb Tetrahymena • Hongos. De 12 a 60 Mpb
– –

– Eucariontes

– Phycomyces blakesleeanus 60 mbp (?) • Animales
– – –

Saccharomyces cerevisiae 12 Mpb Pleurotus ostreatus 35 Mpb

Invertebrados: 100 – 5000 Mbp (Locusta migratoria) Vertebrados: 300 – 3000 Mbp (Homosapiens 3300 Mbp) Genomas de 100 a 120.000 Mbp (Fritillaris imperiallis)

• Plantas

4

Tamaño de los genomas mitocondriales
13 – 22 kpb 19 kpb 100 kpb P. anserina

80 kpb A. aegerita

69 kpb

Tamaño de los genomas mitocondriales
187 kpb 570 kpb en Z. mays

5

Tamaño genoma de orgánulos
• Cloroplastos
– De 120 a 160 kpb
• En geranio (Pelargonium) 270 Kpb

– Poliploides de 2 a 100 copias por cloroplasto (de 400 a 10.000 copias por célula) – Contienen unos 130 genes

• Mitocondrias

• Transferencia de genes al núcleo

– Plantas: 195 a 2500 kpb con aprox. 100 genes – Animales: de 13 a 60 kpb, con unos 40 genes – Hongos. De 80 a 100 kpb con unos 40 – 50 genes – TRANSFERENCIA DE GENES AL NUCLEO
• El máximo es 60 kpb con unos 100 genes

Secuenciación de ADN
Secuenciación de genes Secuenciación de genomas

6

Secuenciación de ADN

Reacciones de Sanger

Secuenciación de ADN

Reacciones de Sanger

7

Secuenciación de ADN

Reacciones de Sanger

Archivo de texto de ordenador

Secuenciación de ADN

Requerimientos 1. Fragmento de ADN clonado en un vector o producto de PCR 2. Posición de unión de cebadores específicos para la reacción (Primers de PCR primers de secuenciación en vectores)

• Se pueden llegar a leer hasta 700 pb por reacción

8

Secuenciación de genomas completos

Dos estrategias. Secuenciación dirigida (Map based) Secuenciación no dirigida (WSG) Se necesita: ADN purificado y clonado en vectores de gran capacidad de clonaje

9

Secuenciación a partir de un punto determinado: Requiere el mapeo genético del punto de partida para la secuenciación

Estrategia lenta y costosa Estrategia muy segura Consorcio público de secuenciación del genoma humano

10

11

Pasos para la secuenciación de un genoma
1. 2. 3. 4.

Desarrollar un mapa genético de alta densidad Construir genotecas de insertos grandes Construir un mapa físico Secuenciar (WSG, Secuenciación dirigida o secuenciación mixta)

5. 6.
• •

Ensamblaje de la secuencia usando Phred, Phrap y Consed Terminar la secuenciación
Resolución de gaps Orientación de los contigs

Frecuentemente se hacen varias secuenciaciones usando diferentes vectores

12

Cálculo del número de clones necesarios en una genoteca: N= ln (1-P) / ln (1-f) Donde P es la probabilidad de encontrar un gen determinado y f es el cociente del tamaño del inserto sobre el tamaño total del genoma

Cobertura de una genoteca: Número de clones x tamaño clones Tamaño del genoma

13

Ejemplo Para un genoma con tamaño de 3 Mpb, si el Inserto tiene un tamaño de 150 Kpb, la probabilidad de encontrar representado un gen determinado en una genoreca de 100 BACs es de 0.994 (9.4%)

BAC library for Pleurotus

ostreatus

• 1152 clones con un inserto de 125 kpb en promedio que suponen un 4X de cobertura del genoma
– (1152 X 125) / 35000 = 4.11 veces representado

• 3552 clones con un inserto de 150 kpb en promedio que suponen un 13X de cobertura del genoma
– (3552 x 150) / 35000 = 15.223 – La diferencia entre 13X y 15.2X se debe a la existencia de clones sin inserto en la genoteca de 150 kbp

14

15

Contig • Se trata de una secuencia contigua que puede ser leía a través de varias secuencias individuales solapantes o que presentan fingerprints correspondientes • Los contigs están flanqueados por regiones de difícil secuenciación tales como regiones de ADN repetitivo, de baja complejidad, etc. Los contigs pueden orientarse sobre el mapa físico; pero no pueden encadenarse Sin haber “cerrado” el gap que existe entre ellos

EST: Expressd Sequence Tags Secuencias de ARN expresadas en un tejido o en unas condiciones concretas. Puede tratarse de genes completos, aunque, por lo general, se trata sólo de unos pocos cientos de bases. Pueden corresponder a genes de copia única o a genes de familias .

16

17

18

19

20

Anotación del Genoma

0.0kb

50.0kb

100.0kb

150.0kb

200.0kb

250.0kb

21

Identificación de marcadores

Anotación del genoma
• A nivel de nucleótido
– Determinar inicio y fin del gen – Determinar intrones y exones

• Anotación de proteínas
– Determinar la estructura – Determinar la función

• Anotación de procesos
– Determiar interacciones y procesos

22

Anotación de nucleótidos
• Mapeo genético • Identificación de marcadores
– e-PCR – BlastN – Integración de la secuencia en mapas citogenéticos (hibridaciíon de fluorescencia) – Densidad de genes
• • • • Bacterias 85% Levaduras 70% Insectos <25% Mamíferos <5%

• Identificación de genes

– Identificación basada en similitud Blast – Identificación basada en predicción

• Sistemas de predicción de elementos simples EXON • Sistemas basados en redes neurales (Grail) • Sistemas basados en Modelos de Markov (Glimmer HMM, Softberry, etc.) • Conceptos de Sensibilidad y Especificidad

Anotación de nucleótidos
• Niveles actuales
– Sensibilidad: 40% – Especificidad: 30%

23

Secuencia problema

>= 200

80 - 200

24

>= 200

80 - 200

R4425
15

mpt1
9 4 1 4 3 3 1 4 1 15

L16875 S191250

P122150 L191750 cpa1 rpl44-2 R13525 P192000 P11825 R72700 L7825 P9400 R191300

P42550
9 5

R141750 P91400 P91500 poh2

25

26

27

28

Anotación de nucleótidos
• Non-coding RNAs
– RNA ribosomal – RNA transferencia – RNA nuclear y nucleolar

• Elementos repetitivos • Duplicaciones segmentales • Variaciones

29

Genome analysis and sequencing
Pleurotus ostreatus
(oyster mushroom)

30

Pasos para determinar el genoma de un organismo
• Información preliminar
– – – – – – Tamaño del genoma Cariotipo Mapas de ligamiento Contenido de G+C Mapas físicos Secuencias parciales Conocimiento avanzado de la biología y genética del organismo

Metagenomas: • la secuenciación de organismos no cultivables • “Genoma del suelo” • “Genoma de ambientes especiales”

Genetics and Cellular Biology of Basidiomycetes - VI

Life cycle of an agarical
Basidiospore (n) Monokaryotic hypha (n) a b c d e f Clamp connection
MITOSIS

Dikaryotic hypha
APICAL GROWTH OF THE DIKARYON FUSSION OF COMPATIBLE MYCELIA

Monokaryotic hypha (n)

Monokaryotic mycelium

MONOKARYOTIC GROWTH

Dicaryotic mycelium (n+n)
FRUITING

Germinating tube (n)
SPORULATION

Hymenium
MEIOSIS NUCLEAR FUSSION

Environmental factors: Light CO2

Basidiospore (n)

etc.

Basidium Fertile hymenial hyphae (tips)

Fruit Body (n+n)

M. Peñas, 1999

Pamplona, Jume 2005

31

Pasos para determinar el genoma de un organismo
• Información preliminar
– – – – – – Cariotipo Tamaño del genoma Mapas de ligamiento Contenido de G+C Mapas físicos Secuencias parciales

Molecular karyotype of

Pleurotus ostreatus

32

Molecular karyotype of P. ostreatus
PFGE separation of the chromosomes
A
Clamp connection f

Dikaryon N001
Basidiospore (n) Monokaryotic hypha (n) a b c d e
MITOSIS

Dikaryotic hypha
APICAL GROWTH OF THE DIKARYON FUSSION OF COMPATIBLE MYCELIA

B
PC-9 PC-15

Size markers (Mbp)

N001 PC-9 PC-15

Monokaryotic hypha (n)

Protoplasts
5.7

_ _ _ _ _ _ _ _ _ _
I-II III I-III II IV V VI VII-VIII VI-VIII IX IX X XI X XI IV-V VII

Monokaryotic mycelium

MONOKARYOTIC GROWTH

Dicaryotic mycelium (n+n)
FRUITING

Germinating tube (n)
SPORULATION

Hymenium
MEIOSIS NUCLEAR FUSSION

Environmental factors: Light CO2

Basidiospore (n)

etc.

Monokaryotic protoclones

4.6 3.5

Basidium Fertile hymenial hyphae (tips)

Fruit Body (n+n)

3.1 2.7 2.4

M. Peñas, 1999

PC9

PC15

1.8 1.7 1.4 1.1

Molecular karyotype of P. ostreatus
vmh1 Rib matA cel1 mnp3 pox1 poh2 est1 matB vmh3 fbh1

Each chromosome can be identified using specific gene markers There is a pronounced chromosome length polymorphism in the N001 strain

33

Molecular karyotype of P. ostreatus
Chromosome number I II III IV V VI VII VIII IX X XI Total Chromosome size (Mbp) PC9 PC15 4.7 4.7 4.4 3.6 3.4 3.3 3.0 3.0 2.2 1.8 1.4 35.3 4.7 4.0 4.7 3.5 3.5 2.9 3.3 2.9 2.0 1.7 1.5 34.7 Difference in size (%) 0 15 -7 3 -3 12 -10 3 9 6 -7 2 Chromosome specific marker

vmh1 matA cel1 mnp3 pox1 poh2 est1 matB vmh3 fbh1
Rib

Genetic Linkage Map of

Pleurotus ostreatus

34

Dikaryon (N001)

Estado del marcador genético
acoplamiento repulsión A B C D E F G

2
1 1 1 1 0 0 1

6
1 1 0 1 0 1 1

9
0 0 1 0 0 0 1

11
0 0 1 0 1 0 0

Genetics and Cellular Biology of Basidiomycetes - VI

Molecular markers as tools to uncover genetic variability in genetic resources
• Isoenzymes, RAPDs, RFLP, SCARS • Microsatellites • ITS polymorphimsms

Pamplona, Jume 2005

35

Genetic linkage map of P. ostreatus

Chrom. I II III IV V VI VII VIII IX X XI Avg. Total
a

Size (Mbp) a 4.70 4.35 4.55 3.55 3.45 3.10 3.15 2.95 2.10 1.75 1.45 3.19 35.1

Size (cM) 103.0 173.6 178.7 59.2 82.0 76.7 74.4 85.3 74.5 33.8 59.5 91 1000

Markers number 23 23 25 14 13 20 18 14 16 13 10 16.7 189

Kb/cM 45.6 25.1 25.5 60.0 42.1 40.4 42.3 34.6 28.2 51.8 24.4 35.1 -

Average Marker Interval (cM) 4.5 7.5 7.1 4.2 6.3 3.8 4.1 6.1 4.7 2.6 5.9 5.3 -

Cross-over events 0.98 1.71 1.75 0.59 0.81 0.76 0.74 0.84 0.74 0.34 0.59 0.89 -

size (Mbp) is the average of the two protoclones

36

I
L182175

II
S71725

III
R7 2 400

IV
L8575 / P21150 / P13675 / S122425 8 mnp1 6

36

30

34

2 1 13
M V108

P9875* / P11950* MV090-1* cbh1-1* MV146* MV136* R91300* L21850* / P81875* MV019-2*

4 2 2 2 2 4 3 1 4 5 6 4 13

P121350 R12400 S172375 R11775 MV052-2 L5875 / L72025 / vmh1 R1775 MV087 MV126 MV112 R151025 L151125 / S17775 MV045 MV058 L111450 MV032-2 MV162

1 3 3 1 9 3 14

R202700 P9950 rXhoI / Rib / O17 MV011-2 MV044 L182900 / P162175 /R3 MV132-2 P131625 P17425

7 R3 9 75

1 1 3 1 3

L52525* R72225*

MV155* MV091* MV105*

26

R 3 3 625 11 1 1 1 1 3 4 1 P 11 8 50 L10 21 75 / L10 29 25 / R 4 92 5 / R20 1 50 0 L14 23 75 /R 11 67 5 M V057-2 M V015-1 P1 5 950 M V119 M V115 R19 2 10 0 R17 1 50 0

18 MV143* 5 1 L192525*/ R131425* MV145* MV028-1* MV113*

L42400 / L132575 / L161100 / S181175 MV138 MV054-2 MV097 P71525 S122075

L141800 / P19950 MV150-2 4 MV150-1

22

16

1 4 19

P1750 L7900 MV032-1 P151050 MV161-2*

R201400 10 R32475 8 R132175

1 4 3 4 3 1 3 1 14

P1 9 550 R8 5 75 M V133-2* P 17 1 42 5 * M V023* M V172* M V142* M V133-1 * m atA * / P 12 15 25 */ R3 8 50 * / S 11 97 5 * / S 18 12 75 * M V131-1* M V042* M V132-1* M V131-2*

V
MV094-3* 3 3 L15625 MV019-1* R151200

15

MV152*
P1 2 352 5 *

5 4 5 3 3 P131550 P31550* L111325 / mnp3 MV089 S192600 MV179 MV057-1 MV118 MV163-1 MV014 MV165 MV098-3 10

22

Mapping of the lamellae EST

1

P4 145 0 P5 122 5

6 3 2

18 R16 7 75

5 1 2 8

R153100 R101375 R151750 P11800 R21675 MV109

14 S71200

VI
pox C 5 3 5 6 1 1 1 5 1 1 1 3 3 5 cbhI-5 14 1 1 4 L151525 R3925 P131250 R11475 P4600 / R8775 / R17850 / pox 1 MV004-2 P14650 MV106 R6950 / R12925 MV011-1 MV174 MV054-1 P6950 R111875 L11075 / P192100 / R81475 / S7400 MV094-1 mnp2 hon2 MV046 MV104 S191475 cbhI-3/ cbhI-4 MV004-1 MV156 MV052-1 MV028-2

VII
R4425

VIII
R3 2050 9

IX
L141525 / P161525 MV098-1 8

XI
MV100-1

21
R4 2425 / S12 1550

15

P12950 7 P31375

M V052-3
26

MV163-3*

9 P122150 4 1 5 3 1 1 1 3 4 1 15 P42550 8 R141750 5 P91400 / P91500
1 5 S112325 MV116 MV093 R8 300 MV094-2 MV123 26

17

18
tel 3 L5850 Hind III*

L191750 M V128 M V090-2 R13525 P192000
4 4 4 3 1 2 4 3

1
vao MV148 R10 2100/ R10 2225 R20 650* / Est1 * P102325 / P15 1225 / P19 1425 L18 1200 / R11 575 MV033 MV092 R20 1950

S12800 13

11 4 8 3 1 MV028-3 R21600* matBα * / L31350* P11600* P22650*

P11825 L7825 / L16875 / P9400 / P171325 / R72700 / S181925 M V163-4 R191300 S191250

M V129 M V131-4 M V098-2

P62300* 4 1 3 1 1 1 3 8 R14700 fbh1 L22475 / R161200 MV084 R15575 R193300 / vmh2 MV110 MV081 MV163-2

18

1 1

P2 L61800/ R15675 matBβ / P2725 / P19525 / R32275
2100

MV114

30

21

X
MV100-2

L151275
L12600 P16400 / S161250 / S161275 / O3 S17825 vmh3 MV102 MV168 MV034 MV161-1 SSR9

1 3 5 3

38

Mapping of the lamellae EST

5 7 3 1 6 1 8 MV131-3 P82775 GP015 L51475 / R71450 / R92450 /L15.1125pst MV111 P61100 R41175

MV103 8 R121475/ R121500/ P122005 MV080 6 4 6 R161250 P191125 MV051

37

Dikaryon (N001)

2 QTLs FOR MONOKARYOTIC GROWTH
45,00 40,00 35,00 30,00 25,00 20,00 15,00 10,00 5,00 0,00 1 4 7

6

9

11

10 13 16 19 22 25 28 31 34 37 40 43 46 49 52 55 58 61 64 67 70 73 76 79

III II
R16 1250 * R7 2400

IV

L8575 mnp1

V

L15 625 R15 1200

I
L18 2175

P19 1125 P12 2025 R3 975 L10 2175 L14 2375 P15 950 R19 2100 R17 1500 P12 1350 R12 400 S17 R11 2375 775 vmh1 R1 775 R15 1025 L15 1125 L11 1450 L16 1100 P7 1525 S12 2075

P9875* R9 1300 *

Qdgre4 Qmgre1 Qmgrs1

L21850* L52525* * R7 2225

P13 1550 P31550 * mnp3 S19 2600

Qdgre10

S7 1725 P19 550 R8 575 P17 1425 * matA * P12 3525 * R20 2700 Rib P9 950 L18 2900 L19 2525*

R15 3100 P11 800 R2 1675

S7 1200

VI
pox C pox 1 P14 650

VII
R4 425

P1 750 Cap64 P15 1050

Qdgre7 Qdgre1

Qdgre8

P13 1625 P17 425

P4 1450 P5 1225

R12 925 P6 950 R11 1875 L1 1075 mnp2 Hon2 S19 1475

L14 1800

R16 775

P12 2150 L19 1750 L16 875 S19 1250

Qdgre5 Qdgre11

VIII
R3 2050 R4 2425 L15 1525 R3 925 P13
1250

P4 2550

Qdgre2

R20 1400

IX
R3 2475 R13 2175 L14 1525 P12 950 P3 1375

R1 1475

R14 1750 P9 1400

XI X
S12 800 L12600 P16400 S17825 vmh3 P6 2300* fbh1 L22475 vmh2 R14 700

R10 2100 Est1 * P10 2325 R11 575 R20 1950

Qmgre2 Qdgre3

Qmgrs2 Qdgre9

Qmgrs3 Qdgre6 Qdgre12

P1 1600* P2 2650* matB α * L51475 P61100 R4 1175 P82775

L15 1275

10 cM 10% (R 2 )

S11 2325 R8 300

P2 2100 L61800 matB β

38

I
SWL_1

II
L18217
5

III
R161250 * P191125 P122025 4 R724
00

IV
4,19,23,33 L8575
Y21_1 FFY21_1

VI
pox C 25 pox 1 P14650
P21_2 FFY15_1

VIII
R32050 6

14,24 1,2,11

P21_1

mnp 1 P9875*

8,32 26 R12925 P6950 CWL_2 FLE_3 R111875 L11075 20 mnp2 Hon2 34 S19
147 5

R42425

X
L12600 P16400 S17825 vmh3 13,17

R91300* NUM_1
COL_1

R3975 P12135
0 R12400 S172375 R11775 vmh1 R1775

L102175 L142375 P15950 R192100 R171500

L21850* L52525 * R72225 *

28

vao

R102100 Est1 * P102325 R11575 39 L192525* 27
152 R3 5 9 P13 25 125 0 R11475

R15102 L151125 5 L11145
0

5

S71725

19,23

35 L51475 P61100 COL_2 R41175 P82775 25,32

9

L15

L161100 P7152
5

20,34

P195 R8575 50 P171425 *

R20195
0

S122075

P15X21_1

CFW_1 FLE_1

matA * P1750 Cap64 P151050 R202700 Rib 28,30 P9950 L182900 29,36

P21_4

3

P123525 *

CWL_3

V
L15625 R151200 12

VII
R442
5

S112325 R8300 15,38

16,22,37

P131625 P17425

8 P41450 P51225 6,7,10,18, 21,26,31

IX
L141525
CFW_2 NUM_2 P15x21_2 FFY15_2 P21_3 Y15_1 P15_1 Y21_2 FFY21_2

29 7,9,18,31

XI
S12800

L141800 R16775 27

10,21 P131550 P31550 * mnp3 FLE_2 S192600

5

P12950 P31375

P12215 L19175 0
0 L16875 S191250

P62300* fbh1 L22475 vmh2 R14700 P11600 P22650 * * 2,30,37

39 1,3,14,2433,35

SWL_2

R201400 11

R15310
0 P11 800

36 P425
50

R32475 R132175

R21675

R14175
0

12

matBα *

13,17 L151275

P91400

CWL_1

S71200 P22100 L61800 matBβ 15,16,22,38

Cloning and sequencing of the central region of P. ostreatus chromosome VII
R4425
15

mpt1
9 4 1 4 3 3 1 4 1 15

P122150 L191750 R13525 P192000 P11825 R72700 L7825 P9400 R191300

cpa1

rpl44-2

L16875 S191250

P171325

S181925

P42550
9 5

R141750 P91400 P91500 poh2

CFW_2 NUM_2 P15X21_2 FFY15_2 P21_3 Y15_1 Y21_2 P15_1 FFY21_2 Qdgre5 Qdgre11

Pamplona, Jume 2005

39

Cloning and sequencing of the central region of P. ostreatus chromosome VII chromosome VII in PC15 (54303 bp)
SR1 0.0kb hp-c.neof hp-cyc hp-c.neof 20.0kb hp-26Sproteasoma hp-c.neof hp-19Kda uox tppA IR-1 SR1 40.0kb apo-mucina rhaA helA

hp-cdc37

hp-n.crassa

0.0kb

20.0kb ph531b ph371 ph312a

40.0kb ph13a6 ph24a1

L16875
Pamplona, Jume 2005

Cloning and sequencing of the central region of P. ostreatus chromosome VII
Sequencing strategy

L16875

Rhamnosidase (p)

PC15
54 Kbp

∼ 125 Kbp ∼150 Kbp

Pamplona, Jume 2005

40

Cloning and sequencing of the central region of P. ostreatus chromosome VII chromosome VII in PC15 (255268 bp)
LR1.1 LR1.2 LR2.1 LR2.2

SR1.1 SR1.2

SR2.1

SR2.2

0.0kb

50.0kb
BAC_L5(RC)

100.0kb

150.0kb

200.0kb

250.0kb

BAC_I3 (RC) 45a1 531b 13a6 24a1 371 312a

L16875

Pasos para determinar el genoma de un organismo
• Información preliminar
– – – – – – Tamaño del genoma Cariotipo Mapas de ligamiento Mapas físicos Contenido de G+C Secuencias parciales
35 Mbp 11 cromosomas CLP disponibles

41

Cloning and sequencing of the central region of P. ostreatus chromosome VII Summary • 255 Kbp sequenced • 50.35% G+C • 61 putative genes detected by BlastX similarity • About 90 genes expected • Gene density • observed 4.2 Kbp per gene • expected 2.8 Kbp per gene • Estim. P. ostreatus gene number: 8300 – 12500 • Repetitive sequences: • Two short inverted repeats of 38 bp • Two short direct repeats of 51 bp • Two long direct repeats of 2.4 Kbp • Two long inverted repeats of 3.3 Kbp

42

Sign up to vote on this title
UsefulNot useful