Vous êtes sur la page 1sur 23

Biotecnologa Molecular IIQ2693

Tarea 4

Integrantes:
Mauricio Gonzales
Rodrigo Martnez
Rodrigo Dedes

Pregunta 1

A) En el cromatograma los pulsos deben estar bien definidos, para que sea una zona de
buena calidad de secuenciacin. En la Fig 1, la regin seleccionada es una zona
poco confiable, mientras que la regin no seleccionada muestras pulsos ms
definidos, zona de mejor calidad de secuenciacin. En la figura 2 se muestran
regiones de mala calidad de secuenciacin, mientras que la figura 3, los pulsos estn
perfectamente definidos una regin de muy buena calidad de secuenciacin.
Figura 1

Figura 2

Figura. 3

B) Utilizamos el Plsmido PET101, cuyo sitio de insercin del gen se puede apreciar
en la Figura. 4 y Figura.5

Figura. 4

Figura.5

c) Usando la herramienta Nucleotide Blast, vemos que genoma alinea con nuestro gen
secuenciado (sacando las regiones poco confiables del gen).
Usando P12+T7 Prom
Figura.6

El Blast muestra un 98% de identidad con Bifidobacterium longum subsp. infantis JCM
1222 DNA, complete genome y Bifidobacterium longum subsp. infantis ATCC 15697,
complete genome
Usando P12+T7term.

Figura.7

Figura.8

Vemos que T7 term se alinea con muchos genomas pero el gen P12 se alinea con las
mismas especies obtenidas anteriormente (Figura.8), Bifidobacterium longum subsp.
infantis ATCC 15697 con un 97% . (Quevery Cover 88%) (Figura.7)

d) Buscando en la base de datos del NCBI para Bifidobacterium longum subsp. infantis
ATCC 15697
Figura.9

Vemos que el nombre de Gen es Blon_2255 (Figura.9, Figura.10)


El Genoma completo del cromosoma Bifidobacterium longum subsp. infantis ATCC 15697
es el siguiente: (Fasta)
CGGCGACTACTGGACGAACGATATCGCTCCGGTGCGTGCCGCCGGTGGGCTTAC
CGCGTTCATCCACGAG
CCTGATCCATCCTTGCCCGCGACCATCACCGCCCCGACCTTGCGGCAGATGGTC
GATGACATTGTGGATG
TATGCGCCGCCGCGACGGCGGATGCCGGTGGGGCCGAGGCCGCTTTCCGGGACT
GACCGCAACCGTGTCC
GTTGACCCCGTTGACGGCTATCATGTCCTGAGGGCCAGAAGGCTCTATCTCGATG
CAGAGGTCGAAAGGA
TATGTGGCTGCTATGGTGCAGGAACCAACATTGGAATGGCATGTCATACCGGAGC
CGACGAATGTCGAGC
CGCTGGTGGGAACATGCTCGTTGCCGTTGTCGGGAACGGTTGTGGAGCAACGA
GGTGCGGATGATGCGGA
GGCCGTGTTTGCGCGTCAGCTTGTCGACGACATTAAGCGCGTGTGCGGAGGCCG
CTGGCAGGTGGCCTCC
GGAGAGGTTCAGCGGGAGGTGACTTTGCGGACCAGTCCTTCGCTCGATGACTG
GTCGTACGTGCTTGAGG
TCTCGCCGGACGGCGTTGTGATCACTGGTTCGGGGTTCGAAGGCGTTCGCGATG
GCGTGCAGACATTGCG
TCAGATTATTCGCCAGATTGGTTTGACGATACCGTGCATGGTCATCAGGGATCGG
CCGGCGTTCTCGACC
CGCGGTTACTATCTGGACGTGACTCGTGGCCGTGTGCCCTCTATGGCTTGGCTGA
AATCGTGGGTGGATC
GCCTGTGCTTCTACAAGTACAACCAATTCCAGTTGTACATCGAGCATACGTTCCA
GTTCAATGGTCTTAG
CGAAGTGTGGCGTGGCGCCGATCCGTTGACTTCGTCCGACATTCTCGAGCTTGA
TTCCTATTGCGCGGCG
CGTGGCATAGAGCTCGTGCCCTCCGTGTCGACGTTCGGACATCATTACACCGCG
CTGCGGACGCGGCAAC
TACGTGATCTGGGAGAGTTTCCGGAGGACGCGGATCGTCCTTTCAGCCTGATCG
AGCGAATGACGCACCA

TACGCTCAACATCACCGATGAGCGGTCCTATGAGTTTTCGACATCATTGATCGAT
GAGCTGATGCCGTTG
TTCCGTTCGCGGAAGTTCAATATCTGCGCCGATGAGACGTTTGATCTCGGCAAGG
GGAGGTCGAAGCAGG
AATCGGCGAAACGTGGCGTTGGCGCGATGTATGCCGATTTCGTCGAGCGACTGT
GCCGCCATGTTGATGA
TCGTGGGCATGATGTCATGGTGTGGGCCGATGTCGCGCTCGAGCACCCTGAGAT
CATCGATACGCTTCCC
AAGAACATCACCTGGCTGAATTGGCAGTATGAGCCCAACGTGGATGATGGCACA
ACGGCAGCTCTCGCCG
ATGCCGGCGCGACGCAGATGGTGTGCCCGGCGGTGTGGTGCTGGAATGCGCTGA
TTCCGCGGATCGACGA
TGCGTGGAATAACATCACCAGGATGGCGCGCCATGGCCGCGCCCATGATGTTTC
GGGGATGCTGGTCACT
GATTGGGGGGATTTCGGACACGTCAACGATCCCCGCATGTCGGTTCCGGGCATG
ATCTTCGGTGCGCAGC
AATCCTGGAATCCGGATGCCGAGCTCAGCGAAGTCGATATGCTGTCGCGCATATC
CACCATCGAATACGG
CGACCATACTGGTAGCGTGGTCGGTGCGCTCAGGGGCGCTTCTGCCAAAGGCGG
ATTCTCGTGGAGCGAT
CTCGTCACCTATCTGGAACTGGACGACGGCCGTGGCGGATGCAATACGGAGATC
GTGCGGGTCATGGGCT
GTCTGGAAGCGTATCGGAATGATTTGCCGCAGTCCGGTCAGGCAAGGTTGGCGG
ATGCTCGCGTTTCGAT
GCTGCGGACGTTGCGTGACTCCATTCTCGCGGGCCGGGAATTGAACGGCAAGCT
TGACGATGCAGCCAAG
GATATCACCCAGCTGCTCCGCGTGGCCGGTGATCCCTCCTCCGCTGCGGTCTGGT
CGTTGGCCATCGACG
GTCAGCGTCTGCTGAACCGTGTCGGGTTGGCGTTGTTGGCCGCGCATGGCGTGG
TGCGGCAGGATGAGGC
CGGAATCGATGCGGCGAAGCTGGCCGATGAACTGGAATGCTGGACCGAACAGT
ATTCGAGGCTCTGGCAT
GAGGTCAGTCGGCAGTCGGAACTGGCCCGCATCCAACACGTGGTATGGCGCGC
GGCGGACGTGCTGCGTT
CCATTTAGCCGGTTGCGTGGTGACGGGAGCGGCGGTGCGAGCGGGCCTGATGC
AAATATGTTAAGGCTGT
TGACAGTGCTGGCTCCCGTACCTATCATGGTTGCGTCCATCTCATAGGTGTGATG
GATGCAACCGAAGTC
ATCATCGACTCAAAGGAGAGACAATGAGGAATGTCGCGATGAAGGTGGGTGCT
GCGGTATGCGCCGTGGC
CTTGCTGGGTTCGCTGTCTGCGTGTGGCAATAAGAAGTCGACCACGACGGCTGA
CGGCAAGCCGATTGTG
ACGGTTCTGGTCAAGAAGAACG
Buscamos en GeneBank, lo que nos entrega todo los datos del gen de inters y
publicaciones relacionadas. Resulta ser una enzima que codifica para una protena
Hidrolasa de la especie Bifidobacterium, Es parte de la microbiota intestinal. El gen

Blon_2355 estara relacionado con la degradacin de oligosacridos complejos en la leche


humana, que tiene relacin directa con la nutricin esencial en infantes.
Proteina
MVQEPTLEWHVIPEPTNVEPLVGTCSLPLSGTVVEQRGADDAEAVFARQLVDDIKR
VCGGRWQVASGEVQ
REVTLRTSPSLDDWSYVLEVSPDGVVITGSGFEGVRDGVQTLRQIIRQIGLTIPCMVI
RDRPAFSTRGYY
LDVTRGRVPSMAWLKSWVDRLCFYKYNQFQLYIEHTFQFNGLSEVWRGADPLTSS
DILELDSYCAARGIE
LVPSVSTFGHHYTALRTRQLRDLGEFPEDADRPFSLIERMTHHTLNITDERSYEFSTS
LIDELMPLFRSR
KFNICADETFDLGKGRSKQESAKRGVGAMYADFVERLCRHVDDRGHDVMVWAD
VALEHPEIIDTLPKNIT
WLNWQYEPNVDDGTTAALADAGATQMVCPAVWCWNALIPRIDDAWNNITRMAR
HGRAHDVSGMLVTDWGD
FGHVNDPRMSVPGMIFGAQQSWNPDAELSEVDMLSRISTIEYGDHTGSVVGALRG
ASAKGGFSWSDLVTY
LELDDGRGGCNTEIVRVMGCLEAYRNDLPQSGQARLADARVSMLRTLRDSILAGR
ELNGKLDDAAKDITQ
LLRVAGDPSSAAVWSLAIDGQRLLNRVGLALLAAHGVVRQDEAGIDAAKLADELE
CWTEQYSRLWHEVSR
QSELARIQHVVWRAADVLRSI
Figura.10

Informacin Genebank:
Glycoside hydrolase family protein [Bifidobacterium longum subsp. infantis ATCC 15697
= JCM 1222]

LOCUS
NC_011593
1956 bp DNA linear CON 10-JUN-2013
DEFINITION Bifidobacterium longum subsp. infantis ATCC 15697 chromosome,
complete genome.
ACCESSION NC_011593 REGION: complement(2628314..2630269)
VERSION NC_011593.1 GI:213690928
DBLINK
Project: 58677
BioProject: PRJNA58677
KEYWORDS RefSeq.
SOURCE Bifidobacterium longum subsp. infantis ATCC 15697 = JCM 1222 = DSM
20088
ORGANISM Bifidobacterium longum subsp. infantis ATCC 15697 = JCM 1222 = DSM
20088
Bacteria; Actinobacteria; Actinobacteridae; Bifidobacteriales;
Bifidobacteriaceae; Bifidobacterium.
REFERENCE 1 (bases 1 to 1956)
AUTHORS Sela,D.A., Chapman,J., Adeuya,A., Kim,J.H., Chen,F.,
Whitehead,T.R., Lapidus,A., Rokhsar,D.S., Lebrilla,C.B.,
German,J.B., Price,N.P., Richardson,P.M. and Mills,D.A.
TITLE The genome sequence of Bifidobacterium longum subsp. infantis
reveals adaptations for milk utilization within the infant
microbiome
JOURNAL Proc. Natl. Acad. Sci. U.S.A. 105 (48), 18964-18969 (2008)
PUBMED 19033196
REFERENCE 2 (bases 1 to 1956)
CONSRTM NCBI Genome Project
TITLE Direct Submission
JOURNAL Submitted (21-NOV-2008) National Center for Biotechnology
Information, NIH, Bethesda, MD 20894, USA
REFERENCE 3 (bases 1 to 1956)
AUTHORS Lucas,S., Copeland,A., Lapidus,A., Barry,K., Detter,J.C., Glavina
del Rio,T., Dalin,E., Tice,H., Goltsman,E., Pitluck,S., Schmutz,J.,
Larimer,F., Land,M., Hauser,L., Kyrpides,N., Mikhailova,N.,
Sela,D.A., Chapman,J., Adeuya,A., Kim,J.H., Chen,F.,
Whitehead,T.R., Rokhsar,D.S., Lebrilla,C.B., German,J.B.,
Price,N.P., Mills,D.A. and Richardson,P.M.
CONSRTM US DOE Joint Genome Institute
TITLE Direct Submission
JOURNAL Submitted (28-MAY-2008) US DOE Joint Genome Institute, 2800
Mitchell Drive B100, Walnut Creek, CA 94598-1698, USA

COMMENT PROVISIONAL REFSEQ: This record has not yet been subject to final
NCBI review. The reference sequence was derived from CP001095.
URL -- http://www.jgi.doe.gov
JGI Project ID: 40002686
Source DNA available from David Mills (damills@ucdavis.edu)
Bacteria available from ATCC: ATCC 15697
Contacts: David Mills (damills@ucdavis.edu)
David Bruce (microbe@cuba.jgi-psf.org)
Quality assurance done by JGI-Stanford
Annotation done by JGI-ORNL and JGI-PGF
Finishing done by JGI-PGF
Finished microbial genomes have been curated to close all gaps with
greater than 98% coverage of at least two independent clones. Each
base pair has a minimum q (quality) value of 30 and the total error
rate is less than one per 50000.
The JGI and collaborators endorse the principles for the
distribution and use of large scale sequencing data adopted by the
larger genome sequencing community and urge users of this data to
follow them. it is our intention to publish the work of this
project in a timely fashion and we welcome collaborative
interaction on the project and analysis.
(http://www.genome.gov/page.cfm?pageID=10506376).
COMPLETENESS: full length.
FEATURES
Location/Qualifiers
source
1..1956
/organism="Bifidobacterium longum subsp. infantis ATCC
15697 = JCM 1222 = DSM 20088"
/mol_type="genomic DNA"
/strain="ATCC 15697"
/sub_species="infantis"
/culture_collection="ATCC:15697"
/db_xref="taxon:391904"
gene
1..1956
/locus_tag="Blon_2355"
/db_xref="GeneID:7054955"
CDS
1..1956
/locus_tag="Blon_2355"
/note="PFAM: glycoside hydrolase, family 20;
KEGG: blo:BL0056 possible beta-hexosaminidase A"
/codon_start=1
/transl_table=11
/product="glycoside hydrolase family protein"
/protein_id="YP_002323791.1"
/db_xref="GI:213693205"
/db_xref="InterPro:IPR001540"
/db_xref="GeneID:7054955"

/translation="MVQEPTLEWHVIPEPTNVEPLVGTCSLPLSGTVVEQRGADDAEA
VFARQLVDDIKRVCGGRWQVASGEVQREVTLRTSPSLDDWSYVLEVSPDGVVITGS
GF
EGVRDGVQTLRQIIRQIGLTIPCMVIRDRPAFSTRGYYLDVTRGRVPSMAWLKSWV
DR
LCFYKYNQFQLYIEHTFQFNGLSEVWRGADPLTSSDILELDSYCAARGIELVPSVSTF
GHHYTALRTRQLRDLGEFPEDADRPFSLIERMTHHTLNITDERSYEFSTSLIDELMPL
FRSRKFNICADETFDLGKGRSKQESAKRGVGAMYADFVERLCRHVDDRGHDVMV
WADV
ALEHPEIIDTLPKNITWLNWQYEPNVDDGTTAALADAGATQMVCPAVWCWNALIP
RID
DAWNNITRMARHGRAHDVSGMLVTDWGDFGHVNDPRMSVPGMIFGAQQSWNPD
AELSE
VDMLSRISTIEYGDHTGSVVGALRGASAKGGFSWSDLVTYLELDDGRGGCNTEIVR
VM
GCLEAYRNDLPQSGQARLADARVSMLRTLRDSILAGRELNGKLDDAAKDITQLLRV
AG
DPSSAAVWSLAIDGQRLLNRVGLALLAAHGVVRQDEAGIDAAKLADELECWTEQ
YSRL
WHEVSRQSELARIQHVVWRAADVLRSI"
ORIGIN
1 atggtgcagg aaccaacatt ggaatggcat gtcataccgg agccgacgaa tgtcgagccg
61 ctggtgggaa catgctcgtt gccgttgtcg ggaacggttg tggagcaacg aggtgcggat
121 gatgcggagg ccgtgtttgc gcgtcagctt gtcgacgaca ttaagcgcgt gtgcggaggc
181 cgctggcagg tggcctccgg agaggttcag cgggaggtga ctttgcggac cagtccttcg
241 ctcgatgact ggtcgtacgt gcttgaggtc tcgccggacg gcgttgtgat cactggttcg
301 gggttcgaag gcgttcgcga tggcgtgcag acattgcgtc agattattcg ccagattggt
361 ttgacgatac cgtgcatggt catcagggat cggccggcgt tctcgacccg cggttactat
421 ctggacgtga ctcgtggccg tgtgccctct atggcttggc tgaaatcgtg ggtggatcgc
481 ctgtgcttct acaagtacaa ccaattccag ttgtacatcg agcatacgtt ccagttcaat
541 ggtcttagcg aagtgtggcg tggcgccgat ccgttgactt cgtccgacat tctcgagctt
601 gattcctatt gcgcggcgcg tggcatagag ctcgtgccct ccgtgtcgac gttcggacat
661 cattacaccg cgctgcggac gcggcaacta cgtgatctgg gagagtttcc ggaggacgcg
721 gatcgtcctt tcagcctgat cgagcgaatg acgcaccata cgctcaacat caccgatgag
781 cggtcctatg agttttcgac atcattgatc gatgagctga tgccgttgtt ccgttcgcgg
841 aagttcaata tctgcgccga tgagacgttt gatctcggca aggggaggtc gaagcaggaa
901 tcggcgaaac gtggcgttgg cgcgatgtat gccgatttcg tcgagcgact gtgccgccat

961 gttgatgatc gtgggcatga tgtcatggtg tgggccgatg tcgcgctcga gcaccctgag


1021 atcatcgata cgcttcccaa gaacatcacc tggctgaatt ggcagtatga gcccaacgtg
1081 gatgatggca caacggcagc tctcgccgat gccggcgcga cgcagatggt gtgcccggcg
1141 gtgtggtgct ggaatgcgct gattccgcgg atcgacgatg cgtggaataa catcaccagg
1201 atggcgcgcc atggccgcgc ccatgatgtt tcggggatgc tggtcactga ttggggggat
1261 ttcggacacg tcaacgatcc ccgcatgtcg gttccgggca tgatcttcgg tgcgcagcaa
1321 tcctggaatc cggatgccga gctcagcgaa gtcgatatgc tgtcgcgcat atccaccatc
1381 gaatacggcg accatactgg tagcgtggtc ggtgcgctca ggggcgcttc tgccaaaggc
1441 ggattctcgt ggagcgatct cgtcacctat ctggaactgg acgacggccg tggcggatgc
1501 aatacggaga tcgtgcgggt catgggctgt ctggaagcgt atcggaatga tttgccgcag
1561 tccggtcagg caaggttggc ggatgctcgc gtttcgatgc tgcggacgtt gcgtgactcc
1621 attctcgcgg gccgggaatt gaacggcaag cttgacgatg cagccaagga tatcacccag
1681 ctgctccgcg tggccggtga tccctcctcc gctgcggtct ggtcgttggc catcgacggt
1741 cagcgtctgc tgaaccgtgt cgggttggcg ttgttggccg cgcatggcgt ggtgcggcag
1801 gatgaggccg gaatcgatgc ggcgaagctg gccgatgaac tggaatgctg gaccgaacag
1861 tattcgaggc tctggcatga ggtcagtcgg cagtcggaac tggcccgcat ccaacacgtg
1921 gtatggcgcg cggcggacgt gctgcgttcc atttag

d) Usando Bioedit alineamos las secuencias encontrada usando la base de datos de NCBI
(Importando el archivo Fasta de la secuencia del Gen completo), con la que obtuvimos
secuenciando con los primers.

Viendo el alineamiento notamos que no es exacto para cada base por lo que no podemos
asegurar que el gen este perfectamente secuenciado.

Pregunta 2

a) En la siguiente tabla se muestran los valores RPKM calculados segn la siguiente


formula:
9

RPKM =

N de secuencias que alineancon el gen10


N total de secuenciaslongitud del gen

Donde se toma el nmero total de secuencias como la suma de todas las secuencias que alinean en
el genoma completo de 58 genes. Con lo que se obtiene la siguiente tabla:
Geno RPKM medio RPKM
RPKM sal
RPKM Redox
ma
rico
pH3.0
0.5 M
-300mV
Gen1
1024,60
339,65
423,99
3892,25
Gen2
3232,79
3016,88
3174,89
3177,28
Gen3
1328,83
1898,65
1271,03
18142,39
Gen4
951,49
1467,03
778,33
14641,01
Gen5
460,45
1593,80
925,15
12883,60
Gen6
160,30
1222,37
1301,01
3467,74
Gen7
925,28
737,77
1161,22
8407,49
Gen8
3188,26
1396,67
1525,45
8360,17
Gen9
8329,26
1929,68
2008,95
1911,88
Gen10
965,37
347,18
457,70
3965,38
Gen11
1496,17
710,50
749,85
6796,32
Gen12
2183,18
1051,39
1452,25
642,26
Gen13
3722,84
1911,63
2708,29
1260,37
Gen14
2344,52
930,13
1381,42
472,84
Gen15
1734,43
6319,77
9969,17
468,61
Gen16
9329,66
5046,36
5008,70
1521,87
Gen17
21924,89 82755,41
133694,92
6412,46
Gen18
16944,22 91720,78
142307,82
6329,62
Gen19
878,79
5186,00
7094,86
5565,26
Gen20
61554,77 41614,86
30201,55
63398,65
Gen21
61174,78 17823,52
12512,87
20931,98
Gen22
41304,08
8670,38
4554,72
19238,74
Gen23
34767,30
6848,76
9057,16
17732,60
Gen24
43556,93 14962,64
16038,03
17410,62
Gen25
1977,32
2070,93
1919,81
8084,35
Gen26
824,12
1406,16
662,31
10531,46
Gen27
737,59
1434,23
849,38
14603,96
Gen28
1146,91
1921,27
1153,27
18140,73
Gen29
1242,62
2622,67
710,14
99926,90
Gen30
1756,45
905,74
452,39
28438,43
Gen31
966,32
517,65
199,25
37081,73
Gen32
446,30
1828,93
221,34
82758,57
Gen33
769,68
2409,76
466,15
81700,68

Gen34
7241,89
3635,27
3909,51
1954,95
Gen35
3239,76
825,68
1225,21
722,61
Gen36
47071,91 16301,41
12674,67
31794,19
Gen37
28826,98 33971,87
19745,09
7548,98
Gen38
23578,66 34706,19
16604,73
6511,98
Gen39
17787,09 19473,71
14620,75
3691,76
Gen40
31532,59 21576,76
17660,57
5594,83
Gen41
42425,76 41418,57
37828,40
7407,91
Gen42
36881,08 37239,68
32540,36
6405,41
Gen43
4011,23
8731,98
10803,56
1075,16
Gen44
11693,16 24942,49
37037,93
3552,65
Gen45
10457,53 27498,58
40201,54
4720,88
Gen46
13127,67 46490,01
41070,61
5527,39
Gen47
11341,09 24562,88
36244,20
3642,01
Gen48
10026,53 27514,19
40314,10
4417,02
Gen49
6101,78 41461,86
24111,38
3570,16
Gen50
2228,01
4018,16
3207,82
1860,17
Gen51
2050,28
4807,82
4269,11
2315,97
Gen52
3156,26
3439,36
3448,99
3436,61
Gen53
1177,56
1627,93
2901,70
2919,88
Gen54
1939,88
2560,70
3786,66
3131,95
Gen55
1935,37
726,72
680,49
1252,03
Gen56
4578,59
1595,46
2029,48
5677,82
Gen57
4119,45
1307,68
2139,59
6757,81
Gen58
34693,33 26050,59
24659,10
56221,17
b) Tomando intervalos de a 1000 obtenemos los siguientes cuatro histogramas para cada condicin
y sus respectivos valores RPKM:

Medio Rico
16
14
12
10
8
6
Frecuencia
4
2
0

Frecuencia

Rango

RPKM pH3.0
16
14
12
10
8
6
Frecuencia
4
2
0

Frecuencia

Rango

RPKM sal 0.5 M


16
14
12
10
8
6
Frecuencia
4
2
0

Frecuencia

Rango

RPKM Redox -300mV

Frecuencia

8
7
6
5
4
3
2
1
0

Frecuencia

Rango

c) Luego hacemos el Heat map de los RPKM para cada medio, donde la escala de rojos representa
los valores ms pequeos y la de verdes los ms grandes:
Geno RPKM medio RPKM
RPKM sal
RPKM Redox
ma
rico
pH3.0
0.5 M
-300mV
Gen1
1024,60
339,65
423,99
3892,25
Gen2
3232,79
3016,88
3174,89
3177,28
Gen3
1328,83
1898,65
1271,03
18142,39
Gen4
951,49
1467,03
778,33
14641,01
Gen5
460,45
1593,80
925,15
12883,60
Gen6
160,30
1222,37
1301,01
3467,74
Gen7
925,28
737,77
1161,22
8407,49
Gen8
3188,26
1396,67
1525,45
8360,17
Gen9
8329,26
1929,68
2008,95
1911,88
Gen10
965,37
347,18
457,70
3965,38
Gen11
1496,17
710,50
749,85
6796,32
Gen12
2183,18
1051,39
1452,25
642,26
Gen13
3722,84
1911,63
2708,29
1260,37
Gen14
2344,52
930,13
1381,42
472,84
Gen15
1734,43
6319,77
9969,17
468,61
Gen16
9329,66
5046,36
5008,70
1521,87
Gen17
21924,89 82755,41
133694,92
6412,46
Gen18
16944,22 91720,78
142307,82
6329,62
Gen19
878,79
5186,00
7094,86
5565,26
Gen20
61554,77 41614,86
30201,55
63398,65
Gen21
61174,78 17823,52
12512,87
20931,98
Gen22
41304,08
8670,38
4554,72
19238,74
Gen23
34767,30
6848,76
9057,16
17732,60

Gen24
Gen25
Gen26
Gen27
Gen28
Gen29
Gen30
Gen31
Gen32
Gen33
Gen34
Gen35
Gen36
Gen37
Gen38
Gen39
Gen40
Gen41
Gen42
Gen43
Gen44
Gen45
Gen46
Gen47
Gen48
Gen49
Gen50
Gen51
Gen52
Gen53
Gen54
Gen55
Gen56
Gen57
Gen58

43556,93
1977,32
824,12
737,59
1146,91
1242,62
1756,45
966,32
446,30
769,68
7241,89
3239,76
47071,91
28826,98
23578,66
17787,09
31532,59
42425,76
36881,08
4011,23
11693,16
10457,53
13127,67
11341,09
10026,53
6101,78
2228,01
2050,28
3156,26
1177,56
1939,88
1935,37
4578,59
4119,45
34693,33

14962,64
2070,93
1406,16
1434,23
1921,27
2622,67
905,74
517,65
1828,93
2409,76
3635,27
825,68
16301,41
33971,87
34706,19
19473,71
21576,76
41418,57
37239,68
8731,98
24942,49
27498,58
46490,01
24562,88
27514,19
41461,86
4018,16
4807,82
3439,36
1627,93
2560,70
726,72
1595,46
1307,68
26050,59

16038,03
1919,81
662,31
849,38
1153,27
710,14
452,39
199,25
221,34
466,15
3909,51
1225,21
12674,67
19745,09
16604,73
14620,75
17660,57
37828,40
32540,36
10803,56
37037,93
40201,54
41070,61
36244,20
40314,10
24111,38
3207,82
4269,11
3448,99
2901,70
3786,66
680,49
2029,48
2139,59
24659,10

17410,62
8084,35
10531,46
14603,96
18140,73
99926,90
28438,43
37081,73
82758,57
81700,68
1954,95
722,61
31794,19
7548,98
6511,98
3691,76
5594,83
7407,91
6405,41
1075,16
3552,65
4720,88
5527,39
3642,01
4417,02
3570,16
1860,17
2315,97
3436,61
2919,88
3131,95
1252,03
5677,82
6757,81
56221,17

d) Gracias al heat map es fcil ver cuales genes son candidatos a ser genes constitutivos, ya que
veremos los valores de sus respectivos RPKM en cada medio y estos debieran estar en una misma
tonalidad de color. Con esto vemos que hay solo2 genes constitutivos y son el gen 2 y el 52:
Gen2
Gen52

3232,79
3156,26

3016,88
3439,36

3174,89
3448,99

3177,28
3436,61

Luego para saber que genes estn fuertemente inducidos o reprimidos (ms de 4 veces la condicin
basal), o sin cambio, programamos una macros en Excel y obtenemos la siguiente tabla.:
Geno
ma
Gen1
Gen2

RPKM pH3.0
Reprimido
Constitutivo

RPKM sal 0.5 M


Reprimido
Constitutivo

Gen3

Inducido

Sin cambio

Gen4

Inducido

Reprimido

Gen5
Gen6

Inducido
Fuertemente
Inducido

Inducido
Fuertemente
Inducido

Gen7
Gen8
Gen9
Gen10

Reprimido
Reprimido
Reprimido
Reprimido

Inducido
Reprimido
Reprimido
Reprimido

Gen11
Gen12
Gen13
Gen14

Reprimido
Reprimido
Reprimido
Reprimido

Gen17 Inducido
Fuertemente
Gen18 Inducido
Fuertemente
Gen19 Inducido
Gen20 Reprimido
Gen21 Reprimido
Gen22 Reprimido
Gen23 Reprimido
Gen24 Reprimido
Gen25 Sin cambio

Reprimido
Reprimido
Reprimido
Reprimido
Fuertemente
Inducido
Reprimido
Fuertemente
Inducido
Fuertemente
Inducido
Fuertemente
Inducido
Reprimido
Reprimido
Reprimido
Reprimido
Reprimido
Sin cambio

Gen26 Inducido

Reprimido

Gen27 Inducido

Inducido

Gen28 Inducido

Sin cambio

Gen29 Inducido

Reprimido

Gen15 Inducido
Gen16 Reprimido

RPKM Redox
-300mV
Inducido
Constitutivo
Fuertemente
Inducido
Fuertemente
Inducido
Fuertemente
Inducido
Fuertemente
Inducido
Fuertemente
Inducido
Inducido
Reprimido
Inducido
Fuertemente
Inducido
Reprimido
Reprimido
Reprimido
Reprimido
Reprimido
Reprimido
Reprimido
Fuertemente
Inducido
Sin cambio
Reprimido
Reprimido
Reprimido
Reprimido
Inducido
Fuertemente
Inducido
Fuertemente
Inducido
Fuertemente
Inducido
Fuertemente
Inducido

Gen30 Reprimido

Reprimido

Gen31 Reprimido

Reprimido

Gen32 Inducido

Reprimido

Gen33
Gen34
Gen35
Gen36
Gen37
Gen38
Gen39
Gen40
Gen41
Gen42
Gen43
Gen44
Gen45
Gen46
Gen47
Gen48

Reprimido
Reprimido
Reprimido
Reprimido
Reprimido
Reprimido
Reprimido
Reprimido
Reprimido
Reprimido
Inducido
Inducido
Inducido
Inducido
Inducido
Inducido

Fuertemente
Inducido
Fuertemente
Inducido
Fuertemente
Inducido
Fuertemente
Inducido
Reprimido
Reprimido
Reprimido
Reprimido
Reprimido
Reprimido
Reprimido
Reprimido
Reprimido
Reprimido
Reprimido
Reprimido
Reprimido
Reprimido
Reprimido

Inducido
Inducido
Inducido
Constitutivo
Inducido
Inducido
Reprimido
Reprimido
Reprimido
Reprimido

Reprimido
Reprimido
Inducido
Constitutivo
Inducido
Inducido
Reprimido
Inducido
Inducido
Inducido

Gen49
Gen50
Gen51
Gen52
Gen53
Gen54
Gen55
Gen56
Gen57
Gen58

Inducido
Reprimido
Reprimido
Reprimido
Inducido
Inducido
Sin cambio
Reprimido
Sin cambio
Sin cambio
Inducido
Inducido
Inducido
Inducido
Inducido
Inducido
Fuertemente
Inducido
Inducido
Inducido
Constitutivo
Inducido
Inducido
Reprimido
Reprimido
Reprimido
Reprimido

Pregunta 3

Figura 1: rbol filogentico.


A partir de la informacin entregada por el rbol podemos ver que s
existe una relacin entre la distancia filogentica y la tincin gram del
set de bacterias entregado. Esto se ve claramente ya que el rbol
filogentico agrupa en nodos diferentes, dejando a las bacterias gram
negativas en el grupo de arriba, mientras que a las gram positivas en el
grupo del medio (hay un outlier) como se puede ver en la figura 2.
Dems est decir que que las bacterias en un mismo grupo estn ms
cercanas respecto a las bacterias en los otros grupos.

Figura 2: rbol filogentico indicando la separacin en grupos de las


bacterias gram positivas y gram negativas.
Finalmente, se adjunta los clculos de la matriz de distancias, que
corrobora la informacin entregada por el rbol.

Ralstonia_ 0.0000 0.2810 0.2832 0.3293 0.3879 0.3328


0.3107 0.2238
0.3013 0.2245 0.3081 0.2999 0.2109 0.2217 0.3420
0.3112 0.2548
0.2912 0.2347 0.2018 0.3123 0.2832
Clostridiu 0.2810 0.0000 0.2655 0.2938 0.3226 0.2183
0.1990 0.2732
0.2017 0.2804 0.2098 0.1909 0.2642 0.2864 0.2357
0.3028 0.2591
0.2606 0.2954 0.2460 0.2577 0.2655
Prochloroc 0.2832 0.2655 0.0000 0.3000 0.3542 0.2667
0.2572 0.2821
0.2530 0.2793 0.2595 0.2427 0.2701 0.2727 0.2808
0.2741 0.2820
0.3043 0.2955 0.2598 0.2887 0.0000
Bifidobact 0.3293 0.2938 0.3000 0.0000 0.3613 0.3207
0.3084 0.3068
0.3017 0.3147 0.2898 0.2633 0.2969 0.3262 0.3138
0.3418 0.3266
0.3346 0.3313 0.3089 0.1775 0.3000
Bacteroide 0.3879 0.3226 0.3542 0.3613 0.0000 0.3731
0.3605 0.3696
0.3889 0.3944 0.4034 0.3801 0.3815 0.3568 0.3962
0.3862 0.3684
0.3586 0.3853 0.3526 0.3568 0.3542
Lactococcu 0.3328 0.2183 0.2667 0.3207 0.3731 0.0000
0.1172 0.3007
0.1803 0.3137 0.1960 0.1817 0.2898 0.2945 0.1661
0.3078 0.2826
0.2917 0.3356 0.2634 0.2796 0.2667
Streptococ 0.3107 0.1990 0.2572 0.3084 0.3605 0.1172
0.0000 0.2897
0.1605 0.2961 0.1857 0.1707 0.3091 0.3081 0.1748
0.3157 0.2745
0.2989 0.3351 0.2773 0.2739 0.2572
Salmonella 0.2238 0.2732 0.2821 0.3068 0.3696 0.3007
0.2897 0.0000
0.2864 0.0358 0.2920 0.2953 0.1883 0.0995 0.3135
0.2976 0.2812
0.3067 0.1431 0.1572 0.2837 0.2821
Listeria_m 0.3013 0.2017 0.2530 0.3017 0.3889 0.1803
0.1605 0.2864
0.0000 0.2918 0.1041 0.0915 0.2837 0.2884 0.1539
0.2994 0.2964
0.2870 0.3167 0.2560 0.2662 0.2530
Enterobact 0.2245 0.2804 0.2793 0.3147 0.3944 0.3137
0.2961 0.0358

0.2918 0.0000 0.2871 0.2976 0.2038 0.0974 0.3064


0.2955 0.2790
0.3017 0.1395 0.1725 0.2819 0.2793
Staphyloco 0.3081 0.2098 0.2595 0.2898 0.4034 0.1960
0.1857 0.2920
0.1041 0.2871 0.0000 0.0861 0.3059 0.2913 0.1598
0.2914 0.2811
0.2897 0.3214 0.2609 0.2548 0.2595
Bacillus_s 0.2999 0.1909 0.2427 0.2633 0.3801 0.1817
0.1707 0.2953
0.0915 0.2976 0.0861 0.0000 0.2801 0.2949 0.1499
0.3134 0.2753
0.2889 0.3165 0.2492 0.2342 0.2427
Acidithiob 0.2109 0.2642 0.2701 0.2969 0.3815 0.2898
0.3091 0.1883
0.2837 0.2038 0.3059 0.2801 0.0000 0.2076 0.3176
0.3003 0.2740
0.2797 0.2196 0.1795 0.2717 0.2701
Vibrio_vul 0.2217 0.2864 0.2727 0.3262 0.3568 0.2945
0.3081 0.0995
0.2884 0.0974 0.2913 0.2949 0.2076 0.0000 0.3100
0.3191 0.2695
0.2968 0.1615 0.1579 0.2812 0.2727
Lactobacil 0.3420 0.2357 0.2808 0.3138 0.3962 0.1661
0.1748 0.3135
0.1539 0.3064 0.1598 0.1499 0.3176 0.3100 0.0000
0.3293 0.2972
0.3193 0.3517 0.2878 0.2677 0.2808
Campylobac 0.3112 0.3028 0.2741 0.3418 0.3862 0.3078
0.3157 0.2976
0.2994 0.2955 0.2914 0.3134 0.3003 0.3191 0.3293
0.0000 0.2917
0.1566 0.3257 0.2765 0.3112 0.2741
Bdellovibr 0.2548 0.2591 0.2820 0.3266 0.3684 0.2826
0.2745 0.2812
0.2964 0.2790 0.2811 0.2753 0.2740 0.2695 0.2972
0.2917 0.0000
0.2962 0.3019 0.2697 0.2935 0.2820
Helicobact 0.2912 0.2606 0.3043 0.3346 0.3586 0.2917
0.2989 0.3067
0.2870 0.3017 0.2897 0.2889 0.2797 0.2968 0.3193
0.1566 0.2962
0.0000 0.3105 0.2714 0.3046 0.3043
Pasteurell 0.2347 0.2954 0.2955 0.3313 0.3853 0.3356
0.3351 0.1431
0.3167 0.1395 0.3214 0.3165 0.2196 0.1615 0.3517
0.3257 0.3019

0.3105 0.0000 0.2119 0.3109 0.2955


Pseudomona 0.2018 0.2460 0.2598 0.3089 0.3526 0.2634
0.2773 0.1572
0.2560 0.1725 0.2609 0.2492 0.1795 0.1579 0.2878
0.2765 0.2697
0.2714 0.2119 0.0000 0.2798 0.2598
Streptomyc 0.3123 0.2577 0.2887 0.1775 0.3568 0.2796
0.2739 0.2837
0.2662 0.2819 0.2548 0.2342 0.2717 0.2812 0.2677
0.3112 0.2935
0.3046 0.3109 0.2798 0.0000 0.2887
Prochloro2 0.2832 0.2655 0.0000 0.3000 0.3542 0.2667
0.2572 0.2821
0.2530 0.2793 0.2595 0.2427 0.2701 0.2727 0.2808
0.2741 0.2820
0.3043 0.2955 0.2598 0.2887 0.0000