Académique Documents
Professionnel Documents
Culture Documents
Bioinformática do NUPEB/UFOP
Ms. Lauro Ângelo Gonçalves de Moraes
Apresentação
Quem sou?
❏ Formação
❏ Graduado em Ciência da Computação - UFOP (2010 - 2015)
❏ Mestrado em Ciência da Computação - UFOP (2016 - 2018)
❏ Doutorando em em Ciência da Computação - UFOP (2108 - ...)
❏ Experiência de trabalho
❏ Auxiliar de laboratório de Informática - DEMAT/DEEST (2009 - 2015)
❏ Analista de sistemas TI - LMU de Bioinformática do NUPEB (2015 - ...)
LMU de Bioinformática
Equipe
❏ Coordenador
❏ Dr. Leandro Márcio Moreira
❏ Técnico
❏ Ms. Lauro Ângelo Gonçalves de Moraes
LMU de Bioinformática
Local
Equipamentos
Bioquímica Estatística
Tipos de dados
❏ Sequências de nucleotídeos e aminoácidos.
❏ Estruturas de proteínas.
❏ Dados de triagem clínica.
❏ Imagens (ressonância magnética, células, etc.)
❏ ...
Focos
❏ Desenvolvimento de algoritmos e métodos estatísticos.
❏ Análise e interpretação.
❏ Desenvolvimento de ferramentas.
Alguns trabalhos realizados no LMU de
Bioinformática
TabPath
❏ Ferramenta on-line de análise interativa de vias metabólicas do KEGG.
❏ Interface simples e resultados de consultas rápidos.
❏ Cria matrizes comparativas, cruzando dados de organismos e vias
metabólicas.
❏ Permite dois tipos de análises:
❏ Comparação entre vias metabólicas e organismos de interesse
❏ Análise de genes ou proteínas expressas em vias metabólicas
Robôs
❏ Percorreram as páginas do KEGG coletando códigos HTML de interesse.
❏ Armazenam em Bases de Dados.
❏ Filtram os dados dos documentos.
❏ Limpa e transforma os dados filtrados.
❏ Cruzam informações de fontes diferentes e forma novos documentos.
❏ Armazena na devida base de dados.
❏ Define novas pontos de partida para coletas.
Anotação de RNAs
❏ Victor Fernandes de Oliveira
❏ Orientação: Renata Guerra de Sá
❏ “Identification of 170 New Long Noncoding RNAs in Schistosoma mansoni”
❏ Configuração de ferramentas nos servidores
❏ Configuração de bases de dados nos servidores
❏ Implementação de um pipeline programático para automatizar a
execução dos programas.
❏ Scripts para analisar, filtrar e montar dados de acordo com demandas
específicas.
Anotação de RNAs
❏ Programas utilizados no pipeline:
❏ FastQC: Controle de qualidade das amostras
❏ STAR: Mapeamento das reads
❏ SAMtools: Formatação das extensões
❏ Cufflinks: Reconstrução dos transcritos
❏ BLAST: Alinhamento de sequências
Iniciando na Bioinfirmática
Conhecimentos Relacionados
❏ Biologia molecular
❏ Bioquímica
❏ Lógica de programação
❏ Bancos de dados
❏ Sistema operacional Linux
❏ Métodos estatísticos
Linguagens de programação
❏ Python
❏ Perl
❏ Java
❏ Javascript
❏ HTML
❏ CSS
❏ SQL
❏ Shell script
Área tecnológica
❏ Muitas opções
❏ Conhecimento amplo
❏ Boa definição de escopo
❏ Mudanças constantes
❏ Novas ferramentas
❏ Estudar sempre novas tecnologias
❏ Pesquisar sempre
❏ Fóruns de discussão
❏ Documentações oficiais
❏ Tutoriais
❏ Stack Overflow
Automação
❏ Algumas tarefas podem ser feitas manualmente pelos usuários com
algum tempo e esforço.
❏ Utilizar o NCBI para realizar BLAST.
❏ Encontrar e selecionar informações de interesse presentes em repositórios em uma
tabela.
❏ Utilizar os dados de saída de um programa como entrada de outro.
Automação
❏ Realizar os mesmos tipos de tarefas repetidamente.
❏ Cruzar informações em diversas bases de dados.
❏ Montar um pipeline de programas para executar um fluxo de
informações.
❏ Testar diversas configurações em um programa.
❏ Problemas
❏ Grande esforço por parte do usuário
❏ Dispêndio de tempo
❏ Maior propensão a erros
Automação
❏ Pontos de questionamento
❏ Tempo gasto na execução da tarefa.
❏ Tempo gasto no desenvolvimento da automação.
❏ Possibilidade de reuso por outros usuários.
❏ Necessidade de um script pontual.
❏ Necessidade de um sistema de informação.
Desenvolvimento de Software
❏ Análise de requisitos.
❏ Definição do projeto.
❏ Modelagem conceitual.
❏ Estudo de ferramentas.
❏ Implementação e codificação.
❏ Testes e avaliação
❏ Refatoração.
Desenvolvimento de Sistemas
❏ Modelagem de Banco de Dados.
❏ Modelagem de Interface com o usuário.
❏ Modelagem de Regras de Controle.
Pesando as prioridades
Obrigado