Académique Documents
Professionnel Documents
Culture Documents
7 Sistemas de informação.
8 Teoria da informação.
14 Metadados de arquivos.
Fundamentos de Teoria Geral dos Sistemas
CONCEITOS
BÁSICOS
• Sistemas:
• Grupo de componentes inter-
relacionados que operam rumo à
consecução de uma meta comum
mediante a aceitação de entradas e
produção de saídas em um processo
organizado.
• Sistemas de informação:
• Utiliza os recursos de pessoas,
hardware, software, dados e redes
para executar atividades de entrada,
processamento, saída,
armazenamento e controle que
convertem dados em informação
SISTEMA DE
INFORMAÇÃO
ÁREA FUNCIONAL OU NÍVEL ORGANIZACIONAL?
SAE/SIE
SIG/SAD
SPT
FASES E ETAPAS DE UM SISTEMA DE INFORMAÇÃO
MANUTENÇÃO
Informação – contextualização e
significado
• Experência
Inteligência • Intuição
• Complexidade
Síntese • Confiabilidade
Conhecimento • Relevância
• Importância
Avaliação
• Fatos
Dados • Textos
• Imagens
Dados organizados em blocos semânticos (relações)
semiestruturados
A alta heterogeneidade dificulta as consultas a estes dados
• Que são classificados como semiestruturados
• Não são estritamente tipados
• Não são completamente não-estruturados
Estrutura irregular
Estrutura parcial
Esquemas Representativos
Lógicos
Implementação
Físicos
Esquemas
Físicos Baixo nível
ADMINISTRAÇÃO DE DADOS
Um sistema
funcionando
Prototipação
evolucionária
Requisitos
compreendidos
Elaborar os
requisitos
Validar ou derivar
os requisitos
Prototipação
descartável
Protótipo +
especificação do
sistema
ELEMENTOS BÁSICOS
CARDINALIDADE
Grau de Relacionamento
• Grau de um tipo Relacionamento
– É o número de entidades
que participam desse
relacionamento
– Grau 2 - Binário, Grau 3 -
Ternário
HERANÇA
Herança
Atributos de entidade de
nível superior são herdados
pelos conjuntos de
entidades de nível inferior
Na prática a generalização é
simplesmente o inverso da
especialização.
Disjunção e sobreposição
Especialização: Total ou parcial
• Ao longo do processo de
criação de banco de dados,
você gerou várias listas,
folhas de especificações e
diagramas usados para
registrar vários aspectos do
design do banco de dados.
• Você deve organizá-los em
um repositório central,
• Incidentalmente, você
poderia gerar e
armazenar esses
documentos usando
um programa de
computador.
DOCUMENTAÇÃO
ELEMENTOS
DOCUMENTADOS
• O repositório de design deve consistir dos seguintes
conjuntos de documentos:
• Lista final da tabelas do sistemas
• Diagramas de Relacionamentos
• Especificações dos Campos ou atributos
• Especificações de regra de negócios
• Lista de campos calculados
• Diagramas de visão
• Diagramas da estrutura das tabelas
• Especificações da visões
RAZÕES PARA DOCUMENTAÇÃO
Chave e Relacionamento
RELAÇÃO
RELAÇÃO
• SuperChave
– Chave candidata
– Chave primária
– Chave alternativa
– Chave secundária
– Chave estrangeira
• Chave natural x chave artificial
REVISANDO
RELACIONAMENTO
QUESTÃO CESPE BASA 2018
• Julgue os itens seguintes, referentes à modelagem relacional de dados.
• 115 Considerando-se a propriedade da unicidade do conjunto de atributos que compõem uma
tabela, é correto afirmar que toda tabela tem pelo menos uma chave candidata.
• 116 O valor de uma chave estrangeira que apareça em uma tabela deve, necessariamente, ser
considerado como chave primária de outra tabela.
• 117 Após definir-se uma visão, é disponibilizada para o usuário uma tabela virtual que não compõe
o modelo lógico de dados, na qual o usuário tem plena liberdade para realizar operações de
consulta, inclusão, exclusão ou alteração.
• 118 Uma tabela não pode ter valores de chaves estrangeiras nulos, em decorrência da regra de
integridade referencial.
• 120 As restrições de integridade classificadas como restrições de transição tanto podem referir-se a
apenas uma tabela, como a um conjunto de tabelas. Nessa última situação, denominam-se
restrições de transição de banco de dados
Noções de mineração de dados
Conceituação e características
O QUE É MINERAÇÃO DE DADOS?
• A mineração de dados é a prática de pesquisar automaticamente grandes bases de dados para
descobrir padrões e tendências que vão além da simples análise. A mineração de dados usa
algoritmos matemáticos sofisticados para segmentar os dados e avaliar a probabilidade de eventos
futuros. A mineração de dados também é conhecida como descoberta de conhecimento em dados
(KDD). As principais propriedades da mineração de dados são:
– Descoberta automática de padrões
– Previsão de resultados prováveis
– Criação de informação acionável
– Concentra-se em grandes conjuntos de dados e bancos de dados
• A mineração de dados pode responder a perguntas que não podem ser abordadas por meio de
técnicas simples de consulta e geração de relatórios.
• Descoberta Automática
– A mineração de dados é realizada pela construção de modelos. Um modelo usa um algoritmo para atuar em
um conjunto de dados. A noção de descoberta automática refere-se à execução de modelos de mineração
de dados. Os modelos de mineração de dados podem ser usados para explorar os dados nos quais eles são
construídos, mas a maioria dos modelos é generalizável para novos dados. O processo de aplicar um modelo
a novos dados é conhecido como pontuação (scoring).
MINERAÇÃO DE DADOS
Análise de agrupamentos
Detecção de anomalias.
(clusterização).
CRISP-DM - FASES
Entendimento Entendimento Preparação
Modelagem Avaliação Entrega
do negócio dos dados dos dados
• Viés é a tendência de um
classificador aprender
consistentemente uma
generalização incorreta.
• Variância é o valor que a
estimativa da função de
destino mudará se forem
usados dados de
treinamento diferentes.
OVERFITTING
• Overfitting ocorre quando um algoritmo de aprendizado de
máquina captura o ruído dos dados.
• Intuitivamente, o overfitting ocorre quando o modelo ou o
algoritmo ajusta os dados muito bem.
• Especificamente, o overfitting ocorre se o modelo ou algoritmo
mostrar baixo viés, mas alta variância.
• O overfitting é muitas vezes o resultado de um modelo
excessivamente complicado, e pode ser evitado através da
adaptação de vários modelos e usando validação ou validação
cruzada para comparar as suas precisões de previsão nos dados de
teste.
UNDERFITTING
• O underfitting ocorre quando um modelo estatístico ou um
algoritmo de aprendizado de máquina não consegue capturar a
tendência subjacente dos dados.
• Intuitivamente, o underfitting ocorre quando o modelo ou o
algoritmo não se ajustam bem aos dados.
• Especificamente, o underfitting ocorre se o modelo ou algoritmo
mostrar baixa variância, mas alto viés.
• O underfitting é frequentemente resultado de um modelo
excessivamente simples.
• O overfitting e o underfitting levam a previsões ruins sobre novos
conjuntos de dados.
UNDERFITTING E OVERFITTING
CATEGORIAS
Linguagem de
Modos Paradigmas Formas
Descrição
• Supervisionado • Simbólico • Incremental • Exemplos ou
• Não • Estatístico • Não objetos
supervisionado • Baseado em incremental • Hipóteses
• Por reforço exemplos • Conhecimento
• Conexista do domínio
• Evolutivo
ALGORITMOS DE APRENDIZADO
Noções de bigdata
Consistência eventual
Persistência poliglota
Conceitos
Consistência - uma leitura em qualquer um dos nodos de um sistema
retorna como resultado a mesma informação
Hadoop
Documentos
Map- NoSQL
Reduce +
HDFS
Colunar
Grafos
Teorema
BASE X ACID
CAP
• 5 Vs:
• Velocidade, Variedade, Volume, Valor e Veracidade
• Escalabilidade horizontal
• Persistência poliglota
• Teorema CAP
•
CONCEITOS Bases de dados NoSQL
• Chave-valor
• Documento
• Grafo
• Colunar
• Hadoop
• Map Reduce
• HFDFS
Noções de programação R
CONCEITOS