Académique Documents
Professionnel Documents
Culture Documents
Sistemas de Informao
Sistemas Dado x Informao Sistemas de Informao Sistemas de apoio s operaes Sistemas de apoio gesto EDP, MIS, DSS Data Warehouse Modelagem Multidimensional
Sistemas
Um conjunto de elementos interdependentes em interao, com vistas a atingir um objetivo. (Cautela & Polloni, 1986, p.15) Qualquer conjunto de partes unidas entre si pode ser considerado um sistema, desde que as relaes entre as partes e o comportamento do todo seja foco de ateno. ( Chiavenato, TGA, p. 516) Elementos de um sistemas podem ser outros sistemas (subsistemas).
Sistemas
Exemplos de sistema: Automvel
Quais os objetivos ? Quais os subsistemas que compem o sistema automvel ? Quais os objetivos? Quais os subsistemas que compem o sistema computador?
Computador
Dado x Informao
Dado qualquer elemento identificado em sua forma bruta que por si s no conduz a uma compreenso de determinado fato ou situao. Informao o dado trabalhado que permite a tomada de deciso.
Dado x Informao
Exemplo: Mede-se presso arterial Qual a tendncia de sade do cliente em funo dos dados histricos de presso arterial?
Dado x Informao
Exemplo: Exemplos de dados em uma empresa: quantidade de produo, custo da matriaprima, nmero de funcionrios. Como resultado da anlise de tais dados temse a informao : capacidade de produo, custo de venda do produto, produtividade do funcionrio. Como o executivo pode usar esta informao?
Dados x Informao
Caractersticas da Informao:
Sistemas de Informao
Sistemas de Informao (SI) so sistemas que permitem a coleta, o armazenamento, o processamento, a recuperao e a disseminao de informaes. SI so, hoje, quase sem exceo, baseados no computador e apiam as funes operacionais, gerenciais e de tomada de deciso existentes na organizao.
Sistemas de Informao
Os sistemas de apoio s operaes so tipicamente sistemas que processam transaes , ou seja, so redes de procedimentos rotineiros que servem para o processamento de informaes recorrentes.
Os " sistemas de apoio gesto " existem especificamente para auxiliar processos decisrios. Exemplos: previses de vendas, oramentos, anlises financeiras, etc.
EDP: Eletronic Data Processing MIS: Management Information System DSS: Decision Suport System SPRAGUE(1991, p.9)
Aplicado inicialmente aos nveis operacionais mais baixos da empresa no sentido de automatizar o trabalho. Caractersticas:
Foco no armazenamento, processamento e fluxos de dados no nvel operacional; Processamento de transaes eficientes; Relatrios para gerenciamento.
Caractersticas:
Foco sobre a informao, direcionando a gerentes de nvel mdio (ttico); Integrao de atividades de EDP por funo comercial, tais como MIS para produo, MIS para marketing, MIS para pessoal, etc.; Gerao de relatrios e consultas, normalmente com um banco de dados.
Um DSS tem seu foco num nvel mais alto da organizao (estratgico). Caractersticas:
Foco sobre as decises, voltado para gerentes de alto nvel e para os responsveis pela tomada de decises; nfase na flexibilidade, adaptabilidade e capacidade de fornecer respostas rpidas;
Permitem armazenar e analisar grandes BD para extrair informaes que auxiliam a compreenso do comportamento dos dados sobre o negcio. Fornecem apoio ao suporte estratgico de deciso. Consistem em sistemas computacionais de suporte deciso que integram dados oriundos de diversas fontes de dados.
Visualizar tendncias:
Anlise de Dados
Qual o desempenho dos nossos representantes em cada regio? Para cada produto, qual o total de vendas no ltimo ano? Como tem variado o ndice de participao de cada produto em nossas vendas (Market Share) ao longo dos trs ltimos anos? Existe alguma relao entre o desempenho dos representantes e sua faixa de salrio?
Suporte a Deciso
Grande quantidade de dados, acesso lento aos dados, aplicaes de controle, ...
Data Warehouse
Definio
DW uma base de dados que facilita a execuo de consultas de apoio deciso (Bill Inmon) Armazm de dado onde a histria da empresa, seus clientes, fornecedores e operaes estejam disponveis e acessveis para consultas e anlises.
Data Warehouse
Objetivos
Fornecer uma imagem global da realidade do negcio. Exibir informaes em nveis apropriados de detalhes (resumido ou detalhado). Otimizar o processamento de consultas complexas (Modelo Estrela ou Flocos de Neve).
Data Warehouse
Consistncia entre dados no mais a preocupao fundamental. O mais importante que os dados estejam acessveis para anlise. Frequentemente so desnormalizados e sumarizados.
Data Warehouse
Reduzir tempo gasto com obteno e anlise dos dados para tomada de deciso.
Tornar tomada de deciso seja mais calculada e precisa. Clara, Precisa, Rpida (Acessvel), Dirigida
Modelagem Multidimensional
Tcnica desenvolvida para a obteno de modelos de dados de simples entendimento e alta performance de acesso a dados. Data Warehouse orientado somente para consulta de seus dados. Projeto de DW deve resultar num armazm de dados organizado e acessvel. Informaes necessrias gesto e no ao controle dos negcios.
Exerccio
Que tipo de SI voc desenvolveu no semestre anterior na disciplina LPOO I, DWEB II, ES I ? Identifique as caractersticas daquele S.I. Identifique informaes teis aos gerentes de alto nvel da empresa. Discuta as dificuldades de fornecer estas informaes a partir do banco de dados atualmente usado.
OLTP
Atualizaes Baixo
OLAP
Consulta Alto
Pequena
Grande
Atual Registros
Histricos Assunto
Informao para dar Anlise de informaes suporte a servios do histricas. dia-a-dia. Dados armazenados em nvel de transao. Projeto do Banco de Dados: Normalizado Dados precisam ser integrados. Desnormalizado, esquema estrela.
Extrao de Dados
Sistemas de Operaes
Extraes
Tomadores de deciso
Dados selecionados de um ambiente (operacional) e transportados para outro (deciso). Usurios possuem seus prprios dados
Extrao de Dados
Sistemas de Operaes
Extraes
Tomadores de deciso
Exploso de Extraes
Data Warehouses
Data Warehouse
DW uma base de dados que facilita a execuo de consultas de apoio deciso (Bill Inmon) Uma base de dados de suporte a deciso mantida separadamente da base de dados operacional da organizao.
Data Warehouse
Objetivos:
Fornecer uma imagem global da realidade do negcio. Exibir informaes em nveis apropriados de detalhes (resumido ou detalhado) Otimizar o processamento de consultas complexas (Modelo Estrela ou Flocos de Neve)
Data Warehousing
Processo de fazer Data Warehouse. Tcnica para agrupar e gerenciar dados de vrias fontes com o propsito de responder questes de negcio. Construo do Data Warehouse exige:
Levantamento de necessidades da empresa e seus executivos. Transferncia e transformao dos dados existentes em sistemas corporativos.
Caractersticas do Ambiente de DW
Extrao de dados de fontes heterogneas. Orientao por Assunto. Variao no Tempo. No Voltil. Integrao.
Fontes de Dados
Exemplos de fontes para um ambiente analtico de empresa area:
Operaes: Horrios reais dos vos, Escala de Tripulao de cada vo. Reserva: Agendas dos vos, Reservas dos Passageiros Calendrio de feriados. Relacionamento com o cliente: Compensaes por atraso, Milhagem ganha. Informaes tcnicas: Tabela de milhagem entre cidades, Tabela de ligaes entre cidades.
Sistemas transacionais: orientados para as transaes realizadas diariamente. Mostra desempenho e possui indicadores de sua evoluo
Produo
Falha, Produto
Qualidade
Variao de Tempo
Dados de um DW representam resultados operacionais em determinado momento. No podem ser atualizados. DW: Guarda histria da variao dos dados ao longo do tempo. Ex.: Visualizao de saldo bancrio X Evoluo dos saldos mensais durante um longo perodo. Horizonte de tempo dos sistemas DW muito maior que o dos sistemas transacionais 30 90 dias X 5 a 10 anos.
No Voltil
UMA VIA
Integrao
Dados em um DW possuem alto nvel de integrao.
Integrao
Exemplo: Convenes de nomes e valores de variveis so formalmente unificados e integrados.
Arquitetura do Ambiente
A arquitetura de um DW inclui:
Arquitetura do Ambiente
Ferramentas:
Extrao dos dados de mltiplos sistemas transacionais e fontes externas. Limpeza, transformao e integrao dos dados.
Arquitetura do Ambiente
Repositrios:
Data Warehouse: Grande conjunto de todos os dados (armazm de dados). Data Marts (DM): Prateleiras do armazm de dados. Repositrios menores, orientados a reas especficas.
Arquitetura do Ambiente
Componentes do ADW
Papis:
Responsveis pela carga dos dados Usurios finais Responsveis pelo desenvolvimento e manuteno do DW e dos DM:
Processos e ferramentas
na extrao dos dados das diversas fontes, na organizao e integrao destes dados de forma consistente para o DW, no acesso aos dados integrados de modo eficiente e flexvel.
Filtragem, limpeza, sumarizao e concentrao dos dados espalhados pelas fontes externas e nos sistemas operativos.
Processos e ferramentas
Ferramentas para pesquisa e relatrios. Ferramentas do tipo OLAP (On-line Analytical Processing). Sistemas de informaes executivas Data Mining
Permite ao usurio avaliar tendncias e padres no conhecidos entre os dados. Redes Neurais, algoritmos genticos e lgica nebulosa.
ETL
Extract
Extrao de dados de fontes externas e ambientes operativos. Transformao dos dados para melhor se adequar s necessidades do negcio. Carregar os dados no data warehouse.
Transform
Load
Extrao
Projetos de Datawarehousing consolidam dados de diferentes fontes. Cada fonte pode usar um formato de dados diferente.
Mais comuns so tabelas de um banco de dados relacional e arquivos texto (flat files).
Transformao
Este processo aplica regras ou funes nos dados extrados para transform-los os dados a serem carregados no DW. Possveis transformaes so: Selecionar apenas algumas colunas para carregar. Traduzir valores codificados (e.x., se o sistema fonte armazena 1 para masculino e 2 para feminino, mas o DW armazena M e F).
Transformao
Codificar valores livres (e.x., mapear "Masculino" e "M" em 1) Obter um valor calculado (e.x., total_vendas = qtd * preco_unit) Sumarizar mltiplas linhas de dados (e.x., total de vendas para cada regio) . Quebrar uma coluna em vrias
Carga
Carregar os dados, j transformados, no Data Warehouse.
Os Dados
Os dados encontram-se em repositrios que constituem uma das principais preocupaes de um ADW
Os Dados
Os dados podem ser armazenados em diferentes nveis de agregao, como: dados detalhados, configurando o nvel operacional, dados levemente sumarizados e dados altamente sumarizados. O ADW pode apresentar os seguintes repositrios de dados:
Sistema de vendas
ODS
DW
Dados sincronizados
Sistema financeiro
Data Warehouse
Representa uma grande base de dados capaz de integrar, de forma concisa e confivel, as informaes (antes espalhadas) de interesse para a empresa.
Nem tudo que gerencial deve estar em um Data Warehouse, somente informaes em carter histrico e estatstico.
Data Warehouse
Ambiente Transacional
Data Marts
Normalmente, modelado em um esquema estrela, de acordo com as necessidades especficas do usurio final.
Normalmente so um subconjunto do DM. Destaque graas ao desenvolvimento de ferramentas OLAP para Desktop (DOLAP).
Arquiteturas de DW
Atividade
Uma empresa pretende construir um DW: (Voc pode escolher qualquer ramo, exemplos: hotel, supermercado).
Identifique fontes de dados. Identifique assuntos de interesse para tomada de deciso. D pelo menos dois exemplos de transformaes nos dados. Uma ODS seria necessrio neste ambiente? Justifique. D dois exemplos de tendncias a serem analisadas com informaes do DW. D um exemplo de anlise que deve ser feita por uma aplicao especfica do ambiente transacional (e no no ambiente do DW). Identifique DMs para o Ambiente de DW em questo.
Granularidade de Dados
Nvel de sumarizao dos elementos e de detalhes disponveis nos dados. Importante aspecto do projeto de DW.
Afeta volume de dados e tipos de consulta. Quanto maior o volume menor a performance.
Exemplo:
Data Hora Vendedor Valor
50 registros/ms
Ms Vendedor Valor
1 registro/ms
Granularidade de Dados
Alto nvel de detalhes Baixo nvel de granularidade. Mais baixo nvel de granularidade: Sistemas de transaes. Exemplo:
Granularidade de Dados
Granularidade de Dados
Do ponto de vista dos negcios... 1. Interessaria para o gerente analisar a evoluo das vendas no dia 5 de cada ms nos ltimos 5 anos? 2. E analisar o comportamento das vendas no ms de Dezembro nos ltimos 5 anos? 3. Analisar a evoluo das vendas de cada exemplar de um livro ou do de todos os exemplares? 4. Analisar a evoluo das vendas em cada loja ou nas lojas de uma regio?
Arquiteturas de DW
Tipos de Arquitetura
Arquitetura Global Arquitetura de DMs Independentes Arquitetura de DMs Integrados Top Down Bottom Up Combinada
Abordagens de Implementao
Arquitetura Global
Arquitetura
Determina o local onde o Data Warehouse, ou Data Marts, residem.
Arquitetura Global:
Global: Escopo de acesso das informaes (Centralizada) Disponvel para toda a empresa. Pode ser fisicamente centralizada ou distribuda. Arquitetura de integrao
Arquitetura Global
Trata a empresa como um todo Viso corporativa de dados Menor redundncia de dados Maior integrao e consistncia. Manuteno mais fcil Altssimo tempo de desenvolvimento
Cada departamento constri e gerencia o seu Data Mart. Data Marts atendem necessidades especficas de departamentos. No h foco corporativo (viso global). Maior redundncia. Menor integrao. Consultas mais limitadas. Tempo menor de desenvolvimento. Realidade Atual.
Data Marts implementados separadamente, mas so integrados/ interconectados. Dados comuns a vrios Data Marts podem ser compartilhados. Mais complexo que DMs independentes. Possibilita viso corporativa . Soluo intermediria entre Arquitetura Global e de DMs independentes
Abordagens de Implementao
Como o DW ser desenvolvido Padro inicial
A partir do DW so extrados dados para os Data Marts Informaes dos Data Marts:
Maior nvel de sumarizao Menor nvel no histrico do DW Viso corporativa Repositrio de metadados centralizado e simples Controle e centralizao de regras
Desvantagens:
Alta taxa de risco Politicamente difcil de ser definida Implementao Longa Expectativa relacionadas ao ambiente
Implementao rpida Retorno rpido Enfoque da equipe (desenvolvimento por reas de interesse).
Desvantagens:
No h garantias de padres nicos de metadados. Podem ocorrer redundncias de dados e inconsistncias entre Data Marts. Extrao de dados para mltiplos Data Marts crtico na interferncia junto aos sistemas transacionais. Desfio de possuir a viso corporativa.
Abordagem Bottom Up
Otimizar o processo de desenvolvimento. Garantir a consistncia dos metadados e facilidade de integrao do ambiente. Enterprise Data Mart Architecture (EDMA) Data Storage/Data Mart (DS/DM)
Exemplos:
Abordagem Bottom Up
Enterprise Data Mart Architecture (EDMA)
Garantir uma padronizao dos metadados utilizados na construo do ambiente, permitindo o desenvolvimento incremental do DW, com margens mnimas de duplicidade e inconsistncia de informaes. Introduz o DDS (substituindo o conceito do ODS original).
Abordagem Bottom Up
Enterprise Data Mart Architecture (EDMA)
Abordagem Bottom Up
Data Storage/Data Mart (DS/DM) Similar arquitetura EDMA, entretanto ela substitui o DW por uma viso que representa uma conjuno lgica de DM.
Abordagem Combinada
Modelo: abstrao do mundo real. Modelar: Forma de visualizar o que se deseja realizar. O mesmo vale para modelagem de dados
Diagrama ER:
Anlise de requisitos de negcio. Desenho de uma estrutura de dados. Visualizao de questes abstratas requisitos dos usurios de negcio. Exige nvel de abstrao superior ao utilizado em modelo de dados transacionais.
Modelagem multidimensional
Como est a evoluo das despesas durante o ano? Controlar despesas com relao ao oramento do ms. Saber quais produtos ou servios esto relacionados com estas despesas. Como est a relao percentual da despesa por tipo de gasto em relao ao oramento?
Modelagem Multidimensional
Mais simples e fcil de entender que modelagem ER Conceito relativamente novo Modelo Multidimensional:
Fatos
Representa um item, uma transao ou um evento de negcio. Usado para analisar o processo de negcio de uma empresa. Reflete a evoluo dos negcios do dia a dia de uma organizao. Representado por valores numricos.
Dimenses
Por ms, por pas, por produto, por regio, etc. Classificao de dados dentro de uma dimenso Dimenso tempo: Ano, Trimestre, Ms, Dia.
Hierarquia de Dimenses
Dimenses
Exemplo:
Dimenses:
Medidas (Variveis)
So os atributos numricos que representam um fato. Performance de um indicador de negcios relativo s dimenses que participam deste fato.
Medidas (Variveis)
Exemplo:
Medidas
Determinada pela combinao das dimenses que participam de um fato.
Atributos de um fato.
Localizao
11 22 41 A NOKIA
21 43 45 B
38 Tempo 35 56 C LG Produto
PB
Modelo Estrela
Fato (entidade central) Tabelas de Fato Dimenses (entidades menores) Tabelas de Dimenso
Modelo Estrela
Decomposio de dimenses que possuem hierarquias entre seus membros. Relacionamentos muitos para um entre entidades dimenses. Resultado da terceira forma normal sobre as entidades dimenso.
Modelo Multidimensional
Elementos Bsicos:
Fatos
Que tipo de informaes so armazenadas em um DW?
Informaes sobre notas fiscais? Qual o assunto das notas fiscais?
Fatos
Tudo que pode ter importncia para tomarmos decises na vida. Assunto sobre o qual necessitamos possuir informaes histricas para compreender seu comportamento e tomar decises sobre ele. Identificar Fatos:
Fatos
Caractersticas:
So evolutivos:
Fatos
O ndice de aprovao escolar na cadeira de Banco de Dados vem diminuindo nos ltimos dois anos
De que Fato se trata? Representado por valores numricos? Varia com o tempo? Possui histrico?
Fatos
2005 Curso BD Redes LPOO Alunos 50 45 48 AP 41 40 37 %AP 0,82 0,89 0,77 Alunos 45 55 50 2006 AP 35 42 37 %AP 0,78 0,76 0,74 Alunos 50 45 48 2007 AP 35 42 40 %AP 0,7 0,93 0,83
2009 Curso BD Redes LPOO Alunos 5 13 4 AP 0 7 1 %AP 0,0 0,53 0,25 Alunos 12 11 3
Fatos
O consumo de bebidas alcolicas aumentou no Brasil entre 2009 e 2010 O ndices de criminalidade aumentaram no ano atual 50% sobre os ltimos dois anos
Identificando fatos
Quando entrevistamos um executivo suas necessidades no aparecem sob a forma de um modelo de dados. Entretanto eles so muito objetivos quanto aos indicadores de negcio. Vamos buscar identificar os fatos do negcio. S ento poderemos projetar algo sensato para um DM/ DW.
Identificando fatos
Qual a participao dos clientes da regio sudeste em nosso mix de vendas? Qual a performance de nossos representantes em cada regio? Precisamos saber qual o ndice de participao de cada produto nas nossas vendas, o product share.
Identificando fatos
O que o fato?
O que varia ao longo do tempo? O que possui valor numrico relativo a perodos de tempo? Sobre o que podemos manter dados histricos com o passar do tempo?
Identificando fatos
O que o fato?
O que varia ao longo do tempo? O que possui valor numrico relativo a perodos de tempo? Sobre o que podemos manter dados histricos com o passar do tempo?
VENDAS
Identificando fatos
O que vem a ser considerada a participao dos clientes na regio sudeste? Performance dos representantes seria um fato?
Identificando fatos
Identificando fatos
Em modelagem ER tradicional:
Identificando fatos
Em modelagem ER tradicional:
Indicadores matemticos:
Participao, Performance, Evoluo, ndice
Exerccio 1
Identifique o fato e justifique sua resposta: Um programa exemplar faz do RS campeo em transplantes mltiplos de rgos. Cerca de 90% dos transplantes realizados no ano passado foram mltiplos. Em SP, 70% dos transplantes so realizados desta forma. No RJ, metade dos transplantes entram nesta categoria. Apenas nos dois primeiros meses deste ano quinze doadores permitiram que 46 pessoas continuassem vivendo
Exerccio 2
Busque na Internet, ou em jornais e revistas duas reportagens que permitam identificar fatos em determinados contextos.
Dimenses
So os elementos, entidades, que participam de um fato. O por dos dados. Considere o fato Compras em uma organizao. Quais so os elementos participantes deste fato? Aplicao dos quatro pontos cardeais:
Quando a compra foi realizada. Onde foi realizada. Quem realizou. O que foi comprado.
Dimenses
Identificamos ento quatro dimenses envolvidas nesse fato
Onde? Quando?
Compra
Quem?
O que?
Dimenses
Por meio do arranjo das dimenses podese analisar as informaes sob diferentes perspectivas. Ex.: Quanto o comprador Felipe comprou de produtos do tipo calado em Setembro de 2009 nas lojas Tamanco de Ouro? Dimenses de anlise: quem, quando, o que, onde.
Esquema Estrela
Um DM modelado para ambientes de bancos de dados relacionais. Esquema Estrela: A modelagem conceitual dos fatos o principal elemento de desenvolvimento de um DM/ DW. Conjunto de entidades Relacionadas.
As tabelas possuem atributos de identificao e que estabelecem o relacionamento entre elas, as chaves estrangeiras.
Esquema Estrela
A tabela fato um grande relacionamento muitos para muitos. Aplicao de atributos s tabelas permite visualizar um esquema estrela mais delineado.
Dimenso Tempo
Est presente em qualquer DM/ DW. A dimenso tempo uma hierarquia de espaos de tempo. Ex:
Anlise dos fatos so feitas sobre transaes em um espao de tempo definido como gro de anlise. Gro de anlise a unidade de tempo na qual os dados esto armazenados e podem ser sumarizados.
Dimenso Tempo
Exemplo: Dados agrupados por semana Compras realizadas diariamente, porm o menor gro de anlise so compras semanais. Valores so agregados hierarquicamente de semana at ano:
Dimenso Onde
Competio de programao no Rio de Janeiro marcado para as 10:00h. Quando faltavam 5 minutos para as 11:00h um locutor anunciou que as provas comeariam dali a 15 minutos.
Onde?
Rio de Janeiro
Dimenso Onde
Posse de Armnio Fraga no Banco Central agendada para as 14:00h em Braslia. A cerimnia comeou as 14:40h porque o Ministro da Fazenda custou a chegar
Onde?
Braslia Banco Central Duas ocorrncias da mesma entidade ou duas entidades Onde?
Dimenso Onde
Posse de Armnio Fraga no Banco Central agendada para as 14:00h em Braslia. A cerimnia comeou as 14:40h porque o Ministro da Fazenda custou a chegar
Onde?
Braslia Banco Central Duas ocorrncias da mesma entidade ou duas entidades Onde?
Atributos de Dimenso
Voltando ao fato compras
Atributos de Dimenso
Atributos de Dimenso
Cdigo do fornecedor mantido como um atributo da dimenso. Utilizaremos outra chave primria para o DM.
Por qu?
Atributos de Dimenso
Cdigo do fornecedor mantido como um atributo da dimenso. Utilizaremos outra chave primria para o DM.
Por qu?
Atributos de Dimenso
O que aconteceria se o fornecedor X mudasse para a rea 3? Histrico do fornecedor no muda. E o histrico das reas? Soluo: inserir uma nova ocorrncia de fornecedor, com uma nova rea.
Nova ocorrncia no Data Mart tem chave primria diferente. O atributo referente chave do ambiente transacional (Cdigo_fornecedor) o mesmo.
Dimenses
Eliminando o problema de mudana de rea do Fornecedor fornecedor.
Chave Fornecedor
Tempo
Chave Tempo
rea
Chave rea
Compra
Chave Fornecedor Chave Tempo Chave Comprador Chave rea Chave Produto
Comprador
Chave Comprador
Dimenses
No ambiente transacional:
Cdigo Fornecedor Cdigo rea (FK) Nome Fornecedor Cdigo rea
1 N
Nome rea
Atributos de Dimenso
Atributos da dimenso tempo:
Fornecedor
Chave Fornecedor
Tempo
Chave Tempo Ano Trimestre Ms
rea
Chave rea
Compra
Chave Fornecedor Chave Tempo Chave Comprador Chave rea Chave Produto
Comprador
Chave Comprador
Dimenses e Hierarquias
Quando carregamos dados para os fato compra as transaes so agrupadas pela granularidade mnima de tempo. Roteiro:
Agrupar registros por ms Identificar o ms na tabela tempo Obter a chave de tempo Usar a chave de tempo na gravao de um registro do fato.
Dimenses e Hierarquias
Informaes so organizadas hierarquicamente para fins de anlise. Exemplo: Informaes sobre produtos de uma empresa farmacutica.
Classe Teraputica
Familia
Sub Familia
Apresentao
Produto
Classe Teraputica
Fcil de entender. Para totalizar os valores preciso realizar um join entre as seis tabelas realizar clculos de totalizao dos valores. No a melhor soluo em termos de performance das consultas.
Modelo Estrela
Classe Teraputica
Familia
Sub Familia
Apresentao
Modelo Estrela
Muito usado na prtica Acesso direto entre a entidade da hierarquia e o fato, com simples seleo de dados e acumuladores de valores.
Dimeses e Hierarquias
Hierarquias mltiplas Exemplo: Produtos de um supermercado podem ser classificados em categorias: Alimento, Material de Limpeza, etc. Alimentos podem ter subcategorias.
Medidas
Data Marts so usados para consultar dados histricos sumarizados por perodos de tempo, e as mais variadas combinaes de classificao de uma informao. Normalmente se deseja ver a evoluo ou no de valores numricos, em um espao de tempo. Medidas
Medidas
Os ndices de criminalidade aumentaram no ano de 1999, 50% sobre os dois anos anteriores ndice: valor obtido sobre valores numricos de ocorrncia de um fato.
Tipos de Medidas
Valores Aditivos
Podem ser aplicadas operaes como soma, subtrao e mdia sobre estes valores. No podem ser manipulados livremente. Percentuais ou valores relativos
Valores No Aditivos
Tipos de Medidas
Valores semiaditivos:
Produto pode permanecer em estoque durante dois meses: Novembro e Dezembro de 2009. Soma dos totais em estoque em mais de um perodo contabilizaria mais de uma vez os mesmos itens de estoque.
Hierarquias de Medidas
Uma determinada medida pode possuir uma hierarquia de composio de seu valor. Ex.: Valor das Receitas uma medida composta de outras e que pode compor outras.
1. Receita Bruta = Valor de Venda Custo de Venda 2. Lucro antes dos impostos = Receita Bruta Despesas Corporativas 3. Lucro Lquido = Lucro antes dos impostos (Lucro antes dos impostos * 3%)
Hierarquias de Medidas
Observe: impostos tambm uma frmula, mas uma frmula no hierrquica, ou seja, no aplica operador sobre outro nvel hierrquico
Hierarquias de Medidas
Medidas existem em funo de dimenses que participam de um fato. Vamos considerar a dimenso produto. Cada valor das medidas est associado a um produto. Temos o produto participando do fato e os valores das medidas que aparecem no problema.
Hierarquias de Medidas
Hierarquias de Medidas
obtida a partir de uma operao sobre Lucro Lquido No est associada hierarquicamente com nenhuma outra medida Mesmo nvel hierrquico que Lucro Lquido.
Hierarquias de Medidas
At aqui vinculamos as medidas do fato vendas apenas a uma dimenso (produto). Vamos adicionar uma nova dimenso: regio.
preciso conhecer os valores relativos a venda por regionais de operao. At aqui consideramos as despesas como um todo, corporativas.
Hierarquias de Medidas
Hierarquias de Medidas
Colocar medidas na entidade fato. Manter todos os atributos na entidade? Manter apenas os necessrios para os clculos?
Discutvel...
Atributos de um Fato
Os atributos identificados so todos relativos ao fato venda? O usurio consegue montar uma planilha com estes dados? Se sim, os atributos so relativos ao fato
Chave Produto Chave Regio Chave Regio Nome Regio 1 Impostos * Venda Bruta Custo de Venda 1 * Despesa Corporativa Despesa Marketing Despesa Administrativa Despesa Compras Despesa Outras Chave Produto Descrio Produto
O sistema transacional
Controla filmes por sala de cinema onde so exibidos, tendo informaes sobre a capacidade de lotao de cada sala, localizao regional no pas, assim como os registros de bilheteria de cada sesso diria de cinema.
As necessidade executivas
Acompanhar a evoluo do pblico e o valor arrecadado em cada regio do pas, estado e cidade, classificados por gnero de filme e sala de cinema. Avaliar a evoluo de filmes por ator participante, assim como por diretor. Quais diretores atraem o maior pblico e em que gnero est este pblico. Quais perodos do ano possuem maior pblico por gnero, ator e diretor, e geograficamente.
Identificando o fato
Acompanhar a evoluo do pblico e o valor arrecadado em cada regio do pas, estado e cidade, classificados por gnero de filme e sala de cinema. Quem tem pblico? Quem tem valor arrecadado?
Identificando o fato
Acompanhar a evoluo do pblico e o valor arrecadado em cada regio do pas, estado e cidade, classificados por gnero de filme e sala de cinema. Quem tem pblico? Quem tem valor arrecadado? EXIBIO DE FILME
Identificando o fato
Em geral, fatos correspondem a relacionamento muito para muitos no modelo de dados transacional
Onde? Exibio_de_Filmes Quem?
Quando?
O que?
Medidas
Acompanhar a evoluo do pblico e o valor arrecadado em cada regio do pas, estado e cidade, classificados por gnero de filme e sala de cinema.
Dimenses
Onde o filme exibido? Acompanhar a evoluo do pblico e o valor arrecadado em cada regio do pas, estado e cidade, classificados por gnero de filme e sala de cinema. Duas dimenses relativas ao ponto cardeal onde.
Dimenses
O qu exibido? Acompanhar a evoluo do pblico e o valor arrecadado em cada regio do pas, estado e cidade, classificados por gnero de filme e sala de cinema
Dimenses
Quem participa do filme exibido? Avaliar a evoluo de filmes por ator participante, assim como por diretor.
Dimenses
Quando?
Modelo Estrela
Chave_Tempo Ano Trimestre Mes Periodo Dia
Chave_Genero Descricao
Chave_Tempo
Modelo Estrela
Chave_Tempo(FK) Chave_Cidade(FK) Chave_Sala(FK) Chave_Diretor(FK) Chave_Ator(FK) Chave_Genero(FK) Chave_Genero Descricao Chave_Ator Nome_Ator Numero_de_pessoas Valor_arrecadado
Chave_Sala Nome_Sala
Sistema Transacional
Sistema usado at o presente momento pela instituio, que cadastra os docentes, alunos e gerenciam as suas notas, freqncias e matriculas. H ainda dados em cada gerencia acadmica referente a protocolos e entradas extras que alunos podem vir a requisitar como casos extraordinrios.
As necessidade executivas
A produtividade de cada professor ao longo de vrios perodos. A produtividade descrita da seguinte maneira:
(a) N de alunos matriculados em disciplinas do professor por perodo acadmico (b) N de alunos aprovados / N total de alunos
A produtividade de cada departamento: mdia da produtividade dos seus professores. O ranking dos professores mais produtivos perodo a perodo, por curso e por departamento. Produtividade disciplinas tericas versus disciplinas prticas
Esquema ER
Disciplina:Cdigo,Nome,No_creditos,Natureza{teoria,prtica} Professor:Matrcula,Nome,Titulao,Endereo Aluno:Matrcula,Nome,Estado_civil,Sexo,Ano_ingresso Curso:Cdigo,Descrio,No_crditos,Durao_normal Turma:Ano,Perodo,Sala Departamento:Cdigo,Nome
Esquema Estrela??
Fato? Dimenso Onde? Dimenso O que? Dimenso Quem? Dimenso Quando?
Esquema Estrela??
Fato? Produo escolar Dimenso Onde? Curso, Departamento Dimenso O que? Disciplina Dimenso Quem? Professor Dimenso Quando? Tempo Ano/Periodo
Modelo Multidimensional
ROLAP: Modelagem multidimensional, ambiente transacional, consultas analticas atravs de SQL puro. HOLAP: Modelagem multidimensional, ambiente transacional, consultas analticas atravs de ferramenta. OLAP: Modelagem multidimensional, ambiente analtico, consultas analticas atravs de ferramenta.
A produtividade de cada professor ao longo de vrios perodos. A produtividade descrita da seguinte maneira:
(a) N de alunos matriculados em disciplinas do professor por perodo acadmico (b) N de alunos aprovados / N total de alunos
Exemplo HOLAP
Mesmo Banco de Dados com uma ferramenta de criao de consultas automticas: PENTAHO
Exemplo - OLAP
Banco de dados e ambiente de consultas diferenciado: - Oracle BI - SQL Server Analysis Services
OLAP Definio
OLAP (Processamento analtico on-line) uma categoria da tecnologia de software que permite que, analistas, gerentes e executivos obtenham, de maneira rpida, consistente e interativa, o acesso a uma variedade de visualizaes possveis da informao (INMON,1997);
OLAP Definio
OLAP : processamento de dados, dedicado ao suporte deciso, por meio de visualizao de dados agregados ao longo de vrias dimenses analticas (tempo, espao, categoria de produto, quantidade vendida, preo...), armazenados em BD dimensional.
OLAP Objetivos
A tecnologia OLAP foi definida em decorrncia da forte necessidade de anlises dos dados de forma fcil e flexvel, analisando mltiplas vises do negcio em diferentes nveis de detalhe, comparaes e tendncias.
OLAP Objetivos
Ajudar analistas e gerentes a sintetizarem informaes sobre a empresa atravs de comparaes, vises personalizadas, anlise histrica e projeo dos dados em vrios cenrios
Operaes OLAP
Operaes Drill
Utilizam navegao nos dados, modificando o nvel de granularidade da consulta. Drill down/ Roll up (Drill up) Drill Across Drill Throught Navegar nas dimenses
Drill down:
O usurio navega de um nvel mais baixo de detalhe at um nvel mais alto (diminui-se a granularidade) O usurio navega de um nvel mais alto de detalhe at o nvel mais baixo (aumenta-se a granularidade).
Roll up:
Drill Down: aumentar o nvel de detalhe, ir para o menor gro. Roll Up: diminuir o nvel de detalhe, subir para o maior gro.
Drill Across
O Drill Across ocorre quando o usurio pula um nvel intermedirio dentro de uma mesma dimenso.
Por exemplo: a dimenso tempo composta por ano, semestre, trimestre e ms. O usurio estar executando um Drill Across quando ele passar de ano direto para ms.
Drill Throught
O Drill Throught ocorre quando o usurio passa de uma informao contida em uma dimenso para uma outra.
Por exemplo: Estou na dimenso de tempo e no prximo passo comeo a analisar a informao por regio.
Operaes para realizar navegao por meio dos dados na visualizao por meio de um cubo. Slice
Corta o cubo, mas mantm a mesma perspectiva de visualizao dos dados. Funciona como um filtro restringindo uma dimenso somente algum ou alguns de seus valores
Dice
Mudana de perspectiva da viso multidimensional, como se o cubo fosse girado. Permite descobrir comportamentos e tendncias entre os valores das medidas analisadas, em diversas perspectivas
Slice (exemplo)
Dice (exemplo)
Esquema Estrela
Esquema Estrela
Tabelas Fato Tabelas Dimenso Um modelo dimensional pode ser representado por uma ou mais tabelas de fatos, relacionadas com tabelas de dimenses. Entretanto, a viso de um esquema por vez torna o modelo mais claro.
Tabelas Secundrias
Qual a produo escolar por titulao de professores? Quais as disciplinas que mais reprovam alunos? Qual das provas tem notas mais baixas? Primeira, Segunda, Reposio, Final? Qual o product share da produtividade dos departamentos/cursos/disciplinas?
Clculos que aumentam o processamento das consultas
Tabelas Secundrias
Dados Secundrias
Dimenses Secundrias Fatos Secundrios Medidas Secundrias Formas de acelerar as consultas a partir de novas sumarizaes
Ex: Agregado apenas de ano
Agregados
Tabelas Secundrias
Tabelas Secundrias
Controlar crescimento do banco de dados pelas tabelas secundrias vs. conservar os benefcios!
Esparsidade do DW
Em um DW, em geral a tabela de fatos primria bastante esparsa, isto , h muito menos valores da chave composta do que o produto cartesiano dos valores das chaves de cada dimenso. Isto bom porque, do contrrio, o tamanho da tabela primria tenderia ao "infinito"!
Esparsidade do DW
Dimenso Tempo: 2 anos x 365 dias = 730 dias Dimenso Loja: 300 lojas Dimenso Produto: 30.000 produtos Nmero de registros da tabela de fatos: 730 x 300 x 30.000 = 6570 x 10 registros Porm, dos 30.000 produtos em estoque, somente 3.000 aproximadamente (10%) so comercializados diariamente, por loja.
Poda e Arrumao
Para montar o esquema estrela necessrio descobrir quais os atributos do MER que sero utilizados
Cdigo Nome
Matricula
Nome
Cdigo N. de crditos
Titulao
Disciplina Natureza
Producao_escolar
Turma
Professor
Endereo
Nota
Poda
Remoo de campos desnecessrios ao modelo: - Professor: Tiramos endereo, matricula e deixamos apenas nome e titulao. - Turma: Tiramos a nota, e deixamos apenas o ano e o perodo, e a chamamos de tempo. - Departamento: Tiramos o cdigo e deixamos apenas o nome. - Disciplina: Apenas deixamos natureza.
Poda
Nome
Natureza
Nome
Disciplina
Producao_escolar
Tempo Titulao
Professor