Académique Documents
Professionnel Documents
Culture Documents
Planejamento Levantamento das necessidades Modelagem dimensional Projeto fsico dos BD Projeto ETC Desenvolvimento aplicaes Validao e teste Treinamento Implantao
Definio do ambiente (relatrios e consultas prestruturadas geram pouca demanda de BD, anlises complexas exigem maior demanda de BD, frequncia de necessidade de atualizao (grandes volumes de dados que so atualizados em intervalos regulares, favorecem uma arquitetura centralizada)
Identificao de dois modelos: Modelo dimensional Modelo relacionado com as fontes das informaes (modelo fonte dos dados) Anlise da qualidade e integridade dos dados fonte
Anlise dos volumes brutos dos dados visando o processamento para obteno de informaes consolidadas As tarefas de modelagem dimensional devero ser suportadas por planilhas de apoio, para facilitar os calculos e estimativas de carga e volumes projetados. Definio fatos e dimenses e respectivos atributos Nvel de granularidade e agregadores
Desenho fsico das estruturas lgicas do modelo dimensional: estimativa de tamanho do database criao do database criao das: tabelas fato e dimenso relacionamentos indexao atributos de tabelas campos chaves restries, e implantao de regras.
Definio dos processos requeridos de extrao, transformao e carga do modelo fonte para o modelo dimensional. Definio dos tratamentos a serem utilizados (filtro de dados, integrao de dados, condensao de dados (resumidos e sumariados), converso de dados e derivao de dados (criao dados virtuais a partir de existentes))
Desenvolvimento das aplicaes para ETC e tambm para consultas gerenciais Em caso de utilizao de ferramentas adquiridas gerao de modelos para facilitar ao usurio final a elaborao de consultas
Ser efetuado treinamento para usurio nas ferramentas OLAP e no modelo dimensional criado.
A implantao dever ser seguida de rigoroso acompanhamento de uso das aplicaes disponibilizadas.
Em paralelo a todas as etapas dever ser construdo o diretrio de metadados do projeto. Este diretrio dever permitir ao usurio obter as informaes para uso do sistema
Data Mining
Banco de dados
DW e DM
Business Intelligence
Vendas de livro de informtica por ms e por regio Que fatores influenciam a venda de livros em BH? Que fatores influenciaram a variao de venda de livros de informtica nos ltimos 3 meses?
Preparao
Minerao Anlise
Aplicao
Preparao
Alguns coeficientes podem ser obtidos na anlise de associao efetuada: Valor de confiana (confidence) ou probabilidade da cesta contendo sertanejo conter tambm pagode -Sertanejo aparece em 6 transaes -Pagode aparece em conjunto com Sertanejo em 4 Confidence = 4/6 (67%) quanto maior este valor mais forte a correlao
Tcnicas bsicas definidas no processo de garimpagem: Associao indica coeficiente de afinidade entre registos de determinados fatos. Exemplo Padres sequenciais Definidos como processos que visam a identificao de fatos que implicam em outros fatos, em momentos diferentes de tempo (Ex:
estabelecer correlaes como 60% dos clientes que compram lambada, num espao mximo de 2 meses voltam para comprar um cd de Maria Rita (certamente como elemento de desintoxao)), anlise de comportamento de fraudes e perfis de consumidores.
Classificaes So processos que definem agrupamentos de itens em classes segundo referncias estabelecidas. Ex. em sistemas de anlise de
risco de crdito onde os clientes so classificados segundo padres de atraso de pagamento, classe, idade, etc. Modelos definidos atravs de redes neurais, rvores de deciso, etc
Agregao Atua em conjunto de registros porm os registros no esto classificados nem definidos em referncias estabelecidas. Ex. trabalhos para
segmentao do mercado, anlise de defeitos, etc.