Vous êtes sur la page 1sur 4

Data Warehouse (ou armazm de dados) um banco de dados utilizado para armazenar informaes

relativas s atividades de uma organizao de forma consolidada. O DW tem como principal finalidade
organizar grandes volumes de dados histricos em um formato adequado para anlise e recuperao de
informao.

Data Warehouse tipicamente um banco de dados baseado em assuntos, projetado para suportar as
necessidades dos sistemas de suporte deciso.

Sistemas de Suporte Deciso um tipo de sistema utilizado para auxiliar em decises administrativas.

Data Mart um subconjunto do data warehouse da empresa e geralmente desempenha o papel de um DW
departamental, regional ou funcional.

A anlise e transformao de dados em informaes com valor agregado e que permita auxiliar nas
tomadas de deciso da empresa, traz para a empresa um diferencial no mercado, podendo resultar em
vantagens no apenas estratgicas, mas tambm financeiras.

O processo de extrair, transformar e carregar as informaes do banco de dados e unific-las em um nico
local conhecido como ETL (Extract Transformation Load). uma etapa crtica durante o projeto de
modelagem do DW, pois durante este processo que ir ocorrer a padronizao dos dados.

OLAP (On-line Analytical Processing ou Processamento Analtico On-line) uma ferramenta de Business
Intelligence, que possibilita a explorao dos dados em um DW visando obter novos conhecimentos que
sero empregados para apoiar as empresas na tomada de deciso. Seu objetivo final e transformar dados
em informaes capazes de dar suporte s decises gerenciais de forma amigvel e flexvel ao usurio em
tempo hbil.

Drill Across: ocorre quando o usurio pula um nvel intermedirio dentro de uma mesma dimenso.

Drill Down: ocorre quando o usurio aumenta o nvel de detalhe da informao, diminuindo a
granularidade.

Drill Up: ocorre quando o usurio aumenta a granularidade, diminuindo o nvel de detalhamento da
informao.

Slice/Dice: um mdulo responsvel por trabalhar informaes que so armazenadas em cubo
multidimensionais, que gravam valores quantitativos e medidas, permitindo visualizao atravs de
diversos ngulos.

O MOLAP (Multidimensional On-line Analytical Processing) uma forma clssica d OLAP, em que os dados
de base e suas agregaes so armazenadas usando um cubo dimensional.

O tipo de arquitetura ROLAP (Relational On-line Processing) utiliza banco de dados relacionais para
armazenar os dados, realizando a consulta no servidor do banco de dados relacional.

Aplicativos OLAP (On-line Analytical Processing) so uma forma de visualizao de dados que possuem a
capacidade de manipular e analisar um grande volume de dados sob mltiplas perspectivas.
Ferramentas OLAP so ferramentas utilizadas para executar anlises sobre os dados de DW e DM, com
capacidade de visualizar as informaes sob diferentes ngulos e nveis de agrupamento/detalhamento.

Os cubos so construdos de tal forma que, cada combinao de atributos das dimenses com uma
mtrica, ou pr-calculado ou calculado muito rapidamente.


Principais caractersticas do DW:
- Orientado por assunto: responde a determinadas questes sobre uma rea especfica de negcio.
- Integrado: dados consistentes entre si.
- No voltil: aps os dados serem carregados, estes ficam disponveis apenas para consultas e gerao de
relatrios.
- Varivel com o tempo: todos os dados encontrados no DW so precisos em algum instante no tempo. As
informaes contidas referem-se a algum momento especfico, no sendo atualizvel.
- Granularidade: o nvel de detalhamento existente no DW. Quanto mais detalhes existir, mais baixo ser
o nvel, e quanto menor detalhes existir, mais alto ser seu nvel.
- Agregao: unio de dados do mesmo tipo.
- Consultas ad-hoc: consultas realizadas de maneira instantnea, ou seja, vo sendo compostas a partir das
necessidades do usurio.

Ad Hoc uma tcnica de acesso informao onde o prprio usurio constri as suas consultas e o seu
significado direto ao assunto.

O Modelo Dimensional para construo de banco de dados para Data Warehouse uma forma de
modelagem onde as informaes se relacionam de forma que pode ser representada como um cubo.
Esta tcnica permite representar as informaes importantes para o modelo de negcios.
A modelagem dimensional est focada em estabelecer vises integradas para a gerao de relatrios
gerenciais em um modelo de visualizao de dados composto de um conjunto de medidas que descrevem
aspectos comuns de negcio.
O modelo dimensional representa:
- os indicadores importantes para uma rea de negcios, que so chamados de fatos ou mtricas;
- os parmetros atravs dos quais estas mtricas so analisadas pelos usurios que so chamados de
dimenses (as dimenses de negcios).

Tabelas de dimenso
A principal funo de uma tabela de dimenso reunir os atributos que sero utilizados para qualificar as
consultas e cujos valores sero utilizados para agrupar ou sumarizar as mtricas (ou fatos).

A chave primria de uma tabela dimenso deve ser sempre um atributo nico e definido pelo sistema com
um valor genrico, inteiros atribudos sequencialmente.
Uma das razes para se utilizar chaves genricas, artificiais, substitutas ou surrogate Keys que o Data
Warehouse deve se manter isolado das regras operacionais para gerar, atualizar, excluir, reciclar e reutilizar
os cdigos utilizados nos sistemas transacionais. Outra razo que, em caso de alteraes de atributos nos
sistemas transacionais, as chaves genricas sero a base para se manter o histrico destas alteraes no
data warehouse (Slowly Changing Dimensions ou dimenses que mudam lentamente).
Slowly Changing Dimension um termo utilizado em teorias de DW para grupos de dados lgicos, como
informaes de produtos, clientes, etc., que mudam lentamente ao longo do tempo. SCD bastante
utilizado para armazenar alteraes em informaes que compe um sistema de BI. So regras que
definem a alterao para cada campo.

EXTRAO
Esta etapa responsvel por realizar a seleo e extrao dos dados de fontes distintas que realmente
sero relevantes para a montagem do data warehouse. Durante o processo da extrao, apenas os dados
que so teis e relevantes ao negocio, so extrados para o Data WareHouse.

TRANSFORMAO
Pode-se dizer que esta a etapa mais cautelosa da ETL. Esta etapa de transformao, conforme j
comentado ocorre preferencialmente na rea de stage.
nesta etapa que tentamos garantir aos usurios do DW, a integrao e confiabilidade dos dados
armazenados. Para isto realizamos uma seria de transformaes e acabamos tambm por filtrar apenas o
que ser necessrio para carga do DW.

CARGA
a etapa final da ETL. Os dados teoricamente j se encontram limpos e transformados.
Este o momento de ser realizada a carga dos dados da rea de stage para o data warehouse em si. Depois
de realizada todas as transformaes, codificaes, sumarizaes j calculadas, os dados se encontram
num ponto aceitvel, assumindo que esto com todos os requisitos atendidos, para serem carregados no
data warehouse.

Carga incremental ou a carga por cima dos dados. A carga incremental normalmente feita para tabelas
fatos e a carga por cima dos dados feita em tabelas dimenses onde o analista ter que excluir os dados
existentes e inclu-los novamente. Mas em alguns casos poder acontecer que as tabelas de dimenses tm
de manter o histrico, ento o mesmo dever ser mantido (slowly change dimension).

Outro ponto a ser definido nesta etapa, se a carga a ser realizada ser incremental ou total. Definir que a
carga seja incremental, quer dizer que os dados sero apenas adicionados ao data warehouse. J com a
carga do tipo total, os dados existentes sero excludos e os dados so re-inseridos. Geralmente orienta-se
que a carga incremental seja realizada em tabelas fatos e a carga total em dimenses. Isto porque os dados
das dimenses no sofrem tantas alteraes e tendem a manter e a ocupar o mesmo espao com um
pequeno crescimento ao longo do tempo. O que em relao s tabelas fatos isto no ocorre, pois so
entidades que tendem a ter um crescimento continuo, devido a armazenarem informaes consolidadas do
assunto, obtidas e guardadas do dia-dia da organizao.

A dimenso Tempo (que tambm pode ser chamada de dimenso Data, quando a granularidade o dia) vai
aparecer em todos os data warehouses/data marts. Isto porque os DW/DM tem como caracterstica
manter a informao temporal, o que possibilita os diversos comparativos dos indicadores e mtricas ao
longo do tempo.

Tabela fato a tabela que conter as mtricas, ou valores a serem analisados pelos usurios, atravs de
informaes representadas nas dimenses. Ela representa quais informaes sero analisadas e as
dimenses representam como elas sero analisadas. A tabela fato contm dois grupos de atributos:
- as mtricas ou fatos numricos e
- as chaves para cada uma das dimenses do modelo.

Fatos so os nmeros que sero medidos e analisados atravs das diferentes dimenses de ngocios.

No Modelo Estrela (Star Schema) todas as tabelas relacionam-se com a tabela de fatos. Este modelo
chamado de estrela porque a tabela de fatos fica ao centro, cercada das tabelas dimensionais,
assemelhando-se a uma estrela. Mas o ponto forte que as dimenses no so normalizadas, contendo
descries repetidas em cada registro.

Star Schema uma tcnica de modelagem para DW onde os modelos tomam a forma de uma estrela.

No Modelo Floco de Neve (Snow Flake) as tabelas dimensionais relacionam-se com a tabela de fatos, mas
algumas dimenses relacionam-se apenas entre elas. Isto ocorre para fins de normalizao das tabelas
dimensionais, visando diminuir o espao ocupado por estas tabelas. Este modelo chama-se floco de neve,
pois cada dimenso se divide em vrias outras tabelas, onde so organizadas de uma certa forma que
lembra um floco de neve.

Snow Flake um tcnica de modelagem para DW que evoluiu a partir da tcnica Star Schema

Um snapshot de banco de dados prov uma viso esttica e somente leitura de outro banco de dados
(origem) num determinado ponto no tempo. Snapshots podem ser usados para criar cpias de um banco
de dados e usar estas cpias como fonte de consultas e relatrios.

Hierarquia

DIM_CLIENTE

SK_Cliente
PK_Cliente
Nome
Sexo
DataCadastro
DataNascimento
Cartao
Identificador
Endereco
Numero
Bairro
Cidade
Estado
Pais


DIM_PONTOVENDA
PK_PontoVenda
Caixa
Departamento
TipoLoja
CNPJ
Endereco
Numero
Bairro
Cidade
Estado
Pais



DIM_TEMPO

PK_Data
Ano
Semestre
Quadrimestre
Trimestre
Bimestre
Ms
Ms_Extenso
Quizena
Dia
Dia_Semana

Vous aimerez peut-être aussi