Académique Documents
Professionnel Documents
Culture Documents
Resumo
Em termos simples, um Data Warehouse, ou em portugus, Armazm de Dados, pode ser
definido como um banco de dados especializado, o qual integra e gerencia o fluxo de
informaes a partir dos bancos de dados corporativos e fontes de dados externas empresa.
Grande parte do trabalho na construo de um DW est na anlise dos sistemas
transacionais e dos dados que eles contm.
Um Data Warehouse permite a gerao de dados integrados e histricos auxiliando os
diretores a decidirem embasados em fatos e no em intuies ou especulaes, o que reduz a
probabilidade de erros aumentados velocidade na hora da deciso. Conhecer mais sobre
essa tecnologia permitir aos administradores descobrir novas maneiras de diferenciar sua
empresa numa economia globalizada, deixando-os mais seguros para definirem as metas e
adotarem diferentes estratgias em sua organizao, conseguindo assim visualizarem antes
de seus concorrentes novos mercados e oportunidades atuando de maneiras diferentes
conforme o perfil de seus consumidores.
O artigo contempla uma apresentao da importncia do Data Warehouse nas organizaes
e algumas definies e caractersticas dessa tecnologia. Disserta-se tambm sobre sua
implementao e alguns problemas que podem ocorrer. Para finalizar so apresentadas
algumas ferramentas de extrao de informaes e consideraes finais.
Palavras-Chave: Data Warehouse; Organizaes; Ferramentas.
1 Introduo
Uma importante questo estratgica para o sucesso de qualquer organizao nos dias de hoje
a sua capacidade de analisar, planejar e reagir, rpida e imediatamente, s mudanas nas
condies de seus negcios. Para que isso acontea, necessrio que a organizao disponha
de mais e melhores informaes, que constituem, reconhecidamente, a base destes processos.
Os avanos da tecnologia de informao vieram garantir a possibilidade das empresas
manipularem grandes volumes de dados e atingirem um alto ndice de troca de informaes,
com o uso das redes viabilizando operaes em nvel mundial. Com a globalizao, os
negcios no tm mais fronteiras, ter a informao correta no menor tempo possvel e utilizarse de sistemas de apoio deciso tornou-se o grande diferencial para as empresas.
Diariamente, dados sobre os mais variados aspectos dos negcios da organizao so gerados
e armazenados, e passam a fazer parte dos recursos de informao da mesma. Entretanto,
essas informaes encontram-se, em geral, espalhadas em diversos sistemas e exigem um
esforo considervel de integrao para que possam dar suporte efetivo tomada de deciso
de gerentes e executivos. Isso significa que, em que pesem os avanos da tecnologia de
armazenamento e manipulao de dados, ainda se verifica, nos dias de hoje, uma grande
deficincia na obteno gil de informaes estratgicas (datawarehouse, 2005).
Por esse motivo, um novo conjunto de conceitos e ferramentas vem ganhando enorme
destaque nos ltimos anos como a tecnologia de Data Warehouse, que oferece s
organizaes uma maneira flexvel e eficiente de obter as informaes necessrias a seus
processos decisrios. De acordo com Elmasri e Navathe (1994) o Data Warehouse (DW)
prov armazenamento, funcionalidade e responsividade s perguntas que exigem capacidade
de armazenamento alm dos bancos de dados orientados para transaes. Prov tambm
acesso a anlise de dados complexos, obteno de conhecimento e, principalmente, est
direcionada para aplicaes de suporte deciso.
2 Data Warehouse como uma Necessidade Organizacional
Com a evoluo da tecnologia de informao e o crescimento do uso de computadores
interconectados, praticamente todas as empresas de mdio e grande porte esto utilizando
sistemas informatizados para realizar seus processos mais importantes. Com o passar do
tempo esses sistemas acabam gerando uma enorme quantidade de dados relacionados ao
negcio, mas no relacionados entre si, pois normal que estes dados estejam espalhados por
diversos locais e que tenham sido gerados por sistemas desenvolvidos em diferentes
ambientes e linguagens.
Sabe-se que os bancos de dados so de vital importncia para as empresas e tambm que
sempre foi difcil analisar os dados neles existentes. Ou seja, estes dados armazenados em um
ou mais sistemas operacionais de uma empresa so um recurso, mas de modo geral, raramente
servem como recurso estratgico no seu estado original.
Os sistemas convencionais de informtica no so projetados para gerar e armazenar as
informaes estratgicas, o que torna os dados vagos e sem valor para o apoio ao processo de
tomada de decises das organizaes. Alm disso, no se consegue buscar informaes que
permitam tomada de deciso embasada num histrico dos dados. As decises normalmente
so tomadas com base na experincia dos administradores quando poderiam tambm ser
baseadas em fatos histricos, que foram armazenados pelos diversos sistemas de informao
utilizados pelas organizaes. O uso dos dados histricos poderia identificar as tendncias e
posicionar a empresa estrategicamente para ser mais competitiva e conseqentemente
maximizar os lucros diminuindo o ndice de erros na tomada de deciso. Cerca de 88% dos
diretores admitem que dedicam quase 75% do tempo s tomadas de deciso apoiadas em
anlises subjetivas (Aspect International Consulting, 1997, apud datawarehouse, 2005),
menosprezando o fato de que por volta de 100% deles tem acesso a computadores.
A necessidade de novos mtodos e tecnologias surgiu da constatao, primeiro de que existe
uma necessidade de informao no atendida pelos aplicativos comerciais convencionais, que
Um Data Warehouse construdo para que tais dados possam ser armazenados e acessados de
forma que no sejam limitados por tabelas e linhas estritamente relacionais. Elmasri e
Navathe (1994) complementam ao afirmando que ele um modelo de dados
multidimensional que armazena dados de forma integrada e disponibiliza sries no tempo e
anlises de tendncias travs de banco de dados histrico e no-volatividade. interessante
salientar que o DW est separado dos bancos de dados operacionais, portanto as consultas dos
usurios no impactam nestes sistemas, que ficam resguardados de alteraes indevidas ou
perdas de dados.
Stair e Reynolds (2002) atestam que como o propsito do DW suportar requisies de
informaes, esse tem como caractersticas: fonte de dados de arquivos mltiplos, de banco de
dados internos e externos; os acessos dos usurios so para somente leitura; o modo de acesso
primrio aos dados se d por consultas simples ou complexas, com uso crescente do data
mining; utilizao de um modelo de banco de dados relacional e multidimensional; os nveis
de detalhes so freqentemente resumidos; dados histricos de mltiplos anos; h um
processo peridico de atualizao, mas esses so complexos, j que se combinam diversas
fontes; e necessrio um grande esforo de limpeza dos dados para que esses fiquem
ntegros.
4 Caractersticas do Data Warehouse
Segundo Inmon (1996), um DW deve ser orientado por assuntos, integrado, varivel no tempo
e no voltil. Essas seriam as principais caractersticas de um DW, porm existem outras
tambm importantes como a localizao, credibilidade dos dados e granularidade (Cazella,
2005).
4.1 Orientao por Assunto
A orientao por assunto uma caracterstica marcante de um DW, pois toda modelagem
voltada em torno dos principais assuntos da empresa. Enquanto todos os sistemas
transacionais esto voltados para processos e aplicaes especficas, os DWs objetivam
assuntos. Os assuntos so o conjunto de informaes relativas determinada rea estratgica
de uma empresa. Um exemplo tpico pode ser ilustrado da rea de vendas como produtos,
revendedores, contas e clientes.
4.2 Integrao
Esta caracterstica talvez seja a mais importante do DW. atravs dela que se padroniza uma
representao nica para os dados de todos os sistemas que formaro a base de dados do DW.
Por isso, grande parte do trabalho na construo de um DW est na anlise dos sistemas
transacionais e dos dados que eles contm. Esses dados geralmente encontram-se
armazenados em vrios padres de codificao, isso se deve aos inmeros sistemas existentes
nas empresas, e que eles tenham sido codificados por diferentes analistas. Isso quer dizer que
os mesmos dados podem estar em formatos diferentes.
Um exemplo clssico o que se refere aos gneros masculino e feminino. Num sistema
OLTP, o analista convencionou que o sexo seria 1 para masculino e 0 para feminino, j em
outro sistema outro analista usou para guardar a mesma informao a seguinte definio, M
para masculino e F para feminino, e por fim outro programador achou melhor colocar H para
masculino e M para feminino. Como podemos ver, so as mesmas informaes, mas esto em
formatos diferentes, e isso num DW jamais poder acontecer. Portanto por isso que dever
4.5 Localizao
Os dados podem estar fisicamente armazenados de trs formas:
Num nico local centralizado, com banco de dados em um DW integrado procura-se nessa
forma maximizar o poder de processamento e agilizando a busca dos dados. Esse tipo de
armazenagem bastante utilizada, porm h o inconveniente do investimento em
hardware para comportar a base de dados muito volumosa e o poderio de processamento
elevado para atender satisfatoriamente as consultas simultneas de muitos usurios.
Alm dos passos anteriores, os usurios devem ser treinados de forma a aprender como
manipular as informaes existentes seja na criao das estatsticas, seja na criao de
grficos e relatrios.
7 Problemas que podem existir na Implantao de um Data Warehouse
Existem diversos problemas que podem ocorrer durante o desenvolvimento de um sistema de
DW. Dentre estes problemas, segundo Bar (1996, apud Data Warehouse, 2005), os mais
comuns so:
a) No envolver a alta direo da empresa no projeto: O projeto de um DW s ter sucesso se
os futuros usurios se envolverem diretamente desde o incio nas atividades, pois isto
facilitar a destinao das verbas necessrias nos momentos oportunos alm de direcionar os
trabalhos para que os reais objetivos do DW para o negcio da empresa sejam alcanados no
momento da implantao.
b) Gerar falsas expectativas com promessas que no podero ser cumpridas: citar frases do
tipo "O DW mostrar aos gerentes as melhores decises" pode causar tanto desconfiana no
projeto quanto desprezo. O DW no mostrar as melhores decises, mas sim respostas s
consultas efetuadas. Cabe aos usurios elaborar consultas inteligentes e analisar as respostas
obtidas.
c) Carregar no DW informaes somente porque elas esto disponveis nos sistemas
transacionais: Nem todos os dados disponveis nos sistemas operacionais da empresa so
necessariamente teis para o DW. Cabe ao arquiteto dos dados analisar junto com os usurios
quais os dados que realmente contm informaes necessrias e desprezar aqueles que no
fazem parte dos objetivos do DW.
d) Imaginar que o projeto do banco de dados do DW o mesmo que o projeto de um sistema
transacional: num processo transacional devem ser dimensionados os recursos para que se
atinja uma alta velocidade de acesso e grandes facilidades na atualizao de registros. Nos
sistemas de apoio deciso a realidade totalmente outra. O objetivo destes sistemas
fornecer acessos agregados, ou seja, somas, mdias, tendncias, etc. Outra diferena entre os
dois tipos de sistemas pode ser detectado no tipo de usurios. Nos sistemas transacionais um
programador desenvolve uma consulta que poder ser utilizada milhares de vezes. No DW o
usurio final desenvolve suas prprias consultas que podem ser utilizadas somente uma vez.
e) Na seleo do pessoal, escolher um gerente para o DW com orientao essencialmente
tcnica: os sistemas de apoio deciso so na verdade uma prestao de servios e no um
servio de armazenamento de dados. Por isso, fundamental que o gerente do DW seja uma
pessoa voltada aos interesses dos usurios e principalmente que, saiba dos termos utilizados
diariamente pelos altos gerentes e outros tomadores de decises.
f) Dedicar-se ao tratamento de dados do tipo registros numricos e string: Muitos poderiam
imaginar que as informaes que sero utilizadas em um DW seriam oriundas
especificamente dos registros das bases de dados transacionais, e que estas informaes
seriam apenas nmeros ou palavras. Porm a incluso de textos, imagens, sons e vdeos
podem ser bastante teis no momento da anlise de determinadas situaes da empresa e do
negcio.
10
Referncias
CAMPOS, Maria Luiza; ROCHA, Arnaldo V. Filho. Data Warehouse.
http://tartaruga.nce.ufrj.br/dataware/tutorial/home.html. Acesso em: 18 maio de 2005.
Disponvel
em:
CAZELLA, Slvio Csar. Slides de aula sobre sistema de apoio deciso. Disponvel em:
http://www.inf.unisinos.br/~cazella/dss/sad_aula_11.pdf. Acesso em: 18 maio de 2005. ________________.
Slides
de
aula
sobre
sistema
de
apoio
deciso.
Disponvel
em:http://www.inf.unisinos.br/~cazella/dss/sad_aula_12.pdf. Acesso em: 18 maio de 2005.
DATAWAREHOUSE. Disponvel em: www.datawarehouse.inf.br. Acesso em : 18 maio 2005.
DATA WAREHOUSE. Disponvel em: www.datawarehouse.com. Acesso em: 18 de maio de 2005.
ELMASRI, Ramez.; NAVATHE, Sham.. Fundamentals of database systems. 2nd ed. - Redwood City Calif. :
Benjamin/Cummings, c1994
FLORES, Christian Feltrin. Projeto e Desenvolvimento de Datawarehouse Hospitalar. Disponvel em:
http://www.hcaa.com.br/antiga/dw/index.htm. Acesso em: 18 de maio de 2005.
INMON, W.H. Information System Arquiteture: Development in 90s. Nova York: John Wiley & Sons Inc.,
1993. Partes do livro disponvel em: www.billinmon.com.
____________. Building the Data Warehouse. Nova York: John Wiley & Sons Inc., 1996. Partes do livro
disponvel em: http://www.billinmon.com/.
11
Administrao de Tecnologia de
12