Vous êtes sur la page 1sur 71

UNIVERSIDADE CRUZEIRO DO SUL

BACHARELADO EM CINCIA DA COMPUTAO

RAFAEL MACEDO MARQUES

APLICAO DE UM SISTEMA BUSINESS INTELLIGENCE


OPEN SOURCE EM UM ESTUDO DE CASO PARA
PEQUENAS E MDIAS EMPRESAS

So Paulo
2015

UNIVERSIDADE CRUZEIRO DO SUL


BACHARELADO EM CINCIA DA COMPUTAO
RAFAEL MACEDO MARQUES

APLICAO DE UM SISTEMA BUSINESS INTELLIGENCE


OPEN SOURCE EM UM ESTUDO DE CASO PARA
PEQUENAS E MDIAS EMPRESAS

Trabalho apresentado disciplina de


Trabalho

de

Graduao

Interdisciplinar II, requisito parcial


para

obteno

Bacharel

em

Computao,
Professor
Bezerra.

So Paulo
2015

sob

Luis

do

grau

de

Cincias

da

orientao

do

Naito

Mendes

Folha de Aprovao

Rafael Macedo Marques 120259-6

Aplicao de um sistema business intelligence open source em um estudo de caso


para pequenas e mdias empresas.
Trabalho apresentado disciplina de
Trabalho

de

Graduao

Interdisciplinar II, requisito parcial


para

obteno

Bacharel
Computao,

em
sob

do

grau

de

Cincia

da

orientao

do

Professor Ms. Luis Naito Mendes


Bezerra.

Aprovado em:
Banca examinadora
Prof..:____________________________________________________________
Instituio:___________________________ Assinatura:______________________

Prof..:____________________________________________________________
Instituio:___________________________ Assinatura:______________________
Prof..:____________________________________________________________
Instituio:___________________________ Assinatura:______________________

Dedico este trabalho primeiramente


a Deus por ter me proporcionado
este momento e aos meus familiares
pela pacincia que tiveram durante o
nosso

isolamento

para

nos

entregarmos a este trabalho, aos


meus

professores

aos

meus

amigos que tanto me apoiaram e


incentivarem
projeto.

prosseguir

neste

Resumo

Com o crescimento da competitividade no mercado, uma empresa precisa se


superar para enfrentar a concorrncia. Para auxiliar nessa competitividade, ter em
mos informaes precisas e estratgicas pode representar uma maneira de se
destacar. O Business Intelligence facilita o entendimento das necessidades do
negcio, atravs da automatizao dos processos de tomada de deciso, gerando
relatrios gerenciais com informaes importantes que podem trazer grandes
benefcios a estratgia da organizao.
O objetivo deste trabalho aplicar o conceito do Business Intelligence utilizando
ferramentas Open Source para uma empresa mdia, para apoiar na tomada de
deciso a equipe de vendas, gerando relatrios gerenciais sobre vendas. Para tanto,
foi desenvolvido um Data Warehouse, criado atravs da ferramenta Pentaho
juntamente sendo alimentado pelo Sistema Gerenciador de Banco de Dados
PostegreSQL.
O desenvolvimento deste ambiente poder trazer para a empresa uma nova viso
sobre suas vendas, melhor definio de estratgia a partir dos Dashboards
gerenciais e melhoria na viso da equipe de vendas.
Palavras-Chave: Open Source, Business Intelligence, Data Warehouse, Pentaho,
Tomada de Deciso, Competividade e Estratgia de negcio.

Abstract

As competitiveness increases within the market, a company needs overcome itself in


order to face competition. To help this competition, having accurate and strategic
information can represent a way to stand out. Business Intelligence favors the
understanding of the business needs through automation of decision-making
processes, generating reports with essential information, which can bring many
benefits to the organization strategy.
The objective of this study is to apply the Business Intelligence concept using Open
Source tools in a medium business company, in order to help the sales staff in the
decision-making process by creating management reports. Therefore, a Data
Warehouse was developed through the Pentaho tool, being fed by the PostegreSQL
Database Management System.
This IT environment developing process can bring to any business company a new
sight about sales and a better strategy definition from the management Dashboards.

Keywords: Decision-Making Process, Competitiveness, Open Source, Business


Intelligence, Data Warehouse, Pentaho.

No que diz respeito ao empenho, ao compromisso, ao


esforo, dedicao, no existe meio termo.
Ou voc faz uma coisa bem-feita ou no faz....
Ayrton Senna
(1960-1994)

LISTA DE FIGURAS

Figura 1 Dados e informao................................................................................16


Figura 2 Sistemas da Informao nas empresas................................................20
Figura 3 Pirmide de Sistemas da Informao...................................................21
Figura 4 Tipos de Sistemas e suas gerncias.....................................................22
Figura 5 Criao de tabelas ..................................................................................32
Figura 6 - Estrutura Business Inteligence..............................................................33
Figura 7 - Solues mais utilizadas em BI..............................................................35
Figura 8 - Arquitetura de um sistema de BI............................................................37
Figura 9 - Schema Star..............................................................................................38
Figura 10 - Schema Snowflake.................................................................................39
Figura 11 - Cubo BI....................................................................................................43
Figura 12 - Interao entre o banco de dados, database e tablespace...............46
Figura 13 - Arquitetura Pentaho...............................................................................51
Figura 14 - Dashboard Pentaho...............................................................................55
Figura 15 Diagrama de Classe do Sistema..........................................................57
Figura 16 Diagrama de banco de dados empresa X.........................................59
Figura 17 PUC (Ferramenta de controle de usurio e conexo do Pentaho). .59
Figura 18 Arquitetura do estudo de caso............................................................60
Figura 19 Spoon (Criando Carga para dimenso)..............................................60
Figura 20 Spoon (Transformao)........................................................................61
Figura 21 Tabelas dimenso e fato criadas no PostgreSQL..............................61
Figura 22 PostgreSQL............................................................................................62
Figura 23 Schema Workbench (Criando cubo)...................................................63
Figura 24 Pentaho User Controller (PUC)............................................................63
Figura 25 Criando Grficos...................................................................................64
Figura 26 Criando Dashboards.............................................................................65

LISTA DE QUADROS

QUADRO 1 - Funcionrios nas indstrias..............................................................18


QUADRO 2 - Funcionrios no comrcio e servios..............................................18
QUADRO 3 - Receita anual.......................................................................................18

LISTA DE SIGLAS
BI

Business Intelligence

BPM Business Process Management


DDL Data Definition Language
DM

Data Mart

DML Data Manipulation Language


DOLAP

Desktop Online Analytical Processing

DW

Data Warehouse

ETL

Extract Transform Load

HOLAP

Hybrid Online Analytical Processing

JDK Java Development Kit


LDAP Lightweight Directory Access Protocol
MER Modelo Entidade Relacionamento
MOLAP

Multidimensional On Line Analytical Processing

OLAP Online Analytical Processing


OLTP Online Transaction Processing
PAC Pentaho Administration Console
PDI

Pentaho Data Integration

PUC Pentaho User Console


ROLAP

Relational On Line Analytical Processing

SAD Sistema de Apoio Deciso


SAE Sistema Administrativo Empresarial
SGBD
SIG

Sistema de Gerenciamento de Banco de Dados


Sistema Integrado de Gesto

SIGE Sistemas Integrados de Gesto Empresarial


SPT

Sistemas de Processamento de Transaes

SQL Structured Query Language


STC Sistemas de Trabalhadores do Conhecimento
TCL

Transaction Control Language

TI

Tecnologia da Informao

SUMRIO
1 INTRODUO.........................................................................................................13
1.1 CONTEXTUALIZAO DO TEMA...........................................................................13
1.2 JUSTIFICATIVA............................................................................................................13
1.3 OBJETIVOS DA PESQUISA.........................................................................................15
1.4 METODOLOGIA...........................................................................................................15
2 FUNDAMENTAO TERICA...............................................................................16
2.1 INFORMAO..............................................................................................................16
2.1.1 DADOS E INFORMAO....................................................................................16
2.1.2 A ERA DA INFORMAO....................................................................................17
2.1.3 INFORMAO NAS PEQUENAS, MDIAS E GRANDES EMPRESAS.........18
2.1.4 TIPOS DE SISTEMAS DA INFORMAO.........................................................19
2.2 SOFTWARE E SOFTWARE LIVRE (OPEN SOURCE)..................................................23
2.2.1 A importncia dos softwares Open Source no mundo moderno..............................24
2.2.2 Softwares Open Source no Brasil.............................................................................25
2.2.3 Vantagens e desvantagens dos softwares Open Source............................................26
2.2.4 Softwares Open Source x Softwares free x Softwares privados...............................26
2.3 BANCO DE DADOS.....................................................................................................27
2.3.1 BANCO DE DADOS RELACIONAL....................................................................27
2.3.2 BANCO DE DADOS ORIENTADO A OBJETOS.................................................27
2.3.3 PostgreSQL..............................................................................................................28
2.3.4 MYSQL.....................................................................................................................28
2.3.5 Firebird....................................................................................................................29
2.3.6 MONGODB..............................................................................................................29
2.3.7 MARIADB................................................................................................................30
2.3.8 LINGUAGEM SQL.................................................................................................30
2.3.9 INSTRUES DML, DDL e TCL...........................................................................31
2.3.10 CHAVE PRIMRIA, CHAVE ESTRANGEIRA E CRIAO DE TABELA.....31
2.4 BUSINESS INTELLIGENCE..........................................................................................32
2.4.1 O CONCEITO DO BUSINESS INTELLIGENCE...................................................32
2.4.2 BUSINESS INTELIGENCE NO BRASIL...............................................................33
2.4.3 VANTAGENS E DESVANTAGENS......................................................................35

2.5 ARQUITETURA DO BUSINESS INTELLIGENCE......................................................35


2.5.1 Modelagem Multidimensional.................................................................................37
2.5.2 Data Warehouse (DW).............................................................................................38
2.5.3 Data Marts...............................................................................................................39
2.5.4 Metadados................................................................................................................39
2.5.5 ETL...........................................................................................................................40
2.5.6 Cubos de dados........................................................................................................41
2.5.7 OLAP........................................................................................................................42
2.5.7.1 Arquiteturas OLAP................................................................................................42
2.5.7.2 Elementos OLAP...................................................................................................43
2.5.8 Dashboards..............................................................................................................43
2.5.9 Data Mining.............................................................................................................43
2.5.10 Importao e Exportao de dados........................................................................44
2.5.11 OLTP......................................................................................................................45
2.5.12 Relatrios...............................................................................................................45
3.1 SUITES BUSINESS INTELLIGENCE OPEN SOURCE................................................46
3.1.1 Jaspersoft.................................................................................................................46
3.1.2 Openi........................................................................................................................47
3.1.4 Vanilla......................................................................................................................48
3.1.5 SpagoBI....................................................................................................................48
3.1.6 Pentaho....................................................................................................................48
3.1.6.1 Pentaho Data Integration.....................................................................................51
3.1.6.2 Pentaho Reporting................................................................................................51
3.1.6.3 Pentaho Dashboards.............................................................................................52
3.1.6.4 Pentaho Analysis Services....................................................................................53
3.1.6.5 Pentaho Data Mining............................................................................................53
3.1.6.6 Suporte ao Pentaho...............................................................................................53
4 ESTUDO DE CASO.................................................................................................55
4.1.Cenrio Atual..............................................................................................................55
4.2 Soluo........................................................................................................................56
5 CONCLUSO..........................................................................................................64
REFERNCIAS BIBLIOGRFICAS...........................................................................65

13

1 INTRODUO

1.1 CONTEXTUALIZAO DO TEMA


Atualmente, a tecnologia da informao utilizada em todo tipo segmento
empresarial, h quem fale que no h como uma empresa sobreviver no mercado
sem uso da tecnologia, seja para suporte aos seus sistemas internos, seja na
entrega de valor como servio ou em seus procedimentos automatizados.
Mesmo sendo uma era onde empreendedorismo e tecnologia caminham
juntas, h muito ainda para ser explorado por parte das empresas, onde no
momento pequenas e mdias organizaes veem somente custo ao invs de
oportunidades de negcio atravs do uso da tecnologia, e assim continuam
utilizando sistemas ultrapassados e processos manuais.
A implementao do conceito Business Intelligence faz parte dessas
tecnologias que muitas vezes tem alto custo, porm trazem grandes benefcios as
organizaes, auxiliando na tomada de deciso e disponibilizando dados
consistentes para criao ou reformulao da estratgia de negcio, porm h
solues sem custo algum, solues chamadas Open Source com ambientes
completos e disponveis para qualquer negcio.
Atravs deste trabalho possvel entender a realidade de como est sendo
dirigido o negcio, e entender como pequenas e mdias empresas podem tirar
proveito do conceito de Business Intelligence (BI) sem custos, podendo assim
confrontar informaes de vendas, para auxiliar na tomada de deciso, seja para
aumentar a venda de determinado produto, seja para atrair novos clientes, abrir
novas filiais e at mesmo maximizar os lucros.

1.2 JUSTIFICATIVA

Esta pesquisa aborda uma das novas tecnologias de nossos tempos, mesmo
sendo uma tecnologia que teve seu conceito criado na dcada de 80, apenas nos
ltimos anos ganhou fora no mercado.

14

Os investimentos das empresas de Tecnologia da informao (TI) no Brasil


devem totalizar US$ 96,4 bilhes em 2016. Os investimentos com software
totalizaro US$ 4,3 bilhes, registrando um crescimento de 5,4%. Os servios de TI
devero consumir cerca de US$ 19 bilhes em 2016, o que representar um
aumento de 6,4% em relao a este ano de 2015; e os servios de comunicao
devem totalizar US$ 56 bilhes de investimentos em 2016, 0,5% menos em relao
a 2015, segundo dados do Gartner publicados no site ComputerWorld por DREHER,
Felipe em 2015.
O grande volume de informaes e a alta competividade entre as empresas
nos trouxe a necessidade de interpretar os dados de forma mais completa,
interligando diversas bases de dados com tecnologias e ambientes distintos, para
obtermos um melhor suporte nas tomadas de decises gerencias e estratgicas,
garantindo assim o crescimento organizacional e maximizao dos lucros.
De acordo com pesquisa levantada pela ABES (Associao Brasileira das
Empresas de Software), a indstria brasileira de TI est em 7 lugar na classificao
mundial, somando um investimento de US$ 60 bilhes, com crescimento de 6,7%
em 2014. Na Amrica Latina, o Brasil o pas que mais investimentos realiza no
setor de TI, representando 46% desse mercado. Business Intelligence (BI) e
Analytics tem previso de atingirem US$ 788 milhes at o final do ms de
dezembro e assim mostrando a importncia do conceito do BI abordado nesse
trabalho.
A relevncia deste assunto encontra-se na mudana das estratgias das
empresas alinhado ao negcio e a tecnologia da informao, trazendo impactos
positivos e transformando o investimento em TI em um diferencial competitivo.
Espera-se que a oportunidade de pesquisar e aplicar este conceito traga as
empresas uma nova viso para seu negcio.
A justificativa para elaborao desta pesquisa e aplicao do conceito em
estudo de caso o fato de ser um tema atual e extremamente relevante a rea de
TI, que ir contribuir para o desenvolvimento das habilidades profissionais tanto do
pesquisador quanto dos leitores e sendo possvel ser reaproveitada por empresas
interessadas.

15

1.3 OBJETIVOS DA PESQUISA

Tem por objetivo o presente trabalho estudar e aplicar o conceito de Business


Intelligence, demonstrando as vantagens que as pequenas e mdias empresas
podem ter com o auxlio do BI utilizando ferramentas Open Source na construo de
um ambiente operacional para a rea de vendas de uma empresa X.
Atravs deste trabalho possvel entender a realidade de como est sendo
dirigido o negcio, e iremos mostrar como pequenas e mdias empresas podem tirar
proveito do conceito de BI, sem custos, podendo assim confrontar informaes de
vendas, caractersticas dos compradores para auxiliar na tomada de deciso, seja
para aumentar a venda de determinado produto, seja para atrair novos clientes, abrir
novas filiais em e at mesmo maximizar os lucros.

1.4 METODOLOGIA

Neste trabalho ser estudado o conceito de Business Intelligence e aplicado


na construo de um ambiente utilizando Data Warehouse e a ferramenta Pentaho
open source para transformao dos dados, criao dos relatrios gerencias e
dashboards baseado em um estudo de caso envolvendo uma empresa real, para
assim auxiliar na tomada de deciso da rea de vendas, podendo futuramente
auxiliar outras reas.

16

2 FUNDAMENTAO TERICA

Neste capitulo sero apresentados os significados de informao, dados,


conhecimento, sobre o papel da informao no mundo corporativo no Brasil,
mostrando suas definies, e suas contribuies.
2.1 INFORMAO
2.1.1 DADOS E INFORMAO

LAUDON (2014) afirma que a informao so dados que foram modelados


em um formato em que h significado e ter utilidade para algo.
Dados so informaes no tratadas que representam acontecimentos que
ocorrem nas organizaes antes de serem modeladas e passarem a serem
informaes teis. Informao so os dados tratados dessa forma j possuem
utilidade para tomada de deciso, conhecimento a informao tratada a partir da
j possvel aplicar a informao em um sistema da informao, conforme Figura 1 Dados e informao.

Figura 1 Dados e informao


Fonte: Laudon (2014)

17

2.1.2 A ERA DA INFORMAO

No decorrer das ltimas dcadas, tivemos grandes avanos tecnolgicos e


simultaneamente tivemos um aumento gigantesco de informaes. Vivemos numa
era de grandes volumes de informaes, alguns autores chamam isso de "exploso
de informaes". A cada instante um novo dado passa por nossos olhos, nas redes
sociais (jornais utilizam para publicar pequenas notcias e atualizaes sobre o dia),
nas aplicaes para celulares somos notificados sobre o trnsito em nossas cidades,
podemos saber a previso do tempo, recebemos sugestes para conhecer lugares
de acordo com nossos gostos e locais que frequentamos ou pesquisamos.
As quantidades de informaes no so s maiores em nossa poca, mas
tambm so compartilhadas, fazendo com que aplicaes com arquiteturas
diferentes se comuniquem, gerando novos dados.
Conforme Mrcio Silva, pesquisador do laboratrio de Arquitetura e Redes do
Departamento de Cincia da Computao - Poli-USP, publicado pela revista Veja
(2013), todo dia so produzidos 2,5 exabytes de informao no planeta.
Neste contexto, a informao se tornou um diferencial competitivo e com isso
as empresas podem fazer projees de gastos, obter dados baseados no lucro
obtido para serem utilizados em campanhas de marketing, gerar melhoria na
prestao de servios, cortar gastos e se planejar at para futuros investimentos a
partir de informaes sobre o pblico que ir usufruir dos produtos e servios.

18

2.1.3 INFORMAO NAS PEQUENAS, MDIAS E GRANDES EMPRESAS

De acordo com a SEBRAE (Servio Brasileiro de Apoio s Micro e Pequenas


Empresas) (2015), as classificaes do porte das empresas variam de acordo com o
setor de atuao no mercado, conforme pode ser observado no quadro 1 Funcionrios nas indstrias mostrado o nmero por tamanho na rea industrial.

Quadro 1 Funcionrios nas indstrias


INDSTRIA
Microempresa at
19 empregados
Pequena Empresa
20 a 99 empregados
Mdia Empresa
100 a 499 empregados
Grande Empresa
500 ou mais empregados

Fonte: SEBRAE (2015)

No quadro 2 Funcionrios no comrcio e servios vemos as empresas nas reas de


comrcio e servios e o nmero de funcionrios por seguimento.

Quadro 2 Funcionrios no comrcio e servios


COMRCIO E SERVIOS
Microempresa at
9 empregados
Pequena Empresa
10 a 49 empregados
Mdia Empresa
Grande Empresa

50 a 99 empregados
mais de 100 empregados

Fonte: SEBRAE (2015)

19

A diferena entre os tipos de empresas fica ainda mais evidente por conta do
seu

faturamento

anual

de

acordo

com

BNDES

(Banco

Nacional

de

Desenvolvimento). Conforme pode ser observado no Quadro 3.


Quadro 3 Receita anual
Classificao
Microempresa
Pequena empresa
Mdia empresa
Mdia-grande empresa
Grande empresa

Receita operacional bruta anual


Menor ou igual a R$ 2,4 milhes
Maior que R$ 2,4 milhes e menor ou igual a R$ 16 milhes
Maior que R$ 16 milhes e menor ou igual a R$ 90 milhes
Maior que R$ 90 milhes e menor ou igual a R$ 300 milhes
Maior que R$ 300 milhes

Fonte: Banco Nacional de Desenvolvimento Econmico e Social (2014)

No mundo atual, a tecnologia da informao um grande diferencial


competitivo, no milnio da informao, pequenas empresas tentam adequar suas
regras de negcio com seu portflio de servios e buscar a evoluo organizacional.
Empresas mdias tentam se estabelecer no mercado buscado novos clientes e
melhorando a qualidade dos servios j prestados com apoio da tecnologia, as
grandes empresas buscam maximizar os lucros com qualidade e excelncia no
produto final.

2.1.4 TIPOS DE SISTEMAS DA INFORMAO

Os sistemas de informao - (SI) so capazes de otimizar os processos


organizacionais, favorecendo principalmente a tomada de deciso. Na perspectiva
dos funcionrios, os sistemas contribuem com a melhoria do processo de
atendimento, facilitando as aes, deixando as atividades mais transparentes e
geis. Por sua vez, na perspectiva do cliente, o atendimento realizado de modo
mais satisfatrio, j que h a reduo do tempo de resposta e em muitos casos h
ainda a mudana dos preos estabelecidos pela organizao e de outros fatores
considerados diferenciais no relacionamento com a empresa.

20

Assim, cada organizao apresenta suas necessidades e especificidades,


sendo isto fatores primordiais para a escolha da tecnologia a ser utilizada. Entendese, portanto que quanto mais operaes dirias e estratgias corporativas as
empresas praticarem, maior ser o suporte estratgico da TI no alcance dos
objetivos organizacionais. Conforme Obrien (2004) um sistema de informao
formado por um conjunto de pessoas, hardware, software, redes de comunicaes e
recursos de dados, cuja finalidade transformar, coletar e disseminar informaes
em uma empresa. Para uma melhor comunicao nas empresas as pessoas esto
recorrendo aos sistemas de informao, a figura 2 - Sistemas da Informao mostra
que Pessoas, Tecnologia e Organizaes englobam o Sistema da informao.

Figura 2 Sistemas da Informao nas empresas


Fonte: Laudon (2014)

Robredo (2003) afirma que o sistema de informao um sistema humano


que utiliza dos recursos computacionais para automatizar elementos, considerada
uma entidade complexa, organizada, que armazena, processa, capta, usa, fornece e
distribui informao, criada com o intuito de obter alguma vantagem ou benefcio.
Stair e Reynolds (2002) afirmam que um sistema de informao constitui um tipo
especial de sistema que pode ser definido de diferentes maneiras. Conforme
mencionado anteriormente, um SI um conjunto de elementos ou componentes
inter-relacionados que coletam (entrada), manipulam (processamento) e disseminam
(sada) os dados e a informao e fornecem um mecanismo de feedback para
atender a um objetivo.
Compreende-se ento que ao integrar todos os elementos de evoluo com
os diversos conhecimentos e estruturas focadas na prtica de TI, os processos
organizacionais se tornam primordiais para a empresa, principalmente quando

21

direcionada para a obteno de valor agregado ao cliente. Enfatiza-se que a


modelagem de processos se encontra em um alto nvel de importncia no ambiente
organizacional.
No entanto, cabe ressaltar que para otimizar os processos de deciso da
empresa atravs da utilizao de sistemas de informao, dever manter seus
objetivos organizacionais compatveis com suas metas, no priorizando apenas o
aumento da lucratividade, mas o alcance da rentabilidade organizacional como um
todo. Neste contexto, o nvel de integrao dos sistemas depender da quantidade
de aplicaes que a empresa deseja efetivar, havendo a busca por repositrios de
informaes cuja finalidade contribuir com a integrao dos processos
organizacionais. A integrao dos sistemas de informao contribui com a adoo de
uma poltica organizacional, onde as empresas estaro preparadas para atender s
frequentes exigncias do mercado de seu ambiente interno (REZENDE; ABREU,
2011).
Conforme figura 3 - Pirmide de Sistemas da Informao descrito os
principais tipos sistemas da informao e seus respectivos grupos atendidos e reas
funcionais.

Figura 3 Pirmide de Sistemas da Informao


Fonte: Laudon (2014)

22

Os Sistemas de apoio ao executivo (SAE) possuem dados agregados, vindo


de fora quando de aplicaes internas sendo processados atravs de grficos,
simulaes, interatividade gerando projees e consultas aos gerentes seniores.
Sistemas de apoio deciso (SAD) possuem baixo volume de dados
otimizados para anlise sendo processados atravs da interatividade, simulaes
gerando relatrios especiais, informaes para tomada de deciso, consultas
destinadas os gerentes e diretores (topo da pirmide).
Sistemas de informao gerenciais (SIG) so sistemas que possuem
gerenciamento das transaes, alto volume de dados, verses simplificadas sendo
processadas atravs de modelos simples e anlise de baixo nvel e geram relatrios
administrativos aos gerentes mdios.
Sistemas de trabalhadores do conhecimento (STC) so sistemas que
possuem especificaes de projeto e base de conhecimentos so processados
atravs de modelagem, simulaes gerando modelos e grficos aos analistas que
possuem uma maior especializao e no mnimo superior completo.
Sistemas de automao de escritrio so sistemas que possuem documentos
e cronogramas so processados atravs de gerenciamento de documentos,
programao e comunicao para os funcionrios operacionais e tambm de
escritrio (atividades rotineiras).
Sistemas de processamento de transaes (SPT) possuem transaes,
eventos e so processadas atravs de classificao, listagem, juno, atualizao
gerando relatrios detalhados, listas e resumos aos supervisores.
Em resumo todos os nveis da pirmide reportam ao ltimo nvel, o
estratgico, que atende aos grupos de gestores seniores e presidentes, cada nvel
atende o nvel acima, e em conjunto fazem parte do gerenciamento dos sistemas da
informao.
Na Figura 4 Tipos de Sistemas e suas gerncias, possvel visualizar mais
detalhadamente todos os grupos e reas que fazem parte e tem apoio dos
respectivos sistemas.

23

Figura 4 Tipos de Sistemas e suas gerncias


Fonte: Laudon (2011)

Neste trabalho estaremos utilizando o Sistema de informao Gerencial (SIG),


no caso o Business Intelligence e o banco de dados PostgreSQL.

2.2 SOFTWARE E SOFTWARE LIVRE (OPEN SOURCE)


Para SOMMERVILLE (2011), software so sistemas computacionais abstratos
e intangveis que permitem realizar atividades especificas em um computador, o
mundo moderno no poderia existir sem o software, pois muitos e diversificados
servios so controlados, e suportados atravs desses sistemas computacionais
abstratos.
Conforme afirma PRESSMAN (2011), o principal elemento para o bom
funcionamento dos sistemas operacionais, pois esses sistemas e permitem que o
mesmo trabalhe de maneira controlada otimizando as operaes. O autor afirma que
em muitos negcios os softwares computacionais so os verdadeiros diferenciais
das empresas em relao a seus concorrentes. Diante disso, apresenta suas
principais caractersticas:
- o software criado e desenvolvido a partir de uma anlise baseada na
engenharia de software, e no de acordo com as manufaturas tradicionais;

24

- o software no possui prazo de validade como a maioria das mercadorias


manufaturadas. O que ocorre que o mesmo pode se tornar obsoleto, visto que a
empresa necessitar de um software mais atualizado de acordo com suas
necessidades;
- os softwares so desenvolvidos sob medida, para atender especificidades e
caractersticas dos sistemas operacionais e dos clientes.
Para Maziero (2008) o sistema operacional uma estrutura muito complexa
que agrupa aspectos como drivers, gerncia de memria, programas utilitrios e a
interface grfica como um tudo.
O modelo do software como servio (SaaS) refere-se aos softwares com
objetivos especficos oferecidos aos usurios atravs da Internet. O usurio no
consegue administrar ou controlar a infraestrutura subjacente como servidores,
servios

operacionais,

armazenamento

at

mesmo

configuraes,

responsabilidade por essa parte do fornecedor, o usurio acessa a aplicao via


internet pagando por um valor especfico. (VELTE; VEITE; ELSENPETER, 2009).
Os softwares de investigao so aqueles que conseguem localizar diversas
informaes sobre diferentes e diversos assuntos como as enciclopdias. Os
softwares tutoriais so vastamente utilizados para informar ou ensinar contedos
educativos ou em treinamentos, cujos conceitos so restringidos pela prpria equipe
que o desenvolveu. Nesta mesma linha de raciocnio, os softwares de exercitao
buscam garantir maior interatividade com o usurio, oferecendo respostas prontas
mediante questes j pr-estabelecidas. (PRESSMAN, 2011).
No prximo ttulo explicado um tipo de software que tido como a revoluo
dos softwares, por ter seu cdigo aberto, causando debates nos dias atuais.
2.2.1 A importncia dos softwares Open Source no mundo moderno

Os softwares livres esto sendo utilizados devido a sua liberdade de uso


educacional e de adaptao, fomentando sua adoo em vrios campos,
empresarial e educativa. De acordo com Prates et al (2011) a definio de software
livre programa que pode ter seu cdigo fonte alterado por qualquer usurio e no
exige licena para distribuio. primeira vista, os softwares livres seriam uma
soluo para as necessidades de usurios de softwares proprietrios, j que esses

25

so pagos, normalmente muito caros e de cdigo fechado. Entretanto, softwares


livres costumam ter algumas instalaes complicadas e estabilidade ruim, o que
limita muito sua utilizao. Isso representa um problema aos usurios que desejam
substituir os softwares privados por essas alternativas mais baratas.
Um software considerado livre quando atende a quatro principais requisitos:
pode ser copiado, usado, modificado e redistribudo no mercado conforme as
necessidades e desejos de cada usurio.
2.2.2 Softwares Open Source no Brasil

No Brasil passou a ser difundido especialmente na dcada de 80,


apresentando novas solues em contraposio aos softwares pagos que eram
muito caros e muitas vezes inacessveis para os usurios.
Conforme relatam Prates et al (2011) sua utilizao ainda muito restrita no
Brasil e no mundo, seja porque os usurios apresentam resistncia sua utilizao
ou porque algumas caractersticas desses softwares geram baixa popularidade. Os
autores enfatizam ainda que a pirataria um desafio para seu crescimento, j que
muitas aes ilcitas so observadas na disseminao de licenas para o acesso
aos softwares pagos.
O Governo o principal utilizador do mercado de software open source no
Brasil. Conforme pesquisa da ABES, apontam que os software e servios open
source responderam por US$1,192 milho, ou 4,6% do total produzido na rea de
software no pas em 2013 - U$ 25.948 milhes.
A pesquisa mostra que servios a principal base do software livre no Brasil,
sendo US$ 961 milhes da receita apurada em 2013. O software ficou com US$ 231
milhes. O governo tem grande participao de mercado de 68%, com um volume
de US$ 811,9 milhes, porm os aplicativos so o maior segmento do open source
com 40,8% de participao ou US$ 486,5 milhes. Os sistemas operacionais
surgem com 38,6%, ou US$ 460,2 milhes. As ferramentas de desenvolvimento e os
bancos de dados atingem, respectivamente, com 8,3% e 3,5%, ou US$ 98,9 milhes
ou US$ 42,9 milhes. (ABES, 2014).

26

2.2.3 Vantagens e desvantagens dos softwares Open Source

Uma das vantagens da utilizao de softwares livres a gratuidade mediante


os preos elevados praticados pela indstria de softwares pagos. Alm disso, a
identificao do melhor software para determinada necessidade deve considerar as
propriedades do programa e seu custo. Assim, basta o software livre possuir alguma
propriedade que seu competidor pago no tenha para que seu uso seja
recomendado, independentemente do preo (PRATES, 2011).
Os autores afirmam ainda que a comunidade em geral pode se beneficiar,
pois estes softwares normalmente so distribudos de modo que seus usurios
podem melhora-los e aperfeioa-los e compartilhar novamente na rede. Cabe
ressaltar tambm que isto implica no aumento da qualidade nas operaes, pois
este tipo de software depende deste requisito para sua sobrevivncia, j que no
existe o investimento em marketing.
Com relao s desvantagens, Prates et al (2011) relatam que h problemas
de desenvolvimento e de uso. Quanto ao desenvolvimento, h a carncia de
empresas desenvolvedoras que os patrocinem, sendo que este processo muitas
vezes feito por pessoas com especializao questionvel. Quanto s desvantagens
de uso, cita-se a falta de um ambiente integrado e com interfaces pouco amigveis.
2.2.4 Softwares Open Source x Softwares free x Softwares privados
Softwares

Open

Source

possuem

cdigo

aberto

so

totalmente

personalizveis tanto na parte da programao quanto da interface grfica, seu


suporte atravs de fruns, no h nenhum responsvel pelo programa, j o
software free no personalizvel no h nenhum gasto com licena, porm sempre
existe a verso para dos programas free, com suporte e um responsvel pelo
produto, o software privado totalmente pago, possui uma empresa responsvel,
possui gastos com licenas obrigatrias e o suporte adquirido a partir das licenas.

27

2.3 BANCO DE DADOS


No prximo item tratado os tipos de bancos de dados e suas principais
caractersticas.
2.3.1 BANCO DE DADOS RELACIONAL

De acordo com (ELMASRI, RAMEZ; NAVATHE, SHAMKANT, 2011), o modelo


relacional representa o banco de dados como uma coleo de relaes de acordo
com valores e atributos implementados em vrios sistemas. O Modelo Entidade
Relacionamento (MER) foi concebido com a inteno de oferecer um mecanismo de
representao dos ambientes reais para um modelo de dados.
Os

relacionamentos

so

representados

por

entidades

dependentes

abrangendo trs abordagens principais dos dados: a estrutura, a integridade e a


manipulao.

2.3.2 BANCO DE DADOS ORIENTADO A OBJETOS

O bando de dados orientado a objetos responsvel por propor abstraes


do mundo real, oferecendo benefcios como a reutilizao do cdigo, bem como dos
requisitos, anlise, projeto e especificao impactando no aumento da produtividade
do sistema, j que melhora a captura de processos, procedimentos e normativas.
(ELMASRI, RAMEZ; NAVATHE, SHAMKANT, 2011).
A orientao a objetos contribui para o gerenciamento dos sistemas,
considerando que so extremamente complexos para que seja possvel a
compreenso dos mesmos de maneira imediata. Permite o isolamento dos
elementos mais importantes. Assim, para alcanar a resoluo de um problema
atravs da orientao a objetos, torna-se preciso identificar primeiramente a classe
do problema, onde somente aps esta fase dever ser analisado quais os ajustes

28

que sero necessrios para manter o bom funcionamento do sistema (ELMASRI,


RAMEZ; NAVATHE, SHAMKANT, 2011).
O prximo item abordar os principais bancos de dados livres.
2.3.3 PostgreSQL

O PostgreSQL um sistema de gerenciamento de banco de dados(SGBDOR)


desenvolvido pelo Departamento de Cincia da Computao da Universidade da
Califrnia, sua estrutura grfica lembra a do SQL Server.
O PostgreSQL descendente do cdigo original de Berkeley, que suporta
grande parte do padro SQL e oferece muitas funcionalidades modernas, como:
comandos

complexos,

chaves

estrangeiras,

gatilhos,

vises,

integridade

transacional, controle de simultaneidade multiverso.


Devido sua licena free, o PostgreSQL pode ser utilizado, modificado e
distribudo por qualquer pessoa para qualquer finalidade, seja particular, comercial
ou acadmica, livre de custos. (GONZAGA, 2007).
2.3.4 MYSQL

O MYSQL um software gratuito e possui um desempenho bom. Para


empresas de pequeno porte facilmente recomendado por no haver custo e
oferecer um sistema com bom potencial de armazenamento de dados, alm de ter
um timo processamento. (REESE, GEORGE, 2003).
O MYSQL focado na agilidade. Assim, se sua aplicao necessita de
retornos rpidos e no envolve operaes complexas, o MySQL a opo mais
adequada, pois otimizado para proporcionar processamento rpido dos dados e
tempo curto de resposta sem exigir muito do hardware.
Dentre suas caractersticas principais esto:
- Alto nvel de portabilidade, responsvel por suportar qualquer plataforma
atual;
- Compatibilidade com inmeros drivers;

29

- timo desempenho e estabilidade;


- Exigncia reduzida quanto a recursos de hardware;
- Facilidade de uso;
- Software gratuito com base na GPL;
- Permite a utilizao de vrios Storage Engines como MyISAM, InnoDB,
Falcon, BDB, Archive, Federated, CSV, Solid, etc.
- Suporta controle transacional;
- Suporta Triggers;
- Suporta Cursors (Non-Scrollable e Non-Updatable);
- Suporta Stored Procedures e Functions;
- Replicao facilmente configurvel;
- Interfaces grficas de fcil utilizao cedidos pela MySQL Inc. (REESE,
GEORGE, 2003).
2.3.5 Firebird

O Firebird descendente do cdigo do Borland InterBase 6.0. Possui o


cdigo aberto, tem 20 anos, com isso sua tecnologia e arquitetura madura e
segura.
Seu instalador pequeno, porm ele um SGBD completo podendo
administrar Gigas de dados, sua aparncia lembra a parte grfica do SQL Server.
(CANTU, 2005).

2.3.6 MONGODB

De acordo com Thesis (2012) o MongoDB um bando de dados de cdigo


aberto NoSQL desenvolvido pela 10gen em C++. Esta base de dados possui uma
segurana de transao menor, porm so mais rpidos e eficientes no acesso aos
dados. O Mongo DB funciona a partir de esquemas dinmicos, onde cada coleo
pode conter diferentes tipos de objetos.

30

2.3.7 MARIADB

Bartholomew (2015) afirma que MariaDB um banco de dados de cdigo


aberto avanado cuja substituio binria compatvel com o MySQL, porm mais
eficiente. Portanto, as semelhanas entre MariaDB e MySQL so inmeras, j que
os desenvolvedores utilizaram o cdigo do

MySQL livremente disponvel

incorporando mudanas para melhorar sua atuao.

2.3.8 LINGUAGEM SQL

O Structured Query Language (SQL) tambm denominado de Linguagem de


Questes Estruturadas uma linguagem de pesquisa utilizada em banco de dados
relacional inspirado em clculos matemticos em tabelas que embora possa parecer
hierrquico, contribui com o desenvolvimento de modernos bancos de dados
orientados a objeto. (PUGA; FRANA; GOYA, 2014).
O SQL possui diferentes variaes e extenses sendo utilizado de acordo
com os objetivos dos fabricantes de sistemas gerenciadores de banco de dados e
com as necessidades das empresas que utilizam os sistemas de busca. As
extenses so desenvolvidas no intuito de proporcionar avanos nas pesquisas e
consequentemente melhorar o desempenho e facilitar a manipulao dos dados
(RAMALHO, 2005).
A linguagem SQL uma linguagem declarativa responsvel pela definio,
questionamento e manipulao de bases de dados, incorporando uma srie de
benefcios adicionais que asseguram o estabelecimento de restries de integridade;
definio de viso sobre os dados; especificao das transaes; permisses de
segurana e acesso; melhoria do acesso; integrao com outras linguagens de
programao (RAMALHO, 2006).
Em relao a sua estrutura, afirma-se que a mesma constituda
basicamente de trs clusulas: a Select que visa operar as projees da lgebra
relacional, listando os requisitos desejados na busca; a From cuja finalidade atuar
na orientao do plano cartesiano da lgebra relacional, listando as relaes que

31

sero avaliadas na pesquisa; e por fim, a clusula Where, que busca selecionar o
predicado relacional que faz parte das relaes que aparecem na clusula From.
(PUGA; FRANA; GOYA, 2014).

2.3.9 INSTRUES DML, DDL e TCL

A instruo Data Manipulation Language ( DML) utilizada no gerenciamento


de dados dentro de objetos do banco de dados, enquanto a Data Definition
Language (DDL) utilizada na definio da estrutura de banco de dados ou
esquema. A instruo Transaction Control Language (TCL) atua no controle de
transaes, gerenciando as mudanas realizadas pela instruo DML, com isso, h
o agrupamento das declaraes em transaes lgicas.

2.3.10 CHAVE PRIMRIA, CHAVE ESTRANGEIRA E CRIAO DE TABELA

Cada tabela constituda apenas por uma chave primria, com no mximo
16 colunas com comprimento de chave total de 900 bytes. Dessa forma, todas as
colunas apresentadas so definidas como NOT NULL caso a nulidade no for
especificada. Quanto estabelecida como tipo CLR, ocorre a implementao de
acordo com a ordenao binria (MICROSOFT, 2015).
Por sua vez, a chave estrangeira uma ou combinaes de colunas cujos
objetivos so estabelecer e definir um link entre as informaes de duas tabelas,
sendo possvel exercer o controle dos dados que sero armazenados nesta tabela.
Com isso, criado um link entre duas tabelas que possuem o valor de chave
primria, formando uma chave estrangeira na segunda tabela (MICROSOFT, 2015).
A linguagem SQL praticada a partir da criao de uma tabela,
representada por uma nova relao constituda por nome, atributos, domnio,
restries e valores por falhas, alm das restries de integridade da chave e
referencial, conforme demonstrado a seguir:

32

Figura 5 Criao de tabelas


Fonte: Rocha (2004)

Estas tabelas possuem a finalidade de armazenar os dados. H a


possibilidade de juntar duas ou mais tabelas, dando origem a uma relao entre as
colunas das tabelas utilizadas.

2.4 BUSINESS INTELLIGENCE


2.4.1 O CONCEITO DO BUSINESS INTELLIGENCE

Segundo Ong, Siew e Wong (2011) o conceito Business Intelligence (BI)


envolve a captura, a anlise, a compreenso e a transformao de dados brutos,
so considerados um dos ativos mais valiosos de uma organizao a fim de
melhorar os negcios, obtendo o desempenho desejado. um processo associada
coleta de dados, armazenamento de dados, e gesto do conhecimento que busca
utilizar ferramentas analticas para fornecer aos gestores, informaes sobre a
concorrncia, que muitas vezes atuam como diferenciadores no atual ambiente
competitivo de negcios.
Na figura 6, apresentada a arquitetura de funcionamento do Business
Intelligence, so 4 passos: ETL, Transformao, Extrao para o DW, Relatrios.

33

Figura 6 Estrutura Business Inteligence


Disponvel em: http://www.openconsulting.com.br/pentaho/.
(Acesso em Out.2015)

De acordo com (INMON, 1997), o BI tm como principais funes e


responsabilidades a coleta de conjunto de dados atravs de um sistema S.I.G.E.
(Sistemas Integrados de Gesto Empresarial) para transform-los em uma ou mais
informaes

consolidadas

tambm

apontar

possveis

mudanas

de

comportamento scio-econmico da empresa ou de seus clientes.


Para se ter sucesso na adoo do BI, preciso seguir um bom projeto
arquitetnico em seu processo de implementao, de modo a determinar o sucesso
em seu investimento. Esta arquitetura constituda por diferentes componentes,
dentre eles, dados, pessoas, processos, tecnologia e processos de gesto que
quando bem integrados propiciam o bom funcionamento do sistema (ONG; SIEW;
WONG, 2011).

2.4.2 BUSINESS INTELIGENCE NO BRASIL

As empresas passaram a manter seus recursos tecnolgicos voltados a um


novo paradigma de orientao a servios, que oferece o suporte necessrio para as
empresas, permitindo o desenvolvimento de sistemas mais interativos. A rea de
Tecnologia da informao (TI) sempre manteve uma misso importante no segmento
empresarial, principalmente devido ao fato de que as organizaes vm se
deparando com a atual concorrncia acirrada, onde a maioria est utilizando

34

ferramentas e processos tecnolgicos para reduzir custos, minimizar riscos, elevar


seu potencial de produtividade e aumentar a qualidade de produtos e servios
(FERNANDES; ABREU, 2012).
Conforme relata Anand (2012) a ferramenta Business Intelligence (BI) ganhou
amplo reconhecimento nos ltimos anos por manter alto impacto nos negcios,
sendo vista como um elemento essencial para valor e desempenho aumentando no
ambiente organizacional pela gesto de TI, mantendo ainda alta relevncia para o
lucro das empresas.
O mercado de Business Intelligence and Analytics dever encerrar o ano com
US$ 788 milhes de investimentos no Brasil em 2015 conforme o IDC.
Uma projeo do Gartner para 2016 aponta que o mercado de (BI) deve
movimentar US$ 13,8 bilhes no Brasil, o que representa um crescimento de 7% em
relao a 2012. A estimativa que o mercado atinja US$ 14,1 bilhes em 2016.
A figura 7 - Solues mais utilizadas em BI, apresenta as solues de BI mais
utilizadas pelo mercado mundial em 2013, trazendo a Microsoft no topo.

Figura 7 Solues mais utilizadas em BI


Fonte: Gartner (2015)

35

2.4.3 VANTAGENS E DESVANTAGENS

Estas ferramentas fornecem para a empresa uma viso sistmica do negcio,


atuando na distribuio uniforme das informaes entre os colaboradores,
transformando grande quantidade de dados em estratgias eficientes para o
processo de tomada de decises. Atravs dos sistemas de BI possvel cruzar
dados, visualizar informao em dimenses variadas e observar os indicadores de
desempenho organizacional (BATISTA, 2004).
A nova dinmica empresarial atual exige que as organizaes se demonstrem
dispostas a redesenhar processos e atividades. Alm desta exigncia ser bastante
complexa, mantm alto custo financeiro, visto que a partir da perspectiva
computacional, devero ser realizadas inmeras atividades para testar sistemas e
adaptar tecnologias (AKABANE, 2012).

2.5 ARQUITETURA DO BUSINESS INTELLIGENCE

Segundo Turban et al (2008) a arquitetura de um sistema de BI constituda


por quatro grandes reas (Figura 8), dentre elas:
- DataWarehouse (DW): referente ao banco ou repositrio de informaes
utilizado para oferecer suporte ao processo de tomada de deciso da organizao,
onde possvel gerar desde simples relatrios a consultas que exijam o cruzamento
de dados, otimizando as aplicaes.
- Anlise de negcios: conhecida inicialmente pelo nome de processamento
analtico online (OLAP), atualmente existem diferentes ferramentas de software que
buscam o desenvolvimento dos relatrios propriamente ditos, atuando na consulta
de altas demandas, proporcionando uma anlise de dados eficientes. O principal
objetivo destas ferramentas oferecer aos usurios a identificao das informaes
com rapidez e agilidade, apresentando um desempenho cclico e significativo.
- Desempenho e estratgica: a organizao conta com excelentes
ferramentas para manipular e analisar as informaes. O Data Mining capaz de
identificar padres ocultos em um banco de dados que podem ser utilizados para

36

projetar comportamentos futuros, contribuindo na observao de clientes em


potencial, enquanto o Business Performance Management (BPM) volta-se para a
metodologia do Balanced Scorecard (BS) mantendo uma estrutura focada na
definio, implementao e gerenciamento da estratgia de negcios de modo a
definir padres de nvel superior. (TURBAN, 2008)

Figura 8 Arquitetura de um sistema de BI


Fonte: Turban et al (2008)

Diante destas ferramentas, compreende-se que o segmento empresarial


preza a integrao e eficincia na troca de informaes entre usurios, encontrando
em sistemas de BI importantes ferramentas para solues mais modernas e
interativas. As empresas tm buscado manter seus sistemas computacionais
voltados para a otimizao de seus processos de negcios, mantendo uma
infraestrutura de TI adequada que permanea de acordo com seus objetivos
organizacionais (TURBAN et al, 2008).
A adoo de sistemas de informao permite que as empresas tenham um
gerenciamento eficiente e transparente, voltada para o alcance dos objetivos e
obteno de resultados. Uma organizao que realiza investimentos na rea de
Tecnologia da Informao (TI) otimiza suas atividades podem aumentar a
rentabilidade e lucratividade da empresa. No entanto, preciso enfatizar que os

37

investimentos em recursos tecnolgicos devem estar associados com a necessidade


e a infraestrutura que a empresa apresenta, levando em considerao princpios
focados no bom-senso (AKABANE, 2012).
2.5.1 Modelagem Multidimensional

Um dos pontos muito importantes do BI a modelagem, o tipo de modelagem


deve ser escolhido de acordo com as exigncias do cliente e as necessidades que
so identificadas em relao a situao do negcio.
Neste trabalho utilizado o Schema Star. Existem dois principais tipos de
modelagem a Snowflake Schema e Star Schema.
Elas se diferenciam conforme sua estrutura e desempenho no processamento
de informao. De acordo com NOGARE (2014) a modelagem Star Schema, possui
desempenho melhor.
Conforme figura 9 Schema Star, no Schema Star as dimenses se
relacionam diretamente com a tabela Fato, sem nenhuma sub-dimenso.

Figura 9 Schema Star


Fonte: Autor

38

Conforme figura Figura 10 Schema Snowflake, o Schema Snowflake,


possuimos sub-dimenses ligadas s dimenses, e estas esto ligadas tabela fato.

Figura 10 Schema Snowflake


Fonte: Autor

Neste item mostrado os principais componentes do Business Intelligence


apresentando suas respectivas funcionalidades.
2.5.2 Data Warehouse (DW)

O DW atualmente reconhecido por ser um Sistema de Apoio Deciso


(SAD), cuja funo fornecer um banco de dados analtico para consultas,
fornecendo apoio em processos decisrios. Este sistema disponibiliza uma cpia
das informaes de transaes, estruturada efetivando as anlises.(INMON, 2004).
Seu propsito fornecer os recursos necessrios para a transformao de
um banco de dados, denominado banco de dados OLTP (On-Line Transation
Processing), para uma base de dados maior que contenha o histrico de todos os
dados gerados durantes anos, chamado banco OLAP (On-Line Analytical
Processing) ou DW. (INMON, 2004).

39

Segundo Ong, Siew e Wong (2011) o DW um dos componentes mais


importantes na

arquitetura

de

Business Intelligence

(BI),

cujas principais

caractersticas so:
- Orientado para assunto: onde dados de vrias fontes permanecem
organizados em grupos com base em reas comuns de concentrao de acordo
com as necessidades da organizao, como clientes, vendas e produtos.
- Integrada: rene grande quantidade de informaes de vrias fontes, onde
as mesmas devem ser consistentes em termos de convenes de nomenclatura,
formatos e outras caractersticas relacionadas.
- Variao de tempo: todos os dados armazenados no DW possuem
dimenso de tempo para acompanhar as mudanas ou tendncias em os dados.
2.5.3 Data Marts

Segundo Ferreira (2012) o Data Marts (DM) representa um subconjunto dos


dados destinados a um usurio especfico ou a um conjunto de grupos de usurios,
implementados em servidores departamentais de baixo custo, em plataforma Unix
ou Windows NT. Estas informaes podem ser capturadas de diferentes bases
operacionais, bem como de dados externos.

2.5.4 Metadados

Ferreira (2012) cita os metadados como objetos fundamentais para o DW. Um


objeto metadado corresponde a dados sobre os dados, apontando para informaes
que se encontram em outros locais, cuja abordagem contribui para um melhor
aproveitamento do material de dados existente, alm de possibilitar a interao e a
prtica de mais de um tipo de instrumento, responsvel por acessar o mesmo banco
de dados.
Com isso, os objetos metadados e os objetos contedo podero ser
armazenados em banco de dados, se considerados elementos independentes. A
alterao dos objetos metadados pode ser realizada sem haver a interferncia nos

40

objetos-contedos. Assim, pode-se tambm mudar um contedo sem interferir nos


objetos metadados que lhe fazem referncia. Atravs da utilizao do metadado,
possvel empregar uma camada que servir como intermediria entre os dados
armazenados e a apresentao dos mesmos (TURBAN et al, 2008).

2.5.5 ETL

Segundo Anand (2012) o processo de ETL composto de trs etapas


bsicas:
- Extrao: Na primeira fase, os dados so extrados dos sistemas
operacionais heterogneos. A quantidade reduzida omitindo quaisquer conjuntos
no relevantes. Esta etapa no deve afetar negativamente o desempenho dos
sistemas produtivos, sendo executada como uma tarefa em segundo plano ou
realizada em perodos de baixa atividade (por exemplo, durante a noite).
Os dados extrados so enviados para uma rea de armazenamento
temporrio antes da transformao e processo de limpeza. Isto feito para evitar a
necessidade de extrair novamente, caso seja identificado algum problema (ONG;
SIEW; WONG, 2011).
- Transformao: Qualquer transformao necessria para fornecer dados
que podem ser interpretados em termos de negcios feito nesta segunda etapa.
Os conjuntos de dados so limpos no que diz respeito qualidade. Eventualmente,
eles so convertidos para o regime de banco de dados e consolidados.
Nesta fase, ocorre ainda a limpeza de dados, referente identificao e
correo de dados e erros com base em regras pr-especificadas. Se houver um
erro encontrado, em seguida, ele enviado de volta para a fonte de dados para
correo. Depois da transformados, eles so armazenados na rea de teste. Isto
pode evitar a necessidade de transformar os dados novamente se os processos de
carregamento falhar ou terminar (ONG; SIEW; WONG, 2011).
- Carga: esta etapa refere-se ao carregamento para o repositrio de dados
propriamente dito. Considerando que a primeira fase pode afetar significativamente
os sistemas produtivos, o carregamento pode ter um imenso efeito sobre o DW.
Processos ETL podem ser executados no modo batch ou em tempo real. O

41

carregamento incremental uma tarefa crtica, e trabalhos em lote so normalmente


executados periodicamente.

2.5.6 Cubos de dados

A criao dos cubos fundamental para hospedar as informaes e


centralizar as regras de negcio que sero utilizadas pelos clculos em um banco de
dados. Cabe citar ainda que com este suporte fica mais fcil realizar consultas e
comparar dados anualmente, criando valores cumulativos. O desempenho das
consultas melhora significativamente, havendo a possibilidade de criar tabelas de
resumo que preparam os dados para visualizao sem exigir muitos detalhes no
nvel da transao (MISNER, 2009).
Conforme na figura Figura 11 Cubo BI, o cubo multidimensional possui as
faces: Ms, Regio e Produto.

Figura 11 Cubo BI
Fonte: Turban (2008)

42

2.5.7 OLAP

O On-Line Analytical Processing (OLAP) no mantido apenas como uma


tecnologia que soluciona problemas, mas que atua na sintetizao, anlise e
consolidao de dados para problemas de sntese. Segundo Anzanello (2002)
consegue visualizar informaes a partir de perspectivas diferentes, enquanto possui
estrutura de dados apropriado. A visualizao feita em dados agrupados, e no em
dados operacionais porque a aplicao OLAP tem objetivo de auxiliar no apoio aos
usurios finais na tomada de deciso. Os dados so apresentados em termos de
medidas e dimenso.

2.5.7.1 Arquiteturas OLAP

Anzanello (2002) cita que a arquitetura do OLAP ser elaborada a partir do


mtodo de armazenamento de dados escolhidos, dentre eles:
- Multidimensional On-Line Analytical Processing (MOLAP): os dados so
acessados diretamente no banco de dados do servidor multimensional, mantendo
um limite prtica com relao ao tamanho fsico das informaes que o sistema
poder manipular.
- Relational On-Line Analytical Processing (ROLAP): utiliza-se um modelo
relacionar que responsvel pelas consultas e gerenciamento das informaes no
banco de dados relacional.
- Desktop On-Line Analytical Processing (DOLAP): utilizado para
proporcionar a portabilidade dos dados, assegurando a reduo do trfico na rede.
- Hybrid On-Line Analytical Processing (HOLAP): combinao existente entre
ROLAP e MOLAP.

43

2.5.7.2 Elementos OLAP

Segundo Anzanello (2002) a modelagem multidimensional do OLAP


constituda por trs elementos bsicos:
- Fatos: abrange a coleo de itens de dados, gerados a partir de medidas e
contextos como variao ao longo do tempo e valores numricos para avaliao.
- Dimenses: refere-se aos elementos que constituem os fatos, permitindo a
compreenso do mesmo atravs da identificao do produto, perodo, regio
geogrfica, cliente, fornecedor e outros fatores que ampliam o entendimento.
- Medidas: estes atributos envolvem os valores numricos que representam o
fato, normalmente associadas a um fator de medida como custos de produo,
unidades fabricadas; unidades vendidas, quantidade de clientes, etc.

2.5.8 Dashboards

O Dashboard definido como um painel de controle que garante a


visualizao de um ou mais relatrios e grficos na tela de um computador, podendo
ser utilizado por todos os nveis de gesto na obteno de uma imagem real de
vrios aspectos de negcios em um nico formato. (ANZANELLO, 2002).

2.5.9 Data Mining

Historicamente, o Data Mining, tambm conhecido como Minerao de


Dados, surgiu na dcada de 60 atravs da criao de tcnicas de anlises
estatsticas envolvendo as atividades de correlao e regresso de dados. Somente
na dcada de 80, o sistema recebeu novas funcionalidades atravs da insero de
lgicas fuzzy e redes neurais. Com isso, na dcada de 90, o Data Mining devido aos
seus benefcios no processamento de informaes, passou a ser utilizada como

44

importante ferramenta empresarial na soluo de problemas no ambiente


organizacional (DUNHAN, 2003).
O Data Mining permite explorar detalhadamente e identificar informaes
armazenadas em uma grande unidade de dados, sendo muito utilizado pelas
organizaes na busca por padres de consumo, assim como na avaliao de
tendncias do mercado. A previso das informaes por meio dele se d utilizando
inmeras tcnicas indutivas, utilizadas para aumentar a qualidade das informaes
processadas (DUNHAN, 2003).
A metodologia do Data Mining parte da busca de dados a partir de uma
descrio lgica ou matemtica seguindo padres e regularidades, onde
normalmente os dados so analisados com base na suposio. (CARDOSO;
MACHADO, 2008).

2.5.10 Importao e Exportao de dados

As estruturas lgicas de um banco de dados envolvem tablespaces, objetos


de

esquema,

blocos,

extenses

segmentos.

Cabe

ressaltar

que

seu

funcionamento depende da integrao entre os tablespaces e os datafiles, conforme


ilustrado na figura a seguir:

Figura 12 Interao entre o banco de dados, database e tablespace


Fonte: Ramalho (2006, p. 03)

Ao analisar a figura acima possvel afirmar que cada banco de dados podese dividir de maneira lgica em um ou mais tablespaces, assim como um ou mais

45

datafiles podem ser criados para cada tablespace, visando o armazenamento fsico
das informaes que formam todas as estruturas lgicas.

2.5.11 OLTP

Muito utilizado na dinmica do BI, o OLTP um sistema que permite


processar dados rotineiros gerados constantemente pelos bancos de dados a partir
de comandos bsicos como insert, update e delete. Possui uma abordagem
operacional tanto na leitura quanto na gravao das informaes, cujos principais
benefcios abrangem a eficincia na resposta dos clculos e simplicidade no
manuseio e entendimento das operaes (OLIVEIRA, 2012).

2.5.12 Relatrios

O desenvolvimento de relatrios ocorre na fase de transformao envolvendo


o processo de converso de dados, utilizando um conjunto de regras de negcios
(como funes de agregao) em formatos consistentes para elaborao de
relatrios e anlise. Tambm inclui a definio lgica de negcios para mapeamento
de dados e padronizao de definies de dados, a fim de garantir a consistncia
em uma organizao (ONG; SIEW; WONG, 2011).

46

3 FERRAMENTAS BUSINESS INTELLIGENCE OPEN SOURCE


Neste item apresentada as principais ferramentas de BI Open Source, nesse
trabalho ser utilizada a ferramenta Pentaho.
3.1 SUITES BUSINESS INTELLIGENCE OPEN SOURCE

3.1.1 Jaspersoft

A Jaspersoft atende significativamente as reas individuais das empresas.


Criada em 2006, mantida como um conjunto de BI altamente flexvel, econmico e
muito usado em todo o mundo, sendo utilizada constantemente por uma
comunidade que possui mais de 225.000 usurios registrados (MARINHEIRO;
BERNARDINO, 2013) o JasperReports Server um servidor de relatrios
standalone que pode ser integrado em qualquer aplicao. Fornece relatrios e
anlises que podem ser utilizados em aplicaes para internet (WEB) ou mobile.
Fornece informaes em tempo real, para a WEB, dispositivo mvel, impressora ou
correio eletrnico. Foi desenvolvido para partilhar, proteger e gerir de forma a reunir
os relatrios e anlises. Entre as funcionalidades, destacam-se: formatao e
visualizao de relatrios de forma interativa, repositrio integrado e seguro,
agendamento de gerao e distribuio de relatrios e interface personalizvel
(MARINHEIRO; BERNARDINO, 2013).
Esta ferramenta a mais utilizada no processo de gerao de relatrios,
sendo programada em Java, fazendo uso de dados de quaisquer origens,
produzindo documentos facilmente visualizados, podendo ser impressos em
diferentes formatos, HTML, PDF, Word, etc.

47

3.1.2 Openi

Esta ferramenta melhora radicalmente a interoperabilidade dos servios


baseados em nuvem e confiam em armazenamento em nuvem pessoal atravs do
desenvolvimento de um consumidor-centric, plataforma open source de aplicaes
em nuvem mvel. Conforme relatam Marcon Jr (2011), de modo geral, a computao
em nuvem pode ser utilizada na hospedagem de softwares em ambientes
computacionais na Internet. Com isso, os consumidores podem se comunicar com
inmeros servidores ao mesmo tempo e compartilhar dados entre si. Com a adoo
de uma central administrativa consegue-se desenvolver novas capacidades para
elevar o desempenho dos servios, sem interferir nas aes do consumidor.

3.1.3 Palo

Desenvolvida em 2007 pela empresa alem Jedox AG, esta sute open
source composta por quatro aplicaes de BI: Palo OLAP Server, Palo Web, Palo
for Excel e ETL Server, cuja plataforma desenvolvida em cdigo open source,
totalmente gratuita e distribuda a partir de licena. As propriedades do Palo, so
dividas em: Excel Integration (Excel Add-in; OLAP); Web-Client (Web Spreadsheet;
Web Pivot; File Manager; User Manager; ETL Manager); ETL (ETL Server). ainda
constituda pelos produtos Palo OLAP, Palo for Excel, Palo Web e Palo ETL
(MARINHEIRO; BERNARDINO, 2013).
O Palo OLAP um servidor multidimensional OLAP que atua em memria, a
partir da organizao de dados em cubos, dimenses e elementos. O Palo for Excel
uma ferramenta voltada para Excel e Open Office que quando aliado ao DataBase
se transforma em um sistema de BI completo. O Palo Web combina todos os
componentes da ferramenta, analisando, planejando e criando relatrios em uma
plataforma Web uniforme. Por fim, o Palo ETL integra grande quantidade de
informaes atravs do processo de ETL.

48

3.1.4 Vanilla

A primeira verso foi desenvolvida em junho de 2008 pelo consorcio francs


BPM-Conseil, especializado em consultoria, cujos membros possuem vasta
capacitao em programao, agrega uma plataforma que define a sequncia
completa do negcio. Para tanto, disponibilizado ao usurio suporte tcnico em um
frum mantido pela equipe de desenvolvedores em quatro idiomas padro: francs,
ingls, espanhol e portugus. Suas principais caractersticas envolvem a integrao
com metadados, otimizaes em SQL, integrao com ETL e Workflow, e uma base
de indicadores de desempenho KPIs, estando adequados com o Bi Gateway e
Dashboard (MARINHEIRO; BERNARDINO, 2013).

3.1.5 SpagoBI

Esta ferramenta possui um componente de previso de what-if que


proporciona uma anlise multidimensional, responsvel por efetuar simulaes e
cenrio em modalidade alternativa, garantindo a avaliao das mltiplas hipteses
mantidas pelo sistema em tempo real e em diversos nveis detalhados. Alm disso,
esta ferramenta amplia a atuao de self-service, compondo os prprios painis
analticos com liberdade, oferecendo melhor suporte ao processo de fuso de dados
heterogneos e tecnologias in- memory (KLEIN, 2014).

3.1.6 Pentaho

O Pentaho uma sute livre que oferece suporte s operaes de BI, cuja
plataforma desenvolvida em Java independente. Criada em 2004, atualmente
uma das mais utilizadas e com maior reconhecimento no mercado dentre os
desenvolvedores e utilizadores de ferramentas de BI.

49

Seus recursos atendem a inmeras necessidades como: gerar relatrios,


integrar e armazenar dados (Data warehouse); analisar informaes (OLAP);
construir painis (Dashboards); controlar acesso operacional e gerencial; minerar
dados (Data mining) (BARBAN; FIGUEIREDO; FERREIRA, 2012).

Figura 13 Arquitetura Pentaho


Fonte: Barban, Figueiredo e Ferreira (2012)

Estudos como o de Hirata e Vacari (2014) sugerem que esta ferramenta


muito conceituada e benfica, j que possui facilidade na construo e
acessibilidade de todas suas funcionalidades, mantendo uma interface amigvel e
intuitiva. Alm disso, contribui com o atendimento de demandas de anlises de
dados, bem como de extrao de informaes de modo eficiente e rpido.
Esta sute constituda por duas verses: Enterprise e Community.
A verso Enterprise uma verso proprietria que contm todos os recursos,
com interfaces simples e de fcil entendimento para os usurios. A verso
Community open source, e fornece os mesmos mdulos, sendo que alguns no

50

tm a interface to utilizvel, e tm maior dificuldade de adequao. O seu


desenvolvimento feito em Java, e pode ser executada a partir de uma Java Virtual
Machine (MARINHEIRO; BERNARDINO, 2013).
A verso Community (livre) composta por cinco mdulos: Pentaho Data
Integration, Pentaho Reporting, Pentaho Dashboards, Pentaho Analysis Services e
Pentaho Data Mining. distribuda sob as licenas GNU General Public License
verso 2.0 (GPLv2), GNU Lesser General Public License verso 2.0 (LGPLv2), e
Mozilla Public License 1.1 (MPL 1.1). A verso mais recente desta suite a 4.8,
disponibilizada em Novembro de 2012 (MARINHEIRO; BERNARDINO, 2013).
Reconhecida como lder em open source BI & Data Integration, segundo
pesquisa da empresa Third Nature (2009).
Caractersticas:

Mdia de download, a cada 30 segundos

Mais de 10.000 implementaes ativas em produo

Mais 1.200 clientes em 65 pases

Economia de >US$2 bilhes em licenas e manuteno

Apoiado por Benchmark Capital, Index Ventures e NEA

Ambiente 100% J2EE

Escalvel, baseada em padres

Interfaces Web e Thin-client

Multiplataforma

Windows, Linux, Unix e Mac

Rica capacidade analtica

49 modelos de processamento de dados

76 algoritmos de classificao / regresso

Algoritmos de clustering

10 algoritmos de busca em seleo futura

Acesso a diversas fontes de dados

SGBD, XML, OLAP

Resultados em vrios formatos

Flexvel: l +30 bancos de dados;

51

Economia: relatrios SQL so reaproveitveis;

Portvel: 100% Java;

Segurana: integra com LDAP;

Extensvel: integra-se com aplicaes existentes via

SOAP;

Ponta-a-ponta: faz desde ETL, data mining, incluindo

OLAP, dashboards e relatrios ad hoc.

Simples: acesso centralizado via web aos dados da

empresa;

Flexvel: relatrios, grficos, OLAP on-line ou e-mail, em

background ou no;

Self service: liberdade de escolha dos campos, e

combinaes;

Sadas: resultados em vrios formatos: Excel, CVS ou

PDF.

3.1.6.1 Pentaho Data Integration

Tambm denominado de Kettle, atua na prtica do processo de ETL dos


dados de maneira fcil e intuitiva, mantendo uma grande biblioteca de objetos de
mapeamento suportados por diversas fontes de dados. Com isso, o armazenamento
ocorre a partir de dimenses de Data Warehouses ou ficheiros. Durante o processo
de transformao, h a limpeza de dados de acordo com as diretrizes e a migrao
de dados entre as operaes (MARINHEIRO; BERNARDINO, 2013).

3.1.6.2 Pentaho Reporting

52

Este mdulo composto por duas ferramentas, a primeira responsvel pela


gerao de relatrios, denominada de JFreeReport; e a segunda que gera os
metadados, criando relatrios ad-hoc via Web. So suportadas vrias fontes de
dados, at mesmo, relacionais, OLAP e XML, o que garante relatrios orientados por
wizard, multi-lngua, filtros de visualizao interativa, e exportao para os formatos
mais comuns (MARINHEIRO; BERNARDINO, 2013).

3.1.6.3 Pentaho Dashboards

O Pentaho Dashboards constitudo por KPIs que so indicadores de


desempenho que geram painis de controle e renem em uma mesma janela os
principais requisitos de determinado objetivos. Estas mtricas so estabelecidas
intuitivamente, integrando os mdulos Pentaho Reporting e Analysis, propiciando a
monitorizao

frequente

continua

identificao

(MARINHEIRO; BERNARDINO, 2013).


Segue abaixo um exemplo de Dashboards:

Figura 14 Dashboard Pentaho


Fonte Exemplos Pentaho

de

possveis

falhas

53

3.1.6.4 Pentaho Analysis Services

Tambm denominado de Mondrian, um motor OLAP, que faz uso da


arquitetura ROLAP, para gerenciar a base de dados, cujas funcionalidades
envolvem uma camada de metadados, linguagem MDX, cache em memria, tabelas
inseridas, etc, suportadas em ambiente web, cuja gerao de relatrios ocorre a
partir de suporte drag&drop (MARINHEIRO; BERNARDINO, 2013).

3.1.6.5 Pentaho Data Mining

Este mdulo estabelece as ferramentas de prospeco de dados, mantendo


uma srie de normas de classificao, regresso, associao e algoritmos de
clustering, contribuindo com a melhor compreenso do negcio, obtendo resultados
mais satisfatrios (MARINHEIRO; BERNARDINO, 2013).
3.1.6.6 Suporte ao Pentaho

Diante de suas inmeras funcionalidades, o suporte para a utilizao da


ferramenta Pentaho fundamental, uma vez que busca oferecer informaes que
auxiliem os usurios a utilizar a sute Pentaho de BI, compreendendo como
implementar, modelar e construir processos eficientes de acordo com suas
necessidades.
Embora seja uma ferramenta gratuita, inmeras entidades e fruns possuem
equipe tcnica que se dedica a prestar o servio de suporte gratuito de Pentaho,
bem como a quaisquer questes relacionadas s temticas de BI e Open Source. O
suporte gratuito torna-se importante para que toda a comunidade adquira o
conhecimento sobre a ferramenta e receba o apoio adequado garantindo uma
implementao

profissional,

minimizando

os

riscos

investimentos, obtendo assim solues satisfatrias de BI.

potencializando

os

54

Dentre as principais comunidades e fruns nacionais e internacionais, que


oferecem auxlio no entendimento da ferramenta e de seus erros, alm de sanar
dvidas e compartilhar tutorias para o desenvolvimento do ambiente de BI,
destacam-se:
- Pentaho: http://www.pentaho.org.br
- It4Biz: http://www.it4biz.com.br/novosite/servicos/suporte-gratuito/
- Pentaho Brasil: pentahobrasil@googlegroups.com; http://pentahobrasil.org
- Pentaho BR: pentahobr@yahoogrupos.com.br
- Pentaho Africa: pentahoafrica@googlegroups.com
- Pentaho Big Data: pentahobigdata@googlegroups.com
- Software Livre: http://softwarelivre.org/
- Blog Pentaho Brasil: http://pentahobrasil.blogspot.com.br/
- Facebook Pentaho Brasil: https://pt-br.facebook.com/pentahobrasil

55

4 ESTUDO DE CASO

Para este estudo de caso ser utilizada uma empresa que ser chamada a
partir de agora como X, com 480 funcionrios, considerada uma organizao
mdia, atua no ramo de alimentos h 10 anos, localizada no interior de So Paulo,
pretende maximizar seu negcio e gerenciar melhor suas vendas.

4.1.Cenrio Atual

Atualmente utiliza um sistema em Linguagem C++ que alimenta um banco de


dados PostgreSQL, nesse sistema feito o cadastramento das mercadorias,
pedidos, clientes, funcionrios.

Figura 15 Diagrama de Classe do Sistema


Fonte: Autor (2015)

As reas gerenciais tm total necessidade de obter informaes precisas para


que possam desenvolver estratgias decisrias. Atualmente o sistema utilizado pela
organizao no possui funo para gerao de relatrios, o mesmo no possui
nenhum processo padro unificado, cada rea da empresa se organiza de uma

56

forma, seja planilhas ou anotaes manuais, para extrair informaes gerencias que
apoiem na tomada de deciso sempre solicitam que algum extraia essas
informaes do banco de dados, consultando querys gigantescas gerando demora
na entrega da informao e possvel inconsistncias e com isso informaes cruciais
para o crescimento, manuteno e gerenciamento do negcio so desperdiadas.
Se o gerente na rea de vendas solicitar qual foi a quantidade de produtos
mais vendidos por nome de cliente no segundo trimestre de 1998, esses dados no
momento esto em papis guardados em pastas, at os dados serem estudados,
organizados e entendidos para a sim serem transformados em relatrios
demandar

muito

tempo

recurso,

podendo

haver

inconsistncias

inconformidades.
H muitas necessidades que parecem ser simples como essa citada acima,
no texto seguinte veremos a soluo para obteno de informaes especficas e
construo de um ambiente de Business Intelligence com base em um Data
Warehouse.

4.2 Soluo

Inicialmente este projeto apoiar a rea de vendas no gerenciamento do


negcio e na tomada de deciso, podendo futuramente ser utilizado para outras
reas.
A soluo ser construda com o ambiente Pentaho que como j foi descrito
neste trabalho uma das ferramentas Open Source mais completas e respeitadas
do mercado.
Criaremos um Data Warehouse a partir do banco de dados j existente da
empresa X, no caso o PostgreSQL.
A modelagem do banco de dados atualmente da organizao vista na
Figura 16 Diagrama de banco de dados empresa X:

57

Figura 16 Diagrama de banco de dados empresa X


Fonte: Autor (2015)

Os Pr-requisitos para instalar o ambiente Pentaho so:


Sun Java Developer Kit (JDK ),
Arquivo de instalao do Pentaho BI Server que podem ser encontrados em:
http://sourceforge.net/projects/pentaho/files/Business%20Intelligence%20Server/.
Primeiramente devemos criar a conexo do banco de dados PostgreSQL com
a ferramenta Pentaho em Pentaho User Console:

Figura 17 PUC (Ferramenta de controle de usurio e conexo do Pentaho)


Fonte: Autor (2015)

58

Aps a conexo feita com o PostgreSQL devemos acessar a ferramenta


Spoon, criaremos nosso Datawarehouse atravs das cargas de dados vindas do
nosso banco de dados.

Figura 18 Arquitetura do estudo de caso


Fonte: Autor (2015)

Abaixo vemos a carga de dados ETL vinda do banco de dados da


organizao X sendo criada em uma nova base de dados, neste caso, a da
Dimensao_Clientes.

Figura 19 Spoon (Criando Carga para dimenso)


Fonte: Autor (2015)

Aps criar todas as cargas e dimenses, devemos criar uma transformao


que nada mais do que o tratamento dos dados que sero inseridos, neste caso
estamos criando uma transformao para facilitar consulta dos dados por data, ano,
ms e inserindo essas informaes numa dimenso chamada dimenso_data.

59

Figura 20 Spoon (Transformao)


Fonte: Autor (2015)

Com a construo das outras tabelas dimenso, o DW est pronto no banco


PostgreSQL com as dimenses e tabela f_pedido conforme mostra a Figura 21
Tabelas dimenso e fato criadas no PostgreSQL:

Figura 21 Tabelas dimenso e fato criadas no PostgreSQL


Fonte: Autor (2015)

A tabela Fato Pedido a que centraliza os IDs das outras tabelas dimenses,
o DW est modelado como star schema conforme j descrito nos captulos
anteriores, a imagem abaixo possvel visualizar as tabelas criadas e suas relaes.

60

Figura 22 PostgreSQL
Fonte: Autor (2015)

Nesta prxima etapa o cubo criado pela ferramenta Schema Workbench, ao


criar o cubo, voc deve definir as tabelas dimenses, qual a finalidade dessas
informaes e em qual perodo queremos trata-las? Essa a parte mais importante,
pois o que for definido no cubo ter reflexo no resultado final (relatrios,
dashboards).
Na figura Figura 23 Schema Workbench (Criando cubo), foi criado o cubo
Vendas com as dimenses CLIENTE, PRODUTO e DATA, com a mtrica
quantidade, podem ser criadas vrios tipos de mtricas, valor mximo, valor mnimo,
depende da necessidade.

61

Figura 23 Schema Workbench (Criando cubo)


Fonte: Autor (2015)

Depois da finalizao do Cubo ele deve ser salvo e importado na ferramenta PUC
conforme Figura 24 Pentaho User Controller (PUC), essa a ferramenta para
criao de relatrios e Dashboards.

Figura 24 Pentaho User Controller (PUC)


Fonte: Autor (2015)

62

Na Figura 25 Criando Grficos, importamos o cubo criado e geramos


informao e grficos, nesse caso filtramos todos os produtos vendidos nos anos de
1994, 1995 e 1996, uma solicitao que demoraria tempo foi gerada em questo de
minutos de forma grfica.

Figura 25 Criando Grficos


Fonte: Autor (2015)

Na mesma ferramenta foi criado Dashboards respondendo as perguntas: Qual


o cliente que mais comprou no de ano 1994? Pode ser gerado diversos tipos de
grficos para adicionar em Dashboards diferentes.
O Ambiente Pentaho totalmente personalizvel, essas informaes geradas
como exemplo na Figura 26 Criando Dashboards, serviriam para se questionar
sobre o porqu do cliente que mais fez compra ser uma mulher? Quais

so

os

produtos que foram adquiridos por ela? As caractersticas desses produtos podem
ser aplicadas em produtos menos vendidos e assim apoiar na tomada de deciso
para o gerente de vendas.

63

Figura 26 Criando Dashboards


Fonte: Autor (2015)

64

5 CONCLUSO

O objetivo geral deste trabalho foi desenvolver um ambiente de Business


Intelligence para uma mdia empresa de nome X no apoio a tomada de deciso
Com base nisso foi feito um estudo de caso visando a rea de vendas e suas
atuais necessidades.
O ambiente desenvolvido atendeu a algumas necessidades e encontra-se
extremamente apto para satisfazer futuras demandas que surgirem no s da rea
de vendas, mas para outras reas que precisarem de informaes para apoio na
tomada de deciso, porm ainda no est sendo utilizado pela empresa do estudo
de caso.
O resultado no estudo de caso pode gerar informaes sobre quantidade de
vendas por ms, por ano, por dia, pode mostrar quais clientes compraram mais em
determinado perodo, quais foram os produtos mais vendidos e os menos vendidos.
Essas informaes so consistentes e nunca iro se perder, podero ser
consultadas a qualquer momento para um relatrio. Sero teis para uma anlise
dos gerentes de vendas e as equipes para perceberem as necessidades dos
clientes de acordo com suas compras, aplicar as caractersticas dos produtos mais
vendidos nos menos vendidos, verificar quais meses houveram queda de vendas e
analisar o porqu, chegando em decises e estratgias para o negcio.

65

REFERNCIAS BIBLIOGRFICAS

ABES, Faturamento do setor de software e servios no Brasil. Disponvel em:


<http://www.abessoftware.com.br/dados-do-setor/dados-2014> Acesso em: 05 de
outubro de 2015.
AKABANE, Getulio K. Gesto estratgica da tecnologia da informao:
conceitos, metodologias, planejamento e avaliaes. So Paulo. Editora Atlas, 2012.
ANAND, N. Application of ETL Tools in Business Intelligence. International Journal
of Scientific and Research Publications, v. 2, n. 11, novembro 2012. Disponvel
em: <http://www.ijsrp.org/research-paper-1112/ijsrp-p1135.pdf> Acesso em: 24 de
set. 2015
ANZANELLO, C. A. OLAP Conceitos e utilizao (2002) Disponvel em:
<http://siaibib01.univali.br/pdf/Romero%20Piske.pdf> Acesso em: 27 de set. 2015
BARBAN, L. R. C. F; FIGUEIREDO, L; FERREIRA, S. A. A. C. Projeto de migrao
de bi utilizando a ferramenta pentaho community edition com banco de dados
POSTGRESQL

(2012)

Disponvel

em:

<http://www.ccuec.unicamp.br/biti/download/08.pdf> Acesso em: 28 de set. 2015


BARTHOLOMEW, D. Getting Started with MariaDB. Packt, 2015.
BATISTA, Emerson de Oliveira. Sistema de Informao: o uso consciente da
tecnologia para o gerenciamento. So Paulo: Saraiva, 2004.
BLANCACCO, A. M; FERRAZ, A. R; AMORIM, C. H. V; SILVA, C. H. M; FREITAS, J.
B;

TELES,

R.

B.

I.

Business

Intelligence

(2008)

Disponvel

em:

<http://www.esedh.pr.gov.br/arquivos/File/artigo_bi.pdf> Acesso em: 24 de set. 2015

66

BNDES,

Classificao

pequenas

mdias

empresas.

Disponvel

em:

<http://www.bndes.gov.br/SiteBNDES/bndes/bndes_pt/Institucional/Apoio_Financeiro
/porte.html> Acesso em: 02 de outubro de 2015.
CANTU, CARLOS HENRIQUE. Firebird Essencial. So Paulo: Ciencia Moderna.
2005.
CARDOSO, O. N. P; MACHADO, R. T. M. Gesto do conhecimento usando data
mining: estudo de caso na Universidade Federal de Lavras. RAP 2008; 42(3): 495428.
DUNHAM, M. H. Data mining: introductory and advanced topics. Upper Saddle
River, NJ: Pearson Education, 2003.
DREHER, Felipe Gastos com TI atingiro US$ 125 bilhes no Brasil em 2015.
Disponvel em: <http://computerworld.com.br/node/52830.> Acesso em: 02 de
outubro de 2015.
ELMASRI, RAMEZ; NAVATHE, SHAMKANT B. Sistemas de Bancos
de Dados. Pearson, 6a, 2011.
FERNANDES, Aguinaldo Aragon; ABREU, Vladimir Ferraz De. Implantando a
governana de TI: da estratgia gesto dos processos e servios. 3 Edio, Rio
de Janeiro, Editora Brasport, 2012.
GARTNER, Magic Quadrant for Business Intelligence and Analytics Platforms.
Disponvel

em:

<http://www.gartner.com/technology/reprints.do?id=1-

2ACLP1P&ct=150220&st=sb> Acesso em: 01 de outubro de 2015.


GONZAGA, Jorge L. Dominando o PostgreSQL. So Paulo: Ciencia Moderna,
2007.
HIRATA, A; VACARI, I. Uso da ferramenta Pentaho BI-Server para obteno de
informaes gerenciais do Sistema Aberto e Integrado de Informao em

67

INMON, W. H.; HACKATHORN, Richard D. Como Usar o Data Warehouse. Rio de


Janeiro: Infobook, 1997.
INMON, William H. Building the Data Warehouse. Indiana: Wiley, 2004.
KLEIN, C. A suite SpagoBI emite a primeira soluo open-source para as
simulaes

de

previses

(2014)

Disponvel

em:

<http://www.spagobi.org/2014/09/a-suite-spagobi-emite-a-primeira-solucao-opensource-para-as-simulacoes-de-previsoes/> Acesso em: 25 de set. 2015


LAUDON, Jane P. & LAUDON, Kenneth C. Sistemas de informaes gerenciais.
So Paulo. Pearson Prentive Hall, 2014.
MAN, O, D; MAIA, L. F. J; TIRELLI, A. Anlise comparativa entre os bancos de
dados

Adabas,

Dataflex,

Oracle

Progress

(1998)

Disponvel

em:

<http://campeche.inf.furb.br/siic/siego/docs/dalfovo__oscar__tirelli__aldiranalisec.pdf
> Acesso em: 22 de set. 2015
MARCON JR, A; LAUREANO, M; SANTIN, A; MAZIERO, C. Aspectos de
segurana e privacidade em ambientes de Computao em Nuvem (2011)
Disponvel

em:

<http://professor.ufabc.edu.br/~joao.kleinschmidt/aulas/seg2011/nuvem.pdf> Acesso
em: 22 de set. 2015

MARINHEIRO, A; BERNARDINO, J. Analysis of Open Source Business


Intelligence Suites Anlise de Suites Open Source Business Intelligence (2013)
Disponvel

em:

<http://ieeexplore.ieee.org/stamp/stamp.jsp?arnumber=6615764>

Acesso em: 28 de set. 2015


MAZIERO, Carlos Alberto. Sistemas Operacionais (2008) Disponvel em:
<http://www.ifba.edu.br/professores/flaviamsn/docs/so-cap01.pdf> Acesso em: 25 de
set. 2015

68

MICROSOFT. Restries de chave primria e chave estrangeira (2014)


Disponvel em: <https://msdn.microsoft.com/pt-br/library/ms179610(v=sql.120).aspx>
Acesso em: 28 de set. 2015
MISNER, S. Business Intelligence: construindo seu primeiro cubo (2009)
Disponvel

em:

<https://technet.microsoft.com/pt-br/magazine/ee677579.aspx>

Acesso em: 29 de set. 2015


NOGARE, Diego. Do banco de dados tomada de deciso. So Paulo: B2U
Editora, 2014.
OBRIEN, James A. Sistema de informao: e as decises gerenciais na era da
internet. So Paulo: Saraiva, 2004.
OLIVEIRA, Wilson Jose de. Data Warehouse. So Paulo: Visual Books, 2002.
OLIVEIRA, D. H. R. O que business intelligence parte II/V OLTP X OLAP
(2012) Disponvel em: <http://projetoseti.com.br/o-que-business-intelligence-parte-2oltp-x-olap/> Acesso em: 28 de set. 2015
ONG, I. L; SIEW, P. H; WONG, S. F. A Five-Layered Business Intelligence
Architecture.

IBIMA

Publishing,

2011.

Disponvel

em:

<http://www.ibimapublishing.com/journals/CIBIMA/2011/695619/695619.pdf> Acesso
em: 24 de set. 2015
OPENI HOME PAGE, Big Data Dashboards + Reports Hackers for Hire.
Disponvel em: < http://openi.org/> Acesso em: 10 de maio 2015.
PRATES, C. F; SOUZA, C. H. F. B; CASTRO, C. V; VILELA, D. R. G; ALMEIDA, N.
M.

Software

livre:

soluo

ou

problema?

(2011)

Disponvel

em:

<http://ueadsl.textolivre.pro.br/2011.1/papers/upload/96.pdf> Acesso em: 24 de set.


2015

69

PRESSMAN, Roger S. Engenharia de Software. 6 ed. Rio de Janeiro: McGraw-Hill,


2011.
PUGA, Sandra; FRANA, Edson; GOYA, Milton. Banco de dados: implementao
em SQL, PL/SQL e Oracle 11g. So Paulo: Pearson, 2014
RAMALHO,

Jos

Antonio.

Oracle

10g

(2006)

Disponvel

em:

<http://books.google.com.br/books?hl=ptBR&lr=lang_pt&id=AdEET9xkkGkC&oi=fnd&pg=PA1&dq=oracle&ots=UMSv36rkIO&
sig=gVTcGUc_i1pE7TmdN9zgHBtlqPE#v=onepage&q&f=false> Acesso em: 24 de
set. 2015
RAMALHO, J.A. Microsoft Sql Server- Guia Prtico. Brasil. Elsevier Brasil, 2005.
REDAO, convergecom Gastos com TI no Brasil devem crescer menos de 1%
em 2016, aponta estudo. Disponvel em: <
http://convergecom.com.br/tiinside/21/10/2015/gastos-com-ti-no-brasil-devemcrescer-menos-de-1-em-2016-aponta-estudo/?
noticiario=TI&__akacao=2642122&__akcnt=ac002182&__akvkey=03e2&utm_source
=akna&utm_medium=email&utm_campaign=TI+INSIDE+Online++21%2F10%2F2015+23%3A19 /.> Acesso em: 14 de novembro 2015.
REESE, GEORGE. MYSQL POCKET REFERENCE. EUA. Editora OREILLY &
ASSOC, 2003.
REZENDE, Denis Alcides; ABREU, Aline Frana de. Tecnologia da informao:
aplicada a sistemas de informao empresariais. 8. ed. So Paulo: Atlas, 2011.
ROBREDO, Jaime. Da cincia da informao revisitada aos sistemas humanos
de informao. Braslia: Thesaurus, 2003.
ROCHA,

R.

Bases

de

Dados

(2004)

Disponvel

<https://www.dcc.fc.up.pt/~ricroc/aulas/1011/bd/apontamentos/parteV.pdf>
em: 24 de set. 2015

em:
Acesso

70

ROSA, Karina Brasil o 7 no mundo em investimentos em TI, com US$ 60


bilhes em 2014. Disponvel em: <http://www.compusoftware.com.br/brasil-e-o-7ono-mundo-em-investimentos-em-ti-com-us-60-bilhoes-em-2014/.> Acesso em: 29 de
maio 2015.
SEBRAE,

Classificao

pequenas

mdias

empresas.

Disponvel

em:

<http://www.sebrae-sc.com.br/leis/default.asp?vcdtexto=4154> Acesso em: 02 de


outubro de 2015.
SERRA, Laercio. A essncia do Business Intelligence. So Paulo: Berkeley, 2002.
SETZER, V.W. Os Meios Eletrnicos e a Educao: Uma Viso alternativa.
So Paulo: Editora Escrituras, Coleo Ensaios Transversais Vol. 10, 2001.
SILVA, Mrcio. Entenda o que Big Data. Revista Veja, So Paulo, ed.2321, n.20,
ano 46, maio de 2013.
SOMMERVILLE, Ian. Engenharia de Software 8. ed. So Paulo: Persson, 2011.
STAIR, Ralph M; REYNOLDS G. W. Princpios de sistemas de informao: uma
abordagem gerencial. Rio de Janeiro: LTC, 2002.
THESIS, S. MongoDB: An introduction and performance analysis (2012) Disponvel
em: <http://wiki.hsr.ch/Datenbanken/files/MongoDB.pdf> 29 de set. 2015
THIRD NATURE, ETL Proof of Concept Written Response: Pentaho Data
Integration

(2009).

Disponvel

em:

<http://thirdnature.net/content/Pentaho_ETL_RFP_response.pdf>
Acesso em: 05 de maio 2015.
TURBAN, E; SHARDA, R; ARONSON, J. E; KING, D. Business Intelligence: um
enfoque gerencial para a inteligncia do negcio. So Paulo: Prentice Hall, 2008.

71

TURBAN, E.; VOLONIMO, L. Business Intelligence e Suporte a Deciso. In:


Tecnologia da Informao para Gesto: em busca do melhor desempenho
estratgico e operacional. Porto Alegre: Bookman, 2013.
TURBAN, Efraim; RAINER JR., R. Kelly; POTTER, Richard E. Administrao de
tecnologia da informao: teoria e prtica. Rio de Janeiro: Campus, 2003.
VELTE, T; VEITE, A; ELSENPETER, R. C. Cloud Computing: a practical approach.
McGraw-Hill Osborne Media, 2009.

Vous aimerez peut-être aussi