Académique Documents
Professionnel Documents
Culture Documents
FEDERAL
DE
GOIS
ESCOLA
DE
ENGENHARIA
ELTRICA
E
DE
COMPUTAO
ESPECIALIZAO
NAS
TECNOLOGIAS
PARA
A
GESTO
DE
NEGCIOS
HTTP://WWW.GESTAODENEGOCIOS.EEEC.UFG.BR/
ATA
BIG
D
SIRLON
DINIZ
DE
CARVALHO
DR
sirlondiniz@gmail.com
BIBLIOGRAFIA
Mayer-Schnberger, Viktor; Kenneth, Cukier. Big Data: como extrair
volume, variedade, velocidade e valor da avalanche de informao
cotidiana. Rio de Janeiro: Elsevier, 2013.
Mahrt, M.; Scharkow, M. (2013) The Value of Big Data in Digital Media
Research. Journal of Broadcasting & Electronic Media, 57(1), 20-33.
Manyika J, Chui M, Brown B, Bughin J, Dobbs R, Roxburgh C, Byers AH
(2011) Big data: the next frontier for innovation, competition, and
productivity. McKinsey Global Institute. Disponvel em http://
www.mckinsey.com/insights/mgi/research/technology_and_innovation/
big_data_ the_next_frontier_for_innovation. Acesso em 2014-09-01.
Inmon, W. H., Como Construir o Data Warehouse, Campus, 1997.
Barbieri, Carlos. BI Business Intelligence Modelagem & Tecnologia.
Rio de Janeiro: Editora Axel Books, 2001.
Serra, L., A Essncia do Business Intelligence, Berkeley Brasil, 2002.
Kimball, Ross. "The Data Warehouse Toolkit: The Complete Guide to
Dimensional Modeling (Second Edition)", Wiley, 2002.
3
DETALHES
IMPORTANTES
CRONOGRAMA
Dia
Semana
Carga Horria
12/setembro/2014
Sexta
18:00 h 23:00 h
27/setembro/2014
Sbado
14:00 h 19:00 h
04/outubro/2014
Sbado
8:00 h 13:00 h
Total
15 horas
AVALIAO
Avaliao
processual
e
parHcipao
30%.
Avaliao
de
trabalhos
em
grupos
70%.
EMENTA
Dos sistemas transacionais tomada de deciso: estrutura de dados transacionais versus
dados para tomada de deciso. Fundamentos de Business Intelligence e sua implicao
no Big Data. Introduo ao conceito e tecnologias de informao associadas ao Big Data.
Estudos de casos. Redes Sociais. Conceitos de Dataficao e o Valor dos Dados. A
cadeia de valor em Big Data. A Anlise de Correlao e o Big Data. Riscos e Controle do
Big Data. Ferramentas de Big Data. NOSQL e sua aplicao no Big Data. Projeto de Big
Data.
4
PROGRAMA
Unidade I Dos Sistemas Transacionais
ao Big Data
Sistemas Transacionais e sua estrutura de
Dados;
C o n c e i t o d e B a n c o s d e D a d o s
Relacionais;
Dos Dados Transacionais ao Data
Warehouse (DW);
A construo do DW e suas implicaes
para a tomada de deciso;
Alm dos Dados Transacionais e do DW:
e-mails, informaes de trfego de rede,
redes sociais etc.;
O Big Data e a Business Intelligence;
O agora em Big Data: aplicaes e
estudos de Casos;
A impreciso dos dados (confuso):
nfase no todo e no no detalhe.
Unidade II Big Data: Volume, Variedade,
Velocidade e Valor
Os Vs do Big Data
Aceitando a Confuso: estudos de caso;
A causalidade: sem saber o porqu,
apenas o qu;
Sequncia Did[ca
10
11
12
BI Conceito
Exerccio
Leitura
de
Texto
Escrever
sobre
processos
de
tomada
de
deciso
Tempo:
15
minutos
16
17
Caracters[cas
de
um
DW
Orientado
a
assuntos:
vendas
de
produtos
a
diferentes
Hpos
de
clientes,
atendimentos
e
diagnsHcos
de
pacientes,
rendimento
de
estudantes.
18
DW Fundamentos
Conceitos
bsicos
Povoamento:
primeira
grande
carga
Carga:
alimentao
peridica
dos
dados
Periodicidade
de
cargas:
depende
do
assunto
Granularidade:
refere-se
ao
nvel
de
detalhe
Baixa
Prod.
A1
B1
A1
A1
Data
13/9/00
14/9/00
16/9/00
16/9/00
Qtde.
10
15
20
90
Alta
Valor
100,00
150,00
200,00
890,00
19
DW Conceitos bsicos
20
Data Warehouse
Orientados aplicao
Orientados a assuntos
Preciso Instantnea
Snapshots
Atualizveis
Volteis
Histricos
Dispersos em aplicaes
Integrados no DW
Acesso frequente
Acesso espordico
80
70
60
50
40
Transacional
30
DW
20
10
0
0
10
21
O Data Warehouse
22
DW
Abordagem
Organizacional
Sistemas Transacionais
Dados
Externos
Dados
Financeiros
Dados de
Manufatura
Dados de
Vendas
Infra-Estrutura de Acesso
Data Warehouse
Corporativo
DW Abordagem Organizacional
24
Data
Mart
Subconjunto
dos
dados
corporaHvos
Informaes
especcas
para
um
grupo
de
usurios
Esquemas
no
normalizados
Data Warehouse
Corporativo
Data Mart de
Marketing
Data Mart de
Finanas
Data Mart
de Vendas
25
26
DW Abordagem Organizacional
Vantagens
Evita
a
repeHo
de
extrao
Garante
uma
interpretao
padronizada
dos
dados
Facilidade
de
se
construir
novos
Data
Marts
Sistemas Transacionais
Dados
Externos
Desvantagens
Dados
Dados de
Financeiros Manufatura
Dados de
Vendas
Infra-Estrutura de Acesso
Data Warehouse
Corporativo
Alto
custo
Alto
risco
Data Mart de
Marketing
27
Dados
Operaciona
is
Data
Mart
Ferramentas Relacionais
Data
Mart
Ferramentas OLAP
Dados
Externos
Data
Mart
Aplicaes
28
Vantagens
Construo
rpida
Menor
custo
Menor
risco
Desvantagens
Extrao
repeHda
Diferenas
de
terminologia,
semnHca
e
formatos
Variedade
de
regras
de
transformao
Diculdade
de
integrao
29
DW
CORPORATIVO
DATA MART
30
DW - Integrao
Integrao de dados
Aplicao B
Aplicao A
Aplicao A
Aplicao B
Aplicao C
Aplicao C
Valor
atual,
2 anos
Valor
atual,
3 meses
Valor
atual,
1 ano
Valor atual,
6 meses
31
DW - Integrao
OPERACIONAL
Aplicao A: m,f
Aplicao B: 1,0
Aplicao C: masculino, feminino
sexo: m, f
caminho:
centmetros
descrio
Chave
char(12)
32
33
Desao
da
Extrao
Somente
a
extrao
dos
dados
leva
cerca
de
60%
das
horas
de
desenvolvimento
de
um
DW
(KIMBALL,
1998
apud
ABREU,
2007).
A
maior
parte
do
esforo
exigido
no
desenvolvimento
de
um
DW
consumido
neste
momento
e
no
incomum
que
oitenta
por
cento
de
todo
esforo
seja
empregado
no
processo
de
ETL,
(INMON,
1997
apud
ABREU,
2007)
A
extrao
afetada
pelo
ambiente
34
Desao
da
transformao
Subsequente
extrao,
esta
fase
no
s
transforma
os
dados,
mas
tambm
realiza
a
limpeza
dos
mesmos.
35
ETL: Transformao
Os
principais
;pos
de
conitos
estruturais
so
aqueles
de
domnio
de
atributo
que
se
caracterizam
pelo
uso
de
diferentes
;pos
de
dados
para
os
mesmos
campos.
Conitos
Tpicos
-
diferenas
de
Unidades:
centmetro,
polegada
Preciso:
quanHdade
de
casas
decimais
Cdigos
ou
expresses:
sexo
M/F
ou
0/1
Granularidade:
quando
horas
trabalhadas
correspondem
a
semana
ou
a
ms,
mesmo
mantendo
a
mesma
unidade
Abstrao:
quando
a
forma
de
estruturar
uma
mesma
informao
segue
critrios
diferentes
37
38
Vantagens
Controle:
se
voc
desenvolve,
voc
tem
controle
do
processo
Customizao:
o
cdigo
estar
disponvel
para
mudanas
Convergncia
com
a
plataforma
tecnolgica:
no
ser
necessrio
adquirir
hardware,
so{ware
ou
sistema
operacional
para
a
ETL
Convivncia
com
o
legado:
desenvolvimento
interno
se
adaptar
aos
sistemas
legados
e
no
o
contrrio
para
adaptar-se
s
cargas
Suporte:
a
construo
prpria
dispensa
contratos
de
suporte
e
manuteno
Debugao:
aHvidades
de
DEBUG
no
vo
se
deparar
com
uma
parte
no
"debugvel"
do
cdigo
-
cdigo
disponvel
39
Vantagens
Desenvolvimento
das
cargas:
em
ferramenta
de
ETL
muito
mais
fcil
e
rpido
Manuteno
das
cargas:
manuteno
mais
fcil
que
em
cdigo
Desempenho:
uHlizam
mtodos
mais
performHcos
para
trabalhar
com
grandes
volumes
Execuo
em
paralelo:
possuem
recursos
de
paralelizao
naHvos
e
facilmente
implementveis
Escalabilidade:
podem
ser
transferidas
de
servidor
mais
facilmente
e
at
eventualmente
distribuir
sua
carga
entre
vrios
servidores
40
Vantagens
Diversidade
de
conectores:
a
conexo
de
uma
ferramenta
de
ETL
com
mlHplas
fontes
de
dados
transparente
Separao
entre
funcionalidade
e
manipulao
de
dados:
j
possui
suas
funcionalidades
disponveis
(Lookup,
Merge,
Split,
Expresses
calculadas
etc.)
Reusabilidade:
uma
carga
normalmente
pode
ser
reaproveita
Reinicializao:
possuem
a
capacidade
de
reiniciar
a
carga
de
onde
pararam
Manuteno
de
Metadados:
metadados
so
gerados
e
manHdos
automaHcamente
41
Vantagens
Documentao:
possuem
mecanismos
de
documentao
Maior
garan[a
da
qualidade
dos
dados:
Ferramentas
de
ETL
podem
disponibilizar
meios
para
trabalhar
a
qualidade
dos
dados
atravs
de
algoritmos
complexos
(lgica
fuzzy,
IA
etc.)
Auditoria
&
Tracking:
permite
implementar
recursos
de
auditoria
e
tracking
para
conhecer
de
onde
veio
o
registro,
que
transformaes
sofreu
e
como
foi
carregado
Segurana:
permite
tornar
a
segurana
mais
modular
dividindo-
se
os
papis
(criao
de
cargas,
execuo
de
cargas,
agendamento
etc.)
42
Ferramentas de ETL
Centenas
disponveis:
kele.pentaho.org
Oracle
Warehouse
Builder
(OWB)
IBM
InformaHon
Server
(Data
Stage)
IntegraHon
Services
(SSIS)
Power
Center
(anHgo
Power
Mart)
43
Dados Externos
Dados
Externos
referem-se
a
dados
essenciais
para
a
tomada
de
deciso,
mas
que
no
fazem
parte
dos
dados
originados
dos
sistemas
transacionais.
Exemplos
de
Dados
Externos:
cotao
de
moeda
estrangeira,
situaes
de
catstrofe,
cenrio
de
mercado
etc.
Fonte
de
Dados
Externos:
revistas
especializadas,
jornais,
ndices
governamentais
etc.
44
Os Metadados: Conceito
45
46
Warehouse
VENDAS
ESTOQUE
47
Tempo
Linha de Produtos
48
Regio
Vendas
Sul
R$1.552M
Nordeste
R$1.732M
49
Trimestre
Sul
T1
R$ 377M
T2
R$ 368M
T3
R$ 423M
T4
R$ 384M
T1
R$ 427M
T2
R$ 418M
T3
R$ 453M
T4
R$ 434M
Nordeste
Vendas
50
Trimestre
Sul
T1
T2
T3
T4
Nordeste
T1
T2
T3
T4
Linha de Produtos
Padro
Especial
Padro
Especial
Padro
Especial
Padro
Especial
Padro
Especial
Padro
Especial
Padro
Especial
Padro
Especial
Vendas
R$ 250M
R$ 127M
R$ 225M
R$ 143M
R$ 275M
R$ 148M
R$ 253M
R$ 131M
R$ 280M
R$ 147M
R$ 255M
R$ 163M
R$ 305M
R$ 148M
R$ 283M
R$ 151M
51
Viso
MulHdimensional
Regio
Trimestre
Sul
T1
T2
T3
T4
Nordeste
T1
T2
T3
T4
Dimenses
Linha de Produtos
Padro
Especial
Padro
Especial
Padro
Especial
Padro
Especial
Padro
Especial
Padro
Especial
Padro
Especial
Padro
Especial
Vendas
R$ 250M
R$ 127M
R$ 225M
R$ 143M
R$ 275M
R$ 148M
R$ 253M
R$ 131M
R$ 280M
R$ 147M
R$ 255M
R$ 163M
R$ 305M
R$ 148M
R$ 283M
R$ 151M
Fatos
52
O
Esquema
Star
Data
Id Data
Dia
Ms
Trimestre
Ano
Tabelas de
Dimenso
Vendas
Id Loja
Id Data
Id Cliente
Id Produto
Quantidade
Valor
Cliente
Id Cliente
Codigo Cliente
Nome
Sobrenome
Endereo
Cidade
Estado
Pas
CEP
Id Loja
Nmero da Loja
Nome da Loja
Cidade
Estado
Pas
Telefone
Tabelas de
Dimenso
Produto
Id Produto
Cdigo Produto
Descrio
Categoria
Tabela de
Fatos
53
53
Tabela
de
Fatos
Contm
chaves
estrangeiras
das
tabelas
de
dimenso
Armazenam
os
nmeros
da
empresa
Cada
conjunto
de
fatos
baseado
na
interseo
de
cada
combinao
dos
atributos
dimensionais
Vendas
Id Loja
Id Data
Id Cliente
Id Produto
Quantidade
Valor
Atributos
Dimensionais
Fatos
54
Loja
Data
Id Data
Dia
Ms
Trimestre
Ano
Vendas
Cliente
Id Cliente
Codigo
Cliente
Nome
Sobrenome
Endereo
Cidade
Estado
Pas
CEP
Dimenso Clientes
Id Loja
Nmero da
Loja
Nome da Loja
Cidade
Estado
Pas
Telefone
Id Loja
Id Data
Id Cliente
Id Produto
Quantidade
Valor
Dimenso
Loja
Dimenso
Produto
Produto
Tabela de
Fatos
Id Produto
Cdigo Produto
Descrio
Categoria
55
55
Loja
Id Loja
Nmero da Loja
Nome da Loja
Id Cidade
Telefone
Vendas
Id Loja
Id Data
Id Cliente
Id Produto
Quantidade
Valor
Ms
Id Ms
Trimestre
Ano
Produto
Cliente
Id Cliente
Codigo Cliente
Nome
Sobrenome
Endereo
Cidade
CEP
Id Produto
Cdigo Produto
Descrio
Id Categoria
Cidade
Id Cidade
Estado
Pas
Categoria de Produto
Id Categoria
Descrio
56
Data
Id Data
Dia
Id Ms
Vendas
Loja
Id Loja
Nmero da Loja
Nome da Loja
Cidade
Estado
Pas
Telefone
Id Loja
Id Data
Id Cliente
Id Produto
Quantidade
Valor
Resumo_Mensal_Cat
Id Ms
Id Categoria
Quantidade_Total
Valor_Total
Cliente
Produto
Id Produto
Cdigo Produto
Descrio
Id Categoria
Categoria_Produto
Id Categoria
Cdigo Categoria
Descrio
Id Cliente
Codigo Cliente
Nome
Sobrenome
Endereo
Cidade
Estado
Pas
CEP
57
58
A Dimenso Tempo
Tipos
de
Ferramentas
MOLAP:
MulHdimensional
OLAP
ROLAP:
RelaHonal
OLAP
HOLAP:
Hybrid
OLAP
DOLAP:
Desktop
OLAP
60
Ferramentas OLAP
Dados
Operaciona
is
Warehouse
Data
Mart
Ferramentas OLAP
Dados
Externos
Matemtica
Heurstica
Estatstica
Inteligncia
Artificial
Diferenas
entre
- OLAP
- Data
Mining
Machine Learning
Business Application
Data Mining
62
Questes
Hcas
A
Informao
como
aHvo
da
empresa:
novo
conceito
Possibilidade
de
vendas
de
informao
E
as
novas
fontes
de
informao?
Para
onde
vamos?
Big
Data?
63
Denio
Existem
vrias,
mas
segundo
Mayer-Schnberger,
Big
data
se
refere
a
trabalhos
em
grande
escala
que
no
podem
ser
feitos
em
escala
menor,
para
extrair
novas
ideias
e
criar
novas
formas
de
valor
de
maneiras
que
alterem
os
mercados,
as
organizaes,
a
relao
entre
os
cidados
e
governos
etc.
Origem
do
nome
Big
Data
Cincias
como
astronomia
e
genmica
64
Caso
H1N1
CDCs
(Centro
de
Controle
de
Preveno
de
Doenas):
Dependia
de
resultado
de
exames
e
informaes
do
mdicos
Cenrio
defasado
em
01
ou
02
semanas
Google:
usou
dados
de
50
milhes
de
termos
de
busca
comuns
(histrico
de
2003
a
2008)
450
milhes
de
modelos
matemHcos
Combinao
de
45
termos,
num
modelo
matermHco
Encontrou
correlao
entre
previso
e
nmeros
ociais
Em
tempo
real
Sem
teste
de
saliva,
sem
atraso
65
67
68
Empresas
de
Internet
Google:
processa
24
petabyte/dia
Facebook
Recebe
mais
de
10
milhes
de
fotos/hora
CurHr
e
comentar:
3
bilhes/dia
Trilha
digital
construda
Youtube
800
milhes
de
usurios
>
1
hora
de
vdeo
criada
por
segundo
Twier
(2012):
400
milhes/dia
69
Quanto
h
de
informao?
Existem
vrios
estudos
MarHn
Hilbert,
da
Annenberg
School
for
CommunicaHon
and
Journalism,
CA,
EUA,
apresentou
um
Considerando
Livros,
imagens,
e-mails,
fotograas,
msica,
vdeo
(analgico
e
digital),
videogames,
ligaes
telefnicas,
cartas
e
sistemas
de
navegao
para
carros,
alm
de
televiso
e
rdio
Resultado:
em
2007
esHmou-se
300
hexabytes
(um
bilho
de
GB)
O
suciente
para
Se
impresso,
cobrir
os
EUA
com
52
camadas
Em
CD-ROMs
empilhados:
5
pilhas
at
a
lua
70
Big
Data
Inteligncia
ArHcial?
Aprendizado
de
mquina?
Ensinar
um
computador
a
pensar?
Na
verdade
est
mais
para
aplicao
de
matem;ca
a
enormes
quan;dades
de
dados
visando
prever
probabilidades!
71
72
Sequncia Did[ca
Os Vs do Big Data
Aceitando a Confuso: estudos de caso;
A causalidade: sem saber o porqu, apenas o qu;
Fundamentos de Correlao e sua relevncia para o Big Data;
A Dataficao: quantificao, tabulao e anlise;
Alm dos dados estruturados: o valor dos dados no
estruturados;
Valor dos dados: anlise de custo e benefcio;
Dados: reutilizao, recombinao, expanso e depreciao;
A cadeia de valor do Big Data: Informao, Especialista de
Dados, Pessoas e Empresas com mente Big Data;
Riscos do Big Data: Privacidade e Punies preditivas;
Big Data e normas de regulao.
73
3
ou
5
Vs
Volume:
grande,
crescimento
exponencial
e
s
vezes
subuHlizados
Velocidade:
tratamento
dos
dados
(obteno,
gravao,
atualizao
etc.)
deve
ser
rpido
-
muitas
vezes
em
tempo
real
Variedade:
diversidade
de
informaes
(Estruturados
-
Bancos
de
Dados,
DWs,
No
Estruturados
-
documentos,
imagens,
udios,
vdeos
etc.)
74
3
ou
5
Vs
Veracidade:
dados
conveis,
garanHr
o
mximo
possvel
a
consistncia
dos
dados?
Valor:
os
resultados
devem
trazer
benewcios
signicaHvos
e
que
compensem
o
invesHmento?
75
76
Case
vinhedo
Medir
a
temperatura
com
um
nico
sensor
o Tem
que
ser
preciso
o No
permite
confuso
Medir
a
temperatura
com
um
sensor
a
cada
100
parreiras
o Pode-se
usar
sensores
mais
baratos
(no
tendenciosos)
o Alguns
podem
apresentar
confuso
o Mas
a
soma
mais
abrangente
o Mudar
de
uma
medida
por
minuto
para
10
ou
100/segundo
o Volume
versus
perda
77
79
Aceitando a causalidade
A causalidade
Correlao
Fundamento
esta|s[co
Tenta
determinar
como
uma
varivel
se
relaciona
com
outras
variveis
da
mesma
populao
Tenta
medir
quanto
e
de
que
maneira
se
relacionam
duas
variveis
Exemplos:
o Frio
e
setor
farmacuHco
o Dia
das
mes
e
o
comrcio
o Energia
eltrica
e
temperatura
etc.
o Grco
de
disperso
auxilia
83
Correlao
84
Correlao
85
Correlao
A
correlao
Medida
padronizada
da
relao
entre
duas
variveis
Pode
ser
calculada
da
covarincia
A
raiz
evita
diviso
por
zeros
Intervalo
entre
um
e
menos
um
(1
e
-1)
Correlao
prxima
a
zero:
as
variveis
no
esto
relacionadas
Ou
86
Correlao
A
correlao
PosiHva:
indica
que
as
duas
variveis
movem
juntas
NegaHva:
as
duas
variveis
movem-se
em
direes
opostas
Propriedades:
Se
X
e
Y
so
iguais
(mesma
varivel):
r
igual
a
1
Permuta
das
variveis
(mantendo-se
os
dados):
no
altera
r
87
Correlao
88
Correlao
Cases
Amazon
o Editores
e
as
dicas
de
leituras
o Modelos
automaHzados
Walmart
o 2
milhes
de
funcionrios,
vendas
US$
450
bilhes
(maior
que
PIB
de
de
pases
do
mundo)
o Aviso
de
furaco
e
Pop-Tarts
o Barbie
e
Chocolate
etc.
Target
Previso
de
gravidez
e
cupons
via
correio
Felicidade
e
renda
O
m
da
teoria?
89
Exerccios
90
Datacao
91
Datacao
NOSQL
Criado
por
Carlo
Strozzi
em
1998:
BD
relacional
cdigo
aberto
mas
sem
SQL
DisHnto
do
modelo
relacional:
o
termo
noRel
caria
melhor
Ressurgiu
em
2009:
Rackspace
evento
sobre
BD
Open
Source
e
Distribudos
Termo
se
refere
a
diferentes
sistemas
de
BDs
no
estruturados
Buscam
performance
superior
e
de
alta
escalabilidade
Facilidade
para
distribuio
horizontal:
mais
dados
mais
servidores
Todas
informaes
agrupadas
no
mesmo
registro
Mais
tolerantes
a
erros
Ideal
para
BDs
Transacionais?
94
Reu[lizao
e
recombinao
ReuHlizao:
dados
de
uso
primrio
uHlizados
para
outros
ns
o Dados
das
buscas:
corretor
ortogrco
o Amazon
extraiu
preferncia
de
usurios
da
AOL
o Reconhecimento
de
voz:
Google
versus
Nuance
o SWIFT:
prever
PIB
a
parHr
de
transferncias
internacionais
o Operadora
de
Celular:
dados
de
localizao
annimos
Recombinao:
combinar
fontes
de
dados
diferentes
Uso
de
Celular
e
Cncer
(Dinamarca):
3,8
milhes
de
dados
Zillow
(Ramo
imobilirio):
informaes
de
imveis
+
preos
+
mapas
para
prever
valores
96
Expanso
e
depreciao
Expanso:
dados
adequados
a
vrios
usos
o Cmeras:
segurana
e
uxo
de
clientes
o Street
View:
fotos,
dados
de
GPS
(autopiloto),
nomes
de
redes
WiFi
(especula-se
que
at
dados)
dois
pelo
preo
de
um
Depreciao:
perda
de
uHlidade
com
o
tempo
o Desao
de
separar
dados
teis
ou
manter
todos
o NSA
mantem
dados
do
maior
nmero
possvel
Uso
exausHvo
dos
dados
Case
corretor:
Yahoo
pensou,
Google
agiu
(veio
de
graa)
Treinamento
de
voz:
aprendizado
recursivo
Gostamos
de
aprender
com
bancos
de
dados
enormes
e
barulhentos
funcionrio
Google
97
Informao
Dados
da
empresa
auxiliam
na
denio
do
seu
valor
contbil
Bancos
e
a
Terceirizao
de
cartes:
qual
o
custo?
Mastercard
analisa
65
bilhes
de
transaes
de
1,5
bilho
de
clientes
em
210
pases
e
at
vende
informaes
Capaz
de
descobrir:
encher
tanque
16h,
gastar
de
US$
35,00
a
US$
50,00
na
prxima
hora
(em
mercearia
ou
restaurante)
Sensores
sem
o
em
nibus
pblico
para
prever
quebras
o Diminuiu
o
custo
em
at
10%
o Possibilitou
a
subsHtuio
de
uma
pea
com
450
mil
Km
(antes
era
com
320
ou
400
mil):
economia
de
mais
de
US$
1
mil/veculo
Origem
da
informao
irrelevante:
mdia
e
dados
98
Especialista
de
Dados
Ganha
bem,
trabalha
duro
e
entrega
o
diamante
para
o
dono
Ideias
e
habilidades
so
acessrios:
o
valor
recai
sobre
os
dados
Valor
migrou:
conhecimento
ideia
dados
Morte
do
especialista?
Pioneiros
tem
origem
externa
ao
seu
domnio:
especialista
em
anlise
de
dados,
IA,
matemHca,
estatsHca
etc.
Piada
Microso{:
a
qualidade
das
tradues
aumenta
sempre
que
um
linguista
deixa
a
equipe
Grupo
Google
capaz
de
traduzir
para
idiomas
que
no
dominam
99
101
Regulao
rea
nova,
ainda
no
h
regulao
especca
Como
invesHgar?
Quem
capaz?
Algoritmistas,
a
nova
prosso?
o Algoritmistas
externos
e
internos
Governos
tambm
devem
ser
regulados?
Big
data
altera
autocontrole
da
sociedade?
Para
onde
vamos?
103
A[vidades de Avaliao
Sequncia Did[ca
105
106
Estruturados
No Estruturados
107
108
110
112
Estrutura
Tradicional
Custo
j
conhecido
ETLs
especcas
Conhecimentos
do
negcio
Tempo
e
custo
elevados
Dados
estruturados
e
no
estruturados
no
necessariamente
integrados
Carga
de
dados
Banco
de
Dados
para
o
Big
Data
114
115
116
ATA
BIG
D
SIRLON
DINIZ
DE
CARVALHO
DR
sirlondiniz@gmail.com
117