Vous êtes sur la page 1sur 5

01/10/2018 Blog LabCisco: Afinal, O Que é Big Data?

Redes de Computadores e Telecomunicações

Início Downloads & Laboratórios Videoaulas

Membros no Facebook

Pesquisar no Blog

quinta-feira, 1 de agosto de 2013

Afinal, O Que é Big Data?


Olá Pessoal.

No último ano foram publicadas muitas notícias sobre o chamado Big Data, mas as dúvidas sobre o
que esse termo realmente quer dizer ainda continuam em alta, incomodando aqueles que lêem
essa palavra o tempo todo sem conseguir compreender sua magnitude. Um dos motivos dessa
dúvida é que a informação sobre esse assunto está muito pulverizada na própria Internet e Sua Conexão
diferentes autores têm sua interpretação pessoal, o que é normal e diria até que desejável, sobre as
IPv4
principais características que definem melhor esse termo.
201.18.239.186

IPv6
Nesse artigo trago um esforço para ajudar a organizar alguns dos principais conceitos diretamente not available
relacionados ao assunto, por isso fui buscar algumas definições na essência da origem do termo
labcisco.blogspot.com
Big Data! Sempre digo que é a partir da compreensão da origem das coisas que o processo de 92.06% / 7.94%
aprendizado fica mais natural. Aliás, não existe uma definição universal aceita pela academia e
indústria, motivo pelo qual esse artigo se torna ainda mais importante para ajudá-lo a formular sua Esse blog é acessível
própria interpretação do assunto! via IPv6. Se o globo
estiver girando, então
você também possui
conexão IPv6.

Fonte: Internet

Comprar o Livro de Cisco


A figura acima já é um clichê na Internet e nas revistas no que diz respeito a esse assunto. E não é
para menos, afinal no entorno do termo Big Data podemos encontrar várias palavras que
representam ferramentas/tecnologias de suporte ao "misterioso" Big Data, a exemplo de: Internet,
redes, informação, compartilhamento, busca, geranciamento, análise, software, negócios,
armazenamento, registro, sistemas e várias outras. O interessante é que, dependendo do perfil de
cada pessoa, é comum observarmos mais rapidamente aquelas palavras que têm relação direta
com o nosso cotidiano.

É claro que em um único artigo seria impossível definir detalhadamente todas essas ferramentas e

http://labcisco.blogspot.com/2013/08/afinal-o-que-e-big-data.html 1/5
01/10/2018 Blog LabCisco: Afinal, O Que é Big Data?
tecnologias que suportam o Big Data e, na realidade, nem é esse o objetivo. Então vamos tentar Comprar o Livro de IPv6
organizar melhor as idéias...

Em primeira análise, temos que destacar que Big Data está diretamente relacionado com a Internet
moldada pelo uso que fazemos dela atualmente e, é por isso que, em síntese, são as tecnologias
de computação em nuvem que suportam o Big Data, seja no contexto técnico da infraestrutura ou
na visão de negócios. Essa é uma primeira correlação importante para caminharmos adiante porque
mostra que Big Data ultrapassa os limites de uma única organização...

Em segunda análise, temos que entender o motivo pelo qual as empresas têm demonstrado tanto
interesse no Big Data. Essa é uma questão mais fácil de responder, afinal informação é crucial para
Comprar o Livro de Linux
subsidiar a estratégia de qualquer negócio! Até que haja algum critério para definir qual informação
é relevante para um negócio, ou seja, aquela que pode agregar valor de alguma forma, então
assumimos que toda informação pode ser útil. De forma bastante objetiva podemos afirmar que Big
Data é INFORMAÇÃO! Mas reparem que não estamos falando de qualquer informação, estamos
falando de muita informação gerada e consumida rapidamente!

Essa análise ainda está superficial, então nesse tocante surge outro conceito importante
relacionado ao Big Data, a mineração de dados (ou data mining). Esse é um conceito clássico na
Ciência da Computação que consiste, de maneira superficial, em métodos para realizar a extração
de informação útil em grandes volumes de dados! Uma analogia que está se consolidando e que
pode ajudar nesse entendimento é a seguinte: Atualizações no E-Mail

1) Pense no Big Data como um telescópio, afinal quando você observa através dele passa a ter a Email address... Submit
possibilidade de enxergar uma infinidade de coisas e tudo parece estar ali ao seu alcance, mas
como saber para onde olhar diante da imensidão do universo?
Arquivo de Postagens

2) Pense no Data Mining como um microscópio, afinal quando você observa através dele passa a ► 2018 (3)
focalizar sua visão nos detalhes de algo específico, ou seja, é esperado que você já saiba qual
► 2017 (13)
informação quer obter!
► 2016 (31)

Na realidade o data mining não é assim tão simples como a mera busca de dados, o conceito de ► 2015 (33)

mineração envolve complexos algoritmos para auxiliar no processo de identificação de padrões para ► 2014 (61)
obtenção de informação útil que possa agregar valor à parte interessada. Há toda uma linha de ▼ 2013 (80)
pesquisa na academia que envolve cientistas engajados no desenvolvimento dessas técnicas, ► Dezembro (5)
sejamos justos! ► Novembro (3)
► Outubro (4)
Observação: Enquanto que data mining faz referência às técnicas para extração de dados, o termo
► Setembro (6)
de negócios mais popular é Bussiness Inteligence (BI). O termo BI compreende, inclusive, outras
ferramentas além do data mining. ▼ Agosto (7)
Configuração de Cliente PPPoE
em Roteadores Cisco
Estamos evoluindo bem, mas antes de dar seguimento à nossa caminhada no entendimento do Big
Data, temos que fazer uma observação. É por envolver técnicas de mineração de dados que muitas Evento Cisco Academy Day
2013
vezes o Big Data é confundido com outro elemento clássico da computação: o Data Warehouse
(DW). Novos Labs de IPv6 no
Repositório do Blog

O Data Warehouse (cuja tradução literal seria armazém de dados) é um repositório consolidado de Modelo de Licenciamento do
Cisco IOS 15
uma organização e que armazena grande volume de dados (principalmente histórico) originados por
Cisco NetFlow na Classificação
fontes no contexto da própria organização. É agora que essa definição pode atrapalhar, afinal ela é do Tráfego em Fluxo...
muita similar ao conceito de Big Data visto até aqui! Então que tal apontar as diferenças entre as
Livro Oficial de IPv6 Disponível
duas coisas?
Afinal, O Que é Big Data?
A "novidade" do Big Data é que o comportamento do usuário no uso cotidiano que ele faz da ► Julho (7)
Internet irá refletir na geração de informações sobre o seu perfil! E essas informações também
► Junho (5)
serão armazenadas, mesmo que temporariamente, para "posterior" (quase imediata, observe as
► Maio (7)
aspas) consulta! Então repare que você, sem nenhum relacionamento direto com a orgnização,
também passa a ser fonte de informação a partir da Internet, por exemplo através da sua interação ► Abril (6)
nas redes sociais! ► Março (7)

► Fevereiro (11)
Outra forma de enxergar as diferenças é pensar que o Data Warehouse existe no contexto de uma
► Janeiro (12)
organização e foi devidamente projetado para atender seu propósito, enquanto que o Big Data é um
conceito mais amplo e abstrato que simplesmente acontece espontaneamente, afinal ele está aí ► 2012 (14)
crescendo desenfreadamente e não pode ser contido! As soluções de Big Data encontradas no
mercado são desenvolvidas para fazer a extração em volumes de dados aleatórios sem orgnização
estruturada (coletados da Internet), enquanto que o Data Warehouse é previamente projetado para
otimizar as posteriores buscas.

Seria ousadia minha, então, pensar que o Big Data poderia ser interpretado como o Data
Warehouse da "organização" Internet??? Na realidade eu mesmo discordo dessa afirmação, mas
esse é um bom exercício de reflexão! ;-) No final do exercício, qualquer que tenha sido sua
resposta, tenho certeza que o processo de reflexão foi de grande valia!

Como sugestão da material complementar, o vídeo abaixo foi produzido pela EMC², uma empresa
líder no mercado de Big Data e soluções de computação em nuvem. Achei conveniente trazê-lo
como apoio para essa discussão porque sua abordagem contribui com a proposta desse artigo.

Top Posts

Lançamento do Cisco Packet


Tracer 6.2.0

http://labcisco.blogspot.com/2013/08/afinal-o-que-e-big-data.html 2/5
01/10/2018 Blog LabCisco: Afinal, O Que é Big Data?

Interpretação dos
Resultados do
Ping

Wireshark na
Análise de Tráfego
e Protocolos em
Redes

Calculando Sub-
Redes de
Tamanho Variável
(VLSM)
Por fim, é importante destacar que a simples leitura desse artigo não é suficiente para esgotar o
assunto e nem tenho essa pretensão. A leitura de outros materiais é recomendada, até mesmo
porque a interpretação de outros autores pode apontar para uma direção diferente da minha Configuração de
abordagem e que, de alguma forma, seja mais adequada para alguns leitores do blog. Switch Multi-Layer
(Layer-3)

Abraço.

Samuel.
Lançamento do
Cisco Packet
Tracer 7.0
Postado por Samuel Henrique Bucke Brito às 00:41:00

Marcadores: Big-Data, Internet, Multimídia, Negócios

7 comentários: Status do IPv6

Anônimo 1 de agosto de 2013 01:44

Ou seja, Big Data, por si só, não é nada sem um Data Mining eficiente? É isto?

Responder

Respostas

Samuel Henrique Bucke Brito 1 de agosto de 2013 09:24

Olá Anônimo.

Sim, você está correto. De que adianta toda essa avalanche de dados se não conseguimos
extrair informação útil? É por isso que a maior preocupação das chamadas soluções comerciais
de Big Data consiste em métodos eficientes para obter informação.

Abraço.

Responder

Ricardo 1 de agosto de 2013 07:00

Caro Samuel, Status do IPv4

Achei bem interessante e didatica a sua conceituação, mas ainda tenho duvidas principalmente quando voce
faz um paralelismo entre Big Data e Datawarehouse. IPv4 Exhaustion
Counter
Imagine o seguinte cenário: uma maquina gerando dados de produção ( uma impressora 3D), que produz
▼Present Status (RIR)
material sob encomenda e recebe pedidos e manda dados de produção via um site da internet. Como
X-day and Reserved Blocks
podemos conceituar isso? Ou seria então o Big Data uma evolução natural do Datawarehouse?
(Remaining /8)
AfriNIC
Responder
May 23, 2019 0.91
APNIC
Respostas Apr 15, 2011 0.43
ARIN
Sep 24, 2015 0
Samuel Henrique Bucke Brito 1 de agosto de 2013 09:14
LACNIC
Olá Ricardo. Jun 10, 2014 0.24
RIPE NCC
O paralelismo que fiz entre Big Data e Data Warehouse foi justamente para chamar a atenção Sep 14, 2012 0.71

dos leitores de que são duas coisas distintas. Ou seja, o Big Data NÃO é uma evolução natural via IPv4
do Data Warehouse (DW). Essa dúvida é recorrente porque há vários artigos na Internet que
defendem essa abordagem de que um é a evolução do outro, algo que eu discordo!

Pense que o objetivo principal do DW é manter um repositório consolidado (unificado) da Registro de Acessos
empresa, principalmente com histórico, ou seja, dados relacionados com algo que já aconteceu
e que serão posteriormente analisados pela estratégia do negócio. O DW é cuidadosamente
projetado por especialistas para armazenar os dados de maneira organizada com o intuito de
3,036,020
otimizar o processo de extração da informação.

Por outro lado, o objetivo principal do Big Data é obter informação útil a partir de dados Busca por Palavra-Chave
armazenados em "tempo real" (espontâneos) e por isso esses dados não são estruturados, o
#PodeAcreditar (2)
que torna a aplicação de técnicas de extração de informação mais difícil! Ou seja, estamos
falando de muitos dados que são gerados e consumidos rapidamente. É por isso que dizemos 802.11 (10)

http://labcisco.blogspot.com/2013/08/afinal-o-que-e-big-data.html 3/5
01/10/2018 Blog LabCisco: Afinal, O Que é Big Data?
que as características mais marcantes do Big Data são: (i) quantidade e (ii) velocidade. 802.3 (4)
ACL (8)
Então pegando seu exemplo do e-commerce, a simples transação eletrônica é uma relação
ANSI/TIA-568-C (5)
direta entre cliente e empresa, o que não é caracterizado como Big Data. Essa transação gera
um pedido que representa um histórico sob a visão de negócios da empresa. ARP (1)
AS (12)
Por outro lado, se a empresa tem ferramentas para analisar o comportamento dos usuários Backup (3)
enquanto eles navegam pela sua página de e-commerce, é possível exibir para o usuário
Banco de Dados (1)
somente aqueles produtos que estejam alinhados ao seu perfil, então existe potencial real de
maximizar as vendas - isso é Big Data. BGP (11)
Big-Data (2)
Outro exemplo de Big Data no mesmo contexto do comércio eletrônico e que faz relação com a Blog (20)
produção: Se a empresa tem ferramentas para avaliar quais produtos estão sendo mais
BPDU (1)
acessados em seu e-commerce naquele momento, esse pode ser um indicativo de quais
produtos devem ser priorizados no ambiente da produção. Cabeamento (10)
Cat5e (3)
Então repare que os dados foram originados de maneira espontânea e as informações foram Cat6 (3)
consumidas praticamente no mesmo tempo em que foram geradas, por isso essas informações
Cat6A (2)
não são estruturadas. Esse é outro exemplo de Big Data.
Cat7 (2)
Abraço. CCNA (17)
CEF (1)

Responder Certificação (20)


CGI.br (8)
Cisco (126)
Classe D (3)
André 1 de agosto de 2013 20:21 CORE (3)
Tudo bem Samuel. Realmente poderiamos ficar como estamos hoje, a informação crescendo e os dados Desempenho (13)
sendo analisados, pesquisas encontrar em menos de meio segundo, mas quantidade de informação em DHCP (10)
todas as áreas não tem fim, a cada dia milhões de blogs postam info novas entre outros tipos de dados.
DHCP Snooping (1)
Com certeza essa área de desenvolvimento de algoritmo tem que ser bem remunerado, tem que ser criada
de uma forma a pensar no futuro, e não apenas como está hoje as informações, tem que se pensar na Disponibilidade (6)
expansão do dia a dia. Mas e pra conseguir extrair toda informação e mostrar o que mais é relevante ao DNS (4)
usuário. É fantástico e ao mesmo tempo abusivo você acessar um site e ele captar o que você procura e te Educação (12)
mostrar informações mais relevantes. Mas o exemplo do youtube é o mais interessante, pois ao procurar
EIGRP (3)
sobre um assunto já traz vários outros que você já abre em outra aba. E por aí vai, mas muito interessante
com certeza. Entrevista (1)
Errata (2)
Responder
Ether-Channel (3)
Ethernet (7)
Facebook (2)
Priscila 6 de setembro de 2013 23:42
Fibra Óptica (5)
Olá Samuel.
Firewall (5)

Na sua opinião, qual é a diferença entre Business Intelligence e Big Data? Física (1)
Fotos (2)
Responder
Gerenciamento (17)

Respostas GNS (9)


Governança (5)
Samuel Henrique Bucke Brito 7 de setembro de 2013 00:01 HTTP (1)
ICMPv6 (5)
Olá Priscila.
IEEE (14)
Não me considero um especialista da área para afirmar categorigamente isso ou aquilo nessa IETF (4)
discussão, mas no meu entendimento o BI (Business Intelligence) e BD (Big Data) são IGP (2)
ferramentas complementares. Até por conta disso pode ser que venham a convergir para uma
Informatize-se (1)
solução única!
Internet (42)
De maneira bem objetiva eu diria que a diferença entre os dois conceitos é que Big Data tem IOS (16)
mais relação com informações do presente (o que está acontecendo agora), enquanto que BI IoT (3)
tem relação com informações de eventos que já ocorreram (histórico).
IPSec (4)

Por conta dessa diferença a técnica de extração da informação é diferente em cada uma dessas IPv4 (29)
duas abordagens. No caso do BI o sistema é criteriosamente modelado para trabalhar naquilo IPv6 (56)
que já existe armazenado. No caso do Big Data é mais difícil o processo de modelagem porque ISP (4)
a ferramenta tem que lidar com um grande volume de dados gerados espontaneamente (agora). ISR (2)
Laboratório (97)
Certamente os especialistas nessa área (não é o meu caso) podem oferecer contribuições mais
valorosas! ;-) LACNIC (4)
LAN (6)
Abraço. Linux (34)
Livros (37)
Samuel.
Marco Civil da Internet (3)
MIB (1)
Microsoft (6)
Responder
Monitoramento (8)
MPLS (1)
Multicast (4)
Multimídia (6)
NAT (3)
NDP (1)
Negócios (2)
NetFlow (1)
NIC.br (31)
NMS (3)
Notícias (33)
NTP (2)
Ondas (1)
OSPF (3)

http://labcisco.blogspot.com/2013/08/afinal-o-que-e-big-data.html 4/5
01/10/2018 Blog LabCisco: Afinal, O Que é Big Data?
P&D (4)
Packet-Tracer (14)
Digite seu comentário...
Palestra (10)
Par-Trançado (1)
PIM-DM (2)
PIM-SM (2)
Comentar como: Cristiano Almei Sair Ping (1)
PoE (1)
Policing (2)
Publicar Visualizar Notifique-me Policy-Map (3)
PPP (3)
PSTN (1)
PTT (3)
QoS (5)
Rack (1)
Redes Convergentes (2)
Redistribuição (1)
Relay-Agent (1)
Postagem mais recente Página inicial Postagem mais antiga Restrição de Banda (1)
RFC (7)
Assinar: Postar comentários (Atom)
Rotas (2)
Roteamento (20)
Route-Map (4)
Route-Reflector (1)
SAMBA (2)
SDN (4)
Segurança (19)
Shaping (1)
SLA (5)
SNMP (2)
SSH (3)
STP (3)
Switch (21)
TACACS+ (1)
Telecomunicações (4)
Teleconferência (2)
Telefonia (3)
Telnet (2)
Terminal-Server (1)
TV (3)
UNIMEP (12)
Vídeo (19)
VLAN (6)
VLSM (1)
VoIP (3)
VPN (5)
VRF (2)
WAN (5)
WebEx (1)
Wireless (12)
Wireshark (3)
WLAN (10)

Prof. Samuel Henrique Bucke Brito. Tema Simples. Tecnologia do Blogger.

http://labcisco.blogspot.com/2013/08/afinal-o-que-e-big-data.html 5/5

Vous aimerez peut-être aussi