Vous êtes sur la page 1sur 38

BIG DATA

Cristian Cedillo Jiménez


ORIGENES
 18000 A.C. uso de palos y muescas de huesos para predecir
necesidades de comida y cuenta de provisiones
 Primer evidencia del interés por recopilar, contar y guardar
datos
ORIGENES
 Ábaco: realizar
cálculos

 Biblioteca de
alejandria, en la cual
se almacena el
conocimiento
ORIGENES
 Anticiteria: computadora mecánica de Grecia predecía

 posiciones astronómicas

 Marcar fechas exactas de los juegos Griegos

 1663: Jhon Graunt realiza el primer experimento de análisis de datos estadístico

 La peste bubónica en Europa.


ORIGENES
1926 Nikola Tesla: predice la tecnología inalámbrica tuvo la visión de que el planeta esta conectado, simplificando el uso del teléfono de tal forma que cada persona
 1865. Aparece por primera vez el término business intelligence, en la enciclopedia 

llevará uno en su bolsillo

comercial de Richard Millar Deven


ORIGENES
 1965 se proyecta el primer data center en Estados Unidos guarda
documentos de impuestos y huellas digitales en cintas magnéticas

 1989 Erick Larson habla por primera vez del Big


Data, su artículo esta en la revista Harpers
Magazine
ORIGENES
 El termino Big Data es analizado por primera vez en un
estudio académico. El propósito de la computación es el
entendimiento.
 2001 Laney de
Gartner define las 3
V’s del Big Data

 2005 se crea la web 2.0 con contenido


creado por el usuario.

 Se crea hadoop, entorno de trabajo de


Big Data de software libre.
ORIGENES
 2018
¿Big Data?
 Es como el sexo en la adolescencia:
 Todo el mundo habla de él
 Nadie sabe como hacerlo
 Todos creen que los demás lo están haciendo

 Todos dicen que lo hacen

Descripción: Macintosh
¿Big Data?

 Son datos (estructurados y no estructurados) que contienen una mayor variedad y que
se presentan en volúmenes crecientes y a una velocidad de crecimiento que dificulta su
captura, gestión procesamiento y análisis.
¿Big Data?
 Formada por conjuntos de datos de mayor tamaño y más complejos

 Procedentes de nuevas fuentes de datos

 Conjunto de datos muy voluminosos

 El software convencional no puede gestionarlos


 Datos masivos usados para abordar problemas empresariales
3V+2V= Big Data
 Doug Laney articuló la definición de big data en las tres V’s.
 Volumen: El tamaño si importa. Se deben manejar grandes cantidades de información,
esto dependerá de la organización, algunas tendrán la necesidad de almacenar
decenas de terabytes, para otras organizaciones pueden ser cientos de petabytes.
 Velocidad: Ritmo al que se reciben los datos, recordar que la mayor velocidad de los
datos normalmente se trasmiten directamente a la memoria, hoy en día los sensores,
etiquetas FID y la medición inteligente crean una necesidad de distribuir grandes
cantidades de datos en tiempo real.
 Variedad: hace referencia a los diversos tipos de datos disponibles, Big data presenta
datos no estructurados y semiestructurados lo cual hace más compleja la obtención de
datos, por ejemplo: audio, video, imagen y texto.
3V+2V = Big Data
 Recientemente han surgido otras dos V’s, las cuales son:
 Valor: Se refiere al valor intrinseco de cada dato, el cual tiene importancia cuando se
descubre ese dicho valor. El valor de la Big Data no solo proviene del análisis, también
se obtiene su valor de los usuarios empresariales y ejecutivos que plantean
cuestiones, identifican patrones, toman decisiones y predicen comportamientos.
 Veracidad: Se refiere a que tanto se puede confiar en un dato según su autenticidad.

3V + 2V = Big Data
¿Quién creo la Big Data?
 “En 2010 Eric Schmidt, entonces consejero delegado de Google, hizo una declaración memorable durante una
rueda de prensa en Abu Dabi: «Un día, en el curso de una conversación, caímos en la cuenta de que se podría
[utilizar los datos que tiene Google de sus usuarios] para predecir la evolución del mercado bursátil. Y después
decidimos que eso era ilegal. Así que dejamos de hacerlo”.

 Muchos autores coinciden en que Google originó la Big Data, con el estudio de Sanjay Ghemawat, Howard
Gobioff, and Shun-Tak Leung en la que explica su sistema de ficheros Google File System publicado en el 2003

 En el 2004 Google presentó el componente básico que forma parte de las plataformas de Big Data surguiendo
como un nuevo paradigma en procesamiento distribuido al que se le llamó Map & Reduce

 En el año 2006 los ingenieros de Apache Doug Couting y Mike Cafarella llevaron los paradigmas de Google a la
comunicación de la primer plataforma Big Data Open Source a la que llamaron Hadoop, el cal es la base de la
mayor parte de los sistemas Big Data.


¿Para qué? ¿Por qué?
 Big data proporciona respuestas a muchas preguntas que las empresas ni siquiera sabían que tenían,
proporcionan un punto de referencia con una cantidad grande de información, con esto las organizaciones
pueden identificar los problemas de una forma comprensible.

 Big Data permite obtener respuestas más completas, porque disponen de una gran cantidad de información

 Disponibilidad de respuestas más completas significa una mayor fiabilidad de datos

 El análisis de Big Data ayuda a las organizaciones a aprovechar los datos y usarlos para identificar nuevas
oportunidades.
IMPORTANCIA
 Reducción del coste

 Más rápido, mejor toma de decisiones

 Nuevos productos y servicios

 Determina la causa del origen de fallos, y defectos en tiempo real

 Recalcular portafolios de riesgos en minutos

 Detectar conducta fraudulenta antes de que afecte a la organización

 Tomas de decisiones inteligentes



¿Cómo funciona?
 Como ya sabemos Big Data obtiene datos estructurados y no estructurados
¿Cómo funciona?
 Los datos obtenidos se procesan, se les da algún formato y se almacenan
¿Cómo funciona?
 Los datos se cargan de forma distribuida, así datos con gran tamaño pueden ser distribuidos
entre varios procesadores.

¿Cómo funciona?
 Al darles una estructura su búsqueda y análisis de los datos se realiza a una mayor velocidad

¿Cómo funciona?
 Para analizarlos se usan algoritmos, la inteligencia artificial y modelos predictivos y prescrictivos
(define un conjunto de actividades, acciones, tareas y productos de trabajo requeridos para el
desarrollo de software de alta calidad)


¿Cómo funciona?
 Al final se extraen la forma de patrones de los datos en comportamientos, predicciones de compra o
identificación de nuevas oportunidades de negocio, entre otras cosas
IMPLEMENTACIÓN BIG DATA
 Implementación revolucionaria de Big data: consiste en que una empieza adopta por completo el Big Data para tomar decisiones en función de los datos
obtenidos, con esto las empresas están apostando todo a esta nueva tecnología.

 Ventajas:

 Se agilizan los procesamientos de la información, porque cada porción se maneja de manera más ágil

 Optimización de los recursos implica reducción de costes

 Flexibilidad de uso gracias al sistema de modos para calcular lo que se va a gastar y pagar solo o que se usa

 Desventajas:

 Altos costos en capacitación de personal

 Dificultad para encontrar personas con el perfil adecuado para trabajar con Big Data

 Mayor tiempo de adaptación


IMPLEMENTACIÓN BIG DATA
 Implementación del método evolutivo del Big Data: es preferido por empresas no tan pioneras a eta tecnología, pero que ya tienen un Business Intelligence bastante maduro. El método permite a las empresas hacer uso
de sus herramientas, pero la extracción de datos y la estructura será resuelta por Big Data.

 Ventajas:

 Los modelos se nutren con diversos datos

 Se multiplica el volumen de información que se obtiene gracias a Big Data

 Ahorro en tiempo de implementación como de costes

 Desventajas:

 La velocidad de extremo a extremo estará limitada por el BI

 El nivel de percepción no es tan amplio, ya que BI no tiene granularidad

 Esta solución solo es temporal por que el BI en un futuro ya no podrá con los requerimientos que se tengan en ese momento
IMPLEMENTACIÓN BIG DATA
 Alternativa híbrida a la implementación del Big Data: con este método se sugiere que el BI se use para determinado tipo de información y de análisis. Y el Big Data se encargara de datos no estructurados y mucho más refinados, como un análisis predictivos y simulaciones. El Big Data no solo es un anexo a BI,
también es una plataforma que sirve para hacer análisis avanzados.

 Ventajas:

 Precisión: los sistemas ahora se nutren con una información estructurada, antes solo se podía acceder por datos no estructurados

 Posibilidad de hacer un análisis predictivo

 El internet de las cosas que permite conocer en tiempo real todo lo que está sucediendo en cualquier parte

 Rentabilidad: Se ofrecen mejores servicios que también pueden cobrarse

 Desventajas:

 Resistencia de las empresas a no cambiar y avanzar tecnológicamente

 Dificultad: de quienes están acostumbrados a limitarse a un tipo de análisis


USOS DEL BIG DATA
 La NBA permiten que los equipos de basket ball tomen o no la
decisión de usar o no Big Data para formular estrategias que los
lleven a ganar.
USOS DEL BIG DATA
 La NFL cuenta con una plataforma analítica para que todos los equipos
tiene las mismas condiciones y oportunidades de aprovechamiento de
los datos. La plataforma ofrecen información como estadísticas
personales de cada jugador, condiciones de clima y del cesped, entre
otros datos.
USOS DEL BIG DATA
 Big Data se uso para que el ex presidente Obama sea reelegido
en el año 2012, con un equipo de 100 analistas divididos en
distintos puestos
 .
USOS DEL BIG DATA
 En el sector salud para recopilar datos de forma diaria de
historiales del paciente, dosis de medicación, informes de
estudios, con esto se aceleran los pasos hacia la evolución del
tratamiento
USOS DEL BIG DATA
 Banca y finanzas: BBVA esta volcando su sistema a Big Data
para ser capaces de segmentar mejor sus propuestas
USOS DEL BIG DATA
 Educación: las clases serían impartidas de otra forma ya que se
estudiará el entorno de cada estudiante para estipular un método
de aprendizaje personalizado.
 .
USOS DEL BIG DATA
 Agricultura: Big Data puede incluir los datos del clima, la
humedad, la cantidad del cultivo que se esta generando, entre
otros factores, también se pueden determinar las mejores
épocas para el cultivo.
USOS DEL BIG DATA
 Smart Cities: Esto trata de modificar la naturaleza de las ciudades para
convertirlas en urbes inteligentes, con el objetivo de aumentar la calidad de
vida de las personas, las cuales viven integradas con los datos, las decisiones
tomadas por el gobierno serán bien aceptadas por las personas ya que se
tiene la seguridad de que se realizó un análisis previo a esa decisión.
TECNOLOGÍAS DEL BIG DATA
Hadoop: es un proyecto Apache que engloba un conjunto de tecnologías software bajo un framework con licencia libre para la gestión de aplicaciones distribuidas, como el sistema de ficheros distribidos HDFS

MapReduce para procesamiento paralelo proporcionan un entorno perfecto para su tratamiento distribuido.

Herramientas:

ZooKeeper: Servidor para la coordinación de aplicaciones distribuidas.

HBase y Cassandra: Bases de datos NoSQL.

Pig y Hive: Proporcionan capas de abstracción de nivel superior para datos y consultas.

Mahout: Librería de aprendizaje automático para el descubrimiento de información en los datos.


BIG DATA GOVERNANCE
Es el gobierno de la información, ayuda a usar mucha más información del cliente y gestionarla de forma más eficaz, como se tiene acceso a más información de cada cliente es importante:

Tener en claro el origen de la información

Priorizar una versiones sobre otras y unos datos sobre otros

Determinar que información es necesario y cual no.

También se establece la veracidad de la información, se establecen reglas para identificar los objetivos, velar por una correcta aplicación de los datos, se deben estipular las métricas con las que se evalúan los resultados, se definen los niveles de importancia que ayudarán a estructurar la información y trabajar para garantizar la fiabilidad del dato.

Governance se encarga de:

Administrar datos

Establecer el ciclo de vida de cada dato

Descifrar el tiempo de interés de la información

Observar el cumplimiento de la legalidad vigente

Auditar para comprobar que todo es correcto


PRIVACIDAD DEL BIG DATA
Los avances tecnológicos de cualquier campo deben ser evaluados, de forma que se apoye su
progreso, pero también hay que saber frenar a tiempo para evitar darle impulso a situaciones que
atenten contra nuestros derechos o realidades deshumanizadas. Todo esto con el fin de evitar casos
como el de FaceBook o el holocausto de IBM.
BIBLIOGRAFÍA
 Big Data International Campus. (2018, 14 septiembre). El origen del Big Data. Recuperado 23 febrero, 2019, de https://www.campusbigdata.com/big-data-blog/item/106-origen-big-data

 Big Data qué es y por qué es importante. (2019, 1 enero). Recuperado 23 febrero, 2019, de https://www.sas.com/es_mx/insights/big-data/what-is-big-data.html

 Diferencias entre datos estructurados y no estructurados. (2017, 27 abril). Recuperado 23 febrero, 2019, de https://smarterworkspaces.kyocera.es/blog/diferencia-datos-estructurados-no-estructurados/

 Eduardo Valencia, E. V. (2017, 1 enero). ¿Qué es Big Data? la definición definitiva. Recuperado 23 febrero, 2019, de http://www.eduardovalencia.com/2015/09/que-es-big-data-la-definicion-definitiva.html

 Grupo IGN. (2017, 2 mayo). Historia del big data. Recuperado 23 febrero, 2019, de https://ignsl.es/historia-del-big-data/

 Nielsen, M. N. (2013, 7 septiembre). Big Data ¿a quién pertence? Recuperado 23 febrero, 2019, de https://www.bbvaopenmind.com/articulos/big-data-a-quien-pertenece/

 PowerData. (2017, 1 enero). Recuperado 23 febrero, 2019, de https://www.powerdata.es/big-data

 ¿Qué es Big Data? (2018, 1 enero). Recuperado 23 febrero, 2019, de https://www.oracle.com/mx/big-data/guide/what-is-big-data.html

 PowerData. (2018). Del bit... Al Big Data (Ed. rev.). Recuperado de https://www.powerdata.es/big-data

Vous aimerez peut-être aussi