Vous êtes sur la page 1sur 13

Base de Datos II Ing.

Sistemas y Telemática

“Año del Diálogo y Reconciliación Nacional”

Tema: Big Data

Docente: Ing. Marco Aurelio Porro Chulli

Curso: Base de Datos II.

Carrera: Ingeniería de Sistemas y Telemática

Ciclo: VIII – B

Integrantes:
• Mego Saavedra Lucy.
• Rivera Salazar Rosaliny Yonely.

AMAZONAS – UTCUBAMBA - BAGUA GRANDE

2018

Pág. 1 Ing. Marco Aurelio Porro Chulli


Base de Datos II Ing. Sistemas y Telemática

Índice

1. Contenido ......................................................................................................... 3
1.1 Definición: .............................................................................................................. 3
1.2 Características: ..................................................................................................... 4
1.3 Funcionamiento: ................................................................................................... 5
1.4 Principales fuentes de datos: ........................................................................... 6
1.5 Ejemplos: ................................................................................................................ 6
2. Resumen:.......................................................................................................... 7
3. Summary: ......................................................................................................... 8
4. Recomendaciones: .......................................................................................... 8
5. Conclusiones: .................................................................................................. 9
6. Apreciación del Equipo: ................................................................................ 10
7. Glosario de Términos: ................................................................................... 12
8. Linkografía: .................................................................................................... 13

BIG DATA

Pág. 2 Ing. Marco Aurelio Porro Chulli


Base de Datos II Ing. Sistemas y Telemática

1. Contenido

1.1 Definición:

Big data o macrodatos es un término que hace referencia a una cantidad de


datos tal que supera la capacidad del software convencional para ser capturados,
administrados y procesados en un tiempo razonable. El término de "Big Data" o
"Macrodatos", es muy conocido en la actualidad gracias a las empresas de
marketing, la mayoría de la población que usa internet frecuentemente cree que
es una nueva tecnología, teniendo en cuenta que existe desde hace unos 12
años, fecha que coincide con la aparición masiva de datos en internet. El límite
superior de procesamiento ha ido creciendo a lo largo de los años.

Los datos siempre han existido y siempre ha habido una necesidad de


almacenamiento, procesamiento y administración de datos, desde el comienzo
de la civilización humana y las sociedades humanas. Sin embargo, la cantidad y
el tipo de datos capturados, almacenados, procesados y administrados
dependían entonces e incluso ahora de varios factores, incluida la necesidad
sentida por los humanos, herramientas y tecnologías disponibles para
almacenamiento, procesamiento, administración, esfuerzo y costo, capacidad de
obtener información en los datos, toma decisiones, etc.

Big Data es el avance tecnológico enfocado en el entendimiento y toma de


decisiones, además de ser una metodología para almacenar y procesar datos,
estructurados o semiestructurados, los cuales serían muy difícil de almacenar en
una base de datos y posteriormente analizarlos. Este término es empleado para
referirse a toda aquella información que es excesivamente grande. Pongamos
como punto de referencia todos los boletos y los premios entregados de la
administración de lotería nacional a lo largo de toda su historia, que se puede
almacenar fácilmente en una base de datos, pero no lo suficientemente grande
como para ser considerada Big Data. Se ha definido también como datos lo
suficientemente masivos como para poner de relieve cuestiones y
preocupaciones en torno a la efectividad del anonimato desde una perspectiva
más práctica que teórica.

Pág. 3 Ing. Marco Aurelio Porro Chulli


Base de Datos II Ing. Sistemas y Telemática

1.2 Características:

¿Cuándo decimos que estamos tratando con Big Data? Para algunas personas,
1TB puede parecer grande, para otros 10TB pueden ser grandes, para otros
100GB pueden ser grandes, y algo más para otros. Este término es cualitativo y
realmente no se puede cuantificar. Por lo tanto, identificamos Big Data por unas
pocas características que son específicas de Big Data. Los macrodatos se
pueden describir por las siguientes características:

 Volumen: La cantidad de datos generados y guardado. El tamaño de los datos


determina el valor y entendimiento potencial, y si los puede considerar como
auténticos macrodatos. Los volúmenes de información disponible actualmente
suponen retos técnicos y analíticos singulares.

 Variedad: El tipo y naturaleza de los datos para ayudar a las personas a


analizar los datos y usar los resultados de forma eficaz. Los macrodatos usan
textos imágenes, audio y vídeo. También completan pedazos pedidos a través
de la fusión de datos. Día a día, se crean cantidades de datos, de múltiples
fuentes y diversos formatos, desde estructurados hasta información no
estructurada en forma de documentos, vídeos, correos electrónicos
provenientes de telefonía móvil, redes sociales, entradas de un blog.

 Velocidad: en este contexto, la velocidad a la cual se generan y procesan los


datos para cumplir las exigencias y desafíos de su análisis.

 Veracidad: La calidad de los datos capturados puede variar mucho y así


afectar a los resultados del análisis, una gran parte de los datos provienen de
social media, aunque mucha gente cree que todos los datos que usamos son
de redes sociales, cosa que es totalmente falsa, una gran parte viene de ahí.
Desde mi punto de vista, esta V se refiere tanto a la calidad del dato como a su
predictibilidad. La variedad afecta a la veracidad: la veracidad es la variable
menos uniforme a lo largo de los distintos tipos de dato que manejamos.

Pág. 4 Ing. Marco Aurelio Porro Chulli


Base de Datos II Ing. Sistemas y Telemática

1.3 Funcionamiento:

Con nuevas herramientas que se ocupan de todo el ciclo de administración de


datos, las tecnologías de big data hacen que resulte técnica y económicamente
viable no solo recopilar y almacenar conjuntos grandes de datos, sino también
analizarlos para descubrir información nueva y valiosa. En la mayoría de los
casos, el procedimiento de los datos sigue un flujo de datos como son:

 Recopilar: Recopilar los datos sin procesar, como transacciones, registros,


dispositivos móviles y más, es el primer desafío de big data al que se
enfrentan las empresas. Una plataforma de big data adecuada facilita este
paso y permite a los desarrolladores la recepción de una gran variedad de
datos, tanto estructurados como no estructurados, a cualquier velocidad, ya
sea en tiempo real o en lotes.

 Almacenar: Cualquier plataforma de big data necesita un repositorio seguro,


escalable y duradero donde almacenar los datos antes o incluso después de
procesarlos. Dependiendo de sus requisitos específicos, también podría
necesitar almacenes temporales para los datos en tránsito.

 Procesar y analizar: En este paso, los datos se transforman de datos sin


procesar a datos consumibles, normalmente al clasificar, acumular, unir e
incluso realizar funciones y algoritmos más avanzados. Los conjuntos de
datos resultantes se almacenan para procesarlos todavía más o para que se
encuentren disponibles para su consumo mediante herramientas de
visualización de datos e inteligencia empresarial.

 Consumir y visualizar: El objetivo de los big data consiste en obtener


información procesable y valiosa a partir de los recursos de datos. Lo ideal es
que las partes interesadas puedan acceder a los datos mediante herramientas
ágiles de visualización de datos e inteligencia empresarial de autoservicio que
les permitan explorar los conjuntos de datos de forma rápida y sencilla.
Dependiendo del tipo de análisis, los usuarios finales también podrían
consumir los datos resultantes como "predicciones" estadísticas (en el caso
del análisis predictivo) o como acciones recomendadas (en el caso del
análisis prescriptivo).

Pág. 5 Ing. Marco Aurelio Porro Chulli


Base de Datos II Ing. Sistemas y Telemática

1.4 Principales fuentes de datos:

❖ Redes sociales y medios de comunicación:


✓ 700 millones de usuarios de Facebook, 250 millones de usuarios de
Twitter y 156 millones de blogs públicos.

❖ Dispositivos móviles:
✓ Más de 5 mil millones de teléfonos móviles en uso en todo el mundo.

❖ Transacciones en Internet:
✓ Miles de millones de compras en línea, operaciones de bolsa y otras
transacciones ocurren todos los días.

❖ Dispositivos de red y sensores:


✓ Datos en la nube.

1.5 Ejemplos:

a) El almacén de datos tradicional de la empresa de marketing de Luca.

Pág. 6 Ing. Marco Aurelio Porro Chulli


Base de Datos II Ing. Sistemas y Telemática

b) Pasos de Procesamiento de la ejecución de consultas relacionales de Big


Data.

1. Consultas SQL enviadas al nodo de control.

2. El nodo de control crea plan de ejecución de la consulta.

3. El plan de consulta crea consultas distribuidas para su ejecución en cada


nodo de cómputo.

4. Las consultas distribuidas enviados nodos en de cálculo (todos corriendo


en paralelo).

5. El nodo de control recoge los resultados de la consulta y los devuelve al


usuario.

2. Resumen:

Big Data se ha convertido en una tendencia a nivel mundial y aunque aún no cuenta
con un concepto científico o académico consensuado, se augura cada día mayor
crecimiento del mercado que lo envuelve y de las áreas de investigación asociadas.
En este artículo se reporta una exploración de literatura sobre Big Data, que
comprende un estado del arte de las técnicas y tecnologías asociadas a Big Data,
las cuales abarcan captura, procesamiento, análisis y visualización de datos.
Se exploran también las características, fortalezas, debilidades y oportunidades de
algunas aplicaciones y modelos que incluyen Big Data, principalmente para el
soporte al modelado de datos, análisis y minería de datos. Asimismo, se introducen
algunas de las tendencias futuras para el desarrollo de Big Data por medio de la
definición de aspectos básicos, alcance e importancia de cada una.
La metodología empleada para la exploración incluye la aplicación de dos
estrategias, una primera corresponde a un análisis cienciométrico; y la segunda, una
categorización de documentos por medio de una herramienta web de apoyo a los
procesos de revisión literaria. Como resultados se obtiene una síntesis y
conclusiones en torno a la temática y se plantean posibles escenarios para trabajos
investigativos en el campo de dominio.

Pág. 7 Ing. Marco Aurelio Porro Chulli


Base de Datos II Ing. Sistemas y Telemática

Los científicos con cierta regularidad encuentran límites en el análisis debido a la


gran cantidad de datos en ciertas áreas, tales como la meteorología, la genómica,
la conectómica, las complejas simulaciones de procesos físicos y las investigaciones
relacionadas con los procesos biológicos y ambientales, Las limitaciones también
afectan a los motores de búsqueda en internet, a los sistemas finanzas y a
la informática de negocios.

3. Summary:

Big Data has become a worldwide trend and although it does not yet have a
consensual scientific or academic concept, every day greater growth is expected of
the market that surrounds it and of the associated research areas. This article reports
an exploration of literature on Big Data, which includes a state of the art of techniques
and technologies associated with Big Data, which include capture, processing,
analysis and visualization of data.
The characteristics, strengths, weaknesses and opportunities of some applications
and models that include Big Data are also explored, mainly for the support of data
modeling, analysis and data mining. Likewise, some of the future trends for the
development of Big Data are introduced through the definition of basic aspects, scope
and importance of each one.
The methodology used for the exploration includes the application of two strategies,
a first corresponds to a scientometric analysis; and the second, a categorization of
documents through a web tool to support literary revision processes. As results, a
synthesis and conclusions about the subject are obtained and possible scenarios for
investigative work in the domain field are proposed.
Scientists with some regularity find limits in the analysis due to the large amount of
data in certain areas, such as meteorology, genomics, connectomics, complex
simulations of physical processes and investigations related to biological and
environmental processes. Limitations also affect search engines on the internet,
finance systems and business computing.

4. Recomendaciones:

➢ Una de las tareas principales de los expertos en BIG DATA es el análisis de las
necesidades relacionadas con la explotación de datos, ya que los sistemas BIG
DATA permiten el tratamiento y análisis de enormes depósitos de datos, tan
desproporcionadamente grandes, que resulta imposible tratarlos con las
herramientas de bases de datos y analíticas convencionales.

➢ El elevado volumen de datos procedentes de páginas web, aplicaciones de


imagen y vídeo, redes sociales, dispositivos móviles, sensores, requiere de
sistemas potentes que permitan su gestión para fines muy diversos: análisis de
negocios, de datos sobre enfermedades infecciosas, de comercialización de
productos, etc.

Pág. 8 Ing. Marco Aurelio Porro Chulli


Base de Datos II Ing. Sistemas y Telemática

➢ El trabajo que realizan los expertos en BIG DATA sirve para ayudar a la toma de
decisiones de otros profesionales entorno a la seguridad, la optimización de
recursos en el caso de mantenimientos, la predicción de consumo y gasto.

➢ Big Data tiene importantes cualidades distintivas que lo diferencian de los datos
corporativos "tradicionales"; los datos no son centralizadas, muy estructurados y
de fácil manejo, ahora más que nunca los datos están muy dispersos, poco
estructurados (o no tiene estructura en absoluto), y cada vez más con volúmenes
más grandes.

➢ El Big Data evoluciona muy rápido ya que cada vez disponemos de más fuentes
y recursos de las que extraer datos. Por ello, las empresas necesitan a
especialistas que sean capaces de digerir los datos, convertirlos en información y
seleccionar cuál es útil y cuál no.

5. Conclusiones:

 BIG DATA no es sólo una herramienta o una tecnología si no un conductor de una


disciplina de toma de decisiones mejorada basada en análisis predictivos, que
marca el comienzo de una era de cambio cultural y mejora del rendimiento. La
experiencia del usuario será clave, no sólo en la venta de servicios, sino también
en los productos.

 Con BIG DATA la venta de productos o servicios podrá diferenciarse haciendo que
el consumo de los mismos suponga una experiencia personalizada para los gustos
y preferencias de cada cliente. BIG DATA nos permitirá llevar a cabo la gestión de
emociones a la hora de enriquecer el consumo de los productos y servicios.

 BIG DATA no es una actividad aislada. Para el éxito se necesita más que nunca
el conocimiento del negocio que permita hacer las preguntas correctas y
establecer las correlaciones oportunas.

 Sin duda alguna, uno de los retos de BIG DATA es incorporar a su capacidad
analítica, información de contexto que permita adaptar y comprender el resultado
del análisis en base a las condiciones del entorno. Para ello, el verdadero
conocimiento será aquel que incorpore los atributos de entorno que contextualicen
el análisis.

 BIG DATA es un sistema genérico que debe tratar una gran cantidad de datos y
que le hace falta integrar muchas herramientas para que sea lo que dice su
nombre, dependiendo de la cantidad de datos, su tipo, relación entre los mismos,
modelos y algoritmos a ejecutar.

Pág. 9 Ing. Marco Aurelio Porro Chulli


Base de Datos II Ing. Sistemas y Telemática

6. Apreciación del Equipo:

➢ Los propietarios de pequeñas empresas pueden probar la analítica de big data y


ver los beneficios por sí solos. De esta forma los gerentes pueden emprender el
camino y cosechar los frutos: Identificar sus desafíos. Comprender la oportunidad
que big data que puede presentarle a su compañía; fijar algunos objetivos, tales
como ahorrar costos, aumentar el retorno de la inversión, crecer o expandirse.

Los datos comienzan por ver los datos que su organización está creando y
entender de dónde vienen, incluso de redes sociales, actividades de negocio y
aplicaciones de software para ventas o marketing. Conocer con qué elementos
cuenta para trabajar es un paso crítico.

Identificar la información que es más útil. Sobre la base de los datos que su
organización ya está generando, descubra qué tipos de información tendrán más
impacto en su negocio. Considere estas preguntas: ¿Investigar el sentimiento de
los clientes en las redes sociales ayudaría a mejorar el desarrollo de productos y
la atención al cliente? ¿Puede usar datos de ventas y marketing para mejorar el
crecimiento y los ingresos? Concentrarse en sus clientes.

Históricamente, el foco principal de TI se puso en la automatización y en el ahorro


de costos en sistemas de registro. Hoy, el foco está mutando hacia los sistemas
de interacción. Al sumergirse en sus datos, piense cómo impulsar el crecimiento
de ingresos utilizando datos para encontrar nuevos clientes y asociados.

Elegir la tecnología correcta a la medida de las necesidades de su organización


será crucial para el éxito en analítica de datos de su compañía. Hay versiones
gratuitas de soluciones potentes disponibles hoy que le permiten darse una buena
idea de las características, para tener una apreciación de lo que pueden hacer.
Estos atributos a menudo proporcionan beneficios suficientes como para marcar
una diferencia de inmediato.

Considerar usar la nube, el auge de la nube está teniendo un impacto significativo,


lo cual pone a las tecnologías de analítica de big data al alcance de las pequeñas
empresas y los nuevos emprendimientos. Colocar data big en la nube implica
mínimos costos y requisitos de infraestructura. Puede bajar costos y redirigir el
ahorro resultante al desarrollo de productos y al servicio al cliente, y al mismo
tiempo extraer valiosos conocimientos para su negocio.

Los big data se vuelven rápidos y simples. Las organizaciones aprovechan los
mares de datos desde un comienzo para obtener el máximo rendimiento; la
arquitectura informática evoluciona hacia un marco de trabajo en el que la “talla
única” deja de ser el estándar. Ni volumen ni velocidad: la variedad será lo que
impulse las inversiones en big data. Spark y el aprendizaje automático dinamizan
el mundo de los big data. La preparación de datos de autoservicio se vuelve una
tendencia dominante a medida que los usuarios finales comienzan a dar forma a
los big data.

Pág. 10 Ing. Marco Aurelio Porro Chulli


Base de Datos II Ing. Sistemas y Telemática

➢ BIG DATA es un concepto que hace referencia a grandes cantidades de


información, disponibles en diversos formatos y tipos de estructuras, recopilada
principalmente a través de Internet mediante la interacción de los usuarios de
computadores, teléfonos móviles y dispositivos GPS, entre otros. Cuando
navegamos en la web muchos de nuestros datos son recabados para distintos
objetos, la Big Data es información estadística que crea perfiles para mandar
información específica a nosotros los usuarios de acuerdo a nuestro estilo de vida.

BIG Data está en todas partes y cada día se crean más aplicaciones para
aprovechar su valor y enriquecer tanto nuestra vida personal como profesional de
diversas formas, big data nace se ha visto acelerado en gran medida por ello
muchos como los conocimientos de los datos científicos por otra parte este
desborde ha llevado a que se produzca algunos cambios sociales y económicos
muy positivos para la sociedad; el big data está impulsado por las propiedades de
la nube de hecho son los atributos de la nube con economías de escala, la
rentabilidad para las masas, la capacidad y agilidad de extensión lo que nos
permite crear big data y vencer sus retos. A su vez las altas demandas de big data
motivan la creación de futuros diseños mejoras y expansiones de la nube todo en
un ciclo interminable que permite el avance de ambos.

Big Data se trata en realidad de cualquier atributo uno de ellos es el tamaño, que
representa un reto para las limitaciones de las funcionalidades de los sistemas o
de las necesidades de un negocio, otro aspecto interesante de big data tienen un
formato bien definido como las transacciones de una base de datos donde cada
entrada puede dividirse en campos cada uno con un tipo de datos bien definidos
y comprendido es posible que algunos big data solo sea una colección de entradas
de blog que contienen texto, tablas, imágenes, voy y video todo guardado en el
mismo almacenamiento de datos, esto nos lleva al aspecto final de big data la
diversidad de generación de interconectividad, los rangos de generación de big
data van desde la generación automática de información por un medio de
aplicaciones como imágenes de predilección meteorológica hasta entradas
manuales como partes de videos que las personas graban de sus vidas o las
entradas de texto en Twitter, Facebook, Instagram, WhatsApp, etc; big data
también se actualiza a una velocidad increíble de manera muy interactiva y en
aumento los aumentos los cambios en los datos se generan constantemente y
estos últimos se vuelven más exactos y más precisos en la medida que pasa el
tiempo y en la medida que se crean calculan o infieren más datos sobre esos
mismos datos a pesar del tamaño, la velocidad, el origen de los datos o de las
partes de los datos en big data surge la necesidad de darle algún sentido a todo
este caos

Big data crea la necesidad de dar un significado a los datos en constante cambio
y de hallar relaciones entre los datos entre los datos creados la comprensión de
esta interconectividad y la capacidad de recopilar la información oculta en big data
revela su valor el cual se puede obtener solamente venciendo nuestros propios
retos de big data la recopilación, el análisis y la comprensión de big data se
convierte hoy en día en una estrategia diferenciada, pero a futuro se convertirá en
un hecho.

Pág. 11 Ing. Marco Aurelio Porro Chulli


Base de Datos II Ing. Sistemas y Telemática

7. Glosario de Términos:

➢ Fusión: Es el proceso de integración de múltiples datos y conocimientos que


representa el mismo objeto del mundo real en una representación coherente,
precisa y útil.

➢ Predictibilidad: Puede referirse tanto a la acción y al efecto de predecir, como a


las palabras que manifiestan aquello que se predice; en este sentido, predecir algo
es «anunciar por revelación, ciencia o conjetura algo que ha de suceder.

➢ Recopilar: La actividad que consiste en la recopilación de información dentro de


un cierto contexto.

➢ Repositorio: Es un espacio que se utiliza para almacenar distintas cosas.

➢ Autoservicio: Sistema de venta empleado en comercios y restaurantes que


consiste en tener la mercancía expuesta para que el consumidor o cliente se sirva
él mismo y abone el importe a la salida.

➢ Predictivo: Permite extraer conclusiones confiables sobre eventos futuros, a


través de la aplicación de métodos estadísticos, matemáticos y de reconocimiento
de patrones.

➢ Prescriptivo: Es aquel que se utiliza para indicarle a un interlocutor qué es lo que


debe hacer.

➢ Macrodatos: Se refiere a la información dispuesta de manera adecuada de una


consulta, es la información dispuesta de manera adecuada para su tratamiento
por una computadora

➢ Civilización: Es el estadio cultural propio de las sociedades más avanzadas


según su nivel de ciencia, artes, etc.

➢ Relieve: Es la acción del ser humano puede generar cambios en el relieve; eso
es lo que ocurre al abrir un archivo.

➢ Efectividad: La efectividad puede referirse a la validez de algo, también es la


capacidad de conseguir el resultado que se busca.

➢ Masivo: Es todo lo que posee mucha masa (del latín “Massa” que quiere decir
amontonamiento), y densidad; o aparece en abundancia o cantidad. Algo que se
difunde masivamente es lo que llega a gran cantidad de personas, ya sea una
noticia, etc.

➢ Anonimato: se define como actuar o comunicarse sin usar o presentar el nombre


o identidad propios; o cómo actuar o comunicarse en una manera que protege la
determinación del nombre o identidad propios, o usando un nombre asumido o
inventado que no puede necesariamente asociarse con la identidad legal o
habitual de uno.

Pág. 12 Ing. Marco Aurelio Porro Chulli


Base de Datos II Ing. Sistemas y Telemática

➢ Metodología: Se define como el grupo de mecanismos o procedimientos


racionales, empleados para el logro de un objetivo, o serie de objetivos que dirige
una investigación científica.

➢ Procesados: Es la Técnica que consiste en la recolección de los datos primarios


de entrada, que son evaluados y ordenados, para obtener información útil, que
luego serán analizados por el usuario final, para que pueda tomar las decisiones
o realizar las acciones que estime conveniente.

8. Linkografía:

https://aws.amazon.com/es/big-data/what-is-big-data/
http://www.campusbigdata.com/big-data-blog/item/77-bigdata-
macrodatos-5v-datascience
https://www.tableau.com/es-es/resource/top-10-big-data-trends
https://www.mssqltips.com/sqlservertip/3132/big-data-basics--part-1--
introduction-to-big-data/

Pág. 13 Ing. Marco Aurelio Porro Chulli

Vous aimerez peut-être aussi