Vous êtes sur la page 1sur 2

Asignatura: Introduccin a la Ingeniera de Sistemas

Seccin: A
Ing. Guillermo Caldern Ruiz
Integrantes
-Aguilar Valdivia Mauricio Carlos
-Melo Gonzales Kevyn Mauro
-Noguera Rafael Harold Edson
-Pamo Delgado Rodrigo Edmur

Big Data: Storage Solution


1. Qu es Big Data?
Big Data son las grandes cantidades de datos, que no puede ser procesada o analizadas
utilizando procesos o herramientas tradicionales.
2. Evolucin del Big Data:
Se puede considerar 3 periodos de evolucin:

1er Periodo: A finales de los 90 comenz el primer periodo de evolucin de Big Data, teniendo
como aspecto principal la adopcin del correo electrnico y archivos adjuntos.
2do Periodo: Fue dada por el crecimiento masivo de la tecnologa digital. A la vez que
comienza la aparicin de los datos no estructurados los cuales superan por mucho a los datos
estructurados.
3er Periodo. En los ltimos aos se vio impulsada por la informtica social, periodo durante el
cual los datos no estructurados ocupan el 80% de los datos en general .Por el desmesurado
crecimiento de datos comenzaron los problemas de almacenamiento
3. Los formatos de datos que afectan al almacenamiento
- Social media (forma ms comn de datos no estructurado)
- Formatos de fotografa, audio y video
- Investigacin espacial y aplicaciones geogrficas
- Reportes e investigaciones de la ciencia
Todos ellos contribuyen a un mayor grupo de datos no estructurados cada vez ms difciles de
gestionar.
4. High Tech y Big Data
Las empresas High Tech se ven afectadas por la creciente tendencia analtica Big Data en
las siguientes dos maneras:
1. Las empresas tienen que esforzarse por entender los datos, esto abarca el anlisis de
requisitos de rendimiento para diversos mercados y hacer estas funcionalidades disponibles a
travs de sus productos. La solucin del problema se compone de la capacidad para gestionar
grandes volmenes a alta velocidad utilizando motores de bsqueda (Advanced-Analytics:
Soluciones que proporcionan herramientas y tcnicas que le ayudaran a predecir eventos
futuros con confianza y lograr mejores resultados para su organizacin.)

2. Las empresas de alta tecnologa quieren aprovechar la voz del cliente en lnea y en tiempo real
a travs de las plataformas sociales para lograr as un anlisis detallado en los intereses de
los clientes. Este es un problema de Big Data ya que las entradas de datos son enormes.
4.1. Caractersticas para un buen almacenamiento
- Capacidad: Que sea capaz de soportar datos no-estructurado y Big Data.
- Velocidad: Para contrarrestar esto se requiere soluciones de almacenamiento con un
rendimiento escala web y
escalabilidad lineal.
-Tipo: Requieren nuevas plataformas de anlisis de datos, sobre todo el marco Hadoop de
cdigo abierto.
5. Soluciones:
5.1 Scale-Out: Arquitectura modular que comprende numerosos nodos que agrupan y
configuran una extensa y masiva infraestructura de almacenamiento.
Scale-Out no solo permite la expansin del almacenamiento sino que mantiene su
funcionalidad y rendimiento ya que se expande.
5.1.1 Hadoop: .Es una sistema de archivos distribuido que almacena, procesa y analiza
grandes volmenes de datos a travs de diferentes nodos y mantiene la tolerancia a fallos.
Los beneficios de Hadoop son:
- Mejor escalabilidad.
-Rentabilidad.
-Rendimiento mejorado.
5.1.2 MapReduce: Es un tipo de programacin que procesa cantidades grandes de datos.
Este modelo est compuesto por dos pasos que a la vez provienen de su nombre.
-1er paso Map, consiste en el mapeo de datos pasando por un proceso de filtrado que
como resultado da otra coleccin de datos en el que se identifica un solo registro para cado
valor utilizado como clave.
-2do paso Reduce, consiste en generar un nuevo grupo de datos provenientes del
resultado del mapeo que por lo general reduce el nmero de particiones.
6. Conclusin:
Big Data como sabemos es una gran cantidad de datos; la cual las empresas quieren
aprovechar de todos estos para el beneficio de s misma, extrayendo su valor real con la
observacin de intereses y necesidades de las personas lo cual para hacer esto necesitan
almacenar todos estos datos de una manera organizada y estructurada, he de ah que viene la
problemtica del Big Data.
El TCS, nos brinda las mejores alternativas de soluciones como el sistema Scale-Out entre
otras para mitigar esta problemtica y as poder dar un mayor salto en el crecimiento de sus
ventas con el uso correcto de estos datos.

Vous aimerez peut-être aussi