Vous êtes sur la page 1sur 6

Big Data:

Son datos de una gran cantidad que llega a superar el software convencional para
ser capturados y administrados de una forma estratgica.

Como se usa:
El lado duro de los negocios costos, velocidad, rotacin de inventarios, cadenas
de suministro, eficiencia de capital se compone de cosas que pueden medirse
con precisin.

Quien lo usa:
Amazon, Netflix, Walmart son de las compaas que mas fuertes utilizan el big-
data atravez de la historia ya que estas empresas lo utilizan desde 1990 y
contando. Aunque el lder en la carrera es Facebook.

Para que lo usan:


En el caso de walmart, que se convitrio en una pionera en el usa del big data y de
las herramientas de anlisis y consigui por ello estar preparada para el huracn
Katrina que las autoridades de Nueva Orleans, mientras ellos no saban muy bien
que hace la cadena de supermercados tenia la lista de la compra de los
consumiedores para situaciones similares clara y preparada para ser atendida.

Nike: por lo menos la firma de alta tecnologa y software, de forma tanto coyuntural
cierto es. La compaa es una de las pioneras en el terreno de las wearables, los
dispositivos que permiten aadir una capa de inteligencia a elementos que antes
no lo eran como puede ser el caso de los relojes pulsometros y a medida que las
personas utilizan estos dispositivos incrementan la informacin que puede llegar
hacia a ellos.

Amazon: este es de las compaas que hacen convencer a sus consumidores


poder comprar productos y haci es como venden en grandes cantidades.

Principales usos:
La exploracin de grandes datos
Las tres 'V' del Big Data (velocidad, volumen y variedad) reflejan el reto al que se
enfrentan las grandes compaas a la hora de dar a los datos un valor para tomar
mejores decisiones, mejorar las operaciones y reducir los riesgos. Por lo tanto, es
necesario poder navegar de forma fcil para obtener la informacin tanto dentro de
los sistemas de la compaa como los datos que llegan desde afuera.
El aumento del llamado bruto de datos o ruido plantea el dilema de
cmo contextualizar estos datos para alimentar un mejor anlisis y una mejor toma
de decisiones. La exploracin de datos, adems de ofrecer soluciones a estos
problemas, tambin contribuye a disminuir el riesgo de filtracin de informacin
confidencial gracias a sus mecanismos de seguridad.

360 de visin sobre el cliente

Para conseguir un conocimiento total del cliente, las compaas deben obtener
informacin de fuentes internas y externas para poder asesorarle y entender cul
es la mejor manera de ayudarle. El objetivo es comprender el comportamiento del
cliente y predecir sus futuras acciones.

Los empleados que trabajan directamente con los clientes deben poseer la
informacin suficiente y adecuada para crear una relacin de confianza y
conseguir un compromiso o una fidelidad por parte del consumidor. Para
conseguirlo, el empleado debe poder disponer al instante tanto de informacin
interna (segn el comportamiento del cliente en otras experiencias con la propia
compaa) como externa (sobre sus gustos e intereses, obtenida de redes
sociales, correo electrnico, etc).

Hay que aclarar que la palabra cliente es un nombre genrico, que pasar a
denominarse paciente en el sector de la salud, un sospechoso en un caso policial,
etc.

Tcnicas y software:
Machine Learning

Es una tcnica para conseguir el aprendizaje automtico basado en datos.


Tpicamente hay dos tipos de aprendizaje, el supervisado y el no supervisado.
Como ejemplo del supervisado, el anlisis de sentimiento en redes sociales se
basa en clasificar las opiniones en favorables o desfavorables (puede haber ms
de dos tipos). Se parte de unos casos de entrenamiento que se han catalogado
manualmente para que el programa pueda generalizar a partir de ellos. Esto
requiere tratamiento del lenguaje natural y aplicacin prctica de clculos
estadsticos.

En el caso del no supervisado, podemos pensar en la segmentacin de clientes,


agrupando los que tienen caractersticas comunes. De nuevo se utiliza la
estadstica para obtener esa medicin de cercana o distancia, pero sin recurrir a
una clasificacin previa realizada por una persona.

Hadoop y MapReduce

Apache Hadoop es un framework abierto pensado para almacenar y tratar grandes


volmenes de datos, basndose en el proceso paralelo (distribuido). Inicialmente
para responder a las necesidades de los grandes buscadores y redes sociales,
que requieren a la vez buenos tiempos de respuesta y tolerancia a fallos. De aqu
que est tan asociado a la problemtica Big Data.

Como repositorio de datos distribuido, a nivel tcnico conviene recordar el


teorema CAP. Nos indica que en un sistema distribuido no podemos conseguir
simultneamente las tres caractersticas siguientes:

Consistencia (todos los nodos comparten la misma informacin


simultneamente)
Disponibilidad (la peticin a un nodo siempre obtiene respuesta sobre si se
ha resuelto o no satisfactoriamente)
Tolerancia a particiones (el sistema funciona aunque falle una parte de la
conectividad entre nodos)

En Hadoop y en general en bases de datos noSQL como MongoDB se intenta


llegar a un compromiso para equilibrar las tres caractersticas, pero es importante
saber cul es la que no se va a cumplir en un caso extremo.

Ejemplos:
Macy's y sus precios en tiempo real
Macy's es uno de los comercios minoristas ms importantes de los Estados
Unidos, que destaca por su e-commerce. Utilizando la tecnologa de SAS
Institute ha conseguido mejorar sus ingresos y la experiencia del usuario. Gracias
a la velocidad de anlisis y los informes obtenidos con esta nueva tecnologa,
han reducido en 500.000 dlares el gasto anual de analtica. Macy's sabe hoy
perfectamente el impacto de sus newsletters y notificaciones y conoce mejor a los
clientes ms satisfechos, lo que les gusta y lo que no... Hoy, el uso de estos datos,
les permite segmentar al mximo sus envos, de manera que envan menos
emails, pero con mucho ms impacto y han conseguido reducir las de
suscripciones hasta en un 20%. Gracias a la utilizacin de un algoritmo y al control
de la demanda y el inventario, pueden lanzar ofertas cruzadas, ajustar precios y
hacer rebajas casi en tiempo real para sus 73 millones de artculos a la venta.

Juegos de pelota y millones de datos

Casi todo el mundo ha odo hablar de la pelcula Moneyball: Rompiendo las


reglas (2011), si no es por Brad Pitt, al menos s como ejemplo del uso de Data.
Ocurri en la pretemporada de 2002 en Oakland Athletics de las Grandes Ligas de
Bisbol de los Estados Unidos. El gerente deportivo Billy Beane, revolucion la
historia del club y posiblemente del deporte en general tras fichar a un joven
economista, Peter Brand, que traa nuevas ideas. Juntos contrataron jugadores
infravalorados, pero econmicamente rentables, con un criterio de seleccin muy
diferente. La intuicin y sapiencia de los ojeadores es sustituda por las
conclusiones de los anlisis de estadsticas y nmeros acumulados a la hora de
establecer las necesidades del equipo y los jugadores que mejor se adaptan a
stas.

En la actualidad contamos con muchos ms casos en los que se usa Big Data en
el deporte. Los equipos de la NBA ya tienen implantado el uso de datos a la hora
de preparar la estrategia en partido, mientras que la NFL tiene una plataforma que
ayuda con sus aplicaciones a los 32 equipos a tomar las mejores decisiones en
base a la analtica de datos: desde el estado de la superficie del csped a las
condiciones climatolgicas, pasando por datos de la etapa universitaria de cada
jugador...todo est registrado y todo puede servir para sacar conclusiones
diversas, como la de prevenir lesiones en jugadores. Adems, analiza
las preferencias de los aficionados gracias a su aplicacin NFL Now, que ofrece la
posibilidad de que stos creen su propio canal con contenido variado de la NFL:
vdeos divertidos, cheerleaders preferidas, informacin por equipos, por jugadores,
etc. Tambin utilizan NetApp para almacenar todos estos datos. Con esto
consiguen establecer las demandas de los fans y facilita las cosas a la hora de
establecer acciones de marketing, expandir el mercado, encontrar los partners
ms apropiados, etc.

La reeleccin de Obama
Tras su primer mandato, el presidente de los EEUU, Barack Obama, decidi
utilizar Big Data para su reeleccin en 2012. Un centenar de personas trabajaron
en el departamento de analtica de la campaa. 50 estaban fijos en las oficinas
centrales, otros 30 se movilizaron a lo largo y ancho de las distintas sedes del
pas, y 20 estaban nica y exclusivamente centrados en la interpretacin de los
datos recibidos. Tras un primer anlisis, los esfuerzos de la campaa se enfocaron
en tres aspectos: registro (recoger datos de los votantes convencidos), persuasin
(dirigirse a los dudosos de una forma eficaz) y voto del electorado (asegurarse de
que los partidarios fueran a ejercer el voto s o s). Y, por primera vez, los tres
equipos ms importantes de las campaas electorales: el de campo, el digital y el
de comunicacin, trabajaron con una estrategia unificada con los respectivos
datos de cada uno. El motor de todo, la plataforma inteligente utilizada fue HP
Vertica. Entre las acciones ms efectivas que permita esta plataforma
estaban: recoger datos a pie de campo y realizar un feedback muy rpido via
notificaciones email por parte del equipo online (se mejoraba en tiempo y
eficiencia); o detectar los nichos en los que funcionara mejor la publicidad en TV
cruzando datos de los votantes con otros demogrficos, audiencias, precios de
publicidad, programas... (se mejor en impacto y segmentacin). Con su analtica,
el equipo de Obama optimiz la comunicacin y mejor la respuesta del
electorado afn, permitiendo no malgastar recursos, tiempo y dinero en los
votantes que no eran partidarios de su partido.

Vous aimerez peut-être aussi