Vous êtes sur la page 1sur 15

White Paper

Gestionando del ciclo de vida analtico


para la toma de decisiones a gran escala:
Los pasos a seguir para pasar de los datos a las decisiones de la forma ms rpida posible
Contents
Introduccin........................................................................ 1

Decisiones a gran escala ................................................. 2


Cules son los retos? ................................................................2

SAS Analytical Life Cycle: Mejores prcticas para


mejorar los resultados de la modelizacin
predictiva ............................................................................ 4
La fase de exploracin del ciclo de vida analtico ...............4

La fase de implementacin del ciclo de vida analtico .......6

Pasar del concepto a la accin: cmo crear un


entorno analtico eficaz ................................................... 7

SASCmo puede contribuir SAS al ciclo de vida


analtico al ciclo de vida analtico .................................. 8
Preparacin y exploracin de los datos:
Un enfoque sistemtico .............................................................8

Desarrollo de modelos mediante un


entorno analtico innovador......................................................9

Implementacin de modelos desde un


solo entorno fcil de usar ..........................................................9

En marcha! Pon en prctica los resultados de la


modelizacin lo ms rpido posible ......................................10

Gestin y evaluacin de modelos:


Un proceso continuo ..................................................................10

Casos prcticos ................................................................11


Institucin financiera del Reino Unido: Modernizando su
ciclo de vida analtico .............................................................. 11

Orlando Magic: La magia al descubierto ........................... 11

Visa: Mil millones de decisiones operacionales al ao mejo-


ran la experiencia de los clientes y reducen el fraude ..... 11

Recursos adicionales ......................................................12


1

Introduccin
Considera el supuesto que se expone a continuacin. Los modelos analticos son fundamentales para las decisiones
empresariales importantes. Gracias a ellos, puedes identificar
Una organizacin cuenta con cientos de modelos nuevas oportunidades, forjar nuevas o mejores relaciones con
analticos integrados en produccin que respaldan la clientes y gestionar la incertidumbre y los riesgos. Por estos y
toma de decisiones en marketing, la fijacin de precios, otros muchos motivos, los modelos se deben crear y considerar
los riesgos de crdito, los riesgos operativos, el fraude y como activos organizativos de gran valor. Pero cmo?
la gestin financiera.

Para empezar, necesitas un software potente y fcil de usar que


Los analistas de las diferentes unidades de negocio
te ayude a dar forma a tus datos y crear rpidamente muchos
desarrollan sus modelos sin seguir ningn proceso
modelos predictivos precisos. A continuacin, debes recurrir a
formalizado o estndar de almacenamiento, implementa-
procesos potentes e integrados para gestionar tus modelos
cin y gestin. Algunos modelos no disponen de docu-
analticos, de modo que consigas un rendimiento ptimo
mentacin que indique el responsable del modelo, el
objetivo empresarial, las instrucciones de uso u otro tipo
de informacin necesaria para gestionarlo o presentarlo
a las autoridades reguladoras.

Los responsables de la toma de decisiones obtienen Uso de modelos para tomar decisiones de
resultados de los modelos, pero con requisitos y forma automtica
controles limitados. Adems, los resultados son inco
herentes debido al uso de variables y conjuntos de datos La toma de decisiones operativas es un
distintos en su creacin. Los procesos de validacin y las proceso muy repetitivo que, a menudo,
pruebas backtesting no son suficientes para asegurar el ocurre muchas veces al da. En la toma de
ajuste de los modelos.
decisiones, pueden participar personas, por
Las decisiones se adoptan en funcin de los resultados ejemplo, empleados de call centers que
obtenidos por los modelos, y todos esperamos lograr los realizan ventas incrementales o complemen-
mejores resultados tarias llamando por telfono a clientes, o
A muchas organizaciones les suena mucho este tipo de bien pueden ser decisiones completamente
problemas con sus modelos. En un entorno de modelizacin automatizadas, que simulan la lgica
variado y poco gestionado, a veces es muy difcil responder a humana, por ejemplo, si se rechaza una
preguntas muy importantes en relacin a los modelos predic-
compra con tarjeta de crdito. Sin embargo,
tivos. Entre estas cuestiones, podemos encontrar las siguientes:
una decisin operativa no tiene por qu
Quin cre los modelos y por qu?
afectar a un solo cliente, sino que puede
Qu variables de entrada se usan para hacer predicciones
hacer referencia al mejor grupo de clientes
y, en ltima instancia, tomar decisiones?
al que dirigir una determinada oferta. Este
Cmo se usan los modelos?
tipo de decisiones se meten en los sistemas
Cul es el rendimiento de estos modelos y cundo se
actualizaron por ltima vez?
de gestin de campaas cada semana o
Dnde se encuentra la documentacin complementaria?
mes. Cuando los modelos analticos predic-
Por qu se tarda tanto en poner en marcha modelos
tivos estn integrados en los sistemas de
nuevos o actualizados? produccin y cuando negocio usa los resul-
Las organizaciones que no pueden contestar con confianza tados para ofrecer respuestas al instante, has
a estas preguntas no pueden garantizar que sus modelos implementado eficazmente estos modelos
analticos verdaderamente ofrecen buenos resultados. analticos.
2

durante todo el ciclo de vida. Los equipos analticos y de TI Por ello, la capacidad de tomar rpidamente las decisiones
necesitan procesos eficaces y sistemticos, as como una arqui- operativas ms adecuadas, al mismo tiempo que se aprovechan
tectura fiable para gestionar datos y realizar el seguimiento de los crecientes volmenes de informacin, puede traducirse en
los modelos analticos predictivos durante el ciclo de que se produzca un fraude o no, es decir, en fracaso o xito
implementacin. empresarial.

Por lo tanto, qu hay que hacer para tomar rpidamente


Y lo que es ms importante: la clave para conseguir el xito en
muchas decisiones adecuadas y alineadas con la estrategia?
materia de anlisis es convertir rpidamente los datos en cono-
Algunos requisitos son:
cimiento y este, a su vez, en acciones, lo que implica que debes
integrar con eficacia modelos predictivos precisos en sistemas 1. Aplicaciones operacionales que se basen en los datos para
de produccin que impulsen la toma de decisiones de forma ofrecer respuestas a personas (o sistemas) con lo que garan-
automatizada. tizar una toma de decisiones optimizada

2. Modelos analticos actualizados y basados en un cono-


La complejidad creciente de gestionar cientos o miles de cimiento profundo que la empresa pueda emplear como
modelos inestables hace que las organizaciones se encuentren material fiable a la hora de tomar decisiones acertadas en el
al borde de una revolucin de la informacin. El enfoque arte- momento adecuado
sanal, que resulta ineficaz y ha quedado obsoleto, debe evolu-
cionar y convertirse en un proceso automatizado ms eficaz. 3. Integracin de reglas empresariales y anlisis predictivos en
los procesos de toma de decisiones operativas que propor-

}}
cionen la orientacin necesaria para tomar decisiones
basadas en datos reales
Las decisiones operacionales son 4. Un mtodo para gestionar y supervisar los modelos
analticos con el fin de garantizar que son eficaces y siguen
las que convierten tu estrategia de
ofreciendo las respuestas acertadas
negocio en una realidad y garantizan 5. Una arquitectura y unos procesos que pueden crecer para
que tu organizacin trabaje de satisfacer nuevas necesidades, como difundir datos y crear
modelos predictivos ms detallados de la forma ms rpida
manera eficaz. posible

James Taylor y Neil Raden, Cules son los retos?


Smart (Enough) Systems Desafortunadamente, a pesar de que los datos abunden y
sepamos qu necesitamos, no resulta sencillo convertir
grandes cantidades de datos estructurados y desestructurados

Decisiones a gran escala en informacin til que permita tomar mejores decisiones de
forma automatizada. A continuacin, figuran algunos retos:
Cuntas decisiones que afectan a las operaciones se toman en
Retrasos: Debido a procesos que, a menudo, son manuales
tu organizacin cada da? Probablemente ms de lo que te
y ad hoc, la implementacin de un modelo en los sistemas
imaginas; por ejemplo, elegir una entidad financiera. Cuntas
de produccin puede tardar meses. Puesto que las fases
transacciones con tarjeta de crdito se procesan cada hora? (En
de desarrollo y prueba de los modelos lleva demasiado
Visa, la tasa puede alcanzar las 14 000 por segundo. Consulta la
tiempo, pueden quedarse obsoletos en el momento en el
pgina 3). Cada una de ellas representa una decisin en
que alcanzan la fase de produccin. O puede suceder que
materia de operaciones: permitir o prohibir que la transaccin
nunca lleguen a implementarse. Los problemas de
se procese teniendo en cuenta la valoracin de riesgo de
cumplimiento externo e interno pueden plantear an
fraude. Aunque cada transaccin o decisin de este tipo pueda
ms retos.
tener un riesgo individual bajo, el gran nmero de estas deci-
siones que se toman cada hora o cada da incrementa mucho el
riesgo asociado.
3

Dificultades para identificar los desencadenantes La fase


que implica convertir las respuestas de los modelos
analticos en decisiones operativas requiere reglas de
Visa: Mil millones de decisiones operacionales
negocio acordadas y claras. Estas reglas de negocio tienen
que formar parte del entorno controlado, ya que determinan al ao mejoran la experiencia de los clientes y
cmo se usan los resultados de los modelos. Por ejemplo, reducen el fraude
un modelo de deteccin de fraude podra identificar una Visa, que es una marca reconocida a nivel mundial,
calificacin de riesgo de fraude como un nmero compren- facilita las transferencias electrnicas de fondos a
dido entre 100 y 1000 (similar a la calificacin crediticia travs de productos de marca de terceros
FICO). La empresa tendr que decidir qu nivel de riesgo comercializados por sus miles de entidades
implica llevar a cabo una accin. Si el nivel de un aviso de financieras asociadas. La empresa ha tramitado
fraude se establece en un nivel demasiado alto, el fraude 64 900 millones de transacciones en 2014, y se
podra pasar inadvertido. En cambio, si se establece en un realizaron compras con un valor de 4,7 billones
nivel demasiado bajo, los avisos sealan demasiados falsos
de dlares por medio de tarjetas Visa durante
ese mismo ao.
positivos. Ambas metodologas restan el valor aportado por
estos modelos y disminuyen la confianza en los resultados.
Visa cuenta con una capacidad de clculo que
Resultados deficientes: Con demasiada frecuencia, los es capaz de tramitar 56 000 mensajes de transac-
modelos de bajo rendimiento se quedan en la fase de cin por segundo, que supera cuatro veces la
produccin, incluso si ofrecen resultados imprecisos que tasa de transaccin mxima real hasta la fecha.
conllevan decisiones empresariales desacertadas. Los resul- Visa no solo tramita y calcula, sino que realiza
tados de los modelos cambiarn a medida que los datos se anlisis constantemente para proporcionar infor-
adaptan a las nuevas condiciones y comportamientos. Las macin estratgica y operativa a sus entidades
principales razones son la falta de un repositorio central de
asociadas y les ayuda a mejorar el rendimiento.
modelos y la inexistencia de mtricas coherentes para deter-
El objetivo de negocio est respaldado por
minar si un modelo necesita actualizarse o sustituirse.
un sistema de gestin de datos muy potente.
Confusin: Las organizaciones actan de forma reactiva, es Visa tambin ayuda a sus clientes a mejorar el
decir, reaccionan con prisas cuando el regulador marca el rendimiento y les proporcionar informacin
momento de la entrega. Dado que cada departamento tiene analtica exhaustiva. Examinamos los patrones
una manera diferente de manejar y validar un modelo, las de comportamiento mediante una agrupacin y
revisiones y ajustes de los modelos son complicados lo que segmentacin muy detalla, y proporcionamos
dificulta enormemente el trabajo de TI. No se sabe con esta informacin a nuestros clientes, afirma
certeza por qu se seleccion el modelo definitivo, cmo se
Nathan Falkenborg, responsable de Visa
Performance en el norte de Asia.
calcul un determinado scoring ni por qu criterios se rigen
las reglas empresariales que activan el modelo.
Hace muy poco tiempo Visa hizo una prueba de
Falta de transparencia: Hay poca visibilidad en las fases en concepto con una solucin de alto rendimiento
las que se desarrollan los modelos o se desconoce quin de SAS que inclua almacenamiento en memoria
est involucrado en ellos a medida que avanzan por su ciclo para potenciar los algoritmos estadsticos y de
de vida. Por lo tanto, surgen presunciones conflictivas. Se machine-learning para posteriormente presentar
debe recurrir a revisores imparciales para validar los dicha informacin de manera visual. Falkenborg
modelos a medida que pasan por cada grupo, lo que declara: El reto que se nos presenta, tal y como
supone una gran despilfarro de recursos.
ocurre en cualquier empresa que pretende
gestionar y usar grandes cantidades de datos,
Prdida de informacin importante acerca de los modelos: es cmo sacarle el mayor partido a todos esos
Si la informacin acerca de los modelos no est correcta- datos para que nos ayuden a solucionar nuestros
mente documentada, cuando los responsables se van se retos de negocio, ya sea mejorar los modelos de
pierde la informacin. La propiedad intelectual tambin es prevencin del fraude, o bien ofrecer asistencia a
un aspecto importante a tener en cuenta. nuestros clientes para comunicarse de forma
ms eficaz con sus propios clientes.

Ms informacin
4

Escasez de habilidades analticas: Aunque haya un nmero Sin embargo, son pocas las entidades que saben lidiar
creciente de cientficos de datos que entran en el mercado, plenamente con las complejidades que surgen en todo el ciclo
la escasez de habilidades analticas necesarias para la de vida del modelo analtico, ya que se trata de una tarea de
creacin e implementacin de modelos supone an un gran carcter polifactico.
reto para muchas organizaciones.
En SAS, hemos desarrollado un ciclo de vida analtico
sistemtico que te gua durante cada fase del proceso durante
SAS Analytical Life Cycle: el cual los datos se transforman en decisiones. Empezaremos

Mejores prcticas para diciendo que hay dos fases en el ciclo de vida analtico: detec-
cin e implementacin. A continuacin, describiremos las
mejorar los resultados de la tareas de cada fase y cmo interactan para crear un proceso

modelizacin predictiva sistemtico que puedas usar para producir resultados predic-
tivos, fiables y constantes.
Las organizaciones lderes reconocen que los modelos
analticos son activos empresariales fundamentales que La fase de exploracin del ciclo
generan respuestas que ayudan a mejorar las relaciones con los
de vida analtico
clientes y las operaciones, adems de aumentar los ingresos y
reducir los riesgos. Por lo tanto, es evidente que tratan de crear P
reguntas que se quieren responder: El proceso de Explo
los mejores modelos posibles. racin se rige por el planteamiento de cuestiones empresari-
ales que dan lugar a la innovacin. Por lo tanto, el primer
paso implica determinar lo que la empresa quiere averiguar.

Prepare Implement

Ask
lore

Discovery Deployment
Act
Exp

l Eva
M o de lu ate

Ilustracin 1: El ciclo de vida analtico de SAS


5

A continuacin, esa pregunta se traduce en una represen clave para encontrar la respuesta ms fiable, y la creacin de
tacin matemtica del problema, que se puede solucionar modelos automatizados puede ayudar a minimizar el tiempo
con anlisis predictivos. Las reas de negocio tambin tienen en el que se obtienen resultados, as como impulsar la
que especificar las necesidades, el alcance, las condiciones productividad de los equipos analticos. Con las herra-
del mercado y los objetivos relacionados con la preguntas mientas de creacin manual de modelos los responsables
que estn tratando de responder, lo que ayuda a seleccionar de la minera de datos y los cientficos de datos solo podan
las tcnicas de modelizacin ms apropiadas. crear varios modelos en una semana o un mes. Las nuevas
P
reparacin de los datos: Las tecnologas, como Hadoop, y soluciones y los ordenadores ms rpidos han acelerado
los ordenadores cada vez ms rpidos y baratos permiten este proceso, de modo que, hoy en da, se pueden crear
almacenar y usar una cantidad y tipos de datos mayor que cientos o miles de modelos en el mismo plazo. Sin embargo,
nunca. No obstante, esto solo ha aumentado la necesidad con ello, ha surgido otro problema: cmo identificar de la
de combinar datos en diferentes formatos y de diferentes forma ms rpida y fiable el modelo (entre muchos) que
orgenes, as como de transformar datos en bruto, de modo mejor funciona? La comparacin entre modelos sirve para
que se puedan usar en la modelizacin predictiva. Debido a elegir el que ofrezca los mejores resultados para un conjunto
los nuevos tipos de datos que provienen de dispositivos de datos especfico. El hecho de que existan modelos
conectados, de sensores o los registros web de interac- machine-learning automatizados y mtricas claramente
ciones on line, la fase de preparacin de datos plantea an definidas se consigue el identificar el mejor modelo. Los
ms retos. Muchas organizaciones an declaran que analistas y cientficos de datos pueden dedicar tiempo a
emplean una cantidad de tiempo excesiva, a veces, hasta un centrarse en el anlisis y cuestiones ms estratgicas.
80 %, para lidiar con las tareas de preparacin de datos. La
mayor parte del tiempo durante la fase de exploracin se
debe emplear en estudiar los datos y crear modelos
idneos, en lugar de preparar los datos.
Exploracin de los datos: Las herramientas de visualizacin
self-service interactivas deben satisfacer las necesidades de
una amplia variedad de usuarios (desde los analistas de
negocio que no poseen conocimientos estadsticos hasta los
cientficos de datos que son expertos en anlisis), de modo
que puedan buscar fcilmente relaciones, tendencias y
patrones para comprender mejor los datos. Durante esta
fase, se pule tanto la pregunta como el enfoque que
surgieron en la fase inicial de planteamiento del proyecto.
Asimismo, se desarrollan y se ponen a prueba ideas sobre
cmo afrontar el reto de negocio desde una perspectiva
analtica. Durante la exploracin de los datos, es posible que
te des cuenta de que debes aadir, eliminar o combinar vari-
ables para crear modelos mucho ms concretos. Soluciones
giles e interactivas contribuyen a que este proceso sea
sistemtico, que es esencial para identificar las mejores
preguntas y respuestas.
Modelizacin de los datos: Durante esta fase, se aplican
numerosos algoritmos de modelizacin analtica y machine-
learning a los datos para encontrar la mejor representacin
de las relaciones entre ellos que ayudar a resolver la
pregunta de negocio. Las herramientas analticas buscan
una combinacin de tcnicas de modelizacin y datos que
pronostican el mejor resultado. Sin embargo, no existe un
solo algoritmo que valga para todo, sino que el ms
idneo para resolver las preguntas hechas se establece en
funcin de los datos. La experimentacin es un aspecto
6

La fase de implementacin del ciclo de herramienta de gestin de decisiones, las actualizaciones y


mejoras que sirven para cambiar las condiciones resultan
vida analtico
sencillas y mejoran el control y la agilidad de los negocios.
I mplementacin de los modelos: En este punto, recopilas la Tras aprobar el modelo para la fase de produccin, la herra-
informacin generada en la fase de deteccin y la incorporas mienta de gestin de decisiones lo aplica a los nuevos datos
utilizando procesos automatizados y sistemticos. En muchas operativos, generando as la informacin predictiva nece-
organizaciones, el proceso de modelizacin analtica se saria para actuar de la mejor forma posible.
ralentiza considerablemente en esta fase, dado que no se ha Evaluacin de los resultados: El siguiente paso, y quizs el
definido una etapa de transicin entre la deteccin y la ms importante, es evaluar los resultados de las acciones
implementacin, ni tampoco existe una colaboracin entre que se han tomado siguiendo las indicaciones del modelo.
los desarrolladores de modelos y los arquitectos de imple- Han dado lugar tus modelos a las predicciones correctas?
mentacin del departamento de TI, ni mucho menos una Se obtuvieron resultados tangibles, como el aumento de
automatizacin optimizada. En la mayora de las orga- los ingresos o la reduccin de los costes? Es imprescindible
nizaciones, el entorno de implementacin es muy diferente una supervisin y medicin continas del rendimiento de los
del entorno de deteccin, particularmente si los modelos modelos a partir de estadsticas estandarizadas. Los resul-
predictivos fomentan la toma de decisiones que afectan a las tados de esta evaluacin, a su vez, pueden incorporarse a la
operaciones. A menudo, el departamento de TI tiene que siguiente iteracin del modelo, lo que da lugar a un bucle
aplicar polticas de control estrictas en este entorno para continuo de aprendizaje automtico. Si detectas un dete-
garantizar los acuerdos de nivel de servicio con la empresa. rioro de ciertos modelos analticos, puedes definir la
Si integras las fases de deteccin e implementacin, puedes estrategia ptima de actualizacin para que sigan producien
crear una transicin sistemtica, flexible y automatizada que do los resultados deseados. Dado el incremento del nmero
mejora las decisiones operativas. Asimismo, un proceso de los modelos analticos, la automatizacin se impone
controlado y transparente resulta muy importante para como un elemento necesario para identificar con rapidez
todos, especialmente para los auditores. Una vez creado, el aquellos modelos que reclaman una mayor atencin, e
modelo se registra, se somete a pruebas o se valida, se incluso realizar un ajuste automatizado.
aprueba y, por ltimo, se informa de que est listo para Nuevo planteamiento: Los modelos predictivos no son
usarse junto con los datos en produccin, que estn inte- eternos. Los factores que permiten elaborar predicciones en
grados en los sistemas operativos. el marco de un modelo tienen un carcter dinmico: los
T
rabajando con la nueva informacin: Existen dos tipos de clientes van cambiando; algunos competidores abandonan
decisiones que se pueden tomar en funcin de los resul- el mercado, mientras que otros nuevos se incorporan, y
tados analticos. Por un lado, los encargados de examinar los nuevos datos pasan a estar disponibles. En consecuencia,
resultados y actuar toman decisiones estratgicas, normal- incluso los modelos ms precisos tienen que actualizarse, lo
mente de cara al futuro. Por otro, las decisiones operativas se que obliga a las organizaciones a repetir las fases de explo
toman de forma automatizada, como las calificaciones credi- racin e implementacin. Se trata de un proceso constante y
ticias o las mejores ofertas recomendadas. Estas decisiones cambiante. Si un modelo se deteriora, se somete, bien a un
no involucran a personas, dado que las reglas que estas ajuste, mediante el cambio de sus coeficientes, bien a una
ltimas podran aplicar se pueden codificar en sistemas de reformulacin, en la que se conservan algunas caractersticas
produccin. Cada vez ms organizaciones tratan de automa- y se aaden otras nuevas. Cuando el modelo deja de satis-
tizar las decisiones que ataen a las operaciones y propor- facer una necesidad empresarial, se retira.
cionar resultados en tiempo real para reducir las demoras a Resulta fcil imaginar las muchas formar en las que puede fallar
la hora de tomar decisiones. Si estas decisiones operativas este proceso. Con frecuencia, las organizaciones tardan meses,
se basan en las respuestas que dan los modelos analticos, o incluso aos, en recorrer este trayecto. Se pueden mencionar
adquieren objetividad, coherencia, regularidad y un valor numerosos que hacen que ocurra esto:
cuantificable. La integracin de los modelos con herra-
mientas de gestin de decisiones ayuda a que las orga- Las fuentes de datos necesarias pueden estar dispersas en
nizaciones creen flujos completos y exhaustivos para tomar diversos puntos de la organizacin.
decisiones operativas. Estos flujos combinan modelos Es posible que los datos deban integrarse y limpiarse varias
analticos con indicadores basados en reglas de negocio veces para satisfacer distintos requisitos analticos.
para tomar las mejores decisiones de forma automatizada. Y La traduccin manual de los modelos a distintos lenguajes
dado que estos aspectos estn formalmente definidos en la de programacin para su integracin con sistemas
7

operativos importantes (tanto en sistema de lotes como en


tiempo real) puede prolongarse considerablemente.
Pasar del concepto a la
Las organizaciones pueden tardar en reconocer la nece accin: cmo crear un
sidad de cambiar un modelo, por lo que avanzan adoptando
decisiones inadecuadas en funcin de resultados obsoletos.
entorno analtico eficaz
En un entorno analtico eficaz, que cuente con un buen almace-
Muchos de los pasos incluidos en el ciclo de vida analtico
namiento y acceso a los datos y con una estructura correcta
son repetitivos por naturaleza, por lo que pueden exigir la
para su exploracin y para su desarrollo, los modelos se
vuelta a un paso anterior del ciclo para incorporar o actua
efectan con gran rapidez. Los modelos se generan y prueban
lizar datos.
con celeridad, y se implementan en un entorno de produccin
Los distintos perfiles aaden complejidad al proceso, lo que
sin apenas demora. Los modelos en produccin no tardan en
confiere una importancia capital a las tareas de colaboracin
generar resultados fiables y su rendimiento se supervisa
y documentacin. En muchas organizaciones, el departa-
constantemente para sustituir de inmediato los que muestran
mento de IT se encarga de preparar los datos durante la fase
un funcionamiento deficiente por otros ms actualizados.
de deteccin, mientras que las labores de exploracin de
datos y de desarrollo de modelos suelen recaer en los En resumen, una estrategia analtica correcta entraa algo ms
analistas de negocios y los cientficos de datos. El departa- que la mera creacin de un modelo de gran capacidad predic-
mento de IT tambin es responsable de la implementacin tiva: comprende la gestin holstica de cada una de las fases
(en especial, cuando incluye la integracin en procesos del ciclo de vida tanto para cada uno de los modelos como
operativos). No obstante, el equipo especfico del departa- para el conjunto completo de estos. Y no se trata de una tarea
mento encargado de esta tarea puede diferir del grupo de sencilla.
gestin de datos.
No olvidemos que los analistas y los cientficos de datos no se
limitan a desarrollar un nico modelo para solucionar un
Todo esto tiene como efecto neto que los modelos, que supues
problema empresarial. Elaboran un conjunto de modelos
tamente deben generar informacin empresarial til y slida,
enfrentados y usan diversas tcnicas para abordar problemas
conducen a la adopcin de decisiones subptimas, a la prdida
complejos. Contarn con varios de ellos en distintas fases del
de oportunidades y a la implantacin de medidas inadecuadas.
Pero existe una solucin a este problema.

Ilustracin 2: SAS Data Loader incluye instrucciones para


minimizar las necesidades de formacin. Este ejemplo
muestra la norma que permite unir y combinar datos,
mediante la que puedes combinar dos tablas en una,
y que se ejecuta en Hadoop para conseguir un mayor
rendimiento.

Ilustracin 3: Analiza los datos desde un entorno de


visualizacin de datos interactivo.
8

desarrollo, adems de con otros adaptados a lneas de Para obtener los mejores resultados analticos, las orga-
productos y problemas empresariales especficos. De este nizaciones necesitan contratar personal con la cualificacin
modo, la organizacin puede llegar con facilidad a gestionar adecuada y facilitarles el trabajo colaborativo para realizar
miles de modelos. sus funciones.

Y, ms an, el entorno de los modelos no tiene nada de


esttico: estos se actualizan continuamente conforme se Cmo puede contribuir
prueban y nuevos datos pasan a estar disponibles. El objetivo
consiste en generar los mejores modelos predictivos posibles
SASCmo puede contribuir
con los datos ptimos disponibles. SAS al ciclo de vida analtico
Los modelos predictivos constituyen activos muy valiosos de las al ciclo de vida analtico
organizaciones, cuyo xito requiere algo ms que el mero uso
SAS utiliza componentes integrados para reducir el tiempo de
de la tecnologa. Las organizaciones tambin deben tener muy
elaboracin de los modelos, desde los datos hasta la gestin
en cuenta tanto a las personas como a los procesos. Por
de las decisiones. Los procesos y las tecnologas consistentes
ejemplo, es importante actualizar constantemente las habili-
que se emplean en el desarrollo y la implementacin de los
dades analticas de carcter empresarial y tcnico para que
modelos reducen los riesgos inherentes a la modelizacin y, al
puedan identificarse los problemas de negocio ms acuciantes,
mismo tiempo, fomentan la colaboracin y el control entre los
adems de aplicarse la informacin analtica pertinente a los
principales interesados de negocio y del departamento de TI.
procesos operativos.

El ciclo de vida analtico es sistemtico y colaborativo por natu- Preparacin y exploracin de los datos:
raleza. El personal, que posee distintos perfiles y habilidades, Un enfoque sistemtico
participo en varias etapas del proceso. Los responsables de
negocio tienen que detectar el problema o la pregunta que Preparacin de los datos: SAS Data Management te
quieran responder y, a continuacin, tomar la decisin apro- permite definir perfiles y limpiar los datos, as como crear
piada, adems de supervisar los ingresos obtenidos a partir de rutinas con procesos ELT (extraer, cargar y transformar) que
dicha decisin. Los analistas de negocios llevan a cabo la visual- generan los data marts analticos, en los que se utilizan solo
izacin y el estudio de los datos y trabajan para identificar vari- los datos necesarios. Los datos se almacenan en la base de
ables claves que influyan en los resultados. Los equipos de datos para que se carguen de forma rpida, y se les de una
gestin de datos y del departamento de TI facilitan la prepara- estructura que facilite la creacin de modelos y se simpli-
cin de los datos, adems de la implementacin y supervisin fican para crear variables derivadas. Estos procesos se
de los modelos. Los cientficos de datos o responsables de la pueden automatizar y planificar en lotes, o bien se pueden
extraccin de datos llevan a cabo tareas ms complejas de ejecutar en tiempo real y ad hoc, en funcin de la fase del
anlisis exploratorios segmentacin descriptiva y modelizacin ciclo de vida analtico. Las herramientas de manipulacin y
predictiva. preparacin de datos self-service, como SAS Data Loader
para Hadoop, ayudan a los analistas y a los cientficos de
datos a facilitar el acceso, combinando y limpiando datos sin
que suponga una carga para el departamento de TI. El proc-
esamiento secuencial de eventos de SAS implica que se

Ilustracin 4: Tcnicas de evaluacin personalizables de


SAS Factory Miner que te permiten generar los modelos
ganadores para todos los segmentos
9

Las plantillas pueden crearse directamente usando best


practices que se pueden compartir con otros usuarios sin
tener que escribir ninguna lnea de cdigo.
odelizacin predictiva y minera de datos. SAS Enterprise
M
MinerTM optimiza el proceso de minera de datos, de modo
que puedas crear rpidamente modelos descriptivos y
predictivos optimizados basados en grandes volmenes de
datos. Un entorno de trabajo interactivo y los flujos de
proyecto pueden servir para documentar el trabajo y reducir
el tiempo de desarrollo de los modelos. Los responsables
del desarrollo de los modelos pueden usar funciones de
evaluacin visual y estadsticas de validacin, as como
Ilustracin 5: SAS Decision Manager agiliza proceso de
implementacin de los modelos. Integra la automatizacin comparar distintos modelos a la vez.
del desarrollo de los modelos. SAS Factory Miner acelera M
inera de textos: SAS Text Analytics proporciona una
las tareas manuales habituales, como la fijacin de reglas de amplia gama de herramientas para detectar y extraer
negocio y la terminologa, que se genera automticamente conceptos e informacin de las fuentes textuales, entre las
que se incluyen la web, notas de call centers, libros, etc.
Adems, puedes aadir a tus modelos analticos informacin
puedan gestionar con la mayor eficiencia cientos de de fuentes textuales para lograr una mayor capacidad
millones de eventos por segundo. Adems, te ayuda a iden- predictiva.
tificar qu aspectos requieren atencin inmediata, cuales se
A
nlisis en memoria: El procesamiento de anlisis en
pueden ignorar o cuales deben almacenarse. Finalmente, el
memoria distribuido en las soluciones de SAS aprovecha
procesamiento in data-based se usa para reducir el
una potentes, fiable y escalable infraestructura analtica, que
movimiento de datos y mejorar el rendimiento.
incluye bases de datos, como Pivotal Greenplum, Teradata,
E
xploracin de datos: SAS Visual Analytics permite que los Oracle y SAP HANA, as como el hardware bsico que usa
analistas detecten con facilidad relaciones importantes entre Hadoop. Este procesamiento tan rpido permite que los
datos y se centren rpidamente en mbitos de inters o que modelos machine-learning y los modelos estadsticos se
presentan oportunidades, descubrir patrones inesperados, optimicen rpidamente bebiendo de bases de datos de
examinar distribuciones de datos, averiguar la frecuencia de gran tamao.
valores extremos e identificar variables importantes para
incorporar en el proceso de desarrollo de modelos.
Implementacin de modelos desde un
solo entorno fcil de usar
Desarrollo de modelos mediante un
SAS Enterprise Decision Manager es la clave para mejorar la
entorno analtico innovador
fase de implementacin del ciclo de vida analtico. Proporciona
Los analistas pueden crear modelos predictivos utilizando una un entorno compartido basado en web que permite gestionar
variedad de herramientas de SAS que incluyen un amplio el ciclo de vida y el control de tus activos de modelizacin y,
conjunto de algoritmos para analizar datos estructurados, as adems, se ajusta a las necesidades de los usuarios de negocio
como no estructurados. y del departamento de TI. Los analistas seleccionan datos y
C
omparaciones automticas de los modelos modelos de un repositorio central y, al mismo tiempo, pueden
machine-learning. Gracias a SAS Factory Miner, consigues determinar las reglas de negocio que se aplican en sus
un entorno de modelizacin predictiva interactivo que modelos. Este marco de trabajo facilita el seguimiento de las
facilita crear, modificar y evaluar cientos, o incluso miles, de actividades de modelizacin y las actualizaciones y las en un
modelos de forma muy rpida. Con unos cuantos clics, entorno nico.
puedes acceder, modificar y transformar tu datos, elegir qu R
egistro de modelos: Tras finalizar el desarrollo del modelo,
tcnicas de machine-learning quieres aplicar y ejecutar los los analistas registran un paquete que contiene el modelo,
modelos en un entorno de comparacin automatizada de que incluye todas las transformaciones o imputaciones de
modelos para identificar rpidamente el que mejor funciona. datos etc., adems de todos los resultados y documentos
10

relacionados. Este paquete garantiza que se han adoptado I mplementacin flexible: La misma solucin no se ajusta a
las medidas apropiadas y que el modelo lanzado a produc- todas las necesidades si nos referimos a los distintos
cin es potente y adecuado. Tambin ayuda a las orga- sistemas operativos. Si no se tienen que implementar
nizaciones a estandarizar el proceso para crear, gestionar, cambios, los mismos modelos se pueden implementar en
implementar y supervisar modelos analticos. sistemas batch y de tiempo real. Por ello, los analistas se
G
overnance: La gestin del riesgo de los modelos incluye el desprenden de la pesada carga que supone adaptar cada
seguimiento de las mtricas, el control de las diferentes entorno con distintos parmetros, cdigos de scoring y
versiones y quin ha cambiado qu cuando el control pasa cdigos cifrados personalizados.
de un departamento a otro, entre otros aspectos. Un reposi- P
rocesos de scoring controlados mejores y ms rpidos:
torio centralizado de modelos, las plantillas de ciclos de vida Puesto que el modelo se califica directamente en la base de
y los controles de versin hacen que los procesos analticos datos, la tarea de ejecucin de los modelos aprovecha la
sean ms transparentes y garantizan que se pueden auditar velocidad de procesamiento y escalabilidad de la base de
para cumplir con las normativas externas y de control datos. Las tareas que solan durar das y horas se pueden
interno. finalizar en cuestin de minutos o segundos. El movimiento
R
epositorio de modelos: Los repositorios centrales sirven de datos se minimiza dado que el socring analtico puede
para almacenar documentacin completa sobre el modelo, llevarse a cabo donde se guardan los datos. Como los datos
su scoring y los metadatos relacionados. Los responsables no tienen que extraerse del entorno de datos sumamente
de la modelizacin pueden colaborar fcilmente y volver a controlado y seguro. Incluso en entornos muchos menos
usar el cdigo de los modelos, gracias a las actividades que gestionados, como Hadoop, si se elimina el movimiento y la
se quedan registradas a travs de la autenticacin de duplicacin de datos, las ventajas en el rendimiento pueden
usuarios o grupos, los controles de versin y los controles de ser considerables.
auditora.
C
alificacin: Despus de revisar un modelo, aprobarlo e Gestin y evaluacin de modelos:
informar de que est listo para produccin, este adquiere el Un proceso continuo
estado de mejor modelo. Con un solo clic, todo el flujo de Una vez que un modelo se encuentra en un entorno de
trabajo de tu modelo ganador se puede convertir en cdigo produccin y se ejecuta para ofrecer respuestas, el modelo
de scoring que se puede implementar en SAS, bases de ganador se supervisa de forma centralizada a travs de una
datos externas, Hadoop y servicios web. serie de informes basados en indicadores clave de rendimiento.
V
alidacin: Los criterios de calificacin se validan antes de Si el rendimiento del modelo empieza a disminuir por debajo
elaborar los modelos, utilizando una plantilla y un proceso del nivel de aceptacin, dicho modelo se puede sustituir
sistemticos que permiten registrar todas las pruebas que el rpidamente por uno nuevo o volver a ajustarlo.
motor de calificacin ha superado, para garantizar que los
Flujo de trabajo automatizado: Las consolas de flujo de
criterios integrados en el modelo ganador son adecuados.
trabajo basadas en web fomentan que el proceso de gestin
de modelos sea ms automatizado, sistemtico, colaborativo
En marcha! Pon en prctica los resultados de y controlado. Tanto la organizacin como los auditores
la modelizacin lo ms rpido posible pueden realizar el seguimiento de todas las fases de un
Gracias a SAS, puedes elegir entre varias opciones de imple- proyecto de modelizacin, desde el planteamiento del
mentacin para integrar los mejores modelos en los sistemas problema hasta las etapas de desarrollo, implementacin y
en produccin. SAS Scoring Accelerator permite una imple- retirada.
mentacin integrada y automatizada que puede impulsar el G
estin del ciclo de vida general: Todas las fases del ciclo
rendimiento de tus modelos de varias formas. de vida de un modelo se coordinan de manera integral
mediante plantillas prediseadas y personalizadas por el
I mplementacin ms rpida: Implementa informacin y
cliente que se ajustan a los procesos de negocio de la
procesos analticos con una infraestructura y un coste
organizacin.
mnimos. Todo el cdigo de scoring analtico se convierte de
forma automtica en servicios web ligeros o en lenguajes S
upervisin automatizada de los modelos: Las tareas de
nativos para realizar el procesamiento en bases de datos. Por control de rendimiento de los modelos se pueden planificar
ello, desaparecen los procesos manuales, tediosos y de forma peridica y los resultados se pueden supervisar de
propensos a errores con los que se traduce y se valida el manera regular, tanto en el caso de un modelo como en
cdigo de scoring de los modelos para distintos entornos. todo el inventario de modelos. Estos resultados se pueden
11

publicar en dashboards, y fijar los unbrales mnimos de que un modelo alcanzase el entorno de produccin baj
rendimiento. Si estos umbrales se incumplen, los analistas de los tres meses a cuestin de das. La preparacin de
reciben avisos sobre los modelos que requieren su atencin, datos se redujo un 40 % y, por otro lado, la productividad
ahorrando as dinero y tiempo. de los analistas aument un 50 %.

Gracias a un marco de trabajo formal de gestin de modelos, Orlando Magic: La magia al descubierto
los mejores modelos alcanzan la fase de produccin de forma
Gracias a SAS Analytics y SAS Data Management, Orlando
ms rpida para empezar a satisfacer las necesidades de la
Magic es uno de los equipos de la NBA que ms ingresos
empresa mucho antes. La compaa puede generar ms y
genera.
mejores modelos, con una amplia variedad de mtodos
analticos y con menos recursos. Los modelos analticos se
El equipo lo consigui analizando el mercado de reventa de
supervisan y se mejoran continuamente para que estn actual-
entradas y fijando menores precios, previendo el nmero de
izados y gocen de precisin. Todo el proceso de exploracin e
titulares de abonos de temporada con riesgo de cancelar su
implementacin se vuelve ms transparente y mejor contro-
suscripcin (y para recuperarles de nuevo) y analizando las
lado, por lo tanto, resulta sencillo explicar las decisiones
ventas de productos con el fin de asegurarse de que la orga-
basadas en los anlisis a las autoridades reguladoras y a los
nizacin pone a disposicin de los aficionados todo lo que ellos
responsables de negocio.
quieren cada vez que entran al estadio. El club ha utilizado SAS
incluso para ayudar a los entrenadores a reunir la mejor

Casos prcticos alineacin.

Gracias a un enfoque de ciclo de vida analtico predictivo, el esce- Orlando Magic no tiene una bola de cristal, pero cuentan con
nario de despus y la forma de actuar cambia bastante, obteni- SAS Enterprise Miner, que les permiti entender mejor los
ndose una ventaja competitiva considerable. datos y desarrollar modelos analticos que pronostiquen las
renovaciones que llevarn a cabo los titulares de abonos de
Institucin financiera del Reino Unido: temporada. Gracias a las herramientas de minera de datos, el
equipo gener scorings ms precisos que contribuyeron a
Modernizando su ciclo de vida analtico
previsiones ms exactas sobre su mercado y marcaron una dife-
Una de las principales instituciones financieras del Reino rencia con respecto a la forma de abordar la retencin de
Unido se dio cuenta que la duracin del ciclo desde la clientes y el marketing.
iniciacin del modelo hasta su implementacin no
cumplira con las expectativas del siglo XXI. El proceso era
manual, propenso a errores y exiga numerosos recursos.
Visa: Mil millones de decisiones operacionales
Adems, contaba con poca o ninguna supervisin a la al ao mejoran la experiencia de los clientes y
hora de identificar el deterioro de los modelos. reducen el fraude
Visa, que es una marca reconocida a nivel mundial, facilita las
Al trabajar con SAS y Teradata, la organizacin dise una transferencias electrnicas de fondos a travs de productos de
plataforma de anlisis predictiva y flexible en la que marca de terceros comercializados por sus miles de entidades
integr funciones para gestionar datos, desarrollar e financieras asociadas. La empresa ha tramitado 64 900 millones
implementar modelos utilizando tecnologa en bases de de transacciones en 2014, y se realizaron compras con un valor
datos. Esta plataforma aprovecha la escalabilidad del de 4,7 billones de dlares por medio de tarjetas Visa durante
entorno de Teradata para calificar los modelos y utiliza la ese mismo ao.
potencia de SAS Analytics para crearlos.
Visa cuenta con una capacidad de clculo que es capaz de
Gracias a la nueva plataforma, ms de 55 millones de tramitar 56 000 mensajes de transaccin por segundo, que
registros se pueden calificar en Teradata muchas veces supera cuatro veces la tasa de transaccin mxima real hasta la
durante el da; un resultado que jams se habra logrado fecha. Visa no solo tramita y calcula, sino que realiza anlisis
con el proceso anterior. El tiempo necesario para facilitar constantemente para proporcionar informacin estratgica y
operativa a sus entidades asociadas y les ayuda a mejorar el
rendimiento.
12

El objetivo de negocio est respaldado por un sistema de


gestin de datos muy potente. Visa tambin ayuda a sus
clientes a mejorar el rendimiento y les proporcionar infor-
macin analtica exhaustiva. Examinamos los patrones de
comportamiento mediante una agrupacin y segmentacin
muy detalla, y proporcionamos esta informacin a nuestros
clientes, afirma Nathan Falkenborg, responsable de Visa
Performance en el norte de Asia.

Hace muy poco tiempo Visa hizo una prueba de concepto con
una solucin de alto rendimiento de SAS que inclua almace-
namiento en memoria para potenciar los algoritmos
estadsticos y de machine-learning para posteriormente
presentar dicha informacin de manera visual. Falkenborg
declara: El reto que se nos presenta, tal y como ocurre en cual-
quier empresa que pretende gestionar y usar grandes canti-
dades de datos, es cmo sacarle el mayor partido a todos esos
datos para que nos ayuden a solucionar nuestros retos de
negocio, ya sea mejorar los modelos de prevencin del fraude,
o bien ofrecer asistencia a nuestros clientes para comunicarse
de forma ms eficaz con sus propios clientes.

Ms informacin

Recursos adicionales
Para obtener ms informacin sobre la fase de deteccin del
ciclo de vida analtico, lea el informe tcnico La extraccin de
datos de principio a fin: Cmo conseguir informacin y generar
mejores oportunidades.

Para obtener ms informacin sobre la fase de implementacin,


lea el informe tcnico De los datos a la decisin: La automa-
tizacin de las decisiones referentes a las operaciones con
SAS Decision Manager.
Aspectos diferenciales de SAS El seguimiento de la modelizacin desde la fuente de
datos hasta los resultados analticos proporciona un
Preparacin de datos para el anlisis, exploracin y
control esencial, que resulta clave para cumplir las
Discovery interactivo, gestin, control y desarrollo de
normativas o los estrictos requisitos de informes.
modelos; todo ello, en una plataforma integrada.
Dashboards grficos e intuitivos facilitan el seguimiento
Integracin de distintas disciplinas analticas (por
del rendimiento de los modelos en distintos proyectos,
ejemplo, minera de datos, machine learning, fore-
de modo que los equipos puedan centrarse en aquellos
casting, anlisis y optimizacin de textos) que permite
que requieren su atencin de manera inmediata y evitar
lograr una mayor agilidad en el desarrollo de modelos y
el deterioro de modelos.
solucionar problemas empresariales ms complejos.
La interoperabilidad con herramientas de modelizacin
Automatizacin inteligente, as como plantillas de
externas permite a las organizaciones importar,
machine learning y de modelizacin predictiva con
gestionar y supervisar en un repositorio central los
mejores prcticas recomendadas integradas, que
activos de modelizacin creados por SAS y otras herra-
proporcionan herramientas de productividad y machine
mientas (por ejemplo, modelos PMML, R).
learning a un amplio grupo de usuarios.
Las bases de datos ms comunes, como Teradata, Aster
Con SAS, puedes gestionar un gran nmero de modelos
Data, EMC Greenplum, IBM Netezza, IBM DB2, Oracle y
complejos con un nmero de variables prcticamente
Teradata, permiten incorporar funciones de calificacin
ilimitado y bases de datos de gran tamao.
en bases de datos.
El entorno de comparacin de modelos automatizado y
Los metadatos de SAS engloban el anlisis y la gestin
basado en la web fomenta la productividad al permitir
de datos para que las transformaciones de datos
que los responsables de la modelizacin prueben de
utilizadas en la fase de exploracin se puedan volver a
forma rpida y sencilla muchos enfoques a la vez utili-
utilizar en la de implementacin.
zando los algoritmos estadsticos y de machine learning.
SAS proporciona conocimientos tcnicos y
Gracias a las funciones de flujo de trabajo basadas en la
empresariales muy amplios durante la asistencia anterior
web, los usuarios pueden fcilmente determinar
y posterior a la venta que te ayuda a reducir el tiempo a
procesos personalizados, gestionarlos hasta que fina
la hora de sacar ms partido al retorno de la inversin
licen, fomentar la colaboracin mediante notificaciones
y mejorarlo.
y establecer estndares empresariales.

To contact your local SAS office, please visit: sas.com/offices

SAS and all other SAS Institute Inc. product or service names are registered trademarks or trademarks of
SAS Institute Inc. in the USA and other countries. indicates USA registration. Other brand and product
names are trademarks of their respective companies. Copyright 2016, SAS Institute Inc. All rights reserved.
S152614.0416