Vous êtes sur la page 1sur 160

Alberto

Modelos analíticos descriptivos, predictivos y prescrictivos


Scappini
con plantilalas de excel listas para usar.
2ª Edición
80 MODELOS FUNDAMENTALES PARA ANALISTAS DE NEGOCIO
- ALBERTO SCAPPINI -

MSMKW
C/ Príncipe de Vergara, 43 - 28001 Madrid
T(+34) 91 781 69 62

Prohibida toda reproducción total o parcial de los textos, dibujos, fotografías o gráficos de esta publicación, cualquiera que sea el
medio de reproducción a utilizar, sin la autorización expresa de MSMK.
ÍNDICE

INTRODUCCIÓN

1. ACERCA DE ESTE LIBRO 7


2. SUPERFORECASTING 10

EL ANÁLISIS ESTRATÉGICO

3. INTRODUCCIÓN 13
4. EL ANÁLISIS DEL ENTORNO (PEST) 14
5. EL MAPA DE POSICIONAMIENTO 16
6. LA ESTRATEGIA DEL OCÉANO AZUL 17
7. LA MATRIZ DE IMPORTANCIA-DESEMPEÑO 18
8. EL MARCO VMOST 19
9. LA AUDITORÍA DE RECURSOS 21
10. LA MATRIZ DE BOSTON 22
11. LAS CINCO FUERZAS DE PORTER 24
12. EL ANÁLISIS DEL CICLO DE VIDA DE UN PRODUCTO 25
13. LA MATRIZ DE DIVERSIFICACIÓN (MATRIZ G.E.) 27
14. LA MATRIZ DE INTERNACIONALIZACIÓN 28
15. MODELO CANVAS 29
16. EL ANÁLISIS DAFO 31
17. LA MATRIZ DE ANSOFF 32
ÍNDICE

LA FIJACIÓN DE PRECIOS Y LA DEMANDA LOS ANÁLISIS ESTADÍSTICOS

18. INTRODUCCIÓN 34 34. INTRODUCCIÓN 64


19. LA ELASTICIDAD PRECIO DE LA DEMANDA 37 35. LAS ESTADÍSTICAS DESCRIPTIVAS 65
20. EL MÉTODO DE FIJACIÓN DE PRECIOS 36. INTRODUCCIÓN A LAS REGRESIONES 67
GABOR–GRANGER 39 37. LA CORRELACIÓN DE PEARSON 69
21. EL MEDIDOR DE SENSIBILIDAD DE PRECIOS 38. LA REGRESIÓN LINEAL 70
DE VAN WESTENDORP 40 39. OTRAS REGRESIONES 72
22. EL TEST MONÁDICO DE PRECIOS 42 40. EL ANÁLISIS DE RUTAS 74
23. EL ANÁLISIS CONJUNTO 43 41. INTRODUCCIÓN A LAS PRUEBAS DE HIPÓTESIS 77
24. EL ANÁLISIS CONJUNTO BASADO EN ELECCIONES 46 42. EL ENFOQUE BAYESIANO A LAS PRUEBAS
DE HIPÓTESIS 81
43. LA PRUEBA t (t-TEST) 82
EL ANÁLISIS DEL CLIENTE 44. LA PRUEBA DE PROPORCIONES 86
45. EL TEST A/B 87
25. INTRODUCCIÓN 49
46. EL ANÁLISIS DE LA VARIANZA (ANOVA) 89
26. EL MODELO RFM 50
47. INTRODUCCIÓN A LOS MODELOS
27. EL VALOR VITALICIO DEL CLIENTE 1 51
NO PARAMÉTRICOS 92
28. EL VALOR VITALICIO DEL CLIENTE 2 53
48. LA PRUEBA DE CHI-CUADRADO 93
29. EL NET PROMOTER SCORE® (NPS®) 55
49. EL COEFICIENTE DE CORRELACIÓN DE SPEARMAN 95
30. LA MATRIZ DE VALOR DEL CLIENTE 56
50. EL COEFICIENTE PHI 96
31. EL MODELO DE PROBABILIDAD DEL CLIENTE 58
51. LA PRUEBA U DE MANN–WHITNEY 97
32. EL ANÁLISIS DE LA SUPERVIVENCIA 59
52. LA PRUEBA DE LOS RANGOS
33. LOS MODELOS DE PUNTUACIÓN 61
CON SIGNO DE WILCOXON 98
ÍNDICE

53. LA PRUEBA DE KRUSKAL–WALLIS 99 70. EL ANÁLISIS DE SERIES TEMPORALES 127


54. LA PRUEBA DE FRIEDMAN 100 71. LOS MODELOS PICKUP 129
55. LA PRUEBA DE SCHEIRER–RAY–HARE 101 72. LAS REGRESIONES 130
56. LA PRUEBA DE MCNEMAR 102
57. LA PRUEBA Q DE COCHRAN 103
58. INTRODUCCIÓN A LOS MODELOS LOS ANÁLISIS Y SI (WHAT-IF)
DE CLASIFICACIÓN 104 Y LOS MODELOS DE OPTIMIZACIÓN
59. LA CLASIFICACIÓN BINARIA 105
73. INTRODUCCIÓN 132
60. LA REGRESIÓN LOGÍSTICA 107
74. EL ANÁLISIS DE ESCENARIOS 133
61. EL ANÁLISIS DE GRUPOS 108
75. LOS ÁRBOLES DE DECISIÓN SIMPLE 135
62. EL ANÁLISIS DE PERFILES 110
76. LOS MODELOS DE LA TEORÍA DE JUEGOS 137
63. EL ANÁLISIS DE COMPONENTES PRINCIPALES 112
77. LAS SIMULACIONES DE MONTECARLO 140
64. EL ANÁLISIS FACTORIAL EXPLORATORIO 114
78. EL MODELO DE CADENAS DE MARKOV 142
65. EL ANÁLISIS FACTORIAL CONFIRMATORIO 117
79. EL ANÁLISIS DEL EMBUDO DE VENTAS 144
80. OPTIMIZACIÓN 147

PREDICCIÓN

66. INTRODUCCIÓN 120 ANEXO


67. EL ANÁLISIS DEL CICLO DE VIDA DE CURVA S 122
ÍNDICE DE MODELOS 151
68. LA MEDIA MÓVIL 125
ÍNDICE DE FIGURAS 154
69. LA SUAVIZACIÓN EXPONENCIAL 126
BIBLIOGRAFÍA 158
INTRODUCCIÓN
1
7

ACERCA DE ESTE LIBRO

Introducción
¿Por qué es tan importante realizar análisis? Hacer que los
análisis formen parte, hoy en día, de la estrategia de una empresa
ofrece una ventaja competitiva extremadamente poderosa1,
dado que un buen análisis permite a las empresas tomar mejores
decisiones, lo cual significa reducir costes, aumentar márgenes,
lograr que los clientes sean más fieles o adquirir más clientes.
Además, parece que existe una escasez de recursos humanos
en el ámbito del análisis de datos (desde papeles más técnicos
a roles más orientados hacia el negocio) que durará varios años.

¿En qué consiste el Business Analytics? El BABOK® Guide2 define


el business analysis (análisis de negocios) como “el conjunto de

80 Modelos fundamentales para analistas de negocios


tareas y técnicas utilizadas para funcionar como enlace entre las
partes interesadas para poder entender la estructura, las políticas
y las operaciones de una organización, y para recomendar las
soluciones que permitan a la organización lograr sus objetivos.”
Según este manual, los analistas de negocios deberían ser
competentes en diversos ámbitos de especialización tales como
la planificación, el seguimiento, la obtención de información, la
gestión, el análisis de requisitos, etc. Además, deben contar con
competencias subyacentes muy sólidas para encontrar soluciones
y facilitar los procesos de toma de decisiones necesarios para
alcanzar los objetivos de la empresa. Para encontrar estas
soluciones, los analistas de negocios realizan una serie de tareas
La vida es realmente sencilla utilizando distintas “técnicas”: y aquí es donde, por lo menos para
pero insistimos en volverla complicada. mí, empieza la parte más emocionante del business analytics.

1
https://hbr.org/2006/01/competing-on-analytics

(Confucio) Thomas H. Davenport y Jeanne G. Harris, Competing on Analytics: The New Science of Winning (Harvard
Business School, 2007).
2
Guide to the Business Analysis Body of Knowledge: BABOK Guide (International Institute of Business Analysis,
2015).
1
8

ACERCA DE ESTE LIBRO

Introducción
Lo que el BABOK® Guide denomina “técnicas” es un conjunto de modelos, centra en esos modelos y técnicas que me ayudaron a realizar
técnicas, plantillas y mejores prácticas que utilizan los analistas de predicciones, previsiones y estimaciones que necesitaba para
negocios de manera más o menos creativa para resolver un problema. tomar decisiones empresariales. Ya que he decidido centrarme
Tras haber leído varios libros, artículos y publicaciones, tras asistir a años en los modelos analíticos, este libro omite los modelos que se
de cursos empresariales y universitarios, y tras aplicar distintas técnicas centran más en otros aspectos como, por ejemplo, la gestión de
como analista de negocios, echaba claramente en falta un conjunto de proyectos.
herramientas sencillo y organizado que incluyera todos los modelos, las
Hace un año, inicié, por lo tanto, este proyecto que usted puede
técnicas y las plantillas que había utilizado y aprendido hasta el momento.
leer ahora y que tiene como objetivo crear un conjunto de
Sin embargo, lo que encontré durante mi búsqueda era o demasiado
herramientas que sea lo más completo posible, con plantillas
limitado o demasiado extenso y técnico; en otras palabras, no pude
listas para ser utilizadas en la realización de análisis descriptivos,
encontrar un conjunto de herramientas completo y equilibrado que no
predictivos y prescriptivos.
resultara demasiado complejo pero que tuviera suficientes detalles como

80 Modelos fundamentales para analistas de negocios


para poder implementar los modelos. Un problema adicional era que la He tratado de hacer que este conjunto de herramientas sea lo más
información solía estar repartida entre distintas fuentes, y las fuentes más sencillo posible por lo que todas las herramientas que propongo
completas solo contenían modelos centrados en un tema específico no requieren habilidades técnicas específicas ni tampoco la
(como por ejemplo, modelos estadísticos, modelos de negocios, o bien, utilización de ningún software especializado. De hecho, para cada
modelos de fijación de precios). herramienta presentada en este libro, es posible descargarse una
plantilla en formato Excel lista para ser utilizada. También tengo
Durante mi comprobación de referencias entre libros y páginas web,
que admitir que he incluido algunos modelos más complejos
encontré distintas opciones; por ejemplo, Business Analysis Techniques:
que requieren la utilización de software específico, pero para
99 Essential Tools for Success3 es un buen libro de referencia que organiza
los demás modelos, la plantilla incluye todas las fórmulas y las
y explica distintas técnicas. Además, www.real-statistics.com y www.
instrucciones necesarias para su ejecución.
excelmasterseries.com son dos páginas web destacadas que he utilizado
para explicar numerosos modelos estadísticos propuestos en este libro.
Le recomiendo que las consulte si desea más información detallada
acerca del análisis estadístico en Excel.

No obstante, estaba realmente buscando una referencia con modelos


3
James Cadle, Debra Paul, y Paul Turner, Business Analysis Techniques: 99 Essential Tools for Success. 2ª
prácticos para una toma de decisiones rápida por lo que este libro se
edición (BCS Learning & Development Limited, 2014).
1
9

ACERCA DE ESTE LIBRO

Introducción
Valoro mucho la sencillez, y creo que los expertos (¡y los no expertos!) a Existe un libro excelente, que recomiendo encarecidamente a
menudo tienden a complicar las cosas sencillas, quizás para demostrar todos los analistas, denominado Superforecasters4, que resume
sus conocimientos o quizás simplemente porque creemos que los un amplio estudio sobre los patrones que se esconden detrás de
problemas complejos requieren soluciones complejas. Sin embargo, las previsiones más certeras y las mejores prácticas para lograr
creo firmemente que, para resolver un problema de manera eficiente una buena predicción de los acontecimientos futuros. Entre
y eficaz, suele ser mejor simplificarlo todo lo posible, empezando por varias mejores prácticas, una que admiro es la “estimación de
plantear preguntas sencillas que reflejen el objetivo de la investigación Fermi.” Este método, atribuido al físico Enrico Fermi, consiste en
o del análisis: ¿Tenemos que aumentar o reducir los precios? ¿Cuánto? desglosar una estimación compleja en varias estimaciones más
¿Para qué producto? ¿Para qué clientes? ¿Cuándo? sencillas (véase 2. Superforecasting).

El segundo paso consiste en identificar el alcance del análisis: Antes de dejar que se sumerja en las herramientas de este
libro, me gustaría simplemente sugerirle que, siempre que esté
»» ¿Qué ha pasado? (Análisis descriptivo)

80 Modelos fundamentales para analistas de negocios


realizando un análisis, intente ser flexible, creativo y que disfrute
»» ¿Por qué ha pasado? (Análisis diagnóstico)
del proceso.
»» ¿Qué va a pasar? (Análisis predictivo)
»» ¿Qué vamos a hacer? (Análisis prescriptivo) Así que, ¡felices análisis!

El tercer paso es seleccionar el modelo o la técnica que sea más


adecuado/a para la situación. El cuarto paso consiste en comprobar
cuáles son los datos disponibles y/o determinar cómo obtener datos
adicionales de fuentes tanto internas como externas. Quizás ocurra que
no sea posible recopilar todos los datos necesarios para un modelo
específico; en este caso, podemos o bien 1) intentar utilizar datos proxy
como sustitutos de los datos no disponibles o 2) cambiar al segundo
modelo más adecuado. El quinto paso se refiere al análisis propiamente
dicho y a la validación de los resultados, y el paso final consiste en
comunicar los resultados de manera correcta.

4
Philip E. Tetlock y Dan Gardner, Superforecasting: The Art and Science of Prediction (Crown, 2015).
2
10

SUPERFORECASTING

Introducción
Aunque no sea una técnica, he decidido empezar este conjunto
de herramientas con el superforecasting (las superpredicciones),
inspirándome en el libro de Philip E. Tetlock y Gardner5, que
considero imprescindible para cualquier analista. Los autores
intentan explicar por qué algunos expertos son buenos haciendo
predicciones y otros no lo son, basándose en varios experimentos
de predicción.

La primera razón que explica las previsiones erróneas es el exceso


de confianza con respecto a nuestros conocimientos (“ilusión
de conocimiento”); el ejemplo incluido explica cómo mejoró
la medicina cuando se introdujo la experimentación. Nuestro

80 Modelos fundamentales para analistas de negocios


cerebro funciona utilizando dos sistemas, 1 y 26. El sistema 1 es
bueno para el razonamiento rápido y sin esfuerzos que ocurre
de manera inconsciente y resulta útil para el reconocimiento de
patrones (por ejemplo, cuando conducimos por una carretera
que tomamos a menudo, utilizamos el sistema 1). Sin embargo, el
sistema 1 puede crear sesgos o ilusiones ya que el razonamiento
que conlleva está basado en simplificaciones para poder tener
respuestas rápidas y sin esfuerzos. En caso de tener que abordar
problemas que tengan posibles sesgos, tenemos que utilizar el
sistema 2, es decir, el sistema que utiliza el razonamiento y la
lógica y que, a pesar de que requiere más tiempo y esfuerzo, nos
permite superar la “ilusión del conocimiento”. Por lo general, para
La única sabiduría verdadera está los problemas complejos necesitamos utilizar el sistema 2 pero,
en saber que no sabes nada. a veces, cuando hay muchos patrones o mucha información, la

5
Philip E. Tetlock y Dan Gardner, Superforecasting: The Art and Science of Prediction (Crown, 2015).

(Sócrates) 6
Para más información, le recomiendo que lea el siguiente libro: Daniel Kahneman, Thinking, Fast and Slow
(Farrar, Straus y Giroux, 2011).
2
11

SUPERFORECASTING

Introducción
intuición puede ser la mejor solución ya que puede simplificar toda la Por último, una técnica maravillosa muy útil a la hora de realizar
información y analizar de manera inconsciente una cantidad de patrones predicciones complejas es la “estimación de Fermi”. Consiste
que no somos capaces de analizar de forma lógica. en desglosar un problema en varias preguntas de probabilidad
para poder plantear suposiciones más precisas y, después,
Otra de las razones que explican las previsiones desafortunadas es la
añadir esas preguntas para así obtener un resultado final más
falta de precisión y/o de medición. Las predicciones imprecisas no
realista. Esta técnica suele empezar por tomar en consideración
pueden medirse y, por lo tanto, no podemos mejorar nuestros métodos
una perspectiva externa. Por ejemplo, se nos muestra la foto de
de predicción. Un buen pronóstico tiene que incluir:
una familia y tenemos que predecir si tiene o no una mascota.
»» Un resultado medible: “la URSS se disolverá”. De manera instintiva, podemos empezar a centrarnos en las
»» Una predicción más precisa con un posible marco temporal: “en el características de la familia que podamos identificar. No obstante,
plazo de un año a partir de ahora”. deberíamos adoptar una perspectiva más amplia, por ejemplo,
»» Probabilidad: “con un 80% de probabilidad de que acabe ocurriendo”. averiguando el número de familias que tienen mascota en una

80 Modelos fundamentales para analistas de negocios


determinada zona geográfica (país, estado, ciudad, etc.), a saber el
La probabilidad no debería ser una medida de nuestra confianza en los 30%. Este es nuestro punto de partida, así que sabemos, sin ningún
resultados sino la consecuencia de nuestro razonamiento (basado en tipo de información adicional, que nuestra mejor estimación sería
varios elementos de información) sobre la probabilidad de que ocurra un que existe un 30% de probabilidad de que esta familia tenga
acontecimiento. Para medir los resultados de nuestras predicciones con mascota. Podemos, a continuación, ajustar nuestra predicción
probabilidades, resulta necesario realizar distintas predicciones similares con una perspectiva interna que se centre en las características
para calcular su nivel de exactitud y su calibración. de la familia como, por ejemplo, edad, origen étnico, hijos, etc. Un
El autor también demuestra que las previsiones medias de grupo son ejemplo famoso es el de la estimación del número de afinadores
mejores que las previsiones individuales dado que utilizan wwdistintas de piano que hay en Chicago. En lugar de suponer directamente
perspectivas, conocimientos e información. En caso de que tengamos cuál es el número, el problema se desglosa en varias preguntas,
que realizar predicciones de manera individual, podemos comportarnos empezando con la definición de la población total de la ciudad,
como un grupo agregando distintas fuentes de información, solicitando y luego, determinando el número de hogares, calculando el
las opiniones y los puntos de vista de otras personas y poniendo siempre número de hogares con piano, estimando la frecuencia con la
en duda los resultados. También deberíamos acordarnos de actualizar que necesita afinarse un piano, etc.7
nuestros resultados en base a cualquier información nueva y relevante
que obtengamos. 7
Para leer el ejemplo completo, visite https://en.wikipedia.org/wiki/Fermi_problem
EL ANÁLISIS
ESTRATÉGICO
3
13

INTRODUCCIÓN

análisis estratégico
El análisis estratégico incluye todos los modelos y técnicas que estudian
el entorno en el que opera una organización. Este entorno abarca desde

El Análisis
las tendencias externas (economía, política, innovaciones tecnológicas,
etc.) hasta el entorno de la organización (misión, estrategia, objetivos,
cadena de valor, etc.) y su entorno empresarial (competidores, productos
alternativos, clientes, proveedores, etc.).

El objetivo de un análisis estratégico consiste en investigar las ideas y los


problemas, o bien para evaluar la dirección estratégica de la organización,
o bien para identificar las posibles estrategias futuras. Me voy a centrar
únicamente en los modelos analíticos descriptivos, predictivos y
prescriptivos del análisis estratégico, dejando de lado todas las técnicas

80 Modelos fundamentales para analistas de negocios


de seguimiento e implementación de estrategias.
4
14

EL ANÁLISIS DEL ENTORNO (PEST)

El análisis estratégico
El análisis PEST y todas sus variaciones (PESTEL, PESTLIED,
STEEPLE, etc.) se utilizan para analizar las tendencias clave que
OBJETIVO
afectan al entorno que rodea a una organización pero sobre el
IDENTIFICAR LAS TENDENCIAS EXTERNAS CLAVE Y SU IMPACTO EN UNA que esta última no tiene ningún tipo de influencia. La idea clave
ORGANIZACIÓN, EMPRESA O DEPARTAMENTO. consiste en identificar las tendencias que más pueden afectar a
la empresa, organización o departamento en diversos ámbitos:

»» Político.
»» Medioambiental.
»» Económico.
»» Sociocultural.
»» Tecnológico.

80 Modelos fundamentales para analistas de negocios


»» ...

Algunos ejemplos de tendencias clave son: un aumento de


IMPACTOS los tipos de interés, una nueva legislación y el uso creciente
TENDENCIAS TENDENCIAS MOMENTO IMPACTO SOBRE LA COMPAÑÍA
DIRECTOS de dispositivos móviles. Es posible encontrar con bastante
POLÍTICAS CLAVE DEL IMPACTO
CAUSA-EFECTO INGRESOS COSTES facilidad muchos más ejemplos, pero la principal idea que quiero
1 transmitirle es que la división por ámbito es simplemente una
2 manera de facilitar la identificación de las tendencias clave, ya
3 que la decisión sobre si incluir una tendencia en un ámbito o en
4 otro tiene poco impacto, o ninguno, en el modelo. Este modelo
5
se utiliza de manera habitual junto con otras herramientas que
complementan el análisis del entorno empresarial (el análisis
6
competitivo, el análisis de las cinco fuerzas de Porter, etc.) y suele
7
utilizarse también para los análisis SWOT (por sus siglas en inglés)
8
o DAFO (fortalezas, debilidades, oportunidades y amenazas), en el
9
que representa los factores externos, a saber, las oportunidades
Figura 1: Modelo PEST (tendencias políticas) y las amenazas.
4
15

EL ANÁLISIS DEL ENTORNO (PEST)

El análisis estratégico
Para evitar la utilización de este modelo como una herramienta Existen dos métodos principales para la recopilación de datos para
meramente teórica, una vez identificadas las tendencias clave, es este modelo. El primero consiste en explotar los conocimientos
necesario definir los impactos de cada una utilizando un razonamiento de los expertos de distintos ámbitos y sectores para identificar
causa-efecto e intentar cuantificar el efecto positivo o negativo que las tendencias clave que tengan un impacto sobre el futuro de
puede tener cada tendencia en la organización (en términos de ingresos la organización. Pueden aplicarse varias técnicas tales como
o costes). Algunas tendencias pueden tener un impacto prácticamente el método Delphi, el brainstorming (tormenta de ideas), y los
directo pero otras requieren distintas hipótesis, estimaciones y cálculos. think tanks (grupos de reflexión). El segundo método es más
A menudo, resulta necesario determinar el impacto sobre los indicadores bien un “DIY” (hazlo tú mismo) y consiste en la recopilación de
intermedios antes de calcular el impacto monetario. Por ejemplo, la predicciones publicadas por expertos, futuristas, organizaciones,
creciente sensibilidad con respecto al reciclaje puede influir en el gobiernos, etc. Un error común con ambos métodos es que la
empaquetado realizado por la empresa. En este caso, podemos estimar, gente suele saltar directamente a las posibles soluciones pero, al
primero, la pérdida de reputación, después, la reducción de la demanda, hacer esto, estaremos empeorando el rendimiento del modelo. En

80 Modelos fundamentales para analistas de negocios


y por último, el impacto sobre los ingresos. Otro elemento importante esta fase, es necesario centrarse únicamente en las tendencias y
que tiene que identificarse es el momento del impacto dado que afectará en cuantificar el impacto que tendrán sobre la organización.
a las acciones que se tomarán al respecto y cuándo se tendrán que
implementar.

http://analyticsmodels.blogspot.com.es/p/strategic-
analysis-templates.html
5
16

EL MAPA DE POSICIONAMIENTO

El análisis estratégico
Un mapa de posicionamiento es una herramienta que compara
una empresa o unos productos con varios competidores en
OBJETIVO
función de las características más destacadas. También podemos
ANALIZAR EL POSICIONAMIENTO DE UNA EMPRESA O UN PRODUCTO EN añadir en el mapa la importancia relativa de cada característica.
COMPARACIÓN CON OTRAS EMPRESAS O PRODUCTOS A TRAVÉS DE LA Gracias a este mapa, podemos entender cómo está posicionada
EVALUACIÓN DE VARIAS CARACTERÍSTICAS. una empresa en relación con varias características y definir
las cuestiones clave para la toma de decisiones estratégicas.
Por ejemplo, podemos decidir centrarnos en la comunicación
y la promoción sobre la calidad de nuestro producto siempre
y cuando estemos bien posicionados y sea importante para
nuestros clientes.

80 Modelos fundamentales para analistas de negocios


Los datos para la elaboración de este tipo de mapas suelen
recopilarse a través de encuestas. En caso de que la selección
de características no esté clara o el número de características sea
muy elevado, podemos plantear una pregunta de preselección
5 en la que los encuestados tengan que clasificar las características
más importantes. Después, se les preguntará por la importancia
4
y el desempeño de las características seleccionadas para cada
Puntuación

3 empresa o producto. Por lo tanto, sugiero dividir la pregunta en


dos partes:
2
»» Importancia: puntuar del 1 al 5 cada característica.
1 »» Desempeño: puntuar del 1 al 5 cada combinación de
característica y empresa (o producto).
0

Precio Calidad Servicio Clientes Característica1 Caract

Importancia Compañía Competidor 1 Competidor 2 http://analyticsmodels.blogspot.com.es/p/strategic-


Figura 2: Mapa de posicionamiento analysis-templates.html
6
17

LA ESTRATEGIA DEL OCÉANO AZUL

El análisis estratégico
Esta estrategia aparece descrita en el libro Blue Ocean Strategy
escrito por W. Chan Kim y Renée Mauborgne en 20058. Está
OBJETIVO
basada en la idea de que las empresas no deberían centrarse en
IDENTIFICAR POSIBLES IDEAS EMPRESARIALES ROMPEDORAS. vencer a los competidores (océanos rojos) sino en la creación de
“océanos azules”, es decir, nuevos mercados no disputados. En
este sentido, la competencia será irrelevante y se creará nuevo
valor tanto para la empresa como para sus clientes.

El libro ofrece varias herramientas y enfoques para aplicar


de manera sistemática una estrategia del océano azul (estas
herramientas están disponibles en la página web oficial)9. Una de
las herramientas propuestas consiste en un marco de acción que

80 Modelos fundamentales para analistas de negocios


sugiere implementar una estrategia del océano azul mediante la
modificación, la creación, o la eliminación de factores relativos
INCREMENTAR variables CREAR variables que el al producto o al servicio ofrecido. Por ejemplo, una reducción
muy por encima de la norma sector no haya ofrecido relevante de precios gracias a una metodología de producción
del sector nunca diferente o a través de la creación de pantallas táctiles en la
industria de los móviles.

NUEVA
OFERTA
DE VALOR

REDUCIR variables muy ELIMINAR variables con http://analyticsmodels.blogspot.com.es/p/strategic-


por debajo de la norma del una gran competencia en el analysis-templates.html
sector sector
8
W. Chan Kim y Renée Mauborgne. Blue Ocean Strategy: How to Create Uncontested Market Space and Make
the Competition Irrelevant (Harvard Business School, 2005).
Figura 3: Marco de cuatro acciones para la implementación de una estrategia del océano azul 9
https://www.blueoceanstrategy.com/tools
7
18

LA MATRIZ DE IMPORTANCIA - DESEMPEÑO

El análisis estratégico
Este modelo se utiliza para evaluar el desempeño de una empresa
con respecto a varios factores de éxito o bien el desempeño de
OBJETIVO
un producto en función de distintas características. Puede formar
DECIDIR SI ES NECESARIO MEJORAR, MANTENER O REDUCIR CIERTAS parte del modelo del mapa de posicionamiento presentado en
CARACTERÍSTICAS DE PRODUCTO O ALGUNOS FACTORES DE ÉXITO este libro.
ESPECÍFICOS DE LA EMPRESA.
Los datos para la elaboración de este tipo de mapas suelen
recopilarse a través de encuestas. En caso de que la selección
5 de características no esté clara o el número de características sea
muy elevado, podemos plantear una pregunta de preselección
4.5 Precio
en la que los encuestados tengan que clasificar las características
Calidad más importantes. Después, se pedirá a los encuestados que
4

80 Modelos fundamentales para analistas de negocios


MEJORAR MANTENER puntúen del 1 al 5 cada característica.
3.5

Característica 1
3
Importancia

Característica n
2.5

Servicio
2
Cliente

1.5
MANTENER REDUCIR
1

0.5

0
0 0.5 1 1.5 2 2.5 3 3.5 4 4.5 5

Desempeño http://analyticsmodels.blogspot.com.es/p/strategic-
Figura 4: Matriz de importancia-desempeño analysis-templates.html
8
19

EL MARCO VMOST

El análisis estratégico
Se trata de una herramienta de análisis descriptivo que permite la
comunicación o la reflexión sobre el objetivo estratégico de una
OBJETIVO
empresa dado que incluye:
DESCRIBIR QUÉ QUIERE LOGRAR LA EMPRESA Y CÓMO TIENE PENSADO
»» Lo que la empresa quiere lograr: visión, misión y objetivos.
LOGRARLO.
»» Cómo alcanzar los obetivos: estrategias y tácticas.

De manera más detallada, los componentes de estas herramientas


son:

»» Visión: aspiración hacia los futuros resultados orientados al


mercado.

»» Misión: el objetivo fundamental de la empresa, es decir, por

80 Modelos fundamentales para analistas de negocios


qué existe la empresa.

»» Objetivos: las metas que la empresa tiene la intención de


VISIÓN
alcanzar; todos estos objetivos están alineados tanto con la
MISIÓN
misión como con la visión.
OBJETIVO 1 OBJETIVO 2 OBJETIVO 3 OBJETIVO 4 OBJETIVO 5 OBJETIVO 6

Estrategia 1 Estrategia 1 Estrategia 1 Estrategia 1 Estrategia 1 Estrategia 1 »» Estrategias: acciones a medio y largo plazo para alcanzar los
Estrategia 2 Estrategia 2 Estrategia 2 Estrategia 2 Estrategia 2 Estrategia 2 objetivos.
Estrategia 3 Estrategia 3 Estrategia 3 Estrategia 3 Estrategia 3 Estrategia 3
»» Tácticas: acciones a corto plazo para alcanzar los objetivos.
Táctica 1 Táctica 1 Táctica 1 Táctica 1 Táctica 1 Táctica 1

Táctica 2 Táctica 2 Táctica 2 Táctica 2 Táctica 2 Táctica 2

Táctica 3 Táctica 3 Táctica 3 Táctica 3 Táctica 3 Táctica 3

Táctica 4 Táctica 4 Táctica 4 Táctica 4 Táctica 4 Táctica 4

VALORES CENTRALES

Figura 5: Análisis VMOST


8
20

EL MARCO VMOST

El análisis estratégico
Por lo general, ni la visión ni la misión se entienden claramente aunque,
en términos sencillos, la visión es “en qué queremos convertirnos”, por
ejemplo, “estar entre las tres mejores empresas tecnológicas del mundo,”
mientras que la misión es “lo que queremos hacer”, es decir, por qué
existimos, por ejemplo, “para crear productos innovadores...”. La visión y
la misión aparecen con frecuencia acompañadas por una descripción de
los valores centrales de la empresa, es decir, los pilares de la empresa
que reflejan su cultura (por ejemplo, integridad, transparencia y respeto
medioambiental).

Gracias a este análisis, podemos obtener algunas de las fortalezas


y las debilidades que tendrán que incluirse en el análisis DAFO. Si el

80 Modelos fundamentales para analistas de negocios


marco VMOST está bien definido y comunicado, y los empleados están
comprometidos con el cumplimiento de lo que expone, entonces será
una fortaleza en el DAFO; de lo contrario, será una debilidad.

La información para el análisis VMOST ya puede definirse y documentarse


en una empresa o puede construirse a través de sesiones de brainstorming,
talleres o entrevistas con directores y managers de alto nivel.

http://analyticsmodels.blogspot.com.es/p/strategic-
analysis-templates.html
9
21

LA AUDITORÍA DE RECURSOS

El análisis estratégico
Para definir las fortalezas y las debilidades (que pueden utilizarse
posteriormente en un análisis DAFO), deberíamos plantear varias
OBJETIVO
preguntas tales como:
IDENTIFICAR LAS DEBILIDADES Y LAS FORTALEZAS DE UNA ORGANIZACIÓN.
»» ¿Tiene la empresa suficientes recursos disponibles para la
actual situación competitiva?
»» ¿Podrán respaldar desarrollos futuros?
»» ¿Cómo de difícil es para la empresa obtener más de estos
DEBILIDADES FORTALEZAS
recursos? ¿Y para sus competidores?
»» ¿Cómo de difícil es para un competidor imitar estos recursos
Falta de Menos que los Más que los
Recursos únicos o competencias centrales?
recursos únicos competidores competidores
»» ¿Qué nivel de importancia tienen para el negocio principal?
RECURSOS

80 Modelos fundamentales para analistas de negocios


FINANCIEROS En términos simplificados, podemos afirmar que se trata de
RECURSOS una fortaleza de la organización cuando cuenta con recursos
MATERIALES únicos o cuando tiene un mejor acceso a recursos similares en
RECURSOS comparación con sus competidores.
INTANGIBLES
La identificación de fortalezas y debilidades está basada en un
RECURSOS
HUMANOS
razonamiento cualitativo, pero todo esto puede estar respaldado
tanto por datos cuantitativos (ratios financieros, índices de
Figura 6: Ejemplo de auditoría de recursos reputación, tasa de rotación de los empleados, etc.) como por
datos cualitativos (talleres, entrevistas, brainstorming, etc.).
Este modelo identifica los recursos disponibles en una organización,
que pueden dividirse en: recursos financieros (fondos, préstamos,
créditos…), recursos materiales (plantas, edificios, maquinaria...), recursos
intangibles (reputación, conocimientos...) y recursos humanos.

http://analyticsmodels.blogspot.com.es/p/strategic-
analysis-templates.html
10
22

LA MATRIZ DE BOSTON

El análisis estratégico
Creado por el Boston Consulting Group, este método tiene
como objetivo decidir cómo asignar recursos en función del
OBJETIVO
posicionamiento en el mercado de distintos productos o servicios.
DECIDIR LA MEJOR ASIGNACIÓN DE RECURSOS ENTRE DISTINTOS El posicionamiento en el mercado depende de dos variables:
PRODUCTOS, LÍNEAS DE PRODUCTO O UNIDADES DE NEGOCIO.
»» Cuota de mercado: más que el mero porcentaje de la cuota
de mercado, la importancia relativa depende del número de
competidores, la posición según la cuota de mercado, y cómo
5 se compara la empresa con su mayor competidor. También
hay una importante suposición que limita este modelo: la
4.5 Producto 1
cuota de mercado se relaciona en términos positivos con los
Producto 2 beneficios y la rentabilidad.
4

80 Modelos fundamentales para analistas de negocios


INTERROGANTES ESTRELLAS
»» Crecimiento del mercado: se trata del índice de crecimiento
3.5
Crecimiento del mercado

de un producto o servicio, y representa no solo el crecimiento


Producto 4 potencial de los beneficios, sino también, el carácter atractivo
3
Producto 5 de un mercado.
2.5

Producto 3
2

1.5
PERROS VACAS
1

0.5

0
0 0.5 1 1.5 2 2.5 3 3.5 4 4.5 5

Cuota de mercado
Figura 7: Matriz de Boston
10
23

LA MATRIZ DE BOSTON

El análisis estratégico
Esta matriz facilita la toma de decisiones y está basada en las siguientes
cuatro categorías:

»» Estrellas: estos productos mantienen el nivel de inversión y de


estrategia, y serán una fuente importante de ingresos (vacas) cuando
el crecimiento del mercado disminuya.

»» Vacas (cash cows): son productos con una elevada cuota de mercado
y bajo crecimiento; la inversión necesaria es limitada.

»» Interrogantes: es importante mejorar la estrategia a través de la


inversión en las palancas adecuadas para aumentar las ventas y el
posicionamiento en el mercado. El objetivo consiste en mover estos

80 Modelos fundamentales para analistas de negocios


productos a la categoría de “estrellas”.

»» Perros: aquí existen dos opciones, o bien se decide no invertir en


estos productos o se decide redefinirlos.

La matriz de Boston se considera una herramienta útil para definir las


fortalezas y las debilidades de un análisis DAFO aunque también puede
desvelar futuras oportunidades para la organización.

Generalmente, los datos pueden recopilarse de la información publicada


en relación con las industrias, los sectores, los productos o los servicios.
Si los datos no están disponibles, es posible estimar la cuota de mercado
mediante la realización de una encuesta entre una muestra representativa
de clientes.

http://analyticsmodels.blogspot.com.es/p/strategic-
analysis-templates.html
11
24

LAS CINCO FUERZAS DE PORTER

El análisis estratégico
Esta herramienta forma parte del análisis estratégico externo, y resulta
útil para completar un análisis DAFO en relación con las oportunidades
OBJETIVO y las amenazas. Mientras que el análisis PESTEL se refiere a las
macrotendencias y al entorno externo, la técnica de Porter se centra en
ANALIZAR EL ENTORNO COMPETITIVO EN EL QUE OPERA LA EMPRESA.
el ámbito de la industria.

Resulta muy importante, antes de llevar a cabo este análisis, establecer


el ámbito de competencia de la empresa dado que este aspecto puede
cambiar los resultados de manera relevante. El análisis del entorno

AMENAZA competitivo se realiza a través de cinco categorías:

DE NUEVOS »» Competidores: ¿cómo de fuerte es la rivalidad entre competidores?


ACTORES »» Nuevos actores: ¿cómo de fácil es para los nuevos operadores

80 Modelos fundamentales para analistas de negocios


empezar a competir?
»» Sustitutos: ¿cuántos son? ¿qué importancia tienen?
»» Compradores: ¿cuántos hay? ¿en qué medida les resulta fácil
cambiar de proveedor?
PODER DE PODER DE »» Proveedores: ¿cuántos hay? ¿hasta qué punto son elevados los
RIVALIDAD costes de un cambio de suministro para los compradores?
NEGOCIACIÓN NEGOCIACIÓN
ENTRE
DE LOS DE LOS Las respuestas a estas preguntas muestran diversas oportunidades o
COMPETIDORES
PROVEEDORES COMPRADORES amenazas para la empresa; por ejemplo, si los clientes (compradores)
tienen pocas opciones y sus costes de cambio de suministro son
elevados, se trata de una oportunidad para la empresa.

Los datos pueden recopilarse de una amplia investigación del mercado


y de expertos de la industria a través de entrevistas, talleres y sesiones
AMENAZA DE de brainstorming.
SUSTITUTOS

http://analyticsmodels.blogspot.com.es/p/strategic-
Figura 8: Marco de las Cinco Fuerzas de Porter analysis-templates.html
12
25

EL ANÁLISIS DEL CICLO DE VIDA DE UN PRODUCTO

El análisis estratégico
Se han llevado a cabo diversos estudios sobre los ciclos de vida
de las industrias. Tanto los sectores como los productos suelen
OBJETIVO
arrancar desde una etapa emergente, pasando por una etapa
DEFINIR LA MADUREZ DEL SECTOR EN EL QUE ESTÁ COMPITIENDO UNA de crecimiento y, finalmente, alcanzan una etapa de madurez.
EMPRESA O LA MADUREZ DE UN PRODUCTO QUE ESTÁ VENDIENDO. Cuando llegan a este punto, o bien inician de nuevo el ciclo
gracias a las innovaciones o decaen.

Se trata de una herramienta concebida para reflexionar acerca de


la madurez de la industria y la madurez del tipo de productos que
se están fabricando. Para definir la etapa en la que se encuentra la
empresa, es necesario considerar los siguientes aspectos:

»» Etapa emergente: está caracterizada por un número pequeño

80 Modelos fundamentales para analistas de negocios


de empresas, ingresos bajos y, por lo general, ningún margen
o márgenes negativos.

»» Etapa de crecimiento: los márgenes están creciendo


rápidamente (durante un tiempo aunque menos durante la
última parte de la etapa de crecimiento), así como el número
de empresas.

ETAPA EMERGENTE ETAPA DE CRECIMIENTO ETAPA DE MADUREZ


CONSOLIDACIÓN
ESTABILIZACIÓN

DISRUPCIÓN

¿Cuánto dura? ¿Cuánto dura? ¿Cuánto dura?

¿Diseño dominante ¿Cuántos competidores


¿Radical o incremental?
o múltiples diseños? quedan?

Figura 9: Ciclo de vida competitivo


12
26

EL ANÁLISIS DEL CICLO DE VIDA DE UN PRODUCTO

El análisis estratégico
»» Etapa de madurez: los ingresos globales están creciendo a un ritmo
mucho menor; tanto los márgenes como el número de empresas
están disminuyendo.

Normalmente, después de la etapa emergente, se definen las


normas dominantes y tiene lugar el ascenso de una o unas cuantas
empresas (estabilización). Debido a que los márgenes están creciendo
rápidamente, numerosas empresas imitan a los pioneros con más
éxito y, en consecuencia, los márgenes comienzan a disminuir y unas
cuantas empresas empiezan a marcharse del mercado (consolidación).
Únicamente las empresas más eficientes permanecen en el mercado
durante la etapa de madurez, y a su final, asistimos o bien a su declive o

80 Modelos fundamentales para analistas de negocios


bien a una perturbación provocada por una innovación o un cambio en la
demanda. Por último, el proceso empieza de nuevo.

http://analyticsmodels.blogspot.com.es/p/strategic-
analysis-templates.html
13
27

LA MATRIZ DE DIVERSIFICACIÓN (MATRIZ G.E.)

El análisis estratégico
Uno de los objetivos de una empresa puede ser una expansión
mediante la diversificación de sus productos o servicios, que pueden
OBJETIVO
estar relacionados con el negocio principal o no tener ninguna
TOMAR DECISIONES SOBRE ESTRATEGIAS DE DIVERSIFICACIÓN. relación con el mismo. Para decidir si debemos mantener, crear o
cerrar unidades de negocio específicas, tenemos que empezar por
realizar un análisis detallado de las ventajas y las desventajas. Se
utiliza una simple matriz para explorar las principales oportunidades
en relación con la diversificación, que depende, por un lado, del
5 atractivo del sector de cada una de las unidades de negocio (que
Unidad 1 puede medirse a través de un análisis de las cinco fuerzas de Porter)
4.5
y, por otro lado, de la ventaja competitiva de las unidades de negocio.
Unidad 2
4

80 Modelos fundamentales para analistas de negocios


MANTENER CONSTRUIR Para las unidades de negocio situadas en el recuadro superior
3.5 derecho, la decisión debería ser invertir más, mientras que en los
Actividad de la industria

recuadros en los que hay o bien un buen carácter atractivo para la


Unidad 4
3 industria o bien una buena ventaja competitiva, la decisión debería
Unidad 5
ser mantener el rumbo actual. Las empresas deberían considerar el
2.5
cierre de las unidades de negocio que están situadas en el recuadro
Unidad 3
2 inferior izquierdo.

1.5 Los datos son principalmente cualitativos y, por lo general, se derivan


COSECHAR MANTENER de otras herramientas analíticas, como por ejemplo, las cinco fuerzas
1
de Porter o el ciclo de vida competitivo de la industria para el eje
Y (atractivo de la industria) y los mapas de posicionamiento o las
0.5
auditorías de recursos para el eje X (ventaja competitiva de la unidad
0 de negocio).
0 0.5 1 1.5 2 2.5 3 3.5 4 4.5 5

Ventaja competitiva de las unidades de negocio http://analyticsmodels.blogspot.com.es/p/strategic-


analysis-templates.html
Figura 10: Matriz de diversificación
14
28

LA MATRIZ DE INTERNACIONALIZACIÓN

El análisis estratégico
Una estrategia de internacionalización conlleva varios análisis
preliminares para responder a las dos preguntas principales:
OBJETIVO
¿dónde y cómo? No obstante, la principal compensación a la
TOMAR DECISIONES SOBRE ESTRATEGIAS DE INTERNACIONALIZACIÓN. hora de internacionalizarse se encuentra entre las ventajas de la
integración global y las desventajas de la capacidad de respuesta
local (la necesidad de adaptación).

La matriz con estos dos indicadores puede cumplimentarse o bien


5 con industrias diferentes (en caso de que queramos decidir qué
EMPRESA 1 unidad de negocio internacionalizar) o con distintos competidores
4.5 para identificar oportunidades de negocio.
EMPRESA 2
4 Con esta matriz (en el ejemplo de análisis de competidores), es

80 Modelos fundamentales para analistas de negocios


posible encontrar oportunidades en las que los competidores no
3.5
estén explotando las ventajas de la esquina superior izquierda
Integración global

EMPRESA 4 (gran integración global y baja necesidad de adaptación local),


3
EMPRESA 5 implementar estrategias con menores costes de adaptación, y
2.5 obtener mejores ventajas de integración globales. Además, es
posible encontrar oportunidades en las que las condiciones no
2
sean óptimas para otras empresas (esquina inferior derecha) y,
1.5 EMPRESA 3 por tanto, no haya competidores ahí, por lo que es posible ser
rentable. Los datos para este modelo se recopilan en estudios
1
o artículos publicados, datos públicos del sector y opiniones de
0.5 expertos (sesiones de brainstorming, talleres, etc.)

0
0 0.5 1 1.5 2 2.5 3 3.5 4 4.5 5

Respuesta local http://analyticsmodels.blogspot.com.es/p/strategic-


analysis-templates.html
Figura 11: Matriz de internacionalización
15
29

MODELO CANVAS

El análisis estratégico
Esta herramienta, inventada por Alexander Osterwalder et al.11,
puede utilizarse para analizar cómo está creando y aportando
OBJETIVO
valor a sus clientes una organización. Aunque su propósito original
ANALIZAR NUESTRO PROPIO MODELO DE NEGOCIO O LOS MODELOS DE era ayudar a crear un nuevo producto o negocio, en este libro se
NEGOCIO DE NUESTROS COMPETIDORES10. presenta el modelo canvas como una herramienta analítica, ya
que esos tipos de modelos no están incluidos aquí. Este modelo
también puede resultar útil para entender si una empresa es
un competidor o no, dado que analiza la propuesta de valor
ACTIVIDADES PROPUESTA DE RELACIONES CON SEGMENTOS DE que responde a las necesidades de los clientes. De hecho, las
RED DE SOCIOS
PRINCIPALES VALOR LOS CLIENTES CLIENTES
empresas no compiten en productos sino en las necesidades que
satisfacen o los problemas que resuelven para sus clientes.

80 Modelos fundamentales para analistas de negocios


RECURSOS CLAVE CANALES

ESTRUCTURA DE COSTES FUENTES DE INGRESOS

10
Es una herramienta que se utilizó inicialmente para la definición de nuevos productos o negocios pero, dado
que el propósito de este libro consiste en proporcionar herramientas analíticas, utilizamos el lienzo de modelo
de negocio como un modelo para el análisis de estrategias de negocio.
11
Alexander Osterwalder, Yves Pigneur, Tim Clark, y Alan Smith, Business Model Generation: A Handbook for
Visionaries, Game Changers, and Challengers (John Wiley and Sons, 2010).
Figura 12: Modelo Canvas
15
30

MODELO CANVAS

El análisis estratégico
El estudio incluye el análisis de nueve componentes clave del negocio
y cómo están relacionados entre sí. En primer lugar, definimos nuestros
segmentos de clientes y, a continuación, las propuestas de valor que
les estamos ofreciendo. La propuesta de valor es una necesidad que
satisfacemos o un problema que resolvemos para un segmento de
cliente específico. Podemos estar ofreciendo distintas propuestas de
valor a clientes diferentes; por ejemplo, un buscador proporciona, por una
parte, resultados de búsqueda a los usuarios de internet y, por otra parte,
espacios publicitarios a las empresas. Después, identificamos cómo
proporcionar este valor a nuestros clientes (canales) y cómo gestionar
nuestras relaciones con ellos (relaciones con los clientes). Llegados a
este punto, seremos capaces de describir nuestro modelo de ingresos

80 Modelos fundamentales para analistas de negocios


(fuentes de ingresos). Sin embargo, para entender cómo crear nuestras
propuestas de valor, necesitamos identificar nuestras actividades
principales, los recursos clave, y nuestra red de socios. Estos tres
componentes nos permiten identificar nuestra estructura de costes.
Para más información sobre este modelo, le animo a visitar la página web
oficial12 o a inscribirse en el curso online gratuito “How to Build a Startup”
(Cómo crear una startup)13.

http://analyticsmodels.blogspot.com.es/p/strategic-analysis-
templates.html

12
http://www.businessmodelgeneration.com/canvas/bmc
13
https://www.udacity.com/course/how-to-build-a-startup--ep245
16
31

EL ANÁLISIS DAFO

El análisis estratégico
El análisis DAFO es la consolidación de análisis internos y externos, y se
OBJETIVO utiliza para el establecimiento de una estrategia, por lo general en su
fase inicial, para así fijar las bases de distintas acciones estratégicas:
EN LO QUE RESPECTA A UNA EMPRESA, IDENTIFICAR LAS PRINCIPALES
FORTALEZAS QUE HAY QUE MANTENER, LAS OPORTUNIDADES QUE HAY QUE »» Análisis externo: análisis de las oportunidades y amenazas que
APROVECHAR, LAS AMENAZAS QUE HAY QUE REDUCIR, Y LAS DEBILIDADES provienen del entorno externo (PEST, PESTEL); por ejemplo, el uso
QUE HAY QUE GESTIONAR. creciente de dispositivos móviles puede ser una oportunidad que se
debe aprovechar o el creciente coste de la energía puede ser una
amenaza potencial.

»» Análisis interno: debilidades y fortalezas que provienen del análisis


interno (VMOST, auditoría de recursos, etc.) y del análisis competitivo
(mapa de posicionamiento, matriz de importancia-desempeño). Por

80 Modelos fundamentales para analistas de negocios


FUERZAS DEBILIDADES ejemplo, una marca muy conocida es una fortaleza y una definición
pobre de la estrategia de una empresa es una debilidad.

Reducir y tener en consideración como Desde esta matriz, el analista puede definir acciones estratégicas que
Mantener y usar para respaldar aprovechen oportunidades existentes, utilizando las fortalezas de la
riesgos potenciales para las acciones
las acciones estratégicas empresa como factores de éxito cruciales y reduciendo los riesgos que
estratégicas
pueden estar provocados por amenazas potenciales y por las debilidades
de la empresa. Dado que se trata de una consolidación de varios análisis,
las fuentes de información dependen de los análisis previos y de varias
OPORTUNIDADES AMENAZAS
técnicas de recopilación, tales como el brainstorming, el método Delphi
y las encuestas. El analista puede llevar a cabo directamente el proceso
de consolidación, pero suele ser una buena práctica consolidar los
Reducir y tener en consideración como
Aprovechar para el éxito resultados o compartir el análisis con otros integrantes de la empresa,
riesgos potenciales para las acciones
de las acciones estratégicas por ejemplo, a través de talleres o think tanks.
estratégicas

http://analyticsmodels.blogspot.com.es/p/strategic-
Figura 13: Análisis DAFO analysis-templates.html
17
32

LA MATRIZ DE ANSOFF

El análisis estratégico
La matriz de Ansoff suele llevarse a cabo después de realizar un análisis
DAFO, en el que las fortalezas, las debilidades, las oportunidades y las
OBJETIVO amenazas pueden transformarse en estrategias de negocio:

DEFINIR LA ESTRATEGIA DE NEGOCIO MÁS ADECUADA SOBRE LA BASE DE LA »» Penetración del mercado: la organización decide utilizar los
EXISTENCIA DE MERCADOS Y PRODUCTOS. productos existentes en el mercado existente mediante la mejora
de sus tácticas y estrategias para impulsar las ventas, por ejemplo, a
través de la publicidad, la promoción y la fijación de precios.

»» Desarrollo de productos: la organización decide desarrollar


nuevos productos para un mercado existente y añadirles nuevas
características.

80 Modelos fundamentales para analistas de negocios


»» Desarrollo del mercado: la organización decide vender productos
existentes en mercados nuevos, por ejemplo, mediante la
exportación a nuevos países.

»» Diversificación: la organización decide emprender un enfoque más


PRODUCTOS radical a través de la creación de un producto nuevo para un mercado
nuevo. Puede ser el resultado de una oportunidad producida por una
EXISTENTES NUEVOS
nueva tendencia identificada en el análisis DAFO.

Una vez definida la estrategia utilizando la matriz de Ansoff, tanto los


EXISTENTES Penetración en el mercado Desarrollo de productos objetivos como las estrategias y las tácticas pueden revisarse en el
MERCADOS

modelo VMOST. La información que se necesita para esta matriz suele


encontrarse en anteriores análisis internos, análisis externos y análisis
DAFO.

NUEVOS Desarrollo del mercado Diversificación

http://analyticsmodels.blogspot.com.es/p/strategic-
Figura 14: Matriz de Ansoff analysis-templates.html
LA FIJACIÓN DE PRECIOS
Y LA DEMANDA
18
34

INTRODUCCIÓN

La fijación de precios y la demanda


Para elegir el precio que maximice los ingresos y los beneficios,
resulta necesario determinar la disposición a pagar (WTP
o willingness to pay, en inglés) de los clientes. Idealmente,
deberíamos definir la disposición a pagar de cada cliente, aunque,
en la mayoría de los casos, solo es posible establecer la DAP para
distintos segmentos de clientes.

Podemos definir la DAP como el precio máximo que aceptaría


pagar una persona para adquirir un producto o servicio. Sin
DAP
embargo, resulta útil diferenciar entre dos conceptos: el precio
máximo y el precio de referencia14. El precio máximo es el valor
de un producto de referencia más el valor de diferenciación del

80 Modelos fundamentales para analistas de negocios


producto de interés; por ejemplo, la DAP de la marca B es el
Observaciones Encuestas valor de la marca A más el valor de diferenciación entre las dos
marcas. El precio de referencia es el precio máximo que pagaría
una persona por un producto o servicio asumiendo que no tenga
otras alternativas. En conclusión, podemos afirmar que la DAP es
Datos del Encuestas Encuestas
Experimentos o bien el precio máximo o bien el precio de referencia en función
mercado directas indirectas
de cual sea más bajo. Es posible utilizar varios métodos para
la estimación de la DAP, que pueden dividirse en dos grupos
principales: observaciones y encuestas.
Experimentos de Encuestas a
Análisis conjunto
laboratorio expertos

Experimentos Encuestas a Análisis de


sobre el terreno clientes elección discreta
14
Christoph Breidert, Estimation of Willingness-to-Pay: Theory, Measurement, Application (Deutscher
Universitätsverlag, 2006).
Figura 15: Clasificación de los métodos para la estimación de la DAP14
18
35

INTRODUCCIÓN

La fijación de precios y la demanda


DATOS DEL MERCADO »» Experimentos sobre el terreno: son pruebas en las que se
ofrecen distintos precios y productos a los clientes para una
La ventaja de los datos del mercado es que son fácilmente accesibles y
compra real.
no conllevan ningún coste que no sea el tiempo dedicado al análisis. No
obstante, existen varios inconvenientes: Un problema general de los experimentos es que resultan
bastante costosos.
»» Generalmente, no hay suficiente variación de precios en los datos
para probar la gama necesaria de la DAP.

»» Solo estamos analizando a nuestros clientes y no el mercado en su ENCUESTAS DIRECTAS


conjunto.
Las encuestas representan un método más rápido y más barato
»» Podemos simplemente definir si una persona tiene una DAP superior para determinar la DAP. Es posible entrevistar directamente a
al precio de venta, y perderemos información sobre los clientes que expertos o a clientes. En el primer caso, se pide a los expertos

80 Modelos fundamentales para analistas de negocios


han decidido no comprar el producto. en marketing y ventas que pronostiquen la DAP de los clientes.
Este método suele funcionar mejor en situaciones en las que el
»» Normalmente, las curvas de demanda se estiman a través de
número de clientes es reducido, y arroja resultados pobres cuando
regresiones, y, en este caso, deben cumplirse varias condiciones
la base de clientes es amplia y heterogénea. En este caso, resulta
(véase la 36. Introducción a las regresiones).
preferible llevar a cabo encuestas de clientes para preguntarles
directamente por su DAP. Una técnica ampliamente utilizada es
la que propone Van Westendorp. Aunque este método es fácil y
EXPERIMENTOS directo, tiene varias desventajas:
Existen dos categorías principales de experimentos:

»» Experimentos de laboratorio: se simulan los comportamientos de


compra en distintos escenarios en los que se cambian los precios
y los productos (uno de los principales inconvenientes es que la
intención de compra puede estar sesgada ya que los participantes
son conscientes del experimento y, además, no están gastándose su
dinero ni hay dinero real involucrado).
18
36

INTRODUCCIÓN

La fijación de precios y la demanda


»» Los clientes pueden tener incentivos para infravalorar su DAP (para »» Análisis conjunto: Se presentan distintos productos con
así influir en los precios reales del producto) o para exagerar su DAP precios y características diferentes a los encuestados y se les
(para mostrar un mayor estatus social delante de los investigadores). pide que los clasifiquen. Dado que no es posible determinar
si los encuestados comprarían el producto al precio indicado,
»» Incluso si los clientes intentan desvelar su verdadera DAP, se
se les suele pedir también que identifiquen un límite por
trata de una tarea difícil y complicada, y la respuesta puede estar
debajo del cual no comprarían el producto. Una desventaja
inconscientemente sesgada debido a numerosos factores.
de este método es que se muestran los precios habituales
»» Si los compradores no tienen ninguna referencia del mercado, del mercado; por lo tanto, si la DAP de los encuestados no
pueden sobrestimar su DAP. está incluida entre estos precios, la DAP estimada puede ser
bastante diferente de la verdadera.

ENCUESTAS INDIRECTAS

80 Modelos fundamentales para analistas de negocios


»» Análisis de elección discreta: Al igual que en un análisis
Con las encuestas indirectas, se presenta una situación más parecida a la conjunto, los productos se descomponen en características
del proceso de compra ya que se pide a los encuestados que indiquen para las que se calcula la utilidad. Sin embargo, en el análisis
si comprarían un producto específico a un determinado precio o no. Por de elección discreta, los encuestados tienen que elegir
esta razón, la conducta suele ser mejor que en las encuestas directas. un producto entre un conjunto de varias alternativas. La
Existen dos técnicas principales: el análisis conjunto y el análisis de principal diferencia metodológica es que la utilidad de las
elección discreta. características se estima a un nivel agregado (la población),
mientras que en el análisis conjunto, se calcula para cada
individuo. Para calcular la utilidad a nivel individual, podemos
procesar los resultados del análisis de elección discreta
utilizando un enfoque jerárquico de Bayes.
19
37

LA ELASTICIDAD PRECIO DE LA DEMANDA

La fijación de precios y la demanda


La elasticidad precio de la demanda es una medida que representa
cuánto va a cambiar la demanda debido a un cambio en el precio.
OBJETIVO
Con una elasticidad del precio de “1,” un incremento del 5% en el
DETERMINAR LA SENSIBILIDAD AL PRECIO DE LA DEMANDA. precio significa que la demanda aumentará un 5%. No obstante,
la elasticidad precio de la demanda suele ser negativa ya que un
aumento de precio previsiblemente producirá un descenso de la
demanda. Las elasticidades de -1 o 1 se consideran “elasticidades
de unidad,” dado que una variación en el precio desencadena una
variación proporcional en la demanda (positiva o negativa). Las
elasticidades con un valor absoluto inferior a 1 (por ejemplo, 0,4
250 € o -0,6) se consideran rígidas puesto que la variación en el precio
conlleva una variación menos que proporcional en la demanda,

80 Modelos fundamentales para analistas de negocios


mientras que las elasticidades superiores a 1 se consideran
200€
Actividad de la industria

elásticas.

150€ Para calcular la elasticidad del precio, podemos aplicar la


siguiente fórmula:

100€
y= -0.268x + 195.73
R2 = 0.9295
50€

0
0 100 200 300 400 500 600 700

Ventaja competitiva de las unidades de negocio

Figura 16: Elasticidad precio de la demanda


19
38

LA ELASTICIDAD PRECIO DE LA DEMANDA

La fijación de precios y la demanda


En esta fórmula, la variación porcentual de la demanda se divide por Por otro lado, los datos pueden analizarse en mayor detalle
la variación porcentual en el precio. Podemos coger, o bien los dos mediante la utilización de una regresión (véase 38. La regresión
precios ofrecidos más cercanos, o bien calcular la elasticidad tomando lineal). Por ejemplo, en la Figura 16 la elasticidad del precio cambia
precios más alejados. También podemos calcular la elasticidad utilizando radicalmente a partir de un determinado nivel de precio. En otros
puntos intermedios entre los precios ofrecidos. Con una EPD de -0,4, casos, los datos también pueden estar dispersos. En cualquiera
si aumentamos el precio un 20%, podemos esperar que la demanda de los casos, deberíamos pensar en la posibilidad de segmentar
aumente un 8% (-0,4 * 0,2 = -0,8). Sin embargo, este cálculo es menos los datos ya que esto puede estar causado por la heterogeneidad
preciso para las grandes variaciones de precio. Suele ser mejor calcular de los encuestados (por ejemplo, las personas mayores son
las “elasticidades arco” en las que la variación en la demanda se calcula menos sensibles al precio mientras que los jóvenes son mucho
gradualmente para cada variación del 1% en el precio (en nuestro caso, 20 más sensibles al precio).
veces). Con este cálculo, se estima que nuestra reducción de la demanda
Los datos utilizados para un cálculo de la EPD pueden ser, o
estará en torno al 7%: 1 - (1,2 ^ (-0,4)).

80 Modelos fundamentales para analistas de negocios


bien datos reales procedentes de transacciones, o bien datos
Además, a la hora de calcular la EPD, resulta importante tomar en de encuestas. En caso de que utilicemos datos de transacciones
consideración el periodo de tiempo y la inflación: tendremos que ser capaces de excluir las variaciones de
la demanda provocadas por factores que no sean el precio
»» Periodo de tiempo: si nuestros datos están repartidos a lo largo de
(podemos, por ejemplo, incluir otras variables de predicción en
un periodo largo de tiempo (es decir, varios años), tendremos que
la regresión – véase “La regresión con múltiples variables” del
considerar que la demanda podría ser diferente debido a un cambio
apartado 39. Otras regresiones). Si utilizamos datos de encuestas,
en las pruebas de consumidores, nuevos sustitutos, etc. La oferta
pueden tomarse en consideración los modelos de fijación de
también puede haber cambiado y esto tiene un efecto importante en
precios descritos en los siguientes apartados.
el equilibrio de precios con la demanda.

»» Inflación: deberíamos utilizar precios reales ya que, por ejemplo, si


nuestro precio ha aumentado un 3% pero la inflación está en torno al
3%, entonces, en la práctica, nuestro precio no ha cambiado.

http://analyticsmodels.blogspot.com.es/p/pricing-and-
demand-templates.html
20
39

EL MÉTODO DE FIJACIÓN DE PRECIOS GABOR–GRANGER

La fijación de precios y la demanda


Este método es útil para tomar decisiones generales de fijación de
precios. Los datos se recopilan a través de encuestas en las que
OBJETIVO
se pregunta a cada encuestado sobre su intención de compra
DEFINIR EL RANGO DE PRECIOS ÓPTIMO PARA UN PRODUCTO O SERVICIO. y se le muestran varios precios que van subiendo o bajando en
función de sus respuestas anteriores. De manera alternativa, los
precios pueden aparecer de forma aleatoria o siguiendo una
serie fija. Se considera que el precio más elevado al que informa
el encuestado que compraría el producto es su DAP. Una vez
que tengamos un límite de precio específico (DAP) para cada
entrevistado, podremos trazar una curva de demanda acumulada.

Dado que tenemos a nuestra disposición la información sobre la

80 Modelos fundamentales para analistas de negocios


demanda y la DAP, podremos calcular la curva de ingresos en
el gráfico y establecer el precio óptimo al que se maximizan los
ingresos (Figura 17).

http://analyticsmodels.blogspot.com.es/p/pricing-and-
Figura 17: Método de fijación de precios Gabor–Granger demand-templates.html
21
40

EL MEDIDOR DE SENSIBILIDAD DE PRECIOS DE VAN WESTENDORP

La fijación de precios y la demanda


Se pide a los encuestados que definan los precios para un producto
a cuatro niveles: demasiado barato, barato, caro y demasiado
OBJETIVO
caro. Normalmente, se plantean las siguientes preguntas:
DETERMINAR LAS PREFERENCIAS DE PRECIO DEL CONSUMIDOR.
»» ¿A qué precio considerarías que el producto es tan caro que
no lo comprarías? (Demasiado caro)

»» ¿A qué precio considerarías que el producto es tan barato que


dudarías de su calidad? (Demasiado barato)

»» ¿A qué precio considerarías que el producto empieza a ser


lo suficientemente caro que empezarías a replantearte su
compra? (Caro)

80 Modelos fundamentales para analistas de negocios


»» ¿A qué precio considerarías que el producto tiene una buena
relación calidad-precio? (Barato)

Los resultados se organizan por nivel de precio, con la demanda


acumulada para cada pregunta. La demanda suele acumularse
de manera inversa para las categorías de “barato” y “demasiado
barato” para definir los puntos de cruce con las otras dos variables
(Figura 18).

Figura 18: Medidor de sensibilidad de precios de Van Westendorp


21
41

EL MÉTODO DE FIJACIÓN DE PRECIOS GABOR–GRANGER

La fijación de precios y la demanda


Gracias a las cuatro intersecciones, tenemos los límites entre los cuales Con este modelo, podemos definir los límites del precio pero no
habría que establecer el precio (límite inferior y límite superior). Aunque a podemos calcular ni la probabilidad de compra ni la demanda.
veces se usan también los otros dos niveles de precio, yo prefiero utilizar Para la estimación de la demanda (y de los ingresos), podemos
este modelo para definir los precios principales y los precios máximos plantear una pregunta adicional relacionada con la probabilidad
de un producto, mientras que los precios intermedios no deberían ser de comprar el producto a un precio específico con una escala
estáticos sino que deberían cambiar en función de varios factores de cinco puntos de Likert (5 = muy de acuerdo, 1 = muy en
(periodo de compra, lugar, condiciones, etc.). desacuerdo). El precio que se debería incluir puede ser la media
entre el precio “barato” y el precio “caro” para cada encuestado.
Un enfoque más completo sería plantear la pregunta tanto
para el precio “barato” como para el precio “caro”. Después, los
resultados tienen que convertirse en probabilidades de compra,
por ejemplo, muy de acuerdo = 70%, de acuerdo = 50%, etc. Con

80 Modelos fundamentales para analistas de negocios


estos resultados, podemos construir una curva de ingresos y
una curva de demanda acumulada (Figura 19). El precio óptimo
es aquél al que se maximizan los ingresos (es importante tener
en cuenta que este enfoque tiene como objetivo maximizar los
ingresos y no tiene en cuenta ningún coste variable).

Figura 19: Ampliación del MSP de Van Westendorp con estimación de ingresos y de demanda

http://analyticsmodels.blogspot.com.es/p/pricing-and-
demand-templates.html
22
42

EL TEST MONÁDICO DE PRECIOS

La fijación de precios y la demanda


En el test monádico de precios, el comportamiento de compra se
prueba para varios niveles de precio, pero a cada encuestado se
OBJETIVO
le muestra tan solo un único precio. Debido a que este método es
ANALIZAR LA INTENCIÓN DE COMPRA DE LA GENTE A DISTINTOS NIVELES así, se necesita una amplia base de encuestados. Una variación
DE PRECIO Y PARA PRODUCTOS ALTERNATIVOS. de este modelo que requiere una muestra más reducida es el test
monádico secuencial en el que se muestran a los encuestados
distintos niveles de precio, uno cada vez (por lo general, no se
presentan más de tres niveles de precio a cada encuestado).
Resulta importante tener en cuenta que el test monádico
secuencial conlleva algunos sesgos y suele mostrar una intención
de compra mayor en los precios más bajos que el test monádico.

80 Modelos fundamentales para analistas de negocios


Probablemente sea el mejor método para analizar el
35 comportamiento de compra a un precio específico; no obstante,
solo resulta útil si tenemos una idea de los niveles de precio
30
adecuados para un determinado mercado. Si este no es el caso,
25 tendríamos que obtener esta información antes de realizar el
análisis, a través de métodos de encuesta directa o indirecta
20
Precio

(véase 18. Introducción).


15
Una vez recopilados los datos, podemos resumir el
10 comportamiento de compra para los distintos niveles de precio
5 (por ejemplo, el 11% del mercado compraría el producto a 30€,
el 32% a 20€, etc.), y así podemos calcular la curva de demanda.
0
Los datos suelen recopilarse a través de encuestas pero también
0 5 10 15 20 25 30 35 40
pueden obtenerse mediante experimentos controlados.

Cantidad
http://analyticsmodels.blogspot.com.es/p/pricing-and-
Figura 20: Curva de demanda derivada de un test monádico de precios demand-templates.html
23
43

EL ANÁLISIS CONJUNTO

La fijación de precios y la demanda


»» Métodos de composición: se pide a los encuestados que
OBJETIVO evalúen directamente los distintos niveles de características.
IDENTIFICAR LAS PREFERENCIAS DE LOS CLIENTES Y LOS CLIENTES »» Métodos híbridos: se utilizan métodos de composición
POTENCIALES CON RESPECTO A LAS CARACTERÍSTICAS ESPECÍFICAS DE UN durante la primera fase para presentar un número limitado de
PRODUCTO. TAMBIÉN PUEDE UTILIZARSE PARA DEFINIR LA DISPOSICIÓN A versiones del producto en la segunda fase (que resultan útiles
PAGAR (DAP) Y LA CUOTA DE MERCADO DE DISTINTOS PRODUCTOS. cuando tenemos una amplia combinación de características
y niveles).
El análisis conjunto es una técnica de prospección que se utiliza para
Además de los métodos descritos anteriormente, se utilizan
identificar las preferencias de los clientes o de los posibles clientes. Se
varios tipos de análisis conjuntos adaptables para aumentar la
muestran a los encuestados varios productos con distintos niveles de
eficacia del análisis conjunto, especialmente cuando el número
características diferentes (por ejemplo, color, funcionamiento, etc.) y se les
de características es elevado.

80 Modelos fundamentales para analistas de negocios


pide que clasifiquen los productos. Se utiliza después esta clasificación
para calcular la utilidad de cada característica y cada producto a En los análisis conjuntos, el precio suele incluirse como una
nivel individual. Los resultados pueden utilizarse para definir la mejor característica y se calcula la utilidad del precio. Sin embargo, esto
combinación de características y precio o para simular las variaciones en da lugar a varios problemas:
la cuota de mercado en relación con los competidores (si se presentan
»» Por definición, el precio no tiene ninguna utilidad sino
también productos de la competencia).
que se utiliza a cambio de la suma de las utilidades de las
En primer lugar, resulta muy importante dedicarle suficiente tiempo características del producto.
al diseño del análisis, empezando por la selección de los niveles de
»» Los rangos de precio, el número de niveles y la percepción
características y las características más importantes.
de los encuestados pueden sesgar e influir en las respuestas.
Existen tres tipos de métodos:
»» La intención de compra no está incluida por lo que no
»» Los métodos de descomposición: se presentan a los encuestados sabemos si el encuestado compraría realmente el producto
distintas versiones del producto, tienen que clasificarlas y, después, al precio presentado (para evitar parcialmente este problema,
se calculan las utilidades a nivel de las características mediante la se suele pedir a los encuestados que definan un límite en la
descomposición de las observaciones. clasificación por debajo del cual no comprarían los productos).
23
44

EL ANÁLISIS CONJUNTO

La fijación de precios y la demanda


La disposición a pagar se calcula como el tipo de cambio entre la utilidad En el ejemplo, presentamos un análisis conjunto clásico que
del precio y la utilidad de la característica. No obstante, para evitar los incluye el precio como característica adicional. Incorpora una
problemas que acabamos de mencionar, deberíamos considerar un característica de tres niveles, una característica de dos niveles
enfoque distinto, como por ejemplo, dividir el análisis en dos etapas: (color), y tres niveles de precio. Se presentan productos de perfil
completo a los encuestados (método de composición), y se les
1. Realizar un análisis conjunto clásico para las características que no
pide que expresen su preferencia en una escala del 0 al 10 (con
sean de precio para definir las utilidades.
10 representando su producto favorito) en lugar de clasificar los
2. Preguntar sobre la intención de compra de perfiles completos productos.
de producto con distintos precios para definir los límites inferior y
La utilidad de un encuestado se calcula eliminando un nivel
superior entre los que el encuestado aceptaría adquirir el producto.
para cada característica para llevar a cabo una regresión lineal
Con esta información, podremos calcular una función lineal en la múltiple con variables ficticias. Las variables eliminadas tendrán

80 Modelos fundamentales para analistas de negocios


que el precio será la variable dependiente y la utilidad será la variable una utilidad de “0”, mientras que las características incluidas en la
independiente. regresión tendrán la utilidad correspondiente a los coeficientes de
regresión. Tras comprobar la importancia de cada característica
caract. 1 caract. 1 caract. 1 caract. 2 caract. 2 precio precio precio (valor p < 0,05; véase 38. La regresión lineal), pueden sumarse los
nivel 1 nivel 2 nivel 3 nivel 1 nivel 2 nivel 1 nivel 2 nivel 3 Preferencia coeficientes para desarrollar la ecuación de utilidad.
A B C Negro Blanco 10 € 20 € 30 € Preferencia
La ecuación de utilidad a nivel individual puede utilizarse para
1 0 0 1 0 1 0 0 5
1 0 0 1 0 0 1 0 5 definir la combinación más rentable de características y precio.
1 0 0 1 0 0 0 1 0
1 0 0 0 1 1 0 0 8 También permite la elaboración de escenarios en los que se
1 0 0 0 1 0 1 0 5
1 0 0 0 1 0 0 1 2 calculan las variaciones en la cuota de mercado causadas por
0 1 0 1 0 1 0 0 7
0 1 0 1 0 0 1 0 5 los cambios en el precio o las características del producto, en
0 1 0 1 0 0 0 1 3
0 1 0 0 1 1 0 0 9 comparación con los productos ofrecidos por los competidores.
0 1 0 0 1 0 1 0 6
0 1 0 0 1 0 0 1 5
En especial para los escenarios de cuota de mercado, resulta
1 1 0 1 0 0 10
0
0
0
0 1 1 0 0 1 0 7
importante definir la intención de compra pidiendo a los
0 0 1 1 0 0 0 1 5 encuestados que fijen un “límite” más allá del cual no comprarían
0 0 1 0 1 1 0 0 9
0 0 1 0 1 0 1 0 7 el producto.
0 0 1 0 1 0 0 1 8

Figura 21: Combinaciones y preferencias expresadas en un análisis conjunto


23
45

EL ANÁLISIS CONJUNTO

La fijación de precios y la demanda


En la plantilla, se presenta una segunda hoja en la que el precio »» Análisis clásico conjunto: se muestran a los encuestados todas
no se incluye como característica adicional pero se pregunta a los las combinaciones de los niveles de características y se les pide,
encuestados sobre el mismo de forma separada, o bien directamente, o bien que los clasifiquen, o bien que definan sus preferencias
o bien enseñándoles distintas combinaciones de precio-producto y según una determinada escala (por ejemplo, del 0 al 10). En caso
preguntándoles por su intención de compra. Normalmente, el último de que el número de combinaciones sea demasiado amplio,
ejemplo funciona mejor, pero si tenemos numerosas combinaciones, no deberíamos dividir las combinaciones y presentarlas varias veces
podremos mostrarlas todas. a los encuestados o presentar únicamente un determinado
porcentaje de todas las combinaciones posibles (aleatoriamente

50 €
seleccionadas). También deberíamos pedir un “límite”, es decir,
el puesto en la clasificación o el nivel de preferencia en el que el
y= 3.9881x + 5.4036 encuestado cambiaría su intención de compra.
40€ R2 = 0.8224

80 Modelos fundamentales para analistas de negocios


»» Análisis conjunto en el que el precio no es una característica:
el proceso es el mismo que en el análisis conjunto clásico pero
30€
no se incluye el precio como característica. Tras pedir a los
Precio

encuestados que clasifiquen o fijen sus preferencias en relación


20€ con varias combinaciones de niveles de características, se les
pregunta si comprarían una combinación determinada a un precio
específico. En función de la respuesta, se modifica la utilidad o el
10€
precio para identificar la DAP. Si el número de combinaciones es
limitado, es posible probar cada una; si el número es elevado,
0 no se pueden probar todas las combinaciones y será necesario
0 2 4 6 8 10 12 14 calcular la DAP para distintos niveles de utilidad y, a continuación,
Utilidad calcularla para todas las combinaciones.

Figura 22: Relación lineal precio-utilidad

Existen dos enfoques principales a la hora de elaborar encuestas para un http://analyticsmodels.blogspot.com.es/p/pricing-and-


análisis conjunto: demand-templates.html
24
46

EL ANÁLISIS CONJUNTO BASADO EN ELECCIONES

La fijación de precios y la demanda


»» Se debería incluir una opción de “ninguno” entre los productos
OBJETIVO presentados en cada escenario de compra.
IDENTIFICAR LAS PREFERENCIAS DE LOS CLIENTES Y LOS CLIENTES »» Cada escenario debería incluir un máximo de 5 productos.
POTENCIALES CON RESPECTO A LAS CARACTERÍSTICAS ESPECÍFICAS DE UN
PRODUCTO. TAMBIÉN PUEDE UTILIZARSE PARA DEFINIR LA DISPOSICIÓN A »» Se suelen presentar entre 12 y 18 escenarios a cada
PAGAR Y LA CUOTA DE MERCADO DE DISTINTOS PRODUCTOS. encuestado.

Por lo general, no es posible presentar todas las combinaciones


en el mismo escenario, y una buena práctica consiste en mostrar
Es preferible utilizar este método frente al análisis conjunto porque entre dos y cinco productos en cada escenario. A la hora de
representa una situación de compra más realista y, en caso de tener un elegir la combinación de productos para cada escenario, resulta
elevado número de combinaciones posibles, resulta suficiente mostrarle importante que todos los productos se muestren el mismo

80 Modelos fundamentales para analistas de negocios


solo determinado número de combinaciones a cada encuestado. Así, las número de veces y que cada producto se compare en igualdad
respuestas se analizan juntas y la utilidad se define a nivel agregado (y no de condiciones con otras alternativas.
a nivel individual como en el análisis conjunto).
Una vez recopilados los datos, las utilidades se calculan a nivel
Para este método, también resulta muy importante elegir con cuidado agregado. Es posible calcular la cuota de mercado de cada
las características (como regla general, no más de siete incluido el producto utilizando la “cuota de preferencias”:
precio) y los perfiles de producto que se van a presentar, es decir, las
»» Las utilidades de los productos se calculan sumando todas
combinaciones de características. Una vez definidos los perfiles de
las utilidades de las características.
producto y las características, se diseñan los escenarios entre los que
elegir. Un escenario es una combinación de varios productos que se »» Las utilidades de los productos se “exponencian” (es decir
presenta a los encuestados. A la hora de definir escenarios, deberían que la constante “e” se eleva a la potencia de la utilidad:
aplicarse las siguientes recomendaciones: e^utilidad).

»» La cuota de mercado se calcula como la utilidad del producto


“exponenciada” y, después, dividida por la suma de todas las
utilidades ”exponenciadas”.
24
47

EL ANÁLISIS CONJUNTO BASADO EN ELECCIONES

La fijación de precios y la demanda


Para obtener las utilidades a nivel individual, se utiliza un método Debido a la complejidad del análisis conjunto basado en
denominado “modelo jerárquico de Bayes”. Este método nos permite elecciones, recomiendo la utilización de herramientas
calcular una cuota de mercado más fiable basada en la elección de cada específicas (es posible encontrar varias herramientas
encuestado mediante la utilización de tres técnicas principales: de este tipo buscando en internet) o utilizando
complementos de Excel, como el complemento
»» Primera elección: cada encuestado elige el producto que maximiza
ofrecido por XLSTAT15, del que es posible descargarse
su utilidad (esta técnica se sugiere para productos caros que conllevan
un ejemplo en Excel con los resultados de un análisis
una evaluación minuciosa, como los coches o las casas).
conjunto basado en elecciones:
»» Cuota de preferencia: cada encuestado adquiere una parte de
h t t p s : // h e l p . x l s t a t . c o m / c u s t o m e r/ e n / p o r t a l /
cada producto en función de la cuota de utilidades (se recomienda
articles/2062347-running-a-choice-based-conjoint-
cuando un producto se compra varias veces durante un determinado
analysis-cbc-with-xlstat
periodo).

80 Modelos fundamentales para analistas de negocios


»» Primera elección aleatoria: cada encuestado elige un producto con
una probabilidad proporcional a su utilidad.

Este método también resulta útil para predecir las variaciones de la cuota
de mercado en comparación con la competencia a través de la creación
de simulaciones en las que se cambian los precios u otras características
de producto. Por ejemplo, podemos analizar si un descuento puede
atraer suficiente cuota de mercado para compensar la reducción del
precio. En este tipo de simulaciones, asumimos que los competidores
no están modificando tanto las características como el precio, aunque en
realidad este no podría ser el caso. Por ello, deberíamos simular por lo
menos varios escenarios que incluyan posibles reacciones por parte de
los competidores. Para adoptar un enfoque más complejo, tendríamos
que incluir un modelo de teoría de juegos (véase 76. Los modelos de la
teoría de juegos). 15
https://www.xlstat.com/es/soluciones/funciones/choice-based-conjoint-analysis
EL ANÁLISIS
DEL CLIENTE
25
49

INTRODUCCIÓN

El análisis del cliente


A diferencia de los demás modelos descritos en este libro, el análisis del
cliente examina, predice y prescribe a nivel individual propiamente dicho.
La principal idea es que una empresa tenga a su disposición “customer
equity” (el valor de su base de clientes) que representa la suma de los
valores de cada cliente. El valor viene determinado por el comportamiento
de distintos clientes, como la cantidad gastada, la frecuencia de compra,
el nivel de recomendación, etc.

El análisis del cliente permite a las empresas segmentar su base de


clientes de manera adecuada y personalizar sus productos y servicios
para cada grupo de clientes o, incluso, para cada cliente individual.
La personalización les permite retener a sus clientes más valiosos y

80 Modelos fundamentales para analistas de negocios


aumentar el valor de los clientes implementando de manera adecuada
determinadas técnicas comerciales como el upselling (las ventas
adicionales), el cross-selling (las ventas cruzadas), los programas de
recomendación, etc.

Los datos a nivel individual son más complicados de recopilar y más


complejos de analizar que los datos agregados. La mayor parte de esta
información proviene de los datos históricos del mercado (es decir, datos
de la empresa sobre las compras, las iniciativas de los clientes y datos
de elaboración de perfiles), pero suelen complementarse con datos
procedentes de encuestas.
26
50

EL MODELO RFM

El análisis del cliente


Este es, probablemente, el modelo más sencillo para la estimación
del valor de un cliente. A pesar de su simplicidad, también es
OBJETIVO
famoso por su fiabilidad, que está basada en tres variables:
CALCULAR EL VALOR VITALICIO DE UN CLIENTE O GRUPO DE CLIENTES.
»» Recencia: cuanto más reciente sea la última compra o
interacción, más dispuesto estará el cliente a aceptar otra
interacción.

»» Frecuencia: cuantas más veces compre un cliente, más


valioso será para la empresa.

»» Valor monetario: el valor total de un cliente también depende


de la cantidad gastada durante un determinado periodo.

80 Modelos fundamentales para analistas de negocios


Por lo general, estas tres variables se transforman en indicadores
comparables (por ejemplo, en un indicador de entre “0 y 1”) y
se suman para obtener un indicador del valor total. También
podemos definir distintos pesos para cada indicador.

FRECUENCIA VALOR
INDICADOR
RECENCIA INDICADOR (nº compras INDICADOR MONETARIO VALOR TOTAL
CLIENTE VALOR
(nº meses) RECENCIA últimos 12 FRECUENCIA (total últimos (de 0 a 1)
MONETARIO
meses) 12 meses)

1 1 1.00 3 0.33 300 0.60 0.64

2 2 0.75 4 0.50 270 0.48 0.58

3 1 1.00 7 1.00 390 0.96 0.99

4 4 0.25 1 - 400 1.00 0.42

5 5 - 3 0.33 150 - 0.11

6 3 0.50 5 0.67 220 0.28 0.48

7 2 0.75 2 0.17 190 0.16 0.36

8 1 1.00 4 0.50 270 0.48 0.66


http://analyticsmodels.blogspot.com.es/p/customer-
Figura 23: Valor del cliente calculado mediante un modelo RFM analytics-templates.html
27
51

EL VALOR VITALICIO DEL CLIENTE 1

El análisis del cliente


El valor vitalicio del cliente es un indicador que representa el valor
neto actual de un cliente en función de los futuros ingresos y
OBJETIVO
costes estimados. Los principales componentes de este cálculo
CALCULAR EL VALOR VITALICIO DE UN CLIENTE O GRUPO DE CLIENTES. son:

»» Margen medio de compra (ingresos – costes).

»» Frecuencia de compra.

»» Costes de marketing.

»» Tasa de descuento o coste del capital.

Existen varias maneras de calcularlo y se han propuesto distintas

80 Modelos fundamentales para analistas de negocios


fórmulas. La parte más difícil consiste en calcular la repetición o
retención del cliente (en marcos contractuales), así como prever
ANUAL ANUAL ANUAL
la cantidad monetaria que un cliente va a gastar en el futuro. Es
COSTE CONTRIBUCIÓN TASA DE TASA DE
CLIENTE VVC
ADQUISICIÓN MARGINAL RETENCIÓN DESCUENTO importante recordar que el VVC se refiere al futuro y no al pasado,
1 80 130 80% 10% 267 por lo que utilizar datos del pasado de un cliente no es el mejor
2 80 200 80% 10% 453 método para calcular el VVC. Una buena práctica consiste en
3 80 220 80% 10% 507 segmentar a los clientes y calcular la retención y los patrones de
4 80 100 80% 10% 187 gasto basándose en clientes similares. Y, a continuación, puede
5 80 400 80% 10% 987 aplicarse la siguiente fórmula:
6 80 340 80% 10% 827

7 80 310 80% 10% 747

8 80 290 80% 10% 693

Figura 24: Valor vitalicio del cliente de distintos clientes


27
52

EL VALOR VITALICIO DEL CLIENTE 1

El análisis del cliente


»» VVC = valor vitalicio del cliente. este cálculo no se utiliza casi nunca debido a la falta de
»» MC = contribución marginal anual, es decir, los ingresos de compras información. De hecho, para calcular el valor de recomendación
totales en un año menos los costes unitarios de producción y de un cliente, necesitamos información sobre los promotores/
marketing. partidarios y los clientes que han recibido la recomendación,
y para estos últimos, deberíamos ser capaces de distinguir a
»» r = tasa de retención (anual).
aquellos que hubieran realizado la compra de todos modos (sin
»» d = tasa de descuento.
la recomendación). A modo de indicador, podemos utilizar el NPS
»» CA = coste de adquisición (coste único gastado por la empresa para (véase 29. El Net Promoter Score® (NPS®)) combinado con otras
llegar a un cliente nuevo). informaciones procedentes de encuestas tales como preguntar
La tasa de descuento puede ser el coste medio de capital para la empresa si un cliente ha recibido una recomendación y en qué medida ha
o la correspondiente industria. Se utiliza para amortizar el valor de los afectado esta recomendación a la compra.

80 Modelos fundamentales para analistas de negocios


futuros beneficios para así calcular lo que valen actualmente. Los datos históricos del mercado representan la principal fuente
Con esta fórmula, podemos calcular el VVC de un único cliente o un de información (a nivel individual, por lo general, de los sistemas
segmento de clientes. En caso de cálculo a nivel individual, deberíamos CRM), pero pueden enriquecerse con datos de encuestas, por
utilizar la tasa de retención (R) de clientes similares, por ejemplo, clientes ejemplo, en relación con la probabilidad de repetir la compra o
que suelen comprar productos similares, u otras técnicas más sofisticadas, recomendar el producto.
por ejemplo, el análisis clúster.

Cuando definimos el valor de un cliente o un grupo de clientes, podemos


tomar decisiones sobre el nivel de atención, la inversión en marketing y
los costes de retención, o bien sobre la cantidad que podemos gastar (es
decir, el coste de adquisición) para atraer a clientes con un VVC parecido.

Aunque resulte bastante difícil de calcular, tenemos que considerar


que la fórmula del VVC no toma en consideración el valor generado por
las recomendaciones. Aunque se han propuesto algunas fórmulas16,

http://analyticsmodels.blogspot.com.es/p/customer-
16
https://hbr.org/2007/10/how-valuable-is-word-of-mouth analytics-templates.html
28
53

EL VALOR VITALICIO DEL CLIENTE 2

El análisis del cliente


En el anterior apartado, he explicado los principios del VVC y cómo
calcularlo. Sin embargo, uno de los problemas era la estimación
OBJETIVO
de la tasa de retención (para la que la simplificación consiste
CALCULAR LA RETENCIÓN Y EL IMPORTE DEL GASTO FUTURO DE LOS en aplicar la tasa de retención media de clientes similares) y las
CLIENTES. cantidades de gasto futuro (por lo que asumimos que el importe
del gasto medio de cada cliente no va a cambiar en el futuro).
A pesar de la facilidad asociada a la implementación de este
enfoque, puede resultar demasiado simplista y fracasar a la hora
de ayudarnos a calcular un VVC fiable.

Existen varios métodos para calcular la retención y los importes


de gasto pero algunos pueden ser demasiado complejos. El

80 Modelos fundamentales para analistas de negocios


método que voy a proponer tiene un buen equilibrio entre nivel
AÑO 1

SEGMENTOS DE TOTAL ACTIVOS DE VALOR CLIENTES


de exactitud y simplicidad de implementación, y está basado en
CÁLIDOS FRÍOS INACTIVOS
CLIENTES CUSTOMERS ALTO VALOR ESCASO NUEVO la probabilidad y la segmentación de clientes.
ACTIVOS DE
180 80 40 30 20 10 0
ALTO VALOR
El primer paso consiste en coger los datos del cliente del año
ACTIVOS DE
VALOR ESCASO
200 20 60 60 40 20 0 -2 y segmentarlos en función de su valor y su nivel de actividad.
CÁLIDOS 270 30 50 80 70 40 0 Para el valor, podemos utilizar el importe gastado durante un año
AÑO 2

FRÍOS 200 10 20 30 60 80 0 determinado (que es una mezcla de la cantidad media gastada


INACTIVOS 160 10 15 25 30 80 0 por compra y la frecuencia de las compras), y para el nivel de
CLIENTES
NUEVOS
45 10 15 10 10 0 0
actividad, podemos utilizar la recencia de la última compra (por
VALOR TOTAL 660.500 € 320.000 € 200.000 € 117.500 € 23.000 € -€ -€
ejemplo, el número de días entre la última compra y el final del
AÑO 1
año analizado). Para el nivel de actividad, también podemos usar
Figura 25: Matriz de transición de segmentos de clientes una mezcla de recencia y frecuencia.
28
54

EL VALOR VITALICIO DEL CLIENTE 2

El análisis del cliente


En el segundo paso, tenemos que definir un número específico de Con la matriz de transición de probabilidades, podemos simular
segmentos de cliente. La técnica de segmentación puede ser, o bien cómo cambiarán los segmentos en el futuro y quizás darnos
una matriz simple de doble entrada, o bien una técnica de agrupación cuenta de que estamos reduciendo peligrosamente los clientes
estadística. Podemos, por ejemplo, acabar definiendo seis agrupaciones activos en favor de los inactivos y que, por lo tanto, necesitamos
(o clústers): adquirir un número ligeramente mayor de cada tipo de cliente
para evitar una reducción de los beneficios. En cualquier caso,
»» Activos de alto valor.
con esta matriz, podemos simular varios años por adelantado
»» Activos de valor escaso.
y estimar cuántos clientes seguirán activos. También podemos
»» Cálidos.
calcular su valor multiplicando el valor medio de cada segmento
»» Fríos.
por el número de clientes de dicho segmento durante un año
»» Inactivos.
específico (año 0, año +1, año +2, etc.).
»» Clientes nuevos.

80 Modelos fundamentales para analistas de negocios


En la plantilla propuesta, he añadido una estimación de los
La idea que subyace a esta técnica consiste en calcular la retención y el
clientes nuevos obtenidos cada año para simular el número total
importe de gasto utilizando la probabilidad de que un cliente permanezca
de clientes y su valor con unos cuantos años de antelación. No
en el mismo segmento o cambie de segmento, y después, aplicar a este
obstante, para calcular el VVC de los clientes actuales, este valor
cliente la cantidad media de gasto del nuevo segmento. Para calcular la
debería fijarse en 0 y, a continuación, el valor total de cada año
probabilidad de pasar de un segmento a otro, es necesario segmentar
debería reducirse con la tasa de descuento.
a los clientes en año -1 y crear una matriz de transición (transición entre
los distintos segmentos desde el año -2 hasta el año -1) en la que las
probabilidades se calculan para cada combinación de grupos del
segmento.

http://analyticsmodels.blogspot.com.es/p/customer-
analytics-templates.html
29
55

EL NET PROMOTER SCORE® (NPS®)

El análisis del cliente


Los datos se recopilan a través de encuestas y se pide a
los encuestados que puntúen con una escala del 0 al 10 la
OBJETIVO
probabilidad de recomendación por su parte de un producto o
IDENTIFICAR LA PROBABILIDAD DE QUE LOS CLIENTES REALICEN servicio. Aquellos que contestan 9 o 10 son los partidarios reales
RECOMENDACIONES. mientras que los que responden 6 o menos son los detractores.
Los encuestados que puntúan entre 7 y 8 se consideran pasivos
ya que, aunque afirmen que recomendarían el producto o
servicio, en realidad no llegan a recomendarlo nunca. El NPS® es
Por lo general, el valor de los clientes se calcula utilizando únicamente las el porcentaje de partidarios menos el porcentaje de detractores.
variables de importe gastado y frecuencia de las compras. Sin embargo,
los clientes pueden crear valor de otras muchas maneras distintas,
una de las cuales es mediante la recomendación del servicio a otros

80 Modelos fundamentales para analistas de negocios


compradores potenciales. El así llamado fenómeno del “boca a boca” se
ha visto fortalecido hoy en día por las redes sociales, las páginas web de
metabúsquedas o los portales que proporcionan opiniones de clientes
sobre productos.

Las recomendaciones positivas no solo pueden aumentar las ventas sino


que también pueden permitir a las empresas ahorrar dinero en publicidad.
El Net Promoter Score® es un indicador que calcula la probabilidad de
que haya recomendaciones por parte de un grupo de clientes en función
de la intención de recomendación de cada cliente individual. Ha sido
desarrollado y registrado como marca comercial por Fred Reichheld, Bain
& Company, y Satmetrix.

http://analyticsmodels.blogspot.com.es/p/customer-
analytics-templates.html
30
56

LA MATRIZ DE VALOR DEL CLIENTE

El análisis del cliente


Un artículo especialmente interesante publicado en el Harvard
Business Review17 afirma que los clientes que más compran no
OBJETIVO
son necesariamente los clientes más valiosos ya que, según
IDENTIFICAR LOS SEGMENTOS DE CLIENTES EN FUNCIÓN DEL VALOR QUE los autores, los clientes más valiosos son aquellos que son
LE APORTAN A LA ORGANIZACIÓN. capaces de aportarle a la empresa nuevos clientes valiosos a
través de recomendaciones. El valor de recomendación de los
clientes incluye no solo el valor generado por los nuevos clientes
sino también los ahorros en materia de costes de adquisición
(publicidad, descuentos, etc.). En este artículo, tanto el valor
vitalicio del cliente como el valor de recomendación del cliente se
- REPETICIÓN + calculan de manera adecuada pero, normalmente, estos datos no
suelen estar disponibles, principalmente debido al hecho de que

80 Modelos fundamentales para analistas de negocios


+

identificar a los clientes que han realizado recomendaciones y a


los nuevos clientes obtenidos gracias a estas recomendaciones
es una tarea compleja.
PARTIDARIOS CAMPEONES
RECOMENDACIÓN

Sin embargo, podemos tomar la matriz de valor del cliente basada


en sus conclusiones y aplicarla a nuestros datos de clientes de
manera más sencilla. Para esta simplificación, asumimos que
la “repetición” está relacionada con el “valor vitalicio” y que la
intención de recomendar un producto está relacionada con los
nuevos clientes adquiridos a través de esta promoción. Estos
AVAROS ACOMODADOS datos pueden conseguirse a través de una encuesta en la que
preguntaremos acerca de la repetición (actual o intencionada) y
sobre si el cliente recomendaría el producto. Con los resultados
-

de estas dos variables, crearemos una matriz de cuatro bloques


(figura 26):

Figura 26: Matriz de valor del cliente 17


V. Kumar, J. Andrew Petersen, y Robert P. Leone, How Valuable is Word of Mouth? (HBR, 2007).
30
57

LA MATRIZ DE VALOR DEL CLIENTE

El análisis del cliente


»» Campeones: son buenos compradores e importantes partidarios. Un inconveniente a la hora de utilizar esta simplificación consiste
en que tenemos que poder relacionar la encuesta con un cliente
»» Acomodados: son clientes que gastan mucho pero no suelen hacer
real para así diferenciar nuestras técnicas de marketing. Los
recomendaciones.
hoteles, por ejemplo, utilizan encuestas cuando se marchan sus
»» Partidarios: son los clientes que realizan el mayor número de clientes y les preguntan sobre la repetición y la recomendación.
recomendaciones pero no compran mucho.
Los datos se recopilan a través de encuestas online y offline
»» Avaros: son clientes de escaso valor tanto en términos de compras de manera que la encuesta pueda relacionarse con un cliente
como de recomendaciones. específico (a través del correo electrónico, el número de

Para asignar clientes al recuadro correcto, podemos tomar la mediana de


los dos indicadores. El propósito de este modelo consiste en diferenciar
nuestras técnicas de marketing:

80 Modelos fundamentales para analistas de negocios


»» Acomodados: ofrecerles incentivos a cambio de que recomienden
nuestros productos a unos cuantos amigos.

»» Partidarios: centrarse en el upselling (ventas adicionales) o el


cross-selling (ventas cruzadas), por ejemplo, ofreciéndoles lotes de
productos o descuentos para productos que no suelen comprar.

»» Avaros: probar las dos técnicas anteriormente mencionadas para


lograr que se desplacen a la categoría de acomodados o partidarios
(o incluso a la de campeones).

También podemos mejorar el modelo añadiendo un componente de


valor además de la repetición, por ejemplo, el importe gastado de media
para cada compra.

http://analyticsmodels.blogspot.com.es/p/customer-
analytics-templates.html
31
58

EL MODELO DE PROBABILIDAD DEL CLIENTE

El análisis del cliente


Este modelo puede aplicarse en escenarios de tiempos discretos
lo cual significa que puede utilizarse, o bien en casos en los que
OBJETIVO
el cliente puede comprar un producto en ocasiones de compra
PREDECIR EL COMPORTAMIENTO FUTURO A LARGO PLAZO DE LOS CLIENTES. específicas (por ejemplo, cuando participa en una conferencia
anual), o bien en casos en los que se crea un intervalo de compra
discreto (o discontinuo) (el tiempo puede “volverse discontinuo”
mediante un proceso de grabación, por ejemplo, si un cliente
se ha ido o no de crucero o si se ha quedado o no en un hotel
Es posible predecir el comportamiento de los clientes a través de
específico durante un año concreto).
métodos de regresión o disposición a pagar; no obstante, mientras que
estos métodos son buenos a la hora de predecir acciones para el “periodo El modelo propuesto por Peter S. Fader y Bruce G.S. Hardie18
2,” cuanto más a largo plazo intentemos predecir proyectándonos en utiliza una función de log-likelihood que se calcula mediante la

80 Modelos fundamentales para analistas de negocios


el futuro, más imprecisos se volverán estos métodos. Un modelo de utilización del plug-in Solver de Excel. Los autores explican cómo
probabilidad del cliente puede ayudarnos a mejorar el cálculo del valor construir el modelo desde cero y proporcionan una plantilla en
vitalicio del cliente. Excel (véase el siguiente enlace a la plantilla) en la que, en la
última hoja, predeterminan las DERTs (por sus siglas en inglés,
Para ir más allá del “periodo 2”, deberíamos utilizar un modelo probabilístico
transacciones residuales esperadas reducidas), que representan
basado en el reconocimiento de patrones. Un modelo bastante sencillo
“el flujo de transacciones futuras esperadas para un cliente que
que puede implementarse en Excel es el modelo denominado “Buy Till
tenga un historial de compras.”
You Die” (compra hasta que te mueras)18, que necesita tres aportaciones:
la recencia, la frecuencia, y el número de clientes para cada combinación Este modelo utiliza datos históricos de transacciones de la
entre las dos variables anteriores. empresa a nivel individual. Estos datos suelen estar almacenados
en los sistemas CRM.

18
Peter S. Fader and Bruce G.S. Hardie, Implementing the BG/BB Model for Customer-Base Analysis in Excel,
(2011) http://www.brucehardie.com/notes/010/. http://www.brucehardie.com/notes/010/
32
59

EL ANÁLISIS DE LA SUPERVIVENCIA

El análisis del cliente


El análisis de la supervivencia se utiliza, por ejemplo, en el campo
de la medicina (la supervivencia de los pacientes), de la ingeniería
OBJETIVO
(el tiempo estimado hasta que se rompa un componente) o del
CALCULAR EL TIEMPO ESTIMADO HASTA QUE OCURRA UN EVENTO. marketing (tasa de cancelación de clientes o customer churn rate)
para estimar cuándo va a darse un determinado resultado. A la
hora de llevar a cabo este tipo de análisis, es importante considerar
el concepto de “censoring” (censura), es decir, el problema de que
los valores solo sean parcialmente conocidos. Esto es debido al
hecho de que, en el momento en que realizamos la estimación,
para algunos individuos (u objetos), el acontecimiento ya ha
ocurrido mientras que para otros no.
1.2

80 Modelos fundamentales para analistas de negocios


Dos de las técnicas más utilizadas son el método “Kaplan–Meier”
1 y la regresión de Cox. La primera es una técnica estadística no
paramétrica que se utiliza cuando tenemos variables categóricas
0.8 o cuando el número de observaciones es reducido. El ejemplo
desarrollado en la plantilla utiliza esta técnica para calcular la
s(t)

0.6
probabilidad de que sobreviva (no se rompa) un componente
0.4 mecánico una vez transcurridos algunos años. La wmuestra el
gráfico de la curva de supervivencia que representa la función de
0.2 supervivencia.

0 Además del gráfico de la curva de supervivencia, es posible


0 2 4 6 8 10 12 14 utilizar una tabla de vida para analizar los resultados. Esta tabla
Tiempo de supervivencia (nº de años) contiene el número de años, el número de eventos, el porcentaje
de supervivencia, el error estándar y los intervalos de confianza.
Figura 27: Curva de supervivencia
32
60

EL ANÁLISIS DE LA SUPERVIVENCIA

El análisis del cliente


En caso de que necesitemos comparar la función de supervivencia de
dos grupos, podemos utilizar el log-rank test (o prueba logrank o de
Mantel-Cox) para comprobar si las dos curvas son considerablemente
distintas.

Si el número de observaciones es elevado y queremos incluir variables


explicativas adicionales, entonces deberíamos utilizar una regresión de
Cox.

El análisis de la supervivencia puede resultar muy útil cuando necesitamos


priorizar esfuerzos. Por ejemplo, podemos estimar cuándo están los
empleados a punto de marcharse de la empresa utilizando una regresión
de Cox con varias variables explicativas (años en la empresa, número de

80 Modelos fundamentales para analistas de negocios


proyectos, satisfacción, desempeño, etc.). Podemos así crear una matriz
utilizando la función de supervivencia, por un lado, y el desempeño, por
otro, y centrar nuestros esfuerzos en aquellos que muestran tanto un
nivel elevado de desempeño como una alta probabilidad de marcharse.

Para este tipo de análisis, necesitamos un seguimiento específico del


“tiempo de supervivencia” del objeto en cuestión. También podemos
obtener estos datos en un CRM, por ejemplo, con las altas y las bajas de
clientes de un determinado servicio.

http://analyticsmodels.blogspot.com.es/p/customer-analytics-
templates.html
33
61

LOS MODELOS DE PUNTUACIÓN

El análisis del cliente


»» Probabilidad de compra: Utilizaremos una regresión logística
para calcular la probabilidad de compra de un cliente durante
OBJETIVO
el siguiente periodo (véase 26. El modelo RFM y 60. La regresión
DEFINIR LAS ACCIONES PRIORITARIAS EN RELACIÓN CON LOS CLIENTES, logística).
LOS EMPLEADOS, LOS PRODUCTOS, ETC.
»» Importe: Utilizaremos una regresión lineal para calcular el
importe que seguramente acabe gastando cada cliente en su
próxima compra (véase 38. La regresión lineal).
Los modelos de puntuación ayudan a decidir sobre qué elementos
El primer paso consiste en elegir las variables de predicción.
tenemos que actuar de manera prioritaria en función de la puntuación
En nuestro caso, sugiero que utilicemos la recencia, la primera
que obtengan. Por ejemplo, podemos crear un modelo de puntuación
compra, la frecuencia, el importe medio, y el importe máximo del
para evitar que los empleados se marchen de la empresa en el que la
año -2, aunque podríamos probar variables distintas o adicionales.

80 Modelos fundamentales para analistas de negocios


puntuación dependerá tanto de la probabilidad de marcharse como del
La variable objetivo sería una variable binaria que representa si el
desempeño (actuaremos primero sobre aquellos empleados que tengan
cliente ha realizado una compra durante el siguiente periodo (año
una mayor probabilidad de marcharse y que sean importantes para la
-1). Llevamos a cabo una regresión logística con la transformación
empresa). Los modelos de puntuación también resultan bastante útiles
eventual de variables y tras comprobar que se cumplen todos los
en el ámbito del marketing; por ejemplo, podemos puntuar a los clientes
supuestos necesarios (véase la 36. Introducción a las regresiones
basándonos en su probabilidad de responder de forma positiva a una
y 60. La regresión logística).
llamada de telemarketing y, en función de los recursos que tengamos,
llamar únicamente a los primeros “X” clientes.
RESULTADOS DE LA REGRESIÓN
El modelo que voy a proponer es un modelo de puntuación del valor de
COEFICIENTES PROBABILIDAD DE COMPRA CANTIDAD ESTIMADA
los clientes en función de la probabilidad de que compren un producto Intercepción 0.53 20.7
y del importe que probablemente acaben gastando. Este modelo es el Recencia 0.0019

resultado de dos submodelos: Primera compra 0.0012

Frecuencia 0.22

Cantidad media 0.00042 0.14

Cantidad máxima 0.00016 0.05

Figura 28: Coeficientes de las regresiones logísticas y lineales


33
62

LOS MODELOS DE PUNTUACIÓN

El análisis del cliente


En la segunda parte del modelo, podemos utilizar únicamente, por Probabilidad = 1 / (1 + exp(- (coeficiente del punto de intercepción
ejemplo, el importe medio y el importe máximo del año -2, y el importe total + coeficiente de la variable 1 * variable 1 + coeficiente de la
gastado durante el año -1 se utilizará como la variable objetivo. Llevamos variable n * variable n)))
a cabo una regresión lineal con múltiples variables con la eventual
Ahora que ya tenemos dos columnas adicionales en nuestra base
transformación de las variables, tras comprobar que se cumplen todos
de datos, solo necesitamos añadir una tercera para la puntuación
los supuestos necesarios (véase la 36. Introducción a las regresiones, 38. La
final, que será la probabilidad de compra multiplicada por el
regresión lineal, y 39. Otras regresiones. Resulta importante mencionar que
importe estimado (Figura 29). Con este indicador, podremos o
en esta regresión no utilizaremos toda la base de datos de clientes sino
bien clasificar a nuestros clientes (para priorizar la asignación de
que seleccionaremos únicamente aquellos clientes que han realizado
recursos y las campañas de marketing para algunos clientes) o
una compra en el año -1.
utilizarlo para calcular los ingresos de los próximos periodos.
El último paso consiste en juntar las dos regresiones para puntuar a los

80 Modelos fundamentales para analistas de negocios


clientes en función de su probabilidad de compra y del importe que
seguramente acaben gastando. Utilizaremos los coeficientes de regresión
para las estimaciones de cada cliente. En la regresión lineal, sumamos
directamente el punto de intercepción y multiplicamos los coeficientes
de las variables (Figura 28) por los valores reales de cada cliente para
estimar el importe19. Sin embargo, en la regresión logística, deberíamos
utilizar la función exponencial para calcular las probabilidades reales de
que ocurra la compra:

YEAR 1 - DATA FORECAST YEAR

Recencia 1ª compra Frecuencia Cantidad Cantidad Probabilidad Cantidad


ID Cliente Puntuación
(días) (días) (compras) media máxima de compra estimada
http://analyticsmodels.blogspot.com.es/p/customer-
1 3464 3464 1 30 30 99.9% 88 € 88 €
analytics-templates.html
2 302 3386 6 70 80 92.5% 207 € 191 €

3 393 3418 10 112 153 97.3% 332 € 123 €

... ... ... ... ... ... ... ... ...


19
Importe estimado = Punto de intercepción + Coeficiente 1 * Variable 1 + Coeficiente 2 * Variable 2.
Debemos ser conscientes de que si hemos transformado algunas de las variables, no podemos simplemente
Figura 29: Tabla de resultados con la probabilidad de compra, el importe estimado y la puntuación final multiplicar el coeficiente sino que deberíamos hacer algunos cálculos adicionales.
LOS ANÁLISIS
ESTADÍSTICOS
34
64

INTRODUCCIÓN

Los análisis estadísticos


Es posible aplicar distintos análisis estadísticos a los datos para responder a Una parte importante del análisis estadístico consiste en manipular los
diferentes preguntas del ámbito empresarial. Resulta importante saber cuándo datos para prepararlo para la implementación del modelo:
aplicar qué modelo y cuáles son las limitaciones pero hay dos principios
»» Los valores atípicos pueden sesgar considerablemente los
importantes a la hora de llevar a cabo un análisis estadístico:
resultados por lo que tenemos tres opciones:
»» Contexto: esto significa entender los datos, el objetivo del modelo, el nivel • Mantener el valor atípico: en caso de que comprobemos que el
de precisión que deben tener los resultados, si hay que utilizar todos los valor es correcto.
conjuntos de datos o tan solo una parte de los mismos, etc. • Eliminación: siempre que el valor atípico sea un error.
• Transformación: en caso de que podamos corregir el error y
»» Segmentación: es decir, la segmentación de los datos para encajar mejor
sustituirlo por el valor correcto.
con el modelo.
»» Los registros con los datos incompletos no pueden utilizarse en
En los siguientes apartados, empezaré por explicar cómo realizar un análisis
algunos métodos estadísticos tales como las regresiones:
estadístico descriptivo de una variable y, a continuación, explicaré varias técnicas

80 Modelos fundamentales para analistas de negocios


• Podemos dejar los valores que faltan si estamos utilizando un
de análisis que pueden clasificarse en tres categorías principales:
modelo que no esté afectado por los mismos, siempre que el
»» Regresiones: el análisis de la relación entre distintas variables y la creación número de registros afectados sea reducido, o si no podemos
de modelos en los que se estiman los valores desconocidos de una variable sustituirlos por unos valores adecuados.
de resultado utilizando una o más variables de predicción. • También podemos reemplazar los valores que faltan utilizando
un método de predicción (podemos utilizar un simple promedio
»» Prueba de hipótesis: el análisis de las diferencias entre grupos en función de o un método más complejo).
una o más variables de interés.
»» El binning de datos es necesario cuando una variable tiene
»» Modelos de clasificación: son modelos en los que el resultado es la demasiadas categorías y necesitamos agruparlas, por ejemplo, para
pertenencia a un grupo. analizar su distribución.

A veces, es posible utilizar varios modelos para la misma cuestión empresarial, y »» También puede ser necesaria una transformación de variables,
la elección dependerá del tipo de variables que estemos utilizando (categóricas, o bien para cumplir los requisitos para la implementación de un
ordinales o cuantitativas) y de su distribución. modelo específico, o para mejorar el resultado del modelo.

Una vez elegido el modelo, los pasos siguientes son verificar las condiciones, Hay una página web útil que muestra paso a paso cómo crear modelos
llevar a cabo el análisis, comprobar su significado y validez, confirmarlo y de análisis estadístico en Excel: http://blog.excelmasterseries.com.
perfeccionarlo.
35
65

LAS ESTADÍSTICAS DESCRIPTIVAS

Los análisis estadísticos


En un análisis estadístico, el primer paso consiste en analizar los
datos disponibles. Este paso también resulta útil para comprobar
OBJETIVO
si hay valores atípicos o si podemos asumir que existe una
ANALIZAR LA DISTRIBUCIÓN DE UNA O VARIAS VARIABLES EN UN CONJUNTO situación de normalidad para utilizar estos datos para una prueba
DE DATOS. o modelo estadístico específico (véase la 36. Introducción a las
regresiones). Dado que el análisis de estos supuestos está incluido
en el apartado que introduce las regresiones, voy a centrarme aquí
en las estadísticas descriptivas que resultan útiles para describir
ESTADÍSTICA DESCRIPCIÓN variables numéricas (véase la tabla anterior).

Media Promedio aritmético de los datos. Tal y como se muestra en la plantilla, estas estadísticas pueden
Error estándar Representa la diferencia entre el valor esperado y el valor real. calcularse, o bien utilizando el complemento de Excel Análisis

80 Modelos fundamentales para analistas de negocios


Mediana Valor central (es decir, el valor que divide los datos en dos – siempre que exista un de datos, o usando las funciones de Excel. Esto último también
número par de valores). La mediana es la media de los dos valores centrales. es válido a la hora de crear un histograma, con el que podemos
Moda El valor más frecuente. analizar la frecuencia de los valores y hacernos una idea del
Desviación Una medida de cómo se reparten los valores. En términos matemáticos, es la raíz tipo de distribución. En la Figura 30 se incluye una muestra con
estándar cuadrada de la varianza.
datos de edad que aparece representada en un histograma. A la
Varianza Media de las diferencias al cuadrado entre cada valor y la media (también es una
muestral medida de cómo se reparten los valores). derecha, figura un diagrama de caja (box plot) que aporta más
Curtosis20 Una medida del “apuntamiento” y la planitud de la distribución. “0” significa que la información, dividiendo nuestros datos en cuartiles (agrupando
forma es la de una distribución normal, una distribución más plana tiene una curtosis los valores en 4 grupos que contienen un 25% de los valores). El
negativa, y una distribución más apuntada (o escarpada) tiene una curtosis positiva.
diagrama muestra que el 50% de las personas tiene una edad
Asimetría Una medida de la simetría de la distribución. “0” significa que la distribución es
simétrica. Si el valor es negativo, la distribución tendrá una cola larga a la izquierda, y si comprendida, aproximadamente, entre 33 y 46 años, mientras
es positivo, tendrá una cola larga a la derecha. Como regla general, se considera que que los demás están repartidos a lo largo de un mayor rango de
una distribución es simétrica si la curtosis se sitúa entre 1 y -1.
edades (el 25% entre 46 y 64 años y el 25% entre 18 y 33 años).
Rango La diferencia entre el valor más alto y el más bajo.
Mínimo El valor más bajo.
Máximo El valor más alto.
Suma La suma de los valores. 20
Aunque el concepto de Curtosis se defina a menudo en términos de “apuntamiento” y planitud, se ha
demostrado que esto no es del todo correcto. Para más información sobre la Curtosis visite:
Recuento El número de valores.
https://www.ncbi.nlm.nih.gov/pmc/articles/PMC4321753/
35
66

LAS ESTADÍSTICAS DESCRIPTIVAS

Los análisis estadísticos


Histograma Diagrama de caja Por último, quizás tengamos que identificar a qué tipo de
14 70
65 distribución se aproximan más nuestros datos (por ejemplo,
12 60 para llevar a cabo una simulación de Montecarlo). No hay ningún
55
10 50 método específico pero podemos empezar por utilizar un
45
8 histograma y comparar la forma de nuestros datos con las formas
40
6 35 de las distribuciones teóricas. La siguiente URL proporciona 22
30
4 25
plantillas en Excel con gráficos y datos de distintas distribuciones:
2
20 http://www.quantitativeskills.com/sisa/rojo/distribs.htm.
15
0 10
Si nuestras variables son categóricas, podemos analizarlas
<10 10-20 20-30 30-40 40-50 50-60 >60 utilizando una tabla de frecuencias (frecuencias porcentaje
y recuento). También podemos analizar la distribución de las

80 Modelos fundamentales para analistas de negocios


Figura 30: Histograma y diagrama de caja
frecuencias. En caso de que nuestras variables sean ordinales,
deberíamos utilizar el mismo método que para las variables
En la plantilla, podemos ver cómo se han creado estos dos gráficos. categóricas (por ejemplo, si las categorías son respuestas a una
Para el histograma, tenemos que decidir qué grupos de edad queremos pregunta de satisfacción con respuestas ordinales como “muy
utilizar y rellenar una tabla con ellos. Después, podemos utilizar la mal,” “mal,” etc.). No obstante, en algunos casos es posible que
fórmula “=FRECUENCIA” (frecuencia) seleccionando todas las celdas a la queramos analizar variables ordinales con estadísticas utilizadas
derecha de los grupos de edad y pulsando la secuencia “MAYÚS + CTRL para las variables numéricas (por ejemplo, si estamos analizando
+ INTRO,” y la fórmula nos proporcionará las frecuencias. Para el diagrama respuestas a una pregunta sobre la calidad de los servicios
de caja, tendremos que hacer algunos cálculos y realizar algunos trucos con una escala de 1 a 10, puede resultar interesante calcular la
utilizando una tabla de columnas normales en caso de que tengamos puntuación media, el rango, etc.).
una versión anterior a Excel 2016. Es posible consultar la plantilla y varios
tutoriales en internet.

http://analyticsmodels.blogspot.com.es/p/statistical-
analysis-templates_2.html
36
67

INTRODUCCIÓN A LAS REGRESIONES

Los análisis estadísticos


GRÁFICO DE PROBABILIDAD NORMAL
200
Las regresiones son modelos paramétricos que predicen un resultado
cuantitativo (variable dependiente) a partir de una o más variables de 150
predicción cuantitativas (variable independiente). El modelo que tenemos
100
que aplicar depende del tipo de relación mostrada por las variables.
50
Las regresiones tienen forma de ecuaciones en las que “y” representa las
variables de respuesta que reproducen el resultado y “x” es la variable de 0

entrada, es decir, la variable explicativa. Antes de llevar a cabo el análisis, 0 20 40 60 80 100 120 140

es importante que se cumplan varias condiciones: Muestra percentil


Figura 31: Gráfico de probabilidad normal
»» Los valores Y deben tener una distribución normal: esto puede
analizarse con un diagrama residual estandarizado (Figura 33), en
el que la mayoría de los valores deberían ser cercanos a 0 (en las

80 Modelos fundamentales para analistas de negocios


GRÁFICO DE DISPERSIÓN X1
muestras superiores a 50, esto es menos importante), o bien un 100
diagrama residual de probabilidades, en el que debería haber una 80
línea aproximadamente recta (Figura 31). 60
40
»» Los valores Y deben tener una varianza parecida en torno a cada
20
valor X: podemos utilizar una línea de ajuste óptimo (best-fit line) en
0
un diagrama de dispersión (Figura 32) y revisar que la distancia entre
0 50 100 150 200
los puntos y la línea de ajuste sea similar a lo largo de la toda la línea.
Figura 32: Gráfico de dispersión con línea de ajuste óptimo
»» Los residuales deben ser independientes; concretamente, en el
diagrama residual (Figura 33), los puntos deben estar distribuidos de
Si las condiciones no se cumplen, podemos o bien transformar las
manera equitativa en torno a la línea 0 y no deben mostrar ningún
variables o bien llevar a cabo un análisis no paramétrico21 (véase la
patrón (repartidos de manera aleatoria).
47. Introducción a los modelos no paramétricos).

21
Para mejorar las condiciones de normalidad y varianza, podemos intentar aplicar una transformación
logarítmica (log) a la variable (dependiente) de respuesta. También podemos utilizar otros tipos de
transformaciones, aunque es importante recordar que la interpretación de los resultados es más compleja
cuando transformamos nuestras variables.
36
68

INTRODUCCIÓN A LAS REGRESIONES

Los análisis estadísticos


Además, las regresiones son sensibles a los valores atípicos por lo que Otro problema con las regresiones es que los registros a los
resulta importante tratarlos de manera adecuada. Podemos detectar los que les falten datos se excluyen del análisis. En primer lugar,
valores atípicos utilizando un diagrama residual estandarizado en el que deberíamos entender cuál es el significado de que nos falte una
los datos que no estén dentro del rango +3 y -3 (desviaciones estándar) pieza de información: ¿significa 0 o significa que el entrevistado ha
suelen considerarse valores atípicos. En este caso, primero deberíamos preferido no contestar? En el segundo caso, siempre que resulte
comprobar si se ha cometido algún error al recopilar los datos (por importante incluir esta información, podemos sustituir los datos
ejemplo, una persona de 200 años de edad es un error) y eliminar el valor que faltan con un valor:
atípico del conjunto de datos o sustituirlo (véase un poco más adelante
»» Con las medidas de tendencia central, si pensamos que las
cómo abordar los datos que faltan). Si se comprueba que no es un error,
respuestas tienen una distribución normal, es decir, que no
una práctica común consiste en llevar a cabo la regresión con y sin los
existe ninguna razón específica para no responder a esta
valores atípicos, y presentar ambos resultados o transformar los datos.
pregunta, podemos utilizar la media o la mediana de los
Por ejemplo, podemos aplicar una transformación logarítmica o una

80 Modelos fundamentales para analistas de negocios


datos existentes.
transformación del rango. En cualquier caso, deberíamos ser conscientes
de las implicaciones de estas transformaciones. »» Predecir los valores que faltan utilizando otras variables; por
6 ejemplo, si nos faltan algunos datos para la variable “ingresos”,
5
posiblemente podamos utilizar la edad y la profesión para la
predicción.
4
3 Compruebe la plantilla sobre la regresión lineal (véase 38. La
2 regresión lineal), que presenta un ejemplo de cómo generar el
Residuos

1 diagrama residual estandarizado.


0
-1 10 20 30 40 50 60 70 80 90

-2
-3
-4
-5
X1

Figura 33: Gráfico de los residuales estandarízados


37
69

LA CORRELACIÓN DE PEARSON

Los análisis estadísticos


Este método calcula el coeficiente de correlación de Pearson
que cuantifica la fuerza y la dirección de la asociación lineal de
OBJETIVO
dos variables. Resulta útil cuando tenemos varias variables que
AVERIGUAR QUÉ VARIABLES CUANTITATIVAS ESTÁN RELACIONADAS ENTRE pueden estar correlacionadas entre sí y queremos seleccionar
SÍ Y DEFINIR EL GRADO DE CORRELACIÓN ENTRE LOS PARES DE VARIABLES. aquellas que tengan la relación más fuerte. La correlación puede
llevarse a cabo para elegir las variables para una regresión lineal
predictiva.

Con el complemento de Análisis de datos de Excel, podemos llevar


a cabo un análisis de la correlación que tenga como resultado
una tabla de doble entrada con coeficientes de correlación
(coeficientes de Pearson). También podemos calcular las

80 Modelos fundamentales para analistas de negocios


correlaciones utilizando la fórmula de Excel “=COEF.DE.CORREL().”
El signo del coeficiente (el coeficiente de correlación de Pearson)
representa la dirección (si x aumenta entonces y aumenta
X1 X2 X3 X4 Y = correlación positiva; si x aumenta entonces y disminuye =
X1 1 correlación negativa), mientras que el valor absoluto de 0 a 1
representa la fuerza de la correlación. Por lo general, si es superior
X2 0.58694254 1
a 0,8 es muy fuerte, si está entre 0,6 y 0,8 es fuerte, y cuando es
X3 0.78328468 0.47678216 1
inferior a 0,4 entonces no hay correlación (o es muy débil).
X4 0.06372812 0.27641 -0.14709004 1
La Figura 34 muestra que existe una correlación positiva muy
Y 0.9985405 0.57860942 0.79046511 0.05331252 1 fuerte entre X1 e Y así como una correlación positiva fuerte entre
X1–X3 y X3–Y. X3 y X4 tienen una correlación negativa débil.
Figura 34: Matriz de correlación

http://analyticsmodels.blogspot.com.es/p/statistical-
analysis-templates_2.html
38
70

LA REGRESIÓN LINEAL

Los análisis estadísticos


La ecuación de una regresión lineal es:

OBJETIVO Y = α α + βx
DEFINIR LA RELACIÓN LINEAL ENTRE UNA VARIABLE DE ENTRADA (X) Y UNA en la que y es la variable de resultado, α α es el punto de intercepción,
VARIABLE DE RESULTADO (Y) PARA CREAR UN MODELO PREDICTIVO DE β es el coeficiente, y x es la variable de predicción. Este modelo
REGRESIÓN LINEAL. se utiliza para predecir los valores de y para los valores x que no
están incluidos en el conjunto de datos o, en general, de qué
manera se ve afectado el resultado cuando cambia la variable de
entrada. Por ejemplo, este tipo de modelo puede predecir cuánto
RESUMEN aumentarían las ventas como consecuencia de un aumento del
Estadísticas de la regresión gasto en publicidad.

80 Modelos fundamentales para analistas de negocios


Coeficiente de correl 0.978693374 En una regresión lineal, solo podemos utilizar variables numéricas,
Coeficiente de deter 0.957840721 que son o bien discretas o continuas. Podemos incluir variables
R ajustado
2
2.949311573 categóricas siempre y cuando las transformemos en variables
Observaciones 11 ficticias (una variable categórica con cuatro categorías se
transformará en tres variables de dos valores, 0 y 1).
ANÁLISIS DE LA VARIANZA

Grados de Suma de Promedio de los cua- F Valor crítico de F Tras comprobar las condiciones (véase la 36. Introducción a las
libertad cuadrados drados
Regresión 1 1778.623142 1778.623142 204.4761356 1.70776614
regresiones), la regresión lineal puede llevarse a cabo utilizando
el complemento de Análisis de datos de Excel (Figura 35) o
Residuos 9 78.28594879 8.698438754
utilizando las fórmulas estadísticas de Excel tales como “=COEF.
Total 10 1856.909091
DE.CORREL()” para R, “=INTERSECCION.EJE()” para el coeficiente
del punto de intercepción, y “=ESTIMACION.LINEAL()” para el
Coeficien- Error Estadísti- Probabili- Inferior Superior Inferior Superior
tes típico co t dad 95% 95% 95.0% 95.0% coeficiente X (y otras estadísticas). Si un diagrama de dispersión
Intercep- 58.70551543 6.452374608 9.09828071 7.811505 44.10922999 73.30180086 44.1092299 73.3018008 que contenga las dos variables parece indicar que la relación no
ción
1.463230466 0.102327278 14.29951522 1.707766146 1.23175008 1.6947108 1.2317500818 1.69471085
es lineal, podemos o bien transformar la variable independiente
X1
(logarítmica, potencia, etc.) o bien intentar utilizar una regresión
Figura 35: Resultado de un análisis de regresión lineal  no lineal (39. Otras regresiones).
38
71

LA REGRESIÓN LINEAL

Los análisis estadísticos


Existen tres resultados principales de este análisis:

»» Valor p (Probabilidad): el modelo será válido si el valor p tanto del


punto de intercepción como de la variable x es inferior a 0,05 (u otro
valor alfa elegido, normalmente entre 0,1, 0,05 y 0,01). En caso de que
el punto de intercepción tenga un valor p más elevado, podemos fijar
el punto de intercepción en 0 antes de llevar a cabo la regresión.

»» R2: se trata de una medida de cuánto se explica la variabilidad


de y mediante x; cuanto más cerca esté de 1, más explicará x las
variaciones en y.

»» Coeficiente de X: define la dirección y la fuerza de la relación (véase

80 Modelos fundamentales para analistas de negocios


37. La correlación de Pearson).

Resulta importante tener presente que incluso si se cumplen todas las


condiciones, si estamos ante una fuerte correlación y si la regresión
es relevante (valor p < 0,5), esto no necesariamente significa que haya
causalidad. Un buen ejemplo es que posiblemente encontremos una
correlación entre el número de helados consumidos y el número de
personas que se ahogan en las piscinas pero esto no significa que un
fenómeno esté causado por el otro. Es importante descartar la hipótesis
de una tercera variable común que esté causando las variaciones en x y
en y (en nuestro ejemplo, esta variable sería la “temperatura”).

http://analyticsmodels.blogspot.com.es/p/statistical-analysis-
templates_2.html
39
72

OTRAS REGRESIONES

Los análisis estadísticos


Cada una de las siguientes regresiones necesita cumplir las
mismas condiciones que las condiciones mencionadas en la 36.
OBJETIVO
Introducción a las regresiones. Además, necesitamos llevar a cabo
DEFINIR LA RELACIÓN ENTRE UNA O MÁS VARIABLES DE ENTRADA (X) Y el mismo análisis de los valores atípicos y los datos que faltan.
UNA VARIABLE DE RESULTADO (Y) PARA CREAR UN MODELO PREDICTIVO DE
REGRESIÓN.
LA REGRESIÓN CON MÚLTIPLES VARIABLES

RESUMEN Esta regresión lineal se utiliza cuando tenemos varias variables de


Estadísticas de la regresión predicción. En este caso, necesitamos comprobar los valores p de
todas las variables de predicción. Quizás tengamos que excluir
Coeficiente de correl 0.978693374
las variables con un valor p elevado (> 0,5). Puede afirmarse que

80 Modelos fundamentales para analistas de negocios


Coeficiente de deter 0.957840721
cuanto más aumente el número de variables de predicción, mayor
R2 ajustado 2.949311573
será el R2, pero esto no significa únicamente que el modelo sea
Error típico 2.318211131
mejor. Con las regresiones de múltiples variables, deberíamos
Observaciones 11 comprobar el R2 ajustado, que tiene en cuenta el número creciente
de variables. Como norma general, cuando comparamos dos
ANÁLISIS DE LA VARIANZA
modelos con R2 ajustados muy cercanos o iguales, se debería
Grados de Suma de Promedio de los cua- F Valor crítico de F
libertad cuadrados drados elegir el que tenga menos variables de predicción.
Regresión 2 1813.916268 906.9581341 168.7645659 2.87357

Residuos 8 42.99282258 5.374102848


A la hora de utilizar múltiples variables de predicción, el problema
Total 10 1856.909091 de la colinealidad es una cuestión importante. Las variables
de predicción no pueden correlacionarse entre sí por lo que
Coeficien- Error Estadísti- Probabili- Inferior Superior Inferior Superior
deberíamos realizar un análisis de la correlación y eliminar las
tes típico co t dad 95% 95% 95.0% 95.0% variables correlacionadas.
Intercep- 30.99410295 11.94378038 2.594999401 0.031864509 3.451695983 58.53650992 3.451695983 58.53650992
ción
X1 0.861414686 0.248231411 3.470208241 3.470208241 0.288992027 1.433837346 0.288992027 1.433837346
En una regresión con múltiples variables, solo podemos utilizar las
X2 0.334859197 0.130668274 2.56266641 0.033507671 0.033537617 0.636180778 0.033537617 0.636180778 variables de predicción numéricas; no obstante, podemos utilizar
un tipo de transformación para incluir variables categóricas: la
Figura 36: Resultado de un análisis de regresión con múltiples variables
39
73

OTRAS REGRESIONES

Los análisis estadísticos


codificación ficticia. Si suponemos que una variable categórica tiene k »» Como regla general, si estamos probando varios modelos
niveles, entonces crearíamos variables ficticias k-1, y cada una de estas no lineales y todos son relevantes y tienen un R2 parecido,
variables tendría dos niveles (0 y 1). deberíamos entonces elegir el menos complejo (por ejemplo,
un modelo cuadrático frente a uno cúbico).
En caso de que estemos utilizando variables de entrada ordinales,
podremos elegir entre tratarlas como variables numéricas (incluyéndolas 200
180
directamente en la regresión) o bien transformarlas en variables ficticias.
160
En el caso anterior, asumiremos que las distancias entre los niveles son
140
significativas (por ejemplo, la diferencia de valor entre 1 y 2 es la misma
120
que la que existe entre 2 y 3). En caso de que las estemos tratando
100
como variables categóricas, no haremos la suposición anterior sino que
80
perderemos la información sobre la clasificación. 60

80 Modelos fundamentales para analistas de negocios


y= 171.46e-0.012x
40
R2 = 0.9701
20
LAS REGRESIONES NO LINEALES 0
0 10 20 30 40 50 60
Las matemáticas que subyacen a los modelos no lineales son más Figura 37: Regresión exponencial

complejas, como también lo son su interpretación y validación. Siempre


Algunos ejemplos de regresiones no lineales son las
que sea posible, es mejor utilizar una regresión lineal simple, y si el patrón
exponenciales, logarítmicas, polinomiales, cuadráticas, cúbicas
de los datos cambia, podemos segmentar los datos para explicar la
y de potencia. Para los análisis en dos dimensiones, podemos
variación con dos o más regresiones lineales. No obstante, si realmente
trazar nuestros datos en un gráfico como el que se muestra en
creemos que es necesario un modelo no lineal para adaptarse bien a los
la Figura 37 y añadir una línea de tendencia al gráfico (en Excel,
datos:
podemos probar varias líneas de tendencia y comprobar el R2
»» Podemos utilizar softwares más completos que Excel (en Excel, para la bondad de ajuste (goodness of fit) de la línea a los datos).
podemos dibujar un diagrama de dispersión con líneas de tendencias Para regresiones con más dimensiones o para unos análisis más
no lineales, con la ecuación y R2, pero para una interpretación sólidos (que incluyan otras estadísticas además de la función de
y validación adecuadas, deberíamos usar herramientas más regresión y R2), deberíamos utilizar un software estadístico.
profesionales).
http://analyticsmodels.blogspot.com.es/p/statistical-
analysis-templates_2.html
40
74

EL ANÁLISIS DE RUTAS

Los análisis estadísticos


PASO 1: DEFINICIÓN DEL MODELO

OBJETIVO Incluso si podemos calcular todas las relaciones entre las


variables y, a continuación, avanzar en función de los coeficientes
DEFINIR LOS EFECTOS DIRECTOS E INDIRECTOS DE LAS VARIABLES DE
de regresión y los coeficientes de correlación, el enfoque
ENTRADA.
recomendado consiste en empezar por definir un modelo
estructural basado en nuestro conocimiento y crear un diagrama
de rutas con la hipótesis de las relaciones dentro de y entre las
El análisis de rutas (path analysis) forma parte de un grupo más amplio variables de predicción y de resultado.
denominado MES (modelos de ecuaciones estructurales). Los MES
utilizan varios modelos para definir las relaciones entre y dentro de las
ERROR
variables. Además del análisis de rutas, este grupo incluye el análisis
β1 =py1

80 Modelos fundamentales para analistas de negocios


factorial confirmatorio, el análisis de rutas de mínimos cuadrados x1 Coeficiende de
parciales, el programa LISREL, etc. MALTRATO regresión
INFANTIL

El análisis de rutas está basado en regresiones múltiples aunque va más


Y
allá dado que permite la interpretación de las relaciones en el marco de las ERROR TENDENCIAS SUICIDAS
variables de predicción y la variable dependiente por definir. Por ejemplo,
en una regresión múltiple, podemos observar que el género, el maltrato
RX1,X2 = P12 x2
infantil y el consumo de drogas son buenas variables de predicción de Coeficiende de CONSUMO
las tendencias suicidas. No obstante, sospechamos que el consumo de correlación DE DROGAS

drogas se ve afectado por el maltrato infantil. Con un análisis de rutas,


podemos definir un modelo (representado por un diagrama de rutas) en
el que definamos tanto los efectos directos como los indirectos de las
variables de predicción sobre la variable dependiente. En consecuencia,
podremos interpretar mejor las relaciones entre y dentro de las variables. x3
GÉNERO

Figura 38: Diagrama de un análisis de rutas


40
75

EL ANÁLISIS DE RUTAS

Los análisis estadísticos


El diagrama incluye varios elementos: PASO 2: ANÁLISIS DE DATOS

»» Variables observadas: son las variables que se miden y se representan Este modelo requiere el cumplimiento de las mismas condiciones
mediante rectángulos. que las regresiones (véase la 36. Introducción a las regresiones)
y utiliza una regresión múltiple y una matriz de correlación para
»» Variables latentes: son las variables que no se pueden medir, por
encontrar todos los parámetros del modelo. Para este paso,
ejemplo, “errores”22 (varianzas que no están explicadas por el modelo),
recomiendo consultar el artículo de Akinnola Akintunde24 que lleva
que se representan mediante círculos o elipses.
por título “Path Analysis Step by Step Using Excel” (El análisis de
»» Coeficientes de regresión: las relaciones causales entre dos variables rutas paso a paso utilizando Excel). Para obtener los parámetros:
representadas por flechas rectas (también denominadas coeficientes
»» Normalizar todas las variables utilizando la función de Excel
de ruta o efectos directos).
“=NORMALIZACION” (usando el valor x, la media de la variable,
»» Coeficientes de correlación: las relaciones no causales entre dos y su desviación estándar).

80 Modelos fundamentales para analistas de negocios


variables representadas por flechas curvadas.
»» Llevar a cabo una regresión con múltiples variables de la que
Una limitación importante es que el número de parámetros libres se utilizarán los coeficientes de regresión (considerados los
(relaciones establecidas en el diagrama de rutas) tiene que ser inferior efectos directos de determinada variable de predicción en la
al número de valores únicos. Los valores únicos se calculan a través de variable dependiente).
la fórmula p*(p + 1) / 2, en la que p es el número de variables. El número
»» Ejecutar una matriz de correlación entre todas las variables
de parámetros libres es la suma de todas las relaciones establecidas en
(los coeficientes de correlación se utilizarán para calcular los
el modelo (en términos sencillos, el número de flechas del diagrama de
efectos indirectos).
rutas).
»» Los errores se pueden calcular mediante la fórmula “1 - R2”;
Para más información acerca del análisis de rutas y los MES, recomiendo
sin embargo, son tan solo parámetros descriptivos y no se
consultar el libro A Beginner’s Guide to Structural Equation Modeling23.
usan en el cálculo real de relaciones.

22
Los errores solo se representan para las variables endógenas (las variables que reciben flechas) y no para
las variables exógenas (que son variables independientes).
23
Randall E. Schumacker y Richard G. Lomax, A Beginner’s Guide to Structural Equation Modeling (Routledge,
2016).
24
https://www.researchgate.net/publication/270887299_Path_Analysis_Step_by_Step_Using_Excel
40
76

EL ANÁLISIS DE RUTAS

Los análisis estadísticos


Ahora ya tenemos todos los parámetros del diagrama de rutas. Esta plantilla de Excel puede resultar útil a la hora de calcular la
Conocemos los efectos directos (los coeficientes de correlación del bondad de ajuste de los modelos MES: http://www.watoowatoo.
análisis de múltiples variables y la correlación entre las variables de net/sem/sem.html. En caso de que el ajuste del modelo no sea
predicción) y la correlación no causal entre las variables independientes. satisfactorio, será necesario modificar el diagrama de rutas para
También podemos calcular los efectos indirectos. Por ejemplo (Figura 39), encontrar un ajuste mejor:
el efecto indirecto de X1 sobre Y es “c * b,” mientras que el efecto total es
»» Eliminando los parámetros no relevantes mediante la
“a + c * b.”
comprobación de las estadísticas t de los parámetros (por
ejemplo, si son superiores a 1,96).
x1 »» Añadiendo nuevos parámetros a través de la utilización de
MALTRATO a
dos técnicas:
INFANTIL
Y
• Índice de modificación: un valor elevado indica parámetros

80 Modelos fundamentales para analistas de negocios


TENDENCIAS SUICIDAS
potencialmente útiles.
c • Cambio de parámetro esperado: valor aproximado del
b
x2
CONSUMO parámetro nuevo si se añade.
DE DROGAS
»» Analizando la matriz residual estandarizada y buscando
valores que sean superiores a 1,96 o 2,58 (por ejemplo), que a
Figura 39: Efectos directos e indirectos dentro de las variables
su vez identifican los valores que no están bien representados
en el modelo.

PASO 3: PRUEBAS CON EL MODELO Y MODIFICACIÓN RECOMENDACIONES

El modelo puede probarse utilizando, por ejemplo, la prueba de chi- Aunque resulte posible crear modelos sencillos de análisis de rutas en Excel, mi
sugerencia sería utilizar una herramienta estadística apropiada que nos ayude a
cuadrado para la “maldad de ajuste” (véase 48. La prueba de chi-cuadrado)
construir y calcular el modelo. La parte más importante es entender el razonamiento
u otros métodos (RMSEA o GFI). Los valores recomendados para que el que hay detrás de este tipo de modelo para que la parte del cálculo pueda realizarse
modelo funcione bien son: más rápido y con mayor precisión utilizando una herramienta adecuada. La plantilla
»» Valor p del chi-cuadrado > 0,05. asociada no incluirá el cálculo del modelo sino simplemente el diagrama de rutas
presentado en este apartado.
»» RMSEA < 0,05.
»» GFI > 0,95.
http://analyticsmodels.blogspot.com.es/p/statistical-
analysis-templates_2.html
41
77

INTRODUCCIÓN A LAS PRUEBAS DE HIPÓTESIS

Los análisis estadísticos


»» Comprobar si un cambio en un factor tiene un impacto
relevante sobre la muestra llevando a cabo un experimento
OBJETIVO
(por ejemplo, comprobar si una nueva terapia tiene mejores
COMPROBAR SI DOS (O MÁS) GRUPOS SON SIGNIFICATIVAMENTE resultados que la terapia tradicional).
DIFERENTES ENTRE SÍ, HABITUALMENTE COMPARANDO SUS MEDIAS O »» Comprobar si una muestra tomada de una población
MEDIANAS. realmente la representa (si los parámetros de la población,
es decir, la media, son conocidos); por ejemplo, si se espera
que una línea de producción fabrique objetos con un peso
Por lo general, las pruebas de hipótesis estadísticas incluyen todas las
específico, es posible comprobarlo tomando muestras
técnicas que prueban una hipótesis nula frente a una hipótesis alternativa.
aleatorias y pesándolas. Si la diferencia de peso medio con
Aunque también engloban las regresiones, me voy a centrar únicamente
respecto al peso esperado es estadísticamente relevante,
en las pruebas realizadas sobre muestras.
entonces querrá decir que las máquinas deberían revisarse.

80 Modelos fundamentales para analistas de negocios


Existen tres pasos principales en una prueba de hipótesis:
Tras definir y estudiar el problema, necesitamos definir la hipótesis
»» Definición: identificar el problema, estudiarlo, y formular hipótesis; nula (H0) y la hipótesis alternativa (Ha), que son mutuamente
»» Experimento: elegir y definir la técnica de recopilación de datos y el excluyentes y representan todo el rango de posibilidades.
método de muestreo; Normalmente comparamos las medias de las dos muestras o
la media de la muestra con la media de la población esperada.
»» Resultados y conclusión: comprobar los datos, elegir la prueba más
Existen tres posibles ajustes de las hipótesis:
adecuada, analizar los resultados y extraer conclusiones.
»» Para comprobar cualquier tipo de diferencia (positiva o
DEFINICIÓN
negativa), la H0 es tal que no existe diferencia en las medias
El primer paso en una prueba de hipótesis consiste en identificar el (H0: μ = μ0 y Ha: μ ≠ μ0);
problema y analizarlo. Las tres principales categorías de las pruebas de
»» Para comprobar solo un tipo de diferencia:
hipótesis son:
• positiva (H0: μ ≤ μ0 y Ha: μ > μ0);
»» Comprobar si dos muestras son significativamente diferentes; por • negativa (H0: μ ≥ μ0 y Ha: μ < μ0).
ejemplo, tras llevar a cabo una encuesta en dos hoteles de la misma
cadena, queremos comprobar si la diferencia en la satisfacción media
es relevante o no.
41
78

INTRODUCCIÓN A LAS PRUEBAS DE HIPÓTESIS

Los análisis estadísticos


EXPERIMENTO RESULTADOS Y CONCLUSIONES

La técnica de muestreo es extremadamente importante; debemos estar Una vez recopilados todos los datos, resulta necesario hacer una
seguros de que la muestra se elige de manera aleatoria (en general) y, comprobación para buscar los valores atípicos y los datos que
en el caso de un experimento, los participantes no deben saber a qué faltan (véase la 36. Introducción a las regresiones) y elegir así la
grupo pertenecen. Dependiendo del problema que se esté analizando prueba más adecuada en función del problema que queramos
y de la prueba que se esté realizando, se utilizarán distintas técnicas examinar, el tipo de variables y su distribución. Existen dos
para calcular el tamaño de la muestra necesaria (consulte la página enfoques principales para realizar una prueba de hipótesis:
www.powerandsamplesize.com que permite el cálculo del tamaño de la
»» El enfoque frecuentista: se realizan suposiciones sobre la
muestra para distintos tipos de pruebas).
distribución de la población y se utiliza una hipótesis nula y
un valor p para extraer conclusiones (casi todos los métodos
CARACTERÍSTICAS DE LA MUESTRA (VARIABLES INDEPENDIENTES)
presentados aquí son frecuentistas).

80 Modelos fundamentales para analistas de negocios


2 MUESTRAS MUESTRAS > 2
VARIABLE CORRELA- »» El enfoque bayesiano: este enfoque necesita contar con
DEPENDIENTE 1 CIÓN
MUESTRA conocimientos anteriores sobre la población o la muestra, y
INDEPENDIENTE DEPENDIENTE INDEPENDIENTE DEPENDIENTE
el resultado será la probabilidad de una hipótesis (véase 42. El
DICOTÓMICA Prueba de proporciones Coeficiente
enfoque bayesiano a las pruebas de hipótesis).
Prueba de Prueba Q de phi, tablas

McNemar Cochran de contin-
CATEGÓRICA X² X²
gencia

Prueba
Prueba de de Schei-
Prueba de
Kruskal-Wallis, rer-Ray-Hare Correlación
Prueba U de los rangos
ORDINAL X² prueba de la (bidireccional), de Spear-
Mann-Whitney con signo de
suma de rangos prueba de Fried- man
Wilcoxon
de Wilcoxon man (unidirec-
cional)

Prueba t
o prueba Prueba t de dos Prueba t em- ANOVA unidirec- ANOVA de me-
DE INTERVALO z de una muestras parejada cional didas repetidas Correlación
O RATIO muestra de Pearson

ANOVA bidireccional

Figura 40: Resumen de pruebas paramétricas y no paramétricas


41
79

INTRODUCCIÓN A LAS PRUEBAS DE HIPÓTESIS

Los análisis estadísticos


Las pruebas suelen analizar la diferencia de medias, y el resultado es si Además, resulta necesario recordar que, con un tamaño de
la diferencia es o no relevante. Cuando alcanzamos estas conclusiones, muestra igual, cuanto más pequeña sea la α elegida, mayor será
tenemos dos tipos de posibles errores: la β (falso negativo).

»» αα: la hipótesis nula es verdadera (no hay diferencia) pero la rechazamos Si la prueba es relevante, también deberíamos calcular el tamaño
(falso positivo). del efecto. No solo es importante el hecho de que la diferencia
sea o no relevante sino también cómo de significativa es esta
»» β: la hipótesis nula es falsa (sí hay diferencia) pero no la rechazamos
diferencia. El tamaño del efecto puede calcularse dividiendo la
(falso negativo).
diferencia entre las medias por la desviación estándar del grupo de
NO SE RECHAZA LA SE RECHAZA LA HIPÓTESIS control (para ser más precisos, deberíamos utilizar una desviación
HIPÓTESIS NULA NULA estándar agrupada, pero se necesitarán algunos cálculos).
LA HIPÓTESIS NULA ES Como norma general, un tamaño del efecto de 0,2 se considera
1-αα Tipo de error I: α

80 Modelos fundamentales para analistas de negocios


α pequeño, 0,5 medio, y por encima de 0,8 grande. No obstante, en
VERDADERA
LA HIPÓTESIS NULA ES otros contextos, el tamaño del efecto puede obtenerse a través
Tipo de error II: β β 1-β β de otras estadísticas, como la razón de momios (odds ratio) o el
FALSA
coeficiente de correlación.
Figura 41: Posibles resultados de una prueba de hipótesis
Los intervalos de confianza también suelen calcularse para que
tengan un rango probable de valores que permita extraer una
conclusión en la que habrá, por ejemplo, un 95% de confianza
La relevancia de la prueba dependerá del tamaño de αα, es decir,
en que el valor verdadero del parámetro se encuentra dentro
la posibilidad de rechazar la hipótesis nula cuando sea verdadera.
del intervalo de confianza X-Y. El intervalo de confianza reflejará
Normalmente, utilizamos 0,05 o 0,01 como valor crítico y rechazamos la
un nivel de intervalo específico; por ejemplo, un intervalo del
hipótesis nula cuando α es inferior al valor p.
95% reflejará un nivel de relevancia del 5% (o 0,05). A la hora de
Resulta importante recordar que, si estamos realizando varias pruebas, comparar la diferencia entre dos medias, si 0 está dentro del
la probabilidad de cometer un error tipo I (falso positivo) aumenta. Por intervalo de confianza, significará que la prueba no es relevante.
esta razón, deberíamos utilizar una α corregida aplicando, por ejemplo, la
corrección de Bonferroni (que divide α por el número de experimentos). 25
25
Existen también otros métodos que pueden ser más o menos conservadores, como por ejemplo, la
corrección de Šidák o el procedimiento de control de la falsa tasa de descuento.
41
80

INTRODUCCIÓN A LAS PRUEBAS DE HIPÓTESIS

Los análisis estadísticos


MÉTODOS ALTERNATIVOS »» Bootstrapping (método de remuestreo) (una alternativa a
los intervalos de confianza): Volvemos a muestrear cada uno
En los siguientes apartados, voy a presentar varios métodos para llevar a
de nuestros grupos, retirando elementos de manera aleatoria
cabo pruebas de hipótesis, necesitando algunas suposiciones o requisitos
y sustituyéndolos con otros elementos del grupo. En otras
específicos (tipo de variables, distribución, varianza, etc.) Sin embargo,
palabras, con los miembros de un grupo, recreamos nuevos
también hay otra alternativa que podemos utilizar cuando tengamos
grupos que pueden contener un elemento numerosas
variables numéricas pero no estemos seguros de la distribución de la
veces y no contener otro en ningún momento. Un método
población o la varianza. Este método alternativo usa dos simulaciones:
de remuestreo alternativo sería volver a muestrear los
»» Shuffling (redistribución) (una alternativa a la prueba de grupos originales en subgrupos más pequeños (método de
relevancia): redistribuimos aleatoriamente los elementos del grupo Jackknife). Tras calcular la diferencia de las medias de los
(es decir, mezclamos los elementos de ambos grupos de manera nuevos pares de muestras, tendremos una distribución de
aleatoria, creando cada vez un nuevo par de grupos) y calculamos la medias y podremos calcular nuestro intervalo de confianza

80 Modelos fundamentales para analistas de negocios


diferencia media en cada simulación. Después de varias iteraciones, (es decir, el 95% de las diferencias de media calculadas se
calcularemos el porcentaje de pruebas experimentales en las que sitúan entre X e Y).
la diferencia en las medias sea mayor que la que se calcula entre
los dos grupos originales. Esto se puede comparar con la prueba de
relevancia; por ejemplo, si menos del 5% de las iteraciones indican
una diferencia mayor, la prueba será relevante con una α < 0,05.
42
81

EL ENFOQUE BAYESIANO A LAS PRUEBAS DE HIPÓTESIS

Los análisis estadísticos


Este problema se resuelve encontrando el porcentaje de positivos
verdaderos (la prueba es positiva y la persona realmente padece
OBJETIVO
la enfermedad) entre el número total de pruebas positivas, y
IDENTIFICAR LA PROBABILIDAD DE UNA HIPÓTESIS UTILIZANDO LA puede enfocarse elaborando la siguiente matriz y calculando los
PROBABILIDAD DE EVENTOS RELACIONADOS. porcentajes que faltan (Figura 42).

Obtenemos la respuesta dividiendo 0,45% por 10,45%, que da


como resultado que existe un 4,31% de probabilidad de que esa
Este enfoque probabilístico se utiliza a menudo en pruebas lógicas (logic persona esté enferma. De manera más formal, el problema se
tests), que pueden requerir la resolución de una afirmación parecida a la resuelve a través de la siguiente ecuación:
siguiente:

El 0,5% de la población sufre una determinada enfermedad y, aquellos

80 Modelos fundamentales para analistas de negocios


que padecen esta enfermedad y se someten a una prueba clínica,
reciben un diagnóstico correcto en el 90% de los casos. También en la que P es la probabilidad, A es padecer la enfermedad, y B es
se sabe que hay, de media, un 10% de pruebas de falso positivo en cuando la prueba es positiva; por lo tanto, P(A|B) es la probabilidad
personas que no padecen la enfermedad. Si una persona ha recibido de padecer la enfermedad cuando la prueba es positiva y P(B|A)
un diagnóstico positivo, ¿cuál es la probabilidad de que realmente es la probabilidad de recibir una prueba positiva cuando el
tenga la enfermedad? paciente tiene la enfermedad. La plantilla muestra cómo se han
calculado los valores partiendo del problema propuesto.

PADECE NO PADECE
TOTAL
ENFERMEDAD ENFERMEDAD
TEST
0.45% 10% 10.45%
POSITIVO
TEST
0.05% 89.50% 89.55%
NEGATIVO

TOTAL 0.50% 99.50% 100%


http://analyticsmodels.blogspot.com.es/p/statistical-
Figura 42: Matriz del método de inferencia bayesiana analysis-templates_2.html
43
82

LA PRUEBA t (t-TEST)

Los análisis estadísticos


Una alternativa a la prueba t es la prueba z; sin embargo, además
del supuesto de normalidad, necesita un tamaño de muestra
OBJETIVO
mayor (por lo general > 30) así como la desviación estándar de la
COMPROBAR SI DOS GRUPOS SON SIGNIFICATIVAMENTE DIFERENTES. población.

Cada uno de los tres tipos de pruebas t descritos anteriormente


tiene dos variantes en función del tipo de hipótesis que se va
a analizar. En caso de que la hipótesis alternativa sea que las
Existen tres aplicaciones principales de una prueba t: dos medias son diferentes, entonces será necesario realizar
una prueba de dos colas (también denominada bilateral). Si la
»» Prueba t con una muestra: nos permite comparar la media de una
hipótesis consiste en que una media es mayor o menor que la
muestra con la media de su población.
otra, entonces habrá que llevar a cabo una prueba de una cola (o

80 Modelos fundamentales para analistas de negocios


»» Prueba t con dos muestras: para comparar dos medias de dos unilateral). También resulta posible especificar en la hipótesis que
muestras. la diferencia será mayor que un determinado número (en pruebas
t emparejadas y de dos muestras).
»» Prueba t emparejada: nos permite comparar las medias de la misma
muestra en dos distintas situaciones (por ejemplo, antes y después Tras realizar la prueba, podremos rechazar la hipótesis nula (no
de un tratamiento).26 hay diferencias) en caso de que el valor p sea menor que el alfa
(αα) elegido (normalmente 0,05) y siempre que el valor estadístico
Para llevar a cabo una prueba t, resulta necesario comprobar el supuesto t no se encuentre entre el valor crítico t positivo y el negativo (ver
de normalidad (véase 36. Introducción a las regresiones); no obstante, plantilla). El valor crítico de t para una prueba bilateral (dos colas
la prueba t tolera desviaciones de la normalidad siempre y cuando el críticas t) se utiliza para calcular el intervalo de confianza que se
tamaño de la muestra sea grande y las dos muestras tengan un número situará en el 1 menos el αα elegido (si elegimos 0,05, tendremos un
parecido de elementos. En caso de desviaciones de la normalidad intervalo de confianza del 95%).
significativas, podemos o bien transformar los datos o bien utilizar una
prueba no-paramétrica (véase la Figura 40 en el apartado 41. Introducción
a las pruebas de hipótesis).

En algunos casos, también resulta posible utilizar dos muestras y emparejar a cada componente en una
26

determinada dimensión.
43
83

LA PRUEBA t (t-TEST)

Los análisis estadísticos


PRUEBA T DE UNA MUESTRA Se elige un nivel de confianza de 0,05. A continuación, calculamos
el valor crítico t así como el valor p (las fórmulas pueden
Con esta prueba, comparamos la media de una muestra con la media de
consultarse en la plantilla).
la población. Por ejemplo, tenemos una fábrica de champú y sabemos
que cada envase tiene que llenarse con 300 ml de champú. Para controlar
estadístico t - 3.620
la calidad del producto final, tomaremos muestras aleatorias de la línea
de producción y mediremos el volumen de champú. valor p 0.00069638

Significación Si
Unilateral (una cola)
Two-tailed Left-tailed Right-tailed
Intervalos de confianza 3.02
H0 µ = µ0 H0: µ ≥ µ0 H0: µ ≤ µ0
Límite superior 297.58
Ha µ ≠ µ0 Ha: µ < µ0 Ha: µ > µ0

80 Modelos fundamentales para analistas de negocios


Límite inferior 291.54

Media población 300 300 300 Figura 44: Resultados de una prueba t de una muestra
Media muestra 295 295 295

Desviación estándar 11 11 11 Puesto que el valor p es menor que el alfa (0,05), llegamos a la
Tamaño muestra 50 50 50 conclusión de que la diferencia en las medias es significativa
y que deberíamos arreglar nuestra línea de producción. Los
Nivel de significación (α) 0.05 0.05 0.05 resultados también incluyen un intervalo de confianza del 95%, lo
cual significa que tenemos un nivel de confianza del 95% en que
Figura 43: Datos de entrada de una prueba t de una muestra
los envases se llenan con un volumen mínimo de 292 ml y uno
máximo de 298 ml.
Dado que queremos poder parar y arreglar la línea de producción
en caso de que la cantidad de champú sea menor o mayor que la
cantidad esperada (300 ml), tendremos que llevar a cabo una prueba
de dos colas. La Figura 43 incluye los datos de entrada así como la
desviación estándar calculada y la media de la muestra que es de 295.
43
84

LA PRUEBA t (t-TEST)

Los análisis estadísticos


PRUEBA T DE DOS MUESTRAS Prueba t para dos muestras suponiendo varianzas desiguales

Un ejemplo práctico sería tener que determinar si los clientes masculinos MUJERES HOMBRES

compran más o menos que los clientes femeninos. Media 33.5 11.1
Varianza 401.6111111 18.76666667
En primer lugar, deberíamos definir nuestra hipótesis. En nuestro ejemplo,
Observaciones 10 10
nuestra hipótesis consiste en que los clientes masculinos y los femeninos
Diferencia hipotética de las medias 0 291.54
no compran la misma cantidad de productos, así que deberíamos usar
Grados de libertad 10
una prueba de dos colas; es decir, no deducimos que un grupo específico
compre más que el otro. Por otro lado, nos gustaría analizar si los hombres Estadístico t 3.454841624

compran más, por lo que, en este caso, usaríamos una prueba de una P (T ≤ t) una cola 0.00308794
cola. Valor crítico de t (una cola) 1.812461123
P (T ≤ t) dos colas 0.006175881

80 Modelos fundamentales para analistas de negocios


En el complemento de Excel Análisis de datos elegiremos la opción
Valor crítico de t (dos colas) 2.228138852
“Prueba t para dos muestras suponiendo varianzas desiguales” por defecto,
ya que aunque las varianzas fueran iguales, los resultados no serían Figura 45: Resultado de una prueba t con dos muestras suponiendo varianzas desiguales
distintos, pero si suponemos que las varianzas son iguales, entonces
acabaremos teniendo un problema en los resultados si las varianzas
resultan no ser finalmente iguales. Seleccionamos los datos para las dos Ya que estamos analizando la diferencia, o bien positiva o
muestras y especificamos nuestro nivel de confianza (alfa, por defecto, negativa, en el resultado, tendremos que utilizar el valor p de dos
de 0,05). colas y el valor crítico t de dos colas. En este ejemplo, la diferencia
es significativa puesto que el valor p es menor que el alfa elegido
(0,05).

Los intervalos de confianza también se calculan en la plantilla y


se llega a la conclusión de que tenemos un nivel de confianza del
95% en que las mujeres compran entre 8 y 37 productos más que
los hombres.


43
85

LA PRUEBA t (t-TEST)

Los análisis estadísticos


PRUEBA T EMPAREJADA

Queremos analizar dos productos diferentes entre varios posibles Los resultados del ejemplo muestran que no hay ninguna
consumidores para decidir cuál es mejor, pidiendo a los participantes que diferencia significativa en la clasificación de los dos productos ya
prueben cada uno y lo clasifiquen en una escala del 1 al 10. Dado que que el valor p (de dos colas) es mayor que el alfa (0,05). La plantilla
hemos decidido utilizar al mismo grupo para probar ambos productos, también contiene el intervalo de confianza de la diferencia media,
vamos a llevar a cabo una prueba t emparejada de dos colas. El alfa que en este caso incluye el 0 ya que no hay ninguna diferencia
elegido es 0,05. significativa.

Prueba t para dos muestras suponiendo varianzas desiguales


PRODUCTO 1 PRODUCTO 2

80 Modelos fundamentales para analistas de negocios


Media 5.7 5.4
Varianza 2.23333 3.6
Observaciones 10 10
Coeficiente de correlación de Pearson 0.948297995
Diferencia hipotética de las medias 0
Grados de libertad 9
Estadístico t 1.405563857
P (T ≤ t) una cola 0.09671103
Valor crítico de t (una cola) 1.833112933
P (T ≤ t) dos colas 0.19342206
Valor crítico de t (dos colas) 2.262157163

Figura 46: Resultado de una prueba t emparejada

http://analyticsmodels.blogspot.com.es/p/statistical-
analysis-templates_2.html
44
86

LA PRUEBA DE PROPORCIONES

Los análisis estadísticos


CON UNA MUESTRA

OBJETIVO El jefe de una empresa asegura que el 80% de los empleados están muy
satisfechos con sus condiciones de trabajo. Nuestra hipótesis nula es
COMPROBAR SI DOS PROPORCIONES SON SIGNIFICATIVAMENTE que la satisfacción es igual al 80%, y nuestra hipótesis alternativa es que
DIFERENTES. el índice de satisfacción es distinto del 80%. El departamento de RR.HH.
decide encuestar a 100 empleados y obtiene un resultado del 73%. A un
nivel de relevancia del 0,05, no podemos rechazar la hipótesis nula por
lo que no podemos afirmar que la satisfacción de nuestra encuesta sea
Esta prueba tiene el mismo objetivo que una prueba t pero se aplica para
significativamente distinta del 80%. En la Figura 47 podemos ver que el
comparar proporciones, es decir, cuando los elementos pueden tener el valor de
intervalo de confianza (95%) incluye el 80%.
0 o 1. Por ejemplo, podemos comparar la tasa de conversión de dos campañas de
publicidad (prueba de proporciones de dos muestras) o comparar la mejora de Dos colas (H0: p - P = 0)

80 Modelos fundamentales para analistas de negocios


los pacientes que han sido tratados con un medicamento nuevo en comparación Test Statistics (Z-Test) 1.7500 SIGNIFICATIVO
con la mejora media de estos pacientes. valor p 0.080118 NO

Al igual que en la prueba t, tendremos que especificar nuestra hipótesis y, en


Intervalos de confianza (dos colas) 65.16% 80.84%
función de cómo sea, realizar o bien una prueba t de dos colas o bien una prueba
t de una cola (véase 43. La prueba t (t-test)); la única diferencia en este caso es Intervalos de confianza (una cola) 66.42% 79.58%

que, en vez de utilizar medias, usaremos proporciones. Después necesitamos


Figura 47: Resultados de una prueba de proporciones con una muestra
especificar el nivel de relevancia exigido (αα) y la hipotética diferencia entre las
proporciones. CON DOS MUESTRAS

Otras diferencias con respecto a la prueba t consisten en que resolveremos la Una empresa ha lanzado una nueva campaña de marketing online y
prueba calculando el valor crítico z en lugar del valor crítico t, y que el cálculo quiere compararla con una campaña de marketing online convencional.
será ligeramente diferente porque utilizaremos proporciones en lugar de medias, El objetivo consiste en aumentar la tasa de conversión de los usuarios
varianzas y desviaciones estándar. Además, tendremos que comprobar que el online, y las tasas de conversión de las dos campañas se comparan
número de eventos (conversiones) y el número de “no eventos” (usuarios que no utilizando una prueba de proporciones. Los resultados no se presentan
compraron nada) es de, por lo menos, 10. aquí ya que esta prueba se explica en mayor detalle en el apartado 45.
El test A/B.

http://analyticsmodels.blogspot.com.es/p/statistical-
analysis-templates_2.html
45
87

EL TEST A/B

Los análisis estadísticos


Un test A/B es un experimento aleatorio con dos variantes (una
prueba de hipótesis con dos muestras), aunque podemos añadir
OBJETIVO
también más muestras. La diferencia con respecto a las pruebas
ANALIZAR DOS O MÁS PRODUCTOS/OBJETOS E IDENTIFICAR EL QUE TENGA con múltiples variables es que en los tests A/B solo varía un único
EL MEJOR RENDIMIENTO. elemento, mientras que en las otras pruebas, varían distintos
elementos y se deberían analizar varias combinaciones. Estos
tests se utilizan en varios sectores y para distintas cuestiones
empresariales aunque, hoy en día, son bastante populares en el
Los tests A/B forman parte de un grupo más amplio de métodos que se
ámbito del marketing online y del diseño de páginas web.
utilizan para llevar a cabo pruebas de hipótesis estadísticas en las que se
comparan dos conjuntos de datos. Tras definir un umbral de probabilidad Normalmente, se aplican los siguientes pasos:
(nivel de relevancia), podemos determinar en términos estadísticos si
1. Identificar los objetivos: por ejemplo, “mejorar la tasa de

80 Modelos fundamentales para analistas de negocios


tenemos que rechazar o no la hipótesis nula. Por lo general, la hipótesis
conversión de nuestra página web”.
nula consiste en que no hay ninguna diferencia significativa entre los dos
conjuntos de datos. 2. Generar hipótesis: por ejemplo, “un botón de COMPRAR que
sea más grande supondrá una mayor conversión”.

3. Crear variables: en nuestro ejemplo, el elemento que


debemos modificar es el botón de COMPRAR y la página web
alternativa puede crearse con un botón de COMPRAR que
Intervalos de confianza Intervalos de confianza tenga el doble del tamaño del anterior.
(Variación) (Control)
4. Ejecutar el experimento:
Significativo a desde hasta desde hasta
»» Establecer un tamaño de muestra: en función de la
90% confianza SI 4.15% 8.16% 7.56% 12.44%
tasa de conversión esperada, el margen de error que
95% confinaza SI 3.77% 8.54% 7.10% 12.90% consideremos aceptable, el nivel de confianza y la
99% confianza NO 3.03% 9.28% 6.19% 13.81% población, es posible calcular el tamaño mínimo que
Figura 48: Resultado de un test A/B sobre tasas de conversión
tiene que tener la muestra (ver plantilla).
45
88

EL TEST A/B

Los análisis estadísticos


»» Deben presentarse las dos versiones a los visitantes durante el La plantilla propuesta proporciona una calculadora sencilla para el
mismo periodo, y estos internautas deben elegirse de manera tamaño de la muestra necesario y para analizar la relevancia
aleatoria (estamos interesados en analizar el efecto que tiene un del test A/B sobre tasas de conversión. No obstante, existe
botón mayor; si no elegimos a los visitantes de manera aleatoria una cantidad de información considerable acerca de los tests
o si presentamos ambas versiones durante distintos periodos, los A/B disponible online.27 La plantilla del apartado 44. La prueba
resultados seguramente estarán sesgados). de proporciones presenta el mismo test con un mayor nivel de
detalle estadístico así como los intervalos de confianza de la
5. Analizar los resultados:
diferencia media entre las dos muestras, mientras que la plantilla
»» Relevancia: en función del nivel de relevancia elegido para la de las pruebas A/B presenta los intervalos de confianza de cada
prueba (normalmente 90%, 95%, o 99%), podemos tener un nivel tasa de conversión media para las dos muestras.
de confianza del X% en que las dos versiones tendrán resultados
En el ejemplo propuesto, los datos se obtienen utilizando una
de conversión distintos.

80 Modelos fundamentales para analistas de negocios


herramienta de análisis web (por ejemplo, Google Analytics),
»» Intervalos de confianza: según el nivel de confianza elegido, pero pueden conseguirse a través de cualquier experimento que
habrá un rango probable de tasas de conversión (tendremos un decidamos llevar a cabo.
nivel de confianza del X% en que la tasa de conversión oscile
entre X e Y).

»» Tamaño del efecto: el tamaño del efecto representa la diferencia


entre las dos versiones.

http://analyticsmodels.blogspot.com.es/p/statistical-
analysis-templates_2.html

27
http://conversionxl.com/ab-testing-statistics
https://www.optimizesmart.com/understanding-ab-testing-statistics-to-get-real-lift-in-conversions/
46
89

EL ANÁLISIS DE LA VARIANZA (ANOVA)

Los análisis estadísticos


Mientras que con una prueba t solo podemos analizar dos
grupos, con un análisis de la varianza (ANOVA), podemos
OBJETIVO
examinar varios grupos y decidir si las medias de estas muestras
COMPROBAR SI DOS O MÁS GRUPOS SON SIGNIFICATIVAMENTE son significativamente diferentes. El análisis más sencillo es
DIFERENTES. el análisis de la varianza unidireccional, en el que la varianza
depende de un único factor. Imaginemos que queremos saber
si la edad de las personas que compran tres productos distintos
es significativamente diferente para así poder centrar mejor las
campañas promocionales. En este caso, tendremos únicamente
un factor (tipo de producto); y por lo tanto, llevaremos a cabo un
análisis de la varianza unidireccional tras comprobar el supuesto
de normalidad (véase la 36. Introducción a las regresiones).

80 Modelos fundamentales para analistas de negocios


Cuando haya finalizado la prueba, tendremos que comprobar
el valor p (< 0,05) y el valor F (mayor que el valor crítico F) para
RESUMEN rechazar la hipótesis nula y deducir que las poblaciones no son
Grupos Cuenta Suma Promedio Varianza iguales. En el ejemplo propuesto, existe una diferencia de edad
Columna 1 10 10 10 10 significativa entre los compradores de estos productos. Sin
Columna 2 10 10 10 10
embargo, deberíamos realizar una prueba t para cada par de
Columna 3 10 10 10 10
grupos para determinar dónde está la diferencia.

En un análisis de la varianza bidireccional tendremos que


ANÁLISIS DE LA VARIANZA
analizar dos factores. Por ejemplo, estamos vendiendo los
Origen de las Suma de Grados de Promedio de los F Probabili- Valor crítico productos A, B, y C en tres países (1, 2, y 3). En el ejemplo propuesto,
variaciones cuadrados libertad cuadrados dad de F
Entre grupos 1217.266667 2 608.633333 14.87696904 4.41027 3.354130829 utilizaremos un análisis de la varianza bidireccional con una sólo
1104.6 27 40.91111111
muestra por grupo (“Análisis de varianza de dos factores con una
Dentro de los grupos
Total 2321.866667 29 sola muestra por grupo”) dado que tan solo se registrará una
observación para cada combinación de factores (utilizaremos un
Figura 49: Resultado de un análisis de la varianza unidireccional
análisis de la varianza “con réplica” en caso de que tengamos que
46
90

EL ANÁLISIS DE LA VARIANZA (ANOVA)

Los análisis estadísticos


registrar más observaciones para cada combinación). En un análisis de la También podemos llevar a cabo un análisis de la varianza
varianza bidireccional, tendremos que analizar dos hipótesis nulas, una con medidas repetidas siempre y cuando tengamos medidas
para cada factor, y es posible que se rechace la hipótesis para un factor repetidas dentro del mismo grupo. En nuestro ejemplo, una
pero no para el otro. empresa decide poner en marcha un programa de formación de
cuatro semanas para cinco empleados con el objetivo de reducir
En nuestro ejemplo, rechazaremos la hipótesis nula para el factor de
el número de errores cometidos en el trabajo. En este caso, las
“tipo de producto” (filas), dado que su valor p es inferior a 0,05, pero no
medidas repetidas son los errores de cada empleado durante la
podemos rechazar la hipótesis nula del factor “país” (columnas).
misma semana de formación.

RESUMEN

Grupos Cuenta Suma Promedio Varianza

80 Modelos fundamentales para analistas de negocios


1 3 371 123.66667 196.3333
Semanas de formación
Nº errores Sem 1 Sem 2 Sem 3 Sem 4
2 3 450 150 175
Empleado 1 201 201 201 201 153
3 3 517 172.3333 220.3333
Empleado 2 162 144 108 87 125.25
A 3 424 141.3333 282.3333

B 3 479 159.6667 382.3333


Empleado 3 132 102 102 84 105

C 3 435 145 1425 Empleado 4 171 138 96 96 125.25


Empleado 5 75 54 96 75 75
ANÁLISIS DE LA VARIANZA 148.2 126 108 84.6

Origen de las Suma de Grados de Promedio de los F Probabili- Valor crítico


variaciones cuadrados libertad cuadrados dad de F
Filas 3560.66667 2 1780.33333 11.510775 0.021912878 6.94427191 Nº tratamientos 4 df error 12

564.666667 2 282.33333 1.8254310 0.27333512 6.94427191


Nº sujetos 5 MS 650.775
Columnas
Error 618.666667 4 1554.66667 SS Sujetos 13358.7 F 5.59548
Total 4744 8
SS Error 7809.3 Valor P 0.0123

Figura 50: Resultado de un análisis de la varianza bidireccional Figura 51: Resultados de un análisis de la varianza de factor único con medidas repetidas
46
91

EL ANÁLISIS DE LA VARIANZA (ANOVA)

Los análisis estadísticos


La plantilla contiene los cálculos para un análisis de la varianza de factor Una extensión del análisis de la varianza (ANOVA) es el análisis
único con medidas repetidas. En nuestro ejemplo, dado que el valor p multivariante de la varianza (MANOVA), que nos permitirá
es inferior a 0,05 (nuestro alfa elegido), rechazamos la hipótesis nula de llevar a cabo el análisis con más de una variable dependiente.
que no hay diferencia entre las medias de la semana y deducimos que la Por ejemplo, es posible realizar un análisis multivariante de la
formación ha tenido un impacto en el número de errores (Figura 51). varianza (MANOVA) utilizando el “nivel educativo” como variable
independiente categórica y “resultado de la prueba” e “ingresos
Podemos utilizar el complemento de análisis de datos de Excel para
anuales” como las variables independientes continuas.
llevar a cabo un análisis de la varianza de dos factores con medidas
repetidas, eligiendo la prueba “Análisis de varianza de dos factores con
varias muestras por grupo” En el ejemplo propuesto, estamos vendiendo
diferentes versiones del producto en mercados distintos y queremos
analizar si alguno de los productos o el mercado (o ambos) tienen un

80 Modelos fundamentales para analistas de negocios


impacto en el número de productos vendidos. Los resultados muestran
que, mientras que el tipo de producto (filas) sí afecta a las ventas (valor p
< 0,05), el mercado (columnas) no (Figura 52).

ANÁLISIS DE LA VARIANZA
Origen de las Suma de Grados de Promedio de los Probabili- Valor crítico
F
variaciones cuadrados libertad cuadrados dad de F

Muestras 8716.03333 2 4358.016667 9.88679459 0.00025371 3.190727336

Columnas 3416.85 3 1138.95 2.58387371 0.064081112 2.798060635

Integración 6223.7 6 1037.28333 2.35322809 0.045066264 2.294601313

Dentro del grupo 21158 48 440.7916667

Total 39541.58333 59

Figura 52: Resultados de un análisis de la varianza de dos factores con varias muestras por grupo http://analyticsmodels.blogspot.com.es/p/statistical-
analysis-templates_2.html
47
92

INTRODUCCIÓN A LOS MODELOS NO PARAMÉTRICOS

Los análisis estadísticos


Los modelos no paramétricos se utilizan como complemento
de los modelos paramétricos que analizan la correlación o
la dependencia entre variables cuando no se cumplen los
supuestos de los modelos paramétricos: distribución normal,
varianza homogénea, variables de intervalo o ratio, y conjuntos
de datos independientes.

Siempre que el tamaño de la muestra sea lo suficientemente


grande (es decir, superior a 100), podremos utilizar pruebas
paramétricas incluso si no estamos seguros de la normalidad de
la distribución de la población. Si la muestra es pequeña y no
estamos seguros de la distribución de la población, deberíamos

80 Modelos fundamentales para analistas de negocios


utilizar pruebas no paramétricas.

Además, con variables ordinales y nominales, no podemos llevar


a cabo pruebas paramétricas. En el caso de variables numéricas
CARACTERÍSTICAS DE LA MUESTRA (VARIABLES INDEPENDIENTES)
que pueden clasificarse (por ejemplo, la satisfacción de los clientes
VARIABLE
2 MUESTRAS MUESTRAS > 2
CORRELA- medida en una escala del 0 al 10), normalmente no podremos
DEPENDIENTE 1 CIÓN
MUESTRA
utilizarlas como variables de intervalo ya que la distancia entre
INDEPENDIENTE DEPENDIENTE INDEPENDIENTE DEPENDIENTE los valores no será igual a lo largo de la escala. Por ejemplo, una
persona que haya elegido el “6” no estará necesariamente el
Coeficiente
Prueba de phi, tablas doble de satisfecha que una persona que ha elegido el “3”.
CATEGÓRICA Chi-cuadrado Chi-cuadrado Q de Cochran
McNemar de contin-
gencia
La Figura 53 presenta una lista de las pruebas no paramétricas
Prueba
Prueba de de Schei- presentadas en este libro.
Prueba de
Kruskal-Wallis, rer-Ray-Hare Correlación
Chi-cua- Prueba U de los rangos
ORDINAL prueba de la (bidireccional), de Spear-
drado Mann-Whitney con signo de
suma de rangos prueba de Fried- man
Wilcoxon
de Wilcoxon man (unidirec-
cional)

Figura 53: Resumen de las pruebas no paramétricas


48
93

LA PRUEBA DE CHI-CUADRADO

Los análisis estadísticos


PRUEBA DE INDEPENDENCIA
OBJETIVO En el ejemplo, estamos analizando la independencia de las
variables “estado civil” y “nivel de servicio” elegidas por los clientes.
COMPROBAR SI LA DIFERENCIA ENTRE LAS FRECUENCIAS OBSERVADAS Y
LAS FRECUENCIAS ESPERADAS ES SIGNIFICATIVA O NO. VALORES OBSERVADOS

Grupos Premium Medium Basic Total

Casados 21 15 22 48
Una prueba de chi-cuadrado se utiliza para analizar las frecuencias de Solteros 39 22 22 83
observaciones independientes con dos objetivos principales:
Divorciados 8 15 24 47

»» La prueba de independencia: para determinar la asociación entre Total 68 52 58 48

dos variables categóricas, por ejemplo, si el tipo de estado civil no

80 Modelos fundamentales para analistas de negocios


VALORES ESPERADOS
afecta al tipo de servicio que compran los clientes. Grupos Premium Medium Basic Total

»» La prueba de la bondad de ajuste: para determinar la diferencia Casados 18.34 14.02 15.64 48

entre los valores observados y los valores esperados (por ejemplo, Solteros 31.71 24.25 27.04 83
si una muestra tomada de una población sigue la distribución de la Divorciados 17.96 13.73 15.31 47
población esperada o una distribución teórica). Total 68 52 58 178

En cualquiera de los casos, el método utilizado es el mismo; Figura 54: Valores observados frente a valores esperados en una prueba de chi-cuadrado

concretamente, aplicaremos una prueba de chi-cuadrado utilizando


los valores observados y los valores esperados. Siempre que utilicemos Para esta prueba, asumimos que la probabilidad de recibir un
una prueba de chi-cuadrado, resulta importante tener presente que nivel de servicio específico y la probabilidad de estar casado/a,
esta prueba es sensible al tamaño de la muestra (con menos de 50, esta soltero/a o divorciado/a son acontecimientos independientes.
prueba no será adecuada) y necesita tener una frecuencia mínima en Con estas suposiciones, comparamos la distribución real de los
cada contenedor o clase (como mínimo 5). Si estas condiciones no se productos vendidos en cada país y la distribución esperada basada
cumplen, deberíamos entonces considerar usar una prueba exacta de en las probabilidades independientes de los dos acontecimientos
Fisher. (ver plantilla). En otras palabras, la prueba compara las frecuencias
esperadas con las frecuencias reales.
48
94

LA PRUEBA DE CHI-CUADRADO

Los análisis estadísticos


A continuación, se aplica la fórmula de Excel “=PRUEBA.CHICUAD”, y si el También podemos comparar nuestros valores observados con
valor p resultante es inferior a 0,05 (u otro alfa elegido), rechazaremos la una distribución teórica.
hipótesis nula (es decir, las dos variables son independientes) y podremos,
por lo tanto, deducir que las dos variables están relacionadas. En otras PRUEBA DE PROPORCIONES
palabras, podemos afirmar que el estado civil afecta al nivel de servicio
La prueba de chi-cuadrado también puede utilizarse en lugar
recibido.
de usar la prueba z en una prueba de proporciones (véase 44. La
prueba de proporciones) cuando no se cumplen los supuestos
BONDAD DE AJUSTE
necesarios para utilizar una prueba paramétrica. En este caso,
La bondad de ajuste puede calcularse en Excel utilizando la misma compararemos la proporción observada con la proporción
fórmula (=CHITEST) que tendrá que aplicarse a una columna (o fila) con esperada a través de una tabla de contingencia de doble entrada
valores observados y una columna con valores esperados. Por ejemplo, (la misma tabla utilizada en la prueba de independencia pero con

80 Modelos fundamentales para analistas de negocios


si tiramos un dado, esperamos que cada número tenga la misma tan solo dos categorías por fila y dos categorías por columna).
probabilidad de salir (1/6) pero podemos sospechar que el dado esté
trucado. En nuestro ejemplo, tiramos el dado 60 veces y esperamos
obtener cada número 10 veces. Si el valor p es inferior a 0,05, rechazaremos
la hipótesis nula, que consiste en que las variables son independientes
(es decir que los valores observados son significativamente diferentes a
los valores esperados). Ya que el valor p es superior a 0,05, llegaremos a
la conclusión de que el dado no está trucado.

NUMERO OBSERVADO ESPERADO


1 6 10
2 14 10 VALOR P
3 8 10 0.4408
4 12 10
5 8 10
6 12 10 http://analyticsmodels.blogspot.com.es/p/statistical-
Figura 55: Datos y resultados de una prueba de chi-cuadrado con bondad de ajuste analysis-templates_2.html
49
95

EL COEFICIENTE DE CORRELACIÓN DE SPEARMAN

Los análisis estadísticos


12

OBJETIVO 10

8
COMPROBAR SI DOS VARIABLES ESTÁN CORRELACIONADAS (SIEMPRE

Satisfacción
6
QUE NO SE CUMPLAN LOS SUPUESTOS NECESARIOS PARA LAS PRUEBAS
PARAMÉTRICAS). 4

Define la dependencia estadística de dos variables que pueden ser 2

discretas, continuas u ordinales. La correlación de Spearman debería 0


utilizarse en lugar de la correlación de Pearson (véase 37. La correlación 0 5 10 15 20 25
de Pearson) cuando existe una relación monotónica no lineal entre las Productos vendidos
dos variables, cuando hay valores atípicos significativos, o por lo menos

80 Modelos fundamentales para analistas de negocios


una de las variables es ordinal.

En la práctica, la correlación de Spearman es la correlación de Pearson Nº prod Satisfac- Clasific. Clasificación


vendidos ción ventas satisfacción
de la clasificación de las dos variables. En primer lugar, deberíamos
2 5 1 7 r 0.757239
analizar los datos en un diagrama de dispersión y, a continuación, calcular 10 6 7 9.5 p 0
la clasificación de las dos variables. En caso de que tengamos variables 23 10 15 15 n 15
11 7 8.5 11.5 df 13
con el mismo valor, tendremos que calcular una clasificación media (esto
4 4 2.5 4 st 0.050241
puede llevarse a cabo con una función específica de Excel – ver plantilla). 7 4 5 4 t 15.072064
9 5 6 7 alta 0.05
Si el número de observaciones es superior a 10, podremos utilizar el valor 11 5 8.5 7 t-crit 2.160368
p para comprobar si el coeficiente de correlación es significativo o no. 12 7 10 11.5 valor p 1.30124
Si es inferior a 10, deberíamos utilizar una tabla con valores críticos (ver 20 8 14 13 sig si
16 4 12 4
plantilla) y, siempre que el valor absoluto del coeficiente de correlación
13 6 11 9.5 rho-crit 0.5214
(r) sea mayor que el valor crítico (rho-crit), entonces será significativo. 19 9 13 14 sig si
5 2 4 2
4 1 2.5 1
http://analyticsmodels.blogspot.com.es/p/statistical-
analysis-templates_2.html Figura 56: Coeficiente de correlación de Spearman
50
96

EL COEFICIENTE PHI

Los análisis estadísticos


A continuación, tendremos que llevar a cabo una prueba de chi-cuadrado
comparando las frecuencias observadas con las frecuencias esperadas
(para las frecuencias esperadas, crearemos una copia de la tabla y las
calcularemos de la misma manera que para la prueba de chi-cuadrado;
OBJETIVO véase 48. La prueba de chi-cuadrado). Con este valor, podremos calcular
dos coeficientes de correlación:
IDENTIFICAR LA ASOCIACIÓN O CORRELACIÓN ENTRE DOS VARIABLES
NOMINALES. »» Coeficiente Phi: se trata del coeficiente más sencillo utilizado como
medida de la asociación entre dos categorías en dos variables.
»» Coeficiente V de Cramer: se trata de un coeficiente phi ajustado y
las dos variables pueden tener más de dos categorías; nos permite
Cuando tenemos variables dependientes categóricas, este método se utiliza
también comparar una variable categórica con una variable ordinal.
como alternativa de la correlación de Pearson con variables numéricas o de la
correlación de Spearman con variables de rango. También puede definirse como
Interpretación Coeficiente V de Cramer Interpretación Phi
la medida del tamaño del efecto de una prueba de chi-cuadrado (que se utiliza
grados de pequeño mediano grande pequeño medio grande

80 Modelos fundamentales para analistas de negocios


cuando tenemos variables categóricas dependientes e independientes). El primer libertad
1 0.1 0.3 0.5 0.1 0.3 0.5
paso consiste en crear una tabla de contingencia, es decir, una tabla de doble
entrada con las frecuencias cruzadas de las variables seleccionadas. En nuestro 2 0.07 0.21 0.35
3 0.06 0.17 0.029
ejemplo, queremos comprobar la asociación entre una terapia específica y el
final de una enfermedad en varios pacientes. La variable dependiente aparece *valor mínimo entre "nº de filas -1" y "nº columnas -1

representada en las filas (curados y no curados) y la variable independiente en las


Figura 58: Interpretación de los coeficientes Phi y V de Cramer
columnas (terapia 1 y terapia 2).
La Figura 58 presenta algunas directrices que nos ayudarán a interpretar
los resultados de las dos pruebas: en otras palabras, el grado de
VALORES OBSERVADOS
asociación entre las dos variables (pequeño, mediano o grande). La
Grupos Terapia 1 Terapia 2 Total interpretación del coeficiente V de Cramer dependerá del número de
Curado 21 15 36 categorías que se están comparando; en caso de tener solo dos, los

No curado 39 22 61 resultados y la interpretación serán los mismos que para el coeficiente

Total 60 37 97 de correlación de phi.

http://analyticsmodels.blogspot.com.es/p/statistical-
Figura 57: Tabla de contingencia
analysis-templates_2.html
51
97

LA PRUEBA U DE MANN–WHITNEY

Los análisis estadísticos


Define si dos muestras son significativamente distintas y se utiliza
en lugar de la prueba t con dos muestras siempre que no se
OBJETIVO
cumplan los supuestos de normalidad, los datos sean ordinales y
COMPROBAR SI LA DIFERENCIA EN DOS GRUPOS ES SIGNIFICATIVAMENTE no haya valores atípicos significativos.
DIFERENTE (SIEMPRE QUE NO SE CUMPLAN LOS SUPUESTOS NECESARIOS
Esta prueba requiere algunas suposiciones: los datos deben
PARA LAS PRUEBAS PARAMÉTRICAS).
ser, como mínimo, ordinales, la suma de las observaciones en
las dos muestras tiene que ascender a, por lo menos, 20, las
observaciones deben ser independientes (podemos utilizar esta
Satisfacción (1-10) Satisfacción (1-10)
Clasificación Hombres Mujeres
alfa 0.05
prueba para sustituir a una prueba t de muestras independientes
colas 1
Hombres Mujeres Hombres Mujeres Número 15 15 pero no a una prueba t emparejada), y las dos muestras deben
U 69
4 3 6 3.5 Mediana 7 6 media 112.5
tener perfiles de distribución parecidos.

80 Modelos fundamentales para analistas de negocios


7 4 18.5 6 Suma Clase 276 189 varianza 581.25
desv. est. 24.109127
Para la prueba, tendremos que combinar todos los datos y
10 10 29.5 29.5 U 69 156
z-score -1.804296 clasificar cada valor (en el caso de valores ligados, tendremos
8 9 23.5 27
u-crit 72.344015
que calcular una clasificación media al igual que en la prueba de
7 6 18.5 12.5 valor p 0.0355925
sig si
Spearman).
8 3 23.5 3.5
r 0.3294179
6 6 12.5 12.5 En el ejemplo, se realiza una prueba de una cola para comprobar
Distribución de frecuencia
8 7 23.5 18.5 4.5 si los hombres están más satisfechos de media que las mujeres.
6 2 12.5 2 4 Puesto que el valor p es inferior al alfa (0,05), rechazaremos
5 7 8.5 18.5 3.5
la hipótesis nula y asumiremos que los hombres están más
5 4 8.5 6 3
satisfechos que las mujeres.
2.5
7 6 18.5 12.5
2
9 6 27 12.5
1.5
7 1 18.5 1
1
9 8 27 23.5
0.5

7.1 5.5 1 2 3 4 5 6 7 8 9 10 http://analyticsmodels.blogspot.com.es/p/statistical-


Mujeres Hombres analysis-templates_2.html
Figura 59: Prueba U de Mann–Whitney
52
98

LA PRUEBA DE LOS RANGOS CON SIGNO DE WILCOXON

Los análisis estadísticos


Se trata de un reemplazo no paramétrico de una prueba t,
siempre que la normalidad no pueda comprobarse o la muestra
OBJETIVO
sea demasiado pequeña (inferior a 30), pero a diferencia de la
COMPROBAR SI LA DIFERENCIA EN DOS GRUPOS ES SIGNIFICATIVAMENTE prueba de Mann–Whitney, se utiliza para muestras emparejadas
DIFERENTE (SIEMPRE QUE NO SE CUMPLAN LOS SUPUESTOS NECESARIOS (es decir que los grupos no son independientes). El ejemplo que
PARA LAS PRUEBAS PARAMÉTRICAS). incluyo a continuación es una “prueba de los rangos con signo de
Wilcoxon” (para muestras emparejadas y como alternativa de la
prueba t emparejada paramétrica).

Las suposiciones para esta prueba son las siguientes: las muestras
deben provenir de la misma población, las parejas tienen que
Clasificac.
Persona
Satisfac. Satisfac.
Diferencia
Diferencia
diferencia
Clasificac. Clasificac. elegirse de manera independiente, los datos deben medirse,
verano invierno absoluta positivas negativas

80 Modelos fundamentales para analistas de negocios


absoluta
como mínimo, en una escala ordinal (continua, discreta u ordinal),
1 7 9 2 2 6 6
y la distribución no puede ser especialmente desigual (es decir,
2 4 6 2 2 6 6
tiene que ser más o menos simétrica).
3 9 2 -7 7 13.5 13.5

4 2 3 1 1 2.5 2.5 alfa 0.05


Para llevar a cabo esta prueba, se calcula y se clasifica la
5 9 1 -8 8 15 15 colas 2
diferencia entre observaciones. Si tenemos muestras con menos
6 6 7 1 1 2.5 2.5 n 28
de 25 observaciones, tendremos que utilizar una tabla con un
7 10 5 -5 5 11 T 89

8 1 2 1 1 2.5 2.5 T-crit 116


valor crítico T para comprobar la relevancia; más concretamente,
9 1 8 7 7 13.5 13.5 media 203
rechazaremos la hipótesis nula (es decir, no hay diferencia en las
10 1 5 4 4 9.5 9.5 varianza 1928.5 muestras) si T es inferior a la T crítica. Si tenemos una muestra
11 3 6 3 3 8 8 desv est 43.915 mayor, podremos usar el valor p para el análisis de la relevancia.
12 10 4 -6 6 12 12 z-score 2.596

13 5 1 -4 4 9.5 9.5 T-crit 116.879

14 9 8 -1 1 2.5 2.5 Valor p 0.009433

15 1 3 2 2 6 6 sig si

16 10 9 -1 1 2.5 2.5
http://analyticsmodels.blogspot.com.es/p/statistical-
Figura 60: Prueba de los rangos con signo de Wilcoxon analysis-templates_2.html
53
99

LA PRUEBA DE KRUSKAL–WALLIS

Los análisis estadísticos


Esta prueba es una extensión de la prueba de los rangos con signo
de Wilcoxon para más de dos muestras independientes. También
OBJETIVO
puede verse como la alternativa no paramétrica del análisis de
COMPROBAR SI LA DIFERENCIA EN DOS GRUPOS ES SIGNIFICATIVAMENTE la varianza unidireccional y se utiliza cuando las muestras no
DIFERENTE (SIEMPRE QUE NO SE CUMPLAN LOS SUPUESTOS NECESARIOS tienen una distribución normal (sobre todo, cuando la muestra
PARA LAS PRUEBAS PARAMÉTRICAS). es pequeña) o cuando las varianzas son muy diferentes. No
obstante, esta prueba requiere que las muestras tengan perfiles
de distribución parecidos (lo cual puede valorarse utilizando un
Antigua Nueva Placebo Antigua Nueva Placebo
histograma), que sean de un tamaño idéntico y que incluyan más
46 44 26 23 20 5
de cinco observaciones.
32 31 49 10.5 8,5 25,5

42 25 33 18 4 12
El ejemplo recogido en la plantilla se refiere al lanzamiento de

80 Modelos fundamentales para analistas de negocios


45 22 19 22 3 1,5
una nueva pastilla. En el experimento, los encuestados deben
37 30 31 13 6,5 8,5
tomarse una de entre 3 pastillas (la antigua, la nueva y el placebo),
44 30 38 20 6,5 14,5
y tienen que informar sobre el número de días durante los que
38 32 44 14,5 10,5 20

47 19 50 24 1,5 27
han seguido notando el efecto de la misma. Se clasifican después
49 40 25,5 16 los resultados y se lleva a cabo la prueba. En caso de que el
41 17 valor p sea inferior al alfa (0,05), rechazaremos la hipótesis nula
y podremos afirmar que hay una diferencia significativa entre los
Media 42,10 30.33 36,25 Suma clasificación R 187,5 76,5 114 tres grupos; en otras palabras, las pastillas tienen efectos distintos.
Var 27,21 63,75 122,21 Tamaño grupo 10 9 8 27
En cuanto a la relevancia, podremos realizar una comparación por
R2/n 3.515,63 650,25 1.624,50 5.970,38
pares utilizando la prueba U de Mann–Whitney.

H 7,91071429

grados de libertad 2

p 0,01915183

alfa 0,05

sig si
http://analyticsmodels.blogspot.com.es/p/statistical-
Figura 61: Prueba de Kruskal–Wallis analysis-templates_2.html
54
100

LA PRUEBA DE FRIEDMAN

Los análisis estadísticos


Esta prueba es la alternativa no paramétrica del análisis de la
varianza unidireccional con medidas repetidas.
OBJETIVO
El ejemplo incluido en la plantilla describe un experimento en el
COMPROBAR SI LA DIFERENCIA ENTRE DOS GRUPOS ES SIGNIFICATIVAMENTE
que preguntamos a quince clientes potenciales que prueben tres
DISTINTA (SIEMPRE QUE NO SE CUMPLAN LOS SUPUESTOS NECESARIOS
versiones de un producto y los puntúen con una escala del 1 al
PARA LAS PRUEBAS PARAMÉTRICAS).
10. Después, se clasifican los resultados para cada persona y se
lleva a cabo la prueba. En caso de que el valor p sea inferior al alfa
(0,05), rechazaremos la hipótesis nula y deduciremos que existe
una diferencia significativa en la preferencia de, por lo menos, dos
de los tres productos.
Persona Prod. A Prod. B Prod. C Persona Prod. A Prod, B Prod. C R2 2794.5

80 Modelos fundamentales para analistas de negocios


1 10 7 7 1 3 1.5 1.5 k 3

2 8 5 5 2 3 1.5 1.5 m 15

3 7 7 5 3 2.5 2.5 1 Q 6.30

4 9 6 4 4 3 2 1 grados l. 2

5 7 5 7 5 2.5 1 2.5 valor p 0.04

6 7 7 5 6 2.5 2.5 1 alfa 0.05

7 5 8 3 7 2 3 1 sig si

8 4 6 7 8 1 2 3

9 5 4 6 9 2 1 3

10 9 9 4 10 2.5 2.5 1

11 4 7 4 11 1.5 3 1.5

12 7 3 3 12 3 1.5 1.5

13 8 2 7 13 3 1 2

14 9 8 8 14 3 1.5 1.5

15 10 8 1 15 3 2 1

R 37.5 28.5 24

R 2
1406.25 812.5 576 2794.5
http://analyticsmodels.blogspot.com.es/p/statistical-
Figura 62: Prueba de Friedman analysis-templates_2.html
55
101

LA PRUEBA DE SCHEIRER–RAY–HARE

Los análisis estadísticos


Para cada intersección, registramos el número de productos
vendidos. Los datos se registran cinco veces para cada
intersección entre anuncio publicitario/producto. A continuación,
se clasifican los datos, se realiza un análisis de la varianza con
OBJETIVO los datos clasificados y se calculan los valores H utilizando el
resultado del análisis de la varianza.
COMPROBAR SI LA DIFERENCIA ENTRE DOS GRUPOS ES SIGNIFICATIVAMENTE
DISTINTA (SIEMPRE QUE NO SE CUMPLAN LOS SUPUESTOS NECESARIOS
PARA LAS PRUEBAS PARAMÉTRICAS). PRUEBA DE SCHEIRER-RAY-HARE

H Valor P Sig

Filas 13.13 0.00 si


Esta prueba es el complemento no paramétrico del análisis de la varianza
Columnas 4.39 0.22 no
bidireccional con medidas repetidas o bien, si la comparamos con otras Interacción 9.49 0.15 no
pruebas no paramétricas, es la versión con dos factores de la prueba ANÁLISIS DE VARIANZA
de Kruskal–Wallis. Deben cumplirse las mismas condiciones que con

80 Modelos fundamentales para analistas de negocios


Suma cua- Grados Promedio Probabili- Valor
Origen F
la prueba de Kruskal–Wallis; en concreto, las muestras deben tener el drados libertad cuadrados dad crítico F

mismo tamaño y por lo menos cinco observaciones cada una. Muestras 4004.25 2 2002.2125 9,854115186 0.002596 3.190727

Columnas 1339.033 3 446.344 2.19673464 0.1005681 2.7980603

En el ejemplo incluido en la plantilla, tenemos tres tipos de Interacción 2893.641 6 482.273 2.373564102 0.0434701 2.2946013

anuncios publicitarios (filas) y cuatro productos distintos (columnas). Dentro grupo 9752.9 48 203.1854

Total 17990 59

Persona Prod A Prod B Prod C Prod D Persona Prod A Prod B Prod C Prod D
Figura 64: Prueba de Scheirer–Ray–Hare
Anuncio 1 123 128 166 151 Anuncio 1 8 11 22 23
156 150 178 125 28.5 22 45.5 9
112 184 187 117 3 40 52.5 5
100 116 153 155 1 4 24 26.5 En el ejemplo, solo el parámetro de las “filas” es significativo, lo
168 109 195 158 36.5 2 59 30

Anuncio 2 135 175 140 167 Anuncio 2 15 41.5 17 34.5


cual significa que el tipo de anuncio publicitario afecta al número
130
176
132
120
145
159
183
142
12
43.5
14
6.5
19
31
48
18
de productos vendidos. No obstante, el tipo de producto no es
120 187 131 167 6.5 52.5 13 34.5
155 184 126 168 26.5 49 10 36.5 una variable determinante.
Anuncio 3 156 186 185 175 Anuncio 3 28.5 51 50 41.5
180 138 206 173 47 16 60 39
147 178 188 154 21 45.5 54.5 25
146 176 165 191 20 43.5 31 57
193 190 188 169 58 56 54.5 38
http://analyticsmodels.blogspot.com.es/p/statistical-
Figura 63: Datos para la prueba de Scheirer–Ray–Hare analysis-templates_2.html
56
102

LA PRUEBA DE MCNEMAR

Los análisis estadísticos


Esta prueba no paramétrica es la alternativa de la prueba t
emparejada paramétrica o de la prueba no paramétrica de los
OBJETIVO
rangos con signo de Wilcoxon cuando las medidas repetidas son
COMPROBAR SI HAY UN CAMBIO SIGNIFICATIVO ANTES Y DESPUÉS DE UN dicotómicas (sí/no, 1/0, curado/no curado, etc.). En el ejemplo
ACONTECIMIENTO (VARIABLES NOMINALES). presentado, una empresa decide lanzar una campaña específica
para aumentar las recomendaciones de sus productos. Después
de la campaña, se registra el número de clientes que han pasado
de la postura de detractor a defensor así como el número de
clientes que han sufrido el cambio a la inversa.

Como norma general, cuando la suma de los dos individuos que


han cambiado de grupo (en nuestro ejemplo, el número de clientes

80 Modelos fundamentales para analistas de negocios


que han cambiado su postura de recomendación) es inferior a 25,
deberíamos utilizar una distribución binomial o una distribución
de chi-cuadrado. En la plantilla se incluye una fórmula que calcula
De detractor a defensor 115 esta condición de manera automática y si la celda destacada
De defensor a detractor 73 informa de que la prueba es relevante, entonces rechazaremos la
hipótesis nula y deduciremos que hay una diferencia significativa
Chi-cuadrado 9,160904255 en el cambio de actitud. En otras palabras, podemos afirmar que
Chi-cuadrado critic 3,841458821 la campaña logró aumentar las recomendaciones de los clientes.
Significación si

Binomial 0.001345739
Significación si

Significación
si
http://analyticsmodels.blogspot.com.es/p/statistical-
Figura 65: Datos y resultados de una prueba de McNemar analysis-templates_2.html
57
103

LA PRUEBA Q DE COCHRAN

Los análisis estadísticos


La prueba Q de Cochran es el complemento del análisis
paramétrico de la varianza con medidas repetidas y de la prueba no
OBJETIVO
paramétrica de Scheirer–Ray–Hare cuando las medidas repetidas
COMPROBAR SI HAY UN CAMBIO SIGNIFICATIVO ANTES Y DESPUÉS DE UN son dicotómicas. La plantilla presenta el ejemplo de una empresa
ACONTECIMIENTO (VARIABLES NOMINALES) CUANDO TENEMOS MÁS DE que quiere averiguar si la satisfacción de los clientes difiere de
DOS GRUPOS. manera significativa en función de la temporada. La medida
dicotómica es la satisfacción (1 = satisfecho, 0 = no satisfecho), y
para una muestra de veinte clientes, tenemos sus respuestas en
Cliente Alta temporada Temp. intermedia Temporada baja Total
tres temporadas distintas: alta, media, y baja.
1 1 1 1 3 k 3

2 0 1 1 2 n 20 Tras realizar la prueba, si el valor p es inferior a 0,05, rechazaremos


3 0 0 1 1 df 2 la hipótesis nula y, por lo tanto, habrá una diferencia significativa en

80 Modelos fundamentales para analistas de negocios


4 0 1 1 2 Q 9,8750
materia de satisfacción según la temporada. Una vez rechazada
5 1 0 0 1 alfa 0.,05
la hipótesis nula, deberíamos llevar a cabo una prueba Q de
6 0 1 1 2 valor p 0,00717251
Cochran por pares (simplemente repitiendo la prueba y utilizando
7 0 1 1 2 Q-crit 5,99146455
dos temporadas cada vez) o podemos realizar una prueba de
8 0 0 0 0 Sig si

9 0 1 1 2
McNemar.
10 0 0 0 0

11 1 1 0 2

12 0 1 1 2

13 0 0 0 0

14 1 0 1 2

15 0 1 1 2

16 0 1 1 2

17 0 0 1 1

18 0 1 1 2

19 1 0 1 2

20 0 1 1 2
http://analyticsmodels.blogspot.com.es/p/statistical-
TOTAL 5 12 15 32
analysis-templates_2.html
Figura 66: Datos y resultados de una prueba Q de Cochran
58
104

INTRODUCCIÓN A LOS MODELOS DE CLASIFICACIÓN

Los análisis estadísticos


En los siguientes apartados, he agrupado varios métodos que tienen
como objetivo clasificar o bien variables o bien elementos de conjuntos
de datos.

Los dos primeros métodos, la clasificación binaria y la regresión logística,


definen la pertenencia de un elemento a uno de los dos grupos
resultantes en función de una o más variables de entrada. El análisis de
grupos (o clústers) es una técnica exploratoria que clasifica los elementos
en grupos por similitudes en distintas variables de entrada. El análisis de
perfiles se realiza para analizar las similitudes y diferencias de distintos
grupos para definir los perfiles. El análisis de componentes principales y
el análisis factorial exploratorio se utilizan para agrupar distintas variables

80 Modelos fundamentales para analistas de negocios


en variables latentes, mientras que el análisis factorial confirmatorio
define primero las variables latentes en un modelo y, después, valida el
modelo.
59
105

LA CLASIFICACIÓN BINARIA

Los análisis estadísticos


Eventos Eventos Ratio verd. Ratio falsos
Puntuación
postivos negativos positivos positivos
OBJETIVO 0 0 0 0

CLASIFICAR LOS ELEMENTOS DE UN CONJUNTO DE DATOS EN DOS GRUPOS. 100 0 1 - 0,06


95 1 0 0,33 0,06
90 0 1 0,33 0,12
85 0 1 0,33 0,18
80 1 0 0,67 0,18
En una clasificación binaria, el objetivo consiste en clasificar los elementos de
75 0 1 0,67 0,24
un conjunto de datos en dos grupos en función de una regla de clasificación
más o menos compleja. El ejemplo propuesto en la plantilla se refiere a una Figura 67: Tabla para el cálculo de la curva ROC
empresa que quiere promocionar un perfume muy exclusivo regalando una

80 Modelos fundamentales para analistas de negocios


muestra gratuita del mismo a algunos de sus clientes. El coste de ofrecer esta La curva ROC es la línea continua en el siguiente gráfico (Figura 68),
muestra gratuita asciende a 50€, pero si logran llegar al cliente adecuado, el mientras que la línea discontinua es la curva ROC teórica en un modelo
retorno esperado equivale a 950€ (1.000€ menos el coste de la muestra). Para en el que la clasificación es aleatoria. En términos gráficos, entendemos
clasificar a los clientes, la empresa decide utilizar una valoración que se calcula que nuestro modelo es más eficiente que un método de clasificación
a partir del número de compras realizadas y del importe medio gastado por cada aleatoria ya que la línea continua está por encima de la línea discontinua.
cliente (ver 33. Los modelos de puntuación para más información sobre la creación El área que está situada debajo de la curva (AUC) es la medida de la
de indicadores de valoración). Nuestra regla de clasificación es “cuanto mayor sea eficacia de la clasificación y representa la probabilidad de que un evento
la valoración, más probabilidades habrá de que funcione la muestra gratuita.” positivo sea clasificado como positivo. Un modelo aleatorio (línea roja)
tendrá una AUC de 0,5, mientras que un buen modelo tendrá una AUC
El primer paso consiste en comprobar si la regla de clasificación elegida es válida,
superior a 0,7. Nuestro modelo tiene una AUC de aproximadamente 0,82,
es decir, cómo de eficaz es a la hora de que clasifiquemos los elementos (clientes).
por lo que podemos deducir que nuestra regla de clasificación clasifica a
La curva ROC mide la eficacia de la clasificación y es una combinación de:
los clientes de manera eficaz.
»» Sensibilidad: RATIO DE VERDADEROS POSITIVOS = TP / (TP+FN).28
»» 1-especificidad: RATIO DE FALSOS POSITIVOS = 1 - TN / (TN + FP).

La curva se obtiene ordenando nuestra muestra de 20 clientes desde la valoración


más alta a la más baja y presentando los resultados del experimento (1 = el cliente
ha comprado el producto, 0 = el cliente no ha comprado el producto, véase la 28
T = verdadero, F = falso, P = positivo, y N = negativo.

Figura 67).
59
106

LA CLASIFICACIÓN BINARIA

Los análisis estadísticos


1
»» Verdadero negativo: predecimos de manera correcta que este
0.9 cliente no comprará pese a la muestra gratuita por lo que no
tendremos ni costes ni ingresos.
0.8
RATIO VERDADEROS POSITIVOS

»» Falso negativo: no somos capaces de identificar a un cliente que


0.7
hubiera comprado el producto por lo que tampoco tendremos ni
0.6 costes ni ingresos.
Sensibilidad

0.5 Al definir esta matriz, no tendremos que incluir ni los costes de


oportunidad (los posibles ingresos perdidos en un falso negativo) ni los
0.4
beneficios de oportunidad (el dinero que nos ahorramos por no enviar
0.3 una muestra gratuita al cliente equivocado en un verdadero negativo).
Si los incluyéramos, duplicaríamos los costes y los ingresos. En nuestro
0.2
ejemplo, el umbral óptimo es una valoración de 65, lo cual significa que

80 Modelos fundamentales para analistas de negocios


0.1 la empresa tendrá que enviar una muestra gratuita a los clientes que
tengan, como mínimo, esta puntuación.
0
0 0.2 0.4 0.6 0.8 1 Esta matriz de costes/ingresos puede utilizarse para establecer el
1-Especificidad umbral de probabilidad de una regresión logística (véase 60. La regresión
RATIO FALSOS POSITIVOS logística). Utilizando el mismo ejemplo, podemos llevar a cabo una
Figura 68: Curva ROC regresión logística con varias variables de predicción (número de
compras, importe gastado, ubicación, estado civil, etc.) y calcular la
El siguiente paso es encontrar el umbral óptimo que, en este caso, es la valoración
probabilidad de que los clientes individuales compren un producto. Si
mínima que debería tener un cliente para recibir una muestra gratuita. Para
nos basamos en el coste de los incentivos y los beneficios de llegar a
calcularlo, tenemos que asignar los costes y los ingresos de los cuatro posibles
los clientes adecuados, el umbral de probabilidad puede ser superior o
resultados de la clasificación:
inferior a 0,5.
»» Verdadero positivo: si le damos una muestra gratuita al cliente adecuado,
tendremos un coste de 50€ por la muestra y un retorno de 1.000€, por lo
que le asignaremos al VP (o TP en inglés), unos ingresos de 950€.

»» Falso positivo: si le damos una muestra al cliente equivocado, tendremos un http://analyticsmodels.blogspot.com.es/p/statistical-


coste de 50€. analysis-templates_2.html
60
107

LA REGRESIÓN LOGÍSTICA

Los análisis estadísticos


Esta regresión se utiliza para responder a preguntas de sí/no,
como por ejemplo, comprar o no comprar un producto en función
OBJETIVO
de una o varias variables de predicción, es decir que calcula la
PREDECIR UN RESULTADO BINARIO A PARTIR DE UNA O MÁS VARIABLES DE probabilidad de que ocurra un acontecimiento (comprar el
PREDICCIÓN CUANTITATIVAS. producto). Cuando tenemos un resultado binario, no podemos
llevar a cabo una regresión lineal ya que no se cumplen los
supuestos de normalidad de la distribución y la varianza igual
para la variable objetivo. Si las variables independientes son
categóricas, necesitamos transformarlas en variables ficticias
(véase 38. La regresión lineal).

En la plantilla, utilizo la función de log-likelihood y el complemento

80 Modelos fundamentales para analistas de negocios


de Excel denominado Solver para calcular los parámetros de
regresión. Una vez que hayamos obtenido los resultados de la
regresión, tendremos que aplicar una función exponencial para
obtener las probabilidades de un acontecimiento ya que no
podemos utilizar los parámetros directamente.

La plantilla propuesta incluye una regresión logística con una


variable de predicción pero es posible añadir más variables.
Además, podemos utilizar una variable objetivo con más de dos
valores y llevar a cabo una regresión logística multinomial.

http://analyticsmodels.blogspot.com.es/p/statistical-
Figura 69: Regresión logística analysis-templates_2.html
61
108

EL ANÁLISIS DE GRUPOS

Los análisis estadísticos


OBJETIVO
IDENTIFICAR GRUPOS (CLÚSTERS) DE CLIENTES O PRODUCTOS (U OTROS
OBJETOS).

El análisis de grupos es una técnica exploratoria que agrupa


determinados objetos en grupos o clústers homogéneos utilizando una o
varias variables de entrada. El objetivo consiste en encontrar el equilibrio
adecuado entre la similitud de los objetos dentro de cada grupo y la

80 Modelos fundamentales para analistas de negocios


diferencia entre grupos (clústers). La capacidad de identificar grupos de
clientes o productos puede utilizarse para aprovechar sinergias o asignar Figura 70: Análisis sencillo de grupos utilizando un diagrama de dispersión

mejor los recursos disponibles.

La técnica más sencilla de agrupación (clustering) es la que utiliza una


Podemos identificar tres grupos principales de productos:
matriz de dos variables e identifica visualmente los posibles grupos. El
ejemplo incluido en la plantilla aborda un problema de stock. Imaginemos »» En la esquina superior izquierda, aparecen los productos que
que una empresa quiere optimizar las existencias de distintos productos, tienen unas ventas elevadas y una baja variabilidad por lo que
sabiendo que tener un stock muy amplio de cada producto es muy la empresa mantendrá un stock amplio.
caro pero que el hecho de que se agoten productos cuando se están
»» En la esquina superior derecha, figuran los productos que
demandando implica un daño económico y un perjuicio para la imagen
tienen unas ventas elevadas pero con una variabilidad alta y,
de la empresa. Para resolver este problema, la empresa necesita decidir
por lo tanto, la empresa decidirá caso por caso.
qué productos tendrán un stock amplio y cuáles funcionarán más bien
“bajo demanda”. Las variables utilizadas son el volumen medio de ventas »» El tercer grupo (en la parte inferior) tiene un volumen bajo de
diarias y la volatilidad de las ventas (la desviación estándar de las ventas ventas y un nivel alto de variabilidad por lo que la empresa
diarias dividida por las ventas medias diarias de cada producto). fabricará estos productos bajo demanda.
61
109

EL ANÁLISIS DE GRUPOS

Los análisis estadísticos


Se trata de una técnica sencilla y visualmente eficaz; no obstante, 6. Realizar la prueba y analizar los resultados; también
si queremos definir los grupos mediante una técnica más sólida o podemos recurrir a un análisis de la varianza.
necesitamos incluir más de dos variables, deberíamos utilizar un software
7. Utilizar variables explicativas y descriptivas para describir
estadístico. Podemos emplear varios métodos (modelos jerárquicos,
los grupos.
de k-means, basados en distribuciones, basados en la densidad, etc.),
aunque suelen seguir los mismos pasos:

1. Elegir las variables: incluyendo variables explicativas relevantes (por


ejemplo, para un producto podemos elegir el volumen medio de
ventas, el precio promedio, etc.) y excluyendo las variables que sean
exógenas o meramente descriptivas (color, tamaño, etc.).

2. Identificar y terminar eliminando los valores atípicos.

80 Modelos fundamentales para analistas de negocios


3. Definir el número de grupos: el número de grupos puede decidirse
utilizando métodos estadísticos (dendogramas) o criterios del
negocio (sentido común, limitaciones de la organización, etc.);
también podemos empezar con un número más elevado de grupos y
después reducirlo hasta encontrar la cantidad óptima.

4. Normalizar las variables: las variables pueden estar en distintas


escalas por lo que tendremos que normalizarlas para obtener
distancias comparables.

5. Elegir el método de agrupación (clustering) en función del problema


empresarial, de las variables utilizadas (cuantitativas o cualitativas) y
si el número de grupos es conocido.

http://analyticsmodels.blogspot.com.es/p/statistical-
analysis-templates_2.html
62
110

EL ANÁLISIS DE PERFILES

Los análisis estadísticos


»» ¿Tienen de media los grupos niveles iguales de puntuaciones
a lo largo de distintos puntos temporales u observaciones?
OBJETIVO
IDENTIFICAR SI DOS O MÁS GRUPOS TIENEN PERFILES SIGNIFICATIVAMENTE
DIFERENTES.

Este análisis se lleva a cabo cuando el objetivo consiste en comparar las


mismas variables dependientes entre grupos a lo largo de varios periodos
o cuando existen varias medidas de la misma variable dependiente.
Suele realizarse para analizar los resultados de distintos tipos de pruebas

80 Modelos fundamentales para analistas de negocios


(psicológica, de inteligencia, etc.).

Para comparar los datos entre grupos, el análisis de perfiles utiliza tanto
representaciones gráficas (diagramas) como métodos estadísticos
que analizan la varianza. Los diagramas suelen representarse con Figura 71: Ejemplo de niveles iguales en un análisis de perfiles (en términos promedios, los
niveles son iguales aunque no haya paralelismo)
puntuaciones o respuestas en el eje y, así como puntos temporales
(o pruebas u observaciones) en el eje x. Estas representaciones nos
permiten hacernos una idea de la similitud/diferencia entre los grupos.
Sin embargo, utilizando métodos estadísticos (como un análisis de la
varianza o un análisis multivariante de la varianza, entre otros), podremos
contestar en términos estadísticos a las tres principales preguntas que
plantea un análisis de perfiles:
62
111

EL ANÁLISIS DE PERFILES

Los análisis estadísticos


»» ¿Son paralelos/similares los rendimientos de los grupos a lo largo
de distintos puntos temporales u observaciones?

80 Modelos fundamentales para analistas de negocios


Figura 73: Ejemplo de planitud en un análisis de perfiles

La plantilla propuesta solo ofrece una representación gráfica de


los niveles iguales, el paralelismo y la planitud. Para realizar un
Figura 72: Ejemplo de paralelismo en un análisis de perfiles análisis de perfiles apropiado, deberíamos utilizar una herramienta
estadística. Los datos para llevar a cabo un análisis de perfiles
suelen provenir de distintos tipos de pruebas (psicológica, de
»» ¿Presentan los perfiles planitud a lo largo de distintos puntos inteligencia, etc.) o de experimentos (el sabor de una comida para
temporales u observaciones? (La planitud es cuando la puntuación clientes potenciales, la respuesta ante un tratamiento, etc.).
a lo largo de varios puntos distintos no cambia de manera significativa
y la línea es más o menos plana.)

http://analyticsmodels.blogspot.com.es/p/statistical-
analysis-templates_2.html
63
112

EL ANÁLISIS DE COMPONENTES PRINCIPALES

Los análisis estadísticos


En primer lugar, el análisis tiene que empezar con una matriz de
correlación o covarianza. Sugiero que se utilice una matriz de
OBJETIVO
correlación ya que no podremos usar una matriz de covarianza
ANALIZAR LAS INTERRELACIONES ENTRE DISTINTAS VARIABLES Y si las variables tienen escalas distintas o las varianzas son
EXPLICARLAS CON UN NÚMERO REDUCIDO DE VARIABLES. demasiado diferentes. Después, se calculan los eigenvectores (la
dirección de la varianza) y los eigenvalores (el grado de varianza
en determinada dirección). Ahora ya tendremos un número de
componentes que será igual al número de variables, cada cual
Un análisis de componentes principales (ACP) analiza las interrelaciones
con un eigenvalor específico.
entre un gran número de variables para encontrar un número pequeño
de variables (componentes) que expliquen la varianza de las variables
originales. Este método suele aplicarse como el primer paso de una Componente Eigenvalor % Varianza
% Acumulado

80 Modelos fundamentales para analistas de negocios


varianza
serie de análisis; por ejemplo, puede utilizarse cuando hay demasiadas
1 2,437 24% 24%
variables de predicción en comparación con el número de observaciones
2 1,729 17% 42%
o para evitar la multicolinealidad.
3 1,301 13% 55%
Supongamos que una empresa está recabando respuestas sobre las
4 0,909 9% 64%
numerosas características de un producto, por ejemplo, un nuevo
5 0,826 8% 72%
champú: color, olor, limpieza y brillo. Tras realizar un ACP, descubre que
6 0,743 7% 79%
las cuatro variables originales pueden reducirse a dos componentes29:
7 0,701 7% 86%
»» El componente “calidad”: color y olor. 8 0,614 6% 93%

»» El componente “efecto sobre el cabello”: limpieza y brillo. 9 0,483 5% 97%


10 0,257 3% 100%
Aunque resulta posible realizar un ACP en Excel con cálculos complejos
o complementos especiales30, recomiendo utilizar una herramienta Figura 74: Resultados de un ACP

estadística propiamente dicha. A continuación, explicaré tan solo algunas


directrices para la realización de un ACP.

29
Pese a este ejemplo, un ACP suele llevarse a cabo cuando tenemos un mayor número de variables.
30
http://www.real-statistics.com/multivariate-statistics/factor-analysis/principal-component-analysis/
63
113

EL ANÁLISIS DE COMPONENTES PRINCIPALES

Los análisis estadísticos


Cuanta más varianza (eigenvalor) explique un componente, más
importante será. Existen varios enfoques que podemos utilizar para elegir
el número de componentes que tendremos que retener:

1. Definir un umbral antes del análisis:


»» elegir todos los componentes que tengan un determinado
eigenvalor (normalmente > 1).

»» elegir a priori un número específico de componentes (y después


comprobar la varianza total explicada y otras pruebas de validez).

»» elegir los primeros componentes x que expliquen por lo menos


el X% de la varianza, por ejemplo, el 80% si estamos usando los

80 Modelos fundamentales para analistas de negocios


resultados con objetivos descriptivos o un porcentaje mayor si
los resultados se van a utilizar en otro análisis estadístico (Figura
74). Figura 75: Gráfico de sedimentación

2. Utilizar un gráfico de sedimentación (Figura 75) y “cortar” la línea en


si no podemos explicar los componentes resultantes en términos
el punto de inflexión principal o en uno de los puntos de inflexión
conceptuales, debemos tener presente que el objetivo principal
principales en los que haya una varianza total aceptable explicada
de un ACP consiste en reducir un elevado número de variables
(por ejemplo, en la Figura 75 podemos elegir los cuatro primeros
hasta obtener un número manejable de componentes, por lo
componentes ya que hay un punto de inflexión importante, pero solo
que la interpretación del componente no resulta estrictamente
explican el 60% de la varianza).
necesaria. En el apartado 64. El análisis factorial exploratorio, se
utilizará un ACP como el método para realizar un análisis factorial
El siguiente paso consiste en analizar los coeficientes de correlación de y presentaré los métodos de optimización, la puntuación factorial
los componentes principales en una matriz con variables y componentes. (factor scoring) y las pruebas de validez.
Idealmente, queremos que una variable tenga una correlación elevada
con un componente para definir en términos conceptuales cada
componente (olor y color = componente “calidad”). No obstante, incluso http://analyticsmodels.blogspot.com.es/p/statistical-
analysis-templates_2.html
64
114

EL ANÁLISIS FACTORIAL EXPLORATORIO

Los análisis estadísticos


»» Tamaño de la muestra: idealmente deberíamos tener un
ratio elevado entre el número de observaciones y el número
OBJETIVO
de variables, por ejemplo, 20:1 (aunque podemos aceptar
EXPLORAR LA ESTRUCTURA LATENTE SUBYACENTE A LOS DATOS PARA ratios inferiores, pero no se recomienda trabajar con ratios
IDENTIFICAR VARIABLES IMPLÍCITAS INADVERTIDAS QUE SE “ESCONDEN” que estén por debajo de 5:1).
DETRÁS DE DISTINTAS VARIABLES OBSERVADAS. Al igual que en el ACP, no voy a proponer la utilización de una
plantilla de Excel ya que recomiendo encarecidamente realizar
Un análisis factorial exploratorio (AFE) examina la interrelación entre un AFE con una herramienta estadística adecuada. Sin embargo,
un gran número de variables para encontrar un número pequeño de si estamos realmente interesados en llevar a cabo un AFE en
variables implícitas o latentes (denominadas factores) que expliquen Excel, hay tutoriales disponibles online31. En general, un tamaño
gran parte de la correlación/covarianza de las variables originales. de muestra más pequeño requerirá correlaciones más elevadas

80 Modelos fundamentales para analistas de negocios


Resulta habitual confundir el AFE con el ACP (análisis de componentes para que el análisis produzca resultados válidos (las pruebas de
principales). El principal objetivo del ACP consiste en reducir un conjunto validez se explican más adelante en este apartado).
amplio de variables hasta obtener un posible conjunto más pequeño de Empezaremos por elegir el método de extracción de los
variables que sigan explicando la mayor parte de la varianza. factores, en nuestro caso un ACP, aunque existen otros métodos
A diferencia del ACP, el AFE se utiliza para identificar o entender conceptos disponibles (eje principal, máxima verosimilitud, etc.). Por lo tanto,
complejos que no pueden medirse directamente: estatus social, los primeros pasos serán los mismos que en un ACP (véase 63. El
inteligencia, perfil psicológico, sociabilidad, etc. Por ejemplo, en un AFE análisis de componentes principales):
podemos ver que existen patrones similares en las respuestas sobre los »» Reproducir una matriz de correlación.
ingresos, la educación y la ocupación para que podamos identificarlos
»» Elegir el umbral para el número de factores retenidos
como la variable latente de “estatus social”.
(eigenvalor, número de factores, varianza total explicada,
Antes de iniciar el análisis, deberíamos comprobar algunas suposiciones: gráfico de sedimentación).
»» Normalidad: no es un requisito obligatorio pero puede mejorar los
resultados.

31
http://www.real-statistics.com/multivariate-statistics/factor-analysis/
64
115

EL ANÁLISIS FACTORIAL EXPLORATORIO

Los análisis estadísticos


Las herramientas estadísticas también ofrecen un método de elección Factor 1 Factor 2 Comunalidades
de la rotación. Sin entrar en los detalles de la explicación técnica, creo
Variable 1 0.1851 0.8942 0.83378
que resulta suficiente saber que tener idealmente una variable con una
correlación elevada con un único factor maximiza las diferencias entre Variable 2 1.1120 0.7294 0.54459888

los factores de carga. El método más popular y, probablemente más Variable 3 0.2070 0.5232 0.316554488
utilizado, es la rotación Varimax, pero podemos investigar las ventajas y
Variable 4 0.1391 0.4247 0.199701685
las desventajas de los demás métodos.
Variable 5 -0.6965 0.1851 0.519315314
Llegados a este punto, tendremos una matriz de correlación, un gráfico
Variable 6 -0.5433 0.2379 0.3517505543
de sedimentación y una tabla que recogerá todos los componentes
Variable 7 0.8473 0.0000 0.717893717
junto con sus eigenvalores y el porcentaje de la varianza explicado. La
siguiente tabla que tendremos que utilizar es una matriz con factores y Variable 8 -0.6884 0.2942 0.560470279

80 Modelos fundamentales para analistas de negocios


variables rellenada con los factores de carga. Los factores de carga son Variable 9 0.0375 0.0000 0.001403522
medidas que oscilan entre -1 y 1, y representan en qué medida explica Variable 10 -0.7552 0.1921 0.607300417
un factor una variable específica. Esta es la clave para entender los datos
4.65277
subyacentes e interpretar en términos conceptuales un factor. En la Figura
76 queda claro que el factor 1 explica principalmente las variables 5, 6, 7, Figura 76: Factores de carga y comunalidades

8, y 10, mientras que el factor 2 explica las variables 1 a 4. La variable


9 tiene factores de carga bajos con ambos factores así que podemos Tras elegir los factores retenidos y las variables, tendremos
excluirla. Además, como regla general, cada variable debería tener una que recalcular los factores de carga y las comunalidades. A
comunalidad de por lo menos 0,5 que tendremos que mantener en el continuación, necesitamos llevar a cabo una prueba de validez
modelo. La comunalidad de una variable es la proporción de la variación para comprobar dos posibles problemas: 1) que la correlación
explicada por los factores retenidos. entre las variables sea muy baja y 2) que la correlación entre
las variables sea demasiado elevada y haya un riesgo de
multicolinealidad.
64
116

EL ANÁLISIS FACTORIAL EXPLORATORIO

Los análisis estadísticos


Para el primer problema, deberíamos realizar dos pruebas de medida de
la exactitud de la muestra (MSA o measure of sample adequacy):

»» Prueba de Bartlett: si el valor p es significativo (normalmente < 0,05),


la correlación total entre las variables será aceptable.

»» Prueba KMO: se trata de una medida que oscila entre 0 y 1, y que


comprueba si hay alguna variable que no se correlaciona bien
(debería ser superior a 0,532; de lo contrario, deberíamos comprobar
la “matriz de correlación anti-imagen,” que proporciona valores KMO
únicos de cada variable, y así identificar la que se debería eliminar).

Para descartar la hipótesis de la multicolinealidad, deberíamos empezar

80 Modelos fundamentales para analistas de negocios


por desconfiar, al principio, de la prueba si en la matriz de correlación
aparecen valores cercanos a 0,9 o superiores. Después, podemos fijarnos
en el “determinante” de la matriz de correlación, que debería situarse
cerca de 1, mientras que un determinante cercano a 0 significaría una
probable multicolinealidad. También podemos llevar a cabo una prueba
de relevancia de Haitovsky (comprobando el valor p que debería ser
< 0,05).

http://analyticsmodels.blogspot.com.es/p/statistical-
32
A modo de guía, podemos considerar un KMO superior a 0,8 como un índice adecuado para un análisis factorial, de entre
0,7 y 0,8 como un índice suficiente, y entre 0,7 y 0,5 un índice entre bajo y muy bajo para un análisis factorial. analysis-templates_2.html
65
117

EL ANÁLISIS FACTORIAL CONFIRMATORIO

Los análisis estadísticos


OBJETIVO
CONFIRMAR O RECHAZAR UN MODELO DE ECUACIÓN ESTRUCTURADA QUE
IDENTIFIQUE UNA O MÁS VARIABLES LATENTES (NO OBSERVADAS).

Un análisis factorial confirmatorio (AFC) utiliza prácticamente las mismas


técnicas estadísticas que el análisis factorial exploratorio (AFE) pero en
términos conceptuales es bastante diferente. Mientras que el AFE explora
variables medidas para descubrir posibles variables latentes inadvertidas

80 Modelos fundamentales para analistas de negocios


(factores), el AFC define primero un modelo teórico y, después, realiza
un análisis factorial para o bien confirmar o bien rechazar el modelo
propuesto.

La definición del modelo supone especificar el número de factores,


las variables que se relacionan con cada factor y las fortalezas de las
relaciones. El modelo suele representarse a través de un diagrama de
rutas parecido al que aparece descrito para el análisis de rutas (véase 40.
El análisis de rutas).
Figura 77: Diagrama de rutas de un análisis factorial confirmatorio

Por ejemplo, planteamos la hipótesis de que existen dos variables


latentes, el “estatus social” y la “influencia sobre otras personas”.
65
118

EL ANÁLISIS FACTORIAL CONFIRMATORIO

Los análisis estadísticos


Después, diseñaremos el modelo teórico mediante la definición de: »» Valor p del chi-cuadrado > 0,05.
»» RMSEA < 0,05.
»» Las variables latentes (factores): influencia y estatus social
»» GFI > 0,95.
(representadas por elipses).
Esta plantilla de Excel puede resultar útil a la hora de calcular la
»» Las variables observadas (por ejemplo, ingresos y educación)
bondad de ajuste de los modelos MES: http://www.watoowatoo.
representadas por rectángulos.
net/sem/sem.html. En caso de que el ajuste del modelo no sea
»» Las relaciones entre las variables y los factores (cargas factoriales) satisfactorio, será necesario modificar el diagrama de rutas para
que aparecen representadas por simples flechas (las variables se encontrar un ajuste mejor:
pueden relacionar con tan solo un factor o con ambos).
»» Eliminando los parámetros no relevantes mediante la
»» La correlación entre factores, si consideramos que existe (flechas
comprobación de las estadísticas t de los parámetros (por
dobles curvadas).
ejemplo, si son superiores a 1,96).

80 Modelos fundamentales para analistas de negocios


»» Los errores, representados por elipses (normalmente, tendremos
»» Añadiendo nuevos parámetros a través de la utilización de
errores apuntando hacia todas las variables observadas).
dos técnicas:
»» La correlación entre errores, si consideramos que existe (flechas • Índice de modificación: un valor elevado indica parámetros
dobles curvadas). potencialmente útiles.
Una limitación importante es que el número de parámetros libres • Cambio de parámetro esperado: valor aproximado del
(relaciones establecidas en el diagrama de rutas) tiene que ser inferior parámetro nuevo si se añade.
al número de valores únicos. Los valores únicos se calculan a través de
»» Analizando la matriz residual estandarizada y buscando
la fórmula p*(p + 1) / 2, en la que p es el número de variables. El número
valores que sean superiores a 1,96 o 2,58 (por ejemplo),
de parámetros libres es la suma de todas las relaciones establecidas en
que a su vez identificarán los valores que no están bien
el modelo (en términos sencillos, el número de flechas del diagrama de
representados en el modelo.
rutas).
Sugiero utilizar una herramienta analítica adecuada para llevar
El modelo puede probarse utilizando, por ejemplo, la prueba de chi-
a cabo este modelo, pero el siguiente artículo muestra cómo
cuadrado para la “maldad de ajuste” (véase 48. La prueba de chi-cuadrado)
realizar este modelo en Excel:
u otros métodos (RMSEA o GFI). Los valores recomendados para que el
modelo funcione bien son: https://www.researchgate.net/publication/7151927_
Confirmatory_factor_analysis_using_Microsoft_Excel.
PREDICCIÓN
66
120

INTRODUCCIÓN

Predicción
El objetivo de las predicciones es producir pronósticos e indicaciones MÉTODOS Y TÉCNICAS DE PREDICCIÓN
(normalmente en relación con la demanda o las ventas) para periodos
Existen varios métodos33 disponibles, y la elección de uno de ellos
futuros utilizando datos históricos y planteando suposiciones. Por
dependerá de cinco factores principales:
ejemplo, queremos predecir las ventas mensuales del año +1 y tomamos
como referencia las ventas mensuales del año actual. Un supuesto podría »» La fase del ciclo de vida de nuestro producto o servicio (fase
ser que las ventas no van a cambiar el año que viene y nuestro pronóstico emergente, de crecimiento o madurez).
será simplemente equivalente a los datos históricos. Otra suposición »» El tipo de producto.
sencilla de implementar puede ser establecer un aumento fijo de las »» La precisión mínima necesaria y cuánto estamos dispuestos a
ventas cada mes o un aumento proporcional, por ejemplo, del 10%. Las invertir en tiempo y en dinero.
suposiciones pueden volverse mucho más complejas cuando utilizamos »» La disponibilidad de datos (y el coste de obtener más datos, si
modelos causales o de tendencia. existe la posibilidad de hacerlo).

80 Modelos fundamentales para analistas de negocios


Para llevar a cabo pronósticos robustos, resulta importante identificar »» El alcance del pronóstico (a corto, medio o largo plazo).
los elementos que van a tener un impacto sobre la demanda y utilizar la
Además, podemos agrupar los modelos de predicción en tres
mejor técnica disponible para calcular el impacto. No vamos a encontrar
categorías:
una respuesta para todos los elementos que afectan a la demanda pero
resulta necesario plantear las mejores suposiciones complementando »» Las técnicas cualitativas: el pronóstico estará basado en
las técnicas cuantitativas con técnicas cualitativas y percepciones la opinión de expertos (el método Delphi, el brainstorming
personales del negocio. (tormenta de ideas), el consenso de panel, etc.), la opinión
de distintos clientes a través de encuestas o los estudios
Podemos utilizar una regresión para definir la elasticidad del precio de mercado. Suelen aplicarse siempre que no tengamos
y, sabiendo que la empresa va a cambiar sus precios, podemos incluir datos cuantitativos (por ejemplo para el lanzamiento de un
este parámetro en la predicción. No obstante, si solo utilizamos datos producto) o para predicciones a varios años vista.
históricos y aplicamos el efecto de la elasticidad del precio al cambio de
precio, estaremos asumiendo que los demás elementos que afectan a la
demanda no van a cambiar: la demanda será estable, los clientes no van
a cambiar ni su comportamiento ni sus gustos, los competidores van a
mantener sus precios actuales, etc.
33
Para más información sobre distintos modelos, le animo a leer este interesante artículo:
https://hbr.org/1971/07/how-to-choose-the-right-forecasting-technique
66
121

INTRODUCCIÓN

Predicción
»» Las proyecciones y series temporales: el pronóstico estará basado en de la gestión de ingresos (los modelos pickup y las regresiones).
el reconocimiento de patrones sobre datos pasados (estacionalidad, No voy a incluir modelos de fijación de precios ni de análisis de
ciclos y tendencias) y la proyección de estos patrones en el futuro. clientes puesto que ya los he incluido en anteriores apartados.
Su nivel de exactitud es mayor cuando el producto ya ha entrado
EL CUMPLIMIENTO DE LA PREVISIÓN
en la etapa estable (la fase madura). Estos métodos pueden ser
más continuos o más sensibles frente a los cambios; no obstante, Para elegir el mejor método que decidamos utilizar, en primer
no pueden predecir puntos de inflexión basados en acontecimientos lugar deberíamos considerar el tipo de negocio y los datos
especiales y solo pueden reaccionar de manera más o menos rápida disponibles. Sin embargo, esta información no suele ser suficiente
ante un cambio en los datos medidos. Algunos ejemplos son la media y necesitamos comparar distintos métodos basándonos en su
móvil, la suavización exponencial y el análisis de series temporales. nivel de cumplimiento.

»» Los modelos causales: el pronóstico estará basado en la relación El cumplimiento se calcula a través del error de pronóstico, es

80 Modelos fundamentales para analistas de negocios


entre el resultado (las ventas) y una o más variables de predicción, decir, la diferencia entre los datos reales y los datos pronosticados.
tales como las características del producto (precio, calidad y Si tenemos suficientes datos, hay una buena práctica que consiste
disponibilidad), las características del producto de los competidores, en utilizar parte de estos datos para construir el modelo (datos de
nuestra estrategia frente a la estrategia de los competidores aprendizaje) y otra parte para probar el modelo (datos de prueba).
(publicidad, promociones, etc.) o los factores externos (factores
económicos o geopolíticos). Este grupo incluye distintos tipos de Dos de los métodos de error utilizados con mayor frecuencia son:
regresiones, modelos de fijación de precios y modelos de análisis de »» El ECM (error cuadrático medio): se trata del promedio de los
clientes para predecir comportamientos futuros. errores al cuadrado de cada periodo.
En los siguientes apartados, empezaré por explicar cómo llevar a cabo un »» El MAPE (por sus siglas en inglés, mean absolute percentage
análisis del ciclo de vida de curva S, que se considera un modelo causal error o error porcentual absoluto medio): se trata del promedio
aunque también es, en parte, un modelo de proyección. Creo que este del error porcentual absoluto de cada periodo.
método no se debería utilizar de manera independiente sino como base
para unos métodos de predicción más precisos. Después, me centraré en
los tres métodos más utilizados de “proyección y series temporales”: la
media móvil, la suavización exponencial y el análisis de series temporales.
Por último, incluiré dos métodos causales que se utilizan en el ámbito
67
122

EL ANÁLISIS DEL CICLO DE VIDA DE CURVA S

Predicción
deberíamos identificar la tendencia en el número de empresas,
ingresos y márgenes. No obstante, podemos complementar este
OBJETIVO
análisis con un enfoque estadístico que nos ayude a predecir el
IDENTIFICAR LA MADUREZ DE UN PRODUCTO O SERVICIO Y PRONOSTICAR futuro crecimiento.
LA DEMANDA DE LOS SIGUIENTES PERIODOS.
Si nuestro producto se encuentra en la etapa emergente o
simplemente en la etapa de crecimiento, no tendremos suficientes
datos para calcular la curva S por lo que deberíamos utilizar los
El supuesto que subyace a este modelo es que, normalmente, un datos de productos que tengan características parecidas y analizar
producto tiene un ciclo de vida que sigue una curva con forma de S con sus curvas de ciclo de vida de producto. Resulta importante
tres fases principales (véase 12. El análisis del ciclo de vida de un producto): plantear buenas suposiciones sobre el nivel de saturación del
mercado y las diferencias entre nuestro producto y los productos
»» Etapa emergente: está caracterizada por un número pequeño

80 Modelos fundamentales para analistas de negocios


similares que puedan afectar a los índices de crecimiento durante
de empresas, ingresos bajos y, por lo general, ningún margen o
las tres etapas. Cuantos más datos obtengamos después del
márgenes negativos.
lanzamiento de nuestro producto, mayor será la precisión con la
»» Etapa de crecimiento: los márgenes están creciendo rápidamente que podremos compararlos con la curva S de productos parecidos
(durante un tiempo aunque menos durante la última parte de la etapa y, por lo tanto, más podremos ajustar nuestras suposiciones.
de crecimiento), así como el número de empresas.

»» Etapa de madurez: los ingresos globales están creciendo a un ritmo


mucho menor; tanto los márgenes como el número de empresas
están disminuyendo. Llegados a este punto, el producto puede entrar
en una etapa de declive, por ejemplo, si se introduce un producto
sustituto más novedoso o si la demanda está decreciendo.

Tal y como se explica en el apartado 12. El análisis del ciclo de vida de un


producto, resulta importante identificar la fase del producto o del servicio
(este análisis también puede aplicarse a distintos niveles de producto –
34
Generalmente, el ciclo de vida de un producto necesita años para alcanzar la madurez pero, en caso de que
marca, línea de producto, categoría de producto, etc.). Para este objetivo, tengamos un ciclo de vida más corto, podremos utilizar datos mensuales desestacionalizados (por ejemplo,
utilizando una media móvil).
67
123

EL ANÁLISIS DEL CICLO DE VIDA DE CURVA S

Predicción
Si consideramos que nuestro producto ya está en la etapa de crecimiento, Si creemos que la curva S no se ajusta de forma adecuada al
además de compararlo con otros productos similares, podremos construir pronóstico, entonces podremos cambiar nuestras suposiciones
nuestra curva S utilizando, por ejemplo, una estimación lineal logarítmica sobre el nivel de saturación del mercado (que cambiará los datos
(ver plantilla) y predecir las futuras ventas. Tal y como aparece en la Figura transformados y, por lo tanto, nuestra predicción). En la plantilla,
78, los datos de las ventas para cada periodo (años34) se introducen en se calcula el R2 y podemos utilizarlo como una medida de hasta
la tabla y, después, se transforman para calcular una tendencia lineal. qué punto se ajusta bien la curva de pronóstico a los datos reales
En la última fila de la tabla, la transformación logarítmica se invierte y se de venta. No obstante, cabe recordar que nuestras suposiciones
predicen las ventas (ver gráfico situado a la derecha en la Figura 79). sobre los niveles de saturación del mercado son más importantes
que alcanzar el ajuste “perfecto” de la curva de pronóstico.
Por ejemplo, podemos alcanzar un R2 mayor pero con un nivel
Periodos Ventas Transformación LN Tendencia LN Previsión elevado de saturación del mercado altamente improbable.
De hecho, existen distintos factores que pueden afectar a la

80 Modelos fundamentales para analistas de negocios


1 1.55 -4.15 -4.51 1.09
forma de la curva: la situación económica, las estrategias de
2 2.02 -3.88 -5.04 1.72
los competidores, la entrada de nuevos productos alternativos,
3 2.50 -3.66 -3.58 2.71
nuevas modas, etc.
4 3.54 -3.30 -3.12 4.24

5 5.46 -2.85 -2.65 6.58

6 9.06 -2.31 -2.19 10.08

7 13.20 -1.88 -1.72 15.14

8 18.88 -1.46 -1.26 22.10

9 29.27 -0.88 -0.80 31.10


10 45.21 -0.19 -0.33 41.80
11 62.42 0.51 0.13 53.33
12 0.60 64.51
13 1.0y 74.31

Figura 78: Pronóstico y datos de venta utilizando una transformación logarítmica Figura 79: Línea de tendencia lineal y datos transformados según el registro..
67
124

EL ANÁLISIS DEL CICLO DE VIDA DE CURVA S

Predicción
Sin embargo, a veces esto no es suficiente ni para seguir
aumentando las ventas ni para evitar el declive. En este caso,
deberíamos considerar acciones que sean capaces de “empujar
hacia arriba” la curva S, ampliando el ciclo de vida del producto:
evolución del producto, innovación, nuevos mercados, nueva
utilización del producto, etc.

Por último, resulta importante recordar que este no es un método


de predicción preciso ya que no es su principal objetivo. Con
este método, podremos proyectar el potencial de crecimiento
del producto a medio y a largo plazo pero, para obtener una
predicción más exacta, este método deberá complementarse

80 Modelos fundamentales para analistas de negocios


Figura 79:. Datos reales de venta y ventas pronosticadas. con otros modelos más precisos, especialmente en relación con
la predicción a corto plazo.
Por último, en caso de que nuestro producto ya se encuentre en la etapa
de madurez, este modelo simplemente proyectará un nivel de ventas
estable o ligeramente ascendente. No obstante, no puede predecir ni
calcular si nuestro producto va a entrar en la etapa de declive ni cuándo
pasará. Esto puede estimarse solo cuando el producto ya haya empezado
el declive. De todas formas, cuando se vuelva evidente que nuestro
producto está en la etapa de madurez, nuestras acciones estratégicas
tendrán que centrarse en la optimización y “extensión de vida”. Por un
lado, tendremos que optimizar todo lo que podamos obtener con este
producto y su mercado alcanzando su pleno potencial (optimización de
la fijación de precios, programas de fidelización, paquetes de productos,
publicidad, promociones, etc.)

http://analyticsmodels.blogspot.com.es/p/forecasting-
templates.html
68
125

LA MEDIA MÓVIL

Predicción
La previsión de la demanda (F) para el siguiente periodo (t + 1) se
pronostica a través del promedio de la demanda (X) a lo largo de
OBJETIVO
un determinado número de periodos (n) incluido el periodo actual
PRONOSTICAR LA DEMANDA PARA LOS PRÓXIMOS PERIODOS. (t). Aquí, la elección del número de periodos resulta fundamental.
Cuantos más periodos incluyamos en la media, más reduciremos
el carácter aleatorio del modelo, pero, por otro lado, perderemos
información importante sobre la estacionalidad. Una variación
de este modelo es un modelo de media móvil ponderado en el
El supuesto que subyace a este modelo es que la demanda reciente es
que distintos periodos tienen diferentes impactos sobre la media
un buen dato de predicción de la demanda futura. La fórmula es:
móvil. Por lo general, se suele asignar más peso a los periodos
más recientes pero es posible elegir un enfoque diferente en
función del tipo de negocio.

80 Modelos fundamentales para analistas de negocios


La media móvil no funciona bien en caso de que haya
estacionalidad o ciclos de negocio dado que suaviza las series
temporales utilizadas. No obstante, se trata de un método valioso
para la extracción de la estacionalidad, los ciclos o la irregularidad
de una serie temporal para llevar a cabo unos métodos de
predicción más avanzados tales como las regresiones o el
modelo autorregresivo integrado de (ARIMA, por sus siglas en
inglés) (véase 70. El análisis de series temporales).

http://analyticsmodels.blogspot.com.es/p/forecasting-
Figura 80: Ejemplo de medias móviles de tres y cinco periodos templates.html
69
126

LA SUAVIZACIÓN EXPONENCIAL

Predicción
OBJETIVO
PRONOSTICAR LA DEMANDA PARA LOS PRÓXIMOS PERIODOS.

A diferencia de la media móvil, la suavización exponencial incluye todos


los datos de las series temporales en el pronóstico y otorga más peso a
los valores más recientes, reduciendo el peso de los datos más antiguos
de manera exponencial a lo largo del tiempo.

80 Modelos fundamentales para analistas de negocios


incluir los componentes de tendencia y estacionalidad en la
El pronóstico para el siguiente periodo (Ft+1) se calcula mediante un
fórmula:
promedio ponderado del valor del periodo actual (Xt) y el pronóstico del
periodo actual (Ft). El peso del valor del periodo actual (a) es arbitrario, St = 〖y ( X〗t - Ft ) + ( 1 - y ) St - s
y la bondad del pronóstico debería probarse utilizando distintas
ponderaciones. Un a más bajo (cercano a 0) significa que se otorga más
Tt= β〖β ( F〗t - Ft - 1 ) + ( 1 - β ) Tt - 1
peso a las observaciones más tempranas, lo cual equivale a una curva Ft + 1 =〖 aX〗t + ( 1 - a ) Ft + Tt + St
más suave (esto suele ser adecuado cuando las series temporales son
estables). Un a más cercano a 1, otorgará más peso a las observaciones en la que S es la estacionalidad, y es el peso de la estacionalidad,
más recientes y responderá más rápido ante los cambios en las series T es la tendencia, y β es el peso de la tendencia. Cuanto mayor sea
temporales. Puesto que no tenemos datos para el pronóstico del primer el peso, más sensible ante los cambios será el pronóstico. Cuanto
periodo, podemos utilizar los datos reales del periodo. menor sea el peso, más estable será el pronóstico.

Al igual que la media móvil, la exponencial por sí sola


no resulta adecuada para las series temporales que tengan una http://analyticsmodels.blogspot.com.es/p/forecasting-
estacionalidad o una tendencia significativas; no obstante, podemos templates.html
70
127

EL ANÁLISIS DE SERIES TEMPORALES

Predicción
El análisis de series temporales es útil para realizar predicciones
basándose en los patrones que subyacen a los datos del pasado.
OBJETIVO
Existen cuatro componentes principales:
PRONOSTICAR LA DEMANDA PARA LOS PRÓXIMOS PERIODOS.
»» Tendencia: un movimiento a largo plazo relativo a las series
temporales que puede ser ascendente, descendente o fijo (un
ejemplo puede ser la tendencia ascendente del crecimiento
de la población).

»» Componente cíclico: un patrón que suele observarse a lo


largo de dos o más años, y viene causado por circunstancias
que se repiten en ciclos (por ejemplo, los ciclos económicos
que presentan cuatro fases: prosperidad, declive, depresión y

80 Modelos fundamentales para analistas de negocios


recuperación).

»» Componentes estacionales: variaciones a lo largo de un año


que suelen depender del tiempo, los hábitos de los clientes,
etc.

»» Componentes irregulares: acontecimientos aleatorios con


influencias impredecibles sobre las series temporales.

Figura 82: Análisis de series temporales


70
128

EL ANÁLISIS DE SERIES TEMPORALES

Predicción
Existen dos tipos de modelos principales en función de cómo se incluyan Un buen análisis de series temporales conlleva varios análisis
los cuatro componentes anteriores: exploratorios y validaciones de modelo, lo cual requiere
experiencia y conocimientos estadísticos. La plantilla contiene
»» Modelos multiplicativos: los cuatro componentes se multiplican, y
una simplificación de un modelo de series temporales en el que
en este caso, asumimos que los componentes pueden afectarse los
la estacionalidad y las tendencias se aíslan para predecir futuras
unos a los otros.
ventas.
Y(t) =T(t) x S(t) x C(t) x I(t)
Los datos pueden recopilarse en cada periodo de tiempo (series
»» Modelos aditivos: asumimos que los componentes son temporales continuas), por ejemplo, una lectura de temperaturas,
independientes. o bien en puntos temporales separados (series temporales
discretas), cuando se observan diariamente, semanalmente,
Y(t)=T(t) + S(t) + C(t) + I(t) mensualmente, etc.

80 Modelos fundamentales para analistas de negocios


Otro elemento importante de las series temporales es la estacionariedad.
Un proceso es estacionario cuando un evento se ve influido por otro(s)
evento(s) anterior(es). Por ejemplo, si hoy la temperatura es bastante
elevada, resulta más probable que mañana también siga siendo bastante
elevada.

Existen muchos modelos para el análisis de series temporales aunque


uno de los más utilizados es el modelo autorregresivo integrado de
media móvil (ARIMA, por sus siglas en inglés). Hay algunas variaciones del
mismo así como modelos no lineales. No obstante, los modelos lineales
como el modelo ARIMA se utilizan ampliamente debido a su simplicidad
de implementación y facilidad de comprensión.

http://analyticsmodels.blogspot.com.es/p/forecasting-
templates.html
71
129

LOS MODELOS PICKUP

Predicción
de anticipación (PUDB(X,O)). En la segunda fórmula (pickup
multiplicativo), el pronóstico se calcula multiplicando las reservas
OBJETIVO
actuales por el ratio de pickup medio (PURDB(X,0)).
PRONOSTICAR LA DEMANDA PARA LOS PRÓXIMOS PERIODOS.
Para realizar buenas predicciones, resulta muy importante calcular
con cuidado o bien el pickup medio o el ratio de pickup. Tomemos
como ejemplo una compañía aérea. Si estamos utilizando el
pickup medio, entonces deberíamos tomar en consideración
Los modelos pickup son modelos de predicción que se utilizan en la estacionalidad a distintos niveles: hora del día, día de la
la gestión de ingresos (revenue management), y pueden aplicarse en semana, mes, vacaciones, etc. La cantidad de reservas graduales
negocios que suelen reservar el servicio con antelación (aerolíneas, dependerá fuertemente de la demanda por una hora de salida
hoteles, teatros, etc.). El pronóstico se calcula utilizando las reservas específica por lo que deberíamos calcular la media utilizando días

80 Modelos fundamentales para analistas de negocios


actuales para un determinado periodo futuro y estimando las reservas parecidos. No obstante, si estamos utilizando el ratio de pickup
graduales (pickup) desde ahora hasta ese periodo futuro (es decir, día de medio, no tendremos este problema aunque quizás descubramos
llegada, día de salida, etc.). que el ritmo de las reservas es distinto para periodos de salida
diferentes; por ejemplo, se espera que reserven más personas
El pickup se calcula utilizando datos anteriores, y puede ser el pickup
durante los periodos estivales. En este caso, resulta importante
medio con una anticipación específica (x días antes) si estamos
calcular el ratio de pickup medio de periodos de salida parecidos.
sumándolo a las reservas actuales o puede ser un ratio de pickup medio
(reservas totales / reservas x días antes) si estamos multiplicándolo por También podemos ir un paso más allá y esperar que el ritmo de
las reservas actuales: reservas pueda cambiar a lo largo del tiempo, o bien porque el
comportamiento de los clientes haya cambiado o porque hayamos
BDB0 = B DBX + PU DB(X,0)
̅ ampliado el horizonte de reservas. Por ejemplo, podemos calcular
BDB0= BDBX * PUR DB(X,0) una tendencia en el ratio de pickup y ajustarla para la predicción
de periodos futuros.
En la primera fórmula (pickup aditivo), las reservas en el día 0 de
anticipación (BDB0) son iguales a las reservas actuales (BDBX) más las
reservas pickup medias entre el día de anticipación x y el día 0
http://analyticsmodels.blogspot.com.es/p/forecasting-
templates.html
72
130

LAS REGRESIONES

Predicción
OBJETIVO
PRONOSTICAR LA DEMANDA PARA LOS PRÓXIMOS PERIODOS.

Este método es parecido al modelo pickup puesto que predice las


reservas finales basándose en el número de reservas durante un
determinado periodo de anticipación:

BDB0 = β0 + β1 B〗DBX

80 Modelos fundamentales para analistas de negocios


Las reservas del día 0 de anticipación (BDB0) representan la variable
dependiente, las reservas actuales (BDBX) son la variable independiente,
β0 es el punto de intercepción, y β1 es el parámetro de regresión X.
La técnica utilizada para definir la relación entre las reservas actuales y
las reservas finales es una regresión lineal, aunque también es posible
utilizar otros tipos de regresiones (para más información, véase la 36.
Introducción a las regresiones).

http://analyticsmodels.blogspot.com.es/p/forecasting-
templates.html
LOS ANÁLISIS Y SI (WHAT-IF) Y
LOS MODELOS DE OPTIMIZACIÓN
73
132

INTRODUCCIÓN

Análisis what-if y modelos de optimización


Los análisis y si (what-if) incluyen un amplio abanico de técnicas que
se utilizan para representar posibles escenarios futuros basados en los
posibles acontecimientos o puntos de inflexión que pueden tener un
impacto sobre los mismos. Por ejemplo, podemos plantear hipótesis
elaborando distintos escenarios con diferentes situaciones de la
economía o con distintas estrategias de los competidores.

Aunque, con este análisis, podamos calcular el resultado más probable


(es decir, el escenario más probable o el promedio de los escenarios
definidos), el hecho de definir también resultados menos probables
proporciona información adicional a los encargados de la toma de
decisiones:

80 Modelos fundamentales para analistas de negocios


»» Evaluar el riesgo de una inversión siempre que la diferencia entre
resultados extremos sea muy amplia.

»» Estar preparados en caso de que ocurra un escenario menos


probable.

»» Minimizar los riesgos y maximizar las oportunidades.

»» Realizar pruebas de resistencia (stress tests).


74
133

EL ANÁLISIS DE ESCENARIOS

Análisis what-if y modelos de optimización


»» Coste del capital: para calcular el valor neto actual,
descontamos los flujos de caja junto con el coste del capital
OBJETIVO
para nuestra empresa.
IDENTIFICAR POSIBLES ESCENARIOS FUTUROS.
El segundo paso consiste en definir el número de escenarios. En
nuestro caso, tenemos tres escenarios aunque también podemos
decantarnos por un análisis de múltiples escenarios que incluya
más escenarios intermedios (pero debemos tener presente que,
EL ANÁLISIS DE ESCENARIOS: MEJOR–PEOR–MEDIO si aumentamos el número de escenarios, por un lado tendremos
unos resultados más realistas pero, por otro, el análisis se volverá
El análisis simple de escenarios puede gestionarse en una hoja de
más complicado).
cálculo en la que podremos introducir datos y funciones que representen
nuestro modelo de negocio. En el ejemplo propuesto, la hoja de cálculo Después, modificaremos nuestras variables de entrada (ingresos,

80 Modelos fundamentales para analistas de negocios


contiene las cifras para una inversión en un sistema de inteligencia costes y coste del capital) tomando en consideración los factores
empresarial (BI por business intelligence en inglés) para una cadena de subyacentes que puedan cambiar estas variables. Por ejemplo,
hoteles, y los costes y retornos asociados a esta inversión. En la primera una peor situación económica mundial afectará de manera
hoja, se presenta el escenario más probable, y con un sencillo análisis y si, negativa a los ingresos y algunas situaciones inesperadas pueden
añadimos el peor escenario posible y el mejor escenario posible. aumentar los costes asociados con el proyecto o simplemente
nuestras estimaciones sobre los efectos positivos del sistema de
En primer lugar, definiremos las principales variables de entrada que
BI. Tras definir los principales factores y los supuestos subyacentes,
afectarán al resultado:
modificaremos las variables de entrada con el máximo efecto
»» Ingresos: proyectamos los ingresos adicionales esperados durante negativo para el peor escenario posible y con el máximo efecto
los próximos años gracias al nuevo sistema de BI. Los ingresos positivo para el mejor escenario posible.
adicionales se esperan gracias a una mayor personalización del
Podemos utilizar la herramienta Análisis de hipótesis de Excel para
servicio, un mejor servicio al cliente y unas campañas de marketing
guardar distintos escenarios y crear un resumen de los mismos
más eficaces.
pinchando en “Datos”, “Análisis de hiótesis” y “Administrador de
»» Costes: se generarán costes adicionales relacionados con la gestión escenarios”. Así, podremos ver los tres escenarios que hemos
del sistema de BI. guardado; si pinchamos en un escenario y después en “Mostrar”,
74
134

EL ANÁLISIS DE ESCENARIOS

Análisis what-if y modelos de optimización


entonces veremos ese escenario. También podemos añadir uno nuevo OTROS TIPOS DE ANÁLISIS DE ESCENARIOS
pinchando en “Agregar” (aunque sugiero modificar primero las celdas
También podemos optar por un análisis multivariante de
cambiantes en la hoja de cálculo – las celdas verdes – y añadir después
escenarios, añadiendo más escenarios intermedios. En este caso,
un nuevo escenario; de lo contrario, tendremos que cambiar los valores
resulta habitual asignar una probabilidad a cada escenario para
de forma menos intuitiva en la ventana de gestión de escenarios). Cuando
evaluar los riesgos y las oportunidades en función tanto de la
ya hayamos añadido un nuevo escenario, podemos pinchar en “Resumen”
magnitud del impacto como de la probabilidad asociada.
y elegir el tipo de informe y las celdas resultantes (por defecto, veremos
las celdas del valor neto actual de los escenarios guardados). Otra técnica frecuente es la del análisis del árbol de decisiones,
que intenta representar todos los posibles eventos con
probabilidades e impactos relacionados (véase 75. Los árboles
RESUMEN DEL ESCENARIO
de decisión simple). Una técnica más precisa pero más compleja
Valores Actuales Más probable Peor Mejor es la de las simulaciones, que dependen de las distribuciones

80 Modelos fundamentales para analistas de negocios


Celdas de probabilidad de las variables de entrada para crear una
cambiantes
distribución de posibles resultados (o escenarios). La ventaja de
Celdas de 2.02 -3.88 -5.04 1.72
resultado las simulaciones es su análisis más preciso puesto que podemos
VNA_A1 - 167.509 € - 167.509 € -255.333 € 108.193 € calcular parámetros estadísticos con exactitud, tales como el
VNA_A2 -48.881 € -48.881 € -241.296 € 88.685 €
error estándar, los intervalos de confianza, etc. (véase 77. Las
VNA_A3 111.555 € 111.555 € -202.419 € 344.440 €
VNA_A4 304.021 € 304.021 € -144.915 € 646.767 € simulaciones de montercarlo).
VNA_A5 521.368 € 521.368 € -72.858 € 986.233 €
Encontrará más información sobre el análisis probabilístico de
Figura 83: Resumen de escenarios
escenarios en el siguiente documento:
http://people.stern.nyu.edu/adamodar/pdfiles/papers/
La Figura 83 presenta las celdas resultantes del resumen de escenarios probabilistic.pdf
(se han eliminado las celdas cambiantes). Los valores actuales son los
mismos que en el escenario más probable ya que representan el valor en
el momento de realización del resumen. Con los valores netos actuales
acumulados de los próximos cinco años, ya podemos evaluar los riesgos
y las oportunidades de este proyecto. http://analyticsmodels.blogspot.com.es/p/what-if-
analysis-and-optimization-models.html
75
135

LOS ÁRBOLES DE DECISIÓN SIMPLE

Análisis what-if y modelos de optimización


OBJETIVO
CALCULAR LA PROBABILIDAD DE FUTUROS EVENTOS.

Un árbol de probabilidad es una manera sencilla de representar un


“espacio de probabilidad” con acontecimientos dependientes y/o
independientes (probabilidades condicionales). Cada nodo representa
Figura 84: Árbol de probabilidad
las posibilidades de que ocurra un evento después de que haya tenido

80 Modelos fundamentales para analistas de negocios


lugar el anterior evento; por lo tanto, la probabilidad de un determinado
nodo es el producto de sus probabilidades y de todas las probabilidades Los pasos para construir un árbol de decisiones son:
de los anteriores nodos. Aquí los riesgos y las probabilidades pueden ser
secuenciales o discretos mientras que en el análisis de escenarios son »» Dividir el análisis en distintas etapas de riesgo, es decir, futuros
únicamente discretos. acontecimientos que tengan resultados inciertos.

En un árbol de decisiones, tenemos distintos tipos de nodos: »» Para cada evento, definir todos los posibles resultados (si son
numerosos o infinitos, tendremos que simplificarlos hasta
»» Nodo raíz: se trata del primer nodo y suele representar la cuestión de obtener un número reducido y manejable de resultados
si invertir o no. discretos) y asignar una probabilidad a cada uno de ellos (la
»» Nodos de posibilidad o evento (representados por círculos): son probabilidad tendrá que ascender a 1).
eventos con varios resultados posibles (cada uno con una probabilidad
»» Definir los puntos de decisión, es decir, las decisiones que
asociada).
pueden tomarse cuando ya se conoce un resultado exacto.
»» Nodos de decisión (representados por cuadrados): representan todas
las posibles decisiones que pueden tomarse después del resultado
de un evento.

»» Nodos finales: son los nodos resultado.


75
136

LOS ÁRBOLES DE DECISIÓN SIMPLE

Análisis what-if y modelos de optimización


»» Calcular el valor (o flujo de caja) de cada nodo (los costes y los
ingresos de ese nodo y los anteriores que llevaron a este resultado). Si
los ingresos se proyectan en los siguientes años, deberíamos aplicar
un porcentaje de descuento (véase 74. El análisis de escenearios).

»» Vamos a replegar a continuación el árbol:

• Para cada rama de un nodo de decisión, elija la que tenga el valor


más elevado.

• Para cada nodo de evento, calcule la probabilidad media


ponderada de todos los resultados.

Con este método, “replegaremos” el árbol hasta alcanzar el nodo raíz,

80 Modelos fundamentales para analistas de negocios


que en nuestro ejemplo, muestra que invertir en el producto nuevo está
valorado en 30€ y que, por lo tanto, es mejor invertir que abandonarlo.
También podemos analizar el abanico de posibles valores (-150€ hasta
400€) para hacernos una mejor idea de los riesgos relacionados con la
inversión. Cuando empecemos el proyecto, en función del resultado de
cada acontecimiento, tomaremos la decisión con el valor asociado más
elevado. Este proceso resulta muy útil cuando tenemos distintos nodos
secuenciales con varios posibles resultados.

Los datos suelen conllevar el planteamiento de suposiciones y el


cálculo de las probabilidades de acontecimientos futuros. La perspicacia
empresarial y las opiniones de expertos resultan extremadamente
importantes a la hora de construir un árbol de probabilidad fiable.

http://analyticsmodels.blogspot.com.es/p/what-if-analysis-and-
optimization-models.html
76
137

LOS MODELOS DE LA TEORÍA DE JUEGOS

Análisis what-if y modelos de optimización


»» Juegos dinámicos de información incompleta: los
movimientos son secuenciales y por lo menos un jugador no
OBJETIVO
tiene la información completa sobre la recompensa de los
ANTICIPAR LAS DECISIONES ESTRATÉGICAS DE LOS COMPETIDORES. demás.

Otro elemento importante de los modelos de la teoría de juegos


es la repetición de los juegos debido al hecho de que la estrategia
de los jugadores puede cambiar en función del número de
Los modelos de fijación de precios o de previsión de la demanda tienen juegos. En este caso, podemos calcular el valor neto actual de
como objetivo encontrar la solución óptima para maximizar los beneficios. los resultados futuros ya que las recompensas más cercanas son
Sin embargo, esta optimización no suele tomar en consideración el hecho más valiosas que las más lejanas. También tendremos que realizar
de que los competidores no son actores estáticos y que seguramente una serie de suposiciones a la hora de aplicar estos modelos:

80 Modelos fundamentales para analistas de negocios


reaccionarán ante las decisiones estratégicas.
»» Los jugadores son racionales.
Los modelos de la teoría de juegos tienen en cuenta las acciones de los
»» Los jugadores son neutrales ante el riesgo.
otros jugadores y ofrecen, teóricamente, un equilibrio en el que ningún
jugador puede tener ventaja cambiando su estrategia (equilibrio de »» Cada jugador actúa en función de su propio interés.
Nash). Existen cuatro tipos principales de modelos de la teoría de juegos:
»» A la hora de tomar una decisión, cada jugador toma en
»» Juegos estáticos de información completa: los movimientos consideración las reacciones de los demás jugadores.
son simultáneos y todos los jugadores conocen las funciones de
Los juegos estáticos (simultáneos) suelen representarse mediante
recompensa de los demás.
cajas de recompensa: en este caso, el ejemplo más conocido es
»» Juegos dinámicos de información completa: los movimientos el del dilema del prisionero. Aquí, la estrategia dominante para
son secuenciales y todos los jugadores conocen las funciones de ambos prisioneros es delatar al otro ya que, pese a la decisión
recompensa de los demás. que pueda tomar el otro prisionero, para ambos la decisión de
delatar es la que tiene la mayor recompensa. Si el prisionero 1 no
»» Juegos estáticos de información incompleta: los movimientos
delata al otro, puede obtener 1 año de cárcel si el segundo no le
son simultáneos y por lo menos un jugador no tiene la información
delata también, o 9 años si el segundo le delata.
completa sobre la recompensa de los demás.
76
138

LOS MODELOS DE LA TEORÍA DE JUEGOS

Análisis what-if y modelos de optimización


Sin embargo, si el prisionero 1 delata al otro, saldrá de cárcel si el segundo
no lo delata, u obtendrá 6 años si el otro le delata.

80 Modelos fundamentales para analistas de negocios


Figura 86: Árbol de decisiones con las recompensas de los jugadores
Figura 85: El dilema del prisionero

Por otro lado, los juegos secuenciales suelen representarse mediante Algunas aplicaciones frecuentes en el ámbito empresarial son:
árboles de decisión que incluyen las recompensas y las decisiones »» Toma de decisiones sobre la entrada a un mercado.
de los jugadores. En el siguiente ejemplo, un nuevo competidor tiene
que decidir si entrar o no en un mercado, además eligiendo si invertir »» Modificaciones de precio.
en una tecnología moderna (entrar con bajos costes operativos) o con
»» Modificaciones de cantidad.
la tecnología actual (altos costes operativos). En este otro mercado, la
empresa actual puede reaccionar o bien de manera agresiva o bien de
manera moderada. En este caso, el nuevo competidor decidirá entrar
porque una vez que entre, la decisión más rentable para la empresa actual
será de reaccionar de manera moderada (en cada pareja de valores, el
valor de la derecha representa las pérdidas o ganancias de la empresa
actual).
76
139

LOS MODELOS DE LA TEORÍA DE JUEGOS

Análisis what-if y modelos de optimización


Para encontrar las soluciones a estos juegos, utilizamos las funciones de
demanda, oferta, coste y utilidad. En función de las posibles decisiones
adoptadas por los jugadores, calcular estas funciones fijará la recompensa
de los jugadores para determinar el equilibrio del juego. Cuando se
desconoce parte de la información, podemos utilizar suposiciones y
ponderarlas con un porcentaje de probabilidad, pero esto requiere la
elaboración de modelos más complejos.

La plantilla que sugiero tiene como objetivo la maximización del beneficio


basándose en las decisiones sobre las modificaciones de precio. Los
beneficios (o recompensas) se calculan a través de la diferencia entre
una función de coste y una función de demanda. La demanda es una

80 Modelos fundamentales para analistas de negocios


función de la elasticidad del precio del mercado y la elasticidad cruzada
del precio con otros competidores (esta información puede recopilarse a
través de distintas técnicas de fijación de precios, por ejemplo, el análisis
conjunto basado en elecciones).

Hay más modelos disponibles en internet (juegos de Cournot, Bertrand,


y Stackelberg), y existen varias plantillas en Excel (por ejemplo, http://
econpapers.repec.org/software/uthexclio/). Los datos sobre la cuota de
mercado, los costes, los límites de producción, etc. de los competidores
deberían calcularse utilizando los datos del sector, los informes
publicados y la opinión de los expertos (brainstorming, talleres, etc.). Los
precios son más fáciles de recopilar puesto que suelen ser de dominio
público. Los datos sobre la elasticidad del precio se calculan a través de
encuestas que incluyen preguntas propias de las técnicas de análisis de
precios.

http://analyticsmodels.blogspot.com.es/p/what-if-analysis-and-
optimization-models.html
77
140

LAS SIMULACIONES DE MONTECARLO

Análisis what-if y modelos de optimización


En los modelos deterministas, predecimos los eventos con un
sistema lineal simple y asumimos que las condiciones iniciales no
OBJETIVO cambian. Además, las mismas condiciones iniciales producirán los
mismos resultados. No obstante, el mundo es más complicado y
DETERMINAR RESULTADOS PROBABLES.
los acontecimientos suelen estar determinados por una compleja
interrelación de distintas variables, algunas de las cuales son difíciles o
casi imposibles de calcular. Las simulaciones de Montecarlo resuelven
este problema utilizando distribuciones de probabilidad para cada
variable de entrada y realizando, después, distintas simulaciones
para producir resultados probables. Podemos decir que este modelo
permite la predicción de un resultado sin tener que realizar numerosos
experimentos costosos.

80 Modelos fundamentales para analistas de negocios


Los pasos para llevar a cabo una simulación de Montecarlo son los
siguientes:

»» Definir la fórmula matemática para el resultado.

»» Identificar las distribuciones de probabilidad de las variables de


entrada y definir sus parámetros.

»» Ejecutar las simulaciones.

»» Analizar y optimizar.

LAS VARIABLES DE ENTRADA Y DE SALIDA

El primer paso en una simulación de Montecarlo consiste en definir el


resultado, es decir, identificar la variable que queremos predecir, por
ejemplo, “beneficios”. A continuación, tendremos que identificar las
variables de entrada de las que dependen los “beneficios”. Algunas
pueden ser incuestionables; por ejemplo, podemos tener un coste fijo
Figura 87: Resultado de una simulación de Montecarlo
77
141

LAS SIMULACIONES DE MONTECARLO

Análisis what-if y modelos de optimización


con un valor específico, pero suelen ser inciertas. Para cada variable incierta, ANÁLISIS Y OPTIMIZACIÓN
tenemos que identificar una distribución específica de la probabilidad que
Cuando ya hayamos obtenido la gama de resultados probables, en
utilizaremos para la simulación. Algunos ejemplos de distribución son:
función del objetivo, utilizaremos indicadores como el valor mínimo, el
»» Distribución discreta: definimos la probabilidad de un número finito de valor máximo, la media, la desviación estándar, etc. En general, se suelen
valores. comparar los siguientes elementos:

»» Distribución uniforme: cada valor variable tiene probabilidades parecidas »» El valor esperado: el promedio de todos los resultados con sus
(por ejemplo, cuando tiramos un dado, cada número tiene 1/6 de probabilidad intervalos de confianza.
de salir).
»» El riesgo: en el ejemplo propuesto, se trata de la probabilidad de
»» Distribución de Bernoulli: solo tenemos dos resultados exclusivos y obtener beneficios negativos (% de resultados < 0), pero también
alternativos (0 o 1). podemos elegir un valor específico.
»» Distribución normal: los valores centrales son los más probables (definidos También es posible comparar diferentes simulaciones con distribuciones

80 Modelos fundamentales para analistas de negocios


por la media y la desviación estándar). o valores de variables de entrada distintos. Para comparar estos
»» Distribución triangular: tenemos el valor más probable, un límite inferior y elementos, deberíamos calcular los intervalos de confianza tanto de los
uno superior. valores esperados como de los riesgos. Si el rango entre los intervalos
de confianza no se superpone, podremos deducir que un escenario es
»» Otras distribuciones: exponencial, logarítmica, binomial, beta, etc.
mejor o peor que el otro.
Tras identificar la distribución, podemos utilizar una prueba de chi-cuadrado
Si el objetivo consiste en utilizar los resultados para un plan de negocios
(véase 48. LA PRUEBA DE CHI-CUADRADO) para comprobar si los datos encajan
o un análisis de riesgos, podemos detenernos aquí, pero si queremos
con la distribución elegida. Una opción alternativa sería realizar una prueba de
optimizar los resultados, necesitaremos un análisis de sensibilidad. En
Korm–Smirnov.
este tipo de análisis, mediremos la “importancia” de cada variable de
En esta etapa, también enunciaremos la fórmula matemática que define el entrada y podremos decidir si actuamos sobre las más influyentes. Por
resultado, por ejemplo: lo general, se utiliza el coeficiente de correlación entre cada variable de
entrada y el resultado pero podemos adoptar distintas técnicas.
Beneficios = (precio – coste variable) * unidades – costes fijos

Después, se lleva a cabo la simulación repitiendo las variables de entrada (con


cada distribución de la probabilidad específica) cientos o miles de veces para http://analyticsmodels.blogspot.com.es/p/what-if-
obtener una distribución de los resultados probables.
analysis-and-optimization-models.html
78
142

EL MODELO DE CADENAS DE MARKOV

Análisis what-if y modelos de optimización


Una cadena de Markov es un proceso aleatorio en el que, para
cada iteración, tenemos una transición desde el estado actual
OBJETIVO
hacia otro estado. El número de estados es finito y la probabilidad
CALCULAR LA PROBABILIDAD DE FUTUROS ACONTECIMIENTOS. de pasar de un estado a otro solo viene determinada por el estado
actual y no por los estados anteriores (es decir, la propiedad de
Markov). Una vez definidos los objetivos y el modelo de negocio
que queremos representar, el primer paso consiste en identificar
los distintos estados y la probabilidad de transición de uno a otro
en una matriz de transición de probabilidades.

En el ejemplo propuesto, dos empresas (1 y 2) están luchando por


dominar un mercado concreto. Hay cinco estados diferentes:

80 Modelos fundamentales para analistas de negocios


»» “0”: misma cuota de mercado.

»» “adv1” y “adv2”: cuando una de las empresas logra obtener


una ventaja significativa en la cuota de mercado.

»» “1” y “2”: cuando una de las empresas domina el mercado.

En este modelo, queremos representar una situación en la que solo


2 adv2 0 adv1 1
una empresa puede sobrevivir y su objetivo es dominar el mercado.
Punto de partida 0% 0% 100% 0% 0% La segunda suposición es que cuanta más cuota de mercado se
2 99% 1% 0% 0% 0% gana, más probable resulta que la empresa domine el mercado.
adv2 50% 30% 20% 0% 0%

0 0% 55% 0% 45% 0%

adv1 0% 0% 25% 30% 45%

1 0% 0% 0% 5% 95%

Figura 88: Matriz de transición de probabilidades


78
143

EL MODELO DE CADENAS DE MARKOV

Análisis what-if y modelos de optimización


La última suposición es que la empresa “2” está ligeramente
mejor posicionada que la empresa “1.” Hipotéticamente, podemos
imaginar que, cada mes, tendremos una nueva iteración en la
que se modificarán las estrategias empresariales; podemos
entonces simular la probabilidad, transcurridos 20 meses, de que
2 v2 0 v1 1 la empresa “2” domine el mercado. En nuestra simulación, hay
P1 0% 0% 100% 0% 0% una probabilidad de casi un 60% de que la empresa “2” domine el
P2 0% 55% 0% 45% 0% mercado (Figura 89).
P3 27.5% 16.5% 22.5% 13.5% 20.25%
El ejemplo presentado y la correspondiente plantilla representan
P4 35.48% 17.46% 6.68% 15.08% 25.31%
una “cadena de Markov en tiempo discreto” pero también existe el
P5 43.85% 9.26% 7.26% 8.79% 30.83%
“proceso de Markov en tiempo continuo”. Para realizar un análisis

80 Modelos fundamentales para analistas de negocios


P6 48.05% 7.21% 4.05% 7.45% 33.25%
más complejo, podemos utilizar o bien add-ins (complementos)
P7 51.17% 4.87% 3.30% 5.72% 34.93% de Excel35 o herramientas estadísticas.
P8 53.09% 3.79% 2.40% 4.95% 35.76%
P9 54.46% 2.99% 2.00% 4.35% 36.2%
P10 55.41% 2.24% 1.69% 4.01% 36.35%
P11 56.13% 2.54% 1.51% 3.78% 36.34%
P12 56.69% 2.07% 1.39% 3.63% 36.22%
P13 57.15% 1.95% 1.32% 3.53% 36.05%
P14 57.56% 1.88% 1.27% 3.46% 35.83%
P15 57.92% 1.84% 1.24% 3.4% 35.59%
P16 58.26% 1.81% 1.22% 3.36% 35.35%
P17 58.59% 1.80% 1.20% 3.32% 35.09%
P18 58.90% 1.79% 1.19% 3.29% 34.83%
http://analyticsmodels.blogspot.com.es/p/what-if-
P19 59.21% 1.78% 1.18% 3.26% 34.57%
analysis-and-optimization-models.html
P20 59.50% 1.78% 1.17% 3.24% 34.31%

Figura 89: Resultado de una cadena de Markov 35


https://www.me.utexas.edu/~jensen/ORMM/excel/markov.html
79
144

EL ANÁLISIS DEL EMBUDO DE VENTAS

Análisis what-if y modelos de optimización


Estos elementos están relacionados entre sí, por ejemplo:

OBJETIVO »» El 70% de las personas del mercado tiene conocimiento del


producto (conocimiento del mercado).
MEJORAR LA CONVERSIÓN DE CLIENTES POTENCIALES OPTIMIZANDO EL
EMBUDO DE VENTAS (SALES FUNNEL). »» El 80% de las personas que conocen el producto considera la
posibilidad de comprarlo.

»» El 10% de las personas que lo consideran, acaba realmente


Los modelos que calculan la demanda suelen centrarse en un aspecto comprándolo.
específico del canal de ventas. Por ejemplo, un modelo de fijación de
precios suele definir la elección de los clientes ante un conjunto de
Embudo de ventas
posibles productos o servicios; no obstante, no tiene en cuenta el

80 Modelos fundamentales para analistas de negocios


100%
conocimiento que existe en el mercado hacia un determinado producto 100%
(suele asumir un conocimiento pleno para simplificar el análisis).
80% 70%
Idealmente, estos modelos de fijación de precios (ver los modelos de
60% 56%
fijación de precios y demanda) tienen que incluirse en un marco más 70%
amplio denominado embudo de ventas. Un embudo de ventas contiene 40%
80%
cuatro elementos principales:
20%
10% 5,6%
»» Mercado: el número total de clientes potenciales.
0
»» Conocimiento: las personas del mercado que conocen el producto. Mercado Conocimiento Consideración Conversión

Figura 90: Embudo de ventas


»» Consideración: las personas que conocen el producto y lo tienen en
cuenta a la hora de comprar.
Podemos calcular que el 56% de todos los clientes potenciales
»» Conversión: entre las personas que consideran el producto, aquellos considera el producto (70% * 80%) y que el 5,6% compra el
que acaban realmente comprándolo. producto (70% * 80% * 10%). También podemos calcular que el 8%
de las personas que conocen el producto lo comprará (5,6% /
70%).
79
145

EL ANÁLISIS DEL EMBUDO DE VENTAS

Análisis what-if y modelos de optimización


Un aumento del número de personas en el mercado tendrá como producto, resulta probable que el ratio de consideración del
resultado un aumento de las compras puesto que (normalmente) conocimientode estas personas esté muy por debajo de nuestro
asumimos que las relaciones o los ratios siguen siendo los mismos: 70%, 80%.
80%, y 10%. Los datos sobre los cambios del mercado pueden derivarse
LA CONSIDERACIÓN DEL CONOCIMIENTO
de los datos públicos sobre población. Por ejemplo, si nuestros clientes
potenciales son hombres con unos ingresos anuales de entre 40.000€ Entre las personas que conocen nuestro producto, algunos no
y 80.000€, y este sector de la población aumenta, entonces nuestro lo considerarán a la hora de comprar, o bien porque son fieles a
“mercado” aumentará. una marca, o porque piensan que nuestros niveles de precio y/o
calidad no son aceptables. Existen dos maneras principales de
Además del mercado, podemos actuar sobre las relaciones entre el
mejorar la consideración:
conocimiento del mercado, la consideración del conocimiento y la
conversión de la consideración para aumentar las ventas. »» Si el precio o la calidad son buenos pero la baja consideración

80 Modelos fundamentales para analistas de negocios


se explica porque la gente tiene una percepción que es peor
EL CONOCIMIENTO DEL MERCADO
que la propia realidad, deberíamos invertir en comunicación.
En nuestro ejemplo, el 70% de las personas conoce nuestro producto
»» Si la gente tiene una percepción correcta del precio y de la
pero podemos aumentar este ratio invirtiendo en publicidad, relaciones
calidad, podremos mejorarla (mayor calidad y menor precio).
públicas, ofertas especiales, etc. El efecto sobre las ventas de un
aumento del conocimiento de la gente puede calcularse utilizando los Invertir en comunicación mejorará el número de personas que
otros ratios que asumimos que no cambian (el 80% de consideración del nos conocen y que considerarán nuestro producto, y podemos
conocimiento y el 10% de conversión de la consideración). Sin embargo, calcular el aumento en las ventas utilizando el ratio de conversión
tenemos que considerar que esta suposición puede no ser totalmente de la consideración del 10%. Asumiremos que el ratio de
cierta y, o bien utilizar medidas correctivas, o simplemente ser prudentes conversión no cambia pero, al igual que en el anterior ejemplo,
a la hora de interpretar los resultados. De hecho, el 30% restante de las esta suposición puede no ser totalmente cierta.
personas del mercado que no conocen el producto pueden tener unos
ratios de consideración y de conversión inferiores, porque, por ejemplo, Si mejoramos la calidad o reducimos el precio, es probable que
sean más fieles a una marca específica y no conozcan nuestra marca, o el ratio de conversión de la consideración también cambie ya que
porque no estén interesadas en buscar un producto alternativo. el producto será más atractivo para las personas que ya lo han
considerado.
En este caso, incluso aunque logremos que tengan conciencia de nuestro
79
146

EL ANÁLISIS DEL EMBUDO DE VENTAS

Análisis what-if y modelos de optimización


LA CONVERSIÓN DE LA CONSIDERACIÓN

En este caso, el precio y la calidad son los principales motores pero aquí
se comparan con otras alternativas (es un concepto similar al del precio
de referencia frente al precio máximo explicado en la introducción a los
modelos de fijación de precios y demanda). El efecto de una modificación
del precio puede derivarse de varios modelos de elasticidad y fijación de
precios.

LA OPTIMIZACIÓN

Con el modelo propuesto, calcularemos el impacto sobre el volumen,


más concretamente, el número de clientes adicionales, pero deberíamos

80 Modelos fundamentales para analistas de negocios


incluir otros elementos para decidir qué estrategia vamos a seguir:

»» Ingresos: los ingresos dependen de la cantidad media de compras


y del precio medio. Hay que tener en cuenta que si reducimos el
precio, posiblemente tengamos también un efecto positivo sobre la
cantidad de compras (en función del producto) pero habrá, además,
un efecto negativo puesto que estaremos vendiendo más barato.

»» Costes: los costes de la publicidad, las comunicaciones y las mejoras


de la calidad deben incluirse en el modelo.

Una vez que hayamos definido la estructura de los costes y los ingresos
relacionados con el modelo, podremos utilizar el Solver de Excel para
encontrar el plan de inversiones óptimo (véase 80. Optimización).

http://analyticsmodels.blogspot.com.es/p/what-if-analysis-and-
optimization-models.html
80
147

OPTIMIZACIÓN

Análisis what-if y modelos de optimización


precios. También asumiremos que un cliente compra únicamente
un producto.
OBJETIVO
100%
OPTIMIZAR EL RESULTADO DE UN MODELO CAMBIANDO LOS VALORES DE 100%
DISTINTAS VARIABLES DE DECISIÓN.
80% 70%

60% 56%
70%
La optimización significa encontrar los valores de determinadas variables 40%
80%
de decisión que optimizan el resultado (o la variable de salida). Las 20%
10%
variables de decisión son elementos en los que podemos intervenir, por 5,6%

ejemplo, el precio de un producto o la inversión en publicidad, mientras 0

80 Modelos fundamentales para analistas de negocios


que el resultado es la combinación de fórmulas y funciones incluidas Mercado Conocimiento Consideración Conversión

en el modelo después de modificar nuestras variables de decisión (un Figura 91: Embudo de ventas de la situación de partida (escenario 0)
ejemplo podría ser “beneficios”).
El primer paso consiste en definir el modelo que vamos a
Voy a utilizar aquí el mismo ejemplo que en el apartado 79. El análisis optimizar mediante la identificación de las relaciones entre las
del embudo de ventas en el que he definido las cuatro etapas de un variables (Figura 92). La variable objetivo es “beneficios” que, a
cliente potencial: mercado, conocimiento, consideración y conversión. La su vez, depende de tres variables: los costes variables (que no
relación entre los elementos aparece representada mediante ratios; por cambian), el precio y el número de productos vendidos. El número
ejemplo, el 70% de las personas del mercado conoce nuestro producto, de productos vendidos depende de la tasa de conversión y el
el 80% de las personas que conoce nuestro producto lo considera a número de personas que consideren nuestro producto. Podemos
la hora de comprar, y el 10% de los que consideran nuestro producto continuar con este razonamiento hasta llegar al final del diagrama.
acaba comprándolo. Para mejorar nuestras ventas, podemos actuar Se han definido todas las conexiones del diagrama a través de
sobre tres variables de decisión: aumentar el conocimiento, aumentar funciones en la plantilla, y en particular, estamos interesados en
la consideración o aumentar la conversión. En aras de la simplicidad, las relaciones con nuestras tres principales variables de decisión
asumiremos que podemos aumentar directamente el concoimiento de (precio, comunicación y publicidad). Estas son las variables
la marca invirtiendo en publicidad, podemos aumentar la consideración que podemos modificar en función de nuestras decisiones
invirtiendo en comunicación y podemos mejorar la conversión bajando los empresariales para aumentar nuestros beneficios:
80
148

OPTIMIZACIÓN

Análisis what-if y modelos de optimización


»» Precio: podemos reducir el precio de nuestro producto para Llegados a este punto, abriremos Solver en Excel (“Datos” –
aumentar la tasa de conversión y, por tanto, el número de productos “Análisis de datos” – “Solver”)36 y definiremos nuestras variables
vendidos (consultar la plantilla de Excel para ver el cálculo exacto), (ver Figura 93):
pero al mismo tiempo, tendrá un efecto negativo directo sobre los
»» El objetivo es la celda con los ingresos – costes, y
beneficios puesto que el número de productos se multiplicará por un
comprobaremos que queremos que esa celda contenga la
precio inferior.
cantidad máxima (la celda amarilla de la plantilla).
»» Costes de comunicación: podemos aumentar los gastos en
»» Las celdas de las variables cambiantes son las celdas que
comunicación para mejorar la consideración de nuestro producto
contienen nuestras variables de decisión (precio, costes
(cuanto más convenzamos a la gente, más caro resultará convencer
de comunicación y costes de publicidad); habrá que
a los clientes nuevos).
seleccionarlas utilizando CTRL en caso de que no sean celdas
»» Costes de publicidad: podemos aumentar nuestra inversión en consecutivas (celdas verdes).

80 Modelos fundamentales para analistas de negocios


publicidad para incrementar el número de clientes potenciales que
»» Limitaciones (celdas rojas): definiremos tres tipos de
nos conocen pero, en términos de comunicación, se volverá cada vez
limitaciones:
más costoso a medida que nos vayamos aproximando al 100% del
mercado. • Que nuestras tasas de conocimiento, consideración y
conversión no pueden superar el 100%.
• Que tenemos un presupuesto total de 120.000€ para
gastos de publicidad y comunicación.
• Que todas las variables no limitadas deben ser no-
negativas (hay que marcar esta casilla en Solver).

36
Asegúrese de tener el complemento Solver instalado y habilitado; para más información,
Figura 92: Definición del modelo (optimización) visite www.solver.com
80
149

OPTIMIZACIÓN

Análisis what-if y modelos de optimización


»» Método de optimización: utilizaremos un método no lineal de Los resultados muestran que podemos aumentar nuestros
Gradiente Reducido Generalizado (GRG) puesto que no todas beneficios invirtiendo 112.000€ en publicidad y 8.000€ en
nuestras combinaciones de funciones (objetivo, variables de decisión comunicación, y reduciendo el precio un 4%. También muestran
y limitaciones) son lineales. Si tratamos de utilizar el método lineal que la iniciativa estratégica más importante está relacionada
Simplex, Solver informará de que no puede resolver el modelo.37 con la tasa de conocimiento, que ha aumentado un 33% hasta
alcanzar el 93% del mercado, tal y como aparece en la Figura 94.
ESCENARIO 0 CAMBIO ESCENARIO 1

MERCADO 100.000 0% 100.000


Embudo de ventas escenario 1
% mercado / conocimiento 70% 33% 93%
CONOCIMIENTO 70.000 33% 93.329 100%
100% 93%
% conocimiento / consideración 80% 2% 81%
CONSIDERACIÓN 56.000 36% 76.024 80% 76%
% consideración / conversión 10% 6% 11%

80 Modelos fundamentales para analistas de negocios


CONVERSIÓN 5.600 44% 8.059 60%
93% 81%
PRECIO MEDIO 100 € -4% 96 € 40%
COSTE VARIABLE 20 € 0% 20 €
INGRESOS 560.000 € 38% 771.320 € 20%
11% 8,1%
COSTES 112.000 € 44% 161.171 €
COSTES ADIC PUBLICIDAD - 111.981€ 0
COSTES ADIC COMUNIC. - 8.020 € Mercado Conocimiento Consideración Conversión
INGRESOS - COSTES 448.000€ 9% 490.149 €

MÁX INVER. PUBLI + COM 120.000€ Figura 94: Embudo de ventas después de la optimización (escenario 1)

Figura 93: Resultados de la optimización utilizando Solver

37
Siempre que todas las funciones sean lineales (objetivo, variables de decisión y limitaciones), será más
eficiente utilizar el método Simplex LP. Suele ser el caso cuando estamos utilizando fórmulas sencillas con
sumas, restas, divisiones o multiplicaciones. Para fórmulas más complejas (y especialmente para potencias o
raíces), deberíamos utilizar un método no lineal de Gradiente Reducido Generalizado (GRG). En caso de que
tengamos datos discontinuos o no atenuados (por ejemplo, si utilizamos fórmulas con SI, ELEGIR, REDONDEAR,
CONTAR, ENTERO, ABS, MIN, MAX, etc.), deberíamos utilizar el método evolutivo que encontrará una “buena
solución” pero seguramente no la mejor solución en términos globales (se recomienda intentarlo varias veces
con distintos puntos de partida). Un método más complejo para una solución más sencilla (como por ejemplo,
el método no lineal GRG para un problema lineal) funcionará pero no será el método más eficiente. En caso http://analyticsmodels.blogspot.com.es/p/what-if-
de que Solver produzca un error, habrá que seleccionar los informes facilitados para obtener más información
acerca del problema. Hay más información disponible en www.solver.com. analysis-and-optimization-models.html
ANEXO
151

ÍNDICE DE MODELOS

Anexo
„„ Análisis conjunto 43 „„ Análisis multivariante de escenarios 134

„„ Análisis conjunto basado en elecciones 46 „„ Análisis multivariante de la varianza 91

„„ Análisis DAFO 31 „„ Árboles de decisión simple 135

„„ Análisis de componentes principales 112 „„ Auditoría de recursos 21

„„ Análisis de escenarios mejor-peor-medio 133 „„ Bondad de ajuste de chi-cuadrado 94

„„ Análisis de grupos 108 „„ Bootstrapping (método de remuestreo) 80

„„ Análisis de la varianza bidireccional 89 „„ Clasificación binaria 105

„„ Análisis de la varianza con medidas repetidas 90 „„ Coeficiente de correlación de Spearman 95

80 Modelos fundamentales para analistas de negocios


„„ Análisis de la varianza unidireccional 89 „„ Coeficiente Phi 96

„„ Análisis de perfiles 110 „„ Coeficiente V de Cramer 96

„„ Análisis de series temporales 127 „„ Correlación de Pearson 69

„„ Análisis del ciclo de vida de curva S 122 „„ El análisis de rutas 74

„„ Análisis del ciclo de vida de un producto 25 „„ El marco VMOST 19

„„ Análisis del cumplimiento de la previsión 121 „„ Estadísticas descriptivas 65

„„ Análisis del embudo de ventas 144 „„ Estrategia del océano azul 17

„„ Análisis del entorno (PEST/PESTEL) 14 „„ Las 5 fuerzas de Porter 24

„„ Análisis factorial confirmatorio 117 „„ Mapa de posicionamiento 16

„„ Análisis factorial exploratorio 114 „„ Matriz de Ansoff 32


152

ÍNDICE DE MODELOS

Anexo
„„ Matriz de Boston 22 „„ Pickup multiplicativo 129

„„ Matriz de diversificación 27 „„ Prueba de Friedman 100

„„ Matriz de importancia-desempeño 18 „„ Prueba de hipótesis bayesiana 81

„„ Matriz de internacionalización 28 „„ Prueba de independencia de chi-cuadrado 93

„„ Matriz de valor del cliente 56 „„ Prueba de Kruskal-Wallis 99

„„ Media móvil 125 „„ Prueba de los rangos con signo de Wilcoxon 98

„„ Medidor de sensibilidad de precios de Van Westendorp 40 „„ Prueba de McNemar 102

„„ Método de fijación de precios Gabor Granger 39 „„ Prueba de proporciones con dos muestras 86

80 Modelos fundamentales para analistas de negocios


„„ Modelo Canvas 29 „„ Prueba de proporciones con una muestra 86

„„ Modelo de cadenas de Markov 142 „„ Prueba de proporciones de chi-cuadrado 93

„„ Modelo de probabilidad del cliente 58 „„ Prueba de Scheirer-Ray-Hare 101

„„ Modelo de regresión pickup 129 „„ Prueba Q de Cochran 103

„„ Modelo RFM 50 „„ Prueba t de dos muestras 84

„„ Modelos de la teoría de juegos 137 „„ Prueba t de una muestra 83

„„ Modelos de puntuación 61 „„ Prueba t emparejada 85

„„ Net Promoter Score 55 „„ Prueba U de Mann-Whitney 97

„„ Optimización 147 „„ Regresión con múltiples variables 72

„„ Pickup aditivo 129 „„ Regresión lineal 70


153

ÍNDICE DE MODELOS

Anexo
„„ Regresión logística 107

„„ Regresiones no lineales 73

„„ Shuffling (redistribución) 80

„„ Simulaciones de Montecarlo 140

„„ Suavización exponencial 126

„„ Superforecasting 10

„„ Tabla de contingencia 96

„„ Test A/B 87

80 Modelos fundamentales para analistas de negocios


„„ Test monádico de precios 42

„„ Valor vitalicio del cliente 1 51

„„ Valor vitalicio del cliente 2 53


154

ÍNDICE DE FIGURAS

Anexo
„„ Figura 1: Modelo PEST (tendencias políticas) 14 „„ Figura 18: Medidor de sensibilidad de precios de Van
Westendorp 40
„„ Figura 2: Mapa de posicionamiento 16
„„ Figura 19: Ampliación del MSP de Van Westendorp con
„„ Figura 3: Marco de cuatro acciones para la implementación
estimación de ingresos y de demanda 41
de una estrategia del océano azul 17
„„ Figura 20: Curva de demanda derivada de un test monádico
„„ Figura 4: Matriz de importancia-desempeño 18
de precios 42
„„ Figura 5: Análisis VMOST 19
„„ Figura 21: Combinaciones y preferencias expresadas en un
„„ Figura 6: Ejemplo de auditoría de recursos 21 análisis conjunto 44

„„ Figura 7: Matriz de Boston 22 „„ Figura 22: Relación lineal precio-utilidad 45

80 Modelos fundamentales para analistas de negocios


„„ Figura 8: Marco de las cinco fuerzas de Porter 24 „„ Figura 23: Valor del cliente calculado mediante un modelo
RFM 50
„„ Figura 9: Ciclo de vida competitivo 25
„„ Figura 24: Valor vitalicio del cliente de distintos clientes 51
„„ Figura 10: Matriz de diversificación 27
„„ Figura 25: Matriz de transición de segmentos de clientes 53
„„ Figura 11: Matriz de internacionalización 28
„„ Figura 26: Matriz de valor del cliente 56
„„ Figura 12: Modelo Canvas 29
„„ Figura 27: Curva de supervivencia 59
„„ Figura 13: Análisis DAFO 31
„„ Figura 28: Coeficientes de las regresiones logísticas y
„„ Figura 14: Matriz de Ansoff 32 lineales 61
„„ Figura 15: Clasificación de los métodos para „„ Figura 29: Tabla de resultados con la probabilidad de
la estimación de la DAP 34 compra, el importe estimado y la puntuación final 62
„„ Figura 16: Elasticidad precio de la demanda 37 „„ Figura 30: Histograma y diagrama de caja 66
„„ Figura 17: Método de fijación de precios Gabor–Granger 39 „„ Figura 31: Gráfico de probabilidad normal 67
155

ÍNDICE DE FIGURAS

Anexo
„„ Figura 32: Gráfico de dispersión con línea de ajuste óptimo 67 „„ Figura 48: Resultado de un test A/B sobre tasas de
conversión 87
„„ Figura 33: Gráfico de los residuales estandarízados 68
„„ Figura 49: Resultado de un análisis de la varianza
„„ Figura 34: Matriz de correlación 69
unidireccional 89
„„ Figura 35: Resultado de un análisis de regresión lineal 70
„„ Figura 50: Resultado de un análisis de la varianza
„„ Figura 36: Resultado de un análisis de regresión con múltiples bidireccional 90
variables 72
„„ Figura 51: Resultados de un análisis de la varianza de factor
„„ Figura 37: Regresión exponencial 73 único con medidas repetidas 90

„„ Figura 38: Diagrama de un análisis de rutas 74 „„ Figura 52: Resultados de un análisis de la varianza de dos
factores con varias muestras por grupo 91

80 Modelos fundamentales para analistas de negocios


„„ Figura 39: Efectos directos e indirectos dentro de las variables 76
„„ Figura 53: Resumen de las pruebas no paramétricas 92
„„ Figura 40: Resumen de pruebas paramétricas y no paramétricas 78
„„ Figura 54: Valores observados frente a valores esperados en
„„ Figura 41: Posibles resultados de una prueba de hipótesis 79 una prueba de chi-cuadrado 93
„„ Figura 42: Matriz del método de inferencia bayesiana 81 „„ Figura 55: Datos y resultados de una prueba de chi-cuadrado
„„ Figura 43: Datos de entrada de una prueba t de una muestra 83 con bondad de ajuste 94

„„ Figura 44: Resultados de una prueba t de una muestra 83 „„ Figura 56: Coeficiente de correlación de Spearman 95

„„ Figura 45: Resultado de una prueba t con dos muestras suponiendo „„ Figura 57: Tabla de contingencia 96
varianzas desiguales 84 „„ Figura 58: Interpretación de los coeficientes Phi y V de
„„ Figura 46: Resultado de una prueba t emparejada 85 Cramer 96

„„ Figura 47: Resultados de una prueba de proporciones con una „„ Figura 59: Prueba U de Mann–Whitney 97
muestra 86 „„ Figura 60: Prueba de los rangos con signo de Wilcoxon 98
156

ÍNDICE DE FIGURAS

Anexo
„„ Figura 61: Prueba de Kruskal–Wallis 99 „„ Figura 77: Diagrama de rutas de un análisis factorial
confirmatorio 117
„„ Figura 62: Prueba de Friedman 100
„„ Figura 78: Pronóstico y datos de venta utilizando una
„„ Figura 63: Datos para la prueba de Scheirer–Ray–Hare 101
transformación logarítmica 123
„„ Figura 64: Prueba de Scheirer–Ray–Hare 101
„„ Figura 79: Línea de tendencia lineal y datos transformados
„„ Figura 65: Datos y resultados de una prueba de McNemar 102 según el registro 123
Datos reales de venta y ventas pronosticadas 124
„„ Figura 66: Datos y resultados de una prueba Q de Cochran 103
„„ Figura 80: Ejemplo de medias móviles de tres y cinco
„„ Figura 67: Tabla para el cálculo de la curva ROC 105 periodos 125
„„ Figura 68: Curva ROC 106 „„ Figura 81: Suavización exponencial con un alfa más bajo (0,2)

80 Modelos fundamentales para analistas de negocios


„„ Figura 69: Regresión logística 107 y otro más elevado (0,8) 126

„„ Figura 70: Análisis sencillo de grupos utilizando un diagrama de „„ Figura 82: Análisis de series temporales 127
dispersión 108 „„ Figura 83: Resumen de escenarios 134
„„ Figura 71: Ejemplo de niveles iguales en un análisis de perfiles „„ Figura 84: Árbol de probabilidad 135
(en términos promedios, los niveles son iguales aunque no haya
paralelismo) 110 „„ Figura 85: El dilema del prisionero 138

„„ Figura 72: Ejemplo de paralelismo en un análisis de perfiles 111 „„ Figura 86: Árbol de decisiones con las recompensas de los
jugadores 138
„„ Figura 73: Ejemplo de planitud en un análisis de perfiles 111
„„ Figura 87: Resultado de una simulación de Montecarlo 140
„„ Figura 74: Resultados de un ACP 112
„„ Figura 88: Matriz de transición de probabilidades 142
„„ Figura 75: Gráfico de sedimentación 113
„„ Figura 89: Resultado de una cadena de Markov 143
„„ Figura 76: Factores de carga y comunalidades 115
„„ Figura 90: Embudo de ventas 144
157

ÍNDICE DE FIGURAS

Anexo
„„ Figura 91: Embudo de ventas
de la situación de partida (escenario 0) 147

„„ Figura 92: Definición del modelo (optimización) 148

„„ Figura 93: Resultados de la optimización utilizando Solver 149

„„ Figura 94: Embudo de ventas


después de la optimización (escenario 1) 149

80 Modelos fundamentales para analistas de negocios


158

BIBLIOGRAFÍA

Anexo
„„ Breidert, Christoph. Estimation of Willingness-to-Pay: Theory, „„ Schumacker, Randall E., and Richard G. Lomax. A Beginner’s
Measurement, Application. Deutscher Universitätsverlag, 2006. Guide to Structural Equation Modeling. Routledge, 2016.

„„ Cadle, James, Debra Paul, and Paul Turner. Business Analysis „„ Tetlock, Philip E., and Dan Gardner. Superforecasting: The Art
Techniques: 99 Essential Tools for Success. 2nd ed. BCS Learning & and Science of Prediction. Crown, 2015.
Development Limited, 2014.
„„ https://hbr.org/2006/01/competing-on-analytics
„„ Davenport, Thomas H., and Jeanne G. Harris. Competing on Analytics:
„„ http://www.excelmasterseries.com/
The New Science of Winning. Harvard Business School, 2007.
„„ http://blog.excelmasterseries.com/
„„ Fader, Peter S., and Bruce G.S. Hardie. “Implementing the BG/
BB Model for Customer-Base Analysis in Excel”, 2011. http://www. „„ http://www.real-statistics.com/
brucehardie.com/notes/010/

80 Modelos fundamentales para analistas de negocios


„„ https://en.wikipedia.org/wiki/Fermi_problem
„„ Guide to the Business Analysis Body of Knowledge: BABOK Guide.
International Institute of Business Analysis, 2015. „„ http://www.businessmodelgeneration.com/canvas/bmc

„„ Kahneman, Daniel. Thinking, Fast and Slow. Farrar, Straus and Giroux, „„ https://www.udacity.com/course/how-to-build-a-startup--
2011. ep245

„„ Kim, W. Chan, and Renée Mauborgne. Blue Ocean Strategy: How to „„ https://www.xlstat.com/es/soluciones/funciones/choice-
Create Uncontested Market Space and Make the Competition Irrelevant. based-conjoint-analysis
Harvard Business School, 2005. „„ https://hbr.org/2007/10/how-valuable-is-word-of-mouth
„„ Kumar, V., J. Andrew Petersen, and Robert P. Leone. “How Valuable is „„ http://www.quantitativeskills.com/sisa/rojo/distribs.htm
Word of Mouth?” HBR (2007).
„„ https://www.researchgate.net/publication/270887299_Path_
„„ Osterwalder, Alexander, Yves Pigneur, Tim Clark, and Alan Smith. Analysis_Step_by_Step_Using_Excel
Business Model Generation: A Handbook for Visionaries, Game
Changers, and Challengers. John Wiley and Sons, 2010. „„ http://www.watoowatoo.net/sem/sem.html
159

BIBLIOGRAFÍA

Anexo
„„ www.powerandsamplesize.com

„„ http://conversionxl.com/ab-testing-statistics/

„„ https://www.optimizesmart.com/understanding-ab-testing-statistics-
to-get-real-lift-in-conversions/

„„ http://www.real-statistics.com/multivariate-statistics/factor-analysis/
principal-component-analysis/

„„ http://www.real-statistics.com/multivariate-statistics/factor-analysis/

„„ https://www.researchgate.net/publication/7151927_Confirmatory_
factor_analysis_using_Microsoft_Excel

80 Modelos fundamentales para analistas de negocios


„„ https://hbr.org/1971/07/how-to-choose-the-right-forecasting-
technique

„„ http://people.stern.nyu.edu/adamodar/pdfiles/papers/probabilistic.
pdf

„„ http://econpapers.repec.org/software/uthexclio/

„„ https://www.me.utexas.edu/~jensen/ORMM/excel/markov.html

„„ www.solver.com
CONTACTA CON NOSOTROS
www.msmk.es
info@msmk.es
Teléfono: (+34) 91 781 69 62
MADRID: C/Príncipe de Vergara, 43 – 28001, Madrid (España)

Vous aimerez peut-être aussi