Académique Documents
Professionnel Documents
Culture Documents
Ttulo de la tesina
Asesor
LA SERNA PALOMINO, Nora
Lima Per
2013
ii
FICHA CATALOGRFICA
YALTA MAICELO, Juan Jos
SISTEMA DE INFORMACIN PARA EL PRONSTICO DE VENTAS EN PYMES
DEL SECTOR COMERCIAL EN EL PER UTILIZANDO REDES NEURONALES
ARTIFICIALES
Inteligencia Artificial
(Lima, Per 2013)
Tesina, Facultad de Ingeniera de Sistemas e Informtica, Pregrado, Universidad Nacional
Mayor de San Marcos
Formato 21 x 29.7 cm
Pginas 140
iii
DEDICATORIA
El presente trabajo est dedicado a mis padres
Juan y Rosa, por el incansable apoyo brindado y
por el eterno aliento entregado a sus hijos.
iv
AGRADECIMIENTOS
Agradezco a mis padres por los principios y valores inculcados en mi vida, a todos mis
maestros que compartieron conmigo sus conocimientos y experiencias, a mi Universidad
San Marcos por acogerme en sus aulas y por permitirme crecer como persona y profesional
y a mi asesora Dra. Nora La Serna por ayudarme a materializar el presente proyecto.
RESUMEN
El cambiante y altamente competitivo ambiente de negocios que se viene desarrollando en
la actualidad, requiere de nuevas y eficientes herramientas que ayuden y den soporte a la
toma de decisiones empresariales, las cuales presentan un alto riesgo inherente, propio de
situaciones de incertidumbre, es por ello que para minimizar ese grado de incertidumbre,
esa falta de conocimiento de lo que podra suceder, se realizan pronsticos de aquellos
eventos considerados imprescindibles para tomar mejores decisiones, uno de los cuales es
el pronstico de ventas. Estos pronsticos deben tener una alta precisin debido al gran
impacto que tienen, por lo que los especialistas prestan mucha importancia en la
elaboracin de los mismos, utilizando muchos de los mtodos clsicos de pronstico
conocidos; sin embargo, tales mtodos no brindan la precisin requerida a un costo y
tiempo aceptables. Es por ello que el presente trabajo tiene por finalidad brindar una
solucin para el pronstico de ventas en pymes del sector comercial en el Per utilizando
uno de los denominados nuevos mtodos para pronsticos, las redes neuronales artificiales,
mediante las cuales se generar un modelo de pronstico de ventas en base a los niveles de
venta histricos efectuados.
Palabras Claves: Pronstico de Ventas, Redes Neuronales, Pyme.
vi
ABSTRACT
The changing and highly competitive business environment that is being developed at
present, requires new and efficient tools to assist and give support to business decisions,
which have a high inherent risk, typical of situations of uncertainty, is so that to minimize
the degree of uncertainty, that lack of knowledge of what could happen, forecasts are made
of those events considered essential to make better decisions, one of which is the sales
forecast. These forecasts should have a high accuracy due to high impact, so that
specialists pay great importance in the development of them, using traditional methods of
forecasting many known, but such methods do not provide the accuracy required to
acceptable cost and time. That is why this paper aims to provide a solution for sales
forecasting SME sector commercial in Peru using one of the so-called new methods for
forecasting, artificial neural networks, which is generated by a forecasting model sales
based on historical sales levels incurred.
Key words: Sales Forecasting, Neural Networks, SME.
vii
NDICE DE CONTENIDO
Dedicatoria .......................................................................................................... iv
Agradecimientos .................................................................................................. v
Resumen .............................................................................................................. vi
Abstract .............................................................................................................. vii
ndice de contenido .......................................................................................... viii
Lista de figuras ................................................................................................... xi
Lista de tablas ................................................................................................... xiii
Introduccin ...................................................................................................... xiv
Captulo 1:
1.1
Antecedentes .................................................................................................................................. 1
1.2
1.3
Objetivos ........................................................................................................................................ 3
1.3.1
1.3.2
1.4
Justificacin.................................................................................................................................... 4
1.5
Propuesta........................................................................................................................................ 4
1.6
Captulo 2:
2.1
2.1.1
Definicin ................................................................................................................................... 7
2.1.2
2.1.3
2.1.4
2.1.5
2.1.6
2.2
2.2.1
Definicin ................................................................................................................................. 18
2.2.2
2.2.3
2.2.4
2.2.5
2.2.6
2.3
2.3.1
Definicin ................................................................................................................................. 23
2.3.2
2.3.3
viii
2.3.4
2.4
2.4.1
Definicin ................................................................................................................................. 31
2.4.2
2.4.3
2.4.4
2.4.5
2.4.6
2.4.7
2.4.8
Captulo 3:
3.1
3.1.1
Definicin ................................................................................................................................. 41
3.1.2
Taxonoma ................................................................................................................................ 42
3.2
3.2.1
3.2.2
3.2.3
3.2.4
3.2.5
3.3
3.3.1
3.3.2
3.3.3
3.3.4
3.4
3.4.1
3.4.2
Captulo 4:
4.1
4.1.1
4.1.2
ix
4.2.1
Introduccin .............................................................................................................................. 85
4.2.2
4.2.3
Requerimientos ......................................................................................................................... 88
4.2.4
4.2.5
4.2.6
4.2.7
4.2.8
4.2.9
4.2.10
4.2.11
4.3
4.3.1
4.3.2
4.3.3
4.4
Captulo 5:
5.1
5.2
LISTA DE FIGURAS
11
15
22
28
28
30
31
33
35
42
43
46
50
50
51
51
81
92
93
94
104
105
106
107
108
109
109
111
113
xi
114
115
116
117
118
119
120
121
122
123
124
125
126
129
xii
LISTA DE TABLAS
25
74
74
75
86
86
87
87
88
94
95
95
97
98
99
101
102
125
128
130
130
xiii
INTRODUCCIN
Dentro del contexto globalizado y con mercados tan competitivos como los existentes en la
actualidad, las empresas se ven obligadas a buscar mayor eficiencia en sus procesos de
negocio. Un proceso de negocio fundamental en las empresas, es pronosticar los ndices de
ventas, pues los resultados de ste son fuente primordial para la planificacin de
operaciones y ventas, planificacin de la produccin, planificacin del inventario y
planificacin de las actividades de distribucin. As pues, los procesos del negocio
orientados al suministro (compras, produccin y distribucin) estn enfocados a garantizar
la disponibilidad de productos o servicio con eficiencia y al menor costo, y su desempeo
depende de que las reas de mercadotecnia y ventas pronostiquen lo mejor posible los
ndices de ventas. En este sentido, el tema que actualmente interesa es cmo pronosticar
con ms certeza los ndices de ventas.
Por lo mencionado anteriormente el presente trabajo est centrado en brindar a las pymes
del sector comercial peruano, una herramienta software para realizar el pronstico de
xiv
ventas con una precisin adecuada a un costo y tiempo aceptable, utilizando para ello las
redes neuronales artificiales.
xv
Captulo 1:
PLANTEAMIENTO METODOLGICO
1.1
Antecedentes
Desde tiempos remotos, el hombre buscaba predecir los hechos que ocurran a su alrededor
pues de stos dependa su supervivencia, as en la prehistoria el hombre tena la necesidad
de predecir la naturaleza, al vivir de la caza y recoleccin realizaban incisiones en huesos
de animales para representar las fases de la luna buscando predecir los cambios de
estacin; luego el cielo adquiri gran importancia para determinar la poca adecuada para
realizar la siembra y la cosecha.
En la edad antigua muchos reyes y altos jefes militares griegos recurran al Orculo de
Delfos para consultar sobre cuestiones inquietantes, como el resultado de guerras o el
advenimiento de plagas y enfermedades; los egipcios consultaban al orculo de Helipolis
y Abidos mediante preguntas escritas depositadas en los santuarios, los sacerdotes
astrnomos utilizaban calendarios primitivos para predecir los desbordamientos peridicos
del ro Nilo, pues la vida dependa de irrigar y cultivar los campos agrcolas con sus aguas.
En la edad media un gran nmero de reyes catlicos contaban con astrlogos para despejar
sus dudas en la toma de decisiones, as mismo en la edad moderna las civilizaciones
empleaban tcnicas de prediccin de eclipses y tcnicas antissmicas.
1.2
La falta de una herramienta eficiente que realice el pronstico de ventas con una precisin
adecuada a un costo y tiempo aceptable, es un gran inconveniente con el que se encuentran
las pymes del sector comercial en el Per, pues si bien es cierto que una de las
caractersticas de las pymes es que reaccionan hbilmente a los cambios inherentes del
mercado, su correcto desempeo y sostenido crecimiento depende mucho del grado de
previsin que puedan tener acerca del ambiente inestable que los rodea. Es por tal razn
que los pronsticos de venta toman un papel muy importante en la organizacin, pues los
resultados obtenidos son fuente primordial para la realizacin de los planes de venta,
marketing y operaciones, as como para la elaboracin de los presupuestos y la gestin de
inventarios.
El enunciado del problema es: La falta de una herramienta eficiente que realice el
pronstico de ventas para pymes del sector comercial en el Per con una precisin
adecuada a un costo y tiempo aceptable dificulta la planeacin y el eficiente desempeo
financiero de la empresa.
1.3
1.3.1
Objetivos
Objetivo principal
Ayudar a las pymes del sector comercial peruano a agilizar la realizacin del pronstico de
ventas, mediante la puesta a disposicin de una herramienta software que elabore
pronsticos precisos y confiables utilizando redes neuronales artificiales.
1.3.2
Objetivos secundarios
Definir el marco conceptual dentro del cual debe encontrarse la pyme para que sea
una buena receptora de la solucin a desarrollar.
1.4
Justificacin
1.5
Propuesta
Todo ello sostenido en base a las diversas investigaciones realizadas con dicha herramienta
y a las evaluaciones comparativas respecto a los mtodos clsicos de pronstico.
1.6
Organizacin de la tesina
En el Captulo 2 Marco Referencial; se muestra cada uno de los conceptos sobre los cuales
se fundamentan las Redes Neuronales Artificiales haciendo hincapi en el Perceptrn
5
Captulo 2:
MARCO REFERENCIAL
2.1
Una de las ramas ms destacadas del campo cientfico de la Inteligencia Artificia es la que
corresponde a las Redes Neuronales Artificiales (RNAs) entendiendo como tales aquellas
redes en las que existen elementos procesadores de informacin de cuyas interacciones
locales depende el comportamiento del conjunto del sistema (Hilera y Martnez, 1995,
p.16) citado por (Flrez y Fernndez, 2008, p.11).
2.1.1
Definicin
con los objetos del mundo real del mismo modo que lo hace el sistema nervioso
biolgico (Kohonen, 1988a).
2.1.2
Elementos Bsicos
A continuacin se puede ver, en la figura 2.1, el esquema de una red neuronal artificial:
Figura 2.1: Esquema de una red neuronal artificial. Adaptado de (Corchado y Fyfe,
2004, p.328)
La figura 2.1 muestra el diagrama general de una red neuronal artificial, donde se observa
las entradas, los pesos sinpticos, el umbral, la funcin de activacin y la salida de la red.
Adems incluye una entrada externa adicional, denominada polarizacin o bias y
denotada por
yi
f(
wij x j
Una neurona biolgica puede estar activa (excitada) o inactiva (no excitada); es decir, que
tiene un estado de activacin. Las neuronas artificiales tambin tienen diferentes estados
de activacin; algunas de ellas solamente dos, al igual que las biolgicas, pero otras pueden
tomar cualquier valor dentro de un conjunto determinado.
El ltimo componente que una neurona necesita es la funcin de salida. El valor resultante
de esta funcin es la salida de la neurona; por ende, la funcin de salida determina que
valor se transfiere a las neuronas vinculadas. Si la funcin de activacin est por debajo de
un umbral determinado, ninguna salida se pasa a la neurona subsiguiente. Normalmente,
no cualquier valor es permitido como una entrada para una neurona, por lo tanto, los
valores de salida estn comprendidos en el rango [0, 1] o [-1, 1]. Tambin pueden ser
binarios {0, 1} o {-1, 1} (Matich, 2001, p.15).
Identidad: Este es el tipo de funcin ms sencillo, tal que la salida es la misma que
la entrada.
Binaria:
si acti
caso contrario
donde
es el umbral.
Cuando tenemos una red de neuronas las salidas de unas se conectan con las entradas de
otras. Si el peso entre dos neuronas conectadas es positivo, el efecto producido es de
excitacin. Por el contrario, si es negativo, este efecto es de inhibicin.
Por lo tanto, podemos ver que una nica neurona es una unidad de procesamiento muy
simple. Se considera que el potencial de las redes neuronales artificiales proviene de la
capacidad que proporciona el empleo de muchas de stas unidades simples y robustas al
actuar en paralelo. De nuevo podemos considerar que estamos simulando (o intentando
simular) lo que ocurre en la realidad debido a que los seres humanos poseen varios cientos
de billones de neuronas (Corchado y Fyfe, 2004, p.329). Normalmente imaginamos las
neuronas actuando conjuntamente en capas como se muestra en la figura 2.3.
10
Figura 2.3: Red Neuronal Artificial formada por cuatro capas de neuronas (Matich,
2001, p.12)
Hay dos modos de trabajo en una red neuronal (Corchado y Fyfe, 2004, p.329):
2.1.3
Se ha visto que los datos de entrada se procesan a travs de la red neuronal con el propsito
de lograr una salida. Tambin se dijo que las redes neuronales extraen generalizaciones
desde un conjunto determinado de ejemplos anteriores de tales problemas de decisin. Una
red neuronal debe aprender a calcular la salida correcta para cada constelacin (arreglo o
11
El conjunto de datos (o conjunto de ejemplos) sobre el cual este proceso se basa es, por
ende, llamado: conjunto de datos de entrenamiento.
En otras palabras el aprendizaje es el proceso por el cual una red neuronal modifica sus
pesos en respuesta a una informacin de entrada. Los cambios que se producen durante el
mismo se reducen a la destruccin, modificacin y creacin de conexiones entre las
neuronas. En los sistemas biolgicos existe una continua destruccin y creacin de
conexiones entre las neuronas. En los modelos de redes neuronales artificiales, la creacin
de una nueva conexin implica que el peso de la misma pasa a tener un valor distinto de
cero. De la misma manera, una conexin se destruye cuando su peso pasa a ser cero.
0 ).
Aprendizaje supervisado.
Aprendizaje no supervisado.
12
Otro criterio que se puede utilizar para diferenciar las reglas de aprendizaje se basa en
considerar si la red puede aprender durante su funcionamiento habitual o si el aprendizaje
supone la desconexin de la red, es decir, su inhabilitacin hasta que el proceso termine.
En el primer caso, se tratara de un aprendizaje on line, mientras que el segundo es lo que
se conoce como off line (Matich, 2001, p.19).
wij (t 1)
wij (t )
wij (t )
Donde t hace referencia a la etapa de aprendizaje, wij (t 1) al peso nuevo y wij (t ) al peso
antiguo.
2.1.4
Aprendizaje Supervisado
En este tipo de aprendizaje se suelen considerar, a su vez, tres formas de llevarlo a cabo,
que dan lugar a los siguientes aprendizajes supervisados:
2.1.5
El Perceptrn Multicapa
14
Figura 2.4: Red MLP tpica de tres capas (Lara, 2007, p.68)
El potencial del MLP es su capacidad para modelar conjuntos de datos que no son
linealmente separables, aunque ste potencial se descubri pronto, se tard bastante tiempo
en encontrar un mtodo o regla de aprendizaje apropiada para construirlas a partir de
ejemplos. Esta regla parece que fue descubierta de manera independiente varias veces, y no
existe acuerdo de la fecha exacta ni de su descubridor, pero fue popularizada
principalmente por el Grupo PDP (Paralel Distributed Procesing), bajo el nombre de
Retropropagacin o Propagacin hacia atrs, el cual detallaremos ms adelante.
En la red MLP la activacin se propaga a travs de los pesos desde la capa de entrada hacia
la capa oculta donde se aplica alguna funcin de activacin a las entradas que le llegan.
Entonces la activacin se propaga a travs de los pesos hacia la capa de salida (Corchado y
Fyfe, 2004, p.332).
15
Es posible utilizar el nmero de capas ocultas que queramos, pues el mtodo es bastante
general. Sin embargo, un factor a tener en cuenta es normalmente el tiempo de
entrenamiento, el cual puede ser excesivo para arquitecturas con muchas capas. Adems,
se ha demostrado que redes con un nica capa oculta son capaces de aproximar cualquier
funcin continua (o incluso cualquier funcin con slo un nmero finito de
discontinuidades), en el caso de utilizar funciones de activacin diferenciables (no lineales)
en la capa oculta (Corchado y Fyfe, 2004, p.332).
2.1.6
El Algoritmo Backpropagation
(s ( q ) , t ( q ) )
xi
[ x1 , x2 , x3 ,..., xn ]
oj
[o1 , o2 , o3 ,..., or ]
yk
[ y1 , y 2 , y3 ,..., y m ]
w ji
wkj
uj
uk
bj
bk
16
Tasa de Aprendizaje
Paso 0: Inicializacin
Comparar las salidas estimadas por la red ( y ) con las reales ( t ) y determinar el error
cometido. Luego calcular los cambios en los pesos que llegan a la capa de salida utilizando
la frmula:
wkj
n ( tk
yk ) f ' (uk )o j
w ji
usando:
w ji
n[
( tk
k 1
wkjnuevo
wkjactual
wkj
w nuevo
ji
w actual
ji
w ji
Repetir los pasos del 1 al 5 con todos los patrones de entrenamiento. Hacer
w actual
ji
actual
w nuevo
y wkj
ji
para todos los vectores del conjunto de entrenamiento, haya sido reducido a un valor
(previamente establecido) como aceptable. Tambin se puede usar otro criterio de
convergencia, basndose en otras funciones de error.
2.2
2.2.1
El Pronstico de Ventas
Definicin
El pronstico de ventas debe ser pensado como una mejor estimacin sobre la demanda de
los clientes para los productos o servicios de una empresa, en un horizonte de tiempo
determinado, dado un conjunto de supuestos sobre el entorno (Mentzer y Moon, 2005, p9).
2.2.2
18
2.2.3
Tipos de Pronstico
En general segn (Hanke y Wichern, 2006, p.3) los pronsticos se pueden clasificar en
base a tres criterios principales.
2.2.4
19
Qi
SiQ
Donde:
2.2.5
Qi
Demanda de la empresa i
Si
Cuota de mercado
La intencin de medir la precisin de los pronsticos tiene una doble finalidad: la precisin
de los pronsticos influye en diversos costos operativos y en la satisfaccin del cliente. Del
20
Entre los costos operativos derivados se pueden mencionar los de operacin (produccin,
logstica), mercadotcnica (promociones, publicidad, cuotas de venta, desarrollo de
producto, precio). Estos surgen, en el caso de las operaciones, por costos de inventario, por
errores en el producto, cambios en los programas, envos errneos que aumentan costos de
inventario, transporte, etc.
Entre los costos derivados para el caso de mercadotcnica estaran costos ineficaces en
publicidad, desarrollo de nuevos productos sin demanda adecuada, precios que no
maximizan la contribucin, cuotas de venta inapropiadas. Es importante considerar cmo
se pueden generar patrones extraos de pronsticos, que pueden estar provocados por
incentivos inapropiados (un sistema de sanciones a los que superen la cuota de ventas, por
ejemplo). Siempre es importante valorar los beneficios que puede traer el sistema de
pronsticos. No siempre superan los costos del desarrollo de un sistema ms complejo.
21
No tener los productos deseados por los clientes en los lugares y cantidades
deseadas.
2.2.6
2.3
2.3.1
Definicin
Desde un marco legal, segn el Texto nico Ordenado (TUO) de la Ley de Promocin de
la Competitividad, Formalizacin y Desarrollo de la Micro y Pequea Empresa y del
Acceso al Empleo Decente, Ley MYPE promulgada por el Decreto Supremo N 007-2008,
del 20 de septiembre de 2008, se define:
La Micro y Pequea Empresa es la unidad econmica constituida por una persona natural o
jurdica, bajo cualquier forma de organizacin o gestin empresarial contemplada en la
legislacin vigente, que tiene como objeto desarrollar actividades de extraccin,
transformacin, produccin, comercializacin de bienes o prestacin de servicios.
23
2.3.2
Segn el Decreto Legislativo N 1086, unificado con la Ley N 28015 mediante el TUO del
Decreto Supremo N 007-2008, para que una empresa sea catalogada como mype debe
reunir las siguientes caractersticas concurrentes:
24
Clasificacin
Nmero de
Trabajadores (T)
Ventas Anuales
(VA) en UIT
Microempresa
1 <= T <= 10
Pequea
Empresa
Mediana y Gran
Empresa
100 < T
2.3.3
Microempresa: remuneracin mnima vital de 600 nuevos soles (puede ser menor
si acuerda).
Descanso semanal
Microempresa: 24 horas.
25
Vacaciones
Despido injustificado
Microempresa: no aplica.
Gratificaciones
Microempresa: no aplica.
2.3.4
26
7.6% con respecto al 2007 cuando se encontraban 5.75 millones de negocios de sta clase
(Departamento de Estudios Econmicos de COMEXPERU, 2012, p.32).
Una MYPE promedio en el Per tiene 7 aos de antigedad, atiende solamente 10 meses
del ao y posee como fuerza laboral dos trabajadores, quienes son familiares del dueo del
negocio en el 75% de los casos. Adems un tercio de dichas organizaciones usa el
domicilio del empresario como local y en el 60% de los casos ste es propio. Por otro lado,
el predio mayormente cuenta con electricidad (61%), en ocasiones posee agua potable
(25.2%) y desage (13%), y casi nunca tiene telfono fijo (5.3%) o internet (3.6%). No
obstante los problemas no acaban all, sino que se ha hallado que un 88% de las mismas
son informales al no estar registradas como persona jurdica o natural. Peor an, el 71.7%
no lleva ningn tipo de registro de ventas. Ello no es ms que resultado de la falta de
cultura institucional dentro de la mentalidad empresarial, as como de la complejidad del
proceso que se requiere hacer para lograr la ansiada formalizacin (Departamento de
Estudios Econmicos de COMEXPERU, 2012, p.32).
Con respecto a los sectores econmicos o giros de negocio, durante los ltimos aos, se ha
visto cmo ha disminuido la preferencia por la manufactura y el comercio, mientras que ha
crecido significativamente la predileccin por los servicios. Lo llamativo es que son
justamente las dos primeras actividades las que, en promedio, le proporcionan mayores
ingresos al empresario, con S/. 1,707 y S/. 3,193, respectivamente, en contraposicin con
los S/. 1,474 de la ltima. Es as que el crecimiento de los servicios, que ha pasado del
43.4% al 50.3% en los ltimos cinco aos, como se muestra en la figura 2.6, se debe al
poco capital y alta mano de obra que requiere el comienzo de su negocio, mas no a las
ganancias netas.
27
Por otro lado, del total de empresas formales en el Per, un 90.1% es representado por las
microempresas, un 2.1% por pequeas empresas, y un 7.8% por medianas y grandes
empresas, tal como se muestra en la figura 2.7. Adems, las micro y pequeas empresas
aportan el 42% de la produccin total en el Per, ubicndose el 39% de estas en la ciudad
de Lima Metropolitana (Ferreyros, 2012, p.12).
Figura 2.7: Distribucin de las empresas formales en el Per. Fuente (ENAHO, 2011)
28
Un hecho relevante es que las pequeas empresas no dejan de crecer, lo que ha hecho que
consecuentemente se involucre cada vez mayor cantidad de fuerza laboral a sus filas. De
esta manera, al finalizar el 2011, las MYPE contrataron a 12.6 millones de personas, lo que
represent un 77.7% de la poblacin econmicamente activa (PEA). Cabe sealar que no
existe un claro dominio de un sexo en la direccin de los negocios; en un 41.9% de los
casos las mujeres son las que llevan las riendas (Departamento de Estudios Econmicos de
COMEXPERU, 2012, p.32).
Sin embargo, un 88% de estos negocios son informales, y un 21.3% del total de sus
trabajadores no recibe ningn tipo de remuneracin, lo que se sustenta en que alrededor del
75% utiliza mano de obra familiar. Ante este panorama, es claro que se necesitan
alternativas para seguir impulsando el desarrollo de este tipo de empresas (Ferreyros, 2012,
p.12).
ltimos aos, pero se viene ganado ms, lo que indica que, pese a lo que algunos alegan,
realmente el desarrollo econmico est llegando a las poblaciones de menores recursos
(Semanario COMEXPERU 669, 2012, p.5).
Cabe indicar que el nivel de ingreso que percibe el empresario vara de acuerdo al giro del
negocio que decida emprender, y se debe mencionar que en el 49.3% de los casos la
organizacin se inici por necesidad econmica del dueo, tal como se muestra en la figura
2.8.
Figura 2.8: Razones por las que se crean las mypes. (Departamento de Estudios
Econmicos de COMEXPERU, 2012, p.33)
30
2.4
2.4.1
La Minera de Datos
Definicin
31
2.4.2
Si bien es cierto que en muchas ocasiones los trminos Minera de Datos y Descubrimiento
de Conocimiento en Base de Datos (Knowledge Discovery from Databases, KDD) son
usados indistintamente, ste ltimo es un proceso ms amplio compuesto por una
secuencia iterativa de etapas o fases, una de las cuales es La Minera de Datos.
Se define el KDD como el proceso no trivial de identificar patrones vlidos, novedosos,
potencialmente tiles y, en ltima instancia, comprensibles a partir de los datos (Fayyad
et al., 1996a), citado por (Hernndez, Ramrez y Ferri, 2004, p.13).
La definicin anterior expresa que el KDD es un proceso complejo que incluye no slo la
obtencin de los modelos o patrones, sino tambin el pre procesado de los datos al igual
que la evaluacin e interpretacin de los resultados.
Por lo tanto el KDD el proceso global de descubrir conocimiento til desde las bases de
datos, mientras que la Minera de Datos se refiere a la aplicacin de los mtodos de
aprendizaje y estadsticos para la obtencin de patrones y modelos (Hernndez et al., 2004,
p.14).
2.4.3
El proceso de KDD est conformado por cinco fases, tal como se muestra en la figura 2.10.
La fase inicial es la de integracin y recopilacin, en donde se determinan las fuentes de
datos a utilizar y se construye el almacn de datos o Datawarehouse, el cual resumir de
manera operativa toda la informacin recogida facilitando la navegacin y visualizacin
previa de los datos. En la siguiente fase se realiza la seleccin, limpieza y transformacin
32
Figura 2.10: Fases del Proceso del KDD. Adaptado de (Hernndez et al., 2004, p.20).
33
2.4.4
Esencialmente los Almacenes de Datos se usan para poder agregar o cruzar eficientemente
la informacin de maneras sofisticadas. Por ello, los datos se modelan con una estructura
de base de datos multidimensional, donde cada dimensin corresponde a un atributo o
conjunto de atributos en el esquema en torno a unos hechos que almacenan el valor de
alguna medida agregada, como por ejemplo la cantidad vendida de un producto en un da
concreto en una tienda. Esta visin multidimensional hace a los almacenes de datos
34
Los Almacenes de datos son tiles para muchas tareas que necesitan como fuente, los datos
histricos de la organizacin, es as que se usas conjuntamente con herramientas de
consultas e informes, herramientas EIS (Executive Information System), herramientas
OLAP y herramientas de minera de datos, tal como se muestra en la figura 2.11.
35
2.4.5
Por otro lado, adems de la irrelevancia, existen tambin otros problemas que afectan a la
calidad de los datos. Uno de estos problemas es la presencia de valores que no se ajustan al
comportamiento general de los datos (outliers). Estos datos anmalos pueden representar
errores en los datos o pueden ser valores correctos que son simplemente diferentes a los
dems. Algunos algoritmos de minera de datos ignoran estos datos, otros los descartan
considerndolos ruido o excepciones, pero otros son muy sensibles y el resultado se ve
claramente perjudicado por ello. Sin embargo no siempre es conveniente eliminarlos, ya
que, en algunas aplicaciones como la deteccin de compras fraudulentas efectuadas con
tarjetas de crdito a la prediccin de inundaciones, los eventos raros pueden ser ms
interesantes que los regulares (por ejemplo, compras por un importe mucho ms elevado
que el de las compras efectuadas habitualmente con la tarjeta, o das en los que la cantidad
de lluvia recogida es muy superior a la media) (Hernndez et al., 2004, p.23).
As mismo la presencia de datos faltantes o perdidos (missing values) puede ser tambin un
problema pernicioso que puede conducir a resultados poco precisos. No obstante, es
necesario reflexionar primero sobre el significado de los valores faltantes antes de tomar
alguna decisin sobre cmo tratarlos ya que estos pueden deberse a causas muy diversas,
como un mal funcionamiento del dispositivo que hizo la lectura del valor, o cambios
efectuados en los procedimientos usados durante la coleccin de los datos o al hecho de
que los datos se recopilen desde fuentes diversas.
Para el desarrollo de esta fase se dispone de diversas tareas de preparacin de datos cada
una de las cuales resuelve, dependiendo de la forma en que se aplica, los problemas
anteriormente planteados. Dentro de las tareas de preparacin de datos podemos encontrar
36
2.4.6
La fase de minera de datos es la ms caracterstica del KDD y, por sta razn, muchas
veces se utiliza esta fase para nombrar todo el proceso. El objetivo de esta fase es producir
nuevo conocimiento que pueda utilizar el usuario. Esto se realiza construyendo un modelo
basado en los datos recopilados para este efecto. El modelo es una descripcin de los
patrones y relaciones entre los datos que pueden usarse para hacer predicciones, para
entender mejor los datos o para explicar situaciones pasadas. Para ello es necesario tomar
una serie de decisiones antes de empezar el proceso:
Elegir el tipo de modelo. Por ejemplo para la tarea de prediccin. Podramos usar
las redes neuronales artificiales.
Elegir el algoritmo de minera que resuelva la tarea y obtenga el tipo de modelo que
estamos buscando.- Por ejemplo para crear redes neuronales para prediccin,
podramos usar el perceptrn multicapa con el algoritmo de aprendizaje de retropropagacin (backpropagation).
Cada uno de estos paradigmas incluye diferentes algoritmos y variaciones de los mismos,
as como otro tipo de restricciones que hacen que la efectividad del algoritmo dependa del
dominio de aplicacin, no existiendo lo que podramos llamar el mtodo universal
aplicable a todo tipo de aplicacin (Hernndez et al., 2004, p.27).
37
2.4.7
En esta fase se realiza la medicin de calidad de los patrones descubiertos por el algoritmo
de minera de datos, ste proceso de medicin puede ser desarrollado en base a varios
criterios, algunos de ellos bastante subjetivos.
Idealmente, los patrones descubiertos deben tener tres cualidades: ser precisos,
comprensibles (es decir, inteligibles) e interesantes (tiles y novedosos). Segn las
aplicaciones puede ser conveniente mejorar algn criterio y sacrificar ligeramente otro
(Hernndez et al., 2004, p.35).
Para entrenar y probar un modelo, se parten los datos en dos conjuntos: el conjunto de
entrenamiento (training set) y el conjunto de prueba o de test (test set). Esta separacin es
necesaria para garantizar que la validacin de la precisin del modelo es una medida
independiente. Si no se usan conjuntos diferentes de validacin y prueba, la precisin del
modelo ser sobreestimada, es decir tendremos estimaciones muy optimistas.
En los modelos predictivos el uso de esta separacin entre entrenamiento y prueba es fcil
de interpretar. Por ejemplo, para una tarea de prediccin, despus de generar el modelo con
el conjunto de entrenamiento, ste se puede usar para predecir los valores de los datos de
prueba (test). Entonces la razn de precisin, (o simplemente precisin), se obtiene
dividiendo el nmero de predicciones correctas por el nmero total de instancias de prueba.
La precisin es una buena estimacin de cmo se comportar el modelo para datos futuros
similares a los del test.
38
El mtodo que se usa normalmente es la validacin cruzada con n pliegues (n-fold cross
validation). En este mtodo los datos se dividen aleatoriamente en n grupos. Un grupo se
reserva para el conjunto de prueba y con los otros n-1 restantes (juntando todos sus datos)
se construye un modelo y se usa para predecir el resultado de los datos del grupo
reservado. Este proceso se repite n veces, dejando cada vez un grupo diferente para la
prueba. Esto significa que se calculan n ratios de error independientemente. Finalmente, se
construye un modelo con todos los datos y se obtiene sus ratios de error y precisin
promediando los n ratios de error disponibles.
Cuando se dispone de pocos datos, otra tcnica para estimar el error es la conocida como
bootstrapping. Esta consiste en construir primero un modelo con todos los datos iniciales.
Entonces, se crean numerosos conjuntos de datos, llamados bootstrap samples, haciendo
un muestreo de los datos originales con reemplazo, es decir, se van seleccionando
instancias del conjunto inicial, pudiendo seleccionar la misma instancia varias veces.
Ntese que los conjuntos construidos de sta forma pueden contener datos repetidos. A
continuacin se construye un modelo con cada conjunto y se calcula su ratio de error sobre
el conjunto de test (que son los datos sobrantes de cada muestreo). El error final estimado
para el modelo construido con todos los datos se calcula promediando los errores obtenidos
para cada muestra (Hernndez et al., 2004, p.37).
2.4.8
Una vez construido y validado el modelo puede usarse principalmente con dos finalidades:
para que un analista recomiende acciones basndose en el modelo y en sus resultados, o
bien para aplicar el modelo a diferentes conjuntos de datos. Tambin puede incorporarse a
otras aplicaciones operacionales de la empresa.
Tambin es importante medir lo bien que el modelo evoluciona. Aun cuando el modelo
funcione bien debemos continuamente comprobar las presentaciones del mismo. Esto se
39
debe principalmente a que los patrones pueden cambiar. Por ejemplo todos los vendedores
saben que las ventas se ven afectadas por factores externos, como la tasa de inflacin, la
cual altera el comportamiento de compra de la gente. Por lo tanto, el modelo deber ser
monitorizado, lo que significa que de tiempo en tiempo el modelo tendr que ser reevaluado, re-entrenado y posiblemente reconstruido completamente (Hernndez et al.,
2004, p.39).
40
Captulo 3:
3.1
3.1.1
Definicin
Es imperativo que las empresas tengan enfoques eficaces de pronsticos y que el mismo
pronstico forme parte integral de la planeacin empresarial. Cuando los gerentes planean,
determinan los cursos de accin que tomarn en el futuro. Por lo tanto, el primer paso en la
planeacin es el pronstico, es decir, estimar la demanda futura de productos y servicios y
los recursos necesarios para producirlos. Las estimaciones de la demanda para productos y
servicios por lo general se conocen como pronsticos de ventas, que en la administracin
de la produccin y de las operaciones constituye el punto de partida de todos los dems
pronsticos (Gaither y Frazier, 1999) citado por (Garca et al., 2009, p.26).
Gaither y Frazier, de manera ilustrativa en la figura 3.1, muestran como los pronsticos
forman parte integral de la planeacin de los negocios. Los insumos se procesan a travs de
modelos o mtodos de pronsticos para el desarrollo de las estimaciones de la demanda,
estas estimaciones de la demanda no son los pronsticos de ventas, stos son el punto de
partida para que los equipos administrativos desarrollen los pronsticos de ventas. Los
pronsticos de ventas se convierten en los insumos tanto para la estrategia empresarial
como para los pronsticos de los recursos de la produccin.
41
3.1.2
Taxonoma
Adems del pronstico de ventas, existen otras estimaciones que se realizan dentro del
proceso de planeacin empresarial como:
42
Estimacin del Potencial de Ventas (Oferta).- Mxima cantidad de producto que nuestra
compaa es capaz de producir y vender en un perodo de tiempo determinado.
43
3.2
3.2.1
Aplicaciones en Mercadotecnia
3.2.2
Aplicaciones en Produccin
3.2.3
Aplicaciones en Finanzas
Tasas de inters
Cuentas de pagos lentos
3.2.4
Nmero de trabajadores
Rotacin de personal
Tendencias de ausentismo
Tendencia de llegadas tarde
3.2.5
Factores econmicos
Cambios de precios
Costos
Crecimiento de lneas de productos
En suma se puede decir que los pronsticos son un recurso primordial y actan como
insumo para la toma de decisiones a distinto nivel dentro de la organizacin. En la figura
3.3, se ilustra la aplicacin al ms alto nivel de los pronsticos, que juntamente con los
objetivos conforman los insumos de informacin necesarios para tomar las decisiones, las
cuales generarn acciones que tendrn como consecuencia algn resultado.
45
Figura 3.3: Los pronsticos como insumo para la toma de decisiones (Velsquez,
Dyner y Souza, 2006)
3.3
Es as que, (Chase, Aquilano y Jacobs, 2001) citado por (Garca et al., 2009, p.48), hacen
una clasificacin de los mtodos de pronstico en base a lo que consideran importante de
analizar, agrupndolos como: cualitativos, de anlisis de series de tiempo, causales y
modelos de simulacin.
A continuacin describiremos cada uno de los mtodos y modelos que se utilizan para
realizar el pronstico de ventas.
3.3.1
Mtodos Cualitativos
Consiste en pronosticar las ventas con las estimaciones de la fuerza de venta (vendedores,
distribuidores, jefes de ventas, etc.). Los vendedores estiman las ventas esperadas en sus
territorios para un determinado perodo. La sumatoria de los estimados individuales
conforma el pronstico de la Empresa o de la Divisin. Este mtodo puede generar
pronsticos muy precisos si los vendedores son personas competentes ya que el vnculo
directo con el mercado los hace personas claves y aptas para hacer dicho pronstico. El
inconveniente es la tendencia de los vendedores a hacer estimativos muy conservadores,
adems del problema de que por lo general la fuerza de ventas no domina las herramientas
estadsticas, mtodos, etc.
Argumentos expuestos por (Chase, 2001) citado por (Garca et al., 2009, p.57) sugieren
que, la composicin de la fuerza de venta es el mtodo que asume, que es mejor elaborar
un pronstico desde los niveles ms bajos de la organizacin hasta llegar a los ms altos,
ya que los niveles bajos son los que tienen mayor contacto con los clientes. Por lo tanto,
estas personas son las que tienen que elaborar el pronstico y mandarlo a los niveles
superiores, hasta llegar a los ejecutivos.
Mtodo Delphi
47
Se usa para pronsticos a largo plazo, adems de pronsticos de ventas, para de productos
nuevos y pronsticos tecnolgicos.
El tiempo estimado para hacer un pronstico es ms de dos meses, con una exactitud de
regular a muy buena.
Investigacin de mercados
Se usa para evaluar y probar hiptesis acerca de mercados reales. Su tiempo de ejecucin
es de ms de tres meses. Su exactitud, puede ser excelente, dependiendo del cuidado que se
haya puesto en el trabajo y en la profundidad del mismo.
Consenso de un Panel
48
Tiene los mismos usos que el Mtodo Delphi, con un tiempo estimado para efectuar el
pronstico de ms de dos semanas y una exactitud de baja a regular.
Pronsticos Individuales/Visionarios
Analoga histrica
3.3.2
Se utilizan los datos histricos de ventas de la empresa para descubrir tendencias de tipo
estacional, cclico y aleatorio o errtico. Es un mtodo efectivo para productos de demanda
razonablemente estable. Por medio de los promedios mviles determinamos primero si hay
presente un factor estacional. Con un sistema de regresin lineal simple se determina la
lnea de tendencia de los datos para establecer si hay presente un factor cclico. El factor
aleatorio estar presente si se puede atribuir un comportamiento errtico a las ventas
debido a acontecimientos aleatorios no recurrentes (Toro, Meja y Salazar, 2004, p.26).
Para el anlisis de series de tiempo es importante considerar los diferentes patrones que
una serie puede seguir. Existen cuatro patrones bsicos que son: Horizontal (Estacionario),
Tendencia, Estacional y Cclico
49
Efecto estacional.- Existe cuando una serie tiene fluctuaciones peridicas debidas
a factores fsicos, econmicos o de mercadotecnia.
A continuacin mostraremos grficamente cada uno de los patones que una serie de tiempo
puede adoptar:
Ventas
Ventas
Tiempo
Tiempo
(Elaboracin propia)
(Elaboracin propia)
50
Ventas
Ventas
Tiempo
Tiempo
(Elaboracin propia)
(Elaboracin propia)
Una serie de tiempo real puede estar compuesta por uno o ms de estos patrones. Adems
siempre existen fluctuaciones con cierto grado de aleatoriedad.
Promedios mviles
51
Este tipo de tcnicas se usa para pronsticos a corto plazo, muy frecuentemente en control
de inventarios cuando el nmero de artculos que maneja la empresa es muy grande.
La frmula general usada para pronsticos mediante el mtodo de promedios mviles es:
Pt
(Xt
Xt
.......... ........
Xt
N 1
)/N
Donde:
Pt
Xt
Cuando una serie de datos muestra tendencia, existen modificaciones a este mtodo para
considerar la tendencia. El mtodo se conoce como mtodo de promedios mviles lineales
o cuadrticos.
Suavizacin exponencial
El pronstico se basa en una suma ponderada de las observaciones pasadas. Los valores
dependen de los llamados parmetros de atenuacin. Una vez que se han elegido tales
parmetros, es fcil calcular los pronsticos, el mtodo se puede adaptar fcilmente para
considerar los factores estacinales y tendencias (Makridakis y Wheelwright, 1992) citado
por (Garca et al., 2009, p.51).
La tcnica es similar a la de los promedios mviles excepto que a los datos ms recientes
se les da mayor ponderacin. En este mtodo el pronstico nuevo es igual al pronstico del
perodo anterior ms una correlacin proporcional al ltimo error observado.
La frmula general es:
Pt
Pt
Donde
Xt
Pt
(1
) Pt
(Xt
Pt )
Anlisis de regresin
Los observaciones pasadas se describen como una funcin del tiempo, y luego, el patrn
identificado se utiliza para pronosticar el futuro, las funciones tpicas son la recta, la lnea
exponencial y la curva en forma de s. en el software se computacin se encuentran algunas
curvas alternativas. A menudo este mtodo se emplea en pronsticos a largo plazo
(Makridakis y Wheelwright, 1992) citado por (Garca et al., 2009, p.51).
Donde
(i
Box Jenkins
(Molinero, 2004, p.6) describe los pasos para construir este tipo de modelos. El primer
paso consiste en convertir nuestra serie de observaciones en una serie estacionaria, que es
aquella en la que ni la media, ni la varianza, ni las auto correlaciones dependen del tiempo.
Una vez "estabilizada" la serie mediante las transformaciones adecuadas, se procede a
estudiar la presencia de regularidades en la serie, para identificar un posible modelo
matemtico. Para ello se calculan la funcin de auto correlacin simple y parcial, y se
compara su forma con un catlogo de patrones grficos, que son tpicos de los diferentes
53
Una vez elegida la forma del modelo, se estiman los coeficientes del mismo, y finalmente
se procede a efectuar un anlisis de los residuos (diferencia entre el valor realmente
observado y el valor previsto por el modelo), con el fin de comprobar si el ajuste del
modelo a nuestros datos es adecuado. Si no lo fuera repetimos el proceso buscando otros
modelos.
En el modelo, cada valor tomado por la variable en un instante dado, est influenciado por
los valores de la variable en momentos anteriores, y se expresa como una relacin lineal,
funcin de:
Que es la frmula general de los modelos denominados ARMA. Est constituido por una
combinacin de p trminos AR (proceso autorregresivo), y q trminos MA (proceso de
medias mviles). La parte AR modela la influencia de los valores anteriores de la serie
( Xt
54
serie ( Z t
3.3.3
Los modelos de pronstico causales parten del supuesto de que el grado de influencia de
las variables que afectan al comportamiento del mercado permanece estable, para luego
construir un modelo que relacione ese comportamiento con las variables que se estima que
son las causantes de los cambios que se observan en el mercado (Dervitsiotis, 1981).
Estos tienen una estructura similar a la de los modelos de un sola ecuacin ya descritos,
pero con ms de una variable dependiente, en seguida pronostican la variables
dependientes (o endgenas) mediante suposiciones acerca de los valores futuros de las
55
variables exgenos (Makridakis y Wheelwright, 1992) citado por (Garca et al., 2009,
p.52).
Modelos de simulacin
Como en los modelos de sistemas simultneos, los modelos de simulacin tienen que ver
con un gran nmero de variables y sus interrelaciones con los factores exgenos, los
modeladores de simulacin hacen nfasis en la estructura del modelo (en lugar de las
estructuras lineales de los modelos de sistemas de regresin y simultneos). En general,
incluyen muchos ms detalles del sistema modelado, por ejemplo, flujos de informacin.
La identificacin del modelo es mucho ms adecuada que los rigurosos modelos
estadsticos mencionados al principio (Makridakis y Wheelwright, 1992) citado por
(Garca et al., 2009, p.52).
Modelos de entrada-salida
Los modelos de entrada salida se fundan en la idea de que para obtener una produccin
dada de productos o servicios, se requiere de un conjunto fijo de insumos. Una vez que se
han efectuado los pronsticos de la demanda del consumidor, las tcnicas de entrada salida
permitirn calcular la cantidad necesaria de un producto en particular para mantener tal
nivel de la demanda (Blin).
56
3.3.4
Nuevos Mtodos
Debido a la importancia cada vez mayor de pronsticos eficientes las tcnicas para
conseguir una precisin adecuada son continuamente objeto de estudio y desarrollo. Pues
cuanto ms complejo sea el entorno del negocio, mayor ser la demanda de un mtodo que
puede calcular las tendencias y la estacionalidad que puedan suceder.
Las redes neuronales son un mtodo relativamente nuevo para el pronstico de ventas.
stas trabajan de forma similar al cerebro humano y a su vez es por lo tanto capaz de
aprender por s misma con los nuevos datos que son presentados. El modelo trabaja como
una herramienta de transformacin, donde se colocan los datos y el sistema los transforma
en un conjunto de datos no lineales para finalmente volverlos a convertir en lineales con la
finalidad de que la salida del sistema pueda ser entendible (Amstrong, 2003). Una
conocida desventaja de las redes neuronales es que los modelos creados son difciles de
comprender cmo es que realmente trabajan. Las relaciones entre las diferentes variables
en el modelo son muy difciles de entender y el modelo es por lo tanto visto como una
caja negra para solucionar el problema de pronsticos. Las ventajas de una red neuronal
es que se adapta fcilmente a irregularidades y que es enteramente automtica (Makridakis,
Wheelwright y Hyndman 1998).
Sistemas Expertos
Son sistemas altamente estructurados basados en cmo expertos del rea podran
pronosticar el futuro. stos sistemas se basan en entrevistas, libros y encuestas hechas por
expertos y son por tanto ms caros y consumen mucho tiempo (Amstrong, 2003).
3.4
En la actualidad existe una gran variedad de aplicativos software para realizar pronsticos
de ventas, unos ms sofisticados que otros, muchos de tipo comercial as como algunos de
libre uso y distribucin.
57
La mayora de los aplicativos forman junto con otros, los llamados paquetes de cmputo,
de los cuales existen dos tipos que son de especial inters para los pronosticadores:
3.4.1
Minitab
Desarrollado por Minitab Inc (Minitab Inc Minitab, 2012), es un paquete estadstico
diseado para ejecutar funciones estadsticas bsicas y avanzadas, el cual presenta las
siguientes capacidades:
58
IBM SPSS
Desarrollado por IBM (IBM SPSS, 2012), es un paquete estadstico para el anlisis
predictivo, el cual ofrece modelos de prediccin y una amplia gama de funcionalidades que
permiten acceder y gestionar fcilmente grandes cantidades de datos, seleccionar los
mismos, llevar acabo el anlisis oportuno y presentar los resultados a la organizacin.
Est compuesto por un conjunto de mdulos, dentro de los cuales encontramos al mdulo
base y los mdulos anexos que se han ido actualizando con nuevos procedimientos
estadsticos, algunos mdulos incluidos son:
Modelos de regresin
Modelos avanzados: Reduccin de datos, clasificacin, pruebas no paramtricas.
Anlisis conjunto
Pruebas exactas
Anlisis de valores perdidos
Muestras complejas
SamplePower
rboles de clasificacin
Validacin de datos
59
SAS Analytics
Desarrollado por SAS Institute Inc (SAS Institute Inc SAS, 2012), es un software que
proporciona un entorno integrado para el modelado predictivo y descriptico, la minera de
datos, el anlisis de texto, previsin, optimizacin, simulacin, diseo experimental y ms.
Desde la visualizacin dinmica de modelado predictivo, la implementacin del modelo y
la optimizacin de procesos, SAS ofrece una amplia gama de tcnicas y procesos para la
recoleccin, clasificacin, anlisis e interpretacin de datos para revelar patrones,
anomalas, variables y relaciones.
60
3.4.2
Paquetes de pronstico
Forecast Management
Desarrollado por Demand Solutions (Demand Solutions Forecast Management, 2012) es
un software orientado a la gestin de la cadena de suministro basado en la planeacin de la
demanda e inventario.
Para realizar los pronsticos de venta y planeacin del inventario clasifica los segmentos
del negocio mediante el anlisis ABC, para identificar la informacin ms relevante y
eliminar aquella que no brinda beneficios al sistema de pronsticos.
Brinda una interfaz para integracin con sistemas de terceros permitiendo la comunicacin
desde y hacia su software.
Forecast Server
Desarrollado por Vanguard Software Corporation (Vanguard Software Corporation
Forecast Server, 2012), es un software que crea pronsticos dentro del proceso de
61
Permite integracin con sistemas de terceros, anlisis de datos en tiempo real, visualizacin
de datos e informes flexibles.
Cuenta con variados mtodos estadsticos los cuales operan apoyados por mltiples
factores dentro de los cuales encontramos: tendencias de crecimiento, estacionalidad,
efectos del ciclo de vida del producto, modelos de adopcin, nuevo producto de
aceleracin, transicin de productos y canibalizacin, promociones y eventos, entre otros.
Lokad
Desarrollado por LOKAD SAS (Lokad Software de Pronstico de Ventas, 2012), es un
software de anlisis de datos para los sectores minorista, mayorista y de eCommerce.
Mejora la exactitud de los resultados, detectando similitudes entre los productos o las
series mediante etiquetas". Incluso aprovecha todos los datos con los que cuenta para cada
cliente particular, combinando la Web 2.0 y la computacin cientfica.
Utilizas una
gran
variedad
de
sistemas
estadsticos.
62
Adems
monitorea
Forecast Pro
Desarrollado por Business Forecast Systems (Business Forecast Systems - Forecast Pro,
2012), es un software de pronsticos el cual utiliza una amplia variedad de mtodos
estadsticos, los cuales capturan patrones en la historia de los datos, tales como: niveles de
venta, tendencia, estacionalidad, impacto de promociones y la relacin con variables
explicatorias.
Cuenta con un sistema experto integrado, para ayudar al usuario a seleccionar el mtodo
estadstico que mejor se ajuste a los datos del negocio.
Los resultados obtenidos pueden ser almacenados en Excel, archivos de texto o en base de
datos, adems de brindar reportes personalizables.
GMDH Sell
Desarrollado por Geos Research Group (Geos Research Group - GMDH Sell, 2012), es un
software para pronstico multipropsito diseado para todo tipo de negocios y pronsticos
de ventas.
El ncleo del software es un algoritmo matemtico el cual, una vez cargado toda la
informacin histrica de ventas, comienza a construir una serie de modelos matemticos y
los aplica a los datos introducidos. Si los errores obtenidos de las pruebas son grandes,
entonces los modelos son mejorados mediante varios medios (incluyendo redes neuronales,
bsqueda combinatoria y otros mtodos).
Brinda una serie de plantillas personalizables, y una amplia gama de parmetros ajustables
logrando que se pueda afinar para casi cualquier negocio.
63
Prophecy
Desarrollado por Data Perceptions (Data Perceptions Prophecy, 2012), es una solucin
construida y probada para realizar pronstico de ventas, la cual entre otras caractersticas:
brinda al usuario la posibilidad de elegir las variables de la base de datos a utilizar, permite
incluir presupuestos o previsiones con datos reales, presenta un conjunto de frmulas
totalmente flexible, etc.
Cuenta con Prophecy Advisor, un agente integrado que analiza las previsiones mientras se
est pronosticando, el cual informa sobre las posibles desviaciones encontradas con
respecto a la historia anterior, los pronsticos estadsticos y las recientes tasas de
ejecucin. Tambin elabora un informe resumido sobre el pronstico actual.
Presenta una vista de versiones, en donde se almacenan todos los pronsticos creados a lo
largo del tiempo.
SmartForecasts
Desarrollado por Smart Software (Smart Software SmartForecasts, 2012), es un software
diseado para generar pronsticos variados (ventas, demanda de productos, stock de
seguridad, niveles de inventario), basado en su amplio y automatizado juego de mtodos
estadsticos.
64
Permite la integracin con sistemas ERP y SCM, al igual que con motores de base de datos
tales como Oracle, SQL Server, y DB2 de IBM.
65
Captulo 4:
IMPLEMENTACIN Y RESULTADOS
4.1
4.1.1
Aporte Terico
Mtodos Cualitativos
Composicin de fuerza de ventas
Mtodo Delphi
Investigacin de mercados
Consenso de un Panel
66
Pronsticos Individuales/Visionarios
Analoga histrica
Nuevos Mtodos
Redes Neuronales Artificiales
Sistemas Expertos
67
utilizarn ms datos, los datos por lo general son ms difciles de obtener, y los
modelos tienen un diseo ms costoso, son ms caros ponerlos en prctica y
operarlos.
Cada uno de los mtodos para el pronstico tienen sus ventajas y desventajas, bondades,
beneficios. Al respecto (Makridakis y Wheelwright, 1992) citado por (Garca et al., 2009,
68
Ventajas
Barato si se quiere que as sea; flexible, puede pronosticar cualquier cosa;
cualquiera lo puede hacer
Desventajas
Precisin dudosa (Amstrong); aunque quiz pueda mejorarse la calidad de los
criterios mediante la evaluacin de la precisin del pronosticador, la habilidad de
un atributo de la persona, no de la organizacin; se encuentra sujeto a todos los
problemas del criterio humano (Hogarth y Makridakis proporcionan un estudio)
Ventajas
Relaciona diferentes perspectivas al problema, adems de las ventajas mencionadas
antes
Desventajas
Puede dominar una voz fuerte, que no necesariamente corresponda a la del mejor
pronosticador; Quin quiere contradecir al jefe en una organizacin jerrquica?
Presenta las desventajas del criterio humano? Es ms caro que el individual. No
brinda respuesta a las interrogantes Cmo selecciona usted un comit? y
Cmo organiza una junta? una encuesta puede decir ms acerca de las actitudes
actuales de la gente y de sus expectativas que las actividades futuras.
69
Delphi
Ventajas
Igual que en el caso anterior, pero intenta a travs del anonimato, eliminar los
efectos de la autoridad y la dominacin del grupo.
Desventajas
Complicado, existe presin por lograr el consenso a medida que transcurren las
sesiones, no necesariamente existe convergencia hacia un pronstico acordado, no
constituye necesariamente el mejoramiento del mtodo ms directo del comit.
Ventajas
Es fcil de aprender de usar y de comprender
Desventajas
Es demasiado fcil y por tanto, propicia el descuido; especialmente a largo plazo,
Por qu una curva dependiente slo del tiempo debera brindar una descripcin
adecuada del futuro distante?
Ventajas
Crebles por intuicin
Desventajas
No tienen una explicacin estadstica; no son ideales para los pronsticos, tienen
los mismos problemas que las curvas de tendencia. Se utilizan como mtodos de
identificacin de los factores. Tendencia, estacinales y cclicos.
Atenuacin exponencial
Ventajas
Fcil de aplicar con computadora para un gran nmero de productos. Muy barato de
operar, fcil de establecer sistemas de control. De fcil comprensin
70
Desventajas
Sin base terica, pierde los puntos crticos, impreciso.
Ventajas
La seleccin de valores es amplia, lo que permite al usuario identificar en los datos
muchos ms patrones sutiles que con los mtodos previos, ms que una tcnica, el
enfoque de Box-Jenkins proporciona una filosofa acerca del modelado basada en el
principio de la parsimonia: cuanto ms simple es el modelo tanto mejor, siempre y
cuando satisfaga un nmero adecuado de verificaciones de diagnstico.
Ventajas
Es posible desarrollar modelos que sean suficientemente confiables. Estos son
ideales ya que contestan a la pregunta Cmo influyen la compaa en la ventas?.
Estos son modelos de control, as como modelos de pronsticos
Desventajas
Los modelos son difciles de desarrollar, requieren personal como experiencia y
gran cantidad de datos que a menudo la organizacin no se ocupa de recolectar.
Subsiste el problema de pronosticar los factores exgenos.
Ventajas
Muchos sistemas no se ajustan naturalmente al formato del modelo de una sola
ecuacin. En la poltica macroeconmica, el desempeo, la produccin y la
inflacin son todos interdependientes. En la empresa, a menudo se sostiene que las
ventas y la publicidad se determinan en conjunto, los modelos de sistemas
simultneos captan estas interrelaciones
Desventajas
71
Modelos de simulacin
Ventajas
Se aplican adecuadamente, tales modelos pueden ofrecer al encargado de la toma
de decisiones una ayuda substancial; se les puede disear de tal modo que sean de
uso sencillo y fcil entendimiento; pueden tambin resolver el problema preciso
Desventajas
Caros; con frecuencia requieren de gran cantidad de datos; no hay una explicacin
clara acerca de su construccin; requiere una validacin cuidadosa
Modelos de entrada-salida
Ventajas
A diferencia de muchas de las tcnicas descritas, el mtodo de entrada-salida es
ideal para pronosticar productos industriales
Desventajas
Pocas veces las tablas gubernamentales de entrada-salida contienen suficiente
detalles para una compaa interesada en clases especficas de productos; tambin
tienden a ser obsoletas por varios aos; no se sabe que tan importante es la
suposicin de proporcionalidad entre la entrada (insumo) y la salida (produccin).
Es costoso preparar una tabla de entrada-salida especfica para un producto. Los
pronsticos dependen de la exactitud de los pronsticos iniciales acerca de la
demanda del consumidor.
Ventajas
Es capaz de tratar eventos importantes que pueden ocasionar gran impacto. Pueden
tratar tanto con eventos cuantitativos como cualitativos
72
Desventajas
Por la general, las probabilidades tienen que estimarse mediante los diversos
mtodos a criterio mencionados. Esto puede influir en la importancia que se d a
los diferentes escenarios. Tambin es crucial la eleccin de cuales eventos incluir.
Qu tan acertados somos para saber qu eventos podran afectar de manera
importante a la organizacin? Por ltimo existe alguna evidencia de que el
impacto cruzado tenga algn valor de prediccin?
Adems podemos mencionar algunas de las ventajas y desventajas de los llamados nuevos
mtodos para pronsticos de venta, las redes neuronales y los sistemas expertos.
Ventajas
Se adapta a situaciones en las que los datos son altamente irregulares e incluso
desconocidos. Son capaces de aprender automticamente a partir de los ejemplos
presentados. Requiere intervencin mnima del usuario gracias a que son autoorganizadas. Brinda resultados con un alto grado de precisin y confiabilidad, y son
capaces de pronosticar eventos a largo plazo igual de efectivos.
Desventajas
Los modelos creados son incomprensibles, lo cual impide analizar el
comportamiento que tienen las variables dentro del mismo y por lo tanto se
desconoce cmo se lleg a la solucin. Se requiere una correcta determinacin y
ajuste de los parmetros de la red para lograr construir un modelo adecuado.
Sistemas Expertos
Ventajas
Emplean el conocimiento obtenido de diversos expertos en el rea para la solucin
del problema. Si son adecuadamente construidos pueden pronosticar resultados con
un alto grado de precisin.
Desventajas
73
Una vez revisado el anlisis realizado por (Makridakis y Wheelwright, 1992), y haber
mencionado las ventajas y desventajas de los mtodos de pronstico tanto clsicos como
nuevos, se realizar la evaluacin comparativa de los mtodos y modelos para el
pronstico de ventas, tomando como base los criterios de comparacin descritos
anteriormente y centrndonos en la resolucin del problema, la cual busca implementar un
modelo para pronstico de ventas en pymes del sector comercial peruano.
En primer lugar se asigna a cada uno de los criterios de evaluacin, el peso correspondiente
en base a los requerimientos del problema, como se muestra en la tabla 4.1.
Costo
20%
Peso
Lapso de Sensibilidad
Tiempo Adaptabilidad
10%
5%
Precisin Dificultad
50%
15%
As mismo, en la tabla 4.2 se indica los valores de las notas (cuadro amarillo) y el valor de
los pesos (cuadro gris) correspondientes a cada uno de los criterios de evaluacin,
considerando que la mxima nota a obtener es 20 y la mnima 0.
Nota
Alto
Medio
Bajo
Costo
0
10
20
0
2
4
Precisin
Dificultad
20
10
0
0
10
20
10
5
0
0
1.5
3
Lapso de
Tiempo
0
0
10
1
20
2
Sensibilidad
Adaptabilidad
20
1
10
0.5
0
0
Finalmente, una vez mencionadas las ventajas y desventajas de los mtodos de pronstico,
y luego de haber establecido los pesos y las notas para cada criterio de evaluacin. Se
74
procede a elaborar el cuadro comparativo para los mtodos y modelos, obteniendo la nota
final correspondiente a cada uno de ellos, como se muestra en la tabla 4.3:
Mtodo/Modelo
Costo
Criterio de Evaluacin
Lapso de
Precisin Dificultad
tiempo
Sensibilidad
Adaptabilidad
Nota
Composicin de fuerza
de ventas
alto
medio
bajo
bajo
bajo
10
Mtodo Delphi
alto
medio
medio
alto
medio
alto
medio
bajo
alto
bajo
Consenso de un Panel
alto
bajo
medio
medio
bajo
2.5
Pronsticos
Individuales/Visionarios
bajo
bajo
alto
bajo
bajo
Analoga histrica
bajo
bajo
bajo
bajo
bajo
Promedios mviles
bajo
medio
medio
bajo
bajo
12.5
Suavizacin
exponencial
bajo
medio
medio
bajo
bajo
12.5
Anlisis de regresin
bajo
medio
bajo
bajo
bajo
14
bajo
alto
alto
medio
medio
15.5
bajo
medio
alto
medio
medio
10.5
alto
alto
alto
alto
medio
10.5
alto
alto
medio
medio
medio
13
alto
medio
alto
alto
bajo
alto
alto
alto
alto
medio
10.5
bajo
alto
medio
bajo
alto
18.5
alto
alto
alto
alto
medio
10.5
Investigacin
mercados
de
Modelos de regresin
de una sola ecuacin
Modelos de sistemas
simultneos
Modelos de simulacin
Modelos de entradasalida
Anlisis del impacto
cruzado
Redes
Neuronales
Artificiales
Sistemas Expertos
75
Para la solucin del problema planteado se opta por seleccionar como herramienta
tecnolgica a las Redes Neuronales Artificiales por las siguientes razones:
76
4.1.2
En ste apartado se proceder a adaptar la Red Neuronal Artificial para que opere como un
modelo de pronstico de ventas y as dar solucin al problema planteado.
Diseo de la Solucin
Antes de precisar todos los componentes que se utilizarn para la construccin del modelo.
Es preciso mencionar los fundamentos sobre los cuales se efectuar la construccin de la
red, as como las restricciones a las que ser sometida.
Para la construccin del modelo se partir de la premisa de que el valor de las ventas en un
periodo de tiempo determinado, puede ser estimado a partir de los niveles de venta
anteriores a dicho periodo, es decir a partir del comportamiento histrico de dicha variable
en el tiempo. Esto sugiere que el problema ser tratado como una serie temporal, y por
ende presentar los factores que rigen el comportamiento de las series temporales, los
cuales especficamente para el problema de prediccin de ventas sern la tendencia y la
estacionalidad.
77
Para describir el factor tendencia de la serie, se puede considerar los niveles de venta
histricos para un nmero determinado de perodos y analizarlos en busca de patrones de
tendencia presentes en la serie. As mismo para describir el factor estacionalidad, se puede
considerar el nivel de ventas del periodo de tiempo a estimar obtenidas el ao anterior. En
suma toda la informacin que se necesita para describir adecuadamente los factores que
afectan el comportamiento de la serie de ventas, puede ser obtenida de la misma serie.
Por otro lado, por tratarse de un problema de serie temporal, es lgico que una variable
ms a considerar sea el tiempo, por esta razn el periodo de tiempo para el cual se quiere
hacer el pronstico tambin servir como informacin para el modelo. Ante esto, se sigue
conservando la ventaja de poder pronosticar el ndice de ventas a partir de la informacin
contenida en la propia serie de ventas.
El periodo de tiempo para el cual y a partir de los cuales se realizarn las predicciones es
mensual. Esto es debido a diversas razones: es muy comn en las empresas realizar
pronsticos mensuales, los datos histricos son almacenados en base a dicho periodo, los
pronsticos a partir de dicho periodo de tiempo son ms representativos, por comodidad.
Conjunto de Entradas
78
12
vp
vt
12
vt
11
vt
10
vt
vt
vt
vt
vt
vt
vt
vt
vt
12
[0,1]
As por ejemplo para el mes Mayo, los valores de las entradas del modelo sern:
m1
0 , m2
1 , m3
0 , m4
79
12
; v p ; mb )
a partir de las cuales se predecir el nivel de ventas ( yt ) para un periodo de tiempo (mes)
yt
F[vt 3 , vt 2 , vt 1, vt
12
, v p , m1, m2 , m3 , m4 ]
Donde F es una funcin vectorial no lineal de mapeo entre entradas y salidas del modelo.
Topologa de la Red
80
A continuacin se describe cada uno de los elementos que forman parte de la Red
Neuronal Artificial Perceptrn Multicapa que se va a disear.
vt
vt
vt
vt
12
vp
m1
m2
m3
m4
vt
xi
oj
yt
w LI
: Peso para la coneccin entre la j sima n. oculta y la i sima n. entrada.
ji
wtjLD : Peso para la coneccin entre la neurona
de salida y la j sima n. oculta.
81
bj
bt
vt
xi
oj
yt
w LI
: Peso para la coneccin entre la j sima n. oculta y la i sima n. entrada.
ji
wtjLD : Peso para la coneccin entre la neurona de salida y la j sima n. oculta.
bj
bt
n
e
: Tasa de Aprendizaje .
: Tasa de Error esperado
Funcin de Propagacin
w LI
ji xi
uj
bj
i 0
wtjLD o j
ut
bt
j 0
Funcin de Activacin
1
u
1 e j
f (ut ) : funcin de activacin para la neurona de salida.
f (ut )
1
1 e
ut
Funcin de Salida
82
f (u j )
f (ut )
Regla de Aprendizaje
regla de aprendizaje.
dt
(Vt
yt ) f / (ut )
wtjLD (nuevo)
dj
wtjLD (anterior) n * d t * o j
d t wtjLD ) f / (u j )
w LI
ji ( nuevo)
w LI
n * d j * xi
ji ( anterior)
Condicin de parada
Para la condicin de parada del proceso de entrenamiento, se considera dos factores: que el
error cuadrtico medio alcance la tasa de error esperada o que se alcance el nmero
mximo de iteraciones del proceso de entrenamiento, como sigue:
condicin de parada.
error cuadrtico medio : ECM
0.5 ( vt
yt ) 2
[10000 iteraciones ]
Algoritmo de Entrenamiento
83
w LI
ji xi
uj
bj
i 0
f (u j )
1
1 e
uj
oj
f (u j )
wtjLD o j
ut
bt
j 0
f (ut )
1
1 e
ut
yt
f (ut )
dt
(Vt
yt ) f / (ut )
wtjLD (nuevo)
bt (nuevo)
y bias bt
wtjLD (anterior) n * d t * o j
bt (anterior)
n * dt
84
w LI
ji
y bias b j
dj
d t wtjLD ) f / (u j )
w LI
ji ( nuevo)
w LD
n * d j * xi
ji ( anterior)
b j (nuevo)
b j (anterior)
n*d j
Fin de poca
Fin de algoritmo
4.2
4.2.1
Aporte Prctico
Introduccin
Es as que entre las principales caractersticas del sistema sern: funciones de conectividad
a bases de datos; brindar al usuario la posibilidad de explorar las tablas correspondientes y
seleccionar los patrones de entrada (Fecha) y salida (Volumen de Venta) histricos;
construir el modelo de prediccin (Modelo basado en Red Neuronal Artificial) a partir de
los patrones seleccionados, lo cual incluye los procesos de entrenamiento y validacin del
modelo; gestionar los modelos de prediccin construidos, dando la posibilidad al usuario
de seleccionar el modelo que presente el mayor rendimiento y confiabilidad; finalmente el
sistema debe implementar el proceso de pronstico de ventas propiamente dicho a partir
del(los) modelo(s) de prediccin previamente construido(s), mostrando grfica y
textualmente el volumen de ventas pronosticado para la fecha o periodo indicado por el
usuario, brindando a su vez la posibilidad de gestionar toda la informacin relacionada con
los pronstico elaborados.
Cabe mencionar que el sistema manejar los pronsticos como proyectos independientes,
dentro de los cuales encontraremos a los modelos para pronsticos y los procesos tanto de
creacin de modelos y de pronstico de ventas necesarios para su correcto funcionamiento.
85
As mismo los modelos para pronstico estarn basados en redes neuronales artificiales tal
como se describi en apartados anteriores.
4.2.2
OBJ - 01
Versin
Descripcin
Gestionar Pronsticos
1.0 (04/10/2012)
El sistema deber gestionar la informacin
correspondiente a los pronsticos de venta creados:
creacin de pronsticos, actualizacin de datos y
eliminacin de pronsticos.
Importancia Importante
A corto plazo
Urgencia
Alta
Estabilidad
Comentarios Los pronsticos de venta sern creados como
proyectos que, entre otra informacin, contendrn a
los modelos para pronstico construidos, as como a
los procesos de entrenamiento, validacin y
funcionamiento.
Tabla 4.4: Tabla de especificacin de objetivos: Gestionar Pronsticos (Elaboracin
propia)
OBJ - 02
Versin
Descripcin
86
OBJ 03
Versin
Descripcin
87
4.2.3
Requerimientos
Requerimientos Funcionales
El Sistema para Pronstico de Ventas - Sales Forecasting System SFS, presentar las
funcionalidades descritas en la tabla 4.8.
Cdigo
RF-01
Requerimientos Funcionales
Descripcin
Registrar usuarios y sus respectivos roles de acceso
al sistema
RF-02
RF-03
RF-04
indicando los
parmetros de entrenamiento
RF-05
RF-06
RF-07
RF-08
Requerimientos No Funcionales
88
Funcionalidad
Seguridad
El acceso al sistema estar restringido por el uso de contraseas asignadas a
cada uno de los usuarios.
El sistema slo aceptar el ingreso a aquellas personas que estn registradas,
estos usuarios sern clasificados en dos tipos de usuarios o roles: Administrador
y Usuario.
El sistema deber permitir configurar los perfiles para cada rol mencionado;
asignando las ventanas, procesos y reportes a los cuales tendrn acceso.
El sistema deber asociar y registrar cada actividad ejecutada con los usuarios
involucrados, con la finalidad de construir un mecanismo til de auditora.
Utilidad
Esttica de interfaz de usuario
La interfaz de usuario ser lo ms estndar posible, para lograr la rpida
aceptacin del usuario.
La interfaz del sistema debe presentar una distribucin uniforme incluyendo
una barra de men, barra de herramientas, panel de seleccin, panel principal
con pestaas y textos claros.
Entrenamiento requerido
Se debe brindar capacitacin al personal que va a utilizar la solucin, para que
pueda hacer buen uso del sistema y obtener el mximo beneficio de ste.
Manual de Usuario
El sistema pondr a disposicin del usuario su respectiva informacin de
Ayuda, la cual de be ser precisa, concisa y completa.
Confiabilidad
Tiempo entre Fallas
Cualquier falla que pudiera ocurrir en el uso mismo de la aplicacin, debido a
un error propio de la solucin; el tiempo que transcurrir hasta otra ocurrencia
de este error ser precisada cuando se ejecute el conjunto de pruebas (Log de
pruebas) a cada una de las funciones del sistema.
Tiempo de Reparacin
89
Los tiempos de reparacin del sistema dependern del tipo de falla que tenga, si
es de parada de servicios el tiempo ser solo unos minutos, si es por corrupcin
del servidor depender de la gravedad de la falla.
Las horas de mantenimiento podran variar dependiendo de otros factores.
Fallas por la mala implementacin del sistema, o por el mal uso de este, por
parte del personal.
Exactitud
La informacin proporcionada por el sistema contar con un 100% de exactitud,
dentro de los lmites establecidos.
El sistema presentar una exactitud instantnea al tiempo, que depender del
momento en que se ejecute algn proceso o en el momento de ingresar los
datos.
Seguridad de Datos
Almacenamiento y manejo seguro de la informacin.
Rendimiento
Requerimiento de Rendimiento
El tiempo promedio para un proceso vara de acuerdo a la cantidad de procesos
que se encuentren ejecutndose en ese momento, as como de las caractersticas
del hardware sobre el cual se ejecutan: procesador, memoria, disco.
La configuracin mnima para que el sistema funcione con normalidad es:
Procesador Intel Pentium D 2.8 GHz o AMD Athlon 64x2 4400+, 500 MB de
memoria RAM, espacio disponible en disco de 1GB.
La configuracin recomendada para que el sistema funcione en ptimas
condiciones es: Procesador Intel Core 2 Duo 2.4 GHz o AMD Athlon 64x2
5600+ 2.8 GHz, 1 GB de memoria RAM.
Soporte
Requerimiento de Soporte
El sistema podr ser usado sobre los siguientes sistemas operativos:
Windows98/Windows2000/Windows XP/Windows 7.
Diseo
Primer Contraste del Diseo
Para la construccin del sistema se utilizar el lenguaje de programacin Java
S.E. con el entorno de desarrollo NetBeans 7.2.
90
91
4.2.4
Subsistema de
Pronstico de Ventas
<<include>>
Gestionar Pronstico
(UC-01)
Administrador
(from Actores)
<<include>>
Gestionar Usuarios
(UC-07)
Usuario
Asignar Rol
(UC-08)
(from Actores)
92
4.2.5
93
4.2.6
Gestionar Pronstico
(UC-01)
Mdulo de Autenticacin
Mdulo de Administracin
<<include>>
Iniciar Sesin (UC-09)
(from Casos de Uso)
Gestionar Usuarios
(UC-07)
Asignar Rol
(UC-08)
4.2.7
Definicin de Actores
ACT-01
Administrador
1.0 (04/10/2012)
Versin
Descripcin Este actor representa a la persona que tiene a su cargo
la elaboracin y gestin de los modelos de pronstico
de ventas dentro de la organizacin, generalmente un
empleado de la empresa.
Tabla 4.9: Tabla de Actor: Administrador (Elaboracin propia)
94
ACT-01
Usuario
1.0 (04/10/2012)
Versin
Descripcin Este actor representa a la persona que tiene a su cargo
realizar el pronstico de ventas dentro de la
organizacin, utilizando para ello un modelo de
pronstico previamente creado; generalmente es un
empleado de la empresa.
Tabla 4.10: Tabla de Actor: Usuario (Elaboracin propia)
4.2.8
UC-01
Versin
Objetivos
Asociados
Descripcin
Gestionar Pronstico
1.0 (05/10/2012)
OBJ-01
Rendimiento
Frecuencia
Importancia
Urgencia
Estabilidad
96
UC-02
Versin
Objetivos
Asociados
Descripcin
Importancia
Urgencia
Estabilidad
Alta
Alta
Alta
Tabla 4.12: Tabla de especificacin de caso de uso: Gestionar Modelo para Pronstico
(Elaboracin propia)
UC-03
Versin
Objetivos
Asociados
Descripcin
98
Excepciones
Rendimiento
Frecuencia
Importancia
Urgencia
Estabilidad
correspondiente.
Paso
Accin
Si el administrador ingresa el nombre de un
modelo para pronstico ya registrado en el
pronstico principal actual, el sistema
3
mostrar el mensaje correspondiente
solicitando cambiar el nombre del modelo a
entrenar.
Si el administrador selecciona pausar
entrenamiento.
4
El sistema pausa el entrenamiento de la red
neuronal artificial, mostrando el nmero de
etapa y la tasa de error actual.
Si el administrador selecciona detener
entrenamiento.
4
El sistema detiene el entrenamiento de la red
neuronal artificial, mostrando el nmero de
etapa y la tasa de error actual.
Si el sistema durante el proceso de
entrenamiento llega a las 10 000 iteraciones y
an no encuentra una solucin (el error del
4
modelo no es menor a la tolerancia en el error
solicitada), el sistema mostrar el mensaje
correspondiente y finalizar el proceso de
entrenamiento.
Paso
Cota de Tiempo
2
1 segundo
4
5-10 minutos
5 veces / semana
Vital
Alta
Alta
Tabla 4.13: Tabla de especificacin de caso de uso: Entrenar Modelo para Pronstico
(Elaboracin propia)
UC-04
Versin
Objetivos
Asociados
Descripcin
Secuencia
Normal
Post
condicin
Excepciones
Rendimiento
Frecuencia
Importancia
Urgencia
Estabilidad
Paso
Accin
El administrador selecciona iniciar proceso
1
de validacin.
El sistema muestra el panel de proceso de
validacin y realiza la validacin de la red
neuronal mostrando grficamente la funcin
de validacin del modelo y el log del proceso
indicando por cada ejemplo de validacin: el
nmero de ejemplo, la salida de la red, la
2
salida esperada y el error obtenido. El
proceso finalizar cuando se haya validado el
modelo con cada uno de los ejemplos de
validacin disponibles, mostrando el nmero
d ejemplos, el nmero de aciertos y la tasa de
rendimiento del modelo.
El administrador selecciona guardar modelo
3
para pronstico.
El sistema almacena el modelo para
4
pronstico entrenado y validado.
Se ha realizado la validacin de la red neuronal
artificial
del
modelo
para
pronstico
correspondiente y finalmente ha sido almacenado.
Paso
Accin
Si el administrador selecciona pausar
validacin.
2
El sistema pausa la validacin de la red
neuronal artificial, mostrando el nmero de
ejemplo y la tasa de rendimiento actual.
Si el administrador selecciona detener
validacin.
2
El sistema detiene la validacin de la red
neuronal artificial, mostrando el nmero de
ejemplo y la tasa de rendimiento actual.
Paso
Cota de Tiempo
2
1-5 minutos
4
1 segundo
5 veces / semana
Vital
Alta
Alta
Tabla 4.14: Tabla de especificacin de caso de uso: Validar Modelo para Pronstico
(Elaboracin propia)
100
UC-05
Versin
Objetivos
Asociados
Descripcin
UC-06
Versin
Objetivos
Asociados
Descripcin
Post
condicin
Excepciones
Rendimiento
Frecuencia
Importancia
Urgencia
Estabilidad
103
4.2.9
Diagramas de Secuencia
: Usuario
: Ventana Principal
Selecciona
"Nuevo Pronstico"
Cargar Ventana
: Controlador Nuevo
Pronstico
: Pronostico
Cargar Ventana
Datos por defecto
Cargar Ventana
Datos por defecto
Selecciona "Siguiente"
Establecer conexin
Establece conexin con
la Base de Datos
Selecciona "Siguiente"
: Usuario
: Ventana Principal
: Controlador Modelos
: Pronostico
: Modelo neuronal
Ver Modelos
Listar Modelos
Describir Modelo
105
: Usuario
: Ventana Principal
: Ventana Parmetros de
Entrenamiento
: Controlador
Entrenamiento
Cargar datos
por defecto
Cargar Ventana
Iniciar Entrenamiento
Realizar Proceso
de Entrenamiento
106
: Usuario
: Ventana Principal
: Pronostico
Realizar Proceso
de Validacin
107
: Usuario
: Ventana Principal
: Controlador Pronstico
de Ventas
Selecciona "Pronosticar"
Pronosticar
108
Servidor de
Aplicaciones
PC Usuario
1
<<TCP/IP>>
1..n
1
<<TCP/IP>>
1
Servidor de Base de
Datos
109
4.3
4.3.1
Es as que para obtener dicha informacin se dise un simulador simple que gener un
script conteniendo registros de ventas realizas desde el 01 de enero de 1990 hasta el 31 de
diciembre de 2012, tomando en cuenta las siguientes consideraciones:
110
4.3.2
Una vez ejecutado el simulador, obtenemos como resultado una base de datos de prueba
con informacin transaccional de las ventas realizadas durante 276 meses equivalentes a
los 23 aos en los que oper la pyme en cuestin, resultando al final un total de 374,038
registros almacenados en la tabla de nombre venta.
Nmero de Tablas: 4
A continuacin en la figura 4.13, se muestran los ndices de venta totalizados por mes para
los tres ltimos aos (2010, 2011 y 2012) almacenados en la base de datos generada para la
pyme en estudio. En el grfico se observa claramente que las ventas para los meses de
diciembre, marzo y mayo son mayores a las de cualquier otro mes para cada ao indicado,
ascendiendo a un total de S/. 174,924.3 para el mes de diciembre de 2010 y S/. 136,317.4
para el mes de diciembre de 2012.
112
Figura 4.13: ndices de venta para los aos 2010, 2011 y 2012 (Elaboracin
propia)
4.3.3
Experimentos realizados
Una vez definido el caso de estudio es posible realizar los experimentos correspondientes,
ejecutando la herramienta tecnolgica sobre la informacin obtenida de la base de datos de
la pyme modelo creada anteriormente.
Se realizarn dos experimentos, el primero para pronosticar las ventas para un nico mes
objetivo (el inmediatamente posterior al ltimo mes registrado en la base de datos); y el
segundo para pronosticar las ventas para un rango de tiempo determinado, en donde el
sistema deber pronosticar las ventas para cada mes incluido dentro del rango.
113
Hacer doble clic sobre el ejecutable de la aplicacin SFS y se cargar la siguiente pantalla,
tal como se muestra en la figura 4.14:
114
115
Seleccionar el tipo de conexin a establecer (en este caso MySQL), ingresar el nombre del
host donde se encuentra la base de datos (para el caso de estudio localhost), ingresar el
nombre de la base de datos sales_forecasting_db, ingresar el nmero de puerto (el
sistema presenta el puerto por defecto segn el tipo de conexin, en este caso el nmero de
puerto 3306 para MySQL), ingresar el usuario (root) y contrasea con el cual se conectar
a la base de datos (es posible, antes de continuar, probar que con la informacin ingresada
la conexin pueda ser establecida, seleccionar para ello el botn probar conexin), luego
seleccionar el botn siguiente y se mostrar la ventana de la figura 4.17.
116
En esta ventana, el sistema luego de haber establecido la conexin con la base de datos,
explora el conjunto de tablas y vistas presentes en ella y las muestra al usuario con la
finalidad de que ste pueda seleccionar la tabla o vista que contiene la informacin
correspondiente a los niveles de venta histricos de la empresa (en este caso la tabla de
nombre venta), al efectuar la seleccin el sistema muestra automticamente el conjunto
de campos que componen a la tabla o vista seleccionada.
Continuando con el experimento, luego de elegir la tabla fuente de los datos de ventas
histricas, se selecciona el botn siguiente y se mostrar la ventana de la figura 4.18.
117
En esta ltima ventana se muestran los campos que componen la tabla o vista seleccionada
en el paso anterior, la cual contiene la informacin histrica de los ndices de ventas. En
ella se debe seleccionar de la lista del lado izquierdo, la columna que corresponde a los
patrones de entrada (fecha en la que se realiz la transaccin de venta) y de la lista del lado
derecho, la columna que corresponde a los patrones de salida (volumen monetario de la
venta); los cuales para el caso de estudio en cuestin sern la columna de nombre fecha
como patrn de entrada y la columna de nombre montoTotal como patrn de salida.
Finalmente seleccionar el botn finalizar, el sistema crear el nuevo pronstico y cargar la
ventana de la figura 4.19.
118
En este paso se ejecutar los procesos de entrenamiento y validacin del modelo neuronal,
el cual ser utilizado para realizar el pronstico de ventas requerido por la empresa.
Para el proceso de entrenamiento del modelo, en primer lugar se necesita seleccionar los
parmetros de entrenamiento, para ello en la solapa parmetros de entrenamiento de la
figura 4.19 se debe ingresar el nombre del modelo neuronal Modelo1, seleccionar el
nmero de neuronas para la capa oculta (10 neuronas para el caso de estudio), partir el total
de ejemplos disponibles, en ejemplos para entrenamiento del modelo (67% del total) y
ejemplos para validacin del modelo (23% del total), seleccionar el mecanismo de
inicializacin de pesos (Aleatorios entre [-1,1] para el caso en cuestin), indicar la tasa de
119
aprendizaje para el modelo neuronal (0.1) y la tolerancia en el error requerida, el cual para
el caso de estudio se sita en 8%.
120
Cabe mencionar que un ejemplo de entrenamiento est conformado por la dupla [entradas,
salidas], valores que fueron definidos durante la construccin del modelo neuronal, en la
seccin del aporte terico del captulo 4 de la investigacin; en resumidas cuentas, las
salidas son los ndices de venta mensuales y las entradas la informacin necesaria para
obtener dichos ndices de venta.
121
Una vez el sistema concluya con el proceso de validacin y muestre una tasa de
rendimiento que cumpla nuestras expectativas, se debe seleccionar el botn guardar
modelo neuronal y se cargar la ventana mostrada en la figura 4.22, en la cual, se puede
visualizar las caractersticas del modelo construido, incluyendo su tasa de rendimiento, que
para el caso de estudio es igual al 96.6%, lo cual indica que el modelo neuronal construido
realizar pronsticos acertados en el 96.6% de los casos.
122
En este paso se realizar el pronstico de ventas para el mes de enero del 2013, para lo cual
se debe seleccionar el botn pronosticar con el modelo (anteriormente creado), y se cagar
la ventana de la figura 4.23.
123
Como se puede apreciar en la figura 4.24 el volumen de ventas para el mes de enero de
2013 asciende a S/. 62,606.3927.
Es as que para el presente experimento se ha elegido que el mes a pronosticar ser Abril
del 2014 04/2014.
124
Como se puede apreciar en la figura 4.21 los ndices de venta para los meses indicados son
como se muestra en la tabla 4.17.
Ao
Mes
2013 Enero
62606.3927
2013 Febrero
48612.4203
2013 Marzo
133690.2330
125
2013 Abril
43207.3345
2013 Mayo
78164.0921
2013 Junio
50384.2016
2013 Julio
55590.3081
2013 Agosto
49667.8879
2013 Septiembre
62041.8098
2013 Octubre
44789.5498
2013 Noviembre
42122.9062
2013 Diciembre
124201.2600
2014 Enero
50322.2956
2014 Febrero
44862.3519
2014 Marzo
100281.1170
2014 Abril
53384.7669
Finalmente en la figura 4.26 se muestran las series de ventas para los periodos
correspondientes al experimento 2.
126
4.4
Discusin de resultados
Para realizar una comparacin efectiva de los resultados, se ejecut tanto el SFS como el
GMDH Sell, sobre la misma fuente de datos, la cual corresponde a la informacin
de ventas histricas de la pyme tipo en estudio, almacenadas en la base de datos de prueba.
Las ventas mensuales para el ao 2012 sern utilizadas para efectuar la medicin de
la precisin de los pronsticos realizados por ambos aplicativos software.
Para el caso del SFS el modelo creado presentar las siguientes caractersticas: 10
neuronas ocultas, inicializacin de pesos a valores aleatorios entre -1 y 1, tasa de
aprendizaje del 10%, y una tolerancia en el error de 8%.
Para el caso del GMDH Sell el modelo se crear sobre la plantilla Time series
combinational, con la cual el sistema generar modelos matemticos candidatos,
los validar y finalmente seleccionar los modelos mejor calificados usando como
criterio el RMSE (raz del error cuadrtico medio).
127
Una vez construidos los modelos a comparar, se utilizar cada uno de ellos para
realizar los pronsticos de ventas para los meses comprendidos entre enero y
diciembre de 2012.
Luego de construidos los modelos y ejecutados los pronsticos, los resultados obtenidos
son los que se muestran en la tabla 4.18:
Periodo
Ventas Reales
Ventas SFS
2012
Enero
54147.3
45402.6
58378.2
2012
Febrero
64832.4
49847.5
48700.0
2012
Marzo
97685.2
116523.8
126120.0
2012
Abril
54415.0
48738.9
56296.6
2012
Mayo
78270.2
83227.0
78218.7
2012
Junio
52970.1
58546.7
44940.6
2012
Julio
56139.5
53111.9
62827.6
2012
Agosto
56199.5
55271.4
50646.5
2012
Septiembre
54967.1
61871.0
53724.1
2012
Octubre
57676.7
48371.8
50445.1
2012
Noviembre
48691.6
50260.8
56663.6
2012
Diciembre
136317.4
146581.7
166050.0
As mismo los resultados obtenidos por ambos aplicativos pueden ser trasladados a un
grfico de series de tiempo para identificar mejor la relacin existente entre los valores
pronosticados y los valores reales de ventas histricas, tal como se muestra en la figura
4.27.
128
Donde:
:
129
54147.3
45402.6
0.026081866
64832.4
49847.5
0.053422151
97685.2
116523.8
0.037191084
54415.0
48738.9
0.010880626
78270.2
83227.0
0.004010497
52970.1
58546.7
0.011083499
56139.5
53111.9
0.002908471
56199.5
55271.4
0.000272754
54967.1
61871.0
0.015775631
10
57676.7
48371.8
0.026027078
11
48691.6
50260.8
0.001038665
12
136317.4
146581.7
0.005669591
0.194361914
RCREM
12.73%
Precisin
87.27%
Luego se aplica la medida RCREM para el pronstico realizado por el GMDH Sell, como
se muestra en la tabla 4.20:
54147.3
58378.2
0.006105307
64832.4
48700.0
0.061917487
97685.2
126120.0
0.084730895
54415.0
56296.6
0.001195738
78270.2
78218.7
0.000000433
52970.1
44940.6
0.022978114
56139.5
62827.6
0.014192908
130
56199.5
50646.5
0.009763175
54967.1
53724.1
0.000511350
10
57676.7
50445.1
0.015720548
11
48691.6
56663.6
0.026805956
12
136317.4
166050.0
0.047573278
0.291495191
RCREM
15.59%
Precisin
84.41%
Tabla 4.20: Medida de precisin RCREM para el GMDH Sell (Elaboracin propia)
Como evaluacin final se obtiene que los ndices de ventas pronosticados por el Sales
Forecasting System SFS tienen una precisin de 87.27%, mientras que los pronosticados
por el GMDH Sell cuentan con una precisin de 84.81%. Esto implica que a pesar de que
la diferencia de precisin entre ambos mtodos no es considerable (2.86%), se puede decir
que los pronsticos realizados con modelos basados en redes neuronales brindan mejores
resultados que los basados en mtodos matemtico-estadsticos. Cabe mencionar tambin
que el software seleccionado para realizar la comparacin de resultados (el GMDH Sell) es
uno de los que brinda la ms alta precisin en el mercado.
Sin embargo el tiempo consumido por ambas herramientas desde la presentacin de los
datos fuente, procesamiento de informacin, construccin/evaluacin de modelos, hasta la
ejecucin y obtencin de los pronsticos de ventas finales, fue prcticamente el mismo.
Siendo ambos software ejecutados sobre un nico ordenador que cumple con los requisitos
recomendados en la seccin de requerimientos no funcionales del captulo 4.
131
El costo monetario para el Sales Forecasting Systems SFS, al ser sta una herramienta
desarrollada con software libre, que crea modelos basados en redes neuronales y est
orientado a las pymes comerciales del Per, tendra un precio promedio de S/ 120.00
mensuales. En caso del GDMH Sell al ser una aplicacin comercial americana de mltiples
caractersticas se encuentra disponible en tres versiones bajo tres planes de venta
diferenciados, de los cuales la versin que mejor se ajustara para una pyme del sector
comercial peruano (GDMH Sell - Starter), con un plan que brinde el precio ms bajo (plan
de dos aos), al da de hoy enero del 2013 tiene un precio de $ 67.00 mensuales (Geos
Research Group - GMDH Sell, 2012).
El costo de aprendizaje para el Sales Forecasting System SFS, es relativamente alto en un
principio, pues el usuario que tiene a su cargo la construccin de los modelos, es el
responsable de seleccionar los parmetros de entrenamiento del mismo, debiendo conocer
por ende conceptos como capas de neuronas, tasa de rendimiento o tasa de aprendizaje;
aunque dicho inconveniente puede ser efectivamente reducido mediante una adecuada
capacitacin. Con respecto al GDMH Sell, el costo de aprendizaje es relativamente bajo,
pues asla al usuario de aquellas tareas de modelado matemtico, siendo el sistema quien se
encarga de seleccionar el modelo que mejor se ajusta a los datos presentados y que menor
error presente.
El costo de utilizacin del Sales Forecasting System SFS, es el incurrido durante el uso
de la aplicacin, en donde luego del aprendizaje sobre la construccin de modelos, no
existe mayor dificultad para ejecutar los pronsticos, pues el diseo del sistema es simple,
intuitivo y organizado. El costo de utilizacin del GMDH Sell tambin es bajo, pues a
pesar de que cuenta con una amplia gama de herramientas de anlisis, stos pueden ser
fcilmente asimilados por su sencillez y por el soporte informativo que brinda (manuales,
ayuda, etc.).
132
Captulo 5:
CONCLUSIONES Y RECOMENDACIONES
5.1
Conclusiones
Las conclusiones obtenidas luego de la realizacin de la presente investigacin son las que
se exponen a continuacin:
Se ha definido el marco conceptual dentro del cual debe encontrarse la empresa, para poder
hacer uso eficiente de la solucin creada, indicando que sta debe de ser una pyme del
sector comercial peruano, que almacene la informacin correspondiente a sus ventas en
una base de datos transaccional, considerando como informacin bsica la fecha de
realizacin de la venta y los volmenes de la misma ya sea en unidades monetarias o en
unidades de producto vendidas, indicando adems que se requiere como mnimo de un
histrico de ventas de por lo menos un ao, para que la solucin pueda ser ejecutada
adecuadamente.
133
5.2
Recomendaciones
Al ser los datos la fuente principal sobre la cual se construirn los pronsticos, es
recomendable que stos sean lo ms confiables posibles, por ello sera conveniente aplicar
134
135
REFERENCIAS BIBLIOGRFICAS
Business Forecast Systems - Forecast Pro. 2012. USA: Business Forecast Systems.
Consultado el 05 de agosto de 2012. Disponible en: http://www.forecastpro.com/
Chase R. B., Aquilano N. J., Jacobs, F. R. 2001. Administracin de Produccin de
va
Corchado R. Emilio, Fyfe Colin. 2004. Redes Neuronales Artificiales. En: Hernndez O.
Jos, Ramrez Q. Mara, Ferri R. Csar. Introduccin a la Minera de Datos. Prentice-Hall
Pearson. 2004.
136
Ferraro Carlo, Stumpo Giovanni. CEPAL. 2010. Polticas de apoyo a las pymes en
Amrica Latina. Entre avances innovadores y desafos institucionales. Chile. 393p.
672.
Consultado
el
12
de
diciembre
de
2012,
de
http://www.comexperu.org.pe/semanario.asp
Flrez L. Raquel, Fernndez F. Jos. Netbiblo. 2008. Las Redes Neuronales Artificiales:
Fundamentos Tericos y Aplicaciones Prcticas. 1 ed. Espaa. 152p.
Geos Research Group - GMDH Sell. 2012. USA. Geos Research Group. Consultado el 06
de agosto de 2012. Disponible en http://www.gmdhshell.com
Hanke J. E., Wichern D. W. Pearson Educacin. 2006. Pronsticos en los Negocios. 8 ed.
Mxico. 535p.
137
OLAP.
Consultado
el
15
de
abril
de
2011,
de
http://www.dwreview.com/Articles/Metadata.html
Makridakis S. G., Wheelwhright S. C., McGee. 1992. V.E. Forecasting: Methods and
Applications. John Wiley, 1
ra
y2
da
nd
Nacional.
Rosario,
de
http://www.frro.utn.edu.ar/repositorio/catedras/quimica/5_anio/orientadora1/monograias/m
atich-redesneuronales.pdf
138
Nojek, S., Britos, P., Rossi B., Garca M. 2003. Pronstico de Ventas: Comparacin de
prediccin entre redes neuronales y mtodo estadstico. Departamento de Ingeniera
Industrial. Centro de Ingeniera del Software e Ingeniera del Conocimiento. Instituto
Tecnolgico de Buenos Aires. Argentina.
Toro O. Eliana, Meja G. Diego, Salazar I. Harold. 2004. Pronstico de Ventas usando
Redes Neuronales, Redalyc - Scientia Et Technica, Vol. X, Nm. 26, pp. 25-30.
Universidad Tecnolgica de Pereira. Colombia.
139
Consultado
el
04
de
agosto
de
2012.
Disponible
en:
http://www.vanguardsw.com/
Vega P. Cynthia. 2011. Anlisis del financiamiento para las Pymes en la regin Piura
(Per). Tesis Mster en Desarrollo Local: Gestin de Pymes y Economa Social.
Universidad Internacional de Andaluca. Santa Mara de la Rbida Espaa. 137p.
140