Académique Documents
Professionnel Documents
Culture Documents
Presentado por:
Ventura Mamani Wily
Curso: Seminario de Tesis I
Dcimo Ciclo
Profesor asesor:
Ing. Adin Snchez Snchez
Arequipa Per
2015
2
Dedicatoria
A DIOS
A NUESTROS PADRES
Agradecimiento
que
accedi
Resumen
El proyecto que se presenta en este documento tiene como objetivo exponer el flujo de
procesos o serie de pasos que se realiza en un proceso de implantacin de un ERP y
en un proceso algortmico de Data Mining; se realiza lo antes mencionado porque la
empresa a la que se aplicar ambos conjuntos de procesos necesita ordenar su
informacin en el rea de ventas y obtener informacin que beneficie a la empresa
respecto a cmo se comportan sus clientes cuando compran en todo un periodo de
tiempo. Para que el objetivo final del proyecto se cumpla, se usaron herramientas de
software, herramientas de planificacin y de organizacin, estas ltimas se usaron
porque son herramientas estandarizadas y aceptadas internacionalmente en sus
respectivos campos; adems, sirvieron eficientemente para su propsito porque son
una gua de pasos detalladas y especficas para cada actividad que se necesitaba en
el proyecto. Con respecto a las herramientas software usadas, estas fueron
seleccionadas mediante una comparacin de criterios, las cuales eran necesarias por
los requerimientos y necesidades planteadas en la justificacin y viabilidad del
proyecto.
La planificacin y el planteamiento de objetivos generales y especficos con sus
respectivos mtodos y actividades, ayudaron a mantener una idea clara y concisa de
lo que se pretenda realizar desde los inicios del proyecto.
ndice
Introduccin ...................................................................................................................................... 9
Captulo I: Planteamiento del problema ..................................................................................... 10
1.1
1.2
1.3
1.3.1
Generales ............................................................................................................... 11
1.3.2
Especficos ............................................................................................................. 11
1.4
1.4.1
Justificacin ............................................................................................................ 11
1.4.2
1.5
Hiptesis ......................................................................................................................... 13
1.6
Variables de estudio...................................................................................................... 13
1.6.1
1.6.2
1.6.3
Indicadores ............................................................................................................. 13
2.2
2.2.1
Concepto ..................................................................................................................... 15
2.2.2
KDD, Descubrimiento de Conocimiento en Bases de Datos (Knowledge
Discovery Database) ................................................................................................................. 20
2.2.3
3.2.
3.3.
Poblacin ........................................................................................................................ 28
3.4.
Muestra ........................................................................................................................... 28
3.5.
3.6.
3.6.1.
Factibilidad Tcnica................................................................................................... 29
3.6.2.
3.6.3.
3.6.3.1.
3.6.3.2.
3.6.3.3.
3.7.
3.8.
Cronograma de Actividades......................................................................................... 40
ndice De Figuras
ndice de Tablas
Introduccin
Cuando se plantea el realizar un trabajo de investigacin sobre Anlisis e implantacin de
un Sistema de Produccin que emplea una herramienta Data Mining para el pronstico
de produccin en la empresa de calzados DUKE S.A.C., se debe tener en cuenta el
hecho de que hablar de dicha investigacin implica tener que adquirir ciertos
conocimientos sobre el dominio de Minera de Datos (Data Mining), para obtener un
modelo provechoso para el pronstico de produccin de calzados.
El presente trabajo tiene por objetivo mostrar el enfoque de implementacin de Data
Minig para la mejora los niveles de eficiencia, productividad y que en realidad, las
experiencias as denominadas no obedecen a los preceptos de dicho enfoque, sino que
de hecho tienen ms parecido con una solucin organizativa ya madura denominada
diseo de sistemas de informacin, cuyos fundamentos se basan, en suma, en una
filosofa que promueve el aprovechar la experiencia y conocimiento del personal e
integrarlo con los nuevos desarrollos tecnolgicos.
El siguiente trabajo de investigacin est estructurado de la siguiente manera: Como
primer captulo trataremos el planteamiento del problema en lo cual sealaremos la
descripcin, Interrogantes, objetivos, justificacin, hiptesis de la investigacin y variables
de estudio. Como segundo captulo que consta del marco terico en este captulo se
menciona los antecedentes de investigacin y definicin de marco terico. Seguidamente
trataremos el tercer captulo que consta del planteamiento operacional, en este captulo
se tratara la metodologa de Investigacin, poblacin y muestra, tcnicas e instrumentos
de recoleccin de datos y el estudio de factibilidad. Finalmente se dar a conocer los
resultados de la investigacin.
1.2
1.3
Objetivos de la Investigacin
1.3.1
Generales
Especficos
o
Realizar una limpieza de datos de la base de datos (Data Cleaning), con el fin
de que el proceso de Data Mining pueda tener datos de entrada adecuados.
1.4
1.4.1
Justificacin
11
herramienta del mercado actual que permita automatizar muchos de los procesos; sin
embargo, un software como el ERP permite una prospeccin a futuro, porque se puede
llegar a automatizar otros procesos de la empresa que en un futuro requieran un cambio
y que este se pueda dar de manera integrada; es decir, que la empresa llegar a usar un
solo software, evitando conflictos por el uso de distintas herramientas de software. Para
el segundo problema mencionado, estos se puede solucionar, con los resultados que se
obtendrn del proceso algortmico de Data Mining y una adecuada gestin de produccin
(esto ltimo depende netamente de la empresa).
La eleccin e implementacin de un mtodo adecuado de pronsticos siempre ha sido
un tema de gran importancia para la empresa. Se utilizan los pronsticos de forma
emprica. Un error en el pronstico de produccin podra dejar a la
empresa sin
Delimitacin de la investigacin
12
1.5
Hiptesis
1.6
Variables de estudio
1.6.1
Variable Dependiente
Pronostico de Produccin
1.6.2
Variable Independiente
Data Minig
1.6.3
Indicadores
Variable Dependiente
Indicadores
Criterios de negocio
Pronostico de produccin
Criterios de produccin
Procesos de produccin
Compradores o Consumidores
Venta de productos
Variable Independiente
Indicadores
Recoleccin de datos iniciales
Data Minig
13
14
Ao: 2008
Procedencia: Universidad Politcnica de Madrid, Espaa.
Fuente: Tesis
Resumen: El proyecto surge, en la empresa MDS Boole, por la necesidad de explorar
y desarrollar el conocimiento individual de los consumidores, el cual, se ha convertido
en uno delos principales objetivos en la mayora de las empresas que desean orientar
sus actividades de marketing de forma ms eficaz y rentable.
La falta de informacin sobre nuestros propios clientes, y sobre los consumidores en
general, es un importante obstculo que impide saber ms acerca de los potenciales
consumidor es a nivel individual. En el mejor de los casos, aquellas empresas que
desarrollan sus actividades directamente con el consumidor, disponen de una
informacin transaccional muy importante pero, en la mayora de los casos,
desconocen los aspectos descriptivos de cmo son sus clientes. Por el contrario, las
empresas que desarrollan sus actividades a travs de un canal de distribucin sobre
el que no tienen control directo, la transaccin es annima y el conocimiento sobre el
transaccional de los clientes a nivel individual es inexistente.
2.2
Data Minig
2.2.1 Concepto
Es un proceso no trivial que tiene como entrada datos y como salida Informacin, en este
proceso se hace un anlisis detallado a travs del uso de algoritmos para descubrir
patrones o comportamiento de los datos. (Weiss & Davison, 2010)
15
Seleccin,
Pre-procesamiento,
Transformacin
la
parte
16
17
Uso de una constante global para rellenar los valores faltantes, reemplazar
los valores de los atributos sin datos con etiquetas, Desconocido, este
mtodo puede afectar el proceso de Data Mining, ya que el algoritmo
puede darle otro significado a estas etiquetas. (Han & Kamber, 2006)
Datos Ruidosos
Se define como un error aleatorio o en varianza para un valor medible; es decir
que si el precio de un producto oscila entre 10 dlares y 20 dlares y hay uno que
esta fuera de ese rango, este ltimo es considerado dato ruidoso; se puede
combatir suavizando los datos, para esto existen tcnicas. (Han & Kamber, 2006)
Algunas de estas son:
18
Binning, este mtodo ordena los datos con consultas a los vecinos ms
cercanos, luego son separados en grupos llamados bins o buckets de
igual tamao y luego los valores medios de los grupos son reemplazados
por el valor ms significativo del grupo, por valores de los extremos o por
l, valor que se encuentre en el medio del grupo; mientras ms grande sea
el grupo hay una mejor aproximacin. (Han & Kamber, 2006)
problemas; luego, con los datos ya procesados se deben crear reglas para poder
ver los detalles de la estructura de los datos; es decir, formatos de fechas,
monedas, etc.
(HAN & KAMBER, 2006)
El segundo paso es la transformacin de los datos, en este paso se debe
transformar los datos segn las reglas definidas en el paso anterior, para poder
tener as formatos uniformes de datos y el proceso de algoritmia pueda procesar
datos limpios. (HAN & KAMBER, 2006).
20
Las fases definidas anteriormente sirven para una gua adecuada en cualquier
proyecto que est relacionado con Knowledge Discovery in Databases, el cual a
veces es confundido y es relacionado al Data Mining como el mismo proceso.
(Maimom & Rokach, 2010).
21
23
de decisiones,
redes neuronales, regresin lineal, regresin logstica, etc.
24
Knowledge Seeker
Es un producto de inteligencia de negocios con Data Mining para poder predecir y
anticipar escenarios; adems posee funcionalidad de diseo de estrategia
(ANGOSS, 2012), entre sus principales caractersticas se tiene:
Es flexible, una herramienta poderosa que permite interactuar los usuarios
de forma fcil; adems, posee arboles de decisin, arboles de estrategias
(comparacin de estrategias con mltiples variables de decisin).
encuentra
patrones
de
comportamiento
determina
25
Knowledge
Seeker
dVelox
Enterprise
MicroStrategy
Data Mining
SQL Server
Data
Mining 2008
Pentaho Data
Mining
(Weka)
Es una
herramienta de
cdigo abierto
Trabaja con
Se realizan continuas
Permite la limpieza,
distintas
actualizaciones sobre
integracin y
Puntuacin
bases de
las funcionalidades del
transformacin de datos
Datos.
Software
12
26
3.1.
Planteamiento Metodolgico
El siguiente trabajo de investigacin est dentro del paradigma positivista, el tipo
de investigacin segn la finalidad es aplicada, segn la temporalidad es
seccional o sincrnica, segn la Amplitud
mbito es de campo.
3.2.
Tipo de estudio
De acuerdo al alcance de ejecucin del diseo de investigacin es:
Descriptiva
Cuasi Experimental
O1
O2
Figura 2. Tipo de estudio
DONDE:
M=Muestra
O1=Variable Independiente
O2=Variable Dependiente
27
3.3.
Poblacin
de
calzados de damas que fueron en total de 15719 pares de calzados solo para damas
de la empresa Duke S.A.C
3.4.
Muestra
El muestreo se realiz de forma aleatoria en la cual se tomaron 30 muestras de
tamao 20 del total de 15719 pareces de calzados solo para damas de la empresa
Duke S.A.C
Para poder hallar la muestra de nuestra poblacin aplicamos una formula
estadstica
=
N x 2 2
2 ( 1) + 2 2
Dnde:
Margen de error
Tamao de la poblacin
Desviacin estndar
Nivel de confianza
e:
N:
o:
Z:
0.05
15719
0.5
95%
= 375
3.5.
3.6.
Estudio de Factibilidad
Requerimiento de Hardware
El equipo con el que se desarrollara el proyecto tiene las siguientes
caractersticas
Tabla 2. Requerimiento de Hardware
Marca:
Gigabyte
Placa Madre:
Procesador:
Disco Duro:
Memoria RAM:
500
Modelo:
---------------------
4 GB
KINGSTON DDR3
Video:
Sonido:
Integrado 7.1
Tarjeta de red
Red:
10/100/1000 incorporado
Case ATX:
Floppy:
Multi DVD:
Combo 24X LG
Card Reader:
------------------------------
Monitor:
18 lg o samsung
Teclado:
Multimedia
Mouse:
ptico
Woofer:
Escritorio
Estabilizador: Forza
29
Requerimiento de Software
Por otro lado con el software con el que se cuenta
Tabla 3. Requerimiento de Software
Software
Versin
Sistema Operativo
Windows 8.1
8.1
Microsoft Office
Word y Excel
2010
NetBeans
Leguaje de programacin 8.0.2
8.0.2
Mysql 5.3
5.3
Realizar diagramas
StarUML
2.3.0
Antivirus
Nod 32
Weka
7.0302
3.7.3
30
Costo de personal
Los costos de apoyo sern calculados teniendo en cuenta dos tipos de
involucrados en el proyecto los cuales son en primera instancia personal
encargada del desarrollo en si del proyecto de investigacin (jefe de
proyecto, analista, programador, testeador, diseador).
Personal de desarrollo en si del proyecto
Participa en diferentes etapas del proyecto por un determinado tiempo
nombrando las funciones a continuacin.
Jefe de proyecto.
Analista.
Diseador.
Programador.
Testeador.
Numero de
Recursos Humanos
Meses
Tarifa Mensual
Total (S/.)
Jefe de proyecto es el
analista.
S/.
800.00
S/.
4,000.00
Diseador.
3 semanas
S/.
1,000.00
S/.
750.00
Programador.
S/.
1,000.00
S/.
2,000.00
Testeador.
2 semanas
S/.
750.00
S/.
375.00
S/.
7,125.00
TOTAL
31
Costo de Hardware
En cuanto a costos para el equipamiento bsico para el funcionamiento
operativo del sistema
Tabla 5. Costo de Hardware
Equipo
Cantidad
Costo unitario(S/.)
CPU
S/.
900.00
S/.
900.00
Monitor
S/.
300.00
S/.
300.00
Impresora
S/.
200.00
S/.
200.00
Kit de dispositivos
perifricos
S/.
80.00
S/.
80.00
TOTAL
Total(S/.)
S/. 1,480.00
Costo de Software
En cuanto al coste de software, es tan igual como el coste del equipo o hardware,
el cual es, para la implementacin del sistema y costo de software para el
funcionamiento del mismo.
Costo de Software para la Implementacin
Tabla 6. Costo de Software para la implementacin
Software
Cantidad
Costo de licencias(S/.)
Windows 8.1
S/.
500.00
S/. 500.00
Word y excel
S/.
313.83
S/. 313.83
NetBeans 8.0.2
S/.
0.00
S/.
0.00
Mysql 5.3
S/.
0.00
S/.
0.00
StarUML
S/.
0.00
S/.
0.00
Nod 32
S/.
44.38
S/.
44.38
Weka
S/.
0.00
S/.
0.00
TOTAL
32
Total(S/.)
S/. 858.21
Cantidad licencias(S/.)
Windows 8.1
S/.
500.00
TOTAL
Total(S/.)
S/.
500.00
S/.
500.00
Costo de Suministro
En cuanto a suministros bsicos se consideran los siguientes: hojas bond,
tiles de escritorio, discos, tinta para impresora, memoria de USB.
Cantidad
Unidad(S/.)
Material de Oficina
S/.
10.00 S/.
10.00
Hojas Bond
S/.
12.00 S/.
12.00
Cartuchos de Impresora
S/.
Memoria USB
S/.
20.00 S/.
TOTAL
Total(S/.)
20.00
S/. 162.00
Costo de Servicios
En el siguiente apartado se consideran los gastos de servicios como el
agua, la luz, transporte y el servicio de internet, viticos.
33
Cantidad(Mes)
Mes
Agua
S/.
6.00
Luz
S/.
15.00
S/.
75.00
Transporte
S/.
28.00
S/.
140.00
Viticos
S/.
80.00
S/.
400.00
Internet
S/.
15.00
S/.
75.00
S/.
720.00
TOTAL
Total(S/.)
S/. 30.00
Resumen de Costos
En este ltimo apartado se resume todos los costos que sern utilizados
para el desarrollo del proyecto.
Tabla 10. Valor de desecho del Equipo
S/.
Costo de Equipo
1,480.00
Valor de desecho
10%
Total valor de
Salvamiento
148
Valor de depreciacin
370
34
Criterio
Personal
Suministros
Software
Equipo de
Usuario
Servicios
Total
Costo Inicial
S/.
7,125.00
S/.
162.00
S/.
1,358.21
S/.
1,332.00
S/.
1,480.00
S/.
720.00
S/.
10,845.21
Ao 1
Ao 2
Ao 3
Ao 4
.....
.....
.....
.....
.....
.....
.....
.....
.....
.....
.....
.....
(4/10)
(3/10)
2/10)
S/.
291.38
S/.
435.60
S/.
726.98
(1/10)
S/.
518.00
S/.
388.50
S/.
360.00
S/.
396.00
S/.
878.00
S/.
784.50
S/.
218.53
S/.
479.16
S/.
697.69
Ao 1
Ao 2
Ao 3
Ao 4
S/.
4,000.00
S/.4,000.00
S/. 4,000.00
VD=S/.148.00+ S/.
4,000.00
S/.
S/.
500.00
4,500.00
S/. 500.00
S/. 4,500.00
S/. 500.00
S/. 4,500.00
S/. 500.00
S/. 4,648.00
35
Ao 0
Beneficio
..
Costo
S/. 10,845.21
S/. Total
10,845.21
S/. Acumulado
10,845.21
Ao 1
S/.
4,500.00
S/.
878.00
S/.
5,378.00
S/. 5,467.21
Ao 2
S/.
4,500.00
S/.
784.50
S/.
5,284.50
S/.
182.71
Ao 3
S/. 4,500.00
S/.
726.98
S/. 5,226.98
S/. 5,044.27
Ao 4
S/.
4,648.00
S/.
697.69
S/.
5,345.69
S/.
10,389.96
6000
Costo
4000
2000
0
Ao 0
Ao 1
Ao 2
Ao 3
Ao 4
36
Banco Central de Reserva del Per, Presentacin del Reporte de Inflacin-Junio 2015
En http://www.bcrp.gob.pe/
37
Flujos de Caja
0 S/. -10,845.21
1 S/.
5,378.00
2 S/.
5,284.50
3 S/.
5,226.98
4 S/.
5,345.69
S/.
2,891.06
VAR
TIR
34%
Dado que el Valor Actual Neto (VAN), del proyecto es de S/. 2,891.06 >0 el
proyecto puede aceptarse y por otro lado la tasa Interna de Retorno es
34%>20.06% por lo tanto el proyecto ofrecer una rentabilidad mayor que la
mnima requerida.
38
3.7.
Inicio
Area de Cortes
Si
Troquel o Manual
Existe Modelo
No
Revisin de Cuero
Disear Modelo
Revisin de Cuero
Escarlar Piezas
Cortar Pieles
Despastar y
Repujar
Aparar Piezas de
Cuero
Montar Puntas y
Talon
Armar Cortes
Pegar Plantas
Rematar o Acabar
Empacar y
Almacenar
Fin
Recepcin,,
inspeccin y
almacenamiento
de Materiales
Fin
Area de Corte
Area de aparado
rea de Empaque
y almacn
Area de acabado
39
Area de Armado
rea de Armado
3.8.
Cronograma de Actividades
Figura 5. Diagrama de Gantt
40
8%
8%
74 87
11%
88 101
10%
102 115
35%
17%
116 129
130 143
144 157
41
60 72
25%
73 85
65%
86 98
99 111
0 16
25%
17 33
40%
34 50
51 67
68 84
23%
85 101
102 118
42
14%
12%
0 13
14 27
28 41
42 55
56 69
70 83
21%
21%
17%
84 97
43
0 22
4%
23 45
13%
48%
46 68
69 91
92 114
23%
115 137
138 160
44
22%
9%
50 69
12%
70 89
90 109
19%
14%
110 129
130 149
17%
150 169
170 189
45
29%
52%
64 77
78 91
92 105
13%
106 119
120 133
46
2%
4%
13%
15 7,5
19%
31 23,5
25%
47 39,5
63 55,5
79 71,5
35%
95 87,5
111 103,5
47
4%
15%
10%
19%
0 13
14 27
28 41
42 55
21%
23%
56 69
70 83
84 97
48
0 24
50%
25 49
50 74
75 99
29%
100 124
125 149
150 174
49
180 200
6%
201 221
19%
222 242
18%
243 263
5%
264 284
5%
5%
11%
285 305
10%
306 326
327 347
348 368
180 197
7%
9%
198 215
10%
2%
5%
17%
7%
216 233
234 251
252 269
270 287
288 305
31%
306 323
324 341
342 359
50
51
Conclusiones
52
Bibliografa
Han, J., & Kamber, M. (2006). Data Mining: Concepts and Techniques. BOSTON: EL SEVIER.
Maimom, O., & Rokach, l. (2010). Dataming and KDD. New York: Springer.
Molina Lpez , J., & Garca Herrero, J. (2006). TCNICAS DE ANLISIS DE DATOS. Madrid:
Universidad de Madrid.
Usama, F., Piatetsky, G., & Smyth , P. (1996). From Data Mining to Knowledge Discovery in
Databases. AAAI96, 54.
Weiss, G., & Davison, B. (2010). Data Mining. To appear in the Handbook of Technology
Management, H. Bidgoli (Ed.), 17.
Weiss, J. (2010). Data Mining. The Handbook of Technology Management.
53
Anexos
54
55
56