Vous êtes sur la page 1sur 25

DATAMINING

Ing. CIP Richard Branko Luque del Carpio

Temas a tratar
Introduccion
Claves

de xito de un programa de
minera de datos
Cuando
empezar?
Necesidades
y
objetivos de negocio.
El modelo y gua de referencias CRISP-DM
Impacto social de la minera de datos
Cuestiones ticas y legales

Introduccin

La decisin de implementar un programa de minera de datos y


el diseo de un plan del mismo debe preceder a cualquiera de
las fases que han visto en captulos anteriores

Se debe establecer cual es el contexto del negocio, los objetivos


del mismo y plasmarlos en objetivos de minera de datos.

Hoy en da ninguna empresa y organizacin de cierto tamao


puede permitirse el lujo de no haber tenido en el orden del da
de alguna reunin de direccin el tema

"IMPLEMENTACION DE UNA MINERIA DE DATOS".


Un programa de minera de datos es un uso sistemticos,
prolongado y racional de las tcnicas de minera de datos de
una determinada organizacin.

Temas a tratar
Introduccion
Claves

de xito de un programa de
minera de datos
Cuando
empezar?
Necesidades
y
objetivos de negocio.
El modelo y gua de referencias CRISP-DM
Impacto social de la minera de datos
Cuestiones ticas y legales

2. Claves de xito de un programa de minera de datos

Se puede destacar los siguiente aspectos


fundamentales para el xito de la minera de datos en
una organizacin:

El negocio y sus necesidades han de dirigir el desarrollo del


programa. Se han de especificar claramente los problemas y
objetivos del negocio. Con estos problemas y objetivos de
negocio podremos averiguar que datos van a ser necesarios
y podrn surgir los objetivos y tareas de minera de datos.

Una buena especificacin de problemas concretos y


especficos de minera de datos es otra clave de xito. Es
importante trasladar correctamente los objetivos de negocio
a los objetivos concretos de minera de datos.

2. Claves de xito de un programa de


minera de datos

La integracin del resto de programa de la


organizacin y el apoyo incondicional de los altos
ejecutivos de la organizacin es imprescindible.

La calidad de datos es primordial. La integracin


de informacin externa necesaria para los
modelos, como campaas de la competencia,
evolucin de la economa, calendarios, etc.

Temas a tratar
Introduccion
Claves

de xito de un programa de
minera de datos
Cuando empezar? Necesidades y
objetivos de negocio.
El modelo y gua de referencias CRISP-DM
Impacto social de la minera de datos
Cuestiones ticas y legales

Los consultores, asesores y comerciales productivos, as


como las revistas y expertos especializados, se la
ingenian, especialmente en momentos de crisis, de
estancamiento o de bonanza, es decir, en cualquier
momento, para ofrecernos productos que ya tenemos o
vendernos productos que no necesitamos, pero acabamos
necesitando

Si uno esta convencido de que el futuro esta en el software


de 5 capas o tambin llamado NOODLEWARE, puede ser
que, con tal escarmiento, se dude que realmente la
minera de datos sea tan solo una moda mas, una palabra
atractiva que le obligue a actualizarse la versin de su
sistema de gestin de base de datos y comprar
complementos de minera de datos.

Un aspecto a considerar para determinar si es necesario


un programa de minera de datos es la identificacin de
necesidades que puedan ser cubiertas con la minera de
datos.
La necesidad debe crear el programa y mas no el
programa tiene que crear la necesidad
La necesidades pueden ser clsicas como:

Identificar subidas y bajadas de ventas


Adecuar la produccin a las ventas futuras
Determinar tendencias del mercado o la competencia
Realizar una campaa de marketing selectiva ante cierto
producto
Determinar los sectores de mas uso de los mensajes de texto

Los objetivos de negocio de un programa de minera


de datos no son tareas de minera de datos.

Por ejemplo:
La asignacin de una probabilidad de compra de un
producto a un conjunto de clientes es una tarea de
minera de datos que, en si misma, no tiene
beneficios. En cambio, la realizacin de una campaa
de marketing selectiva de clientes ante un producto
y la obtena de respuesta de un 5% es un objetivo de
negocio con una medida de evaluacin del cual si
puede estimarse su beneficio

Temas a tratar
Introduccion
Claves

de xito de un programa de
minera de datos
Cuando
empezar?
Necesidades
y
objetivos de negocio.
El modelo y gua de referencias
CRISP-DM
Impacto social de la minera de datos
Cuestiones ticas y legales

4. El modelo y gua de referencias CRISPDM

CRISP (Cross Industry Standard Process for Data


Mining) es un consorcio de empresas las cuales
crearon un estndar "ESTANDAR 1.0" ka cual es
una gua muy til al momento de establecer una
planificacin de un programa de minera de datos
adaptado a las necesidades de una organizacin.
El modelo gua se estructura en 6 fases
principales:

Comprensin del Negocio


Comprensin de los datos
Preparacin de datos
Modelado

4. El modelo y gua de referencias CRISPDM

Comprensin del negocio: se centra en


entender los objetivos y requerimientos del
proyecto desde una perspectiva de negocio,
plasmando todo esto en una definicin del
problema de minera de datos y plan
preliminar diseado a obtener los objetivos.
Esta fase consta de 4 subfases:

1. Establecimiento de los objetivos del negocio


2. Evaluacin de la situacin
3. Establecimiento de los objetivos de minera de
datos
4. Generacin del plan de proyecto

4. El modelo y gua de referencias CRISPDM

Comprensin de los datos: segn este


estndar, se trata de recopilar y familiarizarse
con los datos, identificar los problemas de
calidad de datos y ver las primeras
potencialidades o subconjuntos de datos que
puede ser interesante analizar. Esta fase
consta de 4 subfases:

1. Recopilacin inicial de datos


2. Descripcin de datos
3. Verificacin de calidad de datos

4. El modelo y gua de referencias CRISPDM

Preparacin de datos: el objetivo de esta fase


es obtener la "vista minable" aunque el
estndar no use esta terminologa. Aqu se
incluye lo que es la integracin, seleccin,
limpieza y transformacin.

1.
2.
3.
4.
5.

Seleccin de datos
Limpieza de datos
Construccin de datos
Integracin de datos
Formateo de datos

4. El modelo y gua de referencias CRISPDM

Modelado: es la aplicacin de tcnicas de


modelado o de minera de datos propiamente
dichas a las vistas minables anteriores. Consta
de cuatro subfases:
1.
2.
3.
4.

Seleccin de la tcnica de modelado


Diseo de la evaluacin
Construccin del modelo
Evaluacin del modelo

5. Impacto social de la minera de datos


tratar
Introduccion
Claves

de xito de un programa de minera


de datos
Cuando
empezar?
Necesidades
y
objetivos de negocio.
El modelo y gua de referencias CRISP-DM
Impacto social de la minera de datos
Cuestiones ticas y legales

5. Impacto social de la minera de datos


tratar

Cada vez son mas los usuarios, las aplicaciones, las


investigaciones y los desarrollos relacionados con
ella, y crecen los sistemas de software que afirman
ser productos de mineria de datos.

La mineria de datos a evolucionado desde su


aparicion desarrollando nuevos metodos para
adaptarse a las necesidades de una amplia variedad
de dominios de la aplicacion.

Esta disciplina se ha convertido en una tecnologia


ampliamente reconocida por compaias de todo tipo,
organizaciones, instituciones publicas e individuos.

5. Impacto social de la minera de datos


tratar

Los almacenes de datos, que han hecho posible el


almacenamiento de grandes volmenes de datos en un
mismo repositorio, junto con el incremento en potencia
de la computacin, son las causas de que las empresas
de hoy en da busquen herramientas y tecnologas
capaces de extraer informacin til de los datos.

Uno de los mbitos en los que la minera de datos esta


teniendo un impacto muy importante, son en la
medicina y general el rea que se ha venido a llamar
bioinformatica, tienen unas consecuencias indirectas en
la sociedad.

5. Impacto social de la minera de datos


tratar

- La minera de datos no es solo til en los mbitos


empresariales, institucionales o cientficos, sino
tambin a nivel individual. Por ejemplo: la mayora
de navegadores de ultima generacin incluyen
mtodos de aprendizaje automtico para clasificar
el correo electrnico y detectar mensajes spam.

Esto solo el principio, nuestra informacin personal


tambin ser procesada y analizada por
herramientas que no sugerirn patrones, nos
filtraran informacin y nos harn mas llevadera y
provechosa nuestra sociedad de informacin,
convirtindola en la sociedad de conocimiento.

6. Cuestiones ticas y legales

La minera de datos puede reportar


numerosos beneficios en muy diversas
aplicaciones. Pero existe tambin un lado
peligroso en la minera de datos que tiene que
ver con dos aspectos fundamentalmente:

La privacidad de las personas con cuyos datos se


trabaja
El uso descuidado de los modelos obtenidos.

6.1 Privacidad

Casi todas las constituciones y leyes


supranacionales del mundo afirman
taxativamente que deben observarse una serie de
medidas para un tratamiento riguroso de la
informacin privada de las personas.

Un ejemplo mas practico es el de los exmenes


mdicos personales. A nadie le gustara que su
historial medico apareciese en una pagina web o
que un trabajador del archivo de un hospital
pudiera ver libremente este historial, a la caza de
algn famoso con alguna enfermedad singular.

6.1 Privacidad

En un mundo donde la informacin fluye tan rpidamente,


evitar este tipo de problemas obliga a limitar en gran
medida la manera en la que se recogen y almacenan los
datos.

Existe ya una tradicin de directivas y leyes para esta


proteccin de datos. Por ejemplo: Una iniciativa europea
para la proteccin de los datos, conocida como European
Data Protection Directive, establece el marco legal que se
debe cumplir cuando se comercia con informacin
personal en cualquiera de los estados miembros de la
Union Europea. Estas directrices garantizan unos derechos
bsicos sobre los datos recogidos de un individuo:

6.1 Privacidad

Derecho a acceder a los datos


Derecho a rectificar cualquier error en los
datos
Derecho a conocer de donde se obtuvieron
los datos
Derecho a recurrir contra tratamientos
ilegales
Derecho a denegar el permiso para usar tus
datos en campaas publicitarias

GRACIAS POR SU ATENCION

Vous aimerez peut-être aussi