Académique Documents
Professionnel Documents
Culture Documents
TECNOLOGAS DE LA INFORMACIN
LABORATORIO III HERRAMIENTAS DE ANLISIS Y MINERA DE DATOS
ALUMNO J. ALONSO LUNA R.
pg. 1
1. Seleccin de datos.
En esta etapa se determinan las fuentes de datos y el tipo de informacin a utilizar. Es la etapa donde los datos relevantes para el
anlisis son extrados desde la o las fuentes de datos.
2. Pre procesamiento.
Esta etapa consiste en la preparacin y limpieza de los datos extrados desde las distintas fuentes de datos en una forma manejable,
necesaria para las fases posteriores. En esta etapa se utilizan diversas estrategias para manejar datos faltantes o en blanco, datos
inconsistentes o que estn fuera de rango, obtenindose al final una estructura de datos adecuada para su posterior transformacin.
pg. 2
3. Transformacin.
Consiste en el tratamiento preliminar de los datos, transformacin y generacin de nuevas variables a partir de las ya existentes con una
estructura de datos apropiada. Aqu se realizan operaciones de agregacin o normalizacin, consolidando los datos de una forma
necesaria para la fase siguiente.
4. Data Mining.
Es la fase de modelamiento propiamente tal, en donde mtodos inteligentes son aplicados con el objetivo de extraer patrones
previamente desconocidos, vlidos, nuevos, potencialmente tiles y comprensibles y que estn contenidos u ocultos en los datos.
5. Interpretacin y Evaluacin.
Se identifican los patrones obtenidos y que son realmente interesantes, basndose en algunas medidas y se realiza una evaluacin de los
resultados obtenidos.
KDD proceso
IMAGEN 2
IMAGEN 1
pg. 3
REFERENCIAS BIBLIOGRAFICAS
pg. 4