Vous êtes sur la page 1sur 13

5-6-2014

INGENIERIA DEL
CONOCIMIENTO

INVESTIGACIN
UNIDAD 4. ADQUISICIN DEL CONOCIMIENTO
06/06/2014

TABLA DE CONTENIDO


INTRODUCCIN ........................................................................................................................................... 2
4.1 INTRODUCCION A LA MINERIA DE DATOS. ............................................................................................. 4
4.2 TCNICAS PARA EL PRE-PROCESAMINETO DE DATOS. ............................................................................ 5
4.3 TCNICAS PARA IDENTIFICACIN DE CONCEPTOS, REGLAS Y RELACIONES ............................................. 6
4.4 HERRAMIENTA PARA ANLISIS DEL CONOCIMIENTO, SELECCIN DE DATOS, EXTRACCIN DE REGLAS. 9
CONCLUSION ............................................................................................................................................. 12
REFERENCIAS ............................................................................................................................................. 12

INTRODUCCIN

















Tal vez un iceberg sea la mejor comparacin para describir lo que representa la gestin
del conocimiento y presentar el propsito de este documento, es decir, no se pretende
realizar un anlisis a profundidad de todas las herramientas de software actuales, sino
simplemente
describir algunas de ellas







4.1 INTRODUCCION A LA MINERIA DE DATOS.

La minera de datos es el proceso que tiene como propsito descubrir y almacenar la
informacin relevante de amplias bases de datos, a travs de programas de bsqueda e
identificacin de patrones y relaciones globales, tendencias, desviaciones y otros
indicadores aparentemente caticos que tienen una explicacin que puede descubrirse
mediante diversas tcnicas de esta herramienta. El objetivo fundamental es aprovechar el
valor de la informacin localizada y usar los patrones preestablecidos para tener un mejor
conocimiento de lo que se trabaja y poder tomar decisiones ms confiables.
Se considera al Descubrimiento de Conocimiento en Bases de Datos (KDD) como el
proceso, lo ms automatizado posible, que va de los datos elementales disponibles en un
repositorio de datos a la decisin.
El objetivo principal del Descubrimiento de Conocimiento en Bases de Datos (KDD)
es crear un proceso automatizado que tome como punto de partida los datos y cuya
meta es la ayuda a la toma de decisiones. Minera de Datos
La diferencia entre minera de datos y KDD es que la minera de datos usa algoritmos
para extraer informacin y/o patrones derivados dentro del proceso KDD.

4.2 TCNICAS PARA EL PRE-PROCESAMINETO DE
DATOS.

Engloba a todas aquellas tcnicas de anlisis de datos que permite mejorar la calidad de
un conjunto de datos de modo que las tcnicas de extraccin de conocimiento/minera de
datos puedan obtener mayor y mejor informacin (mejor porcentaje de clasificacin,
reglas con ms completitud, etc.)

COMPONENTES DEL PRE-PROCEAMIENTO DE DATOS.
LIMPIEZA DE DATOS (DATA CLEANING): Este proceso consiste en la
eliminacin de datos errneos o inconsistentes en trminos generales:
Resuelve redundancias.
Chequea y resuelve problemas de ruido, datos errneos, valores perdidos.
Resuelve inconsistencias/conflictos entre datos
REDUCCIN DE DATOS: Consiste en decidir qu datos deben ser utilizados para
el anlisis se subdivide en el rango de atributos continuos en intervalos, almacena
solo las etiquetas de los intervalos.
INTEGRACIN DE DATOS: Obtiene los datos de diferentes fuentes de
informacin, resuelve problemas de representacin y codificacin, adems integra
los datos desde diferentes tablas para crear informacin homognea. Se basa en
combinar mltiples tablas o registros para crear nuevo registros o valores.
TRANSFORMACIN DE DATOS (NORMALIZACIN). Las transformaciones
consisten principalmente en modificaciones sintcticas llevadas a cabo sobre los
datos.


4.3 TCNICAS PARA IDENTIFICACIN DE CONCEPTOS,
REGLAS Y RELACIONES

Puede decirse que no existen tcnicas o herramientas ampliamente aceptadas para llevar
a cabo, de modo automtico, el anlisis de la documentacin que necesita el IC.
Sin embargo, las escasas tcnicas existentes poseen una filosofa comn: buscar, a
travs de la documentacin, determinados trminos.
Tcnicas en las cuales los trminos son determinados por el IC en tiempo de ejecucin.
Ante el anlisis de un determinado texto, que constituye parte de la documentacin
proporcionada para desarrollar el sistema, establece una serie de trminos que deben ser
buscados, automticamente o no, en el texto.
Tcnicas en las que los trminos a buscar estn preestablecidos por la tcnica y son
dependientes del dominio.
Las tcnicas pertenecientes a la tercera familia (trminos preestablecidos independientes
del dominio) realizan extraccin tanto de conceptos como de relaciones entre los mismos.
Estas tcnicas suelen denominarse de anlisis estructural de textos, dado que extraen
conceptos fundamentales del dominio buscando estructuras preestablecidas.
La tcnica sabe que los conceptos vienen introducidos en estructuras de tipo definicin, o
que las relaciones entre conceptos vienen establecidas en estructuras de tipo afirmacin
relacional
Para poder funcionar el anlisis estructural de textos necesita:
Tener descritas las estructuras textuales interesantes (definicin, afirmacin,...) y el tipo
de conocimientos que aportan (concepto, relacin, caracterstica, valor,...)
Tener descrito el modo de detectar las estructuras en el texto.


TCNICAS DE IDENTIFICACIN
Entrevistas
Consiste en una interaccin sistemtica de un IC con un experto para extraer los
conocimientos de experiencia de ste.
Abiertas
Es una entrevista no estructurada, o abierta, el IC plantea, ms o menos
espontneamente, preguntas al experto.
Estructuradas
El IC, una vez marcado el tema y la profundidad con que se desea tratarlo, planifica todas
las preguntas que debe plantear al experto durante la sesin.
Cuestionarios
En esta tcnica el IC piensa en un concepto/escenario, que el experto debe averiguar.
El experto hace preguntas de tipo SI/NO al IC para descubrir el escenario/concepto.
Observacin de tareas habituales
Con frecuencia, la mejor forma de descubrir cmo hace un juicio un experto, efecta un
diagnstico, o disea una solucin, es observar a un experto trabajar en un problema real
habitual.
Anlisis de protocolos
Anlisis de un protocolo o caso concreto de forma global.
Tres profundidades:
Anlisis del Asunto o Materia (dependencias entre conceptos interrelacionados
que se infieren en secuencia).
Anlisis de Tareas (pasos del procedimiento).
Distinguir el caso dentro de la materia y la tarea asociada.

Emparrillado
Sesin de valoracin y recuerdo. Permite establecer prioridades entre caractersticas
diferenciadoras de elementos.
Incidentes crticos
Una variante es plantear al experto casos crticos imaginarios. Se le pide al experto que
considere un caso cualquiera y se le convierte en un incidente crtico mediante el
planteamiento de situaciones alternativas de la forma: qu pasara si?.
Es muy til para determinar lo inslito.

Clasificacin de conceptos
Esta tcnica es especialmente aconsejable cuando hay un gran nmero de conceptos en
un dominio, de modo que requieren una estructuracin para que sean manejables.


4.4 HERRAMIENTA PARA ANLISIS DEL CONOCIMIENTO,
SELECCIN DE DATOS, EXTRACCIN DE REGLAS.

Una forma comn del almacenamiento del conocimiento de una organizacin son los
documentos. Para poder reutilizar el conocimiento guardado en los documentos es
necesario disponer de herramientas de clasificacin, bsqueda, almacenamiento y
extraccin.


La bsqueda de texto completo es probablemente el mtodo ms conocido y usado al
realizar una bsqueda. La idea detrs de este mtodo es la bsqueda a travs de
documentos de palabras clave. Los motores de bsqueda ms conocidos por el pblico
general son los que se pueden encontrar en Internet, como Google, Yahoo, Altavista,
Lycos, etc. Pero existe una gran variedad de motores de bsqueda, algunos de los cuales
examinaremos con un poco ms de detalle en la seccin Error! No se encuentra el origen
de la referencia., pgina Error! Marcador no definido.. El modo de operar de estos
motores de bsqueda consiste en la construccin de un ndice de palabras claves que se
encuentran en los documentos. Estos ndices creados se hacen corresponder cuando se
realizan bsquedas. Como resultado de la bsqueda se muestran las pginas que tienen
aquellos ndices.

El trabajo en un entorno dinmico exige la obtencin de informacin sobre temas
relacionados en distintos momentos del tiempo. Este es uno de los objetivos de las
herramientas que permiten la distribucin de informacin personalizada (vase seccin
Error! No se encuentra el origen de la referencia., pgina Error! Marcador no definido.).
De forma automtica, el usuario tiene acceso a informacin que ha sido seleccionada
anteriormente, sin necesidad de realizar el mismo tipo de bsqueda ms de una vez.


Portales Corporativos

La creacin de portales, y en concreto de portales del conocimiento, permite aprovechar
la utilizacin de los estndares de Internet e integrar las distintas herramientas de gestin
de datos e informacin. Mediante los portales, los individuos tienen acceso a contenido
personalizado y, adems, son una herramienta que ayuda a crear ambientes
colaborativos.
Cada vez adquiere ms importancia el disponer de un portal corporativo porque facilita el
acceso a una gran cantidad de informacin sin que el usuario tenga que cambiar de
aplicacin para realizar distintas tareas relacionadas con el conocimiento. Otra
particularidad de las herramientas de creacin de portales de conocimiento es que,
indirectamente, se permite el acceso a una cantidad inmensa de informacin que no
necesariamente est depositada en los repositorios de la organizacin, sino que proviene
de fuentes externas. Adems, mediante el acceso personalizado e integrado se permite
que aumente la eficacia en la bsqueda de informacin.

Herramientas de Simulacin

En la mayora de los casos se trata de herramientas que simulan el esquema de
coordinacin de una tarea de trabajo, con lo que se pueden corregir errores sin necesidad
que se hayan producido. Estn basadas en los procesos de pensamiento humano con la
finalidad de poder reproducir sus esquemas principales y corregir los errores que puedan
producirse al planificar una tarea compleja dentro de una organizacin. Son de gran
utilidad para organizaciones que desarrollan complejos proyectos con una gran cantidad
de agentes y dirigidas por directores de proyecto, estos ltimos siendo uno de los
principales usuarios de estas herramientas.


Herramientas de Trabajo en Grupo

Para hacer efectiva una GC dentro de las complejas organizaciones de hoy en da es
necesario disponer de herramientas que permitan generar procesos colaborativos,
distribuir y sincronizar tareas en la organizacin, de forma que se pueda reducir el tiempo
y aumentar la eficacia.
Estas herramientas engloban procesos que podran incluirse dentro de funcionalidades de
bsqueda o de distribucin personalizada de informacin, pero van mucho ms all de
estos para convertirse en paquetes altamente integrados capaces de realizar una gestin
casi integral del conocimiento de la organizacin. Tenemos que mencionar que para que
estas herramientas tan complejas puedan servir a la organizacin en su totalidad en
muchos casos tienen que realizarse cambios no solo organizativos, sino incluso culturales
en la empresa/organizacin en la que se implanten. Las herramientas analizadas incluyen
tantas funciones de relacin sncrona, es decir, que se llevan a cabo en el mismo instante
de tiempo, como funciones de relacin asncrona, sin que sea necesario que las distintas
partes que comparten conocimiento se comuniquen en el mismo instante.

Ejemplos de algunos buscadores de informacin:
Oracle Database Server
http://www.oracle.com/database/index.html
La base de datos de Oracle es una de las herramientas ms potentes del mercado. Es un
repositorio en el cual se integran mltiples aplicaciones capaces de personalizar las
necesidades de cliente. Internet Platform, Oracle 8i y Oracle DataWarehouse son las
principales bases de datos que incluye Database Server.

Lycos Site Spider
http://www.lycos.com/software/software-intranet.html
Permite buscar un determinado contenido en un sitio web. Puede recoger e indexar
informacin automticamente utilizando la base de datos de texto de Inmagic. Adems, es
capaz de actualizar la base de datos a medida que el contenido de un sitio web cambia.
Meridio
http://www.teamware.com/teamware/Products/meridio/meridio.htm

Sistema de gestin de documentos a nivel empresarial. Asegura que la informacin est
protegida de accesos no autorizados y facilita, al mismo tiempo, que los individuos que la
necesiten puedan compartirla.
Interlan Systems
http://www.inter-lan.com/

Sistema de Gestin de la Informacin y del Conocimiento abierto, flexible y adaptable a la
mayora de los estndares informticos actuales, que permite ofrecer servicio y optimizar
la gestin empresarial de medianas y grandes empresas que necesiten clasificar,
archivar, publicar, traducir y buscar la informacin de una manera personalizada, rpida y
sencilla en distintos idiomas. Inter-Search es un mdulo que permite buscar la informacin
dentro de la Intranet y obtener los resultados de la bsqueda de forma estructurada.



CONCLUSION
En trminos generales la minera de datos engloba a todas aquellas tcnicas de anlisis
de datos que permite mejorar la calidad de un conjunto de datos de modo que las tcnicas
de extraccin de conocimiento/minera de datos puedan obtener mayor y mejor
informacin (mejor porcentaje de clasificacin, reglas con ms completitud, etc.)




REFERENCIAS

Herramientas de gestin del conocimiento
http://www.tdx.cat/bitstream/handle/10803/127223/Tdlf1de1.pdf?sequence=2
Introduccin a la minera de datos
http://www.redalyc.org/pdf/944/94402303.pdf

Vous aimerez peut-être aussi