Vous êtes sur la page 1sur 4

Datamining (Minera de datos)

El datamining (minera de datos), es el conjunto de tcnicas y tecnologas que permiten


explorar grandes bases de datos, de manera automtica o semiautomtica, con el
objetivo de encontrar patrones repetitivos, tendencias o reglas que expliquen el
comportamiento de los datos en un determinado contexto.
Bsicamente, el datamining surge para intentar ayudar a comprender el contenido de un
repositorio de datos. Con este fin, hace uso de prcticas estadsticas y, en algunos casos,
de algoritmos de bsqueda prximos a la Inteligencia Artificial y a las redes neuronales.
De forma general, los datos son la materia prima bruta. En el momento que el usuario
les atribuye algn significado especial pasan a convertirse en informacin. Cuando los
especialistas elaboran o encuentran un modelo, haciendo que la interpretacin que
surge entre la informacin y ese modelo represente un valor agregado, entonces nos
referimos al conocimiento. Vea ms diferencias entre datos, informacin y
conocimiento.
Aunque en datamining cada caso concreto puede ser radicalmente distinto al anterior,
el proceso comn a todos ellos se suele componer de cuatro etapas principales:
Determinacin de los objetivos. Trata de la delimitacin de los objetivos que el
cliente desea bajo la orientacin del especialista en data mining.
Preprocesamiento de los datos. Se refiere a la seleccin, la limpieza, el
enriquecimiento, la reduccin y la transformacin de las bases de datos. Esta etapa
consume generalmente alrededor del setenta por ciento del tiempo total de un
proyecto de datamining.
Determinacin del modelo. Se comienza realizando unos anlisis estadsticos de los
datos, y despus se lleva a cabo una visualizacin grfica de los mismos para tener una
primera aproximacin. Segn los objetivos planteados y la tarea que debe llevarse a
cabo, pueden utilizarse algoritmos desarrollados en diferentes reas de la Inteligencia
Artificial.
Anlisis de los resultados. Verifica si los resultados obtenidos son coherentes y los
coteja con los obtenidos por los anlisis estadsticos y de visualizacin grfica. El cliente
determina si son novedosos y si le aportan un nuevo conocimiento que le permita
considerar sus decisiones.

OLAP (CUBOS OLAP)
El trmino OLAP, que proviene de Online Analitical Processing (Procesamiento Analtico
en Lnea), define a una tecnologa que se basa en el anlisis multidimensional de los
datos y que le permite al usuario tener una visin ms rpida e interactiva de los
mismos.
Este anlisis, tambin conocido como anlisis del hipercubo, organiza la informacin
segn los parmetros que se consulten, de manera tal que a partir de estructuras
multidimensionales que contienen los datos resumidos de Sistemas Transaccionales,
conocidos como OLTP (Online Transactional Processing) o de grandes bases, se obtendr
la informacin requerida.
Es muy utilizado en el rea de marketing, ventas, informes, etc., especialmente porque
las respuestas a consultas complejas se obtienen muy rpidamente y adems porque
puede obtener los datos tanto de una fuente externa como de una base interna.
Hay diversos tipos de implementaciones de la tecnologa OLAP, las que varan segn el
tipo de motor en el que se almacenan los datos. De esta manera, podemos clasificarlas
como ROLAP, que almacena los datos en un motor relacional por lo que se puede tener
un acceso veloz a ellos; MOLAP, que almacena los datos en una base de datos
multidimensional y DOLAP, que guarda los datos en el escritorio, los que obtiene a partir
de una base de datos relacional.
Cubos OLAP: Bsicamente, el Cubo OLAP, es una base de datos que posee
diversas dimensiones, ampliando las posibilidades que hasta el momento ofrecan las
conocidas hojas de clculo.
En este modelo los datos son vistos como cubos los cuales consisten
en categora descriptivas (dimensiones) y valores cuantitativos (medidas).
Es un modelo multidimensional de datos, que simplifica a los usuarios
realizar consultas complejas, arreglar datos en un reporte, cambiar de datos
resumidos a datos detallados, etc.
Los Cubos OLAP son vectores en los cuales se dispone la informacin, y gracias a
esta ordenada jerarqua es posible llevar a cabo un anlisis rpido de los datos
El OLTP (Procesamiento de Transacciones En Lnea) es una clase de programa
que facilita y gestiona aplicaciones orientadas a transacciones, tpicamente para
ingreso de datos y retencin de transacciones en varias industrias, incluyendo
banca, aerolneas, correo, supermercados y productores. Probablemente el
producto OLTP instalado ms distribuido es el CICS (Sistema de Control de
Informacin de Clientes) de IBM.
El proceso de transacciones en lnea de hoy en da requiere cada vez ms el
apoyo para transacciones que abarcan una red y pueden incluir ms de una
compaa. Por esta razn, los nuevos software de OTLP usan un procesamiento
cliente/servidor y un software intermediario que permite que las transacciones
se den en diferentes plataformas computacionales en una red.
ERP (SISTEMAS DE PLANIFICACION DE RECURSOS EMPRESARIALES)
Los sistemas de planificacin de recursos empresariales, o ERP (Enterprise
Resource Planning) son sistemas de informacin gerenciales que integran y
manejan muchos de los negocios asociados con las operaciones de produccin y
de los aspectos de distribucin de una compaa en la produccin de bienes o ser
vicios .Los sistemas ERP tpicamente manejan la produccin, logstica,
distribucin, inventario, envos, facturas y contabilidad de la compaa de forma
modular. Sin embargo, la Planificacin de Recursos Empresariales o el software
ERP puede intervenir en el control de muchas actividades de negocios como
ventas, entregas, pagos, produccin, administracin de inventarios, calidad de
administracin y la administracin de recursos humanos vicio
Los ERP funcionaban ampliamente en las empresas. Entre sus mdulos ms
comunes se encuentran el de manufactura o produccin, almacenamiento,
logstica e informacin tecnolgica, incluyen adems la contabilidad, y suelen
incluir un sistema de administracin de recursos humanos, y herramientas
de mercadotecnia y administracin estratgica
Los sistemas ERP son llamados ocasionalmente back office (trastienda) ya que
indican que el cliente y el pblico general no estn directamente involucrados.
Este sistema es, en contraste con el sistema de apertura de datos (front office),
que crea una relacin administrativa del consumidor o servicio al consumidor
(CRM) .
un sistema que trata directamente con los clientes, o con los sistemas de
negocios electrnicos tales como comercio electrnico, administracin
electrnica, telecomunicaciones electrnicas y finanzas electrnicas; asimismo,
es un sistema que trata directamente con los proveedores, no estableciendo
nicamente una relacin administrativa con ellos (SRM).

Vous aimerez peut-être aussi