El datamining (minera de datos), es el conjunto de tcnicas y tecnologas que permiten
explorar grandes bases de datos, de manera automtica o semiautomtica, con el objetivo de encontrar patrones repetitivos, tendencias o reglas que expliquen el comportamiento de los datos en un determinado contexto. Bsicamente, el datamining surge para intentar ayudar a comprender el contenido de un repositorio de datos. Con este fin, hace uso de prcticas estadsticas y, en algunos casos, de algoritmos de bsqueda prximos a la Inteligencia Artificial y a las redes neuronales. De forma general, los datos son la materia prima bruta. En el momento que el usuario les atribuye algn significado especial pasan a convertirse en informacin. Cuando los especialistas elaboran o encuentran un modelo, haciendo que la interpretacin que surge entre la informacin y ese modelo represente un valor agregado, entonces nos referimos al conocimiento. Vea ms diferencias entre datos, informacin y conocimiento. Aunque en datamining cada caso concreto puede ser radicalmente distinto al anterior, el proceso comn a todos ellos se suele componer de cuatro etapas principales: Determinacin de los objetivos. Trata de la delimitacin de los objetivos que el cliente desea bajo la orientacin del especialista en data mining. Preprocesamiento de los datos. Se refiere a la seleccin, la limpieza, el enriquecimiento, la reduccin y la transformacin de las bases de datos. Esta etapa consume generalmente alrededor del setenta por ciento del tiempo total de un proyecto de datamining. Determinacin del modelo. Se comienza realizando unos anlisis estadsticos de los datos, y despus se lleva a cabo una visualizacin grfica de los mismos para tener una primera aproximacin. Segn los objetivos planteados y la tarea que debe llevarse a cabo, pueden utilizarse algoritmos desarrollados en diferentes reas de la Inteligencia Artificial. Anlisis de los resultados. Verifica si los resultados obtenidos son coherentes y los coteja con los obtenidos por los anlisis estadsticos y de visualizacin grfica. El cliente determina si son novedosos y si le aportan un nuevo conocimiento que le permita considerar sus decisiones.
OLAP (CUBOS OLAP) El trmino OLAP, que proviene de Online Analitical Processing (Procesamiento Analtico en Lnea), define a una tecnologa que se basa en el anlisis multidimensional de los datos y que le permite al usuario tener una visin ms rpida e interactiva de los mismos. Este anlisis, tambin conocido como anlisis del hipercubo, organiza la informacin segn los parmetros que se consulten, de manera tal que a partir de estructuras multidimensionales que contienen los datos resumidos de Sistemas Transaccionales, conocidos como OLTP (Online Transactional Processing) o de grandes bases, se obtendr la informacin requerida. Es muy utilizado en el rea de marketing, ventas, informes, etc., especialmente porque las respuestas a consultas complejas se obtienen muy rpidamente y adems porque puede obtener los datos tanto de una fuente externa como de una base interna. Hay diversos tipos de implementaciones de la tecnologa OLAP, las que varan segn el tipo de motor en el que se almacenan los datos. De esta manera, podemos clasificarlas como ROLAP, que almacena los datos en un motor relacional por lo que se puede tener un acceso veloz a ellos; MOLAP, que almacena los datos en una base de datos multidimensional y DOLAP, que guarda los datos en el escritorio, los que obtiene a partir de una base de datos relacional. Cubos OLAP: Bsicamente, el Cubo OLAP, es una base de datos que posee diversas dimensiones, ampliando las posibilidades que hasta el momento ofrecan las conocidas hojas de clculo. En este modelo los datos son vistos como cubos los cuales consisten en categora descriptivas (dimensiones) y valores cuantitativos (medidas). Es un modelo multidimensional de datos, que simplifica a los usuarios realizar consultas complejas, arreglar datos en un reporte, cambiar de datos resumidos a datos detallados, etc. Los Cubos OLAP son vectores en los cuales se dispone la informacin, y gracias a esta ordenada jerarqua es posible llevar a cabo un anlisis rpido de los datos El OLTP (Procesamiento de Transacciones En Lnea) es una clase de programa que facilita y gestiona aplicaciones orientadas a transacciones, tpicamente para ingreso de datos y retencin de transacciones en varias industrias, incluyendo banca, aerolneas, correo, supermercados y productores. Probablemente el producto OLTP instalado ms distribuido es el CICS (Sistema de Control de Informacin de Clientes) de IBM. El proceso de transacciones en lnea de hoy en da requiere cada vez ms el apoyo para transacciones que abarcan una red y pueden incluir ms de una compaa. Por esta razn, los nuevos software de OTLP usan un procesamiento cliente/servidor y un software intermediario que permite que las transacciones se den en diferentes plataformas computacionales en una red. ERP (SISTEMAS DE PLANIFICACION DE RECURSOS EMPRESARIALES) Los sistemas de planificacin de recursos empresariales, o ERP (Enterprise Resource Planning) son sistemas de informacin gerenciales que integran y manejan muchos de los negocios asociados con las operaciones de produccin y de los aspectos de distribucin de una compaa en la produccin de bienes o ser vicios .Los sistemas ERP tpicamente manejan la produccin, logstica, distribucin, inventario, envos, facturas y contabilidad de la compaa de forma modular. Sin embargo, la Planificacin de Recursos Empresariales o el software ERP puede intervenir en el control de muchas actividades de negocios como ventas, entregas, pagos, produccin, administracin de inventarios, calidad de administracin y la administracin de recursos humanos vicio Los ERP funcionaban ampliamente en las empresas. Entre sus mdulos ms comunes se encuentran el de manufactura o produccin, almacenamiento, logstica e informacin tecnolgica, incluyen adems la contabilidad, y suelen incluir un sistema de administracin de recursos humanos, y herramientas de mercadotecnia y administracin estratgica Los sistemas ERP son llamados ocasionalmente back office (trastienda) ya que indican que el cliente y el pblico general no estn directamente involucrados. Este sistema es, en contraste con el sistema de apertura de datos (front office), que crea una relacin administrativa del consumidor o servicio al consumidor (CRM) . un sistema que trata directamente con los clientes, o con los sistemas de negocios electrnicos tales como comercio electrnico, administracin electrnica, telecomunicaciones electrnicas y finanzas electrnicas; asimismo, es un sistema que trata directamente con los proveedores, no estableciendo nicamente una relacin administrativa con ellos (SRM).