Vous êtes sur la page 1sur 23

OPTIMIZACIN DE LA ESTRUCTURA DE

BASE DE DATOS

Estructura de contenidos

INTRODUCCIN........................................................................3

1. APLICACIN Y DISEO DE BASE DE DATOS..............................3

1.1 Normalizar la base de datos.................................................3

1.2 Desnormalizar la base de datos..............................................8

2. LA OPTIMIZACIN DE CONSULTAS...........................................9

2.1 Consultas SQL basadas en el lgebra relacional........................10

2.1.1 Operaciones del Algebra Relacional......................................10

2.2 Seleccin de ndices.............................................................18

2.3 Estimacin de Costes............................................................20

FAVA - Formacin en Ambientes Virtuales de Aprendizaje SENA - Servicio Nacional de Aprendizaje


DISEO E IMPLEMENTACIN DE CUBOS DE DATOS
Mapa conceptual

2
FAVA - Formacin en Ambientes Virtuales de Aprendizaje SENA - Servicio Nacional de Aprendizaje
Diseo e Implementacin de Cubos de Datos

INTRODUCCIN

La bsqueda de un nivel ptimo de rendimiento en los servicios asociados


a las bases de datos, es una constante para lograr el mantenimiento
proactivo que debe proveer el administrador de las bases de datos.

Consecuentemente una de las tareas a implementar es la verificacin


de la estructura de la base de datos y el desarrollo de acciones que
permitan optimizarla, para esto deben ser revisados temas asociados a
la normalizacin y desnormalizacin de la base de datos, ya que una
estructura deficiente puede incidir en que las consultas a los datos
relacionados no puedan realizarse de una manera ptima y deterioren el
nivel de respuesta esperado.

Otro aspecto a analizar es el uso de herramientas que permitan optimizar


las consultas, as como la creacin y uso apropiado de ndices para el
mejoramiento del rendimiento en la ejecucin de consultas. Al tener
consultas de larga duracin se consumen recursos del sistema que hacen
que el servidor y las aplicaciones funcionen con lentitud, desencadenando
otros problemas y por tanto es necesario adoptar diferentes estrategias
para buscar la ejecucin ms eficiente de las consultas.

1. APLICACIN Y DISEO DE BASE DE DATOS

Las tcnicas que permiten optimizar el diseo de una base de datos han
evolucionado a medida que se desarrollan ms aplicaciones. Las tcnicas
se basan en la aplicacin de la normalizacin para el desarrollo de bases
de datos, junto con una estrecha colaboracin entre los administradores
de bases y desarrolladores de aplicaciones, as como tcnicas de trabajo,
tanto en pre-produccin como en los sistemas terminados.

1.1 Normalizar la base de datos

1.1.1 Introduccin

El objetivo de la normalizacin es la construccin de un esquema de base


de datos que satisfacen propiedades de las formas normales.

Un esquema mal definido en la etapa de diseo puede conducir a una

3
FAVA - Formacin en Ambientes Virtuales de Aprendizaje SENA - Servicio Nacional de Aprendizaje
Diseo e Implementacin de Cubos de Datos

serie de anomalas durante la fase operativa, tales como duplicacin


de la informacin y anomalas durante las operaciones de actualizacin
(insertar, suprimir, modificar).

Estas anomalas no aparecern si se descompone la base de datos desde


el principio.

El proceso de normalizacin implementa la aplicacin de una serie de


reglas conocidas como las formas normales. Las tres primeras formas
normales ayudan a evitar la redundancia de informacin y a mejorar
el rendimiento de la base de datos, especficamente en las consultas.
Estas formas normales se basan en las dependencias funcionales entre
los atributos de un esquema de base de datos.

1.1.2 Primera forma normal (1FN).

Una tabla se encuentra en primera forma normal cuando sus atributos no


contienen grupos de repeticin.

A continuacin se presenta un ejemplo de aplicacin de las formas


normales con una base de datos para una institucin educativa.

En la estructura de la tabla, indicada en la siguiente figura se tiene un


grupo de repeticin y por tanto no est en primera Forma Normal.

Alumnos

Nombres
NoMatricula
FechaNacimiento
NombrePapa
NombreMama

Una tabla con esta estructura presentan varios problemas. Por ejemplo,
si una pareja tiene ms de un nio en la misma institucin, debemos

4
FAVA - Formacin en Ambientes Virtuales de Aprendizaje SENA - Servicio Nacional de Aprendizaje
introducir el nombre del Padre y la Madre varias veces por cada nio.
Esto forma un grupo de repeticin. Por otra parte se puede presentar un
error tipogrfico en el nombre del Padre, si no se introduce exactamente
el mismo nombre todo el tiempo, se pueden causar problemas cuando
ejecuten bsquedas as como en la presentacin de informes.

Este problema se produce porque combinamos informacin en la misma


tabla. Ponemos la informacin de los padres y los nios en la misma
tabla. La solucin para este problema es simple: crear una tabla separada
para la informacin de los padres, que se relacionan con la tabla de los
Alumnos a travs de una relacin uno a muchos, es decir, una pareja de
padres puede tener varios hijos.

Observe en la siguiente figura la relacin de padres y alumnos


(representando los hijos).

Alumnos Padres
1
Documento Codigo
Nombre Nombrepadre
NoMatricula Nombremadre
FechaNacimiento Direccion
Padres Telefono

Las dos tablas resultantes de la aplicacin de la Primera Forma Normal:


Padres y alumnos estn ahora en primera forma normal.

1.1.3 Segunda forma normal (2FN).

Se produce cuando la clave principal est compuesta por ms de un


campo. En este caso, todos los campos que dependan funcionalmente de
la clave principal forman una tabla y los campos que no se identifiquen
con la clave principal deben pertenecer a otra tabla.

Continuando con el ejemplo, ahora se tiene la tabla Cursos:

5
FAVA - Formacin en Ambientes Virtuales de Aprendizaje SENA - Servicio Nacional de Aprendizaje
Diseo e Implementacin de Cubos de Datos

Cursos

NoMatricula
CodCurso
Nombre
Descripcion

Esta tabla tiene una clave primaria compuesta y no est en segunda forma
normal.

La clave principal est formada por la combinacin de campos NoMatricula


y CodCurso. Al evaluar que campos dependen de la clave primaria, se
obtiene que el campo Descripcin slo depende del campo CodCurso,
es decir, que con el cdigo de curso es posible encontrar su descripcin,
independientemente del valor de NoMatricula. Por tanto este campo que
no es parte de la clave primaria y depende solamente de uno de los
campos que constituye la clave primaria compuesta, por lo que se puede
afirmar que este cuadro no est en Segunda forma normal.

Para solucionar esta situacin: se divide la tabla que no est en la segunda


forma normal en otras dos tablas, como se muestra en la siguiente figura,
y las dos tablas resultantes se encuentran en segunda forma normal.

Matriculas Cursos

NoMatricula CodCurso
CodCurso Descripcion
Nombre

Obteniendo Matriculas y Cursos en tablas separadas.

6
FAVA - Formacin en Ambientes Virtuales de Aprendizaje SENA - Servicio Nacional de Aprendizaje
Diseo e Implementacin de Cubos de Datos

En conclusin la segunda forma est conectada con la aparicin de claves


primarias compuestas.

1.1.4 Tercera forma normal (3FN).

La tercera forma normal revisa la dependencia funcional de los campos


con aquellos que no son clave, si esto ocurre, se deben extraer de la
tabla, sin que se pierda el vnculo existente con las tablas.

En el siguiente ejemplo algunos campos no dependen directamente de


la clave principal o parte de ella, sino que depende de otro campo de la
tabla, por tanto decimos que la tabla no est en tercera forma normal.

Funcionarios

NoMatricula
NomFuncionario
CodCargo
DescripCargo

El campo DesCargo slo depende del CodCargo, que no forma parte de la


clave principal, por eso se puede afirmar que la tabla no est en tercera
forma normal.

Para solucionar este problema se debe dividir la tabla en otras dos, como
se indica en la siguiente figura. Las dos tablas resultantes se encuentran
en tercera forma normal.

7
FAVA - Formacin en Ambientes Virtuales de Aprendizaje SENA - Servicio Nacional de Aprendizaje
Diseo e Implementacin de Cubos de Datos

Funcionarios Cursos

NoMatricula CodCurso
NomFuncionario DescripCargo
CodCurso

Como resultado del proceso de normalizacin, se obtiene un mayor


nmero de tablas, pero sin redundancia y problemas de inconsistencia de
los datos.

1.1.5 Consideraciones finales y problemas de la normalizacin.

La teora de la normalizacin nos ayuda a estructurar mejor las tablas de


la base de datos, evitando posibles redundancias.

Mientras la normalizacin resuelve los problemas relacionados con la


estructuracin de los datos en tablas, crea problemas aadidos a su propio
concepto, como es la ineficacia en la recuperacin de informacin.

As, el proceso de normalizacin envuelve la descomposicin de una tabla


en tablas ms pequeas, lo cual requiere que la clave primaria de la tabla
original se incluya, como una clave fornea, en las nuevas tablas que
se forman. Esto significa que a medida que se van creando estas claves
forneas se va incrementando las probabilidades de poner en peligro la
integridad de la base de datos.

Otro efecto adicional al nmero creciente de tablas en la base de datos,


es que se ve disminuido el rendimiento del sistema en la recuperacin
de la informacin contenida, por tanto, en ciertas ocasiones es necesario
llegar a un equilibrio entre el nivel de normalizacin de la base de datos y
el rendimiento del sistema.

1.2 Desnormalizar la base de datos

Aunque la normalizacin se considera el objetivo del modelado de una


base de datos, eliminando la redundancia y dependencias incoherentes

8
FAVA - Formacin en Ambientes Virtuales de Aprendizaje SENA - Servicio Nacional de Aprendizaje
Diseo e Implementacin de Cubos de Datos

entre las tablas, la desnormalizacin es decir, la duplicacin de registros


para acelerar la recuperacin de datos, puede ser til en algunos casos:

 uando las consultas ms importantes se refieren a datos de varias


C
tablas.

Cuando los clculos se debe realizar en una o ms columnas.

 i las tablas se debe consultar de diferentes maneras por diferentes


S
usuarios en el mismo perodo.

Si algunas tablas se utilizan con mucha frecuencia.

Para evaluar la opcin de desnormalizar, se deben analizar las necesidades


en de acceso a los datos por las aplicaciones en su entorno y en funcin
de su rendimiento. En la mayora de los casos, los problemas potenciales
de rendimiento pueden ser resueltos por una poltica de indexacin y el
uso alternativo de la desnormalizacin.

La desnormalizacin puede hacerse de diferentes formas:

Particionamiento horizontal: se utiliza para dividir una tabla en


varias tablas que contienen las mismas columnas, pero menos filas.

 l particionamiento vertical: una tabla que se utiliza para dividir


E
en tablas separadas que contienen el mismo nmero de filas, pero
menos columnas.

FusionTables: Tablas que se pueden combinar para eliminar la


unin entre ellos.

 olumna de desnormalizacin: Se repite una columna en varias


C
tablas para evitar tener que crear combinaciones entre tablas.

2. LA OPTIMIZACIN DE CONSULTAS

En Bases de datos relacionales el lenguaje de consultas SQL es lo ms


utilizado por los programadores y desarrolladores para obtener informacin
de la Base de datos. La complejidad que pueden alcanzar algunas
consultas puede ser tal, que el diseo de una consulta puede tomar un
tiempo considerable, obteniendo no siempre una respuesta optima.

9
FAVA - Formacin en Ambientes Virtuales de Aprendizaje SENA - Servicio Nacional de Aprendizaje
Diseo e Implementacin de Cubos de Datos

El xito de un proyecto de software depende de la experiencia y habilidad


del personal en el desarrollo.

Es una tcnica para ahorro de tiempo en las consulta a travs del algebra
relacional

2.1 Consultas SQL basadas en el lgebra relacional

En esta seccin se revisarn los principales operadores del lgebra relacional


como una base para el desarrollo y el anlisis (Plan de Implementacin)
consultas.

El buen conocimiento de lgebra relacional ayuda a disear cualquier


consulta aunque sea demasiado complejo para implementar, utilizando el
lenguaje SQL. Las operaciones bsicas del lgebra relacional son (unin,
interseccin, diferencia, producto cartesiano) y luego operaciones propias
(proyeccin, seleccin, unin, la divisin). Tambin se presentan las
operaciones de clculo, agrupacin, recuento y clasificacin.

2.1.1 Operaciones del Algebra Relacional

2.1.1.1 Proyeccin

Esta operacin permite extraer columnas (atributos) de una relacin,


dando como resultado un subconjunto vertical de atributos de la relacin.

La notacin utilizada para representar esta operacin es:

PROYECCIN = (R1, lista de atributos)

Donde R1, representa una relacin (tabla).

Ejemplo

10
FAVA - Formacin en Ambientes Virtuales de Aprendizaje SENA - Servicio Nacional de Aprendizaje
Diseo e Implementacin de Cubos de Datos

PRODUCTOS
Nombre Marca Precio
procesador AMD $500.000
procesador INTEL $600.000
procesador INTEL $50.000
Memoria USB OCZ $50.000

R1 R2

R1 = PROYECCIN (PRODUCTOS, Nombre)

PRODUCTOS
Nombre
procesador
Memoria USB

R1 PROYECCIN (PRODUCTOS, Nombre)

R2 = PROYECCIN (PRODUCTOS, Nombre, Marca)

PRODUCTOS
Nombre Marca
procesador AMD
procesador INTEL
Memoria USB OCZ

R2 PROYECCIN (PRODUCTOS, Nombre, Marca)

11
FAVA - Formacin en Ambientes Virtuales de Aprendizaje SENA - Servicio Nacional de Aprendizaje
Diseo e Implementacin de Cubos de Datos

Este operador se aplica slo a una relacin y permite seleccionar slo


ciertos atributos especficos de una relacin, obteniendo todas las tuplas
de la relacin sin duplicados.

2.1.1.2 Seleccin

Permite seleccionar de una relacin (R) un subconjunto de tuplas que


cumplan con la(s) condicin(es) P.

La notacin utilizada para representar esta operacin es:

R = SELECT (R1, condicin)

Ejemplo:

PRODUCTOS
Especies Categora Embalaje
Rosa Preservar Frasco
Rosa Seco Frasco
Sombrilla Costos Caja
Rosa Seco La bolsa de plstico

R3

R3 = SELECT (PRODUCTOS, Categora = seco)

PRODUCTOS
Especies Categora Embalaje
Rosa Seco Frasco
Rosa Seco La bolsa de plstico

R3 SELECT (PRODUCTOS, Categora = "seco")

12
FAVA - Formacin en Ambientes Virtuales de Aprendizaje SENA - Servicio Nacional de Aprendizaje
Diseo e Implementacin de Cubos de Datos

Este operador se aplica slo a una relacin.

Permite seleccionar slo las tuplas que cumplen una condicin que se
expresa utilizando los operadores aritmticos (=,>, <,> =, <=, <>) o la
lgica bsica (AND, OR y NOT).

Todos los atributos de la relacin se mantienen.

2.1.1.2 Operacin de unin

La operacin unin natural en el lgebra relacional es la que permite


reconstruir las tablas originales previas al proceso de normalizacin,
tomando la informacin de dos relaciones con un vnculo que corresponde
a una igualdad de atributos o los atributos de relacin llave Primaria <->
llave Fornea.

Notacin:

R = JOIN (R1, R2, la condicin de la igualdad entre los


atributos)

Ejemplo:

PRODUCTOS DETALLE
CodPrd Descripcin Precio por unidad No. CodPrd Cantidad
590A HD 1.6 GB $ 161.500 97001 590A 2
588J Escner HP $ 170.000 97002 515J 4
515J LBP 660 $ 182.000 97003 515J 3

R = JOIN (PRODUCTO,DETALLE,producto.codprd=detalle.codprd)

13
FAVA - Formacin en Ambientes Virtuales de Aprendizaje SENA - Servicio Nacional de Aprendizaje
Diseo e Implementacin de Cubos de Datos

CodPrd Descripcin Precio por unidad No. CodPrd Cantidad


590A HD 1.6 GB $ 161.500 97001 590A 2
588J Escner HP $ 170.000 97002 515J 4
515J LBP 660 $ 182.000 97003 515J 3

R JOIN (PRODUCTO,DETALLE,producto.codprd=detalle.codprd)

ste operador incluye dos relaciones deben tener al menos un


E
atributo definido en el mismo campo (todos los valores permitidos
para un atributo).

 a condicin de unin puede ser aproximadamente igual a uno o


L
ms atributos definidos en la misma zona (pero no necesariamente
con el mismo nombre).

 as tuplas de la relacin resultado se forman por la concatenacin


L
de las tuplas de las relaciones de origen que cumplan la condicin
de combinacin.

Se pueden utilizar tambin condiciones al comando de unin como (<,>,


<=,> =, <>).

2.1.1.3 Interseccin

La interseccin, como en la teora de conjuntos, corresponde al conjunto de


todas las tuplas que estn en R y en S, siendo R y S uniones compatibles.

R = interseccin (R1, R2)

Ejemplo:

14
FAVA - Formacin en Ambientes Virtuales de Aprendizaje SENA - Servicio Nacional de Aprendizaje
Diseo e Implementacin de Cubos de Datos

Profesores Profesores
Cdigo Nombre Sindicales
1 DIEGO
Cdigo Nombre
3 DURAND 1 DIEGO
4 MARTIN 4 MARTIN
5 BERTRAND 6 MICHEL

R2

Se requiere saber que profesores son sindicales.

R2 = interseccin (E1, E2)

Profesores
Cdigo Nombre
1 DIEGO
4 MARTIN

R2 interseccin (E1, E2)

Este operador incluye dos relaciones de patrn similar.

La relacin resultado tiene los atributos de las relaciones de origen y las


tuplas comunes a cada uno.

2.1.1.4 Diferencia

La diferencia de dos relaciones, corresponde a las tuplas de una que no


tienen correspondencia con la otra relacin. Dadas las relaciones R y S, se
denota la diferencia as:

15
FAVA - Formacin en Ambientes Virtuales de Aprendizaje SENA - Servicio Nacional de Aprendizaje
Diseo e Implementacin de Cubos de Datos

R = DIFERENCIA (R, S)

Ejemplo:

Profesores Profesores
Cdigo Nombre Sindicales
Cdigo Nombre
1 DIEGO
3 DURAND 1 DIEGO
4 MARTIN 4 MARTIN
5 BERTRAND 6 MICHEL

R3

Se desea obtener una lista de profesores que no son representantes


sindicales.

DIFERENCIA R3 = (E1, E2)

Profesores
Cdigo Nombre
3 DURAND
5 BERTRAND

R3 (E1, E2)

Este operador incluye dos relaciones de patrn similar.

La relacin resultado tiene los atributos de las relaciones de origen y las


tuplas de la primera relacin que no pertenece a la segunda.

16
FAVA - Formacin en Ambientes Virtuales de Aprendizaje SENA - Servicio Nacional de Aprendizaje
Diseo e Implementacin de Cubos de Datos

2.1.1.6 Producto

Corresponde a una combinacin de todas las tuplas de R con cada una de


las tuplas de S, y sus atributos corresponden a los de R seguidos por los
de S.

R = PRODUCTO (R1, R2)

Ejemplo:

Estudiantes Pruebas
Cdigo Nombre Curso Crdi
101 DURAND Informtica 2
102 MARTIN Matemticas 3
Financiera 5

Producto
Cdigo Nombre Curso Crditos
101 DURAN Informtica 2
101 DURAN Matemticas 3
101 DURAN Financiera 5
102 MARTIN Informtica 2
102 MARTIN Matemticas 3
102 MARTIN Financiera 5

R Comentario = PRODUCTO (Estudiantes, Eventos)

17
FAVA - Formacin en Ambientes Virtuales de Aprendizaje SENA - Servicio Nacional de Aprendizaje
Diseo e Implementacin de Cubos de Datos

Este operador incluye dos relaciones.

El resultado tiene relacin con los atributos de cada una de las relaciones
de origen y sus tuplas se forman mediante la concatenacin de cada tupla
de la primera relacin con todas las tuplas de la segunda.

2.2 Seleccin de ndices

Un ndice es una lista (encabezados) e indicadores asociados que permite


la ubicacin de datos en una base de datos.

Todos los sistemas de gestin de bases de datos actuales utilizan los


ndices para acelerar el tiempo de respuesta de las consultas. El tipo ms
simple del ndice es una lista ordenada ligada a los contenidos de una
columna en particular de una tabla, con punteros a la lnea de la tabla
asociada con el valor del ndice original. Un ndice permite que varias
lneas en una tabla que satisfacen una condicin, puedan ser localizadas
rpidamente. Normalmente, los ndices se almacenan en la estructura
de datos comunes (como los rboles-B o listas enlazadas). Cada ndice
ocupa un espacio y, adems, un ndice debe ser actualizado cada vez que
se realicen operaciones de insercin o borrado sobre los campos en los
que se construy.

Si bien un ndice ahorra tiempo en las consultas sobre los datos, aumenta
el costo de insercin y actualizacin.

2.2.1 Finalidad de los ndices

Los objetivos principales para construir un ndice pueden resumirse as:

Optimizar el tiempo de respuesta de una consulta

 ara asegurar la unicidad de los valores para una columna o un


P
conjunto de columnas

La utilizacin de ndices es muy recomendable para mejorar el rendimiento


de las consultas, generalmente uno de los primeros ndices en las tablas
es la clave principal. Para construir los ndices se requiere tener los
privilegios necesarios, as que por lo general esta actividad la realizan los
administradores de la BD.

18
FAVA - Formacin en Ambientes Virtuales de Aprendizaje SENA - Servicio Nacional de Aprendizaje
Diseo e Implementacin de Cubos de Datos

2.2.2 Cuando se utiliza un ndice

Los SMBD automticamente utilizan los ndices, identificando las columnas


a indexar y el tipo de contenido. Algunas de las normas que le permiten
decidir cundo utilizar el ndice se presentan a continuacin:

La columna indizada debe estar referenciada en la clusula WHERE.

Ejemplo:

SELECT nombre, apellido, direccin


FROM empleado
En la consulta anterior no se utiliza el ndice porque no tiene
ninguna clusula WHERE.
La siguiente consulta utiliza el ndice creado para la columna
Apellido:
SELECT *
FROM Empleado
WHERE Apellido=Rodrguez
 l ndice no se utiliza si a la columna se hace referencia con una
E
funcin.

En el ejemplo siguiente, si existiese un ndice sobre la columna fecha no


se utilizara debido a que la columna es parte de una funcin:

SELECT *
FROM Empleado
WHERE FUNCION (fecha) > 100
En el ejemplo siguiente, el ndice no se utilizara porque la
columna es parte de una expresin:
SELECT *
FROM Empleado
WHERE fecha+7=30-jun-2012

2.2.3 Los ndices y combinaciones

Si no hay ndices en las columnas que sirven para llevar a cabo la unin
equivalente, se realiza una operacin de SORT / MERGE para responder a
la consulta. Esto significa que cada tabla se ordena por separado, y luego
las dos se unen.

19
FAVA - Formacin en Ambientes Virtuales de Aprendizaje SENA - Servicio Nacional de Aprendizaje
Diseo e Implementacin de Cubos de Datos

2.3 Estimacin de Costes

Para llevar a cabo esta optimizacin, se requiere informacin especfica


estrictamente dependiente del sistema y pueden incluir cosas tales como
el tamao del archivo, la estructura de los mismos, la disponibilidad de
los ndices, el porcentaje de registros para recuperar de cada tabla, etc.

Dado que el objetivo de cualquier optimizacin es reducir al mnimo el


nmero de registros extrados y el tiempo de extraccin, se utiliza para el
proceso de optimizacin informacin sobre la estructura de base de datos
y la distribucin de datos, con lo cual se asigna un costo, estimado en
trminos de tiempo y el nmero de registros que se extrae de cada tabla
as como el nmero de accesos para cada operacin.

Se evala a partir de la suma total de estos costos y se puede seleccionar


la mejor secuencia para la extraccin eficiente de los datos.

Los costos se asignan ms o menos en funcin de toda la informacin


que el sistema mantiene en las tablas, archivos, etc. Esta informacin
requiere tiempo y recursos, por lo que cada sistema almacena un bloque
de informacin y actualiza (reconstruccin) de vez en cuando. Si en la base
de datos se lleva a cabo muchas operaciones que implican la destruccin
y reconstruccin de varias tablas de cero, la eficacia de este mtodo de
optimizacin estar seriamente comprometida.

20
FAVA - Formacin en Ambientes Virtuales de Aprendizaje SENA - Servicio Nacional de Aprendizaje
GLOSARIO

BI: Business Intelligence Inteligencia de negocios

CRISP-DM: Cross Industry Standard Process for Data Mining

Data mining: Minera de datos

DMAMC: Definir, Medir, Analizar, Mejorar, Controlar

DW: Data Warehouse - Bodega de datos

KDD: Knowledge Discovery in Databases

LDAP: Lightweight Directory Access Protocol - Protocolo ligero de acceso


a directorios

MER: Modelo Entidad Relacin

OLAP: OnLine Analytical Processing Procesamiento analtico en lnea

OLTP: OnLine Transaction Processing - Procesamiento de transacciones


en lnea

SEMMA: Sample, Explore, Modify, Model, Assess

21
FAVA - Formacin en Ambientes Virtuales de Aprendizaje SENA - Servicio Nacional de Aprendizaje
BIBLIOGRAFA

Date, C.(2001). Introduccin a los sistemas de bases de datos (7 Edicin).


Mexico: Editorial: Pearson Education, Capitulo 21 : Apoyo a la toma de
decisiones.

Gallardo J. (2009). Metodologa para la Definicin de Requisitos en Proyectos


de Data Mining (ER-DM). Recuperado el 28 de mayo de 2012 desde:
http://oa.upm.es/1946/1/JOSE_ALBERTO_GALLARDO_ARANCIBIA.pdf

Hernndez J., Ramrez J.y Ferri R. (2008). Introduccin a la minera de


datos, Madrid, Espaa: Editorial: Pearson Prentice Hall.

Kroenke, D, (2003). Procesamiento de Bases de Datos, Editorial: Prentice


Hall.

Laudon, C. y Laudon, P. (2008). Sistemas de Informacion Gerencial -


Administracion de la empresa digital (10 Edicin). Mexico: Editorial
Pearson Prentice Hall, Capitulo 6: Fundamentos de la inteligencia de
negocios: administracin de bases de datos e informacin.

Prez, Csar y Gonzlez D, (2007.) Mineria de datos Tcnicas y


herramientas, Madrid, Espaa: Editorial:Thomson.

Sevilla, E. (2003). Gua metodolgica para la definicin y desarrollo de


un DW. Recuperado el 31 de mayo de 2012 desde: http://biblioteca.uam.
edu.ni/opac_tes/009/00902630.pdf

Silberschatz, A. Korth, H. y Sudarshan, S. (2002). Fundamentos de bases


de datos (4ta Edicin). Madrid, Espaa: Editorial McGraw Hill, Parte 7,
Captulo 22.

22
FAVA - Formacin en Ambientes Virtuales de Aprendizaje SENA - Servicio Nacional de Aprendizaje
Control de documento
Construccin Objeto de Aprendizaje
Diseo e Implementacin de Cubos de Datos
Desarrollador de contenido Alejandro Pinzn Roberto
Experto temtico
Asesor pedaggico Rafael Neftal Lizcano Reyes
Produccin Multimedia Luis Fernando Botero Mendoza
Victor Hugo Tabares
Programadores Daniel Eduardo Martnez
Grateful Dead Montao Sierra
Lder expertos temticos Ana Yaqueline Chavarro Parra
Lder lnea de produccin Santiago Lozada Garcs

23
FAVA - Formacin en Ambientes Virtuales de Aprendizaje SENA - Servicio Nacional de Aprendizaje

Vous aimerez peut-être aussi