Vous êtes sur la page 1sur 29

UNIVERSIDAD AUTÓNOMA DE BAJA CALIFORNIA

FACULTAD DE CONTADURIA Y ADMINISTRACIÓN


MAESTRÍA EN TECNOLOGIAS DE INFORMACIÓN Y LA
COMUNICACIÓN

Modelado de Bases de Datos Corporativas

M.C.C. Margarita Ramírez Ramírez


Cuatrimestre 2 Mayo al 29 Agosto
2 Mayo -17 Junio 17 Julio-29 Agosto

Profundidad de la asignatura.
Reconocer la importancia del uso de las Bases de datos en las
organizaciones. Analizar con detalle los componentes del modelo
conceptual de datos. Manejo de terminología de Bases de datos. Conocer
conceptualmente los manejadores más importantes en el mercado.
Discutir las tendencias actuales en el ámbito de las Bases de datos.

Unidad I. Introducción a las bases de datos corporativas.

Objetivo.
Identificar el papel que juegan las bases de datos dentro de los sistemas
de Información.
Conocer la tecnología y herramientas emergentes para la construcción de
bases de datos corporativas.

Temas.
1.1. Las Bases de Datos y los Sistemas de Información.
1.2. Que se entiende por una base de datos Corporativa.
1.3. Importancia de las bases de datos corporativas.
1.4. Tecnología asociada a las bases de datos corporativas.
1.4.1. Base de datos distribuida.
1.4.2. Data Warehouse: Multibase de datos y minería de datos,
inteligencia de negocios.

Productos a evaluar.
• Reporte de Investigación documental.
• Presentación de resultados obtenidos en la investigación.
• Desarrollo de caso de estudio.
• Examen

Unidad II. Modelos de base de datos.

Objetivo.
Evaluar los diferentes modelos de datos y los diferentes niveles de
abstracción que conducen a la creación de una base de datos.

Temas.
2.1. Abstracción de datos.

Base de Datos Corporativas, M.R.R. 1


2.2. Tipos de modelos de datos.
2.2.1. Modelos lógicos basados en objetos.
2.2.2. Modelos lógicos basados en registros.
2.2.3. Modelos físicos de datos.

Producto a evaluar.
• Reporte de Investigación.
• Resolución de caso práctico.
• Examen.

Unidad III. Diseño conceptual de base de datos.

Objetivo.
Presentación del modelo Entidad-Relación como herramienta del diseño
conceptual y su transformación al modelo relacional.
Presentación y aplicación de la teoría de la Normalización

Temas.
3.1. Modelo entidad-relación.
3.2. Modelo relacional.
3.3. Diseño de base de datos relacionales.
3.4. Formas normales.
3.5. Lenguajes relacionales comerciales.

Producto a evaluar.
• Desarrollo del diseño conceptual de una base de datos para un caso
propuesto.
• Examen

Material de apoyo.
• Apuntes clase.
• Lectura. pag. 109-207, Sistemas de bases de datos, Peter
Rob/Carlos Coronel.
• Lectura pag. 137-171, Diseño y Administración de Bases de
datos, Gary W. Hansen, James V. Hansen.

Unidad IV. Manejadores de Base de Datos.

Objetivo.
Evaluar los diferentes sistemas manejadores de bases de datos de tal
forma que permita seleccionar el mejor para la implementación de
bases de datos dentro de una organización, de acuerdo a sus
necesidades.

Temas.
4.1. Access
4.2. MySQL
4.3. SQL Server
4.4. Oracle

Base de Datos Corporativas, M.R.R. 2


4.5. Informix
4.6. DB2

Producto a evaluar.

• Exposición tema asignado.


• Estudio comparativo y documentado de los diferentes manejadores
de bases de datos y su campo de aplicación.
• Aplicaciones

Unidad V. Tendencias.
Objetivo.
Analizar las propuestas en el “estado del arte” para el manejo y
modelado de datos que nos mantengan al día para generar propuestas
de mejora en la organización.

Temas.
5.1. BD Deductivas
5.2. Tecnología XML.
5.3. Java aplicado a BD.
5.4. Bases de Datos en Internet.
5.5. Bases de Datos multimedios.

Producto a evaluar.

• Exposición tema asignado.


• Realizar perspectivas de aplicación de nuevas tecnologías y su
documentación.

Bibliografía

• Catherine M. Ricardo, Bases de Datos, Editorial McGraw Hill, 2009.


• Peter Rob, Carlos Coronel, Sistemas de Bases de datos, Diseño
Implementación y Administración, Edit. Thomson, 2004.
• Gary W. Hansen, James V. Hansen., Diseño y administración de
Base de datos, Prentice Hall, 1998.
• Abraham Silberschatz, Henry F. Korth, S.Sudarshan, Fundamentos de
bases de datos, Mc Graw Hill, 2006.
• Ramakrishnan Raghu, Gehrke Johannes, Sistemas de Gestión de
Bases de Datos, Mc Graw Hill,2007.
• David M. Kroenke. Procesamiento de bases de datos, Prentice Hall,
1996.
• Gross James R., Aplique SQL, Mc Graw Hill.
• Ramez Elmasri, Shamkant B. Navathe., Sistemas de Bases de datos,
Addison Wesley, 1997.
• Pérez César, Oracle 10 g Administración y Análisis de Bases de Datos,
Alfaomega, 2005.

Base de Datos Corporativas, M.R.R. 3


• Brust J. Andrew, Forte Stephen, Programación avanzada con Microsoft
SQL Server 2005, Mc Graw Hill, 2007.

Base de Datos Corporativas, M.R.R. 4


Fecha Tema
5 Mayo Examen Diagnóstico, Presentación curso, Unidad I.
12 Mayo Investigación tema 1.4, 1.4.1, 1.4.2
19 Mayo Conclusiones temas 1.4, Unidad II.
26 Mayo Unidad III, Conceptualización
2 Junio Unidad III, Ejercicios
9 Junio Examen
16 Junio Asamblea ANFECA
21 Julio Unidad IV, Exposición
28 Julio Unidad IV, Exposición
4 Agosto Unidad IV, Exposición
11 Agosto Examen, Unidad V, Investigación.
18 Agosto Coloquio
25 Agosto Promedio final

Base de Datos Corporativas, M.R.R. 5


Unidad I
Introducción a las bases de datos corporativas.

1.1. Las Bases de Datos y los Sistemas de Información.


1.2. Que se entiende por una base de datos Corporativa.
1.3. Importancia de las bases de datos corporativas.
1.4. Tecnología asociada a las bases de datos corporativas.
1.4.1. Base de datos distribuidas.
1.4.2. Data Warehouse: Multibase de datos y minería de datos.

Introducción.

Un archivo es un colección de información de un sujeto u objeto


conformado por un conjunto de registros, a su vez los registros están
conformados por una serie de atributos.
Los archivos, pueden almacenarse de dos formas diferentes en los
dispositivos de almacenamiento: archivos convencionales y/o bases de
datos.
Los archivos convencionales, pueden organizarse como archivos
secuenciales o archivos directos. Sin embargo, el almacenamiento de la
información a través de archivos convencionales presenta una serie de
limitaciones que afectan a las aplicaciones que se desarrollan.

1.1. Las Bases de Datos y los Sistemas de Información.

Archivos convencionales.
El uso de sistemas de información por parte de las organizaciones
requiere el almacenamiento de grandes cantidades de información, ya
sea para el uso del mismo, para generar resultados o para compartir
dicha información con otros sistemas.
Las formas en las cuales pueden organizarse son archivos secuenciales o
archivos directos. En los archivos secuenciales los registros están
almacenados en una secuencia que depende de algún criterio definido.
Por ejemplo, pueden almacenarse los registros de los empleados de la
empresa de manera secuencial de acuerdo al departamento al que
pertenecen o de acuerdo a su antigüedad.
Los archivos directos permiten acceder directamente un registro de
información sin tener que buscar uno a uno por todos los registros del
archivo, utilizando una llave de acceso dentro del archivo.

Base de Datos Corporativas, M.R.R. 6


Base de datos.

• Conjunto de datos organizados con características afines entre sí,


que identifican a un ente en especial, cualquier colección de
información interrelacionada, es una base de datos.

• Conjunto autodescriptivo de registros integrados; autodescriptivo ya


que puede contener información del usuario, descripción de la B.D.,
que nos permite representar las relaciones entre los datos. En
donde la información que se tiene almacenada está disponible para
todos los usuarios del sistema, en el que los datos redundantes
pueden eliminarse o al menos minimizarse.

• Las bases de datos proporcionan la infraestructura requerida para


los sistemas de apoyo a la toma de decisiones y para los sistemas
de información estratégicos, ya que estos sistemas explotan la
información contenida en las bases de datos de la organización para
apoyar el proceso de toma de decisiones.

Componentes de una Base de Datos.

1.2. Base de datos Corporativa.

• Es el enfoque de la Informática actual que busca apoyar al ejecutivo


moderno en la toma de decisiones estratégicas en la empresa,
proporcionando información de calidad, resumida y oportuna.
• Es la base de datos que permite concentrar información útil que
pueda servir de base para la toma de decisiones.
• Globalización de la información. Permite a los diferentes usuarios
considerar la información como un recurso corporativo que carece
de dueños específicos.
• Eliminación de información redundante.
• Eliminación de información inconsistente.
• Permite compartir información. Varios sistemas o usuarios pueden
utilizar una misma entidad.
• Permite mantener la integridad en la información. Solo se almacena
la información correcta.
• Independencia de datos. Esto implica un divorcio entre programas y
datos; es decir, se pueden hacer cambios a la información que
contiene la base de datos o tener acceso a la base de datos de
diferente manera, sin hace cambios en las aplicaciones o en los
programas.

Base de Datos Corporativas, M.R.R. 7


Componentes en un sistema de Base de Datos.
Datos. Los datos son la Base de Datos propiamente dicha.
Hardware. El hardware se refiere a los dispositivos de almacenamiento
en donde reside la base de datos, así como a los dispositivos periféricos
(unidad de control, canales de comunicación, etc.) necesarios para su uso.
Software. Está constituido por un conjunto de programas que se conoce
como Sistema Manejador de Base de Datos (DMBS: Data Base
Management System). Este sistema maneja todas las solicitudes
formuladas por los usuarios a la base de datos.
Usuarios. Existen varias clases de usuarios relacionados con una Base
de Datos:
1. El programador de aplicaciones, quien crea programas de aplicación
que utilizan la base de datos.
2. El usuario final, quien accesa la Base de Datos por medio de un
lenguaje de consulta o de programas de aplicación.
3. El administrador de la Base de Datos (DBA: Data Base
Administrator), quien se encarga del control general del Sistema de
Base de Datos.

1.3. Importancia de las bases de datos.

• Integran datos importantes para la institución.


• Obtención de datos en menor tiempo, por diferentes niveles de
mando.
• Consistencia de información.
• Precisión en la información.
• Base de datos organizadas, planeadas en todas sus fases.
• Integración de plataformas, sistemas operativos, lenguajes de
Programación, métodos de comunicación.
• Actualización de sistemas.

1.4. Tecnología asociada a las bases de datos corporativas.


• Arquitectura cliente/servidor

• Servidores semejantes a Mainframes, arquitecturas de memoria


tecnológicamente superiores, con procesadores de alta velocidad y
capacidades de almacenamiento masivas.

• Aparición de modernos sistemas de gestión de bases de datos


(DBMS), los cuales proporcionan mayor soporte para estructuras
complejas.

Base de Datos Corporativas, M.R.R. 8


1.4.1. Base de Datos Distribuidas.

En años recientes, la disponibilidad de las bases de datos y de las redes


de computadoras ha promovido el desarrollo de un nuevo campo
denominado bases de datos distribuidas. Una base de datos distribuida es
una base de datos integrada la cual se construye por encima de una red
de computadoras en lugar de una sola computadora.

Las bases de datos distribuidas ofrecen diversas ventajas a los


diseñadores y usuarios de bases de datos. Entre las más importantes se
encuentra la transparencia en el acceso y localización de información. Sin
embargo, el diseño y administración de bases de datos distribuidas
constituye un gran desafío que incorpora problemas no encontrados en
bases de datos centralizadas. Por ejemplo, los esquemas de
fragmentación y localización de información, el manejo de consultas a
sitios distribuidos y los mecanismos de control de concurrencia y
confiabilidad en bases de datos distribuidas.

Base de Datos Distribuidas.

La cantidad de innovaciones tecnológicas que ha habido en los últimos


años ha promovido un cambio en la forma de observar a los sistemas de
información y, en general, a las aplicaciones computacionales. Existen
avances tecnológicos que se realizan continuamente en circuitos,
dispositivos de almacenamiento, programas y metodologías. Sin embargo,
los cambios tecnológicos van de la mano con la demanda de los usuarios
y programas para la explotación exhaustiva de tales dispositivos
mejorados. Por tanto, existe un continuo desarrollo de nuevos productos
los cuales incorporan ideas nuevas desarrolladas por compañías e
instituciones académicas.

Aún cuando es posible que un usuario común no perciba los desarrollos


relevantes de nuevos productos, para las aplicaciones existe una
demanda permanente por mayor funcionalidad, mayor número de
servicios, más flexibilidad y mejor rendimiento. Así, al diseñar un nuevo
sistema de información o al prolongar la vida de uno ya existente, se debe
buscar siempre formas para enlazar las soluciones ofrecidas por la
tecnología disponible a las necesidades de las aplicaciones de los
usuarios.

Un área en la cual las soluciones están integrando tecnología con nuevas


arquitecturas o formas de hacer las cosas es, sin lugar a dudas, el área de
los sistemas distribuidos de información. Ellos se refieren al manejo de
datos almacenados en facilidades de cómputo localizadas en muchos
sitios ligados a través de una red de comunicaciones. Un caso específico
de estos sistemas distribuidos es lo que se conoce como bases de datos
distribuidas, tópico a estudiar en estas notas.

Base de Datos Corporativas, M.R.R. 9


1.4.2. Data Warehouse Multibase de datos y minería de datos.

Datawarehouse vs Base de Datos Corporativa

¿Cuales son las diferencias entre un DWH y una Base de Datos


corporativa? Sabemos que ambas pueden existir en una organización, si
solo se podría elegir uno, ¿qué razones tendría para elegir un DWH y/o
qué razones tendría para escoger una Base de Datos corporativa?

Un Data Warehouse (DW) es un almacén o repositorio de datos


categorizados, que concentra un gran volumen de información de interés
para toda una organización, la cual se distribuye por medio de diversas
herramientas de consulta y de creación de informes orientados a la toma
de decisiones.

Existe muchas definiciones de distintos autores, pero una de las más


famosas puede ser:: "Un Data Warehouse es una colección de datos
orientados a temas, integrados, no-volátiles y variante en el tiempo,
organizados para soportar necesidades empresariales".

Los Data warehouse a menudo almacenan gran cantidad de información,


la cual está a veces subdividida en pequeñas unidades lógicas.
Periódicamente, se importan estos datos de otros sistemas de información
dentro del data warehouse, para realizar sobre ellos un procesamiento
posterior.

Un Data Warehouse se diferencia de una Base de Datos operacional de


una empresa, un data warehouse puede derivar de la Base de Datos
corporativa, mediante la importación de información, pero el data
warehouse no es esa BD operacional.

Las principales características o propiedades de un Data Warehouse son


las siguientes:

Base de Datos Corporativas, M.R.R. 10


• Está orientado a la toma de decisiones. Un buen diseño de la base
de datos favorece el análisis y la recuperación de datos para
obtener una ventaja estratégica y para facilitar las decisiones de
marketing.

• El DW almacena datos categorizando o estructurándolos de forma


que favorezcan el análisis de los datos y puedan proporcionar
análisis históricos.

• El DW no está orientado a procesos relacionados con la operativa de


la empresa. El DW está preparado para ser explotado mediante
herramientas específicas que permiten la extracción de información
significativa y patrones de comportamiento que permanecen ocultos
en un enorme repositorio de datos.
• Esta explotación de los datos se suele realizar con herramientas de
Data mining o minería de datos, que suelen realizar predicciones del
funcionamiento futuro a partir de la evolución de los datos
actualmente almacenados en el repositorio. Estas utilidades
trasforman los datos en información útil para resolver cuestiones de
negocio y marketing.

Software para un Data Warehouse

La información estratégica se almacena en gigabytes de datos de


marketing o índice de transacciones de venta. La información debe ser
extraída de alguna forma para la toma de decisiones.

En este caso se necesita software especializado que permita capturar los


datos relevantes en forma rápida y pueda verse a través de diferentes
dimensiones de los datos. El software no debería limitarse únicamente al
acceso a los datos, si no también, al análisis significativo de los datos. En
efecto, transformar los datos de la información cruda o no procesada, en
información útil para la empresa.

Los softwares o herramientas de negocios inteligentes se colocan sobre la


plataforma data warehousing y proveen este servicio. Debido a que son el
punto principal de contacto entre la aplicación del depósito y la gente que
lo usa, estas herramientas pueden constituir la diferencia entre el éxito o
fracaso de un depósito.

Las herramientas de negocio inteligentes se han convertido en los


sucesores de los sistemas de soporte de decisión, pero tienen un alcance
más amplio. No solamente ayudan en las decisiones de soporte sino, en
muchos casos, estas herramientas soportan muchas funciones
operacionales y de misión-crítica de la compañía. Sin embargo, estos

Base de Datos Corporativas, M.R.R. 11


productos no son infalibles ya que sólo se consigue el máximo provecho
del data warehouse, si elige las herramientas adecuadas a las
necesidades de cada usuario final.

Herramientas de software.

1. Herramientas de consulta y reporte.

Las herramientas de consulta al igual que la mayoría de herramientas


visuales, permiten apuntar y dar un click a los menús y botones para
especificar los elementos de datos, condiciones, criterios de agrupación y
otros atributos de una solicitud de información. La herramienta de
consulta genera entonces un llamado a una base de datos, extrae los
datos pertinentes, efectúa cálculos adicionales, manipula los datos si es
necesario y presenta los resultados en un formato claro. Se puede
almacenar las consultas y los pedidos de reporte para trabajos
subsiguientes, como está o con modificaciones. El procesamiento
estadístico se limita comúnmente a promedios, sumas, desviaciones
estándar y otras funciones de análisis básicas

2. Herramientas de base de datos multidimensionales / OLAP.

Las primeras soluciones OLAP (On Line Analytical Processing), estuvieron


basadas en bases de datos multidimensionales (MDDBS). Un cubo
estructural (dos veces un hipercubo o un arreglo multidimensional)
almacenaba los datos para que se puedan manipular intuitivamente y
claramente ver las asociaciones a través de dimensiones múltiples Pero
este enfoque tiene varias limitaciones:

Las nuevas estructuras de almacenamiento de datos requieren bases de


datos propietarias. No hay realmente estándares disponibles para acceder
a los datos multidimensionales.

La segunda limitación de un MDDB concierne al desarrollo de una


estructura de datos. Las compañías generalmente almacenan los datos de
la empresa en bases de datos relacionales, lo que significa que alguien
tiene que extraer, transformar y cargar estos datos en el hipercubo.

Este proceso puede ser complejo y consumidor de tiempo pero,


nuevamente, los proveedores están investigando la forma de
solucionarlos. Las herramientas de extracción de datos y otras
automatizan el proceso, trazando campos relacionales en la estructura
multidimensional y desarrollando el MDDB sobre la marcha. Algunos
proveedores ofrecen ahora la técnica OLAP relacional (Relational On Line
Analytical Processing - ROLAP), que explora y opera en el data warehouse
directamente usando llamadas SQL estándares. Los defensores de ROLAP
argumentan que se usan estándares abiertos (SQL) y que se esquematiza
(nivel de detalle) los datos para hacerlos más fácilmente accesibles. Por
otra parte, argumentan que una estructura multidimensional nativa logra

Base de Datos Corporativas, M.R.R. 12


mejor performance y flexibilidad, una vez que se desarrolla el almacén de
los datos.

3. Sistemas de información ejecutivos.

Las herramientas de sistemas de información ejecutivos (Executive


Information Systems - EIS), proporcionan medios sumamente fáciles de
usar para consulta y análisis de la información confiable. Generalmente se
diseñan para el usuario que necesita conseguir los datos rápidamente,
pero quiere utilizar el menor tiempo posible para comprender el uso de la
herramienta. El precio de esta facilidad de uso es que por lo general
existen algunas limitaciones sobre las capacidades analíticas disponibles
con el sistema de información ejecutivo. Además, muchas de las
herramientas de consulta/reporte y OLAP/multidimensional, pueden
usarse para desarrollar sistemas de información ejecutivos. El concepto
de sistema de información ejecutivo es simple: los ejecutivos no tienen
mucho tiempo, ni la habilidad en muchos casos, para efectuar el análisis
de grandes volúmenes de datos. El EIS presenta vistas de los datos
simplificados, altamente consolidados y mayormente estáticas.

4. Herramientas data mining

Data mining es una categoría de herramientas de análisis open-end. En


lugar de hacer preguntas, se toma estas herramientas y se pregunta algo
"interesante", una tendencia o una agrupación peculiar, por ejemplo. El
proceso de data mining extrae los conocimientos guardados o información
predictiva desde el data warehouse sin requerir pedidos o preguntas
específicas. Las herramientas Mining usan algunas de las técnicas de
computación más avanzadas para generar modelos y asociaciones como
redes neurales, detección de desviación, modelamiento predictivo y
programación genética. Mining es un dato-conducido, no una aplicación-
conducida.

5. Sistemas de gestión de bases de datos.

Estos software proporcionan procesamiento en paralelo y algo fuera de


los aspectos ordinarios, que puedan ser especialmente interesantes para
la gente de desarrollo de data warehouse y de sistemas de soporte de
decisiones.

Ventajas y desventajas.

• Proporciona un gran poder de procesamiento de información.


• Permite una mayor flexibilidad y rapidez en el acceso a la
información.
• Facilita la toma de decisiones en los negocios.

Base de Datos Corporativas, M.R.R. 13


• Las empresas obtienen un aumento de la productividad.
• Proporciona una comunicación fiable entre todos los departamentos
de la empresa.
• Mejora las relaciones con los proveedores y los clientes.
• Permite conocer qué está pasando en el negocio, es decir, estar
siempre enterado de los resultados.
• Transforma los datos en información y la información en
conocimiento.
• Permite hacer planes de forma más efectiva. Reduce los tiempos de
respuesta y los costes de operación.

Resumiendo, el Datawarehouse proporciona una información de gestión


accesible, correcta, uniforme y actualizada. Proporciona un menor coste
en la toma de decisiones, una mayor flexibilidad ante el entorno, un mejor
servicio al cliente y permite el rediseño de los procesos.

Desventajas

• Requieren una revisión del modelo de datos, objetos, transacciones


y además del almacenamiento.
• Diseño complejo y multidisciplinar requieren reestructuración de
los sistemas operacionales.
• Alto costo sistemas, aplicaciones y almacenamiento específico.

Base de Datos Corporativas, M.R.R. 14


UNIDAD II Modelos de Bases de Datos.

2.1 Abstracción de datos.


2.2 Tipos de modelos de datos.
2.2.1. Modelos lógicos basados en objetos.
2.2.2. Modelos lógicos basados en registros.
2.2.3. Modelos físicos de datos.

2.2. Tipos de modelos de datos.

Conceptos básicos del modelado.


Modelo: Descripción analógica que se utiliza para visualizar algo,
abstracción de un objeto del mundo real.

Modelo de datos. Representación gráfica relativamente simple de


estructuras de datos del mundo real.

ANSI(American National Standards Institute/Standards Planning and


requirementes Comité (ANSI/SPARC), define tres tipos de modelos de
acuerdo con su grado de abstracción conceptual, externo e interno.

Modelo Conceptual
Por este modelo se representa una visión general de los datos, es una
representación de datos a nivel empresarial.

Base de Datos Corporativas, M.R.R. 15


Modelo
Modelo Externo
Conceptual

Modelo
Interno

Modelo Externo

Modelo Físico

Ejemplo Modelo conceptual de un sistema de Facturación.

Tien
CLIENTE FACTURA
e
1 M

Contien
e

PRODUCTOS

Base de Datos Corporativas, M.R.R. 16


Descripción del modelo.

• Una factura contiene muchos productos.


• Un producto se factura en N facturas.
• Un cliente puede recibir muchas facturas
• Una factura la recibe sólo un cliente

Este modelo puede fraccionarse y programarse por varios módulos.

Modelo Interno
El modelo interno es utilizado por los desarrolladores que trabajan con
manejadores de tipo jerárquico y de redes, ya que estos modelos
especifican detalles de almacenamiento de los datos y rutas de acceso.

Modelo externo
Este modelo muestra la visión de del ambiente de datos de los usuarios
finales.
Cada modelo externo incluye entidades, relaciones, procesos y
restricciones apropiadas definidas por las reglas de negocio.

Modelo físico.
Este modelo es el que funciona en el nivel más bajo de abstracción y
describe como son almacenados los datos en los medios magnéticos de
almacenamiento. Este modelo depende tanto del hardware como del
software. Este modelo es utilizado por desarrolladores que diseñan bases
de datos jerárquicos y de red, las cuales requieren mayores detalles e
almacenamiento de datos.

Base de Datos Corporativas, M.R.R. 17


Unidad III

3.1. Modelo entidad-relación.


3.2. Modelo relacional.
3.3. Diseño de base de datos relacionales.
3.4. Formas normales.
3.5. Lenguajes relacionales comerciales.

3.1. Modelo entidad-relación.

Modelo entidad-relación.
Este modelo permite establecer las bases, para el desarrollo y diseño de
una base de datos, en este modelo es posible especificar y representar la
estructura de una empresa, la estructura global de una base de datos, es
un modelo semántico de datos, facilita la representación de las relaciones,
e interacciones entre las transacciones, operaciones y departamentos en
una empresa.
Este modelo se basa en una percepción del mundo real, que consta de una
colección de objetos básicos, llamados entidades, atributos y relaciones
entre objetos.
El modelo E-R además de entidades y relaciones representa las uniones
que los contenidos de la base de datos deben cumplir. Una unión es la
correspondencia de cardinalidades, que expresan el número de entidades
con las que otra entidad se puede asociar a través de un conjunto de
relaciones.

Las estructuras lógicas de una base de datos se pueden expresar de


forma gráfica mediante este diagrama E-R, el cual consta de los
siguientes componentes:

Símbolos modelado entidad relación

Símbolo Representación

ALUMNO Entidad Alumno

Entidad de Relación

Atributo

________
Relación

Base de Datos Corporativas, M.R.R. 18


1 Lado uno de la relación
*, M Lado muchos de la relación
Rectángulos. Representan entidades.
Elipses. Representan atributos.
Rombos. Representan relaciones entre conjuntos de entidades.
Líneas. Unen a los atributos con los conjuntos de entidades y los
conjuntos de entidades con las relaciones.

Ejemplo de diagrama de E-R.

Númerocuenta
Teléfono
Saldo
RFC
Tien
CLIENTE CUENTA
e

Nombre
Dirección
Tipocuenta

Este modelo representa a las entidades Cliente, y Cuenta, además de una


tabla generada por la relación denominada posee.
La tabla Cliente contiene los atributos: Rfc, Dirección, nombre, Teléfono.
La tabla Cuenta contiene los atributos: Númerocuenta, tipocuenta, saldo.

El modelo E-R permite relaciones de cualquier grado, aunque


generalmente son de grado 2, esto es relaciones que involucran a dos
tablas, denominadas relaciones binarias.

Vendedor
Vendedor
Pedido-Vendedor
Pedido-Vendedor

Pedido
Pedido

Esquema. Visión general de la base de datos relacional, es la colección


de tablas involucradas en la B.D.

Entidad. En el modelo entidad-relación, una entidad corresponde a una


tabla, esto es; una entidad es un sujeto, un objeto o una cosa del mundo
real que se diferencia de los demás. Una entidad tiene propiedades y
valores que identifican a un sujeto u objeto el cual existe y es
distinguible de otros objetos, se representa por un conjunto de atributos,
ejemplo de entidad: libro, alumno, empleado, etc.

Base de Datos Corporativas, M.R.R. 19


Atributos. descriptores de la entidad, de la cual se almacena
información, Las columnas corresponden a los atributos (título, editorial,
autor), son atributos que identifican a la entidad LIBRO.

Dominio del atributo. El conjunto de todos los valores posibles, para un


atributo en particular.
Llave o clave de la relación. Es el identificador único de cada tupla.

Clave primaria. clave candidata que el diseñador elige de la base de


datos como el medio principal de identificar entidades dentro de un
conjunto de entidades.

Clave compuesta. Una clave compuesta de más de un atributo.

Clave candidata. Cualquier conjunto de atributos que puede ser


elegido como una clave de una relación.

Clave externa. Un conjunto de atributos en una relación que


constituyen una clave en alguna otra (o posiblemente la misma) relación,
usada para indicar enlaces lógicos entre relaciones.

Tupla. Conjunto de atributos que representan a una unidad.

Valor nulo. El valor dado a un atributo en una tupla si el atributo es


inaplicable o su valor es desconocido.

Atributos simples. Un atributo simple es aquel que no se puede


subdividir, por ejemplo la edad, el sexo de una persona.

Atributos compuestos. Este es un atributo que puede ser dividido en


otros atributos adicionales, por ejemplo la dirección de una persona,
puede subdividirse en calle, número, código postal, etc.

Cardinalidad. Número específico de ocurrencias de entidad, asociadas


con una ocurrencia de la entidad relacionada, esto es el número máximo
de instancias de un conjunto de objetos que puede estar relacionado con
una sola instancia de otro conjunto de objetos.

Por ejemplo:
1. Para una interrelación entre un supervisor y un departamento, la
cardinalidad es de una a una, en donde el uno es representado por 1.

Supervisor 1 1
Departamento

• Un supervisor, supervisa a un departamento.


• Un departamento es supervisado por una persona.
Este el caso de una relación de uno a uno.

Base de Datos Corporativas, M.R.R. 20


2. Para una interrelación entre un supervisor y empleados, la cardinalidad
es de una a muchos, en donde el muchos podrá ser representado por un *,
o la letra m.

1,*
Supervisor Empleado
1 *

• Un supervisor supervisa a muchos empleados.


• Un empleado es supervisado por un supervisor.

Este es el caso de una interrelación de uno a muchos.

3. En una interrelación entre alumnos y materias cursadas, la cardinalidad


es de muchos a muchos.

Alumno CURS Materias


A

• Un alumno cursa muchas materias.


• Una materia la cursan muchos alumnos.

Este es el caso de una interrelación muchos a muchos.

Cardinalidad uno a uno. Una cardinalidad de la interrelación que es 1 en


ambas direcciones.

Cardinalidad uno a muchos. Una cardinalidad de la interrelación que es una en


una dirección y muchos en la otra.

Cardinalidad muchos a muchos. Una cardinalidad de la interrelación que es


mucha en ambas direcciones.

Reglas que determinan las interrelaciones (Cardinalidad).

Regla 1. Si dos tablas tienen una interrelación de uno a uno (1 a 1), entonces el
campo clave de una de las tablas debe aparecer en la otra tabla.

Regla 2. Si dos tablas tienen una interrelación de uno a muchos (1 a *),


entonces el campo clave de la tabla del (1) debe aparecer en la tabla del muchos
(*).

Regla 3. Si dos tablas tienen una interrelación de muchos a muchos (* a *),


entonces debe crearse una tabla que tenga los campos claves de las dos tablas.

Cardinalidades básicas de las interrelaciones.

Cardinalidad Notación Ejemplos


Uno-uno 1:1 o 1-1 Un supervisor supervisa un
departamento.

Base de Datos Corporativas, M.R.R. 21


Un departamento es atendido
por un supervisor.
Uno-muchos 1:* o 1-* Un empleado esta en un
departamento.
Un departamento tiene
muchos empleados
Muchos-muchos *:* o*-* Una factura tiene muchos
productos
Un producto esta en muchas
facturas
Relación. Una relación es una asociación entre entidades, se denomina
de igual modo a una tabla que se genera a partir de la relación o
asociación de dos o más tablas o entidades existentes.
Las relaciones entre entidades se generan en dos direcciones, esto es
para definir la relación entre un empleado y un departamento se
especifica de la siguiente manera:
• Un empleado pertenece a un departamento.
• En un departamento están asignados muchos empleados.

Esta relación es de tipo 1:M

Tipos de relaciones. Las relaciones pueden ser clasificadas de acuerdo


a su grado, el grado de una relación es el número de entidades o
participantes asociados.

Relación Unaria. Es una relación que se da en una entidad simple.

Relación Binaria. Relación que se da cuando dos entidades están


asociadas.

Relación Ternaria. Esta relación se da cuando tres entidades, están


asociadas.

Relación Recursiva: Es aquella relación que existe entre ocurrencias


del mismo conjunto de entidad. (Relación unaria).
Un ejemplo de una relación recursiva se puede dar en un sistema de
kardex de un estudiante en donde una asignatura se convierte en
requisito de otra asignatura.

Modelos Entidad Relación. La simbología utilizada en el modelo


Entidad relación son los símbolos básicos de los modelos de Chen y
modelo de pata de gallo, los cuales son los más conocidos.

Modelo Chen. Este modelo fue creado por Peter Chen en 1976, Chen
permitió dar al modelo conceptual una representación practica
estableciendo bloques de construcción básicos: entidades y relaciones La

Base de Datos Corporativas, M.R.R. 22


estructura de este modelo fue la base para las herramientas CASE, las
herramientas ERD actuales encuentran su origen en el modelo Chen.

Modelo de Pata de gallo. Desarrollado por C.W. Bachman, la diferencia


entre el modelo Chen y este modelo es la representación de conectividad,
cuando para Chen es 1 y M, para el modelo de pata de gallo es (0,1),
(0,N), (1,1), (1, N).

Características del modelo Entidad-Relación.


• Los modelos de Chen y pata de gallo utilizan rectángulos para
representar a las entidades.
• Los nombres de las entidades son sustantivos.
• Los nombres de relación son verbos activos o pasivos y se escriben
en minúsculas.
• El modelo Chen coloca los nombres de relación en un diamante.
• El modelo pata de gallo escribe el nombre de relación en cualquier
lugar de la línea de relación que conecta a los rectángulos de
entidad.
• El 1 se utiliza para representar el lado uno de la relación y el m, o el
*, para el lado muchos de la relación.

3.2. Modelo relacional.

El modelo relacional, está basado en las relaciones lógicas entre los datos,
este modelo organiza y representa a los datos en forma de tablas de dos
dimensiones, consistente en filas y columnas de datos.

Modelo relacional de base de datos.

Una vez que las bases de datos fueron implementadas y utilizadas


con éxito surgieron diferentes formas de organizar y representar a las
mismas, entre las cuales se encuentran el modelo de base de datos
Jerárquico, modelo de base de datos de redes, surgiendo posteriormente
el modelo de base de datos relacional, el cual hasta la fecha es
reconocido como uno de los modelos más eficientes y que ofrece ventajas
tales como la minimización de la redundancia de información. A
continuación se describirán brevemente sus antecedentes.

El concepto base de datos relacional fue escrito por primera vez por
el Dr. Codd en 1970 el cual publicó un artículo en el que aplicaba los
conceptos de una rama de las matemáticas llamada algebra relacional, a
los problemas de almacenar enormes cantidades de datos. Este artículo
dio inicio a un movimiento en la comunidad de las bases de datos que en
muy poco tiempo condujo a la definición del modelo de bases de datos
relacionales.

Base de Datos Corporativas, M.R.R. 23


El modelo relacional surge como un intento de simplificar la
estructura de las bases de datos, eliminando estructuras padre/hijo del
modelo jerárquico de la base de datos y en su lugar representar todos los
datos en la base de datos como tablas conformadas a su vez por
renglones y columnas con valores de datos.

El modelo de base de datos relacional es un modelo simple,


poderoso y formal de representar la realidad. Este modelo, es un modelo
simple que facilita la construcción de consultas del usuario, dando como
resultado una alta productividad de los programadores de la base de
datos.

A continuación se muestran conceptos utilizados en el diseño de base de


datos relacional.
Ejemplo de una entidad o tabla:

Tabla Libro
Númer Título Autor Editorial
o
1234 Demian Hermann Sayrols
Hesse
5234 Base de Datos Javier Ceballos Macrobit

Entidad: Libro.
Clave: 1234, 5234
Atributo. Número, titulo, autor, editorial.
Dominio Titulo: Demian, Cobol
Dominio Editorial: Sayrols, Macrobit.

Transformación de un modelo conceptual en un modelo


relacional.

Hemos revisado la representación de un modelo conceptual, ahora


revisaremos los detalles que debemos considerar para realizar la
conversión entre un modelo conceptual y un modelo relacional. Un
modelo de datos conceptual consta de objetos, interrelaciones, atributos,
especializaciones, agregados, etc. Cada uno de ellos podrá ser
transformado generando la creación de relaciones normalizadas para la
cuarta forma normal. Por lo tanto ya no se requiere aplicar el proceso de
normalización.

Transformar conjuntos de objetos y atributos.

NO_SS FECHA-
NAC
PERSONA

Base de Datos Corporativas, M.R.R. 24


Este es un conjunto de objetos con dos atributos. Persona es un conjunto
de objetos abstractos.
Este diagrama se transforma en una relación con atributos, de la sig.
manera.

PERSONA (NO_SS, FECHA-NAC). Se considera que el NO_SS puede servir


como campo clave, ya que identifica únicamente a la persona.

Transformar modelos sin claves externas.

Suponga el sig. modelo conceptual.

IMPORTE NO_PTO

VENTA
En este caso es posible transformar este diseño al modelo relacional de la
siguiente forma.

VENTA (Importe, no_pto), solo que no encontramos un campo que pueda


servir de clave, por lo que es necesario a añadir un atributo que nos
represente a la clave para esta relación. Ejemplo: VENTA(No_venta,
Importe, no_pto)

Restricciones de Integridad.

Para que una tabla sea una afinidad debe cumplir ciertas restricciones.
Entendiendo por restricción a las reglas que limitan los valores que
pueden estar en una base de datos.
El modelo de datos relacional de Codd incluye varias restricciones que se
usan para verificar la validación de los datos en una base de datos.
• Las celdas de la tabla deben ser de valor único; no se permite
repetir grupos ni tener arreglos como valores.
• Todos los ingresos en cualquier columna (atributo) deben ser del
mismo tipo.
• Cada columna posee un nombre único y no es importante el orden
de las columnas en la tabla.
• En la tabla no pueden ser idénticas dos hileras (tuplas) y no es
importante el orden de los renglones.

Además de considerar las siguientes restricciones:

Base de Datos Corporativas, M.R.R. 25


 Integridad de la entidad. El atributo que es clave de una fila
no puede ser nulo.
 Integridad referencial. El valor no nulo de una clave externa
debe ser un valor real de la clave de otra relación.
 Dependencia funcional. El valor de un atributo en una tupla
determina el valor de otro atributo en la tupla.

La simplicidad del modelo relacional se da desde que todas las


relaciones son definidas independientemente. La relación en el modelo E-
R puede ser representada en un modelo relacional por una unión entre
atributos de diferentes tablas.

Para entender el modelo relacional y la normalización es necesario


conocer los conceptos de dependencia funcional y de clave, de la cual ya
hemos hablado previamente.

Una dependencia funcional es una relación entre uno o más


atributos, esto es un dato será dependiente de otro y podremos encontrar
información a partir de un dato original.

Cuando en una tabla o base de datos no se tiene un diseño correcto


de los datos, se puede incurrir en anomalías de los siguientes tipos.

Anomalías de actualización. Inconsistencia de los datos como


resultados de datos redundantes y actualizaciones parciales.
Anomalías de borrado. Perdida no intencionada de datos debido a que
se han borrado otros datos.
Anomalías de Inserción. Imposibilidad de adicionar datos en la base de
datos debido a la ausencia de otros datos.
Ejemplo:

Tabla Trabajador.
Id-trab Nombre Oficio Id-sup Id-edificio
1235 Manuel. Alvarez Electricista 1511 300
1235 Manuel. Alvarez Electricista 1511 400
1412 Martin Perez Obrero 500
1412 Martin Perez Plomero 600
1412 Martin Perez Plomero 450
1412 Martin Perez Plomero 400
1511 Carlos Diaz Plomero 450

Esta es una tabla mal diseñada, que muestra redundancia, en datos


como el nombre, oficio.
Esta redundancia no sólo ocupa espacio, sino que puede llevar a perder la
integridad de los datos (pérdida de la consistencia) en la base de datos.
Suponiendo que un trabajador atiende a más de un edificio al mismo
tiempo y que además el oficio en una tupla es incorrecto y las demás son

Base de Datos Corporativas, M.R.R. 26


correctas. Esto genera inconsistencia entre las tuplas que contienen
información del trabajador. Esto se llama anomalías de actualización.

Suponga que un empleado ha dejado de trabajar por un tiempo y el


edificio que tenia asignado se termino. Si se desea eliminar las tuplas de
los edificios terminados es posible que la tupla de un trabajador sea
borrada y no se tengan los datos de el.Esto se denomina anomalías de
borrado. A modo inverso, puede tenerse contratado un nuevo empleado
llamado Jorge Media, si aun no se le asigna un edificio. A esto se le llama
anomalías de actualización.
Si deseamos eliminar este tipo de errores es necesario aplicar la técnica
de normalización que nos permita tener un diseño correcto.

Se han realizado muchos trabajos teóricos acerca de lo que es una


relación bien estructurada. Este trabajo se ha denominado Normalización,
porque es uno de los pioneros en la tecnología de las bases de datos, E.F.
Codd, definió varias formas normales de afinidades.

Normalización.
La técnica de normalización es semejante a lo que comúnmente se
dice de que un párrafo debe tener un sólo tema, si un párrafo tenía más
de un tema, debe dividirlo en tantos párrafos como temas se consideren.
La lógica que se aplica a la normalización es cada afinidad normalizada
tiene un sólo tema, Si tiene dos o más, deberá fragmentarse en
afinidades, cada una de las cuales tendrá un sólo tema.
Estas clases de afinidades y las técnicas para prevenir las anomalías
son llamadas formas normales. Dependiendo de su estructura, una
afinidad puede estar en primera forma normal, segunda forma normal o
alguna otra. En su artículo Ted Codd, estableció la primera, segunda y
tercera forma normal. Cada una de estas formas están anidadas, esto es
una afinidad que está en tercera forma, debe estar en primera y segunda
forma normal.

Primera forma normal

Una afinidad está en primera forma normal, si la tupla tiene un


campo definido como campo clave y todos sus valores son atómicos para
cada atributo en la relación. Esto es que los valores de los atributos no
pueden ser un conjunto de valores o un grupo repetitivo.
Cualquier tabla de datos que cumpla con la definición de una
afinidad, se dice que está en la primera forma normal.

Si en una tabla nos encontramos grupos repetitivos es necesario


crear una tabla de relación que interrelacione a las tablas determinadas.

Ejemplo:

Tabla Trabajador.

Base de Datos Corporativas, M.R.R. 27


Id- Nombre Oficio Id-sup Id-edificio
trabajador
1235 Manuel. Electricista 1511 300,450,500
Álvarez
1412 Martin Pérez Plomero 400.450,500,6
00
1511 Carlos Díaz Plomero 450,500

En esta tabla se observa que cada empleado puede atender a


diferentes edificios, este es el caso de un atributo como grupo repetitivo, por lo
que es necesario corregir esta tabla creando una nueva tabla de relación.

Trabajador
Id- Nombre Oficio Id-sup
trabajador
1235 Manuel. Electricista 1511
Álvarez
1412 Martin Pérez Plomero
1511 Carlos Díaz Plomero

Asignación por trabajador


Id- Id-edificio
trabajador
1235 300
1235 450
1235 500
1412 400
1412 450
1412 500
1412 600
1511 450
1511 500
Segunda forma normal.

La segunda y tercera forma normal se ocupa de la relación entre los


atributos claves y no claves. Una relación está en segunda forma normal
(2FN) si todos sus atributos que no son claves dependen por completo de
la clave, esto es cada afinidad que tiene un atributo único como clave, está
en segunda forma normal. La clave es sólo un atributo, en forma
predeterminada, cada atributo que no es clave no es funcionalmente
dependiente de una parte de la clave; no puede haber dependencias
parciales.Por tanto, la 2FN puede violarse sólo cuando una clave sea
compuesta o, en otras palabras, que conste de más de un atributo.

Ejemplo:

Id- Nombre Id-edificio Fecha inicio


trabajador
1235 Manuel. 300 01/01/01
Álvarez

Base de Datos Corporativas, M.R.R. 28


1412 Martin Pérez 400 01/04/01
1235 Manuel. 450 10/03/01
Álvarez
1412 Martin Pérez 500 02/10/01
1412 Martin Pérez 600 03/12/01

En esta tabla tenemos los datos del trabajador (id-trabajador y


nombre) cada vez que aparece una tupla de edificio asignado, existe
redundancia en el nombre y podrían acceder datos por id-trabajador y por
nombre, esto es una violación a la 2FN.

Tercera forma normal.

Una afinidad está en tercera forma normal si está en segunda forma


normal y no tiene dependencias transitivas. Una dependencia transitiva
es un arreglo de dependencias funcionales. Es posible decir que una
relación esta en 3FN si para toda dependencia funcional DF: X Y, X
es una clave.

Trabajador
Id- Oficio Sueldo
trabajador
1235 Electricista 3.50
1412 Plomero 3.00
1511 Plomero 3.75

Cuarta forma normal (4FN).

Una relación que esta en 3FN y no tiene dependencias


multievaluadas.

Quinta forma normal (5FN).

Una forma normal que elimina las dependencias de reunión (join:


unión).

Base de Datos Corporativas, M.R.R. 29

Vous aimerez peut-être aussi