Vous êtes sur la page 1sur 19

TALLER DE BASE DE DATOS

Unidad 1
MC. María del Rosario Moreno Fernández

Objetivo Específico: El alumno conocerá las características principales de un sistema


manejador de base de datos (SMBD).

Base de datos: Es una colección de archivos interrelacionados, son creados


con un Sistema Manejador de Base de Datos (SMBD). El contenido de una
base de datos engloba a la información concerniente de una organización, de
tal manera que los datos estén disponibles para los usuarios, una finalidad de
la base de datos es eliminar la redundancia o al menos minimizarla. 1

Los componentes principales de un sistema de base de datos son el hardware,


software y los datos a manejar, así como el personal encargado del manejo del
sistema.

Sistema Manejador de Base de Datos (SMBD): Es una colección de


numerosas rutinas de software interrelacionadas, cada una de las cuales es
responsable de una tarea específica.

El objetivo primordial de un sistema manejador de base de datos es


proporcionar un contorno que sea a la vez conveniente y eficiente para ser
utilizado al extraer, almacenar y manipular información de la base de datos.
Todas las peticiones de acceso a la base de datos, se manejan
centralizadamente por medio del SMBD, por lo que este paquete funciona
como interfaz entre los usuarios y la base de datos.

Desventajas del procesamiento de archivos.

 Redundancia e inconsistencia de datos: Se refiere a que los archivos que


mantienen almacenada la información son creados por diferentes tipos de
programa de aplicación, existe la posibilidad que si no se controla
detalladamente el almacenamiento se puede originar un duplicado de
1
Freeze, W.S. Paraninfo, Mayo de 1998.,http://alarcos.inf-cr.uclm.es/doc/bda/doc/lab/BDa-
p2.pdf
información, es decir que la misma información sea capturada más de una
vez en un dispositivo de almacenamiento.

Esto aumenta los costos de almacenamiento y acceso a los datos además


de que puede originarse la inconsistencia de los datos.

 Dificultades para tener acceso a los datos: Es decir un sistema de base de


datos debe contemplar un entorno de datos que le facilite al usuario el
manejo de los mismos. Por ejemplo supóngase una agencia de envíos y
que uno de los gerentes necesita saber los nombres de todos los
remitentes que viven dentro del código postal 78733 de la ciudad. El
gerente pide al departamento de procesamiento de datos que genere la
lista correspondiente. Puesto que esta situación no fue prevista en el
diseño del sistema, no existe ninguna aplicación de consultas que permita
este tipo de solicitud, esto ocasiona una deficiencia del sistema.

 Aislamiento de los datos: Los datos están repartidos en varios archivos y


pueden tener diferentes formatos, es difícil escribir nuevos programas de
aplicación para obtener los datos apropiados.

 Anomalías del acceso concurrente: Para mejorar el funcionamiento global


del sistema y obtener un tiempo de respuesta más rápido, muchos
sistemas permiten que múltiples usuarios actualicen los datos
simultáneamente, en un entorno así, la interacción de actualizaciones
concurrentes pueden dar por resultado datos inconsistentes.

 Problemas de seguridad: La información de toda empresa es importante,


aunque unos datos lo son más que otros, por tal motivo se debe
considerar el control de acceso a los mismos, no todos los usuarios
pueden visualizar alguna información, para que un sistema de base de
datos sea confiable debe mantener un grado de seguridad que garantice
la autenticación y protección de los datos.
 Problemas de integridad: Los valores de datos almacenados en la base de
datos deben satisfacer cierto tipo de restricciones de consistencia, estas
restricciones se cumplan en el sistema añadiendo códigos apropiados en
los diversos programas de aplicación.

Abstracción de los datos.

Niveles de abstracción

Físico Conceptual Visión


es es
es
Describe como se Describe que datos Describe sólo
almacenan los datos son realmente parte de la base
almacenados datos

Diapositiva 3. Niveles de abstracción.


Una base de datos es en esencia una colección de archivos relacionados entre
si, de la cual los usuarios pueden extraer información sin considerar las
fronteras de los archivos. 2

Otro punto importante de un sistema de base de datos es proporcionar a los


usuarios una adición abstracta de los datos, es decir, el sistema esconde
ciertos detalles de cómo se almacenan y mantienen los datos, sin embargo
para que el sistema se ha manejable, los datos se deben extraer
eficientemente.

Existen diferentes niveles de abstracción para simplificar la interacción de los


usuarios con el sistema como son: físico, conceptual y de visión.

Vista 1 Vista 2 Vista…n


Nivel de visión
-------------------------------------------------------------------------------------
Nivel conceptual Nivel conceptual
--------------------------------------------------------------------------------------
Nivel físico Nivel físico
--------------------------------------------------------------------------------------
Figura 1. Los tres niveles de abstracción de datos.

 Nivel físico: Nivel más bajo de abstracción, se describe en detalle como se


almacenan realmente los datos, se describen en detalle las estructuras de
datos complejas del nivel bajo.

 Nivel conceptual: El siguiente nivel más alto de abstracción describe que


datos son realmente almacenados en la base de datos y las relaciones
que existen entre los datos. Aquí se describe la base de datos completa
en términos de un número pequeño de estructuras relativamente sencillas.
Aunque la implementación de las estructuras sencillas en el nivel físico, el

2
F. Korth Henry, Silberschatz Abraham, Fundamentos de bases de datos segunda edición,
Editorial Mc Graw Hill, México, 1993. Pág. 4-21.
usuario del nivel conceptual no necesita darse cuenta de eso. El nivel
conceptual de abstracción lo usan los administradores de bases de datos,
quienes deben decidir qué información se va a guardar en la base de
datos.

 Nivel de visión: El nivel más alto de abstracción describe sólo parte de la


base de datos completa. A pesar del uso de estructuras más sencillas en
el nivel conceptual, permanece algo de complejidad debido al gran
tamaño de la base de datos. Muchos usuarios del sistema de base de
datos no se interesarán por toda esta información. En cambio, dichos
usuarios sólo necesitan una parte de la base de datos, para simplificar su
interacción con el sistema puede proporcionar muchas visiones para la
misma base de datos.

1.1.1 Modelos de datos.

 Modelos de datos

Se usa para describir


datos en el nivel
Lógicos basados en objetos conceptual y de visión

Lógicos basados en registros Se utilizan para describir


datos en el modelo
conceptual y físico
Físicos de datos
Se usa para describir
datos en el nivel más
bajo

Diapositiva 4. Modelos de datos.

Para describir la estructura de una base de datos es necesario definir el


concepto de modelo de datos, que es: una colección de herramientas
conceptuales para describir datos, relaciones entre ellos, semántica asociada a
los datos y restricciones de consistencia.3 Los diversos modelos de datos que
se han propuesto se dividen en tres grupos:

 Modelos lógicos basados en objetos


 Modelos lógicos basados en registros
 Modelos físicos de datos

1.1.1.1 Modelos lógicos basados en objetos.

Modelos lógicos basados en objetos

Modelo de datos entidad-relación (E-R)

se basa

Percepción de un mundo real

Modelo orientado a objetos


se basa
Colección de objetos

Diapositiva 5. Modelos lógicos basados en objetos.

Los modelos lógicos basados en objetos se usan para describir datos en los
niveles conceptual y de visión. Se caracterizan por el hecho de que
proporcionan capacidad de estructuración bastante flexible y permiten
especificar restricciones de datos explícitamente. Hay muchos modelos

3
Ibíd. 2
diferentes, pero el más utilizado por su sencillez y eficacia es el modelo
Entidad-Relación.

a) Modelo de datos Entidad-Relación (E-R).

El modelo de datos entidad-relación (E-R) se basa en una percepción de un


mundo real que consiste en una colección de objetos básicos llamados
entidades, y relaciones entre estos objetos. Una entidad es un objeto que es
distinguible de otros objetos por medio de un conjunto específico de atributos.
Una relación es una asociación entre varias entidades.

Además de entidades y relaciones, el modelo E-R representa ciertas


restricciones a las que deben ajustarse los contenidos de una base de datos.
Una restricción importante es la de cardinalidad de asignación, que expresa el
número de entidades a las que puede asociarse otra entidad mediante un
conjunto de relación.

La estructura lógica global de una base de datos puede expresarse


gráficamente por medio de un diagrama E-R, que consta de los siguientes
componentes:

 Rectángulos, que representan conjuntos de entidades.


 Elipses, que representan atributos.
 Rombos, que representan relaciones entre conjuntos de entidades.
 Líneas, que conectan atributos a conjuntos de entidades a relaciones.

b) Modelo orientado a objetos.

El modelo orientado a objetos se basa en una colección de objetos. Un objeto


contiene valores almacenados en variables instancia dentro del objeto, a
diferencia de los modelos orientados a registros, estos valores son objetos por
sí mismos. Así, los objetos contienen objetos a un nivel de anidamiento de
profundidad arbitraria. Un objeto también contiene partes de código que operan
sobre el objeto, estas partes se llaman métodos.

Los objetos que contienen los mismos tipos de valores y los mismos métodos
se agrupan en clases. Una clase puede ser vista como una definición de tipo
para objetos.

1.1.1.2 Modelos lógicos basados en registros.

Modelos lógicos basados en registros

Modelo Relacional
Representa

Datos y relaciones entre los datos


mediante una colección de tablas
Modelo de Red Modelo Jerárquico

se basa
Colecciones
Los registros están
de registros
organizados como
colecciones de árboles
en vez de grafos
arbitrarios

Diapositiva 6. Modelos lógicos basados en registros.

Los modelos lógicos basados en registro se utilizan para describir datos en los
modelos conceptual y físico, se usan para especificar la estructura lógica global
de la base de datos y para proporcionar una descripción a nivel más alto de la
implementación. Estos modelos utilizan registros e instancias para representar
la realidad, así como las relaciones que existen entre estos registros (ligas) o
apuntadores. Los tres modelos de datos más aceptados son:
a) Modelo relacional: Representa los datos y las relaciones entre los datos
mediante una colección de tablas, cada una de las cuales tiene un número
de columnas con nombres únicos.
b) Modelo de red: Los datos en el modelo de red se representan mediante
colecciones de registros y las relaciones entre los datos se representan
mediante enlaces, los cuales pueden verse como punteros. Los registros en
la base de datos se organizan como colecciones de grafos arbitrarios.
c) Modelo jerárquico: Es similar al modelo de red en el sentido de que los datos
y las relaciones entre los datos se representan mediante registros y
enlaces, respectivamente. Se diferencia del modelo de red en que los
registros están organizados como colecciones de árboles en vez de grafos
arbitrarios.

Diferencias entre los modelos.

Los modelos relacionales se diferencian de los modelos de red y jerárquico en


que no usan punteros o enlaces. En cambio, el modelo relacional conecta
registros mediante los valores que éstos contienen. Esta libertad del uso de
punteros permite que se defina una base matemática formal.
1.1.1.3 Modelos físicos de datos.

Diapositiva 7. Modelos físicos de datos.

Los modelos físicos de datos se usan para describir datos en el nivel más bajo.
A diferencia de los modelos lógicos de datos, hay muy pocos modelos físicos
de datos en uso, dos de los más conocidos son:

• Modelo unificador.
• Memoria de elementos.
1.1.1.4 Instancias y esquemas.

Diapositiva 8. Instancias y esquemas.

Las bases de datos cambian a lo largo del tiempo según se añade y se suprime
información. La colección de información almacenada en la base de datos, en
un determinado momento en el tiempo, se llama una instancia de la base de
datos. El diseño global de la base de datos se llama esquema de la base de
datos. Los esquemas se cambian muy raras veces, o nunca.

El concepto de esquema de base de datos corresponde a la noción de


definición de tipo en el lenguaje de programación. Una variable de un tipo dado
tiene un valor determinado en un instante de tiempo dado. Así, el concepto del
valor de una variable en los lenguajes de programación corresponde al
concepto de una instancia de un esquema de la base de datos.

1.1.1.5 Independencia de datos.

Diapositiva 9. Independencia de datos.

La capacidad de modificar una definición de un esquema en un nivel sin afectar


la definición de un esquema en el nivel superior siguiente se llama
independencia de datos. Hay dos niveles de independencia de datos:

 Independencia física de datos: Se refiere a la capacidad de modificar el


esquema físico sin provocar que se vuelvan a escribir los programas de
aplicación. En algunas ocasiones son necesarias las modificaciones en
el nivel físico para mejorar el funcionamiento.
 Independencia lógica de datos: Se refiere a la capacidad de modificar el
esquema conceptual sin provocar que se vuelvan a escribir los programas
de aplicación. Las modificaciones en el nivel conceptual son necesarias
siempre que se altera la estructura lógica de la base de datos.

La independencia lógica de datos es más difícil de lograr que la independencia


física de datos, ya que los programas de aplicación son fuertemente
dependientes de la estructura lógica de los datos a los que acceden.

El concepto de independencia de datos es similar en muchos aspectos al


concepto de tipos abstractos de datos en los lenguajes de programación
modernos. Ambos ocultan detalles de implementación a los usuarios. Esto
permite a los usuarios que se concentren en la estructura general en vez de los
detalles de implementación de bajo nivel.
1.1.1.6 Gestor de base de datos.

Gestor de base de datos

Interfaz entre la base de datos f ísica y las peticiones del usuario.

Petición del Base de datos


usuario física

Indagaciones
Sistema
DBMS operativo Base
de
datos
Sistema de
manejo de
archivos

Diapositiva 10. Gestor de base de datos.

Generalmente, las bases de datos requieren una gran cantidad de espacio de


almacenamiento. Las bases de datos de las empresas comúnmente se miden
en términos de gigabytes es 1000 megabytes (un billón de bytes) o, terabytes
es un millón de megabytes (un trillón de bytes) de datos. Puesto que la
memoria principal de los computadores no puede almacenar ésta información,
se almacena en discos. Los datos se transfieren entre el almacenamiento en
disco y la memoria principal según se necesiten. Ya que el movimiento de los
datos y del disco es lento comparado con la velocidad de la unidad central de
procesamiento, es imperativo que el sistema de la base de datos estructure los
datos de forma que minimice la necesidad de mover los datos entre el disco y
la memoria principal.

En la figura 2. Se muestra el SMBD como interfase entre la base de datos


física y las peticiones del usuario. El SMBD interpreta las peticiones de
entrada/salida del usuario y las envía al sistema operativo para la transferencia
de datos entre la unidad de memoria secundaria y la memoria principal. El
SMBD es conocido también como gestor de base de datos.

Petición del usuario Base de datos física

Indagaciones
Sistema
DBMS Base de
operativo
datos
Sistema de manejo
de archivos

Figura 2. Interfaz entre la base de datos física y las peticiones del usuario.

En sí, un sistema manejador de base de datos es el corazón de la base de


datos ya que se encarga del control total de los posibles aspectos que la
puedan afectar.4

4
Ibíd. 2
1.2 Características del SMBD (Sistema Manejador de Base de Datos).

Características del SMBD (Sistema Manejador de Base de


Datos).

 Funciones de un sistema manejador de base de


datos o también llamado gestor de datos.

 Los componentes principales de un sistema


de base de datos.

Diapositiva 11. Característica del SMBD.

Un sistema de base de datos se divide en módulos que tratan cada una de las
responsabilidades del sistema general. En la mayoría de los casos, el sistema
operativo del computador proporciona únicamente los servicios más básicos, y
el sistema de la base de datos debe partir de esa base. Así, el diseño de un
sistema de base de datos debe incluir la consideración de la interfaz entre el
sistema de base de datos y el sistema operativo.

a) Funciones de un sistema manejador de base de datos o también llamado


gestor de datos.

 Crear y organizar la Base de datos.


 Establecer y mantener las trayectorias de acceso a la base de datos
de tal forma que los datos puedan ser accesados rápidamente.
 Manejar los datos de acuerdo a las peticiones de los usuarios.

 Registrar el uso de las bases de datos.


 Interacción con el manejador de archivos a través de las sentencias en
el Lenguaje de Manipulación de Datos (DML) al comando del sistema
de archivos. Así el Manejador de base de datos es el responsable del
verdadero almacenamiento de los datos.
 Respaldo y recuperación. Consiste en contar con mecanismos
implantados que permitan la recuperación fácilmente de los datos en
caso de ocurrir fallas en el sistema de base de datos.
 Control de concurrencia. Consiste en controlar la interacción entre los
usuarios concurrentes para no afectar la inconsistencia de los datos.
 Seguridad e integridad. Consiste en contar con mecanismos que
permitan el control de la consistencia de los datos evitando que estos
se vean perjudicados por cambios no autorizados o revistos.
b) Los componentes principales de un sistema de base de datos incluyen:

Componentes principales de un sistema de base de datos

Gestor de archivos Gestor de base de datos

Procesador de consultas Precompilador de DML

Compilador de DDL Archivos de datos

Diccionario de datos Índices

Diapositiva 12. Componentes principales de un sistema de base de datos.

 Gestor de archivos, el cual gestiona la asignación de espacio en la


memoria del disco y de las estructuras de datos usadas para
representar información almacenada en disco.

 Gestor de base de datos, el cual proporciona la interfaz entre los datos


de bajo nivel almacenados en la base de datos y los programas de
aplicación y las consultas que se hacen al sistema.

 Procesador de consultas, el cual traduce sentencias en un lenguaje de


consultas a instrucciones de bajo nivel que entiende el gestor de la
base de datos. Además, el procesador de consultas intenta
transformar una pregunta del usuario en una forma equivalente pero
más eficiente, encontrando así una buena estrategia para ejecutar la
consulta.
 Precompilador de DML (Lenguaje de Manipulación de Datos), el cual
convierte las sentencias en DML incorporadas en un programa de
aplicación en llamadas normales a procedimientos en el lenguaje
principal. El precompilador debe interaccionar con el procesador de
consultas para generar el código apropiado.

 Compilador de DDL (Lenguaje de Definición de Datos), el cual


convierte sentencias en DDL en un conjunto de tablas que contienen
metadatos, o datos sobre datos. Además, se requieren varias
estructuras de datos como parte de la implementación del sistema
físico.

 Archivos de datos, que almacenan la base de datos.

 Diccionario de datos, que almacena metadatos sobre la estructura de


la base de datos. El diccionario de datos se usa ampliamente. Por
tanto, debe ponerse mucho énfasis en el desarrollo de un buen diseño
y una implementación eficiente del diccionario.

 Índices, que proporcionan acceso rápido a los elementos de datos que


contienen valores determinados.

Una de las razones principales para tener sistemas de gestión de bases de


datos es tener el control central de los datos y de los programas que
acceden a esos datos. La persona que tiene dicho control central sobre el
sistema se llama administrador de la base de datos (database administrator
(DBA)).

Vous aimerez peut-être aussi