Vous êtes sur la page 1sur 84

Base de Datos Distribuidas

Unidad I

QUE ES UNA BASE DE DATOS

En una base de datos la informacin se encuentra en diversos archivos (tablas) y a su vez estos pueden alojarse en diversos dispositivos de almacenamiento (discos).

INDEPENDENCIA DE LOS DATOS

Se dice que un sistema es independiente de los datos cuando "los requerimientos de la aplicacin no determinan la forma de organizar los datos y la tcnica de acceder a ellos.

INDEPENDENCIA DE LOS DATOS

Al ser independientes no importa qu manejador sea el que acceda a la informacin, estos simplemente son datos y pueden visualizarse y manipularse desde cualquier DBMS.

INDEPENDENCIA DE LOS DATOS

La ventaja que ofrece la independencia de los datos es que si se cambia la estructura de los datos, esta no afecte el cdigo de programacin del sistema, haciendo conversiones o validaciones innecesarias.

DBMS (INDEPENDENCIA)

Permitir cambiar la estructura de los archivos de informacin. Cambiar los tipos de datos y longitudes de registros.

Hacer una administracin optima de la informacin.

DBMS (INDEPENDENCIA)

Permitir crear campos nuevos en base a informacin existente. Importar o exportar datos a formatos estndar sin tener que alterar los programas de la aplicacin

INTEGRIDAD DE DATOS

El trmino integridad de datos se refiere a la correccin y completitud de los datos en una base de datos.

INTEGRIDAD DE DATOS

Cuando los contenidos de una base de datos se modifican con sentencias INSERT, DELETE O UPDATE, la integridad de los datos almacenados puede perderse de muchas maneras diferentes.

COMO SE PUEDE PERDER LA INTEGRIDAD DE LOS DATOS?

TIPOS DE RESTRICCIONES DE INTEGRIDAD EN B.D. RELACIONALES

Datos Requeridos: Establece que una columna tenga un valor NULL o NOT NULL.

TIPOS DE RESTRICCIONES DE INTEGRIDAD EN B.D. RELACIONALES

Verificacin de Validez: Cuando se crea una tabla cada columna tiene un tipo de datos y el DBMS asegura que solamente los datos del tipo especificado sean ingresados en la tabla.

TIPOS DE RESTRICCIONES DE INTEGRIDAD EN B.D. RELACIONALES

Integridad de entidad: Establece que la clave primaria de una tabla debe tener un valor nico para cada fila de la tabla, sino la base de datos perder su integridad.

CLIENTE FACTURA

INVENTARIO

ART_VENDIDOS

NC (PK)

NOM

DIR

1
2 COD_ART (PK)

LUIS
PERLA DESC CANT

A
A CU

A1
A2 FOLIO (PK) 1

LAPIZ
PLUMA FECHA HOY ST 10

10
10 IVA 1

2
5 TOTAL 11 NC (FK) 1

2 3 NART (PK)
1 2 3 4

MANANA 100 PASADO FOLIO (FK)


1 1 2 3

10 20

110 220

2 1 PU
5 3 5 3

200

COD_ART (FK) CVENTA


A1 A2 A1 A2 2 3 4 2

OBJETIVOS DE UNA BASE DE DATOS

La recuperacin y manejo rpido y eficiente de la informacin. El control de la redundancia, evitar la inconsistencia de la informacin y el tener una mayor integridad de ella.

OBJETIVOS DE UNA BASE DE DATOS

Aunado a lo anterior podemos recalcar el poder de las aplicaciones Distribuidas y los sistemas Cliente/Servidor .

Qu es un DBMS?

SISTEMA MANEJADOR DE BASE DE DATOS(SMBD) (DBMS):

Es un software de sistemas que tiene como propsito general facilitar el proceso de definir, construir y manipular bases de datos que se utilizan para diferentes tipos de aplicaciones.

Usuarios/Programadores

Nivel Externo Nivel Conceptual

Programas de Aplicacin/Queries

Software para procesar programas/queries

Software para accesar datos almacenados

Esquema del ambiente de un DBMS Los niveles estn conectados lgicamente

Nivel Interno

Definicin de la base de datos (Metadatos)

Base de datos almacenada

QUE ES UN CLIENTE

Es el que inicia un requerimiento de servicio. El requerimiento inicial puede convertirse en mltiples requerimientos de trabajo a travs de redes LAN o WAN. La ubicacin de los datos o de las aplicaciones es totalmente transparente para el cliente.

Aplicaciones Cliente - Cliente

Concentran toda la actividad en los equipos de los usuarios, la informacin es almacenada en el mismo equipo de computo.

QUE ES UN SERVIDOR

Es cualquier recurso de cmputo dedicado a responder a los requerimientos del cliente. Los servidores pueden estar conectados a los clientes a travs de redes LANs o WANs, para proveer de mltiples servicios a los clientes y ciudadanos tales como impresin, acceso a bases de datos, fax, procesamiento de imgenes, etc.

APLICACIONES CLIENTE/SERVIDOR

CLIENTE/SERVIDOR

C/S es una relacin entre procesos corriendo en mquinas separadas El servidor (S) es un proveedor de servicios. El cliente (C) es un consumidor de servicios. C y S Interactan por un mecanismo de pasaje de mensajes: Pedido de servicio. Respuesta

ELEMENTOS DE LA ARQUITECTURA C/S

Presentacin/Captacin de Informacin Procesos Almacenamiento de la Informacin

Base de Datos Distribuidas

Las Bases de Datos grandes permiten organizarse por partes.

Ejemplo: Servicios de salud, corporaciones industriales o bancos.

Base de Datos Distribuidas

Las organizaciones que han incorporado sistemas de informacin han experimentado dos fases antes de distribuir la informacin.

Fase 1

Si se desea agrupa toda la informacin en un solo lugar, se necesitan equipos sofisticados con grandes capacidades. El 90 % de operaciones de entrada-salida de informacin eran locales.

Fase 1

El 10% involucraba informacin cruzada (ms de un Dpto.).

Fase 2

Descentralizacin de los sistemas de Bases de Datos corporativas. Se presento problemas de consistencia de la informacin entre sistemas locales y central, as como al transferir informacin entre diferentes departamentos de una corporacin.

Fase 3

Se trata de formalizar la descentralizacin de Bases de Datos y sus funciones manteniendo la integridad de la informacin y algn tipo de control centralizado o distribuido.

Los elementos que se pueden distribuir son:

Control. Las actividades relacionadas con el manejo o administracin del sistema. Datos. La informacin que maneja el sistema. Funciones. Las actividades que cada elemento del sistema realiza. Procesamiento lgico. Las tareas especficas involucradas en una actividad de procesamiento de informacin.

Aplicacin Distribuida

Un ambiente computacional se dice distribuido cuando sus programas o BDs estn ubicados en dos o ms computadores.

Aplicacin Distribuida
Sistema ERP Modulo de Compras Modulo de Ventas Modulo C Modulo de Nominas Modulo D

Modulo B Modulo A

Sistemas de base de datos distribuidos.

Una base de datos distribuida (BDD) es un conjunto de mltiples Bases de Datos lgicamente relacionadas las cuales se encuentran distribuidas entre diferentes sitios interconectados por una red de comunicaciones.

Base de Datos Distribuidas


Sistema ERP

Modulo Compras

Modulo Ventas

Modulo Nominas

SITIO 1

SITIO 2

Sistema de Bases de Datos distribuidas (SBDD)

Son sistemas en el cual mltiples sitios de Bases de Datos estn ligados por un sistema de comunicaciones, y un usuario en cualquier sitio puede acceder los datos en cualquier parte de la red, como si los datos estuvieran almacenados en su sitio propio.

Sistema de Bases de Datos distribuida (SBDD)

Es el resultado de la integracin de una BDD con un sistema para su manejo.

Sistema de manejo de Bases de Datos distribuidas (SMBDD)

Se encarga del manejo de la BDD y proporciona un mecanismo de acceso que hace que la distribucin sea transparente a los usuarios.

Bases de Datos Distribuida

Si los sitios estan dispersos se usa la red WAN, si esta en diferentes edificios o departamentos pero dentro de una misma ubicacin se utiliza una red LAN.

TAREA
Investigar sobre:

APLICACIONES DE 2 CAPAS, 3 CAPAS Y N CAPAS.

Base de Datos Distribuidas


Unidad II

Base de Datos Distribuidas

Caractersticas de una Base de Datos Distribuida.

Caractersticas de las BDD

Autonoma Local: Los sitios distribuido deben ser autnomos, es decir que todas las operaciones en un sitio dado se controlan en ese sitio.

Caractersticas de las BDD

No dependencia de un sitio central: No debe de haber dependencia de un sitio central para obtener un servicio.

Caractersticas de las BDD

Operacin Continua: Nunca debera apagarse para que se pueda realizar alguna funcin, como aadir un nuevo sitio.

Caractersticas de las BDD

Independencia con respecto a la localizacin: No debe de ser necesario que los usuarios sepan dnde estn almacenados fsicamente los datos, el usuario lo debe de ver como si solo existiera un sitio local.

Caractersticas de las BDD

Independencia con respecto a la fragmentacin: La fragmentacin es deseable por razones de desempeo, los datos, pueden almacenarse en la localidad donde se utilizan con mayor frecuencia de manera que la mayor parte de las operaciones sean slo locales y se reduzca el trfico en la red.

Caractersticas de las BDD

Independencia de rplica: Si una relacin dada (es decir, un fragmento dado de una relacin) se puede presentar en el nivel fsico mediante varias copias almacenadas o rplicas, en muchos sitios distintos.

Caractersticas de las BDD

Procesamiento Distribuido de Consultas: El objetivo es convertir transacciones de usuario en instrucciones para manipulacin de datos, y as reducir el trafico en la red implica que el proceso mismo de optimizacin de consultas debe ser distribuido.

Caractersticas de las BDD

Manejo Distribuido de Transacciones: Tiene dos aspectos principales, el control de recuperacin y el control de concurrencia, cada uno de los cuales requiere un tratamiento ms amplio en el ambiente distribuido.

Caractersticas de las BDD

Independencia con respecto al equipo. Independencia con respecto al Sistema Operativo.

Independencia con respecto a la red.

Caractersticas de las BDD

Es que se puede leer o escribir datos localizados en diferentes nodos de la red. Todos los usuarios accesan a la BDD a travs de un esquema global en forma transparente al usuario.

Caractersticas de las BDD

El mismo SMBD es usado por cada localidad.

Ventajas de la distribucin de datos

La capacidad de compartir y acceder a la informacin de una forma fiable y eficaz.

Ventajas de la distribucin de datos

Cada localidad pueda controlar hasta cierto punto los datos almacenados localmente.

Ventajas de la distribucin de datos

Existe un administrador global de la base de datos que se encarga de todo el sistema. Parte de esta responsabilidad se delega al administrador de base de datos de cada localidad.

Ventajas de la distribucin de datos

Dependiendo del diseo del sistema distribuido, cada administrador local podr tener un grado de autonoma diferente, que se conoce como autonoma local.

Ventajas de la distribucin de datos

La posibilidad de contar con autonoma local es en muchos casos una ventaja importante de las bases de datos distribuidas.

Desventajas de la distribucin de los datos

La mayor complejidad que se requiere para garantizar una coordinacin adecuada entre localidades.

Desventajas de la distribucin de los datos


El aumento de la complejidad se refleja en:

Costo del desarrollo de software: es ms difcil estructura un sistema de bases de datos distribuidos y por tanto su costo es mayor.

Desventajas de la distribucin de los datos

Mayor posibilidad de errores: puesto que las localidades del sistema distribuido operan en paralelo, es ms difcil garantizar que los algoritmos sean correctos.

Desventajas de la distribucin de los datos

Mayor tiempo extra de procesamiento: el intercambio de mensajes y los clculos adicionales son una forma de tiempo extra que no existe en los sistemas centralizados.

EL PROBLEMA DE DISEO

El problema de diseo de bases de datos distribuidos se refiere, en general, a hacer decisiones acerca de la ubicacin de datos y programas a travs de los diferentes sitios de una red de computadoras.

Puntos a considerar

1. Diseo del "esquema conceptual" el cual describe la base de datos integrada (esto es, todos los datos que son utilizados por las aplicaciones que tienen acceso a las bases de datos). 2. Diseo "fsico de la base de datos", esto es, mapear el esquema conceptual a las reas de almacenamiento y determinar los mtodos de acceso a las bases de datos.

Problemas a resolver

1. Diseo de la fragmentacin, este se determina por la forma en que las relaciones globales se subdividen en fragmentos horizontales, verticales o mixtos.

Problemas a resolver

2. Diseo de la asignacin de los fragmentos, esto se determina en la forma en que los fragmentos se mapean a las imgenes fsicas, en esta forma, tambin se determina la solicitud de fragmentos.

Objetivos del Diseo de la Distribucin de los Datos

Procesamiento local. Colocar los datos tan cerca como sea posible de las aplicaciones que los utilizan. Distribucin de la carga de trabajo. Costo de almacenamiento y disponibilidad. La distribucin de la base de datos refleja el costo y disponibilidad del almacenamiento en diferentes sitios.

Fragmentacin

Fragmentacion
JNO JNOMBRE PRESUPUE STO LUGAR

J:

J1

Instrumentac in
Desarrollo de bases de datos

150000

Monterrey

J2

135000

Mxico

J3 J4 J5

CAD/CAM Mantenimien to CAD/CAM

250000 310000 500000

Puebla Mxico Guadalajara

Fragmentacin Horizontal
JNO JNOMBRE PRESUPUEST O LUGAR J1 Instrumentaci n 150000 Monterrey

J2

Desarrollo de bases de datos

135000

Mxico

Presupuesto < 200000


JNO JNOMBRE PRESUPUEST O LUGAR

J3

CAD/CAM

250000

Puebla

J4

Mantenimiento

310000

Mxico

J5

CAD/CAM

500000

Guadalajara

Presupuesto > 200000

Fragmentacin Horizontal
SUPPLIER( SNUM, NAME, CITY ) Entonces, la fragmentacin horizontal puede ser definida como:

SUPPLIER1 = SLcity == "SF"SUPPLIER SUPPLIER1 = SLcity == "LA"SUPPLIER Esta fragmentacin satisface la condicin de completes si "SF" y "LA" son solamente los nicos valores posibles del atributo CITY.

La condicin de reconstruccin se logra con:

SUPPLIER = SUPPLIER1 union SUPPLIER2

Fragmentacin Vertical
JNO J1 J2 J3 J4 J5 PRESUPUESTO 150000 135000 250000 310000 500000

Informacin acerca de presupuestos de proyectos

JNO J1 J2 J3 J4 J5

JNOMBRE Instrumentacin Desarrollo de bases de datos CAD/CAM Mantenimiento CAD/CAM

LUGAR Monterrey Mxico Puebla Mxico Guadalajara

J2: informacin acerca de los nombres y ubicaciones de proyectos

Fragmentacin Vertical
Considere la siguiente relacin global: EMP( empnum, name, sal, tax, mgrnum, depnum ) Una fragmentacin vertical de esta relacin puede ser definida como:

EMP1 = PJempnum, name, mgrnum, depnum EMP EMP2 = PJempnum, sal, tax EMP

La reconstruccin de la relacin EMP puede ser obtenida como:

EMP = EMP1 (JN empnum) EMP2 porque empnum es una clave de EMP

Objetivos del Diseo de la Distribucin de los Datos

La replicacin se complica cuando es necesario hacer actualizaciones a las copias mltiples de un dato. Por tanto, respecto a la replicacin, en el asignamiento de fragmentos se tienen tres estrategias:

Alternativas sobre replicacin para el asignamiento de fragmentos

La replicacin de informacin es de utilidad para obtener un mejor rendimiento y para ofrecer un mayor grado de confiabilidad (tolerancia a fallas).

Tipos de Replicas

No soportar replicacin. Cada fragmento reside en un solo sitio. Soportar replicacin completa. Cada fragmento en cada uno de los sitios. Soportar replicacin parcial. Cada fragmento en algunos de los sitios.

Vous aimerez peut-être aussi