Académique Documents
Professionnel Documents
Culture Documents
Unidad I
En una base de datos la informacin se encuentra en diversos archivos (tablas) y a su vez estos pueden alojarse en diversos dispositivos de almacenamiento (discos).
Se dice que un sistema es independiente de los datos cuando "los requerimientos de la aplicacin no determinan la forma de organizar los datos y la tcnica de acceder a ellos.
Al ser independientes no importa qu manejador sea el que acceda a la informacin, estos simplemente son datos y pueden visualizarse y manipularse desde cualquier DBMS.
La ventaja que ofrece la independencia de los datos es que si se cambia la estructura de los datos, esta no afecte el cdigo de programacin del sistema, haciendo conversiones o validaciones innecesarias.
DBMS (INDEPENDENCIA)
Permitir cambiar la estructura de los archivos de informacin. Cambiar los tipos de datos y longitudes de registros.
DBMS (INDEPENDENCIA)
Permitir crear campos nuevos en base a informacin existente. Importar o exportar datos a formatos estndar sin tener que alterar los programas de la aplicacin
INTEGRIDAD DE DATOS
El trmino integridad de datos se refiere a la correccin y completitud de los datos en una base de datos.
INTEGRIDAD DE DATOS
Cuando los contenidos de una base de datos se modifican con sentencias INSERT, DELETE O UPDATE, la integridad de los datos almacenados puede perderse de muchas maneras diferentes.
Datos Requeridos: Establece que una columna tenga un valor NULL o NOT NULL.
Verificacin de Validez: Cuando se crea una tabla cada columna tiene un tipo de datos y el DBMS asegura que solamente los datos del tipo especificado sean ingresados en la tabla.
Integridad de entidad: Establece que la clave primaria de una tabla debe tener un valor nico para cada fila de la tabla, sino la base de datos perder su integridad.
CLIENTE FACTURA
INVENTARIO
ART_VENDIDOS
NC (PK)
NOM
DIR
1
2 COD_ART (PK)
LUIS
PERLA DESC CANT
A
A CU
A1
A2 FOLIO (PK) 1
LAPIZ
PLUMA FECHA HOY ST 10
10
10 IVA 1
2
5 TOTAL 11 NC (FK) 1
2 3 NART (PK)
1 2 3 4
10 20
110 220
2 1 PU
5 3 5 3
200
La recuperacin y manejo rpido y eficiente de la informacin. El control de la redundancia, evitar la inconsistencia de la informacin y el tener una mayor integridad de ella.
Aunado a lo anterior podemos recalcar el poder de las aplicaciones Distribuidas y los sistemas Cliente/Servidor .
Qu es un DBMS?
Es un software de sistemas que tiene como propsito general facilitar el proceso de definir, construir y manipular bases de datos que se utilizan para diferentes tipos de aplicaciones.
Usuarios/Programadores
Programas de Aplicacin/Queries
Nivel Interno
QUE ES UN CLIENTE
Es el que inicia un requerimiento de servicio. El requerimiento inicial puede convertirse en mltiples requerimientos de trabajo a travs de redes LAN o WAN. La ubicacin de los datos o de las aplicaciones es totalmente transparente para el cliente.
Concentran toda la actividad en los equipos de los usuarios, la informacin es almacenada en el mismo equipo de computo.
QUE ES UN SERVIDOR
Es cualquier recurso de cmputo dedicado a responder a los requerimientos del cliente. Los servidores pueden estar conectados a los clientes a travs de redes LANs o WANs, para proveer de mltiples servicios a los clientes y ciudadanos tales como impresin, acceso a bases de datos, fax, procesamiento de imgenes, etc.
APLICACIONES CLIENTE/SERVIDOR
CLIENTE/SERVIDOR
C/S es una relacin entre procesos corriendo en mquinas separadas El servidor (S) es un proveedor de servicios. El cliente (C) es un consumidor de servicios. C y S Interactan por un mecanismo de pasaje de mensajes: Pedido de servicio. Respuesta
Las organizaciones que han incorporado sistemas de informacin han experimentado dos fases antes de distribuir la informacin.
Fase 1
Si se desea agrupa toda la informacin en un solo lugar, se necesitan equipos sofisticados con grandes capacidades. El 90 % de operaciones de entrada-salida de informacin eran locales.
Fase 1
Fase 2
Descentralizacin de los sistemas de Bases de Datos corporativas. Se presento problemas de consistencia de la informacin entre sistemas locales y central, as como al transferir informacin entre diferentes departamentos de una corporacin.
Fase 3
Se trata de formalizar la descentralizacin de Bases de Datos y sus funciones manteniendo la integridad de la informacin y algn tipo de control centralizado o distribuido.
Control. Las actividades relacionadas con el manejo o administracin del sistema. Datos. La informacin que maneja el sistema. Funciones. Las actividades que cada elemento del sistema realiza. Procesamiento lgico. Las tareas especficas involucradas en una actividad de procesamiento de informacin.
Aplicacin Distribuida
Un ambiente computacional se dice distribuido cuando sus programas o BDs estn ubicados en dos o ms computadores.
Aplicacin Distribuida
Sistema ERP Modulo de Compras Modulo de Ventas Modulo C Modulo de Nominas Modulo D
Modulo B Modulo A
Una base de datos distribuida (BDD) es un conjunto de mltiples Bases de Datos lgicamente relacionadas las cuales se encuentran distribuidas entre diferentes sitios interconectados por una red de comunicaciones.
Modulo Compras
Modulo Ventas
Modulo Nominas
SITIO 1
SITIO 2
Son sistemas en el cual mltiples sitios de Bases de Datos estn ligados por un sistema de comunicaciones, y un usuario en cualquier sitio puede acceder los datos en cualquier parte de la red, como si los datos estuvieran almacenados en su sitio propio.
Se encarga del manejo de la BDD y proporciona un mecanismo de acceso que hace que la distribucin sea transparente a los usuarios.
Si los sitios estan dispersos se usa la red WAN, si esta en diferentes edificios o departamentos pero dentro de una misma ubicacin se utiliza una red LAN.
TAREA
Investigar sobre:
Autonoma Local: Los sitios distribuido deben ser autnomos, es decir que todas las operaciones en un sitio dado se controlan en ese sitio.
No dependencia de un sitio central: No debe de haber dependencia de un sitio central para obtener un servicio.
Operacin Continua: Nunca debera apagarse para que se pueda realizar alguna funcin, como aadir un nuevo sitio.
Independencia con respecto a la localizacin: No debe de ser necesario que los usuarios sepan dnde estn almacenados fsicamente los datos, el usuario lo debe de ver como si solo existiera un sitio local.
Independencia con respecto a la fragmentacin: La fragmentacin es deseable por razones de desempeo, los datos, pueden almacenarse en la localidad donde se utilizan con mayor frecuencia de manera que la mayor parte de las operaciones sean slo locales y se reduzca el trfico en la red.
Independencia de rplica: Si una relacin dada (es decir, un fragmento dado de una relacin) se puede presentar en el nivel fsico mediante varias copias almacenadas o rplicas, en muchos sitios distintos.
Procesamiento Distribuido de Consultas: El objetivo es convertir transacciones de usuario en instrucciones para manipulacin de datos, y as reducir el trafico en la red implica que el proceso mismo de optimizacin de consultas debe ser distribuido.
Manejo Distribuido de Transacciones: Tiene dos aspectos principales, el control de recuperacin y el control de concurrencia, cada uno de los cuales requiere un tratamiento ms amplio en el ambiente distribuido.
Es que se puede leer o escribir datos localizados en diferentes nodos de la red. Todos los usuarios accesan a la BDD a travs de un esquema global en forma transparente al usuario.
Cada localidad pueda controlar hasta cierto punto los datos almacenados localmente.
Existe un administrador global de la base de datos que se encarga de todo el sistema. Parte de esta responsabilidad se delega al administrador de base de datos de cada localidad.
Dependiendo del diseo del sistema distribuido, cada administrador local podr tener un grado de autonoma diferente, que se conoce como autonoma local.
La posibilidad de contar con autonoma local es en muchos casos una ventaja importante de las bases de datos distribuidas.
La mayor complejidad que se requiere para garantizar una coordinacin adecuada entre localidades.
Costo del desarrollo de software: es ms difcil estructura un sistema de bases de datos distribuidos y por tanto su costo es mayor.
Mayor posibilidad de errores: puesto que las localidades del sistema distribuido operan en paralelo, es ms difcil garantizar que los algoritmos sean correctos.
Mayor tiempo extra de procesamiento: el intercambio de mensajes y los clculos adicionales son una forma de tiempo extra que no existe en los sistemas centralizados.
EL PROBLEMA DE DISEO
El problema de diseo de bases de datos distribuidos se refiere, en general, a hacer decisiones acerca de la ubicacin de datos y programas a travs de los diferentes sitios de una red de computadoras.
Puntos a considerar
1. Diseo del "esquema conceptual" el cual describe la base de datos integrada (esto es, todos los datos que son utilizados por las aplicaciones que tienen acceso a las bases de datos). 2. Diseo "fsico de la base de datos", esto es, mapear el esquema conceptual a las reas de almacenamiento y determinar los mtodos de acceso a las bases de datos.
Problemas a resolver
1. Diseo de la fragmentacin, este se determina por la forma en que las relaciones globales se subdividen en fragmentos horizontales, verticales o mixtos.
Problemas a resolver
2. Diseo de la asignacin de los fragmentos, esto se determina en la forma en que los fragmentos se mapean a las imgenes fsicas, en esta forma, tambin se determina la solicitud de fragmentos.
Procesamiento local. Colocar los datos tan cerca como sea posible de las aplicaciones que los utilizan. Distribucin de la carga de trabajo. Costo de almacenamiento y disponibilidad. La distribucin de la base de datos refleja el costo y disponibilidad del almacenamiento en diferentes sitios.
Fragmentacin
Fragmentacion
JNO JNOMBRE PRESUPUE STO LUGAR
J:
J1
Instrumentac in
Desarrollo de bases de datos
150000
Monterrey
J2
135000
Mxico
J3 J4 J5
Fragmentacin Horizontal
JNO JNOMBRE PRESUPUEST O LUGAR J1 Instrumentaci n 150000 Monterrey
J2
135000
Mxico
J3
CAD/CAM
250000
Puebla
J4
Mantenimiento
310000
Mxico
J5
CAD/CAM
500000
Guadalajara
Fragmentacin Horizontal
SUPPLIER( SNUM, NAME, CITY ) Entonces, la fragmentacin horizontal puede ser definida como:
SUPPLIER1 = SLcity == "SF"SUPPLIER SUPPLIER1 = SLcity == "LA"SUPPLIER Esta fragmentacin satisface la condicin de completes si "SF" y "LA" son solamente los nicos valores posibles del atributo CITY.
Fragmentacin Vertical
JNO J1 J2 J3 J4 J5 PRESUPUESTO 150000 135000 250000 310000 500000
JNO J1 J2 J3 J4 J5
Fragmentacin Vertical
Considere la siguiente relacin global: EMP( empnum, name, sal, tax, mgrnum, depnum ) Una fragmentacin vertical de esta relacin puede ser definida como:
EMP1 = PJempnum, name, mgrnum, depnum EMP EMP2 = PJempnum, sal, tax EMP
EMP = EMP1 (JN empnum) EMP2 porque empnum es una clave de EMP
La replicacin se complica cuando es necesario hacer actualizaciones a las copias mltiples de un dato. Por tanto, respecto a la replicacin, en el asignamiento de fragmentos se tienen tres estrategias:
La replicacin de informacin es de utilidad para obtener un mejor rendimiento y para ofrecer un mayor grado de confiabilidad (tolerancia a fallas).
Tipos de Replicas
No soportar replicacin. Cada fragmento reside en un solo sitio. Soportar replicacin completa. Cada fragmento en cada uno de los sitios. Soportar replicacin parcial. Cada fragmento en algunos de los sitios.