Vous êtes sur la page 1sur 6

UNIVERSIDAD PRIVADA DEL SUR DE MXICO

Bases de Datos Distribuidas


(antologa)












M.C.C. Pedro Alejo Escarela Rodrguez Tuxtla Gutirrez, Chiapas. Mayo de 2013

UNIDAD I. CONCEPTOS BSICOS


Qu es un sistema distribuido de bases de datos?

Un sistema distribuido de bases de datos (SDBD) es un conjunto de mltiples
bases de datos lgicamente relacionadas, las cuales se encuentran ubicadas en diferentes
sitios interconectados por una red de telecomunicaciones, y que tienen la capacidad de
procesamiento autnomo, lo que indica que puede realizar operaciones locales o
distribuidas.

En este tipo de sistemas los usuarios desde cualquier sitio pueden acceder a los
datos en cualquier parte de la red exactamente como si los datos estuvieran en un
ambiente local.

Los principales factores que distinguen un sistema distribuido de bases de datos de
un sistema centralizado son los siguientes:

La base de datos se encuentra distribuida en varios equipos denominados
servidores de datos.
En cada servidor de datos se ubica una rplica de la base de datos principal, la cual
puede ser parcial o total.
A cada servidor se le conoce con el nombre de sitio o nodo.
Las transacciones sobre las bases de datos son administradas por un coordinador
de transacciones distribuidas.





Principios de un sistema distribuido de bases de datos

Un sistema distribuido de bases de datos debe observar los siguientes principios:

Disponibilidad. Si alguno de los sitios falla, los datos pueden hallarse en otro sitio
distinto. Por lo tanto, el sistema debe poder continuar trabajando a pesar del fallo.
Paralelismo. El sistema debe contar con la capacidad de que varios sitios puedan
procesar en paralelo las transacciones solicitadas por los clientes.
Fragmentacin. Es la descomposicin o particin de la base de datos en varias
partes llamadas fragmentos. La fragmentacin puede darse a nivel de tablas o
separando las tablas de otros objetos o elementos de la base de datos. A nivel de
tabla, sta puede darse de manera horizontal o vertical.
Transparencia de datos. Los datos siempre estarn disponibles sin importar en
qu sitio se encuentren fsicamente o el modo en que se puede tener acceso a
ellos en un sitio local concreto. La transparencia de datos puede adoptar las
siguientes tres formas:
o Transparencia de fragmentacin. No es necesario conocer el modo en que
se han fragmentado los datos.
o Transparencia de rplica. Los objetos de datos se ven como lgicamente
uno solo. Puede que el sistema distribuido replique los objetos para
incrementar el rendimiento del sistema o disponibilidad de los datos. Por lo
tanto, no debe preocupar qu objetos se han replicado ni la ubicacin de
esas rplicas.
o Transparencia de la ubicacin. No es necesario conocer la ubicacin fsica
de los datos, sin importar desde qu punto se ha hecho la peticin de las
transacciones.
Autonoma local. Los sitios distribuidos deben ser autnomos, es decir, que las
operaciones en un sitio dado se controlan en ese sitio.
No dependencia de un sitio central. No debe haber dependencia de un sitio
central para obtener el servicio.
Operacin continua. El sistema nunca debera apagarse para que se pueda realizar
alguna funcin, como aadir un nuevo sitio o dejar de operar por fallos en el
servidor central u otro nodo.
Independencia con respecto a la localizacin. No se hace necesario que los
usuarios conozcan dnde estn almacenados fsicamente los datos, sino que el
usuario debe verlos como si se tratara de un sitio local.
Independencia con respecto a la fragmentacin. La fragmentacin es deseable
por razones de desempeo, los datos pueden almacenarse en la localidad donde
se utilizan con mayor frecuencia de manera que la mayor parte de las operaciones
sean slo locales y se reduzca el trfico en la red.
Independencia de rplica. Si una relacin dada (es decir, un fragmento dado de
una relacin) se puede representar en el nivel fsico mediante varias copias
almacenadas o rplicas en muchos sitios distintos.
Procesamiento distribuido de consultas. El objetivo es convertir transacciones de
usuario en instrucciones para manipulacin de datos, y as reducir el trfico en la
red implica que el procesamiento mismo de optimizacin de consultas debe ser
distribuido.
Independencia con respecto al sistema operativo. El sistema debe ser ejecutable
en diferentes sistemas operativos.


Ventajas de un sistema distribuido de bases de datos

Los sistemas distribuidos de bases de datos presentan como principales ventajas
las siguientes:

Expandibilidad. Al crecer la organizacin por la adicin de una nueva unidad, el
nuevo nodo o unidad de localizacin de datos pasa a formar parte del sistema
distribuido de bases de datos sin reconfigurarla completamente.
Confiablidad y disponibilidad. Fcil conexin entre los datos de varias
localizaciones sin tener en cuenta los sistemas operativos y/o el hardware y
software utilizados. La capacidad que tiene el sistema de seguir trabajando, a pesar
del fallo de una localidad, da como resultado una mayor disponibilidad. Para
aplicaciones de solo lectura se almacenan mltiples copias de la misma
informacin, de forma que el sistema tenga alternativas de solucin para asegurar
que siempre alguna de ellas est disponible. La disponibilidad es fundamental para
los sistemas de bases de datos que se utilizan en aplicaciones de tiempo real.
Flexibilidad. Al realizar un movimiento en un dato de un lugar a otro o algn
cambio en una localizacin fsica de ciertos nodos requeridos, no hay que realizar
cambios en la base de datos o su arquitectura.
Distribucin de carga de trabajo. La distribucin de la carga de trabajo sobre los
sitios se hace sobre la base de utilizar la potencia de las computadoras de cada
sitio y maximizar el paralelismo en la ejecucin de las aplicaciones.
Comparticin. Los datos pueden ser compartidos por sucursales o usuarios
diferentes de la misma organizacin u organizaciones diferentes, permitiendo as
la comunicacin eficiente entre usuarios distantes. La ventaja principal de
compartir los datos mediante la distribucin es que cada localidad puede tener un
mejor control de sus datos almacenados localmente.
Confiabilidad. La confiabilidad se logra al tener rplicas de los datos, pues es
posible recuperar una copia daada o destruida a partir de otra.


Desventajas de un sistema distribuido de bases de datos

Debido a que ningn sistema es infalible, los sistemas distribuidos de bases de
datos tambin presentan algunas desventajas, siendo las siguientes las ms
representativas:

Complejidad. Un sistema distribuido, que oculta su naturaleza distribuida al
usuario, es ms complejo que un sistema centralizado. Las consideraciones tales
como el control de concurrencia y la seguridad deberan tenerse muy en cuenta,
no para mencionar la complejidad alta de la optimizacin de las consultas,
comparado con un sistema centralizado, sino que las actualizaciones se complican
proporcionalmente con el aumento de rplicas en el sistema.
Eficiencia. Se deben implementar mecanismos que garanticen la consistencia de
datos y permitan detectar fallas en el sistema y su posterior recuperacin. Al
ocurrir fallas en sitios distintos, el sitio que contenga una rplica de esa base de
datos y adems sea operable, debe garantizar la consistencia y actualizacin de su
base de datos, Al reponerse los diferentes sitios, el sistema gestor de bases de
datos debe garantizar la actualizacin de los sitios que estaban sin operar. Al estar
particionada la red que une los diferentes sitios, es un poco ms difcil garantizar
las actualizaciones de las bases de datos.
Mayor tiempo de procesamiento. El intercambio de mensajes y los clculos
adicionales que se requieren para coordinar las localidades son una forma de
tiempo extra que no existe en los sistemas centralizados.
Costo. La complejidad aumentada significa que los costos de mantenimiento y
adquisicin del sistema son mucho ms altos que los de un sistema manejador de
bases de datos centralizado.
Aumento del trfico de comunicacin. Cuando un sitio accede frecuentemente a
los datos de otro sitio, aumenta el trfico de mensajes y transacciones en la red, y
por tanto las comunicaciones; lo que puede convertirse en un cuello de botella.
Integridad. Debido a que no todos los datos se ubican en un lugar centralizado, el
fracaso podra ocasionar una prdida de datos para otros nodos.