Vous êtes sur la page 1sur 9

Introduccin

Una base de datos distribuida (BDD) es un conjunto de mltiples bases de datos lgicamente relacionadas que se encuentran distribuidas entre diferentes sitios interconectados por una red de comunicaciones. La informacin que constituye la base de datos est almacenada en diferentes sitios de la red, y las aplicaciones que se ejecutan acceden a estos datos en lugares distintos. Por lo tanto, una base de datos es una coleccin de datos que pertenecen lgicamente a un slo sistema, pero que fsicamente se encuentra "distribuido" en varios lugares de la red. Hay que tener en cuenta que cada sitio anteriormente mencionado es un sistema de base de datos en s mismo pero que con el resto de sitios que conforman la base de datos distribuida han decidido trabajar juntos con el fin de que un usuario de cualquier lugar pueda obtener acceso a los datos de cualquier punto de la red tal como si todos los datos estuvieran siendo accedidos de forma local. En consecuencia, la llamada base de datos distribuida es en realidad una especie de objeto virtual, cuyas partes componentes se almacenan fsicamente en varias bases de datos "reales" distintas, ubicadas en diferentes sitios. Es una unin lgica de esas bases de datos. Se asume que cada localidad ejecuta el mismo software de control de base de datos distribuida. Si no se cumple esta premisa, ser muy difcil manejar transacciones globales.

Bases de Datos Distribuidas


La diferencia principal entre los sistemas de bases de datos centralizados y los distribuidos es que en los primeros, los datos residen en una sola localidad, mientras que, en lo ltimos, se encuentran en varias localidades. Cada localidad puede procesar transacciones locales, es decir, aquellas que slo acceden a datos que residen en esa localidad. Adems, una localidad puede participar en la ejecucin de transacciones globales, es decir, aquellas que acceden a datos de varias localidades, sta requiere comunicacin entre las localidades. Una transaccin local es la que accede a cuentas en la localidad individual donde se inicio. En cambio, una transaccin global accede a cuentas de una localidad distinta a la localidad donde se inicio o a cuentas de varias localidades diferentes. El sistema de administracin de Base de Datos Distribuida (DDBMS), esta formado por las transacciones y los administradores de base de datos distribuidos de todas las computadoras. Tal DDBMS en un esquema genrico implica un conjunto de programas que operan en diversas computadoras. Estos programas pueden ser subsistemas de un producto nico DDBMS, concesionado por un slo fabricante, o tambin pudiera resultar de una coleccin de programas de fuentes dispares: algunos considerados por fabricantes y algunos otros escritos en casa. Un administrador de de transacciones distribuidas (DTM) es un programa que recibe solicitudes de procesamiento de los programas de consulta o de transacciones y a su vez las traduce en acciones para los administradores de la base de datos . Una funcin importante del DTM es coordinar y controlar dichas acciones. Cada sitio tiene sus propias bases de datos "reales" locales, sus propios usuarios locales, sus propios DBMS y programas para administracin de transacciones y su propio administrador local de comunicacin de datos.

Las Doce Reglas De Las Bases De Datos Distribuidas El principio fundamental es que para el usuario un sistema distribuido debe ser igual que uno centralizado Autonoma Local: Los sitios distribuidos deben ser autnomos, es decir que todas las operaciones en un sitio dado se controlan en ese sitio. No dependencia de un sitio central: No debe de haber dependencia de un sitio central para obtener un servicio. Operacin Continua: Nunca debera apagarse para que se pueda realizar alguna funcin, como aadir un nuevo sitio. Independencia con respecto a la localizacin: No debe de ser necesario que los usuarios sepan dnde estn almacenados fsicamente los datos, sino que ms el usuario lo debe de ver como si solo existiera un sitio local. Independencia con respecto a la fragmentacin: La fragmentacin es deseable por razones de desempeo, los datos, pueden almacenarse en la localidad donde se utilizan con mayor frecuencia de manera que la mayor parte de las operaciones sean slo locales y se reduzca el trfico en la red. Independencia de rplica: Si una relacin dada (es decir, un fragmento dado de una relacin ) se puede presentar en el nivel fsico mediante varias copias almacenadas o rplicas, en muchos sitios distintos. Procesamiento Distribuido de Consultas: El objetivo es convertir transacciones de usuario en instrucciones para manipulacin de datos, y as reducir el trafico en la red implica que el proceso mismo de optimizacin de consultas debe ser distribuido. Manejo Distribuido de Transacciones: Tiene dos aspectos principales, el control de recuperacin y el control de concurrencia, cada uno de los cuales requiere un tratamiento ms amplio en el ambiente distribuido. Independencia con respecto al equipo: El SGBDD debe ser ejecutable en diferentes plataformas hardware. Independencia con respecto al Sistema Operativo: El sistema debe ser ejecutable varios diferentes SO. Independencia con respecto a la red: El sistema debe poder ejecutarse en diferentes redes. Todos los usuarios accesan a la BDD a travs de un esquema global en forma transparente al usuario. Debe ser posible ejecutar diferentes SGBDD locales que utilicen distintos modelos de datos.

Ventajas y desventajas de Bases de Datos Distribuidas Ventajas

La primera ventaja es la modularidad, los sistemas distribuidos pueden variar su tamao de un modo ms sencillo. Se pueden agregar computadoras adicionales a la red conforme aumentan el nmero de usuarios y su carga de procesamiento. Despus, si la carga de trabajo se reduce, el tamao de la red tambin puede reducirse. A menudo es ms fcil y ms econmico agregar una nueva computadora ms pequea que actualizar una computadora nica y centralizada que sea ms poderosa. En tercer lugar tenemos la sencillez, los sistemas distribuidos se pueden adecuar de una manera ms sencilla a las estructuras de la organizacin de los usuarios. Como cuarta ventaja podemos mencionar la autonoma local de los datos. Los datos se pueden colocar fsicamente en el lugar donde se accede a ellos ms frecuentemente, haciendo que los usuarios tengan control local de los datos con los que actan (un departamento puede controlar los datos que le pertenecen) permitiendo a los usuarios aplicar polticas locales respecto del tipo de accesos a sus datos. La quinta ventaja se basa en la disponibilidad. Si se produce un fallo en una localidad de un sistema distribuido, es posible que las dems localidades puedan seguir trabajando. En particular, si los datos se repiten en varias localidades, una transaccin que requiere un dato especfico puede encontrarlo en ms de una localidad. As, el fallo de una localidad no implica necesariamente la desactivacin del sistema. La disponibilidad es fundamental para los sistemas de bases de datos que se utilizan en aplicaciones de tiempo real. La sexta, puede dar como resultado un mejor rendimiento que el que se obtiene por un procesamiento centralizado. Los datos generalmente se ubican cerca del sitio con mayor demanda, tambin los sistemas trabajan en paralelo, lo cual permite balancear la carga en los servidores. Varias computadoras operando en forma simultnea pueden entregar ms volumen de procesamiento que una sola computadora. ltima, los datos duplicados aumentan su confiabilidad. Cuando falla una computadora, se pueden obtener los datos extrados de otras computadoras. Los usuarios no dependen de la disponibilidad de una sola fuente para sus datos.

Estas dos ltimas ventajas no se pueden garantizar y por eso sern mencionadas de nuevo entre las desventajas de los sistemas de bases de datos distribuidos ya que dependen de: la confiabilidad de las computadoras de procesamiento, de la red, del DDBMS, de las transacciones y de las tasas de error en la carga de trabajo.

Desventajas

La primera desventaja es el rendimiento, puede ser peor para el procesamiento distribuido que para el procesamiento centralizado. Depende de la naturaleza de la carga de trabajo, la red, el DDBMS y las estrategias utilizadas de concurrencia y de falla, as como las ventajas del acceso local a los datos y de los procesadores mltiples, ya que stos pueden ser abrumados por las tareas de coordinacin y de control requeridas. Tal situacin es probable cuando la carga de trabajo necesita un gran nmero de actualizaciones concurrentes sobre datos duplicados, y que deben estar muy distribuidos. La segunda es la confiabilidad. El procesamiento de base de datos distribuida puede resultar menos confiable que el procesamiento centralizado y un sistema distribuido puede estar menos disponible que uno centralizado. Esto depender de los parmetros mencionados en el apartado anterior. Una tercera desventaja es su mayor complejidad, a menudo se traduce en altos gastos de construccin y mantenimiento. Ya que existen ms componentes de hardware, hay ms cantidad de cosas por aprender y ms interfaces susceptibles de fallar. Se debe asegurar que la base de datos sea transparente, se debe lidiar con varios sistemas diferentes que pueden presentar dificultades nicas. La cuarta es el coste. El control de concurrencia y recuperacin de fallos puede convertirse en algo complicado y difcil de implementar, puede empujar a una mayor carga sobre programadores y personal de operaciones y quiz se requiera de personal ms experimentado y ms costoso. Quinta, el procesamiento de bases de datos distribuido es difcil de controlar. Una computadora centralizada reside en un entorno controlado, con personal de operaciones que supervisa muy de cerca, y las actividades de procesamiento pueden ser vigiladas, aunque a veces con dificultad. En un sistema distribuido, las computadoras de proceso, residen muchas veces en las reas de trabajo de los usuarios. En ocasiones el acceso fsico no est controlado, y los procedimientos

operativos son demasiado suaves y efectuados por personas que tienen escasa apreciacin o comprensin sobre su importancia. En sistemas centralizados, en caso de un desastre o catstrofe, la recuperacin puede ser ms difcil de sincronizar.

En sexto lugar tenemos la seguridad. Dado que los datos residen en muchos nodos diferentes y se pueden consultar por nodos diversos de la red, la probabilidad de violaciones de seguridad es creciente si no se toman las precauciones debidas. La siguiente es la integridad (consistencia, validez y exactitud de la informacin). Se vuelve difcil mantener la integridad, aplicar las reglas de integridad a travs de la red puede ser muy caro en trminos de transmisin de datos. Finalmente se puede mencionar la carencia de estndares. An no existen herramientas o metodologas que ayuden a los usuarios a convertir un DBMS centralizado en un DBMS distribuido.

Caractersticas De Un Sistema Cliente/Servidor.


Un sistema cliente/servidor es aquel en el que uno o ms clientes y uno o ms servidores, conjuntamente con un sistema operativo subyacente y un sistema de comunicacin entre procesos, forma un sistema compuesto que permite cmputo distribuido, anlisis, y presentacin de los datos. Si existen mltiples servidores de procesamiento de base de datos, cada uno de ellos deber procesar una base de datos distinta, para que el sistema sea considerado un sistema cliente/servidor. Cuando dos servidores procesan la misma base de datos, el sistema ya no se llama un sistema cliente/servidor, sino que se trata de un sistema de base de datos distribuido. Los clientes, a travs de la red, pueden realizar consultas al servidor. El servidor tiene el control sobre los datos; sin embargo los clientes pueden tener datos privados que residen en sus computadoras. Las principales caractersticas de la arquitectura cliente/servidor son: - El servidor presenta a todos sus clientes una interfaz nica y bien definida. - El cliente no necesita conocer la lgica del servidor, slo su interfaz externa. - El cliente no depende de la ubicacin fsica del servidor, ni del tipo de equipo fsico en el que se encuentra, ni de su sistema operativo. - Los cambios en el servidor implican pocos o ningn cambio en el cliente. Como ejemplos de clientes pueden citarse interfaces de usuario para enviar comandos a un servidor, APIs (Aplication Program Interface) para el desarrollo de aplicaciones distribuidas, herramientas en el cliente para acceder a servidores remotos (por ejemplo, servidores de SQL) o aplicaciones que solicitan acceso a servidores para algunos servicios. Como ejemplos de servidores pueden citarse servidores de ventanas como Xwindows, servidores de archivos como NFS, servidores para el manejo de bases de datos (como los servidores de SQL), servidores de diseo y manufactura asistidos por computador, etc.

Independencia de DDMS
En la arquitectura distribuida el SGBD y la BD no estn asociados a un determinado ordenador, sino a una red cuyos nodos se reparten las funciones. Una base de datos distribuida es vista por las aplicaciones igual que si fuera centralizada. Es el SGBDD el que se encarga de preservar la integridad y coherencia de la BD. Sin embargo existe otra definicin mucho menos estricta de base de datos distribuida utilizada por muchos fabricantes de SGBD, segn la cual una base de datos es distribuida s permite lecturas y modificaciones remotas, independientemente de que stas sean transparentes o no para las aplicaciones. Esta definicin no es adecuada cuando se desea seleccionar una BD realmente distribuida.

Independencia con respecto al DBMS.


Bajo este ttulo consideramos las implicaciones de relajar la suposicin de homogeneidad estricta. Puede alegarse que esa suposicin es quiz demasiado rgida. En realidad, no se requiere sino que los DBMS en los diferentes sitios manejen todos la misma interfaz; no necesitan ser por fuerza copias del mismo sistema. Por ejemplo, si tanto Ingres como Oracle manejaran la norma oficial de SQL, podra ser posible lograr una comunicacin entre los dos en el contexto de un sistema distribuido. Dicho de otro modo, el sistema distribuido podra ser heterogneo, al menos hasta cierto grado. Definitivamente sera deseable poder manejar la heterogeneidad. Una vez ms, en la realidad las instalaciones de cmputo no slo suelen emplear varias mquinas diferentes y varios sistemas operativos distintos, sino que tambin ejecutan diferentes DBMS; y sera agradable que todos esos DBMS distintos pudieran participar de alguna manera en un sistema distribuido. En otras palabras, el sistema distribuido ideal deber ofrecer independencia respecto al DBMS.

Conclusiones
Sistema de Base de Datos Distribuida (SBDD) es un sistema en el cual mltiples sitios de bases de datos estn ligados por un sistema de comunicaciones, de tal forma que, un usuario en cualquier sitio puede acceder a los datos en cualquier parte de la red exactamente como si los datos estuvieran almacenados en su sitio propio. Es entonces el resultado de la integracin de una base de datos distribuida con un sistema para su manejo. En un sistema distribuido de bases de datos se almacenan en varias computadoras. La desventaja principal de los sistemas distribuidos es la mayor complejidad que se requiere para garantizar una coordinacin adecuada entre localidades. La principal ventaja de los sistemas distribuidos es la capacidad de compartir y acceder a la informacin de una forma fiable y eficaz.

Vous aimerez peut-être aussi