Académique Documents
Professionnel Documents
Culture Documents
Una base de datos distribuida (BDD) es un conjunto de mltiples bases de datos lgicamente relacionadas que se encuentran distribuidas entre diferentes sitios interconectados por una red de comunicaciones. La informacin que constituye la base de datos est almacenada en diferentes sitios de la red, y las aplicaciones que se ejecutan acceden a estos datos en lugares distintos. Por lo tanto, una base de datos es una coleccin de datos que pertenecen lgicamente a un slo sistema, pero que fsicamente se encuentra "distribuido" en varios lugares de la red. Hay que tener en cuenta que cada sitio anteriormente mencionado es un sistema de base de datos en s mismo pero que con el resto de sitios que conforman la base de datos distribuida han decidido trabajar juntos con el fin de que un usuario de cualquier lugar pueda obtener acceso a los datos de cualquier punto de la red tal como si todos los datos estuvieran siendo accedidos de forma local. En consecuencia, la llamada base de datos distribuida es en realidad una especie de objeto virtual, cuyas partes componentes se almacenan fsicamente en varias bases de datos "reales" distintas, ubicadas en diferentes sitios. Es una unin lgica de esas bases de datos. Se asume que cada localidad ejecuta el mismo software de control de base de datos distribuida. Si no se cumple esta premisa, ser muy difcil manejar transacciones globales.
Las Doce Reglas De Las Bases De Datos Distribuidas El principio fundamental es que para el usuario un sistema distribuido debe ser igual que uno centralizado Autonoma Local: Los sitios distribuidos deben ser autnomos, es decir que todas las operaciones en un sitio dado se controlan en ese sitio. No dependencia de un sitio central: No debe de haber dependencia de un sitio central para obtener un servicio. Operacin Continua: Nunca debera apagarse para que se pueda realizar alguna funcin, como aadir un nuevo sitio. Independencia con respecto a la localizacin: No debe de ser necesario que los usuarios sepan dnde estn almacenados fsicamente los datos, sino que ms el usuario lo debe de ver como si solo existiera un sitio local. Independencia con respecto a la fragmentacin: La fragmentacin es deseable por razones de desempeo, los datos, pueden almacenarse en la localidad donde se utilizan con mayor frecuencia de manera que la mayor parte de las operaciones sean slo locales y se reduzca el trfico en la red. Independencia de rplica: Si una relacin dada (es decir, un fragmento dado de una relacin ) se puede presentar en el nivel fsico mediante varias copias almacenadas o rplicas, en muchos sitios distintos. Procesamiento Distribuido de Consultas: El objetivo es convertir transacciones de usuario en instrucciones para manipulacin de datos, y as reducir el trafico en la red implica que el proceso mismo de optimizacin de consultas debe ser distribuido. Manejo Distribuido de Transacciones: Tiene dos aspectos principales, el control de recuperacin y el control de concurrencia, cada uno de los cuales requiere un tratamiento ms amplio en el ambiente distribuido. Independencia con respecto al equipo: El SGBDD debe ser ejecutable en diferentes plataformas hardware. Independencia con respecto al Sistema Operativo: El sistema debe ser ejecutable varios diferentes SO. Independencia con respecto a la red: El sistema debe poder ejecutarse en diferentes redes. Todos los usuarios accesan a la BDD a travs de un esquema global en forma transparente al usuario. Debe ser posible ejecutar diferentes SGBDD locales que utilicen distintos modelos de datos.
La primera ventaja es la modularidad, los sistemas distribuidos pueden variar su tamao de un modo ms sencillo. Se pueden agregar computadoras adicionales a la red conforme aumentan el nmero de usuarios y su carga de procesamiento. Despus, si la carga de trabajo se reduce, el tamao de la red tambin puede reducirse. A menudo es ms fcil y ms econmico agregar una nueva computadora ms pequea que actualizar una computadora nica y centralizada que sea ms poderosa. En tercer lugar tenemos la sencillez, los sistemas distribuidos se pueden adecuar de una manera ms sencilla a las estructuras de la organizacin de los usuarios. Como cuarta ventaja podemos mencionar la autonoma local de los datos. Los datos se pueden colocar fsicamente en el lugar donde se accede a ellos ms frecuentemente, haciendo que los usuarios tengan control local de los datos con los que actan (un departamento puede controlar los datos que le pertenecen) permitiendo a los usuarios aplicar polticas locales respecto del tipo de accesos a sus datos. La quinta ventaja se basa en la disponibilidad. Si se produce un fallo en una localidad de un sistema distribuido, es posible que las dems localidades puedan seguir trabajando. En particular, si los datos se repiten en varias localidades, una transaccin que requiere un dato especfico puede encontrarlo en ms de una localidad. As, el fallo de una localidad no implica necesariamente la desactivacin del sistema. La disponibilidad es fundamental para los sistemas de bases de datos que se utilizan en aplicaciones de tiempo real. La sexta, puede dar como resultado un mejor rendimiento que el que se obtiene por un procesamiento centralizado. Los datos generalmente se ubican cerca del sitio con mayor demanda, tambin los sistemas trabajan en paralelo, lo cual permite balancear la carga en los servidores. Varias computadoras operando en forma simultnea pueden entregar ms volumen de procesamiento que una sola computadora. ltima, los datos duplicados aumentan su confiabilidad. Cuando falla una computadora, se pueden obtener los datos extrados de otras computadoras. Los usuarios no dependen de la disponibilidad de una sola fuente para sus datos.
Estas dos ltimas ventajas no se pueden garantizar y por eso sern mencionadas de nuevo entre las desventajas de los sistemas de bases de datos distribuidos ya que dependen de: la confiabilidad de las computadoras de procesamiento, de la red, del DDBMS, de las transacciones y de las tasas de error en la carga de trabajo.
Desventajas
La primera desventaja es el rendimiento, puede ser peor para el procesamiento distribuido que para el procesamiento centralizado. Depende de la naturaleza de la carga de trabajo, la red, el DDBMS y las estrategias utilizadas de concurrencia y de falla, as como las ventajas del acceso local a los datos y de los procesadores mltiples, ya que stos pueden ser abrumados por las tareas de coordinacin y de control requeridas. Tal situacin es probable cuando la carga de trabajo necesita un gran nmero de actualizaciones concurrentes sobre datos duplicados, y que deben estar muy distribuidos. La segunda es la confiabilidad. El procesamiento de base de datos distribuida puede resultar menos confiable que el procesamiento centralizado y un sistema distribuido puede estar menos disponible que uno centralizado. Esto depender de los parmetros mencionados en el apartado anterior. Una tercera desventaja es su mayor complejidad, a menudo se traduce en altos gastos de construccin y mantenimiento. Ya que existen ms componentes de hardware, hay ms cantidad de cosas por aprender y ms interfaces susceptibles de fallar. Se debe asegurar que la base de datos sea transparente, se debe lidiar con varios sistemas diferentes que pueden presentar dificultades nicas. La cuarta es el coste. El control de concurrencia y recuperacin de fallos puede convertirse en algo complicado y difcil de implementar, puede empujar a una mayor carga sobre programadores y personal de operaciones y quiz se requiera de personal ms experimentado y ms costoso. Quinta, el procesamiento de bases de datos distribuido es difcil de controlar. Una computadora centralizada reside en un entorno controlado, con personal de operaciones que supervisa muy de cerca, y las actividades de procesamiento pueden ser vigiladas, aunque a veces con dificultad. En un sistema distribuido, las computadoras de proceso, residen muchas veces en las reas de trabajo de los usuarios. En ocasiones el acceso fsico no est controlado, y los procedimientos
operativos son demasiado suaves y efectuados por personas que tienen escasa apreciacin o comprensin sobre su importancia. En sistemas centralizados, en caso de un desastre o catstrofe, la recuperacin puede ser ms difcil de sincronizar.
En sexto lugar tenemos la seguridad. Dado que los datos residen en muchos nodos diferentes y se pueden consultar por nodos diversos de la red, la probabilidad de violaciones de seguridad es creciente si no se toman las precauciones debidas. La siguiente es la integridad (consistencia, validez y exactitud de la informacin). Se vuelve difcil mantener la integridad, aplicar las reglas de integridad a travs de la red puede ser muy caro en trminos de transmisin de datos. Finalmente se puede mencionar la carencia de estndares. An no existen herramientas o metodologas que ayuden a los usuarios a convertir un DBMS centralizado en un DBMS distribuido.
Independencia de DDMS
En la arquitectura distribuida el SGBD y la BD no estn asociados a un determinado ordenador, sino a una red cuyos nodos se reparten las funciones. Una base de datos distribuida es vista por las aplicaciones igual que si fuera centralizada. Es el SGBDD el que se encarga de preservar la integridad y coherencia de la BD. Sin embargo existe otra definicin mucho menos estricta de base de datos distribuida utilizada por muchos fabricantes de SGBD, segn la cual una base de datos es distribuida s permite lecturas y modificaciones remotas, independientemente de que stas sean transparentes o no para las aplicaciones. Esta definicin no es adecuada cuando se desea seleccionar una BD realmente distribuida.
Conclusiones
Sistema de Base de Datos Distribuida (SBDD) es un sistema en el cual mltiples sitios de bases de datos estn ligados por un sistema de comunicaciones, de tal forma que, un usuario en cualquier sitio puede acceder a los datos en cualquier parte de la red exactamente como si los datos estuvieran almacenados en su sitio propio. Es entonces el resultado de la integracin de una base de datos distribuida con un sistema para su manejo. En un sistema distribuido de bases de datos se almacenan en varias computadoras. La desventaja principal de los sistemas distribuidos es la mayor complejidad que se requiere para garantizar una coordinacin adecuada entre localidades. La principal ventaja de los sistemas distribuidos es la capacidad de compartir y acceder a la informacin de una forma fiable y eficaz.