Investigacion de Distribucion y Paralelismo Alvin Padilla Terminado

Universidad “Mariano Gálvez”
Ingeniería en Sistemas de Información
7to. Semestre
Sección “A”
Base de Datos II
Ing. Axel Aguilar
Que es Distribución y Paralelismo en Base de Datos
Alvin Steve Padilla Meza
3090-10-11973
Mazatenango 16 de marzo del 2018.

Índice
Tema………………………………………………………………… Pagina
Introducción……………………………………………………………… 3
Estructuración…………………………………………………………. 4-13
Conclusión……………………………………………………………… 14
Bibliografía...….………………………………………………………… 15
Introducción
En el siguiente trabajo se presentara una investigación correspondiente al tema
denominado: “Que es Distribución y Paralelismo en Base de Datos” en la cual se
conocerá que es la Distribución y Paralelismo en Base de Datos, también se aprenderá
el uso de la distribución y el Paralelismo en Base de Datos y también se conocerán lo
que son las ventajas y desventajas de cada uno de los términos de distribución y
paralelismos en base de datos, etc.
Bases de datos distribuidas
Son la que almacenan datos que pertenecen lógicamente a un sólo sistema, pero se
encuentra físicamente esparcido en varios “sitios” de la red. Un sistema de base de
datos distribuidos se compone de un conjunto de sitios, conectados entre sí mediante
algún tipo de red de comunicaciones, en el cual:
• Cada sitio es un sistema de base de datos en sí mismo.
• Los sitios trabajan en conjunto si es necesario con el fin de que un usuario de
cualquier sitio pueda obtener acceso a los datos de cualquier punto de la red tal como si
todos los datos estuvieran almacenados en el sitio propio del usuario.
Historia
La necesidad de almacenar datos de forma masiva dio paso a la creación de los
sistemas de bases de datos.
La base de datos distribuidas originalmente almacenan la información de manera
centralizada, pero con el paso del tiempo las necesidades aumentaron y esto produjo
ciertos inconvenientes que no era posible solucionarlos o volverlos eficientes de la
forma centralizada. Estos problemas impulsaron la creación de almacenamiento
distribuido, los cuales hoy en día proveen características indispensables en el manejo
de información; es decir, la combinación de las redes de comunicación y las bases de
datos.
Ambientes de bases de datos distribuidas
Las BDD pueden ser:
Homogéneas: Todos los sitios tienen el mismo SGBD, son conscientes de la existencia
de los demás sitios y cooperan en el procesamiento de las solicitudes. Los sitios locales
mantienen un mismo esquema y SGBD.
Heterogéneas: Cada sitio puede tener un SGBD distinto así como esquemas diferentes.
Puede que algunos sitios no conozcan a otros. Puede que solo ofrezcan facilidades
limitadas para la cooperación en el procesamiento de transacciones.
Sistema de Gestión de Base de Datos Distribuida
Un sistema de gestión de bases de datos distribuidas (SGBDD) es un Sistema de
Gestión de bases de datos que gestiona la BD distribuida
Funcionalidades de un SGBDD
Accede a sitios remotos y transmite consultas y datos a través de varios sitios
mediante una red de comunicación.
Almacena el esquema de distribución y replicación de los datos en el catalogo del
sistema.
Establece las estrategias de ejecución de las consultas y las transacciones que
acceden a los datos en más de un sitio.
Decide sobre cual copia de los datos replicados acceder.
Mantiene la consistencia de las copias de los datos replicados.
Realiza la recuperación ante los fallos.
Componentes de un sistema gestor distribuido
Hardware
El hardware que compone una base de datos distribuida se reduce a servidores y la
red.
Software
Sistema manejador de base de datos distribuida (DDBMS): Este sistema está formado
por las transacciones y los administradores de la base de datos distribuidos. Un
DDBMS implica un conjunto de programas que operan en diversas computadoras, estos
programas pueden ser subsistemas de un único DDBMS de un fabricante o podría
consistir de una colección de programas de diferentes fuentes.
Administrador de transacciones distribuidas (DTM): Este es un programa que recibe las
solicitudes de procesamiento de los programas de consulta o transacciones y las
traduce en acciones para los administradores de la base de datos. Los DTM se
encargan de coordinar y controlar estas acciones. Este DTM puede ser propietario o
desarrollado en casa.
El manejador de transacciones es el encargado de definir la estructura de las
transacciones, mantener la consistencia en la base de datos cuando se ejecuta una
transacción o se cancela la ejecución de una, mantener protocolos de fiabilidad,
implementar algoritmos para el control de la concurrencia y sincronizar las
transacciones que se ejecutan simultáneamente.
El manejador recibe solicitudes de procesamiento de transacciones y las traduce en
acciones para el calendarizado.
La operación COMMIT señala el término exitoso de la transacción: le dice al manejador
de transacciones que se ha finalizado con éxito una unidad lógica de trabajo, que la
base de datos esta (o debería estar) de nuevo en un estado consistente, y que se
pueden hacer permanentes todas las modificaciones efectuadas por esa unidad de
trabajo.
La operación ROLLBACK, en cambio, señala el término no exitoso de la transacción: le
dice al manejador de transacciones que algo salió mal, que la base de datos podría
estar en un estado inconsistente y que todas las modificaciones efectuadas hasta el
momento por la unidad lógica de trabajo deben retroceder o anularse.
Sistema manejador de base de datos (DBMS): Es un programa que procesa cierta
porción de la base de datos distribuida. Se encarga de recuperar y actualizar datos del
usuario y generales de acuerdo con los comandos recibidos de los DTM.
Nodo: Un nodo es una computadora que ejecuta un DTM o un DBM o ambos. Un nodo
de transacción ejecuta un DTM y un nodo de base de datos ejecuta un DBM.
Distribución de los datos
Una de las decisiones más importantes que el diseñador de bases de datos distribuidas
debe tomar es el posicionamiento de la data en el sistema y el esquema bajo el cuál lo
desea hacer. Para esto existen cuatro alternativas principales: centralizada, replicada,
fragmentada, e híbrida.
Centralizada
Es muy similar al modelo de Cliente/Servidor en el sentido que la BDD está centralizada
en un lugar y los usuarios están distribuidos. Este modelo solo brinda la ventaja de
tener el procesamiento distribuido ya que en sentido de disponibilidad y fiabilidad de los
datos no se gana nada.
Replicadas
El esquema de BDD de replicación consiste en que cada nodo debe tener su copia
completa de la base de datos. Es fácil ver que este esquema tiene un alto costo en el
almacenamiento de la información. Debido a que la actualización de los datos debe ser
realizada en todas las copias, también tiene un alto costo de escritura, pero todo esto
vale la pena si tenemos un sistema en el que se va a escribir pocas veces y leer
muchas, y dónde la disponibilidad y fiabilidad de los datos sea de máxima importancia.
Particionadas o fragmentadas
Este modelo consiste en que solo hay una copia de cada elemento, pero la información
está distribuida a través de los nodos. En cada nodo se aloja uno o más fragmentos
disjuntos de la base de datos. Como los fragmentos no se replican esto disminuye el
costo de almacenamiento, pero también sacrifica la disponibilidad y fiabilidad de los
datos. Algo que se debe tomar en cuenta cuando se desea implementar este modelo es
la granularidad de la fragmentación. La fragmentación se puede realizar también de tres
formas:
Horizontal: Los fragmentos son subconjuntos de una tabla (análogo a un restringir)
Vertical: Los fragmentos son subconjuntos de los atributos con sus valores (análogo a
un proyectar)
Mixto: Se almacenan fragmentos producto de restringir y proyectar una tabla.
Para que una fragmentación sea correcta esta debe cumplir con las siguientes reglas:
Debe ser Completa: Si una relación R se fragmenta en R1,R2, … , Rn, cada elemento
de la data de R debe estar en algún Ri.
Debe ser Reconstruible: Debe ser posible definir una operación relacional que a partir
de los fragmentos obtenga la relación.
Los fragmentos deben ser Disjuntos: Si la fragmentación es horizontal entonces si un
elemento e está en Ri este elemento no puede estar en ningún Rk (para k distinto a i).
En el caso de fragmentación vertical es necesario que se repitan las llaves primarias y
esta condición solo se debe cumplir para el conjunto de atributos que no son llave
primaria.
Híbrida
Este esquema simplemente representa la combinación del esquema de partición y
replicación. Se particionar la relación y a la vez los fragmentos están selectivamente
replicados a través del sistema de BDD.
Tipos de arquitecturas/implementaciones
En un sistema de bases de datos distribuidas, existen varios factores que deben tomar
en consideración que definen la arquitectura del sistema:
Distribución: Los componentes del sistema están localizados en la misma computadora
o no.
Heterogeneidad: Un sistema es heterogéneo cuando existen en él componentes que se
ejecutan en diversos sistemas operativos, de diferentes fuentes, etc.
Autonomía: Se puede presentar en diferentes niveles, los cuales se describen a
continuación:
Autonomía de diseño: Habilidad de un componente del sistema para decidir cuestiones
relacionadas a su propio diseño.
Autonomía de comunicación: Habilidad de un componente del sistema para decidir
como y cuando comunicarse con otros SGBD (Sistema Gestor de Bases de Datos).
Autonomía de ejecución: Habilidad de un componente del sistema para ejecutar
operaciones locales como quiera.
Ventajas
Refleja una estructura organizacional – los fragmentos de la base de datos se ubican en
los departamentos a los que tienen relación.
Autonomía local – un departamento puede controlar los datos que le pertenecen.
Disponibilidad – un fallo en una parte del sistema solo afectará a un fragmento, en lugar
de a toda la base de datos.
Rendimiento – los datos generalmente se ubican cerca del sitio con mayor demanda,
también los sistemas trabajan en paralelo, lo cual permite balancear la carga en los
servidores.
Economía – es más barato crear una red de muchas computadoras pequeñas, que
tener una sola computadora muy poderosa.
Modularidad – se pueden modificar, agregar o quitar sistemas de la base de datos
distribuida sin afectar a los demás sistemas (módulos).
Desventajas
Complejidad – Se debe asegurar que la base de datos sea transparente, se debe lidiar
con varios sistemas diferentes que pueden presentar dificultades únicas. El diseño de la
base de datos se tiene que trabajar tomando en cuenta su naturaleza distribuida, por lo
cual no podemos pensar en hacer joins que afecten varios sistemas.
Economía – la complejidad y la infraestructura necesaria implica que se necesitará una
mayor mano de obra.
Seguridad – se debe trabajar en la seguridad de la infraestructura así como cada uno
de los sistemas.
Integridad – Se vuelve difícil mantener la integridad, aplicar las reglas de integridad a
través de la red puede ser muy caro en términos de transmisión de datos.
Falta de experiencia – las bases de datos distribuidas son un campo relativamente
nuevo y poco común por lo cual no existe mucho personal con experiencia o
conocimientos adecuados.
Carencia de estándares – aún no existen herramientas o metodologías que ayuden a
los usuarios a convertir un DBMS centralizado en un DBMS distribuido.
Bases de Datos Paralelas.
Paralelismo
De forma general el concepto de paralelismo en las bases de datos lo podríamos definir
como la partición de la base de datos (normalmente a nivel de relaciones) para poder
procesar de forma paralela en distintos discos y con distintos procesadores una sola
operación sobre la base de datos.
El paralelismo se usa para mejorar la velocidad en la ejecución de consultas. Además el
paralelismo se usa para proporcionar dimensionabilidad ya que la creciente carga de
trabajo se trata sin incrementar el tiempo de respuesta pero incrementando el grado de
paralelismo.
También podemos decir que el paralelismo de datos es un paradigma de
la programación concurrente que consiste en subdividir el conjunto de datos de entrada
a un programa, de manera que a cada procesador le corresponda un subconjunto de
esos datos. Cada procesador efectuará la misma secuencia de operaciones que los
otros procesadores sobre su subconjunto de datos asignado. En resumen: se
distribuyen los datos y se replican las tareas.
Idealmente, esta ejecución simultánea de operaciones, resulta en una aceleración neta

global del cómputo.
El paralelismo de datos es un paradigma suficientemente adecuado para operaciones

sobre vectores y matrices, dado que muchas de ellas consisten en aplicar la misma
operación sobre cada uno de sus elementos.
El objetivo del paralelismo: en los sistemas de bases de datos suele ser asegurar que
la ejecución del sistema continuará realizándose a una velocidad aceptable, incluso en
el caso de que aumente el tamaño de la base de datos o el número de transacciones
(empleabilidad).
Existen cuatro arquitecturas de sistemas paralelos:

De memoria compartida: Todos los procesadores comparten una memoria común.
De discos compartidos: Todos los procesadores comparten un conjunto de discos
común.
Sin compartimiento: Los procesadores no comparten ni memoria ni disco.
Jerárquica: Este modelo es un híbrido de las arquitecturas anteriores.
SGBD paralelo
Un SGBD que se ejecuta sobre múltiples procesadores y discos que han sido
diseñados para ejecutar operaciones en paralelo, cuando sea posible, con el propósito
de mejorar el rendimiento.
Los sistemas paralelos mejoran la velocidad de procesamiento y de E/S mediante la
utilización de UCP y discos en paralelo. La fuerza que ha impulsado a los sistemas
paralelos de bases de datos ha sido la demanda de aplicaciones que han de manejar
bases de datos extremadamente grandes (del orden de terabytes, esto es, 1012 bytes)
o que tienen que procesar un número enorme de transacciones por segundo (del orden
de miles de transacciones por segundo).
Los sistemas paralelos de base de datos constan de varios procesadores y varios
discos conectados a través de una red de interconexión de alta velocidad. Para medir el
rendimiento de los sistemas de base de datos existen 2 medidas principales:
La productividad (Throughput) que se entiende como el número de tareas que pueden
completarse en un intervalo de tiempo determinado.
El tiempo de respuesta (response time) que es la cantidad de tiempo que necesita para
completar una única tarea a partir del momento en que se envíe. Un sistema que
procese un gran número de pequeñas transacciones puede mejorar su productividad
realizando muchas transacciones en paralelo. Un sistema que procese transacciones
más largas puede mejorar tanto su productividad como sus tiempos de respuesta
realizando en paralelo cada una de las subtareas de cada transacción.
Paralelismo de E/S
De forma general podemos hablar de paralelismo de E/S cuando hablamos de
divisiones en las relaciones entre varios discos para reducir el tiempo necesario de su
recuperación.
Normalmente la división más común en un entorno de bases de datos paralelas es la
división horizontal. En este tipo de división las tuplas de cada relación se dividen entre
varios discos de modo que cada tupla resida en un disco distinto. Suponiendo que
tenemos n discos (D0,D1,…,Dn) entre los que se van a dividir los datos, existen varias
estrategias de división:
· Turno rotatorio: Se recorre la relación y la i-ésima tupla se envía al disco Di quedando
una distribución homogénea de las tuplas en los discos.
· División por asociación: Se escogen varios atributos del esquema de la relación y se
designan como atributos de división. Se escoge una función de asociación cuyo rango
es {0,1,…,n-1}. Cada tupla de la relación original se asocia en términos de los atributos
de división. Si la función de asociación devuelve i, la tupla de ubica en el disco DI.
· División por rangos: Se distribuye rangos contiguos de valores de los atributos a cada
disco. Para ello se escoge un atributo de división, AD, como vector de división y la
relación se divide de la siguiente manera:
o Sea [vo, v1, …, vn-2] el vector de división con i<j y vi<vj. Considérese una tupla t
tal que t[A]=x.
o Si x< vo entonces t se ubica en el disco Do.
o Si x≥vn-2 entonces t se ubica en el disco Dn-1.
o Si vi≤x < vi+1 entonces t se ubica en el disco DI+1
Comparativa entre técnicas de división
Cuando ya hemos dividido una relación en varios discos se puede recuperar en paralelo
utilizándolos todos de la misma manera que se puede escribir en paralelo cuando se
está dividiendo una relación. Por lo tanto, cuando se quiera leer (o escribir) la relación
completa ganaremos tiempo gracias al paralelismo. Además de leer de forma completa
una relación existen otro tipo de lecturas o consultas:
· Exploración de la relación completa: Ya mencionada
· Consultas concretas: Buscan tuplas con un determinado valor para un atributo
concreto.
· Consultas de rango: Buscan tuplas con un valor que esté dentro de un rango para un
atributo concreto.
Las técnicas de división explicadas permiten estos tipos de acceso pero con diferentes
niveles de eficacia:
· Turno rotatorio: Se adapta bien a la exploración completa pero no es eficiente para
consultas concretas y de rango ya que tiene que buscar en todos los discos.
· División por asociación: Este esquema se adapta bien a las consultas concretas
basadas en el atributo de división ya que dirigimos la consulta al disco que se nos indica
la función de asociación para el atributo y el valor del mismo. También se adapta bien a
una exploración completa si la función de asociación reparte bien las tuplas en los
discos. Sin embargo no es adecuada esta técnica para consultas concretas cuando el
atributo de búsqueda no coincide con el atributo de división.
· División por rangos: Se adapta bien a las consultas concretas y de rango basadas
en el atributo de división. Para consultas concretas se debe analizar el vector de
división para ver en que disco está la tupla al igual que para una consulta de rango se
consulta el vector de división para ver en que rango de discos están las tuplas.
Paralelismo entre consultas
Los sistemas de bases de datos con arquitectura paralela deben asegurar de que dos
procesadores no actualicen simultáneamente los mismos datos de manera
independiente.
Cuando un procesador accede a los datos o los actualiza, el sistema de bases de datos
debe garantizar que tenga su última versión en la memoria intermedia. El problema de
asegurar que la versión sea la última disponible se denomina problema de coherencia
de cache.
Existen una serie de protocolos para garantizar la coherencia de cache, que
normalmente se integran con los de control de concurrencia para reducir la sobrecarga.
Los protocolos de este tipo de sistemas de disco compartido son los siguientes:
· Antes de cualquier acceso de lectura o escritura de una página, la transacción la
bloquea en modo compartido o excluso, según corresponda. Inmediatamente después
de obtener el bloqueo compartido o exclusivo de la página, la transacción lee también
su copia más reciente del disco compartido.
· Antes de que una transacción libere el bloqueo exclusivo de una página, la traslada al
disco compartido, posteriormente libera el bloqueo.
Con este protocolo se garantiza que cuando una transacción establece un bloqueo
compartido o exclusivo sobre una página, obtenga la copia correcta de la página.
Paralelismo en consultas
Es la ejecución en paralelo de una única consulta entre varios procesadores y discos,
cuyo objetivo es acelerar las consultas de ejecución prologada. Por tanto se puede
hacer paralelas las consultas haciendo paralelas las operaciones que las forman.
Existen dos maneras de ejecutar en paralelo una sola consulta:
· Paralelismo en operaciones. Se puede acelerar el procesamiento de las consulta
haciendo paralela la ejecución de cada una de sus operaciones individuales
ordenación, selección, proyección y reunión.
· Paralelismo entre Operaciones. Se puede acelerar el procesamiento de la consulta
ejecutando en paralelo las diferentes operaciones de las expresiones de las consultas.
Por lo tanto el objetivo que se persigue es dividir la relación que interviene en la
consulta por medio de técnicas de división de relaciones, guardar dichas relaciones en
discos que van a ser gestionados cada uno de ellos por un procesador, a su vez, cada
procesador ejecuta su consulta local y cada uno de estos resultados parciales se unen
para formar la respuesta a la consulta.
Paralelismo en operaciones
Ya que las operaciones relacionales trabajan con relaciones que contienen grandes
conjuntos de tuplas, las operaciones se pueden paralelizar ejecutándolas sobre
subconjuntos diferentes de las relaciones en paralelo. Según el tipo de operación se
siguen distintos criterios en el tratamiento que son:
· Ordenación Paralela
· Reunión Paralela.
Ordenación Paralela.
Dependiendo del criterio en la división de la relación se pueden distinguir dos tipos de
ordenación:
Ordenación división de Rangos. Esta forma de división por rangos posee dos etapas
diferenciadas:
Redistribuir las tuplas de la relación utilizando una estrategia de división por rangos, de
manera que todas las tuplas que se hallen dentro del rango i-ésimo se envíen al
procesador Pi, que almacena temporalmente la relación en el disco Di. Para
implementar en paralelo la división por rangos cada procesador lee las tuplas de su
disco y las envía al procesador de destino. Cada procesador P0,P1…Pn también recibe
las tuplas correspondientes a su partición y las almacena localmente.
Cada uno de los procesadores ordena localmente su partición de la relación sin
interactuar con los demás. La operación final de mezcla es trivial ya que la división por
rangos de la primera etapa asegura que los valores de la clave del procesador Pi sean
menores que los procesador Pj
Ordenación y mezcla externa paralela. Este tipo de ordenación es una alternativa a la
efectuada por la división por rangos. Las etapas que se definen una vez que la relación
se ha divida entre los diferentes discos D1, D2…Dn-a son las siguientes:
Cada procesador Pi ordena localmente los datos del disco Di
El sistema mezcla las partes ordenadas por cada procesador para obtener el resultado
ordenado final.
A su vez el paso en el que el sistema realiza la mezcla puede ser también paralelizado
mediante la siguiente secuencia de acciones.
El sistema divide en rangos las particiones ordenadas encada procesador Pi entre los
procesadores P0, P1…Pn-1. Envía las tuplas de acuerdo con el orden establecido por
lo que cada procesador recibe las tuplas en corrientes ordenadas.
Cada procesador Pi, realiza una mezcla de las corrientes según las recibe para obtener
una sola parte ordenada.
Las partes ordenadas de los procesadores P0,P1… Pn-1 se concatenan para obtener el
resultado final.
Reunión Paralela.
La operación reunión exige que el sistema compare pares de tuplas para ver si
satisface la condición de reunión, si la cumple añade el par al resultado de la reunión.
Los algoritmos de reunión paralela intentan repartir entre varios procesadores los pares
que hay que comparar.
Cada procesador procesa luego localmente parte de la reunión. Después, el sistema
reúne los resultados de cada procesador para producir el resultado final.
Reunión por División. Válida para reuniones de tipo equirreuniones y reuniones
naturales, en la cual existen n procesadores y las relaciones que hay que reunir son r y
s. La reunión por división funciona de esta forma:
· El sistema divide las relaciones r y s en n particiones r0,r1,…rn-1 y s0,s1,…sn-1
· Envía las particiones ri y si al procesador Pi, donde la reunión se procesa localmente.
Reunión con fragmentos y replicas. Proporcionan una alternativa para las reuniones que
no puede ser procesada por la técnica de reunión por división, como por ejemplo si la
condición de reunión es una desigualdad. En este tipo de reuniones pueden
paralelizarse utilizando una técnica denominada fragmentos y replicas, cuyo
funcionamiento es el siguiente.
El sistema divide una de las relaciones (por ejemplo s) mediante cualquier técnica de
división, incluida por turno rotatorio.
El sistema replica la otra relación r en todos los procesadores
El procesador Pi procesa localmente la reunión de ri con todos, utilizando cualquier
técnica de reunión.
Reunión por asociación dividida en paralelo. La reunión por asociación realizada en
cada procesador es independiente de las realizadas en otros procesadores, y recibir las
tuplas de ri y de si es parecido a leerlas del disco. En concreto, se puede utilizar el
algoritmo híbrido de reunión por asociación para guardar en caché algunas de las
tuplas de entrada, y evitar así los costes de escribirlas y volver a leerlas.
Factores negativos de Paralelismo
Estos pueden atenuar tanto la ganancia de velocidad como la ampliabilidad:
Costes de inicio. El inicio de un único proceso lleva asociado un coste de inicio.
Interferencia. Como los procesos que se ejecutan en un sistema paralelo acceden con
frecuencia a recursos compartidos, pueden sufrir un cierto retardo como consecuencia
de la esta.
Sesgo. Al dividir cada tarea en un cierto número de pasos paralelos se reduce el
tamaño del paso medio. Normalmente es difícil dividir una tarea en partes exactamente
iguales, entonces se dice que la forma de distribución de los tamaños es sesgada.
Conclusión
En este trabajo se presentó una investigación sobre el tema “Que es Distribución y
Paralelismos en Base de Datos” en la cual conocimos que es la distribución en base de
datos y se define como la que almacenan datos que pertenecen lógicamente a un sólo
sistema, pero se encuentra físicamente esparcido en varios “sitios” de la red. Un
sistema de base de datos distribuidos se compone de un conjunto de sitios, conectados
entre sí mediante algún tipo de red de comunicaciones, en el cual: Cada sitio es un
sistema de base de datos en sí mismo y Los sitios trabajan en conjunto si es necesario
con el fin de que un usuario de cualquier sitio pueda obtener acceso a los datos de
cualquier punto de la red tal como si todos los datos estuvieran almacenados en el sitio
propio del usuario., también conocimos lo que es el Paralelismo y este es de forma
general el concepto de paralelismo en las bases de datos lo podríamos definir como la
partición de la base de datos (normalmente a nivel de relaciones) para poder procesar
de forma paralela en distintos discos y con distintos procesadores una sola operación
sobre la base de datos. El paralelismo se usa para mejorar la velocidad en la ejecución
de consultas. Además el paralelismo se usa para proporcionar dimensionabilidad ya
que la creciente carga de trabajo se trata sin incrementar el tiempo de respuesta pero
incrementando el grado de paralelismo, etc.
Bibliografía
https://modelosbd2012t1.wordpress.com/2012/03/08/bases-de-datos-distribuidas/
https://docs.microsoft.com/es-es/sql/relational-databases/replication/distribution-
database
https://modelosbd2012t1.wordpress.com/2012/03/24/base-de-datos-paralelas/
https://es.wikipedia.org/wiki/Paralelismo_de_datos

Investigacion de Distribucion y Paralelismo Alvin Padilla Terminado

Transféré par

Informations du document

Description originale:

Copyright

Formats disponibles

Partager ce document

Partager ou intégrer le document

Options de partage

Avez-vous trouvé ce document utile ?

Ce contenu est-il inapproprié ?

Droits d'auteur :

Formats disponibles

Investigacion de Distribucion y Paralelismo Alvin Padilla Terminado

Transféré par

Droits d'auteur :

Formats disponibles

Universidad “Mariano Gálvez”

Ingeniería en Sistemas de Información

Ing. Axel Aguilar

Que es Distribución y Paralelismo en Base de Datos

Alvin Steve Padilla Meza

Mazatenango 16 de marzo del 2018.

Idealmente, esta ejecución simultánea de operaciones, resulta en una aceleración neta

El paralelismo de datos es un paradigma suficientemente adecuado para operaciones

Existen cuatro arquitecturas de sistemas paralelos:

Vous aimerez peut-être aussi