Académique Documents
Professionnel Documents
Culture Documents
Este trabajo a de tratar sobre las Bases de Datos. Las bases son cualquier conjunto de
datos organizados para su almacenamiento en la memoria de un ordenador o
computadora, diseñado para facilitar su mantenimiento y acceso de una forma
estándar. Los datos suelen aparecer en forma de texto, números o gráficos. Desde su
aparición en la década de 1950, se han hecho imprescindibles para las sociedades
industriales.
Para diseñar una base de datos debemos establecer un proceso partiendo del mundo
real, de manera que sea posible plasmarlo mediante una serie de datos.
La Base de Datos tienen varios tipos entre ellos están: Base de Datos Relacional, Base de
Datos Jerárquica, Bases de Datos Red también sus tipos de Datos que pueden ser tanto
de Entrada como de Salida y los tipos de Datos para los campos de una tabla.
1
Contenido
Introducción ............................................................................................................. 1
Bases de datos jerárquicas ..................................................................................... 4
Base de datos de red .............................................................................................. 5
Bases de datos relacionales.................................................................................... 6
Base de datos de entidad-relación .......................................................................... 8
Relaciones de cardinalidad: ....................................................................... 8
Uno a uno:.................................................................................................. 8
Uno a varios o varios a uno:....................................................................... 8
Varios a varios: .......................................................................................... 8
Superclave: ................................................................................................ 9
Clave primaria: ........................................................................................... 9
Clave externa o clave foránea: ................................................................... 9
Modelo entidad-relación extendida.......................................................................... 9
Modelo de objetos ................................................................................................... 9
Base de datos documental .................................................................................... 10
Claves: ............................................................................................................... 10
Recuperación:.................................................................................................... 10
Organización:..................................................................................................... 11
Modelo entidad–atributo–valor .............................................................................. 11
Modelo de Estrella ................................................................................................. 12
Modelos Físicos de Datos ..................................................................................... 13
Índice invertido................................................................................................... 13
Fichero Plano..................................................................................................... 13
Otros Modelos Lógicos .......................................................................................... 14
Modelo Asociativo .............................................................................................. 14
Modelo Multidimensional ................................................................................... 14
Modelo Multivalor ............................................................................................... 15
Modelo Semántico................................................................................................. 16
Base de Datos xml ................................................................................................ 16
XML habilitado: ........................................................................................ 16
2
XML nativo: .............................................................................................. 16
Grafo Etiquetado ................................................................................................... 17
Triplestore ............................................................................................................. 17
Implementación ................................................................................................. 17
Conclusión............................................................................................................. 18
3
Bases de datos jerárquicas
Las bases de datos jerárquicas son especialmente útiles en el caso de aplicaciones que
manejan un gran volumen de información y datos muy compartidos permitiendo crear
estructuras estables y de gran rendimiento.
En este modelo los datos se organizan en forma de árbol invertido (raíz), en donde
un nodo padre de información puede tener varios hijos. El nodo que no tiene padres es
llamado raíz, y a los nodos que no tienen hijos se los conoce como hojas.
La principal ventaja que presenta este tipo de base de datos es la rapidez en las
consultas de información ya que la propia estructura piramidal de los datos permite un
rápido acceso a ella.El modelo jerárquico no diferencia una vista lógica de una vista
física de la base de datos. De manera que las relaciones entre datos se establecen
siempre a nivel físico, es decir, mediante referencia a direcciones físicas del medio de
almacenamiento (sectores y pistas).
Los datos se almacenan en la forma de registros, el equivalente a las tuplas del modelo
relacional. Cada registro consta de un conjunto de campos, el equivalente a los atributos
del modelo relacional. Un conjunto de registros con los mismos campos se denomina
fichero (record type, en inglés), el equivalente a las relaciones del modelo relacional.
Los problemas típicos de las bases de datos jerárquicas todos estos problemas derivan del
hecho de que el sistema gestor de base de datos no implementa ningún control sobre los
propios datos, sino que queda en manos de las aplicaciones garantizar que se cumplen
las condiciones invariantes que se requieran (por ejemplo, evitar la duplicidad de
registros). Dado que todas las aplicaciones están sujetas a errores y fallos, esto es
imposible en la práctica. Además dichas condiciones suelen romperse ex profeso por
motivos operativos (generalmente, ajustes debidos a cambios en el negocio) sin evaluarse
sus consecuencias. Los problemas comunes son:
Duplicidad de registros
4
Integridad referencial
Des normalización
En las bases de datos en red, existen los punteros, que son conexiones adicionales entre
nodos padres y nodos hijos, que permiten acceder a un nodo por vías distintas
accediendo al mismo en dirección descendente por las diversas ramas.
La base de datos en red representa una mejora al modelo jerárquico con respecto al
modelo jerárquico, ya que ofrecía una solución eficiente al problema de redundancia de
datos; pero, aun así, la dificultad que significa administrar la información en una base de
datos de red ha significado que sea un modelo utilizado en su mayoría por
programadores más que por usuarios finales.
Se puede definir el modelo CODASYL como un conjunto finito de registros {R1,R2,..., Rn}
compuestos cada uno de ellos por un conjunto finito de elementos de datos, entre los
tipos de registros se establecen interrelaciones, llamadas conjuntos: {Ckij..h}, el conjunto
{Cki,j..h} representa la interrelación entre los registros Ri,Rj.. Rn, en la que el registro Ri es
el propietario y los demás son los miembros, el superíndice k indica que entre la misma
colección de tipos de registro Ri puede haber mas de un SET, al ser estos nominados.
Cada tipo de registro tiene un conjunto finito de ocurrencias, entre las cuales existen las
vinculaciones definidas por los SET del esquema; Una ocurrencia de registro propietario
encadenada con las correspondientes ocurrencias de registros miembro constituye una
ocurrencia de SET
5
Las críticas al modelo se han centrado principalmente en la falta de independencia,
confidencialidad, integridad, y ausencia de un lenguaje de interrogación auto contenido.
Pese a que ésta es la teoría de las bases de datos relacionales creadas por Codd, la
mayoría de las veces se conceptualiza de una manera más fácil de imaginar. Esto es
pensando en cada relación como si fuese una tabla que está compuesta por registros (las
filas de una tabla), que representarían las tuplas, y campos (las columnas de una tabla).
En este modelo, el lugar y la forma en que se almacenen los datos no tienen relevancia
(a diferencia de otros modelos como el jerárquico y el de red). Esto tiene la considerable
ventaja de que es más fácil de entender y de utilizar para un usuario esporádico de la
base de datos. La información puede ser recuperada o almacenada mediante "consultas"
que ofrecen una amplia flexibilidad y poder para administrar la información.
El lenguaje más habitual para construir las consultas a bases de datos relacionales
es SQL, StructuredQueryLanguage o Lenguaje Estructurado de Consultas, un estándar
implementado por los principales motores o sistemas de gestión de bases de datos
relacionales.Durante su diseño, una base de datos relacional pasa por un proceso al que
se le conoce como normalización de una base de datos.
Los sistemas relacionales son importantes porque ofrecen muchos tipos de procesos de
datos, como: simplicidad y generalidad, facilidad de uso para el usuario final, períodos
cortos de aprendizaje y las consultas de información se especifican de forma sencilla. Las
tablas son un medio de representar la información de una forma más compacta y es
posible acceder a la información contenida en dos o más tablas. Más adelante
explicaremos que son las tablas.
6
Las bases de datos relacionales están constituidas por una o más tablas que contienen la
información ordenada de una forma organizada. Cumplen las siguientes leyes básicas:
7
Base de datos de entidad-relación
Este modelo es solo y exclusivamente un método del que disponemos para diseñar estos
esquemas que posteriormente debemos de implementar en un gestor de BBDD (bases
de datos). Este modelo se representa a través de diagramas y está formado por varios
elementos. Este modelo habitualmente, además de disponer de un diagrama que ayuda
a entender los datos y como se relacionan entre ellos. Las entidades representan cosas u
objetos (ya sean reales o abstractos), que se diferencian
Una relación es un vínculo que nos permite definir una dependencia entre varias
entidades, es decir, nos permite exigir que varias entidades compartan ciertos atributos
de forma indispensable.
Uno a uno: Una entidad se relaciona únicamente con otra y viceversa. Por
ejemplo, si tuviésemos una entidad con distintos chasis y otra con matrículas
deberíamos de determinar que cada chasis solo puede tener una matrícula (y
cada matrícula un chasis, ni más en ningún caso).
Varios a varios: determina que una entidad puede relacionarse con otra con
ninguno o varios registros y viceversa. Por ejemplo, en el taller un coche puede
ser reparado por varios mecánicos distintos y esos mecánicos pueden reparar
varios coches distintos.
Las calves es el atributo de una entidad, al que le aplicamos una restricción que lo
distingue de los demás registros (no permitiendo que el atributo específico se repita en la
entidad). Estos son los distintos tipos:
8
Superclave: aplica una clave o restricción a varios atributos de la entidad, para
así asegurarse que en su conjunto no se repitan varias veces y así no poder entrar
en dudas al querer identificar un registro.
Clave externa o clave foránea: este campo tiene que estar estrictamente
relacionado con la clave primaria de otra entidad, para así exigir que exista
previamente ese clave.
Modelo de objetos
En una base de datos orientada a objetos, la información se representa mediante objetos
como los presentes en la programación orientada a objetos. Cuando se integra las
características de una base de datos con las de un lenguaje de programación orientado a
objetos, el resultado es un sistema gestor de base de datos orientada a objetos . Un
ODBMS hace que los objetos de la base de datos aparezcan como objetos de un lenguaje
de programación en uno o más lenguajes de programación a los que dé soporte. Un
ODBMS extiende los lenguajes con datos persistentes de forma transparente, control de
concurrencia, recuperación de datos, consultas asociativas y otras capacidades.
Las bases de datos orientadas a objetos se diseñan para trabajar bien en conjunción con
lenguajes de programación orientados a objetos como Java, C#, Visual Basic.NET y C++.
Los ODBMS usan exactamente el mismo modelo que estos lenguajes de programación.
Los ODBMS proporcionan los costes de desarrollo más bajos y el mejor rendimiento
cuando se usan objetos gracias a que almacenan objetos en disco y tienen una
9
integración transparente con el programa escrito en un lenguaje de programación
orientado a objetos, al almacenar exactamente el modelo de objeto usado a nivel
aplicativo, lo que reduce los costes de desarrollo y mantenimiento.
Estos documentos contienen alguna información similar y otra diferente. Al contrario que
una base de datos relacional en la que todos los registros deben tener los mismos
atributos -que pueden quedar vacíos- , en un documento no quedan 'campos' vacíos. De
este modo es posible añadir nueva información sin necesidad de establecer qué
información queda excluida.
Claves:
Se direccionan los documentos mediante una clave única que identifica el documento.
Generalmente esta clave se compone de una simple cadena. En algunos casos puede
tratarse de un URI o un camino, que sirve para rescatar el documento de la base de
datos. Generalmente la base de datos mantiene un índice de dichas claves, por lo que la
recuperación es rápida.
Recuperación:
Otra de las características que definen una base de datos orientada a documentos es
que, más allá de la sencilla correspondencia clave-documento usada para recuperar un
documento, la base de datos ofrece un API o un lenguaje de interrogación para
recuperar documentos según su contenido.
10
Organización:
Las distintas implementaciones de bases de datos documentales que podemos organizan
los documentos de muy distintas formas:
-Colecciones -Jerarquía de directorios
-Etiquetas
-Metadatos ocultos
Modelo entidad–atributo–valor
El objeto básico que un modelo de ER representa es una entidad, que es un "objeto" en el
mundo real con una existencia independiente. Una entidad puede ser un objeto con una
existencia física ( por ejemplo, una persona, un automóvil, una casa o un empleado ) o
este puede ser un objeto con una existencia conceptual ( por ejemplo, una compañía, un
trabajo, un curso universitario). Cada entidad tiene atributos, la propiedades
particulares que lo describen. Por ejemplo, la entidad de un empleado puede describir el
nombre del empleado, su edad, su dirección, su salario, su trabajo específico. Una
entidad particular tendrá un valor para cada uno de sus atributos. Los valores de los
atributos que describen cada entidad componen los datos almacenados en una base de
datos.
11
Modelo de Estrella
Es un modelo de datos que tiene una tabla de hechos que contiene los datos para el
análisis, rodeada de las tablas de dimensiones. Este aspecto, de tabla de hechos más
grande rodeada de radios o tablas más pequeñas es lo que asemeja a una estrella,
dándole nombre a este tipo de construcciones.
Las tablas de dimensiones tendrán siempre una clave primaria simple, mientras que en
la tabla de hechos, la clave principal estará compuesta por las claves principales de las
tablas dimensionales.
Otra razón para utilizar los esquemas en estrella es su simplicidad desde el punto de vista
del usuario final. Las consultas no son complicadas, ya que las condiciones y las uniones
(JOIN) necesarias sólo involucran a la tabla de hechos y a las de dimensiones, no
haciendo falta que se encadenen uniones y condiciones a dos o más niveles como
ocurriría en un esquema en copo de nieve. Finalmente, es la opción con mejor
rendimiento y velocidad pues permite indexar las dimensiones de forma individualizada
sin que repercuta en el rendimiento de la base de datos en su conjunto.
12
Modelos Físicos de Datos
Índice invertido
También llamado fichero invertido, en este los datos contenidos se usan como claves en
una tabla de consulta (lookup table), y los valores en la tabla se utilizan como punteros
a la localización de cada instancia. Esta es también la estructura lógica de los índices de
bases de datos modernas, los cuales introducen sólo el contenido de algunas columnas en
esa tabla de consulta. El modelo de fichero invertido se puede poner los índices en
ficheros planos para acceder a los registros de manera eficiente
Los ficheros invertidos asumen que los textos son secuencias de palabras →se limita el
tipo de búsqueda, las consultas de tipo frases son más difíciles de resolver, los vectores de
sufijos permiten resolver de forma más eficiente consultas de tipo complejo.
Fichero Plano
El modelo de fichero plano consiste en una sola matriz bidimensional de elementos
donde todos los miembros en una columna dada tienen valores del mismo tipo, y todos
los miembros de la misma fila están relacionados entre ellos. Por ejemplo, las columnas
para nombre y clave pueden ser usadas para la seguridad de un sistema; cada fila
indicará el nombre y su correspondiente clave para un individuo. Las columnas en la
tabla suelen tener un tipo asociado, que la define como cadena de caracteres, fecha y
hora, entero o numero de coma flotante. Este modelo tabular fue el precursor del
modelo relacional.
Las bases de datos de fichero plano consisten en ficheros de texto que se dividen en filas y
columnas, estas bases de datos son las más primitivas y quizás ni siquiera deberían
considerarse como tales. Pueden ser muy útiles para aplicaciones muy simples, pero no
para aplicaciones medianas o complejas, debido a sus grandes limitaciones.
13
Otros Modelos Lógicos
Modelo Asociativo
Se podría decir que el modelo asociativo es equivalente en estructura al modelo
dimensional. Buscan encontrar patrones de comportamientos, basados en el seguimiento
de las secuencias de eventos son los más apropiados para utilizarla. Las bases de datos
asociativas, almacenan la información de fuentes de datos completamente heterogéneas
y son especialmente útiles cuando las consultas requieren gran flexibilidad.
Los proyectos más adecuados para este tipo de bases son aquellos que buscan encontrar
patrones de comportamiento basados en el seguimiento de secuencias de eventos. Estas
bases almacenan y organizan la información de forma adecuada para su análisis,
basándose en la indexación de los valores de cada uno de los campos.
Modelo Multidimensional
Estas se utilizan principalmente para crear aplicaciones OLAP y pueden verse como
bases de datos de una sola tabla, se diferencian de las demás porque cada dimensión
tiene un campo o columna, y otro campo por cada métrica o hecho, es decir estas
almacenan registros cuyos campos son de la forma: d1,d2,d3,…f1,f2,f3, donde los campos
d1 hacen referencia a las dimensiones de la tabla, y los campos f1 a las métricas o hechos
que se quiere almacenar, estudiar o analizar.
14
Para implementar esta estructura de datos es importante tener en cuenta que la tabla
contiene todas las n-tuplas, con los valores de las dimensiones, o índice del cubo, y los
valores de las métricas previamente calculados para el cruce de valores del índice en
cuestión.
Modelo Multivalor
Las bases de datos multivalor o multivaluadas son un tipo especial de bases de datos
multidimensionales, y son llamadas bases de datos PICK por el primer desarrollo que se
realizó de este tipo. El modelo fue definido por Don Nelson a mediados de los 60, y en
1968 se realizó la primera implementación de un sistema de bases de datos
multidimensional, este desarrollo se atribuye a Dick Pick.
Para realizar este modelo de bases no se aplica la regla de la primera forma normal, es
decir, se permite que un campo pueda tener más de un valor almacenado. Por ejemplo:
Tabla 'Cliente'
ID Cliente Nombre Apellido Teléfono
123 Rachel Ingram 555-861-2025
555-403-1659
456 James Wright
555-776-4100
789 Maria Fernández 555-808-9633
15
Modelo Semántico
Una base de datos XML constituye un sistema software que da persistencia a datos
almacenados en formato XML. Estos datos pueden ser interrogados, exportados y
serializados. Las bases de datos XML están generalmente asociadas con las bases de datos
documentales.
XML nativo: el modelo interno de estas bases de datos usa documentos XML
como la unidad elemental de almacenamiento, los cuales no han de
almacenarse necesariamente en formato de texto.
16
Grafo Etiquetado
Una Base de Datos en Grafo es una base de datos que tiene como propósito almacenar
estructuras de datos que tienen topología de grafo, es decir, que la información que se
almacena se puede representar por medio de nodos y aristas entre ellos. Por definición,
una BDG agruparía a cualquier solución de almacenamiento en la que los elementos
que están conectados se enlazan sin hacer uso de una referencia por medio de índices
(que sería el método habitual de "simular" una relación en una Base de Datos
relacional), de esta forma, los vecinos de una entidad son accesibles directamente por
ella por medio de una referencia directa, sin pasar por estructuras intermedias que
hagan el proceso de referenciado. En esta definición no tenemos en cuenta el tipo de
grafo (en su sentido más amplio) que nuestros datos seguirán, ni en el tipo de aristas
(dirigidas o no), ni en la multiplicidad de las mismas entre dos nodos, ni en la claridad
que reflejen las aristas.
Triplestore
Un triplestore es una base de datos especialmente diseñada para el almacenamiento y
recuperación de datos RDF. Como base de datos relacional, un conjunto de datos
almacena triplestore y recupera a través de un lenguaje de consulta. Pero a diferencia
de una base de datos relacional, una tiendas triplestore tipo único de datos: el triplete.
Por lo tanto, no necesita de inicialización para grabar nuevos datos. Es decir, no es
necesario para crear tablas como en una base de datos relacional. Además, un triplestore
está optimizado para el almacenamiento de un gran número de tripletes y para la
recuperación de estos tripletes utilizando lenguaje de consulta SPARQL.
Algunos triplestores pueden almacenar miles de millones de triples RDF y mañana Teras.
El rendimiento de un triplestore se puede medir con el Benchmark Universidad Lehigh o
con datos reales de UniProt.
Implementación
Algunos triplestores se construyeron como la primera base de datos a partir de cero,
mientras que otros se construyeron bases de datos comerciales existentes sobre las bases
de datos relacionales Basado en la experiencia de base de datos OLAP, esto permitió
que con poco esfuerzo para lograr capacidad de almacenamiento y tiempos de
respuesta bajos. A largo plazo, parece probable que los triplestores nativos tienen la
ventaja sobre los criterios de rendimiento.
17
Conclusión
18