Académique Documents
Professionnel Documents
Culture Documents
ndice
[ocultar]
Segn el contenido[editar]
Bases de datos bibliogrficas[editar]
Slo contienen un subrogante (representante) de la fuente primaria, que permite
localizarla. Un registro tpico de una base de datos bibliogrfica contiene informacin
sobre el autor, fecha de publicacin, editorial, ttulo, edicin, de una determinada
publicacin, etc. Puede contener un resumen o extracto de la publicacin original, pero
nunca el texto completo, porque si no, estaramos en presencia de una base de datos a
texto completo (o de fuentes primarias ver ms abajo). Como su nombre lo indica, el
contenido son cifras o nmeros. Por ejemplo, una coleccin de resultados de anlisis de
laboratorio, entre otras.
Bases de datos de texto completo[editar]
Almacenan las fuentes primarias, como por ejemplo, todo el contenido de todas las
ediciones de una coleccin de revistas cientficas.
Directorios[editar]
Un ejemplo son las guas telefnicas en formato electrnico.
Bases de datos o "bibliotecas" de informacin qumica o biolgica[editar]
Son bases de datos que almacenan diferentes tipos de informacin proveniente de la
qumica, las ciencias de la vida o mdicas. Se pueden considerar en varios subtipos:
En este modelo los datos se organizan en forma de rbol invertido (algunos dicen raz),
en donde un nodo padre de informacin puede tener varios hijos. El nodo que no tiene
padres es llamado raz, y a los nodos que no tienen hijos se los conoce como hojas.
Las bases de datos jerrquicas son especialmente tiles en el caso de aplicaciones que
manejan un gran volumen de informacin y datos muy compartidos permitiendo crear
estructuras estables y de gran rendimiento.
Una de las principales limitaciones de este modelo es su incapacidad de representar
eficientemente la redundancia de datos.
sistema), el resultado final es que, o bien se han realizado las dos operaciones, o bien no
se ha realizado ninguna,
Son bases de datos ideadas para desarrollar aplicaciones muy concretas, como creacin
de Cubos OLAP. Bsicamente no se diferencian demasiado de las bases de datos
relacionales (una tabla en una base de datos relacional podra serlo tambin en una base
de datos multidimensional), la diferencia est ms bien a nivel conceptual; en las bases
de datos multidimensionales los campos o atributos de una tabla pueden ser de dos
tipos, o bien representan dimensiones de la tabla, o bien representan mtricas que se
desean aprender.
En bases de datos orientadas a objetos, los usuarios pueden definir operaciones sobre
los datos como parte de la definicin de la base de datos. Una operacin (llamada
funcin) se especifica en dos partes. La interfaz (o signatura) de una operacin incluye
el nombre de la operacin y los tipos de datos de sus argumentos (o parmetros). La
implementacin (o mtodo) de la operacin se especifica separadamente y puede
modificarse sin afectar la interfaz. Los programas de aplicacin de los usuarios pueden
operar sobre los datos invocando a dichas operaciones a travs de sus nombres y
argumentos, sea cual sea la forma en la que se han implementado. Esto podra
denominarse independencia entre programas y operaciones.
SQL:2003, es el estndar de SQL92 ampliado, soporta los conceptos orientados a
objetos y mantiene la compatibilidad con SQL92.
Ventajas[editar]
Fases[editar]
Interpretacin[editar]
Encontramos dos teoras de interpretacin de las bases de datos deductiva por lo cual
consideramos las reglas y los hechos como axiomas. Los hechos son axiomas base que
se consideran como verdaderos y no contienen variables. Las reglas son axiomas
deductivos ya que se utilizan para deducir nuevos hechos.
Mecanismos[editar]
Existen dos mecanismos de inferencia:
Vase tambin[editar]
SQL
De Wikipedia, la enciclopedia libre
Saltar a: navegacin , bsqueda
Este artculo o seccin necesita referencias que aparezcan en una publicacin
acreditada, como revistas especializadas, monografas, prensa diaria o pginas
de Internet fidedignas. Este aviso fue puesto el 19 de enero de 2013.
Puedes aadirlas o avisar al autor principal del artculo en su pgina de discusin
pegando: {{subst:Aviso referencias|SQL}} ~~~~
SQL
Desarrollador(es)
IBM
ISO/IEC 9075-1:2012
Informacin general
Paradigma
Multiparadigma
Apareci en
1974
Diseado por
Donald D. Chamberlin
ltima versin
estable
SQL:2012 (2012)
Tipo de dato
Esttico, Fuerte
Implementaciones Varias
Dialectos
Influido por
Datalog
Ha influido a
Sistema operativo
multiplataforma
SQL
Desarrollador
IBM
ISO/IEC 9075-1:2008
Informacin general
Extensin de archivo
.sql
Tipo de MIME
application/x-sql
Lanzamiento inicial
1986
ltima versin
SQL:2012
2012
Tipo de formato
Base de datos
Estndar(es)
ISO/IEC 9075
Formato abierto
[editar datos en Wikidata]
ndice
1 Orgenes y evolucin
2 Caractersticas generales del SQL
o 2.1 Tipos de Datos
o 2.2 Optimizacin
3 Lenguaje de definicin de datos (DDL)
o 3.1 CREATE | CREAR
o 3.2 ALTER | MODIFICAR
o 3.3 DROP | ELIMINAR
o 3.4 TRUNCATE | BORRAR TABLA
4 Lenguaje de manipulacin de datos DML(Data Manipulation Language)
o 4.1 Definicin
o 4.2 SELECT | SELECCIONAR
4.2.1 Forma bsica
4.2.2 Clusula WHERE
4.2.3 Clusula ORDER BY
o 4.3 INSERT | INSERTAR
4.3.1 Forma bsica
4.3.2 Ejemplo
4.3.3 Formas avanzadas
4.3.3.1 Copia de filas de otras tablas
o 4.4 UPDATE
4.4.1 Ejemplo
o 4.5 DELETE
4.5.1 Forma bsica
4.5.2 Ejemplo
5 Recuperacin de clave
6 Disparadores
7 Sistemas de gestin de base de datos
8 Referencias
9 Vase tambin
10 Enlaces externos
Orgenes y evolucin[editar]
Los orgenes del SQL estn ligados a los de las bases de datos relacionales. En 1970 E.
F. Codd propone el modelo relacional y asociado a este un sublenguaje de acceso a los
datos basado en el clculo de predicados. Basndose en estas ideas, los laboratorios de
IBM definieron el lenguaje SEQUEL (Structured English Query Language) que ms
tarde fue ampliamente implementado por el sistema de gestin de bases de datos
(SGBD) experimental System R, desarrollado en 1977 tambin por IBM. Sin embargo,
fue Oracle quien lo introdujo por primera vez en 1979 en un producto comercial.
El SEQUEL termin siendo el predecesor de SQL, que es una versin evolucionada del
primero. El SQL pasa a ser el lenguaje por excelencia de los diversos sistemas de
gestin de bases de datos relacionales surgidos en los aos siguientes y fue por fin
estandarizado en 1986 por el ANSI, dando lugar a la primera versin estndar de este
lenguaje, el "SQL-86" o "SQL1". Al ao siguiente este estndar es tambin adoptado
por la ISO.
Sin embargo, este primer estndar no cubra todas las necesidades de los desarrolladores
e inclua funcionalidades de definicin de almacenamiento que se consider suprimirlas.
As que, en 1992, se lanz un nuevo estndar ampliado y revisado del SQL llamado
"SQL-92" o "SQL2".
En la actualidad el SQL es el estndar de facto de la inmensa mayora de los SGBD
comerciales. Y, aunque la diversidad de aadidos particulares que incluyen las distintas
implementaciones comerciales del lenguaje es amplia, el soporte al estndar SQL-92 es
general y muy amplio.
El ANSI SQL sufri varias revisiones y agregados a lo largo del tiempo:
Ao Nombre Alias
Comentarios
1986 SQL-86 SQL-87 Primera publicacin hecha por ANSI. Confirmada por ISO
en 1987.
1989 SQL-89
Revisin menor.
1992 SQL-92 SQL2
Revisin mayor.
1999 SQL:1999 SQL2000 Se agregaron expresiones regulares, consultas recursivas
(para relaciones jerrquicas), triggers y algunas
caractersticas orientadas a objetos.
2003 SQL:2003
Introduce algunas caractersticas de XML, cambios en las
funciones, estandarizacin del objeto sequence y de las
columnas autonumericas. (Ver Eisenberg et al.: SQL:2003
Has Been Published.)
2005 SQL:2005
ISO/IEC 9075-14:2005 Define las maneras en las cuales el
SQL se puede utilizar conjuntamente con XML. Define
maneras de importar y guardar datos XML en una base de
datos SQL, manipulndolos dentro de la base de datos y
publicando el XML y los datos SQL convencionales en
forma XML. Adems, proporciona facilidades que permiten
a las aplicaciones integrar dentro de su cdigo SQL el uso
de XQuery, lenguaje de consulta XML publicado por el
W3C (World Wide Web Consortium) para acceso
concurrente a datos ordinarios SQL y documentos XML.
2008 SQL:2008
Permite el uso de la clusula ORDER BY fuera de las
definiciones de los cursores. Incluye los disparadores del
tipo INSTEAD OF. Aade la sentencia TRUNCATE. (Ver
[1].)
Tipos de Datos[editar]
Algunos de los tipos de datos bsicos de SQL son:
Date: una fecha de calendario que contiene el ao (de cuatro cifras), el mes y el
da.
Time: La hora del da en horas minutos segundos (el valor predeterminado es 0).
Timestamp: la combinacin de Date y Time.
Optimizacin[editar]
Como ya se dijo antes, y suele ser comn en los lenguajes de acceso a bases de datos de
alto nivel, el SQL es un lenguaje declarativo. O sea, que especifica qu es lo que se
quiere y no cmo conseguirlo, por lo que una sentencia no establece explcitamente un
orden de ejecucin.
El orden de ejecucin interno de una sentencia puede afectar seriamente a la eficiencia
del SGBD, por lo que se hace necesario que ste lleve a cabo una optimizacin antes de
su ejecucin. Muchas veces, el uso de ndices acelera una instruccin de consulta, pero
ralentiza la actualizacin de los datos. Dependiendo del uso de la aplicacin, se
priorizar el acceso indexado o una rpida actualizacin de la informacin. La
optimizacin difiere sensiblemente en cada motor de base de datos y depende de
muchos factores.
Existe una ampliacin de SQL conocida como FSQL (Fuzzy SQL, SQL difuso) que
permite el acceso a bases de datos difusas, usando la lgica difusa. Este lenguaje ha sido
implementado a nivel experimental y est evolucionando rpidamente.
CREATE | CREAR[editar]
Este comando permite crear objetos de datos, como nuevas bases de datos, tablas, vistas
y procedimientos almacenados.
Ejemplo (crear una tabla)
CREATE TABLE 'CUSTOMERS';
ALTER | MODIFICAR[editar]
Este comando permite modificar la estructura de una tabla u objeto. Se pueden
agregar/quitar campos a una tabla, modificar el tipo de un campo, agregar/quitar ndices
a una tabla, modificar un trigger, etc.
Ejemplo (agregar columna a una tabla)
ALTER TABLE 'ALUMNOS' ADD EDAD INT UNSIGNED;
DROP | ELIMINAR[editar]
Este comando elimina un objeto de la base de datos. Puede ser una tabla, vista, ndice,
trigger, funcin, procedimiento o cualquier objeto que el motor de la base de datos
soporte. Se puede combinar con la sentencia ALTER.
Ejemplo
DROP TABLE 'ALUMNOS';.
SELECT | SELECCIONAR[editar]
La sentencia SELECT nos permite consultar los datos almacenados en una tabla de la
base de datos.
Forma bsica[editar]
SELECT [ALL | DISTINCT ]
<nombre_campo> [{,<nombre_campo>}]
FROM <nombre_tabla>|<nombre_vista>
[{,<nombre_tabla>|<nombre_vista>}]
[WHERE <condicin> [{ AND|OR <condicin>}]]
[GROUP BY <nombre_campo> [{,<nombre_campo >}]]
[HAVING <condicin>[{ AND|OR <condicin>}]]
[ORDER BY <nombre_campo>|<indice_campo> [ASC | DESC]
[{,<nombre_campo>|<indice_campo> [ASC | DESC ]}]]
Palabra clave que indica que la sentencia de SQL que queremos ejecutar
es de seleccin.
Indica que queremos seleccionar todos los valores.Es el valor por defecto
ALL
y no suele especificarse casi nunca.
DISTINCT Indica que queremos seleccionar slo los valores distintos.
Indica la tabla (o tablas) desde la que queremos recuperar los datos. En el
caso de que exista ms de una tabla se denomina a la consulta "consulta
FROM
combinada" o "join". En las consultas combinadas es necesario aplicar
una condicin de combinacin a travs de una clusula WHERE.
Especifica una condicin que debe cumplirse para que los datos sean
WHERE
devueltos por la consulta. Admite los operadores lgicos AND y OR.
Especifica la agrupacin que se da a los datos. Se usa siempre en
GROUP
combinacin con funciones agregadas.
BY
Especifica una condicin que debe cumplirse para que los datos sean
devueltos por la consulta. Su funcionamiento es similar al de WHERE
HAVING pero aplicado al conjunto de resultados devueltos por la consulta. Debe
aplicarse siempre junto a GROUP BY y la condicin debe estar referida a
los campos contenidos en ella.
SELECT
ORDER
BY
Ejemplo:
Para formular una consulta a la tabla Coches y recuperar los campos matricula, marca,
modelo, color, numero_kilometros, num_plazas debemos ejecutar la siguiente consulta.
Los datos sern devueltos ordenados por marca y por modelo en orden ascendente, de
menor a mayor. La palabra clave FROM indica que los datos sern recuperados de la
tabla Coches.
SELECT matricula, marca, modelo, color, numero_kilometros, num_plazas
FROM Coches
ORDER BY marca,modelo;
Clusula WHERE[editar]
La clusula WHERE es la instruccin que nos permite filtrar el resultado de una
sentencia SELECT. Habitualmente no deseamos obtener toda la informacin existente
en la tabla, sino que queremos obtener slo la informacin que nos resulte til en ese
momento. La clusula WHERE filtra los datos antes de ser devueltos por la consulta.
Cuando en la Clusula WHERE queremos incluir un tipo texto, debemos incluir el valor
entre comillas simples.
Ejemplos:
En nuestro ejemplo, se desea consultar un coche en concreto, para esto se agreg una
clusula WHERE. Esta clusula especifica una o varias condiciones que deben
cumplirse para que la sentencia SELECT devuelva los datos. En este caso la consulta
devolver slo los datos del coche con matrcula para que la consulta devuelva slo los
datos del coche con matrcula MF-234-ZD o bien la matrcula FK-938-ZL . Se puede
utilizar la clusula WHERE solamente, en combinacin con tantas condiciones como
queramos.
SELECT matricula, marca, modelo, color, numero_kilometros, num_plazas
FROM Coches
WHERE matricula = 'MF-234-ZD'
OR matricula = 'FK-938-ZL' ;
Una Condicin WHERE puede ser negada a travs del Operador Lgico NOT. La
Siguiente consulta devolver todos los datos de la tabla Coches, menos el que tenga la
Matrcula MF-234-ZD .
La Siguiente consulta utiliza la condicional DISTINCT, la cual nos devolver todos los
valores distintos formados por los Campos Marca y Modelo. de la tabla coches.
SELECT DISTINCT marca, modelo FROM coches;
Este ejemplo, selecciona todos los campos matrcula, marca, modelo, color,
numero_kilometros y num_plazas de la tabla coches, ordenndolos por el campo marca,
ya que aparece en segundo lugar dentro de la lista de campos que componen la
SELECT.
INSERT | INSERTAR[editar]
Una sentencia INSERT de SQL agrega uno o ms registros a una (y slo una) tabla en
una base de datos relacional.
Forma bsica[editar]
Cuando se especifican todos los valores de una tabla, se puede utilizar la sentencia
acortada:
INSERT INTO nombreTabla VALUES ('valor1', ['valor2,...'])
Ejemplo (asumiendo que 'nombre' y 'nmero' son las nicas columnas de la tabla
'agenda_telefonica'):
INSERT INTO agenda_telefonica
VALUES ('Jhonny Aguilar', 080473968);
Formas avanzadas[editar]
Una caracterstica de SQL (desde SQL-92) es el uso de constructores de filas para
insertar mltiples filas a la vez, con una sola sentencia SQL:
INSERT INTO ''tabla'' (''columna1'', [''columna2,... ''])
VALUES (''valor1a'', [''valor1b,...'']),
(''value2a'', [''value2b,...'']),...;
Esta caracterstica es soportada por DB2, PostgreSQL (desde la versin 8.2), MySQL, y
H2.
Ejemplo (asumiendo que 'nombre' y 'nmero' son las nicas columnas en la tabla
'agenda_telefonica'):
INSERT INTO agenda_telefonica VALUES ('Roberto Fernndez', '4886850'),
('Alejandro Sosa', '4556550');
Notar que las sentencias separadas pueden tener semntica diferente (especialmente con
respecto a los triggers), y puede tener diferente rendimiento que la sentencia de
insercin mltiple.
Para insertar varias filas en MS SQL puede utilizar esa construccin:
INSERT INTO phone_book
SELECT 'John Doe', '555-1212'
UNION ALL
SELECT 'Peter Doe', '555-2323';
Tenga en cuenta que no se trata de una sentencia SQL vlida de acuerdo con el estndar
SQL (SQL: 2003), debido a la clusula subselect incompleta.
Para hacer lo mismo en Oracle se usa la Tabla DUAL, siempre que se trate de solo una
simple fila:
INSERT INTO phone_book
SELECT 'John Doe', '555-1212' FROM DUAL
UNION ALL
SELECT 'Peter Doe','555-2323' FROM DUAL
Una variacin es necesaria cuando algunos de los datos de la tabla fuente se est
insertando en la nueva tabla, pero no todo el registro. (O cuando los esquemas de las
tablas no son iguales.)
INSERT INTO phone_book2 ( [name], [phoneNumber] )
SELECT [name], [phoneNumber]
FROM phone_book
UPDATE[editar]
Una sentencia UPDATE de SQL es utilizada para modificar los valores de un conjunto
de registros existentes en una tabla.
Ejemplo[editar]
UPDATE My_table SET field1 = 'updated value asd' WHERE field2 = 'N';
DELETE[editar]
Una sentencia DELETE de SQL borra uno o ms registros existentes en una tabla.
Forma bsica[editar]
DELETE FROM tabla WHERE columna1 = 'valor1'
Ejemplo[editar]
DELETE FROM My_table WHERE field2 = 'N';
Recuperacin de clave[editar]
Los diseadores de base de datos que usan una clave suplente como la clave principal
para cada tabla, se ejecutar en el ocasional escenario en el que es necesario recuperar
automticamente la base de datos, generando una clave primaria de una sentencia SQL
INSERT para su uso en otras sentencias SQL. La mayora de los sistemas no permiten
sentencias SQL INSERT para retornar fila de datos. Por lo tanto, se hace necesario
aplicar una solucin en tales escenarios.
Implementaciones comunes incluyen:
SELECT *
FROM NEW TABLE ( INSERT INTO phone_book VALUES ( 'Cristobal
Jeldrez','0426.817.10.30' ) ) AS t
Disparadores[editar]
Los disparadores, tambin conocidos como desencadenantes (triggers en ingls) son
definidos sobre la tabla en la que opera la sentencia INSERT, y son evaluados en el
contexto de la operacin. Los desencadenantes BEFORE INSERT permiten la
modificacin de los valores que se insertarn en la tabla. Los desencadenantes AFTER
INSERT no puede modificar los datos de ahora en adelante, pero se puede utilizar para
iniciar acciones en otras tablas, por ejemplo para aplicar mecanismos de auditora.
DB2
Firebird
HSQL
Informix
Interbase
MariaDB
Microsoft SQL Server
MySQL
Oracle
PostgreSQL
Progress
PervasiveSQL
SQLite
Sybase ASE
Referencias[editar]
Vase tambin[editar]
Lenguaje de consulta
De Wikipedia, la enciclopedia libre
Saltar a: navegacin , bsqueda
Un lenguaje de consulta es un lenguaje informtico usado para hacer consultas en
bases de datos y sistemas de informacin.
Los lenguajes de consulta pueden ser clasificados de acuerdo a si son lenguajes de
consulta de bases de datos o lenguajes de consulta de recuperacin de informacin.
Algunos ejemplos son:
Vase tambin[editar]
SQL
Bases de datos relacionales
Paradigma de programacin
Lenguaje informtico
ndice
[ocultar]
1 Los documentos
o 1.1 Claves
o 1.2 Recuperacin
o 1.3 Organizacin
2 Implementaciones
o 2.1 Bases de datos XML
3 Vase tambin
4 Referencias
Los documentos[editar]
El concepto central de una base de datos orientada a documentos es el concepto mismo
de Documento. Mientras cada implementacin de base de datos orientada a documentos
difiere en los detalles, en general todas ellas comparten el principio de que los
documentos encapsulan y codifican datos o informacin siguiendo algn formato
estndar. Entre las codificaciones usadas en la actualidad se encuentran XML, YAML,
JSON y BSON, as como formatos binarios como PDF y documentos Microsoft Office
(MS Word, Excel y dems).
Los documentos dentro de una base de datos orientada a documentos son similar, de
algn modo, a registros, tuplas o filas en una base de datos relacional pero menos
rgidos. No se les requiere ajustarse a un esquema estndar ni tener todos las mismas
secciones, atributos, claves o cosas por el estilo. Por ejemplo un documento puede ser:
{
Nombre:"Pepe",
Direccin:"Plaza Mayor 5",
Profesin:"Panadero"
}
Claves[editar]
Se direccionan los documentos mediante una clave nica que identifica el documento.
Generalmente esta clave se compone de una simple cadena. En algunos casos puede
tratarse de un URI o un camino, que sirve para rescatar el documento de la base de
datos. Generalmente la base de datos mantiene un ndice de dichas claves, por lo que la
recuperacin es rpida.
Recuperacin[editar]
Otra de las caractersticas que definen una base de datos orientada a documentos es que,
ms all de la sencilla correspondencia clave-documento (o clave-valor) usada para
recuperar un documento, la base de datos ofrece un API o un lenguaje de interrogacin
para recuperar documentos segn su contenido. Por ejemplo, para preguntar por todos
los documentos que tienen un valor dado en un campo. El conjunto de caractersticas
del API o del lenguaje de interrogacin, as como lo que se obtiene, vara
significativamente entre distintas implementaciones.
Organizacin[editar]
Las distintas implementaciones de bases de datos documentales que podemos organizan
los documentos de muy distintas formas, entre las que se encuentran:
Collecciones
Etiquetas
Metadatos ocultos
Jerarquas de directorios
Implementaciones[editar]
Nombre
Editor
Licencia
Lenguaje
Notas
API
RESTful
Soporta XML,
JSON y
formatos
binarios;
Java,
BaseX
BaseX Team BSD
arquitectura
S
XQuery
cliente-servidor;
bsquedas de
texto completo
concurrentes.
Almacn de
C, C++ & documentos y
ArangoDB triAGENS Apache 2
S1
Javascript presentacin
grfica.
Base de datos
documental sin
esquema,
bsqueda de
Clusterpoin Clusterpoint Libre/Comercial
C++
texto completo, S
2
t
Ltd.
ordenacin por
relevancia y
funcionamiento
en Cluster.
Base de datos
Couchbase Couchbase,
NoSQL
Apache
Erlang y C
S3
Server
Inc.
distribuida
documental.
JSON sobre
REST/HTTP
con propiedades
Apache
ACID mediante 5
CouchDB Software
Apache
Erlang
S
multiversion
Foundation
concurrency
control
limitadas. Usa
Nombre
Editor
Licencia
Lenguaje
Notas
API
RESTful
map y reduce
para las vistas e
interrogaciones.
4
eXist
eXist, [3]
GPL
XQuery,
Java
FleetDB
FleetDB
MIT
Clojure
XML sobre
REST/HTTP,
WebDAV,
bsqueda de
texto completo
con Lucene,
validacin,
versionado,
S6
clustering,
triggers,
reescritura de
URLs,
colecciones,
ACLs, XQuery
Update
Una base de
datos basada en
JSON sin
(desconocido
esquema,
)
optimizada para
desarrollo
Agile.
Apache
Jackrabbit Software
Apache
Foundation
Java
(desconocido
)
Lotus
Notes
LotusScript
, Java,
Lotus
@Formula
(desconocido
)
MarkLogic
IBM
Proprietaria
MarkLogic Libre o
Corporation comercial
GNU AGPL
v3.07
Base de datos
documental
distribuida con
REST,
multiversion
Java,
concurrency
S
XQuery,
control,
XSLT, C++ bsqueda de
texto completo
y transacciones
ACID.
Base de datos
C++
documental
Opcional8
optimizada para
Nombre
Editor
Licencia
Proprietaria y
GNU Affero
GPL10
MUMPS9
Orient
Technologie Apache
s
Apache
Apache
Software
Apache
Cassandra
Foundation
OrientDB
Redis
BSD License
Rocket U2
Rocket
Software
RavenDB
GNU AGPL
Hibernating
v3.011 o
Rhinos
Commercial
Lenguaje
MUMPS
API
RESTful
Notas
contenido muy
transitorio
Muy usada en
(desconocido
aplicaciones
)
mdicas.
Java
JSON sobre
HTTP
Java
JSON sobre
HTTP
ANSI C
Proprietaria
C#
Vase tambin[editar]
Historia[editar]
Los orgenes del trmino orientados a objetos (abreviado OO) se remontan a los
lenguajes de programacin orientadas a objetos. Los lenguajes de programacin OO
tienen sus races en el lenguaje SIMULA 67, propuesto a finales de la dcada de 1960.
En Simula, el concepto de clase agrupa la estructura de datos interna de un objeto en
una declaracin de clase, es decir, introduce en el lenguaje ALGOL los conceptos de
objeto y de clase. Como Algol, Simula es un lenguaje fuertemente tipado para entornos
compilados. Sin embargo, el primer lenguaje que populariz la aproximacin a objetos
fue Smalltalk (1976); este puede considerarse una sntesis de aos del lenguaje Lisp,
que ofrece una gran flexibilidad gracias a la interpretacin, y de Simula, aadiendo el
concepto de metaclase. Smalltalk ha podido responder a las necesidades de flexibilidad
presentadas por el desarrollo de entornos de programacin grficos, favoreciendo la
rpida creacin de prototipos de interfaces de usuarios amigables. Fue utilizado con
xito en la primera estacin grfica de Xerox.
Con la llegada de las estaciones de trabajo en los aos 80, han crecido numerosos
lenguajes orientados a objetos inspirados en Simula o Smalltalk. Entre los lenguajes
compilados, los ms clebres son C++, Objective C y Eiffel, debido a la compatibilidad
del lenguaje o del cdigo producido con el lenguaje de programacin C. La mayor parte
de los lenguajes interpretados son extensiones del Lisp; por ejemplo, Loops y CLOS. Es
interesante notar que la mayor parte de los lenguajes populares existentes se encuentran
en curso de ampliacin para convertirse en orientados a objetos, incluyendo al COBOL
y Ada (ms exactamente Ada 9X, que aporta la herencia).
En aos recientes, han aparecido muchos prototipos experimentales y sistemas de bases
de datos comerciales orientados a objetos. Entre los primeros se encuentran los sistemas
ORION, OpenOODB, IRIS, ODE y el proyecto ENCORE/ObServer. Y entre los
Vase tambin[editar]
MySQL
De Wikipedia, la enciclopedia libre
Saltar a: navegacin , bsqueda
MySQL
Desarrollador
Informacin general
ltima versin
5.6.25 (info)
estable
ltima versin en
5.7.4 (info)
pruebas
Gnero
Programado en
C, C++
Sistema operativo
Multiplataforma
Licencia
MySQL es usado por muchos sitios web grandes y populares, como Wikipedia,2
Google3 4 (aunque no para bsquedas), Facebook,5 6 7 Twitter,8 Flickr,9 y YouTube.10
ndice
[ocultar]
1 Lenguajes de programacin
2 Aplicaciones
3 Versiones de MySQL
4 Especificaciones
o 4.1 Plataformas
5 Caractersticas adicionales
o 5.1 Caractersticas
o 5.2 Caractersticas distintivas
o 5.3 Tipos de compilacin del servidor
o 5.4 Especificaciones del cdigo fuente
6 Desarrollo del proyecto
7 Otras funcionalidades de las listas de correo
8 Estructuras organizativas/asociativas o de decisin
9 Industria relacionada
10 MySQL en cifras
11 Licencia
12 Vase tambin
13 Referencias
14 Enlaces externos
Lenguajes de programacin[editar]
Existen varias interfaces de programacin de aplicaciones que permiten, a aplicaciones
escritas en diversos lenguajes de programacin, acceder a las bases de datos MySQL,
incluyendo C, C++, C#, Pascal, Delphi (va dbExpress), Eiffel, Smalltalk, Java (con una
implementacin nativa del driver de Java), Lisp, Perl, PHP, Python, Ruby, Gambas,
REALbasic (Mac y Linux), (x)Harbour (Eagle1), FreeBASIC, y Tcl; cada uno de estos
utiliza una interfaz de programacin de aplicaciones especfica. Tambin existe una
interfaz ODBC, llamado MyODBC que permite a cualquier lenguaje de programacin
que soporte ODBC comunicarse con las bases de datos MySQL. Tambin se puede
acceder desde el sistema SAP, lenguaje ABAP.
Aplicaciones[editar]
Versiones de MySQL[editar]
12 13 14 15 16 17
Especificaciones[editar]
Plataformas[editar]
MySQL funciona sobre mltiples plataformas, incluyendo:
AIX
BSD
FreeBSD
HP-UX
Kurisu OS
GNU/Linux
Mac OS X
NetBSD
OpenBSD
OS/2 Warp
QNX
SGI IRIX
Solaris
SunOS
SCO OpenServer
SCO UnixWare
Tru64
eBD
Windows 95, Windows 98, Windows NT, Windows 2000, Windows XP,
Windows Vista, Windows 7, Windows 8 y Windows Server (2000, 2003, 2008 y
2012).
OpenVMS18
Caractersticas adicionales[editar]
Caractersticas[editar]
Inicialmente, MySQL careca de elementos considerados esenciales en las bases de
datos relacionales, tales como integridad referencial y transacciones. A pesar de ello,
atrajo a los desarrolladores de pginas web con contenido dinmico, justamente por su
simplicidad.
Poco a poco los elementos de los que careca MySQL estn siendo incorporados tanto
por desarrollos internos, como por desarrolladores de software libre. Entre las
caractersticas disponibles en las ltimas versiones se puede destacar:
Caractersticas distintivas[editar]
Las siguientes caractersticas son implementadas nicamente por MySQL:
Otras listas de correo son: MyODBC, Herramientas GUI, Cluster, Dotnet, PlusPlus y
Perl.
Adicional a las listas de correo, se encuentra el soporte de IRC de la comunidad
MySQL. Adems, hay soporte a travs de foros [6] agrupados en categoras tales como:
Migracin, Uso de MySQL, Conectores MySQL, Tecnologa MySQL y Negocios.
Estructuras organizativas/asociativas o de
decisin[editar]
La direccin y el patrocinio de los proyectos MySQL estn a cargo de la empresa
MySQL AB quien posee el copyrigth del cdigo fuente MySQL, su logo y marca
registrada. MySQL, Inc. y MySQL GmbH son ejemplos de empresas subsidiarias de
MySQL AB. Estn establecidas en los Estados Unidos y Alemania respectivamente.
MySQL AB, cuenta con ms de 200 empleados en ms de 20 pases y funcionan bajo la
estrategia de teletrabajo.
En enero del 2008 Sun Microsystems anuncia su compra. En abril del 2009 Oracle
anunci la compra de Sun Microsystems.19
Industria relacionada[editar]
Los ingresos de esta empresa por la venta de licencias privativas de sus productos y los
servicios suma los U$12 millones.
MySQL en cifras[editar]
Licencia[editar]
La licencia GNU GPL de MySQL obliga a que la distribucin de cualquier producto
derivado (aplicacin) se haga bajo esa misma licencia. Si un desarrollador desea
incorporar MySQL en su producto pero desea distribuirlo bajo otra licencia que no sea
la GNU GPL, puede adquirir una licencia comercial de MySQL que le permite hacer
justamente eso.
Vase tambin[editar]
PostgreSQL
PHP (lenguaje comnmente usado con MySQL)
Base de datos
Bonsai CVS
WAMP
XAMPP
Appserv (abandonado?)
Firebird (RDBMS de cdigo abierto)
MariaDB (bifurcacin de MySQL)
Mecanismos de almacenamiento
Una Base de Datos Relacional, es una base de datos que cumple con el modelo
relacional, el cual es el modelo ms utilizado en la actualidad para implementar bases de
datos ya planificadas. Permiten establecer interconexiones (relaciones) entre los datos
(que estn guardados en tablas), y a travs de dichas conexiones relacionar los datos de
ambas tablas, de ah proviene su nombre: "Modelo Relacional". Tras ser postuladas
sus bases en 1970 por Edgar Frank Codd, de los laboratorios IBM en San Jos
(California), no tard en consolidarse como un nuevo paradigma en los modelos de base
de datos.1
ndice
[ocultar]
1 Caractersticas
2 Elementos
o 2.1 Relaciones Base y Derivadas
o 2.2 Restricciones
o 2.3 Dominios
o 2.4 Clave primaria
o 2.5 Clave fornea
o 2.6 Clave ndice
o 2.7 Procedimientos almacenados
3 Estructura
4 Manipulacin de la informacin
5 Manejadores de base de datos relacionales
6 Ventajas y desventajas
o 6.1 Ventajas
o 6.2 Desventajas
7 Diseo de las bases de datos relacionales
8 Vase tambin
9 Referencias
10 Enlaces externos
Caractersticas[editar]
Las claves primarias son la clave principal de un registro dentro de una tabla y
stas deben cumplir con la integridad de datos.
Las claves ajenas se colocan en la tabla hija, contienen el mismo valor que la
clave primaria del registro padre; por medio de stas se hacen las formas
relacionales
Elementos[editar]
Relaciones Base y Derivadas[editar]
En una base de datos relacional, todos los datos se almacenan y se accede a ellos por
medio de relaciones. Las relaciones que almacenan datos son llamadas "relaciones base"
y su implementacin es llamada "tabla". Otras relaciones no almacenan datos, pero son
calculadas al aplicar operaciones relacionales. Estas relaciones son llamadas "relaciones
derivadas" y su implementacin es llamada "vista" o "consulta". Las relaciones
derivadas son convenientes ya que expresan informacin de varias relaciones actuando
como si fuera una sola tabla.
Restricciones[editar]
Una restriccin es una limitacin que obliga el cumplimiento de ciertas condiciones en
la base de datos. Algunas no son determinadas por los usuarios, sino que son
inherentemente definidas por el simple hecho de que la base de datos sea relacional.
Algunas otras restricciones las puede definir el usuario, por ejemplo, usar un campo con
valores enteros entre 1 y 10.
Las restricciones proveen un mtodo de implementar reglas en la base de datos. Las
restricciones limitan los datos que pueden ser almacenados en las tablas. Usualmente se
definen usando expresiones que dan como resultado un valor booleano, indicando si los
datos satisfacen la restriccin o no.
Las restricciones no son parte formal del modelo relacional, pero son incluidas porque
juegan el rol de organizar mejor los datos. Las restricciones son muy discutidas junto
con los conceptos relacionales.
Dominios[editar]
Un dominio describe un conjunto de posibles valores para cierto atributo. Como un
dominio restringe los valores del atributo, puede ser considerado como una restriccin.
Matemticamente, atribuir un dominio a un atributo significa "cualquier valor de este
atributo debe ser elemento del conjunto especificado".
Distintos tipos de dominios son: enteros, cadenas de texto, fecha, no procedurales, etc.
Cada tabla puede tener uno o ms campos cuyos valores identifican de forma nica cada
registro de dicha tabla, es decir, no pueden existir dos o ms registros diferentes cuyos
valores en dichos campos sean idnticos. Este conjunto de campos se llama clave nica.
Pueden existir varias claves nicas en una determinada tabla, y a cada una de stas suele
llamrsele candidata a clave primaria.
Clave primaria[editar]
Una clave primaria es una clave nica elegida entre todas las candidatas que define
unvocamente a todos los dems atributos de la tabla, para especificar los datos que
sern relacionados con las dems tablas. La forma de hacer esto es por medio de claves
forneas.
Clave fornea[editar]
Una clave fornea es una referencia a una clave en otra tabla, determina la relacin
existente en dos tablas. Las claves forneas no necesitan ser claves nicas en la tabla
donde estn y s a donde estn referenciadas.
Por ejemplo, el cdigo de departamento puede ser una clave fornea en la tabla de
empleados. Se permite que haya varios empleados en un mismo departamento, pero
habr uno y slo un departamento por cada clave distinta de departamento en la tabla de
departamentos.
Clave ndice[editar]
Las claves ndice surgen con la necesidad de tener un acceso ms rpido a los datos. Los
ndices pueden ser creados con cualquier combinacin de campos de una tabla. Las
consultas que filtran registros por medio de estos campos, pueden encontrar los registros
de forma no secuencial usando la clave ndice.
Las bases de datos relacionales incluyen mltiples tcnicas de ordenamiento, cada una
de ellas es ptima para cierta distribucin de datos y tamao de la relacin.
Los ndices generalmente no se consideran parte de la base de datos, pues son un detalle
agregado. Sin embargo, las claves ndices son desarrolladas por el mismo grupo de
programadores que las otras partes de la base de datos.
Procedimientos almacenados[editar]
Un procedimiento almacenado es cdigo ejecutable que se asocia y se almacena con la
base de datos. Los procedimientos almacenados usualmente recogen y personalizan
operaciones comunes, como insertar un registro dentro de una tabla, recopilar
informacin estadstica, o encapsular clculos complejos. Son frecuentemente usados
por un API por seguridad o simplicidad.
Los procedimientos almacenados no son parte del modelo relacional, pero todas las
implementaciones comerciales los incluyen.
Estructura[editar]
La base de datos se organiza en dos marcadas secciones; el esquema y los datos (o
instancia).
Las bases de datos relacionales pasan por un proceso al que se le conoce como
normalizacin, el resultado de dicho proceso es un esquema que permite que la base de
datos sea usada de manera ptima.
Los datos o instancia es el contenido de la base de datos en un momento dado. Es en s,
el contenido de todos los registros.
Manipulacin de la informacin[editar]
Para manipular la informacin utilizamos un lenguaje relacional, actualmente se cuenta
con dos lenguajes formales el lgebra relacional y el clculo relacional. El lgebra
relacional permite describir la forma de realizar una consulta, en cambio, el clculo
relacional slo indica lo que se desea devolver.
El lenguaje ms comn para construir las consultas a bases de datos relacionales es SQL
(Structured Query Language), un estndar implementado por los principales motores o
sistemas de gestin de bases de datos relacionales integradas.
En el modelo relacional los atributos deben estar explcitamente relacionados a un
nombre en todas las operaciones, en cambio, el estndar SQL permite usar columnas sin
nombre en conjuntos de resultados, como el asterisco taquigrfico (*) como notacin de
consultas.
Al contrario del modelo relacional, el estndar SQL requiere que las columnas tengan
un orden definido, lo cual es fcil de implementar en una computadora, ya que la
memoria es lineal.
Es de notar, sin embargo, que en SQL el orden de las columnas y los registros devueltos
en cierto conjunto de resultado nunca est garantizado, a no ser que explcitamente sea
especificado por el usuario.
MySQL
PostgreSQL,
Oracle,
DB2,
[[Informix]],
Interbase,
Firebird,
Sybase
Microsoft SQL Server
Ventajas y desventajas[editar]
Ventajas[editar]
Desventajas[editar]
Vase tambin[editar]
Base de datos
Modelo relacional
Modelo entidad-relacin
Base de datos orientada a objetos
Referencias[editar]
1. Volver arriba Communications of the ACM, volume=13, issue=6, pages=377-387 en
ingls
Enlaces externos[editar]
Artculo sobre Como ocupar menos espacio de disco duro en bases de datos
relacionales
Blog sobre base de datos Oracle y alta disponibilidad
Comparacin entre Oracle y SQL Server
Categoras:
Clave nica
Bases de datos
Donde los campos ' ' hacen referencia a las dimensiones de la tabla, y los campos ' '
a las mtricas o hechos que se quiere almacenar, estudiar o analizar.
ndice
[ocultar]
Implementacin[editar]
Lo ms importante a tener en cuenta para implementar esta estructura de datos es que la
tabla contiene todas las n-tuplas, con los valores de las dimensiones, o ndice del cubo,
y los valores de las mtricas previamente calculados para el cruce de valores del ndice
en cuestin.
Ejemplo[editar]
Dada la siguiente especificacin para una tabla (o hipercubo) en una base de datos
multidimensional:
Dimensin (Tiempo, Productos)
Jerarqua (Ao->Semestre->Mes->Semana),(Categora->Lnea->Marca)
Elementos (2006, 2007, ..., S1-06, ..., Ene-06, ..., 200625....),
(Todos, Mquinas, Refacciones, Mquinas caras, Mquinas
Baratas, Mquina 1,...)
Hechos
(Ventas, Inventario, Defectos, Devoluciones)
Mtricas (PD:=Devoluciones/Ventas, %Defectos)
Tiempo Productos
P/D %Defectos
2006
Todos
1/100
5%
Ene06
Mquina 1
10/10
100%
...
Ventas
Inventario
Defectos
Devoluciones
1000
200
50
10
10
100
10
10
Historia[editar]
El modelo de datos multivaluado fue definido por Don Nelson a mediados de los 60, y
en 1968 se realiz la primera implementacin de un sistema de bases de datos
multidimensional, este desarrollo se atribuye a Dick Pick (de ah que tambin se utilice
el trmino Base de datos para este tipo de bases de datos).
Concepto[editar]
El modelo de datos ms extendido es el modelo relacional, este modelo se basa en las
leyes de la normalizacin de bases de datos; segn ests normas, y concretamente,
segn la primera forma normal, un campo de una base de datos no puede contener
valores mltiples. En una base de datos multivaluada no se aplica la regla de la primera
forma normal, es decir, se permite que un campo pueda tener ms de un valor
almacenado.
Ejemplo[editar]
Supongamos una base de datos en la que queremos almacenar informacin de clientes;
se supone que cada cliente puede tener ms de un telfono. En el modelo relacional
habra que crear dos tablas o relaciones como estas:
Tabla 'Cliente'
ID Cliente Nombre Apellido
123
Rachel Ingram
456
James Wright
789
Maria Fernndez
Tabla 'Telfono cliente'
ID Cliente Telfono
123
555-861-2025
456
555-403-1659
456
555-776-4100
789
555-808-9633
Vase tambin[editar]
OLAP
Cubo OLAP
OLTP
Vector multidimensional
Minera de datos
Inteligencia empresarial (Business Intelligence)
Almacn de datos (Data Warehousing)
Enlaces externos[editar]
Modelo relacional
De Wikipedia, la enciclopedia libre
Saltar a: navegacin , bsqueda
El modelo relacional para la gestin de una base de datos es un modelo de datos
basado en la lgica de predicados y en la teora de conjuntos. Es el modelo ms
utilizado en la actualidad para modelar problemas reales y administrar datos
dinmicamente. Tras ser postuladas sus bases en 1970 por Edgar Frank Codd, de los
laboratorios IBM en San Jos (California), no tard en consolidarse como un nuevo
paradigma en los modelos de base de datos.
Su idea fundamental es el uso de relaciones. Estas relaciones podran considerarse en
forma lgica como conjuntos de datos llamados tuplas. Pese a que sta es la teora de
las bases de datos relacionales creadas por Edgar Frank Codd, la mayora de las veces se
conceptualiza de una manera ms fcil de imaginar, esto es, pensando en cada relacin
como si fuese una tabla que est compuesta por registros (cada fila de la tabla sera un
registro o tupla), y columnas (tambin llamadas campos).
ndice
[ocultar]
1 Descripcin
o
o
1.1 Esquema
1.2 Instancias
2 Base de datos relacional
3 Vase tambin
Descripcin[editar]
En este modelo todos los datos son almacenados en relaciones, y como cada relacin es
un conjunto de datos, el orden en el que stos se almacenen no tiene relevancia (a
diferencia de otros modelos como el jerrquico y el de red). Esto tiene la considerable
ventaja de que es ms fcil de entender y de utilizar por un usuario no experto. La
informacin puede ser recuperada o almacenada por medio de consultas que ofrecen una
amplia flexibilidad y poder para administrar la informacin.
Este modelo considera la base de datos como una coleccin de relaciones. De manera
simple, una relacin representa una tabla que no es ms que un conjunto de filas, cada
fila es un conjunto de campos y cada campo representa un valor que interpretado
describe el mundo real. Cada fila tambin se puede denominar tupla o registro y a cada
columna tambin se le puede llamar campo o atributo.
Para manipular la informacin utilizamos un lenguaje relacional, actualmente se cuenta
con dos lenguajes formales el lgebra relacional y el Clculo relacional. El lgebra
relacional permite describir la forma de realizar una consulta, en cambio, el Clculo
relacional slo indica lo que se desea devolver.
Esquema[editar]
Un esquema contiene la definicin de una estructura (generalmente relaciones o tablas
de una base de datos), es decir, determina la identidad de la relacin y qu tipo de
informacin podr ser almacenada dentro de ella; en otras palabras, el esquema contiene
los meta dato de la relacin. Todo esquema constar de:
Instancias[editar]
Una instancia de manera formal es la aplicacin de un esquema a un conjunto finito de
datos. En palabras no tan tcnicas, se puede definir como el contenido de una tabla en
un momento dado, pero tambin es valido referirnos a una instancia cuando trabajamos
o mostramos nicamente un subconjunto de la informacin contenida en una relacin o
tabla, como por ejemplo:
Vase tambin[editar]
12 reglas de Codd
Hugh Darwen
Bases de datos
Modelo de Datos
lgebra relacional
Clculo relacional
Modelo entidad-relacin
SQL Lenguaje de consulta estructurado.
Tabla
Registro
Campo
Una base de datos de red es una base de datos conformada por una coleccin o set de
registros, los cuales estn conectados entre s por medio de enlaces en una red. El
registro es similar al de una entidad como las empleadas en el modelo relacional.
Un registro es una coleccin o conjunto de campos (atributos), donde cada uno de ellos
contiene solamente un nico valor almacenado.
El enlace es exclusivamente la asociacin entre dos registros, as que podemos verla
como una relacin estrictamente binaria.
Una estructura de base de datos de red, llamada algunas veces estructura de plex,
abarca ms que la estructura de rbol: un nodo hijo en la estructura red puede tener ms
de un nodo padre. En otras palabras, la restriccin de que en un rbol jerrquico cada
hijo puede tener slo un padre, se hace menos severa.
As, la estructura de rbol se puede considerar como un caso especial de la estructura
de red.
Ejemplo[editar]
Para ilustrar la estructura de los registros en una base de datos de red, mostraremos la
base de datos alumno materia, con los siguientes registros (en el Lenguaje de
programacin Pascal):
type materia = record
clave: string[]
nombreM: string[]
cred: string[2]
end;
type alumno = record
nombre: string[30];
control: string[8];
materia: Materia; {Enlace a materia}
end;
Vase tambin[editar]
Base de datos
Base de datos relacional
Modelo relacional
Una base de datos jerrquica es un tipo de sistema de gestin de bases de datos que,
como su nombre indica, almacena la informacin en una estructura jerrquica que
enlaza los registros en forma de estructura de rbol (similar a un rbol visto al revs), en
donde un nodo padre de informacin puede tener varios nodos hijo, y as
sucesivamente.
Esta relacin jerrquica no es estrictamente obligatoria, de manera que pueden
establecerse relaciones entre nodos hermanos, y en este caso, la estructura en forma de
rbol se convierte en una estructura en forma de grafo dirigido (esta variante se
denomina Bases de datos de red).
ndice
[ocultar]
1 Cmo funcionan
2 Limitaciones del modelo jerrquico
o 2.1 Duplicidad de registros
o 2.2 Integridad referencial
o 2.3 Desnormalizacin
3 Gestores de bases de datos jerrquicas
4 Vase tambin
5 Enlaces externos
Cmo funcionan[editar]
A diferencia del modelo relacional, el modelo jerrquico no diferencia una vista lgica
de una vista fsica de la base de datos. De manera que las relaciones entre datos se
establecen siempre a nivel fsico, es decir, mediante referencia a direcciones fsicas del
medio de almacenamiento (sectores y pistas).
Los datos se almacenan en la forma de registros, el equivalente a las tuplas del modelo
relacional. Cada registro consta de un conjunto de campos, el equivalente a los
atributos del modelo relacional. Un conjunto de registros con los mismos campos se
denomina fichero (record type, en ingls), el equivalente a las relaciones del modelo
relacional.
El modelo jerrquico facilita relaciones padre-hijo, es decir, relaciones 1:N (de uno a
varios) del modelo relacional. Pero a diferencia de ste ltimo, las relaciones son
unidireccionales. En justicia, dichas relaciones son hijo-padre, pero no padre-hijo. Por
ejemplo, el registro de un empleado (nodo hijo) puede relacionarse con el registro de su
departamento (nodo padre), pero no al contrario. Esto implica que solamente se puede
consultar la base de datos desde los nodos hoja hacia el nodo raz. La consulta en el
sentido contrario requiere una bsqueda secuencial por todos los registros de la base de
datos (por ejemplo, para consultar todos los empleados de un departamento). En las
bases de datos jerrquicas no existen ndices que faciliten esta tarea[cita requerida].
Obsrvese que, a priori, no existen relaciones N:M (de muchos a muchos) en el modelo
jerrquico. Salvo que se simulen mediante varias relaciones 1:N. No obstante, esto
puede provocar problemas de inconsistencia, ya que el gestor de base de datos no
controla estas relaciones.
Como ya se ha mencionado, las relaciones se establecen mediante punteros entre
registros. Es decir, un registro hijo contiene la direccin fsica en el medio de
almacenamiento de su registro padre. Esto tiene una ventaja fundamental sobre las
bases de datos relacionales: el rendimiento. El acceso de un registro a otro es
prcticamente inmediato sin necesidad de consultar tablas de correspondencia.
Las relaciones jerrquicas entre diferentes tipos de datos pueden hacer que sea muy
sencillo responder a determinadas preguntas, pero muy difcil el contestar a otras.
Duplicidad de registros[editar]
No se garantiza la inexistencia de registros duplicados. Esto tambin es cierto para los
campos "clave". Es decir, no se garantiza que dos registros cualesquiera tengan
diferentes valores en un subconjunto concreto de campos.
Integridad referencial[editar]
No existe garanta de que un registro hijo est relacionado con un registro padre vlido.
Por ejemplo, es posible borrar un nodo padre sin eliminar antes los nodos hijo, de
manera que stos ltimos estn relacionados con un registro invlido o inexistente..
Desnormalizacin[editar]
Este no es tanto un problema del modelo jerrquico como del uso que se hace de l. Sin
embargo, a diferencia del modelo relacional, las bases de datos jerrquicas no tienen
controles que impidan la desnormalizacin de una base de datos. Por ejemplo, no existe
el concepto de campos clave o campos nicos.
La desnormalizacin permite ingresar redundancia de una forma controlada, seguir a
una serie de pasos conlleva a:
Ejemplo:
Proveedor (Nro_proveedor, calle, ciudad, cod_postal, descripcin) La relacin
Proveedor esta desnormalizada, ya que para normalizarla deberamos crear una tabla
con ciudad y cdigo postal
Adabas
GT.M
IMS
Focus
Vase tambin[editar]
Base de datos
Base de datos relacional
Enlaces externos[editar]
En el modelo relacional es frecuente llamar tabla a una relacin, aunque para que una
tabla sea considerada como una relacin tiene que cumplir con algunas restricciones:
Figura 1.0: Trabajo (Cdigo, Nombre, Posicin, Salario), donde Cdigo es la Clave
Primaria.
Los trminos Relacin, Tupla y Atributo derivan del lgebra y clculo relacional, que
constituyen la fuente terica del modelo de base de datos relacional.
Todo atributo en una tabla tiene un dominio, el cual representa el conjunto de valores
que el mismo puede tomar. Una instancia de una tabla puede verse entonces como un
subconjunto del producto cartesiano entre los dominios de los atributos. Sin embargo,
suele haber algunas diferencias con la analoga matemtica, ya que algunos RDBMS
permiten filas duplicadas, entre otras cosas. Finalmente, una tupla puede razonarse
matemticamente como un elemento del producto cartesiano entre los dominios.
ndice
[ocultar]
1 Dependencias
o 1.1 Dependencia funcional
o 1.2 Propiedades de la dependencia funcional
1.2.1 Dependencia funcional reflexiva
1.2.2 Dependencia funcional Aumentativa
1.2.3 Dependencia funcional transitiva
o 1.3 Propiedades deducidas
1.3.1 Unin
1.3.2 Pseudo-Transitiva
1.3.3 Descomposicin
2 Claves
3 Formas normales
o 3.1 Primera Forma Normal (1FN)
o 3.2 Segunda Forma Normal (2FN)
o 3.3 Tercera Forma Normal (3FN)
o 3.4 Forma normal de Boyce-Codd (FNBC)
o 3.5 Cuarta Forma Normal (4FN)
o 3.6 Quinta Forma Normal (5FN)
4 Reglas de Codd
o 4.1 Regla No. 1 - La Regla de la informacin
o 4.2 Regla No. 2 - La regla del acceso garantizado
o 4.3 Regla No. 3 - Tratamiento sistemtico de los valores nulos
o 4.4 Regla No. 4 - La regla de la descripcin de la base de datos
o 4.5 Regla No. 5 - La regla del sub-lenguaje Integral
o 4.6 Regla No. 6 - La regla de la actualizacin de vistas
o 4.7 Regla No. 7 - La regla de insertar y actualizar
o 4.8 Regla No. 8 - La regla de independencia fsica
o 4.9 Regla No. 9 - La regla de independencia lgica
o 4.10 Regla No. 10 - La regla de la independencia de la integridad
4.10.1 Las reglas de integridad
o 4.11 Regla No. 11 - La regla de la distribucin
o 4.12 Regla No. 12 - Regla de la no-subversin
5 Vase tambin
6 Referencias
Dependencias[editar]
Dependencia funcional[editar]
B es funcionalmente dependiente de A.
Una dependencia funcional es una conexin entre uno o ms atributos. Por ejemplo si se
conoce el valor de DNI tiene una conexin con Apellido o Nombre .
Las dependencias funcionales del sistema se escriben utilizando una flecha, de la
siguiente manera:
FechaDeNacimiento
Edad
nombre
DNI,direccin
nombre,direccin
Z entonces X
FechaDeNacimiento
Edad
Z
Edad
Conducir
FechaDeNacimiento
Edad
Conducir
Propiedades deducidas[editar]
Unin[editar]
y
entonces
Pseudo-Transitiva[editar]
y
entonces
Descomposicin[editar]
y est incluido en entonces
Claves[editar]
Una clave primaria es aquella columna (o conjunto de columnas) que identifica
unvocamente a cada fila. La clave primaria es un identificador que va a ser siempre
nico para cada fila. Se acostumbra a poner la clave primaria como la primera columna
de la tabla pero es ms una conveniencia que una obligacin. Muchas veces la clave
primaria es numrica auto-incrementada, es decir, generada mediante una secuencia
numrica incrementada automticamente cada vez que se inserta una fila.
En una tabla puede que tengamos ms de una columna que puede ser clave primaria por
s misma. En ese caso se puede escoger una para ser la clave primaria y las dems
claves sern claves candidatas.
Una clave ajena (foreign key o clave fornea) es aquella columna que existiendo
como dependiente en una tabla, es a su vez clave primaria en otra tabla.
Una clave alternativa es aquella clave candidata que no ha sido seleccionada como
clave primaria, pero que tambin puede identificar de forma nica a una fila dentro de
una tabla. Ejemplo: Si en una tabla clientes definimos el nmero de documento
(id_cliente) como clave primaria, el nmero de seguro social de ese cliente podra ser
una clave alternativa. En este caso no se us como clave primaria porque es posible que
no se conozca ese dato en todos los clientes.
Una clave compuesta es una clave que est compuesta por ms de una columna.
La visualizacin de todas las posibles claves candidatas en una tabla ayudan a su
optimizacin. Por ejemplo, en una tabla PERSONA podemos identificar como claves su
DNI, o el conjunto de su nombre, apellidos, fecha de nacimiento y direccin. Podemos
usar cualquiera de las dos opciones o incluso todas a la vez como clave primaria, pero
es mejor en la mayora de sistemas la eleccin del menor nmero de columnas como
clave primaria.
Formas normales[editar]
Las formas normales son aplicadas a las tablas de una base de datos. Decir que una base
de datos est en la forma normal N es decir que todas sus tablas estn en la forma
normal N.
Todos los atributos son atmicos. Un atributo es atmico si los elementos del
dominio son simples e indivisibles.
La tabla contiene una clave primaria nica.
La clave primaria no contiene atributos nulos.
Esta forma normal elimina los valores repetidos dentro de una Base de Datos.
Dependencia Funcional. Una relacin est en 2FN si est en 1FN y si los atributos que
no forman parte de ninguna clave dependen de forma completa de la clave principal. Es
decir que no existen dependencias parciales. (Todos los atributos que no son clave
principal deben depender nicamente de la clave principal).
En otras palabras podramos decir que la segunda forma normal est basada en el
concepto de dependencia completamente funcional. Una dependencia funcional
es completamente funcional si al eliminar los atributos A de X significa que la
dependencia no es mantenida, esto es que
. Una
dependencia funcional
es una dependencia parcial si hay algunos atributos
que pueden ser eliminados de X y la dependencia todava se mantiene, esto es
.
Por ejemplo {DNI, ID_PROYECTO} HORAS_TRABAJO (con el DNI de un
empleado y el ID de un proyecto sabemos cuntas horas de trabajo por semana trabaja
un empleado en dicho proyecto) es completamente funcional dado que ni DNI
HORAS_TRABAJO ni ID_PROYECTO HORAS_TRABAJO mantienen la
dependencia. Sin embargo {DNI, ID_PROYECTO} NOMBRE_EMPLEADO es
parcialmente dependiente dado que DNI NOMBRE_EMPLEADO mantiene la
dependencia.
es superllave o clave.
es atributo primo de ; esto es, si es miembro de alguna clave en
es superllave o clave.
De esta forma, todo esquema que cumple FNBC, est adems en 3FN; sin embargo,
no todo esquema que cumple con 3FN, est en FNBC.
Una tabla se encuentra en 4FN si, y slo si, para cada una de sus dependencias mltiples
no funcionales X->->Y, siendo X una super-clave que, X es o una clave candidata o un
conjunto de claves primarias.
Reglas de Codd[editar]
Codd se percat de que existan bases de datos en el mercado las cuales decan ser
relacionales, pero lo nico que hacan era guardar la informacin en las tablas, sin estar
estas tablas literalmente normalizadas; entonces ste public 12 reglas que un verdadero
sistema relacional debera tener, en la prctica algunas de ellas son difciles de realizar.
Un sistema podr considerarse "ms relacional" cuanto ms siga estas reglas.
Hay problemas para soportar los valores nulos en las operaciones relacionales,
especialmente en las operaciones lgicas, para lo cual se considera una lgica
trivaluada, con tres (no dos) valores de verdad: Verdadero, Falso y null. Se crean tablas
de verdad para las operaciones lgicas:
operables, independientemente del tipo de relaciones y restricciones que haya entre las
tablas o no.
Vase tambin[editar]
Referencias[editar]
1. Volver arriba A Relational Model of Data for Large Shared Data Banks
Communications of the ACM, Vol. 13, No. 6, June 1970, pp. 377-387 [1]
2. Volver arriba Fundamentals of DATABASE SYSTEMS Addison-Wesley;, ISBN-10:
0321122267, ISBN-13: 978-0321122261,
E.F.Codd (junio de 1970). "A Relational Model of Data for Large Shared
Databanks". Communications of the ACM.
C.J.Date (1994). "An Introduction to Database Systems". Addison-Wesley.
Men de navegacin
Herramientas personales
Espacios de nombres
Artculo
Discusin
Variantes
Vistas
Leer
Editar
Ver historial
Ms
Buscar
Navegacin
Portada
Portal de la comunidad
Actualidad
Cambios recientes
Pginas nuevas
Pgina aleatoria
Ayuda
Donaciones
Notificar un error
Imprimir/exportar
Crear un libro
Descargar como PDF
Versin para imprimir
Herramientas
En otros idiomas
etina
Deutsch
English
Suomi
Franais
Hrvatski
Italiano
Latvieu
Nederlands
Norsk bokml
Polski
Portugus
Srpskohrvatski /
Simple English
Slovenina
Shqip
/ srpski
Svenska
Trke
Ting Vit
Editar enlaces
Esta pgina fue modificada por ltima vez el 25 may 2015 a las
Minera de datos
De Wikipedia, la enciclopedia libre
Saltar a: navegacin , bsqueda
Se ha sugerido que Tratamiento de base de datos sea fusionado en este
artculo o seccin (discusin).
Una vez que hayas realizado la fusin de artculos, pide la fusin de historiales aqu.
ndice
[ocultar]
1 Proceso
2 Protocolo de un proyecto de minera de datos
3 Tcnicas de minera de datos
4 Ejemplos de uso de la minera de datos
o 4.1 Negocios
4.1.1 Anlisis de la cesta de la compra
Proceso[editar]
Un proceso tpico de minera de datos consta de los siguientes pasos generales:
1. Seleccin del conjunto de datos, tanto en lo que se refiere a las variables
objetivo (aquellas que se quiere predecir, calcular o inferir), como a las variables
independientes (las que sirven para hacer el clculo o proceso), como
posiblemente al muestreo de los registros disponibles.
2. Anlisis de las propiedades de los datos, en especial los histogramas,
diagramas de dispersin, presencia de valores atpicos y ausencia de datos
(valores nulos).
3. Transformacin del conjunto de datos de entrada, se realizar de diversas
formas en funcin del anlisis previo, con el objetivo de prepararlo para aplicar
la tcnica de minera de datos que mejor se adapte a los datos y al problema, a
este paso tambin se le conoce como preprocesamiento de los datos.
4. Seleccionar y aplicar la tcnica de minera de datos, se construye el modelo
predictivo, de clasificacin o segmentacin.
5. Extraccin de conocimiento, mediante una tcnica de minera de datos, se
obtiene un modelo de conocimiento, que representa patrones de comportamiento
observados en los valores de las variables del problema o relaciones de
asociacin entre dichas variables. Tambin pueden usarse varias tcnicas a la
vez para generar distintos modelos, aunque generalmente cada tcnica obliga a
un preprocesado diferente de los datos.
6. Interpretacin y evaluacin de datos, una vez obtenido el modelo, se debe
proceder a su validacin comprobando que las conclusiones que arroja son
vlidas y suficientemente satisfactorias. En el caso de haber obtenido varios
modelos mediante el uso de distintas tcnicas, se deben comparar los modelos en
busca de aquel que se ajuste mejor al problema. Si ninguno de los modelos
alcanza los resultados esperados, debe alterarse alguno de los pasos anteriores
para generar nuevos modelos.
La relacin entre todas estas fases slo es lineal sobre el papel. En realidad, es mucho
ms compleja y esconde toda una jerarqua de subfases. A travs de la experiencia
acumulada en proyectos de minera de datos se han ido desarrollando metodologas que
permiten gestionar esta complejidad de una manera ms o menos uniforme.
Segn el objetivo del anlisis de los datos, los algoritmos utilizados se clasifican en
supervisados y no supervisados (Weiss y Indurkhya, 1998):
La minera de datos tambin puede ser til para los departamentos de recursos humanos
en la identificacin de las caractersticas de sus empleados de mayor xito. La
informacin obtenida puede ayudar a la contratacin de personal, centrndose en los
esfuerzos de sus empleados y los resultados obtenidos por stos. Adems, la ayuda
ofrecida por las aplicaciones para Direccin estratgica en una empresa se traducen en
la obtencin de ventajas a nivel corporativo, tales como mejorar el margen de beneficios
o compartir objetivos; y en la mejora de las decisiones operativas, tales como desarrollo
de planes de produccin o gestin de mano de obra.
Comportamiento en Internet[editar]
Tambin es un rea en boga el del anlisis del comportamiento de los visitantes sobre
todo, cuando son clientes potenciales en una pgina de Internet. O la utilizacin de la
informacin obtenida por medios ms o menos legtimos sobre ellos para
ofrecerles propaganda adaptada especficamente a su perfil. O para, una vez que
adquieren un determinado producto, saber inmediatamente qu otro ofrecerle teniendo
en cuenta la informacin histrica disponible acerca de los clientes que han comprado el
primero.
Terrorismo[editar]
La minera de datos ha sido citada como el mtodo por el cual la unidad Able Danger
del Ejrcito de los EE. UU. haba identificado al lder de los atentados del 11 de
septiembre de 2001, Mohammed Atta, y a otros tres secuestradores del "11-S" como
posibles miembros de una clula de Al Qaeda que operan en los EE. UU. ms de un ao
antes del ataque. Se ha sugerido que tanto la Agencia Central de Inteligencia y su
homloga canadiense, Servicio de Inteligencia y Seguridad Canadiense, tambin han
empleado este mtodo.2
Juegos[editar]
Desde comienzos de la dcada de 1960, con la disponibilidad de orculos para
determinados juegos combinacionales, tambin llamados finales de juego de tablero
(por ejemplo, para las tres en raya o en finales de ajedrez) con cualquier configuracin
de inicio, se ha abierto una nueva rea en la minera de datos que consiste en la
extraccin de estrategias utilizadas por personas para estos orculos. Los planteamientos
actuales sobre reconocimiento de patrones, no parecen poder aplicarse con xito al
funcionamiento de estos orculos. En su lugar, la produccin de patrones perspicaces se
basa en una amplia experimentacin con bases de datos sobre esos finales de juego,
combinado con un estudio intensivo de los propios finales de juego en problemas bien
diseados y con conocimiento de la tcnica (datos previos sobre el final del juego).
Ejemplos notables de investigadores que trabajan en este campo son Berlekamp en el
juego de puntos-y-cajas (o Timbiriche) y John Nunn en finales de ajedrez.
Ciencia e Ingeniera[editar]
En los ltimos aos la minera de datos se est utilizando ampliamente en diversas reas
relacionadas con la ciencia y la ingeniera. Algunos ejemplos de aplicacin en estos
campos son:
Gentica[editar]
En el estudio de la gentica humana, el objetivo principal es entender la relacin
cartogrfica entre las partes y la variacin individual en las secuencias del ADN
humano y la variabilidad en la susceptibilidad a las enfermedades. En trminos ms
llanos, se trata de saber cmo los cambios en la secuencia de ADN de un individuo
afectan al riesgo de desarrollar enfermedades comunes (como por ejemplo el cncer).
Esto es muy importante para ayudar a mejorar el diagnstico, prevencin y tratamiento
de las enfermedades. La tcnica de minera de datos que se utiliza para realizar esta
tarea se conoce como "reduccin de dimensionalidad multifactorial".3
Ingeniera elctrica[editar]
En el mbito de la ingeniera elctrica, las tcnicas de minera de datos han sido
ampliamente utilizadas para monitorizar las condiciones de las instalaciones de alta
tensin. La finalidad de esta monitorizacin es obtener informacin valiosa sobre el
estado del aislamiento de los equipos. Para la vigilancia de las vibraciones o el anlisis
de los cambios de carga en transformadores se utilizan ciertas tcnicas para agrupacin
de datos (clustering) tales como los mapas auto-organizativos (SOM: Self-organizing
map). Estos mapas sirven para detectar condiciones anormales y para estimar la
naturaleza de dichas anomalas.4
Anlisis de gases[editar]
Tambin se han aplicado tcnicas de minera de datos para el anlisis de gases disueltos
(DGA: Dissolved gas analysis) en transformadores elctricos. El anlisis de gases
disueltos se conoce desde hace mucho tiempo como la herramienta para diagnosticar
transformadores. Los mapas auto-organizativos (SOM) se utilizan para analizar datos y
determinar tendencias que podran pasarse por alto utilizando las tcnicas clsicas
(DGA).
De la estadstica[editar]
Ciertamente, la minera de datos bebe de la estadstica, de la que toma las siguientes
tcnicas:
De la informtica[editar]
De la informtica toma las siguientes tcnicas:
Sistemas Expertos: Son sistemas que han sido creados a partir de reglas
prcticas extradas del conocimiento de expertos. Principalmente a base de
inferencias o de causa-efecto.
Sistemas Inteligentes: Son similares a los sistemas expertos, pero con mayor
ventaja ante nuevas situaciones desconocidas para el experto.
tenan que haber salido, basndose en unos datos de prueba, dando lugar a un
proceso de retroalimentacin mediante el cual la red se reconfigura, hasta
obtener un modelo adecuado.
Al analizar los datos desde esta nueva perspectiva se genera un mapa de informacin
que hace innecesario la preparacin previa de los datos, una tarea absolutamente
imprescindible si se desea buenos resultados, pero que lleva enorme cantidad de tiempo.
Es posible seleccionar un grupo de variables ptimo que contenga la informacin
necesaria para realizar un modelo de prediccin.
Una vez que las variables son procesadas con el fin de crear el mapa de informacin y
luego seleccionadas aquellas que aportan la mayor informacin, la eleccin de la
herramienta que se usar para crear el modelo deja de tener importancia, ya que el
mayor trabajo fue realizado en los pasos previos.
Tendencias[editar]
La Minera de Datos ha sufrido transformaciones en los ltimos aos de acuerdo con
cambios tecnolgicos, de estrategias de marketing, la extensin de los modelos de
compra en lnea, etc. Los ms importantes de ellos son:
Herramientas de software[editar]
Existen muchas herramientas de software para el desarrollo de modelos de minera de
datos tanto libres como comerciales como, por ejemplo:
dVelox de APARA
KXEN
KNIME
Neural Designer
OpenNN
Orange
Powerhouse
Quiterian
RapidMiner
R
Vase tambin[editar]
Aprendizaje automtico
Minera de textos
Minera de datos espacial
Minera de procesos
Minera de grafos
Data warehousing o Almacenamiento de datos
SPSS Clementine
SAS Enterprise Miner
STATISTICA Data Miner
Weka
KEEL
Inteligencia Empresarial
Estadstica
Iconografa de las correlaciones
Reglas de asociacin
Web mining
Sistemas de informacin ejecutiva
Sistemas de soporte a decisiones
Almacn operacional de los datos
Weka (aprendizaje automtico)
Facts and authorities
Referencias[editar]
1. Volver arriba Oded Maimon and Lior Rokach (2010). Data Mining and Knowledge
Discovery Handbook. Springer, New York. ISBN 978-0-387-09823-4.
2. Volver arriba Stephen Haag et al. Management Information Systems for the
information age. p. 28. ISBN 0-07-095569-7.
3. Volver arriba Xingquan Zhu, Ian Davidson (2007). Knowledge Discovery and Data
Mining: Challenges and Realities. Hershey, New Your. p. 18. ISBN 978-1-59904-252-7.
4. Volver arriba Plantilla:Cite Journal.
Enlaces externos[editar]
Minera de datos
Bases de datos
Anlisis de datos
Categora oculta:
Wikipedia:Fusionar
Men de navegacin
Herramientas personales
Espacios de nombres
Artculo
Discusin
Variantes
Vistas
Leer
Editar
Ver historial
Ms
Buscar
Navegacin
Portada
Portal de la comunidad
Actualidad
Cambios recientes
Pginas nuevas
Pgina aleatoria
Ayuda
Donaciones
Notificar un error
Imprimir/exportar
Crear un libro
Descargar como PDF
Versin para imprimir
Herramientas
En otros idiomas
Azrbaycanca
Catal
etina
Dansk
Deutsch
English
Eesti
Euskara
Suomi
Franais
Hrvatski
Magyar
Bahasa Indonesia
Italiano
Lietuvi
Latvieu
Nederlands
Norsk bokml
Polski
Portugus
Romn
Srpskohrvatski /
Simple English
Slovenina
Slovenina
/ srpski
Basa Sunda
Svenska
Trke
Ting Vit
Editar enlaces
Esta pgina fue modificada por ltima vez el 4 abr 2015 a las 21:43.
Almacn de datos
De Wikipedia, la enciclopedia libre
Saltar a: navegacin , bsqueda
ndice
[ocultar]
determin que un data warehouse no era ms que: "la unin de todos los Data marts
de una entidad"[cita requerida]. Defiende por tanto una metodologa ascendente (bottomup) a la hora de disear un almacn de datos.
Data marts[editar]
Los Data marts son subconjuntos de datos de un data warehouse para reas
especficas.
Entre las caractersticas de un data mart destacan:
Usuarios limitados.
rea especfica.
Tiene un propsito especfico.
Tiene una funcin de apoyo.
Cubos de informacin[editar]
Artculo principal: Cubo OLAP
Los cubos de informacin o cubos OLAP funcionan como los cubos de rompecabezas
en los juegos, en el juego se trata de armar los colores y en el data warehouse se trata de
organizar los datos por tablas o relaciones; los primeros (el juego) tienen 3 dimensiones,
los cubos OLAP tienen un nmero indefinido de dimensiones, razn por la cual tambin
reciben el nombre de hipercubos. Un cubo OLAP contendr datos de una determinada
variable que se desea analizar, proporcionando una vista lgica de los datos provistos
por el sistema de informacin hacia el data warehouse, esta vista estar dispuesta segn
unas dimensiones y podr contener informacin calculada. El anlisis de los datos est
basado en las dimensiones del hipercubo, por lo tanto, se trata de un anlisis
multidimensional.
A la informacin de un cubo puede acceder el ejecutivo mediante "tablas dinmicas" en
una hoja de clculo o a travs de programas personalizados. Las tablas dinmicas le
permiten manipular las vistas (cruces, filtrados, organizacin, totales) de la informacin
con mucha facilidad. Las diferentes operaciones que se pueden realizar con cubos de
informacin se producen con mucha rapidez. Llevando estos conceptos a un data
warehouse, ste es una coleccin de datos que est formada por dimensiones y
variables, entendiendo como dimensiones a aquellos elementos que participan en el
anlisis y variables a los valores que se desean analizar.
Dimensiones[editar]
Las dimensiones de un cubo son atributos relativos a las variables, son las perspectivas
de anlisis de las variables (forman parte de la tabla de dimensiones). Son catlogos de
informacin complementaria necesaria para la presentacin de los datos a los usuarios,
como por ejemplo: descripciones, nombres, zonas, rangos de tiempo, etc. Es decir, la
informacin general complementaria a cada uno de los registros de la tabla de hechos.
Variables[editar]
Tambin llamadas indicadores de gestin, son los datos que estn siendo analizados.
Forman parte de la tabla de hechos. Ms formalmente, las variables representan algn
aspecto cuantificable o medible de los objetos o eventos a analizar. Normalmente, las
variables son representadas por valores detallados y numricos para cada instancia del
objeto o evento medido. En forma contraria, las dimensiones son atributos relativos a
las variables, y son utilizadas para indexar, ordenar, agrupar o abreviar los valores de las
mismas. Las dimensiones poseen una granularidad menor, tomando como valores un
conjunto de elementos menor que el de las variables; ejemplos de dimensiones podran
ser: productos, localidades (o zonas), el tiempo (medido en das, horas,
semanas, etc.), ...
Ejemplos[editar]
Ejemplos de variables podran ser:
Beneficios
Gastos
Ventas
etc.
Tablas
Columnas de tablas
Relaciones entre tablas
Jerarquas y Dimensiones de datos
Entidades y Relaciones
Middleware[editar]
Artculo principal: Middleware
Middleware es un trmino genrico que se utiliza para referirse a todo tipo de software
de conectividad que ofrece servicios u operaciones que hacen posible el funcionamiento
de aplicaciones distribuidas sobre plataformas heterogneas. Estos servicios funcionan
como una capa de abstraccin de software distribuida, que se sita entre las capas de
aplicaciones y las capas inferiores (sistema operativo y red). El middleware puede verse
como una capa API, que sirve como base a los programadores para que puedan
desarrollar aplicaciones que trabajen en diferentes entornos sin preocuparse de los
protocolos de red y comunicaciones en que se ejecutarn. De esta manera se ofrece una
mejor relacin costo/rendimiento que pasa por el desarrollo de aplicaciones ms
complejas, en menos tiempo.
La funcin del middleware en el contexto de los data warehouse es la de asegurar la
conectividad entre todos los componentes de la arquitectura de un almacn de datos.
de consultas a realizar. Con este criterio los datos deben ser repartidos entre numerosos
data marts. Para abordar un proyecto de data warehouse es necesario hacer un estudio
de algunos temas generales de la organizacin o empresa, los cuales se describen a
continuacin:
Los almacenes de datos hacen ms fcil el acceso a una gran variedad de datos a
los usuarios finales
Facilitan el funcionamiento de las aplicaciones de los sistemas de apoyo a la
decisin tales como informes de tendencia, por ejemplo: obtener los tems con
la mayora de las ventas en un rea en particular dentro de los ltimos dos aos;
informes de excepcin, informes que muestran los resultados reales frente a los
objetivos planteados a priori.
Los almacenes de datos pueden trabajar en conjunto y, por lo tanto, aumentar el
valor operacional de las aplicaciones empresariales, en especial la gestin de
relaciones con clientes.
Inconvenientes[editar]
Utilizar almacenes de datos tambin plantea algunos inconvenientes, algunos de ellos
son:
A menudo existe una delgada lnea entre los almacenes de datos y los sistemas
operacionales. Hay que determinar qu funcionalidades de estos se pueden
aprovechar y cules se deben implementar en el data warehouse, resultara
costoso implementar operaciones no necesarias o dejar de implementar alguna
que s vaya a necesitarse.
Vase tambin[editar]
Notas y referencias[editar]
1. Volver arriba Bill Inmon en la Wikipedia en ingls
2. Volver arriba Ralph Kimball en la Wikipedia en ingls.
Enlaces externos[editar]
Terminologa informtica
Bases de datos
Sistemas de Informacin Geogrfica
ndice
[ocultar]
1 Introduccin
2 Historia
o 2.1 Sistemas de navegacin de 1960
o 2.2 Sistemas relacionales de 1970
o
o
o
o
Introduccin[editar]
Las bases de datos generalmente funcionan en computadoras dedicadas de forma
exclusiva a este campo. Por las prestaciones requeridas, generalmente funcionan en
computadoras multiprocesador con abundante memoria. Para el almacenamiento de los
datos puede contar con sistemas de disco propio (DAS), puede conectarse a una red de
almacenamiento (SAN) o conectarse a un sistema de almacenamiento en red (NAS).
Existen aceleradores hardware, usados en grandes sistema de proceso de transacciones.
Los SGBD se encuentran en el corazn de toda aplicacin que maneje datos. Los SGBD
se basan en sistemas operativos estndar para efectuar dichas funciones.
Historia[editar]
Las Bases de Datos han estado en uso desde los primeros das de los ordenadores
electrnicos. A diferencia de los sistemas modernos, que se pueden aplicar a datos y
necesidades muy diferentes, la mayor parte de los sistemas originales estaban enfocados
a bases de datos especficas y pensados para ganar velocidad a costa de perder
flexibilidad. Los SGBD originales slo estaban a disposicin de las grandes
organizaciones que podan disponer de los complejos ordenadores necesarios.
enlace al primer registro de la base de datos, el cual a su vez contena punteros a otros
datos. Para encontrar un registro concreto el programador deba ir siguiendo punteros
hasta llegar al registro buscado.
Para responder a preguntas simples como buscar todas las personas en Japn el
programa deba recorrer todos los datos para escoger los registros correctos. No existan
los conceptos buscar ni encontrar, algo que sera inaceptable hoy en da, pero que
en los tiempos en que los datos se guardaban en cintas no era viable llevarlos a la
prctica.
Se encontraron soluciones a muchos de esos problemas. El fabricante Prime cre un
SGBD ajustado a CODASYL basado en rboles binarios que atajaba la navegacin de
registro en registro proveyendo caminos alternativos de acceso. Tambin aportaba un
lenguaje de interrogacin muy claro. De hecho no hay razn para no poder aplicar los
conceptos de normalizacin a bases de datos CODASYL, pero en ltimo trmino
CODASYL resultaba muy complejo y requera de mucho esfuerzo y prctica para
producir una aplicacin til.
IBM tambin tena su SGBD propio en 1968, conocido como IMS. Se trataba de un
software desarrollado para el programa Apolo sobre System/360. IMS tena conceptos
similares a CODASYL, pero usaba una jerarqua estricta de ordenacin de los datos,
frente a la estructura en red de CODASYL. Ambos conceptos fueron englobados
posteriormente en el concepto de Bases de Datos de navegacin debido al modo de
acceso a los datos, de hecho Bachman recibi al premio Turing en 1973 por su ponencia
"El programador como navegador".1
slo si lo necesitan. En este modelo relacional los registros relacionados se enlazan con
una "clave".
Un uso comn de las bases de datos puede mantener una agenda de usuarios, su
nombre, informacin de acceso, direccin y telfono. En la solucin de navegacin
todos esos datos estara localizados en un solo registro, y las caractersticas no usadas
simplemente no estaran en la base de datos. En la solucin relacional, los datos estaran
normalizados en una tabla de usuario, una de telfono y una de direccin, en la que
seran aadidos registros si tuviramos que incorporar telfono y direccin.
Reconciliar toda la informacin es la clave de este sistema. En el modelo relacional, una
parte de la informacin se usa como clave, identificando de manera biunvoca un
registro concreto. Cuando se recopila informacin acerca de un usuario, se acceder a la
informacin de las tablas optativas buscando mediante esa clave. Por ejemplo si el
nombre de usuario es nico, la direccin y nmero de telfono de ese usuario ser
guardada con el nombre de usuario como clave. La recopilacin de esta informacin en
un solo registro es algo para lo que los lenguajes tradicionales no estn pensados.
As como el enfoque de navegacin requiere programas que realicen bucles para
recolectar registros, el enfoque relacional tambin los requerir. La solucin de Codd
para los necesarios bucles se basa en un lenguaje orientado a conjuntos, una sugerencia
que ms tarde cristalizara en el ubicuo SQL. Plante el uso de una rama del lgebra
llamada clculo de tuplas, y demonstr que con ella se podran realizar todas las
operaciones tpicas sobre una base de datos, adems de extraer conjuntos de datos de
una forma sencilla.
El artculo de Codd cayo en manos de dos personas en Berkeley, Eugene Wong y
Michael Stonebraker. Ellos comenzaron un proyecto llamado INGRES con fondos
asignados a un proyecto de base de datos geogrfica programada por los estudiantes.
Comenzando en 1973, INGRES produjo sus primeras versiones de prueba que
estuvieron listas para uso general en 1979. INGRES era muy similar a System R de
IBM en varios aspectos, incluyendo un lenguaje para acceso a los datos, conocido como
QUEL. Con el paso del tiempo, INGRES adopto el estndar SQL.
IBM realiz una implementacin de prueba del modelo relacional -PRTV- y una de
produccin -Business System 12- ambas descontinuadas. Honeywell escribi MRDS
para Multics, y aparecen tambin dos nuevas implementaciones: Alphora Dataphor y
Rel. La mayora de las dems implementaciones de SGBD llamados relacionales son en
realidad SGBD SQL.
En la dcada de 1970, la Universidad de Mchigan comenz el desarrollo del MICRO
Information Management System basado en el modelo terico de datos de D.L. Childs.
Micro fue utilizado para gestionar gran cantidad de datos en el Departamento de trabajo
del gobierno US. Corra en mainframe usando Michigan Terminal System. Estuvo en
produccin hasta 1998.
El siglo XXI trajo una nueva tendencia en las bases de datos: el NoSQL. Esta tendencia
introduca una lnea no relacional significativamente diferentes de las clsicas. No
requieren por lo general esquemas fijos, evitan las operaciones join almacenando datos
denormalizados y estn diseadas para escalar horizontalmente. La mayor parte de ellas
pueden clasificarse como almacenes clave-valor o bases de datos orientadas a
documentos.
Recientemente ha habido una gran demanda de bases de datos distribuidas con
tolerancia a particiones, pero de acuerdo con el teorema CAP no es posible conseguir un
sistema distribuido que simultneamente proporcione consistencia, disponibilidad y
tolerancia al particionado. Un sistema distribuido puede satisfacer slo dos de las tres
restricciones a la vez. Por dicha razn muchas de las bases de datos NoSQL usan la
llamada consistencia eventual para proporcionar disponibilidad y tolerancia al
particionado, con un nivel mximo de consistencia de datos.
Entre las aplicaciones ms populares encontramos MongoDB, MemcacheDB, Redis,
CouchDB, Hazelcast, Apache Cassandra y HBase, todas ellas de cdigo abierto.
Componentes[editar]
Lenguajes de modelacin[editar]
Toda base de datos soportada por un SGBD debe tener unos esquemas modelados
adecuadamente. Coincidiendo con la evolucin histrica de las bases de datos stas han
utilizado distintos modelos. Los SGBD esperan un modelo determinado para poder
acceder de forma simple a la base de datos. Estos modelos son:
Jerrquicos
En red.
Relacionales.
Multidimensionales.
De objetos.
Estructura jerrquica[editar]
Estructura en red[editar]
La estructura relacional[editar]
Artculo principal: Base de datos relacional
La estructura multidimensional[editar]
Lenguajes de consulta[editar]
Artculo principal: Lenguaje de consulta
grupo de usuarios puede estar autorizado a ver las nminas mientras que otros pueden
estar autorizados a ver slo las historias laborales y los datos mdicos.
Si el SGBD proporciona un modo de acceder y actualizar la base de datos, as como de
consultarla, ste posibilitar la creacin de bases de datos personales. Sin embargo, le
faltara la capacidad de dejar trazas de las acciones o los controles necesarios que
necesita la base de datos de una gran organizacin. Estos controles estn slo
disponibles cuando un conjunto de programas auxiliares supervisan los accesos y
actualizaciones de los datos.
Arquitectura[editar]
La arquitectura de un SGBD especifica sus componentes (incluyendo su descripcin
funcional) y sus interfaces. Trata de conceptos distintos que la arquitectura de la base de
datos. Los componentes principales de un SGBD son:
Vase tambin[editar]
Base de datos
Almacn de datos
Anexo:Comparacin de sistemas administradores de bases de datos relacionales
Referencias[editar]
1. Volver arriba Bachman, Charles W. The programmer as navigator (en ingls).
Consultado el 17 de febrero de 2013.
2. Volver arriba Codd, E.F. (1970)."A Relational Model of Data for Large Shared Data
Banks". In: Communications of the ACM 13 (6): 377387.
3. Volver arriba Mimer SQL (en ingls). Consultado el 18 de febrero de 2013.
4. Volver arriba Database Management System; Product Overview (en ingls).
Consultado el 19 de febrero de 2013.