Vous êtes sur la page 1sur 13

Resumen BD Base de datos: Es un sistema computalizado para guardar registros.

Una base de datos es una coleccin de informacin organizada de forma que un programa de ordenador pueda seleccionar rpidamente los fragmentos de datos que necesite. Una base de datos es un sistema de archivos electrnico que nos sirve para llevar registros. Las bases de datos tradicionales se organizan por campos, registros y archivos. Un campo es una pieza nica de informacin; un registro es un sistema completo de campos; y un archivo es una coleccin de registros. Por ejemplo, una gua de telfono es anloga a un archivo. Contiene una lista de registros, cada uno de los cuales consiste en tres campos: nombre, direccin, y nmero de telfono. Ventajas Del Uso De Bases De Datos Los sistemas de bases de datos presentan numerosas ventajas ente las cuales se encuentran: -Control sobre la redundancia de datos. No se almacenan varias copias de los mismos datos. -Consistencia de datos. Si un dato est almacenado una sola vez, cualquier actualizacin se debe realizar slo una vez, y est disponible para todos los usuarios inmediatamente. -Ms informacin sobre la misma cantidad de datos. Al estar todos los datos integrados, se puede extraer informacin adicional sobre los mismos. -Comparticin de datos. La base de datos pertenece a la empresa y puede ser compartida por todos los usuarios que estn autorizados. -Mantenimiento de estndares. Gracias a la integracin es ms fcil respetar los estndares necesarios, tanto los establecidos a nivel de la empresa como los nacionales e internacionales. -Mejora en la integridad de datos. La integridad de la base de datos se refiere a la validez y la consistencia de los datos almacenados. -Mejora en la seguridad. Los SGBD permiten mantener la seguridad mediante el establecimiento de claves para identificar al personal autorizado a utilizar la base de datos. -Mejora en la accesibilidad a los datos. Muchos SGBD proporcionan lenguajes de consultas o generadores de informes que permiten al usuario hacer cualquier tipo de consulta sobre los datos. -Mejora en la productividad. El SGBD proporciona muchas de las funciones estndar que el programador necesita escribir en un sistema de ficheros. -Mejora en el mantenimiento gracias a la independencia de datos. Los SGBD separan las descripciones de los datos de las aplicaciones. Esto es lo que se conoce como independencia de datos, gracias a la cual se simplifica el mantenimiento de las aplicaciones que acceden a la base de datos.

-Aumento de la concurrencia. ia. En algunos sistemas de ficheros, si hay varios usuarios que pueden acceder simultneamente a un mismo fichero, es posible que el acceso interfiera entre ellos de modo odo que se pierda informacin. DBMS: (Data Base Management System). Son las siglas en ingls para los Sistemas de Gestin de Bases de Datos (SGBD). Bajo este nombre se conoce a productos de fabricantes como Oracle, Sybase, Informix, Ingres, Borland, Microsoft, IBM, etc. Sistema de administracin de bases de datos. Software que controla la o organizacin, rganizacin, almacenamiento, recuperacin, seguridad e integridad de los datos en una base de datos. Acepta solicitudes de la aplicacin y ordena al sistema operativo transferir los datos apropiados. Los DBMS pueden trabajar con lenguajes de programacin t tradicionales radicionales (COBOL, C, etc.) o pueden incluir su propio lenguaje de programacin. Por ejemplo, dBASE y Paradox son programas de base de datos con un DBMS, un lenguaje completo de programacin y un lenguaje de cuarta generacin, haciendo de ellos sistemas completos de desarrollo de aplicaciones. Los comandos de los lenguajes de cuarta generacin permiten a los usuarios crear en forma interactiva archivos de bases de datos, editarlos, formular preguntas e imprimir informes sin necesidad de programacin. Mile Miles s de aplicaciones han sido desarrolladas en ambientes como stos.

Lenguajes del DBMS DDL (Data Definition language): Lenguaje de Definicin de Datos. Por medio de este el DBMS identifica las descripciones de los elementos de los esquemas y almacena la descripcin escripcin del esquema en el catlogo del DBMS. Por medio de este el DBMS especifica el esquema conceptual e interno (Base de datos Almacenada).

DML (Data Manipulation language): Lenguaje de Manipulacin de Datos. Permite la manipulacin de las operaciones de Insercin, Eliminacin y Modificacin. Tipos de DML's: De alto Nivel o No por procedimientos: SQL. De bajo Nivel o por procedimientos.

Usuarios de un Sistema Manejador de Base de Datos Personal del DBA Usuarios Espordicos Programadores de Aplicaciones Usuarios paramtricos

DBA: El administrador de base de datos (DBA) es el programa responsable de los aspectos ambientales de una base de datos. En general esto incluye lo siguiente: Recuperabilidad - Crear y probar Respaldos Integridad - Verificar o ayudar a la verificacin en la integridad de datos Seguridad - Definir o implementar controles de acceso a los datos Disponibilidad - Asegurarse del mayor tiempo de encendido Desempeo - Asegurarse del mximo desempeo incluso con las limitaciones Desarrollo y soporte a pruebas - Ayudar a los programadores e ingenieros a utilizar eficientemente la base de datos.

El diseo lgico y fsico de las bases de datos a pesar de no ser obligaciones de un administrador de bases de datos, es a veces parte del trabajo. Esas funciones por lo general estn asignadas a los analistas de bases de datos o a los diseadores de bases de datos. Independencia de los datos. La independencia de datos implica un divorcio entre programas y datos; es decir, se pueden hacer cambios a la informacin que contiene la base de datos o tener acceso a la base de datos de diferente manera, sin hace cambios en las aplicaciones o en los programas. Hay dos niveles de independencia. Independencia fsica de datos: Es la capacidad para modificar el esquema fsico sin provocar que los programas de aplicacin tengan que rescribirse. Independencia lgica de datos: Es la capacidad para modificar el esquema lgico sin causar que los programas de aplicacin tengan que rescribirse. Las modificaciones en el nivel lgico son necesarias siempre que la estructura lgica de la base de da tos se altere.

Acceso concurrente: Los sistemas de ficheros de acceso concurrente son aquellos sistemas de ficheros que permiten el acceso simultneo al sistema de ficheros a ms de una mquina al mismo tiempo. Administracin de datos: La gestin de datos se compone de todas las disciplinas relacionadas con gestionar los datos como un recurso valioso. La definicin oficial suministrada por DAMA es que "La Gestin de Recursos de Datos es el desarrollo y ejecucin de arquitecturas, polticas, prcticas y procedimientos que gestionan apropiadamente las necesidades del ciclo de vida completo de los datos de una empresa". Aplicacin en lnea: Son aquellas aplicaciones que los usuarios pueden utilizar accediendo a un servidor web a travs de Internet o de una intranet mediante un navegador. En otras palabras, es una aplicacin software que se codifica en un lenguaje soportado por los navegadores web en la que se confa la ejecucin al navegador. Las aplicaciones web son populares debido a lo prctico del navegador web como cliente ligero, a la independencia del sistema operativo, as como a la facilidad para actualizar y mantener aplicaciones web sin distribuir e instalar software a miles de usuarios potenciales. Es importante mencionar que una pgina Web puede contener elementos que permiten una comunicacin activa entre el usuario y la informacin. Esto permite que el usuario acceda a los datos de modo interactivo, gracias a que la pgina responder a cada una de sus acciones, como por ejemplo rellenar y enviar formularios, participar en juegos diversos y acceder a gestores de base de datos de todo tipo. Archivo almacenado: Es el conjunto (con nombre) de todas las ocurrencias de un tipo de registro almacenado. Un campo almacenado es la unidad ms pequea de informacin almacenada que recibe un nombre. La base de datos incluir, en la mayor parte de los casos, muchas ocurrencias (o casos) de cada uno de los diversos tipos de campo almacenado. Un registro almacenado es un conjunto de campos almacenados relacionados entre s, que cuenta con su propio nombre. Una vez ms se hace la distincin entre tipo y ocurrencia. Una ocurrencia de un registro almacenado est formada por un grupo de ocurrencias de campos almacenados entre s (una ocurrencia para cada tipo distinto de parte). Compartir Datos: En los sistemas de ficheros, los ficheros pertenecen a las personas o a los departamentos que los utilizan. Pero en los sistemas de bases de datos, la base de datos pertenece a la empresa y puede ser compartida por todos los usuarios que estn autorizados. Integridad de datos:

El trmino integridad de datos se refiere a la correccin y completitud de los datos en una base de datos. Cuando los contenidos se modifican con sentencias INSERT, DELETE o UPDATE, la integridad de los datos almacenados puede perderse de muchas maneras diferentes. Pueden aadirse datos no vlidos a la base de datos, tales como un pedido que especifica un producto no existente. Tipos de restricciones de integridad 1. Datos Requeridos: establece que una columna tenga un valor no NULL. Se define efectuando la declaracin de una columna es NOT NULL cuando la tablaque contiene las columnas se crea por primera vez, como parte de la sentencia CREATE TABLE. 2. Chequeo de Validez: cuando se crea una tabla cada columna tiene un tipo de datos y el DBMS asegura que solamente los datos del tipo especificado sean ingresados en la tabla. 3. Integridad de entidad: establece que la clave primaria de una tabla debe tener un valor nico para cada fila de la tabla; si no, la base de datos perder su integridad. Se especifica en la sentencia CREATE TABLE. El DBMS comprueba automticamente la unicidad del valor de la clave primaria con cada sentencia INSERT Y UPDATE. Un intento de insertar o actualizar una fila con un valor de la clave primaria ya existente fallar. 4. Integridad referencial: asegura la integridad entre las llaves forneas y primarias (relaciones padre/hijo). Existen cuatro actualizaciones de la base de datos que pueden corromper: La insercin de una fila hijo se produce cuando no coincide la llave fornea con la llave primaria del padre. La actualizacin en la llave fornea de la fila hijo, donde se produce una actualizacin en la clave ajena de la fila hijo con una sentencia UPDATE y la misma no coincide con ninguna llave primaria. La supresin de una fila padre, con la que, si una fila padre -que tiene uno o ms hijos- se suprime, las filas hijos quedarn hurfanas. La actualizacin de la llave primaria de una fila padre, donde si en una fila padre, que tiene uno o ms hijos se actualiza su llave primaria, las filas hijos quedarn hurfanas.

La integracin de datos: Implica la combinacin de los datos que residen en diferentes fuentes y proporciona a los usuarios una vista unificada de los datos. Este proceso llega a ser significativo en una variedad de situaciones, que incluyen tanto comercial (cuando dos empresas similares deben fusionar sus bases de datos) y cientficos (la

combinacin de resultados de la investigacin de diferentes bioinformtica repositorios, por ejemplo) dominios. La redundancia: En bases de datos o en ficheros, la redundancia hace referencia al almacenamiento de los mismos datos varias veces en diferentes lugares. La redundancia de datos puede provocar problemas como: Incremento del trabajo: como un mismo dato est almacenado en dos o ms lugares, esto hace que cuando se graben o actualicen los datos, deban hacerse en todos los lugares a la vez. Desperdicio de espacio de almacenamiento: ya que los mismos datos estn almacenados en varios lugares distintos, ocupando as ms bytes del medio de almacenamiento. Este problema es ms evidente en grandes bases de datos. Inconsistencia de datos: esto sucede cuando los datos redundantes no son iguales entre s. Esto puede suceder, por ejemplo, cuando se actualiza el dato en un lugar, pero el dato duplicado en otro lugar no es actualizado.

Si una base de datos est bien diseada, no debera haber redundancia de datos (exceptuando la redundancia de datos controlada, que se emplea para mejorar el rendimiento en las consultas a las bases de datos). Interfaz controlado por mens: Esta interfaz proporciona mens para seleccionar opciones del programa, as el usuario no tiene que memorizar comandos. En lugar de esto los comandos son seleccionados del men presentado en pantalla, como cuando se escoge algn plato en un restaurante. Entidad: Representa una cosa u "objeto" del mundo real con existencia independiente, es decir, se diferencia unvocamente de otro objeto o cosa, incluso siendo del mismo tipo, o una misma entidad. Una entidad est descrita y se representa por sus caractersticas o atributos. Es cualquier objeto acerca del cual se quiere registrar informacin. Vnculos: Describe cierta dependencia entre entidades o permite la asociacin de las mismas. Base de datos relacional. Una base de datos relacional es un conjunto de una o ms tablas estructuradas en registros (lneas) y campos (columnas), que se vinculan entre s por un campo en comn, en ambos casos posee las mismas caractersticas como por ejemplo el nombre de campo, tipo y longitud; a este campo generalmente se le denomina ID, identificador o clave. A esta manera de construir bases de datos se le denomina modelo relacional.

Las bases de datos relacionales pasan por un proceso al que se le conoce como normalizacin de una base de datos, el cual es entendido como el proceso necesario para que una base de datos sea utilizada de manera ptima. Entre las ventajas de este modelo estn: Garantiza herramientas para evitar la duplicidad de registros, a travs de campos claves o llaves. Garantiza la integridad referencial: As al eliminar un registro elimina todos los registros relacionados dependientes. Favorece la normalizacin por ser ms comprensible y aplicable.

Tipos de base de datos Segn la variabilidad de los datos almacenados. Bases de datos estticas Son bases de datos de slo lectura, utilizadas primordialmente para almacenar datos histricos que posteriormente se pueden utilizar para estudiar el comportamiento de un conjunto de datos a travs del tiempo, realizar proyecciones, tomar decisiones y realizar anlisis de datos para inteligencia empresarial. Bases de datos dinmicas stas son bases de datos donde la informacin almacenada se modifica con el tiempo, permitiendo operaciones como actualizacin, borrado y adicin de datos, adems de las operaciones fundamentales de consulta. Un ejemplo de esto puede ser la base de datos utilizada en un sistema de informacin de un supermercado, una farmacia, un videoclub o una empresa. Modelos de bases de datos Bases de datos jerrquicas En este modelo los datos se organizan en una forma similar a un rbol (visto al revs), en donde un nodo padre de informacin puede tener varios hijos. El nodo que no tiene padres es llamado raz, y a los nodos que no tienen hijos se los conoce como hojas. Las bases de datos jerrquicas son especialmente tiles en el caso de aplicaciones que manejan un gran volumen de informacin y datos muy compartidos permitiendo crear estructuras estables y de gran rendimiento. Una de las principales limitaciones de este modelo es su incapacidad de representar eficientemente la redundancia de datos. Base de datos de red

ste es un modelo ligeramente distinto del jerrquico; su diferencia fundamental es la modificacin del concepto de nodo: se permite que un mismo nodo tenga varios padres (posibilidad no permitida en el modelo jerrquico). Fue una gran mejora con respecto al modelo jerrquico, ya que ofreca una solucin eficiente al problema de redundancia de datos; pero, aun as, la dificultad que significa administrar la informacin en una base de datos de red ha significado que sea un modelo utilizado en su mayora por programadores ms que por usuarios finales. Arquitectura de los sistemas de bases de datos Arquitectura ANSI (3 capas) La arquitectura de sistemas de bases de datos de tres esquemas fue aprobado por la ANSISPARC (American National Standard Institute - Standards Planning and Requirements Committee) en 1975 como ayuda para conseguir la separacin entre los programas de aplicacin y los datos, el manejo de mltiples vistas por parte de los usuarios y el uso de un catlogo para almacenar el esquema de la base de datos. Nivel interno: Tiene un esquema interno que describe la estructura fsica de almacenamiento de base de datos. Emplea un modelo fsico de datos y los nicos datos que existen estn realmente en este nivel. Nivel conceptual: tiene esquema conceptual. Describe la estructura de toda la base de datos para una comunidad de usuarios. Oculta los detalles fsicos de almacenamiento y trabaja con elementos lgicos como entidades, atributos y relaciones. Nivel externo o de vistas: tiene varios esquemas externos o vistas de usuario. Cada esquema describe la visin que tiene de la base de datos a un grupo de usuarios, ocultando el resto.

El objetivo de la arquitectura de tres niveles es el de separar los programas de aplicacin de la base de datos fsica. La mayora de los SGBD no distinguen del todo los tres niveles. Algunos incluyen detalles del nivel fsico en el esquema conceptual. En casi todos los SGBD que se manejan vistas de usuario, los esquemas externos se especifican con el mismo modelo de datos que describe la informacin a nivel conceptual, aunque en algunos se pueden utilizar diferentes modelos de datos en los niveles conceptual y externo. Hay que destacar que los tres esquemas no son ms que descripciones de los mismos datos pero con distintos niveles de abstraccin. Los nicos datos que existen realmente estn a nivel fsico, almacenados en un dispositivo como puede ser un disco. En un SGBD basado en la arquitectura de tres niveles, cada grupo de usuarios hace referencia exclusivamente a su propio esquema externo. Por lo tanto, el SGBD debe transformar cualquier peticin expresada en trminos de un esquema externo a una peticin expresada en trminos del esquema conceptual, y luego, a una peticin en el esquema interno, que se procesar sobre la base de datos almacenada. Si la peticin es de una obtencin (consulta) de datos, ser preciso modificar el formato de la informacin extrada de la base de datos almacenada, para que

coincida con la vista externa del usuario. El proceso de transformar peticiones y resultados de un nivel a otro se denomina correspondencia o transformacin. Arquitectura Cliente-Servidor. Con respecto a la definicin de arquitectura cliente/servidor se encuentran las siguientes definiciones: Cualquier combinacin de sistemas que pueden colaborar entre s para dar a los usuarios toda la informacin que ellos necesiten sin que tengan que saber donde est ubicada. Es una arquitectura de procesamientos cooperativo donde uno de los componentes pide servicios a otro. Es un procesamiento de datos de ndole colaborativo entre dos o ms computadoras conectadas a una red. El trmino cliente/servidor es originalmente aplicado a la arquitectura de software que describe el procesamiento entre dos o ms programas: una aplicacin y un servicio soportante. IBM define al modelo Cliente/Servidor. "Es la tecnologa que proporciona al usuario final el acceso transparente a las aplicaciones, datos, servicios de cmputo o cualquier otro recurso del grupo de trabajo y/o, a travs de la organizacin, en mltiples plataformas. El modelo soporta un medio ambiente distribuido en el cual los requerimientos de servicio hechos por estaciones de trabajo inteligentes o "clientes'', resultan en un trabajo realizado por otros computadores llamados servidores". "Es un modelo para construir sistemas de informacin, que se sustenta en la idea de repartir el tratamiento de la informacin y los datos por todo el sistema informtico, permitiendo mejorar el rendimiento del sistema global de informacin"

En la arquitectura C/S el remitente de una solicitud es conocido como cliente. Sus caractersticas son: Es quien inicia solicitudes o peticiones, tienen por tanto un papel activo en la comunicacin (dispositivo maestro o amo). Espera y recibe las respuestas del servidor. Por lo general, puede conectarse a varios servidores a la vez. Normalmente interacta directamente con los usuarios finales mediante una interfaz grfica de usuario. Al contratar un servicio de redes, se debe tener en cuenta la velocidad de conexin que le otorga al cliente y el tipo de cable que utiliza , por ejemplo : cable de cobre ronda entre 1 ms y 50 ms.

Al receptor de la solicitud enviada por el cliente se conoce como servidor. Sus caractersticas son: Al iniciarse esperan a que lleguen las solicitudes de los clientes, desempean entonces un papel pasivo en la comunicacin (dispositivo esclavo). Tras la recepcin de una solicitud, la procesan y luego envan la respuesta al cliente.

Por lo general, aceptan conexiones desde un gran nmero de clientes (en ciertos casos el nmero mximo de peticiones puede estar limitado). No es frecuente que interacten directamente con los usuarios finales.

Ventajas. Centralizacin del control: los accesos, recursos y la integridad de los datos son controlados por el servidor de forma que un programa cliente defectuoso o no autorizado no pueda daar el sistema. Esta centralizacin tambin facilita la tarea de poner al da datos u otros recursos (mejor que en las redes P2P). Escalabilidad: se puede aumentar la capacidad de clientes y servidores por separado. Cualquier elemento puede ser aumentado (o mejorado) en cualquier momento, o se pueden aadir nuevos nodos a la red (clientes y/o servidores). Fcil mantenimiento: al estar distribuidas las funciones y responsabilidades entre varios ordenadores independientes, es posible reemplazar, reparar, actualizar, o incluso trasladar un servidor, mientras que sus clientes no se vern afectados por ese cambio (o se afectarn mnimamente). Esta independencia de los cambios tambin se conoce como encapsulacin.

Desventajas. La congestin del trfico ha sido siempre un problema en el paradigma de C/S. Cuando una gran cantidad de clientes envan peticiones simultaneas al mismo servidor, puede ser que cause muchos problemas para ste (a mayor nmero de clientes, ms problemas para el servidor). Al contrario, en las redes P2P como cada nodo en la red hace tambin de servidor, cuanto ms nodos hay, mejor es el ancho de banda que se tiene. El software y el hardware de un servidor son generalmente muy determinantes. Un hardware regular de un ordenador personal puede no poder servir a cierta cantidad de clientes. Normalmente se necesita software y hardware especfico, sobre todo en el lado del servidor, para satisfacer el trabajo. Por supuesto, esto aumentar el coste.

La mayora de los servicios de Internet son tipo de cliente-servidor. La accin de visitar un sitio web requiere una arquitectura cliente-servidor, ya que el servidor web sirve las pginas web al navegador (al cliente).

Procesamiento distribuido. Procesamiento distribuido se define como, la forma en que es posible conectar distintas maquinas, PCs por ejemplo, en cierto tipo de red de comunicaciones, generalmente una LAN o una red de rea amplia o una red como Internet. Logrando as, que una sola tarea de procesamiento de datos pueda ser procesada o ejecutada entre varias maquinas de la red, es decir que un solo proceso se pueda realizar entre varias maquinas diferentes y conectadas a una red. Un error comn es confundir procesamiento distribuido y paralelo, el trmino procesamiento paralelo, bsicamente es el mismo, con excepcin que las maquinas distintas tienden a estar fsicamente muy cerca en un sistema paralelo, lo que no es necesario en un sistema distribuido. Por ejemplo una aplicacin distribuida podra ser una calculadora que usa una suma hecha en Java en un equipo y la divisin implementada en C en otro equipo distinto. De hecho, el procesamiento distribuido permite una mejor utilizacin de equipos y mejora el balanceo del procesamiento dentro de una aplicacin, este ltimo tiene una gran importancia ya que en algunas aplicaciones simplemente no hay una maquina que sea capaz de realizar todo el procesamiento.

Base de datos distribuidas: Definicin El procesamiento distribuido, comparte el procesamiento lgico de la BD entre dos o ms sitios fsicamente independientes conectados mediante una red. Una base de datos distribuida guarda una BD lgicamente relacionada en dos o ms sitios fsicamente independientes. La BD se compone de varias partes conocidas como fragmentos de la Base de Datos. Caractersticas Los datos se ubican en mltiples mquinas (sitio o nodos)

Una red de alta velocidad interconecta las mquinas Los datos son compartidos por usuarios y mltiples mquinas. Transacciones de dos tipos tipos: Locales: solo acceden a datos de su propio nodo Globales: acceden a datos de otras localidades/nodos Procesamiento distribuido:

BD Distribuida:

Ventajas: Los datos se localizan cerca del sitio de mayor demanda. Acceso ms rpido a los datos. Procesamiento ms rpido de los datos. Facilitacin de crecimiento. Comunicacin mejorada.

Costos de operacin reducidos. Interface de usuario fcil de usar. Menos peligro de falla en un sitio. Independencia de procesador. Desventajas Complejidad del manejo y control. Seguridad. Falta de estndares, protocolos de comunicacin a nivel de base de datos. Requerimientos de almacenamiento incrementados (menor problema). Mayor dificultad en el manejo del ambiente de datos. Altos costos de entrenamiento.

Un cursor implcito es creado "automticamente"por Oracle al ejecutar una consulta. Es ms sencillo de cdigo, pero sufre ineficiencia (No tenemos acceso). Un cursor explcito es declarado por el programador. Lleva ms cdigo, pero le da ms control.

Vous aimerez peut-être aussi