Académique Documents
Professionnel Documents
Culture Documents
Evaluacin
Evaluacin Permanente I: 15%
Tareas, prcticas en el laboratorio, exposiciones, intervencin en clases.
Trabajo final
Diseo de un sistema de simulacin y monitoreo de vehculos de transporte interprovincial. Range Partitioning y visualizacin de datos.
Introduccin
Qu factores motivan el crecimiento de la data?
Estructurada, semi-estructurada, no estructurada.
Qu es un petabyte?
Worldwide Production of Original Content, Stored Digitally, in Terabytes. Source: University of California at Berkeley study, 1999.
Discos Duros
Platos Motor RPM Pistas (16000) y Sectores (512 bytes) Cabeza de lectura y escritura Las cabezas se desplazan conjuntamente Cabezas prximas al disco Qu es disco de cabezas fijas? Discos con varios brazos?
Controlador de discos
Interfaz Comprobacin de suma Reasignacin de sectores daados El controlador no administra cabezas, brazos. Interfaz ATA, IDE, SCSI Discos se conectan con cables o Red de rea de Almacenamiento.
Organizacin de archivos
Evitar fragmentacin
Tarea de RAID
Organizacin de archivos
Se organizan en registros acorde a los bloques? Registros de longitud fija. Ej. registros de cuentas de una BD Bancaria
Problemas:
Borrado de registros Traslape de bloques (1 reg. en ms de un bloque)
Problemas
Reutilizar espacio de registros borrados Datos fragmentados Crecimiento de registros
Nmero de elementos. Espacio libre. Array de entradas: Ubicacin y tamao. Cmo se hace el borrado? Cmo se incrementa tamao?
xito: Indireccin
Impositor x cliente
Qu pasa con?
Tipos de informacin.
Nombres tablas, atributos, vistas y definiciones, restricciones de integridad.
Sobre usuarios
Nombres, informacin de cuentas, contraseas, autenticacin
Organizacin de almacenamiento
Si usan archivos del SO Si usan un solo archivo administrado por la BD.
Sobre ndices
Nombre, relacin a la que aplica, atributos, tipos.
ndices
ndice de BD = ndice de libro = Fichas de Biblioteca Evaluacin de ndices
Tipos de acceso Tiempo de acceso Tiempo de insercin Tiempo de borrado Espacio adicional requerido
ndices ordenados
ndices primarios y secundarios
Clave de bsqueda Archivos secuenciales indexados
Sino..
Tarea
12.3. ARCHIVOS DE NDICES DE RBOL B+
ndices secundarios
Son densos con un ptr. a cada registro. Por qu no pueden ser dispersos?
rbol B+
Degradacin de archivos secuenciales rbol equilibrado
<a
valores
se sigue puntero
se sigue
Si no se encuentra,
es
tendramos 20
Y si no hay espacio?
rbol B+. Fusin de nodos por borrado (3/6) Borrado del padre de un nodo
rboles B (1/2)
rboles B (2/2)
Puntero adicional n-1 claves en hojas y m-1 claves en nodos internos. m < n ? Bsqueda es ms eficaz en B?
Ms accesos Menos claves de bsqueda en nodos internos Almacenamiento de espacio.
rboles B (2/2)
Bsqueda es ms eficaz en B?
Ms accesos Menos claves de bsqueda en nodos internos Almacenamiento de espacio.
Transacciones
Transferencia de fondos.
Coleccin de operaciones -> Unidad lgica Una BD debe garantizar
Ejecucin correcta Ejecucin concurrente
Implementacin en BD y lenguajes.
Transacciones: Propiedades
Atomicidad.
Todas o ninguna
Consistencia
Ejecucin aislada
Aislamiento
Ejecucin concurrente
Durabilidad
Permanencia de cambios.
Consistencia
Suma de A + B no sea alterada De quin es la responsabilidad?
Abortada -> Retrocedido Transaccin comprometida no se aborta Transaccin compensadora Abortada: Reiniciar o Cancelar? Escrituras externas observables. Mostrar datos en transacciones largas?
Ejecuciones concurrentes
Ms simple es secuencial que concurrente
Productividad y utilizacin de recursos mejorada.
CPU y E/S en paralelo
Planificaciones
Iniciales: A=1000 y B=2000 Fin: A = 855 y B = 2145
Caractersticas
Incluir todas las instrucciones Conservar el orden
Planificaciones concurrentes
A=1000, B=2000
Secuencialidad
Planificaciones consistentes y no !
No se interpretan tipos de operaciones Slo Leer y Escribir. Dos tipos:
Secuencialidad en cuanto a conflictos Secuencialidad en cuanto a vistas
Conflicto: Operaciones de diferentes transacciones sobre mismo dato y al menos una instruccin es escribir. Ej. Planificacin 3.
960 y 2040
P8 no es equivalente en cuanto a conflictos a P Secuencial <T1,T5> Valores de A y B son los mismos, tanto al ejecutar P8 y PSecuencial <T1,T5> Entonces, sera necesario analizar clculos..
Recuperabilidad (1/2)
Si Tj depende de Ti y Ti falla, hay que abortar ambas. Es necesario poner restricciones Planificaciones recuperables
Sean Ti y Tj, tal que Tj lee lo escrito por Ti, la operacin de comprometer Ti aparece antes que Tj
Recuperabilidad (2/2)
Planificaciones sin cascada
Si
en toda P, Ti precede a Tj
Si G tiene ciclos, P no es secuenciable e cuanto a conflictos. Si no los tiene, P es secuenciable en cuanto a conflictos