Vous êtes sur la page 1sur 9

Almacenamiento y Estructura de Archivos

Bases de Datos

Almacenamiento y
estructura de archivos

Introduccin a los medios de


almacenamiento
Discos Magnticos
RAID
Almacenamiento Terciario
Acceso de almacenamiento
Organizacin de ficheros

Bases de Datos

Clasificacin de los dispositivos de


almacenamiento

Almacenamiento y Estructura de Ficheros

JERARQUAS DE MEMORIA

Velocidad de acceso a los datos

Coste por unidad de datos

Fiabilidad

prdida de datos por fallo de alimentacin o crash del sistema

fallo fsico del dispositivo de almacenamiento

Se puede diferenciar el almacenamiento:

almacenamiento voltil

almacenamiento no-voltil

Bases de Datos

Almacenamiento y Estructura de Ficheros

Bases de Datos

Almacenamiento y Estructura de Ficheros

Jerarqua de Almacenamiento

Discos Magnticos
- Sector: {bytes} (32 - 4096)
- Pista: {sectores} (4 -32 s/p) (20 - 1500 p/sd)
- cilindro: {pistas} en distintas superficies
- fichero: {sectores} (dispersos)
Parmetros:

Almacenamiento primario: es el ms
rpido pero es voltil (cach, memoria
principal)
Almacenamiento secundario: Es novoltil, moderadamente rpido; tambin
llamado almacenamiento en linea (memoria
flash, discos magnticos).
Almacenamiento terciario: Es no-voltil,
es lento; tambin llamado almacenamiento
off-line (cinta magntica, almacenamiento
ptico)
Bases de Datos

Almacenamiento y Estructura de Ficheros

Capacidad: 10MB - 10GB


Tasa de Transferencia: 1 - 5 MB/s
Tiempo de Bsqueda (seek time):
2 - 30 ms
Tiempo espera (latency):4 - 8 ms
Velocidades: 60 - 120 rpm (8-17ms)
Tiempo medio entre fallos: 3 - 91 aos
5

Estructura de un Disco Magntico

Bases de Datos

Almacenamiento y Estructura de Ficheros

OPTIMIZACIN DE ACCESO A DISCO


Un bloque es una secuencia continua de sectores de una
sola pista de un plato
Algoritmos de planificacin del brazo del disco:
minimizar el movimiento del brazo (algoritmo del
ascensor)
Organizacin de los ficheros: se optimiza el tiempo de
acceso organizando los bloques de acuerdo a cmo van a
ser accedidos los datos.
Memoria intermedia de escritura no voltil: se escriben
los bloques a una RAM no voltil intermedia; el
controlador escribir a disco cuando no tenga ms
peticiones pendientes.
Disco de registro histrico: es un disco dedicado a
escribir un registro histrico secuencial, eliminando as el
tiempo de bsqueda. (Parecido al RAM no voltil)

Bases de Datos

Almacenamiento y Estructura de Ficheros

Bases de Datos

Almacenamiento y Estructura de Ficheros

Mejoras via paralelismo

Paralelismo: tiras de datos


Tiras a nivel de bit: divide los bits de cada byte
entre varios discos:

Dos objetivos:
Equilibrar la carga para aumentar el
rendimiento en pequeos accesos.
Paralelizar los accesos grandes para disminuir
el tiempo de respuesta.

En un array de 8 discos, cada bit del byte va a un


disco.
En cada acceso se pueden leer datos a 8 veces la tasa
de un nico disco.
Pero peores tiempo de bsqueda que en un nico
disco.

Se mejora la tasa de transferencia


dividiendo los datos en tiras entre varios
discos.

Bases de Datos

Tiras a nivel de bloque: con n discos, el bloque i


de un fichero va en el disco (i mod n) + 1

Almacenamiento y Estructura de Ficheros

Redundant Arrays of Inexpensive Disks


Originalmente, una alternativa ms barata a
los discos grandes y caros.
Hoy en da los RAIDs son utilizados por su
gran ancho de banda y su fiabilidad. De
aqu que la I se intrerprete como
independiente ms que como inexpensive.

Almacenamiento y Estructura de Ficheros

Almacenamiento y Estructura de Ficheros

10

Mejora de la fiabiliadad via


Redundancia

RAID

Bases de Datos

Bases de Datos

11

Un sistema con 100 discos, cada uno con un


TMEF de 100.000 h (aprox. 11 aos) tendr un
TMEF del sistema de 1000 h (aprox. 41 das)
Redundancia: almacena informacin extra que se
puede utilizar para recuperar informacin perdida
en un fallo del disco.
P.Ej.: Mirroring (o shadowing)
duplica cada disco. Los discos lgicos consisten de 2
discos fsicos
cada escritura se realiza en los dos discos
si uno de los 2 discos falla, los datos se encuentran
disponibles en el otro.
Bases de Datos

Almacenamiento y Estructura de Ficheros

12

Niveles de RAID

RAID 0 (No redundante)

Se pueden mejorar las prestaciones introduciendo


paralelismo.
Consideraremos 4 discos de datos y los discos
adicionales para la informacin redundante:
RAID de nivel 0
RAID de nivel 1
RAID de nivel 2
RAID de nivel 3
RAID de nivel 4
RAID de nivel 5
RAID de nivel 6
Bases de Datos

Almacenamiento y Estructura de Ficheros

Tiras a nivel de Bloque


No redundante
En aplicaciones de alta velocidad, donde no sea
crtico la prdidad de datos.

13

RAID 1 (Con espejo)

T2

T3

T4

T5

T6

T7

T8

T9

T 10

T11

T 12

T 13

T 14

T 15

Bases de Datos

Almacenamiento y Estructura de Ficheros

14

Cdigos de Correcin de Errores Tipo


Memoria (Memory Style ECC)

T0

T1

T2

T3

T0

T1

T2

T3

T4

T5

T6

T7

T4

T5

T6

T7

T8

T9

T 10

T11

T8

T9

T9

T10

T 12

T 13

T 14

T 15

T 12

T 13

T 14

T 15

Almacenamiento y Estructura de Ficheros

T1

RAID 2 (Redundante con cdigo Hamming)

Discos en espejo.
Buenas caractersticas en escritura
Populares para aplicaciones de
almacenamiento de ficheros log.

Bases de Datos

T0

15

b0

Bases de Datos

b1

b2

b3

f0(b)

f1(b)

Almacenamiento y Estructura de Ficheros

f2(b)

16

RAID 3 (Bit de paridad intercalado)

RAID 4 (Paridad en bloques)

Se utiliza un nico bit de paridad; no-deteccin


Cuando se escriben los datos, se calcula el bit de
paridad y se escribe.
Notable mejora de prestaciones en grandes
trasferencias.
En un entorno a transacciones, el entorno sufre pues
slo se puede ejecutar una sla E/S a la vez

b0

b1

Bases de Datos

b2

b3

P(b)

Almacenamiento y Estructura de Ficheros

17

Proporciona tasas de lectura de bloques


independientes ms altas que el nivel 3.
Sin embargo, el bloque de paridad es un cuello
de botella para escrituras de bloques
independientes.

bloque 0

bloque 1

bloque 2

bloque 3

bloque 4

bloque 5

bloque 6

bloque 7

P(4-7)

bloque 8

bloque 9

bloque 10

bloque11

P(8-11)

bloque 12

bloque 13

bloque 14

bloque 15

P(12-15)

Bases de Datos

RAID 5 (Paridad distribuida a nivel de bloques)

P(0-3)

Almacenamiento y Estructura de Ficheros

18

Disco ptico

Datos y paridad distribuidos en los discos.


Mejores niveles de transferencia de E/S que el
nivel 4.
Reemplaza en la prctica al nivel 4.

bloque 0

bloque 1

bloque 2

bloque 3

bloque 4

bloque 5

bloque 6

P(4-7)

bloque 7

bloque 8

bloque 9

P(8-11)

bloque11

bloque 10

bloque 12

P(12-15)

bloque 14

bloque 15

bloque 13

Bases de Datos

P(0-3)

Almacenamiento y Estructura de Ficheros

19

Bases de Datos

Almacenamiento y Estructura de Ficheros

20

Disco ptico

Formato de un bloque de un CD-ROM

CD-ROM
Los discos son porttiles
Gran capacidad de almacenamiento (600MB)
Tiempos de bsqueda y latencia grandes;
menores tasas de transferencia de datos que los
discos magnticos.

DVD (de 1.7 hasta 17 GB)


WORM (Write-Once Read-Many)
Discos Regrabables
Bases de Datos

Almacenamiento y Estructura de Ficheros

21

Bases de Datos

Almacenamiento y Estructura de Ficheros

Cinta Magntica

Estructura de Ficheros

Para grandes volmenes da datos (5GB)


El medio ms barato de almacenamiento
Normalmente se utiliza para back-up o para
transferir informacin entre sistemas.
Se utilizan robots de cintas (con varias) para
grandes capacidades (desde terabytes hasta
petabytes)

La base de datos se almacena como una


coleccin de ficheros.
Cada fichero es una secuencia de registros.
Cada registro es una secuencia de campos.

Bases de Datos

Bases de Datos

Almacenamiento y Estructura de Ficheros

23

Almacenamiento y Estructura de Ficheros

22

24

Registros de Longitud Fija

Registros de Longitud fija: Borrado

Aproximacin sencilla
Los registros pueden ocupar dos bloques
Ejemplo

Bases de Datos

Almacenamiento y Estructura de Ficheros

25

Listas libres

Almacenamiento y Estructura de Ficheros

Almacenamiento y Estructura de Ficheros

26

Registros de Longitud Variable

Mejor aprovechamiento del espacio


Cuidado con los punteros clavados

Bases de Datos

Bases de Datos

Surgen de varias maneras en las BD:


Almacenamiento de varios tipos de registros
en un mismo archivo
Tipos de registros que permiten longitudes
variables para uno o para varios de los
campos.
Tipos de registro que permiten campos
repetidos.

27

Bases de Datos

Almacenamiento y Estructura de Ficheros

28

Registros de Longitud Variable: cadenas de bytes

Se mantiene siempre compacto el espacio


libre y el ocupado.
Los punteros son indirectos, nunca fijos

no resulta sencillo volver a utilizar el espacio


no queda espacio para el aumento de tamao de
los registros.
Bases de Datos

Almacenamiento y Estructura de Ficheros

29

RLV: Representacin de Longitud Fija

Almacenamiento y Estructura de Ficheros

Bases de Datos

Almacenamiento y Estructura de Ficheros

30

RLV: Representacin de Longitud Fija (1/2)

Espacio Reservado

Bases de Datos

RLV: Estructura de pginas con ranuras

Punteros

31

Bases de Datos

Almacenamiento y Estructura de Ficheros

32

RLV: Representacin de Longitud Fija (2/2)

Organizacin de los Registros en Archivos

Punteros (Bloque Ancla y de


desbordamiento)

Montculo: en cualquier sitio libre


Secuencial: de acuerdo al orden secuencial
dado por el valor de una clave.
Asociativa (hash): de acuerdo a la funcin
hash de algn atributo.
En agrupaciones: se pueden guardar en el
mismo archivo registros de varias relaciones
diferentes.

Bases de Datos

Almacenamiento y Estructura de Ficheros

33

Actividad:
En una maquina virtual con una distribucion de Linux, configutrar RAID 0, 1, 5
Realizar una tabla en la que se especifique el nivel de RAID, el numero minimo de discos
necesarios para implementar el nivel de RAID y porque

Bases de Datos

Almacenamiento y Estructura de Ficheros

34

Vous aimerez peut-être aussi