Vous êtes sur la page 1sur 27

Universidad de Extremadura Centro Universitario de Mrida Departamento de Sistemas Informticos y Telemticos.

rea de Lenguajes y Sistemas Informticos

Tema 1. Conceptos bsicos sobre el almacenamiento de informacin

Estructuras de Almacenamiento de la Informacin Curso 2010/2011

Situacin del tema


N Temario terico
Presentacin

H.
1

I
II

Conceptos bsicos sobre el almacenamiento de informacin


Organizacin de ficheros indexados

8
10 6 5

III Organizacin de ficheros directos: dispersin IV Organizacin de ficheros secuenciales: tratamiento de grandes ficheros

ndice y programacin
Conceptos bsicos sobre el almacenamiento de inf.
1
2 3 4 5 6

H.
0,5
1,5 2,5 3 0,5

Introduccin
Jerarqua de almacenamiento Dispositivos de almacenamiento. Discos Gestin de E/S. El sistema de ficheros orientado al almacenamiento El sistema de ficheros orientado a tuplas Organizacin de ficheros

Conocimientos previos
Conocer los trminos memoria principal, memoria

secundaria, RAM, discos Tener nociones de las diferencias entre memoria principal y secundaria Conocer estructuras de almacenamiento en memoria principal Entender el concepto de aplicaciones y sus necesidades de informacin

Objetivos
Justificar la necesidad del almacenamiento en memoria

secundaria Revisar las caractersticas de los dispositivos de almacenamiento Presentar el sistema de ficheros como recurso fundamental parar la gestin de informacin Estudiar las funcionalidades del sistema de ficheros en sus distintas capas Sentar las bases para la gestin del almacenamiento en los sistemas de BD Presentar una clasificacin de las organizaciones de ficheros

CONCEPTOS BSICOS SOBRE EL ALMACENAMIENTO DE INF.


1. 2. 3. 4.

Introduccin Jerarqua de almacenamiento Dispositivos de almacenamiento. Discos Gestin de E/S. El sistema de ficheros orientado al almacenamiento
4.1 Introduccin 4.2 El sistema de ficheros bsico 4.3 Objetos y operaciones del SF bsico 4.4 Asignacin de espacio 4.5 Gestin del buffer

5.

El sistema de ficheros orientado a tuplas


5.1 Introduccin 5.2 Las pginas. Organizacin interna 5.3 Administracin del espacio libre en ficheros 5.4 Representacin fsica de los registros

6. Organizacin de ficheros

1. Introduccin (I)
Incremento de la necesidad de informacin

Memorias
decremento del coste
incremento de capacidad

RAM: almacenamiento ms rpido y simple

1. Introduccin (II)
Por qu memoria secundaria?
Ram voltil Capacidad RAM limitada RAM cara

Problemas almacenamiento secundario


Tiempo alto de acceso a los datos

Tiempo de acceso variable segn posicin

Se necesitan tcnicas para organizar la informacin en memoria secundaria que reduzcan estos problemas!!!

2. Jerarqua de almacenamiento
Memoria Principal. Memoria Secundaria.

Medicin del rendimiento o eficacia de esta memoria:


por el tiempo de acceso a la memoria.

Tiempo de latencia: Tiempo que tarda la memoria en localizar el dato pedido. Tiempo de transferencia: Tiempo que tarda la memoria en enviar los datos. Depende del tamao de los datos a enviar y del ratio de transferencia (bytes/segundo). Precio por byte. Costo por acceso: El costo de leer un bloque de datos viene dado por:

por el precio.

costo leer bloque

costo dispositiv o num. accesos por segundo

2. Jerarqua de almacenamiento
Electrnica: Basada en componentes electrnicos como transistores. Direccionable a byte Por ejemplo la memoria principal, que puede ser accedida a cada uno de los bytes directamente por el procesador. Por ejemplo la EMS o los discos RAM que son estructuras de memoria a las que el sistema operativo accede mediante bloques.

Direccionable a bloque

Magntica: Basada en materiales recubiertos por partculas magnticas.

En este tipo de memorias intervienen componentes mecnicos que ralentizan enormemente el acceso a las mismas. Los datos almacenados en estas memorias se graban en una superficie magntica. Si doblamos esta superficie aumentamos la capacidad pero tambin aumentamos la latencia o tiempo de acceso. Existen dos tipos: de lneas y de crculos

2. Jerarqua de almacenamiento

2. Jerarqua de almacenamiento
Cachs: Principio de localidad Eficiencia:
ratio de acierto (hit ratio)

referencia s satisfec has por la cache total referencias a cache

Este hit ratio es crtico para obtener un buen acceso a los datos: Cuanto mayor sea el hit ratio ms nos aproximamos al rendimiento del procesador.

2. Jerarqua de almacenamiento
Tendencias Memoria magntica desaparecer:

El tamao de las electrnicas aumenta Coste se aproxima a las electrnicas Cuanto mas grandes mas lentas Habr que disminuir el tiempo de latencia por ejemplo aumentando el ancho de banda con disk-array

Discos para siempre:

3. Dispositivos de almacenamiento: discos


Un disco duro es un dispositivo fsico de tres dimensiones
Brazo Cabeza L/E

Cilindro
Cabeza l

Desplazamiento

Rotacin

Pista Sector

3. Dispositivos de almacenamiento: discos


Disco conjunto de cilindros capacidad = n de cilindros * capacidad de un cilindro Cilindro conjunto de pistas capacidad = n pistas por cilindro * capacidad de la pista Pista conjunto de sectores capacidad = n sectores por pista * n bytes por sector Sector conjunto de bytes capacidad = n bytes por sector

Organizacin por sectores Organizacin por bloques

3. Dispositivos de almacenamiento: discos

Organizacin por sectores


Sector es la porcin ms pequea referenciable de un disco. Todos pueden almacenar la misma cantidad de informacin. Si son adyacentes fsicamente, mientras se procesa el sector que se acaba de leer se pierde el siguiente sector slo podra leer un sector por revolucin del disco. Sectores lgicamente adyacentes intercalados. Factor de intercalacin 5 por ejemplo. Archivo = serie de cmulos de sectores. Cmulo = nmero fijo de sectores contiguos (no fsicamente, por factor de intercalacin). Determinada por el administrador de archivos del S.O.

3. Dispositivos de almacenamiento: discos

Organizacin por sectores


cmo se organiza? Los sectores lgicos se unen a los cmulos a los que pertenecen por la FAT. FAT: lista de cmulos ordenada por orden lgico de sectores. Extensiones. Normalmente un cmulo tiene 3 sectores de 512 bytes, pero puede tener entre 1 y 65.535 sectores. Si hay espacio en disco se coloca un archivo en cmulos consecutivos (extensin). Esto implica menos movimientos del brazo del disco, si no hay espacio se divide el archivo en extensiones lo que implica ms desplazamientos. Fragmentacin, si tenemos sectores de 512 y registros de 300

3. Dispositivos de almacenamiento: discos


Organizacin por bloques Las pistas pueden dividirse en sectores. El tamao del bloque lo determina el usuario (programador) Factor de bloque = nmero entero de registros en un bloque

3. Dispositivos de almacenamiento: discos


Organizacin por bloques. Ejemplo: Tengo 20 registros de 200 bytes para un bloque y cada

bloque emplea 100 bytes de control. cuntos bytes ocupa cada bloque? 20 * 200 + 100 4100 bytes ocupa cada bloque cuntos bloques caben en una pista?. Supongamos que 20.000 bytes caben en una pista 20.000 / 4.100 = 48 4 5 bloques ?? Siempre redondeo hacia abajo un bloque NO se reparte en dos pistas. cuntos registros caben en una pista? 4 bloques * 20 registros por bloque = 80 existe fragmentacin? S, las pistas tienen tamao fijo y siempre debe haber un nmero entero de bloques.

3. Dispositivos de almacenamiento: discos


Medidas en un disco (valores 2009): Tiempo de desplazamiento (Seek time), es muy costoso por tratarse de un dispositivo mecnico (Entre 0,2 y 9 ms): f(n) = m * n + s m = velocidad de atravesar las pistas n = nmero de cilindros por atravesar s = tiempo inicial de arranque
Tiempo de seleccin de cabeza, por tratarse de un

dispositivo electrnico es muy rpido, por lo cual no se suele tener en cuenta.

3. Dispositivos de almacenamiento: discos


Medidas en un disco (valores 2009): Tiempo de latencia rotacional, tiempo que tarda en posicionarse un sector bajo el cabezal, suponiendo que ya se haya realizado el desplazamiento de los cabezales sobre la pista buscada. El tiempo de latencia rotacional, en media, equivale al tiempo que tarda el disco en realizar un giro de 180 (0,13 ms).
Tiempo de transferencia. tiempo que se tarda en leer los

datos del disco. Se mide en Mb/s o Gb/s (Entre 0,1 y 6 Gb/s).


(n bytes a transferir / n bytes por pista) * tiempo de rotacin

3. Dispositivos de almacenamiento: discos


Medidas en un disco (valores en 2004):

3. Dispositivos de almacenamiento: discos


Especificaciones

Modelo Interfaz Velocidad de giro Cach Capacidad Nmero de platos Tiempo de acceso (por fabricante)

WD200JD Serial ATA 7.200 RPM 8 mb 200 Gb 3 8.9 ms

3. Dispositivos de almacenamiento: discos


Ejercicio:
Supongamos que tenemos un disco duro de 10 ms desplazamiento., 5 ms de acceso y 0.1 ms de transferencia, y queremos acceder a 1000 sectores de 1K de dos formas:
secuencial: T1000sect= 10 ms (desplaz.) + 5 ms (acc.) + (0.1 ms x 1000 (1000 sect.)) = 10 + 5 + 100 = 115 ms aleatorio: T1000sect=[10ms (desplaz)+ 5ms (acc.)+ 0.1ms (1 sector)]x1000 sectores = (10 + 5 + 0.1) x 1000 = 15100 ms = 15.1 seg (para cada sector aleatorio se hace un desplazamiento)

De aqu se concluye que el modelo de acceso es crtico. Definiremos BLOQUE como unidad de E/S.

3. Dispositivos de almacenamiento: discos


Ejercicio:
Supongamos una unidad de disco con 4 superficies (2 platos). 3600 rpm Desplazamiento promedio = 81,2 612 pistas por superficie 16 sectores por pista 512 bytes por sector La unidad utiliza tamao de cmulo de 16 sectores por cmulo. 8 Kb por cmulo. 1 extensin de cmulo = 1 cmulo por pista. El tamao asignado para archivar archivos es en unidades de pista.(cmulo de 16 sectores y una pista=16 sectores) Factor de intercalacin es de 5.

Tiempo de lectura de un archivo de 128 Kb que contiene registros del tamao de un sector Cuntas pistas ocupa? Cunto tardaremos en leerlo completo secuencial y aleatoriamente?

3. Dispositivos de almacenamiento: discos


Solucin secuencial
1 revolucin = 16,7 msg. 1 pista se lee en 5 revoluciones 16,7 x 5 = 83,5 ms para transferir una pista. Desplazamiento promedio = 81,2 msg. Retraso por rotacin = 8,3 msg. Tiempo de transferencia de pista = 83,5 ms. Tiempo en transferir el fichero = 16*(81,2+8,3+83,5)=2,8 sg.

3. Dispositivos de almacenamiento: discos


Solucin aleatoria.

Vous aimerez peut-être aussi