Académique Documents
Professionnel Documents
Culture Documents
Sistemas de archivos.
Particiones.
Clusters y espacio en disco.
Fragmentacin de disco
Sistemas RAID
Sistema de archivos
Sistema de archivos
Sistema de archivos
Los usuarios deben poder crear, modificar y borrar
archivos.
Se deben poder compartir los archivos de una manera
cuidadosamente controlada
El mecanismo encargado de compartir los archivos debe
proporcionar varios tipos de acceso controlado:
Ej.: Acceso de Lectura, Acceso de Escritura, Acceso de
Ejecucin, varias combinaciones de estos, etc.
Sistema de archivos
Sistema de archivos
Un Archivo es un conjunto de registros
relacionados
El Sistema de Archivos es un componente
importante de un S. O. y suele contener:
Mtodos de acceso relacionados con la manera de
acceder a los datos almacenados en archivos.
Administracin de archivos referida a la provisin de
mecanismos para que los archivos sean
almacenados, referenciados, compartidos y
asegurados.
Administracin del almacenamiento auxiliar para la
asignacin de espacio a los archivos en los
dispositivos de almacenamiento secundario.
Integridad del archivo para garantizar la integridad
de la informacin del archivo.
Sistema de archivos
Sistema de archivos
LINUX
EXT2
EXT3
SWAP
FAT16 FAT32
FAT16: este sistema de archivos proporciona un mximo de 2 GB para cada
espacio asignado o letra de unidad. Por ejemplo, si utiliza el sistema de
archivos FAT16 y tiene un disco duro de 6 GB, puede tener tres letras de
unidad (C, D y E), cada una con 2 GB de espacio asignado. Para obtener
informacin adicional acerca del sistema de archivos FAT16, haga clic en el
siguiente nmero de artculo para ver el artculo en Microsoft Knowledge
Base:118335 Tamao mximo de particin con el sistema de archivos FAT16
FAT32: este sistema de archivos admite unidades de hasta 2 terabytes de
tamao y almacena los archivos en secciones ms pequeas del disco duro
que el sistema de archivos FAT16. Esto permite disponer de ms espacio
libre en el disco duro. El sistema de archivos FAT32 no admite unidades con
un tamao inferior a 512 MB. Para obtener informacin adicional acerca del
sistema de archivos FAT32, haga clic en el nmero de artculo siguiente para
ver el artculo en Microsoft Knowledge Base:154997 Descripcin del sistema
de archivos FAT32
ext2: Hasta hace poco era el sistema estndar de Linux. Tiene una
fragmentacin bajsima, aunque es un poco lento manejando
archivos de gran tamao.
ext3: Es la versin mejorada de ext2, con previsin de prdida de
datos por fallos del disco o apagones. En contraprestacin, es
totalmente imposible recuperar datos borrados. Es compatible con el
sistema de archivos ext2. Actualmente es el ms difundido dentro de
la comunidad GNU/Linux y considerado el estndar de facto.
ReiserFS: Es el sistema de archivos de ltima generacin para
Linux. Organiza los archivos de tal modo que se agilizan mucho las
operaciones con stos. El problema de ser tan actual es que
muchas herramientas (por ejemplo, para recuperar datos) no lo
soportan.
swap: Es el sistema de archivos para la particin de intercambio de
Linux. Todos los sistemas Linux necesitan una particin de este tipo
para cargar los programas y no saturar la memoria RAM cuando se
excede su capacidad. En Windows, esto se hace con
el archivo pagefile.sys en la misma particin de trabajo
Tipos de particiones
Existen 3 tipos diferentes de particiones:
Particin primaria.
Particin extendida.
Particin lgica.
Tipos de particiones
Particin primaria: Son las divisiones crudas o primarias
del disco, solo puede haber 4 de stas o 3 primarias y una
extendida. Depende de una tabla de particiones. Un disco
fsico completamente formateado consiste, en realidad, de
una particin primaria que ocupa todo el espacio del disco
y posee un sistema de archivos. A este tipo de particiones,
prcticamente cualquier sistema operativo puede
detectarlas y asignarles una unidad, siempre y cuando el
sistema operativo reconozca su formato (sistema de
archivos).
Tipos de particiones
Particin extendida: Tambin conocida como
particin secundaria es otro tipo de particin que
acta como una particin primaria; sirve para
contener infinidad de unidades lgicas en su
interior. Fue ideada para romper la limitacin de 4
particiones primarias en un solo disco fsico. Solo
puede existir una particin de este tipo por disco, y
solo sirve para contener particiones lgicas. Por lo
tanto, es el nico tipo de particin que no soporta
un sistema de archivos directamente.
Tipos de particiones
Particin lgica: Ocupa una porcin de la particin
extendida o la totalidad de la misma, la cual se ha
formateado con un tipo especfico de sistema de
archivos (FAT32, NTFS, ext2,...) y se le ha asignado
una unidad, as el sistema operativo reconoce las
particiones lgicas o su sistema de archivos. Puede
haber un mximo de 23 particiones lgicas en una
particin extendida. Linux impone un mximo de 15,
incluyendo las 4 primarias, en discos SCSI y en
discos IDE 8963.
Como crear particiones
Clster
Un clster (o unidad de
asignacin segn la terminologa
de Microsoft) es un conjunto
contiguo de sectores que
componen la unidad ms pequea
de almacenamiento de un disco.
Los archivos se almacenan en uno
o varios clsteres, dependiendo de
su tamao de unidad de
asignacin. Sin embargo, si el
archivo es ms pequeo que un
clster, ste lo ocupa completo.
Estructura:
(A) pista
(B) sector geomtrico
(C) sector de disco
(D) clster.
Clster
Tamao de unidad de asignacin
El tamao de la unidad de asignacin es la cantidad de fragmentos en que
se divide un disco duro cuando se le da formato. Imaginemos un disco duro
como un libro, y las unidades de asignacin son las pginas. Por muy
grande que sea un libro, la cantidad de pginas que puede tener es finita,
aunque las pginas pueden ser ms finas o ms gruesas para abarcar
prrafos de informacin (los puede utilizar varias unidades de asignacin,
pero si el archivo o el fragmento restante es menor que la unidad de
asignacin se desperdicia el espacio sobrante. Por ejemplo, si la unidad es
de 4096 y el archivo es de 512, la prdida es de 3584.
El tamao de unidad de asignacin de los clsteres as como el espacio de
almacenamiento perdido debido a los archivos que ocupan menos que el
tamao del clster depende del sistema de archivos que emplee el disco.
Volume size
Windows NT 3.51
Windows NT 4.0
7 MB8 MB
8 MB32 MB
32 MB64 MB
64 MB128 MB
128 MB256 MB
256 MB512 MB
512 MB1 GB
1 GB2 GB
2 GB4 GB
4 GB8 GB
8 GB16 GB
> 16 GB
Not supported
512 bytes
1 KB
2 KB
4 KB
8 KB
16 KB
32 KB
64 KB
Not supported
Not supported
Not supported
Not supported
512 bytes
1 KB
2 KB
4 KB
8 KB
16 KB
32 KB
64 KB
128 KB*
256 KB*
Not supported
Windows 2000,
Windows XP,
Windows Server
2003, Windows
Vista, and
Windows Server
2008
Not supported
512 bytes
1 KB
2 KB
4 KB
8 KB
16 KB
32 KB
64 KB
Not supported
Not supported
Not supported
Volume size
7 MB16MB
16 MB32 MB
32 MB64 MB
64 MB128 MB
128 MB256 MB
256 MB8GB
8GB16GB
16GB32GB
32GB2TB
> 2TB
Windows 2000,
Windows XP,
Windows Server
Windows NT 3.51 Windows NT 4.0 2003, Windows
Vista, and
Windows Server
2008
Not supported
Not supported
Not supported
512 bytes
512 bytes
Not supported
512 bytes
512 bytes
512 bytes
1 KB
1 KB
1 KB
2 KB
2 KB
2 KB
4 KB
4 KB
4 KB
8 KB
8 KB
8 KB
16 KB
16 KB
16 KB
32 KB
Not supported
Not supported
Not supported
Not supported
Not supported
Volume size
Windows NT 3.51
Windows NT 4.0
7 MB512 MB
512 MB1 GB
1 GB2 GB
2 GB2 TB
2 TB16 TB
16TB32 TB
32TB64 TB
64TB128 TB
128TB256 TB
> 256 TB
512 bytes
1 KB
2 KB
4 KB
Not Supported*
Not Supported*
Not Supported*
Not Supported*
Not Supported*
Not Supported
4 KB
4 KB
4 KB
4 KB
Not Supported*
Not Supported*
Not Supported*
Not Supported*
Not Supported*
Not Supported
Windows 2000,
Windows XP,
Windows Server
2003, Windows
Vista, and
Windows Server
2008
4 KB
4 KB
4 KB
4 KB
4 KB
8 KB
16 KB
32 KB
64 KB
Not Supported
Volume size
7 MB256 MB
4 KB
256 MB32 GB
32 KB
32 GB256 TB
128 KB
> 256 TB
Not supported
Fuente: http://support.microsoft.com/kb/140365/en-us
Clster Ejercicios 1
Supongamos que tenemos un archivo de texto con un nmero de telfono escrito (9
dgitos)
Supongamos asimismo que disponemos de un disco duro de 2 GB (2048 MB)
FAT16 => tamao cluster 64 Kb = 65535 Bytes => desperdicia 65527 Bytes
FAT32 => tamao cluster 4 Kb = 4096 Bytes => desperdicia 4092 Bytes
NTFS => tamao cluster 4 Kb = 4096 Bytes => desperdicia 4092 Bytes
Realizar el mismo cculo para un disco duro de 30 GB.
Realizar el mismo clculo para un archivo de 1GB (1024 Mb)
Clster Ejercicios 2
Supongamos que hemos creado una aplicacin de agenda telefnica, que guarda
cada nmero de telfono en un archivo de texto con un nmero de telfono escrito
(9 dgitos), un espacio y el Nombre y primer Apellido del Contacto (20 caracteres).
Supongamos asimismo que disponemos de un Disco Duro de 30 GB.
Fragmentacin interna
Los discos rgidos tienen un tamao mnimo de bloque, este es llamado
cluster. Este tamao, vara segn el sistema de archivos, y el tamao
total de la particin.
Por eso se sugiere no disponer de un gran tamao de particin en los
discos nuevos donde la capacidad es muy importante. No quisiera entrar
en detalles muy tcnicos respecto a los tipos de sistemas de archivos,
solo explicar que es la fragmentacin.
Por ejemplo si nuestro cluster es de 16KB (16.384 bytes), por ms que
un archivo ocupe menos, en nuestro disco ocupara 16k. Esto sugiere una
prdida de ese espacio que dice utilizar pero no utiliza.
Por eso, en nuestro ejemplo, un archivo de 3KB ocupara en nuestro disco
lo mismo que uno de 10KB, o sea 16 KB. Esa prdida de espacio se
denomina fragmentacin interna, y no se corrige con el desfragmentador.
Sino achicando el tamao de la particin.
Fragmentacin interna
Consejos de uso:
Conviene no configurar particiones muy grandes
cuando se trabaja con Windows, ya que al reducir la
particin, se reduce el tamao del cluster; por lo que
la fragmentacin interna disminuye.
Fragmentacin Externa
El desfragmentador de archivos es una aplicacin que acomoda los segmentos de
los archivos en forma mas eficiente. Por qu podran estar de una manera
ineficiente? pues veamos, el disco esta compuesto por varios sectores, y los
archivos se guardan en esos sectores. Cuando eliminamos un archivo, esos
sectores se vacan; dejando un hueco de espacio en donde se encontraba el
archivo; entonces cuando guardamos otro archivo (ms chico o ms grande), ese
archivo, en caso que sea ms grande, queda un trozo en ese hueco y otro en
donde haya espacio, de esta forma cada archivo se va fragmentando cada vez
mas.
Vemoslo con un pobre ejemplo grfico
En esta primera imagen, vemos que el archivo1 y 2 no se encuentran
fragmentados (es una situacin ideal)
Fragmentacin Externa
Pero qu pasa cuando el archivo1 es borrado? Queda un hueco donde
antes estuvo el archivo1:
Fragmentacin Externa
Y si grabamos un nuevo archivo llamado archivo4 ms grande que el
primero? Quedara as:
Defragmentador de Windows
Defragmentador de Windows
Defragmentador de Windows
Defragmentador de Windows
Sistemas RAID
Que es tecnologa RAID?
El concepto de RAID fue desarrollado por un
grupo de cientficos en la Universidad de
California en Berkley en 1987.
Los cientficos investigaban usando pequeos HD
unidos en un arreglo (definido como dos o mas
HD agrupados para aparecer como un dispositivo
nico para el servidor) y compararon el
desempeo y los costos de este tipo de
configuracin de almacenamiento con el uso de
un SLED (Single Large Expensive Disk), comn
en aplicac iones de MainFrames.
RAID 0
Tambin llamado particin de los discos, los datos son distribuidos a
travs de discos paralelos. RAID 0 distribuye los datos rpidamente a los
usuarios, pero no ofrece mas proteccin a fallas de hardware que un
simple disco.
El RAID 0 se usa normalmente para incrementar el rendimiento, aunque
tambin puede utilizarse como forma de crear un pequeo nmero de
grandes discos virtuales a partir de un gran nmero de pequeos discos
fsicos.
RAID 1
Tambin llamado Disk mirroring provee la mas alta medida de proteccin
de datos a travs de una completa redundancia. Los datos son copiados
a dos discos o ms discos simultneamente. La disponibilidad es alta
pero el costo tambin dado que los usuarios deben comprar dos veces la
capacidad de almacenamiento que requieren.
Esto resulta til cuando el rendimiento en lectura es ms importante que
la capacidad.
RAID 2
Un RAID 2 divide los datos a nivel de bits divide los datos a nivel
de bits en lugar de a nivel de bloques divide los datos a nivel de bits en
lugar de a nivel de bloques y usa un cdigo de Hamming divide los datos
a nivel de bits en lugar de a nivel de bloques y usa un cdigo de
Hamming para la correccin de errores. Los discos son sincronizados
por la controladora para funcionar al unsono. ste es el nico nivel
RAID original que actualmente no se usa. Permite tasas de trasferencias
extremadamente altas.
Tericamente, un RAID 2 necesitara 39 discos en un sistema
informtico moderno: 32 se usaran para almacenar los bits individuales
que forman cada palabra y 7 se usaran para la correccin de errores.
RAID 3
Logra redundancia sin mirroring completo. El flujo de los datos es
particionado a travs de todos los HD de datos en el arreglo. La
informacin extra que provee la redundancia esta escrito en un HD
dedicado a la parida d. Si cualquier HD del arreglo falla, los datos
perdidos pueden ser reconstruidos matemticamente desde los
miembros restantes del arreglo. RAID 3 es especialmente apropiado
para procesamiento de imagen, coleccin de datos cientficos , y otras
aplicaciones en las cuales grandes bloques de datos guardados
secuencialmente deben ser transferidos rpidamente
RAID 4
Diagrama de una configuracin RAID 4. Cada nmero representa un bloque de
datos; cada columna, un disco.
Un RAID 4, tambin conocido como IDA (acceso independiente con discos
dedicados a la paridad) usa divisin a nivel de bloques usa divisin a nivel
de bloques con un disco de paridad usa divisin a nivel de bloques con un disco
de paridad dedicado. Necesita un mnimo de 3 discos fsicos. El RAID 4 es
parecido al RAID 3 excepto porque divide a nivel de bloques en lugar de a nivel
de bytes. Esto permite que cada miembro del conjunto funcione
independientemente cuando se solicita un nico bloque. Si la controladora de
disco lo permite, un conjunto RAID 4 puede servir varias peticiones de lectura
simultneamente. En principio tambin sera posible servir varias peticiones de
escritura simultneamente, pero al estar toda la informacin de paridad en un
solo disco, ste se convertira en el cuello de botella del conjunto.
RAID 5
Todos los HD en el arreglo operan independientemente.
Un registro entero de datos es almacenado en un solo disco,
permitiendo al arreglo satisfacer mltiples requerimientos de
entrada y salida al mismo tiempo.
La informacion de paridad esta distribuida en todos los discos,
aliviando el cuello de botella de acceder un solo disco de
paridad durante operaciones de entrada y salida concurrentes.
RAID 5
RAID 5 provee accesos rpidos a los datos y una gran medida de
proteccin por un costo mas bajo que el Disk Mirroring.
Un RAID 5 usa divisin de datos a nivel de bloques usa divisin
de datos a nivel de bloques distribuyendo la informacin
de paridad entre todos los discos miembros del conjunto.
El RAID 5 ha logrado popularidad gracias a su bajo coste de
redundancia.
Generalmente, el RAID 5 se implementa con soporte hardware
para el clculo de la paridad.
RAID 5 necesitar un mnimo de 3 discos para ser implementado.
RAID 6
Diagrama de una configuracin RAID 6. Cada nmero representa un
bloque de datos; cada columna, un disco; p y q, cdigos Reed-Solomon.
Un RAID 6 ampla el nivel RAID 5 aadiendo otro bloque de paridad, por
lo que divide los datos a nivel de bloques y distribuye los dos bloques de
paridad entre todos los miembros del conjunto. El RAID 6 no era uno de
los niveles RAID originales.
El RAID 6 es ineficiente cuando se usa un pequeo nmero de discos
pero a medida que el conjunto crece y se dispone de ms discos la
prdida en capacidad de almacenamiento se hace menos importante,
creciendo al mismo tiempo la probabilidad de que dos discos fallen
simultneamente. El RAID 6 proporciona proteccin contra fallos dobles
de discos y contra fallos cuando se est reconstruyendo un disco. En
caso de que slo tengamos un conjunto puede ser ms adecuado que
usar un RAID 5 con un disco de reserva.
Un RAID 6 no penaliza el rendimiento de las operaciones de lectura,
pero s el de las de escritura debido al proceso que exigen los clculos
adicionales de paridad.
RAID 5E y RAID 6E
RAID 5E
Se suele llamar RAID 5E y RAID 6E a las variantes de RAID 5 y RAID 6
que incluyen discos de reserva. Estos discos pueden estar conectados y
preparados (hot spare) o en espera (standby spare). En los RAID 5E y
RAID 6E, los discos de reserva estn disponibles para cualquiera de las
unidades miembro. No suponen mejora alguna del rendimiento, pero s
se minimiza el tiempo de reconstruccin (en el caso de los discos hot
spare) y las labores de administracin cuando se producen fallos. Un
disco de reserva no es realmente parte del conjunto hasta que un disco
falla y el conjunto se reconstruye sobre el de reserva.
RAID 0/1
Combina Disk mirroring y particin de datos. El resultado es gran
disponibilidad al mas alto desempeo de entrada y de salida para las
aplicaciones denegocios mas criticas. A este nivel como en el RAID 1 los
discos so n duplicados. Dado que son relativamente no costosos, RAID
0/1 es una alternativa para los negocios que necesitan solamente uno o
dos discos para sus datos, sin embargo, el costo puede convertirse en
un problema cuando se requieren mas de dos discos.
RAID 10
La informacin se distribuye en bloques como en RAID-0 y
adicionalmente, cada disco se duplica como RAID-1, creando un
segundo nivel de arreglo. Se conoce como "striping de arreglos
duplicados". Se requieren, dos canales, dos discos para cada canal y se
utiliza el 50% de la capacidad para informacin de control. Este nivel
ofrece un 100% de redundancia de la informacin y un soporte para
grandes volmenes de datos, donde el precio no es un factor importan
te. Ideal para sistemas de misin crtica donde se requiera mayor
confiabilidad de la informacin, ya que pueden fallar dos discos inclusive
(uno por cada canal) y los datos todava se mantienen en lnea. Es
apropiado tambin en escrituras aleatorias pequeas.
RAID 30
El RAID 30 proporciona tasas de transferencia elevadas combinadas con
una alta fiabilidad a cambio de un coste de implementacin muy alto.
El RAID 30 trocea los datos en bloque ms pequeos y los divide en
cada conjunto RAID 3, que a su vez lo divide en trozos an menores,
calcula la paridad aplicando un XOR a cada uno y los escriben en todos
los discos del conjunto salvo en uno, donde se almacena la informacin
de paridad. El tamao de cada bloque se decide en el momento de
construir el RAID.Etc...
El RAID 30 permite que falle un disco de cada conjunto RAID 3. Hasta
que estos discos que fallaron sean reemplazados, los otros discos de
cada conjunto que sufri el fallo son puntos nicos de fallo para el
conjunto RAID 30 completo. En otras palabras, si alguno de ellos falla se
perdern todos los datos del conjunto. El tiempo de recuperacin
necesario (detectar y responder al fallo del disco y reconstruir el conjunto
sobre el disco nuevo) representa un periodo de vulnerabilidad para el
RAID.
RAID 50
Combina la divisin a nivel de bloques de un RAID 0 con la paridad
distribuida de un RAID 5.
Un disco de cada conjunto RAID 5 puede fallar sin que se pierdan datos.
El RAID 50 mejora el rendimiento del RAID 5, especialmente en
escritura, y proporciona mejor tolerancia a fallos que un nivel RAID
nico. Este nivel se recomienda para aplicaciones que necesitan gran
tolerancia a fallos, capacidad y rendimiento de bsqueda aleatoria.
RAID 100
Es una divisin de conjuntos RAID 10. Es un RAID cuadriculado, en el
que conjuntos divididos son a su vez divididos conjuntamente de nuevo.
Todos los discos menos unos podran fallar en cada RAID 1 sin perder
datos. Sin embargo, el disco restante de un RAID 1 se convierte as en
un punto nico de fallo para el conjunto degradado.
Los principales beneficios de un RAID 100 (y de los RAID cuadriculados
en general) sobre un nico nivel RAID son mejor rendimiento para
lecturas aleatorias y la mitigacin de los puntos calientes de riesgo en el
conjunto.
Por estas razones, el RAID 100 es a menudo la mejor eleccin para
bases de datos muy grandes.
Fuentes:
Wikipedia
Wikimedia
http://www.eoi.es