Académique Documents
Professionnel Documents
Culture Documents
U
N
I
D
A
D
El tamao de un archivo est limitado por una serie de factores, como la capacidad
disponible en la memoria secundaria del ordenador y los lmites impuestos por el
sistema operativo o el sistema de archivos.
tener en cuenta que sta no debe contener carcteres reservados, como por
ejemplo (*/:.;), es dedir, ser vlida la extensin Archivo.PIF pero no Archivo./*1
Tambin es recomendable no usar para un archivo de texto plano extensiones que,
estando muy difundidas y siendo muy conocidas, pueden confundir tanto al usuario
como al propio sistema operativo, como por ejemplo .xls .doc .ppt .wav .gif .jpg,
aunque
no
hay
ningn
impedimento
si
se
quieren
utilizar.
Convenciones de nombres de archivos texto en sistemas Unix En sistemas Unix las
convenciones de nombres de archivos son ms relajadas, la extensin .txt se ha
hecho popular en los ltimos tiempos pero habitualmente el contenido del archivo
se ha determinado con programas que examinan los primeros bytes, como por
ejemplo el comando file.
Archivos binarios: Los archivos binarios son archivos electrnicos que han sido
guardados utilizando el cdigo bsico de las computadoras u ordenadores: una
sucesin de ceros y unos.
Constituyen, en ltima instancia, la forma en la cual almacenan la informacin,
aunque su interaccin con los usuarios requiere de lenguajes auxiliares que
resulten ms inteligibles al ser humano.
Fcil actualizacin
Economa de almacenamiento
Mantenimiento simple
A travs del sistema de archivos que forma parte del sistema operativo se puede
establecer una correspondencia entre los archivos lgicos y los archivos fsicos.
Campos
Estudios
Salario
7
Da
Mes
Ao
Nombre
Profesin
Direccin
Telfono
Estructura
lgica
Archivo {Registro {Campo
Ciudad
Borrado: Eliminacin total del archivo, dejando libre el espacio del soporte que
ocupaba.
Mantenimiento: Se
Reorganizacin.
da
travs
de
dos
acciones:
Reestructuracin
U
N
I
D
A
D
Ventajas y desventajas.
Ventajas:
Los archivos con poca volatilidad, gran actividad y tamao variable son altamente
susceptibles de ser organizados secuencialmente.
La ventaja ms importante de la tcnica de organizacin secuencial de archivos es
la capacidad de acceso al "siguiente" registro rpidamente: Mientras que el patrn
de acceso a un archivo secuencial se conforme al ordenamiento de registros en el
archivo, los tiempos de acceso sern muy buenos. Sin embargo, si el patrn de
acceso al programa no se conforma al patrn de ordenamiento de los registros,
entonces la eficiencia del programa puede ser terrible.
Otra ventaja de los archivos de organizacin secuencial es que son muy sencillos
de usar y aplicar.
Desventajas:
El acceso a un registro es pobre, la localizacin de un determinado registro no se
puede hacer individualmente no de manera rpida, y el acceso aleatorio es
imprctico.
Adems, en los archivos secuenciales la direccin de registro est implcita y
estn vulnerables a fallas del sistema.
ndice Datos
Una forma sencilla de ver la estructura de un archivo ndice es la de un rbol de bsqueda
binaria, el cual es usado para cumplir el requerimiento de acceso particular a un registro,
esta es una organizacin no secuencial indexada
D B G A C E J 1 2 3 Datos no ordenados D 1 B 2 G 3 A 4 C 5 D 6 J 7 Llave Direccin
Ventajas:
Permite procesar el archivo secuencialmente por orden lgico y tambin procesarlo al
azar.
La organizacin secuencial indexada es conveniente para archivos con mediana
volatilidad, actividad variable y tamao relativamente estable.
Desventajas:
Los ndices requieren espacio extra, se necesita una doble bsqueda; una en el ndice y
otra en el archivo.
Los registros deben ser de longitud fija.
El archivo debe estar separado por un dispositivo de acceso aleatorio; no se puede utilizar
en cintas magnticas.
Muchas tcnicas para organizar un archivo como ndice han sido propuestas. No todos los
esquemas sencillos pueden ser ptimos para todas las aplicaciones, se utilizan
principalmente las tcnicas para implementar un ndice rbol y rbol B+.
ARBOL B
Una de las estructuras que ms ampliamente se ha usado para organizar un ndice en un
sistema de base de datos y en administradores de archivos tradicionales es el rbol B. (B
Tree).
Un rbol B es una clase especial de rbol multicamino equilibrado que permite recuperar,
eliminar e insertar registros de un archivo extremo con buen rendimiento en el peor caso.
rbol B (Orden 5) ABC EF HDK MN PQ ST VW Y7 DG ORUX L
Formalmente, un rbol de M vas es un rbol de bsqueda de orden M con las siguientes
propiedades:
1.- Cada nodo del rbol, excepto la raz y las hojas tienen al menos [ * M] subrboles y
no ms de M subrboles.
2.- La raz del rbol tiene al menos dos subrboles, si es que no es una hoja.
3.- Todas las hojas del rbol estn al mismo nivel.
Las estructuras que se usan en el rbol B estn basadas en tres tipos de nodos:
1.- Un bloque para el nodo raz
2.- Nodos bloque para las ramas
3.- Nodos bloque para las hojas
El nodo raz inicia la estructura del rbol. Una hoja es un nodo terminal sin hijos. El
tamao de un nodo (bloque) es usualmente elegido para reflejar algn mltiplo del tamao
del bloque del disco.
Hay varias formas de organizar las hojas, una de ellas es que el archivo principal esta
almacenado solo en las hojas, y que cada hoja ocupa un bloque. Tambin es importante
hacer notar si se trata de un ndice denso, en tal caso se tendr que mantener en cada
nodo la direccin de la informacin asociada al valor de la llave, o sise trata de in ndice
disperso donde se tendra ciertos valores de llaves en el ndice y en las hojas existiran
todos los valores de llaves que propiamente es el archivo principal.
Bsqueda Aleatoria Bsqueda Secuencial ndice como rbol B
En un rbol B+, todas las llaves en las hojas. Los niveles superiores, los cuales estn
organizados como un rbol B, consisten nicamente de un ndice para localizar
rpidamente.
Los nodos ndices y los nodos hoja pueden tener diferentes formatos o tamaos. Los
nodos hoja son usualmente encadenados juntos de izquierda a derecha, sea por el valor
de la llave.
La lista de hojas es referida como el conjunto secuencia, lo cual permite un fcil
procesamiento secuencial.
Para el proceso de bsqueda se realiza desde la raz del rbol a travs del ndice hasta
una hoja. Ya que todas las llaves residen en las hojas, no todos los valores de llaves son
encontrados en la trayectoria de bsqueda, si no hasta llegar a la hoja correcta
Organizacin directa
Consiste en una serie de posiciones de memoria numeradas llamadas celdas. Estas
celdas son de igual capacidad, y estn numerados consecutivamente de 1 a N. los
registros se sitan en el archivo de acuerdo a su nmero de celda.
Estas celdas se convierten en registros numerados, siendo su nmero de posicin
que ocupan respecto al principio del archivo.
VENTAJAS
* Permite la consulta directa, sin lectura de los registros anteriores.
* Permite realizar operaciones de escritura y lectura simultneamente.
* Son muy rpidos al tratar registros individuales.
INCONVENIENTES
* Deja gran cantidad de posiciones libres de memoria dentro del fichero.
* Se producen colisiones, ya que puede existir ms de un registro con la misma clave.
* Al realizar un acceso secuencial, en una consulta sobre todos los registros del
fichero hay que recorrer todas las direcciones que aun estn vacas.