Vous êtes sur la page 1sur 19

2012

UNIDAD II
ORGANIZACIN DE DATOS

UNIDAD II
2 Archivo secuencial
Archivo secuencial es la forma ms simple de almacenar y recuperar registros en
un archivo. En un archivo secuencial, se almacenan los registros uno tras otro. El
primer registro almacenado se coloca al principio del archivo. El segundo se
almacena inmediatamente despus (no existen posiciones sin uso), el tercero
despus del segundo, etc. Este orden nunca cambia en la organizacin
secuencial. Una caracterstica de los archivos secuenciales es que todos los
registros se almacenan por posicin: de primer registro, segundo registro, etc.
2.1 Estructura Archivos Organizacin Secuencial
ARCHIVOS SECUENCIALES.
Se refiere al procesamiento de los registros, no importa el orden en que se haga,
para eso los registros estn organizados en forma de una lista y recuperarlos y
procesarlos uno por uno de principio a fin.
Rudimentos de los archivos Secuenciales; dependiendo del dispositivo de
almacenamiento utilizado el archivo se puede mostrar el usuario como si fuera un
sistema secuencial.
Al finalizar un archivo secuencial se denota con una marca de fin de archivo. (End
end-of-file)
El usuario de un archivo secuancial puede ver los registros en un orden secuancial
simple.
La nica forma de recuperar registros es comenzar al principio y extraerlos en el
orden contemplado.
Cuestiones de programacin; la manipulacin de los archivos se hace en el
contexto de la programacin en un lenguaje por procedimientos de alto nivel.
Estos lenguajes tienden a expresar la manipulacin de archivos mediante
subrutinas que se definen como parte del lenguaje formal o se incluyen como
extensiones del lenguaje en una biblioteca estndar.
La mayor parte de los lenguajes por procedimiento de alto nivel cuenta con
caractersticas que ayudan a detectar la marca de fin de archivo.
Archivos Secuenciales indexados
Un mtodo popular para superar las desventajas de los archivos secuenciales es
el del archivo secuencias indexado.
El archivo secuencial indexado mantiene las caracteristicas bsicas de los
archivos secuenciales: los registros estn organizados en una secuencia basada
en un campo. Dos caractersticas se aaden: un ndice del archivo para soportar
los accesos aleatorios y un archivo de desbordamiento ( overflow ).
El indice provee una capacidad de bsqueda para llegar rapidamente a las
proximidades de un registro deseado. El archivo de desbordamiento (overflow) es
similar al archivo de registro usado en un archivo secuencial, pero esta intregrado
de forma que los registros del archivo de desbordamiento se ubican en la direccin
de un puntero desde si registro precedente.
En la estructura secuencial indexada mas simple, se usa un solo nivel de
indexacion. El indice, en este caso, es un archivo secuencial simple. Cada registro
del archivo indice tiene dos campos: un campo clave, que es el mismo que el
campo clave del archivo principal y un puntero al archivo principal.
Para encontrar un campo especifico se busca en el indice hasta encontrar el valor
mayor de la clave que es igual o precede al valor deseado de la clave. La
busqueda continua en el archivo principal a partir de la posicin indicada por el
puntero.
Archivos Secuenciales
La forma mas comn de estructura de archivo es el archivo secuencial. En este
tipo de archivo, un formato fijo es usado para los registros. Todos los registros
tienen el mismo tamao, constan del mismo numero de campos de tamao fijo en
un orden particular. Como se conocen la longitud y la posicin de cada campo,
solamente los valores de los campos se necesitan almacenarse; el nombre del
campo y longitud de cada campo son atributos de la estructura de archivos.
Un campo particular, generalmente el primero de cada registro se conoce como el
campo clave. El campo clave identifica unvocamente al registro. as, los valores
de la clave para registros diferentes son siempre diferentes.
Los archivos secuenciales son tpicamente utilizados en aplicaciones de proceso
de lotes Y son ptimos para dichas aplicaciones si se procesan todos los registros.
La organizacin secuencias de archivos es la nica que es fcil de usar tanto en
disco como en cinta.
Para las aplicaciones interactivas que incluyen peticione s o actualizaciones de
registros individuales, los archivos secuenciales ofrecen un rendimiento pobre.
Normalmente un archivo secuencial se almacena en bloques, en un orden
secuencial simple de los registros. La organizacin fsica del archivo en una cinta
o disco se corresponde exactamente con la ubicacin lgica del archivo. En este
caso, el procedimiento para ubicar los nuevos registros en un archivo de pila
separado, llamado archivo de registro (log file) o archivo de transacciones.
Peridicamente, se realiza una actualizacin por lotes que mezcla el archivo de
registro con el archivo maestro para producir un nuevo archivo en secuencia
correcta de claves.
Organizacin de Archivos Secuenciales.
La manera bsica de organizar un conjunto de registros, que forman un archivo,
es utilizando una organizacin secuencial. En un archivo organizado
secuencialmente, los registros quedan grabados consecutivamente cuando el
archivo se usa como entrada.
Un archivo organizado secuencialmente es un conjunto de registros lgicamente
relacionados cuya secuencia de acceso est determinada por su ordenamiento.
Los registros deben ser grabados consecutivamente cuando el archivo es creado,
y deben ser ledos de la misma manera cuando es usado posteriormente como
entrada.
Los requerimientos de proceso determinan el orden adecuado para la orden de los
registros de un archivo secuencial. Por ejemplo para generar un directorio
telefnico el archivo que contenga tal informacin deber ordenarse con base al
apellido y nombre de la persona, porque as se necesita el reporte de los datos.
Sin embargo, si se requiere tener un directorio telefnico ordenado de acuerdo a la
zona postal o por su direccin, deber de existir dos archivos, que podrn
contener la misma informacin pero ordenada de forma diferente, por lo que los
sistemas de informacin que se construyen utilizando esta organizacin, tienden a
duplicar registros. Esto se podra decir que es una desventaja de la organizacin
de archivos secuenciales.
Los sistemas de informacin que se construyen utilizando archivos secuenciales
tienden a duplicar registros por los archivos que estn en orden diferente. Por lo
regular no todos los archivos se conservan; muchos se consideran como
temporales y se borran despus de que se han utilizado como entrada al
programa de aplicacin y la informacin contendida se ha explotado para un
propsito particular.
Debido a que los registros de un archivo secuencialmente deben de accesarse
constantemente se utilizan con mayor frecuencia en procesamiento por lotes (que
pueden tomar varios registros a la ves) que en procesamiento interactivo.
El desempeo de los archivos secuenciales depende de
Factor de bloqueo
Longitud del archivo
Seleccin de la llave.
Actualizacin de archivos secuenciales.
Un archivo maestro representa un panorama esttico de algn aspecto de una
empresa. Sin embargo muchos de los aspectos de dicha organizacin no son
estticos, sino que continuamente ocurren cambios internos y/o externos que
afectan directa o indirectamente a la empresa, como puede ser la contratacin de
personal, despidos, los ajustes de precios, etc. Para que un archivo pueda reflejar
un estado actual lo ms confiable posible, nuestro archivo debe ser actualizado.
Ventajas y Desventajas
La ventaja ms importante de la tcnica de organizacin secuencial de archivos es
la capacidad de acceso al siguiente registro rpidamente: Mientras que el patrn
de acceso a un archivo secuencial se conforme al ordenamiento de registros en el
archivo, los tiempos de acceso sern muy buenos. Sin embargo, si el patrn de
acceso al programa no se conforma al patrn de ordenamiento de los registros,
entonces la eficiencia del programa puede ser terrible.
Otra ventaja de los archivos de organizacin secuencial es que son muy sencillos
de usar y aplicar.
Almacenamiento De Archivos Secuenciales.
Los archivos secuenciales pueden almacenarse en dispositivos de acceso serial o
directo. Con frecuencia los dispositivos de acceso serial son considerablemente
menos caros que los dispositivos de acceso directo en un sistema de cmputo,
pero de hecho, los dispositivos de almacenamiento de acceso directo en una
computadora siempre proporcionan mayor capacidad de almacenamiento y
acceso ms rpido que los dispositivos de acceso serial.
Declaracin De Archivos Secuenciales.
Casi todos los lenguajes proporcionan facilidades para declarar archivos
secuenciales a continuacin te presentamos un ejemplo en Pascal que bien puede
ser aplicado a Delphi.
Program actualiza maestro (reporte, movimientos, maestro ent, maestro -
salida);
Type registro maestro = Record
Nmero empleado: 19999

Nombre empleado: packed array [1..25] of char;

Departamento: packed array [1..5] of char;



end;
registro movimiento = record
tipo movimiento: A,D;

detalle: packed array [1..81] of char;

end;
var reporte:text;
movimiento: file of registro movimiento;

maestro ent, maestro-sal: file of registro maestro;
Creacin de un archivo secuencial.
La creacin de un archivo secuencial incluye la escritura de registros en una
secuencia deseada dentro del medio de almacenamiento. La creacin de un
archivo secuencial de transacciones incluye la tarea de recolectar datos, convertir
los datos a una forma legible para la mquina, editar los datos, convertir los
movimientos rechazados y ordenar los datos editados.
Archivos de Reporte.
La creacin de un archivo de reporte sigue el siguiente algoritmo:
Recuperacin De Informacin De Archivos Secuenciales.
Los registros deben ser recuperados de un archivo secuencial en orden
consecutivo. El orden en el cual los registros fueron grabados en el archivo,
determina el orden en el cual los registros pueden recuperarse. De hecho, en
realidad se hace todo lo contrario: el orden deseado para recuperar los registros
debe dictar el orden en el cual deben grabarse.
La recuperacin de informacin de un archivo secuencial puede clasificarse, ya
sea en generadora de reportes o para hacer consultas, dependiendo del volumen
de informacin producida. Los archivos secuenciales son frecuentemente
accesados en el modo de generacin de reportes. Debido a que los registros
deben ser accesados consecutivamente, es bastante eficiente accesar cada
registro del archivo.
Con que frecuencia es necesaria la actualizacin?
La frecuencia con la que debe ser actualizado el archivo depende de los
siguientes factores.
Velocidad de cambio de los datos.
Tamaos del archivo
Urgencia de tener datos actualizados
Razn de actividad del archivo
La razn de actividad del archivo es el nmero de registros del archivo maestro
afectados por un lote de transacciones, dividido por el nmero total de registros en
el archivo maestro. Mientras menor sea el tiempo entre dos actualizaciones de un
archivo maestro, mayor ser la razn de actividad del archivo.
Entre menos actualizaciones haya, la edad promedio de los datos existentes en el
archivo maestro aumentan.
Mientras mas grande sea la necesidad de tener datos actuales en el archivo
maestro, mayor deber ser la frecuencia de actualizaciones.
Mientras mas frecuent deba ser actualizado el archivo maestro, mayor ser el
costo de procesamiento.
Generacin de archivos.
Una desventaja de los archivos secuenciales es que en el proceso de
actualizacin, la mayora de los archivos secuenciales no pueden ser actualizados,
ms bien habr que reescribirlos totalmente. Para llevar a cabo este proceso
existir un archivo maestro anterior y otro actual. Estas versiones sucesivas del
archivo son normalmente conocidas como generaciones de archivo. Si el archivo
maestro viejo perteneci a la generacin 1, entonces el archivo nuevo del da
pertenecer a la generacin 2, y as sucesivamente.
El tener varias generaciones del archivo se hace con el objetivo de obtener
reportes histricos que podran ayudar en un momento dado para la toma de
decisiones de una empresa.
Tipos de actualizacin
Existen 3 tipos de actualizacin bsicos que pueden ser aplicados a loa archivos
maestros:
1.- Insercin de un nuevo registro
2.- supresin de un registro existente
3.- Modificacin de un registro existente
Manipulacin de errores
Existen muchos tipos de errores que pueden ser encontrados en la actualizacin
de archivos, como los siguientes:
1.- Insercin de un archivo
2.- Supresin de un registro que no existe
3.- Modificacin de un registro que no existe
La accin adecuada que deba realizarse cuando estos errores ocurran depende
de la aplicacin pero no se debe permitir que los errores infecten al archivo.
Generalmente un programa de aplicacin produce un reporte de errores, que
identifica cada transaccin que no fue procesada y la razn por la cual no fue
procesada.
Desempeo De Archivos Secuenciales.
El desempeo de los archivos secuenciales est determinado por tres factores
principales: El factor de bloqueo, la longitud del archivo y la seleccin de la llave.
Factor de Bloqueo
Los datos ledos o grabados en una cinta magntica, en grupos de caracteres, son
llamados bloques. Un bloque es el grupo ms pequeo de datos que se pueden
transferir entre la memoria secundaria y la memoria principal en un solo acceso.
Un bloque puede contener uno o ms registros. Un bloque es algunas veces
mencionado como un registro fsico. El factor de bloqueo se refiere al nmero de
registros por bloque. Mientras mayor sea el factor de bloqueo se mejora ms el
uso del dispositivo de almacenamiento debido a que entre cada bloque existe un
espacio.
Los factores limitantes para determinar la amplitud del bloque son la disponibilidad
de espacio de buffer en la memoria principal, los parmetros del sistema operativo
(los cuales pueden limitar el tamao del bloque) y los algoritmos locales de carga
(los cuales negocian la utilizacin de memoria principal contra el acceso a los
dispositivos de almacenamiento secundarios).
Si el archivo secuencial se almacena en un dispositivo de acceso directo, es
recomendable que el tamao del bloque coincida con el tamao del sector ( si se
utiliza un direccionamiento por sector) o con el tamao de la pista.
Longitud Del Archivo Secuencial.
La longitud del archivo se determina por el volumen de los datos y por el diseo
del registro, es decir el problema de determinar qu campos estn en qu
registros y en que archivos. Una norma es separar los campos de los registros de
acuerdo con la frecuencia en que son accesados, de esta manera, separamos los
datos de un registro completo entre un archivo activo y otro relativamente inactivo
para reducir el tiempo de procesamiento sobre ese archivo.
Seleccin de la llave.
La llave de un archivo determina el orden en el cual son accesados los registros.
Los campos para formar la llave del archivo secuencial son determinados por los
requisitos de la informacin.
Resumen de Archivos Secuenciales.
Un archivo organizado secuencialmente es un conjunto de registros lgicamente
relacionados cuya secuencia de acceso est determinada por su ordenamiento.
Los registros deben ser grabados consecutivamente cuando el archivo es creado,
y deben ser ledos consecutivamente cuando el archivo es usado posteriormente
como entrada. Un archivo secuencial opera de la misma manera de cmo lo hace
una cola larga: el primer registro fsico es el primer registro escrito. Debido a que
los registros deben ser accesados consecutivamente, los archivos de organizacin
secuencial son usados ms frecuentemente en procesamientos por lotes que en
procesamientos interactivos. La principal ventaja de la organizacin secuencial es
la capacidad para accesar rpidamente al siguiente registro.
El proceso de actualizacin de un archivo maestro secuencial es importante. La
frecuencia con la cual el archivo maestro debe ser actualizado, depende de
algunos factores, incluyendo volatilidad de los datos, tamao del archivo, urgencia
de la necesidad de tener datos actualizados y a razn de actividad del archivo. El
concepto de generacin de archivos fue introducido y se discutieron el nmero de
generacin absoluta y relativa. Los tipos bsicos de actualizacin del archivo
maestro son la insercin de nuevos registros, la supresin de registros viejos y la
modificacin de registros existentes. La lgica necesaria para aplicar estas
actualizaciones fue explicada.
Los elementos fundamentales para el buen desempeo de archivos secuenciales
son: el factor de bloqueo, la longitud del archivo (afectado por el diseo del
registro) y la eleccin de la llave. Los archivos de organizacin secuencial son
sencillos y pueden ser almacenados en un medio econmico. Son muy adecuados
para las aplicaciones que requieren slo acceso secuencial a los datos
contenidos. No son adecuados para aplicaciones que requieren acceso directo a
algunos registros particulares de la coleccin. No proporcionan apoyo para
aplicaciones interactivas. No obstante, continuarn siendo importantes.

2.2 Operaciones sobre Archivos Secuenciales
Los archivos secuenciales son tpicamente utilizados en aplicaciones de proceso
de lotes Y son ptimos para dichas aplicaciones si se procesan todos los registros.
La organizacin secuencias de archivos es la nica que es fcil de usar tanto en
disco como en cinta.
Para las aplicaciones interactivas que incluyen peticione s o actualizaciones de
registros individuales, los archivos secuenciales ofrecen un rendimiento pobre.
Normalmente un archivo secuencial se almacena en bloques, en un orden
secuencial simple de los registros. La organizacin fsica del archivo en una cinta
o disco se corresponde exactamente con la ubicacin lgica del archivo. En este
caso, el procedimiento para ubicar los nuevos registros en un archivo de pila
separado, llamado archivo de registro (log file) o archivo de transacciones.
Peridicamente, se realiza una actualizacin por lotes
que mezcla el archivo de registro con el archivo maestro para producir un nuevo
archivo en secuencia correcta de claves.
estructura y manejo de archivos secuenciales
con el fin de proporcionar una secuencia para los registros, se define una llave
para cadauno. uno o mas atributos se volveran los atributos llave para los registros
en los archivos. el conjunto de valores para los atributos llave generalmente
identifica el objeto descrito por el registro; es decir, el numero de placa de un
automovilo el nombre de une persona. se espera poder identificar los registros en
forma unica con base en sus llaves. entonces los registros en el archivo se
conservan en el orden de acuerdo con los atributos llave. un atributo llave
proporcionara la llave primaria de clasificacion de alto orden y si este atributo no
identifica en forma unica al objeto, entonces puede identificarse atributos llave
secundarios o inferiores hasta que el orden se determine por completo.
la lectura serial del archivo en este orden puede realizarce ahora en forma
secuencial. algunas veces se agregan campos artificiales conteniendo numeros de
secuencia o identificacion, para obtener atributos llave unicos.
la participacion del archivo, analisada con la descripcion de archivo de apilo ahora
se realiza de forma explicita:
se selecciona el numero de identificacion para que sea unico para todos los
registros y parta alarchivo en n registros individuales. desafortunadamente, puede
resultar necesaria una computacion separada para determinar el numero de
identificacion perteneciente al dato deseado.
con estas restricciones estructurales y mayor eficiencia en la atencionen el
procesamiento orientado en forma tabular, se pierde mucha flexibilidad.
no es facil colocar las actualizaciones en un archivo secuencial. el hecho de que
determine el atributo llave exclusivamente la secuencia de los registros introduce
una simetria que hace que los archivos secuenciales resulten inadecuados para
recuperar informacion general.
el procedimiento comun para manejarisercion en un archivo secuencial consiste
en recolectarlas en un apilo, el archivo de bitacora de transacciones,hasta que el
apilo resulte demasiado grande para realizar entosces una actializacion por lote.
esto se hace reorganizando el archivo.
en este momoemto el archivo de bitacora de transacciones se clesifica deacuerdo
con las mismas llaves utilizadas para el archivo principal y las modificaciones se
unen en una nueva copia del archivo secuencial.
ARCHIVOS SECUENCIALES
Existen ademas muchas operaciones asociadas a archivos, las mas elementales
son:
1.- Creacin de Archivo.- En este proceso se pretende solamente crear un archivo
nuevo en disco, con su nombre, tipo y especialidad de almacenamiento de datos
apropiado.
2.- Apertura de Archivos.- En este caso se pretende abrir un archivo ya existente
en disco para procesarlo, ya sea cargar o grabar datos en sus registros, o leer
algun registro en especial para mandarlo a una variable de cualquier tipo.
No confundir creacin con apertura, creacin es un proceso que solo se ejecuta
una sola vez en la vida de un archivo, mientras que apertura, siempre se esta
realizando por los programas especializados en algun proceso.
3.-Cierre de archivos: Es la operacin mas importante en cualquier programa que
maneje archivos, o se cierra el archivo como ultima instruccin del pograma o se
vera el anuncio ABORT,RETRY,FAIL.
98, /s, scandisk
4.-Altas en archivo.- En este proceso se carga una clase en memoria con sus
datos pertinentes y se graba la clase en el archivo en disco.
5.-Lectura de archivo.- En este proceso, se abre el archivo y se manda el registro
de disco, a una clase en memoria para su procesamiento.
6.- Consulta de archivos: En este proceso se pretende desplegar todos los
registros del archivo en disco a la pantalla, ya sea consola o mejor an, a una
pagina html
7.-Busqueda en archivos: Una de las operaciones mas comunes, consiste en que
el usuario pide toda la informacin de algun renglon en disco, porporcionando la
informacin de algun campo, generalmente el campo clave de la clase.
8.- Filtros.- En este proceso el usuario esta interesado en algun conjunto de
renglones con caracteristicas comunes (condicin), por ejemplo todos los alumnos
de sisJAVA TEMA s, o todos los empleados que ganen mas de $500.00 pesos, o
todos los clientes que sean de tijuana, etc
9.-Modificaciones de registros o archivos: Problema muy comun, donde los datos
originales ya grabados se tienen que cambiar o actualizar, por ejemplo el nombre
no era juan es juana, o la calificacin no es 100 es 20, etc.
10.- Bajas de registros: tambien muy comun este proceso, por ejemplo el alumno
ya egreso, el cliente huyo, etc.

Vous aimerez peut-être aussi