Apuntes para todos los estudiantes y cursos

Clases de ficheros según su función

La información se puede almacenar en ficheros
Un fichero es una agrupación de datos que están relacionados y hacen referencia a un tema o temas
diversos y que se encuentra en lugares determinados
El registro es la unidad de tratamiento de los ficheros de datos
Los campos son la mínima unidad de información

Clasificación de los ficheros según su uso:


Permanentes


Son aquellos cuyo contenido permanece prácticamente inalterable en el
tiempo, que ala vez se pueden clasificar según con la frecuencia con que se actualizan

O MAESTROS


Mantienen actualizada la información de sus campos. Se
modifican con mucha frecuencia y las modificaciones se realizan en tiempo real, a la vez que suceden los cambios.
o CONSTANTES
:
Estos ficheros rara vez modifican su contenido.Ejemplo Los ficheros INI de Windows
o HISTÓRICO

S : Contienen resultados de operaciones. Se suelen usar para posteriormente realizar algún tratamiento, sobre todo de tipo estadístico o consultas.

Temporales:


duran poco tiempo desde su creación, que a la vez se clasifican en:
§ DE MOVIMIENTO:
Contienen información para la actualización de los
ficheros maestros. Se destruyen una vez realizada la actualización delmaestro.
§ DE MANIOBRA:
Contienen información relativa a un proceso que todavía no se ha finalizado. Son creados por los mismos programas que lo requieren. Cuando el proceso finaliza, se eliminan.
Organización de un fichero es la forma de estructurar y almacenar datos en un dispositivo de almacenamiento.
Direccionabilidadposibilidad de establecer una relación biunívoca entre direcciones lógicas y contenidos de los archivos
Clasificación de los ficheros atendiendo a su direccionabilidad:

ARCHIVOS SIN DIRECCIÓN: ARCHIVOS SECUENCIALES

Son aquellos archivos en los que no es posible acceder a los contenidos a partir de una dirección. La única forma de hacerlo es comenzar por el principio del archivo e ir leyendo secuencialmente la información hasta llegar al dato requerido

1.2.1.2. ARCHIVOS CON DIRECCIÓN:


Son aquellos en los que existe una relación biunívoca entre contenidos y ubicación de dichos contenidos. Permiten el acceso directo a los datos.Esto se logra porque el espacio destinado para el almacenamiento está dividido en espacios segmentados, direccionables individualmente (p. Ejemplo, el disco duro).Para localizar un registro en un archivo con dirección, es necesario utilizar un dato que se pueda comparar con los contenidos del fichero para saber si se encuentra o no el valor buscado. A este tipo de dato se le denomina clave.

1.2.1.2.1. SIN CONVERSIÓN CLAVE ? DIRECCIÓN: ARCHIVOS DE ACCESO DIRECTO O ALEATORIO


La clave es igual a la dirección. Dado que el sistema de direccionamiento es casi siempre numérico, las claves también han de serlo. Si las claves no son consecutivas, este método, genera huecos desaprovechando recursos.

1.2.1.2.2. CON CONVERSIÓN CLAVE ? DIRECCIÓN

· ASOCIACIÓN CLAVE-DIRECCIÓN APLICANDO UNA FUNCIÓN DE ASOCIACIÓN (HASH).
La función hash nos permite obtener la dirección en disco del dato correspondiente a una clave.
F(Clave) = Dirección
Para que dicha función sea eficiente deberá cumplir las siguientes condiciones:
? La función no debe contener cálculos muy complejos para evitar ralentizar todos los accesos.
?

Debe dejar el número mínimo de huecos


Debe minimizar las colisiones

Se denomina colisión cuando al aplicar la función hash a dos claves diferentes nos da la misma dirección.

· ASOCIACIÓN CLAVE-DIRECCIÓN MEDIANTE BÚSQUEDA EN TABLA ASOCIADA O ÍNDICE.
ORGANIZACIÓN SECUENCIAL INDEXADA.

También conocido como acceso DINÁMICO. Son los accesos que permiten cualquier tipo de organización. Permite un acceso directo o por índice a un registro, y a partir de ése el acceso a los demás registros se efectúa de forma secuencial.

Los ficheros indexados constan de tres partes:

?

Área de índices:

es un archivo secuencial creado por el sistema, en el que se divide el área primaria en diferentes segmentos.
?

Área primaria o de datos:

contiene los datos en sí. Estos datos deben estar ordenados de forma ascendente por su campo clave.
?

Área de excedentes o de overflow:

sirve para añadir nuevos registros que no se introducen en el área primaria para evitar la reorganización del mismo.

1.2.2. MODOS DE ACCESO

Se denomina modo de acceso a la forma en que un dispositivo que maneja un soporte de información, que contiene un archivo, se posiciona en un determinado lugar del mismo para realizar una operación de lectura o e escritura de un registro.El modo de acceso lo decide el programador de la aplicación en función del tipo de organización.
Hay dos modos básicos: Secuencial y Directo.
·

Acceso Secuencial

Supone acceder inicialmente al primer registro
del archivo y después, consecutivamente, a todos los sucesivos hasta
llegar al registro deseado.
·

Acceso directo

Consiste en el posicionamiento sobre cualquier
registro sin necesidad de haber accedido antes a los anteriores.

1.3. OPERACIONES SOBRE LOS FICHEROS

·

Creación

Lo primero que tenemos que hacer con un fichero
es crearlo.
·

Apertura

Es necesaria esta operación para realizar cualquier otra operación que necesite acceder al contenido de un fichero.
·

Ordenación

Permite establecer un orden en los registros del fichero
·

Compactación

Reorganiza los registros del fichero eliminando los huecos libres.
·

Cierre

Cuando se termina de operar con un fichero debe cerrarse para evitar modificaciones accidentales.

1.3.2. OPERACIONES EN LOS REGISTROS DE UN FICHERO

·

Actualización

adición,inserción, modificación o eliminación de registros,manteniendo el fichero actualizado.
·

Consulta

Permite acceder a los registros para conocer el contenido de sus campos. Operación de lectura sobre un fichero.

1.3.3. OPERACIONES EN LAS QUE SE CREAN NUEVOS FICHEROS

·

Copia

A partir de un fichero se crea otro con la misma estructura y contenido.
·

Intersección

Consiste en crear un nuevo fichero partiendo de los registros comunes de dos o más ficheros con la misma estructura.
·

Concatenación

A partir de dos ficheros con la misma estructura, se crea un tercer fichero que contiene la información de ambos ficheros.
·

Partición

A partir de un fichero se crean uno o más ficheros con la misma estructura y contenido, en función de alguna carácterística seleccionada.

1.4. PROBLEMAS EN LA GESTIÓN DE DATOS CON SISTEMAS GESTORES DE FICHEROS

Los problemas respecto de los ficheros se deben a la necesitad de controlar la integridad semántica, el control de autorizaciones y la concurrencia de accesos o acceso simultáneo de varios usuarios al mismo fichero de datos.

La integridad semántica es un conjunto de restricciones que permiten o no almacenar determinados valores.

El control de autorizaciones trata de evitar que se produzcan accesos
indebidos a los datos, para lo que a cada usuario se le da un identificador y una clave.
El identificador permite discriminar a los usuarios reales del sistema de aquellos que intentan acceder de forma no autorizada. La clave autentifica al usuario.
El tercer problema es acceso simultáneo de varios usuarios a los mismos datos

Los problemas respecto de los datos se deben a su estructura física. Destacan los siguientes problemas:

?
Redundancia o repetición innecesaria de información en varios ficheros.
?
Inconsistencia o información redundante en la que los datos de los distintos ficheros no concuerda entre sí.
?
Aislamiento o fragmentación de la información.Datos referentes a un objeto se almacenan en distintos ficheros, siendo difícil obtener a la vez toda la información relativa al mismo objeto.
2. CarácterÍSTICAS GENERALES Y VENTAJAS DE
UNA BASE DE DATOS
Dos ventajas:
independencia lógica de datos, lo que significa que los cambios realizados en un objeto de la base de datos no obligan a modificar otros elementos de la base de datos.
independencia física de los datos, es decir, la base de datos no depende del dispositivo de almacenamiento en que se guarde.

2.1. CarácterÍSTICAS

Desempeño: deben asegurar un tiempo de respuesta adecuado en la comunicación hombre-máquina

Mínima redundancia:


evitar el uso de archivos con estructuras planas.

Capacidad de acceso:


Debe ser capaz de responder, en un tiempo aceptable, a cualquier consulta sobre la información que mantiene.

Simplicidad:


Deben estar basadas en representaciones lógicas simples que permitan la verificación en la representación del problema que representan y, más aún, la modificación de nuevos ítems de datos y relaciones no ocasione una complejidad excesiva.

Integridad:


Veracidad de los datos almacenados con respecto a la información existente en el dominio del problema que trata la misma.

Seguridad y Privacidad:


La seguridad de una base de datos hace referencia a la capacidad de ésta para proteger los datos contra su pérdida total o parcial por fallos del sistema o por accesos accidentales o intencionados a los mismos. La privacidad de una base de datos hace referencia a la reserva de la información de la misma a personas no autorizadas.

Afinación:


La afinación hace referencia a la organización física de la información de la base de datos, la cual determina directamente el tiempo de respuesta de los procedimientos que operan sobre la misma.

Interfaz con el pasado y el futuro:



2.2. VENTAJAS DE UNA BASE DE DATOS

? Control centralizado de los datos, de los usuarios y de sus accesos.
? Mayor coherencia de los datos al eliminar la inconsistencia de los datos, disminuir la redundancia, tener procesos de transacciones y más facilidad en la gestión de errores.
? Almacenamiento físico eficiente (más compacto) que en el caso de los sistemas de gestión de datos basados en ficheros e independiente del equipo lógico en el que se instale la base de datos.
? Mantenimiento de la integridad de la base de datos aunque se compartan datos entre diferentes usuarios y sitios o se modifiquen los objetos que la forman. 3. CUANDO NO USAR UN SISTEMA GESTOR DE BASE
DE DATOS (SGBD)

La alta inversión inicial necesaria y la posible necesidad de hardware adicional.
El recargo de proporcionar seguridad control de la concurrencia,
capacidad de recuperación e integridad en los datos.
No se requieren accesos concurrentes

No se permite realizar comentarios.