Vous êtes sur la page 1sur 6

Qu crees que pasara si la calidad en

los datos estuviera ausente en las


aplicaciones de bases de datos referentes
a transacciones bancarias, compras,
ventas, manejo de datos personales?

La calidad de datos consiste en actualizar, completar y mejorar toda la informacin que


contiene la base de datos, de manera que sea fiable y apta para el fin que se cre. Por
tanto, es de vital importancia asegurar dicha calidad, adoptando mtodos, tcnicas y
procesos, desde el momento mismo del diseo de la base de datos.
Mantener o crear un sistema de base de datos con una calidad de datos deficiente va a
repercutir en prdidas de clientes, de negocios, de ventas o de tiempo, dependiendo del giro
de la empresa u organizacin; adems, se pueden efectuar tomas de decisiones errneas por
basarse en datos incorrectos o con calidad deficiente.
Una base de datos carente de calidad, en los datos que maneja, puede presentar problemas,
como datos intiles e innecesarios, redundancia de datos fuera de control, y una gran
cantidad de datos histricos que han caducado.

.1 Integridad

Las restricciones inherentes, las restricciones explcitas y las restricciones semnticas, son
consideradas cuando se disea la estructura de la base de datos, y son necesarias para
asegurar su estado correcto o consistente, es decir, aseguran la calidad de los datos de la
base de datos.

Para ejemplificar los tipos de integridad existentes y cmo lo implementa un SMBD, se


presenta la teora que SQL Server, toma como base para el desarrollo de sus funcionalidades
la biblioteca Technet:
Tipo de integridad Definicin

Restricciones en SQL server

Integridad de
entidad

Define una fila como entidad nica, para una ndices y restricciones UNIQUE, o
tabla determinada. Exige la integridad de las restricciones PRIMARY KEY.
columnas de los identificadores o la clave
principal de una tabla.

Integridad de
dominio

Validez de las entradas para una columna


determinada. Puede exigir la integridad de
dominio, para restringir el tipo mediante
tipos de datos.

Restringir el tipo mediante tipos de datos,


el formato mediante reglas y restricciones
CHECK, o el intervalo de valores posibles
mediante restricciones FOREIGN KEY,
restricciones CHECK, definiciones DEFAULT,
definiciones NOT NULL y reglas.

Integridad
referencial

Protege las relaciones definidas entre las


tablas, cuando se crean o se eliminan filas.
Garantiza que los valores de clave sean
coherentes en las distintas tablas, que no
haya referencias a valores inexistentes y
que, si cambia el valor de una clave, todas
las referencias a ella se cambien en
consecuencia en toda la base de datos.

Restricciones FOREIGN KEY y CHECK

La integridad
definida por el
usuario

Permite definir reglas de empresa


especficas, que no pertenecen a ninguna
otra categora de integridad.

Esto incluye todas las restricciones de nivel


de columna y nivel de tabla, en CREATE
TABLE, procedimientos almacenados y
desencadenadores.

La falta de calidad, en los datos, asociada a la falta de integridad y al mal diseo de la


base de datos puede ocasionar:

Mltiples fuentes de la misma informacin producen diferentes valores.

Grandes volmenes de informacin almacenada hacen difcil el acceso en tiempo


razonable.

La heterogeneidad, en los sistemas distribuidos, puede producir definiciones,


formatos y valores inconsistentes.

La informacin no numrica es difcil de indexar.

No se dispone todava de anlisis automtico a lo largo de colecciones de datos.

Al cambiar las tareas de los consumidores de informacin y el entorno organizacional,


la informacin que es relevante y til tambin cambia.

La facilidad de acceso a la informacin puede entrar en conflicto con los requisitos


de seguridad, privacidad y confidencialidad.

3.2 Acciones
Para tratar de evitar o en su defecto disminuir la problemtica asociada a la falta de la
calidad en los datos, es necesario llevar a cabo diversas acciones, como asegurarse de la
calidad en las aplicaciones, en el sistema de base de datos y en el diseo del modelo mismo:

Exigir la integridad de datos.

Control de concurrencia en el acceso y


modificacin de los datos, conseguido al
tratarse de una aplicacin Web, que
permite el acceso simultneo de varios
usuarios a la informacin.

Desarrollo de aplicaciones escalables, es


decir, que prevn la adaptacin a cambios
de formato o nuevos requisitos funcionales.

Divisin del trabajo en posibles estados, por los que puede pasar la informacin.
Establecer un control de flujo, evitando pasar a la siguiente fase hasta que no
termina la anterior, asegurando que no se deja ningn paso sin hacer.

Control total de usuarios que tienen acceso a la aplicacin, y control estricto de los
perfiles a los que pertenecen. Los usuarios estarn dentro de un perfil concreto, que
les proporcionar acceso solo a determinadas funciones o datos.

Realizar auditoras de control de cambios, que permitan conocer en cualquier


momento todos los estados por los que ha pasado la informacin auditada, valor
anterior y nuevo, usuario que realiz los cambios, fecha, validacin usada para el
cambio producido, etc.

Llevar un control de cambios de los valores posibles de los datos, no permitiendo


introducir incoherencias en la informacin.

Llevar un control de campos que pueden ser modificados para cada regla de
validacin, evitando errores accidentales sobre campos correctos.

Tomado de la biblioteca TechNet de Microsoft SQL Server, se presenta un ejemplo en el que


se muestra la problemtica que puede ocasionar la falta de calidad en los datos, al no
proteger las relaciones definidas entre tablas, cuando se crean o eliminan filas, es decir, no
se cuida la integridad referencial:
En las tablas de la siguiene figura Sales.SalesOrderDetail y Production.Product de la base de
datos AdventureWorks2008R2 proporcionada por CodePlex (2012), la integridad referencial se
basa en la relacin entre la clave externa (ProductID) de la tabla Sales.SalesOrderDetail y la
clave principal (ProductID) de la tabla Production.Product.
Esta relacin garantiza que un pedido de ventas no pueda nunca hacer referencia a un
producto que no existe en la tabla.

Production.Product.

La integridad referencial (el SMBD), en este caso SQL Server, restringir a los usuarios de
realizar las operaciones en las filas, tal como:

Agregar o cambiar filas en una tabla relacionada, si no hay ninguna fila asociada en
la tabla principal.

Cambiar valores en una tabla principal, que crea filas hurfanas en una tabla
relacionada.

Eliminar filas de una tabla principal, cuando hay filas relacionadas coincidentes.

Adems de implementar y ejecutar un plan de acciones -para el aseguramiento de la calidad


de datos en la base de datos- se recomienda el uso de herramientas que son desarrolladas
especficamente con los mecanismos necesarios para conocer el estado de la base de datos,
proponer mejoras en la calidad y efectuar tareas, que dejan la base de datos con calidad en
los datos que manejan.
Entre las herramientas que existen para la calidad de datos, estn las herramientas
comerciales y tambin herramientas que vienen includas con el SMBD, sin que se tenga que
pagar licencia adicional.
Como ejemplo, se tiene el DQS (Data Quality Services, 2012) que es un producto que se
incluye en el SQL Server 2012, y lleva a cabo diversas actividades de calidad de datos, como
las correcciones, el enriquecimiento, la estandarizacin y la eliminacin de datos
duplicados. Entre las caractersticas y tareas de DQS se encuentran:

Aplicacin cliente de calidad de datos

Bases de conocimiento y dominios de DQS

Proyectos de calidad de datos (DQS)

Limpieza de datos

Coincidencia de datos

Servicios de datos de referencia en DQS

Generacin de perfiles de datos y notificaciones de DQS

Otras herramientas desarrolladas para la calidad de datos en las bases de datos son:

Oracle Enterprise Data Quality

Oracle Warehouse Builder

Data profiling (SQL SERVER 2008)

Conclusin
Cada vez son ms las actividades que se suman a la utilizacin de sistemas informticos que
utilizan bases de datos con informacin, que puede ser blanco fcil de ataques cibernticos,
invasin de privacidad, fraudes y malos manejos, que ponen en riesgo desde la calidad de
vida del afectado, hasta la viabilidad de negocios. Por este motivo, se requiere del
desarrollo de sistemas que manejen la informacin de forma segura.
Con respecto a la accesibilidad de los datos, es importante que los sistemas proporcionen
resultados confiables, rpidos y seguros, adems de que estn disponibles en cualquier
momento, pero solo para quien sean requeridos.
La calidad de datos depende, en gran medida, de las especificaciones de diseo, en cuanto a
las restricciones establecidas. Adems, es importante incluir el uso de herramientas de
calidad de datos, como una actividad ms en la bsqueda de sistemas de bases de datos
confiables y eficientes.
Referencias bibliogrficas:

CodePlex Project Hosting for Open Source Software. Comunity Projects & Products
Samples. Microsoft Sql Server (2012). Recuperado de
http://sqlserversamples.codeplex.com/

Data Quality Server. Microsoft (2012). Recuperado de http://msdn.microsoft.com/eses/library/hh213042.aspx

Asegrate de poder:

Explicar el concepto de integridad y los problemas, que pueden disminuir o nulificar


la calidad de los datos en base de datos.

Describir las acciones que pueden asegurar la calidad de los datos en un sistema de
bases de datos relacional.

Tarea 1:
Instrucciones:
1. Realiza las tablas necesarias en una base de datos para almacenar la informacin de
tu grupo en esta materia, mostrando calificaciones, maestra a la que pertenecen e
institucin educativa.
2. Una vez que tengas diseada la base de datos, es necesario que realices en SQL al
menos 5 consultas para mostrar los datos ms importantes.
3. Agrega a tu trabajo tres opciones de SMBD, que utilizaras para implementarlos,
llevando a cabo lo siguiente:
a. Realiza una tabla comparativa de sus caractersticas.
b. Enlista las ventajas y desventajas principales de cada uno.
c. Indica cules son los ms utilizados y por qu.
4. Busca diseos de bases de datos, elige el que te parezca ms completo.
5. Esta informacin te ser til para la prxima actividad.
Realiza la entrega de tu ejercicio en forma de reporte.

Vous aimerez peut-être aussi