Vous êtes sur la page 1sur 41

Bases de datos relacionales en la

clnica

Alex Snchez

Statistics and Bioinformatics Research Group


Statistics department, Universitat de Barelona

Statistics and Bioinformatics Unit


Vall dHebron Institut de Recerca
Contenido
Introduccin: Quien, que, que no
Bases de datos relacionales.
Acceso y recuperacin de la
informacin.
Problemas con las bases de datos.
Directrices para el manejo de datos.
Conclusiones.

http://ueb.ir.vhebron.net/bdclinica
Y quien es l
Introduccin
Todos los procesos
en que participamos
implican gestin de
informacin.
Las bases de datos y
los sistemas para
gestionarlas
permiten un manejo
eficiente de la
informacin.
Bases de datos
Una base de datos o banco de datos
es un conjunto de datos pertenecientes
a un mismo contexto y almacenados
sistemticamente para su posterior uso.
Ejemplos
Contactos del mvil
Pacientes del hospital
Datos de un estudio clnico
SGBD
Un sistema gestor de bases de datos
(SGBD) es un programa para la
[creacin] y
administracin (entrada, edicin, salida)
de datos de forma rpida y estructurada.
Ejemplos
Access (MS), Base (LO), Filemaker
SQL, Oracle

Qu/Que no
En esta sesin
Presentamos algunas ideas para diseo de
bases de datos relacionales de tipo personal
Ilustramos con ejemplos como llevarlo a cabo.
Valoramos algunos problemas que conlleva la
mala praxis en la gestin de los datos
NO discutimos
Bases de datos pre-existentes en el entorno
clnico u hospitalario.
Aspectos legislativos o de regulacin.
Un caso de estudio
The Infant Jaundice Study
Estudio de cohorte (nested double cohort).
Sujetos: Nios de 5 aos
con ictericia neonatal o sin ella
seleccionados al azar
de igual edad.
Variable predictora: Presencia/Ausencia Ict.
Variable respuesta: Puntuaciones neurofisiolgicas
(IQ [55-145]).
Newman, T. B., P. Liljestrand, et al. (2006). "Outcomes among
newborns with total serum bilirubin levels of 25 mg per deciliter or
more." N Engl J Med 354(18): 1889-900.
Datos del estudio
Unos 400 nios
Nombre, Fecha nac., Sexo, Etnia, Raza
5 mdicos para examinarlos.
Unos 700 examenes neurofisiolgicos
Fecha examen, Peso, Altura, Edad, IQ
Los examinadores no se repiten nunca.
Si el nio ha fallecido antes de los 5
aos se registra su edad y circunstancia
de la muerte.
Como almacenar los datos
Paso 0: decidir un formato para
almacenar los datos.
Dos opciones obvias
Hoja de clculo o base de datos de SPSS
Base de datos relacional
Aproximacin naf
Usar hoja de clculo Importar SPSS/R
Intuitivo y directo pero...
Dificil de compartir datos entre usuarios
Integridad de los datos difcil de mantener
Un ordenar mal aplicado deshace la BD
Poco control sobre pequeas variaciones
Snchez <> Sanchez <> SANCHEZ
Puede aceptar un 30-02-2012
Mala gestin de los datos redundantes
Nombre o direccin repetidos en muchas filas
Alternativa:
Bases de datos relacionales
Coleccin de tablas parecidas a hojas de
clculo en donde
Filas = registros = entidades
Columnas = caractersticas = atributos
En cada tabla:
Columna con un valor nico: clave primaria
Columna con valor de clave primaria de otra tabla:
clave externa.
Las tablas pueden relacionarse a travs de sus
claves
Tabla de sujetos del estudio
Comn a cualquier
estudio.
Nombre, Fecha.
Nac., Sexo,
Afectado,
Clave principal?
DOB o Nombre estan
repetidos
Mejor crear una clave
nica y artificial para
cada registro.
Clave principal
Aignando una ID
distinta a cada
participante se
garantiza la
identidad nica
de cada sujeto
en el estudio.
Las variables del estudio (1)
Mediciones realizadas sobre los sujetos
Pueden incluirse en la tabla si hay tan slo
una por sujeto.
Puede ser recomendable mantenerlas
aparte si cambian dinmicamente a lo largo
del estudio.
No es recomendable incluirlas en esta tabla
si puede haber ms de una (en n variable)
por sujeto.
Sujetos y variables juntos
De una a varias tablas
Si el nmero de campos crece en
exceso
Puede ser conveniente fraccionar la tabla en
varias ms pequeas y homogneas.
Si aparecen medidas repetidas en
nmero variable o fijo por sujeto
Puede ser conveniente almacenarlas en una
tabla relacionada
Lo que no hay que hacer
Tampoco hay que duplicar datos

Al duplicar nombres o fechas posibles


errores
El ID de sujeto no es nico para esta tabla.
Los sujetos sin examen no aparecen
Solucin : Normalizacin
Relacin uno-a-muchos

La tabla con informacin redundante se descompone en dos


tablas menores enlazadas por una clave que es:
externa en la tabla hija.
principal en la tabla padre
Definir una relacin una-a-
muchos
Otras formas de relacin
La relacin uno-a-muchos aparece
fcilmente.
Sugiere que pueda haberlas
uno-a-uno
muchos-a-muchos
Relacin uno-a-uno

Algunos campos son propios del sujeto pero slo unos


pocos lo presentan.
La mayora de los sujetos no tienen valores para ellos
Se desperdicia espacio en la base de datos
Relaciones uno-a-uno

Si creamos una
tabla aparte
eliminamos los
campos vacos
y el gasto de
espacio
Una BD relacional
Integridad referencial

Un buen SGBD mantiene la integridad referencia,


es decir:
No asigna revisin a pacientes inexistentes,
No les asigna un doctor no registrado,
No permite eliminar un paciente sin antes borrar sus
revisiones,
Una base de datos con integridad referencial
reduce al mnimo la necesidad de depurar y limpiar
la BD despus de introducir los datos.
La base de datos final
Algunas ideas ms
Campos calculados
No hay que almacenarlos sino calcularlos
Conceptos bsicos
Diccionario de datos
Tipos de datos
Dominios
[Las formas normales de los datos]
Campos calculados?-No gracias

Muchos valores son calculables a partir


de otros campos
Duracin tr.= Fecha Fin Tr- fecha Inicio Tr.
Los SGBD permiten obtenerlos
dinmicamente en vez de definirlos
como campos
Se actualizan si cambian los valores en que
se basan.
No usar campos calculados!

Un campo como edad en meses se debera evitar pues


no se actualiza si cambia la fecha de edad.
Diccionarios, Tipos y Dominios de datos
Entrada y salida de informacin

Lo hacen los SGBD, no las BD!!!


Manejando la informacin
Un usuario quiere manejar sus datos,
Entrar y modificar datos
Verlos, Ordenarlos, Seleccionarlos,
Extraer o listados o exportarlos.
La mayora de las BD permiten extraer
informacin mediante consultas
Algunos SGBD permiten
La entrada de datos mediante formularios.
El listado de datos mediante informes.
Consultas o queries
La ventaja de un sistema bien hecho
basado en mltiples tablas es la
posibilidad de extraer la informacin de
muchas formas.
Nombre y edad de todos los sujetos
examinados entre enero y febrero del 2010
(Siendo muy especfico no tiene sentido
crear una tabla para esto)
Consulta en access o SQL

SELECT Baby.SubjectID, Baby.DOB, Exam.ExDate


FROM Baby INNER JOIN Exam ON Baby.SubjectID =
Exam.SubjectID
WHERE Exam.ExDate Between #1/1/2010# And #2/28/2010#
ORDER BY Exam.ExDate;
Resultado de la consulta
Los resultados de
una consulta son
como tablas
virtuales
No existen
fsicamente
Creadas
dinmicamente
Pueden exportarse
como tablas o hojas
de clculo.
Una consulta de actualizacin
Resultado: valores calculados
Directrices para la gestin de bases
de datos en la clnica
Algunas directrices
1. Establecer las tablas de la bases de datos y las
relaciones correctamente desde el principio.
2. Establecer y seguir las convenciones de nombres para
las columnas y tablas.
3. Obtener informacin de base demogrfica y clnica
sobre los miembros de la poblacin de estudio a partir
de bases de datos informticas existentes.
4. Minimizar el grado en que las mediciones de estudio
se registran en formularios de papel.
5. Utilizar convenciones estndar de entrada de datos.
6. Realizar copias de seguridad de la base de datos con
regularidad.

Vous aimerez peut-être aussi