Bases de Datos Relacionales en La Clinica - v3 PDF
Bases de Datos Relacionales en La Clinica - v3 PDF
Bases de Datos Relacionales en La Clinica - v3 PDF
clínica
Alex Sánchez
http://ueb.ir.vhebron.net/bdclinica
Y quien es él…
Introducción
• Todos los procesos
en que participamos
implican gestión de
información.
• Las bases de datos y
los sistemas para
gestionarlas
permiten un manejo
eficiente de la
información.
Bases de datos
• Una base de datos o banco de datos
es un conjunto de datos pertenecientes
a un mismo contexto y almacenados
sistemáticamente para su posterior uso.
• Ejemplos
– Contactos del móvil
– Pacientes del hospital
– Datos de un estudio clínico
SGBD
• Un sistema gestor de bases de datos
(SGBD) es un programa para la
– [creación] y
– administración (entrada, edición, salida)
de datos de forma rápida y estructurada.
• Ejemplos
– Access (MS), Base (LO), Filemaker
– SQL, Oracle
–…
Qué/Que no
• En esta sesión
– Presentamos algunas ideas para diseño de
bases de datos relacionales de tipo “personal”
– Ilustramos con ejemplos como llevarlo a cabo.
– Valoramos algunos problemas que conlleva la
mala praxis en la gestión de los datos
• NO discutimos
– Bases de datos pre-existentes en el entorno
clínico u hospitalario.
– Aspectos legislativos o de regulación.
Un caso de estudio
• The “Infant Jaundice Study”
– Estudio de cohorte (nested double cohort).
– Sujetos: Niños de 5 años
• con ictericia neonatal o sin ella
• seleccionados al azar
• de igual edad.
– Variable predictora: Presencia/Ausencia Ict.
– Variable respuesta: Puntuaciones neurofisiológicas
(IQ [55-145]).
Newman, T. B., P. Liljestrand, et al. (2006). "Outcomes among
newborns with total serum bilirubin levels of 25 mg per deciliter or
more." N Engl J Med 354(18): 1889-900.
Datos del estudio
• Unos 400 niños
– Nombre, Fecha nac., Sexo, Etnia, Raza
• 5 médicos para examinarlos.
• Unos 700 examenes neurofisiológicos
– Fecha examen, Peso, Altura, Edad, IQ
• Los examinadores no se repiten nunca.
• Si el niño ha fallecido antes de los 5
años se registra su edad y circunstancia
de la muerte.
Como almacenar los datos
• Paso 0: decidir un formato para
almacenar los datos.
• Dos opciones obvias
– Hoja de cálculo o “base de datos” de SPSS
– Base de datos relacional
Aproximación “naïf”
• Usar hoja de cálculo Importar SPSS/R
Intuitivo y directo pero...
Dificil de compartir datos entre usuarios
Integridad de los datos difícil de mantener
Un “ordenar” mal aplicado deshace la BD
Poco control sobre pequeñas variaciones
Sánchez <> Sanchez <> SANCHEZ
Puede aceptar un 30-02-2012
Mala gestión de los datos redundantes
Nombre o dirección repetidos en muchas filas
Alternativa:
Bases de datos relacionales
• Colección de tablas parecidas a hojas de
cálculo en donde
– Filas = registros = “entidades”
– Columnas = características = “atributos”
• En cada tabla:
– Columna con un valor único: clave primaria
– Columna con valor de clave primaria de otra tabla:
clave externa.
– Las tablas pueden relacionarse a través de sus
claves
Tabla de sujetos del estudio
• Común a cualquier
estudio.
• Nombre, Fecha.
Nac., Sexo,
Afectado, …
• Clave principal?
– DOB o Nombre estan
repetidos
– Mejor crear una clave
única y artificial para
cada registro.
Clave principal
• Aignando una ID
distinta a cada
participante se
garantiza la
identidad única
de cada sujeto
en el estudio.
Las variables del estudio (1)
• Mediciones realizadas sobre los sujetos
– Pueden incluirse en la tabla si hay tan sólo
una por sujeto.
– Puede ser recomendable mantenerlas
aparte si cambian dinámicamente a lo largo
del estudio.
– No es recomendable incluirlas en esta tabla
si puede haber más de una (en nº variable)
por sujeto.
Sujetos y variables juntos
De una a varias tablas
• Si el número de campos crece en
exceso
– Puede ser conveniente fraccionar la tabla en
varias más pequeñas y homogéneas.
• Si aparecen medidas repetidas en
número variable o fijo por sujeto
– Puede ser conveniente almacenarlas en una
tabla relacionada
Lo que no hay que hacer …
Tampoco hay que duplicar datos
• Si creamos una
tabla aparte
eliminamos los
campos vacíos
y el gasto de
espacio
Una BD relacional
Integridad referencial