Vous êtes sur la page 1sur 51

Ortopedia basada en la evidencia

Historia de la medicina basada en la evidencia

Cuando Gordon Guyatt introdujo, por primera vez, el término


medicina basada en la evidencia (MBE), en un documento informal
de un programa de adiestramiento de residencia, lo calificó como
"Una actitud de escepticismo progresista hacia la aplicación de
tecnologías de diagnóstico, pronóstico y terapéutica en el manejo
cotidiano de los pacientes". Posteriormente, describió a la MBE en
un editorial; y tanto el término como su filosofía –influidos
fundamentalmente por los primeros trabajos de epidemiólogos
clínicos en la Universidad de McMaster dirigidos por David Sackett
– fueron difundidos en una serie de artículos publicados por el
grupo de trabajo sobre la medicina basada en la evidencia.
La medicina basada en la evidencia ha extendido su campo
de acción para incluir a la enfermería, la fisioterapia, la terapia
ocupacional, la podología, y la especialización basada en la
evidencia. Necesitamos obstetricia, ginecología, medicina interna y
cirugía basadas en la evidencia - - y, por supuesto, es necesaria la
cirugía ortopédica basada en la evidencia (OBE).
Diferencias entre la ortopedia basada en la evidencia y los enfoques
tradicionales de la prestación de asistencia médica.

De acuerdo con el paradigma tradicional, los clínicos evalúan


y solucionan los problemas clínicos reflexionando sobre su propia
experiencia clínica o sobre la biología y la fisiopatología
subyacentes, consultando libros de texto o a un experto local.
Muchos profesionales tradicionales consideran que basta con leer
las secciones de Introducción y de Discusión de un artículo de
investigación médica para adquirir la información pertinente, y que
las observaciones de la experiencia clínica cotidiana constituyen
medios válidos para elaborar y mantener el conocimiento sobre la
prognosis del paciente, el valor de las pruebas diagnósticas, y la
eficacia del tratamiento. El estudio y el conocimiento de los
mecanismos básicos de la enfermedad y de los principios de la
fisiopatología constituyen, por tanto, guías adecuadas para la
práctica clínica. Puesto que este paradigma concede alto valor a la
autoridad científica tradicional y a la adhesión a los enfoques
normales, la formación médica tradicional y el sentido común
constituyen bases suficientes para evaluar nuevas pruebas y
tratamientos. Y los conocimientos especializados del contenido y la
experiencia clínica constituyen puntos de apoyo suficientes para
generar pautas para la práctica clínica.
Si bien la fisiopatología, la experiencia clínica, y la intuición
son necesarias, no son suficientes para guiar la práctica, porque
podrían ser incorrectas y conducir a pronósticos inexactos sobre la
actuación de las pruebas diagnósticas y la eficacia de los
tratamientos. Al igual que el enfoque tradicional de la atención
médica, el paradigma de la atención médica basada en la evidencia
también supone que la experiencia clínica y el desarrollo de los
instintos clínicos (particularmente en cuanto al diagnóstico) son
elementos cruciales de la competencia del médico. Sin embargo, el
enfoque de la ortopedia basada en la evidencia (OBE) incluye
varios pasos adicionales. Entre dichos pasos se encuentran usar la
experiencia del médico para identificar sus lagunas acerca de
conocimientos importantes y su necesidad de información; redactar
esas necesidades formulando preguntas que puedan ser
respondidas; identificar investigaciones potencialmente pertinentes;
evaluar con exactitud la validez de la evidencia y de los resultados;
desarrollar políticas clínicas que vinculen las evidencias obtenidas
en la investigación con las circunstancias clínicas; y aplicar
apropiadamente la evidencia de la investigación a pacientes
individuales con sus experiencias, expectativas, y valores
particulares.
Los que practican la medicina basada en la evidencia (por
ejemplo, los clínicos que trabajan bajo el paradigma de OBE)
consultan regularmente literatura original, entre la que se
encuentran las secciones de Métodos y Resultados de los artículos
de investigación, y otras fuentes confiables de evidencias para que
los ayuden solucionar problemas clínicos. A fin de usar con eficacia
la literatura especializada, se ha de poseer capacidad para evaluar
de modo independiente la evidencia ofrecida y la credibilidad de la
opinión de expertos. A su vez, para interpretar correctamente la
literatura sobre pronóstico, pruebas diagnósticas, tratamiento y
exposiciones potencialmente perjudiciales (efectos secundarios,
exposiciones al medio ambiente) hay que entender la jerarquía de
la evidencia. Por ejemplo, al tomar decisiones en cuanto al
tratamiento, los profesionales de OBE pueden realizar una prueba
aleatoria de N igual a 1 (ensayo aleatorio en pacientes individuales,
el paciente es tratado reiteradamente con intervención activa o
placebo) para determinar el tratamiento óptimo para un paciente
determinado, o pueden solicitar una evaluación sistemática de las
pruebas aleatorias de las alternativas de tratamiento. Si no se
encuentra disponible una evaluación sistemática, buscarán los
ensayos aleatorios individuales y estudios de observación de
buena calidad de las estrategias de manejo relevantes. Si la
literatura carece de información al respecto, los profesionales de
OBE recurrirán a la biología, la fisiopatología y la experiencia
clínica subyacentes.

Resumen

Mientras que, a menudo, se percibe a la OBE como una


adhesión estrecha de miras a los ensayos aleatorios, ésta implica
el uso eficaz e informado de evidencia de todo tipo, pero en
particular de la evidencia de la literatura médica obtenida en la
atención médica dada al paciente. Debido a la cantidad siempre
creciente de información disponible, los cirujanos deben considerar
un cambio del paradigma de la práctica tradicional a otro que
entrañe la formulación de preguntas, evaluación de la validez de los
estudios disponibles y aplicación apropiada de los resultados de
investigación en pacientes individuales.
Jerarquía del diseño de investigación

Introducción

En esta sección se presenta un enfoque para organizar las


investigaciones publicadas sobre la base del diseño del estudio, una
jerarquía de la evidencia. Se abordarán las características
fundamentales y las ventajas y desventajas de diseños de
investigación específicos. Esperamos que los conceptos
presentados posibilitarán, a los médicos clínicos y al personal de
salud, prestar atención médica en el contexto de la ortopedia
basada en la evidencia.

Tipos de diseños de investigación

Los tipos de diseños de investigación empleados en la


investigación clínica pueden clasificarse, en líneas generales, como
los que concentran la atención en describir la distribución o las
características de las características de una enfermedad, o los que
la concentran en dilucidar sus factores determinantes.
Los estudios descriptivos, como su nombre implica,
describen la distribución de una enfermedad, en particular, a las
personas que la padecen, en qué lugar y cuándo ocurre. Los
estudios transversales, los informes de caso, y las series de
estudios de caso representan tipos de estudios descriptivos.
Los estudios de caso son un diseño de estudio descriptivo
no controlado que entraña una intervención y un desenlace con un
perfil detallado de un paciente. La ampliación del informe de caso
individual para incluir a múltiples pacientes constituye una serie de
estudio de caso. Aunque la capacidad de los estudios descriptivos
para hacer las inferencias causales, sobre la relación entre los
factores de riesgo y un resultado de interés, es limitada, dichos
estudios son de utilidad para desarrollar una hipótesis que puede
ser sometida a prueba mediante el uso de un diseño de estudio
analítico.
Los estudios analíticos se concentran en los factores
determinantes de una enfermedad al someter a prueba una
hipótesis con el objetivo final de juzgar si una exposición en
particular causa o previene una enfermedad. Las estrategias de
diseño analíticas se dividen en dos tipos: estudios de
observación, como los estudios de control de caso y de cohorte, y
los estudios experimentales, también llamados ensayos clínicos.
La diferencia entre los dos tipos de estudios analíticos la constituye
el papel que desempeña el investigador en cada uno de los
estudios. En el estudio de observación, el investigador sólo observa
el curso natural de los acontecimientos. En el ensayo, el
investigador determina la intervención o el tratamiento.
Un tipo de estudio de observación es el estudio de control de
caso que comienza con la identificación de los individuos, de casos
de interés, que ya tienen desenlace, los cuales son comparados con
un grupo de control adecuado sin desenlace. La relación entre una
intervención en particular o factor de pronóstico y el desenlace de
interés se examina mediante la comparación del número de
personas individuales con cada intervención o factor de pronóstico
en los casos y los controles. Los estudios de caso controlados se
describirán en detalle más adelante.
En el diseño de un estudio de cohorte, la cohorte
representa a un grupo de las personas a las que se les sigue
durante un período de tiempo para ver si ocurre un desenlace de
interés. De modo ideal, este grupo cumple un cierto nivel de
criterios predeterminados representativos de una población de
interés y es seguido con variables de desenlace bien definidas.
Generalmente, este grupo se empareja con una población control
seleccionada por la presencia o ausencia de exposición a un factor
de interés. El propósito de este tipo de estudio es describir la
ocurrencia de ciertos resultados en el transcurso del tiempo y
analizar las asociaciones entre los factores de pronóstico y dichos
desenlaces. El estudio de cohorte prospectivo se describirá, en
mayor detalle, más adelante.
Los ensayos aleatorizados controlados son considerados,
tradicionalmente, como el patrón contra el cual todos los otros
diseños deben ser contrastados. En un ensayo aleatorio
controlado, los pacientes son asignados a un grupo de tratamiento o
a uno de control. Por lo general, el grupo de control recibe un
tratamiento aceptado o no recibe ninguno, mientras que el grupo de
tratamiento es asignado a la intervención de interés. Se considera
que los ensayos aleatorizados controlados representan la evidencia
de mayor calidad, sobre la base de las fortalezas metodológicas de
la aleatoriedad de la asignación del paciente y la condición a ciegas
de la intervención y del desenlace. El ensayo aleatorizado
controlado se describirá, en mayor detalle, más adelante.
Tabla: Jerarquía de la Evidencia
DISEÑO DEL ESTUDIO MENOS SESGO
Ensayos aleatorizados controlados
Ensayos Controlados ( ej. estudios de antes y después)
Estudios de Caso de Control y de Cohorte
Estudios transversales
Opinión de Experto, Informes de Caso y Series de
Estudios de Caso

Niveles de las evidencias (pruebas)

Los investigadores han intentado reducir al mínimo el daño


que puede ocasionarse a los pacientes al basar las decisiones
clínicas en los tipos de evidencia menos probables de ser erróneos.
Dos estudios definieron lo que se consideró como la evidencia que
proporcionó el estimado menos sesgado del efecto de una
intervención: una revisión sistemática (o meta análisis) que
documentó la homogeneidad de los resultados en un gran número
de ensayos aleatorizados controlados de alta calidad (aleatorio a
ciegas, seguimiento completo, y análisis de todos los aleatorios
denominado análisis de intención de tratar). Dicha evidencia se
denomina Evidencia de Nivel 1. Además, los investigadores
categorizaron los estudios de una intervención sobre la base del
creciente grado de sesgo potencial: revisiones sistemáticas con los
juicios aleatorios controlados que revelan diferencias en el efecto
del tratamiento (heterogeneidad); pruebas aleatorizadas controladas
individuales de elevada calidad (Pruebas de nivel IB); pruebas
aleatorizadas controladas menos rigurosas; estudios de cohorte o
de observación ( Prueba de Nivel 2); estudios de caso control (
Evidencia de Nivel 3); series de estudios de caso ( Evidencia de
Nivel 4) y luego opinión de experto (Evidencia de Nivel 5). Sobre la
base de los varios niveles de pruebas en un tratamiento especial,
los grados de la recomendación pueden ser determinados. Por
ejemplo, Sackett propuso los siguientes grados de
recomendaciones: 1) grado A – Estudios de Nivel 1, 2) grado B –
Estudios Nivel 2 ó de Nivel 3; 3) grado C – Estudios de Nivel 4;
parejos, y 4) grado D – Nivel 5 de evidencia.
Tabla: Jerarquía de la Evidencia
Nivel de pruebas Grado de las
recomendaciones
Nivel I: Grandes ensayos aleatorios con A
resultados bien definidos y bajo
riesgo de error; o Meta análisis de
Ensayos Aleatorios con resultados
homogéneos (similares) e
intervalos de confianza estrechos.
Nivel II: Ensayos aleatorios con resultados B
inciertos y/o riesgo de error de
moderado a alto; estudios de
cohorte de alta calidad
Nivel III: Estudios de caso controlados; o B
meta análisis de estudios de caso
controlados.
Nivel IV: Serie de estudios de caso no C
controlados
Nivel V: Opinión de experto sin evaluación D
crítica explícita, o basada en la
fisiología o prueba de laboratorio

Evaluaciones sistemáticas y Meta análisis


Conducción de una revisión sistemática

La condición sine qua non de las revisiones sistemáticas es


la búsqueda sistemática y la identificación de los estudios.
Bhandari y otros hallaron que en el 83 % de los meta análisis en
ortopedia se mencionaron explícitamente los métodos utilizados en
la búsqueda de la evidencia y que en el 73 % de los meta-análisis
se emplearon estrategias razonablemente integrales. Con el
término sistemático nos referimos al uso de un protocolo de
búsqueda que relaciona todas fuentes de datos potenciales y de las
múltiples estrategias, (que a menudo se solapan) para ser
consultadas. La preocupación principal la constituye el hecho de
que estudios importantes pudieran ser pasados por alto si los que
realizan la revisión bibliográfica realizan una selección limitada de
las fuentes de datos. Las bases de datos electrónicas, como
MEDLINE (producida por la Biblioteca Nacional de Medicina de los
Estados Unidos, libremente accesible), suministran el mayor
volumen de datos para la mayoría de las revisiones sistemáticas.
MEDLINE indiza a un gran número de publicaciones,
principalmente de los Estados Unidos (EMBASE, otra base de datos
electrónica popular, presenta solapamientos importantes con
MEDLINE pero tiene mayor cobertura de estudios multidisciplinarios
y de los realizados en Europa). Por ejemplo, elegir buscar sólo en
MEDLINE también entraña buscar principalmente estudios
publicados en inglés. Las búsquedas limitadas (como en las que se
busca exclusivamente estudios publicados por revistas de críticas
de homólogos, en inglés, o muy recientes) podrían resultar en una
muestra sesgada de la evidencia (en lugar de contener toda la
evidencia disponible) y sesgar el resumen de la evidencia. Uno de
dichos sesgos puede ocasionar un sesgo de publicación.
El próximo paso al hacer una revisión sistemática es la
selección de los estudios que serán incluidos en la revisión. Por lo
general, la pregunta define el tipo de estudio que se incluirá y, por
lo tanto, los criterios de inclusión y exclusión. Al definirlos, como en
todos los pasos anteriores, los expertos en los temas y los
metodólogos de investigación hacen, por lo general, aportes
importantes. Los criterios de inclusión tienden a definir los diseños
del estudio de interés, así como, el tipo de pacientes, las
intervenciones, las intervenciones de control, y los desenlaces de
interés para responder a la pregunta de la revisión. Estos criterios
tienden a ser amplios e inclusivos, para que los resultados sean
generalizables mientras que, al mismo tiempo, reflejen la índole de
la pregunta abordada. Los criterios de exclusión tienden a ser
pocos y a limitar la muestra de estudio para aumentar la
homogeneidad y mantener el enfoque de la revisión. Los que
realizan la revisión bibliográfica deben determinar y definir los
criterios de inclusión y exclusión en el protocolo de la revisión.
Bhandari y otros mostraron que el 78 % de los meta análisis en
ortopedia reportaron explícitamente sus criterios para la inclusión de
estudios en la revisión, pero solamente el 43 % de los mismos
fueron considerados capaces de evitar sesgo en la selección de
estudios para la revisión.
Es importante limitar el sesgo del investigador durante todos
los aspectos de la evaluación. Para reiterar las amenazas a la
validez, incluso en un protocolo que contenga los métodos de
revisión, la investigación de revisión es un ejercicio retrospectivo y,
por lo tanto, está sujeto tanto a los errores aleatorios como a los
sistemáticos. La Colaboración Cochrane presenta protocolos de
revisión a expertos evaluadores para ser revisados con regularidad
y divulga protocolos en la Biblioteca Cochrane, para ser sometidos
a crítica abierta y extendida y para que se comenten, como otra
medida para evitar sesgo en el proceso de revisión. La aplicación
de criterios de inclusión y de exclusión a los abstracts y a los
trabajos de texto completo debe ser sometida a pilotaje, para
garantizar su aplicación uniforme por parte de los revisores.
Generalmente, dos o más revisores aplican estos criterios por
separado y después cuantifican sus desacuerdos (a veces con
métodos estadísticos que miden la concordancia más allá de la
probabilidad, como en la estadística kappa). Una concordancia
considerable entre los revisores (κ > 0.7) indica que los criterios
eran claros, objetivos, y que se aplicaron coherentemente. Los
desacuerdos se resuelven, a menudo, discutiéndolos o mediante el
arbitraje de un tercer revisor. El demostrar confiabilidad en la
selección de los artículos no elimina ningún tipo de error, pero sí
reduce la probabilidad de un error serio.
Debe haber garantías similares al resumir los datos de los
estudios de los estudios. Dichos datos deben guardar relación con
la pregunta de la revisión, estar especificados en el protocolo de
revisión y ser resumidos sistemáticamente. Debe emplearse un
proceso duplicado independiente, similar al descrito para la
selección de los artículos. El resumen de los datos se hace mejor
tras haber desarrollado un formulario estructurado y haberlo
sometido a prueba por parte de los revisores, para que resuma la
información clave de modo más eficiente y exacto. Después de que
se extraigan los datos se cuantifiquen y se resuelven los
desacuerdos, los mismos son introducidos en una base de datos (a
veces en duplicado o con las múltiples estrategias de verificación,
en dependencia del volumen de los datos y la capacidad del equipo
de revisión).
Quizás el elemento más importante en el resumen sea la
calidad metodológica de los estudios primarios. Dos de las
características metodológicas de las pruebas aleatorizadas para las
que existe evidencia empírica de sesgo son la ocultación de la
asignación, y el cegamiento. El hecho de ocultar la asignación de
modo tal que todos los participantes en el estudio no puedan
determinar en que grupo será asignado el próximo paciente que se
inscriba en el estudio, se reporta con poca frecuencia. También se
reporta poco la existencia de cegamiento y cuáles participantes del
estudio desconocieron la asignación después de la aleatorización y
durante todo el estudio.
En un resumen reciente, la baja calidad de los estudios
primarios trajo como resultado una sobreestimación de los efectos
del tratamiento por parte de 15 sujetos debido a un cegamiento
inadecuado y del 30% debido al ocultamiento de la secuencia de
asignación (en contraste con el impacto del sesgo del informe que
analizamos en los párrafos anteriores, el cual, al parecer, no es
mayor de 10%). A pesar de su importancia, los revisores pueden
hallar desafíos al resumir los elementos metodológicos de calidad
de cada estudio, si éstos están reportados de modo deficiente.
Bhandari y otros reportaron que en el 20% de los ensayos se brinda
información suficiente para poder determinar la pertinencia del
ocultamiento de la asignación y que en el 11% se reportó
cegamiento de los evaluadores de los desenlaces (a menudo el
único procedimiento de cegamiento práctico en los ensayos
quirúrgicos. Al igual que en los pasos anteriores de la revisión que
requieren el ejercicio del criterio para juzgar, cuando se dispone de
una metodología de estudio de evaluación, en la que se cuantifican
y se resuelven los desacuerdos por consenso o arbitraje, se
minimiza la introducción de sesgo.
Las revisiones sistemáticas precisan ser evaluadas
críticamente para determinar el grado hasta el cual los métodos
empleados limitan el sesgo, los resultados y su precisión, y la
aplicabilidad de los resultados de la situación clínica que provocó la
indagación. Esta estrategia de evaluación se encuentra contenida
en la “Users’ Guides Series,” la cual fue resumida recientemente en
un libro, por los miembros del grupo de trabajo de la medicina
basada en la evidencia. La guía de evaluación aplicada en los
estudios sistemáticos se resume en la tabla a continuación.
Tabla: Guías para el uso de un artículo revisado

¿Son válidos los resultados?


• ¿Abordó la revisión explícitamente una pregunta clínica sensata?
• ¿La búsqueda de estudios pertinentes fue detallada y exhaustiva?
• ¿La metodología de los estudios primarios era de alta calidad
metodológica?
•¿Las evaluaciones de los estudios podían ser reproducidas?

¿Qué son los resultados?

• ¿Los resultados eran similares de estudio a estudio?


• ¿Cuáles son los resultados generales de la revisión?
• ¿Cuán precisos son los resultados?

¿Cómo puedo aplicar los resultados al atender al paciente?

• ¿Cómo puedo interpretar mejor los resultados para aplicados a la


atención de mis pacientes en el ejercicio de mi profesión?
• ¿Se consideraron todos los resultados clínicos importantes?
• ¿Los beneficios merecen la pena dado el costo y los riesgos
potenciales?

Resumen

Las revisiones sistemáticas de la evidencia disponible


desempeñan un papel fundamental al establecer lo que conocemos
y lo que desconocemos y ofrecen información a los clínicos que
desean practicar la medicina basada en la evidencia. Los
resúmenes de la evidencia también facilitan la práctica clínica al
hacer posible que se base en la evidencia disponible y brindan
tiempo al clínico y al paciente para que ponderen los elementos a
ser tomados en consideración para su decisión, tales como sus
preferencias de atención médica y las circunstancias clínicas.
Dichos resúmenes constituyen herramientas valiosas para la
enseñanza. Además, la mayoría de los organismos que otorgan
subvenciones exigen una revisión sistemática de la literatura para
valorar de modo crítico lo hecho anteriormente, para construir sobre
fortalezas ya establecidas y crear nuevos conocimientos necesarios
para abordar la incertidumbre residual. Por tanto, las revisiones
sistemáticas y los meta-análisis ayudan a identificar áreas que
requieren más investigación.
Resumir sistemáticamente la evidencia es un esfuerzo
investigativo costoso y muy laborioso que no puede ser realizado
por médicos clínicos, a hurtadillas, durante su práctica clínica. Los
médicos clínicos, los maestros y los investigadores en ortopedia
deben considerar no sólo leer los ensayos clínicos de
intervenciones en ortopedia y realizarlos, sino todas las revisiones
sistemáticas de investigaciones que se hayan llevado a cabo.
Tenemos la esperanza de que esta discusión sirva para
incrementar ese entusiasmo.
Ensayos aletorizados controlados

Los ensayos aleatorizados controlados son considerados los


de mayor nivel de evidencia en la jerarquía de los diseños de
investigación. La aleatorización es el único método para controlar
los factores de pronóstico conocidos y los desconocidos entre dos
grupos que se comparan. La carencia de aleatorización predispone
un estudio a desequilibrios importantes en las características
basales entre los dos estudios. El papel de los estudios no
aleatorizados (observacionales) en la evaluación de los tratamientos
es un asunto que se discute constantemente: la elección deliberada
de un tratamiento para cada paciente implica que los resultados
observados puedan derivarse de las diferencias entre las personas
sometidas a los dos tratamientos, y no a los tratamientos
solamente. Los factores confusores no reconocidos pueden
interferir cuando se intente corregir las diferencias identificadas
entre los grupos. Se ha debatido mucho sobre si los resultados de
los estudios no aleatorizados concuerdan con los resultados de los
estudios aleatorizados controlados. Se ha reportado que los
estudios no aleatorizados u observacionales sobreestiman o
subestiman los efectos del tratamiento.
Ciertos investigadores han intentado reducir al mínimo el
daño que potencialmente puede ocasionarse a un paciente
sustentando las decisiones clínicas en el tipo de evidencia menos
probable de contener errores. Dos estudios definieron lo que se
consideró la evidencia que presenta el estimado menos sesgado de
una intervención: una revisión sistemática que documente la
homogeneidad de los resultados de un gran número de ensayos
controlados aleatorizados de alta calidad (aleatorizados con
ocultamiento, cegamiento, seguimiento completo y análisis de
intención de tratar). A esto se denominó Evidencia de Nivel 1 y las
recomendaciones fueron designadas como Grado A. Estas
consideraciones sustentan una jerarquía de evidencia: los ensayos
controlados aleatorizados ocupan la posición más alta, los ensayos
de observación controlados ocupan la posición media y los no
controlados y los de observación, la posición inferior. Sin embargo,
en dos publicaciones recientes, del New England Journal of
Medicine, que identificaron diferencias no significativas entre los
resultados de estudios aleatorios, controlados y de observación, no
apoyaron dichas consideraciones.
Tradicionalmente se considera que los ensayos controlados
constituyen el patrón contra el cual todos los demás diseños deben
ser contrastados. En los ensayos controlados aleatorizados, los
pacientes son asignados a un grupo de tratamiento o a un grupo
control. El grupo controlado recibe, normalmente, un tratamiento
aceptado o no recibe tratamiento alguno, mientras que el grupo de
tratamiento es asignado a una intervención de interés. Se piensa
que los ensayos controlados aleatorizados representan la evidencia
de más alta calidad basada en las fortalezas metodológicas de la
aleatorización, de la asignación del paciente, el cegamiento de la
intervención y el desenlace. A los estudios se les aleatoriza para
eliminar el sesgo selección para equilibrar los factores confusores
en ambos grupos. Al cegar a los sujetos o a los investigadores o a
ambos (doble ciego), se oculta la asignación del paciente para no
influir en el desenlace.
Ocasionalmente se llevan a cabo ensayos controlados sin
aleatorización, pero representan una clase de evidencia con menos
validez interna y sujeta al sesgo de selección. Un ejemplo de la
importancia de la aleatorización proviene de la literatura de
neurofisiología. Durante el decenio de 1970 y a principios del de
1980, los cirujanos realizaban frecuentemente una derivación
extracranial a intracraneal (anastomosis de una rama de la arteria
carótida externa, la temporal superficial, a una rama de la arteria
carótida interna, el cerebro medio). Pensaron que prevenía los
accidentes vasculares cerebrales en pacientes cuya enfermedad
cerebrovascular sintomática era inaccesible quirúrgicamente. Las
comparaciones de los desenlaces entre las cohortes de pacientes
no aleatorizados, quienes por varias razones fueron intervenidos
quirúrgicamente o no lo fueron, profundizaron sus convicciones.
Esos estudios sugieren parece que a los pacientes operados les
fue mucho mejor. No obstante, para sorpresa de los cirujanos, un
ensayo en un gran multicentro, en el cual los pacientes fueron
asignados a tratamiento quirúrgico o médico, mediante un proceso
similar a lanzar una moneda al aire (un ensayo aleatorizado
controlado), mostró que el único efecto de la cirugía fue aumentar
los desenlaces desfavorables en el periodo postoperatorio
inmediato.
Otro ejemplo conmovedor se encuentra en la literatura donde
se evalúa el papel del ultrasonido para la curación de una fractura.
En una encuesta realizada a fisioterapeutas, se identifico la
creencia que el ultrasonido estaba contraindicado en las fracturas.
Esas convicciones eran estimuladas en los libros de texto comunes.
Sin embargo, una revisión sistemática de la literatura realizada para
identificar la evidencia actual contradijo el paradigma anterior
presentado en la mayoría de los libros de texto de fisioterapia.
Cuando se evaluaron críticamente los ensayos aleatorizados, y se
agruparon sus resultados estadísticamente, resultó que el
ultrasonido de baja intensidad acorta, de modo significativo, el
tiempo de curación de las fracturas, medido por radiografías, en
comparación con los pacientes con placebo (dimensión media del
efecto= 64 días tamaño del efecto medio = 64 días; 95% intervalo
de confianza = 10.1 a 118 días).
La ventaja de un ensayo aleatorizado es la calidad del
estudio asociada con su validez interna inherente, porque las
variables confusoras potenciales pueden ser controladas,
proporcionando potencialmente, de ese modo, marcada evidencia
de las relaciones causa-efecto. Los ensayos controlados
aletorizados no siempre pueden ser adecuados para responder
algunas preguntas de la investigación por razones técnicas o éticas.
Es lógico que no todas las preguntas en cirugía puedan ser
abordadas por un ensayo controlado aleatorizado; no obstante, la
información potencialmente derivada de tales estudios, en la
situación actual de la ortopedia basada en la evidencia, constituye
un argumento convincente a su favor.
Los ensayos controlados no son adecuados o factibles para
todas las intervenciones quirúrgicas, y se ha calculado que casi el
60% e las preguntas sobre cirugía no pueden ser respondidas por
una ensayo controlado aleatorizado) ECA), incluso en condiciones
clínicas ideales. Además en los casos en los cuales un ECA es
adecuado, aún queda la selección del diseño del ensayo, cada uno
de los cuales tiene fortalezas y limitaciones. Los ECA puede ser
clasificado según: [1] el aspecto de las intervenciones que los
investigadores desean explorar, [2] el modo en el cual los
participantes son expuestos a las intervenciones y [3] el número de
participantes en el estudio. A continuación, se describen los cuatro
diseños básicos de ECA.
Tabla A: Comparación de los Diseños de los Ensayos
Controlados Aleatorizados

Diseño de ECA Ventajas Desventajas

Paralelo - diseño simple - no brinda información


aplicable a la específica sobre el
mayoría de las paciente
intervenciones y
enfermedades - hay que aumentar
considerablemente el
tamaño de la muestra de
cada intervención bajo
estudio
Cruzado - requiere una - vulnerable a los efectos
muestra más residual y del período
pequeña
- solo pueden someterse a
- las comparaciones ensayo las intervenciones
intra sujeto aseguran de actuación rápida
que todas las condiciones crónicas
características
basales se
distribuyan de modo
igual
Factorial - permite evaluar el - vulnerable a los efectos de
efecto de las interacción
terapias combinadas
n-de-1 - brinda información - los resultados no son
específica sobre el generalizables
paciente

Diseño de Ensayo Paralelo1

La mayoría de los ECA emplean un diseño paralelo, en cual


los participantes son aleatorizados en dos o más grupos del mismo
tamaño y cada grupo es expuesto a una intervención diferente. En
este diseño de ensayo se producen comparaciones entre los
participantes. Los ensayos paralelos con más de un grupo de
tratamiento (emparejado a un grupo de control) brindan la
oportunidad de estudiar intervenciones múltiples o diferentes
exposiciones a una intervención. No obstante, esto requiere
también muestras más grandes, a fin de asegurar que esos
ensayos sean capaces de detectar clínicamente diferencias
significativas entre las intervenciones.

Diseño de Ensayo Cruzado


Un diseño de ensayo de cruzado garantiza que cada
participante en el estudio recibirá todas intervenciones del estudio;
sin embargo, el orden en que las reciben es aleatorio. Cada
participante actúa como su propio control. En los ensayos de cruce
se producen comparaciones intra participantes; y, de ese modo, se
requieren menos participantes que en los ensayos paralelos para
producir resultado estadística y clínicamente significativos.
Existen varios criterios que deben cumplirse para que un
diseño de ensayo de cruce sea adecuado: [1] los participantes en el
estudio deben padecer enfermedades crónicas o incurables. Los
padecimientos que puedan ser resueltos después de una
intervención no serían apropiados para los ensayos cruzados [2]
las intervenciones del estudio deben tener un inicio rápido y un
efecto de breve duración. Las intervenciones de larga duración
corren el riesgo de un efecto residual – cuando el efecto de una
intervención persiste durante el ensayo de otra intervención.
Cuando se conoce la duración de una intervención, los períodos de
tratamiento pueden separase durante un tiempo suficiente para
permitir que el efecto siga su curso. Este período de tiempo que
transcurre entre tratamientos es conocido como “período de lavado”
[3] El padecimiento de estudio debe ser establecido en el tiempo,
con el fin de garantizar que cualquier efecto observado durante el
estudio pueda ser atribuido al tratamiento y no solo a un cambio en
el padecimiento ofrecido que habría ocurrido con o sin tratamiento.
Las diferencias entre los períodos de estudio que resultan de los
padecimientos de estudio y no de una intervención son conocidas
como “efectos del período”.

Diseño de ensayos factoriales

Cuando emplea un ECA se emplea un diseño factorial, éste


permite que las intervenciones puedan ser evaluadas tanto por
separado como en combinación entre sí. Por tanto, en un
experimento pueden explorarse dos o más hipótesis y el efecto de
la terapia de combinación puede ser evaluado. Por ejemplo, en un
ECA en el que se use un diseño de factorial de 2x2, los
participantes son asignados a una de cuatro combinaciones
posibles: [1] A de tratamiento; [2] B de tratamiento, [3] A y B de
tratamiento o [4] ningún tratamiento.
En los ensayos de cruce puede haber una interacción entre
las intervenciones, y esto podría producir un impacto sobre
requisitos del tamaño de la muestra del estudio. Las interacciones
son más comunes cuando los mecanismos de acción de las
intervenciones de los ensayos comparten las semejanzas, y
resultan cuando el efecto de una intervención es influido por otra
intervención. Por ejemplo, en el caso de una interacción negativa,
en el cual el efecto general de las intervenciones se reduce cuando
éstas se producen conjuntamente, habría que aumentar el tamaño
de la muestra para seguir detectando una diferencia significativa.

Ensayos de N igual a 1

Una crítica a los diseños de ECA precedentes es que pueden


brindar buena información sobre el desenlace del tratamiento en los
pacientes “promedio”, pero no están bien equipados para
proporcionar información específica del individuo. Es posible
realizar ensayos aleatorizados con individuos y requieren pocos
recursos. Los estudios “n igual a 1” se llevan a cabo
sistemáticamente variando el manejo de la enfermedad del paciente
durante una serie de períodos de tratamiento (se alternan las
intervenciones experimentales con las de control), a fin de confirmar
la efectividad del tratamiento en un paciente individual. A menudo,
el número de de los pares de intervenciones varía de dos a siete,
pero dicho número no se especifica con anticipación, y el paciente y
el clínico puede decidir terminar cuando se evidente que hay
diferencias importantes entre las intervenciones o cuando no las
haya.
Figura: Diseño de Ensayo Paralelo

Muestra de estudio

Aleatorización

Grupo 1 Grupo 2

Intervención A Intervención B

RESULTADOS DE LA
EVALUACION
Figura: Diseño de Ensayo de Cruce

Muestra de estudio

Aleatorizacion

Grupo 1 Grupo 2

Intervención A Intervención B

RESULTADOS DE LA
EVALUACION

Período
de lavado

Grupo 2 Grupo 1

Intervención A Intervención B

RESULTADOS DE LA
EVALUACION
Figura: Diseño de Ensayo Factorial 2x2

Muestra de estudio

Aleatorizacion

Grupo 1 Grupo 4
Grupo 2 Grupo 3
Intervención A

No Intervención
Intervención A & B
Intervención B

RESULTADOS DE LA EVALUACION
Figura: Diseño de Ensayo n-igual a-1

Paciente individual

Intervención B

RESULTADOS DE LA
EVALUACION

Intervención A

RESULTADOS DE LA
EVALUACION

Intervención A

RESULTADOS DE LA
EVALUACION

Intervención B

RESULTADOS DE LA
EVALUACION
Estudios observacionales
Introducción

Los tratamientos ortopédicos dependen, principalmente, de


los estudios que analizan los datos extraídos de los registros
médicos o lo recolectados de modo prospectivo para fines de
investigación. Debido a que el cirujano y el paciente determinan el
tratamiento, en lugar de ser controlado por el investigador, se les
denomina estudios observacionales. En contraste, los protocolos de
los ensayos controlados especifican los detalles del tratamiento
incluso la asignación de tratamiento para cada paciente. Los
mejores ensayos controlados son los aleatorizados controlados, en
los que los pacientes son asignados de modo aleatorio a los
tratamientos que se comparan. Esta sección aborda las principales
cuestiones metodológicas del diseño y la interpretación posterior de
los estudios observacionales.

Diseño de estudio de cohorte prospectivo

El término cohorte se deriva del Latín en el que se denomina a


un grupo de soldados que marchan juntos a la batalla. En este
diseño de estudio, la cohorte representa a un grupo de personas a
las que les hace seguimiento durante un período de tiempo para ver
si se desarrolla un desenlace de interés. Idealmente, dicho grupo
cumple un cierto nivel de criterios predeterminado representativo de
una población de interés y se le sigue con variables de desenlace
muy bien definidas. El “Framingham Heart Study” es un ejemplo de
estudio de cohorte extenso en el que participaron residentes de una
comunidad del estado de Massachusetts, en EE.UU., con factores
de riesgo cardiovascular identificables, a los cuales se les siguió
para determinar la ocurrencia de eventos cardiovasculares. Por lo
general, este grupo es emparejado con una población control
seleccionada sobre la base de presencia o ausencia de exposición
a un factor de interés. El propósito de este tipo de estudio es
describir la ocurrencia de ciertos resultados con el paso del tiempo y
analizar asociaciones entre los factores de pronóstico y dichos
desenlaces.
Los estudios de cohorte pueden ser de índole prospectiva, lo
que significa que se inician en un momento específico y se someten
a seguimiento en el tiempo, con miras a evaluar la influencia de
ciertos factores de pronóstico o ciertas intervenciones sobres los
desenlaces deseados. Entre los ejemplos de estudios de cohorte
prospectivos se encuentra la evaluación de re-fracturas en
pacientes que fueron tratados inicialmente por presentar una
fractura. Las fortalezas de un estudio de cohorte prospectivo son la
que el investigador puede de estudiar varios desenlaces con el paso
del tiempo y asegurar que los datos recopilados sean pertinentes y
exactos. Los inconvenientes son los gastos que se han de incurrir
para el seguimiento de un gran número de sujetos y el hecho de
dicho estudio requiere un largo período de tiempo. El número de
sujetos que abandonan el estudio aumenta con la duración del
seguimiento, y un gran número de abandono puede invalidar
algunos de los resultados de un estudio de cohorte.
Un estudio de cohorte retrospectivo o histórico entraña
identificar a los pacientes mediante registros del pasado y seguir al
grupo retrospectivamente en el tiempo, de sus registros del
presente hasta los del pasado. Los estudios de cohorte
retrospectivos tienen la ventaja de tener una duración menos
prolongada comparados con los estudios prospectivos, pero no
pueden controlar la selección de los sujetos ni las mediciones de los
desenlaces. Los estudios de cohorte son de índole observacional.
Pueden introducirse variables de confusión porque no se emplea la
asignación aleatoria y, de ese modo, se afecta el desenlace no a los
factores siendo examinados.

Diseño de Estudio de Casos y Controles

Un tipo de estudio observacional es el de caso-control, el cual


se comienza identificando a los individuos con desenlaces de
interés, los cuales se comparan con grupos control adecuados que
no presentan evento de desenlace. La relación entre una
intervención en particular o un factor de pronóstico y el desenlace
de interés se examina mediante la comparación del número de
individuos con cada intervención o factor de pronóstico en los casos
y los controles. Posteriormente en este informe, se describirán en
con todo detalle los estudios de casos y control. Un ejemplo de un
estudio caso-control sería identificar a los pacientes con fracturas
que no sanan con un grupo similar de pacientes con fracturas que
han sanado bien para ver si es más probable que los pacientes con
fracturas que no sanan tienen el hábito de fumar.
Los estudios caso-control se describen como retrospectivos
porque se realizan remontándose al pasado en busca de
información compilada sobre exposiciones pasadas a posibles
factores atribuibles. De dicha información puede calcularse una
razón de probabilidad para describir las probabilidades de un factor
en particular en los individuos con un desenlace de interés
comparado con los que no tienen desenlace. El estudio caso-control
puede ser útil para investigar los desenlaces raros, los de factores
etiológicos múltiples potenciales o para observar los desenlaces
que se demoran mucho tiempo en tener lugar. Además, pueden
realizarse en un breve período de tiempo con muestras más
pequeñas y son menos costosos que otros tipos de estudios. No
obstante, debido a que la información normalmente se obtiene de
los pacientes o de sus hojas clínicas, los datos pueden ser
inexactos porque existe la tendencia, en los que padecen una
enfermedad o tienen malos desenlaces, a atribuir esos desenlaces
a exposiciones (sesgo del recuerdo), a la carencia de información
en sus hojas clínicas o al sesgo de las mismas.

Series de Casos Clínicos

Los informes de caso son estudios descriptivos no controlados


en los cuales se realiza hay una intervención y un desenlace con un
perfil detallado del paciente. Uno de los primeros ejemplos.
divulgado en la literatura de ortopedia, es el informe de caso de
Birkett en 1869 sobre la descripción de una fractura-dislocación de
la cadera. En 1981 una famosa serie de casos de cinco hombres
homosexuales con Pneumocystis carinii, que se realizó en Los
Angeles, California, entre 1980-1981 marcó el comienzo de la
epidemia de Sida en los Estados Unidos. Aunque el diseño de los
estudios descriptivos los limita a hacer inferencias causales sobre la
relación entre los factores de riesgo y un desenlace de interés, son
útiles para desarrollar una hipótesis capaz de ser sometida a prueba
con un diseño de estudio analítico.
Selección del Diseño del Estudio

Introducción

Para planear un estudio clínico, el investigador ha de conocer


la jerarquía de la evidencia, al igual que el lenguaje de la medicina
basada en la evidencia, a fin de percatarse cómo los resultados de
su estudio pueden (o no pueden) aplicarse al cuidado del paciente,
como hemos analizado anteriormente. Un estudio clínico de calidad
a menudo comienza con una propuesta y un plan de estudio de
calidad. Si bien se requieren cientos de pasos para desarrollar un
plan de estudio, nos concentraremos en las consideraciones
importantes que deben ser abordadas en los planes de estudio.

Paso 1: Formulación de una pregunta Importante para un Estudio


Clínico

La formulación de la pregunta incluye normalmente la


descripción de la población, de la intervención y de los desenlaces.
En la interrogación también se determina el diseño más apropiado
para el estudio. Por ejemplo, uno podría plantear lo siguiente:”
¿Cuál es el efecto de la artoplastia versus la fijación no interna
[intervención] en los índices de revisión en pacientes de >65 años
de edad con fractura dislocada del cuello del fémur [población]”? La
mejor respuesta a esta pregunta puede ser un ensayo aleatorizado.

Paso 2: Realizar una Revisión Bibliográfica Integral de la Literatura

Antes de asignar grandes cantidades de tiempo, personal y


financiamiento a un proyecto, el investigador ha de asegurar que el
estudio que propone sea novedoso y que constituya un avance en
el conocimiento actual de un problema. Una revisión cuidadosa y
sistemática de la literatura disponible puede ofrecer información a
los investigadores sobre la evidencia actualizada. Una revisión
bibliográfica sistemática bien realizada (y/ó un meta análisis) es
sumamente valiosa puesto que no es corriente que los estudios
individuales brinden respuestas definitivas a las preguntas clínicas.
Además, una revisión cuantitativa bien hecha puede resolver
las discrepancias entre los estudios que presentan resultados
conflictivos. Usamos el término revisión sistemática para referirnos
a un resumen de la literatura médica que se proponga abordar una
pregunta clínica centralizada en una cuestión. Meta-análisis es un
término que se refiere a las revisiones sistemáticas que emplean
métodos cuantitativos (por ejemplo, técnicas estadísticas) para
resumir los principios rectores en la conducción de meta-análisis
que incluyan una pregunta específica de atención médica, una
estrategia de búsqueda integral, la valoración de la reproducibilidad
de la selección del estudio y de la validez del mismo, la evaluación
de la heterogeneidad (diferencias en el efecto a través de los
estudios), y la inclusión de todas las medidas útiles y clínicamente
pertinentes del efecto del tratamiento.
Puesto que la realización de una revisión integral de la
literatura implica costo en tiempo, esfuerzo y otras prioridades, los
cirujanos pueden buscar información en fuentes que publican
explícitamente resúmenes de evidencia, tópicos evaluados
críticamente y revisiones sistemáticas. Practicar la medicina basada
en la evidencia quiere decir integrar la experiencia clínica individual
a la mejor evidencia clínica disponible para realizar una
investigación sistemática. El User’s Guide to the Medical Literature
ha sido publicado en el Journal of the American Medical Association
y los últimos números de User’s Guide to the Orthopaedic
Literature, publicados en el Journal of Bone & Joint Surgery, brindan
a los clínicos instrumentos para valorar críticamente la calidad
metodológica de estudios individuales, así como aplicar la
evidencia. A fin de brindar fácil acceso a la mejor evidencia
disponible, varias fuentes especializadas incluyen resúmenes de
estudios individuales, revisiones sistemáticas y pautas clínicas
basadas en la evidencia. Uno de esos ejemplos es la Cochrane
Database, una base de datos extensiva de revisiones sistemáticas
de varios tópicos de las enfermedades músculo esqueléticas.
Además, la Cochrane Database contiene un Registro de Ensayos
Clínicos Controlados que proporciona una amplia relación de
ensayos clínicos aleatorizados en ortopedia y en otras
subespecialidades. El Canadian Journal of Surgery, el Journal of
Bone and Joint Surgery, y el Journal of Orthopaedic Trauma
contienen resúmenes de evidencia de una variedad de tópicos.
Tabla: Fuentes Potenciales de Información

The Cochrane Library (www. update-software.com)


Bandolier
Best Evidence
University of York/NHS Center for Reviews and Dissemination
Medline
Ovid
HIRU (www.hiru.mcmaster.ca)
Evidence based medicine center at Oxford
Evidence based medicine
ACP journal club

No obstante, incluso en esta alternativa los cirujanos han de


poseer los conocimientos necesarios que les permitan entender la
evidencia disponible. Por ejemplo, para ayudar a los pacientes a
ponderar los riesgos y los beneficios de un tratamiento, los clínicos
tienen que entender el mejor estimado de la magnitud del efecto del
tratamiento (riesgo relativo), así como la precisión de este estimado
(intervalo de confianza de 95%).
Un modo de expresar el impacto de un tratamiento, en
comparación con otro, es el riesgo relativo: el riego de infección
entre los pacientes de un nuevo tratamiento relativo al riesgo entre
los controles. Por ejemplo, asumamos que el tratamiento A obtiene
como resultado un índice de infección de 10% comparado con el
índice de 20% del tratamiento B. Por tanto, el riego relativo de
infección con el tratamiento A es 0.50 (A/B = 0.10 / 0.20 = 0.50). La
medición de los efectos del tratamiento dicotómico que se reporta
con más frecuencia es el complemento de dicho riesgo relativo
denominado reducción relativa del riesgo (RRR). Se expresa como
porcentaje: (1 - A/B) x 100% = (1 - 0.50) x 100% = 50%. Un RRR
del 50% significa que el tratamiento A redujo el riesgo de infección
en un 50% relativo al tratamiento B; mientras mayor sea la
reducción relativa del riesgo mayor será también la efectividad de la
terapia.
Por lo general, usamos (aunque arbitrariamente) el intervalo de
confianza de 95%. Se puede considerar que el intervalo de
confianza de 95% define el rango que incluye la verdadera
reducción relativa del riesgo. Muy rara vez se encuentra la
verdadera RRR hacia los extremos de este intervalo, y los RRR
verdaderos sólo se encuentran más allá de esos extremos en el 5%
de las veces, una propiedad del intervalo de confianza que guarda
una estrecha relación con el nivel convencional de “significación
estadística” de p <0.05.

Paso 3: Volver a Definir la Pregunta del Estudio

Con frecuencia, en una revisión integral de la literatura se


identifican las revisiones o los resúmenes de evidencia
fundamentales que auxiliarán a los investigadores en la
planificación del estudio. En algunas circunstancias, es posible que
la pregunta planteada (paso 1) deba ser reformulada, para ser más
coherente con las controversias actuales existentes en el campo de
investigación. Por ejemplo, en una revisión de la literatura para
identificar evidencia que evalúa la artroplastia versus la fijación
interna en los pacientes con fracturas del cuello del fémur
dislocadas se identifican dos meta análisis. Ambos estudios
brindan evidencia persuasiva de que la artroplastia reduce el riesgo
de cirugía de revisión en al menos un 58% (pero puede alcanzar
tanto como 87%) comparada con la fijación interna. No obstante, el
efecto de la artroplastia versus la fijación interna en los índices de
mortalidad, sigue sin establecerse con exactitud. Por tanto,
parecería apropiado revisar la pregunta del estudio para evaluar las
índices de mortalidad como desenlaces primarios de interés en vez
de como índices de revisión.

Paso 4: Decidir la Mejor Metodología para el Estudio (Series de


Casos hasta Ensayo Controlado Aleatorizado)

Como se dijo anteriormente, la pregunta ofrece información


sobre el diseño del estudio. Si un investigador desea comparar los
resultados de una o más estrategias del tratamiento, la mejor opción
es un ensayo controlado aleatorizado; sin embargo, si se trata de
identificar los indicadores predictivos de mortalidad en pacientes
tratados por fractura de cadera, un estudio de caso control pudiera
ser diseñado para comparar variables de pronóstico en los
pacientes que fallecieron comparados con los que sobrevivieron. Si
un investigador planifica comparar los desenlaces siguiendo un
tratamiento operativo versus uno conservador de las fracturas de la
columna vertebral, lo más adecuado sería un estudio de cohorte
prospectivo. En esas circunstancias, aleatorizar a los pacientes, en
estas circunstancia, podría considerarse no ético.
Referencias fundamentales

American Medical Association: User's Guides to the Medical


Literature: A Manual for Evidence-Based Clinical Practice. In Guyatt
GH, Rennie D (eds). Ed 2. Chicago, American Medical Association
Press, 2001.

Bernstein J, McGuire K, Freedman KB. Statistical Sampling and


Hypothesis Testing in Orthopaedic Research. Clin Orthop.
2003;413:55-62.

Bhandari M, Whang, W, Kuo JC, Devereaux PJ, Sprague S,


Tornetta P. The Risk of False-Positive Results in Orthopaedic
Surgical Trials. Clin Orthop. 2003;413:63-69.

Bhandari M, Guyatt GH, Swiontkowski MF. User’s guide to the


orthopaedic literature I: How to use an article about a surgical
therapy. Journal of Bone and Joint Surgery- American 2001; 83A:
916-926.

Bhandari M, Guyatt GH, Swiontkowski MF. User’s guide to the


orthopaedic literature II: How to use an article about prognosis.
Journal of Bone and Joint Surgery 2001; 83A: 1555-64.

Bhandari M, Guyatt GH, Montori V, Devereaux PJ, Swiontkowski


MF. User’s Guide to the Orthopaedic Literature III:How to Use a
Systematic Literature Review. J Bone Joint Surg 2002: 84A:1672-
82.

Bhandari M, Guyatt GH, Montori V, Swiontkowski MF. User’s Guide


to the Orthopaedic Literature IV: How to use an article about a
diagnostic test. J Bone Joint Surg Am. 2003; 85A:1133-40.

Bhandari M, Morrow F, Kulkarni AV, Tornetta P, 3rd: Meta-analyses


in orthopaedic surgery. A systematic review of their methodologies.
J Bone Joint Surg 2001; 83A:15-24.

Bhandari M, Schemitsch EH. Randomized trials: a brief history and


modern perspective. Tech Orthop 2004; 19:54-56.

Bhandari M, Tornetta P. Issues in the hierarchy of study design,


hypothesis testing, and presentation of results. Tech Orthop
2004:19:57-65.
Beaton D, Schemitsch E. Measure of Health-Related Quality of Life
and Physical Function. Clin Orthop. 2003 Aug;413:90-105.

Brighton B, Bhandari M, Tornetta III P, Felson DT. Hierarchy of


Evidence: From Case Reports to Randomized Controlled Trials. Clin
Orthop. 2003;413:19-24.

Busse JW, Bhandari M, Schemitsch EH. Types of randomized trials


in surgery. Tech Orthop 2004; 19:77-82.

Devereaux PJ, McKee MD, Yusuf S. Methodologic Issues in


Randomized Controlled Trials of Surgical Interventions. Clin Orthop.
2003;413:25-32.

Guyatt GH: Evidence-based medicine: A new approach to teaching


the practice of medicine. JAMA 1992;268: 2420-2425.

Hartz A, Marsh JL. Methodologic Issues in Observational Studies.


Clin Orthop. 2003;413:33-42.

Jackowski D, Guyatt G. A Guide to Measurement. Clin Orthop.


2003 Aug;413:80-89.

Kocher MS, Henley MB. It is Money That Matters: Decision Analysis


and Cost-Effectiveness Analysis. Clin Orthop. 2003;413:106-116.

Montori VM, Swiontkowski MF, Cook DJ. Methodologic Issues in


Systematic Reviews and Meta-Analyses. Clin Orthop. 2003;413:43-
54.

Sackett DL, Rosenberg WM, Gray JA: Evidence-based medicine:


What it is and what it isn't. BMJ 312: 71-72, 1996.

Schunemann H, Bone L. Evidence-Based Orthopaedics: A Primer.


Clin Orthop. 2003;413:117-132.
Preparación de un Protocolo de Estudio

Introducción

En esta sección presentamos una guía para planificar un


estudio clínico. Un estudio clínico de alta calidad requiere, a
menudo, tanto tiempo en la planificación y preparación como en su
ejecución. Un estudio clínico de calidad comienza frecuentemente
con una propuesta de investigación y un plan del estudio. Si bien
se requieren cientos de pasos para desarrollar un plan de estudio,
nos concentraremos en las consideraciones importantes que deben
ser abordadas en todos los planes de estudio.

Paso 1: Formulación de una Pregunta Importante para un Estudio


Clínico

La formulación de la pregunta incluye normalmente la descripción


de la población, de la intervención y de los desenlaces. Para más
detalles, sírvase referirse a las secciones anteriores sobre la
selección de un diseño de estudio.

Paso 2: Realizar una Revisión Bibliográfica Integral de la Literatura

Antes de asignar grandes cantidades de tiempo, personal y


financiamiento a un proyecto, el investigador tiene que asegurar que
el estudio que propone sea novedoso y que constituya un avance
en el conocimiento actual de un problema. Una revisión cuidadosa y
sistemática de la literatura disponible puede ofrecer información a
los investigadores sobre la evidencia actualizada. Para más
detalles, sírvase referirse a las secciones anteriores sobre la
selección de un diseño de estudio.

Paso 3: Volver a Definir la Interrogación del Estudio

Con frecuencia, en una revisión integral de la literatura se identifican


las revisiones o los resúmenes de evidencia fundamentales que
auxiliarán a los investigadores en la planificación del estudio. En
algunas circunstancias, es posible que la pregunta planteada
(Véase el Paso 1) deba ser reformulada, a fin de que sea más
coherente con las controversias existentes en el campo de
investigación. Para más detalles, sírvase referirse a las secciones
anteriores sobre la selección de un diseño de estudio.
Paso 4: Seleccionar la Mejor Metodología para el Estudio
Para más detalles, sírvase referirse a las secciones anteriores
sobre la selección de un diseño de estudio.

Paso 5: Criterios de Elegibilidad

Los investigadores deben ser explícitos en cuanto a los


criterios empleados para incluir a los pacientes en el estudio. Una
relación extensa y detallada de los criterios de elegibilidad limitará la
capacidad de generalización (validez externa) de los resultados del
estudio más allá del grupo específico de los pacientes incluidos. Por
tanto, una estrategia para mejorar la validez externa de un ensayo
aleatorizado es ser inclusivo al enrolar a un grupo diverso de
pacientes. Por el contrario, en un estudio de cohorte donde el riesgo
de los desequilibrios entre los grupos de pacientes es alto, la
existencia de una relación detallada de los criterios (inclusión y
exclusión) puede mejorar el grado hasta el cual los grupos de
pacientes son similares.

Paso 6: Selección del Desenlace Primario y de los Desenlaces


Secundarios

La selección que se haga en cuanto a cómo medir al


desenlace tiene consecuencias importantes en el tamaño que
requiere la muestra. Hemos hallado que las medidas continuas del
desenlace (duración de la hospitalización, pérdida de sangre,
puntuaciones funcionales) requieren muestras más pequeñas de
pacientes para lograr que el estudio tenga una potencia estadística
adecuada que las variables de desenlace dicotómicas (mortalidad,
tasa de infección, tasa de re-operación). Revisamos la potencia
estadística en estudios publicados que incluían 50 pacientes o
menos, con el fin de examinar el efecto de la variable de desenlace.
Hallamos 76 ensayos cuya muestra incluía a de 50 pacientes o
menos (29 ensayos de desenlace continuo, 47 ensayos de
desenlace dicotómico). Los estudios que reportaron desenlaces
continuos tenían una potencia estadística media más elevada que
los estudios que reportaron variables dicotómicas (Potencia= 49%
vs. 38%, p=0.042). El doble de los ensayos con variables de
desenlace continuo alcanzó niveles aceptables de la potencia
estadística del estudio (por ejemplo, >80% de potencia) cuando se
comparaban con ensayos con variables dicotómicas (37% vs.
18.6%, P=0.04).
Paso 7: Determinación del Tamaño de la Muestra para el Desenlace
Primario

La potencia estadística de un estudio es la probabilidad de


detectar una diferencia entre dos tratamientos cuando de hecho
exista una diferencia. La potencia (1-β) es sencillamente el
complemento del error Tipo II (β). Por tanto, si aceptamos un 20%
de probabilidad de se llegue a una conclusión incorrecta en los
estudios (β=0.20), estamos aceptando también que obtendremos la
conclusión correcta el 80% de las veces. La potencia estadística
del estudio puede emplearse antes de iniciar un ensayo clínico para
que nos auxilie en la determinación del tamaño de la muestra, o
después de haber completado el estudio para determinar si los
hallazgos negativos son ciertos, o se deben al azar.
La potencia de una prueba estadística es típicamente una
función de la magnitud del efecto del tratamiento, del índice del
error Tipo I designado (α), y del tamaño de la muestra (N). Al
diseñar un ensayo, los investigadores pueden seleccionar la
potencia estadística que deseen (1-β) y calcular la muestra
necesaria para lograr ese objetivo. Si los investigadores están
realizando un análisis post hoc de la potencia, luego de haber
terminado el estudio, usarán el tamaño de la muestra obtenida para
calcular la potencia estadística del estudio.
La magnitud del efecto es, por ejemplo, la diferencia entre
la puntuación funcional media del grupo tratado quirúrgicamente y
la del grupo tratado de modo conservador. Para compensar la
variabilidad de los puntuaciones funcionales en cada grupo,
(varianza o desviaciones estándar sobre las puntuaciones medias),
la diferencia puede ser dividida entre la desviación estándar del
grupo de control. Este valor resultante se denomina “tamaño del
efecto”. La interpretación de este ‘tamaño del efecto’ es, en gran
medida, clínica. Debe representar el punto en el cual el cirujano(a)
cambiará su proceder en la práctica si los resultados son ciertos.
Existen amplias pautas para la interpretación del tamaño del efecto:
0.2 un efecto pequeño, 0.5 moderado, y 0.8 grande.
Dado el predominio de los errores Tipo II en los ensayos de
trauma ortopédico, los investigadores deben esforzase por
establecer con anticipación los requisitos del tamaño de las
muestras sobre la base de normas aceptadas convencionalmente
para la potencia estadística del estudio (80%) y los errores Tipo I
(α=0.05). Los estudios pilotos pequeños de un tópico de interés o
reportados previamente en la literatura pueden ser de ayuda para
determinar el efecto probable del tratamiento.
Por ejemplo, al planear un ensayo de estrategias alternativas
para el tratamiento de las fracturas del tallo de la tibia, un
investigador puede identificar una revisión sistemática de la
literatura que reporta que el tiempo transcurrido para que sane la
fractura con el Tratamiento A es 120 ± 45 días , mientras que con el
Tratamiento B (grupo de control) puede esperarse que sea de 140 ±
40 días. La diferencia esperada entre los tratamientos es de 20 días
y el tamaño del efecto es 0.5 (20/40). Según Cohen, éste es un
efecto moderado y es probable que sea de clínicamente
significativo, si es en realidad cierto. El tamaño de la muestra
anticipado para la medición de ese desenlace continuo se
determina por la siguiente ecuación:

N= 2 (Zα + Zβ)σ 2
donde Zα=1.96, Zβ=0.84, σ=40, y δ=20

δ
Este estudio ha de contar con un total de 63 pacientes
aproximadamente, a fin de tener suficiente potencia estadística
para identificar una diferencia de 20 días entre tratamientos, si ésta
ocurriese. Un investigador puede hacer una auditoria del número
de pacientes tratados en sus centros el año anterior para decidir si
habrá suficiente pacientes presentes para cumplir los requisitos del
tamaño de la muestra.
Asumamos que ese mismo investigador selecciona no unión
como desenlace primario en lugar de tiempo de unión. Basado en la
literatura previa, el investigador cree que el Tratamiento A tendrá
como resultado un índice de unión de un 95% y el Tratamiento B
(control Grupo) uno de un 90% de tasa de unión. Otro cálculo del
tamaño de la muestra para las variables dicotómicas se presenta a
continuación:

N= PA (100-PA) + PB(100-PB) x f(α,β) donde PA=95, PB=90, y


f(α,β)=7.9

(PB- PA)2

En este caso, se necesitan 869 pacientes para que el estudio


identifique una diferencia de 5% en tasas de no unión entre
tratamientos. Un investigador puede darse cuenta de que ese
número es lo suficientemente grande para impedir la ejecución de
este ensayo en un centro y puede decidir obtener apoyo para
realizarlo en varios sitios. Para más detalles, sírvase referirse a la
sección sobre los cálculos el tamaño de la muestra.

Paso 8: Identificación de los Colaboradores de la investigación y


Asignación de Roles

Una vez que se haya determinado la interrogante básica de la


investigación, el diseño del estudio y el número estimado de
pacientes, puede procederse a organizar el equipo de investigación.
Probablemente, la formación de un equipo puede ser considerada la
primera prioridad antes de formular una pregunta. No obstante.
estudiar detenidamente la literatura disponible, refinar la
interrogación formulada y la determinación de la muestra para un
estudio repercutirá de modo considerable en las dimensiones del
equipo y en el nivel de conocimientos y competencia requerido.
Por ejemplo, un investigador que proponga un ensayo aleatorizado
de una hemiartroplastia versus una artroplastia bipolar en pacientes
con fractura del cuello del fémur dislocada sobre la calidad de vida
relacionada con la salud (Instrumentos de evaluación funcional
como el cuestionario SF-36, SFMA) puede hallar que sólo se
necesiten 80 pacientes para una potencia estadística adecuada. De
ser así, su institución pudiera llevar a cabo el ensayo en un solo
centro. Por otra parte, un estudio de 800 pacientes puede requerir
varios sitios para realizar la investigación.
Un proyecto de investigación exitoso cuenta con el apoyo de
un equipo de investigación motivado, El equipo óptimo es superior a
la suma de sus partes. Cada miembro contribuye sus capacidades
específicas para asegurar que se mantengan todas las
competencias. Normalmente, un equipo para un estudio de gran
magnitud debe contar con expertos clínicos, bioestadísticos,
metodólogos/epidemiólogos, personal administrativo y
coordinadores y auxiliares de investigación.

Paso 9: Redacción de una Propuesta de Estudio

Los estudios con un buen diseño se sustentan en una


propuesta de investigación clara y detallada. Los componentes de
una guía para las propuestas de investigación de los Institutos de
Investigación en Salud de Canadá se presentan en una Tabla más
abajo. La contribución de todos los miembros del equipo de
investigación es crítica. Las revisiones de la propuesta constituyen
la regla, no la excepción. Un estudio en colaboración extenso puede
ser sometido a 20-30 revisiones antes de ser aceptado por todos
los miembros del equipo que incluye estadísticos, metodólogos,
clínicos, y otro personal de investigación.

Tabla: Guía para los Protocolos de los Ensayos Aleatorizados


(Institutos de Investigación en Salud de Canadá)
Parte 1: NECESIDAD DEL ENSAYO

1. ¿Cuál es el problema que se abordará?


2. ¿Cuáles son las principales preguntas de investigación que se
abordarán?
3. ¿Por qué el ensayo es necesario ahora?
4. Ofrezca referencias de las revisiones sistemáticas pertinentes y
analice la necesidad de su ensayo a la luz de dichas revisiones.
5. ¿Cómo se emplearán los resultados de este ensayo?
6. Describa qué riesgos corre la seguridad de los participantes en
este ensayo.

Parte 2: EL ENSAYO PROPUESTO

1. ¿Cuál es el diseño del ensayo que se propone?


2. ¿Cuáles son las intervenciones del ensayo propuesto?
3. ¿Qué se ha dispuesto para asignar a los participantes a los
grupos de ensayo?
4. ¿Cuáles son los métodos propuestos contra las fuentes de
sesgo?
5. ¿Cuáles son los criterios de inclusión/exclusión planificados?
6. ¿Cuál es la duración del período de tratamiento propuesta?
7. ¿Cuál es la frecuencia y duración del seguimiento que se
propone?
8. ¿Cuáles son las mediciones del desenlace propuestas?
9. ¿Cómo se medirán los desenlaces en el seguimiento?
10. ¿Se medirán preguntas de un servicio de salud en el
seguimiento?
11. ¿Cuál es el tamaño de muestra propuesto y cuáles son las
justificaciones de las suposiciones que sustentan los cálculos de la
potencia estadística?
12. ¿Cuál es el índice reclutamiento planificado?
13. ¿Es probable que se presenten problemas para su
cumplimiento?
14. ¿Cuál es el índice probable de abandono del seguimiento
15¿Cuáles son los tipos análisis propuestos?
16. ¿Cuál es la frecuencia propuesta de los análisis?
17. ¿Hay análisis planificados para los subgrupos?
18. ¿Se ha realizado un estudio piloto con este diseño?

Parte 3: DIRECCION DEL ENSAYO

1. ¿Qué se ha dispuesto para el manejo cotidiano del ensayo?


2. ¿Cuál será el papel de cada investigador o colaborador en el
ensayo?
3. Describa los comités que se formen, tales como el de dirección,
el de monitoreo de los datos el de seguridad (si es aplicable)

Paso 10: Obtención de la Aprobación Ética

Existen guías estrictas para la ejecución ética de la


investigación clínica y la experimental. Los investigadores deben
estar familiarizados con la ética y los procesos de revisión
institucional locales. Deben prepararse con antelación formularios
para el consentimiento y el estudio debe haber obtenido aprobación
antes de su inicio. El proceso para obtener aprobación institucional
y ética, para un estudio particular, puede demorarse desde tan poco
como 4 semanas hasta no menos de 8-9 meses. Por tanto, es
imperativo que se prevean las demoras en este proceso y se tomen
en cuenta en el calendario del estudio.

Paso 11: Realización de Estudios Pilotos Preliminares

El esfuerzo para obtener los datos preliminares puede


sobredimensionarse. Si un investigador piensa realizar un ensayo
aleatorizado o un estudio de cohorte prospectivo, es sumamente
importante llevar a cabo un estudio piloto de una proporción del
tamaño total de la muestra (por ejemplo el 10%) para determinar lo
siguiente: 1) la capacidad real para seleccionar y reclutar a los
pacientes, 2) la conformidad del investigador y el paciente con el
protocolo del estudio, 3) el refinamiento de los protocolos de las
técnicas del protocolo del estudio, 4) la capacidad para realizar un
seguimiento completo. Por tanto, el investigador que planifique
llevar a cabo un estudio con 200 pacientes puede decidir llevar a
cabo un estudio piloto con 20 pacientes para determinar la
factibilidad de la metodología propuesta.
Paso 12: Obtención de Financiamiento de Investigación para
Realizar un Estudio Mayor y Definitivo

Para realizar con éxito un estudio clínico (especialmente un


estudio de cohorte prospectivo o un ensayo aleatorizado mayor) se
requiere, a menudo, financiación que permita reclutar al paciente,
recopilar los datos y analizarlos. Las fuentes de financiación pueden
incluir agencias nacionales y locales revisadas por homólogos,
subvenciones auspiciadas por la industria, o fundaciones con
agendas de investigación específicas. Cualquiera que fuese la
fuente, la búsqueda de fondos es un paso necesario para asegurar
el rigor y la calidad óptima en un estudio clínico extenso.

Conclusión

Para realizar un estudio bien diseñado hay que dedicarle una


gran cantidad e tiempo. Con frecuencia, en un estudio grande, la
fase de planificación se toma tanto tiempo como la fase de
realización. Por regla general, puede asumirse que un estudio de un
año de ejecución requiere un año de planificación (búsqueda de
literatura, desarrollo y revisión del protocolo, obtención de
financiamiento). Si se presta atención a los detalles del plan del
estudio, se minimizarán los problemas que puedan presentarse en
su ejecución.
GLOSARIO DE TERMINOS

Aumento del riesgo absoluto (Absolute Risk Increase): Diferencia


en el riesgo absoluto (porcentaje o proporción de pacientes con un
desenlace) en los expuestos vs. los no expuestos. Normalmente se
emplea en una exposición nociva.

Reducción del riesgo absoluto (Absolute Risk Reduction):


Diferencia en el riesgo absoluto (porcentaje o proporción de
pacientes con un desenlace) en los expuestos (por ejemplo, a una
intervención) (tasa del evento experimental) vs. los no expuestos
(tasa de evento de control). Su uso está limitado a una exposición o
intervención beneficiosa.

Análisis ajustado (Adjusted Analysis) En un análisis ajustado se


toman en consideración las diferencias en los factores de
pronóstico entre los grupos que pueden influir en el desenlace.
Por ejemplo, en la comparación entre un grupo de tratamiento y el
grupo de control, si en el grupo experimental los individuos tienen
mayor edad promedio y, por tanto, el riesgo de un desenlace
adverso es mayor que el del grupo de control, el análisis ajustado
mostrará un mayor efecto del tratamiento que en el análisis no
ajustado.

Error alfa (Alpha Error): La probabilidad de llegar a la conclusión


errónea de que existe una diferencia entre dos tratamientos cuando
de hecho no existe ninguna. Normalmente, los investigadores
toman una decisión sobre la probabilidad de un error falso positivo
que están dispuestos a aceptar, al planear el tamaño de la muestra
de un estudio.

Riesgo basal (Baseline Risk): El riesgo que se corre de que se


produzca un resultado adverso en el grupo de control en un
experimento. Sinónimo: tasa de eventos en el grupo de control
(TEC).

Análisis de Bayes (Bayesian Analysis): Un análisis que comienza


con una probabilidad particular de un evento (probabilidad anterior)
e incorpora nueva información para generar una probabilidad
revisada (probabilidad posterior).
Ensayo de antes y después (Before-After Trial): Investigación de
una intervención en la cual los investigadores comparan el estado
del paciente antes y después de la intervención.

Sesgo (Bias): Una tendencia sistemática a que se produzca un


desenlace que difiera de la verdad subyacente.

Efecto de canalización, Sesgo de canalización (Channeling effect


or Channeling bias): La tendencia de los clínicos a recetar un
tratamiento sobre la base del pronóstico del paciente. Como
resultado de la conducta, las comparaciones entre los pacientes
tratados y los no tratados producirán un estimado sesgado del
efecto del tratamiento.

Sesgo de completamiento de los datos (Data completeness


bias) El hecho de usar un sistema de información para registrar
los episodios en el grupo de tratamiento y utilizar un sistema manual
en el grupo de sistema de apoyo para la toma de decisiones no
computarizado puede crear un sesgo en el completamiento de los
datos.

Sesgo de detección (Detection bias): La tendencia a buscar con


más atención un desenlace en uno de los grupos que están siendo
comparados.

Sesgo de incorporación (Incorporation bias): Ocurre cuando los


investigadores estudian un ensayo diagnóstico que incorpora
características del desenlace del objetivo principal del estudio.

Sesgo del entrevistador (Interviewer bias): Cuando un


entrevistador investiga más a fondo uno de los dos grupos que se
están comparando.

Sesgo de Publicación (Publication bias): Ocurre cuando la


publicación de la investigación depende de la dirección de los
resultados del estudio y del hecho de que sean estadísticamente
significativos.

Sesgo de Recuerdo (Recall bias): Los pacientes que


experimentan un desenlace adverso tienen una probabilidad
diferente de recordar la exposición a la de los pacientes que no han
experimentado un desenlace adverso, independientemente de la
verdadera extensión de la exposición.
Sesgo de vigilancia (Surveillance bias): Sinónimo del sesgo de de
detección. La tendencia a buscar con más atención un desenlace
en uno de los dos grupos que están siendo comparados.

Sesgo de verificación (Verification Bias): Los resultados de un


ensayo de diagnóstico influyen en la asignación o no de los
pacientes a un grupo de tratamiento.

Ciego, A ciegas, enmascarado (Blind, Blinded or Masked): El


participante de interés no sabe si los pacientes han sido asignados
al grupo experimental o al grupo de control, Los pacientes, los
clínicos, los que monitorean los desenlaces, los asesores jurídicos
de los desenlaces, los analistas de datos y los que redactan el
trabajo pueden estar a ciegas o enmascarados. Para evitar
confusión, se prefiere usar término enmascarado en los estudios en
los cuales la pérdida de visión de los pacientes es un desenlace de
interés.

Bootstrap Technique: Una técnica estadística para calcular


parámetros tales como los errores estándar y los intervalos de
confianza basados en repetir la muestra de un conjunto de datos
observados con sustitución.

Informes de casos, series de casos (Case Reports and Case


Series): Descripciones de pacientes individuales. Un estudio que
informa sobre una colección consecutiva de pacientes tratados de
modo similar, sin grupo de control. Por ejemplo, un cirujano puede
describir las características del desenlace de 100 pacientes
consecutivos con isquemia cerebral que recibieron un
procedimiento de revascularización.

Estudio de casos y controles (Case-Control Study): Un estudio


diseñado para determinar la asociación existente entre una
exposición y un desenlace en el cual se muestrea a los pacientes
de acuerdo con el resultado (algunos pacientes con desenlace de
interés son seleccionados y comparados con un grupo de pacientes
sin desenlace) y el investigador examina la proporción de pacientes
con exposición en los dos grupos.
Prueba de ji al cuadrado (Chi-square Test): Una prueba
estadística que examina la distribución de desenlaces categóricos
en dos grupos, la hipótesis nula de la cual es que las distribuciones
subyacentes son idénticas.

Reglas de predicción clínica (reglas de decisión clínica) Clinical


Prediction Rules (or Clinical Decision Rules): Una regla de
predicción clínica se genera al examinar inicialmente y en última
instancia combinar numerosas variables para predecir la
probabilidad de un diagnóstico actual o de un evento futuro. A
veces, si la probabilidad es suficientemente alta o baja, la regla
sugiere un rumbo a seguir.

Cointervenciones (Cointerventions): Son intervenciones ajenas al


tratamiento bajo estudio que pueden ser aplicadas de forma
diferenciada a los grupos de tratamiento y de control; por tanto,
puede sesgar el resultado del estudio.

Cohorte (Cohort): Un grupo de personas que comparten una


característica o un conjunto de características. Normalmente, se
sigue el grupo durante un período específico para determinar la
incidencia de un trastorno o de complicaciones en un trastorno
determinado (pronóstico).

Estudio de cohorte (o estudio analítico de cohorte) Cohort Study


(or Cohort Analytic Study): Investigación prospectiva de los posibles
factores causales de un trastorno en el cual una cohorte de
individuos, que no presentan evidencia de un desenlace de interés
pero que están expuestos a una presunta causa, son comparados
con una cohorte concurrente que tampoco presenta el desenlace,
pero no fue expuesta a la presunta causa. Luego se hace un
seguimiento de ambas cohortes para comparar la incidencia del
desenlace de interés.

Probabilidades condicionadas (Conditional Probabilities): La


probabilidad de un estado particular, dado otro estado. Es decir, la
probabilidad de A, dado B – Probabilidad (A/B).

Intervalo de confianza (IC) (Confidence Interval (CI): Margen de


dos valores dentro de los cuales es probable que se encuentre el
verdadero valor para toda la población de pacientes para la cual se
seleccionaron los pacientes del estudio.
Confusión, factor de (Confounder): Un factor que distorsiona la
verdadera relación de la variable de interés de un estudio por estar
también relacionada con el desenlace de interés. Los factores de
confusión se comparan a menudo. Los estudios aleatorizados se
distribuyen de modo desigual entre los grupos con menos
probabilidad de ser distorsionados por factores de confusión que los
estudios de observacionales.

Contaminación (Contamination): Ocurre contaminación cuando los


participantes en el grupo experimental o en el control reciben la
intervención destinada al otro grupo del estudio.

Variables continuas (Continuous Variables): Una variable que


teóricamente puede tomar cualquier valor y que en la práctica
puede tomar un gran número de valores con pequeñas diferencias
entre ellos.

Correlación (Correlation): La magnitud de la relación entre las


diferentes variables o fenómenos.

Coeficiente de correlación (Correlation Coefficient): Una expresión


numérica de la fortaleza de la relación entre dos variables, que
pueden tomar valores de –1.0 a 1.0

Análisis de costo (Cost Analysis): Si se analizan dos estrategias


pero sólo se comparan los costos, esta comparación ofrecería
información solo de la mitad de la decisión sobre el uso de los
recursos (la otra mitad está constituida por los desenlaces
esperados) y se denomina análisis de costo.

Análisis de costos-beneficios (Cost Benefit Analysis): Un tipo de


análisis económico en el cual los costos y las consecuencias
(incluso los aumentos en la duración y calidad de la vida) se
expresan en términos monetarios.

Análisis de la relación costo-eficacia (Cost-Effectiveness


Analysis): Un análisis económico en el cual las consecuencias se
expresan en unidades naturales. Algunos ejemplos pudieran incluir
al costo por vida salvada o al costo por unidad de la presión
sanguínea disminuida.
Análisis de minimización de los costos (Cost Minimization
Analysis): Un análisis económico que se realiza en situaciones
donde las consecuencias de las alternativas son idénticas, de modo
que la única cuestión es el costo relativo.

Análisis de costo-utilidad (Cost-Utility Analysis): Un tipo de


análisis de costo-eficacia en el cual las consecuencias se expresan
en términos de años de vida ajustados por la preferencia de las
personas. Normalmente, se considera el costo incremental por la
ganancia incremental en años de vida ajustados por la calidad.

Modelo de regresión de Cox (Cox Regression Model): Una


técnica de regresión que permite hacer ajustes para diferencias
conocidas en las características basales entre los grupos
experimental y control aplicadas a los datos de sobrevivencia.

Minería de Datos (Data-dredging) Búsqueda de un conjunto de


datos sobre las diferencias entre los grupos con un desenlace
particular o entre los subgrupos de pacientes, con o sin hipótesis
explicitas a priori.

Análisis de decisiones (Decision Analysis): Un enfoque


sistemático de la toma de decisiones bajo condiciones de
incertidumbre. Entraña identificar todas las alternativas disponibles
y calcular las probabilidades de desenlaces potenciales asociados
con cada alternativa, valorando cada desenlace y, sobre la base de
probabilidades y valores, obtener a un estimado cuantitativo del
mérito relativo de las alternativas.

Decisión bajo riesgo (Decision under risk): Una decisión


contranatural en la cual se conoce la distribución de la probabilidad
en los estados de la naturaleza.

Decisión bajo incertidumbre (Decision under uncertainty): Una


decisión contranatural sin conocimiento de la probabilidad de varios
estados de la naturaleza.

Arbol de decisión ( Decision Tree): La mayoría de los análisis de


las decisiones clínicas se hacen en forma de árbol de decisión. Los
artículos sobre análisis de decisión clínica incluyen, por lo general,
uno o dos diagramas que muestran la estructura del árbol de
decisión utilizado en el análisis.
Resultados dicotómicos (Dichotomous Outcomes): Desenlaces
de “Sí” o “No” que ocurren o no ocurren, tales como re-operación,
infección y muerte.

Variable dicotómica (Dichotomous Variable): Una variable que


puede presentar dos valores, tales como masculino o femenino,
muerto o vivo, con infección o sin infección.

Costos directos (Direct costs): Los costos de todos los recursos


que se incurren en una intervención en particular.

Análisis económico (Economic Analysis): Un conjunto de


métodos formales cuantitativos empleados para comparar dos o
más tratamientos, programas o estrategias en cuanto al uso de sus
recursos y a los desenlaces esperados.

Evaluación económica (Economic Evaluation): Análisis


comparativo de los procedimientos alternativos en función de sus
costos y consecuencias.

Tamaño del efecto (Effect Size): La diferencia de los desenlaces


entre la intervención y los grupos de control dividida entre alguna
medida de variabilidad, generalmente la desviación estándar.

Eficiencia (Efficiency): El logro del incremento máximo en los


beneficios de la salud con una cantidad dada de recursos.

Medicina basada en la evidencia (Evidence-Based Medicine): El


uso serio, explícito y sensato de la mejor evidencia actual en la
toma de decisiones sobre el cuidado de cada paciente individual. La
práctica de la medicina basada en la evidencia requiere la
integración de la experiencia y capacidad clínica individual y las
preferencias del paciente con la mejor evidencia clínica externa
disponible obtenida a través de investigación sistemática.

Fold back analysis: El proceso de resolver un árbol de decisión


trabajando retrospectivamente.

Capacidad de generalización (Generalizibility): La capacidad de


generalizar los resultados de un estudio en un grupo mayor similar
de personas.
Efecto de Hawthorne (Hawthorne Effect): El rendimiento humano
mejora cuando los participantes están concientes de que su
conducta es observada. En un estudio de tratamiento, el tratamiento
es considerado eficaz cuando en realidad no lo es. En un estudio de
diagnóstico, el paciente no sufre la enfermedad objetivo del estudio
, pero el ensayo sugiere que el paciente si la padece.

Razón de riesgo (Hazard Ratio): Los investigadores pueden


calcular el riesgo relativo con el tiempo, como en un análisis de
supervivencia y llamarle una razón de riesgo, la ponderación del
riesgo relativo del estudio completo.

Calidad de Vida relacionada con la salud (Health-Related Quality


of Life): Medidas de como se sienten las personas o del valor que
dan a su estado de salud.

Incidencia (Incidence): Número de nuevos casos de enfermedad


que ocurren durante un período específico de tiempo, expresado
como un por ciento del número de las personas en riesgo.

Heterogeniedad (Heterogeneity): Diferencias entre los pacientes o


diferencias en los resultados de diferentes estudios.

Principio de intención de tratar o Análisis de intención de tratar


(Intention-to-Treat Principle or Intention-to-Treat Analysis):
Análisis de los desenlaces de los pacientes sobre la base del grupo
al cual fueron aleatorizados, hayan recibido la intervención
planificada o no. Este análisis conserva la potencia estadística de la
aleatorización, manteniendo así que es probable que los factores
importantes desconocidos que ejercen influencia en los resultados
se distribuyan del mismo modo en cada grupo de comparación.

Regresión linear (Linear Regression): Es el término empleado


para designar una regresión linear cuando la variable dependiente u
objetivo del estudio es continua y la relación entre la variable
dependiente y la independiente es considerada linear.

Regresión logística (Logistic Regression):El término empleado


para un análisis de regresión en el cual la variable dependiente u
objetivo del estudio es dicotómica y usa un modelo que depende de
logaritmos.
Meta análisis (Meta-Analysis): Una visión general que incorpora
una estrategia cuantitativa para combinar los resultados de varios
estudios en un solo estimado agrupado o resumen.

Ecuación de regresión de múltiples variables (Multivariable


Regression Equation): Un tipo de regresión que proporciona un
modelo matemático que explica o predice la variable dependiente u
objetivo principal al considerar simultáneamente todas las variables
independientes o de predicción.

Análisis de múltiples variables (Multivariate Analysis): Un análisis


que considera de modo simultáneo un número de variables de
predicción.

Hipótesis nula (Null Hypothesis): En el marco de someter a prueba


la hipótesis, la hipótesis nula es la hipótesis de inicio la cual un
ensayo estadístico está diseñado para considerarla y posiblemente
rechazarla.

Número necesario para producir un efecto prejudicial (Number


Needed to Harm): El número de pacientes necesario a tratar
durante un período de tiempo específico antes de que ocurra un
efecto secundario adverso del tratamiento. Es lo contrario del
aumento del riesgo absoluto.

Número necesario para tratar (Number Needed to Treat): El


número de pacientes que se necesita someter a tratamiento durante
un período específico de tiempo para impedir un desenlace
negativo. Al discutir el número requerido para el tratamiento, es
importante especificar el tratamiento, su duración y el mal
desenlace que se está evitando. Es lo contrario de la reducción del
riesgo absoluto.

Estudios de observacionales (Diseño de estudio observacional)


Observational Studies (Observational Studies or Observational
Study Design): Estudios en los cuales la preferencia del paciente o
del médico determina si el paciente recibe tratamiento o si forma
parte del grupo de control.

Posibilidades (Odds): Es una razón de posibilidades de que un


evento ocurra o no.
Razón de posibilidades (Odds Ratio): Una razón de posibilidades
de un evento en un grupo expuesto a las posibilidades del mismo
evento en un grupo no expuesto.

Costo de oportunidad (Opportunity cost): El beneficio potencial al


que se renuncia cuando una de las alternativas seleccionadas
excluye elegir una alternativa diferente.

Potencia estadística (Power): En una comparación de dos


intervenciones, la capacidad para detectar una diferencia entre las
dos intervenciones experimentales si una existe de hecho.

Factores de pronóstico (Prognostic Factors): Características de


los pacientes o de los participantes en el estudio que confieren un
aumento o disminución del riesgo de un desenlace positivo o
adverso.

Estudio de pronóstico (Prognostic Study): Un estudio


que enrola a pacientes en un momento en el tiempo y les hace un
seguimiento para determinar la frecuencia y el momento en que se
presentan los eventos subsiguientes.

Valor P (P-value): La probabilidad que los resultados sean tan


extremos o más extremos como ocurrirían los observados si la
hipótesis nula fuera verdadera y si el experimento era repetido una
y otra vez.

Año de vida ajustado por calidad (Quality-Adjusted Life-Year):


Unidad de medida para la supervivencia que da razón de los
efectos de un estado de salud subóptimo y que trae como resultado
limitaciones en la calidad de vida. Por ejemplo, si un paciente vive
10 años y su calidad de vida disminuye en un 50%, debido a una
enfermedad crónica de los pulmones, su supervivencia sería
equivalente a 5 años de vida ajustados por calidad.
Asignación aleatorizada (Random Allocation): Una muestra
derivada de la selección de unidades de muestreo (por ejemplo,
pacientes individuales) en la cual unidad tiene una oportunidad
independiente y fija (generalmente igual). La selección o no de cada
unidad dada seleccionada la determina la casualidad, por ejemplo,
mediante una tabla de números ordenados de modo aleatorio. Los
individuos se asignan a los grupos casualmente, por lo general, con
la ayuda de una tabla de números aleatorios. Esto no debe
confundirse con la asignación sistemática (por ejemplo en días
pares e impares del mes) o la asignación a conveniencia o
discreción del investigador.

Ensayo aleatorizado (Randomized Trial): Experimento en el cual


los individuos son designados aleatoriamente para recibir o no un
procedimiento preventivo, terapéutico o diagnóstico con un posterior
seguimiento para determinar el efecto de la intervención.

Riesgo relative (Relative Risk): Razón del riesgo de un evento


entre una población expuesta al riesgo entre la no expuesta. ¿?

Reducción del riesgo relativo (Relative Risk Reduction): Un


estimado de la proporción de un riesgo basal que es eliminado por
la terapia, se calcula dividiendo la reducción del riesgo absoluto
entre el riesgo absoluto en el grupo de control.

Confiabilidad (Reliability) Se refiere a la consistencia o


reproducibilidad de los datos.

Sensibilidad (Sensitivity): La proporción de las personas que tienen


verdaderamente un trastorno designado y son identificados por el
ensayo. El ensayo puede consistir en o incluir observaciones
clínicas.

Análisis de sensibilidad (Sensitivity Analysis): Un ensayo de la


estabilidad de las conclusiones de una evaluación de atención
médica sobre una variedad de estimados de probabilidad, juicios de
valor y suposiciones sobre la estructura de las decisiones que se
tomarán. Esto puede implicar repetir la evaluación de un modelo de
decisiones en el cual se varía uno o más de los parámetros de
interés.
Especificidad (Specificity): La proporción de personas que
verdaderamente no padecen una enfermedad designada
identificada como tal por el ensayo. El ensayo puede consistir en
observaciones clínicas o incluirlas.

Estudios o Diseño del estudio (Studies or Study Design): El


modo en que se organiza o elabora el estudio de un medicamento.
(1) Estudios en Fase I: Estudios que investigan el efecto
fisiológico de un medicamento o que aseguran que éste no
manifieste toxicidad inaceptable al principio, a menudo
llevado a cabo con voluntarios saludables.
(2) Estudios en Fase II: Estudios iniciales con pacientes que
proporcionan evidencia preliminar sobre la posible efectividad de
un medicamento.
(3) Estudios en Fase III: Estudios de control aleatorios diseñados
para establecer de modo definitivo la magnitud del beneficio de un
medicamento.
(4) Estudios en Fase IV o de vigilancia de postcomercialización:
Estudios realizados después de haberse establecido la efectividad
de un medicamento comercializado, normalmente para establecer
efectos tóxicos raros.

Efecto del tratamiento (Treatment Effect): Los resultados de


estudios clínicos pueden ser expresados usando varias medidas del
efecto del tratamiento. Entre los ejemplos se encuentran la
reducción del riesgo absoluto, reducción del riesgo relativo, razón
de posibilidades, número necesario para tratar, y efecto del tamaño.
La idoneidad de usar dichos ejemplos para expresar el efecto del
tratamiento y si se emplean o no las probabilidades, medias o
medianas para calcularlas depende del tipo de variable de
desenlace empleada para medir los desenlaces de salud. Por
ejemplo, la reducción del riesgo relativo se emplea para las
variables dicotómicas y los efectos del tamaño se usan, por lo
general, para las variables continuas.

Medida de utilidad )Utility Measures): Medidas que proporcionan


un numero único que resume todas las de Calidad de Vida
Relacionada con la Salud y son ponderadas por preferencia por
valor; estas tienen preferencias o valores anclados a la muerte y a
la salud plena y se denominan medidas de utilidad.

Vous aimerez peut-être aussi