Vous êtes sur la page 1sur 6

matr nas Matronas Prof.

2008; 9 (1): 15-20

profesión

Artículo especial

Estudios experimentales
Experimental studies
Begoña Bermejo Fraile
Médica. Doctora en Metodología de Investigación Biomédica. Servicio de Docencia, Investigación y Desarrollo Sanitarios.
Departamento de Salud del Gobierno de Navarra

RESUMEN ABSTRACT
Este artículo describe los aspectos esenciales en el diseño y análisis This article presents the basical aspects in experimental studies design
de los estudios experimentales: selección de pacientes, distribución and analysis: patient recruitment, randomization, blinding, follow-up,
aleatoria, enmascaramiento, seguimiento, análisis de los datos y pre- data analysis and presentation of results. Quasi-experimental studies
sentación de resultados. Se describen también los estudios cuasiex- and the main bias they can carry are also described.
perimentales y los principales sesgos que conllevan.

Palabras clave: estudios experimentales, estudios cuasiexperimen- Key words: experimental studies, quasi-experimental studies.
tales.

INTRODUCCIÓN sigue a los sujetos durante un tiempo, el que se conside-


El objetivo de los estudios experimentales es evaluar los re pertinente según la patología y los eventos que se
efectos de cualquier intervención, ya sea preventiva, cu- quieran observar, y se valoran los resultados, obtenien-
rativa o rehabilitadora. Por ejemplo, la efectividad de do así unas conclusiones.
diferentes tratamientos para la anemia ferropénica du-
rante el embarazo, la efectividad de las medidas de apo-
yo a la lactancia materna o la determinación de los efec- SELECCIÓN DE LA MUESTRA
tos de las prostaglandinas sobre la maduración cervical Los criterios de selección (criterios de inclusión y ex-
o la inducción del trabajo de parto. clusión) son los que definen la población a la que des-
Se llama ensayo clínico cuando el estudio se realiza en pués querremos generalizar (extrapolar) los resultados
un contexto clínico, en la consulta, con pacientes, y en- del estudio, motivo por el que se denomina población
sayo de campo cuando la intervención se lleva a cabo diana. Pueden ser características sociodemográficas:
fuera del contexto clínico y lo que se prueba es, por edad, sexo, raza, profesión, nivel socioeconómico; ca-
ejemplo, una vacuna. racterísticas de la enfermedad en estudio: curso, tipo,
El diseño clásico de un estudio experimental es como estadio, etiología, complicaciones, duración, trata-
el de la figura 1. Se selecciona un grupo de individuos miento actual, tratamientos previos; contraindicacio-
con unos criterios más o menos restrictivos, se les solici- nes para el tratamiento, otras enfermedades o trata-
ta el consentimiento informado y se dividen aleatoria- mientos que interfieren con el que se está probando;
mente en dos grupos: un grupo de estudio (el que se accesibilidad geográfica y temporal (hospital, centro y
somete a la vacuna, la intervención quirúrgica, el pro- periodo en el que se han reclutado los pacientes) y, por
grama de educación sanitaria o el medicamento que se supuesto, la aceptación del individuo para participar
quiere experimentar) y un grupo control (al que se le da en el estudio, previa información de las características
un placebo, otro tratamiento o simplemente nada). Se del mismo.

Correspondencia: Bermejo Fraile B. Estudios experimentales. Matronas Prof. 2008; 9 (1): 15-20
Begoña Bermejo Fraile
Correo electrónico: bbermejf@cfnavarra.es

15

15-20 ART ESP ESTUDIOS.indd 15 15/5/08 09:12:08


Matronas Prof. 2008; 9 (1): 15-20

Estos criterios son más o menos restrictivos en una cardiópatas, broncópatas, etc. y en tratamiento médico
búsqueda de equilibrio entre la validez interna y la vali- por cualquier patología. Las conclusiones del estudio fue-
dez externa. La validez interna se refiere al hecho de que ron muy válidas, pero difícilmente extrapolables, ya que
los resultados del estudio no están sesgados y se llega a son pocos los mayores de 65 años que no están en trata-
unas conclusiones correctas, válidas. La validez externa miento médico o no presentan alguna patología.
es la capacidad de extrapolación de esos resultados, te-
niendo en cuenta que sólo se pueden generalizar unos
resultados «válidos» a una población que, en los aspec- TAMAÑO DE LA MUESTRA
tos relevantes, es de similares características a la muestra En estadística, el tamaño de la muestra actúa como una
de estudio. lupa: si se estudian muchos individuos, cualquier pe-
Imaginemos que se trata de un ensayo clínico en el que queña diferencia resulta estadísticamente significativa y,
se quieren comparar diferentes formas de tratamiento de en cambio, cuando el tamaño de la muestra es pequeño
la anemia ferropénica durante el embarazo. Los criterios grandes diferencias pueden no resultar estadísticamente
de selección en principio son: mujer embarazada y con significativas. Aquí es importante recalcar que una aso-
anemia ferropénica. Pero dentro de este grupo de muje- ciación estadísticamente significativa no quiere decir
res, puede haber algunas que presentan contraindicacio- que sea clínicamente relevante. La «p» no proporciona
nes para el tratamiento con hierro o intolerancia, pueden en absoluto una medida de la magnitud del efecto. Una
presentar otras enfermedades o tratamientos que interfie- p=0,001 no quiere decir que el efecto sea mayor que si
ran con el hierro, o pueden estar siguiendo una dieta es- ha resultado p=0,78.
pecial que modifica la efectividad del tratamiento. Con
el fin de aumentar la validez del estudio, y que nada aje- Ejemplo: Se comprueba en un estudio pequeño que
no al tratamiento interfiera con los resultados, se puede un medicamento disminuye la presión arterial diastóli-
decidir excluir a estas mujeres, siempre que no constitu- ca de media 30 mmHg, no resultando estas diferencias
yan un número muy elevado, que provoque que al final estadísticamente significativas (p=0,32). En cambio, en
los resultados del estudio sólo se pudieran generalizar a otro estudio con un número de pacientes muchísimo
un sector muy pequeño de la población. mayor, se observa que otro medicamento disminuye la
presión arterial diastólica de media 6 mmHg, siendo
Ejemplo: Se llevó a cabo un ensayo clínico para compa- estas diferencias estadísticamente significativas (p=0,01).
rar la efectividad de dos fármacos para la prevención de Así, a simple vista, ¿cuál parece mejor fármaco para la
la demencia senil. Los criterios de inclusión eran perso- hipertensión? Estudiar pocos sujetos no sirve de mu-
nas mayores de 65 años no diagnosticados de demencia. cho, pero estudiar muchos tampoco. ¿Cuántos pacientes
Con el fin de que los fármacos que se probaban no inter- estudiar? Los necesarios para que una diferencia clínica-
firiesen con otros tratamientos o enfermedades, se exclu- mente relevante, si existe, resulte estadísticamente signifi-
yeron los pacientes hipertensos, hipercolesterolémicos, cativa.

16
Artículo especial

17
Matronas Prof. 2008; 9 (1): 15-20

CUMPLIMIENTO
Clofibrato Placebo
El que el individuo tome o no el tratamiento que se le
ha asignado depende, entre otros, de la forma de admi- p= 0,55
nistración, dosis, duración del tratamiento (puede ser 20,0% 20,9%
muy largo en las enfermedades crónicas). Cómo anali-
zar después a los sujetos «no cumplidores» tiene, como Cumplidores No cumplidores Cumplidores No cumplidores
veremos más adelante, importantes connotaciones me-
todológicas. 15,0% 24,6% 15,1% 28,3%
El tratamiento con hierro puede, además de ser de p <0,001 p <0,001
larga duración, producir molestias gástricas, diarrea o
estreñimiento. Si de entrada «nos aseguramos» que las
mujeres que participan en el estudio cumplirán con to- Figura 2. Análisis por intención de tratar
do el tratamiento, podemos llegar a unos resultados
muy válidos. Pero la realidad es muy distinta: nos dice frente a 24,6%). Pero cuál es nuestra sorpresa cuando
que un elevado porcentaje abandona el tratamiento de- en el grupo control, la mortalidad de los que se han to-
bido a estos efectos adversos. De entrada, seleccionar o mado el placebo también es significativamente inferior
no sujetos más probablemente cumplidores, depende a la de los que no lo han tomado. Parece que lo que dis-
de qué se valore más, si eficacia o efectividad, o de si se minuye la mortalidad es «tomar algo», aunque sea un
quieren conocer los resultados en una situación ideal o placebo.
en la situación real. La pregunta que surge es: ¿Qué característica tienen
Aquí es importante aclarar la diferencia entre eficacia los cumplidores, los que se toman el tratamiento (sin
y efectividad: eficacia es la consecución de unos objeti- saber si están tomando el fármaco o el placebo) que ha-
vos en condiciones ideales, las del laboratorio, las del ce que en ellos la mortalidad sea inferior? Podemos no
ensayo clínico; en cambio, efectividad es la consecución llegar a saberlo nunca, pero con la distribución aleatoria
de esos mismos objetivos en las condiciones reales. que se hizo en un principio, los cumplidores y todas las
connotaciones asociadas a ellos se distribuyeron por
Ejemplo: Un fármaco para la hipertensión puede ser igual en un grupo y otro. La distribución al azar facilita
realmente eficaz, disminuye significativamente la pre- que los dos grupos sean similares, no sólo en las varia-
sión arterial, pero es necesario tomar el medicamento bles que conocemos que influyen en la mortalidad co-
cuatro veces al día, y su sabor no es muy agradable. A la ronaria, sino en aquéllas que no conocemos que influ-
hora de la verdad, el paciente en muchas ocasiones se yen. Por ello, por respeto a la asignación aleatoria hecha
olvida de tomar el fármaco, con lo que, en las condicio- en un principio, se lleva a cabo un «análisis por inten-
nes reales, las de la vida diaria, ya no resulta tan efectivo ción de tratar», que consiste en analizar a los pacientes
y ya no logra disminuir la presión arterial como cuan- según el grupo al que fueron asignados (según la inten-
do, estando en el hospital y bajo las condiciones del en- ción inicial), de forma independiente de si tomaron el
sayo clínico, se le administraba el tratamiento cuatro tratamiento o no. Lógicamente, los «traspasados» redu-
veces al día. cen la potencia del estudio y las probabilidades de de-
tectar diferencias son menores, pero esta forma de ana-
lizar los datos aumenta la validez de los resultados.
ANÁLISIS POR INTENCIÓN DE TRATAR
Ejemplo: Se lleva a cabo un estudio para ver el efecto del
clofibrato sobre la mortalidad coronaria a los 5 años. PRESENTACIÓN DE RESULTADOS
Los resultados son los de la figura 2. En el grupo de clo- Las medidas de eficacia o efectividad de la intervención
fibrato la mortalidad es del 20,0% y en el grupo con- en un ensayo clínico son el riesgo relativo (RR), reduc-
trol es del 20,9%, no siendo estas diferencias estadísti- ción relativa del riesgo (RRR), reducción absoluta del
camente significativas (p=0,55). riesgo (RAR) y número que es necesario tratar (NNT).
Pero en el grupo de clofibrato, no todos los pacientes
se han tomado el fármaco, por lo que uno tiene la ten- Ejemplo: Se lleva a cabo un ensayo clínico para ver los
tación de comparar la mortalidad de los que lo han to- efectos de suplementos de cinc sobre el parto prematu-
mado con los que no lo han tomado, y se observa que ro. En el grupo de intervención, la incidencia de parto
la mortalidad en el grupo de los cumplidores es signifi- prematuro es del 3% y en el grupo control del 5% (los
cativamente inferior que la de los no cumplidores (15% datos no son reales).

18

15-20 ART ESP ESTUDIOS.indd 18 15/5/08 09:12:10


Estudios experimentales Artículo especial
B. Bermejo Fraile

El riesgo relativo (RR) es el cociente entre el riesgo en


Tabla 1. Riesgo de parto prematuro
el grupo de intervención y el riesgo en el grupo control: bajo tres supuestos
0,03/0,05=0,60. Este resultado quiere decir que el tra-
Grupo control Grupo de intervención
tamiento con cinc hace que el riesgo de parto prematu-
ro sea un 60% del que sería sin tratamiento. A 5% 3%
El riesgo de parto prematuro ha disminuido, ha pasado B 5‰ 3‰
C 50% 30%
del 5 al 3% gracias al tratamiento con cinc. Esta dismi-
nución se puede expresar en términos absolutos o relati-
vos. La reducción absoluta del riesgo (RAR) es la diferen- Estas medidas de resultados se deben acompañar de
cia de riesgos: 0,05 – 0,03= 0,02. Esta disminución, en su intervalo de confianza (IC), generalmente del 95%;
referencia al riesgo del que partíamos, es la reducción re- se llama así porque es el rango de valores en el que con-
lativa del riesgo (RRR)= (0,05 – 0,03)/0,05= 0,40. Gra- fiamos que se encuentre el verdadero valor. La amplitud
cias al tratamiento de cinc ha disminuido el riesgo basal de este intervalo, la precisión en la estimación, también
de parto prematuro en un 40% (efectivamente, con el depende del tamaño de la muestra, del número de suje-
RR habíamos dicho que el riesgo en el grupo tratado es tos estudiado, pero así como la p (nivel de significación
un 60% del riesgo en el grupo no tratado). estadística) no es una medida de la magnitud del efecto,
El NNT, como la misma palabra indica, es el número el parámetro estimado y su intervalo de confianza sí lo
de pacientes que es necesario tratar para evitar un even- son, y además nos informa de si las diferencias son esta-
to de los que se pretenden evitar con el tratamiento ex- dísticamente significativas o no: si el intervalo de con-
perimental. Por una simple regla de tres, se deduce que fianza incluye el valor nulo, las diferencias no son esta-
el NNT es el inverso de la reducción absoluta del ries- dísticamente significativas, y si no lo incluye, sí lo son.
go: NNT= 1/RAR. Siguiendo con el ejemplo, si de ca- Para el RR, el valor nulo es 1 (igual riesgo en el grupo
da 100 pacientes tratadas se han evitado 2 partos pre- de intervención que en el grupo control) y para la re-
maturos (RAR= 2%), ¿cuántas pacientes es necesario ducción absoluta o relativa del riesgo el valor nulo es 0.
tratar para evitar uno? 1/0,02= 50. Es necesario tratar
50 pacientes con suplementos de cinc para evitar un
parto prematuro. ESTUDIOS CUASIEXPERIMENTALES
Son diferentes formas de expresar unos mismos resul- Hay ocasiones en que la asignación a un grupo u otro
tados. ¿Cuál de ellas es preferible? (intervención o control) no se hace de forma aleatoria,
Los datos de la tabla 1 representan el riesgo de parto o incluso no hay grupo control, simplemente se com-
prematuro en el grupo control y en el experimental ba- paran en un solo grupo de individuos unos parámetros
jo tres supuestos. En la tabla 2 observamos que si los antes y después de una intervención. Este tipo de estu-
resultados se expresan mediante el RR o la RRR, apa- dios se llaman cuasiexperimentales y pueden darse algu-
rentemente el tratamiento es igualmente eficaz en los nos sesgos.
tres casos. En cambio, cuando se utilizan la RAR o el Imaginemos el caso de un estudio para valorar el efec-
NNT se pone de manifiesto que la alternativa más efec- to sobre la lactancia materna de una campaña de infor-
tiva es la C, disminuyendo mucho el riesgo de parto mación sobre sus beneficios. Un ensayo aleatorio con-
prematuro por el hecho de tomar suplementos de cinc. trolado incluiría la selección de un grupo de mujeres, la
Es más, basta con tratar a 5 pacientes para evitar un distribución aleatoria en dos grupos, a uno se le infor-
parto prematuro. No es lo mismo si el riesgo inicial del ma y al otro no, y se observan al cabo de un tiempo los
que se parte es elevado (y entonces relativamente fácil resultados, si ha aumentado o no la lactancia materna
de disminuir) que si ya el riesgo basal es muy bajo, donde respecto a lo que estaba previsto. Si no hay un grupo
cualquier disminución en términos absolutos va a ser control, pero observamos un aumento de la lactancia
muy pequeña. materna, ¿a qué se debe este aumento? Puede deberse,

Tabla 2. Riesgo relativo (RR), reducción relativa del riesgo (RRR), reducción absoluta del riesgo (RAR)
y número que es necesario tratar (NNT)
RR RRR RAR NNT
A 0,03/0,05 = 0,60 (0,05 – 0,03)/0,05 = 0,40 0,05 – 0,03 = 0,02 1/0,02 = 50
B 0,003/0,005 = 0,60 (0,005 – 0,003)/0,005 = 0,40 0,005 – 0,003 = 0,002 1/0,002 = 500
C 0,3/0,5 = 0,60 (0,3 – 0,5)/0,5 = 0,40 0,5 – 0,3 = 0,2 1/0,2 = 5

19

15-20 ART ESP ESTUDIOS.indd 19 15/5/08 09:12:11


Matronas Prof. 2008; 9 (1): 15-20

efectivamente, a la campaña de información, pero qui-


zás iba a aumentar de forma natural, con o sin campa-
ña, por sugestión (efecto placebo) o por el simple hecho
de sentirse observados, lo que se denomina efecto
{

Mejoría (%)
Hawthorne (figura 3). Este sesgo recibe el nombre de
una fábrica en la que se quiso comprobar si el hecho de
mejorar la iluminación aumentaba la productividad.
Efectivamente aumentó la productividad, pero podía
deberse a la mejora en la iluminación o al hecho de que
los trabajadores, sólo por el hecho de saber que iban a
medir su productividad, la aumentaban. Si hubiese un Grupo control Grupo intervención
grupo control, el efecto Hawthorne, el hecho de sentir-
se observados, el efecto placebo o la evolución natural Mejora espontánea Efecto placebo
afectan por igual a ambos grupos, por lo que si hay di- Efecto Hawthorne Efecto específico
ferencias entre los dos grupos, ésta sólo puede atribuirse Figura 3. Sesgos en los estudios antes-después. Componentes del efecto
a lo único que los diferencia: el que uno tiene mejor total
iluminación que el otro. En el ejemplo de la lactancia,
si hay un grupo control y en el grupo de intervención ocurre con los recién nacidos de madres fumadoras en
es mayor la decisión a favor de la lactancia materna, es- comparación con los de las madres no fumadoras.
ta mejoría sólo puede ser atribuible a lo único que dife- No existe un diseño idóneo, sino aquél más adecuado
rencia a los dos grupos: el que uno recibe la informa- para dar respuesta a los objetivos del estudio.
ción sobre los efectos beneficiosos de la lactancia
materna y el otro no.
Los ensayos clínicos se encuentran en el escalón más BIBLIOGRAFÍA
alto de la evidencia científica. Es el diseño en el que me- Bakke OM, Carné X, García Alonso F. Ensayos clínicos con medicamentos.
nos cabida tienen los sesgos, por lo que suponen la forma Madrid: Mosby/Doyma Libros; 1994.
Bermejo B. Medida de los resultados sobre la salud. En: Bermejo B, ed.
idónea de valorar la eficacia o efectividad de cualquier in-
Epidemiología clínica aplicada a la toma de decisiones en medicina.
tervención sanitaria. Pero no todo es susceptible de ser Pamplona: Departamento de Salud del Gobierno de Navarra, 2001.
estudiado mediante un ensayo: nunca se nos ocurriría se- Guyatt GH, Sackett DL, Cook DJ. Evidence-Based Medicine Working
Group. Guías para usuarios de la lectura médica I. Cómo utilizar un
leccionar a un grupo de gestantes, dividirlas de manera artículo sobre tratamiento o prevención. ¿Son válidos los resultados
aleatoria en dos grupos, decirle a uno de ellos que fume, del estudio? JAMA 1993; 270: 2.598-601.
y al otro que no fume, y valorar así los efectos del tabaco Guyatt GH, Sackett DL, Cook DJ. Evidence-Based Medicine Working
Group. Guías para usuarios de la lectura médica II. Cómo utilizar un
sobre el recién nacido. En este caso, se realizaría un estu- artículo sobre tratamiento o prevención. ¿Cuáles son los resultados?
dio de cohortes, en el que simplemente observamos qué JAMA 1993; 271: 59-63.

20

15-20 ART ESP ESTUDIOS.indd 20 15/5/08 09:12:12

Vous aimerez peut-être aussi