Académique Documents
Professionnel Documents
Culture Documents
El proyecto de investigación
aplicado a la clínica médica
Dr. José Osvel Hinojosa Pérez
El proyecto
de investigación
aplicado
a la clínica médica
ISBN 99934-70-44-9
Prólogo .......................................................................... 7
6
PRÓLOGO
8
SECCIÓN I. PLANEACIÓN
INTRODUCCIÓN
11
te del libro. Cada capítulo de esta sección incluye las prue-
bas estadísticas y medidas de asociación que son de gran
utilidad para cada caso en particular.
El familiarizarse con las bases para elaborar un pro-
tocolo de investigación es el punto de inicio para cono-
cer a fondo los fundamentos de la medicina basada en
evidencia, son inseparables, por ello hemos incluido en
algunos capítulos los aspectos de medicina basada en evi-
dencia correspondientes a cada diseño de estudio.
El autor agradece profundamente al Dr. Roberto del
Bosque Alonso su valiosa colaboración para llevar a fe-
liz término esta obra.
12
Capítulo 1
DINÁMICA DE LA INVESTIGACIÓN
14
factores contribuyen a que las circunstancias varíen y
los hallazgos pueden ser diferentes a lo que planeamos
debido a los errores y sesgos que a toda costa debemos
evitar; esto afecta la verdad en el estudio y la verdad en
el universo.
La población diana es la población objetivo de nues-
tro estudio; vg. si deseamos realizar un estudio de preva-
lencia de trastornos congénitos, nuestra población diana
serán los recién nacidos en general; sin embargo, si de-
seamos realizar el estudio de una enzima en recién naci-
dos con problemas congénitos, nuestra población diana
es precisamente los recién nacidos con este trastorno.
Como es difícil medir a toda la población, existen fór-
mulas que nos permiten sacar conclusiones con una por-
ción de esa población (lo que se llama tamaño de la mues-
tra). La muestra real de individuos estudiados es casi
siempre distinta de la que se intenta obtener en un prin-
cipio y las mediciones que utilizamos no siempre son uni-
formes, por lo que las inferencias causales pueden po-
ner en duda nuestros resultados. Afortunadamente es
factible predecir los errores y sesgos en investigación y
tomar las medidas necesarias para corregirlos antes de
que sea demasiado tarde.
Incluimos en este tratado —y usted lo va a leer fre-
cuentemente—, temas como error aleatorio, error sis-
temático, sesgos, errores tipo I y tipo II, para que no
suceda lo que ha venido ocurriendo a través del tiempo
en la investigación médica, donde encontramos una lite-
ratura médica plagada de sesgos y errores, que publica-
dos como verdad, han provocado en muchas ocasiones
grandes problemas en la práctica médica.
Es común tratar de contestar varias preguntas en un
mismo estudio, la mayoría de las veces no existe una co-
nexión entre las variables de estudio y lo que nos pro-
15
ponemos investigar. Pongamos por ejemplo un estudio
realizado por médicos anestesiólogos: evaluando la efecti-
vidad de dos medicamentos bloqueadores del dolor me-
diante anestesia epidural se observó una franca diferen-
cia estadística en la duración de la analgesia entre los
dos grupos con una muestra de 12 pacientes; la pobla-
ción diana es formada por pacientes en trabajo de parto
o cesárea; los autores deseaban conocer al mismo tiem-
po la prevalencia de trastornos motores secundarios a
la anestesia y encontraron que había cierta diferencia
entre un grupo y otro, pero al aplicar las pruebas esta-
dísticas se encontró que la diferencia no era significati-
va. Al aplicar las fórmulas para calcular el tamaño de la
muestra en ambas preguntas encontramos que efectiva-
mente para la primera pregunta (duración de la analge-
sia) 12 pacientes eran una muestra suficiente para una
significancia estadística, para la segunda pregunta (tras-
tornos motores) se necesitaban 55 pacientes y se estaba
incurriendo en un error de tipo II; desgraciadamente el
trabajo ya había sido presentado en un congreso y no se
pudo dar marcha atrás con las conclusiones.
16
Capítulo 2
CLASIFICACIÓN DEL DISEÑO DE INVESTIGACIÓN
18
estudio para conocer un resultado se elabora un Estu-
dio experimental.
A efecto de conocer adecuadamente nuestra ruta, el
diseño de investigación incluye dos aspectos fundamen-
tales: la temporalidad y la direccionalidad de la in-
vestigación.
La temporalidad se aplica a todos los diseños; im-
plica conocer cómo vamos a obtener la información de
nuestros pacientes o de nuestro universo de estudio. Si
vamos a analizar la información que hemos guardado por
un tiempo, vg. revisión de expedientes o de archivo de
computación, nuestro diseño es de tipo retrospectivo.
Por el contrario, si deseamos conocer lo que sucede hacia
adelante, con los nuevos pacientes que ingresen al estu-
dio, nuestro trabajo será prospectivo; algunos diseños
incluyen ambos métodos y se les llama ambispectivos.
La direccionalidad sólo aplica a los estudios analí-
ticos y experimentales y es útil porque nos permite iden-
tificar el proceso de causa-efecto. Los estudios experi-
mentales van de la causa al efecto al igual que los estu-
dios de cohorte, mientras que los estudios de casos y contro-
les van del efecto a la causa. Los diseños de tipo trans-
versal comparativo pueden tener la dirección hacia am-
bos lados.
Otro factor que debemos especificar en nuestro pro-
tocolo es el número de veces que vamos a medir un sig-
no clínico, una prueba de laboratorio, etc.; si la medición
solamente será efectuada una vez, nuestro estudio es
transversal, si se mide varias veces, longitudinal. Un
ejemplo es la medición de la tensión arterial o la deter-
minación de glicemia; si se realiza una sola vez habla-
mos de un estudio transversal.
Pongamos un ejemplo global: deseamos conocer si
existe algún factor que desencadene una enfermedad o
19
un cambio en la evolución de nuestros pacientes, esco-
gemos un diseño de casos y controles ya que conocemos
el efecto, pero no conocemos la causa. En este ejemplo
escribimos en nuestro protocolo que nuestro diseño es:
OBSERVACIONAL ANALÍTICO, DE CASOS Y CON-
TROLES, RETROSPECTIVO, TRANSVERSAL, DE
EFECTO A CAUSA.
20
Capítulo 3
LAS VARIABLES A INVESTIGAR
22
Continuando con nuestros ejemplos, en otra situa-
ción nos hacemos la siguiente pregunta: ¿Si resolvemos
o evitamos la anemia mediante eritropoyetina recombi-
nante humana en los prematuros, disminuirán los epi-
sodios de apnea? (ejemplo 3). Aquí surge una nueva va-
riable, la eritropoyetina recombinante humana y la
anemia ya no es variable principal de estudio porque pasa
a un segundo plano, sin embargo es importante tomarla
en cuenta porque puede influir sobre el resultado final.
La pregunta del ejemplo 1 nos orienta hacia un estu-
dio observacional descriptivo de prevalencia; aquí la ane-
mia es una variable que se llama dependiente o de des-
enlace.
En el ejemplo 2 tenemos dos variables, aquí “episo-
dios de apnea” es la variable dependiente mientras que
“la anemia” es la variable independiente.
El ejemplo 2 nos muestra un estudio de tipo obser-
vacional analítico ya que estamos buscando causalidad,
estamos preguntando ¿POR QUÉ?; no obstante, sólo es-
tamos observando.
En el ejemplo 3 buscamos la respuesta a un tratamien-
to (eritropoyetina) y a ésta se le llama variable inde-
pendiente o variable de intervención..
23
Por otro lado, suponga usted, estimado lector, que
como respuesta a su pregunta los resultados muestran
que la eritropoyetina disminuye los episodios de apnea,
muy contento va a un congreso y presenta su trabajo; un
investigador le hace el siguiente cuestionamiento: Otros
factores pueden producir episodios de apnea en los pre-
maturos, entre ellos tenemos la sepsis, la hipoglicemia,
y la hemorragia intraventricular ¿tomó en cuenta usted
estas variables confusoras? ¿Qué medidas tomó para
evitar que le llevaran a errores o sesgos en su trabajo?
Las variables confusoras son algunas característi-
cas que pueden afectar tanto a la variable independien-
te como a la dependiente; éstas deben de tomarse en
cuenta al planear la investigación, ya que comúnmente
llevan a errores y sesgos que ponen en duda nuestros
resultados.
Existen otras variables llamadas intervinientes que
influyen directamente sobre la variable dependiente, un
ejemplo sería el que se haya aplicado adecuadamente y
en dosis la eritropoyetina.
24
Capítulo 4
PLANTEAMIENTO DEL PROBLEMA A INVESTIGAR
26
obtener la información, son, en gran parte, producto del
pensamiento intuitivo.
La dificultad para aprender a plantear el proble-
ma estriba en que se ha escrito en forma muy general al
respecto. Encontramos en los libros de investigación que
se escribe que el planteamiento del problema debe ser
interesante, factible, novedoso, vulnerable, trascenden-
te, etc., sin embargo, para el investigador neófito es di-
fícil adaptar su idea a lo que se pretende con estas he-
rramientas. Por tal motivo hemos iniciado con el capítu-
lo de VARIABLES; si se logra comprender a fondo cómo
identificar las variables en nuestro problema lo demás
es cosa fácil. Con esto sugerimos que tome en cuenta lo
siguiente:
1) El planteamiento del problema no debe incluir
antecedentes bibliográficos a excepción de que de ahí
haya surgido nuestra idea de investigación.
2) No debe incluir la justificación, la cual veremos
en el capítulo 6.
3) Debe expresar nuestra intención en forma fácil,
sencilla y plasmarse en una extensión no mayor de una
cuartilla (una hoja).
4) Debe identificar las variables, hablar en forma am-
plia acerca de cada una de ellas y explicar la relación
existente entre ellas.
5) Debe culminar con una pregunta.
Hablemos ahora de los puntos 4 y 5 que son la clave
del éxito.
Pongamos un ejemplo:
Durante los últimos cuatro años han aparecido en va-
rias partes del mundo, en la temporada invernal, epide-
mias de problemas enterales causados por el rotavirus;
llama la atención que su inicio es explosivo, con vómitos
abundantes y lleva a algunos niños a deshidratación.
27
Como observamos hay una serie de variables que
saltan a la vista: problemas enterales, rotavirus, vó-
mitos y deshidratación.
En nuestra consulta diaria han llamado nuestra aten-
ción los vómitos; hemos observado que los niños sólo to-
leran pequeñas cantidades de líquido vía oral; se les ofre-
ce más de una onza de suero y vomitan. Algo nos dice que
el virus inicia su infección en el estómago y produce una
gastritis muy severa. Observe que aquí ya nos esta-
mos ocupando solamente de dos variables: vómitos
y gastritis. Proceda ahora a identificar la variable in-
dependiente, ¿la recuerda? Es la que condiciona el des-
enlace, ¿ya la identificó? En este caso la gastritis provo-
ca los vómitos, por ende la variable independiente es la
gastritis y la variable dependiente los vómitos. ¿Qué tie-
ne que hacer ahora?
Si decide reportar esta observación dará inicio a un
estudio descriptivo simple donde sólo tiene que reunir
los casos con rotavirus positivo y describir las caracte-
rísticas de los vómitos, lo cual le da la oportunidad de
elucubrar (mas no concluir) que son secundarias a una
inflamación aguda del estómago.
28
muy severa. No existen reportes en la literatura que ha-
yan demostrado la inflamación aguda del estómago en
pacientes con rotavirus, por lo que nos hacemos la siguien-
te pregunta: ¿Produce la infección por rotavirus una gas-
tritis aguda en niños?
¿Ya identificó las variables? Observe la pregunta,
¿qué tipo de estudio está por iniciar?
Continuando con el ejemplo hipotético: vamos a su-
poner que ya realizamos el estudio y demostramos que
los pacientes con rotavirus inicialmente tienen una gas-
tritis aguda por eso tienen vómitos tan persistentes. Aho-
ra vamos a demostrar ¿qué pasa si? o sea, vamos a reali-
zar un estudio experimental. Realizamos otro tipo de
planteamiento.
Durante los últimos cuatro años han aparecido en va-
rias partes del mundo, en la temporada invernal, epide-
mias de problemas enterales causados por el rotavirus;
llama la atención que su inicio es explosivo, con vómitos
abundantes y lleva a algunos niños a deshidratación. He-
mos observado que los niños sólo toleran pequeñas canti-
dades de líquido vía oral; se les ofrece más de una onza
de suero y vomitan. En estudios previos hemos demostra-
do la presencia de gastritis severa en los niños que cursan
con infección de tubo digestivo por rotavirus.
Existe una serie de medicamentos que reducen en for-
ma rápida y eficaz la inflamación gástrica aguda, entre
otros contamos con la ranitidina, un antagonista H2 que
inhibe en forma competitiva la interacción de la histami-
na con sus receptores, lo que disminuye la secreción de áci-
do gástrico; su uso puede ser de utilidad en estos pacien-
tes por lo que nos hacemos la siguiente pregunta:
¿Disminuye la ranitidina la gastritis aguda en niños
con rotavirus?
O bien podemos hacer una pregunta clínica:
29
¿Disminuye la ranitidina, la intensidad y frecuencia
de los vómitos en niños con infección por rotavirus?
En la primera pregunta la ranitidina es la variable
independiente de tipo intervención y la variable depen-
diente es la gastritis aguda; en la segunda pregunta la
variable dependiente son los vómitos.
Todo planteamiento del problema debe culminar con
una pregunta de investigación, el motivo es que en la
pregunta se sintetiza y se define la asociación que van a
tener las variables que vamos a estudiar. Una vez que ha
dado este paso, ahora sí tome en cuenta todo lo que di-
cen los diferentes autores acerca de la pregunta de in-
vestigación:
1) La factibilidad: ¿Es factible que pueda realizar
este estudio?, ¿puedo reunir el número suficiente de in-
dividuos?, ¿tenemos experiencia técnica y un laborato-
rio adecuado?, ¿cuento con el equipo necesario?, ¿es abor-
dable en cuanto a tiempo y dinero?, etc.
2) Relevancia: ¿Es relevante para el conocimiento
científico, para la práctica clínica y para líneas de inves-
tigación a futuro?
3) Novedosa: ¿Confirma o refuta hallazgos previos,
amplía los hallazgos previos, proporciona nuevos resul-
tados?
4) Ética: Una buena pregunta a investigar debe ser
ética. Si el estudio supone riesgos físicos inaceptables o
invasión de la intimidad, el investigador deberá buscar
otras formas de contestar esta pregunta. Si se duda acer-
ca de la ética del estudio se deberá comentar con el co-
mité de ética o de investigación de la institución.
Es importante que como investigador deje rodar su
imaginación, se requiere ser creativo, pero también im-
plica una buena dosis de tenacidad para plantearse va-
rias veces el mismo problema que le preocupa, hasta en-
30
contrar una solución satisfactoria. El mantenimiento de
una actitud escéptica respecto de las creencias de acep-
tación general también puede estimular el surgimiento
de buenas preguntas para investigar. Dude de todo lo
que se le presente como verdadero y encontrará que en
el mundo de la medicina se trabaja con verdades apa-
rentes que no han pasado por el crisol del rigor científi-
co; es un reto pero encontrará que vale la pena.
31
Capítulo 5
APOYO BIBLIOGRÁFICO A LA PREGUNTA DE INVESTIGACIÓN.
LA IMPORTANCIA DE LA LECTURA CRÍTICA
33
Tabla 1
Cómo escoger los artículos científicos
NO
1. ¿Es el título interesante o útil?
Pase
al
SÍ
siguiente
NO artículo
2. ¿Tienen los autores buenos antecedentes científicos?
SÍ o NO SABE
NO
3. Vea resultados del RESUMEN. ¿Le serían útiles?
NO
SÍ
Cuál es el propósito
de la búsqueda
NO
Comparar con el
NO
estándar de oro Se integró una
ideal cohorte dx NO
Fue sólida la
temprana y metodología Fue la asigna- NO
uniforme del estudio ción de los
sujetos a las
intervenciones
al azar
SÍ SÍ SÍ SÍ
34
Si el título le interesa pase a ver los nombres de los
autores y vea si son de renombre, si ya conoce usted sus
publicaciones anteriores y sobre todo si tienen buenos
antecedentes científicos, si le convencen o no está segu-
ro, proceda a leer el resumen y vaya al apartado de re-
sultados, olvide todo lo demás, vea los resultados, si los
autores obtuvieron resultados de validez considere si le
son útiles a su investigación, en caso contrario, pase al
siguiente artículo.
Dé importancia al lugar donde fue realizado el estu-
dio, si los resultados son aplicables al medio donde us-
ted se desenvuelve, ese artículo vale la pena que lo revi-
se. Si la población de referencia en el artículo es atendi-
da en un hospital de tercer nivel, donde se cuenta con
gran adelanto tecnológico y la población que usted va a
incluir en su investigación es atendida en un hospital de
segundo nivel, ponga gran atención en los aspectos que
le van a ser útiles en dicha publicación.
Una vez que ha quedado satisfecho con las cuatro
guías de la lectura crítica: leer el titulo, revisar la lis-
ta de autores, leer el resumen y reflexionar sobre
el sitio del estudio, evalúe la publicación que está a pun-
to de incluir en sus citas bibliográficas desde el ángulo
del propósito que tiene usted en la investigación.
35
El mismo paso debe dar si su propósito es conocer el
curso clínico y pronóstico de una enfermedad; en forma
inicial evalúe si los autores integraron una cohorte diag-
nóstica en forma temprana y uniforme (ver capítulo 19).
Si lo que usted planea es hacer un estudio para de-
terminar etiología y causalidad, valore si la metodología
del estudio tiene la suficiente solidez; en caso afirmativo
pase a la sección de material y métodos a realizar una
evaluación exhaustiva de estos aspectos antes de tomar
el estudio para su apoyo bibliográfico (ver capítulo 18).
Por último si lo que usted desea es hacer un estudio
para distinguir una terapéutica útil de una inútil o da-
ñina, analice inmediatamente en el artículo si al hacer la
selección de los sujetos a la intervención se realizó aleato-
rización (ver capítulo 20) y pase a la sección de material
y métodos en caso afirmativo.
Observe que no se sugiere leer la introducción; si el
estudio no fue bien realizado tenga cuidado al tomar en
cuenta las conclusiones a que han llegado los autores.
Algunos trabajos se pueden conseguir en Medline con
el texto completo, los cuales podemos imprimir si con-
tamos con el programa Adobe Acrobat o bien guardar en
disco duro; Medline le ofrece en venta los artículos que
no tienen texto completo, no obstante, si en la biblioteca
de su localidad se cuenta con las revistas mencionadas,
aproveche esta oportunidad.
Una vez seleccionados los artículos escriba en dos a
tres hojas los aspectos de los artículos que tengan rela-
ción con la pregunta que usted está planteando. Escriba
de cada artículo, en cuatro a seis párrafos, lo lo que cada
autor demostró o encontró en su investigación y asigne
un número a cada cita bibliográfica.
En la sección de Antecedentes no debe anotar da-
tos que tengan relación con el planteamiento del proble-
36
ma, ni debe incluir otros aspectos del protocolo de in-
vestigación.
La propuesta para elaborar un buen resumen de los
trabajos de investigación y publicar los resultados con
buena metodología se expone a continuación.
CARACTERISTÍCAS DE UN RESUMEN
ESTRUCTURADO
37
d) Intervenciones: En este apartado se harán ex-
plícitas las principales características de la va-
riable independiente, incluyendo dosis, vía de
administración, intervalo entre dosis, etc.
3. RESULTADOS PRINCIPALES: Los resultados
deben proporcionarse en forma narrativa. Los resulta-
dos numéricos deben incluir medidas de variación o in-
tervalos de confianza, así como el nivel de significancia
estadística obtenido en cada una de las comparaciones
efectuadas. Se debe incluir en este apartado el resulta-
do de las medidas de asociación.
4. CONCLUSIONES: Las conclusiones del estudio
deberán estar sustentadas en los resultados obtenidos,
debiendo mencionar su potencial aplicación, y evitando
hacer una generalización que exceda los límites del es-
tudio, especificando en su caso, la necesidad de hacer
otras investigaciones, particularmente cuando sea nece-
sario realizarlas en otros niveles de atención médica.
38
Capítulo 6
JUSTIFICACIÓN DEL ESTUDIO A REALIZAR
40
Capítulo 7
PLANTEAMIENTO DE LOS OBJETIVOS:
GENERAL Y ESPECÍFICOS
42
Capítulo 8
PLANTEAMIENTO DE LAS HIPÓTESIS
44
La hipótesis de trabajo es la hipótesis nula, la hipó-
tesis alterna se acepta por exclusión si la prueba de sig-
nificación estadística rechaza la hipótesis nula.
La hipótesis nula es la base formal para examinar la
significación estadística. Al empezar con la proposición
de que no existe asociación, las pruebas estadísticas pue-
den estimar la probabilidad de que una diferencia ob-
servada pueda ser debida al azar.
Hulley explica el porqué el investigador debe traba-
jar sobre la hipótesis nula en estas palabras:
“De alguna manera, el problema del investigador es
similar al que enfrenta un acusado. No se puede determi-
nar la verdad absoluta respecto a si el acusado cometió el
crimen. En cambio, el jurado empieza suponiendo la ino-
cencia: el acusado no cometió el crimen. El jurado debe
decidir si existen pruebas suficientes para rechazar la
supuesta inocencia del acusado; la norma se conoce como
más allá de una duda razonable. Sin embargo, un jurado
puede equivocarse, condenando a un acusado que es ino-
cente o dejando de condenar a uno que en realidad es cul-
pable. De manera similar, el investigador empieza supo-
niendo la hipótesis nula de que no hay asociación entre
las variables predictora y de desenlace en la población. A
partir de los datos recogidos en su muestra, el investiga-
dor usa pruebas estadísticas para determinar si hay su-
ficiente evidencia para rechazar la hipótesis nula a favor
de la hipótesis alternativa de que existe una asociación en
la población. La norma de estas pruebas se denomina ni-
vel de significación estadística”.
Se produce un error de tipo I (falso positivo) si un
investigador rechaza una hipótesis nula que en realidad
es verdadera en la población (el acusado era inocente y
se le declaró culpable).
45
Se produce un error de tipo II (falso negativo) si el
investigador no logra rechazar una hipótesis nula que
en realidad es falsa en la población (el acusado era cul-
pable y se le declaró inocente). Estos errores son comu-
nes en investigación y son consecuencia de un mal dise-
ño en el proyecto de investigación.
Se agregan otros ingredientes a las hipótesis que in-
fluyen sobre el tamaño de la muestra que debemos estu-
diar en la población. Para el efecto la hipótesis alterna-
tiva se divide en lo que se ha llamado hipótesis de una
cola e hipótesis de dos colas.
La hipótesis de una cola especifica la dirección de
la asociación entre las variables predictoras y de desen-
lace. Se expresa como A es mayor que B, o B es mayor
que A. La hipótesis de dos colas no especifica el des-
enlace y se expresa como: A es mayor o menor que B.
46
Capítulo 9
NOMENCLATURA DE LAS VARIABLES EN EL PLAN DE ANÁLISIS
48
Las categorías sólo indican diferencias entre sí pero
no se les ubica por encima o por debajo uno de otro. Ej.
sangre tipo O, tipo B, tipo A, etc., otro ejemplo es el gé-
nero (masculino, femenino).
La escala ordinal. Al igual que la nominal es de ca-
rácter subjetivo, son variables cualitativas, pero en esta
escala las categorías guardan un orden, que puede ser
ascendente o descendente progresivo y tienen la carac-
terística que mantienen un orden jerárquico entre sí.
Tienden a contener más información que las nominales
pero su carácter subjetivo las hace susceptible de sesgos.
Una vez que hemos decidido cuáles son las variables
que vamos a incluir en el estudio, se sugiere colocarlas en
un cuadro que lleve los siguientes apartados: nombre y
tipo de variable, definición conceptual, definición
operacional y escala de medición de la variable.
En el ejemplo que mostramos a continuación expon-
dremos un trabajo sobre la incidencia de Tuberculosis
pulmonar en pacientes diabéticos. La variable indepen-
diente es la Diabetes Mellitus y la variable dependiente
es la Tuberculosis pulmonar. Procedamos ahora a colocar
las variables en un cuadro que nos permita definir, clasi-
ficar y establecer la escala de medición de estas variables;
primero se trabaja sobre la variable independiente.
49
Nombre y tipo Definición Definición Escala de
de variable Conceptual Operacional Medición
50
Nombre y tipo Definición Definición Escala de
de variable Conceptual Operacional Medición
Independiente Nominal
Anemia
aplástica
51
Nombre y tipo Definición Definición Escala de
de variable Conceptual Operacional Medición
52
Capítulo 10
POBLACIÓN DE ESTUDIO
54
racterísticas pueden ser clínicas, demográficas y/o
geográficas.
Lo más frecuente a utilizar son las características clí-
nicas de los individuos a participar en el estudio; estos
criterios deben ser muy específicos e incluir todos los
aspectos que hemos definido en nuestras variables. Debe
ser amplia para no descuidar algunos puntos que pue-
dan suscitar controversia.
Las características demográficas incluyen edad, sexo
y raza; especificar estas características nos permite dar-
le una mejor orientación a nuestro trabajo.
Las características geográficas y temporales de in-
clusión implican aspectos administrativos y debemos te-
ner un sentido común para poseer una buena coordina-
ción entre los objetivos científico y práctico de la inves-
tigación que vamos a desarrollar. En ocasiones los cos-
tos o la dificultad para conseguir una buena muestra de
pacientes nos obligan a sacrificar estos aspectos y es pro-
bable se pierda credibilidad o una buena generalización
de los resultados a toda la población diana, por lo que de-
bemos poner en la balanza la factibilidad de realizar una
investigación si no contamos con las características geo-
gráficas y temporales de inclusión.
Los criterios de exclusión nos permiten generali-
zar con mayor veracidad nuestros resultados a la pobla-
ción diana y de esta manera obtener la validez externa
de nuestra investigación. Los individuos que entran en
esta categoría reúnen los criterios de selección, sin em-
bargo, alguna característica clínica, demográfica o tem-
poral, puede crear confusión o problema en la interpre-
tación de lo que andamos buscando, por lo que los indi-
viduos que presenten esas características deben ser ex-
cluidos del estudio. Hulley menciona un buen ejemplo
de esto “la inclusión de pacientes alcohólicos en el estu-
55
dio de la osteoporosis ampliaría la generalización, permi-
tiendo a los investigadores estudiar el exceso de consumo
de alcohol como causa de desmineralización; estas venta-
jas, no obstante, tendrían como contrapartida mayores difi-
cultades en el seguimiento, con lo cual el investigador pue-
de decidir excluir a los pacientes alcohólicos, si cree que es
más importante evitar las pérdidas en el seguimiento” .
Es necesario establecer la diferencia entre criterio
de exclusión y criterio de eliminación. El primero se es-
pecifica antes de seleccionar la muestra poblacional, y el
criterio de eliminación se realiza después de haber in-
cluido a los pacientes en el estudio. Las características
generalmente son de tipo administrativo o temporal; es
común que se mencione “no encontrar el expediente clí-
nico” como criterio de eliminación; este factor cobra es-
pecial importancia en los estudios retrospectivos. Tam-
bién se toman en cuenta aspectos vitales para el segui-
miento como la asistencia a la consulta, ya que la posibi-
lidad de pérdidas es importante para nuestro estudio.
56
Capítulo 11
CÁLCULO DEL TAMAÑO DE LA MUESTRA
Estudios descriptivos
Para calcular cuántos individuos se requieren para
obtener una muestra representativa en estudios descrip-
tivos se utiliza una fórmula sencilla y la estandarización
de algunos parámetros. Supongamos que deseamos rea-
lizar un estudio sobre las características de la dermati-
tis atópica en nuestra población; acudimos a la literatu-
ra para apoyar nuestra pesquisa en estudios de preva-
lencia realizados por otros autores. La literatura repor-
ta una prevalencia de dermatitis atópica en un 10 a 15%
de la población, en algún momento de la vida. Surge la
pregunta: ¿Cuántos individuos debo incluir en el estu-
dio que me permitan concluir sin riesgo de equivocarme
sobre las características de la dermatitis atópica en nues-
tra población?
El estudio que estamos proponiendo es de tipo des-
criptivo y el cálculo del tamaño de la muestra se basa en
la siguiente fórmula:
Zα(2) PQ
n=
d (2)
Esta fórmula expone los elementos indispensables
para obtener un tamaño adecuado de muestra en estu-
dios descriptivos y se define de la siguiente manera:
58
n = tamaño de la muestra
Z α = nivel de significancia
P = proporción o prevalencia reportada en la lite-
ratura de la variable dependiente o de desen-
lace
Q = diferencia de 1 menos P
d = precisión absoluta necesaria a ambos lados de
la proporción
59
un mayor acercamiento al tamaño de muestra. En el su-
puesto caso de no conocer la prevalencia, se debe hacer
una prueba piloto o una estimación realista de la preva-
lencia en nuestra población. A este factor también se le
llama Estimación que toma en cuenta el cálculo aproxi-
mado de un parámetro de la población.
Valor Q - Se obtiene restando la proporción o preva-
lencia a la unidad; es un factor preestablecido para cal-
cular la muestra.
Valor d – Es la precisión absoluta necesaria a am-
bos lados de la proporción; representa el intervalo de
confianza que debemos tomar respecto a la prevalencia
o proporción. Generalmente se toma un valor de 5% (0.05),
no obstante, este valor no es fijo y es importante tomar
en cuenta el significado de la precisión ya que afecta al
tamaño de la muestra.
Aplicación práctica
En el caso de dermatitis atópica tomamos la preva-
lencia de 10% (0.10); en este ejemplo aplicar una preci-
sión (valor d) de 5% (0.05) implica aceptar un intervalo
de confianza de 5 a 15%; al sustituir la fórmula encon-
tramos que si damos una significancia de 95% el valor
de Z corresponde a 1.960, la P es de 0.10 y el valor Q de
0.90. Al realizar las operaciones correspondientes en-
contramos un valor n de 138 que nos indica que se requie-
ren 138 individuos de la población diana (en este caso
pacientes con dermatitis atópica) para conocer las carac-
terísticas de esta entidad nosológica.
Modificando cualquiera de los parámetros de la fór-
mula encontramos un cambio en el valor n; por ejemplo,
si tomamos la prevalencia de 15% (0.15) el valor n resul-
tante es de 195 individuos. En este mismo caso, toman-
do en cuenta una prevalencia de 0.10 pero modificando
60
la precisión (valor d) a un 2% (0.02), el valor n resultan-
te es de 864 individuos, lo que indica que se necesita un
mayor número de individuos para tener una mayor pre-
cisión en el estudio.
El nivel de significación implica la confianza que te-
nemos de que nuestra muestra es representativa de la
población diana, una significancia de 90% corresponde a
un valor α de 1.64; al modificar este parámetro en nues-
tra fórmula, manteniendo un valor P de 0.10 encontra-
mos un valor n de 97 individuos.
Al realizar nuestro proyecto de investigación, si nos
encontramos con la dificultad de que nuestra población
accesible no es suficiente para completar una muestra,
es probable tengamos la tentación de recurrir a dismi-
nuir la significancia o la precisión para que nuestra mues-
tra sea menor; no obstante, debemos ser honestos y con-
signar en nuestro protocolo los parámetros que hemos
utilizado para obtener el número de individuos con el
que proyectamos realizar nuestro trabajo.
En Lectura crítica se nos enseña que al escoger un
artículo publicado en cualquier revista médica, antes de
leer los resultados debemos leer Material y Métodos y
entre otros conceptos de validez interna y externa, bus-
car cómo escogió el investigador su muestra, cuál es su
población diana y si la población accesible corresponde
a la población diana. En el momento en que usted lea que
el investigador utilizó un buen nivel de significación y
una buena precisión, puede estar seguro de que los re-
sultados que está ofreciendo son confiables.
No debemos subestimar el resultado obtenido con esta
fórmula, frecuentemente nos encontramos con la necesi-
dad de un número mayor de individuos de los que pode-
mos estudiar en el tiempo que nos hemos fijado, sin em-
bargo es preferible hacer estudios colaborativos con otros
61
hospitales o prolongar un poco más el tiempo del estu-
dio, antes de resignarnos a no seguir adelante con nues-
tro proyecto o bien de hacerlo con un menor número de
casos.
Es preferible tener el tamaño de muestra adecuado
para poder emitir una conclusión valedera. La determi-
nación del tamaño asume que la muestra es representa-
tiva de la población de estudio.
Otro punto importante a considerar es la prevalen-
cia de la variable que vamos a tomar en cuenta para ob-
tener la muestra. Del Río-Navarro y cols. realizaron un
estudio sobre la presencia de hiperreactividad bronquial
en 30 niños con dermatitis atópica encontrando una pre-
valencia de 70%. En este caso el estudio va dirigido a la
variable hiperreactividad bronquial relacionada con der-
matitis atópica, por lo tanto la muestra se debe calcular
tomando en cuenta la variable de desenlace, en este caso
la hiperreactividad bronquial. Con una significancia de
95% (1.960), un valor P de 0.70, valor Q de 0.30 y preci-
sión de 0.05 obtendremos un valor n de 322 niños con der-
matitis atópica para obtener una conclusión válida en el
estudio, no obstante, como la prevalencia es muy alta, la
precisión se puede ampliar a 0.10 con lo que obtendre-
mos un valor n de 80 niños con dermatitis atópica. Al ha-
cer un análisis de la muestra de 30 pacientes con la que
se publicó el artículo, observamos que tiene una significan-
cia de 90% y una precisión de 0.14.
Si en la literatura médica se conoce la media y des-
viación estándar de una variable podremos obtener la
muestra a través de la siguiente fórmula:
Zα(2) σ (2)
n=
d (2)
62
n = Tamaño de la muestra
Zα = Nivel de significancia
σ (sigma)= También llamado amplitud; se refiere a
la desviación estándar de un parámetro.
d = Precisión absoluta necesaria a ambos la-
dos de la desviación estándar (también
se conoce como intervalo de amplitud)
Estudios comparativos
En los estudios analíticos y experimentales el tama-
ño de la muestra es una estimación del número de in-
dividuos necesarios para detectar una asociación de un
tamaño de efecto determinado entre dos grupos, con unas
probabilidades previamente especificadas de cometer
errores.
63
Existe una estrecha relación entre el tamaño de la
muestra y el resultado de las pruebas estadísticas, esto
ha conducido a condicionar el valor de p a un tamaño
de muestra adecuado.
Los factores que debemos tomar en cuenta antes de
calcular el tamaño de muestra en estudios comparativos
son: la probabilidad α, la probabilidad β, la potencia o po-
der, los errores tipo I y tipo II, las hipótesis de una o de
dos colas, la magnitud de la diferencia y la variabilidad.
Comparar dos proporciones es probablemente la prue-
ba de contraste de hipótesis más utilizada en la investi-
gación clínica; existen fórmulas más sofisticadas para
calcular el tamaño de la muestra según el diseño de es-
tudio, ya sea un ensayo clínico aleatorio, un estudio de
cohortes o de casos y controles. En esta sección vamos a
definir los parámetros que se toman en cuenta para cal-
cular la muestra en una población a través de la fórmula
de prueba de hipótesis y diferencia de proporciones de
dos poblaciones.
Las hipótesis pueden ser en una o dos direcciones;
cuando es una sola dirección se llama hipótesis de una
cola, si es en ambas direcciones se llama hipótesis de
dos colas. Esta situación aparentemente tan simple tam-
bién influye en la cantidad de individuos a incluir en el
estudio.
Hipótesis de una cola. Cuando elaboramos una hi-
pótesis que expresa una condición muy clara, por ejem-
plo, A es mayor que B, el sentido de nuestra investiga-
ción va en una sola dirección y es como esperamos en-
contrar nuestros resultados.
La hipótesis de dos colas implica que el resultado
a obtener puede ser en ambas direcciones, se expresa
en los términos: A es mayor o menor que B.
64
Este tipo de hipótesis es más conservadora y para su
comprobación requiere de un mayor número de partici-
pantes en el estudio.
La fórmula que utilizamos en los estudios compara-
tivos es la siguiente:
(Zα + Zβ)2 (P1Q1 + P2Q2)
n=
(P1 - P2)2
65
significativa entre los dos grupos respecto a la variable
que se está evaluando.
Un valor de P mayor de 0.05 indica que no existe di-
ferencia en las proporciones ya que previamente esta-
blecimos que sólo aceptaríamos un error del 5%, no obs-
tante, si deseamos ser más tolerantes y aceptar un error
de 10% (0.10) como límite, un resultado de 0.08 (8%) en
este caso resulta estadísticamente significativo y se con-
cluye que si existe diferencia estadística entre las dos
proporciones; obviamente establecer un valor Zα tan am-
plio le resta credibilidad a nuestra investigación. Al igual
que en los estudios descriptivos si deseamos un mayor
grado de confianza el valor alfa disminuye (el porcentaje
de error a aceptar) e incrementa el valor de Z.
66
La cantidad de individuos a ingresar en la muestra
de estudio depende del grado de tolerancia que demos
a la posibilidad de cometer errores y es inversamente
proporcional; a menor error deseado mayor deberá ser
el tamaño de la muestra.
El error tipo I o falso positivo se produce si un in-
vestigador rechaza una hipótesis nula que en realidad
es verdadera en la población. Consiste en reconocer equi-
vocadamente que existe una diferencia estadísticamen-
te significativa entre dos grupos cuando en realidad no
existe. El valor de P resultante es menor de 0.05 si he-
mos establecido previamente un valor Zα de 5%. Este tipo
de error se produce más frecuentemente cuando la
muestra excede el número de individuos que se re-
quiere investigar, ya que a mayor número de individuos
los valores de p se estrechan y resultan con diferencias
menores de 0.05; en estos casos se debe utilizar un valor
α de 99%.
El error tipo II o falso negativo se produce si el
investigador no logra rechazar una hipótesis nula que
en realidad es falsa en la población. Consiste en aceptar
equivocadamente que no existe una diferencia estadísti-
camente significativa entre dos grupos cuando en reali-
dad existe. En este caso obtenemos un valor de P mayor
de 0.05 (si hemos establecido ese nivel de probabilidad
de error) cuando debería ser menor de 0.05. Este error
se presenta frecuentemente en investigación y resulta
de un tamaño de muestra insuficiente con una poten-
cia menor del 80%.
La planificación del tamaño de la muestra tiene como
objetivo elegir un número suficiente de individuos para
mantener α y β en un nivel aceptablemente bajo, sin que
el estudio resulte innecesariamente costoso o difícil.
67
La magnitud de la diferencia expresada como P1
menos P2, se refiere a la cantidad que resulta de restar
la proporción uno (que generalmente es el grupo control)
a la proporción dos que es el grupo de estudio. Este pará-
metro tiene gran influencia sobre el tamaño de la mues-
tra y es inversamente proporcional; a mayor diferencia
de proporciones menor será el número de individuos a
incluir en el estudio, por el contrario una diferencia mí-
nima requiere un mayor número de participantes en el
estudio. Para calcular el tamaño de la muestra debe defi-
nirse la magnitud de la diferencia que se desea detectar.
Algunas veces se dispone de datos de la literatura o de
estudios previos que permiten estimar razonablemente
el efecto esperado, si no es así, se debe seleccionar la míni-
ma magnitud que se considera de importancia clínica;
esta diferencia debe de fijarse en términos realistas, den-
tro del rango de valores esperables, no es válido especu-
lar con este parámetro. A menudo, es tentador utilizar
diferencias más amplias, ya que se obtiene un tamaño de
muestra más reducido; esta actitud debe evitarse ya que
implica que diferencias menores a la establecida, a pe-
sar de que pueden ser de importancia clínica, no serían
detectadas al no alcanzar el nivel de significación estadís-
tica con el número de sujetos estudiados. A su vez, conclui-
do y publicado el trabajo, es fácil observar este error al
determinar la potencia del estudio con el número de su-
jetos estudiados.
68
males los niveles de colesterol en más de 70% de la po-
blación.
Es un estudio comparativo con hipótesis de una cola,
que compara dos proporciones. Fijamos una significa-
ción de 95%, por lo cual le corresponde un valor Zα de
1.64, le damos una potencia al estudio de 80%, por lo cual
el valor Zβ correspondiente es de 0.84. El porcentaje esti-
mado (P1) para el grupo control es de 30% (disminución
de niveles de colesterol exclusivamente con pravastati-
na) y el porcentaje estimado para el grupo experimental
(P2) es de 70%. Sustituyendo estos valores en la fórmula
y desarrollándola, encontramos un tamaño de muestra
de 16 pacientes; es importante hacer notar que corres-
ponden 16 pacientes a cada grupo.
Si el porcentaje del grupo control fuera de 50% (0.50)
entonces el tamaño de muestra se eleva a 70 pacientes
en cada grupo porque disminuye la diferencia entre las
dos proporciones.
Observe el ejemplo y la forma en que se sustituyen
los valores de la fórmula para prueba de hipótesis.
(Zα + Zβ)2 (P1Q1 + P2Q2) (1.64 + 0.84)2 (0.30 x 0.70 + 0.70 x 0.30)
n=
(P1 - P2)2 (0.7 – 0.3)2
69
quisitos, incluyendo la aplicación de la fórmula adecua-
da para trabajar con un número de individuos represen-
tativo de la población de estudio estriba en que nos per-
mita concluir que los resultados que estamos obtenien-
do son verdaderos.
Anexo a este libro hemos incluido un archivo llama-
do “cálculo del tamaño de la muestra en estudios de in-
vestigación” donde sólo tiene que aplicar los parámetros
necesarios para su estudio y obtener su muestra*.
70
Capítulo 12
MÉTODOS PARA OBTENER LA MUESTRA DE LA POBLACIÓN
72
sible y más tarde buscar e incluir en el estudio a los in-
dividuos elegidos.
El muestreo sistemático consiste en seleccionar la
muestra utilizando un período determinado previamen-
te. Este período que se puede llamar período k de suje-
tos o unidades de observación consiste en seleccionar
alternadamente de la población cada cierto número de
individuos los que se van a seleccionar para la muestra
del estudio. El valor k se obtiene dividiendo el número
de individuos de la población accesible entre el tamaño
de la muestra deseada. Esta modalidad es una forma de
muestreo probabilístico si el punto de partida se escoge
al azar. En el ejemplo que hemos puesto anteriormente
dividimos la población accesible de 1,000 entre el tama-
ño de muestra que en este caso es de 68 y obtenemos un
valor k de 14. Aquí es importante tomar al azar un nú-
mero entre 1 y 14 y éste va a ser el punto de partida del
muestreo; si escogemos el número 5 al azar, entonces los
individuos a incluir en la muestra serían el 5, el 19, el
33 y así progresivamente hasta completar los 68 indivi-
duos. El muestreo sistemático es susceptible de errores
ocasionados por la periodicidad natural, presentes en la
población permiten que el investigador pueda predecir
y quizá manipular los que posteriormente aparecerán en
la muestra.
El muestreo estratificado consiste en dividir la po-
blación en subgrupos o estratos de acuerdo con ciertas
características generales (Ej. sexo, raza, peso, etc.) y des-
pués extraer una muestra al azar de cada uno de los es-
tratos. Por ejemplo, para evitar que una muestra inclu-
ya un diferente número de pacientes del sexo masculi-
no o femenino, se estratifica primero y después se esco-
gen al azar los individuos que se van a incluir en la mues-
tra. Esta técnica permite asegurar la presencia de la ca-
73
racterística de interés y el control de las variables con-
fusoras.
El muestreo por conglomerados consiste en ex-
traer una muestra al azar a partir de agrupaciones na-
turales de individuos (conglomerados) dentro de la po-
blación, siendo lo más común un área geográfica. Este
tipo de muestreo se utiliza más en estudios epidemiológi-
cos que en estudios clínicos. Es muy útil cuando la pobla-
ción está dispersa y es poco práctico o costoso elaborar
una lista de todos los elementos. La muestra se obtiene
en dos etapas: en la primera la población se divide en
conglomerados y en la segunda etapa se seleccionan los
sujetos de cada conglomerado utilizando una técnica alea-
toria simple, sistemática o estratificada. En un estudio
que abarque varios hospitales, cada hospital es un con-
glomerado, cuando ya hemos determinado todas las insti-
tuciones participantes se procede a un muestreo al azar
de cada hospital para seleccionar la muestra.
El muestreo no probabilístico, como su nombre lo
indica, no toma en cuenta la probabilidad de que los in-
dividuos de la población accesible sean incluidos en la
muestra de estudio. Se le llama también muestreo por
conveniencia o por cuota. Este muestreo es más prácti-
co que el probabilístico para los proyectos de investiga-
ción clínica, sin embargo se puede caer en el error del
sesgo de selección por la persona que está elaborando el
estudio y no cubre los requerimientos de aleatorización
necesarios para calcular errores de muestreo. Existen
tres diseños principales de muestras no probabilísticas:
muestreo de casos consecutivos, muestreo por con-
veniencia y muestreo a criterio.
El muestreo de casos consecutivos consiste en in-
corporar al estudio cada individuo que cumpla con los
criterios de selección dentro de un intervalo de tiempo
74
especifico o hasta alcanzar un número definido de indi-
viduos. Es la mejor de las técnicas no probabilísticas y
resulta factible en muchas ocasiones; su dificultad estri-
ba en no tomar en cuenta algunos factores como los cam-
bios de estación debidos a la duración del estudio, sobre
todo cuando vamos a efectuar un estudio que tiene marca-
da influencia de las condiciones climatológicas, vg. asma
bronquial, problemas respiratorios de etiología viral o
diarreas de origen estacionario.
El muestreo por conveniencia consiste en selec-
cionar a individuos de la población accesible de los que
se pueda disponer con facilidad; es muy utilizado y de
gran valor si los individuos realmente cubren los requi-
sitos de inclusión al estudio. Se puede caer fácilmente
en el sesgo de selección.
El muestreo a criterio consiste en escoger entre la
población accesible a los individuos que se supone más
apropiados para participar en el estudio. Debido a la fa-
cilidad con la que se obtiene la muestra y la gran posibi-
lidad de seleccionar sólo los casos que nos interesan para
nuestro estudio, es difícil extrapolar los resultados a otras
poblaciones.
Se puede realizar una combinación de estos diseños
de muestreo, sobre todo en estudios clínicos, donde la
población accesible es en el ámbito hospitalario. Si es fac-
tible reclutar a todos los individuos a lo largo del perío-
do de un período de inclusión suficientemente largo, la
mejor elección consiste en tomar una muestra de casos
consecutivos; si la población accesible es demasiado gran-
de se extrae una submuestra al azar, mediante muestreo
probabílistico del tipo aleatorio simple. En caso de pre-
sentarse las dificultades antes descritas, se puede recu-
rrir al muestreo estratificado o por conglomerados.
75
Capítulo 13
CONCEPTOS DE VALIDEZ DE LA INVESTIGACIÓN
77
presenta prácticamente el mismo valor cada vez que
se mide. La precisión tiene una influencia muy impor-
tante sobre el poder o la potencia del estudio. Cuanto
más precisa es una medición, para un determinado ta-
maño de muestra, mayor es el poder estadístico para es-
timar los valores medios y contrastar las hipótesis. La
precisión también se ve afectada por la variabilidad bioló-
gica que se presenta en los individuos y esto puede dar
como resultado lo que se ha dado en llamar el error
aleatorio, el cual se define como un resultado equivoca-
do debido al azar; un ejemplo es la prevalencia de anti-
cuerpos frente al virus del SIDA el cual se refiere de 30%
en la población; es posible que una muestra bien diseña-
da de 100 pacientes obtenida a partir de dicha población
contenga 30 pacientes con anticuerpos, pero lo más pro-
bable es que el número de individuos se aproxime a esta
cantidad, vg. 28, 29, 31 o 32. En ocasiones el azar puede
determinar una cifra sustancialmente distinta como 19
o 42.
Al efectuar mediciones existen tres fuentes princi-
pales de error: la variabilidad debida al observador
que está asociada a los factores que influyen en el ob-
servador en un momento dado al tomar una lectura o al
hacer una encuesta. La variabilidad debida al indivi-
duo se refiere a la variación biológica intrínseca de cada
individuo, los biorritmos, ritmos circadianos o el tiempo
transcurrido desde la última medicación. La variabili-
dad debida al instrumento se refiere a la variabilidad
en la medición que tiene como origen las fluctuaciones
de los factores ambientales, como la temperatura o el
ruido de fondo.
En general se considera que el error aleatorio no es
tan grave porque su efecto sobre los resultados se pue-
de resolver mediante el recurso de aumentar el tamaño
78
de la muestra, sin embargo existen algunas estrategias
para aumentar la precisión de las mediciones. El más
importante quizá sea la estandarización de los méto-
dos de medición, donde se da gran importancia a que
en nuestro proyecto hagamos una definición operativa
de cómo vamos a efectuar las mediciones, instrucciones
precisas de abordaje al individuo, cómo calibrar un ins-
trumento, etc., por lo que es importante escribir las pau-
tas específicas de cómo vamos a efectuar una medición.
Es básico dar a conocer a todos los investigadores que
van a participar en el estudio, el protocolo de investiga-
ción una vez terminado, para que se indique a cada uno
su labor específica y cómo se van a efectuar las medicio-
nes; si se trata de una encuesta se debe entrenar a los
observadores y los puntos esenciales que se deben to-
mar en cuenta acerca de los instrumentos es tratar de
hacer las mediciones con el mejor instrumento que
exista en el mercado, de preferencia con dispositivos
automáticos. El error aleatorio también se reduce si se
repite la medición y se utiliza la media de dos o más de-
terminaciones; este método es muy útil en variables como
la presión arterial.
La precisión se describe en estadística mediante la
desviación estándar de una serie de mediciones repe-
tidas. Un estadígrafo útil para comparar la precisión de
distintas variables es el coeficiente de variación que
se conoce como la desviación estándar dividida por la me-
dia. Cuando un método de medición es impreciso se pre-
sentan coeficientes de variación muy grandes. Existen
reportes en la literatura que mencionan desviaciones
estándar casi del tamaño de la media, lo que habla de una
mala precisión.
También se puede medir la precisión valorando la con-
cordancia entre observadores u observaciones; un buen
79
ejemplo de esto es la medición del coeficiente de corre-
lación. Algunas pruebas más complejas miden la concor-
dancia entre observadores, como la prueba de Kappa
que expresa el grado de concordancia no debida al azar.
Esta prueba es muy útil y le da gran valor a la publica-
ción de un trabajo. Si usted va a realizar un trabajo don-
de una variable requiera una lectura muy precisa de al-
gún factor, por ejemplo el conteo de parásitos en una
muestra de heces fecales, puede poner a dos observado-
res que hagan el conteo por separado y después realizar
una prueba de Kappa; si la concordancia entre los ob-
servadores es buena, le da mucho valor a sus resultados
porque esta aumentando la precisión.
80
Cuadro 4
Observador 2
Observador 1
81
Ni (a + b) y No (c + d). Ver el cuadro 6, y ahora la fórmula
queda así:
(Mi x Ni) + (Mo x No) / T 2 , siendo más fácil de recor-
dar. Después de tener bien identificada la fórmula es más
fácil ahora sacar el nivel de concordancia entre los dos
observadores.
Po = (a + d / T) queda así: Po = 47 + 45 / 106, que nos
da 0.867.
Pe = (56 x 52) + (50 x 54) / 106 2
Pe = (2912) + (2700) / 11236 Pe = 0.499
Cuadro 6
Observador 2
Observador 1
82
En el cuadro 7 observamos la clasificación de Landis
y Koch para la interpretación de los valores de Kappa.
Cuadro 7
Valor de Fuerza de
Kappa concordancia
Menor de 0 Pobre
0 a 0.20 Leve
0.21 a 0.40 Mediana
0.41 a 0.60 Moderada
0.61 a 0.80 Sustancial
0.81 a 1.00 Casi perfecta
83
ba de Elisa, la cual por carecer de exactitud nos da mu-
chas pruebas falsas positivas, sin embargo, si recurri-
mos a la prueba de Western Blot, nuestro trabajo tendrá
mayor validez interna ya que es más precisa y exacta en
sus mediciones. La exactitud también se ve afectada por
las variaciones biológicas que referimos en la precisión.
El error a que inducen las mediciones que no son exac-
tas es el llamado error sistemático el cual se define
como un resultado equivocado debido a un sesgo; este
error es irreversible y no mejora al aumentar el tamaño
de la muestra. Cuando nos damos cuenta de un error de
este tipo sólo podemos lograr mejoría de nuestra inves-
tigación al rediseñar el estudio de manera que reduzca
los diferentes sesgos.
Cuando se intenta medir fenómenos abstractos o va-
riables subjetivas como el dolor o la calidad de vida, se
dificulta un poco obtener validez en el estudio, no obs-
tante, actualmente se recurre a instrumentos que hayan
sido validados por otros autores o bien que se pueden
validar mediante la práctica de una prueba piloto antes
de realizar el estudio completo. El instrumento puede
ser una escala de medición, como la escala de medición
del dolor de Glasgow. En todo caso la repetición de la
lectura por varios observadores y la aplicación de una
prueba de concordancia nos permite darle validez a nues-
tro estudio.
84
SECCIÓN II. PONIENDO EN MARCHA
EL PROYECTO DE INVESTIGACIÓN
En esta sección trabajaremos sobre la base de elaborar un pro-
tocolo siguiendo los pasos en cada diseño de investigación. Para el
efecto los hemos dividido en tres grupos: Observacional descriptivo,
Observacional analítico y experimentales. Para tener un mejor
desempeño se recomienda revisar todo el material que hemos in-
cluido en la primera sección conforme vaya incrementando el gra-
do de dificultad del proyecto de investigación.
Capítulo 14
CARACTERÍSTICAS GENERALES DE LOS DISEÑOS
DE INVESTIGACIÓN
Cuadro 8
Enfermedad
Presente Ausente
Presente a b
Exposición
Ausente c d
88
Lea detenidamente cada uno de sus contenidos y en-
contrará que colocando los datos del estudio y decidien-
do la dirección que le vamos a dar a nuestro trabajo po-
dremos encontrar fácilmente el diseño que necesita-
mos para obtener una buena respuesta a nuestra pre-
gunta de investigación.
La exposición o factor de exposición (CAUSA) y
la enfermedad que también podemos llamar desenla-
ce (EFECTO), tienen relación con las variables que he-
mos incluido en nuestra pregunta de investigación. Aquí
hablamos de la variable independiente y de la variable
dependiente. Su asociación varía según la dirección que
le demos al estudio, en un estudio prospectivo partimos
de una exposición (a + b) y (c + d) y como resultado espe-
ramos un desenlace o enfermedad; en cambio, en un es-
tudio retrospectivo, se conoce el desenlace o enferme-
dad (a + c) y (b + d) y el resultado que se desea conocer
es el factor de exposición. De esta manera usted encon-
trará fácilmente las variables independiente y depen-
diente.
Esta situación varía para los estudios descriptivos o
de prevalencia, donde generalmente se busca una expo-
sición en los sujetos que tienen la variable de desenlace
(a + c) sin tomar en cuenta un grupo control. En estos ca-
sos, como es una observación simple no se forma la tabla
de contingencia de 2 x 2 ya que falta el grupo control.
También se puede buscar desde el factor de exposición
(a + b) y evaluar la variable de desenlace.
Para explicar cómo funciona la tabla de contingencia
con relación a la dirección del estudio tomemos como
ejemplo la asociación entre tabaquismo y cáncer de pul-
món (cuadro 9).
89
Cuadro 9
Ca de pulmón
Presente Ausente
Presente a b
Tabaquismo
Ausente c d
90
plo ya que tendríamos que escoger a individuos no fuma-
dores de la población y exponerlos al humo del tabaco
para evaluar después si desarrollan cáncer de pulmón;
la ética no nos permite un estudio de tal magnitud. En
este estudio también se parte del factor de exposición a
la enfermedad o desenlace.
Conociendo bien nuestras variables, las posibilida-
des de realizar el estudio y el tiempo del que dispone-
mos, podemos escoger el diseño de investigación más ade-
cuado.
91
Capítulo 15
CÓMO DISEÑAR UN ESTUDIO OBSERVACIONAL DESCRIPTIVO
93
mente en las revistas médicas o en los congresos médi-
cos. Ofrecen el primer reporte de las variables que ca-
racterizan a una enfermedad de reciente aparición o que
llaman la atención sobre manifestaciones poco conoci-
das; también describen efectos secundarios de fármacos
ya comercializados. Son útiles porque permiten formu-
lar hipótesis después de realizados.
Presentan dos características generales:
1) Suelen ser estudios longitudinales y no transversa-
les; contienen información adquirida a lo largo del tiempo.
2) Todos los pacientes de la serie de casos tienen la
misma enfermedad o han recibido el mismo tratamien-
to. Los resultados no permiten sacar conclusiones ya que
no existe un grupo control, por esto, sólo son útiles para
generar hipótesis pero no para evaluarlas.
Los estudios transversales, también llamados de
prevalencia, examinan la relación entre una enferme-
dad y una serie de variables en una población determi-
nada y en un momento del tiempo. Su característica prin-
cipal es que la presencia de la exposición y de la enfer-
medad se observa simultáneamente o en un corto perío-
do de tiempo; lo que define a los estudios transversales
es la falta de secuencia temporal entre la medición de
un factor de riesgo y una enfermedad. Estos estudios se
utilizan principalmente para estimar la prevalencia de
un factor de riesgo o una enfermedad en una población.
En ocasiones los estudios transversales constituyen la
primera etapa de un estudio longitudinal (estudio de co-
hortes o ensayo clínico), midiendo inicialmente las va-
riables de interés e identificando a los individuos que
deben ser excluidos de la población a riesgo de desarro-
llar la enfermedad. Argimón refiere un estudio realiza-
do para conocer algunas características de pacientes ca-
lificados de asténicos: se seleccionaron aleatoriamente
94
pacientes atendidos en un centro de atención primaria
que completaron un cuestionario validado de vitalidad
que establece el umbral a partir del cual un paciente pue-
de catalogarse como asténico; de los 254 pacientes esco-
gidos, 115 cumplían los criterios. A partir de este estu-
dio transversal, los individuos fueron clasificados en dos
grupos según la presencia o ausencia de fatiga y se si-
guieron durante un año para determinar el número de
visitas y de nuevos diagnósticos de los pacientes en cada
uno de los grupos.
La ventaja de los estudios transversales es que se pue-
den realizar fácilmente y son más económicos, permi-
tiéndonos conocer la prevalencia de una enfermedad; tie-
nen la desventaja de que no nos permiten obtener con-
clusiones acerca de las relaciones de causalidad y no son
útiles para estudiar enfermedades raras si el diseño im-
plica obtener muestra de la población general.
Las encuestas descriptivas son útiles porque per-
miten obtener datos directos de los sujetos de estudio.
La encuesta requiere la formulación de un cuestionario
del cual depende prácticamente la investigación. En este
proceso un cuestionario se define como un proceso es-
tructurado que permite recoger la información a través
de la cumplimentación de una serie predeterminada de
preguntas.
Un cuestionario cumple el requisito de ser estructu-
rado cuando a todos los individuos del estudio se les for-
mulan las mismas preguntas, de la misma forma y en la
misma secuencia; el objetivo es obtener una información
suficiente y amplia que permita comparar los resulta-
dos. La información obtenida por este método es subje-
tiva y la validez tanto externa como interna depende de
que el cuestionario cumpla una serie de requisitos; por
tal motivo, antes de realizar un estudio descriptivo que
95
incluya un cuestionario debe revisar la literatura para
determinar si previamente existe o no una encuesta que
ya esté validada.
Es importante seguir un orden en la elaboración de
una encuesta descriptiva a través de un cuestionario.
En la tabla 2 encontramos los pasos claves que debemos
tener en mente antes de iniciar la investigación.
Tabla 2
Etapas en la preparación
de un cuestionario
1) Revisar la bibliografía.
2) Elegir el tipo de cuestionario.
3) Elegir el tipo de preguntas para cada va-
riable.
4) Elegir el orden de las preguntas.
5) Diseñar el formato.
6) Preparar el manual de instrucciones.
7) Entrenar a los encuestadores.
8) Realizar una prueba piloto.
9) Revisar el cuestionario y el manual de ins-
trucciones.
96
por correo y se puede terminar el estudio en menor tiem-
po. Las desventajas de este cuestionario son que se re-
quiere un buen nivel de escolaridad y capacidad de lec-
tura; las preguntas han de ser simples y cerradas y ade-
más hay un alto porcentaje de no respuestas.
El cuestionario de mayor utilidad es la encuesta rea-
lizada por entrevista personal; es el que proporciona el
mayor número de respuestas y es menor el número de
preguntas que se dejan en blanco. Las preguntas pue-
den ser más completas y la información más exhaustiva.
El problema de este tipo de encuesta es que el entrevis-
tador puede dar lugar a lo que se llama sesgo del entre-
vistador por no seguir la misma técnica de entrevista con
todos los individuos, por percibirse la actitud del entre-
vistador al influenciar las respuestas mediante entona-
ción dirigida a una respuesta; de tal manera los entre-
vistados desean complacer al encuestador y dan una res-
puesta que piensan va a merecer su aprobación. Este pro-
blema se soluciona con un buen entrenamiento a todo el
personal que participa en las entrevistas y mediante la
aplicación de una prueba piloto que permita darle solu-
ción a todos estos detalles.
La encuesta por teléfono tiene ventajas sobre la en-
cuesta enviada por correo; son de utilidad intermedia
pero se obtienen menos respuestas que con la entrevis-
ta personal; no obstante, pueden ser útiles en estudios
que requieran atender una población no disponible fácil-
mente. Las entrevistas deben ser breves y sencillas; se
deben evitar las preguntas íntimas porque es poco pro-
bable que se obtenga una buena respuesta. Un buen re-
curso es enviar una carta previa, explicando los motivos
del estudio y poniendo en claro la institución que reali-
za la investigación.
97
Las preguntas pueden ser cerradas o abiertas. En
las preguntas cerradas se especifica de antemano las po-
sibles respuestas, mientras que en las preguntas abier-
tas el entrevistado contesta con sus propias palabras,
sin más limite que el espacio reservado para ellas. Se
prefieren las preguntas cerradas en un cuestionario ya
que es más fácil medirlas y comparar las respuestas en-
tre individuos, no obstante, el diseño debe ser amplio y
juicioso para permitir la mejor información. Para situa-
ciones complejas es preferible utilizar preguntas abier-
tas porque el entrevistado se puede explayar y dar in-
formación que de otra manera no podemos obtener.
Las preguntas cerradas pueden convertirse en va-
riables susceptibles de medición al convertirlas a núme-
ros; pueden ir desde la simple dicotomía: SÍ o NO, hasta
la graduación por intervalos, que pueden ser de mayor a
menor o de mejor a peor. Es importante que las pregun-
tas sean mutuamente excluyentes para no crear dudas
entre los participantes al escoger la respuesta.
Para diseñar un buen cuestionario se sugiere tomar
en cuenta los siguientes criterios en su redacción:
Utilice un lenguaje sencillo, comprensible para to-
dos los participantes y no use terminología médica; en
caso de requerir utilizar un término médico haga una
pequeña aclaración entre paréntesis, por ejemplo: ¿Ha
presentado artralgias? (dolores en las articulaciones).
Evite las preguntas ambiguas y no formule dos
preguntas en una, es necesario ser preciso.
No formule las preguntas de forma negativa, ya
que conduce a ambigüedades y dobles interpretaciones;
si pregunta ¿No cree usted que fumar perjudica su sa-
lud? puede provocar dos o más tipos de respuestas: «Sí,
creo que perjudica mi salud» o bien, «Sí, no creo que per-
judique mi salud».
98
Utilice preguntas cortas y que no tengan muchos
conceptos para no distraer la atención del encuestado
acerca de nuestro objetivo.
Para las preguntas personales utilice preguntas
cerradas, coloque la enfermedad o variable objetivo en-
tre otras opciones similares para facilitar la respuesta.
Haga preguntas neutras, evite preguntas que su-
gieran algún tipo particular de respuesta; el entrevista-
dor no debe dar motivo para que el individuo de estudio
conteste lo que todo el mundo espera que conteste y no
exprese su propia opinión.
Repita las preguntas más importantes para el
estudio en diferentes sitios del cuestionario, redác-
telas en forma diferente con miras a obtener siempre la
misma respuesta (validez interna), de esta manera se
dará cuenta si el entrevistado ha respondido con la ver-
dad.
Un punto clave a definir es el orden de las pregun-
tas, el cual debe ser lógico para que facilite las respues-
tas. Las primeras preguntas deben despertar el interés
del encuestado y aumentar su interés por colaborar. La
primera pregunta no debe ser una pregunta abierta, debe
más bien ser una pregunta cerrada con pocas opciones
de respuesta. También esta primera pregunta debe ser
neutral, un cuestionario nunca debe empezar con una
pregunta en la que los encuestados deben expresar su
acuerdo o desacuerdo con el tema, las preguntas perso-
nales deben dejarse para el final, de tal manera, el esta-
do civil, trabajo, dirección o teléfono suelen ir cuando
termina el cuestionario. Si en una encuesta se incluyen
preguntas abiertas y cerradas sobre un mismo tema, es
preferible colocar primero las preguntas abiertas para
evitar que el entrevistado se sienta influenciado con lo
que expresamos en las preguntas cerradas. Toda encues-
99
ta debe iniciar con los planteamientos generales y des-
pués con los específicos, por ejemplo se puede iniciar con
la pregunta: ¿Es usted alérgico a medicamentos? ¿Qué
reacción tuvo? y enseguida pasar a la pregunta específi-
ca ¿Es usted alérgico a las sulfas? Aquí, siguiendo un or-
den lógico, al obtener una respuesta negativa en la pri-
mera pregunta, las demás preguntas sobran, por lo que
se puede indicar en el cuestionario pasar a otra pregun-
ta. Las preguntas que pueden causar mayor objeción en-
tre los participantes deben ir al final, incluyendo aquí
las preguntas de índole personal.
Algo que debemos tomar en cuenta al elaborar una
encuesta es que el cuestionario no debe de iniciar direc-
tamente con las preguntas; todo cuestionario debe ini-
ciar con una breve introducción sobre la naturaleza y fi-
nalidad del estudio. En las entrevistas personales el
entrevistador lee la introducción, en los cuestionarios
autocumplimentados se deja aparte la introducción para
que el individuo de estudio la lea cuando considere con-
veniente, generalmente lo hará antes de responder a las
preguntas.
La introducción debe cubrir los siguientes aspectos:
- Finalidad del estudio.
- Resaltar la importancia de que los participan-
tes dediquen unos minutos a responder la en-
cuesta.
- Nombre de la institución que avala el proyec-
to.
- Método de selección de los participantes.
- Uso que se hará de la información.
- Confidencialidad de los datos.
- Y sobre todo, agradecer de antemano su cola-
boración.
100
Por último, es importante que se dé una instrucción
personal a todos los que van a participar en las encues-
tas, reunirlos una y otra vez, que se saturen de los ob-
jetivos del estudio y de la manera en que deseamos que
elaboren una entrevista. También es útil dar inicio con
una prueba piloto, hacer cortes secuenciales e ir corri-
giendo errores sobre la marcha y una vez que estamos
seguros que tenemos pocas posibilidades de error, de-
bemos dar marcha a nuestra investigación.
101
centajes, muy útiles para establecer los valores de una
población.
En los estudios descriptivos debemos dar especial
importancia a los aparatos de medición para dar una
adecuada VALIDEZ INTERNA a nuestra investigación.
Escoja adecuadamente su población (capítulo 10) para
evitar el error sistemático que puede afectar la VALI-
DEZ EXTERNA. El tamaño de muestra debe ser ajusta-
do a la fórmula que mencionamos en el capítulo 11 para
estudios descriptivos. Anote todo lo que va a realizar y
cómo lo va a medir. Una vez que tenga el bosquejo de to-
dos los elementos que va a incluir en el estudio, haga un
ejercicio mental de la dinámica de su investigación y ano-
te paso por paso lo que va a realizar. Imagine que esta
en el consultorio o en el hospital y selecciona un indivi-
duo para el estudio, qué requisitos (criterios de selec-
ción) exige para incluirlo; imagine que le esta tomando
la muestra de sangre o la presión arterial y dónde va a
escribir la lectura obtenida. Vea cómo pasan los datos de
la hoja de recolección a la computadora y cómo analiza
los resultados aplicando las pruebas estadísticas indica-
das previamente. Finalmente, vea la redacción de su in-
vestigación en un artículo médico y ¿por qué no?, piense
en qué revista lo va a publicar. Este ejercicio es muy útil
y varía de un estudio a otro, lo más importante es que al
visualizar paso por paso cómo vamos a realizar la inves-
tigación, evitamos errores que pueden influir en los re-
sultados.
102
Capítulo 16
ANALÍTICO: DISEÑO TRANSVERSAL COMPARATIVO
104
Capítulo 17
DISEÑO DE UN ESTUDIO DE PRUEBA DIAGNÓSTICA
106
los individuos que presentan la enfermedad y los que no
la presentan. El mero hecho de demostrar que existe una
asociación entre el resultado de la prueba y la presen-
cia de la enfermedad no es suficiente. Pongamos un ejem-
plo. En el cuadro 10 encontramos que en 95 individuos
que tuvieron la prueba positiva, el estándar de oro mos-
tró que 65 efectivamente tuvieron la enfermedad, mien-
tras que los restantes 30 que dieron la prueba positiva,
resultaron sanos según el estándar de oro.
Cuadro 10
Prueba diagnóstica
Estándar de oro
Enfermo Sano
107
yoría de las pruebas de la medicina basada en eviden-
cia; observe en el cuadro 11 las 4 casillas denominadas
a, b, c y d, y la disposición que muestra el resultado de
la variable predictora (prueba) y la de desenlace (enfer-
medad). ¡Siempre deben de colocarse en ese sentido! En
la casilla a la prueba es positiva y el paciente tiene la
enfermedad y el resultado se llama verdadero positi-
vo (en el ejemplo: 65 de 100). En la casilla b la prueba
es positiva pero el paciente no tiene la enfermedad, a este
resultado se le llama falso positivo (en el ejemplo: 30
de 100 individuos). La casilla c muestra que la prueba
es negativa pero el paciente presenta la enfermedad re-
cibiendo el nombre de resultado falso negativo (en el
ejemplo: 35 de 100 individuos). La casilla d también es
muy importante, el paciente tiene una prueba negativa
y no tiene la enfermedad, llamada resultado verdadero
negativo (en el ejemplo: 70 de 100 individuos).
Cuadro 11
Prueba diagnóstica
Estándar de oro
Enfermo Sano
108
prende inicialmente una prueba diagnóstica. Estas prue-
bas se llaman sensibilidad, especificidad, valor pre-
dictivo positivo y valor predictivo negativo.
La tabla de contingencia también nos permite valo-
rar la prevalencia de la enfermedad en el estudio ((a+c)
/ TOTAL)) cuya utilidad se manifiesta en una segunda
etapa de las pruebas diagnósticas llamada PROBABILI-
DAD DESPUÉS DE LA PRUEBA.
En general las pruebas diagnósticas se evalúan cal-
culando su sensibilidad y especificidad. En el cuadro 12
se observa lo que se conoce como SENSIBILIDAD, la cual
se define como la proporción de individuos que tie-
nen la enfermedad y el resultado de la prueba es
positivo.
Cuadro 12
Prueba diagnóstica
Estándar de oro
Enfermo Sano
100(a+c)100(b+d) TOTAL
109
LA ESPECIFICIDAD se define como la proporción
de individuos que no tienen la enfermedad y que tie-
nen un resultado de la prueba negativo; nos indica
el grado de acierto de la prueba para identificar a los in-
dividuos que no tienen la enfermedad. En la fórmula la
especificidad se expresa como ((d/(b+d)); según los datos
encontrados en la tabla de contingencia al sustituir los
parámetros encontramos (70/100), lo que da una especi-
ficidad de 70% que también se considera bajo.
Sacket menciona que existe un problema con la in-
terpretación exclusiva de la prueba diagnóstica desde
el punto de vista de sensibilidad y especificidad, ya que
estamos partiendo de cuáles individuos tienen o no la
enfermedad, diagnosticada por un estándar de oro y des-
pués valoramos cuál es su estado respecto a la prueba
diagnóstica (positivo o negativo), es decir, partimos de
efecto a causa. Subraya Sacket que cuando utilizamos
clínicamente las pruebas diagnósticas no conocemos quién
tiene y quién no tiene la enfermedad; si lo supiéramos
no necesitaríamos la prueba diagnóstica. Nuestro inte-
rés clínico no es una vertical de sensibilidad y especifi-
cidad, sino una horizontal del significado de los resulta-
dos positivo y negativo de la prueba; es más importante
partir de causa a efecto.
Es necesario aclarar que el gran valor de la sensibili-
dad y especificidad desde el punto de vista de investiga-
ción es conocer el grado de certeza de una prueba para
detectar o descartar enfermedad y llevarla a cabo a futu-
ro en todos los pacientes en que tengamos sospecha de
algún problema. Para evitar algún problema de interpre-
tación lo mejor es hacer un estudio completo cuando rea-
licemos una investigación de prueba diagnóstica y llegar
inclusive a publicar la probabilidad después de la prueba
según los cambios en la prevalencia de la enfermedad.
110
El VALOR PREDICTIVO POSITIVO de una prueba
se define como la probabilidad de que individuos con
un resultado positivo de la prueba, tengan la enferme-
dad. En el cuadro 13 el VPP se expresa como (a /(a+b))
y al colocar los números correspondientes obtenemos (65
/95) un VPP de 68% que también se considera bajo.
Cuadro 13
Prueba diagnóstica
Estándar de oro
Enfermo Sano
111
en las páginas siguientes vamos a realizar un ejercicio
elaborando un protocolo de prueba diagnóstica para des-
pués entrar en materia acerca de la manera de obtener
un punto de corte en este interesante diseño.
112
Tabla 3
Ocho guías para decidir la utilidad de
una prueba diagnóstica
114
Para el tamaño de la muestra se utiliza la fórmula sim-
ple para estudios descriptivos conociendo la prevalen-
cia de la enfermedad en la población (capítulo 11).
Los resultados de la prueba diagnóstica deben ser in-
terpretados por médicos o personal de laboratorio que
no conozcan (estudio a ciegas) si un paciente está enfer-
mo o sano; esto debe especificarse en el protocolo. El diag-
nóstico de “tiene” o “no tiene” el efecto (variable depen-
diente) se debe realizar con la mejor prueba o método
que exista en el momento para realizar el diagnóstico; se
debe especificar en el protocolo en qué consiste la prue-
ba “estándar de oro”, cómo se realiza, cuáles son sus valo-
res normales y es recomendable apoyar bibliográficamen-
te esta aseveración. Una buena práctica para darle vali-
dez al estudio es realizar una regresión lineal entre la
prueba diagnóstica y el estándar de oro y hacer un aná-
lisis estadístico mediante la prueba de correlación de
Pearson.
En el protocolo, dé mucha importancia al dato de cómo
se realiza la prueba diagnóstica: paso a paso. Defina bien
las variables y por supuesto mencione todas las partes
de la prueba diagnóstica que va a utilizar: sensibilidad,
especificidad, valores predictivos y probabilidad después
de la prueba.
Recoja las variables necesarias en una hoja de reco-
lección de datos y vaya pasando los resultados a la hoja
electrónica (Excel de Microsoft).
115
como base un estudio que realizamos en la Unidad de
Cuidado Intensivo Neonatal para dar respuesta a la pre-
gunta que nos hicimos acerca de la utilidad de la gaso-
metría capilar para detectar hiperoxemia en recién naci-
dos graves. El objetivo del estudio fue encontrar la sensi-
bilidad y especificidad de la gasometría capilar para de-
tectar concentraciones elevadas de oxígeno en el recién
nacido grave. Se tomaron 100 gasometrías en forma si-
multánea de catéter arterial y de punción capilar de ta-
lón, utilizando un gasómetro IL pH blood gas analyzer-
4304 efectuando primero la gasometría arterial y des-
pués la capilar. Previo a la toma de las muestras de san-
gre se midió la saturación de oxígeno-hemoglobina en
un aparato pulsoximetro datascope passport.
El estándar de oro fue la gasometría arterial y la sa-
turación de oxígeno-hemoglobina. Se consideró hiperoxia
una PaO2 (presión parcial de oxígeno en arteria) mayor
de 81 mmHg, presentando al mismo tiempo una satura-
ción de oxígeno-hemoglobina mayor de 95%. Por obser-
vación, durante años se ha considerado que los valores
normales de PO2 capilar eran de 35 a 50 mmHg, por lo
que se planteó el estudio realizando cortes cada 5 mmHg
a partir de 40 mmHg.
El primer paso cuando hacemos una prueba diag-
nóstica es acomodar los resultados en una gráfica simi-
lar a la que mostramos en el cuadro 14.
Como se observa en el cuadro, varía considerablemen-
te la disposición de los números en ambos lados de la grá-
fica; de esta manera debe colocar los pacientes.
En el ejemplo se encontraron 18 pacientes con PO2
capilar arriba de 60 en los que el estándar de oro dio los
valores que se consideraron hiperoxia; por el contrario
sólo tres pacientes normales tuvieron valores superio-
res a 60.
116
Cuadro 14
18 > 60 3
9 51-60 2
10 46-50 6
7 41-45 13
3 > 40 15
HIPEROXIA 1 < 40 NORMAL
Cuadro 16
Especificidad
100 80 60 40 20 0
100
40 mmHg
45 mmHg
80
50 mmHg
60
55 mmHg
40
60 mmHg
20
119
Cuadro 17
Punto de corte a 50 mmHg
>50 37 11
35-50 11 41
Cuadro 18
Prueba diagnóstica
Estándar de oro
Hiperoxia Normal
120
ria de a+b, ((a/(a+b)). El resultado de dividir 37/48 es de
77% el cual es similar al obtenido en la sensibilidad.
El valor predictivo negativo (41/52) da como resultado
un 78%, que es similar a la especificidad; es importante
mencionar que el resultado de los valores predictivos
no siempre es igual a los de sensibilidad y especificidad;
en el ejemplo tenemos este resultado por la cercanía al
50% de la prevalencia. En este caso el resultado de la
prueba diagnóstica nos indica que el nivel de corte que
habíamos tomado como normal no es adecuado para de-
cidir si un recién nacido grave tiene hiperoxia.
Conocer la prevalencia es importante para valorar
la implicación clínica de una prueba diagnóstica ya que
los valores predictivos varían considerablemente si se
modifica la prevalencia. La sensibilidad y especificidad
no se alteran con los cambios en la prevalencia. En el
ejemplo que hemos utilizado la prevalencia es de 48%.
Si sólo hubiéramos encontrado un 30% de niños con hi-
peroxia los resultados serían los siguientes (ver cuadro
19): al cambiar la prevalencia la sensibilidad no cambia
(23/30): 77%, tampoco la especificidad: 54/70 (78%).
Cuadro 19
Prueba diagnóstica
Estándar de oro
Hiperoxia Normal
121
El valor predictivo positivo cambia a 59% (23/39) y el
valor predictivo negativo ahora resulta en 88% (54/61).
En el ejemplo que hemos puesto anteriormente lo que
deseábamos conocer era la sensibilidad y especificidad
de la gasometría capilar para detectar hiperoxia en el
recién nacido grave.
Los valores predictivos son muy importantes desde
el punto de vista clínico, ya que si conocemos la preva-
lencia de una enfermedad en los cambios de edad o de
género, podemos deducir las posibilidades de tener la
enfermedad después de haber realizado la prueba y éste
ha sido el objetivo principal de los autores del diseño de
prueba diagnóstica. Para el efecto, vamos a referirnos a
un ejemplo que Sacket utiliza; se estudió a 360 pacientes
menores de 70 años con sospecha de infarto de miocardio
y con la finalidad de conocer si la prueba CPK podría pre-
decir rápidamente los pacientes que realmente tenían
infarto para admitirlos en la unidad coronaria. En este
grupo de pacientes la prevalencia fue de 230 pacientes
(64%) con infarto de miocardio según el estándar ideal;
el mejor punto de corte resultó en 80 UI. En el cuadro
20 observamos la distribución de los pacientes: en 215
de los 230 pacientes que tuvieron infarto la prueba re-
sultó positiva (valor superior a 80 UI) para una sensibi-
lidad de 93% y en 114 de los 130 pacientes que no tuvie-
ron infarto la prueba resultó negativa para una especifi-
cidad de 88%.
El valor predictivo positivo resultó en un 93% (215/
231), y el valor predictivo negativo en 88% (114/129).
Conociendo los buenos resultados que con esta prue-
ba se obtuvieron, un grupo de clínicos de otro hospital
(este ejemplo es hipotético) decidieron utilizarla de ruti-
na en todas sus admisiones hospitalarias aun en quie-
nes se consideró remota la posibilidad de un infarto de
122
Cuadro 20
Prueba diagnóstica
Infarto de miocardio
Presente Ausente
Cuadro 21
Prueba diagnóstica
Infarto de miocardio
Presente Ausente
123
el valor de una prueba sin tomar en cuenta otras situa-
ciones como en este caso, la prevalencia.
Esto nos lleva a ir un poco más allá y en un quinto
paso encontrar la probabilidad después de la prueba de
que un paciente presente la enfermedad cuando la prue-
ba es positiva, tomando en cuenta los diferentes puntos
de corte y la prevalencia que también se llama probabi-
lidad antes de la prueba.
Volviendo a nuestro ejemplo inicial, en el cuadro 22
observamos los resultados que se obtuvieron en cada pun-
to de corte en el caso de gasometría capilar e hiperoxia.
Por arriba de 60 mmHg hubo 18 casos con hiperoxia y 3
normales (falsos positivos). Para obtener la probabilidad
después de la prueba de que un paciente con el valor supe-
rior a 60 mmHg tenga hiperoxia, primero se saca la tasa
de probabilidad o razón de probabilidad que es lo mismo
que razón de momios. Para obtener esta tasa se siguen
los siguientes pasos:
Cuadro 22
Probabilidad después de la prueba
Razón de Probabilidad
PcO2 Hiperoxia Normal probabilidad post prueba
TOTAL 48 52
124
1) se divide el resultado de la casilla a entre a + c
(resultado 0.375), lo cual no es otra cosa que la sensibili-
dad,
2) divida el resultado de la casilla b entre la suma
de b + d (resultado 0.057) y finalmente,
3) se divide 0.375 entre 0.057 y el resultado es 6.6, lo
cual se trata como una probabilidad 6.6 veces a 1 de te-
ner hiperoxia en este punto de corte.
Efectuando el mismo procedimiento para el punto
de corte 50 mmHg obtenemos 37/48 = 0.77 y 11/52 = 0.21
que da una razón de probabilidad de 3.6, que indica que
una gasometría capilar con PO2 mayor de 50 tiene 3.6 a
1 probabilidades de tener hiperoxia verdadera. En el cua-
dro hemos obtenido la razón de probabilidad para cada
punto de corte.
Finalmente, el sexto paso consiste en obtener la pro-
babilidad después de la prueba que corresponde a 87%
para el punto de corte en 60 mmHg, lo cual es un poco
más confiable y nada despreciable un 85% para el corte
en 55. La manera de obtener la probabilidad después de
la prueba se expresa mediante esta sencilla fórmula:
Razón de probabilidad
después de la prueba Probabilidad
= después de la
Razón de probabilidad prueba
después de la prueba + 1
125
De esta manera usted puede comunicar sus resulta-
dos y mostrar la confiabilidad de una prueba para detec-
tar una alteración.
126
sibilidades diagnósticas desde el punto de vista clínico
no son mayores a un 50%.
Nomograma para la
interpretación de los resultados
de las pruebas diagnósticas
0.1 99
0.2
0.5 95
1 1000 90
500
2 200 80
100
50 70
5
20 60
10 10 50
5 40
20 2 30
% 1 %
30 0,5 20
40 0,2
50 0,1 10
60 0,05
0.02 5
70
0,01
80 0,005 2
0,002
90 0,001 1
95 0.5
0.2
99 0.1
Probabilidad Tasa de Probabilidad
antes de probabili- después de
la prueba dad prueba
127
Capítulo 18
DISEÑO DE UN ESTUDIO DE CASOS Y CONTROLES
129
acerca de la presentación de los casos y asocie como un
hecho de observación algún factor potencialmente pre-
disponente que puede estar provocando la enfermedad.
Pongamos un ejemplo: hace unos años hubo un brote de
enterocolitis necrosante en el área de prematuros, ex-
tremadamente severa y complicada que llevó a la muer-
te a ocho pacientes; dos meses antes de la epidemia se
había tomado la decisión de alimentar con leche mater-
na de la propia madre sin esterilizarla para aprovechar
sus propiedades antigénicas y los investigadores que estu-
diaron el problema llegaron a la conclusión de que ésta
había sido la causa de la epidemia y se decidió suspen-
der este sistema. Éste es un buen ejemplo de cómo la mera
observación (los estudios descriptivos simples) nos pue-
de llevar a conclusiones erróneas. Decidimos realizar
un estudio de casos y controles para hacer un análisis
más exhaustivo de las causas de la epidemia y sobre todo
nos interesaba conocer si la leche materna no esteriliza-
da era la causa del problema. Planteamos nuestro pro-
blema resaltando la asociación de las dos variables: en-
terocolitis necrosante y leche materna. Pudimos haber
colocado más variables de desenlace como factores de
exposición y ésta es una de las ventajas de los diseños
de casos y controles, que se pueden estudiar a la vez va-
rios factores de exposición, pero no lo hicimos. Plantea-
mos y terminamos con una pregunta: La enterocolitis ne-
crosante en recién nacidos pretérmino que se presenta
en esta epidemia, ¿es secundaria a la leche materna no
esterilizada con la cual fueron alimentados?
Es importante aclarar que si ha decidido buscar dos
o más factores causales, debe elaborar una pregunta para
cada uno de ellos, es decir, una pregunta para cada va-
riable.
130
Revisamos la literatura, (éste es el siguiente paso que
le pedimos que efectúe en su protocolo) y encontramos que
varios investigadores habían demostrado que la leche
materna no esterilizada protege al niño contra las infec-
ciones severas como es el caso de la enterocolitis.
Adapte sus variables al ejemplo que vamos dando y
acto seguido ponga la justificación de su estudio, ¿por
qué es importante realizar esta investigación? Si tiene
dudas de cómo redactar la justificación vaya al capítulo 6.
Acto seguido, proceda a enunciar el objetivo y las hi-
pótesis. En nuestro ejemplo no fue difícil, sólo bastó co-
locar un verbo antes de la pregunta y así tuvimos nues-
tro objetivo: Conocer si la enterocolitis necrosante en re-
cién nacidos pretérmino que se presenta en esta epidemia,
es secundaria a la leche materna no esterilizada con la
cual fueron alimentados. Pudimos haber colocado este
otro objetivo: Demostrar que la enterocolitis necrosante
en recién nacidos pretérmino que se presenta en esta epi-
demia, no es secundaria a la leche materna no esteriliza-
da, con la cual fueron alimentados.
¿Se da cuenta qué sencillo es seguir los pasos del
protocolo una vez que ha elaborado adecuadamente su
pregunta y definido sus variables? Haga lo mismo con su
pregunta, coloque ahora su objetivo. Si tiene dos o más
preguntas puede elaborar un objetivo general y después
colocar cada una de las preguntas como un objetivo es-
pecífico.
Un procedimiento similar efectuamos con las hipó-
tesis; como es un diseño observacional analítico debe lle-
var hipótesis. Para el efecto, tome en cuenta las varia-
bles de estudio y oriéntelas hacia qué espera encon-
trar en el estudio, ¿cuáles van a ser los resultados?
Recuerde que la hipótesis de trabajo es la nula, la que
indica que no hay asociación de causa-efecto o que no hay
131
diferencia entre las variables. En nuestro ejemplo fue
evidente que esperábamos aceptar la hipótesis nula ya
que la expresamos de esta forma: la enterocolitis necro-
sante en recién nacidos pretérmino que se presenta en
esta epidemia, no es secundaria a la leche materna no
esterilizada, con la cual fueron alimentados. Ésa fue nues-
tra hipótesis de trabajo, esto es inusual, cuando realiza-
mos un estudio de causalidad lo que esperamos es de-
mostrar la relación causa-efecto, o sea en la mayoría de
los estudios observacionales analíticos e incluso en los
experimentales la tendencia es rechazar la hipótesis nula.
Haga lo mismo con su pregunta, colóquela de manera que
exprese lo que espera encontrar y redacte su hipótesis
nula. Para cada objetivo se debe elaborar una hipótesis.
En la misma hoja que redacta su hipótesis nula coloque
la hipótesis alterna; en nuestro ejemplo la hipótesis al-
terna se redactó de esta manera: La enterocolitis necro-
sante en recién nacidos pretérmino que se presenta en
esta epidemia, es secundaria a la leche materna no este-
rilizada con la cual fueron alimentados. Esto implica una
relación causa-efecto directa.
El siguiente paso es determinar la población de es-
tudio: los casos y los controles.
132
cione que sus casos serán los que tengan tales caracte-
rísticas y no acepte imitaciones. Volviendo a nuestro
ejemplo, encontramos que debido a la severidad de la
epidemia, el médico tratante estuvo catalogando como
enterocolitis necrosante a todo paciente que presentara
vómitos o se distendiera, lo cual elevó el número de ca-
sos diagnosticados; en nuestro protocolo mencionamos
que sólo escogeríamos los casos que reunieran los crite-
rios de Bell para ECN, esto dio como resultado una re-
ducción del número de casos de 43 a 17.
133
En resumen, todas las personas incluidas en el estu-
dio deben tener las mismas probabilidades de estar ex-
puestos, por lo que los criterios que se apliquen en la se-
lección de los participantes han de regir por igual para
los casos y los controles. En el ejemplo previo, los con-
troles fueron seleccionados de un grupo de pacientes que
nacieron en el mismo período que los casos, fueron de
peso y edad gestacional similares, pero no tuvieron en-
terocolitis. Reunimos un buen número de expedientes y
pedimos a una persona ajena a la investigación que se-
leccionara 42 expedientes para tener una relación de tres
controles por cada caso y después procedimos al análisis
de los resultados de todos los pacientes.
El tamaño de la muestra se debe escoger con base en
la enfermedad que se intenta analizar; si la enfermedad
(los casos) es rara o de baja prevalencia se escogen to-
dos los casos y se estudian con una relación más elevada
de controles. Si la enfermedad es de prevalencia alta o
mediana y nos interesa realizar un estudio de casos y con-
troles, se utiliza la fórmula de prueba de hipótesis y di-
ferencia de proporciones para dos poblaciones.
134
posición, se da como resultado que los casos recuerden
con más precisión todos los aspectos debido a una mez-
cla de memoria, emoción e impresiones de las personas
sobre los riesgos asociados a un determinado factor.
Otros puntos de interés son: el sesgo del entrevis-
tador y el sesgo de selección que tienen relación di-
recta con la persona que realiza la entrevista, para el
efecto se recomienda que quien realiza las entrevistas o
selecciona los pacientes, debe desconocer el grupo al que
pertenece cada paciente (cegamiento).
Cuadro 23
Casos y controles
Casos Controles
135
Estas dos casillas muestran los resultados más im-
portantes. Estadísticamente procede utilizar una prue-
ba de X2 o una prueba de Fisher.
Desde el punto de vista de medicina basada en evi-
dencia, la medida de asociación que se utiliza para de-
tectar la relación de causalidad en estudios de casos y
controles es la prueba llamada Razón de momios, tam-
bién llamada Odds ratio. Por Odds se entiende la razón
o relación entre la probabilidad de que un suceso ocu-
rra y la probabilidad de que no ocurra. La razón de mo-
mios no es más que la razón o relación entre la Odds de
exposición observada en el grupo casos (a/c) y la Odds
de exposición en el grupo control (b/d), por lo tanto:
(a / c) a xd
OR = =
(b / d) bxc
136
tes que toman ac. acetilsalicílico tienen 10 a 1 veces la
probabilidad de desarrollar el síndrome de Reye según
el resultado de este estudio. Para el efecto se acepta
que cuando el OR es superior a 2, es significativo de una
fuerte asociación de causalidad.
Cuadro 24
Casos y controles
Casos Controles
137
Capítulo 19
DISEÑO DE UN ESTUDIO DE COHORTES
139
2) La cohorte no expuesta debe ser idéntica a la ex-
puesta respecto a todas las variables que se consideren
pronósticas de la enfermedad a excepción del factor que
se está estudiando; dicho de otro modo, la única dife-
rencia entre los individuos expuestos y no expues-
tos debe ser el factor de exposición.
3) Se deben escoger grupos de individuos con ries-
go elevado para tener una muestra más grande en cada
grupo. Esto es importante ya que los estudios de cohor-
tes son costosos y requieren mayor tiempo, esfuerzo y
organización.
4) No deben incluirse individuos que no puedan
desarrollar el desenlace de interés. Un ejemplo bur-
do, pero útil para el caso, sería excluir a las mujeres his-
terectomizadas en un estudio sobre factores de riesgo
para cáncer cérvico-uterino.
5) Los criterios establecidos y la fuente de informa-
ción se deben aplicar de igual forma tanto a los indi-
viduos expuestos como a los no expuestos con el fin
de no comprometer la validez del estudio.
6) Se deben realizar varias mediciones de una mis-
ma variable a medida que el estudio progresa (estudio
longitudinal).
7) El tiempo de exposición debe ser lo suficiente-
mente largo para permitir que pueda desarrollarse el
número de casos suficiente para conseguir la potencia
estadística deseada, pero lo suficientemente corto como
para no crear graves problemas logísticos y de organiza-
ción.
8) Evite al máximo las pérdidas de pacientes en el
seguimiento; para propósitos prácticos se recomienda
no perder más del 20% de los individuos que inicia-
ron en cada grupo. Las estrategias pueden ser múltiples,
desde excluir a los individuos que se piensa es probable
140
se pierdan durante hasta el seguimiento, hasta anotar
todos los datos del paciente para localizarlo fácilmente.
141
duos deben llenar los criterios de selección que hemos
mencionado previamente.
Recuerde mencionar en el protocolo la definición exac-
ta del factor de exposición y escoger el mejor método para
medirlo, que puede ser un estudio de laboratorio, de ga-
binete o bien una escala de medición clínica; esto le dará
validez interna a su estudio. El desenlace o enfermedad
también se debe precisar con el método más exacto. Se
debe definir exactamente la enfermedad en la manera
como vamos a incluirla en nuestro estudio y no salirnos
de su esquema durante el tiempo que dure la investiga-
ción. Toda técnica de medición se debe definir exacta-
mente en el protocolo y después consignarla en la publi-
cación para que otros investigadores la puedan repro-
ducir.
También se debe especificar cuántas veces se van a
efectuar las mediciones, ya que es un estudio longitudi-
nal y los espacios de tiempo entre mediciones se deben
definir antes de iniciar el estudio.
Anote concienzudamente en una hoja de recolección
de datos, la información que desea acerca de las varia-
bles de estudio y tómese un tiempo para introducir es-
tos datos en la hoja de cálculo para lo cual recomenda-
mos el programa Excel de Microsoft. Esto facilita las co-
sas y permite una mejor observación de los resultados.
142
prueba no paramétrica como la U de Mann-Withney si
la desviación estándar en ambos grupos es diferente.
Cuadro 25
Diseño de cohortes
Enfermos Sanos
(a / (a + b)
RR =
(c / (c + d)
143
rencia, no obstante, consideramos como una verdadera
diferencia los resultados mayores de 2. Al igual que en
la razón de momios, un resultado de RR de 3 significa una
posibilidad 3 a 1 de tener el desenlace en el grupo que
estuvo expuesto.
144
Capítulo 20
CÓMO DISEÑAR UN ESTUDIO EXPERIMENTAL
146
preguntamos si ¿la pravastatina reduce la incidencia de
isquemia del miocardio en pacientes con hipercolestero-
lemia, al ser comparado con un grupo placebo (o con el
tratamiento convencional)?
Algunos investigadores prefieren colocar la pregun-
ta directamente y en esa situación plantean la pregunta
así: ¿Reduce el fármaco X, la incidencia de la enferme-
dad Y, en la población Z, al ser comparado con un grupo
control (placebo)?
Antes de proceder con el objetivo e hipótesis, el in-
vestigador debe revisar exhaustivamente la literatura
para informarse si la pregunta ha tenido o no respuesta
mediante estudios observacionales o bien experimenta-
les; en caso negativo escoja los artículos que le sirvan para
apoyar su investigación y continúe con la elaboración
del protocolo.
La redacción del objetivo debe iniciar con un verbo;
en el ejemplo que hemos utilizado lo escribimos de esta
manera: Demostrar (conocer, evaluar, etc.) que el fárma-
co X reduce la incidencia de la enfermedad Y, en la po-
blación Z, al ser comparado con un grupo control (place-
bo).
La hipótesis nula puede enunciarse así:
El fármaco X no reduce la incidencia de la enferme-
dad Y, en la población Z, al ser comparado con un grupo
control (placebo). De aquí en adelante la investigación
será dirigida a rechazar la hipótesis nula.
En ocasiones se prefiere especificar qué porcentaje
se espera que el fármaco reduzca la incidencia de la en-
fermedad y se plantea la hipótesis en una forma más
precisa: El fármaco X no reduce la incidencia de la enfer-
medad Y, en más de un 40%, en la población Z, al ser com-
parado con un grupo control (placebo).
147
El paso más importante en este diseño es la selección
de la población de estudio. Los individuos en los que se
lleva a cabo la intervención proceden de una población
de referencia o población diana a la que se quiere extra-
polar los resultados; a partir de ella, se especificarán
unos criterios de selección que darán lugar a una pobla-
ción de estudio, aquella en la que se desea realizar la ex-
periencia.
Las personas que toman parte en los estudios experi-
mentales son llamadas participantes o población de estu-
dio (también se les llama sujetos). Las personas que di-
señan el estudio, administran las intervenciones, eva-
lúan los resultados y los analizan son llamados investi-
gadores.
Las intervenciones, también llamadas maniobras clíni-
cas, incluyen acciones de naturaleza muy variada como
estrategias de prevención, pruebas diagnósticas, medi-
cación dirigida o estudio de fármacos.
Usualmente una de las intervenciones es considera-
da el estándar de comparación o control, y el grupo de
participantes que la recibe es llamado grupo control; por
esto el experimento se llama ensayo clínico controlado.
El control puede ser el tratamiento convencional, un pla-
cebo o no intervención. El otro grupo se llama el grupo
experimental o grupo de tratamiento.
Otra característica, quizá la más importante de los
estudios experimentales es la llamada randomización o
aleatorización;implica que todos los participantes de la
población de estudio tienen la misma oportunidad de ser
asignados a cada una de las poblaciones de estudio. Por
lo tanto, la asignación no es determinada por los inves-
tigadores, los clínicos o los participantes en el estudio.
El azar lo decide todo.
148
El principio de randomización (azar) es malinterpre-
tado por muchos investigadores. Es importante saber
que los métodos de asignación de los participantes de
acuerdo a la fecha de nacimiento, el número de registro
hospitalario, la fecha de invitación a participar en el es-
tudio, no le da a cada uno de los participantes la misma
oportunidad de ser incluidos en cada uno de los grupos
de estudio. Estos métodos no son considerados como se-
cuencias de asignación al azar. Estos métodos se consi-
deran “pseudo-randomización” o “quasi-randomización”.
El principal problema asociado con estos métodos es que
el conocimiento del grupo al cual es asignado el partici-
pante puede afectar la decisión de si entra él o ella en el
estudio y esto puede sesgar el estudio totalmente. Si no
hay trampas por parte del investigador, estos estudios
pueden dar grupos balanceados. Los estudios que utili-
zan estos métodos son llamados estudios controlados no
randomizados.
Los ensayos clínicos controlados pueden ser clasifi-
cados de acuerdo a:
1) El aspecto de las intervenciones que los investiga-
dores quieren explorar.
2) La manera en que los participantes están expues-
tos a las intervenciones.
3) El número de participantes incluidos en el estu-
dio.
4) Si los investigadores y los participantes conocen
la intervención que está siendo evaluada, y
5) Si las preferencias de no randomización de los in-
dividuos y participantes se toman en cuenta en el dise-
ño del estudio.
149
y efectividad, queremos hacer énfasis en una clasifica-
ción que se realiza con base en la intervención: estudios
fase I, fase II y fase III.
Los estudios fase I se realizan en humanos para eva-
luar una nueva droga; se efectúan una vez que la seguri-
dad y eficacia potencial ha sido documentada en anima-
les. En el humano se enfocan principalmente a la seguri-
dad; son utilizados para establecer cuánto se puede dar
en humanos de una nueva droga sin causar efectos ad-
versos severos y estudiar cómo es metabolizada la droga
por el cuerpo humano. Generalmente se realizan en vo-
luntarios sanos. Son estudios no randomizados y no con-
trolados. Son serie de casos en que los participantes reci-
ben incremento de dosis de la droga sin un grupo con-
trol, mientras son monitorizados cuidadosamente por
los investigadores.
Después que se ha documentado la seguridad de una
droga en la fase I se procede a realizar un estudio fase
II, donde la nueva droga se da a pequeños grupos de pa-
cientes con una condición dada (generalmente 20 por es-
tudio). El propósito de la fase II es establecer la efica-
cia de diferentes dosis y frecuencias de administración.
Son estudios no controlados y no randomizados; si la dro-
ga se considera inefectiva o muy tóxica ya no se estudia
más. Si la droga prueba ser eficaz y segura se pasa a la
siguiente fase de investigación de una droga.
Los estudios fase III son estudios de efectividad por-
que comparan la nueva droga con una droga o interven-
ción que se conoce como efectiva. Esta droga se conoce
como el método convencional de tratamiento. La mayoría
de los estudios fase III son controlados y randomizados.
150
de 3 formas: diseño paralelo, diseño cruzado y diseño fac-
torial.
La mayoría de los ensayos clínicos aleatorizados (ran-
domizados) incluyen un diseño paralelo; en este estudio
cada grupo de participantes está expuesto a sólo una de
las intervenciones del estudio (droga o placebo).
Un ensayo clínico aleatorizado tiene un diseño cru-
zado cuando cada uno de los participantes recibe las in-
tervenciones del estudio en períodos sucesivos; el orden
en que los participantes reciben las intervenciones se
decide al azar.
Los diseños cruzados producen comparaciones den-
tro de los participantes, mientras que los diseños para-
lelos producen comparaciones entre los participantes.
Debido a que cada participante actúa como su propio con-
trol en los diseños cruzados, éstos producen resultados
clínica y estadísticamente válidos con menos participan-
tes que los requeridos con los diseños paralelos. En los
diseños cruzados se debe tomar en cuenta lo siguiente:
las intervenciones pueden ser usadas en enfermedades
crónicas o incurables, el efecto de la intervención debe
ser rápido y de corta duración y la condición (o enferme-
dad) debe ser estable; esto afecta su efectividad.
Un ensayo clínico aleatorizado tiene un diseño facto-
rial cuando dos o más intervenciones experimentales son
evaluadas separadamente y en combinación contra un
control. Por ejemplo, un diseño factorial que estudia el
efecto de la morfina y el ibuprofen para el tratamiento
del dolor en pacientes con cáncer implica que los pacien-
tes se asignan para recibir morfina sola, ibuprofen solo,
una combinación de morfina e ibuprofen o placebo. Este
diseño permite al investigador comparar la intervención
experimental con el control (morfina vs. placebo), com-
para las intervenciones experimentales entre sí (morfi-
151
na vs. ibuprofen) e investiga posibles interacciones en-
tre ellas (compara la suma de los efectos de morfina e
ibuprofen dados separadamente con los efectos de la com-
binación).
152
los investigadores o clínicos que cuidan a los participan-
tes durante el estudio, a los investigadores que valoran
los resultados de las intervenciones, los que analizan los
datos y a los que escriben los resultados del estudio. Como
es sabido, en muchos estudios los individuos que admi-
nistran las intervenciones, cuidan a los participantes,
valoran los resultados o escriben los reportes, son los mis-
mos. Dependiendo de la extensión del cegamiento los
ensayos clínicos aleatorizados pueden ser clasificados
como: abiertos, simple ciego, doble ciego, triple ciego y cuá-
druple ciego.
Un ECA abierto es un estudio randomizado en el cual
todas las personas envueltas en el estudio conocen la
intervención que se da a cada participante. La mayoría
de los estudios que comparan diferentes intervenciones
quirúrgicas o que compara cirugía con medicación son
estudios abiertos.
Un ECA simple ciego es un estudio randomizado
en el cual un grupo de individuos envueltos en el estu-
dio no conoce la identidad de la intervención que es dada
a cada participante. Usualmente son los participantes o
los investigadores que valoran los resultados los que no
conocen la identidad de las intervenciones. Estos dise-
ños son utilizados para valorar intervenciones educati-
vas o quirúrgicas.
Un ECA doble ciego es un estudio randomizado en
el cual dos grupos de individuos envueltos en el estudio
no conocen la identidad de la intervención que es dada
a cada participante. Usualmente, incluye a los partici-
pantes y a los investigadores que valoran los resultados
de la investigación. Las intervenciones para ellos son A
o B. Cuando la intervención experimental es nueva y no
existen intervenciones convencionales efectivas, los in-
vestigadores usan una sustancia inerte o placebo, que
153
tiene la misma apariencia y sabor de la intervención ex-
perimental; con este diseño el estudio se llama doble cie-
go, randomizado, placebo-controlado.
Cuando se compara la intervención experimental con
el tratamiento convencional los estudios se llaman acti-
vo-controlados.
Los estudios triples o cuádruples ciegos son raros e
incluyen a los demás participantes en la investigación.
La ética en investigación
Todo protocolo donde la variable independiente va a
ser intervenida por el investigador (diseño experimen-
tal), debe incluir una hoja de consentimiento informado
firmada por el paciente o sus parientes más cercanos.
Esta hoja debe redactarse en forma amable y explícita
para que el individuo o los familiares responsables com-
prendan el objetivo de la investigación. Algunos puntos
que deben tomarse en cuenta son los siguientes:
a) Debe darse a conocer antes del proceso de aleato-
rización.
b) Explicar en forma amplia en qué consiste la inter-
vención en el grupo experimental, cuáles son las posibi-
lidades de curación y cuáles son los riesgos.
c) Explicar en forma amplia en qué consiste la inter-
vención en el grupo control, cuáles son las posibilidades
de curación y cuáles son los riesgos.
154
d) Explicar que la decisión de colocar al paciente en
uno u otro grupo se va a decidir al azar.
Finalmente, escriba en forma amable y sincera la jus-
tificación de realizar la investigación y deje el suficiente
espacio para la firma del paciente o familiares y de uno
o dos testigos.
La gran dificultad de la investigación de tipo experi-
mental es convencer a los pacientes de participar en el
estudio. La redacción de la hoja de consentimiento in-
formado es clave para el éxito en este punto del proyecto.
Los individuos elegibles pueden rehusar participar
en el estudio ya sea porque tienen preferencia por una
intervención en particular o porque no desean recibir
un placebo. Otros individuos deciden participar aunque
muestren una clara preferencia por una de las intervencio-
nes; los resultados de los individuos que dudan de entrar
al estudio, pueden ser diferentes de los que no tienen
preferencias particulares. Los resultados de los indivi-
duos que no participan en los estudios o de los que par-
ticipan y tienen fuertes preferencias son registrados en
raras ocasiones.
Existen tres tipos de ECA que toman en cuenta las
preferencias de los individuos elegibles, ya sea que par-
ticipen o no en el estudio. Estos estudios son llamados
estudios de preferencia porque incluyen cuando me-
nos un grupo donde se permite a los participantes esco-
ger su tratamiento preferido entre varias opciones que
se les ofrecen. Estos estudios pueden tener un diseño
Zelen, un estudio que comprende un diseño de cohorte
o un diseño de Wennberg.
En un estudio con diseño Zelen, los individuos ele-
gibles son randomizados antes de dar su consentimiento
de participar en el estudio para recibir un tratamiento
estándar o una intervención experimental. A los que les
155
corresponde recibir el tratamiento estándar reciben el
tratamiento estándar y no se les explica que forman par-
te de un estudio, mientras que a los que les correspon-
de la intervención experimental, se les ofrece la inter-
vención y se les explica que forman parte de un estudio.
Si rehúsan participar en el estudio reciben la interven-
ción estándar y son analizados como si hubieran recibi-
do la intervención experimental.
La gran ventaja de este diseño es que la mayoría de
los individuos elegibles son incluidos en el estudio y per-
mite la evaluación del efecto verdadero de ofrecer una
intervención experimental a los pacientes. La gran des-
ventaja es que son estudios abiertos y el poder estadís-
tico del estudio puede ser afectado si una gran propor-
ción de participantes elige el tratamiento estándar.
En un estudio que comprende un diseño de co-
hortes todos los individuos son seguidos independien-
temente de su randomización. Si una persona está de
acuerdo en formar parte de un ECA, él o ella es randomi-
zado a una de las intervenciones del estudio. Si la per-
sona no desea ser randomizada porque tiene preferen-
cia por una de las intervenciones, esta persona recibe la
intervención de preferencia y seguida como si formara
parte de un estudio de cohortes; al final los que partici-
paron en el ECA pueden ser comparados con los que par-
ticiparon en el estudio de cohortes para evaluar sus si-
militudes y diferencias. Este diseño es ideal para estu-
dios en los cuales una gran proporción de los individuos
elegibles rehúsan ser randomizados porque ellos (o sus
clínicos) tienen una fuerte preferencia por una de las
intervenciones del estudio. El estudio se convierte en
un estudio prospectivo de cohortes con una pequeña
proporción de participantes que toman parte en un en-
sayo clínico controlado.
156
En un estudio con diseño Wennberg los individuos
elegibles son randomizados a un grupo de preferencia o
a un grupo ECA. A los individuos en el grupo de prefe-
rencia se les da la oportunidad de recibir la interven-
ción que deseen, mientras que en el grupo ECA son rando-
mizados para recibir una de las intervenciones del estu-
dio independientemente de su preferencia. Al final del
estudio, los resultados asociados a las intervenciones en
cada uno de los grupos son comparados y usados para
estimar el impacto de la preferencia de los participan-
tes en los resultados.
Los diseños de preferencia son pocas veces utiliza-
dos en investigación del cuidado de la salud, no obstan-
te, abren un campo para buscar soluciones al grave pro-
blema de la decisión de participar o no en la investiga-
ción por parte de los pacientes.
Para calcular el tamaño de la muestra en estudios
experimentales se utiliza la fórmula de prueba de hipó-
tesis y diferencia de proporciones para dos poblaciones
descrita en el capítulo 11.
157
Un dato importante es que para el análisis estadísti-
co y para efectuar las medidas de asociación los resulta-
dos se deben acomodar en la tabla de contingencia de la
manera como se establece en el cuadro 26.
Cuadro 26
Diseño experimental
Desenlace
Malo Bueno
158
((a / (a + b))
RR =
((c / (c + d))
Cuadro 27
Diseño experimental
Desenlace
Enfermo Sano
Intervención 5 15
Grupo
Tx estándar 12 8
159
cuada es la prueba de Fisher) nos da un valor P mayor
de 0.05 que indica que no existe diferencia estadística-
mente significativa entre los dos grupos. Este mismo re-
sultado obtenemos con la prueba Ji cuadrada con co-
rrección de Yates, (X2 = 3.68, P = 0.055). Ahora bien, va-
mos a practicar realizando la prueba de Riesgo Relativo,
por favor revise la fórmula y sustituya los números de
las casillas correspondientes.
Fórmula de Riesgo Relativo: ((a / a+b)) / ((c / c+d))
RR = (5/20) / (12/20) RR = (0.25) / (0.6) RR = 0.41
Este resultado indica que la relación entre el grupo
experimental con relación al grupo control es de 0.4 ve-
ces a 1 de presentar un mal resultado en el desenlace.
En investigación a esto se le llama efecto protector. Si
invertimos la relación y colocamos el grupo control en
las casillas superiores el RR resulta en 2.4 que nos indi-
ca que el dar el tratamiento estándar produce un resulta-
do desfavorable 2.4 veces a 1 con relación al grupo expe-
rimental; sin embargo, el resultado siempre ha de ex-
presarse como lo mencionamos inicialmente.
El siguiente paso es investigar la Reducción del
Riesgo Relativo (RRR) que calcula la reducción por-
centual en el riesgo de complicaciones obtenida con el
tratamiento experimental.
La fórmula de la RRR es: (P – E / P)
Donde P corresponde al porcentaje de resultado des-
favorable en el grupo control (placebo o tratamiento es-
tándar) y E corresponde al porcentaje de resultado des-
favorable en el grupo experimental (ver cuadro 27).
El porcentaje en P es de 0.60 (12/20) y el de E es de
0.25 (5/20).
Sustituyendo estos valores en la fórmula obtenemos
(0.60 – 0.25/0.60) que nos da un valor de RRR de 0.58 tra-
ducido como una reducción de 58% del riesgo relativo,
160
en este caso del desenlace negativo o no curación de la
enfermedad. Los RRR mayores de 50% casi siempre y los
mayores de 25% con frecuencia, son considerados clínica-
mente significativos.
En el ejemplo hipotético que hemos utilizado expo-
nemos la utilidad de un fármaco para curar una enfer-
medad y con los resultados hemos demostrado una re-
ducción de riesgo relativo de 58% de continuar con la en-
fermedad, aun cuando los resultados no fueron estadís-
ticamente significativos. Es importante mencionar en
este momento que el resultado de la prueba estadística
puede ser producido por haber incluido un pequeño nú-
mero de participantes en el estudio y si efectuamos el
reporte en base exclusivamente a la prueba estadística
es probable que cometamos un error tipo II que consiste
en aceptar una hipótesis nula que debería ser rechaza-
da, dicho en otras palabras: publicar que no hay diferen-
cia entre el fármaco que estamos investigando y el tra-
tamiento estándar. Por este motivo es muy importante
calcular el tamaño de muestra adecuado para nuestra
investigación.
El último paso de las medidas de asociación en estu-
dios experimentales es obtener el Número Necesario
a Tratar (NNT). Esta medición implica el número de
pacientes que necesitamos tratar para prevenir una com-
plicación de su enfermedad. El NNT enfatiza muy bien
el esfuerzo que usted y sus pacientes tendrán que dedi-
car con el objeto de establecer un blanco de tratamiento
que sea tangible. Hacer esto ayuda a cuantificar y a desmi-
tificar el “arte” de la decisión de tratar a algún paciente
pero no a otros, aun cuando tengan la misma enferme-
dad. Otra propiedad de la medición de NNT es que brin-
da una base a partir de la cual se pueden expresar los
costos del tratamiento, tanto en términos de costo eco-
161
nómico como el costo de los efectos colaterales y de toxi-
cidad del tratamiento.
La fórmula para obtener el número necesario a tra-
tar (NNT) es:
NNT = 1 / (P – E)
Si aplicamos los resultados de nuestro ejemplo ob-
tendremos lo siguiente:
NNT = 1 / (0.60 – 0.25)
NNT = 1 / 0.35
NNT = 2.8 (3)
Redondeando el 2.8 a 3 encontramos que 1 de cada 3
pacientes tratados con el nuevo fármaco van a ser cura-
dos de la enfermedad en cuestión. Éste es un buen resul-
tado desde el punto de vista de la eficacia del tratamien-
to. Como un agregado, con este NNT también se puede
inferir la utilidad evaluando si el costo del medicamento
es o no elevado o bien si tiene o no complicaciones.
El uso de las medidas de asociación debe ser inclui-
do de rutina en todo trabajo experimental en estas va-
riedades que hemos mostrado, ya que nos dan, aunado a
la estadística, un mejor panorama de nuestra investiga-
ción.
162
BIBLIOGRAFÍA
164
GUYATT GH, SACKET DL, COOK DJ. User’s guides to the me-
dical literature. II. How to use an article about thera-
py or prevention. B. What are the Results and will they
help me in caring for my patients? JAMA 1994; 271:
59-63.
HINOJOSA-PÉREZ JO. El investigador y el clínico. Entrevis-
ta con el Dr. Joaquín Cravioto Muñoz. Archivos de In-
vestigación Pediátrica de México. 1998; 3: 115-116.
HINOJOSA-PÉREz JO, DEL BOSQUE-ALONSO R, VALDOVINOS-CHÁ-
VEZ SB. Aplicación práctica del tamaño de la muestra
en estudios de Investigación. Parte I. REV INVEST
MED SS (MX) 1998; 3: 38-40.
HINOJOSA-PÉREZ JO y TREVIÑO-BÁEZ JD. Utilidad de la ga-
sometría capilar para detectar hiperoxemia en el re-
cién nacido grave. Bol Med Hosp Infant Mex 1999;
56: 93-96.
HINOJOSA-PÉREZ JO, DEL BOSQUE-ALONSO R, MONTALVO-CÓR-
DOBA EY y VALDOVINOS-CHÁVEZ SB. Clasificación del di-
seño de investigación. REV INVEST MED SS (MX)
1998; 3: 3-6.
HULLEY SB y CUMMINGS SR. Diseño de la investigación clí-
nica. 1ª Ed. Barcelona: Ediciones Doyma, 1993.
JADAD AR. Randomized Controlled Trials. London: BMJ
Books, 1998.
JAESCHKE R, GUYATT GH, SACKET DL. User’s guides to the
medical literature. III. How to use an article about a
diagnostic test. A. Are the results of the study valid?
JAMA 1994; 271: 389-391.
User’s guides to the medical literature. III. How to use
an article about a diagnostic test. B. What are the re-
sults and will they help me in caring for my patients?
JAMA 1994; 271: 703-707.
165
KHOURY MJ, BEATY TH. Applications of the case-control
method in genetic epidemiology. Epidemiologic Re-
views 1994; 16: 134-150
LASKY TL, and STOLLEY PD. Selection of Case and Con-
trols. Epidemiologic reviews 1994; 16: 6-17.
MARTÍNEZ-CAIRO-CUETO S. Metodología de la investigación
clínica. Instituto Mexicano del Seguro Social, Sub-
dirección General Médica. Jefatura de Servicios de
Investigación Médica. México D.F. 1994.
MEJÍA-ARANGURE JM, FAJARDO-GUTIÉRREZ A, GÓMEZ-DELGADO
A, CUEVAS-URIOSTEGUI ML, HERNÁNDEZ-HERNÁNDEZ DM,
GARDUÑO-ESPINOSA J y cols. El tamaño de muestra: un
enfoque práctico en la investigación clínica pediátri-
ca. Bol Med Hosp Infant Mex 1995; 52: 381-391.
MERINO-CONDE E. ¿Cómo se mide la concordancia entre dos
observadores? Clínicas Médicas de Norteamérica.
México: Ed. Interamericana, 1993: 283-294.
MORENO-ALTAMIRANO L, CANO-VALLE F, GARCÍA-ROMERO H.
Epidemiología Clínica. 2ª ed. México, D.F.: Ed. Inter-
americana, 1994.
MORTON RF, HEBEL R. Bioestadística y epidemiología. 2ª
edición. México: Ed. Interamericana, 1985.
NAYLOR CD and GUYATT GH. User’s guides to the medical
literature. XI. How to use an article about a clinical
utilization review. JAMA 1996; 275: 1435-1439.
OROZCO-MONTERO JA. ¿Cuánto es un número suficiente de
individuos en una investigación? Clínicas Médicas
de Norteamérica. México: Ed. Interamericana, 1993:
337-349.
OXMAN AD, SACKET DL, GUYATT GH. User’s guides to the
medical literature. I. How to get started. JAMA 1993;
270: 2093-2095.
166
PONCE DE LEÓN S. Ensayos clínicos controlados, lo que el
clínico debe saber. Clínicas Médicas de Norteaméri-
ca. México: Ed. Interamericana, 1993: 381-389.
RIEGELMAN RK, HIRSCH RP. Cómo estudiar un estudio y pro-
bar una prueba: lectura crítica de la literatura médi-
ca. 2ª ed. Washington, DC. OPS, 1992.
SACKETT DL, HAYNES RB, GUYATT GH, TUGWELL P. Epide-
miología clínica. Ciencia Básica para la medicina clí-
nica. Segunda edición. Buenos Aires, Argentina.; Ed.
Médica Panamericana. 1994.
SALES-CARMONA VF. ¿Cómo se mide la asociación entre dos
fenómenos? Clínicas Médicas de Norteamérica. Méxi-
co: Ed. Interamericana, 1993: 275-281.
SALINAS-MARTÍNEZ AM, VILLARREAL-RÍOS E, GARZA-ELIZONDO
ME. La Investigación en Ciencias de la Salud, una
actividad sencilla. Subdirección de Educación Con-
tinua. Facultad de Medicina de la UANL. 1996.
SOLL RF and ANDRUSCAVAGE L. The principles and practice
of evidence-based neonatology. Pediatrics 1999; 103:
215-224.
VILLA AR. ¿Cómo se elige una prueba estadística? Clínicas
Médicas de Norteamérica. México: Ed. Interameri-
cana, 1993: 351-358.
WEISS NS. Application of the Case-Control method in the
evaluation of screening. Epidemiologic Reviews 1994;
16: 102-108.
XANTHOU M. Leukocyte blood picture in full-term and pre-
mature babies during neonatal period. Arch Dis Child
1972; 741-746.
167