Académique Documents
Professionnel Documents
Culture Documents
González de Dios J, Balaguer Santamaría A. Revisión sistemática y metanálisis (I): conceptos básicos. Evid Pediatr. 2007; 3: 107.
Para recibir Evidencias en Pediatría en su correo electrónico debe darse de alta en nuestro boletín por medio del
ETOC http://www.aepap.org/EvidPediatr/etoc.htm
Página 1 de 10
(Número de página de este artículo, no válido para citación)
Evid Pediatr. 2007; 3: 107 http://www.aepap.org/EvidPediatr/numeros/vol3/2007_numero_4/pdf/2007_vol3_numero4.23.pdf
Colaborador de Revisión (Collaborative Review Group), 2.- Permite que el lector decida si la revisión trata de un
el cual está constituido por individuos que comparten un tema relevante para el interés de su práctica clínica19,20.
interés específico sobre un tema determinado. Cada Grupo Dos tareas resultan prioritarias en la elaboración de la
Colaborador de Revisión está coordinado por un equipo pregunta que define el marco conceptual: definir cuál
editorial, quien difunde sus resultados principalmente a es la medida de efectividad que va a medir las virtudes
través de The Cochrane Library, que incluye diferentes de la intervención estudiada y determinar los factores
bases de datos: Base de Datos Cochrane de Revisiones (cofactores, confusores y predictores) que pueden influir
Sistemáticas (The Cochrane Database Systematic Reviews- en los resultados del análisis.
CDSR-, la de mayor interés), la Base de Datos de Resúmenes
b. Componentes clave de una pregunta:
de Efectividad (The Database of Abstracts of Reviews of
Cualquier pregunta clínica estructurada (sea de etiología,
Effectiveness –DARE-), la Base de Datos de Evaluación
diagnóstico, tratamiento, prevención o pronóstico) se
Económica (NHS Economic Evalutation Database –NHS-
compone de los siguientes componentes: el paciente
EED-), el Registro Cochrane de Ensayos Controlados (The
o problema de interés (definiendo las enfermedades, la
Cochrane Controlled Trials Register –CCTR-), etc13,14.
población y el ámbito de interés), la intervención que
Actualmente existen Grupos Colaboradores de Revisión se va a estudiar, la intervención que se va a comparar
en más de 50 áreas clínicas, algunas íntimamente ligadas a (en el caso de que sea pertinente disponer de un grupo
la Pediatría (ej. Neonatal Group, Pregnancy and Childbirth control) y la(s) variable(s) o resultados que se valoran.
Group, Airways Group, Acute Respiratory Infection Group, Habitualmente utilizamos el acrónimo PICO (Patient,
Infection Disease Group, Cystic Fibrosis and Genetic Intervention, Comparison, Outcome) para recordar
Disorder Group, Cochrane Ear, Nose and Throat Disorders las partes fundamentales de una pregunta clínica
Group). La Pediatría (y concretamente la medicina estructurada.
perinatal-neonatal) han tenido un lugar preponderante
en los orígenes de la CC; de hecho, la publicación en 1989 c. Identificación y selección de los estudios mediante los
del libro Effective Care in Pregnancy and Childbirth y The componentes clave de la pregunta:
Oxford Database of Perinatal Trials, fueron los precursores El tipo de pregunta condiciona el tipo de estudio o diseño
de la CC y The Cochrane Library. Las revisiones Cochrane preferencial que responderá a la cuestión planteada:
tiene un formato estándar, perfectamente definido, que si la pregunta es cuándo, cuánto, dónde y quién se
incorpora los apartados expuestos en la tabla 28,10. valorarán estudios descriptivos; si la pregunta es qué
exposición produce un daño se valorarán estudios de
No todas las RS (y MA) se encuentran volcadas en la
casos y controles; si la pregunta es qué daño produce
Colaboración Cochrane, pues muchas otras se encuentran
una exposición se valorarán estudios de cohortes; si la
publicadas en revistas biomédicas15. Si se ha constatado
pregunta es cuánto disminuye el daño la aplicación de un
que las RS (y MA) que aparecen en la Cochrane suelen tener
tratamiento se valorarán ensayos clínicos; si la pregunta
mayor rigor metodológico y mayor grado de actualización
es valorar la operatividad de una prueba diagnóstica se
que las publicadas en revistas biomédicas16.
valorarán estudios sobre pruebas diagnósticas20.
Metodología para la preparación de una revisión
d. Amplitud de las preguntas:
sistemática (y metanálisis)
Son varias las ventajas y desventajas que se derivan de
Basado en el Manual de revisores de la CC (versión formular preguntas amplias o restringidas. Se prefiere
española de Cochrane reviewer´s Handbook del Centro en las RS el enfoque hacia preguntas restringidas, si
Cochrane Iberoamericano) 17,18, y fundamentado en bien presenta el inconveniente de que quizá no sean
revisiones previas8-10. generalizables a entornos diversos.
Primer paso: formulación del problema e. Modificación de las preguntas:
a. Justificación de las preguntas bien formuladas: Las preguntas deben plantearse en el protocolo antes
Es necesario que el artículo exponga claramente de qué de iniciar la revisión completa, pero no debe convertirse
trata la RS, y es preferible que trate de responder a una en una coraza que impida la exploración de aspectos
pregunta y no a muchas. La pregunta principal, formulada inesperados. Sin embargo, las preguntas a posteriori son
a priori, determinará el enfoque principal de la RS y ayuda más proclives a sesgos.
a combatir las denominadas “expediciones de pesca”. Si la Segundo paso: localización y selección de los
pregunta que se quiere responder no está bien formulada estudios
es probable que la revisión no sea pertinente. Exponer
claramente el objetivo de la RS es importante por dos a. Fuentes de información:
razones fundamentales: El lector necesita tener la seguridad de que todas las
publicaciones pertinentes e importantes se han incluido
1.- Ayuda al autor a determinar las estrategias para la en la RS. Cuanto más selectivo o anárquico sea el método
selección de la información (ejemplos: las RS referentes de búsqueda, más probable será que haya sesgos en
a eficacia terapéutica podrían limitarse a datos de EC, las la revisión. Lo ideal es que dichos métodos incluyan
RS referentes a etiología deben hacer especial hincapié una búsqueda en varias bases de datos bibliográficos
en los estudios de casos y controles,...), y (especificando las palabras clave, los años de revisión y otros
Página 3 de 10
(Número de página de este artículo, no válido para citación)
Evid Pediatr. 2007; 3: 107 http://www.aepap.org/EvidPediatr/numeros/vol3/2007_numero_4/pdf/2007_vol3_numero4.23.pdf
aspectos para mejorar el rendimiento de las estrategias de se extraen de la literatura para una revisión, muchos no
búsqueda), una investigación de los informes que sean serán pertinentes al tema que se estudia y otros serán
citados en artículos importantes, las referencias de todos deficientes desde el punto de vista metodológico.
los artículos pertinentes encontrados y la comunicación d. Documentación de una estrategia de búsqueda:
personal con investigadores sobre el tema que se está La exposición explícita de la metodología utilizada para la
revisando. Es importante garantizar que no se omiten RS permite que el lector pueda evaluar con conocimiento
artículos importantes publicados y, en particular, detectar de causa el rigor científico de la revisión y la solidez de los
artículos metodológicamente adecuados que no hayan datos en que se apoyan las inferencias. Los lectores que
sido publicados. Dado que el estudio que ofrece resultados necesiten respuestas a problemas clínicos específicos
positivos tiene más posibilidades de ser publicado que deben buscar RS que indiquen claramente los métodos
el que ofrece resultados negativos, se corre el riesgo de utilizados. Sin conocer los métodos de la RS el lector no
cometer sesgo de publicación en la RS21. puede distinguir las afirmaciones basadas en pruebas
Ya hemos comentado la clasificación, desde un punto de (nuevo paradigma, más objetivo) de aquéllas apoyadas
vista didáctico, de las fuentes de información bibliográfica únicamente en la opinión de quien escribió la revisión
en dos grandes grupos: fuentes de información secundarias (antiguo paradigma, más subjetivo).
y primarias5.
b. Desarrollo de una estrategia de búsqueda: Tercer paso: evaluación de la calidad de los estudios
Internet constituye la herramienta fundamental en la a. Validez. Sesgos en los EC:
búsqueda de información bibliográfica. La búsqueda La validez de un estudio se refiere a la capacidad de
electrónica o informatizada (Medline, Embase, Excerpta evitar los errores sistemáticos o sesgos mediante el
Médica, Índice Médico Español, Cochrane Library, etc) es correcto diseño y realización del estudio. El término
la fuente más utilizada para identificar los trabajos más sesgo hace referencia a los problemas de validez interna
importantes publicados sobre un tema, pero si confiamos de una investigación, esto es, se plantea si los resultados
sólo en este método de búsqueda perderemos parte de obtenidos son ciertos en la población de referencia a la que
información relevante. Otras posibilidades de búsqueda se pretende aplicar los resultados. En los estudios sobre los
para identificar información relevante son: 1) la búsqueda efectos de la atención sanitaria pueden detectarse cuatro
manual de bases bibliográficas (Index Medicus, Excerpta tipos de sesgos10,22:
Medica, Current Contents, etc); 2) la revisión de las listas
• Sesgo de selección (selection bias): conviene instaurar
de referencia de los artículos encontrados, revisiones,
un programa de asignación aleatoria implantado por
libros de texto,...; 3) la búsqueda de la bibliografía “gris” u
alguien no implicado en el reclutamiento (ocultación de
“opaca”, como tesis doctorales, libros de actas a congresos,
la asignación).
informes de instituciones,...; 4) el intercambio directo de
información con expertos en el tema que se investiga; 5) • Sesgo de realización (performance bias): diferencias
la búsqueda de registros internacionales de los estudios sistemáticas en la atención sanitaria proporcionada a los
(básicamente EC) realizados sobre un tema concreto, participantes en los grupos de comparación.
tanto los publicados como los no publicados; 6) agencias • Sesgo de desgaste o pérdida (attrition bias): diferencias
financiadoras (FIS, CICYT, fundaciones, etc.); 7) industria sistemáticas en la pérdida de participantes durante el
farmacéutica; etc. Deben usarse exhaustivamente todas las estudio entre los grupos de comparación;
fuentes de información a nuestro alcance para minimizar • Sesgo de detección (detection bias): diferencias
la probabilidad de omitir estudios relevantes, y detallar sistemáticas en la evaluación de resultados entre los
siempre los procedimientos de búsqueda empleados5. grupos de comparación; el cegado es particularmente
Aumentar la exhaustividad en una búsqueda implica importante en aquellas investigaciones que utilizan
reducir su precisión e identificar más artículos no medidas subjetivas de resultado.
relevantes. Por ello siempre es necesario mantener un b. Evaluación de la validez y calidad de los estudios.
equilibrio entre el grado de exhaustividad (búsquedas Una RS llegará a conclusiones adecuadas solo si valora con
sensibles) y precisión (búsquedas específicas). Pese mucha meticulosidad la validez de los estudios primarios
a la necesidad de elaborar estrategias eficientes de en que se basa la revisión. Si la mayoría de los estudios
búsqueda de información bibliográfica se producen primarios tienen deficiencias básicas, sus conclusiones
numerosas pérdidas de información por la inexperiencia pueden ser cuestionables, incluso cuando sus resultados
del investigador en la búsqueda en bases de datos son comparables. Existen guías metodológicas para los
mecanizadas y por la ingente cantidad de investigación distintas investigaciones sobre etiología, diagnóstico,
no registrada en ellas (bibliografía “gris” u “opaca”). tratamiento, prevención o pronóstico, usando los mismos
c. Selección de estudios: criterios de validez que para las publicaciones originales:
Los autores deben especificar los criterios de inclusión diseño del estudio, aleatorización, enmascaramiento,
y exclusión a la hora de seleccionar los artículos válidos análisis por intención de tratar, etc.23. Basarse en que
para la RS, así cómo seleccionaron los artículos haciendo el artículo ha sido sometido al proceso de revisión por
referencia a los tres elementos básicos de su objetivo, bajo expertos (peer review) de las revistas no garantiza de forma
el acrónimo PICO (población, exposición o intervención, absoluta la calidad de la investigación que se publica en
comparación y resultado). Del conjunto de artículos que ella. La competencia científica del autor y el prestigio de
Página 4 de 10
(Número de página de este artículo, no válido para citación)
Evid Pediatr. 2007; 3: 107 http://www.aepap.org/EvidPediatr/numeros/vol3/2007_numero_4/pdf/2007_vol3_numero4.23.pdf
la revista biomédica son criterios importantes, pero no duración del seguimiento, evolución, etc.
suficientes para la credibilidad de una investigación24. • Diseño del estudio: experimental (con aleatorización o
Lo ideal sería que todos los estudios primarios no), observacional (prospectivo o retrospectivo).
potencialmente apropiados (en base a los criterios de • Exposición o tratamiento estudiado: dosis, pauta,
inclusión y exclusión de la RS) fueran evaluados al menos duración, etc.
por dos autores, cada uno desconocedor de la decisión del • Co-exposición o co-tratamiento
otro. El grado de concordancia debería hacerse constar. • Resultados que permiten medir los efectos principales
Aparte del problema de reproductibilidad, también y secundarios: resultados brutos y medida de efecto
deben tenerse en cuenta las causas principales de sesgo, ajustada con sus intervalos de confianza o valores p
que se relacionan con los autores, sus instituciones y asociados e interacciones representativas
los resultados del estudio, tal como se ha demostrado • Valoración de la calidad o validez de los estudios
en algunos estudios: los trabajos procedentes de • Susceptibilidad del estudio a posibles sesgos, aspectos
instituciones respetadas y que exponen resultados destacables y limitaciones del estudio, y explicaciones que
positivos tienen mayor posibilidad de ser aceptados. Lo los autores presentan de los resultados.
ideal sería que se evaluara el contenido y calidad de los Esta etapa de recogida de la información puede tener
estudio incluidos en una RS a partir de su metodología, sin una considerable influencia sobre la conclusión final, en
que los revisores conocieran a los autores, instituciones y el que pueden surgir dos problemas: 1) diferencias en el
resultados. Sin duda esta precaución adicional reforzaría proceso y calidad de recogida de la información, lo que
las conclusiones de la RS. explica en parte que existan RS sobre un mismo tema que
Los problemas de reproducibilidad y sesgo pueden afectar obtienen conclusiones opuestas; para evitar estos sesgos
a dos etapas del proceso de RS: la decisión final sobre qué de observación, se intenta que la extracción de datos la
estudios se incluirán y la valoración de la calidad de los realicen al menos dos personas; y 2) la falta de información
estudios incluidos. Estos problemas pueden minimizarse si relevante que se obtiene a veces en las publicaciones
se observan los criterios explícitos previamente expuestos. originales; de ahí lo importante que puede resultar que
Se han identificado muchas escalas para valorar la validez el autor del RS contacte con los autores de los estudios
y calidad de los EC; una de las más empleadas es la primarios, por si fuera preciso solicitarles información
propuesta por Jadad y cols25, en la que se puntúan por adicional.
separado tres componentes esenciales: la aleatorización, Quinto paso: análisis y presentación de resultados.
el doble ciego y la descripción de las pérdidas durante el Metanálisis.
seguimiento. Al realizar una RS se encontrarán variaciones en los
El análisis de calidad metodológica es importante por dos resultados de los estudios en los que se investiga la cuestión
razones: el grado de “evidencia” es más débil en presencia de interés. La tarea del revisor es precisamente explicar
de problemas de calidad metodológica, y las variaciones dicha variabilidad. Las posibles fuentes de variación
en calidad pueden explicar diferencias encontradas en son el diseño de la investigación, la pura casualidad y
los estudios. También es posible ponderar los estudios las diferencias en los tres aspectos básicos del estudio
según la validez, de manera que los estudios más válidos (población, exposición o intervención y resultado medido).
tengan más influencia en la medida resumen de efecto (no Así, los lectores de una revisión deben verificar si se han
obstante, no existe una base empírica para determinar qué considerado estas cinco explicaciones de la diferencia de
pesos debe asignarse a los distintos criterios de validez, resultados de los estudios y deben ser escépticos cuando
por lo que este enfoque es de dudosa utilidad). las diferencias se atribuyen a una explicación sin dar la
debida consideración a las demás. La síntesis final de
Cuarto paso: proceso de extracción de datos información debe implicar una integración sistemática y
El formulario de recogida de datos es un puente entre no selectiva, en la que pueden asignarse valores relativos
lo que han informado los investigadores de los estudios a los datos, en función de los resultados de la valoración
primarios y lo que, en último término, informa un estandarizada. Los revisores deben estar dispuestos a usar
revisor. El formulario de extracción de datos debe incluir técnicas de síntesis cuantitativa (MA) para complementar
características del acrónimo PICO (población, exposición y suplementar las técnicas cualitativas. Hay que ser
o intervención, comparación y resultado –sin olvidar el precavidos contra las RS que concluyen la inexistencia de
factor tiempo-). un efecto sin haber considerado la potencia estadística
No existe un modelo universalmente válido para codificar de los estudios para detectar un efecto clínicamente
la información de los estudios a combinar. Las principales importante, lo que resulta especialmente ventajoso en
variables que deben extraerse de los estudios originales condiciones de baja prevalencia o cuando de evalúen
son: efectos de pequeña magnitud.
• Identificación del estudio: autores y país, fuente de a. Justificación para realizar un MA en una revisión:
financiación Un paso más allá de la RS se encuentra el MA, que
• Fecha de publicación del estudio es un conjunto de procedimientos estadísticos cuyo
• Fecha de inicio y final del trabajo objetivo es hacer una síntesis cualitativa y cuantitativa
• Problema estudiado o hipótesis puesta a prueba de los resultados de diferentes estudios independientes
• Características de los individuos: edad, sexo, diagnósticos, que tratan de un mismo tema, bajo la idea de que la
Página 5 de 10
(Número de página de este artículo, no válido para citación)
Evid Pediatr. 2007; 3: 107 http://www.aepap.org/EvidPediatr/numeros/vol3/2007_numero_4/pdf/2007_vol3_numero4.23.pdf
combinación de estudios individuales (preferentemente fuera de nuestro objetivo, pero pueden clasificarse en dos
EC, y con menos frecuencia estudios observacionales) grandes grupos: los modelos de efectos fijos (fixed effects)
permitiría obtener una información más completa. y los modelos de efectos aleatorios (random effects).
La razón de realizar RS es asegurar la validez de los Los modelos de efectos fijos asumen que todos los
resultados. Por eso debe tenerse en cuenta que el papel estudios estiman el mismo efecto, es decir, que las
del análisis estadístico en las revisiones puede estar menos diferencias que se observan entre los estudios se deben
claro y, a veces, el MA puede parecer más un obstáculo únicamente a variabilidad aleatoria. Depende de la
que una ayuda. Además, cabe recordar dos razones variabilidad intraestudios. Los principales métodos de
importantes para no realizar un MA en una revisión: la efectos fijos son el Mantel-Haenszel (el más atractivo y de
principal es la falta de datos válidos y relevantes, y la elección en los MA realizados a partir de EC con variables
segunda es que a veces el estudio estadístico no tiene de efecto dicotómica), el de Woolf (menos eficiente que
sentido. Los objetivos que se persiguen con la realización el anterior, pero tiene la ventaja que puede aplicarse a
de un MA son los siguientes9,26,27: los MA de EC en los que se combinan riesgos relativos,
odds ratios, diferencias de medias, etc) y el de Yusuf-Peto
1.- Obtener un mayor tamaño muestral, lo que permite
(menos utilizado, dado que es bastante intuitivo y puede
aumentar la potencia o poder estadístico, y así se pueden
llevar a resultados paradójicos).
detectar diferencias que pasaron inadvertidas en los
Los modelos de efectos aleatorios se suelen aplicar cuando
estudios individuales.
los estudios tienen un grado de heterogeneidad superior
2.- Obtener conclusiones cuando los resultados de los
al esperado por simple variabilidad aleatoria. Depende de
estudios individuales son contradictorios.
la variabilidad intra e interestudios. Se utiliza el método
3.- Aumentar la generalización de las conclusiones, dada
de DerSimonian y Laird que incorpora la variabilidad
la heterogeneidad de las poblaciones de los diferentes
interestudio en el estimador combinado, y cuyo uso es
estudios.
controvertido. Ciertos autores argumentan que deberían
4.- Responder a preguntas no planteadas en los estudios ser habituales en los MA, ya que es frecuente la existencia
originales. de heterogeneidad residual no explicada. Es frecuente,
Así pues, el MA es una estrategia sistemática de revisión por otro lado, encontrar MA que presentan tanto los
que utiliza procedimientos estadísticos que resulta resultados de modelos de efectos fijos como los de efectos
especialmente útil cuando los tamaños muestrales aleatorios9,26,27.
individuales son demasiado pequeños para detectar un Siempre habrá opiniones distintas sobre cuál es el
efecto y calificarlo de estadísticamente significativo, cuando método más apropiado para hacer un MA particular, de
los resultados de varios estudios son contradictorios en manera que el investigador debe preguntarse en todos
cuanto a la dirección o magnitud del estudio, o cuando los casos en qué medida sus resultados metanalíticos son
una investigación a gran escala exige demasiado tiempo sensibles a la manera en que se realizó el MA. Nunca está
o dinero. Los MA son proyectos de investigación por sí absolutamente claro si usar modelos de efectos fijos o de
mismos, en los que las unidades de observación son efectos aleatorios: en el caso de estudios homogéneos
los estudios originales. Los MA requieren una adecuada se obtienen resultados similares con ambos modelos
planificación y una dedicación considerable de recursos (varía algo el intervalo de confianza), en el caso de
humanos, en la que se debería constituir un equipo estudios heterogéneos se obtienen resultados diferentes
investigador formado por investigadores con experiencia con ambos modelos, y en el caso de estudios con gran
en el tema objeto de estudio, epidemiólogos y/o heterogeneidad, conviene no realizar MA.
bioestadísticos con experiencia en la realización de MA y Los métodos estadísticos utilizados en el MA son
documentalistas expertos en la realización de búsquedas múltiples y pueden encontrarse integrados en programas
bibliográficas exhaustivas. informáticos que pueden facilitar mucho la realización de
b. Resumen de los efectos de los estudios de un MA y un MA o una RS, como DESCARTES, EASY MA, FAST*PRO,
métodos estadísticos: META-ANALYST, TRUE EPISTAT,... pero uno de los más
El primer paso es calcular en cada uno de los estudios conocidos es el programa REVMAN utilizado por la
combinados las medidas del efecto que nos interesa (RAR, Colaboración Cochrane.
RRR, NNT,...) de una variable (tratamiento, exposición,...) c. Evaluación de la heterogeneidad:
sobre otra (mejoría, curación, supervivencia,...), controlando El supuesto que subyace a la combinación de resultados
si es necesario los potenciales factores confusores (sexo, de estudios individuales en una estadística descriptiva
edad, gravedad,...). es que sus diferencias son solo casuales (variación de
Estas medidas de efecto pueden obtenerse a partir de muestreo) y que, por tanto, los resultados de todos
los datos individuales, si se detallan en los estudios, o los estudios son homogéneos, es decir, que reflejan el
tomarse los efectos presentados. También es posible mismo efecto “verdadero”. La falta de uniformidad de
estimar el efecto a partir de los estadígrafos t de Student, los resultados medidos en los estudios puede reflejar el
F de Snedecor, “ji” cuadrado, coeficiente de correlación hecho de que el efecto del tratamiento varía en función
de rangos de Sperman, o incluso de los valores de p. Una de las características particulares de los estudios, por
exposición detallada de los diferentes métodos utilizables ejemplo, las dosis y/o la edad de los pacientes. No solo
para combinar resultados de diferentes estudios está es importante saber la efectividad terapéutica, también
Página 6 de 10
(Número de página de este artículo, no válido para citación)
Evid Pediatr. 2007; 3: 107 http://www.aepap.org/EvidPediatr/numeros/vol3/2007_numero_4/pdf/2007_vol3_numero4.23.pdf
es importante la cuestión de en qué pacientes y bajo qué lo que cabe plantearse las siguientes preguntas para
circunstancias el tratamiento funciona mejor. En la tabla decidir si debe realizarse: 1) ¿hay evidencia indirecta que
3 se presentan posibles causas de heterogeneidad entre apoye la existencia de una diferencia en algún subgrupo
los estudios originales. en particular?, 2) ¿las hipótesis acerca de la diferencia
Un cierto grado de heterogeneidad entre los estudios preceden al análisis y no surgen después de éste?, 3) ¿la
combinados puede ser saludable para aumentar la diferencia se insinúa a partir de comparaciones dentro de
capacidad de generalización (validez externa), pero, no los estudios y no entre los estudios?, 4) ¿la diferencia es
obstante, una notable heterogeneidad estadística de consistente a lo largo de los estudios?, 5) ¿la magnitud de
efectos no es deseable. El límite de homogeneidad en los la diferencia es clínicamente relevante?, 6) ¿la diferencia
efectos que debemos aceptar nos vendrá dado por los es estadísticamente significativa?10.
procedimientos estadísticos habituales para probar que las e. Análisis de sensibilidad:
diferencias entre las medidas de los efectos en los estudios Puede utilizarse como herramienta para analizar por qué
primarios no son mayores de lo que cabría esperar por la dos MA sobre un mismo tema obtienen conclusiones
influencia del azar. También será útil una representación diferentes; con este análisis se intenta responder a la
gráfica de los efectos de los estudios primarios (que nos pregunta ¿serían diferentes los resultados finales de la
permitirá detectar los valores extremos y/o los patrones técnica estadística si se modifican los datos dudosos que
relacionados con las características clínicas) y sobre todo el se han utilizado en el análisis? El análisis de sensibilidad
uso de la lógica clínica, que deberá prevalecer sobre unos se realiza repitiendo la técnica estadística realizada con
criterios exclusivamente matemáticos. Desde un punto de diferentes valores para determinados datos y observando
vista global cabe recordar que el test de homogeneidad si la modificación cambia sustancialmente el efecto final;
aplicado a un MA puede tener escaso poder cuando se si ocurre así, los resultados no tienen la solidez suficiente
comparan menos de diez EC. y, por tanto, es necesario ser muy cauto en la valoración
Cuando se juzga que hay una relativa homogeneidad, de los datos y de las conclusiones.
puede obtenerse una medida sumaria del resultado final
f. Presentación de los resultados del MA:
combinando los resultados de los estudios primarios.
Con el objetivo de mejorar y homogeneizar la calidad
Todos los lectores deberían buscar en la publicación
de la presentación de los resultados de las RS y MA,
de un MA una discusión del tema de la homogeneidad
el grupo QUOROM ha publicado recientemente un
(mediante pruebas gráficas y estadísticas) previa al uso de
documento donde se destacan los puntos que deberían
procedimientos de combinación que la dan por supuesta.
existir ineludiblemente28,29, y que incluye una lista-guía
Se suele estimar el punto de corte de la “ji” cuadrado de la
(ckecklist) y un diagrama de flujo (flow diagram) de los
homogeneidad en 0,1: si p> 0,1= heterogeneidad, si p<
pacientes para evaluar correctamente su presentación.
0,1= homogeneidad27.
La presentación gráfica de los resultados es un método
El gran problema del MA es la heterogeneidad; ¿cómo
complementario de análisis de los resultados combinados
combatirla?: 1) restringir objetivos; 2) plantear análisis
y del resultado global del MA que tiene la ventaja de ser
de subgrupos; 3) y si no es posible evitarla, se deben
intuitivo y fácil de visualizar, pero en el que debe cuidarse
investigar los resultados para identificar las fuentes de
la elección de las escalas para conseguir una impresión
heterogeneidad: análisis de la sensibilidad (estudios
visual no distorsionada. Cada línea horizontal representa
de mayor calidad frente estudios de menor calidad,
el resultado de un EC (cuanto más corta es la línea, más
estudios enmascarados frente no enmascarados, etc.),
cierto es el resultado, pues menor es el intervalo de
meta-regresión... Si hay heterogeneidad significativa,
confianza), cuya autoría y año de realización del EC se
los revisores deben tener precaución al interpretar la
indica al margen. También se representa en una línea
estimación global derivada de un MA, así como al atribuir
horizontal el resultado global de la combinación de
las diferencias entre los estudios a cualquier factor.
todos los EC. La línea vertical indica la posición alrededor
Cuando hay heterogeneidad sustancial en los resultados
de la cual las líneas horizontales se concentrarán si los
hay desacuerdo en la forma de resumirlos y en si estos
dos tratamientos comparados en los EC tuviesen efectos
deben combinarse; sin embargo, existe un acuerdo en
similares. La posición del punto a la izquierda de la línea
que los revisores deben alertar al lector cuando haya
vertical indica que el tratamiento estudiado es beneficioso,
heterogeneidad sustancial y, por tanto, deben recomendar
y su posición a la derecha que es perjudicial. Si una línea
una interpretación cautelosa de los resultados.
horizontal toca la línea vertical, significa que aquel EC
Se debe tener en cuenta que los test estadísticos
concreto no encontró diferencias significativas entre los
no pueden compensar la falta de sentido común, la
tratamientos.
perspicacia clínica y la plausibilidad biológica. De este
La virtud de esta presentación gráfica es que consigue hacer
modo, existen revisiones en que la síntesis de datos no es
visualmente sencillo toda la complejidad metodológica
posible (o mejor, no es deseable) y se quedan en honrosas
del MA.
RS cualitativas9,10.
g. Interpretaciones erróneas y limitaciones de los MA:
d. Análisis de subgrupos:
Después de un notable entusiasmo inicial de los MA,
Se refiere a las agrupaciones particulares de pacientes
las discrepancias entre las conclusiones extraídas de
entre los estudios, no a subgrupos de estudios. Con
algunos MA y los hallazgos encontrados en macroensayos
frecuencia se abusa de los análisis de subgrupos, por
Página 7 de 10
(Número de página de este artículo, no válido para citación)
Evid Pediatr. 2007; 3: 107 http://www.aepap.org/EvidPediatr/numeros/vol3/2007_numero_4/pdf/2007_vol3_numero4.23.pdf
Página 8 de 10
(Número de página de este artículo, no válido para citación)
Evid Pediatr. 2007; 3: 107 http://www.aepap.org/EvidPediatr/numeros/vol3/2007_numero_4/pdf/2007_vol3_numero4.23.pdf
chrane.de/cochrane/hbook.htm 25.- Jadad AR, Moore RA, Carroll D, Jenkinson C, Reynolds DJ,
18.- Centro Cochrane Iberoamericano. Manual de revisores Gavaghan DJ, et al. Assessing the quality of reports of rand-
(versión española de “Cochrane Reviewers´ Handbook”) [actu- omized clinical trials: is blinding necessary?. Control Clin Trials.
alización de junio 2000]. Barcelona: Centro Cochrane Iberoa- 1996;17:1-12.
mericano, 2001. Disponible en: http://www.cochrane.es/?q=es/ 26.- Fernández Ballart JD, Vobecky J, Martí Henneberg C.
handbook Metaanálisis: síntesis e integración de los resultados de estu-
19.- Buñuel Álvarez JC, Ruiz-Canela Cáceres J. Cómo elaborar dios independientes en medicina. Med Clin (Barc). 1991;96:382-
una pregunta clínica. Evid Pediatr. 2005;1:10. 7.
20.- Counsell C. Formulating questions and locating primary 27.- Molinero LM. Interpretación, utilidad y limitaciones del
studies for inclusion in systematic reviews. Ann Intern Med. metaanálisis. Gastroenterol Hepatol Continuada. 2002;1:311-8.
1997;127:380-7. 28.- Moher D, Cook DJ, Eastwood S, Olkin I, Rennie D, Stroup
21.- González de Dios J. El sesgo de publicación: en busca de la DF. Improving the quality of reports of meta-analyses of ran-
evidencia perdida. Pediatr Integral. 2.000;5:760-6. domized controlled trials: the QUOROM statement. Quality of
Reporting of Meta-analyses. Lancet. 1999;354:1896-900.
22.- Delgado Rodríguez M, Sillero Arenas M. Sesgos en el
metaanálisis. Med Clin (Barc). 1999; 112(Supl 1):43-50. 29.- Moher D, Cook DJ, Eastwood S, Olkin I, Rennie D, Stroup
DF. Mejora de la calidad de los informes de metaanálisis de en-
23.- González de Dios J, Buñuel Álvarez JC, Ochoa Sangrador C.
sayos clínicos controlados: el acuerdo QUOROM. Rev Esp Salud
La valoración crítica de documentos científicos y su aplicabili-
Pública. 2000;74:107-18.
dad a la práctica clínica: aspecto clave en la toma de decisiones
basada en las mejores pruebas científicas. Evid Pediatr. 2006; 30.- LeLorier J, Gregoire G, Benhaddad A, Lapierre J, Derderian
2:37. F. Discrepancias between meta-analyses and subsequent large
randomized, controlled trials. N Engl J Med. 1997;337:536-42.
24.- Gérvas J, Pérez Fernández M. La revisión por pares en las
revistas científicas. Aten Primaria. 2001;27:432-9.
Página 9 de 10
(Número de página de este artículo, no válido para citación)
Evid Pediatr. 2007; 3: 107 http://www.aepap.org/EvidPediatr/numeros/vol3/2007_numero_4/pdf/2007_vol3_numero4.23.pdf
Página 10 de 10
(Número de página de este artículo, no válido para citación)