Académique Documents
Professionnel Documents
Culture Documents
ANLISIS ESTADSTICO
INFERENCIAL BIVARIANTE
Criterios para la eleccin de pruebas inferenciales y
anlisis crtico de resultados
Lic. Andr Choc MSc. Unidad de Investigacin
Clnica de Atencin Integral del VIH de Guatemala
Pgina
1
Criterios para la eleccin de pruebas estadsticas inferenciales
Andr Choc
Qumico Farmacutico - Epidemilogo
Clnica de Enfermedades Infecciosas, Hospital Roosevelt
"If you only have a hammer, you tend to see every problem as a nail"
The Psychology of Science, Abraham Maslow, 1966.
Resumen
Abstract
Key words: Parametric tests, Non-parametric tests, univariate statistics, choosing statistical
tests, Biostatistics.
2
Introduccin
Desarrollo
La lgica de las pruebas estadsticas asume que todos los eventos ocurren por azar y
calculan cual es la probabilidad de que un determinando evento se haya producido por
azar para confirmar este supuesto (Henquin, 2013); es decir la estadstica contribuye a
estimar la probabilidad de que el azar justifique resultados clnicos
observados(Fletcher, Fletcher, & Wagner, 1998).
Pregunta de investigacin
Existe una clasificacin general para todas las posibles preguntas de investigacin,
que se relaciona con los alcances de una investigacin; a) las investigaciones
descriptivas indican como es o como est la situacin de las variables que se estudian
en una poblacin; la presencia o ausencia de algo; la frecuencia con que un fenmeno
ocurre; y en quienes donde y cuando; b) las investigaciones analticas indican porque
suceden determinados fenmenos, cual es la causa o factores asociados a ese
fenmeno o cual es el efecto de la presencia de las determinadas variables; c) las
investigaciones experimentales son aquellas en las cuales el investigador manipula las
3
variables y los niveles de exposicin de un factor para evaluar su efecto en los
diferentes grupos de investigacin. (Hernndez Sampieri, Fernndez, & Baptista,
2003). Cada una de las modalidades anteriormente descritas orientara a un diferente
enfoque de anlisis estadstico. Adems, en la investigacin biomdica las preguntas
pueden clasificarse de acuerdo a los diferentes tipos de encuentros mdico-
pacientes(Fletcher et al., 1998). En el cuadro nmerouno se muestra tanto el tipo de
preguntas clnicas ms frecuentes, as como los resultados de la enfermedad en
dichos estudios.
4
nmeros reales; continuando con la jerarqua, la escala de intervalo se refiere a
nmeros verdaderos, susceptibles de medicin que informan que tan grande o tan
pequea resulta una medida respecto de otra, es decir las distancias entre puntos
sucesivos en la escala son equivalentes; la escala de intervalo no posee un cero
absoluto mientras que la escala ms compleja llamada de razn posee todas las
caractersticas de las escalas anteriores y un cero absoluto. Adems, ya sea la escala
de intervalo o de razn pueden clasificarse como discretas o continuas; las escalas
discretas son nmeros que no permiten divisiones decimales mientras que las
continuas si lo permiten (Argimon Pallas & Jimnez Villa, 2000; Blair & Taylor, 2008;
Gunawardena, 2011; Henquin, 2013; Jaykaran, 2010; Siegel & Castellan, 1995). En el
cuadro II se resumen los tipos de relaciones y operaciones posibles para cada escala
de medicin.
5
Estructura de los datos: distribucin de probabilidad
Cuando la variable independiente tiene una escala de intervalo o razn, hay que
preguntarse cul es la distribucin de probabilidad poblacional de la misma. Si los
datos presentan una distribucin de probabilidad similar a la normal (gaussiana),
deberan utilizarse pruebas paramtricas para evaluar las hiptesis propuestas; de lo
contrario, debern utilizarse mtodos no paramtricos, los cuales pueden aplicarse
tambin a variables ordinales (Gunawardena, 2011; Jaykaran, 2010; Siegel &
Castellan, 1995).
Existen varios mtodos para evaluar la distribucin de probabilidad de los datos, como
lo son el uso de histogramas, diagramas de cajas (boxplots), grficos de normalidad
Q-Q (Q-Q plots), beanplots, clculo del coeficiente de asimetra y la curtosis, la
evaluacin de la regla emprica, los test de bondad de ajuste como la prueba de
Shapiro-Wilk, la prueba de Kolmogorov-Smirnof, la prueba de Agostino-Pearson; stas
ltimas evalan la hiptesis que los datos se distribuyen poblacionalmente de forma
normal (hiptesis nula)(Albert & Rizzo, 2012; Barton & Peat, 2014; Jaykaran, 2010;
Kanji, 2006).
6
las transformaciones convierten las variables originales en otras de difcil
interpretacin y comparacin(Barton & Peat, 2014; Motulsky, 1995).
Las medidas repetidas o apareadas son aquellas que se han realizado sobre los
mismos sujetos, por ejemplo cuando se evala el efecto de una intervencin se toma
una medicin basal (anterior a la aplicacin de la intervencin) que se comparar con
una medicin final (posterior a la aplicacin de la intervencin), o cuando se comparan
individuos con caractersticas similares o equivalentes que difieren nicamente en que
unos estn expuestos y los otros no a un factor modulador de la variable respuesta o a
una intervencin, como ocurre en los estudios de casos y controles apareados, donde
a cada caso le corresponde al menos un control que tiene caractersticas clnicas o
demogrficas similares. Se habla de grupos independientes cuando se comparan
individuos diferentes (Argimon Pallas & Jimnez Villa, 2000; Gunawardena, 2011).
La ventaja de disear estudios apareados consiste en que, dado que los sujetos son
los mismos, existen menos fuentes de variacin, y, por ende, en estos casos se cuenta
con pruebas ms potentes. En los estudios apareados se cuantifica la magnitud de las
diferencias entre diferentes mediciones realizadas en los mismos individuos; en los
estudios independientes se comparan los valores resumidos entre los diferentes
grupos independientes. Adems, el tamao de muestra utilizado difiere entre uno y
otro diseo; en particular, los diseos pareados tienen la ventaja de usar muestras
ms pequeas(Argimon Pallas & Jimnez Villa, 2000; Baptist et al., 2010;
Gunawardena, 2011; Ruiz &Morillo, 2004). Cuando se comparan tres o ms grupos el
trmino que se utiliza es el de medidas repetidas (Motulsky, 1995).
7
consecuencia, que un nuevo tratamiento sea incorrectamente aceptado como ser ms
efectivo que un tratamiento existente (Barton & Peat, 2014).
En sntesis, se dir que en casos que por, tamao reducido de muestra, no se pueda
conocer la distribucin de probabilidad de la variable respuesta, y no se disponga de
ms evidencia, se usarn pruebas no paramtricas. En algunos casos particulares, la
eleccin entra una y otra prueba ser basada nicamente en no contar con una
muestra ms grande como lo es el caso de la prueba exacta de Fisher que se utiliza
como una alternativa de la prueba de ji cuadrado, al no contarse con la suficiente
muestra para satisfacer las demandas de la ltima prueba (Siegel & Castellan, 1995).
8
Algoritmo 1: variable respuesta nominal
2 grupos: McNemar / Z
de diferencia de
proporciones
Grupos relacionados
3 o ms grupos:
Cochran
Un grupo: test de
Diferencia bondad de ajuste de Chi
cuadrado (politmicas),
z para proporciones
(dicotmicas)
2 o ms grupos:
Tres grupos o ms: ji
Coeficiente de
Asociacin cuadrado de tablas de
contingencia / V de
contingencia
Cramer
2 grupos: prueba de
signos
Grupos relacionados
3 o ms grupos: test
de Friedman
Diferencia
Un grupo: test de
bondad de ajuste de
Chi cuadrado
Grupos
Variable respuesta independientes
ordinal Dos grupos o ms: ji
cuadrado de tablas
2 grupos: Spearman, de contingencia*
Tau de Kendal
Asociacin
3 o ms grupos: Tau
de Kendall
* Cuando el rango es amplio, por ejemplo > 6 puede usarse la prueba de la suma de rangos de Wilcoxon
para comparar dos grupos independientes o la prueba de Kruskal-Wallis para comparar tres grupos
independientes.
9
Algoritmo 3. Variable respuesta cuantitativa, pruebas no paramtricas
Asociacin: coeficiente de
correlacin de Spearman
Asociacin
Prediccin: regresin no
lineal, regresin no
paramtrica Dos grupos: rangos signados
de Wilcoxon, prueba de los
Variable de intervalo o signos
razn Grupos relacionados
Tres o ms grupos: test de
Cochran
Diferencia
Un grupo: prueba de los
signos para una muestra
Asociacin: coeficiente de
correlacin de Pearson
Asociacin
Dos grupos
Tres o ms grupos
10
Referencias
Albert, J., & Rizzo, M. (2012). R by Example. New York, NY: Springer New York.
http://doi.org/10.1007/978-1-4614-1365-3
Argimon Pallas, J., & Jimnez Villa, J. (2000). Mtodos de investigacin clnica y
epidemiolgica (3rd ed.). Madrid: Elsevier.
Baptist, J., Rhrig, B., Hommel, G., & Blettner, M. (2010). Choosing Statistical Tests.
Deutsches rzteblatt International, 107(19), 343348.
http://doi.org/10.3238/arztebl.2010.0343
Barton, B., & Peat, J. (2014). Medical Statistics: A Guide to SPSS, data analysis and
critical appraisal (2nd ed.). United Kingdom: BMJ Books.
Blair, C., & Taylor, R. (2008). Bioestadstica. Mxico: Pearson Educacin, S.A.
Erceg-Hurn, D. M., & Mirosevich, V. M. (2008). Modern robust statistical methods: An
easy way to maximize the accuracy and power of your research. American
Psychologist, 63(7), 591601. http://doi.org/10.1037/0003-066X.63.7.591
Fletcher, R., Fletcher, S., & Wagner, E. (1998). Epidemiologa Clnica: Aspectos
fundamentales (2nd ed.). Barcelona: Masson.
Garca-Granero, M., & Calavia Gil, D. (2010). UNStat. Pamplona, Navarra:
Departamento de Bioqumica y Gentica, Facultad de Ciencias.
Glantz, S. (2006). Bioestadstica (6th ed.). Mxico, D.F.: Mc Graw Hill.
Gunawardena, N. (2011). Choosing the correct statistical test in research. Sri Lanka
Journal of Child Health, (40), 149153.
Henquin, R. (2013). Epidemiologa y Estadstica para principiantes. Buenos Aires:
Corpus.
Hernndez Sampieri, R., Fernndez, C., & Baptista, P. (2003). Metodologia de la
Investigacin (3rd ed.). Mxico, D.F.: Mc Graw Hill.
Jaykaran. (2010). How to select appropriate statistical test? Journal of Pharmaceutical
Negative Results, 1(2), 61.
Kanji, G. (2006). 100 Statistical Tests (3rd ed.) (3rd ed.). Londres: SAGE Publications
Ltd. http://doi.org/10.4135/9781849208499
Krzywinski, M., & Altman, N. (2013). Points of significance: Importance of being
uncertain. Nature Methods, 10(9), 809810. http://doi.org/10.1038/nmeth.2613
Motulsky, H. (1995). Intuitive Biostatistics. New York: Oxford University Press.
Ruiz, A., & Morillo, L. (2004). Epidemiologa Clnica: Investigacin clnica aplicada.
Bogot: Editorial Mdica Panamericana.
Siegel, S., & Castellan, J. (1995). Estadstica no paramtrica aplicada a las ciencias de
la conducta (4th ed.). Mxico, D.F.: Trillas.
Watt, J., & van den Berg, S. (2002). Research Methods for Communication Science.
11
Gua para redactar hiptesis
B. Mtodos no paramtricos
1. Prueba de Wilcoxon para una muestra
Ho: La mediana poblacional de la variable es igual a un
valor constante.
4. Pruebas de normalidad
Ho: La distribucin de probabilidad de la variable respuesta
en el grupo A es normal.
12
Ho: No hay variacin entre las medias poblacionales de la
variable respuesta en los grupos A y B.
6. Regresin
Ho: La pendiente poblacional beta del modelo de regresin
entre las variables A y B es igual a cero.
B. Muestras relacionadas
1. Mtodo paramtrico: T de Student de muestras apareadas
Ho: La diferencia de promedios poblacionales de variable
respuesta despus y antes de un evento es igual a cero
13
4. Variable dicotmica: Prueba de McNemar
Ho: La diferencia entre las proporciones poblacionales de la
variable respuesta antes y despus de un evento es igual a
cero.
14
Gua de evaluacin de la distribucin de probabilidad
I. Pruebas descriptivas
A. Mtodos grficos
B. Estadsticos
B. Otros mtodos
15
Gua para la evaluacin de la homocedasticidad
I. Mtodos descriptivos
A. Estadsticos
B. Mtodos grficos
16
Presentacin de resultados de una investigacin cuantitativa en el
contexto de las ciencias biomdicas
Andr Choc
Asesor Estadstico y de Investigacin en Ciencias de la Salud
Contacto: panteisme@gmail.com
La obsesin por incluirlo todo, sin olvidar nada, no prueba que se dispone de una informacin
ilimitada, sino que se carece de capacidad de discriminacin.
Aaronson
You cant just make things up, though. Each element in your story should be interesting, and
each provides a glimpse of the truth. In your Results section, your interesting story comes
through your words; the sense and truth of your words come through your statistics.
Bernard Beins.
Introduccin
17
formato a las tablas haciendo uso de procesadores de palabras, hojas
electrnicas o en algn software estadstico; f) interpretar brevemente cada
resultado obtenido; g) revisar nuevamente los resultados; y, h) elaborar un
reporte de investigacin (Hernndez, Fernndez, & Baptista, 2014).Lang y
Altman agregan todos aquellos procedimientos para modificar datos brutos
antes del anlisis como las transformaciones para que los datos posean una
distribucin de probabilidad similar a la normal, la creacin de ratios o variables
derivadas o la degradacin de variables(Lang & Altman, 2015).
Por otro lado, la claridad y la sencillez debe garantizarse bajo el argumento que
representan nuevos conocimientos que se estn aportando al mundo (Day,
2005).
Los resultados han de presentarse siguiendo una sucesin lgica que atienda
al diseo del estudio utilizado; primeramente se expondrn los resultados
descriptivos acerca de las caractersticas principales de los sujetos de estudio;
18
despus, cuando se trata de estudios analticos, la etapa siguiente ser evaluar
la compatibilidad de los grupos de estudio segn las variables que podran
influir sobre los resultados. A continuacin se presenta el resultado principal en
la cual debe exponerse la estimacin del efecto del factor de estudio sobre la
variable respuesta, o bien la estimacin de la asociacin entre variables. Lo
ltimo ser presentar los resultados del anlisis de subgrupos y los que
respondan a preguntas secundarias (Argimon Pallas & Jimnez Villa, 2000).
Las guas SAMPL estn diseadas para ser incluidas en las instrucciones para
los autores en las revistas cientficas. Estas guas indican cmo reportar los
mtodos estadsticos y los resultados. En la seccin de reporte de mtodos
estadsticos se incluye la informacin sobre:a) los anlisis para modificar los
datos, previo al anlisis;b) la descripcin del propsito del anlisis, c) la
identificacin de variables; d) identificacin de la diferencia ms pequea a ser
considerada clnicamente importante; e) la descripcin de los mtodos para
analizar los objetivos primarios del estudio dejando claro qu mtodo responde
a qu pregunta y de forma adecuada; f) cundo se usaron ajustes para
comparaciones mltiples; g) qu consideraciones se tomaron acerca de datos
atpicos; h) el detalle del nivel de significancia y el tipo de hiptesis planteada;
h) nombre y versin del paquete estadstico utilizado; i) la informacin sobre
anlisis auxiliares realizados como sensibilidad, imputacin, valores perdidos o
mtodos de comparaciones de subgrupos (Lang & Altman, 2015).
19
Cuadro 1. Reporte de anlisis estadsticos segn las guas SAMPL
Reporte de nmeros y estadstica descriptiva
Los nmeros reportarlos con precisin adecuada, redondeando razonablemente para su simplicidad.
Reportar numerador y denominador para los porcentajes. Resumir datos con distribucin normal
haciendo uso de media y desviacin estndar; los que no tienen distribucin normal con rangos,
medianas y rangos intercuartlicos (reportando el valor mnimo y mximo del rango). No usar el error
estndar como medida de variabilidad.
Tasas y proporciones
Identificar el tipo de medida epidemiolgica a utilizar. Reportar el numerador y denominador utilizados,
as como periodo de tiempo cuando aplique. Identificar cada unidad o multiplicador de poblacin.
Considerar reportar medidas de precisin de estas mediciones a travs de intervalos de confianza.
Reporte de test de hiptesis
Identificar la mnima diferencia a ser considerada como clnicamente importante. Indicar si el test o tests
utilizados son de una o dos colas y si son pareados o de grupos independientes. Reportar medidas de
precisin por medio de intervalos de confianza cuando aplique. Reportar el valor exacto del valor p con
dos decimales y para valores p muy pequeos indicar p < 0.001. Reportar cmo y cundo se hicieron
ajustes para comparaciones estadsticas mltiples.
Reporte de anlisis de asociacin
El tipo de test realizado. Para los test de asociacin reportar valor p como se indic anteriormente. Para
las medidas de asociacin, reportar el valor del coeficiente e intervalo de confianza (no describir la
asociacin como baja, moderada o alta a menos que los rangos de esas categoras hayan sido definidos
con anterioridad y biolgicamente sean plausibles). Incluir tablas de contingencia.
Anlisis de correlacin
Reportar coeficiente de correlacin y su tipo (la misma recomendacin para medidas de asociacin).
Reportar intervalo de confianza para el coeficiente de correlacin y significancia estadstica, as como una
grfica de dispersin y valor p de un test de hiptesis para el coeficiente de correlacin poblacional.
Anlisis de regresin
Reportar si se hizo tratamiento de valores atpicos y datos perdidos. Coeficiente de determinacin
Reportar la ecuacin de la regresin. Para anlisis de regresin mltiples reportar el nivel alfa usado en
el anlisis univariante, las variables utilizadas, evaluacin de colinealidad, anlisis de interacciones y el
tipo de procedimiento para seleccionar las variables a incluir en el modelo. Reportar los coeficientes de
regresin de cada variable explicatoria y sus intervalos de confianza y valores p en una tabla. Especificar
como fue validado el modelo. Presentar datos con una grfica y ecuacin de la regresin y evitar la
extrapolacin (incluir los rangos de valores de las variables utilizadas).
Anlisis de varianza (ANOVA)
Tratamiento de datos atpicos y valores perdidos si hubo. Especificar si se busc interaccin con las
variables explicatoria y si se realiz algn tratamiento. Valor p de cada variable explicatoria y grados de
libertad. Proveer informacin sobre anlisis de bondad de ajuste. Indicar cmo fue validado el modelo.
Fuente: Adaptado de Lang: The Statistical Analyses and Methods in the Published Literature or
the SAMPL Guidelines.
20
Tablas
Grficos
21
Cuadro 2. Errores frecuentes en la presentacin de resultados
Errores de tipo estadstico
-Presentar valores p sin especificar qu tipo de pruebas de hiptesis fueron realizadas.
- Presentar estimaciones puntuales sin intervalos de confianza o valores p sin explicar la potencia o el
tamao del efecto.
- Expresar la signficacin estadstica como significativa o no significativa sin indicar el valor p exacto.
- Precisin excesiva de los resultados.
- Expresar los resultados en porcentaje cuando el nmero de casos es muy reducido.
- Reportar medidas de tendencia central sin su correspondiente medida de variabilidad.
- Reportar estadsticos no idneos.
Errores metodolgicos
-Incluir informacin no pertinente, es decir, no relacionada con los objetivos del estudio.
- Incluir informacin no relevante u omitir informacin relevante.
- Presentar los resultados sin una secuencia lgica.
- Interpretar los resultados o acompaarlos de opiniones propias.
- Duplicar la informacin presentada en tablas, grficas o texto.
- No citar todas las tablas y figuras que se presentan en texto.
Algunos ejemplos
Tabla 1.
Frecuencia de resistencia a la insulina en pacientes que asistieron a la Consulta
Externa del Hospital Roosevelt durante 2012 2013 (n = 176)
Resistencia a
la insulina Frecuencia Porcentaje
No 138 78.4%
S 38 21.6%
Total 176 100.0%
22
ausencia de lneas verticales facilita la lectura tabular de la tabla y el formato acadmico le da
sobriedad y esttica a la misma. Se incluyen los totales, aunque si se especifica en el ttulo el
tamao de muestra puede omitirse del cuerpo de la tabla. Se us nicamente un decimal, lo
cual es apropiado cuando se reportan porcentajes provenientes de un conteo. El ancho de las
columnas es el mismo. Dado que se necesita describir la variable no hace falta informacin.
No es necesario especificar la fuente de los datos, dado que la tabla se hizo con los datos de la
investigacin actual.
Tabla 1.
Frecuencia y estimacin del intervalo de confianza del 95% de la resistencia a la
insulina en pacientes que asistieron a la Consulta Externa del Hospital Roosevelt
durante 2012 2013 (n = 176)
Resistencia a la
insulina Frecuencia Porcentaje IC 95%
No 138 78.4% 15.2% a 27.9%
S 38 21.6%
Total 176 100.0%
Tabla 2.
Comparacin de los niveles de colesterol de alta densidad (HDL) segn sexo en
pacientes que asistieron a la Consulta Externa del Hospital Roosevelt durante 2012
2013, (n = 176)
Sexo
Femenino Masculino
Comentario: En esta tabla se realiza una comparacin de una variable cuantitativa resumida
segn las categoras de una variable cualitativa. Se eligi la comparacin con medianas y
cuartiles, dado que la variable no mostr distribucin de probabilidad normal. Si se realiz una
prueba inferencial para evaluar la distribucin de probabilidad, el valor p obtenido podra
incluirse al pie de la tabla, especificando el nombre de la prueba realizada y nivel de
significancia.
23
Ejemplo de una tabla comparativa bivariante, variable cualitativa
Tabla 3.
Asociacin entre estado nutricional, segn ndice de masa corporal, y resistencia a la
insulina en pacientes que asistieron a la Consulta Externa del Hospital Roosevelt
durante 2012 2013, prueba de ji cuadrado (n = 176, = 0.05)
Insulinoresistencia
Estado nutricional S No
Normal 5 (10.4%) 43 (89.6%)
Sobrepeso 13 (17.1%) 63 (82.9%)
Obesidad grado I 13 (35.1%) 24 (64.9%)
Obesidad grado II 7 (46.7%) 8 (53.3%)
24
Ejemplo de una tabla para reportar un coeficiente de correlacin
Tabla 4.
Evaluacin de la correlacin entre ndice de masa corporal e ndice HOMA IR en
pacientes que asistieron a la Consulta Externa del Hospital Roosevelt durante 2012
2013 (n = 176)
Tabla 5.
Anlisis de varianza para contrastar los valores promedio de ndice de
consumo de alimentos y nivel acadmico y estado civil, modelo aditivo(n = 160)
25
Ejemplo de una tabla para reportar los resultados de una regresin
Tabla 6.
Modelo de regresin lineal mltiple, para determinar el porcentaje de grasa
corporal, pacientes VIH que asisten a una clnica de atencin integral, ciudad
de Guatemala, 2014, modelo de mxima verosimilitud (n = 135)
Error Valor p
Predictores Coeficientes estndar Valor t unilateral
Intercepto 9.026 1.203 7.504 8.16E-12
Porcentaje grasa bioimpedancia 0.592 0.058 10.166 < 2E-16
Sexo 4.852 1.026 4.731 5.68E-06
Error residual estndar: 4.644 sobre 132 grados de libertad.
Coeficiente de determinacin mltiple: 0.6721.
Coeficiente de determinacin ajustado: 0.6672.
Estadstica F: 135.3 (2 y 132 grados de libertad), valor p, Andeva de la regresin: < 2.2e-16
Comentario: Esta es una tabla bsica para reportar los coeficientes del modelo de regresin
mltiple con los resultados de pruebas individuales de T de Student para cada coeficiente y una
prueba de Andeva de la regresin; se reportan adems los coeficientes de determinacin
mltiple y de determinacin ajustado. En una tabla adicional pueden reportarse los estadsticos
sobre los supuestos del modelo (homocedasticidad, normalidad de los residuos, evaluacin de
independencia, evaluacin de colinealidad). Tambin podran reportarse los rangos de valores
de las variables independientes del modelo, as como el nivel de significancia considerado, y
las consideraciones sobre valores atpicos, datos perdidos, interacciones, entro otros. Resulta
interesante incluir grficos de residuales, leverages y otras que nos den informacin sobre
posibles violaciones al modelo.
Conclusiones
26
Referencias
27