Vous êtes sur la page 1sur 28

BIOESTADSTICA BSICA:

ANLISIS ESTADSTICO
INFERENCIAL BIVARIANTE
Criterios para la eleccin de pruebas inferenciales y
anlisis crtico de resultados
Lic. Andr Choc MSc. Unidad de Investigacin
Clnica de Atencin Integral del VIH de Guatemala

Quetzaltenango, 26 de agosto de 2017


ndice

Pgina

Artculo sobre criterios de eleccin de una prueba estadstica inferencial 02

Gua para la redaccin de hiptesis 12

Gua para la evaluacin de la normalidad 15

Gua para la evaluacin de la homocedasticidad 16

Artculo sobre directivas para la presentacin de resultados 17

1
Criterios para la eleccin de pruebas estadsticas inferenciales

Andr Choc
Qumico Farmacutico - Epidemilogo
Clnica de Enfermedades Infecciosas, Hospital Roosevelt

"If you only have a hammer, you tend to see every problem as a nail"
The Psychology of Science, Abraham Maslow, 1966.

Resumen

Es indiscutible la importancia de la Estadstica en la investigacin cientfica, como el medio que


permite obtener informacin vlida a partir de los datos; sin embargo, ante la disponibilidad de
una gran cantidad de enfoques y pruebas estadsticas, resulta prioritario conocer los criterios
para elegir las herramientas idneas; entre ellos pueden enumerarse: el nivel de medida de
cada variable incluida en el anlisis, la pregunta de investigacin o la hiptesis, el diseo de la
investigacin, la distribucin de probabilidad de la variable independiente, el tipo de muestras
utilizadas y el tamao y diseo de muestra utilizados. En esta revisin bibliogrfica se exponen
los criterios para elegir una prueba estadstica inferencial univariante, entre las alternativas
paramtricas y no paramtricas, agrupndolos estos en tres categoras: la pregunta de
investigacin, la estructura de los datos y el diseo de la investigacin. Respecto a la pregunta
de investigacin hay que distinguir entre las descriptivas, analticas y experimentales. La
estructura de los datos se refiere a las caractersticas de las variables como lo son, la escala de
medicin, la distribucin de probabilidad, la independencia en la recoleccin de datos y la
homocedasticidad. En cuanto al diseo de investigacin, se debe considerar el carcter
apareado o independiente de los grupos de comparacin, el tipo de hiptesis planteada y los
aspectos relacionados al muestreo. Finalmente, se presentan algoritmos concisos para la
eleccin de las pruebas partiendo de la escala de medicin de la variable respuesta y
distinguiendo entre procedimientos paramtricos y no paramtricos.

Palabras clave: Estadstica paramtrica, Estadstica no paramtrica, Estadstica univariante,


eleccin de pruebas estadsticas, Bioestadstica.

Abstract

The importance of the Statistics in scientific research is unquestionable, as the medium to


obtain valid information from the data; however, given the availability of a large number of
approaches and statistical tests, it is a priority to know the criteria for choosing the right tools;
among them, it can be enumerated: the measurement level of each variable included in the
analysis, the research question and the hypothesis, the research design, the probability
distribution of the outcome variable, the sample size and sample design used. This review
exposes the criteria to choosing an univariate inferential statistical test, between the parametric
and non-parametric alternatives, grouping them in three categories: research question, data
structure and research design. Regarding the research question, it is necessary distinguish
between descriptive, analytical and experimental ones. The data structure refers to the
characteristics of the variables as they are, the scale of measurement, the probability
distribution, independence in data collection and homoscedasticity. In terms of research design,
should be considered the character paired or independent of the comparison groups, the type of
hypothesis raised and issues related to sampling process. Finally, concise algorithms for the
choice of statisticaltests are presented; they are based on the identification of the scale of
measurement of the outcome variable and distinguishing between parametric and
nonparametric procedures.

Key words: Parametric tests, Non-parametric tests, univariate statistics, choosing statistical
tests, Biostatistics.

2
Introduccin

La inferencia estadstica pretende tomar informacin de una muestra para


generalizarla a la poblacin de donde esta proviene, con un nivel de certeza
predeterminado y haciendo uso de procedimientos probabilsticos. Cuando la
informacin que se extrae de la muestra hace referencia a comparaciones entre
grupos o consiste en la evaluacin de hiptesis, se define, adems, un nivel de
probabilidad con el que se desea encontrar diferencias respecto a una variable de
desenlace entre tales grupos de comparacin. Los estadsticos estudian muestras que
se suponen son representativas y adecuadas en tamao de la poblacin de la que se
extrajeron. Sin embargo, existe una gran cantidad de recursos estadsticos y pruebas
alternativas disponibles, lo que hace difcil el poder determinar cul es el
procedimiento estadstico que se aplicar a un problema en particular. El objetivo de
este artculo es exponer los criterios para seleccionar un anlisis estadstico
inferencialunivariante entre las alternativas paramtricas y no paramtricas.

Desarrollo

Cundo utilizar una prueba estadstica?

El objeto de analizar datos a travs de la Estadstica se basa en la necesidad de


presentar la conclusin ms fuerte posible a partir de cantidades limitadas de datos. La
validez de esta conclusin puede verse afectada por los dos aspectos siguientes: a) La
variabilidad biolgica y la imprecisin experimental dificultan la identificacin de
diferencias reales; b) el cerebro humano tiende a buscar patrones, incluso en datos
aleatorios. Cuando las diferencias observadas son pequeas comparado a la
imprecisin experimental y la variabilidad biolgica deben usarse pruebas
estadsticas(Krzywinski & Altman, 2013; Motulsky, 1995).

La lgica de las pruebas estadsticas asume que todos los eventos ocurren por azar y
calculan cual es la probabilidad de que un determinando evento se haya producido por
azar para confirmar este supuesto (Henquin, 2013); es decir la estadstica contribuye a
estimar la probabilidad de que el azar justifique resultados clnicos
observados(Fletcher, Fletcher, & Wagner, 1998).

Cmo elegir una prueba estadstica?

Cuando se dispone de pruebas estadsticas alternativas y vlidas para evaluar una


hiptesis de investigacin, deben emplearse algunas racionalizaciones para elegir
entre ellas(Siegel & Castellan, 1995); en general, la eleccin de una prueba estadstica
depender de:a) la pregunta de investigacin, b) de la estructura de los datos y c) del
diseo del estudio (Baptist, Rhrig, Hommel, & Blettner, 2010). Cada uno de estos
tpicos se tratar a continuacin.

Pregunta de investigacin

Existe una clasificacin general para todas las posibles preguntas de investigacin,
que se relaciona con los alcances de una investigacin; a) las investigaciones
descriptivas indican como es o como est la situacin de las variables que se estudian
en una poblacin; la presencia o ausencia de algo; la frecuencia con que un fenmeno
ocurre; y en quienes donde y cuando; b) las investigaciones analticas indican porque
suceden determinados fenmenos, cual es la causa o factores asociados a ese
fenmeno o cual es el efecto de la presencia de las determinadas variables; c) las
investigaciones experimentales son aquellas en las cuales el investigador manipula las

3
variables y los niveles de exposicin de un factor para evaluar su efecto en los
diferentes grupos de investigacin. (Hernndez Sampieri, Fernndez, & Baptista,
2003). Cada una de las modalidades anteriormente descritas orientara a un diferente
enfoque de anlisis estadstico. Adems, en la investigacin biomdica las preguntas
pueden clasificarse de acuerdo a los diferentes tipos de encuentros mdico-
pacientes(Fletcher et al., 1998). En el cuadro nmerouno se muestra tanto el tipo de
preguntas clnicas ms frecuentes, as como los resultados de la enfermedad en
dichos estudios.

Cuadro I. Tipos de eventos estudiados en la investigacin biomdica

Tipo de evento Eventos clnicos Definicin


Identificacin de individuos sanos y enfermos
Anomala
Grado de precisin de las pruebas utilizadas para
Diagnstico diagnosticar la enfermedad.
Frecuencia Frecuencia con que se presenta una enfermedad.
Factores se asocian con mayor o menor riesgo de
Riesgo enfermedad.
Pronstico Consecuencias de ser portador de la enfermedad.
Forma en la que el tratamiento cambia en el curso de la
Tratamiento enfermedad.
Evaluacin de la mejora del curso de la enfermedad
Preguntas Prevencin cuando la deteccin y abordaje son precoces.
clnicas Causa Condiciones que conducen a la enfermedad.
frecuentes Coste Coste de la asistencia de la enfermedad.
Se considera mal resultado si se presenta
Muerte prematuramente.
Conjunto de signos, sntomas fsicos y anomalas de
Enfermedad laboratorio.
Malestar Sntomas como dolor, nuseas, disnea, prurito y otros.
Deterioro de la capacidad para realizar las actividades
Discapacidad habituales.
Desenlaces en Falta de
salud satisfaccin Reaccin emocional a la enfermedad y a su asistencia.
Fuente: adaptado de Fletcher y otros, 1998.

Estructura de los datos: el nivel de medicin de las variables

El proceso de medicin implica la asignacin de nmeros a observaciones de manera


que los nmeros sean factibles de anlisis a travs de la manipulacin u operacin de
acuerdo a ciertas reglas, con el propsito de revelar nueva informacin acerca de los
objetos y las propiedades medidas. Las operaciones interpretables en un conjunto
dado de datos dependen del nivel de medicin alcanzado(Siegel & Castellan, 1995).

La escala ms bsica es la nominal que consiste en variables categricas cuyas


caractersticas no presentan ningn orden, y por tanto no provee informacin alguna
de la relacin entre las categoras; esta puede ser dicotmica si consiste en solo dos
valores posibles o politmicasi hay posibilidad de la existencia de ms de dos
categoras. A continuacin se presenta la escala ordinal que se refiere a una variable
categrica cuyas categoras si pueden ordenarse, aunque estos no son considerados

4
nmeros reales; continuando con la jerarqua, la escala de intervalo se refiere a
nmeros verdaderos, susceptibles de medicin que informan que tan grande o tan
pequea resulta una medida respecto de otra, es decir las distancias entre puntos
sucesivos en la escala son equivalentes; la escala de intervalo no posee un cero
absoluto mientras que la escala ms compleja llamada de razn posee todas las
caractersticas de las escalas anteriores y un cero absoluto. Adems, ya sea la escala
de intervalo o de razn pueden clasificarse como discretas o continuas; las escalas
discretas son nmeros que no permiten divisiones decimales mientras que las
continuas si lo permiten (Argimon Pallas & Jimnez Villa, 2000; Blair & Taylor, 2008;
Gunawardena, 2011; Henquin, 2013; Jaykaran, 2010; Siegel & Castellan, 1995). En el
cuadro II se resumen los tipos de relaciones y operaciones posibles para cada escala
de medicin.

Cuadro II. Escala de medicin de las variables

Escala Tipo de relaciones Tipos de operaciones


Nominal Equivalencia Transformacin de categoras
Equivalencia Transformacin monotnica
Ordinal Orden Clculo de mediana y cuartiles
Equivalencia Operaciones aritmticas
Clculo de media y desviacin
Orden estndar
De intervalo Razn conocida entre dos intervalos Correlacin
Equivalencia Operaciones aritmticas
Clculo de media y desviacin
Orden estndar
Razn conocida entre cualesquier de dos
intervalos Correlacin
Razn conocida entre cualesquiera de dos
De razn valores Modelos de regresin
Fuente: adaptado de Siegel y Castellan, 1995.

El anlisis de la escala de medicin de las variables implicadas debe realizarse tanto


para la variable independiente como para la dependiente; es importante tomar en
cuenta que cuando las variables dependientes tiene una escala de intervalo o razn,
las pruebas estadsticas que se pueden aplicar poseen ms potencia (Argimon Pallas
& Jimnez Villa, 2000). Por otro lado si solo existe una variable independiente se habla
de anlisis bivariados, mientras que si existe ms de una variable dependiente se
habla de anlisis multivariados; si, por otro lado existen varias variables dependientes
se habla de mtodos de respuesta mltiple (Watt & van den Berg, 2002).

Conviene terminar el anlisis de la escala de medicin hablando de variables duras y


blancas. Variables duras son aquellas en las cuales existe una medicin objetiva, al
repetirse se obtienen resultados similares, generalmente tienen poca posibilidad de
influencia externa y para las cuales hay instrumentos precisos; variables blandas son
aquellas que no son objetivas o que tienen un grado alto de subjetividad, no hay
instrumentos de medicin estandarizados, no hay necesariamente repetibilidad cuando
se hacen varias mediciones en condiciones similares y puede haber influencia externa
(Ruiz & Morillo, 2004). Ms adelante veremos que la distribucin de probabilidad de
estas variables no suele ser paramtrica.

5
Estructura de los datos: distribucin de probabilidad

Cuando la variable independiente tiene una escala de intervalo o razn, hay que
preguntarse cul es la distribucin de probabilidad poblacional de la misma. Si los
datos presentan una distribucin de probabilidad similar a la normal (gaussiana),
deberan utilizarse pruebas paramtricas para evaluar las hiptesis propuestas; de lo
contrario, debern utilizarse mtodos no paramtricos, los cuales pueden aplicarse
tambin a variables ordinales (Gunawardena, 2011; Jaykaran, 2010; Siegel &
Castellan, 1995).

Existen varios mtodos para evaluar la distribucin de probabilidad de los datos, como
lo son el uso de histogramas, diagramas de cajas (boxplots), grficos de normalidad
Q-Q (Q-Q plots), beanplots, clculo del coeficiente de asimetra y la curtosis, la
evaluacin de la regla emprica, los test de bondad de ajuste como la prueba de
Shapiro-Wilk, la prueba de Kolmogorov-Smirnof, la prueba de Agostino-Pearson; stas
ltimas evalan la hiptesis que los datos se distribuyen poblacionalmente de forma
normal (hiptesis nula)(Albert & Rizzo, 2012; Barton & Peat, 2014; Jaykaran, 2010;
Kanji, 2006).

Estructura de los datos: homocedasticidad, independencia

Adems de la normalidad, los mtodos paramtricos deben satisfacer otros supuestos


como la independencia, que implica que la seleccin de un caso no debe sesgar la
oportunidad de seleccionar a cualquier otro caso; la homocedasticidad, que implica
que los grupos de comparacin posean varianzas (dispersin) similares; y que las
variables respuesta sean medidas por lo menos en una escala de intervalo (Glantz,
2006; Siegel & Castellan, 1995). Sin embargo, los mtodos paramtricos tambin son
conocidos como robustos, pues aun cuando no se satisfagan completamente estas
asunciones, pueden aplicarse, sobre todo si se trata de muestras lo suficientemente
grandes. Cuando las muestras son pequeas, generalmente, es difcil determinar si se
cumplen dichas asunciones (Argimon Pallas & Jimnez Villa, 2000).

Los mtodos no paramtricos, tpicamente, hacen menos suposiciones sobre los


datos; esto tiene dos implicaciones importantes: a) que las conclusiones derivadas de
la aplicacin de una prueba no paramtrica son menos especficas que las derivadas
de la aplicacin de una prueba paramtrica equivalente; b) que cuando no se cumplen
esas suposiciones o no se puede comprobar que existan, por ejemplo en caso de
muestras pequeas, es recomendable usar pruebas no paramtricas, pues en estas
condiciones, stas resultarn ms potentes que sus equivalentes paramtricos; la
potencia es la capacidad de una prueba para detectar como estadsticamente
significativa una determinada asociacin o diferencia que existe en la realidad. Otro
aspecto importante a considerar en la aplicacin de los mtodos no paramtricos es la
consideracin de la fuerza de las variables; si la escala es blanda, aplicar una prueba
paramtrica podra causar distorsiones que comprometan la validez de los resultados;
por ello, cuando se trate de aplicar mtodos estadsticos a datos categricos, rangos,
variables con distribucin no paramtrica y variables blandas, se utilizarn los no
paramtricos(Argimon Pallas & Jimnez Villa, 2000; Siegel & Castellan, 1995).

Otras consideraciones para considerar la eleccin entre pruebas paramtricas o no


paramtricas son las siguientes: a) cuando los datos muestran distribuciones
sesgadas o valores atpicos o atpicos extremos los mtodos no paramtricos podran
ser los mtodos ms adecuados; b) cuando se disponen de pocos datos
experimentales pero s se disponen de datos previos de la misma poblacin, pueden
examinarse stos para evaluar la normalidad de los mismos; c) pueden aplicarse a
datos no paramtricos transformaciones, como la transformacin logartmica, aunque

6
las transformaciones convierten las variables originales en otras de difcil
interpretacin y comparacin(Barton & Peat, 2014; Motulsky, 1995).

Los procedimientos modernos de Estadstica robusta, pueden resolver problemas


inherentes al uso de mtodos clsicos paramtricos cuando las suposiciones han sido
violadas(Erceg-Hurn & Mirosevich, 2008), sin embargo, no se hablar ms de estos
mtodos en este artculo.

Diseo del estudio: la cantidad de grupos de comparacin

La cantidad de grupos de comparacin, en efecto influyen sobre la prueba estadstica


a utilizar. Mientras ms grupos se comparen entre s, necesitar utilizarse un mayor
tamao de muestra, para garantizar la validez de las conclusiones obtenidas a travs
de la aplicacin de las pruebas estadsticas. (Argimon Pallas & Jimnez Villa, 2000;
Barton & Peat, 2014; Glantz, 2006) De esto se hablar con ms detalle cuando se
desarrolle el tpico correspondiente al tamao de la muestra.

Diseo del estudio: el carcter apareado o independiente de los grupos

Las medidas repetidas o apareadas son aquellas que se han realizado sobre los
mismos sujetos, por ejemplo cuando se evala el efecto de una intervencin se toma
una medicin basal (anterior a la aplicacin de la intervencin) que se comparar con
una medicin final (posterior a la aplicacin de la intervencin), o cuando se comparan
individuos con caractersticas similares o equivalentes que difieren nicamente en que
unos estn expuestos y los otros no a un factor modulador de la variable respuesta o a
una intervencin, como ocurre en los estudios de casos y controles apareados, donde
a cada caso le corresponde al menos un control que tiene caractersticas clnicas o
demogrficas similares. Se habla de grupos independientes cuando se comparan
individuos diferentes (Argimon Pallas & Jimnez Villa, 2000; Gunawardena, 2011).

La ventaja de disear estudios apareados consiste en que, dado que los sujetos son
los mismos, existen menos fuentes de variacin, y, por ende, en estos casos se cuenta
con pruebas ms potentes. En los estudios apareados se cuantifica la magnitud de las
diferencias entre diferentes mediciones realizadas en los mismos individuos; en los
estudios independientes se comparan los valores resumidos entre los diferentes
grupos independientes. Adems, el tamao de muestra utilizado difiere entre uno y
otro diseo; en particular, los diseos pareados tienen la ventaja de usar muestras
ms pequeas(Argimon Pallas & Jimnez Villa, 2000; Baptist et al., 2010;
Gunawardena, 2011; Ruiz &Morillo, 2004). Cuando se comparan tres o ms grupos el
trmino que se utiliza es el de medidas repetidas (Motulsky, 1995).

Diseo del estudio: pruebas de una o dos colas

En el apartado anterior se indic que en los estudios apareados se evala la diferencia


entre las mediciones realizadas, es decir, se usan hiptesis de diferencias, y por tanto,
en estudios con grupos independientes se utilizan hiptesis de comparacin de
parmetros entre grupos (Jaykaran, 2010). Otras hiptesis que pueden evaluarse son
las de una o dos colas; la hiptesis de una cola se aplican cuando existe evidencia
clara que la intervencin podra actuar en una direccin; las de dos colas cuando la
direccin de las diferencias esperadas no est clara (Argimon Pallas & Jimnez Villa,
2000; Henquin, 2013; Motulsky, 1995). En la mayora de los estudios clnicos, el uso
de pruebas de una cola son raras, debido que a menudo se busca un efecto en ambas
direcciones y porque los estudios de dos colas reducen la oportunidad de que una
diferencia entre grupos sea declarada estadsticamente significativa en error, y en

7
consecuencia, que un nuevo tratamiento sea incorrectamente aceptado como ser ms
efectivo que un tratamiento existente (Barton & Peat, 2014).

Diseo del estudio: aspectos referentes al muestreo

En las secciones anteriores se defini el concepto de potencia y se mencionaron


algunos tpicos relacionado con el muestreo. Ahora se discutir el concepto de
potencia-eficacia, que implica queun incrementoparticular en el tamao de la muestra
har equivalentes en potencia a dos pruebas estadsticas. Una prueba estadstica no
paramtrica poseer entre el 90 a 95% de la potencia de su equivalente paramtrico, y
segn el concepto de potencia-eficacia, aumentando de forma suficiente el tamao de
muestra una prueba no paramtrica ser tan potente como su equivalente paramtrico
(Siegel & Castellan, 1995). Tambin hay que recordar que, segn el teorema del
lmite central, las distribuciones muestrales de ciertas clases de estadsticos se
aproximarn a la normalidad, a medida que el tamao de la muestra se incrementa, e
independientemente de la forma de la poblacin muestreada (Blair & Taylor, 2008).

Otro aspecto que se debe considerar es el radio de los grupos de comparacin; la


potencia se ve comprometida cuando el tamao de los grupos de comparacin se
encuentra desequilibrado; pruebas como la T de Student y el anlisis de varianza
requieren radios de comparacin que no excedan 1:4(Barton & Peat, 2014).

En sntesis, se dir que en casos que por, tamao reducido de muestra, no se pueda
conocer la distribucin de probabilidad de la variable respuesta, y no se disponga de
ms evidencia, se usarn pruebas no paramtricas. En algunos casos particulares, la
eleccin entra una y otra prueba ser basada nicamente en no contar con una
muestra ms grande como lo es el caso de la prueba exacta de Fisher que se utiliza
como una alternativa de la prueba de ji cuadrado, al no contarse con la suficiente
muestra para satisfacer las demandas de la ltima prueba (Siegel & Castellan, 1995).

Algoritmos para elegir una prueba estadstica

En esta ltima seccin se presentarn algunos algoritmos para decidir cul es la


prueba idnea, tomando en cuenta todo lo expuesto con anterioridad. Es necesario,
sin embargo, hacer hincapi en algunas advertencias y recomendaciones. Estos
algoritmos han sido elaborados con base a la literatura citada en este artculo, en otros
libros no citados, y en el software UNStat4 elaborado por Marta Garca-Granero y
Diego Calavia Gil, de la Facultad de Ciencias de la Universidad de Navarra(Garca-
Granero & Calavia Gil, 2010). Para conocer detalles de la aplicacin y supuestos de
las pruebas puede consultarse el Handbook of Parametric and
NonparametricStatisticalProcedures de David Sheskin (5 edicin, 2011).

8
Algoritmo 1: variable respuesta nominal

2 grupos: McNemar / Z
de diferencia de
proporciones
Grupos relacionados

3 o ms grupos:
Cochran

Un grupo: test de
Diferencia bondad de ajuste de Chi
cuadrado (politmicas),
z para proporciones
(dicotmicas)

Variable respuesta Dos grupos: ji cuadrado


nominal de tablas de
Grupos independientes
contingencia / Z para
dos proporciones

2 o ms grupos:
Tres grupos o ms: ji
Coeficiente de
Asociacin cuadrado de tablas de
contingencia / V de
contingencia
Cramer

Algoritmo 2: variable respuesta ordinal

2 grupos: prueba de
signos

Grupos relacionados

3 o ms grupos: test
de Friedman

Diferencia
Un grupo: test de
bondad de ajuste de
Chi cuadrado
Grupos
Variable respuesta independientes
ordinal Dos grupos o ms: ji
cuadrado de tablas
2 grupos: Spearman, de contingencia*
Tau de Kendal

Asociacin

3 o ms grupos: Tau
de Kendall

* Cuando el rango es amplio, por ejemplo > 6 puede usarse la prueba de la suma de rangos de Wilcoxon
para comparar dos grupos independientes o la prueba de Kruskal-Wallis para comparar tres grupos
independientes.

9
Algoritmo 3. Variable respuesta cuantitativa, pruebas no paramtricas

Asociacin: coeficiente de
correlacin de Spearman
Asociacin
Prediccin: regresin no
lineal, regresin no
paramtrica Dos grupos: rangos signados
de Wilcoxon, prueba de los
Variable de intervalo o signos
razn Grupos relacionados
Tres o ms grupos: test de
Cochran

Diferencia
Un grupo: prueba de los
signos para una muestra

Dos grupos: Test de Mann-


Grupos independientes Whitney (Prueba de suma
de rangos de Wilcoxon)

Tres o ms grupos: Test de


Kruskall-Wallis, test de la
mediana

Algoritmo 4. Variable respuesta cuantitativa, pruebas paramtricas

Asociacin: coeficiente de
correlacin de Pearson

Asociacin

Prediccin: regresin lineal

Dos grupos: T de Student


pareada

Variable de intervalo o razn Grupos relacionados


Tres o ms grupos: Anlisis de
varianza de medidas
repetidas

Un grupo: T de Student para


Diferencia una muestra, prueba de Z
para una muestra (n > 30)
Varianzas similares: T de
Student, Prueba de Z

Dos grupos

Varianzas desiguales: Prueba


Grupos independientes
de Welch

Varianzas similares: Anlisis


de varianza

Tres o ms grupos

Varianzas desiguales: Prueba


de Welch

10
Referencias

Albert, J., & Rizzo, M. (2012). R by Example. New York, NY: Springer New York.
http://doi.org/10.1007/978-1-4614-1365-3
Argimon Pallas, J., & Jimnez Villa, J. (2000). Mtodos de investigacin clnica y
epidemiolgica (3rd ed.). Madrid: Elsevier.
Baptist, J., Rhrig, B., Hommel, G., & Blettner, M. (2010). Choosing Statistical Tests.
Deutsches rzteblatt International, 107(19), 343348.
http://doi.org/10.3238/arztebl.2010.0343
Barton, B., & Peat, J. (2014). Medical Statistics: A Guide to SPSS, data analysis and
critical appraisal (2nd ed.). United Kingdom: BMJ Books.
Blair, C., & Taylor, R. (2008). Bioestadstica. Mxico: Pearson Educacin, S.A.
Erceg-Hurn, D. M., & Mirosevich, V. M. (2008). Modern robust statistical methods: An
easy way to maximize the accuracy and power of your research. American
Psychologist, 63(7), 591601. http://doi.org/10.1037/0003-066X.63.7.591
Fletcher, R., Fletcher, S., & Wagner, E. (1998). Epidemiologa Clnica: Aspectos
fundamentales (2nd ed.). Barcelona: Masson.
Garca-Granero, M., & Calavia Gil, D. (2010). UNStat. Pamplona, Navarra:
Departamento de Bioqumica y Gentica, Facultad de Ciencias.
Glantz, S. (2006). Bioestadstica (6th ed.). Mxico, D.F.: Mc Graw Hill.
Gunawardena, N. (2011). Choosing the correct statistical test in research. Sri Lanka
Journal of Child Health, (40), 149153.
Henquin, R. (2013). Epidemiologa y Estadstica para principiantes. Buenos Aires:
Corpus.
Hernndez Sampieri, R., Fernndez, C., & Baptista, P. (2003). Metodologia de la
Investigacin (3rd ed.). Mxico, D.F.: Mc Graw Hill.
Jaykaran. (2010). How to select appropriate statistical test? Journal of Pharmaceutical
Negative Results, 1(2), 61.
Kanji, G. (2006). 100 Statistical Tests (3rd ed.) (3rd ed.). Londres: SAGE Publications
Ltd. http://doi.org/10.4135/9781849208499
Krzywinski, M., & Altman, N. (2013). Points of significance: Importance of being
uncertain. Nature Methods, 10(9), 809810. http://doi.org/10.1038/nmeth.2613
Motulsky, H. (1995). Intuitive Biostatistics. New York: Oxford University Press.
Ruiz, A., & Morillo, L. (2004). Epidemiologa Clnica: Investigacin clnica aplicada.
Bogot: Editorial Mdica Panamericana.
Siegel, S., & Castellan, J. (1995). Estadstica no paramtrica aplicada a las ciencias de
la conducta (4th ed.). Mxico, D.F.: Trillas.
Watt, J., & van den Berg, S. (2002). Research Methods for Communication Science.

11
Gua para redactar hiptesis

I. Hiptesis para una muestra


A. Mtodos paramtricos
1. Variable cuantitativa: Prueba de Z / Prueba de T (n menor a
30)
Ho: La media poblacional de la variable es igual a un valor
constante.

2. Variable dicotmica: Prueba de z para proporciones


Ho: La proporcin poblacional de la variable es igual a una
proporcin constante.

B. Mtodos no paramtricos
1. Prueba de Wilcoxon para una muestra
Ho: La mediana poblacional de la variable es igual a un
valor constante.

2. Variable nominal politmica: Prueba de Ji cuadrado


Ho: La proporcin poblacional de las k categoras es igual a
las k categoras constantes.

3. Variable nominal dicotmica: Prueba binomial


Ho: La proporcin poblacional de la categora A es igual a
la proporcin poblacional de la categora B.

4. Pruebas de normalidad
Ho: La distribucin de probabilidad de la variable respuesta
en el grupo A es normal.

Ho: La distribucin de probabilidad poblacional de la


variable es normal.

II. Hiptesis para dos muestras


A. Muestras independientes

1. Mtodo paramtrico: Prueba de T de Student / prueba de z


para medias
Ho: Las medias poblacionales de la variable respuesta en
los grupos A y B no difieren significativamente.

Ho: La media poblacional dela variable respuesta en el


grupo A es igual a la media poblacional dela variable
respuesta en el grupo B.

12
Ho: No hay variacin entre las medias poblacionales de la
variable respuesta en los grupos A y B.

2. Mtodo no paramtrico: Prueba de Mann Whitney


Ho: Las medianas poblacionales de los grupos A y B no
difieren significativamente.

Ho: La mediana poblacional delavariable respuesta en el


grupo A es igual a la mediana poblacional dela variable
respuesta en el grupo B.

Ho: No hay variacin entre las medianas poblacionales de


la variable respuesta en los grupos A y B.

3. Variables categricas: Prueba de ji cuadrado / prueba


exacta de Fisher / prueba de z para proporciones independientes
Ho: La proporcin poblacional de la variable respuesta en
el grupo A no difiere significativamente de la proporcin
poblacional de la variable respuesta en el grupo B.

4. Pruebas de Homocedasticidad: Levene, Bartlet


Ho: No existe diferencia entre las varianzas poblacionales
de los grupos A y B.

5. Correlacin paramtrica o no paramtrica


Ho: El coeficiente de correlacin poblacional entre las
variables A y B es igual a cero.

6. Regresin
Ho: La pendiente poblacional beta del modelo de regresin
entre las variables A y B es igual a cero.

B. Muestras relacionadas
1. Mtodo paramtrico: T de Student de muestras apareadas
Ho: La diferencia de promedios poblacionales de variable
respuesta despus y antes de un evento es igual a cero

2. Mtodo no paramtrico: Prueba de rangos signados de


Wilcoxon
Ho: La diferencia de medianas poblacionales de variable
respuesta despus y antes de un evento es igual a cero.

3. Mtodo no paramtrico, variable ordinal: Prueba de signos


de Wilcoxon
Ho: La diferencia poblacional entre los signos positivos y
los signos negativos es igual a cero.

13
4. Variable dicotmica: Prueba de McNemar
Ho: La diferencia entre las proporciones poblacionales de la
variable respuesta antes y despus de un evento es igual a
cero.

Ho: La diferencia entre las proporciones poblacionales de la


variable respuesta en los grupos A y B, relacionados, es
igual a cero.

14
Gua de evaluacin de la distribucin de probabilidad

I. Pruebas descriptivas

A. Mtodos grficos

QQ plots: Los valores observados similares a los valores


esperados de una curva normal.
Histograma con forma de distribucin de campana.
Boxplot: la mediana coincide con el posible valor de la media.
Los valores atpicos y atpicos extremos estn presentes en
distribuciones no normales.

B. Estadsticos

Regla emprica: Media 1 desviacin estndar incluye al 68% de


los datos; Media 2 desviacin estndar incluye al 95% de los
datos; Media 3 desviacin estndar incluye al 99.7% de los
datos.
Si la desviacin estndar es mayor o igual que la media, la
distribucin podra no ser normal; una desviacin estndar muy
pequea en relacin a su media tambin podra provenir de un
conjunto de datos con distribucin no normal.
Si la media y la mediana tienen un valor similar, se dice que hay
simetra, la distribucin podra ser normal.
Coeficiente de asimetra:
Curtosis:

II. Pruebas inferenciales

A. Mtodos de bondad de ajuste

Prueba de Shapiro-Wilk (la ms potente)


Prueba de Agostino-Pearson
Prueba de Kolmogorov-Smirnov
Prueba de Chi cuadrado de bondad de ajuste (menor potencia)

B. Otros mtodos

Pruebas de hiptesis para curtosis y coeficientes de asimetra


poblacionales

15
Gua para la evaluacin de la homocedasticidad

I. Mtodos descriptivos

A. Estadsticos

Compare las varianzas, deben ser similares.


Compare las desviaciones estndar, deben ser similares.
Compare el rango intercuartil de ambos grupos deben ser
similares.
Compare los coeficientes de variacin, deberan ser similares.

B. Mtodos grficos

La amplitud de un grfico de barras donde se han graficado las


desviaciones estndar (no los intervalos de confianza!) deben ser
similares entre los grupos de comparacin.
El tamao de las cajas de un boxplot debe ser similar para los
grupos de comparacin.

II. Mtodos inferenciales

Prueba de Bartlet (asume que los datos tienen una distribucin de


probabilidad normal)
Estadstico de Levene (podra aplicarse a datos no paramtricos
tambin; existe una versin robusta del test)

16
Presentacin de resultados de una investigacin cuantitativa en el
contexto de las ciencias biomdicas

Andr Choc
Asesor Estadstico y de Investigacin en Ciencias de la Salud
Contacto: panteisme@gmail.com

La obsesin por incluirlo todo, sin olvidar nada, no prueba que se dispone de una informacin
ilimitada, sino que se carece de capacidad de discriminacin.
Aaronson

You cant just make things up, though. Each element in your story should be interesting, and
each provides a glimpse of the truth. In your Results section, your interesting story comes
through your words; the sense and truth of your words come through your statistics.
Bernard Beins.

Introduccin

La etapa de presentacin de resultados de una investigacin debe combinar la


precisin tcnica del resumen de los datos con la brevedad, claridad y esttica.
Recordemos que los datos al ser procesados se convierten en informacin, de
manera que esta ltima nos permite comprender los fenmenos e influir sobre
ellos tomando decisiones. La eficiencia y facilidad en la presentacin de los
resultados deben combinarse al elegir metodologas estandarizadas para la
presentacin de los mismos. Existen metodologas estandarizadas dictadas
por guas de estilo de trabajos acadmicos y cientficos y otras que han
desarrollado las revistas cientficas como requisitos que deben cumplir los
trabajos para su publicacin. En este artculo tiene como objetivo revisar
algunas pautas generales para la presentacin de los resultados de una
investigacin.

Recomendaciones generales para la presentacin de resultados

Despus que se han resumido los datos aplicando diferentes anlisis


estadsticos se presenta la etapa de organizacin y presentacin de los
resultados. Hernndez sugiere las siguientes actividades previas a la
presentacin de resultados: a) revisin de cada resultado obtenido; b)
organizacin de los resultados en anlisis descriptivos, inferenciales,
multivariantes, etc.; c) evaluar la coherencia de los resultados con el marco
conceptual y metodolgico; d) priorizar la informacin ms valiosa; e) dar

17
formato a las tablas haciendo uso de procesadores de palabras, hojas
electrnicas o en algn software estadstico; f) interpretar brevemente cada
resultado obtenido; g) revisar nuevamente los resultados; y, h) elaborar un
reporte de investigacin (Hernndez, Fernndez, & Baptista, 2014).Lang y
Altman agregan todos aquellos procedimientos para modificar datos brutos
antes del anlisis como las transformaciones para que los datos posean una
distribucin de probabilidad similar a la normal, la creacin de ratios o variables
derivadas o la degradacin de variables(Lang & Altman, 2015).

The International Committee of Medical JournalEditors en su sus


UniformRequirementsforManuscriptsSubitted to BiomedicalJournals nos
indican que los resultados se deben describir con suficiente detalle de manera
que permitan a un lector versado poder verificar los resultados reportados a
travs de la revisin de los datos originales; y que el reporte de estos
resultados provea suficiente detalle para que puedan ser incorporados a otros
anlisis (Lang & Altman, 2015). Aunque la extensin de la seccin de
presentacin de resultados depende del estudio y de las normas editoriales
especficas, la tendencia actual es incluir solamente los elementos
considerados necesarios (Hernndez et al., 2014). De hecho, es importante
evitar la redundancia, no es adecuado presentar los mismos datos en tablas y
grficas a la vez, no es adecuado duplicar el texto con tablas y figuras, deber
incluirse el menor nmero posible de las mismas. Se prefiere la sntesis a la
exposicin excesivamente detallada y exhaustiva de los datos, por tanto la
publicacin de toda la informacin disponible ms que honestidad cientfica se
considera falta de criterio de seleccin (Argimon Pallas & Jimnez Villa, 2000;
Day, 2005; Ruiz & Morillo, 2004).

Por otro lado, la claridad y la sencillez debe garantizarse bajo el argumento que
representan nuevos conocimientos que se estn aportando al mundo (Day,
2005).

Los resultados han de presentarse siguiendo una sucesin lgica que atienda
al diseo del estudio utilizado; primeramente se expondrn los resultados
descriptivos acerca de las caractersticas principales de los sujetos de estudio;

18
despus, cuando se trata de estudios analticos, la etapa siguiente ser evaluar
la compatibilidad de los grupos de estudio segn las variables que podran
influir sobre los resultados. A continuacin se presenta el resultado principal en
la cual debe exponerse la estimacin del efecto del factor de estudio sobre la
variable respuesta, o bien la estimacin de la asociacin entre variables. Lo
ltimo ser presentar los resultados del anlisis de subgrupos y los que
respondan a preguntas secundarias (Argimon Pallas & Jimnez Villa, 2000).

Las guas SAMPL estn diseadas para ser incluidas en las instrucciones para
los autores en las revistas cientficas. Estas guas indican cmo reportar los
mtodos estadsticos y los resultados. En la seccin de reporte de mtodos
estadsticos se incluye la informacin sobre:a) los anlisis para modificar los
datos, previo al anlisis;b) la descripcin del propsito del anlisis, c) la
identificacin de variables; d) identificacin de la diferencia ms pequea a ser
considerada clnicamente importante; e) la descripcin de los mtodos para
analizar los objetivos primarios del estudio dejando claro qu mtodo responde
a qu pregunta y de forma adecuada; f) cundo se usaron ajustes para
comparaciones mltiples; g) qu consideraciones se tomaron acerca de datos
atpicos; h) el detalle del nivel de significancia y el tipo de hiptesis planteada;
h) nombre y versin del paquete estadstico utilizado; i) la informacin sobre
anlisis auxiliares realizados como sensibilidad, imputacin, valores perdidos o
mtodos de comparaciones de subgrupos (Lang & Altman, 2015).

En la seccin de reporte de resultados de las guas SAMPL se presentan en


general: a) el propsito del estudio o la asociacin de inters; b) las variables
usadas y las estadsticas descriptivas; c) el o los test estadsticos utilizados; d)
el nivel de precisin de los resultados, el nivel de significancia y la potencia; e)
el tamao de muestra utilizado; f) la confirmacin de las asunciones del modelo
utilizado; g)el software estadstico utilizado. Detalles especficos para cada tipo
de investigacin se presentan en el cuadro 1 (Lang & Altman, 2015).

19
Cuadro 1. Reporte de anlisis estadsticos segn las guas SAMPL
Reporte de nmeros y estadstica descriptiva
Los nmeros reportarlos con precisin adecuada, redondeando razonablemente para su simplicidad.
Reportar numerador y denominador para los porcentajes. Resumir datos con distribucin normal
haciendo uso de media y desviacin estndar; los que no tienen distribucin normal con rangos,
medianas y rangos intercuartlicos (reportando el valor mnimo y mximo del rango). No usar el error
estndar como medida de variabilidad.
Tasas y proporciones
Identificar el tipo de medida epidemiolgica a utilizar. Reportar el numerador y denominador utilizados,
as como periodo de tiempo cuando aplique. Identificar cada unidad o multiplicador de poblacin.
Considerar reportar medidas de precisin de estas mediciones a travs de intervalos de confianza.
Reporte de test de hiptesis
Identificar la mnima diferencia a ser considerada como clnicamente importante. Indicar si el test o tests
utilizados son de una o dos colas y si son pareados o de grupos independientes. Reportar medidas de
precisin por medio de intervalos de confianza cuando aplique. Reportar el valor exacto del valor p con
dos decimales y para valores p muy pequeos indicar p < 0.001. Reportar cmo y cundo se hicieron
ajustes para comparaciones estadsticas mltiples.
Reporte de anlisis de asociacin
El tipo de test realizado. Para los test de asociacin reportar valor p como se indic anteriormente. Para
las medidas de asociacin, reportar el valor del coeficiente e intervalo de confianza (no describir la
asociacin como baja, moderada o alta a menos que los rangos de esas categoras hayan sido definidos
con anterioridad y biolgicamente sean plausibles). Incluir tablas de contingencia.
Anlisis de correlacin
Reportar coeficiente de correlacin y su tipo (la misma recomendacin para medidas de asociacin).
Reportar intervalo de confianza para el coeficiente de correlacin y significancia estadstica, as como una
grfica de dispersin y valor p de un test de hiptesis para el coeficiente de correlacin poblacional.
Anlisis de regresin
Reportar si se hizo tratamiento de valores atpicos y datos perdidos. Coeficiente de determinacin
Reportar la ecuacin de la regresin. Para anlisis de regresin mltiples reportar el nivel alfa usado en
el anlisis univariante, las variables utilizadas, evaluacin de colinealidad, anlisis de interacciones y el
tipo de procedimiento para seleccionar las variables a incluir en el modelo. Reportar los coeficientes de
regresin de cada variable explicatoria y sus intervalos de confianza y valores p en una tabla. Especificar
como fue validado el modelo. Presentar datos con una grfica y ecuacin de la regresin y evitar la
extrapolacin (incluir los rangos de valores de las variables utilizadas).
Anlisis de varianza (ANOVA)
Tratamiento de datos atpicos y valores perdidos si hubo. Especificar si se busc interaccin con las
variables explicatoria y si se realiz algn tratamiento. Valor p de cada variable explicatoria y grados de
libertad. Proveer informacin sobre anlisis de bondad de ajuste. Indicar cmo fue validado el modelo.
Fuente: Adaptado de Lang: The Statistical Analyses and Methods in the Published Literature or
the SAMPL Guidelines.

20
Tablas

El fin de las tablas es la ordenacin y presentacin de informacin de tipo


repetitivo de manera que pueda comprenderse fcilmente. Los criterios ms
importantes para la elaboracin de tablas se mencionan a continuacin: a) han
de ser autoexplicativas, b) se requiere que sean sencillas y de fcil
comprensin, c) debern tener un ttulo breve y claro, d) claridad en
encabezamientos de filas y columnas e incluir unidades de medida, e) las filas
y columnas debern presentar una ordenacin lgica, f) debe evitarse el uso de
excesiva precisin, g) debe incluirse los totales para facilitar la comprensin, h)
las abreviaturas deben hacerse explcitas y es mejor evitarlas, i) deben evitarse
las lneas verticales en la tabla, j) se pueden incluir notas explicativas que
sirvan para indicar la fuente de donde fueron tomados los datos, en caso que
no correspondan al propio estudio(Argimon Pallas & Jimnez Villa, 2000; Beins,
2012; Ruiz & Morillo, 2004). Regresando al criterio de redundancia, cabe
sealar que las mediciones reiteradas se presentarn en cuadros o grficas y
las que no en texto (Day, 2005).

Grficos

En general, se prefiere el uso de tablas, dado que estas son ms exactas y


permiten presentar mucha ms informacin que una grfica. La finalidad de las
grficas es ayudar a la descripcin, exploracin, tabulacin y comparacin. Se
prefieren a las tablas nicamente cuando lo que se quiere realizar es una
representacin de una tendencia que no podra visualizarse fcilmente en
tablas. Se deber evitar las grficas que induzcan la distorsin de lo que se
pretenda mostrar (Argimon Pallas & Jimnez Villa, 2000). Ahora se
enumerarn algunas recomendaciones para el uso de grficas: a) deben
entenderse a simple vista y tener esttica b) no se debe de combinar ms de
tres variables a excepcin de los grficos multivariados, d) debern tener una
escala proporcionada y si es posible esta escala debe originarse en el cero
(Ruiz & Morillo, 2004).

21
Cuadro 2. Errores frecuentes en la presentacin de resultados
Errores de tipo estadstico
-Presentar valores p sin especificar qu tipo de pruebas de hiptesis fueron realizadas.
- Presentar estimaciones puntuales sin intervalos de confianza o valores p sin explicar la potencia o el
tamao del efecto.
- Expresar la signficacin estadstica como significativa o no significativa sin indicar el valor p exacto.
- Precisin excesiva de los resultados.
- Expresar los resultados en porcentaje cuando el nmero de casos es muy reducido.
- Reportar medidas de tendencia central sin su correspondiente medida de variabilidad.
- Reportar estadsticos no idneos.
Errores metodolgicos
-Incluir informacin no pertinente, es decir, no relacionada con los objetivos del estudio.
- Incluir informacin no relevante u omitir informacin relevante.
- Presentar los resultados sin una secuencia lgica.
- Interpretar los resultados o acompaarlos de opiniones propias.
- Duplicar la informacin presentada en tablas, grficas o texto.
- No citar todas las tablas y figuras que se presentan en texto.

Fuente: Adaptado de Pallas, Mtodos de investigacin clnica y epidemiolgica.

Algunos ejemplos

Ahora se desarrollarn algunos ejemplos de presentacin de resultados, segn


pregunta a responder o tipo de procedimiento estadstico realizado. Para el
desarrollo de los ejemplos se tomaron en cuenta las recomendaciones de la
American PsychologicalAssociation (APA) (Barton & Peat, 2014).

Ejemplo de una tabla univariante, variable cualitativa

Tabla 1.
Frecuencia de resistencia a la insulina en pacientes que asistieron a la Consulta
Externa del Hospital Roosevelt durante 2012 2013 (n = 176)

Resistencia a
la insulina Frecuencia Porcentaje
No 138 78.4%
S 38 21.6%
Total 176 100.0%

Comentario: Puede observarse que en el ttulo de la tabla se identifica la variable de inters, el


grupo donde se realiz el estudio, as como el lugar, fecha y tamao de muestra. En el cuerpo
de la tabla se muestran las categoras de la variable, la frecuencia absoluta y el porcentaje. La

22
ausencia de lneas verticales facilita la lectura tabular de la tabla y el formato acadmico le da
sobriedad y esttica a la misma. Se incluyen los totales, aunque si se especifica en el ttulo el
tamao de muestra puede omitirse del cuerpo de la tabla. Se us nicamente un decimal, lo
cual es apropiado cuando se reportan porcentajes provenientes de un conteo. El ancho de las
columnas es el mismo. Dado que se necesita describir la variable no hace falta informacin.
No es necesario especificar la fuente de los datos, dado que la tabla se hizo con los datos de la
investigacin actual.

Tabla 1.
Frecuencia y estimacin del intervalo de confianza del 95% de la resistencia a la
insulina en pacientes que asistieron a la Consulta Externa del Hospital Roosevelt
durante 2012 2013 (n = 176)

Resistencia a la
insulina Frecuencia Porcentaje IC 95%
No 138 78.4% 15.2% a 27.9%

S 38 21.6%
Total 176 100.0%

Comentario: Aqu se incorpora tanto al ttulo como al cuerpo de la tabla el intervalo de


confianza de una proporcin poblacional. Tambin pudo haberse agregado el intervalo de
confianza al pie de pgina de la primera tabla. Se debe tomar en cuenta que en la seccin de
mtodos se debe indicar el software con el que se realiz este clculo inferencial.

Ejemplo de una tabla comparativa bivariante, variable cuantitativa

Tabla 2.
Comparacin de los niveles de colesterol de alta densidad (HDL) segn sexo en
pacientes que asistieron a la Consulta Externa del Hospital Roosevelt durante 2012
2013, (n = 176)

Sexo
Femenino Masculino

Variable Me (Q1, Q3) Me (Q1, Q3)


HDL 41.0 (36.0, 50.0) 44.0 (36.0, 49.0)

Comentario: En esta tabla se realiza una comparacin de una variable cuantitativa resumida
segn las categoras de una variable cualitativa. Se eligi la comparacin con medianas y
cuartiles, dado que la variable no mostr distribucin de probabilidad normal. Si se realiz una
prueba inferencial para evaluar la distribucin de probabilidad, el valor p obtenido podra
incluirse al pie de la tabla, especificando el nombre de la prueba realizada y nivel de
significancia.

23
Ejemplo de una tabla comparativa bivariante, variable cualitativa

Tabla 3.
Asociacin entre estado nutricional, segn ndice de masa corporal, y resistencia a la
insulina en pacientes que asistieron a la Consulta Externa del Hospital Roosevelt
durante 2012 2013, prueba de ji cuadrado (n = 176, = 0.05)

Insulinoresistencia
Estado nutricional S No
Normal 5 (10.4%) 43 (89.6%)
Sobrepeso 13 (17.1%) 63 (82.9%)
Obesidad grado I 13 (35.1%) 24 (64.9%)
Obesidad grado II 7 (46.7%) 8 (53.3%)

Valor p prueba de ji cuadrado = 0.003.


Razn de prevalencia sobrepeso = 1.6 (IC 95% = 0.6 a 4.3).
Razn de prevalencia obesidad grado I = 3.4 (IC 95% = 1.3 a 8.6).
Razn de prevalencia obesidad grado II = 4.5 (IC 95% = 1.6 a 12.1).

Comentario: Esta es una tabla de contingencia, donde se comparan las prevalencias


especficas de resistencia a la insulina segn categoras de estado nutricional; siguiendo las
pautas del enfoque epidemiolgico se sita la variable respuesta en las columnas y el factor en
las filas, de manera que la interpretacin se realice comparando los porcentajes en direccin de
las columnas, es decir la proporcin del evento de inters segn categoras de la variable
independiente. A pesar que no se muestra en la tabla la estadstica del tamao del efecto de la
prueba de chi cuadrado o su potencia, se calcularon las razones de prevalencia y sus
respectivos intervalos de confianza que podran servir como estimadores del tamao del efecto.

24
Ejemplo de una tabla para reportar un coeficiente de correlacin

Tabla 4.
Evaluacin de la correlacin entre ndice de masa corporal e ndice HOMA IR en
pacientes que asistieron a la Consulta Externa del Hospital Roosevelt durante 2012
2013 (n = 176)

Correlacin IMC - ndice HOMA IR Valor


Coeficiente de correlacin de Spearman 0.380
Valor p bilateral* < 0.001
n 176

* Prueba de T para coeficiente de correlacin poblacional = 0.05.


IMC = ndice de masa corporal.
HOMA IR = siglas de HomeostaticModelAssessment para evaluar
resistencia a insulina.

Comentario: En esta tabla se muestran tanto la correlacin, como medida descriptiva de


asociacin entre dos variables cuantitativas de la muestra, as como el resultado de una prueba
inferencial para contrastar el coeficiente de correlacin poblacional. Se eligi el coeficiente de
correlacin de Spearman dado que las variables no tienen distribucin de probabilidad normal.

Ejemplo de una tabla para reportar un anlisis de varianza

Tabla 5.
Anlisis de varianza para contrastar los valores promedio de ndice de
consumo de alimentos y nivel acadmico y estado civil, modelo aditivo(n = 160)

Factores evaluados Media (de) F Valor p


Primaria 31.6 (16.9)
Bsicos 37.4 ( 21.1)
Diversificad 40.6 (13.9)
Nivel educativo Universidad 58.1 (16.0) 16.21 3.31E-09
Unido 36.2 (16.7)
Casado 46.3 (17.6)

Estado civil Soltero 35.0 (18.1) 7.18 0.001


Valores p, pruebas Shapiro-Wilk niveles educativos, 1 a 4: 0.273, 0.189, 0.655, 0.570.
Valores p, pruebas Shapiro-Wilk estado civil: unido 0.983, casado 0.087, soltero 0.294.
Valor p, test de Bartlett, nivel educativo: 0.046; estado civil: 0.929.

25
Ejemplo de una tabla para reportar los resultados de una regresin

Tabla 6.
Modelo de regresin lineal mltiple, para determinar el porcentaje de grasa
corporal, pacientes VIH que asisten a una clnica de atencin integral, ciudad
de Guatemala, 2014, modelo de mxima verosimilitud (n = 135)
Error Valor p
Predictores Coeficientes estndar Valor t unilateral
Intercepto 9.026 1.203 7.504 8.16E-12
Porcentaje grasa bioimpedancia 0.592 0.058 10.166 < 2E-16
Sexo 4.852 1.026 4.731 5.68E-06
Error residual estndar: 4.644 sobre 132 grados de libertad.
Coeficiente de determinacin mltiple: 0.6721.
Coeficiente de determinacin ajustado: 0.6672.
Estadstica F: 135.3 (2 y 132 grados de libertad), valor p, Andeva de la regresin: < 2.2e-16

Comentario: Esta es una tabla bsica para reportar los coeficientes del modelo de regresin
mltiple con los resultados de pruebas individuales de T de Student para cada coeficiente y una
prueba de Andeva de la regresin; se reportan adems los coeficientes de determinacin
mltiple y de determinacin ajustado. En una tabla adicional pueden reportarse los estadsticos
sobre los supuestos del modelo (homocedasticidad, normalidad de los residuos, evaluacin de
independencia, evaluacin de colinealidad). Tambin podran reportarse los rangos de valores
de las variables independientes del modelo, as como el nivel de significancia considerado, y
las consideraciones sobre valores atpicos, datos perdidos, interacciones, entro otros. Resulta
interesante incluir grficos de residuales, leverages y otras que nos den informacin sobre
posibles violaciones al modelo.

Conclusiones

Lo tratado en este artculo puede resumirse enumerando los siguientes tpicos:

Describir los hallazgos en secuencia lgica, con ayuda de tablas, grficas y


otros recursos.
No repetir la informacin de tablas y grficas.
Los resultados deben contestar a los objetivos primarios y secundarios de la
investigacin.
Los resultados deben ser claros.
Limitarse a resaltar datos ms importantes.

26
Referencias

Argimon Pallas, J., & Jimnez Villa, J. (2000). Mtodos de investigacin


clnica y epidemiolgica (3rd ed.). Madrid: Elsevier.
Barton, B., & Peat, J. (2014). Medical Statistics. A Guide to SPSS, Data
Analysis and Critical Appraisal (2nd ed.). United Kingdom: BMJ Books.
Beins, B. (2012). APA Style Simplified. Writing in Psychology, Education,
Nursing and Sociology. United Kingdom: Willey-Blackwell.
Day, R. (2005). Cmo escribir y publicar trabajos cientficos (3rd ed.).
Washington, D.C.: Organizacin Panamericana de la Salud.
Hernndez, R., Fernndez, C., & Baptista, P. (2014). Metodologa de la
investigacin (6th ed.). Mxico, D.F.: Mc Graw Hill Education.
Lang, T. A., & Altman, D. G. (2015). Basic statistical reporting for articles
published in Biomedical Journals: The Statistical Analyses and
Methods in the Published Literature or the SAMPL Guidelines.
International Journal of Nursing Studies, 52(1), 59.
http://doi.org/10.1016/j.ijnurstu.2014.09.006
Ruiz, A., & Morillo, L. (2004). Epidemiologa Clnica: Investigacin clnica
aplicada. Bogot: Editorial Mdica Panamericana.

27

Vous aimerez peut-être aussi