Académique Documents
Professionnel Documents
Culture Documents
NACIONAL
DE COLOMBIA
Revista de la Facultad de
Medicina 1999; 47 (4):232-236
Constanza Quintero Guzmán, Profesora Asociada, Facultad de Ciencias, Departamento de Matemáticas y Estadística. Aura Nidia Herrera
Rojas, Profesora Asistente, Facultad de Ciencias Humanas, Departamento de Psicología. Ricardo Sánchez Pedraza, MD. Profesor Asociado,
Centro de Epidemiología Clínica, Facultad de Medicina, Universidad Nacional de Colombia. INCLEN.
SUMMARY 2. Generación de una hipótesis: "Esa per- gunos autores de libros de Estadística
sona no es normal". la ven como explicación de la infideli-
This article is prirnarily airned to give
3. Prueba de la hipótesis: "No se com- dad (1) .
an understanding of sorne basic
principies in Biostatistics. Instead of porta como los demás, los que se El fenómeno de la variabilidad también
theoretical aspects, the ernphasis is comportan así son los enfermos men- es el responsable de que nunca poda-
firrnly on basic and practical applications tales, si lo comparo con un enfermo mos conocer las características de cier-
related with probability, odds ratios and mental esta persona se porta igual". tas poblaciones por ser estas muy gran-
descriptive statistics. 4. Conclusión: "Esta persona es un en- des o difíciles de medir. En este caso
fermo mental, definitivamente no es debemos recurrir al estudio de solo una
RFSUMEN normal". parte de esa población, lo cual se co-
noce como muestra. El asunto aquí es
Este artículo tiene como objetivo apor- El anterior proceso se realiza en muchas buscar una muestra que refleje de la
tar elementos para la comprensión de otras circunstancias: cuando vemos a mejor manera posible las característi-
algunos principios básicos de la alguien muy alto, o a una persona que cas de la población de la cual se ha to-
Bioestadística. En lugar de mostrar los tiene un acento extraño, o un modelo de mado. Obviamente, entre más grande
aspectos teóricos, se hace énfasis fun- automóvil nuevo ... sea la muestra, más se parecerá a la
damentalmente en aplicaciones bási- Cuando tenemos que analizar una serie población que pretende representar. En
cas y prácticas en el campo de la pro- de datos de un estudio clínico utiliza- este sentido, una muestra de buena ca-
babilidad, los riesgos relativos indirec- mos los mismos pasos: Primero los des- lidad es una muestra representativa.
tos y la estadística descriptiva. cribimos, luego generamos una hipóte- El proceso de describir, generar hipó-
sis que sometemos a un proceso de tesis y probarlas y finalmente sacar una
INTRODUCCIÓN prueba y finalmente llegamos a una con- conclusión, generalmente se efectúa
clusión. sobre muestras. El siguiente paso es,
En nuestra vida cotidiana permanen- Detrás de este proceso está el hecho de mediante un proceso de inferencia, ha-
temente utilizamos la Estadística. que no somos iguales, es decir, hay va- cer extensivos los hallazgos y conclu-
Cuando vemos en la calle una perso- riabilidad. En los casos en los que no siones de la muestra a la población de
na con comportamientos no habitua- hay variabilidad no se necesita la Esta- la cual proviene: esto se ha denomina-
les nos causa extrañeza y la cataloga- dística: No nos causa extrañeza el color do inferencia estadística.
mos como rara o fuera de lo normal. de un taxi porque prácticamente todos De manera general, las inferencias se
En este caso hemos seguido un pro- son iguales, no nos llama la atención que hacen mediante dos estrategias (2):
ceso dentro del cual se han dado cua- un tigre tenga rayas pues casi todos las 1. Inferencia deductiva: O método hi-
tro pasos: tienen. potético-deductivo. Creamos una teo-
La variabilidad es un fenómeno tan im- ría a partir de la cual predecimos re-
1. Descripción del comportamiento: portante que nos permite poder cono- sultados.
"Esa persona se viste descuidada- cer gente nueva, aprender cosas que no 2. Inferencia inductiva: Hacemos va-
mente, grita, dice cosas raras, es sabíamos, extrañarnos, asombrarnos, rias observaciones, dilucidamos un pa-
agresiva sin razón aparente". alegrarnos y entristecernos. Incluso, al- trón y proponemos una teoría.
232
QUINTERO C, HERRERA A, SANCHEZ R.
233
SECCIÓN DE EPIDEMIOLOGÍA Rev Fac Med UN Co11999 Vol. 47 N° 4
3. Pesoma: Peso de la madre en libras Es muy importante considerar que hay RAZA:
diferencia entre datos cualitativos y
4. Raza: Raza de la madre (1=blanca, Clase Frecuencia Frecuencia
datos cuantitativos (7). Los cualitativos
absoluta relativa (%)
2=negra, 3=otra) son aquellos que no son caracteriza-
dos por valores numéricos, y en gene- 1 15 42.9
5. HT: Historia de hipertensión ral describen la cualidad de una perso- 2 8 22.9
(1=si,O=no) na o cosa; en este estudio son: Indica- 3 12 34.2
dor de peso al nacer, raza, historia de
6. HF: Hábito de fumar (1=leve, 2=mo-
hipertensión y hábito de fumar. La asig- Estas distribuciones de frecuencia pue-
derado, 3= grave)
nación de un valor numérico a este tipo den representarse gráficamente por
de datos es artificial y solo se usa para medio de un histograma. En el caso de
7 P: Paridad
permitir su procesamiento en los pro- la edad la representación gráfica es la
8. NS: Nivel socioeconómico (1= bajo, cedimientos o programas estadísticos. siguiente:
2=medio) Si las categorías siguen algún orden se
habla de variables ordinales. En estos 14
Los datos se presentan en formato de casos sacar un promedio no tiene sen-
12 1
texto separado por tabulador, donde tido.
10
cada columna corresponde, en el mis-
mo orden, a cada una de las variables Los datos cuantitativos son aquellos que 8
234
QUINTERO C, HERRERA A, SANCHEZ R.
Con frecuencia se observan dos carac- dente, la mediana es el valor central. Si datos y debe considerar todas las ob-
terísticas a la vez y se quiere informa- el número de valores en el conjunto de servaciones. Dentro de las medidas de
ción sobre la frecuencia en una cate- datos N es impar, la mediana es el va- dispersión tenemos:
goría determinada de una variable y de lor que aparece en el lugar (N +1)/2.
la otra simultáneamente. Esta presen- Cuando N es par hay dos valores cen- El Rango: Es la diferencia entre los va-
tación simultánea y cruzada de carac- trales y la mediana es el promedio de lores máximo y mínimo de la variable.
terísticas se realiza por medio de las éstos. Es independiente de la localización cen-
Tablas de Contingencia. Como ilustra- tral pero considera sólo dos valores del
La media: Es la más común entre las conjunto de datos. Además un valor
ción se presenta la tabla de contingen-
cia para las variables raza y edad. medidas de localización central. Se de- extremo altera el rango considerable-
fine como el promedio aritmético, es mente.
EDAD decir la suma de los N valores de la
Raza [15,20) [20,25) [25,30) [30,35] Total variable dividida por N. La media se usa Desviación estándar y varianza: Para
para datos numéricos. La media es sen- hallar la varianza, cuya notación es
1 3 4 5 3 15
sible a los valores extremos. Si se tiene S 2 Ó (}"2 ,se calcula para cada observa-
2 2 4 O 2 8
3 3 4 3 2 12 una tabla de frecuencias, se puede es- ción x su desviación con respecto a la
Total 8 12 8 7 35 timar la media por un promedio ponde- media, se eleva este resultado al cua-
rado que se obtiene multiplicando el pun- drado, se suma sobre todas las obser-
Frecuentemente es preferible disponer to medio de cada intervalo por el número vaciones y esta suma se divide por N
de medidas que resuman los datos. En de observaciones en ese intervalo. número de observaciones:
el caso de datos cualitativos las medi-
das de resumen empleadas son la moda En una distribución simétrica la moda, n
235
SECCIÓN DE EPIDEMIOLOGÍA Rev Fac Med UN Col 1999 Vol. 47 N° 4
de la madre) y entre dos característi- valores entre -1 y 1; -1 Y 1 indican per- cos utilizados en la literatura médica,
cas ordinales (nivel socioeconómico e fecta correlación entre los rangos de los haciendo énfasis en los aspectos prác-
historia de hipertensión). valores y no entre los valores mismos. ticos relativos a este tipo de aplicacio-
Para estimar la relación entre dos ca- nes.
racterísticas numéricas se usa el co- El coeficiente de correlación entre ni-
eficiente de correlación de Pearson, vel socioeconómico e historia de
REFERENCIAS
dado por hipertensión es 0.1324; por lo tanto
BIBLIOGRÁFICAS
n
puede decirse que no existe correlación
IJ Xi -)1x )( s. =u , ) entre las dos características. l. Nonnan GR, Streiner DL: Bioestadística.
i=l Barcelona: Mosby Doyma Libros: 1996.
Pxy Para comparar la variabilidad de una 2. Wassertheil-Smoller S. Biostatistics and
Na xa y
característica cuantitativa en grupos de Epidemiology. A primer for health
Este coeficiente toma valores entre -1 proffesionals, 2nd ed. New York: Springer
una característica nominal, es conve-
Verlag: 1995;2-6.
y 1, el-l describe una relación negati- niente usar el coeficiente de variación 3. Buck C. Popper's Philosophy for
va perfecta y el 1 describe una relación que estandariza la variación pues equi- Epidemiologists. International Journal of
positiva perfecta. El valor del coeficien- vale a la variación relativa al tamaño de Epidemiology 1975; 4:159-167.
te es independiente de las unidades de la media. Su fórmula es: 4. Ahlbom A. Biostatistics for
medida y está influenciado por valores Epidemiologists. Boca Raton: Lewis
Publishers: 1993;76-78.
extremos de la característica. Es im-
portante notar que correlación no im-
cv = () 100 5. Selvin S. Statistical Analysis of
J1 Epidemiologic Data. 2nd ed. New York:
plica causalidad (lO). Oxford University Press: 1996;93-94.
El coeficiente de correlación entre edad Los conceptos hasta aquí ilustrados 6. Dunn G, Everitt B. Clinical Biostatistics.
y peso de la madre es 0.254, lo cual comprenden los elementos básicos para An Introduction to Evidence-Based
indica que hay pobre correlación entre iniciar el proceso de formulación y Medicine.New York: Edward
Amold:1995;12-20.
estas variables por ser éste muy aleja- prueba de hipótesis. No es posible plan-
7. Dawson-Saunders B, Trapp RG.
do de 1 y de -1. tear adecuadamente el método estadís- Bioestadística Médica. México: Manual
tico para probar una hipótesis si antes Moderno: 1993 ;24-26.
Para estimar la relación entre dos ca- no se ha hecho una adecuada descrip- 8. Rosner B. Fundamentals of Biostatistics,
racterísticas ordinales se usa el coefi- ción de los datos, partiendo de una cla- 4thed. Belmont: Duxbury Press:1995;5-29.
ciente de correlación de Spearman, el ra definición de las variables que se 9. Daniel WW. Bioestadística. Base para el
análisis de las ciencias de la salud, 3ª ed.
cual considera el rango de las observa- están manejando.
México: Noriega Limusa: 1991 ;34-40.
ciones después de ser ordenadas, como 10. Altman DG. Practical Statistics for Medical
si fueran los valores reales de las ob- En una entrega posterior se presenta- Research. London: Chapman&
servaciones. Este coeficiente toma rán los principales métodos estadísti- HiIl:1991 ;277-298.
Nota: Tomado del libro "Estrategias de Investigación Medica Clínica "E Ardila , R Sanchez. J Echeverry Eds. ( en prensa).
236