Vous êtes sur la page 1sur 6

Procedimientos descriptivos

M. A. Martinez-Gonzalez, J. de irala Estvez

2.1. Tipos de variables

2.1.1. Variables y bases de datos


La prctica totalidad de las tareas de investigacin exigen que se realice una
fase de recogida de datos. Estos datos son la materia prima de la Bioestadstica.
Los datos se resumen mediante una serie de nmeros que se calculan a partir
de los datos iniciales. A estos nuevos nmeros, que, de algn modo, extraen la
informacin importante que est en los datos, se les denomina ndices
estadsticos. A las cualidades o cantidades recogidas de cada individuo se les
llama variables, porque varan de un sujeto a otro (Aurman Y BLAND, 1999).
Resulta bsico e imprescindible saber distinguir los diferentes tipos de
variables que existen segn las escalas que se utilizan para medirlas. Conocer
esta distincin con claridad previene muchos de los errores ms frecuentes en la
aplicacin e interpretacin de los procedimientos que se irn estudiando en
otros captulos (GREENHALGH, 1997). Qu tipos de datos son los que se
suelen recoger?
Supongamos que se desea evaluar la efectividad de un programa dirigido a
conseguir que los fumadores dejen de fumar y que el estudio comprende a 200
sujetos, que fueron asignados al azar (aleatoriamente) bien a recibir un
programa especial de intervencin o bien a no recibirlo (grupo control). De cada
sujeto se recogern entre otros los datos presentados en la Tabla 2.1.
Lo que se presenta en la Tabla 2.1 viene a ser como un "diccionario" o
"cabecera" de una base de datos. Incluye la informacin pertinente para
comprender adecuadamente lo que significara en adelante cada nmero en esa
base de datos. A la derecha entre parntesis se ha indicado el nombre que se le
va a dar a cada variable. Junto con la definicin de cada una, aparecen adems
los cdigos que puede tomar cada dato de esta variable.
As, por ejemplo, una variable es el sexo y otra la edad. Se suele buscar un
nombre abreviado (no ms de ocho letras) para referirse a cada variable, as, con

ocho o menos letras, el ordenador guarda el nombre siempre igual. Por ejemplo
"SEXO", "EDAD". "INICIO". etc. Los datos se suelen guardar en un fichero que
contiene filas y columnas.
Cada fila suele corresponder a un individuo y cada columna a una variable. Al
conjunto completo de las variables de todos los individuos se le llama base de
datos. La Tabla 2.2 recoge una base de datos.
Tabla 2.1. Ejemplo de variables contenidas en una base de datos
(diccionario o "cabecera" de la base de datos)

Es evidente que encontrar el nmero 1 en la variable "SEXO" no tiene el


mismo significado que encontrar ese mismo nmero en la variable "NUMCIG".
En el caso de la variable "SEXO", el nmero 1 es un indicador o una especie de
nombre que le damos a todos los individuos de sexo masculino y que se llama
cdigo (viene a ser como una "etiqueta"). En cambio, en la variable "NUMCIG" el
numero 1 sera una cantidad real, ya que correspondera exactamente a fumar 1
cigarrillo al da. Por eso decimos que la variable "SEXO" es una variable
cualitativa o categrica, en cambio la variable "NUMCIG" es una variable
cuantitativa. Las variables cualitativas o categricas estn "medidas" en una escala
nominal, aunque se les asignen cdigos numricos, los nmeros son en realidad
una "traduccin" de sus nombres. La escala de las variables cuantitativas
corresponde a la de los valores reales de los nmeros que toman.

Tabla 2.2. Base de datos del programa


(contenido de la base de datos)

de abandono del tabaco

Una diferencia fundamental entre ambas escalas es que encontrar, por


ejemplo, el nmero 20 en la columna de la variable "NUMCIG corresponde a
un valor que es exactamente la mitad de cuando encontramos el nmero 40 y
que tambin vale exactamente el doble que cuando encontramos el nmero 10.
En cambio, cuando figura el nmero 2 en la variable "SEXO" no supone que una
mujer valga el doble que un varn, pues hubiese dado lo mismo codificar a los
hombres con un 1 y a las mujeres con un 0.
Otras variables de esta base de datos como "EDAD", "PESO" y "TALLA"
tambin son cuantitativas, y, por lo tanto, los datos que aparecen en ellas
corresponden realmente a nmeros. Pero tambin hay ms variables cualitativas
adems de "SEXO", como son, por ejemplo las variables "GRUPO" y "ENFERM".
A su vez, dentro de las variables cuantitativas o realmente numricas
encontramos dos posibilidades: las que admiten cualquier valor dentro de un
intervalo (continuas), sin ms restriccin que los aparatos de medida, y las que
solo pueden tomar nmeros enteros (discretas). El "PESO" o la "TALLA" son
variables cuantitativas continuas, ya que un individuo puede tener un peso que
tome cualquier valor entre 80 y 81 kg, pudiendo pesar, por ejemplo, realmente
80,3333693 kg y lo mismo podra decirse de la talla. En cambio, otras variables
como "INTENTOS" solo pueden tomar nmeros enteros. Nadie puede
realmente haber intentado dejar de fumar 1,333333693 veces (entindase la
coma como un separador de decimales, no de millares, ni de millones). A estas
otras variables que solo pueden tomar valores numricos aislados se les llama
variables cuantitativas discretas.
Pero todava nos queda otro tipo de variables que estn en una situacin
intermedia, en una especie de tierra de nadie. Se trata de variables como el grado

de disnea ("DISNEA") o el inters en dejar de fumar ("INTERES). En este tipo de


variables se puede decir que un grado 2 de disnea es ms intenso que un grado
1, pero nunca puede interpretarse como que una disnea grado 2 sea exactamente
el doble de intensa que la disnea de grado 1. Este tipo de variables se llaman
ordinales, y su uso es muy frecuente en medicina. Por ejemplo, se puede
clasificar el dolor en ausente/ leve/ moderado/intenso y darle respectivamente
los cdigos 0/1/2/3 a cada categora.
Tambin se puede "medir" as la respuesta a un tratamiento asignndole,
por ejemplo, el cdigo -1 a los que empeoran, el 0 a los que quedan igual, el +1
a los que mejoran algo y el +2 a los que mejoran mucho. Otro campo donde
suelen utilizarse tambin variables ordinales es el de las determinaciones
analticas, y as, por ejemplo, para evaluar si un paciente tiene glucosa en orina
("glucosuria") se puede cuantificar: 0 / + / ++ /+++
2.1.2. Variables cualitativas o categricas nominales
Se denominan as aquellas cuyos posibles valores se refieren a una
caracterstica o cualidad que la persona posee o no posee. Los posibles valores
son excluyentes, lo cual se observa claramente en variables como el sexo, ser
asignado a un grupo de tratamiento, haber tenido un infarto... y todas aquellas
en las cuales la respuesta se limita a un grupo o clase, o simplemente pueda ser
un s o un no.
Para su medicin usamos escalas nominales, donde los valores son
identificados con palabras. Una escala nominal solo permite clasificar, pero no
ordenar o jerarquizar. Solo permiten operaciones de igualdad o desigualdad.
Esto quiere decir que si representamos los posibles valores que puede tomar
una escala nominal por letras (A, B, C,...), podemos decir que A es distinta de B,
pero no que es mayor o menor. Si hay una posible gradacin o jerarquizacin
de los valores o categoras (unos son mayores que otros) entonces la escala no es
nominal sino ordinal (vase ms abajo).
A veces los posibles valores de una variable cualitativa o categrica pueden
estar predeterminados de antemano, asignando un cdigo numrico ("etiqueta")
a cada categora. A este proceso se le llama codificacin.
En general, este tipo de variables slo permiten operaciones de igualdad o
desigualdad. Distinguimos dos tipos de variables cualitativas o categricas
nominales:

Dicotmicas o
hombre/mujer.

binarias:

sano/enfermo,

expuesto/no

expuesto,

Politmicas (con varias categoras): grupo sanguneo (A/B/0/AB), cierto

tipo de tratamiento (A/B/C).

2.1.3. Variables cualitativas ordinales


Son aquellas cuyos posibles valores se encuentran jerarquizados y
ordenados. El tipo de escala utilizado se denomina ordinal. Se pueden realizar
con estas variables no solo operaciones de igualdad y desigualdad, sino
tambin operaciones de orden (ordenar los diferentes valores). Ejemplos de
estas variables seran el grado de disnea, el grado de dolor, la intensidad del
hbito tabquico medida en la siguiente escala: nunca fumador / ex fumador /
fumador activo.
2.1.4. Variables cuantitativas
Hablamos de variables cuantitativas cuando los nmeros utilizados para
codificarlas realmente equivalen con exactitud a los verdaderos datos. Los datos
son realmente numricos. Existen los siguientes tipos de variables cuantitativas:
Discretas: solo pueden tomar valores numricos aislados. Sus valores son
finitos y coinciden con nmeros enteros. Ejemplos dares son: nmero de
hijos, nmero de intervenciones previas, nmero de intentos para dejar de
fumar... Permiten operaciones de igualdad-desigualdad y orden ("rango"),
pero tambin operaciones algebraicas.
Continuas: son numricas y adems pueden tericamente valer cualquier
cantidad intermedia entre dos posibles valores. Es decir, tericamente
podran tomar valores con un nmero de decimales que tiende al infinito.
Permiten todas las operaciones hasta ahora comentadas, y se miden en
escala de razn. Ejemplos: edad, peso, talla, tensin arterial... Sin embargo, en
la prctica todos los datos que tericamente son continuos acaban
tratndose como discretos porque los instrumentos de medida son
limitados.

2.1.5. Categorizacin de una variable cuantitativa


Puede realizarse una transformacin de una variable cuantitativa y pasarla a
una escala ordinal, creando as unos datos hbridos entre ordinales y
cuantitativos. A este proceso se le suele llamar categorizacin de una variable.
Consiste en que una determinada variable que inicialmente posea
caractersticas de cuantitativa porque sus valores estaban expresados en
nmeros, se pasa a considerar como cualitativa ordinal (a incluso como nominal
en cierto sentido), de modo que los valores individuales se colapsan formando
solo unos pocos grupos o categoras que engloban a un rango de los valores
anteriores. Por ejemplo, si en la base de datos presentada al principio de este
captulo se quisiera categorizar el hbito tabquico, podramos crear tres
categoras, como muestra la Tabla 2.3:
Tabla 2.3. Ejemplo de transformacin de una variable cuantitativa
(nmero de cigarrillos/da) en una variable cualitativa ordinal
(categorizacin).

Variable Antigua = NUMCIG

Variable nueva = FUMADOR

1-19
20-39
40-maximo

1
2
3

Se
obtendr una nueva variable FUMADOR" que solo contiene tres posibles valores (1, 2 6 3). Tngase en cuenta que en el ejemplo utilizado todos eran
fumadores. Valdr 1 para los que fuman menos de 20 cigarrillos, 2 para los que
fuman entre 20 y 39, y valdr 3 para los que fuman 40 o ms. Hemos pasado de
una escala de razn' a otra de tipo ordinal. Este proceso, aunque a veces es
prctico, siempre supone perder informacin y, desde luego, nunca se debe
recoger la informacin en una escala ordinal si se puede hacer en una escala de
razn. Es mejor recoger siempre las variables con la mxima precisin y detalle
posibles (cuanto ms "cuantitativas", mejor) y solo despus categorizar si
resulta conveniente por el tipo de anlisis estadstico que se desee realizar.
En la tabla 2.4. Se resumen los distintos tipos de variables.
Tabla 2.4. Tipos de variables.
Tipo de variable
Cualitativa nominal

Utilidad: sirve para


Clasificar

Cualitativa ordinal

Jerarquizar

Cuantitativa discreta
Cuantitativa continua

Contar
Medir

Vous aimerez peut-être aussi