Vous êtes sur la page 1sur 7

Especializacin

Metodologa de la
Investigacin

Mdulo
Estadstica Aplicada

Distribucin de frecuencia para


datos agrupados

Organizacin de datos
Actualmente los datos suelen ser analizados con ordenador, por lo que deben
ser almacenados en archivos informticos. Las bases de datos contienen datos
provenientes de un nmero de observaciones ms o menos grande respecto
de un conjunto de variables que puede llegar a ser bastante grande.
La generacin de una base de datos supone la codificacin previa de las
observaciones, la introduccin (grabacin) de los datos en archivos
informticos, la depuracin de los datos ya grabados (deteccin y tratamiento
de los errores de grabacin y valores faltantes), y eventualmente la realizacin
de transformaciones y tratamiento de ficheros que faciliten su posterior
tratamiento estadstico.

Codificacin
Codificar datos es asignar nmeros a las modalidades observadas o
registradas de las variables que constituyen la base de datos, as como asignar
cdigo (valor numrico) a los valores faltantes (aquellos que no han sido
registrados u observados). Ejemplo: Si la base de datos incluye la variable
Sexo, hay que asignar un nmero a las mujeres y otro a los hombres. Si se
trata de variables cuantitativas, hay que definir el nmero de decimales que van
a ser registrados.

Introduccin de datos
La primera cuestin a considerar es la disposicin las variables y las unidades
de observacin (generalmente los individuos de los que se recoge los datos).
Hay dos grandes disposiciones generales, la ms frecuente consiste en
disponer los casos (generalmente los individuos) por filas y las variables por
columnas.

Ejemplo:

La disposicin anterior es tpica de los diseos transversales o estticos (los


datos representan observaciones realizadas en un solo momento temporal). La
siguiente disposicin es utilizada habitualmente para diseos longitudinales (los
datos son registrados a lo largo de intervalos temporales):

En la tabla anterior, las filas representan sujetos y las columnas (cigseg3,


cigseg6 y cigseg12, cigfin) contienen el nmero de cigarrillos consumidos
antes, durante y al acabar una terapia de tabaquismo.

Si el diseo es transversal pondremos las variables por columnas (una variable


por columna) y si hay ms de un grupo hay que decidir entre dos posibilidades
en funcin de los anlisis que queremos hacer: La primera consiste en
introducir los datos de los grupos en columnas (una para los datos de cada
grupo) y la segunda posibilidad consiste en introducir los datos de todos los
grupos en la misma columna y definir una nueva variable donde introducimos
los cdigo de identificacin de los grupos. Si el diseo es longitudinal lo
habitual es que en las columnas representen los momentos temporales en que
se observa las variables.
El paso siguiente consiste en introducir las caractersticas de variables y datos.
En SPSS (programa informtico similar a Excel) hay que activar la ventana
"Vista de variables" clicando en la parte inferior de la pantalla. A continuacin
hay que introducir las caractersticas de cada variable en la fila: 1) Ajustar
decimales. 2) Etiquetar las variables (en su caso). 4) Etiquetar los valores de
las variables (en su caso). 5) Definir valores perdidos (en su caso). 5) Sealar
la escala de medida.
Ejemplo: Generacin de la pgina "Vista de variables" para una base de datos
SPSS (programa informtico similar a Excel) de la siguiente encuesta:

La vista de datos tiene la siguiente apariencia: (Si no la ves bien pon el ratn en
la esquina inferior de la derecha, arrastra y haz ms grande la imagen. Puedes
hacer lo mismo desde la esquina a la izquierda para hacer la imagen ms
pequea)

Para introducir los datos hay que ir a la pgina "Vista de datos" e introducir los
datos desde las teclas numricas (para hacer efectiva la grabacin hay que
pulsar la tecla de introduccin para cada dato).

Depuracin
Depurar una base de datos consiste en detectar los valores anmalos y
tratarlos de manera que no distorsionen los resultados del anlisis de datos. El
tratamiento puede consistir en eliminarlos o asignarles nmeros de cdigo que
los identifiquen.

Transformaciones
Una vez grabados, los datos pueden ser transformados para facilitar su
anlisis. Algunas de las transformaciones ms corrientes consisten en
recodificar variables, definir nuevas variables a partir de variables existentes,
reemplazar los valores perdidos.

Distribucin de Frecuencia para datos Agrupados


Ejemplo: Consideremos el siguiente grupo de datos:

La distribucin de frecuencias es:

La reduccin de datos mediante el agrupamiento en frecuencias no facilita su


interpretacin: La tabla es demasiado grande. Para reducir el tamao de la
tabla agrupamos los valores en intervalos, y las frecuencias son las de los
conjuntos de valores incluidos en los intervalos:
Distribucin de frecuencias agrupados en intervalos

Ahora es ms sencillo interpretar los datos. Por ejemplo, podemos apreciar


inmediatamente que el intervalo con mayor nmero de datos es el 34-39, o que
el 75% de los datos tiene valor inferior a 46.

Este tipo de tabla es denominado "tabla de datos agrupados en intervalos".

Elementos bsicos de las tablas de intervalos:


Intervalo: Cada uno de los grupos de valores de la variable que ocupan una
fila en una distribucin de frecuencias
Lmites aparentes: Valores mayor y menor del intervalo que son observados
en la tabla. Dependen de la precisin del instrumento de medida. En el
ejemplo, los lmites aparentes del intervalo con mayor nmero de frecuencias
son 34 y 39.
Lmites exactos: Valores mximo y mnimo del intervalo que podran medirse
si se contara con un instrumento de precisin perfecta. En el intervalo 34-39,
estos lmites son 33.5 y 39.5
Punto medio del intervalo (Mc. Marca de clase): Suma de los lmites dividido
por dos. Mc del intervalo del ejemplo= 36.5
Amplitud del intervalo: Diferencia entre el lmite exacto superior y el lmite
exacto inferior. En el ejemplo es igual a 6.

Vous aimerez peut-être aussi