Académique Documents
Professionnel Documents
Culture Documents
Metodologa de la
Investigacin
Mdulo
Estadstica Aplicada
Organizacin de datos
Actualmente los datos suelen ser analizados con ordenador, por lo que deben
ser almacenados en archivos informticos. Las bases de datos contienen datos
provenientes de un nmero de observaciones ms o menos grande respecto
de un conjunto de variables que puede llegar a ser bastante grande.
La generacin de una base de datos supone la codificacin previa de las
observaciones, la introduccin (grabacin) de los datos en archivos
informticos, la depuracin de los datos ya grabados (deteccin y tratamiento
de los errores de grabacin y valores faltantes), y eventualmente la realizacin
de transformaciones y tratamiento de ficheros que faciliten su posterior
tratamiento estadstico.
Codificacin
Codificar datos es asignar nmeros a las modalidades observadas o
registradas de las variables que constituyen la base de datos, as como asignar
cdigo (valor numrico) a los valores faltantes (aquellos que no han sido
registrados u observados). Ejemplo: Si la base de datos incluye la variable
Sexo, hay que asignar un nmero a las mujeres y otro a los hombres. Si se
trata de variables cuantitativas, hay que definir el nmero de decimales que van
a ser registrados.
Introduccin de datos
La primera cuestin a considerar es la disposicin las variables y las unidades
de observacin (generalmente los individuos de los que se recoge los datos).
Hay dos grandes disposiciones generales, la ms frecuente consiste en
disponer los casos (generalmente los individuos) por filas y las variables por
columnas.
Ejemplo:
La vista de datos tiene la siguiente apariencia: (Si no la ves bien pon el ratn en
la esquina inferior de la derecha, arrastra y haz ms grande la imagen. Puedes
hacer lo mismo desde la esquina a la izquierda para hacer la imagen ms
pequea)
Para introducir los datos hay que ir a la pgina "Vista de datos" e introducir los
datos desde las teclas numricas (para hacer efectiva la grabacin hay que
pulsar la tecla de introduccin para cada dato).
Depuracin
Depurar una base de datos consiste en detectar los valores anmalos y
tratarlos de manera que no distorsionen los resultados del anlisis de datos. El
tratamiento puede consistir en eliminarlos o asignarles nmeros de cdigo que
los identifiquen.
Transformaciones
Una vez grabados, los datos pueden ser transformados para facilitar su
anlisis. Algunas de las transformaciones ms corrientes consisten en
recodificar variables, definir nuevas variables a partir de variables existentes,
reemplazar los valores perdidos.