Vous êtes sur la page 1sur 6

INTRODUCCIN AL ANLISIS DE DATOS

TEMA 1: CONCEPTOS
EL

BSICOS Y ORGANIZACIN DE DATOS

ANLISIS DE DATOS

El anlisis de datos en psicologa es una herramienta metodolgica de


carcter bsicamente estadstico. Antes de empezar, hay que tener en
cuenta una serie de conceptos bsicos:

LAS

Estadstica: se ocupa de la sistematizacin, recogida, ordenacin y


presentacin de los datos referentes a un fenmeno que presenta
variabilidad o incertidumbre para su estudio metdico con objeto de
hacer previsiones sobre los mismos, tomar decisiones u obtener
conclusiones. Hay dos tipos:
o Estadstica descriptiva. Incluye los procedimientos dirigidos
a la organizacin y descripcin de un conjunto de datos.
o Estadstica inferencial. Est orientada a hacer inferencias
sobre una poblacin a partir de las caractersticas conocidas de
una muestra obtenida de ella.
Poblacin: conjunto de todos los elementos que cumplen una
determinada caracterstica objeto de estudio.
Muestra: subconjunto de una poblacin representativo de la misma.
Para que lo sea, debe seleccionarse mediante mtodos de muestreo
probabilstico, dando como resultado una muestra probabilstica.
Parmetro: propiedad descriptiva de una poblacin.
Estadstico: propiedad descriptiva de una muestra.

ESCALAS DE MEDIDA

La medicin rigurosa de las variables psicolgicas constituye el paso previo


e ineludible para cualquier uso posterior que se vaya a hacer de ellas. La
medicin es el proceso por el cual se asignan nmeros a objetos o
caractersticas (propiedades de los objetos o personas que se desea
estudiar) segn determinadas reglas. Si tenemos en cuenta que el nmero y
tipo de modalidades (distintas formas de presentarse una caracterstica) de
las distintas caractersticas puede ser muy variado, no es de extraar que
en cada caso se use un tipo de escala distinta. Esas escalas son:

Nominal: consiste en la asignacin arbitraria de nmeros o smbolos


a cada una de las modalidades de una caracterstica. Empleando esta
escala tan slo se pueden inferir relaciones de igualdad o desigualdad
entre objetos respecto a una caracterstica, lo que no implica ninguna
otra propiedad.

INTRODUCCIN AL ANLISIS DE DATOS

LAS

Ordinal: los nmeros indican las posiciones relativas de los objetos


respecto a un determinado atributo, es decir, se puede establecer
una ordenacin creciente o decreciente de los objetos o hechos que
se miden. Por tanto, adems de indicar que algo es distinto de algo,
indica tambin si es mayor o menor, pero no se plantea una distancia
entre unas medidas y otras, pues no se usan unidades de medida.
Intervalo: lo que caracteriza a esta escala es la existencia de una
unidad de medicin comn y constante. Los nmeros asignados
representan, por tanto, el grado en el que un objeto posee el atributo
estudiado, permitiendo ordenarlos con respecto a l y, adems,
calcular la distancia numrica exacta que hay entre ellos. No existe
un cero absoluto ya que el origen de medida es arbitrario.
Razn: este nivel aade a las medidas de intervalo la existencia de
un cero absoluto que indica la ausencia total de la caracterstica que
se est estudiando. Gracias a esto, tambin podemos establecer
igualdad o desigualdad de razones.

VARIABLES

Una variable es una representacin numrica de una caracterstica que


presenta ms de una modalidad (valor) de un conjunto determinado. Si slo
presentase una modalidad, esa caracterstica sera una constante. Hay tres
tipos de variables:

Cualitativas: a este tipo pertenecen las variables nominales (sexo,


estado civil, raza). En funcin del nmero de categoras que
presentan, se clasifican en dicotmicas (presentan dos modalidades)
y politmicas (presentan ms de dos modalidades). Tambin pueden
dicotomizarse o politomizarse variables que podran medirse en un
nivel superior para simplificar el trabajo.
Cuasicuantitativas: a este tipo pertenecen las variables ordinales
(dureza, grado de satisfaccin, posicin en un ranquin).
Cuantitativas: a este tipo pertenecen las variables de intervalo y de
razn. En funcin de los valores numricos que se les pueden asignar,
se clasifican en continuas (dados dos valores cualesquiera, siempre
puede encontrarse uno intermedio) y discretas (dados dos valores
consecutivos, no existe uno intermedio).

ORGANIZACIN

DE DATOS

Matriz de casos por variables


Una vez recogidos los datos de un estudio, hay que organizar la
informacin para poder describir el fenmeno estudiado en una tabla,
lo que constituye el primer paso en el anlisis de datos de cualquier

INTRODUCCIN AL ANLISIS DE DATOS


investigacin. Cada fila de la tabla es ocupada por un caso, mientras
que las variables registradas ocupan las columnas. Esta tabla se
denomina matriz de casos por variables. Habitualmente se
realizan distribuciones de frecuencias (representacin de la
relacin entre un conjunto de medidas exhaustivas y mutuamente
excluyentes y la frecuencia de cada una de ellas) de las variables de
inters para facilitar la visualizacin de los datos, realizar grficos de
ellos y calcular estadsticos.

Distribucin de frecuencias: variable cualitativa


Para construir una tabla de distribucin de frecuencias bsica hay que
contar el nmero de casos que hay en cada valor de cada variable,
aunque se pueden aadir otros datos.
X
Hombre
Mujer
Total

ni
24
16
n=40

pi
0,6
0,4
1

Pi
60
40
100

En la primera columna de la tabla se especifican los valores que


puede tomar la variable (X). En la segunda columna aparece la
frecuencia absoluta (ni), es decir, el nmero de veces que
aparecen esos valores. La suma de las frecuencias para todos los
valores de la variable representa el total de la muestra (n). En la
tercera columna se muestra la frecuencia relativa (pi) o proporcin,
que es el cociente de la frecuencia absoluta entre el tamao de la
muestra (pi = ni/n); la suma de todas las proporciones ser 1. La
cuarta columna muestra valores en trmino de porcentaje (Pi), que
es el resultado de multiplicar los valores de la frecuencia relativa por
cien (Pi = pi x 100); la suma de todos los valores porcentuales ser,
por tanto, 100.

Distribucin de frecuencias y representacin grfica: variable


cuasicuantitativa y cuantitativa de modalidades reducidas
X
Primaria
ESO
FP o
bachillera
to
Diplomatu
ra
Licenciatu

ni
13
11
7

pi
0,32
0,28
0,18

Pi
32
28
18

na
13
24
31

pa
0,32
0,6
0,78

Pa
32
60
78

0,1

10

35

0,88

88

0,12

12

40

100

INTRODUCCIN AL ANLISIS DE DATOS


ra
Total

40

100

Al tratarse de una variable ordinal, los valores de la variable (X)


deben colocarse obligatoriamente en orden ascendente o
descendente. La frecuencia absoluta acumulada (na) indica el
nmero de veces que se repite la modalidad ms las modalidades
inferiores. Las proporciones acumuladas (pa) son el cociente entre
la frecuencia absoluta acumulada de cada modalidad y el total de
observaciones (pa = na/n). Por ltimo, los porcentajes acumulados
(Pa) son el resultado de multiplicar las proporciones acumuladas por
cien (Pa = pa x 100).

Distribucin de frecuencias y representacin grfica: variable


cuantitativa
Para casos de variables como la edad, que pueden adquirir multitud
de valores distintos, se procede a la agrupacin en intervalos para un
mejor manejo de los datos. Pese a todo, no en todas las distribuciones
de frecuencias cuantitativas es necesario usar intervalos (caso de las
que cuentan con pocas modalidades). Hay que tener en cuenta que,
al usar intervalos, se pierde informacin.
Lm.
Aparentes
26-35
36-45
46-55
56-65
66-75

Lm. Exactos

Punto medio

ni

25,5-35,5
35,5-45,5
45,5-55,5
55,5-65,5
65,5-75,5

30,5
40,5
50,5
60,5
70,5

10
3
13
7
7
40

En la primera columna de cada fila aparece un intervalo de valores.


Estos intervalos constituyen los lmites aparentes, virtuales o
informados del intervalo. Para cada intervalo existe un lmite inferior
y uno superior. Hay que considerar que entre el lmite superior de un
intervalo y el inferior del siguiente (o viceversa) puede haber valores
intermedios, por lo que la columna de lmites exactos o reales (lm.
exacto = valor informado 0,5 x I, donde I = unidad del instrumento
de medida) muestra donde acaba el rango que abarca uno
exactamente y dnde empieza el que abarca el siguiente. El punto
medio de los intervalos es la semisuma de los lmites exactos o de
los lmites aparentes. En la ltima columna aparece la frecuencia
absoluta (ni) de cada intervalo. La amplitud de un intervalo es la
diferencia entre el lmite exacto superior y el lmite exacto inferior.

INTRODUCCIN AL ANLISIS DE DATOS

Representaciones grficas
Un grfico es una forma rpida e intuitiva de visualizar una
distribucin de frecuencias. Los hay de muchos tipos, siendo unos
ms apropiados que otros en relacin al nmero y al nivel de medida
de la variable que queremos representar.
Para representaciones grficas de una variable se utilizan:
o

Diagrama de barras: se suele utilizar para variables


nominales, ordinales y cuantitativas discretas (para estas dos
ltimas tambin se puede hacer un diagrama de barras
acumulativo con las frecuencias acumuladas). Los valores de
las variables se colocan en el eje de abscisas (horizontal), y las
frecuencias, en el de ordenadas (vertical). Sobre cada
modalidad de la variable se traza un rectngulo cuya altura
coincide con el valor de la frecuencia, ya sea absoluta o
relativa.
Diagrama de sectores: se usa para variables cualitativas y
cuasicuantitativas, y es una representacin en forma de crculo
dividido en secciones cuya superficie es proporcional a la
frecuencia de la modalidad correspondiente. Es habitual
sealar el porcentaje de cada valor de la variable.
Pictograma: se utilizan para variables cualitativas, y expresan
mediante dibujos, smbolos, etc. las frecuencias de las
modalidades de la variable. En estos grficos se representan a
escalas diferentes un mismo dibujo de modo que el rea de
cada uno sea proporcional a la frecuencia.
Histograma: se utiliza para variables cuantitativas continuas
con datos agrupados en intervalos. En el eje de abscisas se
colocan los lmites exactos de cada uno de los intervalos en los
que se han agrupado los datos, o los puntos medios de los
intervalos, y sobre ellos se levantan rectngulos, como se haca
con el diagrama de barras, pero teniendo en cuenta que la
base de cada barra coincide con los lmites reales del intervalo
y que el orden no es arbitrario. Este grfico se puede construir
para frecuencias absolutas o relativas, individuales o
acumuladas.
Polgono de frecuencias: difiere del histograma en que se
traza uniendo los puntos medios de cada intervalo mediante
una lnea.

Para representaciones grficas de dos variables, se utilizan:

INTRODUCCIN AL ANLISIS DE DATOS


o

Diagrama de barras conjunto: apropiado cuando al menos


una de las variables es cualitativa. Si ambas son cualitativas,
conviene realizar una tabla de doble entrada donde se
enfrenten las dos variables, como esta:
Sexo /
Estado civil
Casado
Divorciado
Soltero
Viudo
Total

Hombre

Mujer

Total

12
4
4
4
24

12
2
2
0
16

24
6
6
4
40

En el eje de abscisas se sita una de las variables, y junto a


ella, o sobre ella, con otro color, se coloca la otra, ofreciendo
una comparativa visual proporcionada.
o

Diagrama de dispersin: se utiliza en el caso de dos


variables cuantitativas, dando la idea de una posible relacin
lineal entre ambas. Se sita una de las variables en el eje de
abscisas y otra en el de ordenadas. Para cada par de datos se
localiza la interseccin entre ambas variables y en ella se
coloca un punto.

Distribucin de frecuencias: variable cualitativa


Las distribuciones de frecuencia tienen tres propiedades bsicas:
o

Tendencia central. Se refiere al valor en el que se centra una


distribucin de frecuencias particular. Esta magnitud general
puede cuantificarse mediante unos ndices conocidos como
estadsticos de tendencia central o promedio.
Variabilidad o dispersin. Se refiere al grado de
concentracin de las observaciones en torno al promedio. Una
distribucin de frecuencias ser homognea o poco variable si
los datos difieren poco entre s, y heterognea o muy variable
si los datos se dispersan mucho con respecto al promedio. Esta
propiedad es independiente de la anterior.
Asimetra o sesgo. Se refiere al grado en que los datos se
reparten equilibradamente por encima y por debajo de la
tendencia central. Una distribucin ser simtrica si al dividirla
en dos a la altura de la media, las dos mitades se superponen,
ser asimtrica positiva si la mayor concentracin de
puntuaciones se produce en la parte baja de la escala y ser
asimtrica negativa si se produce en la parte alta.