Académique Documents
Professionnel Documents
Culture Documents
Autores :
LIMA PERU
2011
INTRODUCCION
Actualmente las distintas Tcnicas para el anlisis de Datos aplicando modelos Estadsticos son
instrumentos empleados por los investigadores en las diferentes reas cientficas. Especialmente en las
Ciencias de la Conducta que en los ltimos aos han ido aumentando y, ms concretamente, en la Carrera
de Psicologa.
Las reas de la Psicologa ms utilizadas son: Psicologa experimental, Psicologa del aprendizaje,
Psicologa educacional, Psicologa social, Psicologa Organizacional etc. Hasta en la Psicologa clnica que
exige un dominio profundo de las tcnicas estadsticas.
Al terminar el curso, el alumno aprender el manejo y la aplicacin de las diversas tcnicas de anlisis mas
utilizadas que puede aplicar al realizar estudios de casos, as como tambin desarrollara un esptiru critico
ya que el mismo deducir y decidir cual es la tcnica de anlisis ideal en una determinada situacin.
Cabe sealar, para llevar a cabo el Curso de Tcnicas Multivariadas de Anlisis, es necesario contar con
una calculadora cientfica y mas que todo con los programas de Microsoft Excel y el SPSS, para trabajar
con las tcnicas y realizar el anlisis de resultados.
Los Autores
INDICE
CAPTULO I ANLISIS E INTERPRETACIN DE TABLA DE FRECUENCIAS
1. Definicin de de las tcnicas multivariadas de anlisis.
2. Tipos de tcnicas multivariadas.
3. Procedimiento previo al anlisis
4. Diseo y clculos de una tabla de frecuencia
5. Desarrollo de casos y ejercicios prcticos.
AUTOEVALUACION
CAPTULO II ANLISIS E INTERPRETACIN DE DATOS CON EXCEL
1. Excel como herramienta para el diseo y clculos de tabla de frecuencias.
2. Anlisis comparativo de los intervalos de una clase a travs del Histograma de Frecuencias.
3. Anlisis e interpretacin de representaciones Grficas: Polgono de Frecuencias.
4. Anlisis Porcentual de una muestra a travs de grficos circulares en MS Excel.
5. Desarrollo de casos y ejercicios prcticos.
AUTOEVALUACION
CAPTULO III MEDIDAS DE TENDENCIA CENTRAL
1. Aplicacin de la media aritmtica para obtener el promedio de una muestra.
2. Aplicacin de la mediana que divide la muestra en la mitad.
3. Aplicacin de la moda para obtener el dato que ms se repite en una muestra.
4. Desarrollo de casos y ejercicios prcticos.
AUTOEVALUACION
CAPTULO IV MANEJO DE VARIABLES EN UNA INVESTIGACIN
1. SPSS como herramienta de anlisis e interpretacin y entorno de trabajo de SPSS.
2. Definicin de variables independientes y dependientes e ingreso de datos.
3. Tratamiento de los datos o valores perdidos.
4. Medidas de posicin: cuartiles, deciles y percentiles.
5. Mediadas de dispersin: desviacin estndar y varianza.
6. Coeficiente de Variabilidad.
7. Asimetra y Curtosis.
8. Desarrollo de casos y ejercicios prcticos.
AUTOEVALUACION
CAPTULO V GENERACIN DE CLCULOS Y ANLISIS DE RESULTADOS
1. Generacin de clculos con la calculadora de SPSS.
2. Clculos de coeficiente de asimetra.
3. Desarrollo de casos y ejercicios prcticos
4. Transformacin de datos.
5. Recodificacin de variables o segmentacin de rangos.
6. Ordenar y agrupar casos.
AUTOEVALUACION
CAPTULO VI TCNICAS DE ANLISIS MULTIVARIADAS
1. Anlisis de Regresin Lineal Simple.
2. Anlisis de Regresin Lineal Mltiple.
3. Anova de un Factor.
4. Anlisis Factorial.
5. Desarrollo de casos y ejercicios prcticos.
AUTOEVALUACION
CAPTULO I
ANLISIS E INTERPRETACIN DE TABLA DE FRECUENCIAS
CONTENIDO:
1.
2.
3.
4.
5.
COMPETENCIAS:
1. Conceptuales: conocer la definicin y tipos de tcnicas de anlisis.
2. Procedimentales: aplicar los pasos previos de acomodo de datos antes del anlisis.
3. Actitudinales: identificar las tcnicas de anlisis como herramienta de investigacin.
encuentran en su entorno familiar y en los contextos en los que viven, las condiciones de proteccin y los
modelos que necesitan para desarrollarse.
CASO 1:
En el colegio de nivel primaria Mi mundo mgico se ha tomado un test a 50 nios (tamao de la muestra n),
para determinar la capacidad de resiliencia, en la tabla se muestran los puntajes obtenidos.
Se necesita construir una tabla de distribucin de frecuencias.
73
100
104
91
96
102
87
112
84
100
90
104
90
93
104
97
85
98
88
96
98
90
101
97
101
106
95
94
103
75
108
80
105
84
93
93
98
98
105
82
87
82
93
92
100
88
98
82
114
95
I = 6 * 7
I = 42
d) Verificamos el exceso con la siguiente formula:
exceso = I I
Reemplazando:
exceso = 42 42
exceso = 0
Para este caso no existe ningn exceso, por lo que comenzamos a elaborar la matriz de la
distribucin de frecuencias.
NOTA: de haber un exceso, la mitad entera mayor del exceso, se le suma al valor mximo de los datos
(Vmax), obteniendo as un nuevo Vmax, el cual se usara en la construccin del intervalo y la mitad entera
menor del exceso, se le resta al valor mnimo de los datos (Vmin), obteniendo un nuevo Vmin, el cual se
usara en la construccin de los intervalos.
3 paso: Construir los intervalos.
Tomamos el valor mnimo de los datos (Vmin) que para nuestro caso es 73 y le sumamos la amplitud del
intervalo que hallamos anteriormente (C), es decir:
Vmin + C 73 + 6 = 79
De este modo obtenemos el primer intervalo: 73 79
Para el segundo intervalo tenemos como limite inferior 79 al cual le sumamos los 6 de amplitud (79 + 6 = 85)
y obtenemos el limite superior 85. Y as sucesivamente.
Intervalos
73 79
79 85
85 91
91 97
97 103
103 109
109 115
4 paso: Marca de clase.
Consiste en hacer que cada uno de los datos que se hallan dentro de un mismo intervalo, estn
representados por un mismo valor, esto se denomina marca de clase, las cuales se obtienen promediando
los extremos de cada intervalo.
Para el primer intervalo ser: (73 + 79) / 2 = 76
Para el segundo intervalo ser: (79 + 85) / 2 = 82
Para el tercer intervalo ser: (85 + 91) / 2 = 88
Y as sucesivamente.
5 paso: Conteo y Frecuencia de los datos.
Intervalos
61
79
73
65
50
46
50
63
70
61
64
53
60
43
77
80
90
64
45
80
72
64
40
75
69
97
54
58
60
60
62
64
49
52
65
47
54
62
81
43
57
68
61
59
52
67
60
62
63
64
64
64
64
65
65
67
68
69
70
70
72
73
75
77
79
80
80
81
90
97
49
50
50
51
52
52
53
54
54
54
57
58
59
59
60
60
60
60
60
60
61
61
61
62
Lo caracterstico es que se produzca una recuperacin completa entre los episodios aislados. A diferencia
de otros trastornos del humor afectivos- la incidencia en ambos sexos es aproximadamente la misma. Los
episodios de mana comienzan normalmente de manera brusca y se prolongan durante un perodo de
tiempo que oscila entre dos semanas y cuarto a cinco meses (la duracin mediana es de cuatro meses). Las
depresiones tienden a durar ms (su duracin media es de 6 meses), aunque rara vez se prolongan ms de
un ao, excepto en personas de edad avanzada.
Ambos tipos de episodios sobrevienen a menudo a raz de acontecimientos estresantes u otros traumas
psicolgicos, aunque su presencia o ausencia no es esencial para el diagnstico. El primer episodio puede
presentarse a cualquier edad, desde la infancia hasta la senectud. La frecuencia de los episodios y la forma
de las recadas y remisiones pueden ser muy variables, aunque las remisiones tienden a ser ms cortas y
las depresiones ms frecuentes y prolongadas al sobrepasar la edad media de la vida.
Ejercicio N2:
La clnica de salud mental Hideyo Noguchi evalu a 42 de sus pacientes que sufren de trastorno bipolar y se
encuentran hospitalizados en el rea de psiquiatra, para medir el nivel de depresin que alcanza cada uno
de ellos. Construir la tabla de distribucin de frecuencias:
39
69
53
52
42
45
55
34
47
61
53
72
46
52
52
55
63
56
35
48
38
43
47
50
48
50
62
51
46
63
58
55
65
58
39
51
49
43
59
48
58
54
Inteligencias Mltiples
Luego de una investigacin cognitiva, da fe de la medida en que los estudiantes poseen diferentes
mentalidades y por ello aprenden, memorizan, realizan y comprenden de modos diferentes. Existen
suficientes pruebas positivas de que algunas personas adoptan una aproximacin lingstica al aprendizaje,
mientras que otras prefieren un rumbo espacial o cuantitativo.
Igualmente algunos estudiantes obtienen mejores resultados cuando se les pide que manejen smbolos de
clases diversas, mientras que otros estn mejor capacitados para desplegar su comprensin mediante
demostraciones prcticas o a travs de interacciones con otros individuos.
Todos los seres humanos son capaces de conocer el mundo de siete modos diferentes .Segn el anlisis
de las siete inteligencias todos somos capaces de conocer el mundo de a travs del lenguaje, del anlisis
lgico-matemtico, de la representacin espacial, del pensamiento musical, del uso del cuerpo para resolver
problemas o hacer cosas, de una comprensin de los dems individuos y de una comprensin de nosotros
mismos. Donde los individuos se diferencian es en la intensidad de estas inteligencias y en las formas en
que recurre a esas mismas inteligencias y se las combina para llevar a cabo diferentes labores, para
solucionar problemas diversos y progresar en distintos mbitos.
Las personas aprenden, representan y utilizan el saber de muchos y diferentes modos. Estas diferencias
desafan al sistema educativo que supone que todo el mundo puede aprender las mismas materias del
mismo modo y que basta con una medida uniforme y universal para poner a prueba el aprendizaje de los
alumnos.
Ejercicio N3:
El instituto superior Jos Pardo ha evaluado mediante un test de inteligencias mltiples a 40 alumnos del
rea de diseo grfico para medir el nivel de desarrollo de la inteligencia espacial, donde se encontr la
siguiente frecuencia:
13.8
14.6
16.8
14.6
16.1
16.4
15.8
12.6
17.2
14.5
45.0
14.0
13.8
14.2
13.5
13.2
14.7
17.6
14.7
14.2
14.4
13.6
16.3
13.5
15.0
12.5
14.8
11.9
15.3
15.6
14.9
15.2
15.4
14.0
14.5
15.7
14.4
16.6
13.5
12.8
CASO EJEMPLO: del caso expuesto en el ejemplo anterior, sobre el test tomado a 50 nios para
determinar la capacidad de resiliencia, se obtuvo la siguiente tabla de distribucin de frecuencias:
Intervalos
73 79
79 85
85 91
Frecuencia (fi)
2
6
8
91
97
103
109
97
103
109
115
11
13
8
2
n = 50
Se pide hallar:
a. Frecuencia relativa.
b. Frecuencia porcentual.
c. Frecuencia acumulada.
d. Frecuencia porcentual acumulada.
Intervalos
73 79
79 85
85 91
91 97
97 103
103 109
109 115
fi
2
6
8
11
13
8
2
n = 50
f/n
0.04
0.12
0.16
0.22
0.26
0.16
0.04
f/n = 1
f%
4
12
16
22
26
16
4
f% = 100
F
2
8
16
27
40
48
50
F%
4
16
32
54
80
96
100
Interpretacin:
Hay 2 nios con capacidad de resiliencia menor a 79 puntos.
Hay 40 nios con capacidad de resiliencia menor a 103 puntos.
El 4% de los nios tienen una capacidad de resiliencia menor a 79 puntos.
El 80% de los nios tienen una capacidad de resiliencia menor a 103 puntos.
AUTOEVALUACION Capitulo 1
I.- Los resultados de las evaluaciones aplicadas a nios hiperactivos, se muestran a continuacin:
64
59
75
36
74
63
81
62
95
82
73
44
69
30
52
43
67
61
77
68
38
75
69
79
75
66
76
84
63
87
39
65
72
52
72
50
38
53
82
58
89
73
63
48
47
53
55
75
59
70
84
95
87
63
43
59
Elaborar la tabla de distribucin de frecuencias, absolutas (fi), relativas (f/n), porcentuales (f%),
acumuladas absolutas (Fi), acumuladas porcentuales (F%) y su marca de clase (xi). Responder:
1. Cuantas clases o intervalos son necesarios, es decir cuanto es el valor de k:
a) 5
b) 6
c) 7
d) NA
2. De cuanto es la amplitud, es decir cuanto es el valor de C:
a) 8
b) 10
c) 12
d) NA
3. Cunto es el valor de la frecuencia acumulada (F) en el tercer intervalo:
a) 16
b) 24
c) 12
d) NA
4. La marca de clase (x) en el intervalo 5 es de:
a) 63
b) 73
c) 67
d) NA
5. Que porcentaje de nios tuvo un resultado menor a 68?
a) 54%
b) 16%
c) 70%
d) NA
6. Cuantos nios tuvieron resultados menores a 88?
a) 45 nios
b) 56 nios
c) 53 nios
d) NA
7. Que porcentaje de nios tuvo un resultado menor a 48?
a) 54%
b) 16%
c) 70%
d) NA
8. Cuantos nios tuvieron resultados menores a 78?
a) 45 nios
b) 56 nios
c) 53 nios
d) NA
II. Los resultados de las evaluaciones aplicadas a adolescentes hiperactivos, se muestran a continuacin:
18
25
26
31
31
30
34
37
42
41
19
26
26
30
32
46
35
34
38
43
19
25
28
30
46
33
37
35
39
44
22
26
28
47
30
34
36
36
40
45
20
17
23
24
27
23
24
25
28
29
29
30
30
29
28
46
Elaborar la tabla de distribucin de frecuencias, absolutas (fi), relativas (f/n), porcentuales (f%),
acumuladas absolutas (Fi), acumuladas porcentuales (F%) y su marca de clase (xi). Responder:
9. Cuantas clases o intervalos son necesarios, es decir cuanto es el valor de k:
a) 5
b) 6
c) 7
d) NA
RESPUESTA
c
b
a
b
a
c
b
a
ITEM
9
10
11
12
13
14
15
16
RESPUESTA
c
a
b
a
b
b
c
c
CAPTULO II
ANLISIS E INTERPRETACIN DE DATOS CON EXCEL
CONTENIDO:
1.
2.
3.
4.
5.
COMPETENCIAS:
1. Conceptuales: aprender a interpretar distintos grficos en el anlisis de datos.
2. Procedimentales: aplicar el Excel como herramienta para el estudio y anlisis de casos.
3. Actitudinales: identificar los diversos grficos estadsticos como herramientas de anlisis e investigacin.
INGRESO DE DATOS
El ingreso de datos por medio del teclado es muy similar al uso de una mquina de escribir, pero se deben
tener en cuenta:
Los datos slo se ingresan en la celda activa.
Excel guardar en la celda el ltimo dato digitado.
Los datos alfanumricos se alinean a la izquierda de la celda en uso.
Los datos numricos se alinean a la derecha de la celda en uso.
FORMULAS
Es la secuencia de valores, referencias de celdas, nombres, funciones u operaciones que producen un
nuevo valor a partir de valores existentes.
Toda formula debe empezar con el signo igual (=), no se digitan espacios en blancos en las operaciones.
OPERACIONES ENTRE CELDAS
Permite relacionar contenidos numricos de dos o ms celdas, de tal manera que al cambiar las cifras que
estas contienen, tambin cambian los resultados.
Las operaciones que pueden realizarse son:
Suma
+
Resta
Multiplicacin
*
Divisin
/
Ejemplo:
Ingrese el nmero 5 en la celda A1 y el nmero 3 en la celda B1, a continuacin realice las operaciones
antes mencionadas del siguiente modo:
3
4
5
6
A
Suma
Resta
Multiplicacin
Divisin
B
= B1 + C1
= B1 - C1
= B1 * C1
= B1 / C1
Recuerde que, si tiene que realizar ms de una operacin matemtica en la misma formula, debe usar
parntesis para agrupar las operaciones.
Por ejemplo:
Por ejemplo:
Por ejemplo:
= (B1 + C1) / 2
= (3 * (B1 + C1) / 2) - 10
= (B1 + C1) / 2
Fija la celda
Ejm: $E$7
2. Representaciones Grficas
Las representaciones grficas cumplen un rol muy importante, puesto que basta mirar una grfica para
entender con facilidad los cambios en las variables involucradas.
ANLISIS COMPARATIVO DE LOS INTERVALOS DE UNA CLASE A TRAVS DEL HISTOGRAMA DE
FRECUENCIAS.
HISTOGRAMAS DE FRECUENCIAS.Para realizar este grfico utilizamos un sistema de coordenadas bidimensionales; se acostumbra colocar los
valores de los intervalos en el eje horizontal y en el eje vertical se colocan las frecuencias absolutas.
El histograma de frecuencias se representan mediante rectngulos cuyas bases son cada uno de los
intervalos de una distribucin de frecuencias que se encuentran localizadas en el eje horizontal y cuyas
alturas son las respectivas frecuencias absolutas de la tabla de distribucin.
CASO EJEMPLO: en el caso ejemplo anterior, obtuvimos la tabla de frecuencias:
Intervalos
73 79
79 85
85 91
91 97
97 103
103 109
109 115
Frecuencia (fi)
2
6
8
11
13
8
2
(fi)
Intervalos
ANLISIS E INTERPRETACIN DE REPRESENTACIONES GRFICAS: POLGONO DE FRECUENCIAS.
POLIGONO DE FRECUENCIAS.Procedemos de manera semejante a la realizada por el histograma de frecuencias en lo que se refiere a la
determinacin de la escala vertical y horizontal.
Para este grfico las bases son cada uno de las marcas de clase de la distribucin de frecuencias, es decir
las localizadas en el eje horizontal y las alturas son las respectivas frecuencias absolutas de la tabla de
distribucin.
EJEMPLO: con los datos que realizamos el grafico del histograma, realizamos ahora el polgono de
frecuencias, este grfico suavizado, lo llamamos curva normal.
(fi)
Marca de clase
Si suavizamos las lneas del grfico, obtenemos:
GRAFICOS CIRCULARES.Por medio de sectores circulares, tambin se representan las categoras de las variables cualitativas, que
nos muestran el rea, cantidad y/o porcentaje que este representa.
EJEMPLO: con los siguientes resultados:
coeficiente
alto
medio
bajo
personas
10
32
8
Realizamos un grfico circular para apreciar el porcentaje que representa cada uno.
que
se
fi
3
2
1
0
20-30
30-40
40-50
50-60
60-70
70-80
e) Colocar un titulo a si grfico, como: Histograma de frecuencias; colocar un nombre para los valores
del eje (X), como: intervalos o clases; y colocar un nombre para los valores del eje (Y), como:
frecuencias. En la ficha Leyenda, si gusta puede quitarla desactivando en el check Mostrar leyenda.
f) Presione el botn siguiente.
g) Presione el botn finalizar.
B) Si desea realizar el Polgono de frecuencias:
1.- Crear la tabla, o la distribucin de frecuencias con los datos que se desean graficar.
Por ejemplo:
1.- Crear la tabla, o la distribucin de frecuencias con los datos que se desean graficar.
Por ejemplo:
16.5
15.1
15.1
14.1
19.8
22.1
20.1
22.5
17.1
16.1
14.1
15.1
20.1
12.1
12.1
12.5
8.5
11.3
9.1
21.5
17.3
20.1
12.5
14.1
16.1
9.5
16.1
13.1
19.1
14.1
15.1
Para obtener la tablita sombreada, las formulas que debe digitar son las siguientes, y donde no hay
formula es porque debe digitar el dato redondeado directamente:
n
k
I
C
I'
exec
Vmin
32
=1+3.3*LOG10(C1)
=A32-A1
=C3/D2
=D2*D4
=C5-C3
=A1-E6
6
3
2
f
F
=CONTAR(A1:A2)
=E10
=CONTAR(A3:A6) =F10+E11
=CONTAR(A7:A18) =F11+E12
=CONTAR(A19:A24) =F12+E13
=CONTAR(A25:A29) =F13+E14
=CONTAR(A30:A32) =F14+E15
=SUMA(E10:E15)
=E16/2
f%
=(E10/$E$16)*100
=(E11/$E$16)*100
=(E12/$E$16)*100
=(E13/$E$16)*100
=(E14/$E$16)*100
=(E15/$E$16)*100
F%
=G10
=H10+G11
=H11+G12
=H12+G13
=H13+G14
=H14+G15
x
=(C10+D10)/2
=(C11+D11)/2
=(C12+D12)/2
=(C13+D13)/2
=(C14+D14)/2
=(C15+D15)/2
=SUMA(G10:G15)
b) Elaborar el Histograma y el Polgono de frecuencias (siga las instrucciones de la clase previa, donde
indica como realizar el histograma y polgono)
c) Elaborar un grfico circular que muestre la frecuencia absoluta e indique por cada clase el
porcentaje correspondiente (esto se indica en el grfico).
AUTOEVALUACION Capitulo 2
Se tomo una muestra aleatoria a un grupo de mujeres maltratadas, para medir su grado de autoestima, los
datos obtenidos de dicha prueba son:
14.4
22.9
38.3
19.1
13.8
14.3
11.4
11.5
24.4
14.3
20.5
17.5
26.5
10.3
28.5
30.4
31.5
16.3
22.4
17.1
15.1
15.6
22.1
36.7
13.7
22.6
19.1
25.8
19.9
32.4
24.1
10.8
RESPUESTA
a
c
c
b
a
b
CAPTULO III
MEDIDAS DE TENDENCIA CENTRAL
CONTENIDO:
COMPETENCIAS:
1. Conceptuales: reconocer las medidas de tendencia central (media aritmtica, mediana y moda) como
factores de anlisis de casos.
2. Procedimentales: aplicar el Excel como herramienta para el desarrollo de las medidas de tendencia
central.
3. Actitudinales: identificar las medidas de tendencia central como herramientas de anlisis e investigacin.
Donde:
A: es la marca de clase que se toma como un origen de trabajo, se asume la marca de clase donde la
frecuencia absoluta (fi) tiene el mayor valor.
Adems, se crea una nueva columna (u) que representa la desviacin unitaria, los valores a colocar en
esta columna sern: en el intervalo donde ubicamos A, colocamos 0, a partir de ah los intervalos hacia
arriba iremos disminuyendo valores en uno, es decir 1, -2, -3, -4 as sucesivamente, y los valores de
los intervalos de abajo se irn incrementando en uno, es decir 1, 2, 3, 4 as sucesivamente.
n: es la suma de la frecuencia absoluta (fi), es decir, el tamao de la muestra.
fu: es la suma, de todas las multiplicaciones realizadas con cada frecuencia absoluta (fi) por su respectiva
desviacin unitaria (u).
C: es la amplitud de cada intervalo.
EJEMPLO: sea la distribucin de frecuencias dadas. Calcular La media.
Intervalos
40 50
50 60
60 70
70 80
80 90
A = 65
Frecuencia
(fi)
6
15
38
24
3
n = 86
Marca de clase
(xi)
45
55
65
75
85
C = 10
fu
-2
-1
0
1
2
-12
-15
0
24
6
fu = 3
Reemplazando:
X = 65 +
3
86
10
X = 65.35
n _ Fi-1
Md = extremo inferior +
2
fi
Donde:
extremo inferior: es el valor de inicio, o el menor valor del intervalo donde cayo el numero que se obtuvo de
la divisin de n/2.
fi: es la frecuencia absoluta del intervalo donde cae la mediana.
C: es la amplitud del intervalo.
Fi-1: es la frecuencia acumulada registrada una posicin antes de la clase o intervalo donde cae la mediana.
EJEMPLO: sea la distribucin de frecuencias dadas. Calcular La mediana.
Intervalos
fi
Fi
28
38
48
58
68
78
88
38
48
58
68
78
88
98
2
7
7
14
15
8
3
n = 56
2
9
16
30
45
53
56
Md
Calculando:
n = 56 = 28
2
2
Luego buscamos en las frecuencias acumuladas (Fi), donde cae el 28
Por lo tanto el intervalo donde esta ubicado la mediana es: 58 -> 68, que es la cuarta clase.
Entonces, nuestro extremo inferior de ese intervalo es 58, y la frecuencia absoluta (fi) es 14.
Sabemos que la amplitud (C) es 10.
El Fi-1 es la frecuencia acumulada de la clase anterior a donde cayo la mediana, es decir si ahora la mediana
cayo en la cuarta clase, el Fi-1 es la frecuencia acumulada en la tercera clase, para este caso es = 16.
Reemplazando:
Md = 58 + (( 56/2) 16) * 10
14
Md = 58 + (28 16) * 10
14
Md = 58 + 8.58
Md = 66.57
Usos de la Mediana:
1.- Se prefiere a la mediana como medida de concentracin, cuando en los datos existen valores extremos
muy grandes o muy pequeos, es decir valores muy altos o muy bajos que obligan a la media aritmtica a
desplazarse a la derecha o a la izquierda del punto medio de la distribucin.
En cambio la mediana seala siempre el punto que divide los datos en dos partes iguales: 50% a un lado
y 50% al otro lado, sin importar donde se halla ese punto.
2.- Cuando simplemente necesitamos conocer si los datos que nos interesan estn dentro de la mitad
superior o inferior de la distribucin de los datos y no tiene importancia saber particularmente su
alejamiento al centro de la distribucin.
1
1 + 2
1.- Primero se ubica cual es la mayor frecuencia absoluta (fi), esa ser la clase o intervalo donde estar
ubicada la Moda.
Donde:
extremo inferior: es el valor de inicio, o el menor valor del intervalo donde la frecuencia absoluta (fi) tiene el
mayor valor.
1: es la diferencia (resta) de la frecuencia absoluta del intervalo donde cayo la moda menos la frecuencia
absoluta del intervalo anterior a ella.
2: es la diferencia (resta) de la frecuencia absoluta del intervalo donde cayo la moda menos la frecuencia
absoluta del intervalo posterior a ella.
C: es la amplitud del intervalo.
EJEMPLO: sea la distribucin de frecuencias dadas. Calcular La moda.
Intervalos
fi
73 79
79 85
85 91
91 97
97 103
103 109
109 115
2
6
8
11
9
8
2
Mo
Calculando:
La mayor frecuencia absoluta (fi) es el 11, por lo tanto la clase modal es la cuarta, siendo el intervalo: 91
97.
El extremo inferior es entonces = 91
1 = 11 8 = 3
2 = 11 9 = 2
C=6
Reemplazando:
Mo = 91 +
3
6
3+2
Mo = 91 + 3.6
Mo = 94.6
Usos de la Moda:
1.- Cuando se necesita una estimacin rpida de la tendencia central.
2.- Cuando se desea conocer el punto de mxima frecuencia en una distribucin asimtrica de datos, esto
es el valor ms repetido de un conjunto de datos.
Ejercicio:
De un caso en anlisis, se ha obtenido el siguiente cuadro de distribucin de frecuencias:
intervalos
28
38
38
48
48
58
58
68
68
78
78
88
88
98
f
2
7
7
14
15
8
3
56
F
2
9
16
30
45
53
56
f%
4
13
13
25
27
14
5
100
F%
4
16
29
54
80
95
100
intervalos
28
38
38
48
48
58
58
68
68
78
78
88
88
98
f
2
7
7
14
15
8
3
56
F
2
9
16
30
45
53
56
f%
4
13
13
25
27
14
5
100
F%
4
16
29
54
80
95
100
x
33
43
53
63
73
83
93
u
-4
-3
-2
-1
0
1
2
fu
-8
-21
-14
-14
0
8
6
-43
28
Si se tiene que la amplitud C = 10, entonces:
Media = 73 + (-43 / 56) * 10
Mediana = 58 + ((28 16) * 10) / 14
1 = 15 14 = 1
2 = 15 8 = 7
Moda = 68 + ( 1 / (1 + 7) ) * 10
AUTOEVALUACION Capitulo 3
I. De un caso en anlisis, se ha obtenido el siguiente cuadro de distribucin de frecuencias:
intervalos
x(i)
f(i)
f/n
f%
F%
6.5
9.5
0.06
9.5
12.5
11
0.13
13
19
12.5
15.5
14
12
0.38
38
18
56
15.5
18.5
17
0.19
19
24
75
18.5
21.5
20
0.16
16
29
91
21.5
24.5
23
0.09
32
100
RESPUESTA
CAPTULO IV
MANEJO DE VARIABLES EN UNA INVESTIGACIN
CONTENIDO:
1. SPSS como herramienta de anlisis e interpretacin y entorno de trabajo de SPSS.
2. Definicin de variables independientes y dependientes e ingreso de datos.
3. Tratamiento de los datos o valores perdidos.
4. Medidas de posicin: cuartiles, deciles y percentiles.
5. Mediadas de dispersin: desviacin estndar y varianza.
6. Coeficiente de Variabilidad.
7. Asimetra y Curtosis.
8. Desarrollo de casos y ejercicios prcticos.
COMPETENCIAS:
1. Conceptuales: reconocer al programa SPSS como una herramienta fundamental para el anlisis de
casos.
2. Procedimentales: aplicar el SPSS para el desarrollo y tratamiento de datos.
3. Actitudinales: identificar las ventajas del manejo del software SPSS en el proceso de anlisis e
investigacin.
AREA DE TRABAJO
Las celdas son repositorios de datos, NO SE HACEN FORMULAS COMO EN EXCEL.
LA caracterstica principal del entorno de trabajo es que se basa en el principio de la rectangularidad, es
decir que los datos siempre van ha tender a formar un rectngulo.
DEFINICIN DE VARIABLES
Para definir variables se usa el visor Variable View.
En este visor, en las filas estn las variables y las columnas representan las propiedades de cada variable.
Propiedades de una variable:
1. Name: (nombre de la variable)
Restricciones:
No acepta espacios vacos, por ejemplo (apellido paterno).
No acepta como primer carcter un nmero, por ejemplo (1apellido).
No acepta palabras reservadas, por ejemplo (operadores lgicos AND, OR, NOT, etc).
No acepta caracteres especiales, por ejemplo (%, +, -, /, *, @, etc)
2. Type: (tipo de dato de la variable)
Width (ancho o tamao total)
Decimal (cantidad de decimales)
3. Label: (etiqueta)
Se usa para ingresar texto explicativo a la caracterstica de la variable.
Por ejemplo: Name: Sueldo y Label: Sueldo semanal.
4. Values: (valores)
Se codifican las variables cualitativas.
Por ejemplo: Sexo, puede ser femenino (F) y masculino (M), pero para anlisis es necesario
manejarlos como datos tipo numero, por lo tanto se le valores de dicho tipo, como: F0 y a
M 1.
As podemos codificar variables cualitativas a un contexto numrico.
5. Missing: (valores perdidos)
Define los valores perdidos definidos por el usuario.
Por ejemplo: si tenemos registrado las siguientes edades:
20 27 28 200 18 300 15
Apreciamos que hay 2 edades que no tienen lgica, con los cuales se debe haber cometido
algn error, pero la solucin no es arreglarlo a lo que nos parece pudo haber sido, sino, lo
correcto es obviarlos del anlisis y declararlo como valor perdido, para ello recurrimos al
Missing, aqu podemos definir o registrar:
e) Hasta 3 valores discretos (es decir hasta 3 valores sueltos).
200
f)
300
100
Hig
500
Discreto
52
6. Columns: (columna)
Indica el ancho de la columna en el Data View.
7. Align: (alineacin)
Es la alineacin del dato dentro de la celda (Left: izquierda, Center: centro y Right: derecha).
8. Measure: (medida)
Indica el tipo de medida estadstica que emplear ese dato:
a). Nominal: para variables que tendrn valores cualitativos, estos para poder ser medidos
(measure) deben ser de tipo nominal. Por ejemplo: el estado civil (soltero, casado, viudo), el
sexo (masculino, femenino).
b). Ordinal: para variables cuyo valor representa algn orden o posicin en particular. Por
ejemplo: el grado de instruccin (primaria, secundaria, superior, post grado), etapas (nio,
joven, adulto).
c). Scala: para variables cuyo valor es netamente cuantitativas, representan valores del tipo,
netamente numricos. Por ejemplo: la edad (15, 28, 37), los sueldos (1500, 2100, 845, etc).
INGRESO DE DATOS
Una vez que se definieron las variables en el visor Variable View, pasamos al visor Data View, en este
lugar, notamos que aparece en las columnas, las variables registradas o declaradas anteriormente,
comenzamos entonces a digitar los valores correspondientes a cada una de ellas.
GENERANDO TABLAS DE FRECUENCIAS
1. Men anlisis.
2. Estadsticos descriptivos.
3. Frecuencias
4. Seleccione la variable y psela a la columna de seleccionados.
5. Presione Aceptar u ok.
CALCULOS DE MEDIDAS DE TENDENCIA CENTRAL
1. Men anlisis.
2. Estadsticos descriptivos.
3. Frecuencias
4. Seleccione la variable y pasarla a la siguiente columna (estas variables aparecen listadas por etiqueta,
para cambiarlas a listadas por nombre, hacer lo siguiente:
En el men Edicin, seleccione Opciones, en la ficha General cambiar de Display Labels a Display
Names, presionar Aceptar, en la siguiente ventana vuelva a presionar Aceptar y listo.
5. En la parte inferior de la ventana hay 3 botones, presionar el botn Estadsticos.
6. Activar el check en Mean si desea calcular el promedio o media aritmtica.
Si desea calcular la mediana, active:
Si desea calcular la moda, active:
7. Luego presione Aceptar u ok.
8. Vuelva a presionar ok.
GENERACIN DE GRAFICOS
1. Men anlisis.
2. Estadsticos descriptivos.
3. Frecuencias.
4. Seleccione y pase la variable.
5. Presione el botn grficos ubicado en la parte inferior de la ventana, ah puede seleccionar:
Barra.
Pie.
Histograma.
Con curva normal.
6. Luego presione ok.
7. Vuelva a presionar ok.
EJERCICIO A:
Se realizo una encuesta tomando una muestra aleatoria de las familias del nivel socioeconmico B. La
variable de medicin es el nmero de personas fumadoras por familia. Los resultados fueron los siguientes:
2 1 2 2 1 2 4
2 3 2 1 1 1 3
2 2 1 2 1 1 1
3 2 3 1 2 4 2
1 3 4 3 2 2 2
1) Generar la tabla de distribucin de frecuencias.
2) Generar los siguientes grficos:
Histograma de frecuencias con curva normal.
Grfico Pie.
2
4
3
1
1
1
2
2
4
3
1
2
2
1
3
Solucin:
En el visor de variables (Variable View) declare la siguiente variable:
Name: num_fumadores.
Type: numrico.
Label: numero de fumadores.
Values: ninguno.
Missing: ninguno.
Columns: 12.
Align: center.
Measure: scale.
Luego en el visor de datos (Data View) digite todos los datos que estn en la tabla del ejercicio (no es
importante si los datos estn ordenados o no)
Ahora siga los pasos que se indican en los temas de Generar la tabal de frecuencias y generar grficos para
obtener sus resultados.
EJERCICIO B:
Se han tomado los siguientes datos:
Cod_encuesta Estado_civil Nivel_educativo Edad Sueldo_soles Sexo
A1
Soltero
Superior
27
3500
F
A2
Casado
Secundaria
32
1200
M
A3
Soltero
Primaria
22
900
F
A4
Soltero
Superior
28
1500
M
A5
Divorciado
Secundaria
32
1100
F
A6
Casado
Postgrado
37
4500
M
A7
Soltero
Superior
31
2000
F
A8
Viudo
Postgrado
42
3500
F
A9
Casado
Primaria
19
1000
M
Calcular el sueldo promedio o media aritmtica, es decir, La media.
Declarando variables:
1) Name
: Cod_encuesta
Type
: String (Character = 2)
Label
: Codigo de la encuesta
Values
:
Missing
:
Columns : 8
Align
: Center
Measure : Nominal
2) Name
Type
Label
Values
Missing
Columns
Align
Measure
3) Name
Type
Label
Values
: Estado_civil
: Numeric (Width - Ancho = 1) (Decimal Places = 0)
: Estado civil
: 1=soltero (presione Add), 2=casado (presione Add), 3=viudo (presione Add), 4=divorciado
(presione Add).
:
:8
: Center
: Nominal
: Nivel_educativo
: Numeric (Width - Ancho = 1) (Decimal Places = 0)
: Nivel Educativo
: 1=primaria (presione Add), 2=secundaria (presione Add), 3=superior (presione Add),
4=postgrado (presione Add).
Missing
Columns
Align
Measure
:
: 10
: Center
: Nominal
4) Name
Type
Label
Values
Missing
Columns
Align
Measure
: Edad
: Numeric (Width - Ancho = 2) (Decimal Places = 0)
: Edad
:
:
:8
: Center
: Scalar
5) Name
Type
Label
Values
Missing
Columns
Align
Measure
: Sueldo_soles
: Numeric (Width - Ancho = 4) (Decimal Places = 0)
: Sueldo en soles
:
:
:8
: Center
: Scalar
6) Name
Type
Label
Values
Missing
Columns
Align
Measure
: Sexo
: Numeric (Width - Ancho = 1) (Decimal Places = 0)
: Sexo
: 1=femenino (presione Add), 2=masculino (presione Add),
:
:8
: Center
: Nominal
OTROS ANLISIS:
a) El promedio de las edades considerando como valor perdido el 250 es = 30.56
b) Suponiendo que asumimos que hubo un error de digitacin y la edad 250 es 25 (es decir lo corregimos),
calculamos nuevamente el promedio de las edades y obtenemos como media = 30
c) Si no declaramos valores perdidos, nuestra media ser = 52.50
Observacin: Es bueno analizar todas las situaciones posibles, como lo acabamos de hacer para poder
tomar una decisin adecuada al momento de evaluar resultados.
25%
Q1
25%
25%
Q2
Q3
25%
50%
75%
Q1: es el valor que representa delas observaciones.
n _ Fi-1
Q1 = extremo inferior +
4
fi
4
fi
Percentiles.- valores que dividen a un conjunto de datos en 100 partes iguales. Por lo tanto, el valor que en
la formula figura como r, puede variar del 1 al 100 segn el percentil que desea hallar.
rn _
Pr = extremo inferior +
Fi-1
100
fi
4. Medidas de Dispersin
DESVIACIN ESTANDAR: es la ms confiable de las medidas de dispersin. Tambin se le conoce con el
nombre de desviacin tpica.
Intervalos
fi
fu
fu
3
5
7
4
1
n = 20
-2
-1
0
1
2
-6
-5
0
4
2
fu = -5
12
5
0
4
4
2
fu = 25
20
30
40
50
60
30
40
50
60
70
Reemplazando:
S = 10 *
25
20
S = 10 *
S = 10.9
-5
20
1.25 - 0.0625
VARIANZA: se define como el cuadrado de la desviacin estndar. Para calcular la varianza, primero se
calcula la desviacin estndar. Se representa por:
2
Intervalos
fi
fu
fu
1
11
11
13
22
9
6
7
n = 80
-4
-3
-2
-1
0
1
2
3
-4
-33
-22
-13
0
9
12
21
fu = -30
16
99
44
13
0
9
24
63
2
fu = 268
51
57
63
69
75
81
87
93
57
63
69
75
81
87
93
99
268
80
-30
80
S = 6 *
115.53
S = 10.75
2
S = 115.56
EJEMPLO:
Se aplica una misma prueba de evaluacin en un colegio, a 3 secciones: A, B y C. Con las puntuaciones se
calculan los rendimientos medios (promedio) que son:
Seccin A X = 48
Seccin B X = 36.5
Seccin C X = 29.8
Se calculan las dispersiones de los puntajes, obteniendo una desviacin estndar de 10 puntos, igual para
los 3 grupos.
Queremos saber cual de los 3 grupos tiene un rendimiento ms homogneo, es decir con menos dispersin.
Grupo A:
CV = (10/48) * 100
= 20.83%
Grupo B:
CV = (10/36.5) * 100 = 27.40%
Grupo C:
CV = (10/29.8) * 100 = 33.56%
Respuesta: Concluimos el anlisis, verificando que, el que tiene menor porcentaje de coeficiente de
variabilidad es la seccin A, por lo tanto podemos afirmar que esta seccin es la ms homognea, ya que su
dispersin es menor.
Ejemplo 1: Se aplica una prueba de tolerancia al estrs a los empleados administrativos de tres sucursales
del banco Santander y estos fueron los resultados:
Sucursal
Barranco
Comas
San Isidro
Media Aritmtica
39.6
42.8
36.5
Desviacin estndar
9.23
8.99
9.21
CV= (9.14/39.6)*100
= 23.08 %
Grupo Comas
CV= (9.14/42.8)*100
= 21.36 %
CV= (9.14/36.5)*100
= 25.04 %
Al final podemos concluir que el grupo ms homogneo es el de Comas debido a que su porcentaje de
dispersin de 21.36 % es menor y en contraparte el grupo ms heterogneo es el de San Isidro ya que su
dispersin de 25.04 % es la mayor.
5. Asimetra y Curtosis
El objetivo es analizar las deformaciones horizontales y verticales de las curvas de frecuencia.
ASIMETRIA: es la deformacin horizontal de las curvas de frecuencia.
1) Si el coeficiente de asimetra da un valor negativo (<0), la curva tendr la siguiente forma.
2) Se llama curva simtrica si el coeficiente de asimetra es igual a 0 (=0), la curva tendr la siguiente forma.
X - Mo
S
2) Una curva achatada, que tiene muy poco apuntamiento se llama platicrtica.
3) Una curva que tiene una forma intermedia entre las 2 anteriores se llama mesocrtica.
Al calcular el coeficiente de curtosis que llamamos (K), este nos puede dar valores que oscilan dentro de
cierto rango, decimos as, que:
El valor de K nos indica lo siguiente:
a) Si K tiende a 0.5 se dice que la curva es leptocrtica.
b) Si K tiende a 0.25 la curva es mesocurtica.
c) Si K tiende a 0 se dice que la curva es platicrtica.
Platicrtica
0.125
0.25
Mesocrtica
0.375
0.5
Leptocrtica
Area_Laboral
Contabilidad
Logstica
Sistemas
Logstica
Contabilidad
Sueldo
1200
9
2000
1000
1500
Recuerde que por cada variable debe registrar necesariamente: el Name (nombre), Type (tipo de dato),
Label (etiqueta), Values (valores), esto, solo para las variables que necesiten, y la Measure (medida).
Para la variable Sexo, considere los siguientes Values (valores):
0 = Masculino
1 = Femenino.
Para la variable Area_Laboral, considere los siguientes Values:
1 = Contabilidad
2 = Logstica
3 = Sistemas
a) Calcular el promedio o media aritmtica (mean) de los sueldos: .........
b) Considere el sueldo de 9 como valor perdido (Mising) y calcule el nuevo promedio:.........
c) Cual de los dos asume que sera ms apropiado asumir como promedio en su anlisis:
2. Aplicando el tema de VARIABILIDAD RELATIVA O COEFICIENTE DE VARIABILIDAD, resuelva: Los
pacientes del 5to piso obtuvieron en su test una media de 29,87 y una S de 6,932, adems los pacientes del
7mo piso obtuvieron en su test una media de 31,72 y una S de 6,851. Cul de los 2 pisos presenta los
pacientes ms homogneos y los ms heterogneos? y Por qu?
Solucin:
Calculamos los respectivos coeficientes de variabilidad:
Para el 5to piso CV = 6.932 / 29.87 = 23.21 %
Para el 7mo piso CV = 6.851 / 31.72 = 21.60 %
Por lo tanto el grupo mas homogneo es el del 7mo piso ya que su porcentaje de dispersin es
menor comparado con el del 5to piso que es el mas heterogneo por su porcentaje de dispersin mayor.
AUTOEVALUACION Capitulo 4
I. Los pacientes de la sala 2 obtuvieron en su test una media de 37,61 y una S de 7,931, adems los
pacientes de la sala 3 obtuvieron en su test una media de 31,65 y una S de 6,983.
1. Cuanto es el coeficiente de variabilidad de la sala 2:
a) 20.08
b) 21.09
c) 22.10
d) NA
2. Cuanto es el coeficiente de variabilidad de la sala 3:
a) 20.08
b) 21.09
c) 22.10
d) NA
3. Cul de las 2 salas presenta los pacientes ms homogneos? y Por qu?
a) Sala 2
b) Sala 3
c) NA
II. Los pacientes del 9no piso obtuvieron en su test una media de 29,87 y una S de 6,932, adems los
pacientes del 10mo piso obtuvieron en su test una media de 31,72 y una S de 6,851. Cul de los 2 pisos
presenta los pacientes ms homogneos y los ms heterogneos? y Por qu?
4. Cuanto es el coeficiente de variabilidad del 9no piso:
a) 22.97
b) 23.09
c) 23.21
d) NA
5. Cuanto es el coeficiente de variabilidad del 10mo piso:
a) 21.57
b) 21.60
c) 21.90
d) NA
N_cuotas
2
3
1
400
2
1
2
2000
3
Declare o trabaje con Values (los que usted asuma o desee) en la variable Condicin:
10. Calcular el promedio o media aritmtica (mean) de las N_cuotas:
a) 268.22
b) 304.25
c) 425.04
d) NA
11. Considere valores perdidos en N_cuotas (400 y 2000) como Mising y calcule el nuevo promedio:
a) 1
b) 1.5
c) 2
d) NA
RESPUESTA
10
11
CAPTULO V
GENERACIN DE CLCULOS Y ANLISIS DE RESULTADOS
CONTENIDO:
1. Generacin de clculos con la calculadora de SPSS.
2. Clculos de coeficiente de asimetra.
3. Desarrollo de casos y ejercicios prcticos.
4. Transformacin de datos.
5. Recodificacin de variables o segmentacin de rangos.
6. Ordenar y agrupar casos.
COMPETENCIAS:
1. Conceptuales: reconocer los procesos de clculos, transformacin, recodificacin y agrupacin de
casos.
2. Procedimentales: aplicar SPSS en la transformacin, recodificacin, segmentacin y agrupacin de
casos para el anlisis respectivo.
3. Actitudinales: identificar las ventajas del manejo del software SPSS en el proceso de anlisis e
investigacin.
42
APLICANDO SPSS
CALCULOS DE COEFICIENTE DE ASIMETRIA
1. Men anlisis.
2. Estadsticos descriptivos.
3. Frecuencias
4. Seleccione la variable y pasarla a la siguiente columna.
5. En la parte inferior de la ventana hay 3 botones, presionar el botn Estadsticos.
6. Activar el check en skewness para calcular el coeficiente de asimetra.
7. Luego presione Aceptar u ok.
8. Vuelva a presionar ok.
NOTA: En los resultados sale:
Std. Error of Skewness eso indica el ancho de la campana (medida horizontalmente), cuanto
mayor sea el numero, la campana ser mas ancha.
Talla
1.45
1.67
1.55
Y necesitamos hallar el ndice de masa corporal (Imc) de cada uno, para lo cual sabemos que: Imc =
peso / talla
Podemos con la opcin Compute, realizar dicho calculo (colocando la formula correspondiente) y
automticamente nos generara una nueva variable Imc, con los resultados respectivos.
Peso
58.5
63.2
70.8
Talla
1.45
1.67
1.55
43
Imc
40.34
37.84
45.67
Variable destino:
Aqu, se coloca el nombre que llevara la nueva columna, es decir la nueva variable que se generara
con la formula, funcin u otros que aplique.
Tipo y etiqueta:
Aqu, se coloca el tipo de dato que tendr la nueva variable y en label o etiqueta, se coloca la
referencia o nombre completo de la variable.
Expresiones numricas:
Aqu, se digitan las formulas, u operaciones a realizar; el resultado se mostrar en la variable que
declaro en el sector correspondiente.
Calculadora del SPSS:
B) Operadores aritmticos (+, -, *, /, ** (potencia)).
C) Operadores de comparacin (<, >, <=, >=, =, ~= (diferente)).
D) Operadores lgicos (& (y), | (o), ~(negacin)).
E) Operador de asociacin ( ).
F) Teclado numrico.
Lista de funciones del SPSS:
SPSS tiene ms de 70 funciones, por ejemplo Mean (media), pero esta funcin calcula el promedio
de una fila, mas no el promedio de la muestra.
Si lo que desea es el promedio muestral, debe realizar los clculos como se indica en los Clculos de
medidas de tendencia central.
El botn IF...:
Permite ingresar al mdulo donde se define las condiciones.
DESARROLLO DE CASOS Y EJERCICIOS PRCTICOS
EJERCICIO 1:
Registrar los siguientes datos:
Nombre Practica_1 Practica_2 Practica_3 Ex_final
Jose
18
12
17
16
Carla
14
9
16
10
Beto
7
14
12
12
Pedro
11
8
10
12
Obtener las columnas, o nuevas variables:
e) Promedio de prcticas (pp).
f) Nota final (nf)
44
45
EJERCICIO 3:
Usando la tabla del ejercicio anterior, calcular el pp1 (promedio de practicas) pero usando Funciones.
Solucin:
1. Men transformar.
2. Compute.
3. Presionar el botn Reset.
4. En Variable destino (Target Variable), colocar pp1.
5. En Tipo etiqueta (Type & label), colocar en Type: numrico, y en Label: nuevo promedio de
practicas.
6. En la lista de funciones buscamos la funcion Mean (practica_1, practica_2, practica_3)
7. Presionar ok.
NOTA: como ya se menciono anteriormente, Mean como funcin, calcula el promedio de las filas de
datos, mas no de las columnas. En cambio el Mean que se obtiene de las frecuencias, si es el
promedio de columnas.
RECODIFICACION DE VARIABLES (Segmentacin en rangos)
Permite establecer cdigos a criterios en particular del analista, con propsitos especficos.
Por ejemplo: Se tiene la variable edad; esta variable se puede segmentar en estratos, tomando un
criterio en particular, es decir puede ser:
Edades: 8, 9, 9, 10, 12, 14, 16, 21, 21, 22, 23, 25, 27, 28, 30, 30, 32, 34
Cdigo
1
2
3
Una vez definida la variable cdigo, esta pude asumir valores (values) si el analista lo desea, por
ejemplo, en vez que figure 1,2,3 puede colocar niveles o etapas, donde 1=nio, 2=joven, 3=adulto:
Edades
Nivel
Desde la edad mas baja hasta 15
Nio
15 25
Joven
26 mas
Adulto
EJERCICIO 4:
Registrar los siguientes datos:
Nombre
Fernando
Carlos
Pedro
Vanessa
Alicia
Dora
Augusto
Turno
Maana
Noche
Noche
Maana
Maana
Noche
Maana
Sueldo
500
1500
780
850
980
955
1200
Recodificar la variable sueldo en una nueva variable llamada Rango_sueldo, del siguiente modo:
Sueldo
Rango
Desde el sueldo mas bajo hasta 800
1
801 1000
2
1001 mas
3
46
Solucin:
1. Menu transformar.
2. Seleccionar la opcin Recode (Recodificar).
3. Seleccione Into Different Variables... (Generar en variable diferente).
4. En la ventana que se muestra, seleccionar la variable a segmentar, en este caso es la
variable Sueldo y agregarla al siguiente cuadro.
5. En Output Variable (Variable de salida).
Se coloca el nombre a la nueva variable, la cual tendr los rangos del sueldo.
Name (Nombre)
Rango_sueldo
6. Presionar el botn Cambiar o Change.
7. Presionar el botn Old and New Values (Valores antiguos y nuevos).
8. Marcar:
Range:
1
800
Lowest Through (valor mas bajo a)
9. En la opcin Value (Valor) colocar el cdigo que representara el primer rango:
10. Presionar el botn Add (Adherir)
11. Marcar:
Range:
801
1000
Through (Hasta)
12. En la opcin Value (Valor) colocar el cdigo que representara el segundo rango:
13. Presionar el botn Add (Adherir)
14. Marcar:
Range:
15.
16.
17.
18.
1001
Through highest (Mayores a)
En la opcin Value (Valor) colocar el cdigo que representara el tercer rango:
Presionar el botn Add (Adherir)
Presionar el botn Continue (Continuar)
Presionar Ok (Aceptar).
NOTA: si desea establecer mas de 3 rangos, deber repetir los pasos del 11 al 13 cuantas veces sea
necesario.
Si ahora desea que los rangos obtenidos con cdigos (1,2 y 3) cambien a Valores (Values) por
ejemplo: 1=bajo, 2=medio, 3=alto, debe modificar en la ficha Variable View (Vista de Variables), los
Values correspondientes a la nueva variable obtenida, rango_sueldo.
EJERCICIO 5:
Registrar los siguientes datos:
Cdigo
Nive_Social
Nro_Hijos
Ingreso_familiar
A01
A
2
2500
A02
C
4
800
A03
B
3
1200
A04
A
1
3500
A05
B
1
1500
A06
C
5
600
Considerar la variable ingreso familiar, para establecer 4 segmentos en una nueva variable llamada
Rango_ingreso.
Ingresos
Rango
Desde el ingreso mas bajo hasta 1000
1
1001 2000
2
2001 3000
3
3001 mas
4
Luego asigne los siguientes Values: 1=deficiente, 2=bajo, 3=regular, 4=bueno.
47
EJERCICIO 6:
Registrar los siguientes datos:
Cdigo
Sexo
Talla
Peso
1
Femenino
1.59
50
2
Masculino
1.60
65
3
Masculino
1.43
45
4
Femenino
1.33
37
5
Femenino
1.70
65
6
Masculino
1.65
70
7
Femenino
1.74
68
8
Femenino
1.62
55
9
Femenino
1.55
67
Considerar la variable Talla, para establecer 2 segmentos en una nueva variable llamada
Rango_Talla (considere usted cuales son los valores que tomara cada uno de los rangos).
Y considerar la variable Peso para establecer el numero de segmentos que usted considere
conveniente, junto con los valores que usted vea adecuados manejar por cada rango, esto ser en
una nueva variable llamada Rango_Peso.
Luego asigne Values correspondientes a los valores obtenidos, tanto en Talla, como en Peso.
ORDENAR CASOS
Para ordenar los datos por alguna variable en particular, por ejemplo, si de todos los datos
registrados, desea que estos aparezcan ordenados por edad, realice lo siguiente:
2. Men Data (Datos).
3. Seleccionar la opcin Sort Cases... (Ordenar casos)
4. Seleccionamos y pasamos el dato o variable a ordenar.
5. Presionamos Ok (Aceptar).
AGRUPAR CASOS O AGREGAR DATOS
Consiste en agrupar, varios casos en uno solo y obteniendo algn resultado en particular.
Por ejemplo:
Si tenemos los siguientes datos:
Ciclo
Edad
I
21
I
19
II
29
II
20
II
22
Se desea: Por cada ciclo, mostrar el promedio de edades.
El resultado debe ser:
Ciclo
Prom_edad Num_afectados
I
20
2
II
24
3
Solucin:
1. Menu Data (Datos).
2. Seleccionar Aggregate... (Agregar).
3. En la ventana, seleccionar la variable a agrupar, que en este caso es Ciclo y la pasamos a la
seccin: Break Variables (Variables de segmentacin).
4. Seleccionamos ahora, el dato a calcular de la primera columna, y la agregamos a la seccin:
Aggregate Variables (Variable agregada), sobre este dato se realizarn los clculos. Para nuestro
ejercicio ser la variable Edad.
5. Presionamos el botn Function... (Funcin) para seleccionar la funcin a aplicar, mrquela y
presione el botn Continue (Continuar). Nosotros seleccionaremos de la lista de funciones Mean
(Promedio).
6. Marque:
Save number of cases in break group as variable: (Guardar el numero de casos de la
variable agrupada en la variable:)
Num_afectados
Se coloca en el recuadro un nombre a la variable que registrara el numero
de afectados.
7. Por defecto el resultado se graba en otro archivo llamado aggr.sav, pero si desea cambiar este
nombre, presione el botn File (Archivo) y puede indicar el lugar donde lo guardar, adems de
48
EJERCICIO 7:
Sea el archivo de datos:
Cdigo
Sexo
Area
Sueldo
A
Femenino
Logstica
2500
B
Masculino
Sistemas
3500
C
Femenino
Contabilidad
1500
D
Masculino
Logstica
500
E
Femenino
Sistemas
1200
F
Masculino
Contabilidad
800
G
Femenino
Logstica
600
Calcule:
a) Sueldo total por sexo. Gurdelo en el escritorio como: grupo_sex_totsueldo.
b) Sueldo total por area. Gurdelo en el escritorio como: grupo_area_totsueldo.
c) Mximo sueldo por sexo. Gurdelo en el escritorio como: grupo_sex_maxs.
d) Mximo sueldo por area. Gurdelo en el escritorio como: grupo_area_maxs.
EJERCICIO 8:
Considerando el archivo de datos del EJERCICIO 6, calcule lo siguiente:
a) Talla mxima por sexo.
b) Peso mnimo por sexo.
c) Promedio de tallas por sexo.
49
AUTOEVALUACION Capitulo 5
I. En SPSS registrar los siguientes datos tomados de una Clnica Psiquitrica
Cod_pac
Condicin
Edad
Pago_mensual
P01
Consultorio
8
215
P02
Consultorio
10
310
P03
Traslado
14
280
P04
Internado
12
250
P05
Traslado
9
250
P06
Traslado
12
290
P07
No sabe
13
250
P08
Internado
10
310
N_cuotas
2
3
1
4
2
1
2
2
Condicin
Asociado
Asociado
Libre
Interno
Libre
Asociado
Interno
Interno
Interno
Libre
Edad
8
10
14
12
9
12
13
10
15
13
Monto_total
215
310
280
300
250
290
250
310
310
230
50
Tiempo_resp_testP
50
48
34
40
48
42
40
45
30
35
Punt_obt_testP
25
18
27
28
33
42
34
38
51
44
RESPUESTA
51
CAPTULO VI
TCNICAS DE ANLISIS MULTIVARIADAS
CONTENIDO:
1. Anlisis de Regresin Lineal Simple.
2. Anlisis de Regresin Lineal Mltiple.
3. Anova de un Factor.
4. Anlisis Factorial.
5. Desarrollo de casos y ejercicios prcticos.
COMPETENCIAS:
1. Conceptuales: reconocer los tipos de anlisis, caractersticas y particularidades indispensables
para decidir cual anlisis se acomoda a un determinado caso.
2. Procedimentales: aplicar los distintos tipos de anlisis de acuerdo al caso en estudio tomando
como herramienta el SPSS.
3. Actitudinales: identificar con criterio, el modelo de anlisis que se ajusta mas a un determinado
caso.
52
y = A + Bx
x
Se trata de encontrar el comportamiento de estos puntos y acomodarlo a una forma matemtica
(ecuacin), lo que llamamos modelo. Esa forma puede ser una recta, una curva, etc. (cada una de
ellas tiene su propia ecuacin matemtica).
La distancia de cada punto a la recta es el error, los puntos que caen en la misma recta no tienen
error, la idea es minimizar esos errores.
El Principio del Anlisis de Regresin es:
Si tengo observaciones y minimizo los errores, por ende me acerco a la verdad
Modelo General:
y = A + Bx
y = A + Bx + E
Millas
29.5
32.1
36.3
38.2
37.7
33.6
26.8
Donde:
2
Presin: esta en lb/pulg (libras por pulgada al cuadrado), que es la presin aplicada a los neumticos
de un auto.
Millas: es el numero de millas recorridas.
Es posible encontrar un modelo ajustado?
Solucin:
1) Identificar cual es la variable independiente y cual es la variable dependiente.
Para este caso, analizamos de la siguiente manera:
Nosotros, podemos aumentar o disminuir la Presin a los neumticos en el momento que lo
deseemos, es decir, la presin es una variable independiente porque no depende de ningn factor
en particular, para que este aumente o disminuya. Sin embargo, el numero de millas recorridas,
depende de la presin aplicada a los neumticos, ya que, si la presin aumenta mucho, el
rendimiento de las millas disminuye, en cambio, cuando la presin de los neumticos tiene una
cantidad adecuada, el rendimiento en millas es mejor.
Por lo tanto, con el anlisis realizado, podemos identificar:
Presin variable independiente.
53
a
b
54
EJERCICIO M:
Considerar las siguientes cifras, que indican los datos mensuales del recorrido en millas por vehculo
y los costos de operacin para una empresa de transporte de pasajeros por carretera.
Mes
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
1)
2)
3)
4)
Costos
213.9
212.6
215.3
215.3
215.4
228.2
245.6
259.9
250.9
234.5
205.9
202.7
198.5
195.6
200.4
200.1
201.5
213.2
219.5
243.7
262.3
252.3
224.4
215.3
202.5
200.7
201.8
202.1
200.4
209.3
213.9
227.0
246.4
Millas
3147
3160
3197
3173
3292
3561
4013
4244
4159
3776
3232
3141
2928
3063
3096
3096
3158
3338
3492
4019
4394
4251
3844
3276
3184
3037
3142
3159
3139
3203
3307
3585
4073
Solucin:
1)
Millas variable independiente.
Costos variable dependiente.
2) Rsquare = 0.911 aproximadamente 91.1%
3) Si es posible ajustar a una lnea recta porque el Rsquare sobrepasa el 90%.
4) Siendo la ecuacin: = a + bx
De la tabla de resultados, tomo el valor de a = 64.963 y el valor de b = 0.045.
Me piden predecir los costos de recorrer 5000 millas por lo que x = 5000.
Reemplazando:
= a + bx
= 64.963 + (0.045 * 5000)
= 289.96
Rpta: el costo de operacin de recorrer 5000 millas ser de 289.96.
55
Al igual que el modelo de regresin lineal simple, el R (R cuadrado o R square) debe ser mayor al
90%, para poder asumir que si se cumple con el modelo. Y hacer las predicciones del caso.
Aplicacin:
Tenemos un estudio estadstico de los costos administrativos de distintas entidades Bancarias. Se
desea cuantificar cual es el grado de influencia de las variables independientes sobre la variable
dependiente.
Banco
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
Gastos_admin
48.8
43.2
39.4
29.8
26.2
24.8
24.0
21.5
18.3
15.6
14.3
12.9
12.5
8.8
6.0
5.9
3.6
1.7
1.0
Activos
831.5
1204.0
1153.5
499.6
466.6
522.3
376.6
431.3
282.2
311.8
284.5
399.0
462.8
205.0
162.4
45.8
113.7
237.3
170.8
Agencias
30
18
20
25
30
12
12
20
10
13
7
8
3
12
3
1
4
7
5
Solucin:
1) Determine las variables independientes y la variable dependiente.
Para este caso, analizamos de la siguiente manera:
Una Entidad Bancaria, puede decidir por incrementar su numero de Agencias, o disminuirla, quizs
por su ubicacin comercial, inversin que representa, entre otras, pero es totalmente independiente
en decidir el numero de agencias que manejara; en cuanto a los Activos de la compaa, este
representa el dinero que tiene la empresa materializada por ejemplo en inmuebles, equipos, Activos
que tambin la empresa ser totalmente libre en decidir si adquiere mas equipos incrementando
sus Activos, o quizs disminuirlos; sin embargo los Gastos Administrativos (ojo que no estamos
hablando de gastos en general, sino solamente e gastos administrativos), estos estarn
supeditados a la cantidad de agencias que tenga el banco tanto como a la cantidad de activos que
posee la empresa, ya que, a ms agencias, necesitara ms personal lo que representa ms gastos
administrativos, del mismo modo cuanto mas Activos tenga ya sea en maquinarias inmuebles,
equipos, necesitar invertir mas en personal que lo mantenga, lo que tambin generara mas gastos
administrativos, y en caso disminuyan las agencias y/o activos, los gastos administrativos tambin
disminuiran, por lo que estos Gastos Administrativos dependen de los Activos y las Agencias.
Con el anlisis realizado, podemos identificar:
Activos y Agencias
variables independientes.
56
Gastos Administrativos
variable dependiente.
a0
a1
a2
= a0 + a1x1 + a2x2
= -1.354 + (0.669 * x1 ) + (0.027 * x2 )
NOTA: a0 , es una constante general, el cual si es negativo no es un valor muy lgico, por lo que seria
bueno realizar un anlisis sin considerar dicho valor.
Para suprimir dicha constante:
Al momento de hacer la Regresin, es decir:
1. Men Analyze (Anlisis).
2. Selecione la opcin Regression.
3. Presione la opcin Linear... (Lineal...)
4. Pase las variables independientes y la variable dependiente, cada una al lugar que le
corresponde.
5. Presione el botn Statistics... (Estadsticos...) y verifique que estn marcados: Estimates
(Estimaciones) y Model fit (Modelo ajustado).
6. Presione el botn Options... (Opcion) y quite el check en: Include constant in equation (Incluir
constante en la ecuacin).
57
58
ANOVA DE UN FACTOR
Estudia 2 variables:
1
2
Salario (salary)
2) Establecemos las hiptesis:
H0 : MA = MB La categora laboral de un empleado no influye en su salario.
Ha : MA MB La categora laboral de un empleado si influye en su salario.
3) Ir al Men Analize (Anlisis).
4) Seleccionar Compare Means (Comparacin de medias).
5) Seleccionar One_Way ANOVA (ANOVA de una factor...)
6) Seleccionar la variable dependiente (salario) y pasarla al lugar que le corresponde, luego
seleccionar la variable factor (categora laboral) y agregarla al lugar correspondiente al Factor.
7) Presionar Ok.
9) 8) En los resultados, verificar el valor de P, que es el nivel de significancia (Sig.), (si es menor a
0.05 rechazamos H0 y aceptamos Ha sino hacemos lo contrario).
Para este caso se obtuvo: Sig. = 0.000 como es menor a 0.05, entonces aceptamos Ha.
Conclusin: La categora laboral de empleado, si influye sobre el sueldo.
DESARROLLO DE CASOS Y EJERCICIOS PRCTICOS
EJERCICIO 2:
Se tienen los siguientes datos experimentales, en el que se ha recogido informacin de 2 variables:
Consumo_telefonico Nivel_socio_economico
155
1
154
1
148
1
132
1
59
126
132
156
138
158
144
126
160
136
158
132
144
136
134
142
138
140
142
134
148
146
126
128
120
126
116
142
144
112
116
120
122
136
165
148
128
1
1
1
1
1
1
2
2
2
2
3
1
1
1
1
1
1
2
2
2
2
2
2
3
3
3
3
3
3
3
3
3
1
2
2
2
60
deban
J
K
L
M
N
32
32
35
19
25
262.00
240.00
230.00
389.00
267.00
profesionales
tcnicos
tcnicos
profesionales
tcnicos
61
AUTOEVALUACION Capitulo 6
I. En SPSS registrar los siguientes datos tomados de un Club de Karate.
Cod_pac
P001
P002
P003
P004
P005
P006
P007
P008
P009
P010
Condicin
Asociado
Asociado
Libre
Interno
Libre
Asociado
Interno
Interno
Interno
Libre
Edad
8
10
14
12
9
12
13
10
15
13
Monto_total
215
310
280
300
250
290
250
310
310
230
Tiempo_resp_testP
50
48
34
40
48
42
40
45
30
35
Punt_obt_testP
25
18
27
28
33
42
34
38
51
44
A. Considere las variables Edad y Tiempo_resp_testP para aplicar el modelo de Regresin Lineal
Simple, guarde sus resultados e indique:
1. Variable Independiente:......................................
2. Variable Dependiente:..........................................
Aplique el modelo y luego con la ecuacin reemplace valores para que pueda hacer las siguientes
predicciones:
3. Si el socio tiene 11 aos el tiempo de respuesta que tendr ser:
a) 41
b) 42
c) 43
d) NA
4. Si el socio tiene 25 aos el tiempo de respuesta que tendr ser:
a) 3
b) 4
c) 5
d) NA
B. Aplique ANOVA para verificar si el monto total que pagan los socios est en funcin de su
condicin, guarde sus resultados e indique:
Establezca sus hiptesis:
5. Ho:........................................................................................................................
6. Ha:.......................................................................................................................
7. P o Sig. es menor que 0.05?
a) si
b) no
8. Que hiptesis acepta?
a) Ho
b) Ha
II. En SPSS registrar los siguientes datos de una investigacin de autos.
Millas_galn
Origen
Tpo_aceleracin
Ao
Costo_actual_$
14
Americano
14
2000
3200
17
Americano
16
2002
5000
16
Americano
18
2003
4500
15
Europeo
21
2004
4000
18
Japons
22
2005
3000
21
Japons
14
2000
2000
20
Americano
17
2002
4000
23
Europeo
18
2004
3500
29
Americano
22
2005
5500
22
Europeo
18
2003
3200
C. Con las variables ao y tiempo de aceleracin, aplique el modelo de Regresin Lineal Simple,
guarde sus resultados e indique:
62
9. Variable Independiente:......................................
10. Variable Dependiente:..........................................
Aplique el modelo y luego con la ecuacin reemplace valores para que pueda hacer las siguientes
predicciones:
11. Para el ao 2008 el tiempo de aceleracin tendrn los autos ser de:
a) 25
b) 26
c) 27
d) NA
12. Para el ao 2010 el tiempo de aceleracin tendrn los autos ser de:
a) 29
b) 30
c) 31
d) NA
D. Con las variables rendimiento de millas_galon, tiempo de aceleracin y costo, aplique el modelo de
Regresin Mltiple (considere la posibilidad de quitar la constante en el anlisis para que el modelo
2
se ajuste mas y obtenga un R mucho mas aceptable), guarde sus resultados e indique:
13. Primera Variable Independiente:......................................
14. Segunda Variable Independiente:......................................
15. Variable Dependiente:..........................................
Aplique el modelo y luego con la ecuacin reemplace valores para que pueda hacer las siguientes
predicciones:
16. Considerando un recorrido de 19 millas y con un tiempo de aceleracin de 19, a cuanto
ascenderan los costos?:
a) 3850
b) 3900
c) 3925
d) NA
E. Aplique ANOVA para verificar si el origen esta en funcin del Costo_actual_$, guarde sus
resultados e indique:
Establezca sus hiptesis:
17. Ho:........................................................................................................................
18. Ha:.......................................................................................................................
19. P o Sig. es menor que 0.05?
a) si
b) no
20. Que hiptesis acepta?
a) Ho
b) Ha
RESPUESTA
Edad
Tiempo_resp_testP
c
a
El monto de pago no esta en funcin a su condicin
El monto de pago si esta en funcin a su condicin
b
a
Ao
Tpo_aceleracin
63
ITEM
11
12
13
14
15
16
17
18
19
20
RESPUESTA
b
a
Millas_galn
Tpo_aceleracin
Costo_actual_$
c
origen no esta en funcin del Costo_actual_$,
origen si esta en funcin del Costo_actual_$,
a
b
BIBLIOGRAFIA
1. Fernndez Chavesta Jos
Fernndez Chavesta Juan
Estadstica Aplicada I
Editorial San Marcos, EIRL
Primera Edicin 2007
2. Perez Legoas, Luis
Estadstica Bsica
Editorial San Marcos
3. Murray Spiegel:
Estadstica.
Editorial Mc. Graw Hill.
4. Daniel Wayne W. Estadstica con aplicaciones a las Ciencias Sociales,
Ed. Limusa Mxico
5. Estadstica para Psiclogos II
Jess Amn
Ediciones Pirmide
Novena Edicin, 1993
6. Estadstica
Segunda Edicin
Murria R. Spiegel
Impreso en Espaa
Mc Graw Hill / Interamericana de Espaa SA
7. Morrison D. F
Multivariate Statistical Methods
McGraw-Hill 1990
8. Johnson R.A. y Wichern D.W. (1992)
Applied Multivariate Statistical Anlisis
Prentice-Hall International Inc.
9. Introduccin al anlisis multivariante
Amn,J. (1991)
Barcelona: PPU.
10. Diseos experimentales multivariables
Arnau i Grass, J. (1990)
Madrid: Alianza Psicologa
11. La tcnica del anlisis factorial
Yela, M.(1997)
Madrid: Biblioteca Nueva
64