Vous êtes sur la page 1sur 18

C a p tu l o

10

Anlisis de los datos cuantitativos


Paso 9 Analizar los datos
Decidir el programa de anlisis de datos que se utilizar.
Explorar los datos obtenidos en la recoleccin.
Analizar descriptivamente los datos por variable.

Proceso de investigacin
cuantitativa

Visualizar los datos por variable.


Evaluar la conabilidad, validez y objetividad de los instrumentos de

medicin utilizados.
Analizar e interpretar mediante pruebas estadisicas las hiptesis

planteadas (anlisis estadstico inferencial).


Realizar anlisis adicionales.
Preparar los resultados para presentarlos.

Objetivos del aprendizaje


Al terminar este captulo, el alumno ser capaz de:
1 Revisar el proceso para analizar los datos cuantitativos.
2 Reforzar los conocimientos estadsticos fundamentales.
3 Comprender las principales pruebas o mtodos estadsticos desarrollados, as como sus
aplicaciones y la forma de interpretar sus resultados.
4 Analizar la interrelacin entre distintas pruebas estadsticas.
5 Diferenciar la estadstica descriptiva y la inferencial, la paramtrica y la no
paramtrica.

Sntesis
En el captulo se presentan brevemente los principales programas computacionales de
anlisis estadstico que emplea la mayora de los investigadores, as como el proceso
fundamental para efectuar anlisis cuantitativo. Asimismo, se comentan, analizan y
ejemplican las pruebas estadsticas ms utilizadas. Se muestra la secuencia de anlisis
ms comn, incluyendo estadsticas descriptivas, anlisis paramtricos, no paramtricos y
multivariados. En la mayora de estos anlisis, el enfoque del captulo se centra en los usos
y la interpretacin de los mtodos, ms que en los procedimientos de clcu- lo, debido a
que en la actualidad los anlisis se realizan con ayuda de una computadora.

Cuyo procedimineo es: Fases


Serealiza mediante programas
computacionales como:
SPSS
Minitab
SAS
STATS

1.Seleccionar el programa estadstico para el anlisis de datos


2.Ejecutar el programa
3.Explorar los datos: analizarlos y visualizarlos por variable del estudio
4.Se evala la conabilidad y validez del o de los instrumentos escogidos
5.Se lleva a cabo anlisis estadstico descriptivo de cada variable del
estudio
6.Se realizan anlisis estadsticos inferenciales respecto a las hiptesis
planteadas
7.Se efectan anlisis adicionales
8.Se preparan los resultados para presentarlos

Anlisis de datos
cuantitativos

Distribucin de frecuencias
Medida de tendencia central
El anlisis se realizan tomando en
cuenta los niveles de medicin de las
variables y mediante la estadstica, que
puede ser

Descriptiva

Medidas de variabilidad

Grcas
Puntuaciones z (en CDanexo)

Inferencia
Sirve para estimar
parmetros y probar
hiptesis
Se basa en la
distribucin muestral

Anlisis paramtrico

Anlisis no paramtrico

Anlisis multivariados

Coecientes de correlacin
Regresin lineal
Prueba t
Prueba de la diferencia de proporciones
Anlisis de varianza
Anlisis de covarianza (en CD anexo)

Chi cuadrada
Coecientes de Spearman y Kendall Coecientes para
tabulaciones cruzadas

Media
Mediana
Moda
Rango
Desviacin estndar
Varianza

Qu procedimiento se sigue para analizar cuantitativamente los datos?


Una vez que los datos se han codificado, transferido a una matriz, guardado en un archivo y limpiado de errores,
se procede a analizarlos por computadora Por otra parte, se dispone de sistemas de cmputo para archivar y
analizar datos.
. El proceso de anlisis se esquematiza en la figura 10.1.

FASE 1
Seleccionarunprograma
estadstico en la computadora
(ordenador) para analizar
los datos.

FASE 7
Preparar los resultados
para presentarlos (tablas,
grcas, cuadros,
etctera).

FASE 6
Realizar
anlisis
adicionales.

FASE 2
Ejecutar el programa:
SPSS, Minitab, Stats,
SAS u otro equivalente.

FASE 3
Explorar los datos:
a)Analizar descriptivamente los datos
por variable.
b)Visualizar los datos por variable.

FASE 5
Analizar mediante
pruebas estadsticas las
hiptesis planteadas
(anlisis estadstico
inferencial).

FASE 4
Evaluar la conabilidad y
validez logradas por el o
los instrumentos de
medicin.

Figura 10.1 Proceso para efectuar anlisis estadstico.

Paso 1: seleccionar un programa de anlisis


Existen diversos programas para analizar datos. Su funcionamiento es muy similar, incluyen dos partes :
una parte de definiciones de las variables, que a su vez explican los datos (los elementos de la
codificacin tem por tem), indicador por indicador en casos propios de las ingenieras y diversas
disciplinas y la otra parte, la matriz de datos la cual es como cualquier hoja de clculo.

Tabla 10.1 Ejemplo de matriz de datos con tres variables y cuatro casos

Caso

Columna 1
(gnero)

Columna 2
(color de pelo)

Columna 3
(edad)

35

2
3
4

1
2
2

1
1
4

29
28
33

La codificacin (especificada en la parte de las definiciones de las variables o columnas que corresponden a
tems) sera:
Gnero (1 = masculino y 2 = femenino).
Color de cabello (1 = negro, 2 = castao, 3 = pelirrojo, 4 = rubio).
Edad (dato bruto o crudo en aos).
Por lo general, en la parte superior de la matriz de datos aparecen las opciones de los comandos para
operar el programa de anlisis estadstico como cualquier otro programa (Archivo, Edicin, etc.). Una vez que
estamos seguros que no hay errores en la matriz, procedemos a realizar el anlisis de la
matriz, el anlisis estadstico. En cada programa tales opciones varan, pero en cuestiones mnimas.

Statistical Package for the Social Sciences SPSS o PASW Statistics

El SPSS (Paquete Estadstico para las Ciencias Sociales) desarrollado en la


Universidad de Chicago, es uno de los ms difundidos Como ya se seal,
SPSS/PASW contiene las dos partes citadas que se denominan: a) vista de
variables (para definiciones de las variables y consecuentemente, de los datos) y
b) vista de los datos (matriz de datos).

El paquete SPSS/PASW trabaja de una manera muy sencilla: ste abre la matriz de datos y
el investigador usuario selecciona las opciones ms apropiadas para su anlisis, tal como se hace en
otros programas.

Analyze (analizar): se solicitan anlisis estadsticos que bsicamente seran:


1. Informes (resmenes de casos, informacin de columnas y reglones).
2.Estadsticos descriptivos (tablas de frecuencias, medidas de tendencia central y dispersin, razones, tablas de contingencia).
3.Comparar medias (prueba t y anlisis de varianza ANOVA unidireccional).
4.Modelo lineal general (independiente o factor y dependiente, con covariable).
5.ANOVA (anlisis de varianza factorial en varias direcciones).
6.Correlaciones (bivariada dos y multivariadas tres o ms) para cualquier nivel de
medicin de las variables.
7.Regresin (lineal, curvilineal y mltiple).
8.Clasificacin (conglomerados y anlisis discriminante).
9.Reduccin de datos (anlisis de factores).
10.Escalas (fiabilidad y escalamiento multidimensional).
11.Pruebas no paramtricas.
12.Respuestas mltiples (escalas).
13.Validacin compleja.
14.Series de tiempos.
15.Ecuaciones estructurales y modelamiento matemtico.

nitab
un paquete que goza de popularidad por su relativamente bajo costo. Incluye un considerable nmero de prueba
adsticas, y cuenta con un tutorial para aprender a utilizarlo y practicar; adems, es muy sencillo de manejar.Su
mandos incluyen:
1.Bsicas: descriptivas, correlacin, covarianza, chi-cuadrada, prueba t, prueba de hiptesis acerca de la media
poblacional
2.Regresin lineal y mltiple.
3.Anlisis de varianza (ANOVA) unidireccional y factorial.
4.DOE (anlisis para diseos experimentales, anlisis de respuestas).
5.Diagramas (control charts) (de atributos, multivariados, de tiempo) individuales y grupales.
6.Diagramas de dispersin, Pareto, causa-efecto
7.Confiabilidad.
8. Anlisis multivariado: anlisis de factores (validacin), anlisis discriminante, anlisis de conglomerados, de
correspondencia simple o mltiple.
9.Series de tiempos: autocorrelacin, correlacin parcial, correlacin cruzada, entre otras.
10.Tablas: tabulacin cruzada, chi-cuadrada.
11.Estadstica no paramtrica.
12.EDA (anlisis exploratorio de datos, diagramas de caja, fotograma, etctera).
13.Poder y tamao de muestra (1-muestra z, 1-muestra-t, 2-muestra-t, ANOVA y otras. Sirve para determinar si el
tamao de muestra es apropiado para varias pruebas estadsticas).

Paso 2: ejecutar el programa


En el caso de SPSS y Minitab, ambos paquetes son fciles de usar, pues lo nico que hay que hacer es solicitar los
anlisis requeridos seleccionando las opciones apropiadas. comienza la ejecucin del programa y la tarea analtica.
Paso 3: explorar los datos
En esta etapa, inmediata a la ejecucin del programa, se inicia el anlisis. Cabe sealar que si hemos llevado a cabo
la investigacin reflexionando paso a paso, esta etapa es relativamente sencilla, porque:
1) formulamos la pregunta de investigacin que pretendemos contestar.
2) visualizamos un alcance (exploratorio, descriptivo, correlacional y/o explicativo)
3) establecimos nuestras hiptesis (o estamos conscientes de que no las tenemos)
4) definimos las variables
5) elaboramos un instrumento (conocemos qu tems miden qu variables y qu nivel de medicin tiene cada variable:
nominal, ordinal, de intervalos o razn)
6) recolectamos los datos.

ETAPA 3 (en SPSS)

ETAPA 1 (en SPSS)

En Analizar o Analyze (y usando las opciones:


Informes o Reports y Estadsticos Descriptivos
o
Descriptive Statistics: Frecuencias o
Frequencies) se solicitan para todos los tems
(variable de la matriz por variable de la matriz):
Informes de la matriz (resmenes de casos,
informes estadsticos de las o en columnas).
Con objeto de visualizar resultados tem por tem
y la por la.
Estadsticos descriptivos:
a)Descriptivos (una tabla con las estadsticas
fundamentales de
todas las variables de la matriz, columnas o
tems).
b)Frecuencias (tabla de frecuencias de las
variables de la matriz).
c)Explorar (relaciones entre variables de la
matriz).
d)Generar tablas de contingencia.
e)Generar razones. Al menos a) y b).

ETAPA 2 (analtica)
El investigador evala las
distribuciones y estadsticas de
los tems o columnas, observa
qu tems tienen una distribucin
lgica e ilgica y agrupa a los
tems o indicadores en las
variables
de su investigacin (variables
compuestas), de acuerdo con sus
deniciones operacionales
y la forma como desarroll su
instrumento o instrumentos de
medicin.

En Transformar o Transform y Calcular o


Compute, se indica al programa cmo debe
agrupar los tems en las variables de su estudio.

ETAPA 4 (en SPSS)

En Analizar, se solicitan para todas


las variables del estudio:
a) estadsticas descriptivas (una tabla
con los estadsticos fundamentales de
todas las
variables) y b) un anlisis de frecuencias
con estadsticas, tablas y grcas. A
veces nicamente
se pide lo segundo, porque abarca lo
primero. Debe notarse que estos
anlisis ya no son con tems, sino con
las variables de la investigacin.

Figura 10.3 Secuencia ms comn para explorar datos en SPSS.

Apunte 1

Las variables de la matriz de datos son columnas o tems.


Las variables de la investigacin son las propiedades medidas y que forman parte de las hiptesis o
que se pretenden describir (gnero, edad, actitud hacia el presidente municipal, inteligencia, duracin
de un material, etc.). Cuando slo se precisa de un tem o indicador, las variables de la investigacin
ocupan una columna de la matriz (una variable de la matriz). Pero si estn compuestas de varios
tems, ocuparn tantas columnas como tems (o variables en la matriz) las conformen.

Tabla 10.2 Ejemplos de variables de investigacin y formulacin de tems

Variable: tipo de
escuela a la que
asiste (con un tem)
Asiste a una
escuela pblica o
privada?
1 Escuela pblica
2 Escuela privada

Esta variable es
medida por una sola
pregunta
y ocupa una fila o
variable de la
matriz.

Variable: satisfaccin respecto


al superior (con dos
tems)
1. En qu medida est usted
satisfecho con su superior
inmediato?
1 Sumamente insatisfecho
2 Ms bien insatisfecho
3 Ni insatisfecho ni satisfecho
4 Ms bien satisfecho
5 Sumamente satisfecho
2. Qu tan satisfecho est usted
con el trato que recibe de parte de
su superior inmediato?
1 Sumamente insatisfecho
2 Ms bien insatisfecho
3 Ni insatisfecho ni satisfecho
4 Ms bien satisfecho
5 Sumamente satisfecho
Esta variable es medida por dos
preguntas y ocupa dos filas o
variables de la matriz.

Variable: moral de los


empleados (con dos
tems)
1. En el departamento donde
trabajo nos mantenemos unidos
5 Totalmente de acuerdo
4 De acuerdo
3 Ni de acuerdo ni en desacuerdo
2 En desacuerdo
1 Totalmenteendesacuerdo

2. La mayora de las veces en mi


departa- mento compartimos la
informacin ms que guardarla
para nosotros.
5 Totalmente de acuerdo
4 De acuerdo
3 Ni de acuerdo ni en desacuerdo
2 En desacuerdo
1 Totalmenteendesacuerdo

Esta variable es medida por dos


preguntas y ocupa dos filas o
variables de la matriz.

Esta explicacin la hacemos porque hemos visto que varios estudiantes confunden las variables de la matriz de
datos con las variables del estudio. Son cuestiones vinculadas pero distintas.
Cuando una variable de la investigacin est integrada por diversas variables de la matriz o tems suele
denominrsele variable compuesta y su puntuacin total es el resultado de adicionar los valores de los reactivos
que la conforman.
Tabla 10.3

Ejemplo con la variable moral

Variable de la investigacin: moral

1. En el departamento donde trabajo nos mantenemos


unidos.

Ubicacin en
la matriz

Variable de la matriz
que corresponde a la
variable de la
investigacin
Frase 1 (fr1)

Columna 1

Frase 2 (fr2)

Columna 2

5 Totalmente de acuerdo
4 De acuerdo
3 Ni de acuerdo ni en desacuerdo
2 En desacuerdo
1 Totalmenteendesacuerdo

2. La mayora de las veces en mi departamento


compartimos la infor- macin ms que guardarla para
nosotros.
5 Totalmente de acuerdo
4 De acuerdo
3 Ni de acuerdo ni en desacuerdo
2 En desacuerdo
1 Totalmenteendesacuerdo

Desde luego, para mantener esta variable debemos demostrar que fue medida de forma confiable y vlida, as
como evaluar si todos los tems aportan favorablemente a ambos elementos o algunos no. Y en lugar de una suma, la
variable moral podra ser un promedio de las cinco frases o variables de la matriz (como ya se mencion en el tema de
la escala Likert). Entonces, la expresin en Calcular hubiera sido: (fr1+fr2+fr3+fr4+fr5)/5, y los valores en moral
seran:
EJEMPLO

A
B
c

fr1
1
2
2

fr2
2
2
3

fr3
2
2
2

fr4
4
2
2

fr5
3
2
3

Moral
2.4
2.0
2.4

Apunte 2
Los anlisis de los datos dependen de tres factores:
a)El nivel de medicin de las variables.
b)La manera como se hayan formulado las hiptesis.
c)El inters del investigador.
Por ejemplo, los anlisis que se aplican a una variable nominal son distintos a los de una variable por
intervalos. El investigador busca, en primer trmino, describir sus datos y posteriormente efectuar anlisis
estadsticos para relacionar sus variables. Es decir, realiza anlisis de estadstica descriptiva para cada una de las
variables de la matriz (tems) y luego para cada una de las variables del estudio, finalmente aplica
clculos estadsticos para probar sus hiptesis.
Estadstica descriptiva para cada variable
La primera tarea es describir los datos, los valores o las puntuaciones obtenidas para cada variable. Por
ejemplo, si aplicamos a 2 112 nios el cuestionario sobre los usos y las gratificaciones que la televisin tiene
para ellos, cmo pueden describirse estos datos? Esto se logra al describir la distribucin de las
puntuaciones o frecuencias de cada variable.

Qu es una distribucin de frecuencias?


Una distribucin de frecuencias es un conjunto de puntuaciones ordenadas en sus respectivas categoras y
generalmente se presenta como una tabla.
EJEMPLO
En un estudio entre 200 personas latinas que viven en el estado de
California, Estados Unidos,2 se les pregunt: cmo preere que se
reeran a usted en cuanto a su origen tnico? Las respuestas
fueron:
Variable: preferencias al referir el origen tnico (nombrada en SPSS: prefoe)
Fecuencias
Hispano
1
52
Latino
2
88
Latinoamericano
3
6
Americano
4
22
Otros
5
20
No respondieron
6
12
Total
200

Tabla 10.4
Ejemplo de una distribucin
de frecuencias
Categoras
Cdigos (valores)

A veces, las categoras de las distribuciones de frecuencias son tantas que es necesario resumirlas. Por
ejemplo, examinaremos detenidamente la distribucin de la tabla 10.5. Esta distribucin podra
compendiarse como en la tabla 10.6.

Tabla 10.5

Ejemplo de una distribucin que necesita resumirse


Variable: calicacin en la prueba de motivacin
Categoras
Frecuencias
48
1
55
2
56
3
57
5
58
7
60
1
61
1
62
2
63
3
64
2
65
1
66
1
68
1
69
1
73
2
74
1
75
4
76
3
78
2
80
4
Tabla 10.6 Ejemplo de una distribucin resumida
82
2
83
1
84
1
86
5
87
2
89
1
90
3
92
1
TOTAL
63

Variable: calicacin en la prueba de


motivacin
Categoras
Frecuencias
55 o menos
3
56-60
16
61-65
9
66-70
3
71-75
7
76-80
9
81-85
4
86-90
11
91-96
1
63
TOTAL

Qu otros elementos contiene una distribucin de frecuencias?


Las distribuciones de frecuencias pueden completarse agregando los porcentajes de casos en cada
categora, los porcentajes vlidos (excluyendo los valores perdidos) y los porcentajes acumulados
(porcentaje de lo que se va acumulando en cada categora, desde la ms baja hasta la ms alta). se
acumula el total (100%).
Tabla 10.7 Ejemplo de una distribucin de frecuencias con todos sus elementos
Variable: cooperacin del personal con el proyecto de calidad de la empresa
Categoras
Cdigos
Frecuencia Porcentaje
Porcentaje
s
vlido
acumulado
S se ha obtenido la
1
91
74.6
74.6
cooperacin
No se ha obtenido la
2
5
4.1
78.7
cooperacin
No respondieron
3
26
21.3
100.0
Total
122
100.0

De qu otra manera pueden presentarse las distribuciones de frecuencias?


Las distribuciones de frecuencias, especialmente cuando utilizamos los porcentajes, pueden presentar- se en forma de
histogramas o grficas de otro tipo (por ejemplo: de pastel). Algunos ejemplos se muestran en la figura 10.4.
Grcas
circulares
Cooperacin de todo el
personal
(o la mayora) para el proyecto
de calidad (122 = 100%)

Histogramas
4
Opinin acerca del
actual alcalde del
municipio de San
Sebastian

Otros tipos de grcas


Control paterno sobre el uso que
los nios hacen de la
televisin.

44.4
No
4.1%

Regaan cuando el
nio ve mucha televisin

No respondieron
21.3%

31.1

Aveces castigan al nio


sin ver televisin

20.3
Prohben que vea algunos programas
S
74.6%

Muy desDesfavorable favorable

Imponenla horade
irse a la cama

2.3

1.9
Neutral

Favorable

Muy
favorable
Hay control

Figura 10.4 Ejemplos de grcas para presentar distribuciones.

No hay control

Polgonos de frecuencias Relacionan las puntuaciones con sus respectivas frecuencias, por medio de grcas tiles para describir los datos.
Variable: satisfaccin en el trabajo

El polgono de frecuencias obedece a la siguiente


distribucin:

f
50
40
30
20
10
0
20

25

30

35

40

45

50

55

Figura 10.5 Ejemplo de un polgono de frecuencias.

Categoras/intervalos

Frecuencias absolutas

20-24.9
25-29.9
30-34.9
35-39.9
40-44.9
45-49.9
50-54.9
TOTAL

10
20
35
33
36
27
8
169

Cules son las medidas de tendencia central?


Las medidas de tendencia central son puntos en una distribucin obtenida, los valores medios o centrales de sta,
y nos ayudan a ubicarla dentro de la escala de medicin. Las principales medidas de tendencia central son tres: moda,
mediana y media. El nivel de medicin de la variable determina cul es la medida de tendencia central apropiada para
interpretar.
La moda es la categora o puntuacin que ocurre con mayor frecuencia.
La mediana es el valor que divide la distribucin por la mitad. Esto es, la mitad de los casos caen por debajo de la
mediana y la otra mitad se ubica por encima de sta. Por ejemplo, si los datos obtenidos fueran:

24

31

35

35

38

43

45

50

57 sea (N+1)/2

La media es la medida de tendencia central ms utilizada y puede_definirse como el promedio aritmtico


de una distribucin. Se simboliza como X , y es la suma de todos los valores dividida entre el nmero de casos.
Es una medida sola- mente aplicable a mediciones por intervalos o de razn.

Cules son las medidas de la variabilidad?


Las medidas de la variabilidad indican la dispersin de los datos en la escala de medicin y responden
a la pregunta: dnde estn diseminadas las puntuaciones o los valores obtenidos? Las medidas de
tendencia central son valores en una distribucin y las medidas de la variabilidad son intervalos que

designan distancias o un nmero de unidades en la escala de medicin. Las medidas de la


variabilidad ms utilizadas son rango, desviacin estndar y varianza.
Rango Indica la
extensin total de los
datos en la escala.
Vmax - Vmin

Desviacin estndar (s)


Promedio de desviacin
de
las
puntuaciones con respecto a la media que se expresa en las
unidades originales de medicin de la distribucin.

Vous aimerez peut-être aussi