Académique Documents
Professionnel Documents
Culture Documents
ESTADISTICA DESCRIPTIVA
BIDIMENSIONAL
Contenido:
Las tablas de frecuencia de doble entrada permiten estudiar la relación existente entre
dos variables cuantitativas, dos variables cualitativas o una variable cuantitativa y una
cualitativa. En ellas se incluyen frecuencias conjuntas (absolutas y relativas),
frecuencias marginales (absolutas y relativas) y opcionalmente frecuencias
condicionales (por filas o por columnas)
a) Construir una tabla de frecuencias de doble entrada que recoja las frecuencias
conjuntas y marginales de las variables ALTCOD y PESOCOD. ¿Cómo se
interpretan los valores de la celda (1,1)? ¿Y el total de la primera fila y de la
primera columna?
Son 7 personas del total (131) que cumplen que su peso está entre 40 y 60 kg y
su estatura está entre 150 y 160 cm y que son el 5.34% del total de personas que
hay.
Total por fila es el total de personas que están agrupadas en los distintos grupos
de estatura:
Total por columna es el total de personas que están agrupadas en los distintos
grupos de peso:
c) Construir una tabla de frecuencias que recoja las frecuencias condicionales de la variable
ALTURA asociadas a los distintos tramos de la variable PESO. ¿Cómo se interpreta el
nuevo valor de la celda (1,1)?
Statgraphics: Para obtener la distribución condicional de la variable columna (Y), pulsar con
el botón derecho del ratón, elegir Opciones Ventana y a continuación seleccionar Porcentajes
de Columna.
Statgraphics: Utilizar el botón de opciones gráficas del Statfolio y escoger la opción de gráfico
rascacielos. Para cambiar la perspectiva, utilizar el botón de rotar
30
25
frecuencia
20
15
10
5
0
150-160 80-100
160-170 70-80
170-180 60-70
PESOCOD
ALTCOD 180-200 40-60
20 POLITCOD
CENTRO
DERECHAS
IZQUIERDAS
16 PASA
frecuencia
12
0
DES.SOCIAL DROGAS PARO
PERDIDA VALORES
TERRORISMO
PROBCOD
40 POLITCOD
CENTRO
DERECHAS
IZQUIERDAS
PASA
30
frecuencia
20
10
0
DES.SOCIAL DROGAS PARO
PERDIDA VALORES
TERRORISMO
PROBCOD
d) ¿A que otro grupo político se parecen más los que se consideran de centro?¿Que les
diferencia?
Tienen bastante similitud con los que Pasan, ya que observando el Mosaico de barras
agrupado se observan ciertas similitudes aunque no muchas.
Les diferencia que no consideran como problemas una desigualdad social o una
pérdida de valores.
Que sus opiniones están más equilibradas, más repartidas, no se decantan tanto por
unos problemas u otros, que es lo que pasa con los de una ideología política en
concreto, sino que están más repartidas sus opiniones y menos concentradas.
TRANSPCOD
CENTRO ANDANDO
COCHE
COMPAÑERO
MOTO/BICI
DERECHAS TRANSP.PUB
IZQUIERDAS
PASA
El estudio comparativo de una variable continua por subgrupos dentro de una muestra
se plantea como un estudio de la distribución condicional de la variable continua
considerada para los distintos valores de una variable discreta que indica la
pertenencia a un grupo concreto.
Estadísticas de Resumen
Datos/Variable: PESO
Curtosis
ALTCOD Estandarizada
150-160 -0,944802
160-170 1,63407
170-180 0,0378084
180-200 -0,459484
150-160
160-170
ALTCOD
170-180
180-200
45 55 65 75 85 95
PESO
ANDANDO
COCHE
TRANSPCOD
COMPAÑERO
MOTO/BICI
TRANSP.PUBLICO
45 55 65 75 85 95
PESO
Hay una caja a la que le falta 1 bigote, que significa que todos los del primer
cuartil están concentrados y por eso no sale ningún bigote. Todo esto nos lleva
a que puede que hayan distribuciones que no tengan bigotes.
Lo único que se aprecia así que pueda parecer más llamativo es que, los que
van en coche, suelen pesar o tienen un rango de peso más concentrado que el
resto de opciones de transporte.
22,02 1
23,83 1
26,67 1
25,38 1
25,49 1
23,5 1
25,9 1
24,98 1
21,49 2
22,67 2
24,62 2
24,18 2
22,78 2
22,56 2
24,46 2
23,79 2
20,33 3
21,67 3
24,67 3
22,45 3
22,28 3
21,95 3
20,49 3
21,81 3
1
nmezcla
20 22 24 26 28
Mezcla
3. Covarianza y correlación
Covarianzas
ALTURA PESO EDAD
ALTURA 82,3711 71,6159 1,31439
(131) (131) (131)
PESO 71,6159 113,569 1,88244
(131) (131) (131)
EDAD 1,31439 1,88244 2,7825
(131) (131) (131)
Se interpretan como varianzas las celdas que coinciden altura – altura, peso – peso y
edad – edad y covarianzas las que no coinciden entre sí.
Las covarianzas miden qué tanto varían las variables conjuntamente, y se utilizan para
calcular las correlaciones momento producto de personas.
Correlaciones
ALTURA PESO EDAD
ALTURA 0,7404 0,0868
(131) (131)
0,0000 0,3241
PESO 0,7404 0,1059
(131) (131)
0,0000 0,2287
EDAD 0,0868 0,1059
(131) (131)
0,3241 0,2287
Los valores son la correlación que existe entre las variables, quiere decir,
cuanto mayor es el escalar, más correlación tiene, más fuerte es. Dos variables
que tengan una correlación pobre significa que no tienen apenas relación y que
no siguen un patrón definido, mientras que si tienen una gran correlación,
significa que tienden a llevar un patrón que los relaciona entre sí.
4. Diagrama de dispersión
95
85
75
PESO
65
55
45
150 160 170 180 190 200
ALTURA
Existe una gran dispersión, aunque se puede apreciar bastante bien la correlación que
hemos obtenido anteriormente del 0.7404 y podríamos obtener una estimación lineal de
esta gráfica para obtenerla.
Statgraphics: Para etiquetar los puntos del gráfico en función de una tercera variable,
seleccionar con el botón derecho del ratón Opciones de Ventana y en el campo Código
de Puntos introducir la variable diferenciadora (SEXCOD).
95 SEXO
1
2
85
75
PESO
65
55
45
150 160 170 180 190 200
ALTURA
Llama la atención que el sexo femenino no predomina en altura y, por lo tanto, en peso,
en lo que sí predominan los hombres, de hecho, ambos sexos se encuentran muy muy
bien agrupados, apenas se mezclan los valores de ambos.
Statgraphics: Para seleccionar parte de la muestra utilizar el botón del Statfolio para
seleccionar variable e indicar un filtro
34
31
28
EDAD
25
22
19
150 160 170 180 190 200
ALTURA