Vous êtes sur la page 1sur 18

ESTADSTICA BIDIMENSIONAL

Analiza el comportamiento conjunto de dos variables en


una unidad de estudio, es decir busca la asociacin o
relacin que existe entre ambas variables, se representa
como un conjunto de pares de datos (X,Y), donde:
X : es la variable independiente (llamado factor)
Y : es la variable dependiente (llamado resultado)
Ejemplos:
Peso y talla de un grupo de personas
Gasto en publicidad y volumen de ventas
Nivel de estudios y regin de procedencia
Ingresos y nivel socioeconmico
Cociente intelectual y rendimiento acadmico

La relacin o dependencia de variables se da entre:

I. Dos variables cualitativas; carrera profesional y
gnero; Nivel de satisfaccin y nivel de estudios,
Nivel de pobreza y Zona de residencia.
II. Dos variables cuantitativas; Ingresos y gastos en
una familia, Precio de PC y la velocidad del
procesador.
III. Una variable cualitativa y una cuantitativa;
Nivel de estudios y edad de las personas; Zona
de ventas y volumen de ventas.

..ESTADSTICA BIDIMENSIONAL..
ORGANIZACIN DE DATOS
La asociacin o dependencia de dos variables
cualitativas se debe resumir los resultados en:
Grfico de barras agrupadas
Tablas de contingencia o bidimensionales

Y
X
y
1
y
2
... y
j
... y
l

x
1
f
11
f
12
f
1j
f
1l
f
1.

x
2
f
21
f
22
f
2j
f
2l
f
2.








x
i
f
i1
f
i2
f
ij
f
il
f
i.







x
k
f
k1
f
k2
f
kj
f
kl
f
k.

f
.1
f
.2
f
.j
f
.l

=
=
k
1 i
. i . i
n f

=
=

1 j
j . j .
n f
n f n
k
1 i 1 j
ij ..
= =

= =

Donde:
Las frecuencias absolutas conjuntas se designa con el
ndice ij es decir: f
ij

La suma de los totales se considera de tres formas:

a) Totales por fila; es la suma total de las frecuencias
absolutas en fila:

b) Totales por columna; es la suma total de las frecuencias
absolutas en columna:

c) Total general; es la suma total de las frecuencias
absolutas: f
..
(igual a n)

. i
f
j
f
.
Para obtener los porcentajes, llamadas tambin
frecuencias relativas o proporciones, existen tres
maneras:

a) Con relacin al total general, est dado por:

b) Con relacin al total de fila :

c) Con relacin al total de columna :

n
f
h
ij
ij
=
n
f
h
i
i
.
.
=
n
f
h
j
j
.
.
=

a) Distribucin marginal de X; est dado por las marcas de clase (X
i
) y
por los totales de las frecuencia por filas (fi.) :






b) Distribucin marginal de Y; est dado por las marcas de clase (Y
j
) y
por los totales de las frecuencias por columnas (f.j) :






X fi.
x
1
f
1.

x
2
f
2.

: :
x
k
f
k.

Total n
i.

Y f.j
y
1
f.j
y
2
f.j
: :
yl f.l
Total n.j
Distribuciones marginales
EJEMPLO 1:
La municipalidad del distrito de Ventanilla est
interesada en averiguar si el nivel de estudios est
asociado a la regin de procedencia de sus
pobladores, para ello ha seleccionado un grupo de
personas se encuentran registradas en la RENIEC
correspondientes a su distrito.
Los resultados se presentan en la siguiente tabla
de frecuencias bidimensional.
Presentacin de resultados
Regin de
procedencia
Nivel de estudios
Total
Primaria Secundaria Superior
n % n % n % n %
Costa
40 10.7 80 21.3 60 16.0 180 48.0
Sierra
35 9.3 35 9.3 30 8.0 100 26.7
Selva
30 8.0 40 10.7 25 6.7 95 25.3
Total 105 28.0 155 41.3 115 30.7 375 100.0
Tabla1. Nivel de estudios de pobladores de Ventanilla por regin de procedencia
De las 375 personas encuestadas, 40 son de la costa y tienen grado de instruccin
primaria y son el 10.7%, 35 son de la sierra y tienen secundaria y son el 9.3%, .40
son de la selva y tienen secundaria y son el 10.7%, .
Se observa en la tabla1, que las personas mayormente han alcanzado estudios
secundarios, el 21.3% son de la costa, el 10.7% de la selva y el 9.3% son de la selva.
Estos resultados indican que el mayor porcentaje de personas con nivel de estudios
superiores son de la costa, lo cual demuestra que hay asociacin o dependencia en
el nivel de estudios alcanzado segn la regin de procedencia de las personas.
Grfico 1. Nivel de estudios de pobladores de Ventanilla por regin de procedencia
El nivel de estudios que mayormente han alcanzado las personas por regin
es secundaria: para la costa el 21.3%, en la sierra es 9.03% y en selva el 10.3%.
0
5
10
15
20
25
Costa Sierra Selva
10.7
9.3
8.0
21.3
9.3
10.7
16.0
8.0
6.7
F
r
e
c
u
e
n
c
i
a

(
%
)

Primaria Secundaria Superior
rea de
residencia
Nivel de pobreza
Total
No pobre Pobre no extremo Pobre extremo
n % n % n % n %
Urbana
2336 270 10 2616 100
Rural
203 20 9 232 100
Total 2539 290 19 2848 100
EJEMPLO 2.
En la encuesta nacional de hogares realizada por el INEI en el 2012 se ha
registrado la zona de residencia de nivel de pobreza de los hogares del
departamento de Lima.
1) Hallar los porcentajes por fila de las familias del departamento de Lima
2) Hallar las frecuencias esperadas
3) Encuentre el estadstico Chi-cuadrado para comprobar si existe o no
asociacin entre la regin de procedencia segn el nivel de pobreza .
Tabla 2. Nivel de pobreza segn regin de procedencia
Estadstico de asociacin: Chi cuadrado
El estadstico Chi-cuadrado (
2
) mide el grado de asociacin o
dependencia entre dos variables cualitativas, que consiste en
comparar los valores observados y esperados en una tabla de
contingencia.
Si el resultado del estadstico es cercano a cero, no existe ningn
grado de asociacin; si el resultado es diferente de cero, puede
afirmarse que existe algn tipo de asociacin entre las dos
variables.

El estadstico se define como:
Donde:
fij : son las frecuencias observadas de la muestra
e
ij
: son las frecuencias esperadas , se obtiene:

k: nmero de categoras de la variable en fila
l: nmero de categoras de la variable en columna
( )
ij
k
i
l
j
ij ij
e
e f

= =

=
1 1
2
2
_
( )( )
n
j f f
e
i
ij
.
.
=
rea de
residencia
Nivel de pobreza
Total
No pobre Pobre no extremo Pobre extremo
n e.
1
n e.
2
n e.
3
n
Urbana
2336 270 10 2616
Rural
203 20 9 232
Total 2539 290 19 2848 100
Tabla 3. Nivel de pobreza segn regin de procedencia
( )
ij
k
i
l
j
ij ij
e
e f

= =

=
1 1
2
2
_
a) Media o promedio de la variable X :



b) Media o promedio de la variable Y :


c) Varianza de la variable X :


d) Varianza de la variable Y :


e) Covarianza de la variable X e Y : mide la variabilidad de X e Y



n
f x
x
k
i
i i
=
=
1
.
n
f y
y
l
j
j j
=
=
1
.
Resumen de estadsticos (Para variables cuantitativas)
( )
n
x x f
S
k
1 i
2
i . i
2
x

=

=
( )
n
y y f
S
l
1 j
2
i j .
2
y

=

=
( )
( )( )
n
y y x x f
y x Cov
k
i
l
j
j i ij
= =

=
1 1
,
Comprobar el grado de relacin de variables cuantitativas a travs de:
* Grfico de dispersin
* Covarianza
* Coeficiente de correlacin de Pearson

a) Grfico de dispersin; representacin de pares de valores
observados en el plano cartesiano, describe la relacin existente
entre las variables, ejemplo de casos:
Medidas de Asociacin
No hay relacin Relacin lineal positiva
Relacin lineal negativa Relacin no lineal
b) Covarianza: mide la variabilidad conjunta de X e Y
Medidas de Asociacin
( )
( )( )
n
y y x x f
y x Cov
k
i
l
j
j i ij
= =

=
1 1
,
c) Coeficiente de correlacin de Pearson (R): mide el grado de
asociacin lineal entre las variables X e Y
1 R 1 : Donde s s
y x
S S
) Y , X cov(
R =
Grado de relacin de variables
Aplicacin
Se ha recolectado la estatura (X) en cm y su peso (Y) en kg de un grupo de
estudiantes cuyos resultados se muestran en la tabla de distribucin de
frecuencias bidimensionales.
Estatura en
cm
Peso en kg
[50, 60> [60, 70> [70, 80>
[160, 165> 12 18 3
[165, 170> 15 25 8
[170, 175> 4 10 5
[175, 180> 1 3 10
a) Hallar las distribuciones marginales
b) Interprete f22 , f33 , f41, f1. , f.2
c) Encuentre e interprete el peso y la talla promedio
d) Encuentre la covarianza entre peso y estatura
e) Hallar el coeficiente de correlacin de Pearson
REGRESIN LINEAL SIMPLE
Consiste en analizar la relacin entre dos variables
cuantitativas, es decir se debe establecer una relacin
funcional Y= f(x), llamado modelo de regresin o
ecuacin de la recta, cuyos objetivos son:
1) Medir el grado de relacin con el coeficiente de
correlacin de Pearson.
2) Predecir el efecto de una variable sobre otra (estimar
valores).
El modelo de regresin es:
ij i i
e bx a Y + =
Donde:
Y: variable dependiente
X: variable independiente
eij: error aleatorio
COEFICIENTE DE CORRELACIN DE PEARSON
Mide el grado de relacin entre variables cuantitativas
El estadstico de correlacin es el coeficiente de
correlacin de Pearson (R) es:
( )

= =
= =


=

1 j
2 2
j
k
1 i
2 2
i
k
1 i 1 j
j i ij
y y n x x n
) y y ( x x f n
R
1 R 1 : Donde s s

Vous aimerez peut-être aussi