Vous êtes sur la page 1sur 9

ESTADISTICA DESCRIPTIVA BIVARIADA

En ocasiones existe la necesidad de realizar el anlisis conjunto de un par de variables medidas sobre los mismos elementos de una muestra.
Ejemplo: Describa el comportamiento de las siguientes variables
Peso (X) Estatura (Y) 67 1.71 77 1.75 85 1.78 94 1.86 65 1.66 71 1.76 78 1.79 80 1.77 76 1.80 87 1.74

Una primera opcin de anlisis, seria analizar cada variable de manera independiente desde las recientemente conocidas tcnicas de estadstica descriptiva. Sin embargo esto dejara de lado la asociacin que existe entre variables.
Jaime Mosquera

TABLA DE DISTRIBUCION CONJUNTA


Es una tabla de doble entrada que permite resumir los datos provenientes de la medicin de dos variables (X, Y), de tal manera que logre hacerse un anlisis conjunto de las mismas
Ejemplo: Para una muestra de 42 familias se observ el numero de personas que conforman la familia (X) y el numero de personas econmicamente activas dentro de esa familia (Y).
X 6 2 4 4 3 3 4 5 5 Y 4 1 2 1 1 3 2 2 3 X 5 6 6 5 4 4 4 3 3 Y 5 4 4 3 2 2 2 1 1 X 2 2 3 4 6 6 3 4 4 Y 1 2 1 1 2 1 2 1 2 X 5 5 6 4 3 5 5 5 6 Y 1 2 4 1 1 4 1 3 1 X 1 2 1 4 4 4 5 Y 1 2 1 3 3 4 4

Jaime Mosquera

TABLA DISTRIBUCION CONJUNTA DE FRECUENCIAS ABSOLUTAS


# Personas Economicamente Activas (Y) 1 2 3 4 5 # Personas por Familia (X) 1 2 3 4 5 6 2 2 5 4 2 2 17 0 2 1 6 2 1 12 0 0 1 2 3 0 6 0 0 0 1 2 3 6 0 0 0 0 1 0 1

ni.
2 4 7 13 10 6 42

Distribucin de Frecuencia Marginal de X

n.j

Distribucin de Frecuencia Marginal de Y

1. Cuantas familias estn conformadas por 4 personas y presentan 2 personas econmicamente activas? 2. Cuantas familias estn conformadas por 5 personas o menos y presentan 3 personas econmicamente activas?
Jaime Mosquera

TABLA DISTRIBUCION CONJUNTA DE FRECUENCIAS


3. Que porcentaje de familias est conformada por 4 personas y presenta 1 persona econmicamente activa ? 4. Cuantas familias estn conformadas por 5 personas o menos y presentan 3 personas econmicamente activas? 5. Como puede representar grficamente esta tabla de frecuencias? y sus distribuciones marginales?. 6. Construya la tabla de distribucin conjunta de frecuencias relativas hij. 7. Interprete h43, h.3, h2. H (5, 6). 8. Que porcentaje de hogares esta compuesta por personas todas econmicamente activas. Qu informacin adicional, puede usted obtener desde este contexto?
Recuerden: Todo indicador estadstico pierde su efectividad si no tiene asociada una interpretacin consistente y enfocada sobre el contexto del problema y sus implicaciones Jaime Mosquera

NOTACIN
n = nmero total de individuos en la muestra nij = nmero de individuos que pertenecen a la categora i de la variable X y a la categora j de la variable Y ni. = nmero de individuos que pertenecen a la categora i de la variable X n.j= nmero de individuos que pertenecen a la categora j de la variable Y hij = proporcin de individuos que pertenecen a la categora i de la variable X y a la categora j de la variable Y. hi. = proporcin de individuos que pertenecen a la categora i de la variable X h.j= nmero de individuos que pertenecen a la categora j de la variable Y N(x,y) = nmero de individuos cuya caracterstica X es menor o igual a x, y su caracterstica Y es menor o igual a y. H(x,y) = Proporcin de individuos cuya caracterstica X es menor o igual a x, y su caracterstica Y es menor o igual a y.
Jaime Mosquera

TABLA DISTRIBUCION CONJUNTA DE FRECUENCIAS ABSOLUTAS


La conformacin de la tabla parte del agrupamiento de los valores de las variables, segn categoras. (X1, X2,X3, X4,,Xm) para la variable X; y (Y1, Y2, Y3, Y4, Ys) para la variable Y. Categorias que deben cumplir las siguiente propiedades Frecuencias Absolutas Frecuencias Relativas

1. nij = n
i =1 j =i

4. ni . = n
i =1

6. hij = 1
i =1 j =i

9. hi . = 1
i =1

2. nij = n. j
i =1

5. n.s = n
j =1

7. hij = h. j
i =1

10. h.s = 1
j =1

3. nij = ni.
j =1

8. hij = hi.
j =1

Jaime Mosquera

TABLA DISTRIBUCION CONJUNTA DE FRECUENCIAS ABSOLUTAS


(Caso dos variables continuas) Una empresa cultivadora de caa est interesada en estudiar la relacin el comportamiento de su produccin de caa conjuntamente con el rea cultivada para su produccin. Para ello ha colectado informacin de 200 fincas acerca de X: rea de la finca destinada al cultivo de caa (Hectreas), Y: Produccin total de caa reportada durante la ltima cosecha (Toneladas)
X: Hectareas cultivadas 0-35 34 23 13 0 Y = Produccion de caa 35-70 70-120 120-180 30 14 2 12 20 4 8 24 4 0 2 5 180-280 0 1 1 3

0-20 20-50 50-100 100-150

a) Construya la distribucin de frecuencia marginal de X e Y. b) Represente grficamente la distribucin de frecuencias.


Jaime Mosquera

TABLA DISTRIBUCION CONJUNTA DE FRECUENCIAS


3. Construya la distribucin de frecuencias relativas y sus marginales 4. Que porcentaje de fincas tiene un rea cultivada menor que 20 hectreas? 5. Que porcentaje de fincas tiene un rea cultivada menor que 50 hectreas y produce menos de 120 toneladas de caa? 6. Que porcentaje de fincas tiene un rea cultivada superior a 100 hectreas y una produccin inferior a 180 toneladas? 7. Que porcentaje de fincas tiene un rea cultivada comprendida entre 20 y 100 hectreas y produce entre 70 y 180 toneladas de caa? 8. Que porcentaje de fincas tiene un rea cultivada entre 20 y 120 y produce entre 40 y 120 toneladas. 9. Que porcentaje de fincas produce entre 140 y 180 toneladas y tiene un rea cultivada entre 10 y 110 hectreas.
Jaime Mosquera

INDEPENDENCIA ESTADISTICA
Definicin: Dos variables X e Y son independientes estadsticamente si la distribucin de X es la misma para cualquier subconjunto de individuos conformados desde agrupamientos en Y
X: numero de hijos
h(X=1)=0,3 h(X=2)=0,35 h(X=3)=0,25
h(X>3)=0,1

Y: Estrato socioeconmico
h(X=1)=0,3 h(X=1)=0,3 h(X=2)=0,35 h(X=3)=0,25
h(X>3)=0,1

h(X=1)=0,3 h(X=2)=0,35 h(X=3)=0,25


h(X>3)=0,1

h(X=1)=0,3 h(X=2)=0,35 h(X=3)=0,25


h(X>3)=0,1

h(X=1)=0,3 h(X=2)=0,35 h(X=3)=0,25


h(X>3)=0,1

h(X=2)=0,35 h(X=3)=0,25
h(X>3)=0,1

Y=1 Estrato 1

Y=2 Estrato 2

Y=3 Estrato 3

Y=4 Estrato 3

Y=5 Estrato 4

Y=6 Estrato 6

Lo anterior implica que

h( X i / Y j ) = h( X i )

Para todo i, j
Jaime Mosquera

INDEPENDENCIA ESTADISTICA
Equivalentemente existe independencia entre X e Y si:

h(Y j / X i ) = h(Y j )
De la misma manera si:

Para todo i, j

h( X i Y j ) = h( X i )h(Y j ) hij = hi.h. j


Para todo i, j

Lo anterior quiere decir que si en una tabla de frecuencias conjuntas, encontramos que para cualquier par de categoras de X e Y se cumple la condicin anterior, entonces X e Y son independientes. Bastara con un par de categoras que no cumpla la condicin para decir que las variables son dependientes?
Jaime Mosquera

INDEPENDENCIA ESTADISTICA
Ejemplo 1: Bajo la condicin anterior verifique la dependencia o independencia entre este par de variables
X1 X2 X3 Y.j Y1 0,100 0,040 0,060 0,2 Y2 0,125 0,050 0,075 0,25 Y3 0,150 0,060 0,090 0,3 Y4 0,125 0,050 0,075 0,25 Xi. 0,5 0,2 0,3 1,0

Son independientes?

Ejemplo 2
X1 X2 X3 Y. j Y1 0,100 0,040 0,060 0,2 Y2 0,125 0,040 0,085 0,25 Y3 0,150 0,070 0,080 0,3 Y4 0,125 0,050 0,075 0,25 Xi . 0,5 0,2 0,3 1,0

Son independientes?, note como ligeras desviaciones conllevan a conclusiones diferentes


Jaime Mosquera

INDICADORES DE LA DEPENDENCIA ESTADISTICA


Recordemos: Si X e Y son independientes

ni.n. j n n. j hij = hi .h. j = i. n*ij = n n n n

nij

Frecuencia conjunta bajo el supuesto de independencia

Un Indicador de dependencia estadstica ser una medicin del alejamiento entre la condicin supuesta de independencia y la situacin observada, lo cual puede verse como: Cuadrado de Contingencia

(n
2 =
2
i =1 j =1

ij

n ij )

2 = 0 >0
2

Independencia Dependencia

n*ij

2 m s nij = n 1 i =1 j =1 ni .n. j

Jaime Mosquera

INDICADORES DE LA DEPENDENCIA ESTADISTICA


Problemas del cuadrado de contingencia
2 = n
i =1
m

1 j =1 ni . n. j
s 2 nij

Se ve afectado por el numero total de observaciones. Para eliminar este problema se acostumbra trabajar con el cuadrado medio de contingencia:

f =

2
n

=
i =1 j =1

2 nij

ni.n. j

Coeficiente de Contingencia de Cramer

f 2 min( m 1; s 1)

0 H 2 1

Entre mas cercano a 1, mayor es el nivel de dependencia entre las variables


Jaime Mosquera

INDICADORES DE LA DEPENDENCIA ESTADISTICA


X: Hectareas cultivadas

Ejercicios: Calcule los tres indicadores de dependencia para las siguientes distribuciones conjuntas
0-35 34 23 13 0 Y = Produccion de caa 35-70 70-120 120-180 30 14 2 12 20 4 8 24 4 0 2 5 180-280 0 1 1 3

0-20 20-50 50-100 100-150

# Personas Economicamente Activas (Y) 1 2 3 4 5 # Personas por Familia (X) 1 2 3 4 5 6 2 2 5 4 2 2 17 0 2 1 6 2 1 12 0 0 1 2 3 0 6 0 0 0 1 2 3 6 0 0 0 0 1 0 1

ni.
2 4 7 13 10 6 42

n.j

Jaime Mosquera

Media y Varianza de Distribuciones Condicionales


Recuerde: En algunos momentos es importante conocer como se comporta una variable para una determinada subpoblacin, conformada a travs de las categoras de la otra variable. Por ejemplo: Cual es el numero de hijos promedio para las familias de estrato 1?, cual el de las familias de estrato 6?
Note como la pregunta apunta a conocer el valor de la media de la variable numero de hijos (X) condicionada al estrato socioeconmico de la familia (Y), lo cual en adelante denominaremos Media de X calculada nicamente sobre los individuos que cumplen con la condicin Y= yi

M ( X / Y = yi )

Jaime Mosquera

Media de Distribuciones Condicionales


Y1 10 25 35 30 15 15 130 Y2 10 35 25 20 15 5 110 Estrato Socioeconomico Y3 Y4 12 12 28 27 18 18 10 6 9 4 3 3 80 70 Y5 13 25 12 4 3 3 60 Y6 15 22 10 1 1 1 50 Xi. 72 162 118 71 47 30 500

X1 X2 X3 X4 X5 X6 Y.j

numero de hijos

Para calcular un promedio condicional tenemos dos alternativas:

1. Desde la tabla de distribucin de frecuencias condicionales


M ( X / Y = y j ) = X i h( X i / Y = y j )
i =1 m

2. Directamente desde la tabla de distribucin de frecuencias conjunta

M (X /Y = yj ) = Xi
i =1

nij n. j
Jaime Mosquera

Varianza de Distribuciones Condicionales


Por ejemplo: De la misma manera pudiramos preguntarnos por la varianza del numero de hijos para las familias de estrato 1,2, 3,6
Recordemos la expresin de la varianza general:

(x X )
i

S2 =

i =1

; S 2 = hi ( xi X ) 2
i =1

Al condicionar sobre un valor de Y= yj

S 2 = h( X i / Y j ).( xi M ( X / Y j )) 2

i =1

Desde la distribucin de frecuencias condicionales Desde la distribucin de frecuencias conjunta


Jaime Mosquera

nij S 2 = .( xi M ( X / Y j )) 2 i =1 n. j
m

Vous aimerez peut-être aussi