Académique Documents
Professionnel Documents
Culture Documents
2012
pg.
1
INDICE
Unidad 1
1. Coeficiente de Curtosis
Clasificacin de las distribuciones de datos segn el valor del Coeficiente de Curtosis Aplicacin en datos reales propios de la carrera Conclusiones
2.1 2.2
Unidad 2 : Ejercicios 3, 2 y 12
3. Funcin Generadora de momentos y distribucin normal bivariada
Definicin, propiedades frmulas de clculo e interpretacin. Aplicacin en datos reales propios de la carrera Definicin de distribucin normal bivariada. Aplicacin de datos reales de la carrera
Unidad 3:
4. Estimacin por intervalos (a nivel de confianza 96%)
4.1 4.2
pg.
4.3 4.4
Ajustes del mximo error muestral y determinacin del nuevo tamao de la muestra. Conclusiones.
Prueba de hiptesis para dos varianzas independientes. Conclusiones Prueba de hiptesis para independientes. Conclusiones dos medias
Poblacionales poblacionales
de muestras de muestras
Prueba de hiptesis para dos proporciones poblacionales de muestras independientes. Conclusiones Prueba de hiptesis para dos medias poblacionales de muestras relacionadas. Conclusiones
Unidad 4:
4.1 Prueba de Independencia entre dos variables 4.2 Prueba de Homogeneidad de Proporciones 4.3- Prueba de Bondad de Ajuste
Unidad 5:
5.1- Anlisis de diseo Completamente Aleatorizado: 5.2- Diseo con Bloques Completos Aleatorizados: 5.3- Diseo factorial de dos factores:
6.
Bibliografa
www.trademap.org (TRADEMAP) Instituto del Mar del Per (IMARPE) Instituto Nacional de Estadstica e Informtica (INEI) Banco Central de Reserva del Per (BCRP) www.scribd.com (SCRIBD) Estadstica Inferencial, Manuel Crdova Zamora
pg.
Estadstica Matemtica, William Mendenhall Estadstica para Admin y Eco con aplicaciones en Excell. Universidad de Piura
1.1 -Definicin de curtosis Se trata de una medida que indica el grado de apuntamiento de la distribucin o anchura de sus colas. Al igual que en el caso del coeficiente de asimetra, se toma el coeficiente de curtosis de la distribucin normal como valor referencial. Formalmente, el coeficiente de curtosis se construye a partir del cuarto momento de la distribucin y el cuadrado de su varianza (o la cuarta potencia de su desviacin estndar).
1.3 - Clasificacin de las distribuciones de datos segn el valor del coeficiente de curtosis a) Platicrtica.- si el coeficiente de cutorsis es menor a tres. Poseen un menor apuntamiento (centro ms ancho). Reducido grado de concentracin alrededor de valores centrales de la variable. b) Leptocrtica.- si el cuarto momento es ms de tres veces el cuadrado de la varianza (coeficiente de curtosis mayor a tres). Poseen un mayor apuntamiento (centro ms delgado) y colas ms anchas. c) Mesocrtica.- una distribucin cuyo coeficiente de curtosis se aproxima al valor de tres. Presenta un grado de concentracin medio alrededor de valores centrales de la variable.
pg.
1.4 - Aplicacin en datos reales propios de la carrera. La extraccin de anchoveta ha generado un impacto negativo en poblacional de esta especie. Sus poblaciones se han vuelto ms pequeas y susceptibles a las variaciones del ecosistema y es de esta manera que hoy en da es ms difcil y costoso pescar anchoveta. Por ello se ve a continuacin un breve detalle estadstico de baja extraccin de anchovetas con los aos, segn ello obtener el coeficiente de cutorsis y clasifique la distribucin segn su deformacin vertical:
= 782806.5 *
= 1.090937*
http://www.imarpe.pe/imarpe/archivos/informes/imarpe_infpel_anch_region_sur_2009.pdf
pg.
AO
TOTAL EN ( - ) TONELADA S 1254934 193317 662330 1026673 866353 920627 801244 536974 6262452 472127.5 -589489.5 -120476.5 1026673 83546.5 137820.5 18437.5 -245832.5 782806.5 4.96864E+ 22 1.20755E+ 23 2.10673E+ 20 1.11104E+ 24 4.87206E+ 19 3.60791E+ 20 1.1556E+1 7 3.65222E+ 21 1.28575E+ 24 4.5544665 69 11.068904 08 0.0193112 19 101.84246 25 0.0044659 45 0.0330716 31 1.05927E05 0.3347784 69 117.85747 11 7.27266E-07 1.7675E-06 3.08365E-09 1.62624E-05 7.1313E-10 5.28094E-09 1.69147E-12 5.3458E-08 1.88197E-05= 0.0000188197
2002 2003 2004 2005 2006 2007 2008 2009 TOTAL GENERAL
1.5 Conclusin El desarrollo del ejercicio muestra una curtosis con una distribucin segn su deformacin Platicurtica (El coeficiente de curtosis es menor a tres), lo que significa que los datos estn muy dispersos.
pg.
Promedio de ingresos 250 750 1250 2000 3000 4250 6250 8750 12500 17500 25000 35000 45000 55000 65000 75000 90000 100000
Personas Frec. Absol simple Frec. Abs. Acumulada 2,543,200 2,543,200 2,360,800 4,904,000 2,096,800 7,000,800 3,370,500 10,371,300 2,415,800 12,787,100 2,368,700 15,155,800 2,100,200 17,256,000 1,036,600 18,292,600 921,000 19,213,600 379,900 19,593,500 302,700 19,896,200 116,400 20,012,600 57,200 20,069,800 32,500 20,102,300 20,400 20,122,700 13,600 20,136,300 17,700 20,154,000 59,200 20,213,200 20,213,200
Frecuencias Relativas Simple Acumulada 12.5819% 12.5819% 11.6795% 24.2614% 10.3734% 34.6348% 16.6747% 51.3095% 11.9516% 63.2611% 11.7186% 74.9797% 10.3902% 85.3700% 5.1283% 90.4983% 4.5564% 95.0547% 1.8795% 96.9342% 1.4975% 98.4317% 0.5759% 99.0076% 0.2830% 99.2906% 0.1608% 99.4513% 0.1009% 99.5523% 0.0673% 99.6196% 0.0876% 99.7071% 0.2929% 100.0000%
o s e r g n I
0,4 0,3 0,2 0,1 0 0 0,1 0,2 0,3 0,4 0,5 Personas 0,6 0,7 0,8 0,9 1
Interpretacin: La curva de Lorenz nos muestra grficamente la distribucin relativa del promedio de ingresos en la poblacin. A partir de los datos anteriormente mencionados se puede concluir que en el Per existe una desigualdad media en cuanto a los ingresos.
pg.
Xi 250 750 1250 2000 3000 4250 6250 8750 12500 17500 25000 35000 45000 55000 65000 75000 90000 100000
ni 2,543,200 2,360,800 2,096,800 3,370,500 2,415,800 2,368,700 2,100,200 1,036,600 921,000 379,900 302,700 116,400 57,200 32,500 20,400 13,600 17,700 59,200 20,213,200
Porcentajes Acumulados Ingresos Personas 0.00667142 0.12581877 0.02525025 0.24261374 0.05275229 0.34634793 0.12348531 0.5130954 0.19953196 0.63261136 0.30516429 0.74979716 0.44289746 0.85369956 0.5380712 0.90498288 0.65887136 0.95054717 0.72863116 0.96934182 0.80803661 0.98431718 0.85078491 0.99007579 0.87779378 0.99290563 0.89654994 0.99451349 0.9104636 0.99552273 0.92116642 0.99619556 0.9378817 0.99707122 1 1
% p-% i 0.11914735 0.21736349 0.29359564 0.38961009 0.4330794 0.44463287 0.4108021 0.36691168 0.29167581 0.24071066 0.17628057 0.13929088 0.11511184 0.09796354 0.08505913 0.07502914 0.05918952 0
Interpretacin: El ndice de Gini de 29,87% indica que el nivel de ingresos est bastante uniformemente repartido entre la poblacin, es decir, su nivel de concentracin no es excesivamente alto.
Ejercicio 3
Suponga que el valor (en dlares) en la bolsa de valores de las acciones se 5 empresas es:
ALFA 6
BETA 10
GAMA 9
DELTA 8
YPSILON 6
pg.
X : Menor valor de las acciones de las empresas elegidas Y: Mayor valor de las acciones de las empresas elegidas Halle la Funcin de Probabilidad Conjunta de X e Y
SOLUCION
F(x)
, x=0, 1, 2,3,,9
0, otros casos
F (y)
, y=0, 1, 2,3,,10
0, otros casos
Probabilidad de (6,9)=2/10
pg.
Probabilidad de (6,8)=2/10 Probabilidad de (6,6)=1/10 Probabilidad de (9,10)= 1/10 Probabilidad de (8,10)=1/10 Probabilidad de (8,9)= 1/10
Ejercicio 2
Ana y Alba han acordado reunirse para almorzar entre el medioda (12 horas) y la 1.00 PM. Sea X la hora de llegada de Ana e Y la hora de llegada de Alba. Suponga que las horas de llegada son independientes con las siguientes funciones de densidad marginales
Cul es la probabilidad de que la persona que llegue primero, espere a la otra menos de un cuarto de hora? Solucin: X e Y eventos independientes
pg.
10
pg.
11
P (Y-X< 0.25) =
Ejercicio 12
Sea la f(x;y) la funcin de densidad conjunta para X e Y.
pg.
12
a. Calcule el valor de k b. Determine E(x) c. Determina E(xy) d. Determina E( y) e. Calcule el valor de la covarianza de X e Y*
Solucin de la a:
Solucin de la b:
Solucin de la c:
pg.
13
Solucin de la d:
Solucin de la e:
El r-simo momento de X con respecto al origen es el valor esperado de la variable aleatoria elevada a la r-sima potencia, es decir:
E X r = x r f ( x ),
x
[ ]
r
E X
]=
x r f ( x) d ( x),
1.2.
pg.
14
E ( X ) r = ( x ) r f ( x),
x
E (X
) r = ( x ) r f ( x ) d ( x ),
continua.
1.3.
El valor esperado de z(x) es el k-simo momento de la variable X respecto a la media y se llama k.. De acuerdo a este concepto los momentos dependern de que valor tome k.
E X
distribucin.
[ ]
a la
diferencia entre el segundo momento respecto al origen y el cuadrado del primer momento respecto al origen.
1.4.
Propiedades:
Las funciones generadoras de momentos existirn slo si la suma o integral de (*) converge.
(*)
pg.
15
. Entonces:
(Teorema de unicidad) Sean X y Y dos variables aleatorias con funciones generadoras de momentos y , respectivamente. Si = para
Prueba:
Prueba:
Si
de momentos entonces:
, respectivamente, y
pg.
16
3.2
Aplicacin:
Una fabrica prendas de vestir llamada Textilex S.A est pasando por un momento de reclamos de parte de sus trabajadores, ya que es una de las mejores empresas en su rubro en el pas, y ellos hace ms de un ao vienen reclamando que los sueldos son muy dispersos y que merecen un aumento de sueldos. A continuacin se presenta un cuadro con la distribucin de sueldos:
Nmero
2.0 2.2 2.4 2.6 2.8 3.0 3.2 3.4 3.6 3.8 2.2 2.4 2.6 2.8 3.0 3.2 3.4 3.6 3.8 4.0
10 30 50 40 20 15 10 5 4 2
186
El gerente de finanzas ha determinado que har un estudio con este cuadro del cual sacar el coeficiente de asimetra (As) y la Curtosis (g2) de la distribucin de sueldos para saber que tan disperso estn los datos de la media de la distribucin de sueldos. En la ultima reunin que tuvo el gerente de fianzas con el representante de los trabajadores de la empresa, llegaron a un acuerdo en el cual se concluy lo siguiente: Se har un aumento de sueldos progresivo slo para los trabajadores que ganan menos que el sueldo promedio en caso que la distribucin de los sueldos tenga una asimetra negativa y tenga una clasificacin de curtosis platicurtica , el representante de los trabajadores acept el trato y est a espero del informe que se presentar el da de maana en una reunin en la empresa. Calcular si los trabajadores que ganan menos de promedio lograrn un aumento de sueldos o no. Resultados obtenidos despus del anlisis: Media origen) Varianza origen) (1 momento respecto al 2.6914
(2 momento respecto al
0.1466
pg.
17
2.6706
0.5935
Conclusin: La asimetra obtenida respecto a los datos es positiva, esto seala que tiene una asimetra positiva lo cual significa que los datos estn ms concentrados para el lado en que los sueldos son mayores (mucho ms que el sueldo promedio) y respecto a la curtosis vemos que tambin es positiva (Leptocrtica). Con estos resultados vemos que el aumento de los sueldos menores al promedio no sern posibles, debido a que no cumplen las condiciones del trato entre el gerente de finanzas y el representante de los trabajadores. El gerente de finanzas propuso esos requisitos para el aumento de sueldos, porque seria necesario en caso que los sueldos estaran considerados en el extremo inferior, lo cual no sucede en esta empresa, adems, si la curtosis hubiera sido negativa hubiera sido punto a favor de los trabajadores, pero en este caso no sucedi ya que se demostraria que es un reclamo justo, pero despus del analisis, nos damos cuenta que no es as.
Informacin adicional para entender un poco ms acerca de la curtosis: Es una forma de medir la dispersin o la concentracin de los datos de una distribucion, por ejemplo, cuando tiene datos muy dispersos la grfica de la distribucin estar muy "Aplanada" mientras que si los datos estn muy concentrados o cercanos al promedio la distribucin estar dentro de una distribucin muy estrecha.
La Curtosis mide al apuntamiento de una distribucin Distribucin Platicurtica: Distribucin Mesocrtica: Distribucin Leptocurtica: Datos muy dispersos Distribucin Normal Datos muy concentrados K<0 K=0 K>0
http://es.scribd.com/ferangares/d/31296483-Distribucion-Normal-Bivariada
pg.
18
Sea (x,y) variable aleatoria continua, bidimensional que toma todos los valores en el plano. Entonces, (x, y) tiene una distribucin normal bivariada si su funcin de densidad de probabilidad conjunta (fdp) est dada por la siguiente expresin:
Para que f defina un fdp legtima (f(x,y) mayor igual a cero), debemos poner las siguientes restricciones:
pg.
19
3.4 - APLICACIONES3 Este cuadro nos muestra la pesca de Jurel en el Per por ao (2004 2008) y por rea (north, center and south boundary). La toma de volumen de las capturas de caballa en el Per fluctu entre 49,000 y 280,000 toneladas, mostrando una diminucin gradual de 2006 a 2008, cuando 121,000 fueron capturadas. Durante este perodo, hay que destacar la disminucin de las capturas en la zona norte y su aumento en la zona central y sur de la costa peruana que son en la actualidad las principales reas de pesca.
http://www.imarpe.pe/imarpe/archivos/reportes/imarpe_injure_peru_natio_rep_auckland_s wg_fin_311009.pdf
pg.
20
Ao 2004
Total x 0
Total y 20371
)*(
156081113.5
2005
720
31776
-7660.4
0.785 (18899)^ 2
280374540.2
65247 5286 64
Media poblacional de x = 14263.4. Esto me indica un promedio de pesca de Jurel en Per en el periodo del 2004 al 2008 del rea north boundary.
Media poblacional de y = 39436.4. Esto me indica un promedio de pesca de Jurel en Per en el periodo del 2004 al 2008 del rea south boundary.
Desviacin estndar poblacional de x = 25567.21 La desviacin estndar es una medida de incertidumbre, nos muestra el grado de dispersin de los datos respecto a la media. Una desviacin estndar alta indica que los puntos estan lejos de la media y una desviacin estndar pequea indica que los datos estn agrupados cerca de la media. Entonces, en este caso, los datos presentan un alto grado de dispersin de la pesca de jurel respecto a la media en el rea north boundary (lmite norte), ya que la desviacin estndar es alta.
pg.
21
Desviacin estndar poblacional de y =18898.81. En este caso, los datos presentan un alto grado de dispersin de la pesca de jurel respecto a la media en el rea south boundary (lmite sur), ya que la desviacin estndar tambin es alta.
1.- Estimacin de una media poblacional. Se desea saber la cantidad media del producto bruto interno del Per en los ltimos 30 aos, a fin de establecer la relacin de la demanda interna y la demanda externa neta. Para ello se obtuvieron muestras en millones de soles de la produccin nacional de bienes y servicios de Per. A partir de los datos halle: Asumiendo normalidad en la cantidad de millones de soles, construya un intervalo de confianza del 96% para el promedio del PBI (millones de soles).
AOS 1981 1982 1983 1984 1985 1986 1987 1988 1989 1990 1991 1992 1993
PBI 90,354 95,291 94,979 86,111 89,382 91,250 102,301 110,222 99,839 86,431 82,032 83,760 83,401
pg.
22
1994 1995 1996 1997 1998 1999 2000 2001 2002 2003 2004 2005 2006 2007 2008 2009 2010 2011
87,375 98,577 107,064 109,760 117,294 116,522 117,587 121,057 121,317 127,402 132,545 139,141 148,640 160,145 174,407 191,505 193,155 210,143
pg.
23
Conclusin: Con un nivel de confianza del 96% la media del Producto Bruto Interno del Per est entre 104,499.37 y 132,209.73millones de soles.
2.- Estimacin de una desviacin estndar: A partir de los datos anteriores halle la variabilidad de la cantidad promedio de la produccin total de bienes y servicios anuales en millones de soles, con un nivel de confianza del 96%:
Conclusin: con un nivel de confianza del 96% la variabilidad del PBI nacional est entre 27812.94 y 48158.48 millones de soles.
Se cuenta con una data real con los datos del PBI desde los ltimos 60 aos, se quiere saber si puede haber un incremento de 2.5% en el producto total del Per. Si en la muestra elegida se encontr que en 50 aos hubo un aumento del PBI con respecto al ao anterior, determine e interprete un intervalo de 96% para la verdadera proporcin de aos que aumentaron el producto con respecto al ao anterior.
pg.
24
p=
x 50 = 0.83 = n 60
0.83-2.06*
0.83 * (1 0.83) 60
Conclusin: El intervalo de confianza [73.01%, 92.99%] contiene a la verdadera proporcin aos que aumentaron el producto con respecto al ao anterior, con un nivel de confianza del 96%.
4.- Realice ajustes del mximo error muestral y determine el nuevo tamao de muestra. Tamao de muestra para una media poblacional: e max = 118,354.5502 104,499.37= 13,855.1802 n= (
El nuevo tamao de muestra sera 28 aos con los datos reales del PBI.
1. Dos varianzas poblacionales de muestras independientes: Se desea conocer si existe evidencia de una diferencia en las varianzas de las cantidades producidas de dos tipos de tubrculos del sector agrcola que estn expresados en miles de toneladas. La descripcin de las lecturas de la cantidad producida de los tubrculos se muestra a continuacin PRODUC. AGRICOLAS mar-10 abr-10 may-10 YUCA 89,4 96,6 98,4 PAPA 350,4 728,8 813,8
pg.
25
A partir de los datos obtenidos compruebe la hiptesis con un nivel de significacin del 4% .Asuma poblaciones normales con varianzas iguales: Solucin:
1. Planteo de hiptesis:
2 H 0 : 1 =2 2
H1 ;
2 1 2 2
S12 1 * c= F S 22 12 22
~ f ( n1 1, n2 1)
pg.
26
5. Regiones Crticas. Criterios de Decisin: Si: 0.2481 f c 4.03 No se rechaza la hiptesis nula Si: f c <0.2481 o f c > 4.03 Se rechaza la hiptesis nula TUBERCULOS Media Varianza Observaciones YUCA 105,198277 96,3707218 10 PAPA 338,622564 57778,7994 10
6. Clculos:
2. Dos medias poblacionales de muestras independientes: Dado que el sector agropecuario es una de los componentes muy importantes del PBI. Se desea verificar si existe evidencia de una diferencia en la produccin promedio entre dos sectores el agrcola y el pecuario. La descripcin de las lecturas en miles de toneladas producidas de los dos sectores se muestra a continuacin:
pg.
27
A partir de los datos obtenidos compruebe la hiptesis y concluya con un nivel de significacin del 4%.Asuma poblaciones normales. Solucin: Sea: X 1 : (Cantidad expresada en miles de toneladas del sector Agricola) X 1 ~ N (u 1 , 1 )
2
2 X 2 : (Cantidad expresada en miles de toneladas del sector Pecuario) X 2 ~ N (u 2 , 2 )
1. Planteo de Hiptesis:
2 H 0 : 1 =2 2
H1 ;
2 1 2 2
S12 1 * S 22 12 22
~ f ( n1 1, n2 1)
pg.
28
Si f c <0.2481 o f c > 4.03 se rechaza la hiptesis nula 6. Clculos: SECTORES Media Varianza de la muestra Observaviones AGRCOLA 4,24889297 12,6000752 10 PECUARIO 4,44404633 6,12209632 10
u1 = u 2 u1 u 2
H1 :
( x1 x 2 ) (u1 u 2 ) 1 ~ t n1 +n2 2 ) 2 1 Sp ( + ) n1 n 2
pg.
29
2 p
(4,24889297 4,44404633) 0 = Tc = 1 1 2 Sp *( + ) 10 10
-0.06081582163
7. Conclusin: con 4% de nivel de significacin y la informacin muestral es insuficiente para rechazar la hiptesis nula. Por lo tanto se puede decir que los promedios entre los sectores AGRICOLAS y PECUARIOS en el Per son similares en los meses que comprenden marzo-2010 hasta diciembre-2010 3. Dos proporciones poblacionales de muestras independientes: En una investigacin hecha por alumnos de la UPC, se recopilaron los siguientes datos de las exportaciones FOB en los dos ltimos aos. Se desea saber cul de los dos primeros meses (Enero) represent una mayor participacin respecto al total de exportaciones semestrales peruano. Per - Export (Mill. de $ (Valor-FOB))
2011
Enero Febrero Marzo Abril Mayo Junio Julio Agosto Setiembre Octubre Noviembre Diciembre Fuente: Inei
2,438.9 2,655.2 2,830.3 2,654.9 2,401.9 3,107.3 3,011.9 2,985.3 3,301.7 3,152.3 3,311.9 3,713.3
pg.
30
2012
Fuente: Inei
A partir de los datos obtenidos compruebe la hiptesis que la proporcin de exportaciones de ambos meses no ha variado de un ao a otro y concluya con un nivel de significacin del 4%. Solucin: Sea: P 1 : (Prop. de exportaciones en enero con respecto al primer semestre del ao 2010 expresada en millones de dlares) P 2 : (Prop. de exportaciones en enero con respecto al primer semestre del ao 2011 expresada en millones de dlares) 1. Planteo de Hiptesis:
pg.
31
H0: p =p 1 2 H1 : p p2 1
5. Regiones Crticas. Criterios de Decisin: Si -2.05 Z c 2.05 no se rechaza la hiptesis nula Si Z c <-2.05 o Z c > 2.05 se rechaza la hiptesis nula 6. Clculos:
7. Conclusin: Con 4% de nivel de significancia hay diferencias significativas en las proporciones en las exportaciones de enero acorde a cada semestre.
pg.
32
Con referencia a los datos anteriores se desea probar si el Per ha exportado 2.5 toneladas adicionales en promedio, en el ao 2012 con relacin al ao 2011. Con un nivel de significacin de 4%. Per - Export de esprragos en TN por aos Importadores Estados Unidos Holanda Reino Unido Espaa Japon Australia Francia Brasil 2010 2011
87.663 85.34 13.338 13.338 7.951 6.084 857 1.206 713 489 6.323 9.027 1.501 1.261 785 644
=4%
3. Prueba Estadstica:
d D S d ~ t ( n 1) n
4. Supuestos: Las diferencias tienen distribucin normal. 5. Regiones Crticas: Criterios de decisin. La hiptesis alternante define las zonas de rechazo
pg.
33
No se rechaza H 0 Se rechaza H 0
d = -78.6815
Sd = 318.8322493
tc=
= -0.7201779
7. Conclusiones: Con un nivel de significancia del 4%, la informacin muestral permite rechazar la hiptesis nula, por lo tanto se puede decir que el Per no ha exportado 2.5 toneladas adicionales en los pases estudiados.
4.1-Prueba de Independencia entre dos variables El vertiginoso crecimiento, gracias a una buena gestin econmica del gobierno que empezara en los aos 2000 y que sigue a la fecha, gener la migracin de un gran nmero de peruanos buscando ser parte de esta bonanza econmica y ha llevado a muchos de la regin de la sierra a movilizarse a la costa, donde la actividad econmica es mayor. Se desea determinar si existe una relacin entre la regin de procedencia y la actividad de la poblacin ocupada en la costa del Per para el ao 2010, por lo que se tomo una muestra 4 de 10593 trabajadores y se obtuvo las frecuencias observadas que se presentan en la siguiente tabla de contingencia:
http://www.encuestas.com.pe/category/encuestas-datum/
pg.
34
(*) Comprende de Intervencin Financiera, Actividad Inmobiliaria, empresariales y de alquiler, Enseanza, Actividades de Servicios Sociales y de Salud. (Elaboracin Propia)
Con un nivel de significacin de 5%. La regin de procedencia del trabajador est asociada con actividad econmica a la que se dedica? Solucin: Las variables que se muestran en la tabla son: Variable 1: Regin de procedencia de un trabajador (Costa o Sierra) Variable 2: Actividad Econmica La prueba de Independencia compara las frecuencias observadas frente a las frecuencias esperadas bajo el supuesto de que ambas variables sean independientes. 1.- Formulacin de Hiptesis: H 0 : La regin de procedencia de un trabajador es independiente de la actividad econmica que realiza. H 1 : La regin de procedencia de un trabajador no es independiente de la actividad econmica que realiza. 2.- Fijar el nivel de significacin: =0.05
4.- reas y Criterio de Decisin: Los grados de libertad para el estadstico Ji- cuadrado son (2-1) (6-1)=5 Criterio: Si X c 11.07 se rechaza la H 0 Si X c 11.07 no se rechaza la H 0
2
pg.
35
realiza
Agricultura, Pesca, Minera Manufactura Construccin Comercio Transporte Otros servicios (*) Total
2
971 (898.36) 1125 (1064.51) 1206 (1112.96) 885 (824.34) 1029 (996.88) 425 (743.93) 5641
X c = 340. 8016227 6.- Conclusin: Con un nivel de significacin del 5% se rechaza la hiptesis nula. Por lo tanto hay evidencia estadstica para aceptar que la regin de procedencia de un trabajador depende de la actividad econmica a la que se dedica. Aplicacin a la Economa: Si no son independientes, entonces su lugar de origen influye en la actividad econmica que realizan; quiere decir que siguen realizando las mismas actividades solo que en una distinta regin. Eso justificara una migracin a la costa, donde hay mayor actividad econmica que en la sierra. Por lo tanto, se puede decir que gran parte de la actividad econmica de la costa, es producto de gente de la sierra que trabaja aqu, y que ha traslado su trabajo a la costa (se mantienen en el mismo rubro), dejando a la sierra disminuida de factores de produccin (capital o trabajo) que puedan ayudar al desarrollo econmico de esa regin cuando hayan inversiones. El hacedor de polticas de desarrollo laboral e inclusin social ser quien pueda utilizar estos datos y plantear quizs soluciones como que se hagan inversiones descentralizadas para que no haya una excesiva oferta laboral en la costa que lleve a una disminucin de los sueldos en general a la vez que frenara la migracin y se desarrollaran otras regiones.
4.2- Prueba de Homogeneidad de Proporciones Segn el Instituto Nacional de Estadstica la tasa de empleo 5 (y desempleo como complemento) en el Per ha variado sobre todo en el ltimo decenio. Motivo por el cual se obtuvo muestras de los tres ltimos aos y se observaron los siguientes resultados: Lima Metropolitana: Evolucin de la PEA6 anual (miles de personas) AOS
5
http://www.ceplan.gob.pe/documents/10157/560007b2-5468-434a-8a13-62c35b83e929
pg.
36
Use un nivel de significacin de 5% para probar si en Lima Metropolitana, la probabilidad de encontrar empleo, ha sido la misma durante los tres ltimos aos: 1.- Formulacin de Hiptesis: H 0 : p1 = p 2 = p3 , donde p i corresponde a la probabilidad de encontrar empleo con el ao i. H 1 : al menos una p i es diferente 2.- Fijacin del nivel de significacin: =5% 3.- Estadstico de Prueba:
4.- reas y criterios de decisin: Los grados de libertad para el estadstico Ji- cuadrado son (2-1) (3-1)=2 Criterios: Si X c 5.991 se rechaza la H 0 Si X c 5.991 no se rechaza la H 0 5. Clculos previos: AOS 2009 382.4 (366) 4138.1 (4155) 4520.5
2
2
pg.
37
X c = 1.592
2
6.- Conclusin: Con un nivel de significacin del 5% se acepta la hiptesis nula, los datos son suficientes para aceptar que la probabilidad de encontrar empleo en los tres ltimos aos es la misma. Aplicacin a la Economa: La probabilidad de encontrar empleo en lima (o de poder autogenerarse su propio empleo) ha sido estable durante los aos 2008-2010 lo cual constituye un atractivo importante, a pesar que cada vez se alberga una mayor cantidad de personas y la PEA va aumentando. Entonces, podemos decir que as como la PEA va aumentando, tambin lo hacen los puestos de trabajos, manteniendo casi la misma proporcin de empleados y desempleados. Este factor hace atractivo la migracin del campo a la ciudad, ya que debido al gran nmero de personas siempre habr un nicho de mercado (oportunidad) o una demanda insatisfecha para que muchos ofrezcan su trabajo como mano de obra o se puedan autogenerar sus propios recursos (pequeos comercios, ambulantes, etc). Por todo esto, quizs el anuncio del presidente Ollanta Humala y su promesa de desarrollar las regiones quizs paren un poco la migracin. Nuevamente el hacedor de poltica e inclusin social tiene que luchar contra este atractivo y dar incentivos (trabajo, educacin, sueldos, etc) para que las personas se quieran quedar en sus lugares y desarrollar su regin. 4.3- Prueba de Bondad de Ajuste El Gobierno del Per, despus de muchos aos dej de lado la poltica y no importa quin entre al gobierno, ste deber seguir un Marco Institucional de desarrollo a Largo Plazo para salvaguardar el horizonte de los intereses nacionales tales como poltica econmica, educacin, desarrollo, empleo, entre otras. Para tal fin, se desea saber sobre la evolucin de la poblacin y sus proyecciones crecimiento, para fijar polticas sociales como la de natalidad y directrices sobre la proyeccin del crecimiento del Per para las prximas dcadas. Con un nivel de significancia del 5% se desea saber si la poblacin en el Per desde 1990 hasta el 2010 se mantiene constante.
pg.
38
Per: Poblacin Total Estimada y Proyectada, Segn aos calendarios: 1990 - 2050 Ao Poblacin Tasa 1 Ao Poblacin Tasa1 Ao 1990 21 764 515 2,09 1991 22 203 931 2,02 2011 29 797 694 1,14 2031 1992 22 640 305 1,97 2012 30 135 875 1,13 2032 1993 23 073 150 1,91 2013 30 475 144 1,13 2033 1994 23 501 974 1,86 2014 30 814 175 1,11 2034 1995 23 926 300 1,81 2015 31 151 643 1,10 2035 1996 24 348 132 1,76 2016 31 488 625 1,08 2036 1997 24 767 794 1,72 2017 31 826 018 1,07 2037 1998 25 182 269 1,67 2018 32 162 184 1,06 2038 1999 25 588 546 1,61 2019 32 495 510 1,04 2039 2000 25 983 588 1,54 2020 32 824 358 1,01 2040 2001 26 366 533 1,47 2021 33 149 016 0,99 2041 2002 26 739 379 1,41 2022 33 470 569 0,97 2042 2003 27 103 457 1,36 2023 33 788 589 0,95 2043 2004 27 460 073 1,32 2024 34 102 668 0,93 2044 2005 27 810 540 1,28 2025 34 412 393 0,91 2045 2006 28 151 443 1,23 2026 34 718 378 0,89 2046 2007 28 481 901 1,17 2027 35 020 909 0,87 2047 2008 28 807 034 1,14 2028 35 319 039 0,85 2048 2009 29 132 013 1,13 2029 35 611 848 0,83 2049 2010 29 461 933 1,13 2030 35 898 422 0,80 2050
*Tasa 1, es la tasa de crecimiento medio de la Poblacin total
Poblacin 36 179 425 36 455 488 36 725 576 36 988 666 37 243 725 37 491 075 37 731 399 37 964 224 38 189 086 38 405 474 38 613 529 38 813 569 39 005 416 39 188 891 39 363 812 39 530 305 39 688 488 39 838 182 39 979 209 40 111 393
Tasa1 0,78 0,76 0,74 0,72 0,69 0,66 0,64 0,62 0,59 0,57 0,54 0,52 0,49 0,47 0,45 0,42 0,40 0,38 0,35 0,33
1.- Hiptesis: H 1: la poblacin desde 1990 al 2010 sigue una distribucin uniforme.
H 1 : la poblacin desde 1990 al 2010 no sigue una distribucin uniforme. 2.- Nivel se significacin: = 5%
pg.
39
21 Mnimo Mximo Absoluta Positiva Negativa 21764515 29461933 ,075 ,048 -,075 ,343 1,000
Diferencias ms extremas
Z de Kolmogorov-Smirnov Sig. asintt. (bilateral) a. La distribucin de contraste es la Uniforme. b. Se han calculado a partir de los datos.
> = 5%
Conclusin: La evidencia muestral no permite rechazar la hiptesis nula por lo cual se puede afirmar que la poblacin de 1990 a 2010 sigue una distribucin Uniforme.
Aplicacin a la Economa: La distribucin uniforme y las proyecciones sobre la poblacin del Per nos hace ver que de no seguir una poltica control de natalidad (o la ineficacia de estas) va a repercutir mucho en la sociedad futura, ya que en 60 aos se proyecta que la poblacin prcticamente se duplique pasando de 21 millones en 1990 a 40 millones en el 2050. Eso nos hace pensar en el economista Robert Malthus (1853) y su Teora de la Poblacin que nos dice que si la poblacin crece ms rpido de lo que crecen la produccin de alimentos, pronto no habr que comer; Hoy en dia, para el Per se podra pensar en una situacin como la descrita, ya que con el crecimiento y la migracin de la gente a la costa, pronto no habr quien siembre y coseche los campos, lo cual tiene una repercusin en el IPC y la inflacin producto que seran bienes escasos. Por otro lado, para fijar polticas de crecimiento economico tambin es importante la poblacin ya que Robert Solow y su teora de crecimiento hace hincapi en que el factor de crecimiento de la poblacin es importante para la acumulacin del capital (maquinarias) para producir, ya que si somos muchos no habr suficiente capital (maquinas) para darle a todos y que produzcan, por lo que habr gente que no est haciendo nada y habr que mantenerla, restndonos ingresos a los dems (Como los subsidios por natalidad y seguros por desempleos).
pg.
40
Argentina Colombia 117069.20 120039.90 145986.50 154512.20 211124.70 748732.50 176326.00 93695.50 107286.20 132745.20 152113.00 662165.90
Sea Yv.a= Importaciones de los socios comerciales del Per en millones de dlares Factor: Pases Ho: Las diferencias entre los seis pases de importacin muestran resultados iguales en la importacin (1= 2= 3= 4= 5= 6) H1: Al menos uno de los pases de importacin muestra resultados diferentes en la importacin. (Al menos i es diferente) =5%
http://www.inei.gob.pe/biblioineipub/bancopub/Est/Lib0982/cap25/ind25.htm
pg.
41
H 0 : Los errores tienen una distribucin normal H 1 : Los errores no tienen una distribucin normal Nivel de significancia: 5% Prueba de Kolmogorov-Smirnov para una muestra Residuo para Importacione s N Media Parmetros normales Desviacin tpica Absoluta Diferencias ms Positiva extremas Negativa Z de Kolmogorov-Smirnov Sig. asintt. (bilateral)
a,b
a. La distribucin de contraste es la Normal. b. Se han calculado a partir de los datos. Decisin: Como Dmx = 0,102 p = 0,912 > = 5% No R Ho, con un = 5% Conclusin: ei sigue una distribucin Normal
Homocedasticidad de Varianzas
Ho: Las varianzas para cada pas son similares H1: Al menos una varianza es diferente = 5% Estadstico de Prueba (F Levene) Contraste de Levene sobre la igualdad de las varianzas errora Variable dependiente: Importaciones F 2,210 gl1 5 gl2 24 Sig. ,086
Contrasta la hiptesis nula de que la varianza error de la variable dependiente es igual a lo largo de todos los grupos. a. Diseo: Interseccin + Paises
pg.
42
Decisin: Como F-levene = 2,210 p = 0,086< = 5% R Ho, con un = 5% Conclusin: se concluye que las varianzas no son homogneas.
Retornando a la prueba principal Pruebas de los efectos inter-sujetos Variable dependiente: Importaciones
Origen Suma de cuadrados tipo III gl Media cuadrtica F Sig.
5 1 5 24 30 29
Decisin: Como F.exp = 83.075 p = 0,000 < = 5% R Ho, con un =5%. Conclusin: Entonces se concluye que los pases estudiados si afectan a las exportaciones realizadas por parte de Per.
Anlisis de Duncan Exportaciones Paises Colombia Argentina Duncana,b Ecuador Brasil China N 5 5 5 5 5 Subconjunto 1 13243318,0000 14974650,0000 16890874,0000 18840958,0000 54258318,0000 2
pg.
43
5 ,124
57730812,0000 ,292
Se muestran las medias de los grupos de subconjuntos homogneos. Basadas en las medias observadas. El trmino de error es la media cuadrtica(Error) = 25972267307635,000. a. Usa el tamao muestral de la media armnica = 5,000 b. Alfa = .05.
pg.
44
Se desea saber cmo ha influenciado las continuas crisis de EE.UU (sobre todo antes de la del 2009) al desempleo en tres aos diferentes y en pases distintos. Los pases son representativos ya que tanto Argentina y Espaa son destinos casi fijos por quienes buscan emigrar por un mejor futuro econmico. Por tal motivo se decidi utilizar un diseo aleatorio de bloques que permita controlar el efecto del pas de origen que se est utilizando con un nivel de significancia del 5%. Las mediciones realizadas se encuentran registradas en la siguiente tabla:
Aos Pases
EE.UU. Espaa Argentina Total 2006 0.076 0.099 0.116 0.291 2007 0.072 0.087 0.087 0.246 2008 0.074 0.08 0.089 0.243 Total 0.222 0.266 0.292 0.78
Sea: Y v .a : Tasa de desempleo en porcentaje de tres aos consecutivos Factor: Periodos anuales Bloque: Pas
Comprobacin de Supuestos 1. Anlisis de normalidad de los errores: H 0 : los errores tienen una distribucin normal H 1 : los errores no tienen una distribucin normal
pg.
45
Prueba de Kolmogorov-Smirnov para una muestra Desempleo N Parmetros normalesa,b Media Desviacin tpica Diferencias ms extremas Absoluta Positiva Negativa Z de Kolmogorov-Smirnov Sig. asintt. (bilateral)
a. La distribucin de contraste es la Normal. b. Se han calculado a partir de los datos.
Como: D max = 0.300 -> p = 0.391> =0.05 No RH 0 con =5% Los errores se distribuyen normalmente
pg.
46
F 1.489
gl1 2
gl2
Sig. 6 .299
Contrasta la hiptesis nula de que la varianza error de la variable dependiente es igual a lo largo de todos los grupos. a. Diseo: Interseccin + pais + aos
Como F levene = 1.489 -> p = 0.299 > = 0.05 No RH 0 con =5% Se cumple la homogeneidad de varianzas.
Retomando la prueba principal: Solucin: 1. La hiptesis nula y alterna son: H 0 : u1 = u 2 = u 3 H 1 : no todas las u son iguales
2. El nivel de significacin:
= 5%
3. Criterio: Para tratamientos, se rechaza la hiptesis nula si F 6.94, el valor de F 0.05 para 2 y 4 grados de libertad.
4. Clculos:
pg.
47
Grados de Libertad 2 2 4 8
Suma de Cuadrado F. F critico Cuadrados Medio calculado 0.0005 0.0008 0.0003 0.0016 0.0003 0.0004 0.0001 3 4 6.94 6.94
Origen Modelo corregido Interseccin pais aos Error Total Total corregida
gl 4
F 1,396
Sig. ,377
1 2 2 4 9 8
F cal = 1,143 -> p = 0.405 > = 0.05 No RH 0 con =5% 6. Conclusin: A un nivel de significacin del 5% no se RH 0 .Por lo tanto no existe diferencias significativas de la tasa de desempleo en los ltimos tres aos Aplicacin a la Economa: Todos sabemos que EE.UU. es la mayor economa mundial, seguida muy de cerca de China, tan es as que si EE.UU tropieza los dems pases sentirn
pg.
48
resbaln. El ejercicio nuestra que la tasa de desempleo ha sido estable en los 3 aos en estos pases representativos, hacindolos atractivos por las mltiples oportunidades que ofrecen. Por lo tanto, antes de la crisis del 2009, estos pases se vean aun como estables (desempleo friccional), mientras que pasada la crisis, que fue un retroceso mundial, todo esto cambi por lo que muchos de nuestros compatriotas dejaron de mirar con buenos ojos emigrar e incluso mucho piensan o estn regresando. Per, y esto contrasta con el ejercicio lneas arriba, muestra una desempleo estable (no nos afect mucho la crisis), que si bien se quiere reducir, a la luz de la teora econmica siempre va a haber desempleo ya que las personas cambian de trabajos o estn buscando uno nuevo en un periodo de tiempo, hacindolo nuevamente atractivo para que muchos de nuestros compatriotas regresen nuevamente.
9,163.88 Crdito 333.89 661.73 134.74 87.00 388.59 Mercado 5.45 10.17 0.36 1.36 419.61
8
9,264.22 341.71 674.07 136.94 88.65 346.99 7.21 10.41 0.30 1.24 424.18
9,397.62 341.71 685.94 139.60 90.31 369.29 7.21 12.95 0.41 1.31 427.77
31,542.01
1,163.25
1,599.14
http://www.sbs.gob.pe/app/stats/EstadisticaBoletinEstadistico.asp?p=23#
pg.
49
Operacin
Totales
11,314.11
Sea: Y v .a : Requerimientos de Reservas (en millones de soles) Factor 1: Meses Factor 2: Tipo de riesgo
H 0 : los errores tienen una distribucin normal H 1 : los errores no tienen una distribucin normal Nivel de significancia: =5%
pg.
50
RESERVAS_SOLES N Parmetros normalesa,b Media Desviacin tpica Diferencias ms extremas Absoluta Positiva Negativa Z de Kolmogorov-Smirnov Sig. asintt. (bilateral) a. La distribucin de contraste es la Normal. b. Se han calculado a partir de los datos. 45 ,0000 2101,25795 ,373 ,373 -,215 2,501 ,000
Como: D max = 0.373 -> p = 0.000 < =0.05 RH 0 con =5% Por lo tanto los errores no se distribuyen normalmente
pg.
51
Contraste de Levene sobre la igualdad de las varianzas errora Variable dependiente:RESERVAS_SOLES F 4,829 gl1 8 gl2 36 Sig. ,000
Contrasta la hiptesis nula de que la varianza error de la variable dependiente es igual a lo largo de todos los grupos. a. Diseo: Interseccin + MESES + TIPO_RIESGO + MESES * TIPO_RIESGO
Como F levene = 4.829 -> p = 0.000 < = 0.05 RH 0 con =5% Por lo tanto no se cumple la homogeneidad de varianzas, al menos una i es diferente
Pruebas de los efectos inter-sujetos Variable dependiente:RESERVAS_SOLES Suma cuadrados Origen Modelo corregido Interseccin MESES TIPO_RIESGO MESES * TIPO_RIESGO Error Total Total corregida III 40444023,948a 26150930,208 2534,569 40436322,735 5166,645 1,943E8 2,609E8 2,347E8 de tipo gl 8 1 2 2 4 36 45 44 Media cuadrtica 5055502,994 26150930,208 1267,284 20218161,367 1291,661 5396459,423 F ,937 4,846 ,000 3,747 ,000 Sig. ,499 ,034 1,000 ,033 1,000
pg.
52
H 0 : No Existe interaccin entre el Factor 1 y el Factor 2 H 1 : Si existe interaccin entre el Factor 1 y el Factor 2 Nivel de significancia: =5% F cal = 0.000 -> p =1.000 > = 0.05 NRH 0 con =5% Conclusin: A un nivel de significacin del 5% No existe interaccin entre el Factor1 y Factor2, por lo tanto los efectos de la interaccin no se ven alterados al analizar los requerimientos de reservas de los distintos tipos de riegos durante los primeros meses del ao 2009.
Factor 1: Meses H 0 : 0=3 = 2 = 1 H 1 : al menos una es diferente de cero. Nivel de significancia: =5% F cal = 0.000 -> p =1.000 > = 0.05 NRH 0 con =5% Conclusin: Con un nivel de significacin del 5% No se rechaza la hiptesis y al menos una es diferente de cero, por lo que los meses no afectan al requerimiento de reservas exigido a los grupos de empresas financieras.
Factor 2: Tipo de riesgo H 0 : 1= 2= 3= 0 H 1 : al menos una es diferente de cero Nivel de significancia: =5%
pg.
53
Conclusin: Con un nivel de significacin del 5% se rechaza la hiptesis nula, por lo tanto el tipo de riesgo SI afecta al requerimiento de reservas exigido a los cinco grupos de empresas financieras de operaciones mltiples.
Duncan:
RESERVAS_SOLES Duncana,b Subconjunto TIPO_RIESGO MERCADO OPERACION CREDITO Sig. N 15 15 15 ,973 1 77,5500 106,6093 2102,8007 1,000 2
Se muestran las medias de los grupos de subconjuntos homogneos. Basadas en las medias observadas. El trmino de error es la media cuadrtica(Error) = 5396459,423. a. Usa el tamao muestral de la media armnica = 15,000 b. Alfa = 0,05.
Conclusin:
pg.
54
Aplicacin a la Economa: Las entidades financieras tienen (o deberan tener) un mayor riesgo cuando ofrecen sus servicios de crditos durante la poca de crisis, ya que aumenta el riesgo que no les paguen a tiempo y as que no cumplan con sus obligaciones ventanilla con sus depositantes. Por tal motivo, estas entidades deberan aumentar sus reservas netas (aquellas que no se prestan) para poder cumplir con cualquier eventualidad de liquidez por parte de sus ahorristas. En un contexto ms real, el riesgo por crdito es el ms alto (y se puede ver mediante el crdito vehicular o hipotecario, por ejemplo) ya que se ve que todo el mundo tiene tarjetas de crdito (respaldadas por entidades financieras y estas respaldadas por los fondos de los ahorristas) por lo que se prefiere el tipo de riesgo (de Crdito) a la hora de planear las reservas mnimas que deben de tener las entidades financieras.
pg.
55