Vous êtes sur la page 1sur 54

CURSO ESTADISTICA APLICADA A

LA ING AMBIENTAL
EXPOSITOR:
Maestro Ing. Marco A Snchez
Alvarado
SEMANA N 2
TEMA:
ESTIMACION Y PRUEBA DE
HIPTESIS

LA INFERENCIA ESTADSTICA considera,


dos puntos;
-La estimacin y la Prueba de Hiptesis

PROCESO DE INFERENCIA
Poblacin
Se define la muestra de manera aleatoria
Se calcula el estadstico muestral
Se realizan los estimados y pruebas de
hiptesis
Se toma la decisin

Nomenclatura de parmetro y estadstico

Denominacin
Media o promedio
Varianza

Poblacin
(Parmetro)

Muestra( estadstic
o)
x
s

Desviacin
estandard

Proporcin

Coeficiente de
correlacion

Coeficiente de
determinacin
Tamao

PROCESO DE ESTIMACION
CONSIDERA DOS TIPOS:
-ESTIMACION PUNTUAL
Es el proceso de buscar un estimador que, con base en
los datos mustrales d origen a una estimacin del valor
del parmetro.
-ESTIMACION INTERVALICA
Es la estimacin de un parmetro dentro de un intervalo
de extremos cerrados , llamados limite inferior y limite
superior, que se obtienen a partir de los valores de la
muestra obtenida al azar .

NIVEL DE
CONFIANZA
Probabilidad de que el parmetro
desconocido de la poblacin est
dentro de un intervalo.
Se denota (1- )%= , nivel de
confianza
es la probabilidad de que el
parmetro NO este dentro del
intervalo
Valores tpicos son: 99%, 95% y
90%.

Valores de estimacin intervalica

Nivel
de
confia
nza .
(1-)

99.7
3%

99%

98%

96%

95.45
%

95%

90%

80%

68.27
%

3.0

2.57
5

2.32
7

2.05
4

1.96

1.64
5

1.28

COMO SE INTERPRETA UN INTERVALO


Si a partir de los datos de una muestra aleatoria
de tamao n, hemos construido un intervalo
Ejemplo
a b,
Con un grado de confianza de 95% para el
parmetro
Entonces si se seleccionan repetidamente 100
muestras de tamao n , tendremos 100 intervalos
semejantes al intervalo propuesto y se confa que
95 de estos contengan al verdadero valor del
parmetro

ESTIMACION POR INTERVALO DE LA MEDIA

SUPUESTOS :
La desviacin estndar de la
poblacin es conocida.
La poblacin se distribuye
normalmente
Intervalo de confianza estimado
x - Z(/2). / n x+
Z(/2)./n

ESTIMACION POR
INTERVALO DE LA MEDIA
Supuestos:
(
NO
CONOCIDA)
La desviacin estandar de la poblacin NO

es conocida.
La poblacin debe de estar normalmente
Distribuida.
Se usa la distribucin t de student
x t(/2, n-1). S/n x + t (/ 2 , n1).S/n

OTROS INTERVALOS DE
CONFIANZA
Intervalo de Confianza para
proporciones
Si el estadstico p =x/n es la proporcin de xitos
en una muestra de tamao n .
(p- Z (P) (1-p)/n p+ Z (p) (1-p)/n) = (1-
)%=
Para poblaciones finitas se aplica el factor de
correccin = N-n/N-1

INTERVALOS DE CONFIANZA PARA DOS MEDIAS


POBLACIONALES
Caso cuando se conoce la de la poblacin
(x y) - Z . (x- y) x- y (x y) + Z .
(x- y)
Donde (x-y)= (2x /nx - 2y /ny )

Cuando no se conocen las desviaciones de la


poblacin se aproximan con las desviaciones
estndar de la muestra .
Se asume que las varianzas son iguales

(x y)- t(/2) (nx+ny-2). (x- y) x- y (x y)+ t(/2(nx+ny-2).


(x- y)

Donde (x-y)= (2x/nx- 2y


2=

/ny

((nx-1) s2x +(ny-1) s2y )/ (nx+ny-2)

Ejemplo para diferencia


de medias empleando la t
de student

Una compaa est interesada en comparar la


duracin de dos tipos de piedras de esmeril ,
que causan mucha polucin en el ambiente de
la fabrica, y encuentra que el promedio de
vida de 12 piedras de esmeril del primer tipo
es de 66 meses con una desviacin estndar
de 4 meses y que el promedio de vida de 10
piedras del segundo tipo es de 58 meses con
una desviacin estndar de 6 meses.
Construir un intervalo de confianza del 99%
para la diferencia de medias de os dos tipos de
piedras.

INTERVALO DE
CONFIANZA PARA
DIFERENCIA DE
PROPORCIONES
(p1-p2)Z.S(p1-p2)1-2
S(p1-p2) =(s2p1 + s2p2)
sp = ( p( p-1)/n)

Ejemplo de ejercicios de Intervalos


Las emisiones de CO2 de una siderrgica
que emplea alto horno en su proceso de
elaboracin de acero es de
28,000 T/ao; con una desviacin estndar
de 1, 400 , otro proceso
emplea
tecnologa de hiero esponja y emite
19,000 T/ao con una desviacion estandar
de 980.
Se toman 30 muestras de la primera y 40 de
la segunda .
Construya un intervalo de confianza del 99%
para estimar la diferencia entre los niveles
anuales de
emisin de
las dos
empresas.

Un grupo de 50 ingenieros de la UNI ,


realizaron un trabajo de investigacin
en ing. ambiental y obtuvieron los
siguientes resultados x=89, con una
desviacin estndar de 7. Otro grupo de
60 ingenieros de la UCV , realizaron el
mismo experimento y obtuvieron y=
87, con una desviacin estndar de 5.
Construya un intervalo de confianza del
95% para la diferencia de medias entre
las mediciones realizadas por los
ingenieros de la UNI y la UCV

La vida til promedio de una muestra


aleatoria de 10 focos ahorradores es de
4,000horas , con una desviacin
estndar de 250.
Otra muestra aleatoria de 8 focos
incandescentes dio una vida til de
3,500 horas con una desviacin
estndar de 200 .
Qu puede Ud. afirmar de la vida til
de las dos muestras?

En un laboratorio 100 estudiantes


de ingeniera miden
separadamente el valor especfico
de aluminio obtenindose un
promedio de 0.2210 caloras y una
desviacin estndar de 0.0240.
Construya un intervalo de
confianza del 95% para el
verdadero valor especfico del
aluminio.
Interprete

El Ministerio del Ambiente dice que en el centro de Lima , la


concentracin promedio anual de las partculas de menos
de 10 micras de dimetro (PM10)-fragmentos minerales o
sustancias orgnicas mas pequeas que el grosor de un
cabello en el ao 2011 es de 110 g/metro cubico , con una
desviacin estndar histrica de 10 g/metro cubico .
Para comprobar esta afirmacin se recolecta durante 10
das 20 muestras de aire del centro de Lima y se obtiene
los siguientes valores

150, 167, 189, 110, 120, 189, 99, 157, 189, 220
169, 178, 230, 100, 180, 210, 129, 189, 178, 221.

Ud realice sus clculos y acepte o rechace esta afirmacin.

Segn el ultimo informe de residuos slidos elaborado


por el Ministerio del Ambiente ,el ao 2008, la
generacin per capita de desechos en Lima fue de 0,6
Kg /habitante /dia .
Haciendo en promedio un peso de 4 Kg. Con una
desviacin estandar de 25gr.
Se toman 20 muestras el ao 2011 y se obtiene los
siguientes pesos en gramos :
4035, 3974, 3949, 4009, 3969, 3970, 3955, 4034,
3969, 3991,
3928, 4024, 4017, 3983, 3979, 3997, 3984, 3964, 3995,
3988
Construya un intervalo con 95% de confianza .
Qu concluye Ud. ?

Se analizaron 20 muestras de agua potable de


igual cantidad de sitios seleccionados al azar
del distrito de San Juan de Lurigancho , para
conocer el contenido de cadmio , que se
encuentra presente ,obteniendo las
siguientes cantidades en microgramos por
litro.
0.020,
0.010
0.011 , 0.09,
0.08
0.018,
0.010, 0.06,
0.09 ,
0.010
0.015,
0.012, 0.09 ,
0.010, 0.019
0.017,
0.018, 0.015,
0.021, 0.029
El lmite mximo permisible de cadmio en el
agua potable segn SEDAPAL es de 0.005
de microgramos por litro.
Construya un intervalo de 95% de confianza
para esta informacin.

Ejemplo :

En una comunidad se investiga a una muestra


aleatoria de 100 familias que tienen
conciencia ecolgica que se manifiesta al
seleccionar y clasificar la basura , para que se
pueda facilitar el proceso de reciclado ,
encontrando que lo hacen el 40 % . Determine
el intervalo de confianza del 95 % para la
proporcin de todas las familias que tiene
conciencia ecolgica en esa comunidad.

Ejemplo
Las emisiones de CO2 de una siderrgica
que emplea alto horno en su proceso de
elaboracin de acero es de
28,000 T/ao; con una desviacin estndar
de 1, 400 , otro proceso
emplea
tecnologa de hiero esponja y emite
19,000 T/ao con una desviacion estandar
de 980.
Se toman 30 muestras de la primera y 40 de
la segunda .
Construya un intervalo de confianza del 99%
para estimar la diferencia entre los niveles
anuales de
emisin de
las dos
empresas.

Un grupo de 50 ingenieros de la UNI ,


realizaron un trabajo de investigacin
en ing. ambiental y obtuvieron los
siguientes resultados x=89, con una
desviacin estndar de 7. Otro grupo de
60 ingenieros de la UCV , realizaron el
mismo experimento y obtuvieron y=
87, con una desviacin estndar de 5.
Construya un intervalo de confianza del
95% para la diferencia de medias entre
las mediciones realizadas por los
ingenieros de la UNI y la UCV

EJEMPLO

En un distrito de LM, se determin que una proporcin


de 0.45 familias de una muestra aleatoria de 100
tomada de una comunidad grande tenan conciencia
ecolgica .
En otro distrito de LM 60 familias de una muestra
aleatoria de 200 afirman tener conciencia ecolgica a
favor del medio ambiente .
Construya un intervalo de confianza del 95% para la
proporcin de familias de ambos distritos que estn a
favor del medio ambiente .

Prueba de Hiptesis
Es un procedimiento basado en
evidencia muestral (estadstico)y
en la teora de probabilidades,
para determinar si una hiptesis es
:
Razonable y no debe de
rechazarse,
Irrazonable y debe de ser
rechazada

Qu es una Hiptesis estadstica?


Es un enunciado acerca del valor
de un parmetro.
Un parmetro puede ser la
media, varianza o proporcin
poblacional.
El Parmetro debe de ser
identificado antes de realizar el
anlisis.

LA HIPOTESIS NULA
1. Identifica la afirmacin acerca
del parmetro que debe de ser
probada.
2. Es designado por Ho.
3. Siempre contiene el signo =
4. La Hiptesis nula siempre va ha
negar

LA HIPOTESIS ALTERNA
1. Es siempre opuesta a la
Hiptesis Nula
2. Se designa por Ha o H1
3. Es realmente lo que nos interesa
probar . Es la Hiptesis de
Investigacin.
4. Nunca contiene el signo =

NIVEL DE SIGNIFICANCIA
Define que valores del estadstico
muestral no deseamos (se le llama
Regin de Rechazo de la Hiptesis
nula)
Designada por (alpha)
Cuyos valores tpicos con 0.01,
0.05, 0.10
Debe de ser seleccionada por el
investigador .

PASOS PARA UNA PRUEBA DE HIPOTESIS

1. Plantear la Ho
2. Plantear la H1
3. Elegir el valor de
4. Escoger el tamao de la muestra
aleatoria n
5. Seleccionar la prueba a
realizar(ejemplo Z, t ,p, diferencia de
medias, datos apareados ,etc. )
6. Definir los valores crticos o tericos
de tabla.
7. Colectar datos
8. Calcular el estadstico de Prueba

ERRORES AL TOMAR LA DECISION

1. Error Tipo I.
Rechazar la Hiptesis nula cuando es cierta .
Probabilidad de cometer el error tipo I.
Tambin se le llama Riesgo del Fabricante .

2. Error Tipo II.


No rechazar una Hiptesis nula cuando es
falsa
Probabilidad de cometer el error tipo II
Tambin se le llama Riesgo del Consumidor .

POSIBILIDADES DE UNA
DECISION
DECISION DE HO

CIERTA

FALSA

ACEPTAR HO

Decisin correcta

Error Tipo II

(1-)

RECHAZAR HO

Error Tipo I
Riesgo del
fabricante

( )

()

Riesgo del
consumidor
Decisin correcta
( 1- )

CRITERIOS DE DECISION PARA EMPLEAR


Z o t de Student en inferencia
estadistica.
Se usa Z si :
a) Muestra grande(n>30) , varianza poblacional
conocida y poblacin normal o no .
b) Muestra grande(n>30), varianza poblacional
desconocida y poblacin normal o no.
c) Muestra pequea (n 30), variacin
poblacional conocida y poblacin normal.

Se usa t si:
Si la muestra es pequea (n 30), varianza
poblacional desconocida y poblacin normal

PRUEBA DE HIPOTESIS DE LA
MEDIA DE UNA POBLACION EMPLEANDO Z

1. Plantear la Hiptesis:
Ho: = o
H1: o ; o ; o
2. Definir el nivel de significancia. =
0.01, 0.05, 0.10
3. Estadstico de Prueba Zc= ( x- o)/
(/n.)
4. Regla de decisin.
Zc < Ztabla (No Rechazar Ho)
Zc > Ztabla (Rechazar Ho)

VALORES DE NIVEL DE SIGNIFICANCIA , CUANDO SE


EMPLEA Z

Para una
prueba
de una
cola
Para una
prueba
de dos
colas

0.10

0.05

0.01

0.005 0.00
2
1.281 1.64 2.32 2.57 2.8
7
5
7
5
8

1.645 1.96 2.57 2.81 3.0


5
8

PRUEBA DE HIPOTESIS DE LA
MEDIA DE UNA POBLACION EMPLEANDO LA t DE STUDENT

1. Plantear la Hiptesis:
Ho: = o
H1: o ; o ; o
2. Definir el nivel de significancia. = 0.01,
0.05, 0.10, y sus valores de tabla o valores
crticos.
3. Estadstico de Prueba tc= (x- o)/(s/n.)
4. Regla de decisin.
tc > t tabla (Rechazar Ho)
tc < t tabla (No Rechazar Ho)

Toma de decisin de prueba de hiptesis empleando el valor p

Si p> 0.05
No rechazar Ho
No hay suficiente evidencia significativa para decir
estadsticamente que existe una diferencia entre
alguno de los grupos.

Si p0.05
Rechazar Ho y aceptar Ha
Al menos uno de los grupos es estadsticamente
diferente de los otros

Ejemplos de cmo plantear


hiptesis
Problema 1: La estatura promedio de los estudiantes de la Universidad es de
1.65 mt?
Solucin:
Traducir a lenguaje estadstico:
Establecer su opuesto:
Plantear las hiptesis

1.65
1.65

H 0 : 1.65

H 1 : 1.65

Problema 2: El tiempo de vida promedio de una determinada pieza usada en el


ensamblaje de una marca de computadoras es diferente a 20,000 horas.
Solucin:
Traducir a lenguaje estadstico:
Establecer su opuesto:
Plantear las hiptesis:

20,000
20,000
H 0 : 20,000

H 1 : 20,000

Problema 3: El porcentaje de personas atacadas por la gripe H1N1 en el


pas, es mayor al 10%.
Solucin:
Traducir a lenguaje estadstico:
Establecer su opuesto:
Plantear las hiptesis:

0.10
0.10

Ho :

0.10

H1 :

0.10

Ejemplo 1
Una mquina est calibrada para embolsar cereales a un peso promedio de
500 gramos. Cada cierto tiempo el jefe de control de calidad realiza una
inspeccin para determinar si debe mandar a calibrar la mquina. Para tomar
una decisin toma una muestra aleatoria de 36 bolsas y encuentra un
promedio de 496.5 gr. A que conclusin llegar el jefe de control de calidad,
si suponemos que el peso se distribuye normalmente con una desviacin
estndar de 9 grs? Use un 5% de significancia.
Solucin
Paso 1
Hiptesis nula:
alterna
0

H : 500

Hiptesis

H1 : 500

Las bolsas de cereal pesanLas bolsas de cereal no


en promedio 500 gr.
pesan en promedio
500 gr.
La variable de estudio es peso (X), y el Peso se debe
distribuir como una normal . Por dato del problema, se
sabe que (=9) conocido.
Paso 2
Fijamos alfa: = 0.05, valor de tabla con Z = 1.96

Paso 3
Estadstico de prueba , o calculo de
Zc =

x
Zc
/ n

Paso 4: Regin crtica para alfa dado:

, 1.96

1.96,

Clculo de Zc:

Z calc

496.5 500

2.33
9 / 36

Paso 5: Decisin
Como Zc = - 2.33 < Ztabla =-1.96, se rechaza Ho. Es decir el
peso promedio no es de 500gramos

Conclusin: Con un nivel de significacin del 5% existe evidencia


estadstica para concluir que el peso promedio de las bolsas de
cereal no pesan 500 gramos. Se justifica enviar a calibrar la
mquina.

Ejercicios de Prueba de Hiptesis


Un fabricante de helados desea que el
contenido de grasa polisaturadas de sus
helados sea de 10%. Un anlisis de una
muestra de 49 cajas de helado dio un
contenido de grasa promedio de 0.103
con una desviacin estndar de 0.014 .
Utilizando un nivel de significancia de
0.05 Rechazar el fabricante la
hiptesis de que el contenido medio de
su helado est en el nivel apropiado?

Un fabricante sostiene que un


galn de su pintura puede cubrir
400
pies
cuadrados.
Un
representante de los consumidores
somete a prueba la validez de
dicha afirmacin tomando una
muestra aleatoria de 36 latas de
un galn las que cubrieron en
promedio 385 pies cuadrados con
una desviacin estndar de 8 pies
cuadrados.
Se acepta o se rechaza la

El Ministerio del Ambiente dice que en el centro de


Lima , la concentracin promedio anual de las
partculas de menos de 10 micras de dimetro
(PM10)-fragmentos
minerales
o
sustancias
orgnicas mas pequeas que el grosor de un
cabello en el ao 2011 es de 110 g/metro cubico ,
con una desviacin estndar histrica de 10
g/metro cubico .
Para comprobar esta afirmacin
se recolecta
durante 10 das 20 muestras de aire del centro
de Lima y se obtiene los siguientes valores
150, 167, 189, 110, 120, 189, 99, 157, 189, 220
169, 178, 230, 100, 180, 210, 129, 189, 178, 221.
Ud realice sus clculos y acepte o rechace esta
afirmacin.

Segn el ultimo informe de residuos slidos


elaborado por el Ministerio del Ambiente ,el ao
2008, la generacin per cpita de desechos en
Lima fue de 0,6 Kg /habitante /da .
Haciendo en promedio un peso de 4 Kg. Con una
desviacin estndar de 25gr.
Se toman 20 muestras el ao 2011 y se obtiene
los siguientes pesos :
4035, 3974, 3949, 4009, 3969, 3970, 3955,
4034, 3969, 3991,
3928, 4024, 4017, 3983, 3979, 3997, 3984, 3964,
3995, 3988
Qu puede afirmar Ud. con un nivel de
significancia de 5%? .

Se analizaron 20 muestras de agua potable de


igual cantidad de sitios seleccionados al azar
del distrito de San Juan de Lurigancho , para
conocer el contenido de cadmio , que se
encuentra presente ,obteniendo las
siguientes cantidades en microgramos por
litro.
0.020,
0.010
0.011 , 0.09,
0.08
0.018,
0.010, 0.06,
0.09 ,
0.010
0.015,
0.012, 0.09 ,
0.010, 0.019
0.017,
0.018, 0.015,
0.021, 0.029
El lmite mximo permisible de cadmio en el
agua potable segn SEDAPAL es de 0.005
de microgramos por litro.
Qu puede afirmar Ud. con un = 5%?

Se plantea la hiptesis nula de que


la vida til
promedio de focos
ahorradores
de
una
marca
especfica es de cuando menos de
4200horas. La vida til promedio
de una muestra aleatoria de 10
focos ahorradores, fue de 4000
horas con una desviacin estndar
de 200horas.
Pruebe la hiptesis nula con un
nivel de significancia de =5%.

Debido a una denuncia recibida el


INDECOPI analiza una muestra de 36
paquetes de carne molida de un
supermercado de la capital.
La etiqueta de cada paquete dice
contiene no mas de 25 gramos de
grasa.
Puede este organismo concluir que la
carne molida que vende de este
supermercado tiene mas de 25 % de
grasa si la muestra dio un contenido
medio de grasa de 0.265 con una
desviacin estndar de 0.030?, utilice
un nivel de significancia de 0.05

Se tomaron muestras de sangre de 25 nios de la zona


de Ansieta baja (El Agustino) y se encontr que tienen
plomo srico en la sangre en las siguientes cantidades,
expresadas en microgramos por decilitro de sangre :

15.20, 13.10,
12.18, 10.28, 9.55,
14.36,
8.79,
11.45, 10. 67, 14.23
9.06,
10. 56, 11,78,
9.78, 13, 57
15.23,
12. 45, 9.76,
13.23, 12. 76
13. 56, 12. 76, 21.34, 16. 78, 9.07
NOTA : El MINSA afirma que la cantidad mxima
permisible de plomo srico en la sangre debe de ser de
10.00 microgramos por decilitro de sangre .
.

Haga clic en el icono para


agregar una imagen

Vous aimerez peut-être aussi