Vous êtes sur la page 1sur 54

DOCIMASIA O PRUEBA DE

HIPÓTESIS
Introducción
Un segundo bloque de instrumentos para la inferencia estadística son las
pruebas de hipótesis: Evalúan la evidencia de una afirmación sobre la
población.

Hay situaciones en las que más que conocer el valor concreto del parámetro,
queremos tomar una decisión acerca de este. Formular una hipótesis sobre el
valor del parámetro y contrastarla con los datos de la muestra para comprobar
si estos la apoyan o la desmienten.

En estadística una afirmación sobre la población se plantea en forma de


hipótesis de trabajo. Las dos hipótesis que se plantean son complementarias se
llaman:
Hipótesis nula (H0)
Hipótesis alternativa o de investigación (H1)
Las hipótesis hacen referencia a los parámetros de la población.
Planteamiento General: Hipótesis estadística
Regla de decisión
Una prueba de hipótesis es un procedimiento que especifica:
1. Para qué valores muestrales la decisión será no rechazar la
hipótesis nula (región de aceptación).
2. Para qué valores muestrales la hipótesis nula será rechazada a
favor de la alternativa (región de rechazo).
Evaluación del error

Al tomar la decisión acerca de la veracidad de Ho, podemos cometer dos tipos


de error:

Rechazar H0 cuando de hecho es cierta: error de tipo I

Aceptar H0 cuando realmente es cierta H1: error de tipo II

Observación: el error tipo I = nivel de significación = α


En esquema:

Planteamiento del problema


Hipótesis nula y alternativa

Fijar α

Test estadístico
Decisión

Establecer No rechazar la hipótesis nula


regiones
De rechazo y Rechazar la hipótesis nula
Aceptación (aceptar la hipótesis alternativa)
Dócima para una media poblacional
(σ conocida)
Caso I Caso II Caso III
H o : μ = μ0 H o : μ = μ0 Ho : μ =μ0
H a : μ < μ0 H a : μ ≠ μ0 Ha : μ >μ0

Prueba Estadística:

Población x − μo
Z =
Normal σ
n

Z se distribuye como una normal estándar. bilateral

Decisión
Si Zcal < -Zα entonces Si |Zcal |>Zα/2 entonces Si Zcal >Zα entonces
se rechaza Ho se rechaza Ho se rechaza Ho
Ejemplo
Solución
Ejemplo
Solución
El valor p o mínimo nivel de significación

Cuanto más pequeño sea el p-valor mayor es la evidencia en contra de


Ho.
Ejemplo
En estudios previos se ha determinado que el nivel promedio de cantidad
demandada de cierto servicio es 220 mensualmente. Un empresario piensa
que en realidad el nivel es más alto de lo que se indica y para probar su
afirmación se asume que la demanda es normal con desviación estándar de
13 (σ = 13). Para una muestra de 20 meses, ¿habrá suficiente evidencia
estadística para apoyar la afirmación del empresario?.

217 223 225 245 238 216 217 226 202


233 235 242 219 221 234 199 236 248
218 224
Solución
Ho: μ = 220 (el nivel promedio de demanda es 220). La hipótesis alterna es
Ha: μ > 220 (el empresario piensa que el nivel promedio de demanda es
mayor de 220).

Los resultados son los siguientes:

One-Sample Z: Demanda

Test of mu = 220 vs > 220


The assumed standard deviation = 13

Variable N Mean StDev SE Mean Z P


Demanda 20 225.900 13.094 2.907 2.03 0.021

Interpretación:
El valor del “P-value” (el área a la derecha de 2.03) es .021 menor que el
nivel de significación α =0.05, por lo tanto; se rechaza la hipótesis nula y se
concluye de que sí hay evidencia estadística de que el nivel promedio de
demanda es mayor de 220. O sea los resultados apoyan lo que afirma el
empresario.
Dócima para una media poblacional
(σ desconocida)
Caso I Caso II Caso III
Ho : μ = μo H o : μ = μo H o :μ = μ o
Ha : μ < μ0 Ha : μ ≠ μo Ha :μ > μo

Prueba Estadística
Una muestra x − μ
pequeña (n < 30) t = o

tomada de la
s
población normal n
bilateral
t se distribuye como una t-student con n-1 g.l.

Decisión
Si tcal < -tα entonces Si |tcal |>tα/2 entonces Si tcal > tα entonces
se rechaza Ho se rechaza Ho se rechaza Ho
Ejemplo

Se quiere probar la hipótesis de que las mediciones de un


instrumento tienen promedio superior a 10,2. Si se toman tres
lecturas y se encuentra un promedio muestral de 10,24333 y una
varianza de 0,0002333 unidades cuadráticas, ¿los datos apoyan la
afirmación?
Ejemplo
Los tiempos de atención (en minutos) de 12 clientes para un servicio dado
son los siguientes:

3.1 0.9 2.8 4.3 0.6 1.4 5.8 9.9 6.3 10.4 5 11.5

Probar la hipótesis que el tiempo promedio de duración es menor de 9


minutos.
Solución

One-Sample T: tiempo

Test of mu = 9 vs < 9

Variable N Mean StDev SE Mean T P


tiempo 12 5.16667 3.75967 1.08532 -3.53 0.002

Interpretación:
El valor del “P-value” es .002 menor que el nivel de significación α=0.01,
por lo tanto; se rechaza la hipótesis nula y se concluye de que sí hay
evidencia estadística de que el tiempo promedio de atención es menor de 9.
Riesgos al tomar decisiones
Ejemplo 1: Se juzga a un individuo por la presunta comisión de un delito

Los datos pueden refutarla.

La que se acepta si las


• H0: Hipótesis nula pruebas no indican lo
contrario.
– Es inocente
Rechazarla por error tiene
graves consecuencias.

• H1: Hipótesis alternativa


– Es culpable

No debería ser aceptada sin una


gran evidencia a favor.

Rechazarla por error tiene


consecuencias consideradas
menos graves que la anterior.
Tipos de error al tomar una decisión
(Ejemplo 1)
Realidad
Inocente Culpable
Inocente
OK Error
Menos grave

Veredicto
Culpable
Error OK
Muy grave
Riesgos al contrastar hipótesis

Ejemplo 2: Se cree que un nuevo tratamiento ofrece buenos resultados


Ejemplo 3: Parece que hay una incidencia de enfermedad más alta de lo normal

• H0: Hipótesis nula No especulativa


– (Ej.1) Es inocente
– (Ej.2) El nuevo tratamiento no tiene efecto
– (Ej.3) No hay nada que destacar

• H1: Hipótesis alternativa


– (Ej.1) Es culpable Especulativa
– (Ej.2) El nuevo tratamiento es útil
– (Ej. 3) Hay una situación anormal
Tipos de error al contrastar hipótesis
Ejemplo 2
Realidad
H0 cierta H0 falsa
Error de tipo II
El tratamiento sí tiene efecto
No rechazo H0 Correcto pero no lo percibimos.
El tratamiento no
tiene efecto y así se Probabilidad β
determina.

Error de tipo I
Rechazo H0 El tratamiento no
tiene efecto pero se Correcto
decide que sí. El tratamiento tiene efecto y
Acepto H1
Probabilidad α el experimento lo confirma.
Errores tipo I y II

Ejemplo: Suponga las hipótesis Ho : μ = μ0 vs. Ha : μ = μ1 (μ1 < μ0)

α = P(Rechazar Ho / Ho : μ = μ0) = P ( X < k / Ho : μ = μ 0 )


β = P(Aceptar Ho / Ho : μ = μ1) = P ( X > k / H1 : μ = μ1 )
Más ejemplos
Solución
La variable aleatoria poblacional X de nuestro interés es la duración de
un componente. Esta variable se distribuye en la población como una
exponencial: X = Exp(λ).

(a) Nos piden como contraste de hipótesis:


H0: μ=300
H1: μ<300

Disponemos de una muestra de n = 100 elementos. Para cada


componente se ha medido su duración: {x1, x2, ... , x100}. Y sabemos
que la media muestral, que la vida media de los 100 componentes es:

1 100
x= ∑
100 i =1
xi = 260
1 n
Usaremos como estimador a la media muestral: x = ∑ xi
n i =1
que es una variable aleatoria, de la que nosotros disponemos de un
valor particular: el que nos da nuestra muestra. ¿Qué distribución tiene
nuestro estimador?
El de la suma de 100 variables aleatorias distribuidas exponencialmente.
En principio sería una Erlang, pero puesto que el número de variables
es mayor que 30, podemos utilizar una normal:

(
x ≡ N μ ,σ / n )
Observa que para el caso particular de la exponencial, la media coincide
con la desviación típica y podemos escribir:

(
x ≡ N μ, μ / n )
Tipificando el estimador para que se distribuya como una N(0,1):
x−μ
z= ≡ N (0,1)
μ n
x−μ
z= ≡ N (0,1)
Región Región de μ n
crítica aceptación

α 1-α
a = 250.65

α = 0.05 = P(Rechazar H 0 | H 0 cierta) =


⎛ a − 300 ⎞
= P( x ≤ a | μ = 300) = P⎜ z ≤ ⎟ = 0.05
⎝ 300 / 100 ⎠
a − 300
zcrit = = −1.645 ⇒ a = 250.65
300 / 100
x = 260 > 250.65 ⇒ x ∈ Región de aceptación
⇒ No rechazamos H 0
(b) Si en realidad μ=250 y la hipótesis nula es que μ=300,
"detectarlo" supondría rechazar la hipótesis:

Pot = P (Rechazar H 0 | μ = 250) = P ( x ≤ a | μ = 250)


⎛ 250.65 − 250 ⎞
= P⎜ z ≤ ⎟ = P( z ≤ 0.03) = 0.512
⎝ 250 / 100 ⎠
(c) Si queremos elevar esta última probabilidad hasta el
70%:

⎧ ⎛ b − 250 ⎞
⎪ 0 . 70 = P ( Rechazar H 0 | μ = 250 ) = P ( x ≤ b | μ = 250 ) = P ⎜ z ≤ ⎟
⎪ ⎝ 250 / n ⎠

⎪0.05 = P (Rechazar H | μ = 300) = P ( x ≤ b | μ = 300) = P⎛⎜ z ≤ b − 300 ⎞⎟
⎪⎩ 0
⎝ 300 / n ⎠

⎧ b − 250
⎪⎪ 250 / n = 0.525
⎨ ⇒ n = 156.125 ≈ 157
⎪ b − 300 = −1.645
⎪⎩ 300 / n
Más ejemplos
Solución
La variable aleatoria poblacional X de nuestro interés es el número
de accidentes de tráfico en una semana. Esta variable se distribuye
en la población como una Poisson: X ~ P(λ=2.5).

(a) Debemos contrastar la hipótesis:

H0: λ=10 (reducir el límite de velocidad no influye)


H1: λ<10 (reducir el límite de velocidad disminuye el número de
accidentes)

Requerimos como estadística de prueba la siguiente variable


aleatoria:

Y = número de accidentes en cuatro semanas


0.1 ≥ P (Rechazar H 0 | H 0 cierta ) =
1444424444 3
Error tipo I

a
λx
= P (Y ≤ a | λ = 10) = ∑ e −λ
x =0 x! λ =10

Mirando en las tablas encontramos que a=5. Si el


número de accidentes observado en las cuatro semanas
es menor o igual que 5, entonces rechazamos H0.
(b) Si el número de accidentes disminuyó a 2 por
semana, entonces disminuyó a 8 accidentes por
cada cuatro semanas

P(Rechazar H1 | λ = 8) =
14442444 3
Error tipo II

= P (Y > 5 | λ = 8) = 1 − P (Y ≤ 5 | λ = 8) =
5
λx
= 1− ∑ e −λ
= 1 − 0.19 = 0.81
x =0 x! λ =8
Inferencia para Proporciones
Cuando estamos interesados en estimar la proporción p estimado de
ocurrencia de un evento. Se necesita definir una variable aleatoria X que
indique el número de veces que ocurre el evento en una muestra de
tamaño n y con probabilidad de éxito, p. Se puede mostrar que cuando el
tamaño de muestra es grande, tal que np > 5, entonces el estadístico

pˆ − p
Z =
p (1 − p )
n

se distribuye aproximadamente como una normal estándar. Aquí p


representa la proporción poblacional que se desea estimar, y la proporción
muestral es:
x
pˆ =
n
Dócima para una proporción
Caso I Caso II Caso III
Ho : p = p0 Ho : p = p0 Ho : p = p0
Ha : p < p0 Ha : p ≠ p0 Ha : p > p0

Prueba Estadística (Aproximada)

pˆ − p
Z= ~N(0,1)
p(1 − p )
n
bilateral
Decisión
Si Zcal <-Zα entonces Si |Zcal |>Zα / 2 entonces Si Zcal >Zα entonces
se rechaza Ho se rechaza Ho se rechaza Ho
Procedimiento
Ejemplo
En 1995 en una zona metropolitana, se reportó que dos de cada 5
personas reunían el perfil del consumidor de cierto bien. En una encuesta
reciente hecha en 2005 a 1225 personas se encontró que 478 de ellos
coincidían con dicho perfil. ¿Piensa usted que existe evidencia para
afirmar de que el perfil del consumidor ha cambiado con respecto a
1995? Utilice γ = 0.90

Solución:
Hay que hallar un intervalo de confianza del 90% para la proporción p,
y probar la siguiente hipótesis:

H 0 : p = 0.4 (la proporción no cambió de 1995 a 2005).


H a : p ≠ 0.4 (la proporción cambió de 1995 a 2005).
Test of p = 0.4 vs p not = 0.4

Sample X N Sample p 90% CI Z-Value P-Value


1 478 1225 0.390204 (0.367280, 0.413128) -0.70 0.484

Interpretación: Viendo que el “P-value” es 0.484 mucho mayor que 0.10


se llega a la conclusión de que no hay suficiente evidencia de que la
proporción de personas con el perfil deseado haya cambiado de 1995 a
2005.
Ejemplo

Un político puede estar interesado en conocer si ha habido un aumento en


la proporción (porcentaje) de votantes que lo favorecen en las próximas
elecciones; una productor de cereales puede querer conocer si ha
ocurrido o no una baja en la proporción de clientes que prefieren su marca
de cereal; un hospital desea confirmar el reclamo de un manufacturero de
medicamentos quien afirma éste cura al 80% de los usuarios. Estos
ejemplos son algunas de las situaciones donde nos interesa probar alguna
afirmación referente a una proporción. El procedimiento para probar una
proporción en una población normal es casi igual al usado para las
medias.

Vous aimerez peut-être aussi