Académique Documents
Professionnel Documents
Culture Documents
Tema5.InferenciaEstads3ca
ngelBarnCaldera
ngelCoboOrtega
MaraDoloresFrasDomnguez
JessFernndezFernndez
FranciscoJavierGonzlezOr@z
CarmenMaraSordoGarca
DEPARTAMENTODEMATEMTICAAPLICADAY
CIENCIASDELACOMPUTACIN
UNIVERSIDADDECANTABRIA
License:
Crea3veCommonsBYNCSA3.0
TEMA5: Inferencia Estadstica
1. Muestreo:
Tamao y calidad de la muestra
Muestreo aleatorio
2. Inferencia estadstica:
Estimacin de una proporcin
Estimacin de una media
Estimacin de una varianza
3. Contraste de hiptesis usando
intervalos de confianza
Muestreo
POBLACIN: todos los estudiantes de la
muestra
Universidad de Cantabria
MUESTRA: alumnos de 1 de Grado de
Ingeniera Civil de la Universidad de Cantabria.
poblacin
Necesidad del muestreo:
1-1
1-2
1-3
.
3-1
.
6-5
6-6
Inferencia Estadstica
El problema que aparece con ms frecuencia en la prctica es
el de la estimacin de parmetros de la poblacin, que son
desconocidos.
Existe una
de donde se utilizados
extrae una para estimar
la muestra utilizados
muestra genera para evaluar estadsticos
aleatoria datos
numricos
la muestra utilizados
muestra aleatoria: genera para evaluar x = 1.71
2 0 .5
Alumnos de 1 de
Grupo alumnos
Ingenieria Civil S n = 0.53
1.7
1.72,1.69,1.57...
23,18,20,1.90
media media
varianza 2 Varianza S2
Objetivo:min
Estimacin de una proporcin
Dada una poblacin con N individuos de los cuales M poseen
cierta propiedad (e.g. mujeres) que no poseen los dems, la
proporcin poblacional se define como P = M/N
Si se elige una muestra de esa poblacin de tamao n, en la
que aparecen m individuos con esa propiedad, entonces la
proporcin muestral se define como p = m/n
P p3
p1
p
La proporcin poblacional (P) es p2
constante mientras que cada p4
muestra puede tener una
proporcin muestral (p) distinta.
Se denomina intervalo de
probabilidad de una
proporcin a aquel intervalo
para el cual se sabe con una
confianza 1- que la proporcin
muestral se encuentra en dicho
intervalo.
P-e P+e
Intervalos de probabilidad de una proporcin
1- (nivel de confianza, 90% 95% 99%)
es el nivel de significacin
P+e
P(P e p P + e) = FN ( , )( P + e) FN ( , )( P e) = FN ( 0,1)
2 2
Pe e e e
FN ( 0,1) = FN ( 0,1) 1 FN ( 0,1) = 2 FN ( 0,1) 1 = 1
FN (0,1)(e / ) = 1 / 2
Donde
Intervalos de probabilidad de una proporcin
P-z/2 P P+z/2
Pe
Muestreo sin reemplazamiento y Muestreo con reemplazamiento
poblacin finita o poblacin infinita
nP > 5
nP > 5
n(1 P) > 5 Condiciones
de validez n(1 P) > 5
n / N < 0.9
Ejemplo: La poblacin de internados en un centro mdico es
de 1000 enfermos, de los cuales el 20% padecen afecciones
cardiacas. Se elige una muestra de 50 enfermos del fichero de
registro. Calcular el intervalo de probabilidad al 0.95 de p para el
caso de muestreo sin y con reemplazamiento.
Intervalos de probabilidad de una proporcin
Pe
Muestreo sin reemplazamiento y Muestreo con reemplazamiento
poblacin finita o poblacin infinita
nP > 5
nP > 5
n(1 P) > 5 Condiciones
de validez n(1 P) > 5
n / N < 0.9
Ejemplo:
Estimadores de una proporcin
En la realidad, el problema ms frecuente es el de la estimacin de
los parmetros de la poblacin. Para ello se extrae de la poblacin
una muestra de tamao n y conocida sta se trata de estimar P.
p P
No da informacin alguna de la precisin de la estimacin.
Intervalo de confianza: Determina entre que valores (a, b] se
encuentra la proporcin de la poblacin P con cierta probabilidad o
certeza (1-).
P(a P b) = 1
Complementa la estimacin puntual precisando la exactitud de la estimacin.
Intervalos de Confianza de una Proporcin
Se dice que el intervalo (a,b] es un intervalo de confianza
para P al nivel (1-) si se verifica:
P(a P b) = 1
P(P e p P + e) = 1
Esta expresin se puede escribir como:
P(p e P p + e) = 1
Por lo que el intervalo [p-e, p+e] tiene una probabilidad
asociada de (1- ) de contener al parmetro P.
Intervalos de confianza de una proporcin
pe
Muestreo sin reemplazamiento y Muestreo con reemplazamiento
poblacin finita o poblacin infinita
n ( p e) > 5 n ( p e) > 5
n(1 p e) > 5 Condiciones
de validez n(1 p e) > 5
n / N < 0.9
Ejemplo: En una muestra aleatoria de 50 rocas tomadas de
una mina se observa que 20 de ellas son ricas en contenido
mineral. Estimar puntualmente la proporcin de rocas con alto
contenido mineral en la mina. Calcular un intervalo de confianza
0.95 de esta proporcin.
Intervalos de Confianza de una Proporcin
muestra (n).
La funcin de probabilidad converge a la normal para n
P(a x b) = 1
Al igual que para proporciones, para la media el intervalo de
especial inters es el simtrico respecto de la media de la
poblacin.
P( e x + e) = 1 [ e, + e]
Intervalos de probabilidad de una media
Varianza de la poblacin conocida y n grande (n30): la
distribucin muestral se puede aproximar por una normal, Teor.
central del lmite.
Muestreo sin reemplazamiento y Muestreo con reemplazamiento o
poblacin finita poblacin infinita
N n
z / 2
n(N 1 )
n =1, 4, 16,
> qt(0.95, 9)
[1] 1.833113
Ejercicio
En un instituto se sabe que la estatura de los
alumnos se ajusta a una N(165,82) en cm. Calcular la probabilidad
de que la altura media de 64 alumnos, elegidos al azar, est entre
163 y 167 cm.
Estimadores de una media
Como ya se ha mencionado antes, en la realidad, el problema ms
frecuente es el de la estimacin de los parmetros de la poblacin.
Para ello se extrae de la poblacin una muestra de tamao n y
conocida sta se trata de estimar .
N n
e = z / 2 e = z / 2
n(N 1 ) n
S
e = tn1, / 2
n
Tamao de muestra para estimar media
Al igual que con la proporcin, en la realidad el problema que se
plantea se centra en estimar el tamao de muestra necesario
para estimar una media con un error y nivel de confianza dados.
e = z / 2 n = z/2 2
2
n e
P(a S b) = 1
2
n
Para el caso de la varianza y cuasi-varianza muestrales, no
existe una distribucin a la que converjan todos los casos
posibles de distribucin poblacional.
La distribucin de la varianza o cuasi-varianza muestral
depende en alto grado de cual sea la distribucin poblacional
de partida.
Para simplificar vamos a considerar en lo que sigue slo el
caso de poblacin normal.
Intervalos de probabilidad de una varianza
Por tanto:
n=30
a b
Intervalos de probabilidad de una cuasi-varianza
2
n1 S sigue una distribucin Chi-cuadrado con n-1
grados de libertad,
2
El intervalo de probabilidad vendra dado de la forma:
Estimadores de una varianza
En la realidad, el problema ms frecuente es el de la estimacin de
los parmetros de la poblacin. Para ello se extrae de la poblacin
una muestra de tamao n y conocida sta se trata de estimar 2.
Ejemplo:
La proporcin de mujeres en Madrid toma un valor determinado:
P = 50.58%
Contraste de hiptesis usando intervalos de confianza
Ejemplo:
Se desea contrastar que la proporcin de mujeres en Madrid
toma un valor determinado:
H0: P = 50.58%
Contraste de hiptesis usando intervalos de confianza
La realizacin de un contraste implica la existencia de dos
hiptesis:
La hiptesis nula H0 es la que se formula y se quiere contrastar.
Es la que el investigador asume como correcta y que no
necesita ser probada, es decir, la aceptacin de H0 no implica
que sta sea correcta o que haya sido probada, sino que los
datos no han proporcionado evidencia suficiente como para
rechazarla.
La hiptesis alternativa es la hiptesis opuesta de H0, de forma
que si a partir de la muestra se rechaza H0 entonces se acepta
como cierta H1.
Ejemplo:
Se desea contrastar que la proporcin de mujeres en Madrid
toma un valor determinado:
H0: P = 50.58%
H1: P 50.58%
Contraste de hiptesis usando intervalos de confianza
Las afirmaciones no son todas del mismo tipo, pueden involucrar
ya sea el valor numrico de algn parmetro, suponiendo la
distribucin conocida (generalmente la Normal), o la forma
funcional no conocida de la distribucin de inters a partir de la
cual se obtiene la muestra .
1. H0 : P = 0.5
Contraste paramtrico
2. H0 : = 1.68
3. H0 : F ~ Normal Contraste no paramtrico
Contrastes paramtricos:
Si: H0 : = 0.5,
entonces H1 puede ser: H1 : > 0.5 Contraste unilateral derecho
H1 : < 0.5 Contraste unilateral izquierdo
H1 : 0.5 Contraste bilateral
Contraste de hiptesis usando intervalos de confianza
La prueba de H0 : = 0
Contraste bilateral
H1 : 0