Vous êtes sur la page 1sur 32

Tema 6: Estimación por intervalos

Métodos estadı́sticos y econométricos

Ana J. López, Rigoberto Pérez y Covadonga Caso

Dpto Economı́a Aplicada. Universidad de Oviedo

Curso 2018-2019

A.J. López, R. Pérez y C. Caso (Uniovi) T


Índice

1 Estimación de parámetros. Modelos de probabilidad asociados

2 Intervalos de confianza. Construcción

3 Intervalos de confianza para los parámetros habituales

4 Determinación del tamaño muestral

C:/Users/Maria Jesus

A.J. López, R. Pérez y C. Caso (Uniovi)


Estimación por intervalos
Competencias

En este tema se estudian los métodos de construcción de intervalos y una vez


finalizado los alumnos deberán ser capaces de:
Conocer las ventajas y limitaciones de la estimación puntual y por intervalos
Interpretar las caracterı́sticas de precisión y confianza de una estimación
Describir y calcular probabilidades asociadas a los modelos de probabilidad
chi-cuadrado, t de Student y F de Snedecor
Construir intervalos de confianza para la media, la proporción y la varianza
Conocer el método de obtención del tamaño de muestra necesario para
llevar a cabo una estimación de la media o la proporción con determinadas
garantı́as
DISTRIBUCIÓN DE HORAS DE TRABAJO
Teorı́a Práctica Gretl Trabajo autónomo TOTAL
3 1,5 1,5 8 14 C:/Users/Maria Jesus

A.J. López, R. Pérez y C. Caso (Uniovi)


Estimación de parámetros. Modelos de probabilidad asociados

Estimación puntual y por intervalos

La estimación puntual ofrece algunas garantı́as asociadas a las


muestras aleatorias (selección probabilı́stica) y las propiedades de los
estimadores utilizados (ausencia de sesgo, eficiencia, suficiencia,
consistencia)
Cuando las estimaciones puntuales se complementan con un margen
de error se obtienen intervalos de confianza

C:/Users/Maria Jesus

A.J. López, R. Pérez y C. Caso (Uniovi) T


Estimación de parámetros. Modelos de probabilidad asociados

Parámetros, estimadores y distribuciones

Parámetros habituales
Media Dif.de medias Proporción Varianza Razon de Var.
σX2
µ µX − µY p σ²
σY2
Estimadores utilizados
SX2
X̄ X̄ − Ȳ p̂ S2
SY2

C:/Users/Maria Jesus

A.J. López, R. Pérez y C. Caso (Uniovi)


Estimación de parámetros. Modelos de probabilidad asociados

Distribución chi-cuadrado χ2

Definición
Dadas n variables aleatorias X1 , . . . , Xn , independientes y distribuidas
n
Xi2 se dice que sigue una
P
según un modelo N(0, 1), la variable aleatoria
i=1
distribución chi-cuadrado con n grados de libertad, que denotamos
por χ2n .

Propiedad
Si Y1 , . . . , Yn son variables aleatorias independientes y distribuidas según
n  2
P Yi −µ
un modelo N(µ, σ), la variable aleatoria σ se distribuye según
i=1
un modelo χ2n .
C:/Users/Maria Jesus

A.J. López, R. Pérez y C. Caso (Uniovi)


Estimación de parámetros. Modelos de probabilidad asociados

Caracterı́sticas de la distribución χ2n


Representación gráfica de su función de densidad:
0,16
Chi-cuadrado(5)
Chi-cuadrado(20)

0,14

0,12

0,1

0,08

0,06

0,04

0,02

0
0 5 10 15 20 25 30 35 40

La distribución chi-cuadrado es asimétrica y sólo puede tomar valores


positivos
E (χ2n ) = n; Var (χ2n ) = 2n
El número de grados de libertad n, puede interpretarse como el
número de valores que es posible fijar de modo arbitrario
El modelo χ2n es reproductivo respecto al parámetro n: Si X1 ≈ χ2n1 y C:/Users/Maria Jesus
X2 ≈ χ2n2 son independientes =⇒ X1 + X2 ≈ χ2n1 +n2 .
A.J. López, R. Pérez y C. Caso (Uniovi) T
Estimación de parámetros. Modelos de probabilidad asociados

Distribución t de Student

Definición
Dadas dos variables aleatorias independientes X ≈ N(0, 1) e Y ≈ χ2n , la
variable aleatoria:

X
q
Y
n

se dice que sigue una distribución t de Student con n grados de


libertad, que denotamos por tn .

C:/Users/Maria Jesus

A.J. López, R. Pérez y C. Caso (Uniovi)


Estimación de parámetros. Modelos de probabilidad asociados

Caracterı́sticas de la distribución tn
Representación gráfica de su función de densidad:
0,5
t(30)

0,45

0,4

0,35

0,3

0,25

0,2

0,15

0,1

0,05

0
-5 -4 -3 -2 -1 0 1 2 3 4 5

La distribución tn es unimodal, simétrica y campaniforme. Para


valores elevados de n se aproxima por el modelo N(0, 1)
n
E (tn ) = 0; Var (tn ) = n−2 C:/Users/Maria Jesus

A.J. López, R. Pérez y C. Caso (Uniovi) T


Estimación de parámetros. Modelos de probabilidad asociados

Distribución F de Snedecor

Definición
Dadas dos variables aleatorias independientes X ≈ χ2n e Y ≈ χ2m , la
variable aleatoria:

X /n
Y /m
se dice que sigue una distribución F de Snedecor con n y m grados de
libertad, que denotamos por Fmn o Fn,m .

Snedecor denominó F a esta distribución en honor de R.A. Fisher, que


fue el primero en estudiar la distribución del cociente de varianzas

C:/Users/Maria Jesus

A.J. López, R. Pérez y C. Caso (Uniovi)


Estimación de parámetros. Modelos de probabilidad asociados

Caracterı́sticas de la distribución Fmn


Representación gráfica de su función de densidad:
0,8
F(5, 20)

0,7

0,6

0,5

0,4

0,3

0,2

0,1

0
0 0,5 1 1,5 2 2,5 3 3,5 4 4,5 5

La distribución Fmn es es asimétrica y sólo puede tomar valores


positivos.
(Propiedad de inversión) Si X ≈ Fmn , su inversa 1/X sigue una
distribución Fnm
(Relación con la distribución t de Student) Si X ≈ tm , entonces la C:/Users/Maria Jesus

variable X 2 sigue un modelo Fm1


A.J. López, R. Pérez y C. Caso (Uniovi) T
Estimación de parámetros. Modelos de probabilidad asociados

Actividades del estudiante

Justificar las propiedades de la F de Snedecor (inversión y relación


con la t de Student)
Consultar las biografı́as de Karl Pearson, W.S. Gosset y R.A. Fisher
[INE, U.York]

C:/Users/Maria Jesus

A.J. López, R. Pérez y C. Caso (Uniovi) T


Intervalos de confianza. Construcción

Intervalos de confianza

Definición
Dada una muestra aleatoria (X1 , . . . , Xn ), extraida de una población X
que depende de un parametro desconocido θ, llamamos intervalo de
confianza a un intervalo del espacio paramétrico limitado por dos valores
aleatorios T1 (X1 , . . . , Xn ) y T2 (X1 , . . . , Xn ) entre los que con cierta
probabilidad se halla comprendido el verdadero valor de θ.
Se denomina nivel de confianza, que se denota por 1 − α, a la
probabilidad o confianza de que el parámetro se encuentre entre los lı́mites
anteriores, es decir:

P(T1 ≤ θ ≤ T2 ) = 1 − α

C:/Users/Maria Jesus

A.J. López, R. Pérez y C. Caso (Uniovi)


Intervalos de confianza. Construcción

Caracterı́sticas de las estimaciones

C:/Users/Maria Jesus

A.J. López, R. Pérez y C. Caso (Uniovi) T


Intervalos de confianza. Construcción

Precisión de los intervalos

La precisión de los intervalos se mide a través de su amplitud A o también,


A
en el caso de intervalos simétricos, el margen de error  = .
2
Factores que afectan a la precisión:
El nivel de confianza: al aumentar el nivel de confianza exigido
aumenta la amplitud del intervalo y por tanto disminuye su precisión
La información poblacional: la precisión mejora con la información
sobre la distribución de probabilidad de la variable estudiada X
(modelo y parámetros)
La información muestral: la precisión mejora al aumentar el tamaño
muestral (n), y también cuanto más adecuado sea el método de
selección muestral y el estimador utilizado
C:/Users/Maria Jesus

A.J. López, R. Pérez y C. Caso (Uniovi) T


Intervalos de confianza. Construcción

Interpretación del nivel de confianza


Intervalos con nivel de confianza 1 − α

Si se construyen un número elevado de intervalos, el (1 − α) % de ellos


C:/Users/Maria Jesus

contendrá el verdadero valor del parámetro


A.J. López, R. Pérez y C. Caso (Uniovi) T
Intervalos de confianza. Construcción

Esquema de trabajo en inferencia


' $
POBLACIÓN X
Parámetros θ
Parámetros . & Parámetros

de posición de dispersión
m.a.s.
↓ (X1 , . . . , Xn ) ↓

↓ T (X1 , . . . , Xn ) ↓

T
eT = T − θ ←− Error eT −→ eTR = θ

Discrepancia dT
& %
C:/Users/Maria Jesus

A.J. López, R. Pérez y C. Caso (Uniovi) T


Intervalos de confianza. Construcción

Construcción de intervalos de confianza

C:/Users/Maria Jesus

A.J. López, R. Pérez y C. Caso (Uniovi) T


Intervalos de confianza para los parámetros habituales

Estimación de la media poblacional


Estimador insesgado
La media muestral es un estimador insesgado de la media poblacional
n
X
Xi
i=1   σ2
X̄ = ; E X̄ = µ ; Var X̄ =
n n
σ
Error estándar: σX̄ = √
n

La media muestral se distribuye normalmente siempre que X siga un


modelo normal
 
σ X̄ − µ
X ≈ N(µ, σ) ⇒ X̄ ≈ N µ, √ =⇒ dX̄ = σ ≈ N(0, 1)
n √
n

Además con tamaños muestrales elevados podemos utilizar la


aproximación normal (TCL)
 
σ
X̄ → N µ, √ C:/Users/Maria Jesus
n

A.J. López, R. Pérez y C. Caso (Uniovi) T


Intervalos de confianza para los parámetros habituales

Ilustración. Intervalo de confianza para la media

C:/Users/Maria Jesus

A.J. López, R. Pérez y C. Caso (Uniovi) T


Intervalos de confianza para los parámetros habituales

Intervalos de confianza para la media


Población con varianza conocida (modelo normal o tamaño muestral elevado)

X̄ − µ
dX̄ = ≈ N(0, 1)
√σ
n

 
X̄ −µ
Valor de k: P(−k ≤ N(0, 1) ≤ k) = P −k ≤ σ
√ ≤k =1−α
n
Intervalo de confianza para la media con nivel 1 − α
 
σ σ
X̄ − k √ , X̄ + k √
n n C:/Users/Maria Jesus

A.J. López, R. Pérez y C. Caso (Uniovi)


Intervalos de confianza para los parámetros habituales

Estimación de la varianza poblacional

Estimador insesgado
La varianza muestral es un estimador insesgado de la varianza poblacional:
Pn 2
2 i=1 Xi − X̄
; E S 2 = σ2

S =
n−1

Teorema de Fisher
Dada una m.a.s. (X1 , . . . , Xn ) extraı́da de una población N(µ, σ), se
cumple:
La media muestral X̄ y la varianza muestral S 2 son v.a.
independientes
(n − 1)S 2
La expresión aleatoria se distribuye según el modelo χ2n−1
σ2 C:/Users/Maria Jesus

A.J. López, R. Pérez y C. Caso (Uniovi)


Intervalos de confianza para los parámetros habituales

Estimación de la media poblacional (varianza desconocida)


Si X se distribuye normalmente con varianza desconocida, la discrepancia
asociada a la media muestral para muestras de tamaño n sigue un modelo
t de Student con (n − 1) grados de libertad:

X̄ − µ
X ∼ N(µ, σ) [σ desconocida] =⇒ dX̄ = ∼ tn−1
√S
n

La demostración se basa en los siguientes resultados:


Distribución de la discrepancia dX̄ en el caso de poblaciones normales
con varianza conocida
Teorema de Fisher
Definición del modelo t de Student

C:/Users/Maria Jesus

A.J. López, R. Pérez y C. Caso (Uniovi) T


Intervalos de confianza para los parámetros habituales

Intervalos de confianza para la media


Población normal con varianza desconocida

X̄ − µ
dX̄ = ≈ tn−1
√S
n

 
X̄ −µ
Valor de k: P(−k ≤ tn−1 ≤ k) = P −k ≤ S

≤k =1−α
n
Intervalo de confianza para la media con nivel 1 − α
 
S S
X̄ − k √ , X̄ + k √ C:/Users/Maria Jesus
n n
A.J. López, R. Pérez y C. Caso (Uniovi)
Intervalos de confianza para los parámetros habituales

Intervalos de confianza para la varianza


Población normal

(n − 1)S 2
dS 2 = ≈ χ2n−1
σ2

Valores k1 y k2 :

 α
P χ2n−1 ≤ k1 = P χ2n−1 ≥ k2 = ; P k1 ≤ χ2n−1 ≤ k2 = 1 − α
 
2
Intervalo de confianza para la varianza con nivel (1 − α):

(n − 1)S 2 (n − 1)S 2
 
, C:/Users/Maria Jesus

k2 k1
A.J. López, R. Pérez y C. Caso (Uniovi) T
Intervalos de confianza para los parámetros habituales

Estimación de la proporción poblacional


(X1 , . . . , Xn ) m.a.s., siendo Xi v.a. dicotómicas o de Bernouilli

Xi = 1 Si se presenta la caracterı́stica investigada P(Xi = 1) = p


Xi = 0 En otro caso P(Xi = 0) = 1 − p

Estimador insesgado
La proporción muestral es un estimador insesgado de la proporción
poblacional
X n
Xi
p̂ = i=1n = Xn , con X: Número de elementos de la muestra que presenta
la caracterı́stica investigada [X ∼ B(n, p)]

E (X ) np Var (X ) p(1 − p)
E (p̂) = = = p ; Var (p̂) = =
n n n2 n

Además con tamaños muestrales elevados podemos utilizar la


aproximación normal (Teorema de DeMoivre)
r !
p(1 − p)
p̂ ≈ N p, C:/Users/Maria Jesus
n

A.J. López, R. Pérez y C. Caso (Uniovi) T


Intervalos de confianza para los parámetros habituales

Intervalos de confianza para la proporción


Tamaño muestral elevado

p̂ − p
dp̂ = r ≈ N(0, 1)
p(1 − p)
| {zn }
q
p̂(1−p̂)
n−1

!
Valor de k: P(−k ≤ N(0, 1) ≤ k) = P −k ≤ qp̂−p ≤k =1−α
p̂(1−p̂)
n−1
Intervalo de confianza para la proporción con nivel 1 − α
" r r #
p̂(1 − p̂) p̂(1 − p̂)
p̂ − k , p̂ + k C:/Users/Maria Jesus
n−1 n−1

A.J. López, R. Pérez y C. Caso (Uniovi) T


Intervalos de confianza para los parámetros habituales

Actividades del estudiante

Suponiendo que tenemos una población normal y seleccionamos


muestras aleatorias de un tamaño determinado (n, fijado por
vosotros), obtener los valores de k para construir intervalos para la
media con distintos niveles de confianza (con varianza conocida y
desconocida). Anotar los resultados en una tabla del siguiente tipo y
resumir las conclusiones:

Nivel de confianza 0,8 0,9 0,95 0,99


Valor de k (varianza conocida)
Valor de k (varianza desconocida)

C:/Users/Maria Jesus

A.J. López, R. Pérez y C. Caso (Uniovi) T


Determinación del tamaño muestral

Tamaño muestral para la estimación de la media

En las investigaciones muestrales a menudo es necesario obtener el tamaño


mı́nimo de muestra para estimar la media una vez fijadas las exigencias de
confianza y precisión:
Población: X ≈ N(µ, σ)
Nivel de confianza: 1 − α
Margen de error: 
   2
σ σ σ kσ
X̄ − k √ , X̄ + k √ =⇒  = k √ =⇒ n =
n n n 

El tamaño aumenta con el nivel de confianza (que afecta a k)


El tamaño aumenta con la dispersión poblacional
El tamaño aumenta al reducirse el margen de error 
C:/Users/Maria Jesus

A.J. López, R. Pérez y C. Caso (Uniovi)


Determinación del tamaño muestral

Tamaño muestral para la estimación de la proporción

En ocasiones deseamos obtener el tamaño muestral para estimar la


proporción una vez fijadas las exigencias de confianza y precisión:
Nivel de confianza: 1 − α
Margen de error: 
" r # r
p(1 − p) p(1 − p) k 2 p(1 − p)
p̂ ± k ⇒=k =⇒ n =
n n 2

El tamaño aumenta con el nivel de confianza (que afecta a k)


Existen varios métodos para aproximar el valor p(1 − p):
I Seleccionar una muestra piloto que proporcione una primera estimación
de p
I Sustituir el valor p(1 − p) por su cota máxima, que es 0,25
C:/Users/Maria Jesus

A.J. López, R. Pérez y C. Caso (Uniovi)


Determinación del tamaño muestral

Actividades del estudiante

Consultar algunas de las encuestas electorales disponibles. Analizar su


tamaño muestral y su relación con el margen de error y el nivel de
confianza

C:/Users/Maria Jesus

A.J. López, R. Pérez y C. Caso (Uniovi) T


Determinación del tamaño muestral

Material de consulta

PÉREZ, R. y LÓPEZ, A.J. (2011): Métodos Estadı́sticos para


Economı́a y Empresa. [libro en lı́nea] Disponible desde Internet en:
http://goo.gl/z05TR. [Temas 6 y 7]
Referencias complementarias
INE Revista Índice Nº39
http://www.revistaindice.com/numero39/. Explica
http://www.ine.es/explica/explica_historia.htm
Life and Work of Statisticians, Universidad de York http://www.
york.ac.uk/depts/maths/histstat/lifework.htm

C:/Users/Maria Jesus

A.J. López, R. Pérez y C. Caso (Uniovi) T

Vous aimerez peut-être aussi