Vous êtes sur la page 1sur 42

Gestión Aeronáutica: Estadística Teórica

Facultad Ciencias Económicas y Empresariales
Departamento de Economía Aplicada
Profesor: Santiago de la Fuente Fernández

ESTIMADORES

Gestión Aeronáutica: Estadística Teórica
Facultad Ciencias Económicas y Empresariales
Departamento de Economía Aplicada
Profesor: Santiago de la Fuente Fernández

ESTIMADORES
Un estimador es un estadístico (una función de la muestra) utilizado para estimar un
parámetro desconocido de la población.

Por ejemplo, si se desea conocer el precio medio poblacional de un artículo (parámetro
desconocido) se recogen observaciones del precio de dicho artículo en diversos
establecimientos (muestra) pudiendo utilizarse la media aritmética de las observaciones
para estimar el precio medio poblacional.

Para cada parámetro pueden existir varios estimadores diferentes. En general, se elige
el estimador que posea mejores propiedades que los restantes, como insesgadez,
eficiencia, convergencia y robustez (consistencia).

El valor de un estimador proporciona una estimación puntual del valor del parámetro en
estudio. En general, se realiza la estimación mediante un intervalo, es decir, se obtiene
un intervalo parámetro muestral error muestral dentro del cual se espera se
encuentre el valor poblacional dentro de un cierto nivel de confianza. El nivel de
confianza es la probabilidad de que a priori el valor poblacional se encuentre contenido
en el intervalo.

PROPIEDADES DE LA ESPERANZA Y VARIANZA

a) E a X1 b X2 E a X1 E b X2 aE X1 bE X2

b) Var a X1 b X2 Var a X1 Var b X2 a2 Var X1 b2 Var X2

SESGO

Se denomina sesgo de un estimador a la diferencia entre la esperanza (valor esperado)
del estimador y el verdadero valor del parámetro a estimar. Es deseable que un
estimador sea insesgado o centrado, esto es, que el sesgo sea nulo para que la
esperanza del estimador sea igual al valor del parámetro que se desea estimar.

Por ejemplo, si se desea estimar la media de una población, la media aritmética de la
muestra es un estimador insesgado de la misma, ya que la esperanza (valor esperado)
es igual a la media poblacional.

Si una muestra X (x1, x 2 , , xn ) procede de una población de media :

E xi para i (1, 2, n)

La media aritmética muestral es un estimador insesgado de la media poblacional:
n n n
1 1 1 1 1
E x E xi E xi E xi E x1 E x2 E xn n
n i 1
n i 1
n i 1
n n

1

La varianza de una muestra aleatoria simple es un estimador sesgado de la varianza
poblacional, siendo su esperanza:
n

(xi x)2
2
La varianza muestral x
i 1

n

Para calcular su esperanza matemática se realizan previamente algunos cálculos
sumando y restando la esperanza de la variable aleatoria poblacional.

n n
2
(xi x) (xi x )2 n
2 1 2
x
i 1 i 1
(xi ) (x )
n n n i 1

Desarrollando el cuadrado:
n
2 1
x (xi )2 (x )2 2(x i )(x )
n i 1

n n
1
(xi )2 n(x )2 2(x ) (xi )
n i 1 i 1

n
1
(xi )2 n(x )2 2 (x ) (n x n )
n i 1

n
1
(xi )2 n x2 n 2
2n x 2n x 2 2n x 2n x 2n 2

n i 1

n
1
(xi )2 n(x )2
n i 1

Calculando la esperanza matemática de la varianza muestral 2
x
:

n n
2 1 2 2 1
E x E (xi ) n(x ) E (xi )2 E (x )2
n i 1
n i 1
var ianza media
varianza poblacional muestral

En el segundo miembro aparecen dos esperanzas, la primera E (xi )2 coincide con la
2
varianza poblacional al tratarse de una muestra aleatoria simple, la segunda
2
esperanza E (x )2 es la varianza de la media muestral
n
2
2 2 n 1 2
Por tanto, E x
n n

2

La cuasivarianza de una muestra aleatoria simple es un estimador insesgado de la
varianza poblacional:
n

(xi x)2
s2x i 1

n 1

2 n
La relación entre varianza y cuasivarianza: n x (n 1) s2x s2x 2
x
n 1

La esperanza de la cuasivarianza s2x es igual a la varianza poblacional 2
:

n n n n 1
E s2x E 2
x .E 2
x . . 2 2

n 1 n 1 n 1 n

Un estimador ˆ es insesgado (centrado) cuando E ( ˆ )

Un estimador ˆ es sesgado cuando E ( ˆ ) b(ˆ) b(ˆ) E(ˆ)
sesgo

Un estimador ˆ es asintóticamente insesgado si su posible sesgo tiende a cero al
aumentar el tamaño muestral que se calcula: lim b ( ˆ ) 0
n

n
1
Sea el estimador ˆ xi
n 1 i 1

n n n
1 1 1 1 n
E(ˆ) E xi E xi E (x i ) (n )
n 1 i 1
n 1 i 1
n 1 i 1
n 1 n 1

n n n
b( ˆ ) E( ˆ ) n
0
n 1 n 1 n 1
insesgado
asintóticamente

ERROR CUADRÁTICO MEDIO DE LOS ESTIMADORES (ECM)
La utilización de la estimación puntual como si fuera el verdadero valor del parámetro
conduce a que se pueda cometer un error más o menos grande.

El Error Cuadrático Medio (ECM) de un estimador ˆ viene definido:
2

ECM( ˆ ) E(ˆ )2 V (ˆ) E(ˆ ) siendo el sesgo b ( ˆ ) E(ˆ )
sesgo

Cuando el estimador es centrado, el sesgo b ( ˆ ) 0 ECM( ˆ ) V (ˆ)

Un error cuadrático medio pequeño indicará que en media el estimador ˆ no se
encuentra lejos del parámetro .

3

CONSISTENCIA Si no es posible emplear estimadores de mínima varianza. Sean ˆ 1 y ˆ 2 dos estimadores insesgados. ) nE 4 . El estimador ˆ es consistente cuando lim E ( ˆ ) y lim V ( ˆ ) 0 n n EFICIENCIA Un estimador es más eficiente o más preciso que otro estimador. Es insesgado Un estimador es eficiente cuando verifica: Posee varianza mínima La cuestión de tener varianza mínima queda resuelta mediante la Cota de Cramér-Rao. el requisito mínimo deseable para un estimador es que a medida que el tamaño de la muestra crece. ) nE E 1 Si el estimador es insesgado. La varianza de un estimador verifica siempre la Cota de Cramér-Rao: V( ˆ ) CCR . Un estimador ˆ consistente es un estimador asintóticamente insesgado cuya varianza tiende a cero al aumentar el tamaño muestral. Un estimador será eficiente cuando V( ˆ ) CCR 2 2 1 b( ˆ ) 1 b( ˆ ) y la cota resulta V ( ˆ ) CCR 2 2 lnL(x. ) nE 2 1 b( ˆ ) Y en muestras aleatorias simples: V ( ˆ ) CCR 2 lnL(x. propiedad que se denomina consistencia. el valor del estimador tienda a ser el valor del parámetro poblacional. b( ˆ ) 0 : V(ˆ) CCR 2 lnL(x. si la varianza del primero es menor que la del segundo. ) lnL(X. se dice que ˆ 1 es más eficiente que ˆ 2 si se verifica que Var ( ˆ 1 ) Var ( ˆ 2 ) Var ( ˆ 1 ) La eficiencia relativa se mide por el ratio: Var ( ˆ ) 2 La eficiencia de los estimadores está limitada por las características de la distribución de probabilidad de la muestra de la que proceden.

xn . . xn . ya que es más fácil de manejar y presenta los mismos máximos y mínimos. . puede simplificarse en una muestra aleatoria simple (m. . ) ln P (x . ˆ n ) que maximizan la función de verosimilitud de la muestra (x 1. ˆ n ) de la ecuación: 0 y se obtiene el estimador ˆ de máxima verosimilitud E. . obteniendo la expresión: 2 2 ln P (x1.xn . Un estimador es asintóticamente eficiente si: lim V( ˆ ) CCR x El denominador de la Cota de Cramér-Rao es la cantidad de información de Fisher en una muestra: 2 2 ln L (X.E MÉTODO DE MÁXIMA VEROSIMILITUD (EMV) La estimación por máxima verosimilitud es un método de optimización que supone que la distribución de probabilidad de las observaciones es conocida. x 2 . es más práctico encontrar el estimador de máxima verosimilitud es considerar la función soporte o log-verosimilitud lnL ( ) .V ( ˆ ) 5 .s. ) I( ) E o bien i( ) E donde I( ) ni( ) A la función ln L (X. . ) se llama soporte o log-verosimilitud El denominador de la expresión. x 2 . .). I( ) . ) f (x 1 ) f (x n ) caso continuo En muchas ocasiones. Sea (x 1.a. lnL ( ) Se despeja ˆ ( ˆ 1. ) L ( x 1. x n ) obtenida: P (x 1 . ) caso discreto L( ) L(X. n ).Es preciso destacar que la Cota de Cramér-Rao (CRR) no tiene por qué tomar siempre un valor muy pequeño (cercano a cero). . ) ln f (x . ) Continuo : E n. El estimador de máxima verosimilitud (probabilidad conjunta) de es el formado por los valores ( ˆ 1.M. ) Discreto : E n. en lugar de la función de verosimilitud L ( ) . x n ) una muestra aleatoria (no necesariamente simple) de una población X con función de masa P (o función de densidad f ) donde ( 1. ) P (x n . según sea el caso discreto o continuo.E 2 2 ln f (x1. . ) ln L(x.

h(x 1 . formando así tantas ecuaciones como parámetros poblacionales se pretenden estimar: n xi 1 E (X) ˆ1 a1 i 1 x n n x i2 2 E (X 2 ) ˆ 2 a2 i 1 n n x ri r E (X r ) ˆr ar i 1 n 6 . .x n) caso continuo Para encontrar un estadístico suficiente ˆ hay que factorizar la función de verosimilitud de la forma: L ( ) g ( ˆ . que dice que dada una muestra aleatoria (x 1 . h(x 1 . . .xn) caso discreto f (x 1 . x n ) de una población X con función de masa P (o función de densidad f ) un estadístico ˆ es suficiente para si y sólo sí: P (x 1 . . Es decir.x n) g ˆ (x 1 . x n ).x n) MÉTODO DE LOS MOMENTOS El procedimiento consiste en igualar momentos poblacionales respecto al origen ( r) a los correspondientes momentos muestrales respecto al origen (a r ) . cuando la información basada en ˆ es tan buena como la que hiciera uso de toda la muestra. . x n ). . ) .x n) g ˆ (x 1 . . Para identificar estadísticos suficientes se utiliza el criterio de factorización de Fisher-Neyman. .SUFICIENCIA Un estimador ˆ es suficiente cuando no da lugar a una pérdida de información. . h(x 1 . .

¿cuál escogería?. Razone su respuesta a partir del Error Cuadrático Medio. Solución: a) Un estimador ˆ es insesgado (o centrado) cuando se verifica E( ˆ ) x1 2x2 3x3 1 E ( ˆ 1) E E x1 2x2 3x3 6 6 1 1 E ( x 1) 2E ( x 2 ) 3E ( x 3 ) 6 6 6 x1 4x2 1 1 E( ˆ 2) E E x1 4x2 E ( x 1) 4E ( x 2 ) 3 3 3 1 3 3 x1 x2 x3 x4 1 E( ˆ 3) E E x1 x2 x3 x4 4 4 1 1 E ( x 1) E( x 2) E( x 3) E( x 4) 4 4 4 Los tres estimadores son insesgados o centrados..La variable aleatoria poblacional "renta de las familias" del municipio de Madrid se distribuye siguiendo un modelo N( . se proponen los siguientes: x1 2x2 3x3 ˆ1 6 x3 4x2 ˆ2 3 ˆ3 x Se pide: a) Comprobar si los estimadores son insesgados b) ¿Cuál es el más eficiente? c) Si tuviera que escoger entre ellos. b) El estimador más eficiente es el que tenga menor varianza. Gestión Aeronáutica: Estadística Teórica Facultad Ciencias Económicas y Empresariales Departamento de Economía Aplicada Profesor: Santiago de la Fuente Fernández CÁLCULO DE LA INSESGADEZ y EFICIENCIA DE LOS ESTIMADORES 1. Como estimadores del parámetro . 7 . 2 ) . Se extraen muestras aleatorias simples de tamaño 4.

es decir. c) Se elige el estimador que presente menor Error Cuadrático Medio (ECM) 2 ECM( ˆ ) E(ˆ )2 V (ˆ) E(ˆ ) sesgo b ( ˆ ) E(ˆ ) sesgo Si E ( ˆ ) ECM( ˆ ) V (ˆ) insesgado Al ser los tres estimadores insesgados (centrados).89 9 9 x1 x2 x3 x4 1 V ˆ3 V V x1 x2 x3 x4 4 16 1 1 2 4 2 2 V ( x 1) V ( x 2) V( x 3) V( x 4) 4 0. se opta por el estimador ˆ 3 Adviértase que si el estimador ˆ es insesgado: ECM( ˆ ) V ( ˆ) ESTIMADORES SESGADOS: 8 . se elige al que menor varianza presenta. x1 2x2 3x3 1 V ˆ1 V V x1 2x2 3x3 6 36 1 1 2 14 2 2 V ( x 1) 4 V ( x 2) 9 V( x 3) 14 0.39 36 36 36 x1 4x2 1 1 V ˆ2 V V x1 4x2 V ( x 1) 16 V ( x 2 ) 3 9 9 1 2 17 2 2 17 1. que coincidirá con el que menor ECM tiene.25 16 16 16 El estimador ˆ 3 es el más eficiente.

CÁLCULO DEL SESGO Y ESTIMACIÓN PUNTUAL 2. 0. x) x con 0 y 0 x 1 m.a.La variable aleatoria X representa los gastos mensuales de una empresa. cuya función de densidad es f ( . 0. ) dx x f (x. Se realiza una m. Un estimador ˆ es sesgado cuando E ( ˆ ) b(ˆ) b(ˆ) E(ˆ) sesgo X = ”gastos mensuales de la empresa” 1 f ( .1 . calcule las estimaciones puntuales c) ¿Cuáles son las funciones estimadas para las estimaciones anteriores? Solución: Un estimador ˆ es insesgado (centrado) cuando E ( ˆ ) . x) x 1 con 0 y 0 x 1.s.7 .. con n = 3 Sesgo del estimador ˆ 1 x x1 x2 x3 1 1 ˆ x E ( ˆ 1) E E x1 x2 x3 (3 ) (media poblacional) 1 3 3 3 donde 1 1 1 1 1 1 x x f (x.s. ) dx x x dx x dx 0 0 0 1 0 1 2 El sesgo: b ( ˆ 1 ) E ( ˆ 1) 1 1 x 12 2 x 22 3 x 32 Sesgo del estimador ˆ 2 6 x 12 2 x 22 3 x 32 1 1 E(ˆ 2) E E (x 12 ) 2E (x 22 ) 3E (x 32 ) (6 2 ) 2 ( ) 6 6 6 2 2 2 donde 2 es el momento de orden 2 respecto al origen.3). de tamaño 3. 9 . y se proponen tres estimadores: ˆ x 1 x 12 2 x 22 3 x 32 ˆ 2 6 x3 2x1 4x2 ˆ3 6 a) Calcule los sesgos b) Si la muestra que se obtiene es (0.a.

1 0. x 12 2 x 22 3 x 32 1 E(ˆ 2) E E (x 12 ) 2E (x 22 ) 3E (x 32 ) 2 6 6 2 2 2 2 2 El sesgo: b ( ˆ 2 ) E ˆ2 2 2 x3 2x1 4x2 Sesgo del estimador ˆ 3 6 x3 2x1 4x2 1 1 1 E(ˆ 3) E E x3 2x1 4x2 (3 ) 6 6 6 2 1 1 1 1 1 1 x x f (x.7 .7 4.3 2 2 0. 0.87 2 10 . 1 1 1 2 E(x 2 ) x 2 f (x.3 0.367 3 ˆ 0.1 . calcule las estimaciones puntuales.13 6 ˆ 0.367 x 0. puesto que ˆ 0 6 c) ¿Cuáles son las funciones estimadas para las estimaciones anteriores? ˆ f (0.0.367.7 2 2. ) dx x 2 f (x.12 3.367 x 0.0.13 x 0.1 3 0.13.117 no puede ser. 0. ) dx x2 x 1 dx x 1 dx 0 0 0 1 2 x 2 0 2 entonces.0. ) dx x f (x.3 2.0. x) 0.367 1 0. ˆ1 0.7 0.13 1 0.633 1 ˆ f (0. x) 0.3). ) dx x x dx x dx 0 0 0 1 0 1 1 2 2 El sesgo: b ( ˆ 3 ) E(ˆ3) 2 1 2( 1) b) Si la muestra que se obtiene es (0.367 x 0.

0) 0. 0) 0.1. junto con la probabilidad de las muestras y el valor de la proporción muestral en cada una de ellas.(0.0.512 0 2 (0.0.(0.(1. suponiendo que p 0. 1) 0.0. 1) 0.1.0).(1.128 1/3 0 0.032 2/3 2/3 0.1).128 (1. (0. 1) 0. P(pˆ xi ) 0. 1) 0. 1.83 0.032 2/3 1 0.2 0.008 0.(0. 0) 0.2 0.1.En una población se presenta una alteración leve en una cierta proporción p de los individuos que la componen. Se pide: a) Distribución poblacional de la variable aleatoria b) Si p̂ es la proporción de veces que aparece el valor 1 en muestras aleatorias de tamaño 3. 0.2 p i 1 quedando demostrado que es un estimador insesgado o centrado de p d) En un caso genérico.008 3 (1.096 0.1).(1.2 0.384 0. 0.0.22 0.1).8 0.008 1 0.512 0 La distribución en el muestreo de p̂ : (0.2 c) Demostrar que en este caso p̂ es un estimador insesgado de p d) Repetir los pasos b) y c) de forma general para un valor cualquiera de p Solución: xi pi a) La distribución poblacional 0 0.032 2/3 1/3 0. Hallar la distribución en el muestreo de p̂ .82 0.P(p xi ) 3 0 q 0 2 1/3 3p q p q2 2/3 3p2q 2p2q 1 p3 p3 p q2 2p2q p3 11 . 0.8 1 0.3.128 1/3 (0.2 0.8 0.8 0..1.2 0. la distribución en el muestreo será: p̂ P(pˆ xi ) ˆ ˆ p. 0.0). Se define una variable aleatoria X que vale 1 para los individuos alterados y 0 para los individuos no alterados.0).2 0.064 2 (1.(1.2 b) Se elabora una tabla con las posibles muestras de tamaño 3.1) Muestra Probabilidad p̂ (0.128 1/3 p̂ P(pˆ xi ) ˆ ˆ p.8 0. 0) 0. 1.2 4 ˆ c) La esperanza matemática E(p) (pˆ x i ). 1. 1.0).P(p xi ) 2 (1.82 0.

la eficiencia relativa y la consistencia de ambos estimadores b) Elija uno de los dos en término del error cuadrático medio Solución: a) Insesgadez Un estimador ˆ es insesgado (o centrado) cuando se verifica E ( ˆ ) Un estimador ˆ es sesgado cuando E ( ˆ ) b(ˆ) b(ˆ) E(ˆ) sesgo sesgo Un estimador ˆ es asintóticamente insesgado si su posible sesgo tiende a cero al aumentar el tamaño muestral que se calcula: lim b ( ˆ ) 0 n n n n 1 1 1 1 E ( ˆ 1) E (x) E( x i) E( x i) E (x i ) (n ) n i 1 n i 1 n i 1 n b ( ˆ 1) E ( ˆ 1) 0 n n n 1 1 1 1 n E( ˆ 2) E( x i) E( x i) E (x i ) (n ) n 1 i 1 n 1 i 1 n 1 i 1 n 1 n 1 0 cuando ' n ' aumenta n n n b( ˆ 2) E( ˆ 2) n 1 n 1 n 1 sesgado asin toticamente Eficiencia Sean ˆ 1 y ˆ 2 dos estimadores insesgados de un parámetro desconocido .Sea una población con media de la que se extraen m.a. Considere los siguientes estimadores de la media: n 1 ˆ1 x ˆ2 xi n 1 i1 a) Estudie la insesgadez. 4 ˆ E(p) (pˆ x i ). P(pˆ xi ) p q2 2p2q p3 p(q2 2p q p2 ) p(q p)2 p i 1 CÁLCULO EFICIENCIA RELATIVA Y ERROR CUÁDRATICO MEDIO 4..s. de tamaño n. Decimos que ˆ 1 es más eficiente que ˆ 2 si se verifica que Var ( ˆ 1 ) Var ( ˆ 2 ) Var ( ˆ 1 ) La eficiencia relativa se mide por el ratio: Var ( ˆ )2 12 .

por lo que es más eficiente que ˆ 1 Consistencia Un estimador ˆ consistente es un estimador asintóticamente insesgado cuya varianza tiende a cero al aumentar el tamaño muestral. n n 2 1 1 1 2 V ( ˆ 1) V (x) V( x i) V (x i ) (n ) n i 1 n2 i 1 n2 n n n 1 1 1 2 n 2 V ( ˆ 2) V( x i) V (x i ) (n ) n 1 i 1 (n 1) 2 i 1 (n 1) 2 (n 1) 2 Var ( ˆ 1 ) 2 n (n 1) 2 eficiencia relativa 2 1 Var ( ˆ 1 ) Var ( ˆ 2 ) Var ( ˆ 2 ) n (n 1) 2 n2 El estimador ˆ 2 tiene menor varianza. El Error Cuadrático Medio (ECM) de un estimador ˆ viene definido: 2 ECM( ˆ ) E(ˆ )2 V (ˆ) E(ˆ ) sesgo b ( ˆ ) E(ˆ ) sesgo Si E ( ˆ ) ECM( ˆ ) V (ˆ) insesgado 2 2 2 ECM( ˆ 1 ) V ( ˆ 1) b ( ˆ 1) 0 n n 2 2 n 2 1 n 2 2 ECM( ˆ 2 ) V ( ˆ 2) b( ˆ 2) (n 1) 2 n 1 (n 1) 2 El estimador ˆ 1 será el que presenta menor ECM cuando ECM( ˆ 1 ) ECM( ˆ 2 ) 13 . El estimador ˆ es consistente cuando lim E ( ˆ ) y lim V ( ˆ ) 0 n n lim E ( ˆ 1 ) lim E (x) n n ˆ1 2 es consistente lim V ( ˆ 1 ) lim 0 n n n 1 lim E ( ˆ 2 ) lim n n n 1 ˆ2 es consistente n 2 lim V ( ˆ 2 ) lim 0 n n (n 1) 2 b) Elegir uno de los dos en término del error cuadrático medio.

2 n 2 2 n 2 2 2 n 2 2 n (n 1) 2 (n 1) 2 (n 1) 2 n (n 1) 2 (n 1) 2 (n 1) 2 2 n 2 2 2 (n 1) 2 n2 2 2 n(n 1) 2 (n 1) 2 n 2 2n 1 2 2 2n 1 2 n n 2 2n 1 Si 2 ˆ 1 se elige antes que ˆ 2 n 2 2n 1 Si 2 ˆ 2 se elige antes que ˆ 1 n 5.x 2 . .Sea x1. Calcular el error cuadrático medio para los siguientes estimadores de : 3x1 2x 2 x3 ˆ1 x1 ˆ2 6 Solución: a) Estudio de la insesgadez E( ˆ 1 ) E(x1 ) b( ˆ 1 ) 0 3x1 2x 2 x3 1 1 2 1 E( ˆ 2 ) E 3E(x1 ) 2E(x 2 ) E(x 3 ) 3 2 6 6 6 6 3 1 2 b( ˆ 2 ) E( ˆ 2 ) 3 3 Respecto al sesgo es mejor el primer estimador ˆ 1 que es insesgado o centrado.En esta línea.xn una muestra aleatoria simple de una variable aleatoria X con 2 E(X) y Var(X) .. b) Estudio de la varianza 2 Var ( 1 ) 3x1 2x 2 x3 1 1 Var ( 2 ) Var Var 3x1 2x 2 x3 9 Var(x1 ) 4 Var(x 2 ) Var(x 3 ) 6 36 36 1 2 2 2 14 2 7 2 9 4 36 36 18 14 .

x4. 7 2 2 Respecto a la varianza es mejor el segundo estimador ˆ 1 por ser 18 El mejor estimador será el que presente menor Error Cuadrático Medio (ECM): 2 2 2 ECM( ˆ 1 ) V ( ˆ 1) b( ˆ 1 ) 0 2 2 7 2 2 7 2 4 2 ECM( ˆ 2 ) V(ˆ 2) b( ˆ 2 ) 18 3 18 9 2 7 2 4 2 11 2 4 2 El primer estimador 1 será mejor si 18 9 18 9 2 4 x 18 2 2 8 2 9 x 11 11 6. con idéntico sesgo: b( ˆ 1 ) b( ˆ 2 ) 5( 5) 4 25 b) Estudio de la varianza 5 2 Var ( 1 ) Var xi 5 Var (x) 5 i 1 Var ( 2 ) Var 8x 2 3x 5 82 Var(x 2 ) 32 Var(x 5 ) 64 2 9 2 73 2 Dado que los dos estimadores tienen el mismo sesgo y el primer estimador 1 tiene menor varianza. Justificar la respuesta..x2. será el estimador óptimo. Se proponen los siguientes estimadores: 5 ˆ1 xi ˆ2 8x 2 3x 5 i 1 Determinar cuál es el mejor estimador para .x5 una muestra aleatoria simple de una variable aleatoria X con 2 distribución normal con media ( 5) y varianza .x3.Sea x1. Solución: a) Estudio de la insesgadez 5 E( ˆ 1 ) E xi E x1 x 2 x3 x4 x5 5( 5) i 1 E( ˆ 2 ) E 8x 2 3x 5 8E(x 2 ) 3E(x 5 ) 8( 5) 3( 5) 5( 5) ambos estimadores son sesgados. 15 .

.s. de tamaño 4 para estimar . Se conoce que el peso medio de los jamones vendidos es superior a 5 kg.a X i 'peso en kg de los jamones ' sigue una distribución normal de varianza 4 Para estudiar la insesgadez de los estimadores se calculan sus esperanzas: x1 x2 x3 1 3 E( ˆ 1 ) E E(x 1 ) E(x 2 ) E(x 3 ) 4 4 4 3 1 El sesgo del estimador ˆ 1 será: b( ˆ 1 ) E( ˆ 1 ) 4 4 x1 x2 1 2 E( ˆ 2 ) E E(x 1 ) E(x 2 ) 2 2 2 El estimador ˆ 2 es insesgado. ¿Cuál de los dos estimadores sería el mejor respondiendo a la insesgadez y eficiencia? x1 x2 x3 x1 x2 ˆ ˆ 1 2 4 2 Solución: Un estimador es insesgado (centrado) si E( ˆ ) Un estimador es sesgado si E( ˆ ) b( ˆ ) b( ˆ ) E( ˆ ) sesgo La v.a. y se toman m.Puede observarse que presenta el menor Error Cuadrático Medio: 2 2 2 ECM( ˆ 1 ) V ( ˆ 1) b( ˆ 1 ) 5 4 25 CÁLCULO INSESGADEZ E EFICIENCIA 7.El peso en kilos de los jamones vendidos por una empresa sigue una distribución normal con varianza 4 y peso medio desconocido. b( ˆ 2 ) 0 Atendiendo al sesgo se elige ˆ 2 Para analizar la eficiencia relativa de los dos estimadores se calculan las respectivas varianzas x1 x2 x3 1 1 V ( ˆ 1) V V (x 1 x2 x3) V (x 1 ) V (x 2 ) V (X 3 ) 4 16 16 las observaciones son independientes V (Xi ) 4 1 12 3 12 16 16 4 16 .

Se elige el estimador en base al error cuadrático medio (ECM): 2 2 3 12 ECM( ˆ 1 ) 4 4 16 2 ECM Varianza (sesgo) ECM( ˆ 2 ) 2 0 2 Se analiza cuando es mayor el ECM del primer estimador ˆ 1 : ECM( ˆ 1 ) ECM( ˆ 2 ) 2 12 2 2 20 20 4. no queda duda que el estimador a elegir (con menor error cuadrático medio) es ˆ 2 . de modo que el estimador insesgado ˆ 2 es el de mayor varianza.47. V (Xi ) 4 x1 x2 1 1 1 V(ˆ 2) V V (x 1 x 2) V (x 1 ) V (x 2 ) 8 2 2 4 4 4 las observaciones son independientes Respecto a la varianza se elige el estimador ˆ 1 por ser el de menor varianza. Aparecen propiedades contrapuestas. el error cuadrático medio de ˆ 1 es mayor. con lo que se elige el estimador ˆ 2 . Se conoce que el peso medio de los jamones es superior a 5 kg. 47 16 Si es en valor absoluto mayor que 4. 17 .

137. 135.La distribución del peso de las manzanas de una determinada cosecha sigue una distribución normal. para una muestra aleatoria simple de tamaño cinco. ˆ 2 son insesgados (centrados).. ˆ 2 del peso medio es mejor respecto del sesgo y de la eficiencia. 5 Xi b) Si ˆ 1 y ˆ 2 x 1 2 x 2 3 x 3 4 x 4 x 5 . 49) i 1 25 i 1 25 i 1 25 5 V(ˆ 2) V (x 1 2 x 2 3 x 3 4x4 x5) V (x 1 ) 4V( x 2) 9 V ( x 3 ) 16 V ( x 4 ) V( x5) (49) 4 (49) 9 (49) 16 (49) (49) 31 (49) 1519 Como los dos estimadores son insesgados y V ( ˆ 1 ) V ( ˆ 2 ) se elige como mejor el estimador ˆ 1 .8. el peso medio de la muestra de las cinco manzanas. 7) Se calculan las esperanzas de los estimadores para analizar el sesgo de los estimadores 5 5 5 E(x i ) 1 1 1 E( ˆ 1 ) E xi / 5 E xi E xi (5 ) i 1 5 i 1 5 i 1 5 E( ˆ 2 ) E(x 1 2 x 2 3 x 3 4x4 x5) E(x 1 ) 2E(x 2 ) 3E(x 3 ) 4E(x 4 ) E(x 5 ) 2 3 4 Los estimadores ˆ 1 . 130. 142). 18 . Solución: a) El peso de las manzanas sigue una distribución N( . cuyo peso medio es desconocido y cuya desviación típica es 7 gramos. b) Para analizar la eficiencia de los estimadores se obtienen las varianzas: 5 5 5 V (Xi ) 72 1 1 1 49 V ( ˆ 1) V xi / 5 V xi V xi (5. obtener los pesos medios i 1 5 estimados a partir de la siguiente muestra (125. Se pide: a) Analizar cuál de los estimadores ˆ 1 .

9. de tamaño n. hallamos la esperanza: n n n 1 1 1 n E( ˆ 1 ) E x i (n 1) E xi E(x i ) (n ) i 1 n 1 i 1 n 1 i 1 n 1 n 1 n 1 El sesgo del estimador ˆ 1 será: b( ˆ 1 ) E( ˆ 1 ) n 1 n 1 n n n 1 1 1 E( ˆ 2 ) E xi n E xi E(x i ) (n ) i 1 n i 1 n i 1 n El estimador ˆ 2 . ¿Cuál de los dos estimadores elegiríamos?. La eficiencia de los estimadores se analiza a través de su varianza: n n n 1 1 1 2 n 2 V ( ˆ 1) V x i (n 1) V xi V (x i ) (n ) i 1 (n 1) 2 i 1 (n 1) 2 i 1 (n 1) 2 (n 1) 2 n n n 2 1 1 1 2 V(ˆ 2) V xi n V xi V (x i ) (n ) i 1 n2 i 1 n i 1 n2 n El estimador más eficiente será el de menor varianza. ¿Son consistentes? n n xi xi ˆ1 i 1 ˆ2 i 1 n 1n Solución: La v.Supongamos que la distribución de ingresos de una cierta población es una variable aleatoria con media desconocida y varianza 2 también desconocida.s.a. respecto de la insesgadez y de la eficiencia. Comparando las varianzas de los estimadores: 2 n 2 V ( ˆ 2) V ( ˆ 1 ) puesto que (n 1) 2 n2 n (n 1) 2 El estimador ˆ 2 . es el mejor tanto al sesgo como a la eficiencia. ) Para analizar el sesgo de los estimadores. Si queremos estimar el ingreso medio de la población mediante una m. que es la media muestral.a x i 'ingresos de cierta población' sigue una distribución normal N( . es insesgado (centrado). que es la media muestral. n 2 lim E( ˆ 1 ) y lim V ( ˆ 1 ) lim 0 n n n (n 1) 2 Los dos estimadores son consistentes: 2 lim E( ˆ 2 ) y lim V ( ˆ 2 ) lim 0 n n n n 19 ..

1. ) L ( x 1. B) P(B N B) P(B). B) es independiente. (x 1. (1 p) p 0. x 3 ) .P(B) p. p): P(X x) p x (1 p) 1 x Se selecciona una muestra aleatoria con reemplazamiento de tamaño 3 (x 1. Como el parámetro p es desconocido pretendemos saber.73 qué valor hace más probable la aparición de dicha extracción. siendo más verosímil.0.1439 Resulta más probable (p = 0. p).. con distribución B(1. .Una urna contiene bolas blancas y negras.35 0.P(N). x 2 .73 2 . tomando los valores 0. x 3 ) . x n ) una muestra aleatoria de una población X con función de masa P (o función de densidad f ) donde ( 1.s. PROPIEDADES 10. N. ) caso discreto L( ) L(X. . El estimador de máxima verosimilitud de es el formado por los valores ( ˆ 1.65 : P(B. ) P (x n . x n ) obtenida: P (x 1 . N.65). N.27 0. n ). x 2 .N. entre los valores.. Sea p la probabilidad de extraer una bola blanca cuando se realiza una extracción al azar.Sea (x 1. B).73 : P(B.p p 2 . siendo x i la variable aleatoria a la extracción i-ésima.0.B) 0.xn .(1 p). FUNCIÓN DE VEROSIMILITUD DE LA MUESTRA (EMV). . p 0.COMPRENSIÓN DE LA VEROSIMILITUD. siendo P(N) 1 p P(B. la distribución de probabilidad asociada será: 20 .N.65 2 . CÁLCULO DE LOS ESTIMADORES MÁXIMO VERSOSÍMILES.65 y p 0. . siendo las variables aleatorias x i independientes. y suponemos que ha resultado la siguiente relación (B.B) 0.a. Solución: P(B) p Si la muestra (B. Asociado a este experimento aleatorio tenemos la variable aleatoria X que puede tomar los valores: X = 1 si la bola extraída es blanca X = 0 si la bola extraída es negra La distribución de probabilidad será una B(1.1479 entonces p 0. ˆ n ) que maximizan lo que llamaremos función de verosimilitud de la muestra (x 1. . ) f (x 1 ) f (x n ) caso continuo Si consideramos la m.

p) P( X x 1) p 1 (1 p) x2 1 x2 P ( x 2 . ˆ n ) de la ecuación: 0 y se obtiene el estimador de ˆ máxima verosimilitud E.Un atleta olímpico de salto de altura se enfrenta a un listón de 2. ) P (x i. ) e e n e i 1 x 1! xn! xi! i 1 21 . (1 p) 11.p (1 p) .3 metros. b) Analizar sus propiedades.a. la función de verosimilitud L (X.. p) P( X x 2) p (1 p) xi 1. p) p 1 (1 p) . a) Calcular el estimador máximo verosímil del parámetro .V ( ˆ ) Sea la v. lnL ( ) Se despeja ˆ ( ˆ 1. 0 sea bola blanca o negra x3 1 x3 P ( x 3 . en lugar de la función de verosimilitud L ( ) . p) P( X x 3) p (1 p) La función de verosimilitud será: 3 x 1 x1 x2 1 x2 x3 1 x3 L (p) P (x i.M. ya que es más fácil de manejar y presenta los mismos máximos y mínimos. N. es más práctico encontrar el estimador de máxima verosimilitud es considerar la función soporte o log-verosimilitud lnL ( ) . . x 1 x1 P ( x 1 . X = 'número de saltos fallidos por hora' x E(x) En la distribución de Poisson: P(X x) e x! V (x) En una muestra aleatoria simple de tamaño n. Su entrenador desea estudiar el comportamiento del saltador. B) el valor que toma la función de verosimilitud será: L (p) p1 0 1 (1 p) 3 (1 0 1) p 2 . ) : n xi n x1 xn i 1 n L( ) L (X. Solución: a) En muchas ocasiones. Sabe que el número de saltos fallidos por hora es una variable aleatoria distribuida como una Poisson de parámetro .p (1 p) i 1 x1 x 2 x3 3 ( x1 x 2 x3 ) p (1 p) En la muestra (B.

sustituyendo por ˆ n lnL (X. ) ln n e ln( i 1 ) ln( x i !) ln(e ) i 1 xi! xi! i 1 i 1 n n xi ln ln(x i !) n i 1 i 1 n n lnL (X. se deriva la expresión anterior respecto del parámetro para obtener. El estimador ˆ es consistente cuando lim E ( ˆ ) y lim V ( ˆ ) 0 n n lim E ( ˆ ) lim y lim V ( ˆ ) lim 0 n n n n n 22 . Consistencia. Un estimador ˆ consistente es un estimador asintóticamente insesgado cuya varianza tiende a cero al aumentar el tamaño muestral. ) xi ln ln(x i !) n i 1 i 1 Para obtener el estimador de máxima verosimilitud EMV ( ˆ ) . n n xi xi n xi n i 1 i 1 n n n L (X. ) n 1 xi 0 xi n 0 ˆ i 1 x ˆ i 1 ˆ n El estimador de máxima verosimilitud viene dado por la media muestral: EMV ( ˆ ) x b) Analizar las propiedades (Insesgadez. Eficiencia) Insesgadez El estimador sería insesgado (centrado) si E ( ˆ ) n xi 1 n 1 n 1 E( ˆ) E i 1 E( x i) E (x i ) (n ) n n i1 n i 1 n n xi 1 n 1 V(ˆ) V (x) V i 1 V (x i ) (n ) n n2 i 1 n2 n Consistencia Cuando no es posible emplear estimadores de máxima verosimilitud. ) n e lnL (X. el requisito mínimo deseable para un estimador es que sea consistente.

E x Ahora bien.El estimador ˆ es consistente Eficiencia Para que un estimador sea eficiente tiene que ser centrado y de varianza mínima. n 23 . La varianza mínima se analiza en virtud de la acotación de Cramér-Rao: 1 V(ˆ) 2 acotación de Cramér-Rao ln L (X. ) E En el caso discreto de una m. V ( ˆ ) 1 n n El menor valor de la varianza del estimador será n Se sabe que V ( ˆ ) V (x) . lo que muestra que el estimador empleado es eficiente. P (x .s. la expresión anterior se puede simplificar: 1 V(ˆ) 2 acotación de Cramér-Rao ln P(x . ) x x 1 2 2 lnP (x. ) e x! x lnP (x . ) n. ) x 1 1 1 1 E E 2 E (x )2 2 E (x x) 2 2 V (x) 2 1 En consecuencia.a. ) ln e x ln ln(x!) x! lnP (x .

independientemente unas de otras.En una gran piscifactoría hay una proporción desconocida de peces de una especie A. por máxima verosimilitud.La primera persona obtiene el primer pez tipo A en la décima extracción .. a) Si la proporción de peces de la especie A es p. el proceso de sacar peces al azar hasta encontrarse con el primero de tipo A: . Para obtener información sobre esta proporción.12. Solución: El objetivo fundamental del ejercicio es estimar. ¿cuál es la probabilidad de que el primer pez de la especie A sea el décimo que extraemos?.. a) P(primer pez tipo A en la décima extracción) = (1 p) 9 p b) La función de verosimilitud L(p) = P(Resultados muestrales obtenidos) L(p) = P(primer pez tipo A en la décima extracción y primer pez tipo A en la decimoquinta extracción y primer pez tipo A en la decimoctava extracción) L(p) (1 p) 9 p (1 p) 14 p (1 p) 17 p (1 p) 40 p 3 log L(p) log (1 p) 40 p 3 log(1 p) 40 logp 3 40 log(1 p) 3 logp log L(p) 40 3 3 0 pˆ dp 1 p p 43 24 .La segunda persona obtiene el primer pez tipo A en la decimoquinta extracción .La tercera persona obtiene el primer pez tipo A en la decimoctava extracción Escribir la función de verosimilitud y obtener la estimación de máxima verosimilitud de la proporción p. el parámetro p = "proporción de peces de la especie A". b) Tres personas realizan. vamos a ir sacando peces al azar.

200 mujeres con ojos claros . ¿cuál es la probabilidad de encontrar alguna mujer de ojos oscuros?.300 hombres con ojos oscuros Obtener la estimación de máxima verosimilitud de p = P(hombres) y q = P(ojos oscuros) b) Si tomamos 8 personas al azar de ese país. q) 450 550 0 pˆ 0.89 0) 1 0 La variable Y = "número de mujeres con ojos oscuros.350 mujeres con ojos oscuros . q) log p 450 (1 p) 550 q 350 (1 q) 650 450 logp 550 log(1 p) 350 log q 650 log(1 q) log L(p.13.76) 8 0. P(hombre con ojos claros) = p q . P(hombre con ojos oscuros) = p (1 q) La función de verosimilitud L(p. Las dos características son independientes. P(mujer con ojos oscuros) = (1 p)(1 q) .Las personas de un país se clasifican según dos características: color de los ojos (claros u oscuros) y sexo (hombre o mujer). a) Obtenemos una muestra al azar de la población con los siguientes resultados: .04 25 .24 La variable aleatoria X = "número de mujeres con ojos oscuros.. entre 200" . q) 350 650 0 qˆ 0.04 6.99) 0. 0.0233 6. q) = P(resultados muestrales obtenidos) 200 150 350 300 550 650 L(p. P(mujer con ojos claros) = (1 p) q .24) 0 (0. se aproxima por la distribución normal N( np 48 . entre 8" sigue una distribución binomial B (n 8.24) 8 P(X 1) 1 P(X (0.04) Y 48 60 48 P(Y 60) P P(z 1. 45 p p 1 p log L(p.35 q q 1 q b) Se conoce que P(mujer con ojos oscuros) = (1 p)(1 q) 0. p 0.150 hombres con ojos claros . np q 6. ¿cuál es la probabilidad de que haya más de 60 mujeres de ojos oscuros? Solución: a) Las probabilidades de los cuatro posibles resultados muestrales son: . Y B (20. Y si la muestra que tomamos es de 200 personas. q) (1 p) q pq (1 p)(1 q) (p (1 q) p 450 1 p q 350 1 q log L(p.24) .

a) a2 e ax siendo x 0 en muestras aleatorias simples de tamaño n ax b) f(x. a) (a 2 e ).14.. x n .s. x 2 .(a e ) a2 e a ( x1 x 2 ) aplicando logaritmos neperianos: ln L log (a 2 e ) 2 ln a a (x1 x 2 ) derivando respecto de 'a' e igualando a cero: (ln L) 2 2 1 (x1 x 2 ) 0 aˆ a a x1 x 2 x 26 .Calcular el estimador máximo verosímil del parámetro 'a' de las funciones: a) f(x. de tamaño n La función de verosimilitud n a xi a x1 a x2 a xn L L (x 1.(a 2 e ) (a 2 e ) a 2n e i 1 n a xi n aplicando logaritmos neperianos: ln L log (a 2 n e i 1 ) 2n ln a a xi i 1 derivando respecto de a e igualando a cero: (ln L) 2n n 2n 2 2 xi 0 aˆ n â a a i 1 x x xi i 1 ax b) Sea f(x.s. a) (a e ). .a. de tamaño 2 La función de verosimilitud a x1 a x2 a ( x1 x 2 ) L L (x 1. a) ae para x 0.a. a) a2 e ax donde x 0 en m. a 0 en m.a) ae para x 0. a 0 en muestras aleatorias simples de tamaño 2 Solución: a) f(x. x 2 .

con la media y varianza desconocidas. . ) i 1 2 0 ˆ i 1 x ˆ n n n 2 (xi )2 (xi )2 ln L (X. ) e e e 2 2 2 2 2 2 n ( xi )2 i 1 1 2 2 n n e 2 2 (2 ) ( 2 ) tomando logaritmos neperianos. . ) n i 1 0 ˆ2 i 1 2 ˆ2 ˆ ˆ3 n n (xi x) 2 resolviendo el sistema resulta: ˆ x y ˆ2 i 1 2 x n 2 ln L (X. 27 .Sea la distribución N( . ) n La condición de máximo se verifica.15. ) ln n n e ln(2 ) ln( ) i 1 2 2 2 2 2 2 (2 ) ( 2 ) 2 y derivando respecto de y e igualando a cero: n n 2 (xi ˆ) xi ln L (X. . . pues: 2 2 0 ˆ 2 Los estimadores máximo-verosímiles de y son la media y la varianza muestrales. se tiene: n n ( xi )2 i 1 (xi )2 2 1 2 2 n n 2 ln L (X. ) . Calcular los 2 estimadores máximo-verosímiles de y Solución: La función de verosimilitud es: ( x1 )2 ( x2 )2 (x n )2 2 1 2 2 1 2 2 1 2 2 L (X..

El estimador es insesgado y su varianza 2 V(x) . 28 . ) ln e ln ln2 2 2 2 2 y derivando respecto a : 2 ln f(x. ) 1 x ln f(x. Un estimador es eficiente cuando V( ˆ ) CCR Para obtener la cota de Cramér-Rao se parte de la función de densidad poblacional: 1 CCR 2 ln f(x. se tiene: (x )2 1 2 2 1 (x )2 ln f(x. ) nE (x )2 1 2 2 La función de densidad poblacional: f(x. Demostrar que la media muestral es un estimador eficiente..En una distribución N( . se estima la media poblacional mediante la media de una muestra aleatoria simple (x1 . ) . x 2 . n Solución: La varianza de un estimador verifica siempre la Cota de Cramér-Rao: V( ˆ ) CCR . ) 2 1 n nE n 2 La varianza del estimador coincide con la cota de Cramér-Rao. . ) (x )2 2 2(x ) 2 4 2 La esperanza matemática es: 2 ln f(x. ) e 2 tomando logaritmos neperianos.16. ) (x )2 2 1 E E 4 4 2 Sustituyendo el valor de la esperanza matemática en la expresión de la cota para estimadores insesgados: 2 1 1 CCR ln f(x. concluyendo que la media muestral es un estimador eficiente de la media poblacional en la distribución normal. xn ) .

. ) E n n 1 n 1 4 (xi )2 (xi )2 i 1 2 4 6 i 1 n n 1 n 2 4 E(xi )2 0 2 i 1 1 n n 1 n n E(xi ) 2 E(xi )2 0 4 i 1 2 4 6 i 1 2 4 29 . ) n 1 2 (xi )2 2 (xi )2 i 1 2 2 2 4 i 1 y calculando las segundas derivadas: 2 2 2 2 n ln L (X. . Solución: (x )2 1 2 2 La función de densidad poblacional: f(x. . ) n 1 (x i )2 ( 2 )2 2 4 6 i 1 La matriz de información de Fisher: n n 1 2 4 (xi )2 2 i 1 I( . ) n ln L (X.. ) 1 ln L (X. . ) . ) e e e n n e 2 2 2 2 2 2 (2 ) 2 2 tomando logaritmos neperianos. . ) e 2 2 La función de verosimilitud es: n 2 2 2 ( xi )2 ( x1 ) ( x2 ) (x n ) i 1 2 1 2 2 1 2 2 1 2 2 1 2 2 L(X. ) ln n n e 2 ln2 ln 2 (xi )2 2 2 2 i 1 (2 ) 2 2 2 derivando respecto de y 2 n 2 n ln L (X. ) 1 2 2 2 4 (xi )2 i 1 2 2 n ln L (X. determinar la matriz de información de Fisher de una población con distribución N( . se tiene: n ( xi )2 i 1 n 2 1 2 n n 2 1 ln L(X. 17. respecto a los dos 2 parámetros y . .A partir de una muestra aleatoria simple X de tamaño n. .

. ) .En una distribución N( . se tiene que E(xi ) 0 y E(xi )2 2 18.x 2 . ) nE 2 2 n 1 (n 1)2 1 b( ˆ ) 1 2 4 30 .Adviértase que por ser xi un elemento de una muestra aleatoria simple de una población normal N( . Solución: Un estimador es eficiente cuando V( ˆ ) CCR Para hallar la cota de Cramér-Rao se necesita saber en primer lugar si el estimador es insesgado o no. ) se estima la media poblacional en una muestra aleatoria simple de tamaño n (x1 . .xn ) por medio de la función muestral: n i xi ˆ i 1 n Estúdiese la eficiencia del estimador. se calcula para ello la esperanza matemática: n i xi n n 1 1 1 E( ˆ ) E i 1 E(i xi ) i E(xi ) E(x1 ) 2E(x 2 ) 3E(x 3 ) nE(xn ) n n i 1 n i 1 n 1 (n 1) n (n 1) 2 3 n ) 1 2 3 n n n n 2 2 n 1 n 1 E( ˆ ) b( ˆ ) sesgo b( ˆ ) E( ˆ ) 2 2 La varianza del estimador: n i xi n n 1 1 1 2 V(ˆ) V i 1 V (i x i ) i2 V (x i ) 1 V (x1 ) 22 V (x 2 ) 32 V (x 3 ) n2 V (x n ) n n2 i 1 n2 i 1 n 2 2 2 1 2 2 2 2 2 2 2 2 2 2 2 2 n (n 1)(2n 1) 1 2 3 n 1 2 3 n n2 n 2 n 2 6 2 (n 1)(2n 1) V(ˆ) 6n 2 1 b( ˆ ) La cota de Cramér-Rao CCR 2 lnL(x.

) 2 n 4n 6n nE 2 Al ser la varianza del estimador mayor que la cota de Cramér-Rao: 2 (n 1)(2n 1) (n 1)2 2 V(ˆ) CCR 6n 4n El estimador no es eficiente. ) (x )2 2 1 E E 4 4 2 n y atendiendo a la aditividad de esta medida I( ) ni( ) 2 2 (n 1)2 2 1 b( ˆ ) 4 (n 1)2 2 (n 1)(2n 1) CCR V(ˆ) lnL(x. se tiene: (x )2 1 2 2 1 (x )2 ln f(x. ) ln e ln ln2 2 2 2 2 y derivando respecto a : 2 ln f(x. ) lnL(x. 2 2 lnL(X.En la distribución B(m. Hallar la eficiencia del estimador. siempre que n 1. ) 1 x ln f(x. ) La información de Fisher de la muestra I( ) E nE se (x )2 1 2 2 obtiene a partir de la función de densidad poblacional f(x. siendo x la media muestral en muestras aleatorias simples de m tamaño n. ) e 2 tomando logaritmos neperianos.. Solución: Un estimador es eficiente cuando V( ˆ ) CCR (cota de Cramér-Rao) x mp ˆ E Se determina si el estimador es insesgado: E(p) p m m 31 . 19. ) (x )2 2 2(x ) 2 4 2 La esperanza matemática es: 2 ln f(x. p) se considera como estimador del parámetro p el x estadístico p̂ .

m 32 . por lo que la cota de Cramér-Rao es: 1 CCR 2 lnL(x.p) x mp E(x mp)2 de donde. La varianza del estimador: x 1 1 mp(1 p) p(1 p) ˆ V (p) V V (x) m m2 m2 n mn Como la varianza del estimador coincide con la cota de Cramér-Rao es estadístico x p̂ es eficiente.p) p (1 p)m x x tomando logaritmo neperiano y derivando respecto al parámetro p.Al coincidir la esperanza del estimador con el parámetro.p) ln x lnp (m x) ln(1 p) x ln f(x. resulta: m ln f(x. E E p p(1 p) p2 (1 p)2 En una distribución binomial: E( ) mp . V ( ) E( mp)2 mp(1 p) 2 ln f(x. el estimador es insesgado. ) 2 m nm nE n p(1 p) De otra parte. ) nE Para calcular el denominador de la cota se considera la función de cuantía de la distribución binomial: m x f(x.p) x (m x) (1 p) x p(m x) x mp p p 1 p p(1 p) p(1 p) 2 2 ln f(x.p) E(x mp)2 mp(1 p) m con lo que E p p2 (1 p)2 p2 (1 p)2 p(1 p) 1 1 p(1 p) La cota de Cramér-Rao: CCR lnL(x.

Solución: MÉTODO DE LOS MOMENTOS. 2 2 1 P (X 1) ..El procedimiento consiste en igualar momentos poblacionales respecto al origen ( r ) a los correspondientes momentos muestrales respecto al origen (a r ) . 0 1 2 Estimar los parámetros y por el método de los momentos. estudiando si son insesgados.Sea una población definida por: P (X 1) .CÁLCULO DE ESTIMADOR POR EL MÉTODO DE LOS MOMENTOS 1 20. donde 0 1 . P (X 0) . formando así tantas ecuaciones como parámetros poblacionales se pretenden estimar: n xi 1 E (X) ˆ1 a1 i 1 x n n x i2 2 E (X 2 ) ˆ2 a2 i 1 n n x ri r E (X r ) ˆr ar i 1 n Puesto que hay que estimar dos parámetros hay que calcular los dos primeros momentos.. momentos poblacionales 1 1 1 E(X) x i P(X x i) ( 1) (0) (1) i 2 2 2 2 1 1 2 2 E(X 2 ) x i2 P(X x i ) ( 1) 2 (0) 2 (1) 2 i 2 2 2 2 momentos muestrales xi x i2 a1 x i a2 i n n 1 a1 x 2x 2 2x ˆ 1 a2 x 2a 2 2 ˆ 1 a2 x 2 2 a2 a2 2a 2 2 2 33 .

.Una muestra aleatoria (X 1 . . h(x1 . .x n) g ˆ (x 1 . x n ) de una población X con función de masa P (o función de densidad f ) un estadístico ˆ es suficiente para si y sólo sí: P (x1 . x n ). . . que dice que dada una muestra aleatoria (x 1 . . CÁLCULO DE ESTADÍSTICOS. Es decir. X n ) de la población tiene como función de 1 x si x ( 0. . 1 n 34 . Un estimador ˆ es insesgado (o centrado) cuando se verifica E ( ˆ ) 2 E(ˆ) E (1 a 2 x) 1 E (a 2 ) E (x) 1 2 1 2 2 2 E( ˆ ) E (1 a 2 x) 1 E (a 2 ) E (x) 1 2 1 2 2 Los estimadores y son insesgados. xn ) g ˆ (x1 .x es un estadístico suficiente. ) . xn ) caso discreto f (x 1 . cuando la información basada en ˆ es tan buena como la que hiciera uso de toda la muestra. h(x1 . FUNCIÓN DE DENSIDAD 21. . ˆ x . h(x 1 .. Para identificar estadísticos suficientes se utiliza el teorema de factorización.x n) 1 1 1 n 1 L( ) f (x ) f (x ) f (x ) ( x )( x ) ( x ) (x x ) 1 2 n 1 2 n 1 n Por tanto. . xn ). . xn ) caso continuo Para encontrar un estadístico suficiente ˆ hay que factorizar la función de verosimilitud de la forma: L ( ) g( ˆ . .1) densidad f (x) >0 0 en el resto a) Hallar un estadístico suficiente b) Estimador de máxima verosimilitud de c) Estimador de por el método de los momentos Solución: a) Un estimador ˆ es suficiente cuando no da lugar a una pérdida de información. .

Una muestra aleatoria (X 1 . Es decir.. n 1 b) L( ) (x x ) 1 n n n n 1 n 1 n 1 lnL( ) ln (x x ) ln ln x ln ln( x ) 1 n i 1 i i 1 i n n lnL ( ) n ˆ n lnL ( ) n ln 1 ln(x i ) ln(x i ) 0 n i 1 i 1 ln(x i ) i 1 c) Se plantea la ecuación E X x 1 1 1 1 1 1 x x E (X) x f (x) dx x x dx x dx 0 0 0 1 0 1 ˆ x x( 1) 1 x 22. X n ) de la población tiene como función de densidad x f (x) e si x 0 0 en el resto a) Hallar un estimador por el método de los momentos de b) Estudiar si el estimador encontrado en el apartado anterior es insesgado para estimar el parámetro Solución: a) Se plantea la ecuación: E X x integración por partes x E X x f (x) dx xe x dx 1 ˆ x 1 b) Un estimador es insesgado o centrado cuando su valor probable coincide con el valor del parámetro a estimar. E ˆ E ˆ E( x 1) E( x ) 1 ( 1) 1 Integración por partes: x x x x x x 1 x xe dx x( e ) e dx xe e (1 x) e e u dv u v v du ex 35 . .

..Una muestra aleatoria (X 1 . . Xn ) de esta variable aleatoria a) Obtener el estimador por el método de los momentos b) Calcular la varianza de este estimador y demostrar que es consistente Solución: a) Se plantea la ecuación E X x 36 . x 1 x xe dx e 1 ex 23. 1 1 f (x) 0 en el resto Consideremos una muestra aleatoria (X1 . X n ) de la población tiene como función de 2 x xe si x 0 densidad f (x) 0 en el resto Hallar el estimador de máxima verosimilitud de Solución: La función de verosimilitud L ( ) 2 x1 2 x2 2 xn L( ) f (x ) f (x ) f (x ) x e x e x e 1 2 n 1 2 n n xi 2n ( x1 x2 xn ) 2n i 1 (x x )e (x x )e 1 n 1 n n n xi xi 2n i 1 2n i 1 L( ) (x x )e lnL ( ) ln (x x ) e 1 n 1 n n n n n lnL ( ) (2n) ln ln xi xi lnL ( ) (2n) ln ln x i xi i 1 i 1 i 1 i 1 n lnL ( ) 2n ˆ 2n xi 0 n i 1 xi i 1 24..El coseno X del ángulo con el que se emiten los electrones en un proceso radioactivo es una variable aleatoria con función de densidad (1 x) 2 1 x 1.

1. xn ) una muestra aleatoria de tamaño n que sigue una distribución de n xi ˆ x1 3 x n Poisson. 3 5 8 7 4 5 6 2 Encontrar la estimación máximo verosímil de b) Sea (x1 . x 2 . 2. queda probado que ˆ es consistente para estimar 25. se considera una variable aleatoria con distribución de Poisson de parámetro desconocido. . Si ˆ 1 . ) x! 0 otro caso 37 .. V ( ˆ ) V (X) n n 9 n lim E ( ˆ ) n Para probar que ˆ es consistente para estimar es suficiente probar lim V ( ˆ ) 0 n lim E ( ˆ ) lim E (3 x) lim 3E (x) 3E (X) 3 n n n 3 2 3 lim V ( ˆ ) lim V (3 x) lim 0 n n n n Por tanto. elegidos de forma independiente. 1 1 1 x x2 x3 ˆ x E X x dx 3x 1 2 2 6 1 3 V (X) 9 b) V ( ˆ ) V (3 x) 9 V (x) 9 V (X) n n 1 2 1 2 2 2 2 1 x x3 x4 3 2 V (X) E (X ) E (X) x dx 1 2 3 6 8 1 3 9 2 2 9 9 3 3 de donde.En un estacionamiento el número de veces que se abre la barrera en un intervalo de 10 minutos. 2 son estimadores.. a) En una muestra aleatoria de 8 intervalos de 10 minutos cada uno.. se registra para cada intervalo el valor que toma la variable en estudio. Determinar el mejor i 1 n 4 estimador del parámetro Solución: a) X = "número de veces que se abre la barrera en un intervalo de 10 minutos". . P(X. para que pasen vehículos en un sector de seguridad. X P( ) x e x 0.

esto es. elegidos de forma independiente. ) e e n e i 1 x 1! xn! xi! i 1 n xi n xi n n n i 1 n n lnL (X. la estimación máxima verosímil corresponde a que la barrera se abre 5 veces. b) Se analizan si los estimadores son o no insesgados. n n xi 1 n E( ˆ 1 ) E E(x i ) i 1 n n i 1 n x1 3 x n 1 3 E( ˆ 2 ) E E(x1 ) 3E(x 2 ) 4 4 4 Ambos estimadores son insesgados. ) n 1 xi 0 xi n 0 ˆ i 1 x ˆ i 1 ˆ n El estimador de máxima verosimilitud viene dado por la media muestral: EMV ( ˆ ) x Utilizando la muestra aleatoria de ocho intervalos de 10 minutos. ) P (x i. si la esperanza del estimador coincide con el parámetro a estimar. La varianza de cada estimador: n n xi 1 n V( ˆ 1 ) V V (x i ) i 1 n n2 i 1 n2 n x1 3 x n 1 9 10 5 V(ˆ2) V V(x1 ) 9 V(x 2 ) 4 16 16 16 8 38 . se obtiene el estimador máximo verosímil: ˆ 3 5 8 7 4 5 6 2 5 8 En consecuencia. sustituyendo por ˆ n lnL (X. se deriva la expresión anterior respecto del parámetro para obtener. en una muestra aleatoria de ocho intervalos de 10 minutos cada uno.La función de verosimilitud L( ) : n xi n x1 xn i 1 n L( ) L (X. ) xi ln ln(x i !) n i 1 i 1 Para obtener el estimador de máxima verosimilitud EMV ( ˆ ) . ) ln n e ln( i 1 ) ln xi! ln(e ) x i ln ln(x i !) n i 1 i 1 i 1 xi! i 1 n n lnL (X.

25 segundos ni supere los 0. ) n ln( 1) ln x i i 0 Para obtener el estimador de máxima verosimilitud EMV ( ˆ ) . ) con desconocido. sustituyendo por ˆ n n ln L (x1 . ) n n ln x i 0 ln x i ˆ ˆ 1 i 0 ˆ 1 i 0 39 . x 2 . 1 f(X. 0. x 2 . . xn .7 . ) i 0 n L(x1 .75 segundos.7 . se deriva la expresión anterior respecto del parámetro para obtener. la efectividad de los estimadores depende del tamaño de la muestra: Si la muestra es igual a 1 (n 1) el estimador más eficiente es ˆ 2 Si la muestra es mayor que 1 (n 1) el estimador más eficiente es ˆ 1 26.En conclusión. 0. ) f(xi . x 2 . xn . distribuida según f(x.. . xn .8 . ) : n n n n ln L(x1 .6 . donde X representa el tiempo máximo necesario para determinar un proceso en segundos: ( 1) x 0 x 1. . 2 1 c) Determinar el estimador máximo verosímil de: (a) 1 (b) 1 Solución: n a) La función de verosimilitud L( ) L(X.9 . x 2 . xn . . x 2 . 0.9 . . 0. xn . 0. ) 0 otro caso a) Determinar el estimador máximo verosímil de b) Determinar la estimación máximo verosímil de en una muestra aleatoria simple constituida por los datos: 0. Estimar la probabilidad del tiempo máximo necesario para terminar un proceso.9. 0. x 2 . .Sea (x1 . ) ln ( 1) xi ln( 1) ln xi i 0 i 0 n ln L(x1 . que no exceda de 0. ) ( 1) x1 ( 1) x 2 ( 1) xn ( 1)n xi i 0 Calculando el logaritmo natural de L(x1 . xn ) una muestra aleatoria de tamaño n.

8 ln0.25 ( ˆ 1) 0.047 0.027 2 1 2 EMV 1 2ˆ 1 2 x 3.25 P(0.25 X 0.027 1 40 .8 El estimador máximo verosímil EMV( ) ˆ 3.75) x 0.75 0.9 ln0.027 ln0. ˆ )dx ( ˆ 1) x dx ( ˆ 1) ˆ P(0.754.31 La probabilidad del tiempo máximo necesario para terminar el proceso (entre 0.254.75) 0.9 ln0.027 1 4.027 1 3.027 De otra parte.7 ln0.493 1 EMV 1 ˆ 1 3.25 0.25 0.6 ln0.027 0.25 y 0. ˆ 0.75 x 1 ˆ 1 0.31 2 1 c) El estimador máximo verosímil de 1 y 1 EMV 1 EMV 1 ˆ 1 3.75 segundos) es 0.25 X 0.9 ln0.ˆ n EMV( ) n 1 ln xi i 0 b) El estimador máximo verosímil de con los datos de la muestra: ˆ 8 1 4.7 ln0.75 f(X.75 0.027 1 EMV 2.

Gestión Aeronáutica: Estadística Teórica Facultad Ciencias Económicas y Empresariales Departamento de Economía Aplicada Profesor: Santiago de la Fuente Fernández 37 .