Vous êtes sur la page 1sur 42

Capítulo 6: Estimación puntual y por Intervalos de Con…anza

La inferencia estadística generalmente pretende obtener información acerca de uno o más paráme-
tros de una distribución poblacional, a partir de una muestra de esa población.
Llamaremos muestra aleatoria de una distribución F , a un conjunto de variables aleatorias
X1 ; X2 ; ::; Xn independientes y todas con la misma distribución F: Los valores observados de esa
muestra aleatoria son números x1 ; x2 ; :::; xn .
En este capítulo veremos cómo utilizar los valores de una muestra para obtener información
sobre el valor de un parámetro poblacional. Veremos algunas propiedades de las funciones que sue-
len utilizarse para calcular estimaciones puntuales de los parámetros desconocidos y estudiaremos
procedimientos para obtener estimaciones mediante intervalos de con…anza.
Llamamos estadístico, a cualquier función de la muestra aleatoria, entonces un estadístico es
también una variable aleatoria.
De…nición: Sea X1 ; X2 ; ::; Xn una muestra aleatoria de una distribución que depende de un
parámetro (usaremos la notación F ( )). Un estimador puntual de ese parámetro , es un estadís-
tico b(X1 ; X2 ; ::; Xn ), de modo que un estimador es una variable aleatoria. Cuando esa función se
aplica a los valores observados de la muestra aleatoria b(x1 ; x2 ; ::; xn ) constituye una estimación
puntual, que es un número. En general se suele usar la notación b para referirnos a un estimador
y también para referirnos a una estimación, por el contexto se podrá diferenciar a que nos estamos
re…riendo.
De…nición: Si queremos estimar un parámetro , un estimador b se dice que es insesgado, si
E( ) = . Si b no es insesgado, la diferencia E(b)
b , se llama sesgo del estimador.
Ejemplos de estimadores insesgados: la esperanza muestral (X) y la varianza muestral
(S2 )
Dada una muestra aleatoria de una distribución con media , ya vimos que E(X) = ; luego X
es un estimador insesgado de la media poblacional
Dada una muestra aleatoria de cualquier distribución con media y varianza 2 se de…ne la
varianza muestral como: Pn
2 (Xi X)2
S = i=1
n 1
La varianza muestral es un estimador insesgado de la varianza poblacional 2, esto signi…ca que:

E(S 2 ) = 2

Para probar esta propiedad, desarrollamos:


n
X n
X n
X n
X
2 2
(Xi X)2 = (Xi2 2Xi X + X ) = Xi2 2X Xi + nX
i=1 i=1 i=1 i=1

y teniendo en cuenta que:


n
X
Xi = nX
i=1

llegamos a:
n
X n
X
2 2
(Xi X) = Xi2 nX
i=1 i=1

49
entonces aplicando las propiedades de la esperanza
Pn 2 2 Pn
E i=1 Xi nX 2 2
2 i=1 E(Xi ) nE(X )
E(S ) = =
n 1 n 1
además sabemos que E(X 2 ) = var(X) + E(X)2 , entonces vemos que:
2
E(Xi2 ) = 2
+ 2
y E(X ) = 2
=n + 2

y reemplazando en lo anterior
Pn
2 ( 2 + 2 ) n( 2 =n + 2)
n 2 +n 2 2 n 2 (n 1) 2
2
E(S ) = i=1 = = =
n 1 n 1 n 1

Ejemplo: Si X B(n; p) un posible estimador de p es pb = X=n


se puede ver que es un estimador insesgado, ya que:

E (b
p) = E (X=n) = E(X)=n = np=n = p

Al dar una estimación de un parámetro, siempre se debe dar también una idea de la precisión de
dicha estimación, para eso se utiliza el error estándar.
De…nición: Se denomina error estándar de un estimador a su desviación estándar, dt b =
q
var(b). Si el error estándar es función de parámetros desconocidos cuyos valores se pueden
estimar, al sustituir dichos parámetros por sus estimadores, se obtine el error estándar estimado
\
del estimador, se suele denotar con dt b

Sea X1 ; X2 ; ::; Xn una muestra aleatoria de una distribución con media y varianza 2 :Ya vimos
p
que X es un estimador de , y s es un estimador de , el error estándar de X es dt(X) = = n y
\ = s=pn:
el error estándar estimado es dt(X)
Si X B(n; p) ya q
vimos que pb = X=n es un estimador del parámetro
q p; su error estándar es
p
dt(b [
p) = var(X=n) = p(1n p) y el error estandar estimado es dt(b
p) = pb(1n pb)

Intervalos de con…anza
En los ejemplos anteriores hemos visto como hacer una estimación puntual de un parámetro, pero
sabemos que es prácticamente imposible que nuestra estimación sea exactamente igual al parámetro
que deseamos estimar. Por ese motivo, trataremos de hacer dar una estimación mediante un
intervalo de con…anza.
Se busca acotar el parámetro mediante un intervalo, que debe depender de los datos, como
éstos son aleatorios, el intervalo tambien lo será, y por lo tanto podría no contener a ; si tenemos
mala suerte. Lo que se puede hacer es …jar una probabilidad “alta” 1 ; y buscar un intervalo
que contenga con probabilidad 1 . En general se usa 1 = 0:95.
De…nición: Sea X1 ; X2 ; ::; Xn una muestra aleatoria de una distribución F ( ). Un intervalo de
con…anza para de nivel (1 ), (o intervalo de (1 ) % de con…anza o (IC(1 ) ), es un intervalo
de extremos aleatorios, que contiene al parámetro , con probabilidad 1 , esto quiere decir

IC(1 )( ) = (g1 (X1 ; X2 ; ::; Xn ); g2 (X1 ; X2 ; ::; Xn ))

50
tal que
P 2 IC(1 ) = P (g1 (X1 ; X2 ; ::; Xn ) g2 (X1 ; X2 ; ::; Xn )) = 1
Donde g1 (X1 ; X2 ; ::; Xn ) y g2 (X1 ; X2 ; ::; Xn ) son funciones de la muestra aleatoria, y por lo
tanto son variables aleatorias.
Antes de ver como construir un IC, daremos otra de…nición:

Valor crítico para una N(0,1): Sea 0 < < 1, si Z s N (0; 1), se denomina valor crítico z ,
al valor que veri…ca que la P (Z > z ) =

¿Como construimos un IC?


En general se utiliza el método de la función pivote, que veremos con un ejemplo:
Intervalo de con…anza para la media de una distribución normal con varianza cono-
cida.
Sea X1 ; X2 ; ::; Xn una muestra aleatoria de una distribución Normal con media y varianza 2 :
el método consiste en los siguientes pasos:

1. Encontrar una función de la muestra aleatoria y del parámetro de interés (función pivote),
cuya distribución no dependa de ningún parámetro desconocido, llamemos h(X1 ; X2 ; ::; Xn ; )

X
En este ejemplo h(X1 ; X2 ; ::; Xn ; ) = p N (0; 1)
= n

2. Determinar un par de números reales a y b, tales que

P (a h(X1 ; X2 ; ::; Xn ; ) b) = 1

En el ejemplo : a= z =2 yb=z =2
!
X
P z =2 p ) z =2 = 1
= n

51
3. Siempre que sea posible, a partir de la expresión anterior, despejar los extremos aleatorios
g1 (X1 ; X2 ; ::; Xn ) y g2 (X1 ; X2 ; ::; Xn ): En el ejemplo:
p p
P X z =2 = n X + z =2 = n = 1
p p
IC(1 )( )= X z =2 = n ; X +z =2 = n

Ejemplo: Suponga que se toma una muestra de 5 elementos de una población normal con
desviación estándar de 7:2, y que la media de la muestra es 86. (Importante: la media de la
muestra es x; el promedio de 5 valores observados x1 ; x2 ; ::; x5 : No confundir con la media pobla-
cional que en este caso es desconocida.)
En este caso X1 ; X2 ; ::; X5 es una muestra aleatoria de una distribución N ( ; 7:22 ), usaremos
como función pivote:
X
p N (0; 1)
7:2= 5
Como se requiere 1 = 0:95, esto signi…ca que = 0:05 y =2 = 0:025; buscando en la tabla
de valores críticos z0:025 = 1:96 y el intervalo de 95% de con…anza es:
h p p i
IC(0:95) ( ) = X 1:96 7:2= 5 ; X + 1:96 7:2= 5

reemplazando X por x = 86, obtenemos:


h p p i
86 1:96 7:2= 5; 86 + 1:96 7:2= 5 = [79:69; 92:31]

Interpretación de un intervalo de con…anza


El nivel de con…anza 95% del ejemplo, proviene de la probabilidad 0:95 de que el intervalo aleatorio
contenga al parámetro. Es importante recordar que al reemplazar los estadísticos por los valores de
la muestra, obtuvimos un intervalo real [79:69; 92:31] ; este ya no es aleatorio y no tiene sentido decir
que contiene a con probabilidad 0:95. La interpretación correcta del “nivel de con…anza” se basa

52
en la idea de probabilidad como límite de las frecuencias relativas. Supongamos, para el ejemplo, que
se seleccionan muchas muestras aleatorias de tamaño 5 de esa población y se construyen intervalos
de con…anza utilizando el mismo procedimento; con cada muestra de 5 observaciones tendremos un
valor de x diferente, y en consecuencia un intervalo numérico diferente, lo que podemos a…rmar es
que, aproximadamente, el 95% de estos intervalos contienen al verdadero valor , y naturalmente
habrá aproximadamente un 5% de dichos intervalos que no contienen al verdadero valor .

Nivel de con…anza, precisión y tamaño de la muestra.


Como resulta lógico, es deseable que el nivel de con…anza 1 sea lo mayor posible, pero z
aumenta cuando elegimos valores más grandes para el nivel 1 (por ejemplo si queremos un
nivel del 99%, los valores críticos son 2:58 y 2:58), y en consecuencia aumenta la longitud del
intervalo, o lo que es equivalente, aumenta el error de estimación. Esto signi…ca que si se quiere
más seguridad hay que pagarla con menos precisión. En nuestro ejemplo si deseamos un nivel de
99% de con…anza, el intervalo será:
h p p i
86 2:58 7:2= 5; 86 + 2:58 7:2= 5 = [77:69; 94:31]

la longitud de este intervalo es L = 94:31 77:69: = 16:62, o lo que es lo mismo el error de estimación
es L=2 = 8:31
¿Qué deberíamos hacer si queremos tener un nivel de 99%, pero mayor precisión, por ejemplo
una longitud no mayor de 10; o lo que es equivalente que el margen de error no sea mayor que 5?
p
La solución es aumentar el tamaño de la muestra. La longitud del IC(1 ) ( ) es L = 2z =2 = n,
p
(el margen de error es error = z =2 = n) entonces, en nuestro ejemplo:
p
L = 2 2:58 7:2= n

haciendo
7:2
2 2:58 p 10
n
podemos despejar
p 2 2:58 7:2
n
10
y
n 13:8
necesitaríamos una muestra de por lo menos 14 observaciones para lograr un intervalo de 99% de
con…anza con longitud no mayor de 10.

¿Y cuando no conocemos la varianza?


Intervalo de con…anza para la media de una normal con varianza desconocida.
Si tenemos una muestra aleatoria. X1 ; X2 ; ::; Xn una de una distribución normal con media
y varianza 2 ; pero esta varianza es desconocida, no podemos usar la misma función pivote

X
Z= p
= n
ya que no conocemos , entonces debemos usar otra.
Consideremos la función pivote
X
T = p
S= n

53
donde s
P
(Xi X)2
S=
n 1
cuando las Xi son una muestra aleatoria de una distribución normal, esta función pivote
T tiene distribución de Student con n 1 grados de libertad. Esta distribución es simétrica, y
existen tablas con los valores críticos de esta distribución para cada valor de “grados de liberad ”

Valor crítico para una T(n) : Si T tiene distribución de Student con n grados de libertad, y
es un número real entre 0 y 1, el valor crítico correspondiente a , es el valor t ;n que veri…ca
P (T > t ;n ) = .

Entonces siguiendo el mismo procedimiento anterior, elegimos los valores a = t =2;n 1 y


b = t =2;n 1 que veri…can:
!
X
P t =2;n 1 p t =2;n 1 =1
S= n

y …nalmente llegamos a:
p p
P X t =2;n 1 s= n X +t =2;n 1 s= n =1

t =2;n 1 S t =2;n 1 S
IC(1 )( )= X p ;X+ p
n n

54
Ejemplo: Preocupa la velocidad a la que se conduce en un determinado tramo de una autopista.
El radar indica la siguiente velocidad de una muestra aleatoria de siete automóviles en km/hora

99 93 88 97 106 91 89

Suponiendo que la población sigue una distribución normal, calcule un intervalo de 95% de con…anza
de la velocidad media de todos los automóviles que circulan por este tramo de la autopista.
Tenemos X1 ; X2 ; ::; X10 donde cada Xi representa la velocidad del i-ésimo auto de la muestra
y estamos suponiendo que Xi s N ( ; 2 ), como no se conoce la varianza debemos usar la función
pivote:
X
T = p s T(10 1)
S= 10
y a partir de esa función pivote y buscando en la tabla t0:025;9 = 2:447; se llega al intervalo aleatorio:

S S
X 2:447 p ; X + 2:447 p
10 10
a partir de los datos, calculamos x = 94:71, y s = 6:40 y reemplazando se obtiene el intervalo:
[88:79; 100:63]

Intervalo de con…anza para la varianza de una distribución normal. Sea una muestra
aleatoria. X1 ; X2 ; ::; Xn de una distribución normal con media y varianza 2 : Sabemos que S 2 es
un estimador insesgado de la varianza 2 ; así como S es un estimador de la desviación típica : Pero
queremos construir un intervalo que contenga al verdadero 2 (o ) con probabilidad 1 . Para
esto, como siempre, necesitamos una función pivote h(X1 ; X2 ; ::; Xn ; 2 ), que tenga una distribución
conocida independiente del parámetro a estimar.
En este caso usaremos P
(n 1)S 2 (Xi X)2
V = 2
= 2

ya que puede demostrarse que, cuando las Xi tienen distribución normal, V tiene distribución
Chi-cuadrado ( 2 ) con n 1 grados de libertad. Esta distribución no es simétrica, la densidad es
no nula sólo para x > 0: También existen tablas para los valores críticos de esta distribución para
cada valor de “grados de libertad”

Valor crítico para una 2(n) : Si V tiene distribución Chi-cuadrado con n grados de libertad
y es un número real entre 0 y 1, el valor crítico correspondiente a , es el valor 2 ;n tal que
P (V > 2 ;n ) = .

Como siempre, necesitamos un par de valores, a y b, tales que V se encuentre entre ellos con
probabilidad 1 : Pero esta distribución no es simétrica, entonces deberemos elegir los valores

55
a= 2 yb= 2 tales que
1 =2 =2

2 (n 1)S 2 2
P 1 =2;n 1 2 =2;n 1 =1

al despejar 2 de la expresión entre paréntesis, llegamos a


!
(n 1)S 2 2 (n 1)S 2
P 2 2 =1
=2;n 1 1 =2;n 1

y …nalmente el intervalo de con…anza para 2 es:


" #
2 (n 1)S 2 (n 1)S 2
IC(1 ) = 2 ; 2
=2;n 1 1 =2;n 1

Si queremos un intervalo de con…anza para la desviación estándar, es evidente que:


s s !
(n 1)S 2 p 2 (n 1)S 2
P 2 2 =1
=2;n 1 1 =2;n 1

entonces un intervalo de con…anza para es:


"s s #
(n 1)S 2 (n 1)S 2
IC(1 )( )= 2 ; 2
=2;n 1 1 =2;n 1

Ejemplo: Un fabricante está preocupado por la variabilidad de los niveles de impurezas de los
envíos de una materia prima de un proveedor. Una muestra aleatoria de 15 envíos ha mostrado
una desviación típica de 2:36 en los niveles de impurezas. Suponga que la población sigue una
distribución normal.
Halle el intervalo de con…anza al 95% de la varianza poblacional.
Tenemos X1 ; X2 ; ::; X15 donde cada Xi representa el nivel de impurezas en la materia prima del
i ésimo envío de ese proveedor y Xi s N ( ; 2 ), la función pivote es

(15 1)S 2 2
V = 2
s (15 1)

56
como vimos antes, buscamos en tabla 2 = 26:119 y 2 = 5:629; y el intervalo de 95%
0:025;14 0:975;14
con…anza para 2 es:
14 S 2 14 S 2
;
26:119 5:629
y reemplazando S 2 por s2 = 2:362 ; queda: [2:9854; 13:8523] luego el intervalo decon…anza para
es: [1:73; 3; 72]

¿Y si queremos estimar la media de una distribución desconocida?


El teorema central del límite (TCL), será de utilidad en este caso. Recordemos que este
teorema dice que si tenemos una muestra aleatoria X1 ; X2 ; :::; Xn de cualquier distribución, cuando
p
n es su…cientemente grande, la distribución de n X = se aproxima a una N(0; 1); también es
cierto que si se reemplaza por S, la distribución también se aproxima a una N(0; 1): Este resultado
es el que usaremos cuando no conocemos la distribución de los datos, siempre que la muestra sea
su…cientemente grande. El procedimiento es el mismo, partimos de la función pivote:

X
T = p
S= n

que, considerando que n es grande, tiene una distribución aproximadamente N(0; 1): Entonces los
valores que elegimos son z =2 y z =2 ; y podemos a…rmar que:
p !
n X
P z =2 z =2 ' 1
S

y despejando la desigualdad, como antes, tenemos:


p p
P X z =2 S= n X +z =2 S= n '1

Ejemplo: Se desea estimar cuánta energía eléctrica usarán, en media, durante el mes de agosto,
los residentes de una ciudad. Se seleccionan aleatoriamente 61 residentes y se encuentra que su
consumo promedio en agosto es 894 kilowatts hora (kwh) y la varianza muestral fue 431 (kwh)2 ,
pero se desconoce la forma de la distribución.
(a) Establezca una estimación de intervalo para el consumo promedio de energía eléctrica en el
mes de agosto para tener una seguridad del 90% de que la media verdadera de la población está
dentro de este intervalo.
Tenemos X1 ; X2 ; ::; X61 donde cada Xi representa la energía eléctrica usada por el i-ésimo
residente de la muestra, pero no conocemos la distribución de estas v.a.
En este caso, como n = 61, se usa el TCL y la función pivote será:

X
Z= p que tiene distribución aproximada normal estándar
S 2 =61

como queremos 1 = 0:90, eso signi…ca que = 0:10 y =2 = 0:05; entonces buscando en tabla
z =2 = 1:645: El intervalo de nivel aproximado 0:90, queda:
" r r #
S2 S2
X 1:645 ; X + 1:645
61 61

57
y reemplazando X por x = 894 y S 2 por s2 = 431 se obtiene el intervalo:IC('0:90) ( ) =
[889:63; 898:37]
(b) Repita la parte (a) para una certeza aproximada del 99%, en este caso = 0:01 y z =2 =
z0:005 = 2:33, luego reemplazando y haciendo las cuentas llegamos al intervalo [887; 15; 900; 85]
(c) Si el precio por kilowatt es $0:058, ¿dentro de qué intervalo se puede asegurar con 90% de
con…anza, que caerá el costo promedio de agosto por consumo de electricidad?
Si Xi es el consumo del residente i, el costo para ese residente será Yi = 0:058Xi , sabemos que
la Y = E(Yi ) = 0:058E(Xi ) = 0:058 , luego:
" r r #
431 431
P X 1:645 X + 1:645 =
61 61
" r ! r !#
431 431
= P 0:058 X 1:645 0:058 0:058 X + 1:645
61 61
entonces un intervalo de con…anza de nivel aproximado 0; 90 para Y = E(Yi ) es:

[0:058 889:63; 0:058 898:37] = [51:60; 52:11]

Intervalos de con…anza para una proporción


Sea X s B(n; p) por el caso particular del TCL para la binomial, sabemos que si n es grande,
la distribución de
pb p
q se aproxima a una N(0; 1)
p(1 p)
n

también vale que la distribución de

pb p
q se aproxima a una N(0; 1)
pb(1 pb)
n

Entonces, usamos esta última, como función pivote eligiendo los valores críticos z =2 yz =2 ,
y se cumple: 0 1
p
b p
P @ z =2 q z =2 A ' 1
pb(1 pb)
n

Luego, se puede obtener un intervalo de con…anza para p con nivel aproximadamente 1


(para n grande), de la forma
" r r #
pb(1 pb) pb(1 pb)
IC('1 ) (p) = pb z =2 ; pb + z =2
n n

58
Ejemplo: Se realizó una encuesta para estimar la proporción de vehículos que no están asegura-
dos. Sobre una muestra de 200 vehículos se encontraron 46 que no estabn asegurados. Se requiere
estimar dicha proporción mediante una intervalo de 95% de con…anza.
De…nimos X = "el número de vehículos no asegurados en una muestra de 200 vehículos".
entonces X s B(200; p) donde p es la proporción poblacional de vehículos no asegurados. Sabemos
que
pb p
q se aproxima a una N(0; 1)
pb(1 pb)
200

entonces podemos usar el intervalo de la forma


" r r #
pb(1 pb) pb(1 pb)
IC('0:95) (p) = pb 1:96 ; pb + 1:96
200 200

46
En este ejemplo pb = 200 = 0:23 y reemplazando, obtenemos el intervalo:
" r r #
0:23(1 0:23) 0:23(1 0:23)
0:23 1:96 ; 0:23 + 1:96 = [0:1717 ; 0:2883]
200 200

Esto se puede expresar como: podemos a…rmar con un nivel de con…anza aproximado de 95%
que porcentaje de vehículos que no están asegurados está entre 17:17% y 28:28%
Precisión y tamaño muestral.
En el ejemplo anterior la longitud del intervalo de con…anza resultó L = 0:2883 0:1717 =
0:1166; o expresado en porcentaje 11:66%.
q q
En general la longitud es L = 2z =2 pb(1n pb) , o error = z =2 pb(1n pb) que dependen de pb.
Si se pretende estimar la proporción poblacional con un margen de error no mayor del 5%;
(L 0:10), antes de realizar el estudio se debería determinar cuantos vehículos se deben encuestar,
pero cómo hacerlo sin conocer todavía pb? Veamos un ejemplo

Ejemplo: Se desea hacer una encuesta para estimar la proporción verdadera de consumidores sa-
tisfechos con cierto producto mediante un intervalo del 90% de con…anza, con un error de estimación
no mayor de de 0:04:
(a) Encuentre el tamaño de la muestra requerido. Suponga que no se tiene una ninguna idea
acerca de cuál es la proporción.
Como se desea que el nivel de con…anza 1 = 0:90; eso signi…ca que z0:05 = 1:645, entonces
el intervalo de con…anza será:
" r r #
pb(1 pb) pb(1 pb)
pb 1; 645 ; pb + 1; 645
n n

y el error de estimación: r
pb(1 pb)
error = 1; 645
n
lo que se pide es determinar n para que ese error sea 0:04, el problema es que el error depende
de pb, que no lo conocemos.

59
Pero puede verse en la grá…ca, que la expresión pb(1 pb) es una parábola que alcanza su máximo
cuando pb = 0:5 y en ese caso pb(1 pb) = 0:25

entonces pb(1 pb) 0; 25, esta desigualdad vale para cuanquier pb: Usando eso en la expresión
del error, tenemos r r
pb(1 pb) 0; 25
error = 1:645 1:645
n n
la última expresión es una cota superior del error de estimación, en ningún caso el error de esti-
mación puede ser mayor que esa cota, luego si hacemos
r
0; 25
1; 645 0:04
n
nos aseguramos que el error también sea 0; 04: entonces depejando n de la expresión de arriba,
llegamos a n 422; 8. Se necesita encuestar al menos a 423 consumidores para asegurarnos que,
cualquiera sea el valor de pb; el error de estimación no será mayor de 0:04
(b) Se encuesta a 400 consumidores y 118 dicen estar satisfechos con el producto, construya el
intervalo de con…anza pedido.
Con estos valores pb = 118=400 = 0:295 y el intervalo queda:
" r r #
pb(1 pb) pb(1 pb)
pb 1:645 ; pb + 1:645 = [0:2575; 0:3325]
n n

es decir se puede a…rmar con un nivel de con…anza aproximado de 0:90; que el porcentaje de
consumidores satisfechos con el producto está entre 25:75% y 33:25%
El error de estimación fue 0:0375 (o 3:75%) que es menor que el valor pedido, a pesar de que
el tamaño de la muestra no fue 423. Esto se debe al que el pb obtenido en esta muestra, resultó
mucho menor que 1=2

60
Capítulo 7: Test de Hipótesis para una muestra

En muchas ocasiones, el propósito de una investigación es determinar si es verdadera o no, alguna


hipótesis sobre el parámetro de una distribución. Los métodos que se utilizan para esto se llaman
pruebas o tests de hipótesis.
Una hipótesis estadística es una expresión acerca del valor de una o varias características o
parámetros de la población.
En un procedimiento de test de hipótesis tenemos siempre dos hipótesis para contrastar. La
hipótesis que se desea probar con la menor posibilidad de error, es la hipótesis alternativa (HA ) y
la hipótesis nula (H0 ) representa lo contrario de lo que se quiere probar.

Test de hipótesis para la media de una distribución normal con varianza conocida
Para presentar las ideas principales, comencemos desarrollando un ejemplo:
El director de una fábrica está estudiando la posibilidad de implementar un nuevo sistema
que se supone que incrementará su producción. Se supone que la producción semanal sigue una
distribución normal, actualmente la media es de 80 toneladas. Implementar el nuevo sistema
es costoso, y el director está dispuesto a hacerlo solamente si hay pruebas contundentes de que
incrementa la producción media. En este caso el director quiere estar seguro de que la media de la
producción semanal con el nuevo método es mayor que 80:
Para tomar una decisión el director dispone de datos de un establecimiento que utiliza el nuevo
sistema, durante 6 semanas la producción, en toneladas, fue:

84 78 85 86 80 88

Podemos modelizar esta situación diciendo que X1 ; X2 ; :::; X6 es una muestra aleatoria de la
producción seamanal con el nuevo método y suponemos que cada Xi s N ( ; 2 ), es decir que
la producción semanal con el nuevo método tiene distribución normal. La hipótesis que se desea
probar es HA : > 80, y luego se de…ne H0 : = 80 que indicaría que el nuevo método no mejora
la producción media semanal.
En otros ejemplos la hipótesis alternativa también podría ser HA : < 0 o HA : 6= 0: La
igualdad siempre está en H0 :
Al tomar una decisión, ya sea aceptar o rechazar H0 podemos cometer un error, pero hay dos
tipos de errores:
Error de tipo I : rechazar H0 cuando es verdadera, en el ejemplo: concluir que el nuevo método
incrementa la producción media, cuando en realidad no lo hace.
Error de tipo II : aceptar H0 cuando es falsa, en el ejemplo: concluir que el nuevo método no
incrementa la producción media, cuando en realidad si lo hace.
En el ejemplo, la consecuencia de cometer un error de tipo I, sería implementar el nuevo método
de producción, que es más costoso, sin aumentar la producción media, esto es lo que el director de
la fábrica quiere evitar.
En general el error de tipo I se considera el más grave y los procedimientos que vamos a ver,
nos permiten acotar la probabilidad de cometer un error de tipo I, por eso es importante saber cuál
debe ser la hipótesis nula y cuál la alternativa.
Volviendo al ejemplo, para simpli…car supongamos que la varianza en la producción semanal
con el nuevo método es conocida 2 = 16 entonces las Xi s N ( ; 42 ); sabemos que x es una buena

61
estimación de : Luego, parece natural calcular x y si el resultado es mucho mayor que 80 a…rmar
que > 80
En este caso x = 83:5, pero esto ¿es su…ente para a…rmar que > 80? Podría ocurrir que = 80
y sólo por azar obtuvimos esos valores con los que llegamos a x = 83:5
En realidad deberíamos de…nir una regla de decisión:

A…rmamos que > 80, cuando x es mayor que algún valor k de…nido previamente.

Pero es evidente que:


x 80 k 80
x > k es equivalente a p > p
4= 6 4= 6
k p80
(a la expresión 4= 6
la podemos llamar k1 )
Entonces podríamos pensar en de…nir la regla de decisión como:
x 80
A…rmamos que > 80; cuando p > k1
4= 6

Pero, ¿cómo elegimos ese valor k1 ? Ese valor se elige de modo que la probabilidad de cometer
error de tipo I, sea pequeña. Dado un valor pequeño se quiere que P (Error de tipo I) =
Recordemos que si H0 es verdadera, quiere decir que = 80 entonces

si H0 es verdadera X s N (80; 16=6) y entonces


X 80
si H0 es verdadera p s N (0; 1)
4= 6
Si elegimos k1 = z
La regla de decisión será:
x 80
A…rmamos que > 80; cuando p >z
4= 6
y en consecuencia
X 80
P (Error de tipo I) = P p >z H0 es verdadera =
4= 6
Como se ve en la grá…ca, la probabilidad de error de tipo I, es igual al área bajo la curva a la
derecha del valor z ; (suele llamarse zona de rechazo) y recordando la de…nición de valor crítico,
sabemos que esa área vale :

62
En nuestro ejemplo, si elegimos = 0:05 =) z = 1:645: Es decir la regla de decisión será:
x 80
A…rmamos que > 80; cuando p > 1:645
4= 6
x p
80
Reemplazando x = 83:5 en la expresión 4= 6
obtenemos 2:14 que cae en la zona de rechazo
(2:14 > 1:645), en consecuencia podemos a…rmar que > 80, y la probabilidad de equivocarnos al
hacer esta a…rmación es = 0:05 Ese valor elegido peviamente, se denomina nivel de signi…cación

Tratemos de resumir los principales conceptos que hemos visto hasta aquí.

En un procedimiento de test de hipótesis tenemos siempre dos hipótesis para contrastar. En


investigaciones cientí…cas la hipótesis alternativa (HA ) suele llamarse "hipótesis del investi-
gador" y la hipótesis nula (H0 ) representa lo contrario, que no hay diferencias. En el ejemplo
analizado, la hipótesis nula era H0 : = 80 y la hipótesis alternativa es HA : > 80. En
general si estamos haciendo hipótesis sobre un parámetro ; la hipótesis nula será H0 : = 0
y hipótesis alternativa puede ser: HA : > 0 ; HA : < 0 o HA : 6= 0 : La igualdad
siempre está en H0 :

Un procedimiento de test de hipótesis está determinado por un estadístico de prueba que,


cuando H0 es verdadera, debe tener una distribución conocida e independiente del parámetro
sobre el cual estamos haciendo inferencias. En el ejemplo el estadístico de prueba era:

X 80
p s N (0; 1) si H0 es verdadera
5= 6

Dado ese estadístico de prueba, se de…ne una zona de rechazo y una regla de decisión. Dicha
regla puede de…nirse como: "se rechaza H0 cuando el valor del estadístico de prueba cae en la
zona de rechazo". En el ejemplo, la zona de rechazo eran los valores mayores que z . Siempre
que la hipótesis alternativa es de la forma HA : > 0 la zona de rechazo son los valores
mayores que un punto crítico; en el caso HA : < 0 la zona de rechazo son los valores
menores que un punto crítico; y en el caso HA : 6= 0 la zona de rechazo es bilateral, es decir
está formada por la unión de valores a la derecha y a la izquierda de dos puntos críticos. En
el ejemplo la regla de decisión era
x 80
"se rechaza H0 : = 80 a favor de HA : > 80 cuando p >z "
4= 6

Al tomar una decisión, ya sea aceptar o rechazar H0 podemos cometer un error, hay entonces
dos tipos de errores:

– Error de tipo I : rechazar H0 cuando es verdadera


– Error de tipo II : aceptar H0 cuando es falsa

Se denomina nivel de signi…cación del test a la probabilidad de cometer un error de tipo I,


= P (error de tipo I ) . Este nivel de signi…cación se …ja "a priori" y luego se determina
cual debe ser la zona de rechazo, para que el nivel de signi…cación sea el deseado. El área de
la zona de rechazo es igual al nivel de signi…cación ( ) elegido.

63
Valor-p También podemos razonar de esta manera: si fuera = 80, ¿cuál es la probabilidad
de obtener una media muestral tan grande, o más que 83:5?, o lo que es equivalente, ¿cuál es la
probabilidad de que el estadístico de prueba alcanzara un valor mayor o igual que 2:14?. Esta
probabilidad puede calcularse ya que el estadístico de prueba tiene distribución N(0; 1) cuando
= 80 y es p
P 6 X 80 =4 > 2:14 j H0 verdadera =
=1 (2:14) = 1 0:9838 = 0:0162
Esto es lo que se llama el “valor-p”
Cuánto menor sea este valor -p; más evidencia tengo contra H0 : En nuestro ejemplo, valor -
p = 0:0162 es una probabilidad bastante pequeña, podemos rechazar H0 y a…rmar la alternativa,
es decir que > 80; con fuerte convicción.
Otra manera de expresar la regla de decisión, es decir que se rechaza H0 , cuando el “valor-p”
es menor que el elegido previamente: En realidad el “valor-p” es el menor nivel de signi…cación
(el más exigente) para el cual se puede rechazar H0 con los valores observados.
En este caso el “valor-p”= 0:0162, esto signi…ca que podemos rechazar H0 hasta con un nivel
0:0162

Se de…ne el valor-p como la probabilidad de que el estadístico de prueba tome un valor "tan
extremo" como el obtenido, si fuera cierta la hipótesis nula. O también puede de…nirse como
el menor nivel de signi…cación para el cual se puede rechazar la hipótesis nula con los valores
observados. Estas dos de…niciones son equivalentes. Es importante observar que, el valor-p
y el nivel de signi…cación son cosas diferentes, el valor-p depende de los valores observados,
mientras que el nivel de signi…cación se …ja a priori.

Veamos otro ejemplo:


El director de producción de Rodamientos Niquelados, S.A., le ha pedido ayuda para evaluar un
proceso modi…cado de producción de rodamientos. Cuando el proceso funciona correctamente,
produce rodamientos cuyo peso sigue una distribución normal de media poblacional 5 onzas y
desviación típica poblacional 0:1 onza. Se ha recurrido a un nuevo proveedor de materia prima
para un lote reciente de producción y el director quiere saber si, como consecuencia del cambio,
el peso medio de los rodamientos es menor. No hay razón alguna para sospechar que el nuevo
proveedor plantea problemas y el director continuará recurriendo a él a menos que existan pruebas
contundentes de que están produciéndose rodamientos de menor peso que antes. Se obtuvo una
muestra aleatoria de 16 observaciones y la media muestral fue 4:962.
Tenemos las v.a. X1 ; X2 ; :::; X16 donde Xi es el peso del i-ésimo rodamiento medido y sabemos
que Xi s N ( ; 0:12 )
Se de…nen las hipótesis: H0 : = 5 vs HA : < 5
El estadístico de prueba es:
p
16(X 5)
Z= s N (0; 1) si H0 es verdadera
0:1
En este caso parece natural rechazar H0 cuando x sea lo su…cientemente menor que 5: Si se
elige trabajar con un nivel = 0:05, el valor crítico es z0:05 = 1:645 entonces de…nimos la regla de
decisión como:
p
16(x 5)
rechazo H0 : = 5 a favor de HA : < 5 cuando z = < 1:645
0:1

64
Ya está planteado el test, ahora reemplazamos x = 4:962 y obtenemos z = 1:52. Este resultado
no está en la zona de rechazo, concluimos que no hay evidencia su…ciente a nivel = 0:05 para
a…rmar que el peso medio de los rodamientos es menor que 5.
En este caso, como no rechazamos H0 ; si cometemos un error, sería un error de tipo II, y al
de…nir el procedimiento de test de hipótesis solo hemos acotado la probabilidad de comenter error
de tipo I, pero no sabemos cual es la probabilidad de error de tipo II, puede ser bastante grande.
Por ese motivo, nunca a…rmamos la hipótesis nula, simplemente decimos que no tenemos evidencia
su…ciente para rechazarla.
También podríamos calcular el valor-p correspondiente a este resultado muestral, valor-p =
P (Z < 1:52) = 0; 0643. este resultado es coherente con lo expresado anteriormente, ya que el
mínimo nivel para el cual se puede rechazar H0 con estos valores observados es 0:0643

Veamos otro ejemplo:


Un fabricante surte los ejes traseros para los camiones del Servicio Postal de Estados Unidos. Estos
ejes deben soportar 80000 libras por pulgada cuadrada (lb/in2 ) en pruebas de carga, pero un eje
excesivamente fuerte eleva los costos de producción de manera signi…cativa. En consecuencia la
resistencia media no debería ser menor que 80000 lb/in2 , pero tampoco mayor. La larga experiencia
indica que la resistencia de los ejes es una variable aleatoria con distribución normal con desviación
estándar de 3000 lb/in2 . El fabricante selecciona una muestra de 25 ejes de la producción, los
prueba y encuentra que la capacidad de carga media de la muestra es 79400 lb/in2
Modelizamos como sigue:
X1 ; X2 ; :::; X25 ; donde cada Xi indica la resistencia medida en lb/in2 ; es una muestra aleatoria
con Xi s N ( ; 40002 ) y se quiere decidir entre las hipótesis: H0 : = 80000 vs HA : 6= 80000
El estadístico de prueba a usar es:
p
25(X 80000)
s N (0; 1) si H0 es verdadera
3000
En este caso la hipótesis alternativa es bilateral ( 6= 80000) entonces es natural rechazar H0
cuando el valor del estadístico de prueba es muy grande o muy pequeño. Si queremos un nivel de
signi…cación = 0:05 la regla de decisión es:
p
25(x 80000)
rechazo H0 : = 80000 a favor de HA : 6= 80000 cuando jzj = > 1:96
3000
8 p
< z = 25(x 80000) > 1:96
>
o en forma equivalente cuando p 3000
: o z = 25(x 80000) < 1:96
>
3000
Ahora reemplazando x por 79400, obtenemos z = 1:02, como j 1:02j 1:96, no se puede
rechazar H0 : No se puede a…rmar, con nivel = 0:05, que la resistencia media de los ejes es
diferente de los estándares.
Si queremos calcular el valor-p; también debemos tener en cuenta que es un test bilateral:

valor-p = P (jZj > j 1:02j) =


= P (Z > 1:02) + P (Z < 1:02) =
= 1 (1:02) + ( 1:02) = 0:3078

Obviamente, valor-p es mayor que 0:05, ya que con ese nivel de signi…cación no rechazamos H0

65
Podemos resumir los tipos de test que hemos visto:
Test para la media de una distribución normal con varianza conocida
X1 ; X2 ; :::; Xn m.a.donde cada Xi s N ( ; 2 ) con conocido.
Hipótesis nula: H0 : = 0
p
Estadístico de prueba: Z = n X = s N (0; 1) si H0 es verdadera
p 0
Valor de estadístico de prueba: z = n (x 0) =
Hipótesis alternativa Región de rechazo para un nivel
HA : > 0 z>z
HA : < 0 z< z
HA : 6= 0 z > z =2 o z < z =2

Test de hipótesis para la media de una distribución normal con varianza descono-
cida
Ejemplo: En las negociaciones con los representantes sindicales, una empresa sostiene que con el
nuevo sistema de incentivos los ingresos semanales medios de todos los trabajadores de los servicios
de atención al cliente son al menos de $400. Un representante sindical toma una muestra aleatoria de
20 trabajadores y observa que sus ingresos semanales tienen una media de $380:20 y una desviación
típica de $42:10. Suponga que la distribución es normal.
Estos datos ¿brindan evidencia su…ciente para refutar la a…rmación de la empresa con nivel
= 0; 05?
En este caso las v.a. X1 ; X2 ; :::; X20 donde Xi es el ingreso del i-ésimo trabajador de la muestra
y sabemos que Xi s N ( ; 2 )
Se de…nen las hipótesis: H0 : = 400 vs HA : < 400
Debemos encontrar un estadístico de prueba, que sea función de la muestra, del valor de
cuanto H0 es verdadera y de ningún otro parámetro desconocido, y que su distribución bajo H0
(cuanto H0 es verdadera), sea conocida para poder de…nir la zona de rechazo para el nivel deseado.
Como es desconocido, y recordando la distribución de Student que ya vimos en el capítulo
anterior, el estadístico de prueba es:
p
20(X 400)
T = s T(19) si H0 es verdadera
S
de…nimos la regla de decisión como:
p
20(x 400)
rechazo H0 si t = < 1:729
s
ya que si deseamos un nivel = 0:05, el valor crítico es t(19)0;05 = 1:729
Finalmente, reemplazando x = 380:20 y s = 42:10 obtenemos t = 2:10, que cae en la zona de
rechazo, entonces se puede a…rmar con = 0:05 que < 400; eso signi…ca que puede refutarse la
a…rmación de la empresa con ese nivel de signi…cación.
Si queremos calcular el valor-p, en este caso solamente podemos acotarlo probando con diferentes
valores de :
= 0:05 el valor t(19)0:05 = 1:729 y 2; 10 < 1:729 =) se rechaza H0 con = 0:05
= 0:025 el valor t(19)0;025 = 2:093 y 2; 10 < 2:093 =) se rechaza H0 con = 0:025
= 0:01 el valor t(19)0;01 = 2:539 y 2:10 2:539 =) no se puede rechazar H0 con = 0:01
Entonces 0; 01 < valor p < 0; 025

66
Podemos resumir los tests para la media de una distribución normal con varianza de-
sconocida
X1 ; X2 ; :::; Xn m.a.donde cada Xi s N ( ; 2 ) con desconocido.
Hipótesis nula: H0 : = 0
p
Estadístico de prueba: T = n X =S s T(n 1) si H0 es verdadera
p0
Valor del estadístico de prueba: t = n (x 0 ) =s
Hipótesis alternativa Región de rechazo para un nivel
HA : > 0 t>t
HA : < 0 t< t
HA : 6= 0 t > t =2 o t < t =2

Test de hipótesis para la varianza de una distribución normal


Ejemplo: El director de control de calidad de una Industria quiere saber si la varianza de las
impurezas de sus envíos de fertilizante es superior a la norma establecida. Esta norma establece
que la varianza de los kilos de impurezas de los sacos de 100 kg de fertilizante no puede ser superior
a 4 kg2 . Se seleccionaron 16 sacos de 100 kg y se obtuvo una varianza muestral igual a 4:9 kg2 :
Se supone que el peso de las impurezas en cada saco tiene distribución normal, y se pretende usar
nivel = 0:05
En este caso las v.a. son X1 ; X2 ; :::; X16 donde Xi es el peso de las impurezas del i-ésimo saco
de la muestra y sabemos que Xi s N ( ; 2 )
Se de…nen las hipótesis: H0 : 2 = 4 vs HA : 2 > 4
Para elegir el estadístico de prueba que cumpla todas las condiciones, y sea función del valor
de 2 cuando H0 es verdadera, recordamos la distribución Chi-cuadrado que vimos en el capítulo
anterior. El estadístico de prueba es:

15 S2 2
U= s (15) si H0 es verdadera
4
de…nimos la regla de decisión como:

rechazo H0 si u = 15 s2 =4 > 22:307

ya que si desamos un nivel = 0:05, entonces 2(15)0:05 = 24:996


Luego, reemplazando s2 = 4:9 obtenemos u = 18:375, este valor no es mayor que 24:996,
entonces no se puede a…rmar que 2 > 4, con = 0:05
Esto signi…ca que no hay evidencia su…ciente para a…rmar que la varianza del peso de las
impurezas es superior a la norma, con = 0:05
Podemos resumir el caso de test para la varianza de una distribución normal
X1 ; X2 ; :::; Xn m.a. donde cada Xi s N ( ; 2 )
Hipótesis nula: H0 : 2 = 20
Estadístico de prueba: U = (n 1)S 2 = 20 s 2(n 1) si H0 es verdadera
Valor del estadístico de prueba: u = (n 1)s2 = 20
Hipótesis alternativa Región de rechazo para un nivel
HA : 2 2
> 0 u> 2
HA : 2 2
< 0 u < 21
HA : 2 6= 20 u > 2 =2 o u < 21 =2

67
Test de nivel de signi…cación para la media de una distribución desconocida
Ejemplo: Grand Junction Vegetables es un fabricante de una amplia variedad de verduras conge-
ladas. El presidente de la empresa le interesa saber si las ventas semanales de las bolsas de brócoli
congelado de 16 onzas han aumentado. El año pasado, se ha vendido una media semanal de 2500
bolsas. Se ha obtenido una muestra aleatoria de datos de ventas semanales de 134 tiendas para
realizar el estudio y se observó que la media muestral fue 3293 y la desviación típica muestral fue
4719.
En este caso las v.a. X1 ; X2 ; :::; X134 donde Xi representa la venta semanal de bolsas de brócoli
congelado en la i-ésima tienda de la muestra. Suponemos que estas v.a. tienen media y varianza,
que denominamos y 2 respectivamente, pero nada hace suponer que la distribución de estas v.a.
sea normal.
Se de…nen las hipótesis: H0 : = 2500 vs HA : > 2500
No conocemos la distribución de las Xi ; pero con n = 134 podemos aplicar TCL y usar el
estadístico de prueba: p
Z = 134 X 2500 =S
aceptando que su distribución es aproximadamente N (0; 1) si H0 es verdadera.
De…nimos la regla de decisión:
p
134(x 2500)
rechazo H0 si z = > 1:645
s
de este modo el test tiene nivel de signi…cación aproximado 0:05, ya que usamos el valor crítico
z0:05 = 1:645
Por último, reemplazamos x = 3293 y s = 4719 y obtenemos z = 1:95 que cae en la zona de
rechazo y podemos rechazar H0 con nivel = 0:05 y, en consecunecia, a…rmar con ese nivel de
signi…cación, que las ventas semanales han aumentado.
También podríamos calcular el valor-p (aproximado) = P (Z > 1:95) ' 1 (1:95) = 1
0:9744 = 0:0256 esto signi…ca que se puede rechazar H0 aún con nivel = 0:0256
Podemos resumir el caso de test para la media de una distribución desconocida
X1 ; X2 ; :::; Xn m.a. proviene de una distribución desconocida, pero n es grande:
Hipótesis nula: H0 : = 0
p
Estadístico de prueba: Z = n X =S se aproxima N (0; 1) si H0 es verdadera
p0
Valor del estadístico de prueba: z = n (x 0 ) =s
Hipótesis alternativa Región de rechazo para un nivel (aproximado)
HA : > 0 z>z
HA : < 0 z< z
HA : 6= 0 z > z =2 o z < z =2

Test para una proporción


Ejemplo: En una muestra aleatoria de 361 propietarios de pequeñas empresas que se habían
declarado en quiebra, 105 declararon que no habían hecho ningún estudio de mercado antes de
abrir el negocio. Se desea veri…car, al nivel = 0:05; la hipótesis de que más del 25% de todos los
miembros de esta población no realizó estudios de mercado antes de abrir el negocio.
Interesa hacer inferencias sobre la proporción de propietarios de pymes que no realizaron estudio
de mercado antes de instalar su negocio, dentro de las pymes que van a la quiebra. Para ello se
estudió una muestra de 361 de estas pymes y la variable aleatoria que se usa en este caso es X = "el
no de propietarios en la muestra de 361 pymes que fueron a la quiebra, que no realizaron estudio de

68
mercado antes de instalar su negocio". Esta v.a. tiene distribución binomial X s B(361; p) donde
p es la verdadera proporción poblacional sobre la que estamos interesados.
Las hipótesis son: H0 : p = 0:25 vs HA : p > 0:25
Como n = 361 podemos aplicar TCL y usar el estadístico de prueba:
p p
Z = 361(b p 0:25)= 0:25(1 0:25)

aceptando que, cuando H0 es verdadera, su distribución es aproximadamente N (0; 1):


De…nimos la regla de decisión
p p
rechazo H0 si z = 361(b p 0:25)= 0:25(1 0:25) > 1:645

Luego, reemplazando con pb = 105=361 = 0:2909 y obtenemos z = 1:7947 este valor cae en la
zona de rechazo, luego podemos a…rmar, con nivel = 0:05, que más del 25% de los propietarios
de pymes que fracasaron en su negocio, no realizan estudios de mercado, antes de instalarlo.
También se podría calcular el valor-p (aproximado) = P (Z > 1:7947) ' 1 (1:79) = 1
0:9633 = 0:0367
Resumiendo el caso para test para una proporción
X s B(n; p) y n es grande
Hipótesis nula: H0 : p = p0 p
p
Estadístico de prueba Z = n(b p p0 )= p0 (1 pp 0 ) se aproxima N (0; 1) si H0 es verdadera
p
Valor del estadístico de prueba: z = n(bp p0 )= p0 (1 p0 )
Hipótesis alternativa Región de rechazo para un nivel (aproximado)
HA : p > p 0 z>z
HA : p < p 0 z< z
HA : p 6= p0 z > z =2 o z < z =2

69
Capítulo 8: Intervalos de con…anza y Test de Hipótesis para dos
muestras

En los capítulos anteriores vimos como estimar el parámetro de una población y realizar tests
para comparar dicho parámetro con un valor …jo 0 . Sin embargo, en la mayoría de las aplicaciones,
interesa comparar dos poblaciones. Los procedimientos para construir intervalos de con…anza para
la diferencia de medias y realizar test para comparación de medias, son similares a los que vimos
antes. Lo principal es encontrar la función pivote y el estadístico de prueba adecuado para cada
situación.

Intervalos de Con…anza y Test de Hipótesis para comparación de medias de dos


poblaciones normales con varianzas conocidas.
Sean X1 ; X2 ; :::; Xn1 una muestra aleatoria de una distribución N( 1 ; 21 ) y Y1 ; Y2 ; :::Yn2 una muestra
aleatoria de una distribución N( 2 ; 22 ) e independientes entre si.
Un estimador para 1 2 es X Y y sabemos que X Y tiene distribución N( 1 2 ;
2 =n + 2 =n ), entonces si deseamos construir un intervalo de con…anza para , la función
1 1 2 2 1 2
pivote será:
X Y ( 1 2)
q 2 2
s N(0; 1)
n1 + n2
1 2

Entonces el intervalo de con…anza para 1 2 será:


0 s s 1
2 2 2 2
1 2 1 2A
IC(1 )( 1 2) = @X Y z =2 + ;X Y +z =2 +
n1 n2 n1 n2

Si deseamos contrastar una hipótesis sobre 1 2 , donde H0 : 1 2 = 0 el estadístico de


prueba será:
X Y 0
q 2 2
s N(0; 1) cuando H0 es verdadera
1
n1 + 2
n2

el resumen para los tests de hipótesis para 1 2 será:


Hipótesis nula: H0 : 1 2 = 0 p
Estadístico de prueba Z = (X Y 2 =n + 2 =m s N (0; 1) si H es verdadera
0 )= 1 p 2 0
Valor de estadístico de prueba: z = (x y 2 2
0 )= 1 =n + 2 =m
Hipótesis alternativa Región de rechazo para un nivel
HA : 1 2 > 0 z>z
HA : 1 2 < 0 z< z
HA : 1 2 =
6 0 z > z =2 o z < z =2

Analicemos un ejemplo: Se realizaron pruebas para determinar la resistencia a la cedencia


de dos tipos de acero. Un análisis de una muestra aleatoria compuesta de 20 especímenes de
acero laminado en frío dio por resultado una resistencia promedio muestral de 29:8 klb/pulg2 . Una
segunda muestra aleatoria de 25 especímenes de acero galvanizado dio una resistencia promedio
muestral de 33:7 klb/pulg2 . Suponiendo que las dos distribuciones de resistencia a la cedencia son

70
normales con 1 = 4:0 y 2 = 5:0 , ¿indican los datos que las resistencias a la cedencia medias
verdaderas son diferentes?
Para modelizar este problema consideremos X1 ; X2 ; :::; X20 y Y1 ; Y2 ; :::Y25 , donde Xi es la re-
sistenceia del especimen i del acero laminado en frio y Yj es la resistencia del especimen j del
acero galvanizado, estas son muestras aleatorias independientes, y sabemos que Xi s N ( 1 ; 42 ) y
42 52
Yj s N ( 2 ; 52 ) =) X Y s N 1 1 ; 20 + 25
Las hipótesis son: H0 : 1 = 2 o 1 2 = 0 vs HA : 1 6= 2 o 1 2 6= 0
El estadístico de prueba:

X Y 0
Z= q s N (0; 1) si H0 es verdadera
42 52
20 + 25

En este ejemplo no se aclara el nivel de signi…cación, y lo resolveremos usando el valor-p, de


todos modos si planteáramos un test con nivel ; como se trata de un test bilateral, la regla de
decisión sería:
jx yj
rechazo H0 si jzj = q > z =2
16 25
20 + 25

reemplazando con x = 29:8 y y = 33:7 se obtiene z = 2:91. Calculamos:

valor-p = P (jZj > j 2:91j) = 1 P ( 2:91 < Z < 2:91) = 0:0036

Con un valor-p tan pequeño tenemos muy fuerte evidencia para a…rmar que la resistencia
media de ambos tipos de acero es diferente, ya que podemos hacer esta a…rmación aún con nivel
de signi…cación 0:0036.
Si se desea usar un nivel de signi…cación ; se rechaza H0 cuando el valor-p < ;. Como el nivel
de signi…cación más usado es = 0:05; en general se rechaza H0 cuando el valor-p < 0:05

Test para comparación de medias de dos poblaciones normales con igual varianza
Supongamos que tenemos dos muestras con distribución normal con igual varianza, aunque se
desconoce el valor de esa varianza, es decir: X1 ; X2 ; :::; Xn una m. a. de una distribución N( 1 ; 2 )
y Y1 ; Y2 ; :::Ym una m. a. de una distribución N( 2 ; 2 ) independientes. En ese caso:

2 2 X Y ( 1 2)
X Y sN 1 2; =n + =m =) p s N (0; 1)
2 (1=n + 1=m)

Pero 2 es desconocida, para estimarla podríamos usar cualquiera de las dos muestras
Pn Pn
2 i=1 (Xi X)2 2 (Yi Y )2
S1 = o S2 = i=1
n 1 m 1
pero se puede demostrar que combinando estos dos estimadores, también se obtiene un estimador
insesgado para 2
(n 1) S12 + (m 1) S22
Sp2 =
n+m 2
Entonces la función pivote que usaremos para construir un intervalo de con…anza para la difer-
encia de medias es
X Y ( 1 2)
p s T(n+m 2)
Sp 1=n + 1=m

71
Entonces el intervalo de con…anza para 1 2 será:
p p
IC(1 )( 1 2) = X Y t =2;n+m 2 Sp 1=n + 1=m ; X Y +t =2;n+m 2 Sp 1=n + 1=m

Si se desea contrastar la hipótesis nula es 1 2 = 0, la función pivote que deberemos usar


es:
X Y 0
p s T(n+m 2) si H0 es verdadera
Sp 1=n + 1=m

Veamos un ejemplo: Una organización de investigación de mercados selecciona varios modelos


de automóviles cada año y evalúa su e…ciencia en el consumo de combustible. Este año, en el análisis
de dos modelos subcompactos similares de dos fabricantes distintos, el millaje promedio de 12 autos
de la marca A fue 25:2 millas por galón, y la desviación estándar fue 3:8 mpg. Los 9 autos de la
marca B que se probaron promediaron 32:1 mpg con desviación estándar de 4:3 mpg. Suponga
que el no de millas por galón en ambos modelo tiene distribución normal, y que la varianza es la
misma. Para = 0:01, ¿se puede concluir que marca la marca B rinde en promedio 2 mpg más
que la marca A?

Modelizando: X1 ; X2 ; :::; X12 y Y1 ; Y2 ; :::Y9 son dos muestras aleatorias independientes, donde
Xi es el millaje del auto i de la marca A y Yj es el millaje del auto j de la marca B sabemos que
Xi s N ( 1 ; 2 ) y Yj s N ( 2 ; 2 )
Las hipótesis son: H0 : 2 1 = 2 vs HA : 2 1 >2
El estadístico de prueba:
Y X 2
T = q s T(12+9 2) si H0 es verdadera
1 1
Sp 12 + 9

regla de decisión:
y x 2
rechazo H0 si t = q > t0:01 = 2:539
1 1
sp 12 + 9
4;9
Calculando sp = 4:0181 y reemplazando con x = 25:2, y = 32:1 y sp . Se obtiene t = 1:7718 = 2:77
como ese valor > 2:539 se rechaza Ho . Se puede a…rmar con nivel de signi…cación 0:01 que el millaje
promedio de la marca B supera al de la marca A en más de 2 mpg
Se puede acotar el valor-p: 0:005 < valor p < 0:01
Resumiendo el caso de comparación de medias de distribuciones normales, con igual varianza
X1 ; X2 ; :::; Xn una m. a. de una distribución N( 1 ; 2 ) y Y1 ; Y2 ; :::Ym una m. a. de una
distribución N( 2 ; 2 ) independientes

Hipótesis nula: H0 : 1 2 = 0 p
Estadístico de prueba T = (X Y 0 )=S
qp 1=n2+ 1=m s T(n+m 2) si H0 es verdadera
(n 1)Sx +(m 1)Sy2
donde: Sp = n+mp2
Valor de estadístico de prueba: t = (x y 0 )=sp 1=n + 1=m
Hipótesis alternativa Región de rechazo para un nivel
HA : 1 2 > 0 t > t ;n+m 2
HA : 1 2 < 0 t < t ;n+m 2
HA : 1 2 =
6 0 t > t =2;n+m 2 o t < t =2;n+m 2

72
Intervalos y Test para comparación de medias de muestras apareadas
Consideremos el siguiente ejemplo: Un banco recurre a dos empresas, A y B para valuar las
propiedades de bienes raíces sobre las cuales se hacen los préstamos. Es importante que estas dos
empresas tengan valores similares en sus avalúos. Para revisar la consistencia de las dos empresas
de avalúos, se seleccionan en forma aleatoria 10 casas y se pide a las empresa A y B que valúen las
casas seleccionadas. Los resultados en miles de dólares son:
Casa 1 2 3 4 5 6 7 8 9 10
A 235 210 228 242 205 230 231 210 225 249
B 228 205 219 240 198 223 227 215 222 245
Para cada casa hay dos valuaciones, entonces podemos modelizar de la siguiente forma: (X1 ; Y1 ) ;
(X2 ; Y2 ) ; :::; (Xn ; Yn ) ; donde cada Xi representa la valuación de la i-ésima casa de la muestra
realizada por la empresa A, y cada Yi representa la valuación de la misma casa realizada por la
empresa B. En este caso no trabajamos con dos muestras independientes, sino con una muestra de
pares de variables. Nos interesa la diferencia entre las dos evaluaciones, entonces es natural de…nir
las v.a. Di = Xi Yi , si podemos suponer que estas v.a. tinenen distribución normal, trabajamos
con la muestra aleatoria D1 ; D2 ; :::; Dn , donde Di s N D ; 2D :
Las hipótesis que debemos testear son: H0 : D = 0 vs HA : D 6= 0
El problema se reduce al de una muestra, el estadístico de prueba es:
p
10(D 0)
T = s T(9) si H0 es verdadera
SD
donde P P
Di Di D
D= SD =
n n 1
y si elegimos un nivel de signi…cación = 0; 05 la regla de decisión será:
p
10 d 0
rechazo H0 si jtj = > t0:025;9 = 2:262
sD
Al calcular las diferencias, obtenemos:
Casa 1 2 3 4 5 6 7 8 9 10
A 235 210 228 242 205 230 231 210 225 249
B 228 205 219 240 198 223 227 215 222 245
Dif 7 5 9 2 7 7 4 5 3 4
p
y luego: d = 4:3 y sD = 3:91, …nalmente el valor del estadístico de prueba es: t = 10
3:91
4:3
=
3:478, como j3:478j > 2:262 se rechaza H0 con nivel = 0:05: En conclusión se puede a…rmar que
las dos empresas di…eren en sus avalúos.
Resumieno este caso de comparación de medias con muestras pareadas (X1 ; Y1 ); (X2 ; Y2 ); :::; (Xn ; Yn );
donde de…nimos Di = Xi Yi , y podemos suponer que estas Di constituyen una muestra aleatoria
de una distribución N( D ; 2D ), entonces
Hipótesis nula: H0 : D = 0
p
Estadístico de prueba: T = n(D )=Sd s T(n 1) si H0 es verdadera
p 0
Valor de estadístico de prueba: t = n(d 0 )=sd
Hipótesis alternativa Región de rechazo para un nivel
HA : D > 0 t>t
HA : D < 0 t< t
HA : D 6= 0 t > t =2 o t < t =2

73
Si quisiéramos construir un intervalo de con…anza para D, la función pivote es:
p
10(D D)
T = s T(n 1)
SD
y el intervalo de con…anza es:
t =2;n 1 SD t =2;n 1 SD
IC(1 ) ( D) = D p ; D+ p
n n

Test para comparación de varianzas de dos poblaciones normales


Hasta aquí hemos visto métodos para comparar medias, pero en algunos casos interesa comparar
las varianzas de dos poblaciones con distribución normal. Para eso tenemos que de…nir primero la
distribución de Fisher:
Si tenemos dos muestras aleatorias: X1 ; X2 ; :::; Xn de una distribución N( 1 ; 21 ) y Y1 ; Y2 ; :::Ym
de una distribución N( 2 ; 22 ) independientes, se puede demostrar que

Sx2 = 2
1 Sx2 2
2
2 = 2
Sy2 = 2 Sy2 1

tiene distribución de Fisher con n 1 gl del numerador y m 1 gl del denominador F(n 1;m 1) .
Esta distribución es asimétrica, toma solamente valores positivos y la forma depende de esos dos
parámetros gl, en la siguiente grá…ca se muestran algunas densidades de Fisher

Se de…ne el valor crítico como:

74
Valor crítico para una F(n;m) : Si V tiene distribución Fisher con n y m grados de libertad
y , es un número real entre 0 y 1, el valor crítico correspondiente a , es el valor F ;m;n tal que
P (V > F ;n;m ) = .

Veamos un ejemplo: Se sabe que el gasto anual medio en reparaciones de un automóvil


depende de la antigüedad del automóvil. Un investigador desea saber si la varianza de los gastos
anuales que se hacen en reparación también aumenta con la antigüedad del automóvil. En una
muestra de 21 automóviles de 4 años de antigüedad la desviación estándar muestral en los gastos
anuales en reparación fue $170 y en una muestra de 25 automóviles de 2 años de antigüedad la
desviación estándar muestral en los gastos anuales en reparación fue $100.
Modelizando tenemos dos muestras aleatorias independientes: X1 ; X2 ; :::; X21 y Y1 ; Y2 ; :::Y25 con
Xi s N( 1 ; 21 ) y Yj s N( 2 ; 22 ): Donde Xi representa el gasto anual en reparaciones del i-ésimo
automovil de la muestra de 4 años de antigüedad y Yj el gasto anual del i-ésimo automovil de 2
años de antigüedad
Las hipótesis son: H0 : 21 = 22 vs. HA : 21 > 22
Si H0 es verdadera 21 = 22 = 1 entonces el estadístico de prueba será:

Sx2
V = s F(20;24) si H0 es verdadera
Sy2

y la regla de decisión será:

Sx2
rechazo H0 si V = > F0:05;20;24 = 2:03
Sy2

reemplazando los estimadores por las estimaciones s2x = 1702 y s2y = 1002 , se obtiene: v = 2:89 >
2:03: Entonces se puede rechazar H0 con nivel = 0:05
Resumiendo el caso para comparación de varianzas de dos muestras independientes con dis-
tribución normal
X1 ; X2 ; :::; Xn una m. a. de una distribución N( 1 ; 21 ) y Y1 ; Y2 ; :::Ym una m. a. de una
distribución N( 2 ; 22 )
Hipótesis nula: H0 : 21 = 22
Estadístico de prueba: F = S12 =S22 s F(n 1);(m 1) si H0 es verdadera
Valor de estadístico de prueba: f = s21 =s22
Hipótesis alternativa Región de rechazo para un nivel
2
HA : 1 > 2 2 f > F ;n 1;m 1
HA : 21 < 22 f < F1 ;n;m 1
HA : 21 6= 22 f > F =2;n 1;m 1 o f < F1 =2;n 1;m 1

75
Observación:
La distribución de Fisher tiene la siguiente propiedad:
1
F1 ;n;m =
F ;m;n

esto nos permite calcular, por ejemplo, el valor crítico correspondiente a 0:95, para una Fisher con
n = 15 y m = 20 gl, buscando en la tabla el valor crítico correspondiente a 0:05 para una Fisher
con m = 20 y n = 15 gl y calculando la inversa de ese valor:
1 1
F0:95;15;20 = = = 0:43
F0:05;20;15 2:33

Test de hipótesis para comparación de medias de poblaciones con distribución


desconocida y muestras grandes
Sean X1 ; X2 ; :::; Xn1 e Y1 ; Y2 ; :::Yn2 dos muestras independientes con n y m grandes. E(Xi ) = 1 ,
V (Xi ) = 21 E(Yi ) = 2 y V (Yi ) = 22 , si n y m son grandes podemos aplicar el TCL y resumiendo:
Hipótesis nula: H0 : 1 2 = 0 p
Estadístico de prueba Z = (X Y 2 2
0 )= S1 =n +pS2 =m se aproxima a N (0; 1) si H0 es verdadera
Valor de estadístico de prueba: z = ( x y 2 2
0 )= s1 =n + s2 =m
Hipótesis alternativa Región de rechazo para un nivel aproximado
HA : 1 2 > 0 z>z
HA : 1 2 < 0 z< z
HA : 1 2 =
6 0 z > z =2 o z < z =2

Un intervalo de con…anza es:


0 s s 1
S12 S22 2
1
2
2A
IC(1 )( 1 2) = @X Y z =2 + ;X Y +z =2 +
n1 n2 n1 n2

Test para comparación de medias. Muestras pareadas con distribución descono-


cida y n grande.
Sean (X1 ; Y1 ); (X2 ; Y2 ); :::; (Xn ; Yn ); de…niendo Di = Xi Yi , estas Di constituyen una muestra
aleatoria con media D = X 2
Y y varianza D ; si n es grande puede aplicarse TCL y resumiendo:
Hipótesis nula: H0 : D = 0
p
Estadístico de prueba: Z = n(D )=SD se aproxima a N (0; 1) si H0 es verdadera
p0
Valor de estadístico de prueba: z = n(d 0 )=sD
Hipótesis alternativa Región de rechazo para un nivel
HA : D > 0 z>z
HA : D < 0 z< z
HA : D 6= 0 z > z =2 o z < z =2
Un intervalo de con…anza es:
z =2 SD z =2 SD
IC(1 ) ( D) = D p ; D+ p
n n

76
Test para diferencia de proporciones
Sean X s B(n; p1 ) y Y s B(m; p2 ) independientes con n y m grandes, si queremos testear las
hipótesis H0 : p1 = p2 vs H0 : p1 > p2
Parece natural basar la decisión en pb1 pb2 : Sabemos que

E (b
p1 pb2 ) = p1 p2
p1 (1 p1 ) p2 (1 p2 )
V (b
p1 pb2 ) = +
n m
y si H0 es verdadera p1 = p2 podemos llamarlos p y entonces

E (b
p1 pb2 ) = 0
1 1
V (b
p1 pb2 ) = p(1 p) +
n m

Estamos suponiendo que n y m son valores grandes, podemos usar TCL.y entonces
pb1 pb2
q se aproxima a N (0; 1) si p1 = p2
1 1
p(1 p) n + m

También se puede demostrar que si en el denominador resmplazamos el parámetro p, por el


estimador
X +Y
pb =
n+m
también vale la aproximación a una N (0; 1): Entonces usaremos como estadístico de prueba:

pb1 pb2
Z=q se aproxima a N (0; 1) si H0 es verdadera
1 1
pb(1 pb) n + m

y la regla de decisión será:


pb1 pb2
rechazo H0 si Z = q >z
1 1
pb(1 pb) n + m

Ejemplo:
La CD de un equipo de futbol debe decidir si cambia el actual delantero, por otro de una división
inferior. Entre otros indicadores, evaluarán la efectividad en los tiros libres desde que juega en el
club. Los datos son los siguientes:

Jugador
Nuevo Viejo
Goles realizados 35 330
Total de tiros libres 46 480

¿Hay evidencia, con nivel = 0:05; de que el nuevo es mejor que el viejo?

Sea X=no de goles realizados por el nuevo jugador entre los 46 tiros libres X s B(46; p1 )
Sea Y= no de goles realizados por el jugador viejo entre los 480 tiros libres Y s B(480; p2 )
LAs hipótesis que se desea testear son:
H0 : p1 = p2 vs H0 : p1 > p2

77
Como 46 y 480 son valores grandes, usaremos el estadístico de prueba:
p
Z = (bp1 pb2 )= pb(1 pb)(1=46 + 1=480) se aproxima a N (0; 1) si H0 es verdadera

y la regla de decisión
p
rechazo H0 si z = (b
p1 pb2 )= pb(1 pb)(1=46 + 1=480) > z0:05 = 1; 645

calculando pb1 = 35=46 = 0:7609, pb2 = 330=480 = 0:6875; pb = (35 + 330)=(46 + 480) = 0:6939 y
z = 1:031 como este valor no es mayor que 1:645, no se rechaza H0 , y la conclusión sería que con
estos datos no tenemos evidencia su…ciente para a…rmar que el nuevo jugador es mejor que el viejo,
con nivel aproximadamente 0:05.
Finalmente se optó por no reemplazar al viejo. El nuevo se va del club, después de un tiempo
se mide la efectividad en el nuevo club, resultando en gol 350 de los 460 tiros libres pateados, si
hubiese que decidir ahora, ¿cambiaría la conclusión respecto de la anterior?
Con estos valores pb1 y pb2 son exactamente los mismos que antes, sin embargo, ahora n = 460 en
lugar de 46, y esto cambia dramáticamente el resultado. El valor del estadístico de prueba ahora
sería: z = 2:514 que es superior al valor crítico, entonces con esta información se puede a…rmar que
el nuevo jugador es mejor que el viejo, con nivel aproximadamente 0:05.

78
Capítulo 9: Correlación y Modelo de Regresión Lineal
Correlación.
En algunos problemas se presentan dos variables aleatorias X e Y , que pueden estar relacionadas
entre si. El coe…ciente de correlación ( ), mide la relación lineal existente entre las dos variables
aleatorias. Sabemos que 1 1.
Un valor = 1, signi…ca que existe una relación lineal perfecta entre las dos variables, Y =
aX + b con a > 0 si = 1 y a < 0 si = 1
Un valor = 0, signi…ca que no existe relación lineal entre X e Y
Entonces un valor > 0 signi…ca que hay una relación positiva entre X e Y , que es más fuerte
cuando está más cerca de 1. Análogamente un valor de negativo indica una relación negativa
entre X e Y
Si tomamos una muestra apareada (X1 ; Y1 ) ; (X2 ; Y2 ) ; ::: (Xn ; Yn )
El coe…ciente de correlación muestral
P
SXY Xi X Yi Y
R= p = qP
SXX SY Y 2P 2
Xi X Yi Y
es un estimador del coe…ciente de correlación poblacional
Reemplazando las v.a. por los valores observados, tenemos
P
Sxy (xi x) (yi y)
r=p = qP P
Sxx Syy (xi x)2 (yi y)2
que es una estimación del coe…ciente de correlación poblacional

Ejemplo: El profesor de un curso de estadística tomó un examen …nal y también pidió a los
estudiantes que realizaran un proyecto. La tabla adjunta muestra las cali…caciones de una muestra
aleatoria de 10 estudiantes.
Examen 81 62 74 78 93 69 72 83 90 84
Proyecto 76 71 69 76 87 62 80 75 92 79
Gra…cando los puntos tenemos:
90
85
pro y ecto

80
75
70
65

65 70 75 80 85 90

e xamen

79
El resumen de estos datos es: sxx = 824:4, sxy = 575:8, syy = 668:1
El coe…ciente de correlación muestral es:
sxy 575:8
r=p =p = 0:7756
sxx syy 824:4 668:1

Modelo de regresión lineal


En el caso anterior estudiamos la relación entre dos variables aleatorias. Ahora vamos a estudiar
la relación entre dos variables, pero una de ellas (x) no es aleatoria, y la otra variable (Y ) depende
de la primera, pero en forma no determinística.
En general, se toman diferentes valores xi de la primera variable, y se miden las respuestas yi
Se obtienen un conjunto de observaciones (x1 ; y1 ); (x2 ; y2 ); :::; (xn ; yn ). El modelo de regresión
lineal simple asume que las yi son valores observados de variables aleatorias Yi relacionadas con
las xi , (no son v.a. aleatorias) de la siguiente forma:

Yi = 0 + 1 xi + i

donde 0 y 1 son parámetros …jos y los i son variables aleatorias independientes entre si, que
cumplen
2
E( i ) = 0 ; var( i ) =
Esto signi…ca que para cada valor de la variable independiente o explicativa xi , la variable
dependiente o variable respuesta Yi ; es una variable aleatoria independiente de las otras Yj , que
veri…ca:
E(Yi ) = 0 + 1 xi ; var(Yi ) = 2 :
Conocer los valores de los parámteroas 0 y 1; nos permitiría conocer la distribución de la
variable Y , para determinado valor de x.

Ejemplo: Suponga que el director del Departamento de Salubridad está interesado en la


relación que existe entre la antigüedad de un camión de basura y los gastos anuales de reparación
que debe esperar. Con el …n de determinar esta relación, el director ha reunido información de siete
de los camiones de basura de la ciudad. La información se presenta en la tabla, la antigüedad está
expresada en años y los gastos de reparaciones durante el último año expresados en miles de pesos.

antigüedad del camión 6 1 4 5 5 2 2


gastos en reparación 7.9 4.2 6.0 7.1 7.9 4.6 5.9

Lo primero que se debe hacer es gra…car estos valores.

80
8
7
Gastos

6
5
4

1 2 3 4 5 6

Años

En este caso se observa una relación aproximadamente lineal, y podemos asumir que es válido
el modelo de regresión lineal que vincula los gastos en reparaciones, con la antigüedad del camión.
Si llamamos xi a la antigüedad del camión i, y llamamos Yi al gasto en reparaciones de un camión
de esa antigüedad. Podemos escribir

Yi = 0 + 1 xi + i

con las hipótesis antes enunciadas.


Entonces nos interesa conocer cuáles son los valores de esos parámetros 0 y 1 , eso nos permitirá
estimar el gasto medio en reparaciones de un camión si conocemos su antigüedad.

Estimación de los parámetros 0 y 1

Para estimar los parámetros 0 y 1 se utiliza el método de mínimos cuadrados.


Usaremos la siguiente notación:
b es la estimación de b bi = b 0 + b 1 xi es el valor sobre la recta
0 0 , 1 es la estimación de 1 e y
estimada correspondiente a xi
Se de…nen los residuos como:

ri = y i ybi = yi b + b xi
0 1

Los residuos muestran la discrepancia entre los valores observados yi y los correspondientes va-
lores estimados ybi . Parece lógico pretender que esos residuos sean mínimos. No podemos minimizar
cada residuo por separado, pero podemos minimizarlos de manera global, minimizando la suma de
los residuos al cuadrado (Srr ).
n
X n
X 2
Srr = ri2 = yi b + b xi
0 1 = h( b 0 ; b 1 )
i=1 i=1

81
Entonces el método consiste en hallar la recta que minimice dicha suma. Ahora bien, determinar
la recta equivale a determinar su pendiente ( b 1 ) y su ordenada al origen ( b 0 ). Es decir debemos
hallar los valores b 0 ; b 1 que hagan mínima Srr = h( b 0 ; b 1 )
Calculando las derivadas parciales de h( b 0 ; b 1 ) respecto de b 0 y de b 1 , e igualando ambas a
cero, se obtiene un sistema de dos ecuaciones, al resolver el mismo se llega a la siguiente solución:

b = Sxy ; b =y xb1
1 0
Sxx
donde:
Pn Pn
i=1 xi i=1 yi
x = ; y=
n n
n
X X n
Sxx = (xi x)2 ; Sxy = (xi x) (yi y) ;
i=1 i=1

La recta obtenida yb = b 0 + b 1 x se llama recta de regresión estimada de y en x:


Calculando con los datos del ejemplo, se obtiene: x = 3:57; y = 6:23

Sxx = 21:71429 Sxy = 15:88571 Syy = 13:27429

con estos valores podemos estimar los parámetros de la recta:


b = 0:7316 b = 3:6158
1 0

La recta estimada será:


yb = 3:6158 + 0:7316x
8
7
Gastos

6
5
4

1 2 3 4 5 6

Años

82
Estimación de la varianza 2

La varianza 2 mide la variabilidad inherente al modelo de regresión. Una estimación de 2 se


basará en cuánto se desvían las observaciones de la recta estimada. Entonces la varianza 2 se
estima con s2r de…nido como
Srr
s2r =
n 2
Una manera simple de calcular Srr es la siguiente:
n 2
X Sxy
Srr = ri2 = Syy
Sxx
i=1

donde
n
X
Syy = (yi y)2
i=1

En nuestro ejemplo:
15:885712
Srr = 13:27429 = 1:6526
21:71429
1:6526
s2r = = 0:3305
7 2

Coe…ciente de determinación
El ajuste del modelo no es perfecto, y una medida de la bondad de ese ajuste es el coe…ciente de
determinación
Srr Syy Srr
r2 = 1 =
Syy Syy
y puede expresarse como la proporción de la variabilidad total que es explicada por el modelo.

Para nuestro ejemplo el coe…ciente de determinación es:


Srr 1:6526
r2 = 1 =1 = 0:8755
Syy 13:27429

Esto signi…ca que el 87:55% de la variabilidad en los costos de reparación de un camión, puede
explicarse por este modelo de regresión que vincula dicho costo con la antigüedad.
Con la recta se puede, por ejemplo, estimar los gastos en reparaciones de un camión que tenga
3 años de antigüedad. Para un valor x = 3, según el modelo, la E(Y ) = 0 + 1 3, para estimar esa
esperanza usamos:
yb = b 0 + b 1 3 = 3:6158 + 0:7316 3 = 5:8106
esto signi…ca que se puede esperar un costo de $5810; 6 en reparaciones para un camión que tenga
3 años de antigüedad (recordar que los gastos estabn expresados en miles de pesos).

83
Intervalos de con…anza y test para lo parámetros.
En la sección anterior utilizamos el método de mínimos cuadrados para encontrar estimaciones de
los parámetros 0 y 1 , que son funciones de las observaciones xi e yi . Los valores xi se supone
que son elegidos antes de realizar el experimento y no son aleatorios, en cambio las yi son valores
observados de las respectivas variables aleatorias Yi :
Reemplazando en las ecuaciones anteriores, los valores yi por las variables aleatorias Yi ; se
obtienen estimadores de 0 y 1 .
De…nición: Los estimadores de mínimos cuadrados de los parámetros 0 y 1; están dados
por:
Pn
S xY (xi x) Yi Y
b =
1 = i=1Pn ;
Sxx i=1 (xi x)2
b = Y xb
0 1

Se puede probar que los estimadores de mínimos cuadrados b 0 y b 1 son insesgados, esto quiere
decir que:
E( b ) = ; E( b ) =
0 0 1 1

y también puede probarse que:

2 1 x2 2
var( b 0 ) = + ; var( b 1 ) = ;
n Sxx Sxx
Bajo las suposiciones del modelo anterior estas son las propiedades de estos estimadores.

Si podemos suponer que los i tienen distribución normal, es decir que el modelo ahora sería:

Yi = 0 + 1 xi + i

donde
2
i s N(0; ) e independientes
Entonces, también las variables aleatorias Yi tienen distribución normal, y:
b b
T0 = q0 0
y T1 = 1
p 1
sr 1
+ x2 sr = Sxx
n Sxx

son funciones de la muestra y tiene distribución de Student con n 2 grados de libertad. Estas
funciones pivote nos sirven para construir intervalos de con…anza para 0 y 1 respectivamente,
con el mismo procedimiento que ya usamos anteriormente.
A partir de T0 ; planteamos
0 1
b
P @ t =2;n 2 q0 0
t =2;n 2 A = 1
1 x2
sr n + Sxx

y …nalmente se llega al intervalo


0 s s 1
@b0 1 x2 1 x2
t =2;n 2 sr + ; b0 + t =2;n 2 sr + A
n Sxx n Sxx

84
A partir de T1 , planteamos
!
b
1 1
P t =2;n 2 p t =2;n 2 =1
sr = Sxx

y …nalmente se llega al intervalo


p p
b t =2;n 2 sr = Sxx ; b 1 + t =2;n 2 sr = Sxx
1

q
2
La longitud del intervalo para 0 es 2t =2 sr n1 + Sxxx ; de modo que si x es relativamente
grande, la estimación de 0 será poco precisa. Generalmente la estimación de 0 no es tan
importante como la de 1 :
p
La longitud del intervalo para 1 es 2t =2 sr = Sxx ; de modo que la precisión de la estimación
para 1 , puede mejorarse eligiendo los valores de las xi más dispersas para que Sxx sea más
grande.

Con los datos del ejemplo podemos construir un intervalo de con…anza para la pendiente de
nivel 0:95 p
Ya vimos que b 1 = 0:7316 y sr = 0:3305, además el valor crítico para 5 grados de libertad es
t0:025;5 = 2:571, entonces un intervalo de 95% con…anza para la pendiente es:

(0:7316 2:571 0:5749=4:6599 ; 0:7316 + 2:571 0:5749=4:6599) = (0:4144 , 1:0488)

Recordando que los costos estaban expresados en miles de $, podemos a…rmar con 95% de
con…anza, que por cada año de antigüedad el costo por reparación se incrementa, en media, en un
valor que está entre $414:4 y $1048:8

Si se desea plantear un test de hipótesis sobre la pendiente 1, donde la hipótesis nula es que
1 es un valor …jo b, el estadístico de prueba será:
b b
1
p s T (n 2) si H0 es verdadera
Sr = Sxx
Podemos resumir los diferentes test de hipótesis para la pendiente:
Hipótesis nula: Ho : 1 = b
b b
Estadístico de prueba T = 1
p
sr = Sxx
s T(n 2) si H0 es verdadera
bb
Valor de estadístico de prueba: t = 1
p
sr = Sxx
Hipótesis alternativa Región de rechazo para un nivel
HA : 1 > b t > t ;n 2
HA : 1 < b t < t ;n 2
HA : 1 6= b t > t =2;n 2 o t < t =2;n 2

Veamos otro ejemplo:


Un hombre a…rma que el consumo de combustible de su automovil no depende de la velocidad
a la que es conducido. Para testear si esta hipótesis es plausible, el auto es probado a varias
velocidades entre 45 y 75 millas/hora, y se determinó el rendimiento en millas por galón para cada
una de esas velocidades. Se obtuvieron los siguientes datos:
Velocidad 45 50 55 60 65 70 75
Rendimiento 24.2 25.0 23.3 22.0 21.5 20.6 19.8

85
Gra…quemos estos valores:

30
25
millas/galón

20
15

45 50 55 60 65 70 75

millas/hor a

Suponinedo que el rendimiento (Y) se relaciona con la velocidad (x) según un modelo de regre-
sión lineal
Yi = 0 + 1 xi + i
la a…rmación de ese hombre es equivalente a a…rmar que la pendiente es nula.
Entonces las hipótesis que debemos plantear son: H0 : 1 = 0 HA : 1 6= 0
Estadístico de prueba:
b 0
1
p s T (5) si H0 es verdadera
Sr = Sxx
Si elegimos un nivel de signi…cación = 0:05, el valor crítico t =2;5 = t0:025;5 = 2:571. Luego la
regla de decisión es:
b 0
1
se rechaza H0 si jtj = p > 2:571
sr = sxx
Calculando:
Sxx = 700; Syy = 21:757; Sxy = 119
Luego
b = 119
1 = 0:17
700
y r
( 119)2 1:527
srr = 21:757 = 1:527; sr = = 0:5526
700 5
Entonces el valor del estadístico de prueba es:
0:17
t= p = 8:139
0:5526= 700
entonces podemos rechazar H0 con nivel = 0:05
Si buscamos en la tabla de Student, vemos que para = 0:001, el valor crítico -t =2;5 =
t0:0005;5 = 6:869

86
Como 8:139 < 6:869 también podríamos rechazar H0 con ese nivel de signi…cación, (p
valor < 0:001). Es decir se puede a…rmar que la pendiente de la recta es distinta de cero, con
mucha convición. Esto signi…ca que la a…rmación de que el rendimiento no depende de la velocidad
es falsa.

Inferencias en relación a la media de la variable respuesta (Y ) y el pronóstico de valores


correspondente aun valor x0 de la variable explicativa
Consideremos x0 un valor de la variable explicativa, y sea Y0 la respuesta correspondiente. Si se
cumple el modelo, la respuesta media correspondiente a x0 es

E (Y0 ) = 0 + 1 x0 :

El “valor ajustado”
yb0 = b 0 + b 1 x0 :
se puede considerar una estimador de E (Y0 ).

Si deseamos construir un intervalo de con…anza para E (Y0 ) deberemos encontrar la función


pivote adecuada, es facil ver que

y0 ) = E( b 0 + b 1 x0 ) =
E(b 0 + 1 x0

y que !
2 1 (x0 x)2
y0 ) = V( b 0 + b 1 x0 ) =
V(b +
n Sxx
y también se puede probar que, cuando las Yi tienen distribución Normal, la función

yb0 ( 0 + 1 x0 )
T = q s T (n 2)
1 (x0 x)2
sr n + Sxx

Entonces esa es la función pivote que usamos para construir un intervalo de con…anza para E (Y0 ) :
Siguiendo el mismo procedimiento de siempre, obtenemos el siguiente intervalo de con…anza de
nivel 1 ; para la media de la respuesta Y para un valor dado x0 :
0 s s 1
1 (x0 x) 2 2
1 (x0 x) A
IC1 (E(Y0 )) = @yb0 t =2;n 2 sr + ; yb0 + t =2;n 2 sr +
n Sxx n Sxx

Para el ejemplo del consumo en función de la velocidad, si queremos estimar el consumo medio
de combustible para una velocidad x0 = 62, primero calculamos:
b = y b x = 22:34 ( 0:17) 60 = 32:54
0 1
yb0 = 32:54 0:17 62 = 22:0
q
22:0 y con el valor crítico t0:025;5 \
= 2:571 y el dt (b
y0 ) = 0:5526 1
+ (62 60)2
= 0:213 y el intervalo
7 700
de con…anza es

IC0:95 (E(Y0 )) = (22:0 2:571 0:213 ; 22:0 + 2:571 0:213) =


= (21:45 ; 22:55)

87
Si observamos la forma del intervalo, vemos que la longitud es:
s
1 (x0 x)2
L = 2t =2;n 2 sr +
n Sxx
esta longitud es mínima cuando x0 es igual a x, y aumenta cuando x0 se aleja de x . En la siguiente
…gura se gra…ca la recta de regresión estimada, y dos lineas curvas que representan los límites de
los intervalos de con…anza para la media de Y , dados los posibles valores de x. Se puede ver como
varía la longitud de los intervalos de con…anza.

28
26
24
millas/galon

22
20
18

45 50 55 60 65 70 75

millas/hor a

Importante: Generalmente, el modelo es una aproximación, válida en el mejor de los casos,


dentro del rango de las “x” usadas para ajustar el modelo, no tenemos información para hacer
ninguna inferencia fuera de ese rango de valores, por lo que no es nada con…able “extrapolar”, o
sea, aplicar este procedimiento para x0 fuera del rango de las “x” con las que se estimó la recta de
regresión.

Si queremos predecir el valor que puede tomar la respuesta, cuando la variable explicativa es
x0 ; sabemos que Y0 = 0 + 1 x0 + , y parece lógico predecir ese valor con el valor sobre la recta
estimada, o “valor ajustado”
yb0 = b 0 + b 1 x0
este es el mismo valor que usamos para estimar la E(Y0 ). Pero si pretendemos construir un intervalo
de predicción, las cosas cambian un poco. El error de predicción es la diferencia entre el valor que
puede tomar una variable aleatoria Y0 y el valor ajustado yb0 ; podemos ver que el valor esperado
del error de predicción es:
E (Y0 yb0 ) = 0
y la varianza del error de predicción es:

2 1 (x0 x)2
var(Y0 yb0 ) = var(Y0 ) + var(b
y0 ) = 1+ +
n Sxx

88
de modo que para construir un intervalo de predicción para Y0 , usaremos la función:
Y0 yb0
T = q s T (n 2)
1 (x0 x)2
sr 1+ n + Sxx

Para el ejemplo Y el intervalo de predicción para una observación de Y correspondiente a un valor


x0 es:
0 s s 1
2 2
1 (x0 x) 1 (x0 x)
IP1 (Y0 ) = @yb0 t =2;n 2 sr 1 + + ; yb0 + t =2;n 2 sr 1 + + A
n Sxx n Sxx

En nuestro ejemplo, si queremos hacer un intervalo de predicción para un posible valor del
consumo de combustible correspondiente
q a la misma velocidad x0 = 62, el valor yb0 es el mismo,
\
pero dt (Y0 yb0 ) = 0:5526 1
1+ + (62 60)2
= 0:59223 = luego, el intervalo de predicción será:
7 700

IP0:95 (Y0 ) = (22:0 2:571 0:592 ; 22:0 + 2:571 0:592) =


= (20:48 ; 23:52)
esto signi…ca que tenemos un 95% de con…anza de que ese intervalo contenga a la posible respuesta
Y0 correspondiente a una velocidad x0 = 62. Vemos que la longitud de este intervalo de predicción
para Y0 es mayor que la del intervalo de con…anza para E(Y0 ) que construimos antes ( para el mismo
x0 = 62 ). Esto es lógico porque para predecir el valor que tome la variable aleatoria tengo más
incerteza que para estimar su media. En general vemos que la longitud del intervalo de predicción
es s
1 (x0 x)2
L = 2t =2;n 2 sr 1 + +
n Sxx
vale lo mismo que dijimos para los intervalos de con…anza, la longitud es mínima cuando x0 es igual
a x.
En la siguiente …gura se observan los puntos (xi ; yi ), la recta de regresión estimada, y dos pares
de curvas que representan los límites de los intervalos de con…anza y los intervalos de predicción.
28
26
24
millas/galon

22
20
18

45 50 55 60 65 70 75

millas/hor a

89
Con el …n de analizar como los años de experiencia de un vendedor aumenta el volumen de ventas
Un gerente de ventas recolectó los datos siguientes sobre ventas anuales y años de experiencia de
10 vendedores
Años de experiencia 1 3 4 4 6 8 10 10 11 13
Ventas (en miles de $) 80 97 92 102 103 111 119 123 117 136

Representamos los datos en un grá…co de dispersión:

130
120
v entas(en miles de $)

110
100
90
80

2 4 6 8 10 12

años

Parece razonable modelizar esta relación con un modelo lineal Yi = 0 + 1 xi + i , donde Yi son
las ventas anuales del vendedor i, que tiene xi años de experiencia
Con los datos podemos calcular: x = 7, y = 108; sxx = 142, syy = 2442, sxy = 568

b = sxy = 568 = 4 b =y b x = 108 4 7 = 80


1 0 1
sxx 142
La recta estimada es:
yb = 80 + 4x

srr = syy s2xy =sxx = 2442 5682 =142 = 170

srr
r2 = 1 =1 170=2442 = 0:9304
syy
Expresándolo en porcentaje, podemos decir que 93% de la viariabilidad que se oberva en el
volumen de ventas de los empleados, puede ser explicada por sus años de experiencia.

90

Vous aimerez peut-être aussi