Académique Documents
Professionnel Documents
Culture Documents
-5 -4 -3 -2 -1 0 1 2 3 4 5
Tema 10. Introducción a la Estadística Inferencial. 161
ESTADÍSTICA
GRADOS EN INGENIERÍA MECÁNICA, INGENIERÍA QUÍMICA E
INGENIERÍA EN ORGANIZACIÓN INDUSTRIAL
Conocer el modelo de una población, proceso o sistema sometido a variabilidad o aleatoriedad es muy
útil para conocer sus propiedades y prever su comportamiento.
Nos surge una duda fundamental: ¿Cómo podemos saber cuál es el modelo de cada población?
ESTADÍSTICA MATEMÁTICA O INFERENCIAL
Cuando queremos estudiar un fenómeno aleatorio (población):
Lo más habitual es que no conozcamos el modelo teórico del mismo.
Pero seguramente podremos observarlo, tomar una muestra y describirla.
Utilizando la información dada por una pequeña parte de la población (la muestra disponible) …
¿Se puede inferir el comportamiento de toda ella (conocer el modelo)?
La Estadística Inferencial permite dar este paso validando o refutando las conjeturas de la Estadística
Descriptiva:
Validar un posible modelo para la población.
Estimar parámetros de ese modelo.
Tema 10. Introducción a la Estadística Inferencial. 162
ESTADÍSTICA
GRADOS EN INGENIERÍA MECÁNICA, INGENIERÍA QUÍMICA E
INGENIERÍA EN ORGANIZACIÓN INDUSTRIAL
EL MODELO ESTADÍSTICO
En todos los problemas de la Estadística Inferencial encontraremos los siguientes ingredientes:
1.- Población en estudio.
- X variable aleatoria de interés definida sobre la población.
- PX ley de probabilidad desconocida de la v. a. X.
- Tenemos interés en conocer, hasta donde sea posible, la ley de X (o sus parámetros).
2.- Muestra representativa de la población: X1, …, Xn.
- Habitualmente tendremos una muestra aleatoria simple (m.a.s.), formada por v.a. independientes
e igualmente distribuidas (i.i.d.), con la misma ley de X.
- Los datos o realizaciones de la muestra, x1, …, xn contienen información sobre PX.
3.- El OBJETIVO es extraer la información que contienen los datos acerca de PX:
- Obtener una aproximación razonable del modelo de X (normal, exponencial…)
- Estimar los parámetros u otras cantidades de interés de ese modelo ( P(a<X<b), mediana...)
- Comparar la ley de X en esta población con la ley en otra población de interés (efecto innovación)
La Estadística Inferencial aporta metodología para conseguir este objetivo mediante técnicas de:
- Estimación (puntual o por intervalos) para asignar valores a un parámetro desconocido
- Contraste o Test de Hipótesis (paramétricos, de ajuste …) para decidir entre dos opciones
A veces sabemos que la ley PX está en una determinada familia (normal, exponencial…) y el
problema es sólo determinar (estimar o contrastar) los parámetros : , , … Decimos entonces que
estamos ante un Problema o Modelo Paramétrico.
Tema 10. Introducción a la Estadística Inferencial. 163
ESTADÍSTICA
GRADOS EN INGENIERÍA MECÁNICA, INGENIERÍA QUÍMICA E
INGENIERÍA EN ORGANIZACIÓN INDUSTRIAL
EJEMPLO: Una planta industrial envasa detergente en polvo en paquetes que se etiquetan con:
CONTENIDO 4 Kg.
El proceso viene siguiendo un patrón normal y se considera bajo control mientras cumpla:
=4.01 Kg. y =0.005 Kg.
Pero el proceso se puede desajustar (aumento o disminución de o , aparición de asimetría, etc.) e
interesa poder chequear en cualquier momento el estado del proceso de envasado.
La Estadística Inferencial aporta herramientas para dar respuesta a preguntas naturales como éstas:
1. ¿Cuánto valen y ?
(ESTIMACIÓN PUNTUAL)
2. ¿Entre qué valores se encuentran y con ciertas garantías de acierto (95% ó 99%)?
(ESTIMACIÓN por INTERVALOS DE CONFIANZA)
3. ¿Los datos soportan que =4.01, o por el contrario son más creíbles si =5.01?
¿Los datos soportan que <0.005, o quizás será≥0.005?
(CONTRASTE DE HIPÓTESIS PARAMETRICOS)
4. ¿El modelo es normal?
(TEST DE AJUSTE)
Para responder a estas preguntas tendremos que tomar una muestra de la variable X = Contenido
envasado y estudiar la información que nos aporta s obre el modelo poblacional. Surgen entonces
otras preguntas adicionales:
5. ¿De qué tamaño tiene que ser la muestra para garantizar cierta confianza?, ¿Cómo elijo la muestra?
(MUESTREO)
Tema 10. Introducción a la Estadística Inferencial. 164
ESTADÍSTICA
GRADOS EN INGENIERÍA MECÁNICA, INGENIERÍA QUÍMICA E
INGENIERÍA EN ORGANIZACIÓN INDUSTRIAL
De nuevo se nos plantean una serie de interrogantes naturales a los que sólo podremos dar respuesta
mediante el uso de las técnicas estadísticas apropiadas:
1. ¿Cuánto valen aproximadamente y en cada caso?
(ESTIMACIÓN)
2. ¿Entre qué valores se encuentran con ciertas garantías de acierto AB y A /B (95 % ó 99%)?
(INTERVALOS DE CONFIANZA)
3. ¿Es realmente cierto AB, o quizás AB? Análogamente: ¿Realmente AB, o quizásAB?
(CONTRASTE DE HIPÓTESIS)
4. ¿Los modelos son normales?
(TEST DE AJUSTE)
Para responder a estas preguntas tendremos que tomar muestras de la variable X = Pureza para cada
uno de los proveedores y estudiar la información que nos aportan sobre los modelo de ambas
poblaciones. Surgen entonces otras preguntas adicionales:
5. ¿De qué tamaño tienen que ser las muestras?, ¿Cómo elijo las muestras?
(MUESTREO)
ESTADÍSTICOS Y ESTIMADORES
Estadístico. Es cualquier función de la muestra. T T ( X 1 ,..., X n ) . (Es una v.a.; depende del azar).
Operando los valores X 1 ,..., X n de la muestra, extraemos la in formación que ésta posee sobre la
población (sobre la ley PX desconocida, sus parámetros u otras características de interés).
n n
1 n 1 n
Ejemplos de estadísticos: T1 X i ; T2 X ; X X i ; S ( X i X ) 2 ; Me; ...
2 2
i
i 1 i 1 n i 1 n i 1
Estimadores. Para aproximar o estimar un parámetro desconocido, , en una población, se elige
un estadístico apropiado, ˆ ˆ( X 1 ,..., X n ) . Se dice entonces que el estadístico ˆ es un estimador de .
1 n 1 n
Ejemplos de estimadores: ˆ X n X i ; ˆ S
n i 1
( X i X )2
i 1
varianza poblacional ˆ 2 S 2 1
n
n
i 1
( X i X ) 2 varianza muestral
p = proporción poblacional p̂ = proporción muestral
Xn
1
n X satisface E ( X ) ,
i 1
i Var ( X ) 2 / n, X / n , es decir:
X toma valores centrados en el parámetro a estimar (es un estimador insesgado).
La dispersión (varianza) de X tiende a 0 al crecer n (hay un “n” en el denominador).
X converge hacia X n (estimador consistente), en el sentido:
P
n
Ley de los Grandes Números
P X n 0 para cada 0 .
n 8
P Xn Var ( X n )
2
2
n
0.
2 n
6
Ley de probabilidad de
X n para n grande
4
Interpretación probabilística de la LGN:
Promediando un número suficientemente grande de
observaciones de un experimento, se obtiene un valor 2
que dista de la media poblacional una distancia tan
pequeña como queramos, con una probabilidad tan alta
como queramos. 0
Tema 10. Introducción a la Estadística Inferencial. 167
ESTADÍSTICA
GRADOS EN INGENIERÍA MECÁNICA, INGENIERÍA QUÍMICA E
INGENIERÍA EN ORGANIZACIÓN INDUSTRIAL
Ley de los Grandes Números para otros estadísticos definidos a través de promedios:
El razonamiento anterior se puede hacer exte nsivo de manera no muy complicada a todos los
estadísticos muestrales definidos como promedios (varianza muestral, proporciones muestrales, …).
La LGN también permite concluir que dichos estadísticos muestrales proporcionan aproximaciones o
estimaciones naturales de los correspondientes parámetros poblacionales definidos como promedios
de alguna función en la población (varianza, probabilidad de un suceso, …).
Glivenko-Cantelli: Fn --> F
0,8 Distribución de T
Distribución de la Población
0,6
0,4 parámetro
de interés de
la población
0,2
0
0 1 2 3 t2 tm t1
0.75 3
n=100
0.5 2
para
n=25 diferentes
0.25
tamaños
muestrales
1
n=4
n= 4, 25, 100
0 0
Tema 10. Introducción a la Estadística Inferencial. 171
ESTADÍSTICA
GRADOS EN INGENIERÍA MECÁNICA, INGENIERÍA QUÍMICA E
INGENIERÍA EN ORGANIZACIÓN INDUSTRIAL
0 1 2 3 4 5 6 0 1 2 3 4 5 6 0 1 2 3 4 5 6 0 1 2 3 4 5 6
2
Distribución de promedios de observaciones de una v.a. con densidad f ( x) 1.5( x 1) , x (0,2)
n=1 n=2 n=5 n=25
0 0,4 0,8 1,2 1,6 2 0 0,4 0,8 1,2 1,6 2 0 0,4 0,8 1,2 1,6 2 0 0,4 0,8 1,2 1,6 2
Ejemplo:
El editor de una revista profesional de ingeniería desea estimar el salario medio de los graduados en
Ingeniería Industrial en su primer empleo. Se conoce que el Salario es una variable con ley normal y
=250 €. Se toma una muestra de n=25 titulados de los que obtiene la información sobre su salario.
El editor querría que la estimación (media muestral) obtenida a partir de esta muestra le diera un
valor que se desvíe a lo sumo en 50 € respecto al valor real con cierta probabilidad controlada.
a) Hallar la probabilidad de que el error esté efectivamente entre 50 €.
b) De qué tamaño tiene que ser la muestra para tener garantizado un error máximo de 50 € con
una probabilidad de 0.95.
Solución:
Xn
Utilizamos la distribución de la media muestral: X n N ( , n) N (0,1)
n
50 X n 50 P 1 N (0,1) 1 (1) (1) 0.68.
a) P 50 X 50 P 250 250
25 n 25
50 X n 50 1 2(0.2 n ).
b) 0.95 P 50 X n 50 P 250 250
n n n
1 2(0.2 n ) 0.95 (0.2 n ) 0.025 0.2 n 1.96 n 97 .
1 n 1
estimadores de y
2 2
(X i X )2 , S
n
1.1.2.- S X X
n 1 i 1 n 1 i 1 i
Nota: Se divide por n1 para conseguir E(S2)= Se llama cuasivarianza o varianza corregida.
A partir de ahora siempre las utilizaremos y las llamaremos varianza y desviación típica.
1.2.- Comparación de poblaciones normales con muestras independientes.
1.2.1.- Comparación de medias:
X1 X 2 estimador de 12.
1.2.2.- Comparación de varianzas con muestras independientes:
S12 S 22 estimador de 12 22
2.-VARIABLES CUALITATIVAS DICOTOMICAS O ATRIBUTOS (PROPORCIONES)
2.1.- Inferencias sobre una proporción p.
1 n
pˆ X X i (proporción muestral) estimador de p.
n i 1
S12 S 22 1 1 2 2
[6]
S n S n
1
2
1
2 2
2 2
2
n1 n2 n1 1 n2 1
S12 12
12 22 S 2
S 2 Fn1 1,n2 1 [7
[7]
1 2 S 22 22 ]
Tema 10. Introducción a la Estadística Inferencial. 176
ESTADÍSTICA
GRADOS EN INGENIERÍA MECÁNICA, INGENIERÍA QUÍMICA E
INGENIERÍA EN ORGANIZACIÓN INDUSTRIAL
(n 1) S 2
Aplicación a la estimación de : X 1 ,... X n v.a. i.i.d ., X i N ( , ) 2
n21
2
G. L.
5
0,12 10
0,08
n
25
densidad
densidad
0,06
0,08
0,04
0,04
0,02
0 0
0 5 10 15 20 25 30 35 40 45 50
n2,
Distribución t de Student.
N (0,1)
Se obtiene del cociente t n : Distribución t de Student con n grados de libertad.
1
n 2
n
0,3
2
8
200
0,3 tn
densidad
densidad
0,2 0,2
0,1 0,1
0 0
-5 -4 -3 -2 -1 0 1 2 3 4 5 t n ,
Tema 10. Introducción a la Estadística Inferencial. 178
ESTADÍSTICA
GRADOS EN INGENIERÍA MECÁNICA, INGENIERÍA QUÍMICA E
INGENIERÍA EN ORGANIZACIÓN INDUSTRIAL
Distribución F de Fisher-Snedecor
1
n1 n2
Se obtiene del cociente
1
Fn ,n : Distribución F con n y n grados de libertad.
1
n2 n 2
2
1 2 1 2
Está tabulada. Para distintos valores de n1, n2 y encontramos Fn1 ,n2 , P Fn1 ,n2 Fn1 ,n2 , .
Para obtener valores en la cola izquierda se usa: Fn1 ,n2 ,1 1 Fn2 ,n1 , .
Fn1 ,n2
5,5
1 5,25
25,5 0,6
0,8 25,25
densidad
densidad
0,6 0,4
0,4
0,2
0,2
0 0
0 1 2 3 4 5
Tema 10. Introducción a la Estadística Inferencial.
Fn1 ,n2 , 179
ESTADÍSTICA
GRADOS EN INGENIERÍA MECÁNICA, INGENIERÍA QUÍMICA E
INGENIERÍA EN ORGANIZACIÓN INDUSTRIAL
Ejemplo: Dos modelos de pilas, M1 y M2, están diseñados para tener el mismo voltaje 1.5 V. El
Voltaje de una pila elegida al azar es una variable aleatoria con ley normal con =0.01 V para
ambos modelos. Para estudiar si las medias 1 y 2 son también iguales, se toman dos muestras de 50
pilas de cada modelo y se mide su voltaje.
a) Si las medias son iguales, 12, calcula la probabilidad de que la diferencia entre las medias
muestrales sea mayor de 0.01V.
b) Si 12=0.1V, calcula la probabilidad de que las medias muestrales difieran en menos de 0.05V.
c) ¿Qué tamaño muestral (n=n1=n2) habría sido suficiente en a) para que la probabilidad calculada
sea menor que 0.05?
Solución:
12 22
Conocemos la distribución de la diferencia de medias:
X 1 X 2 N 1 2 , [4]
n n 2
1
X X 2 ( 1 2 ) 0.01 0 0.01
a)
P X 1 X 2 0.01 P 1 2 2 5 0.
2
2
0.0001 0.0001 2
1
2 0.01
n n2 50 50 50
1
b)
P X 1 X 2 0.05 P 0.05 X 1 X 2 0.05P
0.05 0.1 X X 2 ( 1 2 )
1
0.05 0.1
-25 75 0. [4]
0.0001 0.0001 12 22 0.0001 0.0001
50 50 n1 n 2
50 50
0.01
c)
0.05 P X 1 X 2 0.01 2
0.01 2 n
n
1.96 n 8 .
2
MUESTREO DE PROPORCIONES
Ejemplo: Un proveedor suministra envíos que deberían aceptarse sólo si contienen a lo sumo un
10% de productos defectuosos. Un inspector de calidad acepta envíos siempre que una muestra de
tamaño 100 contenga a lo sumo 10 productos defectuosos (10%) y los rechaza en otro caso.
a) Si el proceso tiene una tasa de defectos del 10%, hallar la probabilidad de que la proporción
muestral se desvíe de este valor en más de 2 puntos porcentuales.
b) ¿Hallar la probabilidad de que acepte un envío si la tasa de defectuosos es de un 12%?
c) ¿Hallar la probabilidad de que rechace un envío en el que sólo un 8% son defectuosos?
Solución:
aprox p(1 p)
Utilizamos la distribución límite pˆ N p,
n
que nos proporciona el TCL.
0.075 0.10 pˆ 0.1 0.125 0.10
a) P pˆ 0,1 0.02 P0.08 pˆ 0.12 P 2(0.83) 1 0.593.
[8]
0.1(1 0.1) 0.1(1 0.1) 0.1(1 0.1)
100 100 100
pˆ 0.12 0.10 0.12 0.105 0.12
b) P
pˆ 0.1 P
0.46
0.323.
0.12(1 0.12) 0.12(1 0.12) 0.12(1 0.12)
100 100 100
pˆ 0.08 0.10 0.08
c) P
pˆ 0.1 P
1
0.105 0.08 1 0.92
0.18.
0.081 0.08 0.08 * 0.92
0.08 * 0.92
100 100
100
densidad
0,6
0,4
Ronald A. Fisher
0,2
0
0 1 2 3 4 5
Ejemplo: Para estimar un parámetro de una variable crítica para el funcionamiento de una central
nuclear nos interesará que sea muy pequeño, =0.001 por ejemplo. En otras ocasiones, como por
ejemplo la estimación de un parámetro que afecte a la longitud de las piezas producidas por una
máquina, donde las consecuencias de un posible error no serían tan graves, se podrá admitir un
mayor riesgo de error, por ejemplo =0.05.
Estos intervalos de valores se obtienen a partir de la distribución muestral del estimador usado y se
llamarán Intervalos de Confianza.
Si se repitiera muchas veces el muestreo y el cálculo del intervalo (l,u), en promedio una proporción
1 (100(1)%) de las veces el I.C. contendría al parámetro La proporción restante fallaría.
Esto lo indicamos diciendo que el I.C. tiene una confianza (o garantía) 1.
Esta interpretación frecuentista de los IC sirve también para las cotas de confianza.
0,8
Distribución de la Población
0,6
parámetro
0,4
de interés de
la población
0,2
0
0 1 2 3
0 20 40 60 80 100
Nota: Las muestras provienen de un experimento de s imulación en el que se han construido I.C. al
95%. Podemos ver que en los 100 primeros tenemos 7 fallos y 93 aciertos. Si seguimos tomando
muestras, los porcentajes de aciertos y fallos se estabilizarán en torno a 95% y 5% respectivamente.
0,4
0,3
X
densidad
0,2 P z / 2 z / 2 1 .
n
0,1
X z / 2 X z / 2 X z / 2
o bien n con confianza 1-.
[1]
n n
Para obtener cotas de confianza dejamos todo el riesgo de error en una cola:
X
Cota inferior de confianza : P z 1 X z
n
n
X
Cota superior de confianza : P n z 1 X z n
0,4 0,4
0,3 0,3
densidad
densidad
0,2 0,2
0,1 0,1
Conflicto Confianza-Amplitud:
Si aumentamos la confianza 1-, aumenta z/2 y aumenta la amplitud o error máximo E
E z / 2 / n .
Ejemplo: El editor de una revista profesional de ingeniería desea estimar el salario medio de los
graduados en Ingeniería Industrial en su primer empleo. Se conoce que el Salario es una variable
con ley normal y =250 €. Se toma una muestra de n=25 titulados de los que obtiene la información
sobre su salario, resultando X 1501 .57€ .
a) Obtener un I.C. al 95% para .
b) Obtener una cota inferior de confianza al 99% para .
c) Qué tamaño muestra se necesita en a) para que el error máximo sea de 50€.
Solución:
a) X z / 2 X z / 2 [1]
n n
250 250 250
1501.57 1.96 1501.57 1.96 , o bien 1501.57 1.96 ,
25 25 25
1403.57 1599.57 o bien 1501.57 98€ con una confianza del 95%.
b) X z
n
250
1501.57 2.33 1384,77€ con una confianza del 99%.
25
0,1
0,08 2
Distribución n 1
2 (n 1) S 2
densidad
0,06
P n 1,1 2 n 1, 2 1 .
2
2
0,04
0,02
0
n21,1 / 2 n21, / 2
4. Despejar el parámetro 2 :
(n 1) (n 1)
S2 2 S 2 con confianza 1-. [3]
2
n 1, 2 2
n 1,1 2
Para obtener cotas de confianza dejamos todo el riesgo de error en una cola:
(n 1) S 2 (n 1)
Cota inferior de confianza : P 2
1, 1 2 S2
2
2
n
n 1,
(n 1) S 2 (n 1)
Cota superior de confianza : P 2 n1,1 1 2
2
S2
2
n 1,1
0,08
n21 0,08
n21
densidad
densidad
0,06 0,06
0,04 0,04
0,02 0,02
0
0
n21,1 n21,
Conflicto Confianza-Amplitud:
Si aumentamos la confianza 1-, aumenta 2n-1,/2 y disminuye 2n-1,/2 y por tanto aumenta la
amplitud. En este caso no existe una fórmula explícita para el tamaño muestral.
Ejemplo: Se investiga el diámetro de barras de acero fabricadas por máquinas de extrudado, que
sigue una distribución normal. Aunque el proceso funciona bien en cuanto al valor medio, se han
observado ciertas anomalías que llevan a pensar que tal vez hay algún desajuste que está haciendo
que la fabricación tenga mayor variabilidad de la debida con lo que un alto porcentaje del producto
puede resultar inservible. El parámetro de interés a controlar en este caso es la varianza. En
concreto se quiere que la varianza del proceso sea menor que 0.5 m c 2 . Se dispone de una muestra de
tamaño n = 18 tal que X 8.63 cm y S 2 0.34 cm 2 . Con estos datos construimos una cota superior de
confianza del 95% obteniendo para 2:
Solución:
2 n 1S 2 2 17 S 2
C 2 1 ; C 2 0.95; 2 17 0.34 0.66. [3]
n1,1
17 , 0.95 8.67
0,08
0,06
distribución 172
0,04
0,02 5% 95%
0
0 10 20 30 40 50
Ejemplo: Una empresa está considerando la fabricación de un nuevo material sobre la base de
ciertos cálculos teóricos de su departamento de desarrollo. La propiedad clave del material es su
conductividad térmica, que interesa que sea lo menor posible y que el departamento de desarrollo
juzga como muy inferior a la del material actualmente utilizado. Para asegurarse, la empresa decide
fabricar un total de n=10 unidades del nuevo material. Se quiere obtener una cota superior de
confianza para el valor medio de la conductividad térmica de ese material y la empresa además juzga
asumible un riesgo =0.05. Supóngase normalidad. Los resultados muestrales obtenidos son
X 44.21 B tu / hr - ft-0 F y S 0.1 Btu/hr - ft- 0 F .
Solución:
S
La cota superior de confianza del 100(1-)% para se deduce de P X tn 1, 1 , [2]
n
S 0.1
y en nuestro caso particular se tiene X t 9,0.05 44.21 1.833 44.268
n 10
0.4
Distribución t
con 9 g.l.
0.3 P(t > t9,0.05) = 0.05
0.2
0.1
0
-5 0 t9,0.05=1.833
Ejemplo: A la hora de instalar una nueva factoría de envases se presenta la elección entre dos
sistemas de cerrado de envases que se están empleando en fábricas ya instaladas. Se está interesado
en la resistencia de esos envases en función del tipo de cerrado de los mismos. Se decide estimar la
diferencia entre las resistencias medias mediante un intervalo de confianza del 95%. Para ello se
solicitan datos a las factorías que tienen instalados esos sistemas y de la primera responden enviando
datos relativos a una muestra de tamaño n1 8 con X1 25.38 . De la segunda nos llegan datos de una
muestra con n2 12 y X 2 29.46 . Además de pruebas anteriores con esos tipos de cerrado se sabe que
los modelos son normales y que 12 1.21 y 22 1.98 .
12 22 [4]
1 2 X 1 X 2 z 2
n1 n2
z22 12 2 2 1.962
n 2
1.21 1.98 306.36
Emax 0.2 2
es decir 307 elementos por población.
Tema 11. Intervalos de Confianza. 198
ESTADÍSTICA
GRADOS EN INGENIERÍA MECÁNICA, INGENIERÍA QUÍMICA E
INGENIERÍA EN ORGANIZACIÓN INDUSTRIAL
Ejemplo: Se tienen dos tipos de lámparas A y B y se desea estudiar cuál de los dos tipos tarda más
tiempo en fundirse. Las duraciones se ajustan al modelo normal. Se toma una muestra de 8 lámparas
de cada tipo y se obtienen los siguientes datos medidos en días:
Tipo A : X 1 37.7, S1 6.65 Tipo B : X 2 35.4, S 2 5.86 .
Se pide valorar la existencia de diferencias en las duraciones medias a partir de un intervalo de
confianza del 90% para la diferencia de medias suponiendo varianzas iguales.
Solución:
1 1
La expresión del I.C. es: 1 2 X1 X 2 t 2,n n 2 S p
1 2
n1 n2
[5]
0.2
0.05 0.9 0.05
0.1
0
-5 0 t14,0.05 = 1.761
Ejemplo: En el ejemplo sobre los dos tipos de lámparas para el que realizamos una comparación de
medias en poblaciones normales con varianzas desconocidas pero iguales, construir un intervalo de
confianza del 95% para comparar las varianzas y avalar la suposición realizada. (Si el valor 1
pertenece a ese intervalo entonces nuestra suposición de varianzas iguales tendrá argumentos
consistentes con que sostenerse. El valor 1 corresponde precisamente a 1 2 ).
Solución:
Tenemos dos muestras de tamaño 8, de modo que S 1 6.65 y S 2 5.86 y el I.C. será: [7]
0.4
0.3
0.2
0.1 C=0.95
0
0 1 2 3 4 5 6
Distribución F7,7
Conclusión: 1 IC, luego se pueden considerar las varianzas iguales.
Tema 11. Intervalos de Confianza. 200
ESTADÍSTICA
GRADOS EN INGENIERÍA MECÁNICA, INGENIERÍA QUÍMICA E
INGENIERÍA EN ORGANIZACIÓN INDUSTRIAL
~ N p, p (1 p pˆ p ~ N (0,1).
2. Distribución del estimador: pˆ
n p (1 p ) / n
0,4
0,3
pˆ p
densidad
P z / 2 z / 2 ~
1 .
0,2
p(1 p) / n
0,1
p(1 p)
4. Despejar p: p pˆ z / 2 El intervalo no es operativo porque los extremos dependen de p:
.
n
pˆ (1 pˆ )
Estimamos p(1-p): p pˆ z / 2 n con confianza aprox. 1-. [8]
1
Acotamos p(1-p)1/4: ˆ
4n con confianza al menos 1-. (I.C. conservador)
p p z / 2
Para obtener cotas de confianza dejamos todo el riesgo de error en una cola:
pˆ p pˆ (1 pˆ )
Cota inferior de confianza : P z ~
1 p X z
p(1 p) n n
pˆ p pˆ (1 pˆ )
Cota superior de confianza :
P z ~
1 p X z
p(1 p) n n
Conflicto Confianza-Amplitud:
Si aumentamos la confianza 1-, aumenta z/2 y aumenta el error máximo
p(1 p)
E z / 2 .
n
El error máximo de estimación se interpreta como la máxima posible diferencia entre el parámetro
(desconocido) y la estimación puntual (conocida y que se usa como centro del intervalo) en el caso de
que el I.C. fuese correcto.
Nota: No existen expresiones explícitas para el caso de los I.C. para varianzas.
Tema 11. Intervalos de Confianza. 205
ESTADÍSTICA
GRADOS EN INGENIERÍA MECÁNICA, INGENIERÍA QUÍMICA E
INGENIERÍA EN ORGANIZACIÓN INDUSTRIAL
Ejemplo: Un fabricante de antenas parabólicas quiere ofrecer a sus clientes un periodo de garantía
de un año y le gustaría saber, antes de decidirse cuál es la proporción p de antenas que debería
reparar gratuitamente en ese caso. Para ello toma una muestra de 100 antenas que se prueban
durante un año. De esas 100 antenas se estropean 18.
Solución:
pˆ (1 pˆ )
El intervalo de confianza tiene la forma: p pˆ z 2 n
Sustituyendo los valores obtenemos
0.181 0.18 0.181 0.18
C 0.18 1.65 p 0.18 1.65 0.9
100 100
0.116 p 0.243.
de modo que deberíamos probar otras 1005 antenas para conseguir la precisión requerida a la
estimación.
Ejemplo: En el ejemplo anterior, al considerar que la tasa de fallos en el primer año de vida era
excesiva, un distribuidor del producto decide comparar el funcionamiento de las antenas de ese
fabricante (A) con las de otro fabricante B. Toma una muestra de 200 antenas de este último y
durante el primer año de vida se observan 22 fallos. Comparar las proporciones de fallos mediante
un I.C. al 95%. Hallar los tamaños muestrales necesarios para que el error máximo de la estimación
con la confianza del 95% sea 0.05
Solución:
pˆ 1 (1 pˆ 1 ) pˆ 2 (1 pˆ 2 )
El intervalo de confianza tiene la forma: p1 p 2 pˆ 1 pˆ 2 z 2
n1
n2
Sustituyendo los valores obtenemos
0.181 0.18 0.111 0.11
C p1 p2 0.18 0.11 1.96 0.95
100 200
p1 p2 0.07 0,087.
Para obtener el tamaño muestral utilizamos los estimadores anteriores como pilotos:
de modo que deberíamos probar 378 antenas de cada tipo para conseguir la precisión requerida a la
estimación.