Clase 7

ESTADÍSTICA
GRADOS EN INGENIERÍA MECÁNICA, INGENIERÍA QUÍMICA E

INGENIERÍA EN ORGANIZACIÓN INDUSTRIAL
TEMA 10.- INTRODUCCIÓN A LA

ESTADÍSTICA INFERENCIAL
- De la Estadística Descriptiva a la Estadística Inferencial.
- El Modelo Estadístico.
- Estadísticos y Estimadores.
- Ley de los Grandes Números.
- Distribución muestral.
- Estimadores en modelos normales y proporciones.
tn
G. L.
2
- Distribuciones muestrales en modelos normales. 8
200
- Distribuciones muestrales para muestras grandes. William S. Gosset (Student)
-5 -4 -3 -2 -1 0 1 2 3 4 5
Tema 10. Introducción a la Estadística Inferencial. 161
ESTADÍSTICA
DE LA ESTADÍSTICA DESCRIPTIVA A LA ESTADÍSTICA INFERENCIAL

ESTADÍSTICA DESCRIPTIVA
Analiza muestras describiéndolas y resumiéndolas gráfica y numéricamente.
Ayuda a plantear modelos para la población que podrían explicar el comportamiento de la muestra.
CÁLCULO DE PROBABILIDADES
Da forma matemática a la idea de “modelo” y nos permite explicar y manejar la variabilidad.
Describe diferentes clases de modelos teóricos para las variables aleatorias de interés en una población.
Conocer el modelo de una población, proceso o sistema sometido a variabilidad o aleatoriedad es muy
útil para conocer sus propiedades y prever su comportamiento.
Nos surge una duda fundamental: ¿Cómo podemos saber cuál es el modelo de cada población?
ESTADÍSTICA MATEMÁTICA O INFERENCIAL
Cuando queremos estudiar un fenómeno aleatorio (población):
 Lo más habitual es que no conozcamos el modelo teórico del mismo.
 Pero seguramente podremos observarlo, tomar una muestra y describirla.
Utilizando la información dada por una pequeña parte de la población (la muestra disponible) …
¿Se puede inferir el comportamiento de toda ella (conocer el modelo)?
La Estadística Inferencial permite dar este paso validando o refutando las conjeturas de la Estadística
Descriptiva:
 Validar un posible modelo para la población.
 Estimar parámetros de ese modelo.
ESTADÍSTICA
EL MODELO ESTADÍSTICO
En todos los problemas de la Estadística Inferencial encontraremos los siguientes ingredientes:
1.- Población en estudio.
- X variable aleatoria de interés definida sobre la población.
- PX ley de probabilidad desconocida de la v. a. X.
- Tenemos interés en conocer, hasta donde sea posible, la ley de X (o sus parámetros).
2.- Muestra representativa de la población: X1, …, Xn.
- Habitualmente tendremos una muestra aleatoria simple (m.a.s.), formada por v.a. independientes
e igualmente distribuidas (i.i.d.), con la misma ley de X.
- Los datos o realizaciones de la muestra, x1, …, xn contienen información sobre PX.
3.- El OBJETIVO es extraer la información que contienen los datos acerca de PX:
- Obtener una aproximación razonable del modelo de X (normal, exponencial…)
- Estimar los parámetros u otras cantidades de interés de ese modelo ( P(a<X<b), mediana...)
- Comparar la ley de X en esta población con la ley en otra población de interés (efecto innovación)
La Estadística Inferencial aporta metodología para conseguir este objetivo mediante técnicas de:
- Estimación (puntual o por intervalos) para asignar valores a un parámetro desconocido
- Contraste o Test de Hipótesis (paramétricos, de ajuste …) para decidir entre dos opciones
A veces sabemos que la ley PX está en una determinada familia (normal, exponencial…) y el
problema es sólo determinar (estimar o contrastar) los parámetros : , , … Decimos entonces que
estamos ante un Problema o Modelo Paramétrico.
ESTADÍSTICA
EJEMPLO: Una planta industrial envasa detergente en polvo en paquetes que se etiquetan con:
CONTENIDO 4 Kg.
El proceso viene siguiendo un patrón normal y se considera bajo control mientras cumpla:
=4.01 Kg. y =0.005 Kg.
Pero el proceso se puede desajustar (aumento o disminución de  o , aparición de asimetría, etc.) e
interesa poder chequear en cualquier momento el estado del proceso de envasado.
La Estadística Inferencial aporta herramientas para dar respuesta a preguntas naturales como éstas:
1. ¿Cuánto valen  y ?
(ESTIMACIÓN PUNTUAL)
2. ¿Entre qué valores se encuentran  y con ciertas garantías de acierto (95% ó 99%)?
(ESTIMACIÓN por INTERVALOS DE CONFIANZA)
3. ¿Los datos soportan que =4.01, o por el contrario son más creíbles si =5.01?
¿Los datos soportan que <0.005, o quizás será≥0.005?
(CONTRASTE DE HIPÓTESIS PARAMETRICOS)
4. ¿El modelo es normal?
(TEST DE AJUSTE)
Para responder a estas preguntas tendremos que tomar una muestra de la variable X = Contenido
envasado y estudiar la información que nos aporta s obre el modelo poblacional. Surgen entonces
otras preguntas adicionales:
5. ¿De qué tamaño tiene que ser la muestra para garantizar cierta confianza?, ¿Cómo elijo la muestra?
(MUESTREO)
ESTADÍSTICA
EJEMPLO: Dos proveedores A y B suministran a un fabricante el mismo producto químico cuya

característica de interés es la pureza (en %), que es una variable aleatoria con distribución
supuestamente normal. El fabricante está interesado en comparar los productos suministrados por
ambos proveedores comparando los parámetros en ambos casos (a través de AB y A /B).
De nuevo se nos plantean una serie de interrogantes naturales a los que sólo podremos dar respuesta
mediante el uso de las técnicas estadísticas apropiadas:
1. ¿Cuánto valen aproximadamente  y  en cada caso?
(ESTIMACIÓN)
2. ¿Entre qué valores se encuentran con ciertas garantías de acierto AB y A /B (95 % ó 99%)?
(INTERVALOS DE CONFIANZA)
3. ¿Es realmente cierto AB, o quizás AB? Análogamente: ¿Realmente AB, o quizásAB?
(CONTRASTE DE HIPÓTESIS)
4. ¿Los modelos son normales?
(TEST DE AJUSTE)
Para responder a estas preguntas tendremos que tomar muestras de la variable X = Pureza para cada
uno de los proveedores y estudiar la información que nos aportan sobre los modelo de ambas
poblaciones. Surgen entonces otras preguntas adicionales:
5. ¿De qué tamaño tienen que ser las muestras?, ¿Cómo elijo las muestras?
(MUESTREO)

ESTADÍSTICA
ESTADÍSTICOS Y ESTIMADORES
 Estadístico. Es cualquier función de la muestra. T  T ( X 1 ,..., X n ) . (Es una v.a.; depende del azar).
Operando los valores X 1 ,..., X n de la muestra, extraemos la in formación que ésta posee sobre la
población (sobre la ley PX desconocida, sus parámetros u otras características de interés).
n n
1 n 1 n
Ejemplos de estadísticos: T1   X i ; T2   X ; X   X i ; S   ( X i  X ) 2 ; Me; ...
2 2
i
i 1 i 1 n i 1 n i 1
 Estimadores. Para aproximar o estimar un parámetro desconocido, , en una población, se elige
un estadístico apropiado, ˆ  ˆ( X 1 ,..., X n ) . Se dice entonces que el estadístico ˆ es un estimador de .
1 n 1 n
Ejemplos de estimadores: ˆ  X  n  X i ; ˆ  S  
n i 1
( X i  X )2
i 1
(serán usados habitualmente como estimadores de los parámetros  y , respectivamente).

 Para obtener un estimador adecuado para un parámetro utilizaremos este sencillo razonamiento:
- Cualquier parámetro de interés resulta de realizar alguna “operación” sobre la población.
- El estimador se construye realizando una “operación” paralela sobre la muestra.
Ejemplos:
PARÁMETRO ESTIMADOR
media poblacional ̂  X  1n i 1 X i media muestral
n
varianza poblacional ˆ 2  S 2  1
n 
n
i 1
( X i  X ) 2 varianza muestral
p = proporción poblacional p̂ = proporción muestral
mediana poblacional ˆ  Me mediana muestral

ESTADÍSTICA
LEY DE LOS GRANDES NÚMEROS

Es la justificación matemática de la aproximación de la media poblacional por la muestral X :
 X variable aleatoria con =EX< y 2=Var(X) <. (población con ley desconocida)
 X1, ..., Xn, ... realizaciones independientes de X. (muestra aleatoria de la población)
n
 Xn 
1
n  X satisface E ( X )   ,
i 1
i Var ( X )   2 / n,  X   / n , es decir:
 X toma valores centrados en el parámetro a estimar (es un estimador insesgado).
 La dispersión (varianza) de X tiende a 0 al crecer n (hay un “n” en el denominador).
 X converge hacia  X n   (estimador consistente), en el sentido:
P
n 
 
Ley de los Grandes Números
P X n       0 para cada   0 .
n  8
La prueba se basa en la Desigualdad de Chebyshev:

P Xn     Var ( X n )
2
2
n
 0.
 2 n

6
Ley de probabilidad de
X n para n grande
4
Interpretación probabilística de la LGN:
Promediando un número suficientemente grande de
observaciones de un experimento, se obtiene un valor 2
que dista de la media poblacional una distancia tan
pequeña como queramos, con una probabilidad tan alta
como queramos. 0

ESTADÍSTICA
Aplicación estadística de la Ley de los Grandes Números:

La LGN Justifica que el valor concreto observado para la media muestral, X  x se pueda utilizar
como estimación del parámetro con el siguiente argumento:
Por las propiedades probabilísticas de la v.a. X y la aplicación de la Ley de los Grandes
Números sabemos que muy probablemente X tomará un valor próximo a (parámetro
desconocido); por lo tanto, una vez realizado el muestreo y obtenido el valor numérico
concreto (conocido) que toma la v.a. X ( X  x ) , está justificado concluir que dicho valor es
una aproximación razonable del parámetro 
Ley de los Grandes Números para otros estadísticos definidos a través de promedios:
El razonamiento anterior se puede hacer exte nsivo de manera no muy complicada a todos los
estadísticos muestrales definidos como promedios (varianza muestral, proporciones muestrales, …).
La LGN también permite concluir que dichos estadísticos muestrales proporcionan aproximaciones o
estimaciones naturales de los correspondientes parámetros poblacionales definidos como promedios
de alguna función en la población (varianza, probabilidad de un suceso, …).
Glivenko-Cantelli: Fn --> F
Ley de los Grandes Números para otros estadísticos en general:

Existen otras LGN que justifican las aproximaci ones de otros parámetros poblacionales que no
adoptan directamente la forma de promedios, a partir de los correspondientes estadísticos muestrales
que tampoco adoptan la forma de promedios.

ESTADÍSTICA
DISTRIBUCIÓN DE ESTADÍSTICOS Y ESTIMADORES

 Obtener estimadores de los parámetros más comunes puede ser “fácil”, pero no es suficiente.
 La muestra es aleatoria, es decir presenta variabilidad de unas ocasiones a otras.
 Cualquier estadístico o estimador T es también una v. a. por ser función de la muestra aleatoria.
 T, como toda v.a., seguirá su propia distribución o ley de probabilidad .
 El resultado de la estimación en cada ocasión concreta no tiene ningún valor por sí mismo si no
valoramos la precisión de esa estimación (la variabilidad del estimador).
 Para ello necesitamos conocer la ley de probabilidad del estadístico que estamos empleando.
 La ley de probabilidad de un estadístico a veces recibe el nombre de distribución muestral.
 Conocer la distribución de los estadísticos es imprescindible para:
- Conocer sus propiedades.
- Poder compararlos entre sí.
- Establecer la precisión de las estimaciones.
- Valorar los riesgos de error de los procesos inferenciales.
Ejemplo: El editor de una revista profesional de ingeniería desea estimar el salario medio () de los
graduados en Ingeniería Industrial en su primer empleo. Por razones de coste y tiempo necesario
para el estudio, en lugar de crear una base de datos completa de la última promoción de graduados,
decide trabajar con una muestra de 25 graduados, de los que obtiene su salario, y pretende utilizar el
valor que obtenga de X cRmo estimación de . El editor quiere saber qué posibilidades tiene de que
la estimación obtenida se desvíe a lo sumo en  50 € del valor real de . Para ello necesita conocer
la distribución de la media muestral para calcular
P  50  X    50.
ESTADÍSTICA
Ilustración del concepto de distribución de un estadístico T estimador de un parámetro 
0,8 Distribución de T
Distribución de la Población
0,6
0,4 parámetro
de interés de
la población
0,2
0
0 1 2 3 t2 tm  t1
Muestra 1 : x1,1 ,..., x1,n  T ( x1,1 ,..., x1,n )  t1

Muestra 2 : x2,1 ,..., x2,n  T ( x2,1 ,..., x2,n )  t 2
... ... ...
Muestra m : xm ,1 ,..., xm ,n  T ( x m ,1 ,..., x m ,n )  t m
... ... ... ...

ESTADÍSTICA
DISTRIBUCIÓN DE LA MEDIA MUESTRAL

 Estamos interesados en estimar la media poblacional=EX a partir de una m.a.s. X1, X2, ..., Xn.
 Sabemos que X será utilizado como estimador de  La LGN justifica la aproximación.
 Buscamos la distribución de X para poder además calibrar el error de la aproximación:
 Si conocemos que la ley de X es normal, N(,), entonces X  N (  ,  n ) . (ley exacta)
aprox
 Si la ley de X no es normal, pero n es grande, entonces X  N (  ,  n ) por el TCL. (asintótica)
 Entonces, podemos calcular la probabilidad de cometer a lo sumo un error  en la estimación:
     n   n   n 
 
P X      P    X       P
 
X 
 

  


   


 1  2  .

 n  n  n          
Distribución de la población Distribución de medias muestrales
1 4
0.75 3
n=100
0.5 2
para
n=25 diferentes
0.25
tamaños
muestrales
1
n=4
n= 4, 25, 100
0 0
 
ESTADÍSTICA
DISTRIBUCIÓN DE X n EN POBLACIONES NO NORMALES.
ILUSTRACIÓN DEL EFECTO LÍMITE CENTRAL (TCL).

Distribución de promedios de observaciones de una v.a. con distribución exp(1).
n=1 n=2 n=5 n=25
0 1 2 3 4 5 6 0 1 2 3 4 5 6 0 1 2 3 4 5 6 0 1 2 3 4 5 6
2
Distribución de promedios de observaciones de una v.a. con densidad f ( x)  1.5( x  1) , x  (0,2)
n=1 n=2 n=5 n=25
0 0,4 0,8 1,2 1,6 2 0 0,4 0,8 1,2 1,6 2 0 0,4 0,8 1,2 1,6 2 0 0,4 0,8 1,2 1,6 2

ESTADÍSTICA
Ejemplo:
El editor de una revista profesional de ingeniería desea estimar el salario medio de los graduados en
Ingeniería Industrial en su primer empleo. Se conoce que el Salario es una variable con ley normal y
=250 €. Se toma una muestra de n=25 titulados de los que obtiene la información sobre su salario.
El editor querría que la estimación (media muestral) obtenida a partir de esta muestra le diera un
valor que se desvíe a lo sumo en  50 € respecto al valor real con cierta probabilidad controlada.
a) Hallar la probabilidad de que el error esté efectivamente entre  50 €.
b) De qué tamaño tiene que ser la muestra para tener garantizado un error máximo de  50 € con
una probabilidad de 0.95.
Solución:
Xn  
Utilizamos la distribución de la media muestral: X n  N (  ,  n)   N (0,1)
 n
 
 50  X n    50   P 1  N (0,1)  1  (1)  (1)  0.68.
a) P    50  X    50   P  250  250   
 
 25 n 25 
 
 50  X n    50   1  2(0.2 n ).
b) 0.95  P    50  X n    50   P  250  250 
 
 n n n
1  2(0.2 n )  0.95  (0.2 n )  0.025   0.2 n  1.96  n  97 .

ESTADÍSTICA
PROBLEMAS BÁSICOS DE ESTADÍSTICA INFERENCIAL

1.-VARIABLES CUANTITATIVAS (POBLACIONES NORMALES)
1.1.- Estudio de una población normal. (Problemas de una muestra)
Población: XN(,), Muestra: X1, ...,Xn  X , S
1.1.1.- Inferencias sobre la media .
1.1.2.- Inferencias sobre la desviación típica 
1.2.- Comparación de 2 poblaciones normales. (Problemas de dos muestras)
Población 1: X1N(1, 1), Muestra 1: X 1,1 ,..., X 1, n  X 1 , S1 1
Población 2: X2N(2, 2), Muestra 2: X 2 ,1 ,..., X 2 ,n  X 2 , S 2 2
1.2.1.- Comparación de medias: Inferencias sobre 12 (12=0  12).

1.2.2.- Comparación de varianzas: Inferencias sobre 12/22 (12/22 =1  1=2).
1.3.- Ajuste a la normal. (Fn, Plots ...)
2.- VARIABLES CUALITATIVAS O ATRIBUTOS (PROPORCIONES)
2.1.- Estudio de una proporción. (Problemas de una muestra)
Población: X B(p), Muestra: X1, ...,Xn.  pˆ  X
Inferencias sobre la proporción p.
2.2.- Comparación de 2 proporciones p1p2. (Problemas de dos muestras)
Población 1: X1 B(p1), Muestra 1: X 1,1 ,..., X 1,n  pˆ 1  X 1 1
Población 2: X2 B(p2), Muestra 2: X 2 ,1 ,..., X 2 ,n  pˆ 2  X 2 2
Inferencias sobre p1p2 (p1p2=0  p1p2).

ESTADÍSTICA
ESTIMADORES DE PARÁMETROS EN MODELOS NORMALES Y PROPORCIONES

1.-VARIABLES CUANTITATIVAS (POBL. NORMALES)
1.1.- Estudio de una población normal.
1
1.1.1.- X  n i 1 X i estimador de la media .
n
1 n 1
    estimadores de y
2 2
(X i  X )2 , S 
n
1.1.2.- S  X  X
n  1 i 1 n 1 i 1 i
Nota: Se divide por n1 para conseguir E(S2)= Se llama cuasivarianza o varianza corregida.
A partir de ahora siempre las utilizaremos y las llamaremos varianza y desviación típica.
1.2.- Comparación de poblaciones normales con muestras independientes.
1.2.1.- Comparación de medias:
X1  X 2 estimador de 12.
1.2.2.- Comparación de varianzas con muestras independientes:
S12 S 22   estimador de  12  22
2.-VARIABLES CUALITATIVAS DICOTOMICAS O ATRIBUTOS (PROPORCIONES)
2.1.- Inferencias sobre una proporción p.
1 n
pˆ  X   X i (proporción muestral) estimador de p.
n i 1
2.2.- Comparación de 2 proporciones: p1p2.

pˆ 1  pˆ 2  X 1  X 2 estimador de p1p2.
ESTADÍSTICA
DISTRIBUCIONES EN EL MUESTREO DE POBLACIONES NORMALES

1.- Estudio de una población normal. útil cuando...
Parámetro Estimador Distribución Distribución bis Observaciones

X 
 N ( 0,1) conocida [1]
/ n
1M  X X  N ( , n)
X 
 t n 1 desconocida [2]
S/ n


(n  1)
 S2  2 S 2   n21 [3]
2.- Comparación de dos poblaciones normales.

Parámetro Estimador Distribución Distribución bis Observaciones
X 1  X 2  ( 1   2 )
 N (0,1)
 12  22 1, 2 conocidas [4]

n1 n2
X 1  X 2  ( 1  2 ) 1=2= desconocida
2M   12  22   t n1  n2  2

12 X1  X 2 X 1  X 2  N 1   2 ,
 n

n 2  s 1

1
2
S 
(n1  1) S12  (n2  1) S 22 [5]
 1 P
n1 n2 p
n1  n2  2
X 1  X 2  ( 1  2 ) 12 desconocidas
 t S n  S n   2
2 2 2
S12 S 22  1 1 2 2
[6]
 S n   S n 
1
2
1
2 2
2 2
2
n1 n2 n1  1 n2  1

S12  12 
 12  22  S 2
S 2  Fn1 1,n2 1 [7
[7]
1 2 S 22  22 ]
ESTADÍSTICA
Distribución  2 de Pearson (Chi cuadrado)

Se obtiene de sumar cuadrados de variables normales independientes.
n
X 1 ,... X n v.a. i.i.d ., X i  N (0,1)  X
i 1
i
2
  n2 : Distribución chi-cuadrado con n grados de libertad.
(n  1) S 2
Aplicación a la estimación de : X 1 ,... X n v.a. i.i.d ., X i  N (  ,  )   2
  n21
Está tabulada. En las tablas encontramos para distintos valores de n y   n ,  P  n   n ,  

2 2 2
 
Distribución Chi-Cuadrado Distribución Chi-Cuadrado
0,16 0,1
 2
G. L.
5
0,12 10
0,08
n
25
densidad
densidad
0,06
0,08
0,04
0,04
0,02
 
0 0
0 5 10 15 20 25 30 35 40 45 50
 n2,

ESTADÍSTICA
Distribución t de Student.
N (0,1)
Se obtiene del cociente  t n : Distribución t de Student con n grados de libertad.
1
n  2
n
(siendo el numerador y el denominador independientes)

Aparece al estandarizar X cuando sustituimos  desconocido por su estimador S (studentización).
X  (n -1) S 2 X 
X 1 ,... X n v.a. i.i.d ., X i  N ( , )  X  N ( , n) ó  N (0,1) ,   n21 indeps.   tn 1
 n  2
S n
Está tabulada. En las tablas encontramos para distintos valores de n y  t n ,  P t n  t n ,    

Para obtener valores en la cola izquierda se usa la simetría: t n ,1  t n , .
Para valores de n grande: t   N (0,1)
Distribución t de Student Distribución t de Student
0,4 0,4
G. L.
0,3
2
8
200

0,3 tn
densidad
densidad
0,2 0,2
0,1 0,1
 
0 0
-5 -4 -3 -2 -1 0 1 2 3 4 5 t n ,
ESTADÍSTICA
Distribución F de Fisher-Snedecor
1
n1  n2
Se obtiene del cociente
1
 Fn ,n : Distribución F con n y n grados de libertad.
1
n2 n 2
2
1 2 1 2
(siendo el numerador y el denominador independientes)

X 1,1 ,... X 1,n1 v.a. i.i.d . X 1,i  N ( 1 ,  1 ), S 12  12
Aplicación a la estimación de  12  2 : X ,... X
2   Fn1 1,n2 1
2 ,1 2 , n2 v.a. i.i.d ., X 2 ,i  N (  2 ,  2 ), S 22  22
Está tabulada. Para distintos valores de n1, n2 y encontramos Fn1 ,n2 ,  P Fn1 ,n2  Fn1 ,n2 ,   .  
Para obtener valores en la cola izquierda se usa: Fn1 ,n2 ,1  1 Fn2 ,n1 , .
Distribucíón F de Fisher-Snedecor Distribucíón F de Fisher-Snedecor

1,2 0,8
g.l. Num, g.l. Denom
Fn1 ,n2
5,5
1 5,25
25,5 0,6
0,8 25,25
densidad
densidad
0,6 0,4
0,4
0,2
0,2
 
0 0
0 1 2 3 4 5
Tema 10. Introducción a la Estadística Inferencial.
Fn1 ,n2 , 179
ESTADÍSTICA
Ejemplo: Dos modelos de pilas, M1 y M2, están diseñados para tener el mismo voltaje 1.5 V. El
Voltaje de una pila elegida al azar es una variable aleatoria con ley normal con =0.01 V para
ambos modelos. Para estudiar si las medias 1 y 2 son también iguales, se toman dos muestras de 50
pilas de cada modelo y se mide su voltaje.
a) Si las medias son iguales, 12, calcula la probabilidad de que la diferencia entre las medias
muestrales sea mayor de 0.01V.
b) Si 12=0.1V, calcula la probabilidad de que las medias muestrales difieran en menos de 0.05V.
c) ¿Qué tamaño muestral (n=n1=n2) habría sido suficiente en a) para que la probabilidad calculada
sea menor que 0.05?
Solución:
  12  22 
Conocemos la distribución de la diferencia de medias: 
X 1  X 2  N 1   2 ,  [4]
 n n 2 
 1
   
  
 X  X 2  ( 1  2 ) 0.01  0  0.01 
a)  
P X 1  X 2  0.01  P  1   2    2  5  0.
  2
 2
0.0001 0.0001   2 

1
 2   0.01 
n n2 50 50   50 
 1 
 
 
 
b)  
P X 1  X 2  0.05  P 0.05  X 1  X 2  0.05P
 0.05  0.1 X  X 2  ( 1   2 )
 1 
0.05  0.1
  -25   75  0. [4]
 0.0001  0.0001  12  22 0.0001 0.0001 
 

 50 50 n1 n 2
50 50 
 0.01 
c)  
0.05  P X 1  X 2  0.01  2  
 0.01 2 n 

 n
 1.96  n  8 .
  2

ESTADÍSTICA
DISTRIBUCIONES ASINTOTICAS (aproximaciones para MUESTRAS GRANDES)
MUESTREO DE PROPORCIONES
Parámetro Estimador Distribución límite Distribución límite bis Observaciones

p  p ~ N (0,1) Sólo para
aprox  p(1  p)  
1M p p pˆ  N  p,
n

 p(1  p) Muestra grande [8]
  Se basa en TCL
n
p 1  p 2  ( p1  p2 ) ~ N (0,1) Sólo para
aprox  p1 (1  p1 ) p 2 (1  p 2 )  
p1p2 p 1  p 2 pˆ 1  pˆ 2  N  p1  p 2 ,

 

p1 (1  p1 ) p2 (1  p2 ) Muestras grandes
[9]
2M  n1 n2  
n1 n2 Se basa en TCL
MUESTREO DE VARIABLES CUANTITATIVAS CUALESQUIERA
Parámetro Estimador Distribución límite Distribución límite bis Observaciones

aprox X  ~ Sólo para
  N (0,1) [10]
1M X X  N ( , n) Muestra grande
S n Se basa en TCL
X 1  X 2   1   2  ~
 aprox  12  22   N (0,1) Sólo para

X 1  X 2  N 1   2 ,
[11]
2M 12 X1  X 2


n1 n 2 
2
S1 S 2

2
Muestra grande
  n1 n 2 Se basa en TCL

ESTADÍSTICA
Ejemplo: Un proveedor suministra envíos que deberían aceptarse sólo si contienen a lo sumo un
10% de productos defectuosos. Un inspector de calidad acepta envíos siempre que una muestra de
tamaño 100 contenga a lo sumo 10 productos defectuosos (10%) y los rechaza en otro caso.
a) Si el proceso tiene una tasa de defectos del 10%, hallar la probabilidad de que la proporción
muestral se desvíe de este valor en más de 2 puntos porcentuales.
b) ¿Hallar la probabilidad de que acepte un envío si la tasa de defectuosos es de un 12%?
c) ¿Hallar la probabilidad de que rechace un envío en el que sólo un 8% son defectuosos?
Solución:
aprox  p(1  p) 
Utilizamos la distribución límite pˆ  N  p,
n

 que nos proporciona el TCL.
 
 
 
 
0.075  0.10 pˆ  0.1 0.125  0.10
a) P pˆ  0,1  0.02   P0.08  pˆ  0.12  P     2(0.83)  1  0.593.

[8]
 0.1(1  0.1) 0.1(1  0.1) 0.1(1  0.1) 
 
 100 100 100 
   
   
   
pˆ  0.12 0.10  0.12 0.105  0.12
b) P 
pˆ  0.1  P    
 

    0.46

  0.323.
 0.12(1  0.12) 0.12(1  0.12)   0.12(1  0.12) 
   
 100 100   100 
 
   
   
pˆ  0.08 0.10  0.08
c) P 
pˆ  0.1  P   
  1  
0.105  0.08   1   0.92
   0.18.
 0.081  0.08 0.08 * 0.92  
 0.08 * 0.92 
 

 100 100 


 100 

Nota: En todos los casos se ha utilizado la corrección por continuidad.

ESTADÍSTICA
TEMA 11.- INTERVALOS DE CONFIANZA

- Estimación puntual y por intervalos de confianza.
- Intervalos y cotas de confianza.
- Interpretación frecuentista de los I.C.
- Método general.
- Aplicaciones a modelos normales. Distribucíón F de Fisher-Snedecor
- Aplicaciones a modelos de proporciones. 1,2
g.l. Num, g.l. Denom
5,5
- Elección del tamaño muestral. 1 5,25
25,5
0,8 25,25
densidad
0,6
0,4
Ronald A. Fisher
0,2
0
0 1 2 3 4 5
Tema 11. Intervalos de Confianza. 183

ESTADÍSTICA
ESTIMACIÓN PUNTUAL Y POR INTERVALOS DE CONFIANZA

Obtener una estimación (puntual) de un parámetro es insuficiente:
 No calibramos el error que podemos estar cometiendo.
 Si obtenemos otra estimación basada en otra muestra, el valor será diferente: ¿Cuál es mejor?
 La probabilidad de “acertar” en una estimación puntual con un estimador ˆ es frecuentemente 0.
Siempre que la distribución del estimador ˆ sea continua se tiene
P ( Acertar con la estimación puntual )  P (ˆ   )  0
Es mucho más informativo un intervalo de valores que cubra el verdadero valor del parámetro con
una cierta garantía.
Unas veces tendremos éxito (el intervalo contendrá al verdadero valor del parámetro a estimar, que es
un valor fijo pero desconocido) y otras no.
Construiremos este intervalo a partir de la muestra, y sus extremos serán por tanto aleatorios.
Utilizamos un procedimiento de construcción que asegur e una alta probabilidad de éxito; es decir, de
que el intervalo construido cubra realmente al valor del parámetro desconocido.
Llamamos confianza o garantía a esa probabilidad de éxito y suele expresarse en %.
Puede lograrse tan cercana al 100% como requiera cada situación, pero a costa de aumentar la
amplitud del intervalo y perdiendo por lo tanto precisión.

ESTADÍSTICA
 La confianza o garantía de éxito la fija el investigador: 1- ó bien 100(1-a)%

Habitualmente se usan valores altos, del 95% ó 99%.
 El riesgo de error es el valor complementario  (100%); queda también fijado

Será pequeño. Habitualmente del 5% ó 1%.
Ejemplo: Para estimar un parámetro de una variable crítica para el funcionamiento de una central
nuclear nos interesará que  sea muy pequeño,  =0.001 por ejemplo. En otras ocasiones, como por
ejemplo la estimación de un parámetro que afecte a la longitud de las piezas producidas por una
máquina, donde las consecuencias de un posible error no serían tan graves, se podrá admitir un
mayor riesgo de error, por ejemplo  =0.05.
Estos intervalos de valores se obtienen a partir de la distribución muestral del estimador usado y se
llamarán Intervalos de Confianza.
De forma análoga se construyen cotas de confianza (inferiores o superiores)

ESTADÍSTICA
INTERVALOS Y COTAS DE CONFIANZA:

X variable aleatoria de interés definida sobre la población.
 parámetro de interés desconocido de la población (de la distribución de la variable X).
X1, …, Xn muestra aleatoria simple representativa de la población.
(0,1) fijado de antemano.
Intervalo de confianza del 100(1 para 

Es un intervalo formado por dos estadísticos L y U, L  L ( X 1 ,..., X n ), U  U ( X 1 ,..., X n ) , tal que
P L ( X 1 ,..., X n )    U ( X 1 ,..., X n )   1   .
Cota superior de confianza del 100(1 para 

Viene definida por un estadístico U  U ( X 1 ,..., X n ) , tal que P   U ( X 1 ,..., X n )   1   .
Ejemplo: Inspección de calidad, X=1 (D) ó 0 ( D ). Queremos obtener una cota superior para p=P(D)
Cota inferior de confianza del 100(1 para 

Viene definida por un estadístico L  L ( X 1 ,..., X n ) , tal que P   L ( X 1 ,..., X n )   1   .
Ejemplo: X= Rendimiento de un proceso químico. Queremos obtener una cota inferior para 
Los intervalos y cotas de confianza, además de depender de la muestra, también dependen de la

confianza 1- con la que queremos trabajar.

ESTADÍSTICA
INTERPRETACIÓN FRECUENTISTA DE LOS INTERVALOS DE CONFIANZA

Los extremos de los intervalos y cotas de confianza son aleatorios por ser función de la muestra.
Dada una muestra concreta ( X 1 ,..., X n )  ( x1 ,..., x n ) (datos), calcularemos los valores de L y U
L ( x1 ,..., x n )  l , U ( x1 ,..., x n )  u
y concluiremos que
  (l , u ) ó l    u con confianza 1   .
¿Por qué hablamos de confianza y no de probabilidad?

Una vez calculados los extremos L=l y U=u a partir de los datos, no hablaremos de probabilidad.
Decir P   (l , u )   1   no tiene sentido ya que el parámetro  no es una v. a. sino una cantidad
desconocida pero fija. Entonces, calculado el intervalo (l,u), puede ocurrir:
 Exito: Hemos acertado y el intervalo contiene al parámetro, o bien
 Fracaso: Hemos fallado y no lo contiene.
“Confiamos” en haber acertado ya que (L,U) satisface P L ( X 1 ,..., X n )    U ( X 1 ,..., X n )   1   (alto).
Si se repitiera muchas veces el muestreo y el cálculo del intervalo (l,u), en promedio una proporción
1 (100(1)%) de las veces el I.C. contendría al parámetro La proporción restante  fallaría.
Esto lo indicamos diciendo que el I.C. tiene una confianza (o garantía) 1.
Esta interpretación frecuentista de los IC sirve también para las cotas de confianza.

ESTADÍSTICA
Ilustración de la interpretación frecuentista de los Intervalos de Confianza para un parámetro 
0,8
Distribución de la Población
0,6
parámetro
0,4
de interés de 
la población
0,2
0
0 1 2 3
0 20 40 60 80 100
Muestra 1 : x1,1 ,..., x1, n  I 1  (l1 , u1 )

Muestra 2 : x 2,1 ,..., x 2, n  I 2  (l 2 , u 2 )
... ... ...
Muestra m : x m ,1 ,..., x m , n  I m  (l m , u m )
... ... ... ...
Nota: Las muestras provienen de un experimento de s imulación en el que se han construido I.C. al
95%. Podemos ver que en los 100 primeros tenemos 7 fallos y 93 aciertos. Si seguimos tomando
muestras, los porcentajes de aciertos y fallos se estabilizarán en torno a 95% y 5% respectivamente.

ESTADÍSTICA
CONFIANZA Y AMPLITUD (PRECISIÓN) DE UN I.C.

La utilidad práctica de un intervalo viene dada por dos medidas:
1. CONFIANZA: Mide la seguridad o garantía del procedimiento de construcción del intervalo.
2. AMPLITUD: Mide (inversamente) la precisión de la estimación realizada.
A la hora de valorar un I.C. hay que tener en cuenta que nos interesa:
 Que la confianza sea lo más alta posible. (Por ejemplo, preferiríamos 95% a 90%)
 Que la amplitud sea lo menor posible. (P. ej., preferiríamos 2,995    3,005 a 2,95    3,05 )
Ambos criterios entran en conflicto:
 Confianza y amplitud no se pueden controlar a la vez para un tamaño de muestra dado. Una
característica de los I.C. es que si aumenta la confianza aumenta la amplitud (disminuye la
precisión).
 Se consigue una confianza y amplitud prefijadas eligiendo el tamaño muestral adecuado.
A la amplitud se le suele llamar también “error máximo de estimación”
MÉTODO PARA CONSTRUIR INTERVALOS Y COTAS DE CONFIANZA

El método general sigue los siguientes pasos:
1. Elegir un buen estimador ˆ del parámetro  .
2. Obtener la distribución del estimador ˆ .
3. Delimitar una región de probabilidad  bajo esta distribución,
4. Despejar  .
ESTADÍSTICA
Aplicación a la obtención de un I.C. para  en el modelo N() con  conocida:

1. Estimador: ̂  X .
2. Distribución del estimador:
X 
X  N ( , n)   N (0,1).
 n
3. Región de probabilidad  bajo la distribución muestral:
0,4

0,3
 X  
densidad
0,2  P  z / 2   z / 2   1   .
  n 
0,1
0   

zz
4. Despejar el parámetro  : estimador puntual +- E (error máximo de estimación)
  
X  z / 2    X  z / 2   X  z / 2
o bien n con confianza 1-.
[1]
n n

ESTADÍSTICA
Para obtener cotas de confianza dejamos todo el riesgo de error  en una cola:
 X   
Cota inferior de confianza : P   z   1      X  z
 n  
  n
 X   
Cota superior de confianza : P  n   z   1      X  z n
 
0,4 0,4
 
0,3 0,3
densidad
densidad
0,2 0,2
0,1 0,1
   

0 0
z  z
Conflicto Confianza-Amplitud:
Si aumentamos la confianza 1-, aumenta z/2 y aumenta la amplitud o error máximo E
E  z / 2 / n .
Se puede diseñar el tamaño muestral para conseguir la confianza y el error deseados:

n  ( z / 2 / E ) 2 .

ESTADÍSTICA
Ejemplo: El editor de una revista profesional de ingeniería desea estimar el salario medio de los
graduados en Ingeniería Industrial en su primer empleo. Se conoce que el Salario es una variable
con ley normal y =250 €. Se toma una muestra de n=25 titulados de los que obtiene la información
sobre su salario, resultando X  1501 .57€ .
a) Obtener un I.C. al 95% para .
b) Obtener una cota inferior de confianza al 99% para .
c) Qué tamaño muestra se necesita en a) para que el error máximo sea de 50€.
Solución:
 
a) X  z / 2    X  z / 2 [1]
n n
250 250 250
1501.57  1.96    1501.57  1.96 , o bien   1501.57  1.96 ,
25 25 25
1403.57    1599.57 o bien   1501.57  98€ con una confianza del 95%.

b)   X  z
n
250
  1501.57  2.33  1384,77€ con una confianza del 99%.
25
c) n  ( z / 2 / E ) 2  (1.96  250 / 50) 2  96.04. n  97.

ESTADÍSTICA
Aplicación a la obtención de un I.C. para  en el modelo N():

1. Estimador: ˆ 2  S 2 .
(n  1)
2. Distribución del estimador:  2 S 2   n21
3. Región de probabilidad  bajo la distribución muestral:
0,1
0,08  2
Distribución n 1
 2 (n  1) S 2 
densidad
0,06
 P  n 1,1 2    n 1, 2   1   .
2
 
  2

0,04
0,02
0
  
 n21,1 / 2  n21, / 2
4. Despejar el parámetro  2 :
(n  1) (n  1)
S2  2  S 2 con confianza 1-. [3]
 2
n 1, 2  2
n 1,1 2

ESTADÍSTICA
 (n  1) S 2  (n  1)
Cota inferior de confianza : P   2
1,   1    2  S2
 2
 2
n
  n 1,
 (n  1) S 2  (n  1)
Cota superior de confianza : P  2   n1,1   1    2 
2
S2
   2
n 1,1
Distribución Chi-Cuadrado Distribución Chi-Cuadrado

0,1 0,1
0,08
 n21 0,08
 n21
densidad
densidad
0,06 0,06
0,04 0,04
0,02 0,02
0
  0
 
 n21,1  n21,
Si aumentamos la confianza 1-, aumenta 2n-1,/2 y disminuye 2n-1,/2 y por tanto aumenta la
amplitud. En este caso no existe una fórmula explícita para el tamaño muestral.

ESTADÍSTICA
Ejemplo: Se investiga el diámetro de barras de acero fabricadas por máquinas de extrudado, que
sigue una distribución normal. Aunque el proceso funciona bien en cuanto al valor medio, se han
observado ciertas anomalías que llevan a pensar que tal vez hay algún desajuste que está haciendo
que la fabricación tenga mayor variabilidad de la debida con lo que un alto porcentaje del producto
puede resultar inservible. El parámetro de interés a controlar en este caso es la varianza. En
concreto se quiere que la varianza del proceso sea menor que 0.5 m c 2 . Se dispone de una muestra de
tamaño n = 18 tal que X  8.63 cm y S 2  0.34 cm 2 . Con estos datos construimos una cota superior de
confianza del 95% obteniendo para 2:
Solución:
 2 n  1S 2   2 17 S 2 
C    2   1   ; C   2   0.95;  2  17  0.34  0.66. [3]
  n1,1  
 17 , 0.95  8.67
0,08
0,06
distribución  172
0,04
0,02 5% 95%
0
0 10 20 30 40 50
 172 , 0.95  8.67

Conclusión: los datos no soportan que la varianza cumpla las especificaciones que nosotros
habíamos establecido para ese proceso.

ESTADÍSTICA
INTERVALOS DE CONFIANZA PARA POBLACIONES NORMALES

1.- I.C. para los parámetros de una población normal
PROBLEMA ESTIMADOR DISTRIBUCION INTERVALO DE CONFIANZA 100(1-)%
Estimación de  X  
X  N ( 0,1)   X  z 2 [1]
conocida / n n
Estimación de  X  S
X  t n 1   X  t 2,n 1 [2]
desconocida S/ n n
 (n  1) 2 ( n  1) (n  1)
S   n21 S2  2  S2 [3]
Estimación de  S  2   2, n 1
2
 2
1 2, n 1
2.- Comparación de dos poblaciones normales

PROBLEMA ESTIMADOR DISTRIBUCION INTERVALO DE CONFIANZA 100(1- )%
X 1  X 2  ( 1   2 )
Comparación de medias  N (0,1)  12  22
X1  X 2  2
 2
1   2  X 1  X 2  z 2  [4]
y conocidas 1

2
n1 n2
n1 n2
X 1  X 2  ( 1  2 )
Comparación de medias  t n1  n2  2 1 1
X1  X 2 1 1 1   2  X 1  X 2  t 2,n  n 2 S p  [5]
=desconocidas s P  1 2
n1 n2
n1 n2
X 1  X 2  ( 1  2 )
Comparación de medias  t S12 S 22
X1  X 2 S12 S 22 1   2  X 1  X 2  t 2,  [6]
desconocidas  n1 n2
n1 n2
Comparación de varianzas S12  12 1 S12  12 S12

 Fn1 1,n2 1  
S12 S 22 Fn 1,n 1, 2 [7]
/ S 22  22 Fn1 1,n2 1, 2 , , S 22  22 S 22 2 1
Sp definido en la pg. 176

ESTADÍSTICA
Ejemplo: Una empresa está considerando la fabricación de un nuevo material sobre la base de
ciertos cálculos teóricos de su departamento de desarrollo. La propiedad clave del material es su
conductividad térmica, que interesa que sea lo menor posible y que el departamento de desarrollo
juzga como muy inferior a la del material actualmente utilizado. Para asegurarse, la empresa decide
fabricar un total de n=10 unidades del nuevo material. Se quiere obtener una cota superior de
confianza para el valor medio de la conductividad térmica de ese material y la empresa además juzga
asumible un riesgo =0.05. Supóngase normalidad. Los resultados muestrales obtenidos son
X  44.21 B tu / hr - ft-0 F y S  0.1 Btu/hr - ft- 0 F .
Solución:
 S 
La cota superior de confianza del 100(1-)% para  se deduce de P    X  tn 1,   1 , [2]
 n
S 0.1
y en nuestro caso particular se tiene   X  t 9,0.05  44.21  1.833  44.268
n 10
0.4
Distribución t
con 9 g.l.
0.3 P(t > t9,0.05) = 0.05
0.2
0.1
0
-5 0 t9,0.05=1.833

ESTADÍSTICA
Ejemplo: A la hora de instalar una nueva factoría de envases se presenta la elección entre dos
sistemas de cerrado de envases que se están empleando en fábricas ya instaladas. Se está interesado
en la resistencia de esos envases en función del tipo de cerrado de los mismos. Se decide estimar la
diferencia entre las resistencias medias mediante un intervalo de confianza del 95%. Para ello se
solicitan datos a las factorías que tienen instalados esos sistemas y de la primera responden enviando
datos relativos a una muestra de tamaño n1  8 con X1  25.38 . De la segunda nos llegan datos de una
muestra con n2  12 y X 2  29.46 . Además de pruebas anteriores con esos tipos de cerrado se sabe que
los modelos son normales y que  12  1.21 y  22  1.98 .
 12  22 [4]
 1   2  X 1  X 2  z 2 
n1 n2
Teniendo en cuenta que X1  X2 = 25.38-29.46 = -4.08 y z  z0.025  1.96 , obtenemos: 

2
 4.08  1.96 1.21  1.98  1   2  4.08  1.96 1.21  1.98

8 12 8 12
 5.182  1   2  2.978
En conclusión, como 0 IC las medias se pueden considerar diferentes con confianza 0.95.
El Error máximo de la estimación es de Emáx=1.102. Si quisiéramos que fuera como máximo de 0.2
unidades entonces deberíamos pedir a cada factoría un tamaño muestral igual a
z22  12   2 2  1.962
n 2
 1.21  1.98  306.36
Emax 0.2 2
es decir 307 elementos por población.
ESTADÍSTICA
Ejemplo: Se tienen dos tipos de lámparas A y B y se desea estudiar cuál de los dos tipos tarda más
tiempo en fundirse. Las duraciones se ajustan al modelo normal. Se toma una muestra de 8 lámparas
de cada tipo y se obtienen los siguientes datos medidos en días:
Tipo A : X 1  37.7, S1  6.65 Tipo B : X 2  35.4, S 2  5.86 .
Se pide valorar la existencia de diferencias en las duraciones medias a partir de un intervalo de
confianza del 90% para la diferencia de medias suponiendo varianzas iguales.
Solución:
1 1
La expresión del I.C. es: 1  2  X1  X 2  t 2,n  n 2 S p
1 2

n1 n2
[5]
n1  1S12  n 2  1S 22 7  44.22  7  34.34

X1  X2  37.7  35.4  2.3 ; 2
S    39.28 ; t14, 0.05  1.761
n1  n 2  2 14
p
Sustituyendo los valores en la expresión general obtenemos:

1 1
2.3  1.761  6.27  1   2  2.3  1.761  6.27   3.22  1   2  7.82.
4 4
0.4 Distribución t
con 14 grados
0.3 de libertad
0.2
0.05 0.9 0.05
0.1
0
-5 0 t14,0.05 = 1.761
Conclusión: 0 IC, luego con un 90% de confianza no existen diferencias.

ESTADÍSTICA
Ejemplo: En el ejemplo sobre los dos tipos de lámparas para el que realizamos una comparación de
medias en poblaciones normales con varianzas desconocidas pero iguales, construir un intervalo de
confianza del 95% para comparar las varianzas y avalar la suposición realizada. (Si el valor 1
pertenece a ese intervalo entonces nuestra suposición de varianzas iguales tendrá argumentos
consistentes con que sostenerse. El valor 1 corresponde precisamente a  1   2 ).
Solución:
Tenemos dos muestras de tamaño 8, de modo que S 1  6.65 y S 2  5.86 y el I.C. será: [7]
 S2  2 S2   1 44.22  12 44.22   1 44.22  12 44.22 

C  F7, 7, 0.975 12  12  F7 , 7 , 0.025 12   0.95  C   2  F7 , 7 , 0.025   0 .95  C    4 .99   0.95
 S 2  2 S 2  F
 7 , 7 , 0.025 34 . 34  2 34 .34   4 .99 34 .34  2
2 34 . 34 
 12
0.25  2  6.42.
2
0.7
0.6 F 7,7,0.025 = 4.99
0.5 F7,7,0.975 = 0.2
0.4
0.3
0.2
0.1 C=0.95
0
0 1 2 3 4 5 6
Distribución F7,7
Conclusión: 1 IC, luego se pueden considerar las varianzas iguales.
ESTADÍSTICA
Aplicación del método general a la obtención de un I.C. para una proporción p:

1. Estimador: pˆ  X .
~ N  p, p (1  p  pˆ  p ~ N (0,1).
2. Distribución del estimador: pˆ  
 
 
 n  p (1  p ) / n
3. Región de probabilidad  bajo esta distribución:
0,4

0,3
 pˆ  p 
densidad
 P  z  / 2   z / 2  ~
 1  .
 
0,2
 p(1  p) / n 
0,1
0   

zz
p(1  p)
4. Despejar p: p  pˆ  z / 2 El intervalo no es operativo porque los extremos dependen de p:
.
n
pˆ (1  pˆ )
 Estimamos p(1-p):  p  pˆ  z / 2 n con confianza aprox. 1-. [8]
1
 Acotamos p(1-p)1/4:   ˆ 
4n con confianza al menos 1-. (I.C. conservador)
p p z / 2

ESTADÍSTICA
 pˆ  p  pˆ (1  pˆ )
Cota inferior de confianza : P  z  ~
 1  p  X  z
 p(1  p) n  n
 
 pˆ  p  pˆ (1  pˆ )
Cota superior de confianza : 
P    z ~
   1  p  X  z
 p(1  p) n  n
Si aumentamos la confianza 1-, aumenta z/2 y aumenta el error máximo
p(1  p)
E  z / 2 .
n
El tamaño muestral para conseguir la confianza y el error deseados sería:

z2 / 2 p(1  p)
n .
E2
z2 / 2 pˆ 0 (1  pˆ 0 )
 Si disponemos de un estimador piloto p̂0 , entonces n
E2
z2 / 2
 Si no disponemos de información sobre p, entonces n
4E 2
I.C. conservador, utilizando p(1-p)1/4 (caso más desfavorable p=q=1/2).
Poco aconsejable para p y q extremos. Por ejemplo, si p=0.01, pq=0.0099<<1/4.

ESTADÍSTICA
INTERVALOS DE CONFIANZA BASADOS EN MUESTRAS GRANDES

INTERVALOS DE CONFIANZA PARA PROPORCIONES
PROBLEMA ESTIMADOR DISTRIBUCIÓN MUESTRAL INTERVALO DE CONFIANZA 100(1-)%
p  p ~ N (0,1)
Estimación de una  pˆ (1  pˆ )
p p(1  p) p  pˆ  z 2 [8]
proporción p. n
n
p 1  p 2  ( p1  p2 ) ~ N (0,1)
Comparación de  pˆ 1 (1  pˆ 1 ) pˆ 2 (1  pˆ 2 )
p 1  p 2 p1 (1  p1 ) p2 (1  p2 ) p1  p 2  pˆ 1  pˆ 2  z  2  [9]
proporciones p1p2.  n1 n2
n1 n2
INTERVALOS DE CONFIANZA PARA MEDIAS DE POBLACIONES CUALESQUIERA

PROBLEMA ESTIMADOR DISTRIBUCIÓN MUESTRAL INTERVALO DE CONFIANZA 100(1-)%
Estimación de  X  ~ S
X  N (0,1)   X  z / 2 [10]
n grande S n n
X 1  X 2  1   2  ~
Comparación de  N (0,1) S12 S 22
medias 12, X1  X 2 S12 S 22 1   2  X 1  X 2  z  2  [11]
n1, n2 grandes  n1 n2
n1 n 2

ESTADÍSTICA
TIPOLOGÍA GENERAL DE LOS INTERVALOS PARA MEDIAS Y PROPORCIONES:

Parámetro = Estimador  Error máximo de estimación
Parámetro = Estimador  Factor de  Desv. típica

confianza del estimador
La desviación típica del estimador depende de:

El Factor de confianza depende de:  El estimador usado.
 La confianza deseada .  El modelo o población en estudio.
 La distribución del estimador.  El tamaño muestral.
Frecuentemente se desconoce y debe estimarse
El error máximo de estimación se interpreta como la máxima posible diferencia entre el parámetro
(desconocido) y la estimación puntual (conocida y que se usa como centro del intervalo) en el caso de
que el I.C. fuese correcto.
TIPOLOGÍA GENERAL DE LOS INTERVALOS PARA VARIANZAS:

Parámetro  (Estimador  A , Estimador  B)
Los factores A y B dependen de la confianza y de la distribución del estimador, que a su vez depende
del tamaño muestral.
ESTADÍSTICA
ELECCIÓN DEL TAMAÑO MUESTRAL

La tabla siguiente muestra las fórmulas para calcular los tamaños muestrales necesarios para
conseguir I.C. con una confianza prefijada 1- y un error máximo prefijado Emáx.
PROBLEMA ERROR MÁXIMO TAMAÑO MUESTRAL NECESARIO
Estimación de   z2 2 2
E máx  z 2 n
conocida n 2
E máx
Estimación de  S z2 2 S 2
E máx  t n 1, 2 Se resuelve por tanteo para n pequeño. Si n grande: n 
desconocida. S2 estimador piloto. n 2
Emáx
Comparación de medias   12  22 z2 2 (12   22 )
E máx  z 2  n1  n2 
y conocidas n1 n2 2
Emáx
Comparación de medias  1 1 z2 2 2S p2
=desconocidas. Emáx  t n1 n2 2, 2 S p  Se resuelve por tanteo. Para n1 n2 grandes: n1  n2  2
Sp2 estimador piloto. n1 n2 Emáx
Comparación de medias  S12 S 22 z2 2 (S12  S22 )
desconocidas E máx  t , 2 
n1 n 2 Se resuelve por tanteo. n1 n2 grandes: n1  n2  2
S12 , S22 estimadores piloto. Emáx
Estimación de una proporción p. pˆ (1  pˆ ) 1 z2 2 pˆ 0 (1 pˆ 0 ) z2 2 1 4
p̂0 estimador piloto
E máx  z  2  z 2 n 2
 2
n 4n Emáx Emáx
Comparación de proporciones p1p2. 2
pˆ10 (1 pˆ10 )  pˆ20 (1 pˆ20 ) z 2 (1 4 1 4)
pˆ1(1 pˆ1) pˆ2(1 pˆ2) 2
n  z 2 
p̂10 y p̂20 estimadores piloto Em,ax  z 2  2
Emáx 2
Emáx
n1 n2
n1=n2 Nota: Caso más desfavorable para estimar proporciones: p=q=1/2  p(1-p)=1/4
Nota: No existen expresiones explícitas para el caso de los I.C. para varianzas.
ESTADÍSTICA
Ejemplo: Un fabricante de antenas parabólicas quiere ofrecer a sus clientes un periodo de garantía
de un año y le gustaría saber, antes de decidirse cuál es la proporción p de antenas que debería
reparar gratuitamente en ese caso. Para ello toma una muestra de 100 antenas que se prueban
durante un año. De esas 100 antenas se estropean 18.
Solución:
pˆ (1  pˆ )
El intervalo de confianza tiene la forma: p  pˆ  z 2 n
Sustituyendo los valores obtenemos
 0.181  0.18 0.181  0.18 
C  0.18  1.65  p  0.18  1.65   0.9

 100 100 
0.116  p  0.243.
El Error máximo de la estimación es E max=0.063. Si el fabricante quisiera una precisión mayor en el

intervalo de confianza, de forma que el error máximo en la estimación de la proporción fuera de 0.02
podríamos utilizar la muestra inicial que ya tenemos como muestra piloto y experimentar con una
muestra adicional de
pˆ 1  pˆ z 22 0.181  0.181.65 2
n 2
  1004.6 ,
E max 0.02 2
de modo que deberíamos probar otras 1005 antenas para conseguir la precisión requerida a la
estimación.

ESTADÍSTICA
Ejemplo: En el ejemplo anterior, al considerar que la tasa de fallos en el primer año de vida era
excesiva, un distribuidor del producto decide comparar el funcionamiento de las antenas de ese
fabricante (A) con las de otro fabricante B. Toma una muestra de 200 antenas de este último y
durante el primer año de vida se observan 22 fallos. Comparar las proporciones de fallos mediante
un I.C. al 95%. Hallar los tamaños muestrales necesarios para que el error máximo de la estimación
con la confianza del 95% sea 0.05
Solución:
pˆ 1 (1  pˆ 1 ) pˆ 2 (1  pˆ 2 )
El intervalo de confianza tiene la forma: p1  p 2  pˆ 1  pˆ 2  z  2
n1

n2
Sustituyendo los valores obtenemos
 0.181  0.18 0.111  0.11 
C  p1  p2  0.18  0.11  1.96    0.95

 100 200 
p1  p2  0.07  0,087.
Como 0 IC, con un 95% de confianza no existen diferencias.
Para obtener el tamaño muestral utilizamos los estimadores anteriores como pilotos:
pˆ 1 (1  pˆ 1 )  pˆ 2 (1  pˆ 2 ) 0.18  0.82  0.11 0.89

n1  n2  z2 / 2 2
 1.96 2  377.25 ,
E 0.05 2
de modo que deberíamos probar 378 antenas de cada tipo para conseguir la precisión requerida a la
estimación.

Clase 7

Transféré par

Informations du document

Titre original

Copyright

Formats disponibles

Partager ce document

Partager ou intégrer le document

Options de partage

Avez-vous trouvé ce document utile ?

Ce contenu est-il inapproprié ?

Droits d'auteur :

Formats disponibles

Clase 7

Transféré par

Droits d'auteur :

Formats disponibles

ESTADÍSTICA

GRADOS EN INGENIERÍA MECÁNICA, INGENIERÍA QUÍMICA E

TEMA 10.- INTRODUCCIÓN A LA

- Distribuciones muestrales para muestras grandes. William S. Gosset (Student)

DE LA ESTADÍSTICA DESCRIPTIVA A LA ESTADÍSTICA INFERENCIAL

EJEMPLO: Dos proveedores A y B suministran a un fabricante el mismo producto químico cuya

Tema 10. Introducción a la Estadística Inferencial. 165

(serán usados habitualmente como estimadores de los parámetros  y , respectivamente).

mediana poblacional ˆ  Me mediana muestral

Tema 10. Introducción a la Estadística Inferencial. 166

LEY DE LOS GRANDES NÚMEROS

La prueba se basa en la Desigualdad de Chebyshev:

Aplicación estadística de la Ley de los Grandes Números:

Ley de los Grandes Números para otros estadísticos en general:

Tema 10. Introducción a la Estadística Inferencial. 168

DISTRIBUCIÓN DE ESTADÍSTICOS Y ESTIMADORES

Ilustración del concepto de distribución de un estadístico T estimador de un parámetro 

Muestra 1 : x1,1 ,..., x1,n  T ( x1,1 ,..., x1,n )  t1

Tema 10. Introducción a la Estadística Inferencial. 170

DISTRIBUCIÓN DE LA MEDIA MUESTRAL

DISTRIBUCIÓN DE X n EN POBLACIONES NO NORMALES.

ILUSTRACIÓN DEL EFECTO LÍMITE CENTRAL (TCL).

Tema 10. Introducción a la Estadística Inferencial. 172

Tema 10. Introducción a la Estadística Inferencial. 173

PROBLEMAS BÁSICOS DE ESTADÍSTICA INFERENCIAL

Población 2: X2N(2, 2), Muestra 2: X 2 ,1 ,..., X 2 ,n  X 2 , S 2 2

1.2.1.- Comparación de medias: Inferencias sobre 12 (12=0  12).

Población 2: X2 B(p2), Muestra 2: X 2 ,1 ,..., X 2 ,n  pˆ 2  X 2 2

Inferencias sobre p1p2 (p1p2=0  p1p2).

ESTIMADORES DE PARÁMETROS EN MODELOS NORMALES Y PROPORCIONES

2.2.- Comparación de 2 proporciones: p1p2.

DISTRIBUCIONES EN EL MUESTREO DE POBLACIONES NORMALES

Parámetro Estimador Distribución Distribución bis Observaciones

2.- Comparación de dos poblaciones normales.

Distribución  2 de Pearson (Chi cuadrado)

Está tabulada. En las tablas encontramos para distintos valores de n y   n ,  P  n   n ,  

Tema 10. Introducción a la Estadística Inferencial. 177

(siendo el numerador y el denominador independientes)

Está tabulada. En las tablas encontramos para distintos valores de n y  t n ,  P t n  t n ,    

(siendo el numerador y el denominador independientes)

Distribucíón F de Fisher-Snedecor Distribucíón F de Fisher-Snedecor

Tema 10. Introducción a la Estadística Inferencial. 180

DISTRIBUCIONES ASINTOTICAS (aproximaciones para MUESTRAS GRANDES)

Parámetro Estimador Distribución límite Distribución límite bis Observaciones

MUESTREO DE VARIABLES CUANTITATIVAS CUALESQUIERA

Parámetro Estimador Distribución límite Distribución límite bis Observaciones

Tema 10. Introducción a la Estadística Inferencial. 181

Nota: En todos los casos se ha utilizado la corrección por continuidad.

Tema 10. Introducción a la Estadística Inferencial. 182

TEMA 11.- INTERVALOS DE CONFIANZA

Tema 11. Intervalos de Confianza. 183

ESTIMACIÓN PUNTUAL Y POR INTERVALOS DE CONFIANZA

Tema 11. Intervalos de Confianza. 184

 La confianza o garantía de éxito la fija el investigador: 1- ó bien 100(1-a)%

 El riesgo de error es el valor complementario  (100%); queda también fijado

De forma análoga se construyen cotas de confianza (inferiores o superiores)

Tema 11. Intervalos de Confianza. 185

INTERVALOS Y COTAS DE CONFIANZA:

Intervalo de confianza del 100(1 para 

Cota superior de confianza del 100(1 para 

Cota inferior de confianza del 100(1 para 

Los intervalos y cotas de confianza, además de depender de la muestra, también dependen de la

Tema 11. Intervalos de Confianza. 186