Académique Documents
Professionnel Documents
Culture Documents
Estimadores
Puntuales y
De Confianza
Facilitador:
Alumna:
2015
INTRODUCCIN
El presente trabajo se hace con el propsito de ampliar nuestro conocimiento acerca
de la estadstica pero especficamente de conocer los estimadores puntuales y de
confianza para lo cual se desarrollaran ciertos puntos como lo son:
Qu es una estimacin?
Cuando queremos realizar un estudio de una poblacin cualquiera de la que
desconocemos sus parmetros, por ejemplo su media poblacional o la probabilidad de xito
si la poblacin sigue una distribucin binomial, debemos tomar una muestra aleatoria de
dicha poblacin a travs de la cual calcular una aproximacin a dichos parmetros que
desconocemos y queremos estimar. Bien, pues esa aproximacin se llama estimacin.
Adems, junto a esa estimacin, y dado que muy probablemente no coincida con el valor
real del parmetro, acompaaremos el error aproximado que se comete al realizarla.
Estimacin puntual
Una estimacin puntual del valor de un parmetro poblacional desconocido (como
puede ser la media , o la desviacin estndar ), es un nmero que se utiliza para
aproximar el verdadero valor de dicho parmetro poblacional. A fin de realizar tal
estimacin, tomaremos una muestra de la poblacin y calcularemos el parmetro muestral
asociado (x para la media, s para la desviacin estndar, etc.). El valor de este parmetro
muestral ser la estimacin puntual del parmetro poblacional.
Por ejemplo, supongamos que la compaa Sonytron desea estimar la edad media de los
compradores de equipos de alta fidelidad. Seleccionan una muestra de 100 compradores y
calculan la media de esta muestra, este valor ser un estimador puntual de la media de la
poblacin.
Las estimaciones de intervalo que indican la precisin de una estimacin y son por tanto
preferibles a las estimaciones de punto
Ejemplo:
Si decimos que una distancia s a medido como 5.28 metros (m), estamos dando una
estimacin de punto. Por otra parte, si decimos que la distancia es 5.28 0.03 m, (sea, que
est entre 5.25 y 5.31 m), estamos dando una estimacin de intervalo
El margen de error o la percepcin de una estimacin nos informa su fiabilidad.
siguiente:
. Como en este caso no conocemos el parmetro y lo queremos
estimar por medio de la media de la muestra, slo se despejar de la formula anterior,
quedando lo siguiente:
De esta frmula se puede observar que tanto el tamao de la muestra como el valor de z se
conocern. Z se puede obtener de la tabla de la distribucin normal a partir del nivel de
confianza establecido. Pero en ocasiones se desconoce
por lo que en esos casos lo
correcto es utilizar otra distribucin llamada "t" de student si la poblacin de donde
provienen los datos es normal.
Para el caso de tamaos de muestra grande se puede utilizar una estimacin puntual de la
desviacin estndar, es decir igualar la desviacin estndar de la muestra a la de la
poblacin (s= ).
Ejemplos:
1. Se encuentra que la concentracin promedio de zinc que se saca del agua a partir de
una muestra de mediciones de zinc en 36 sitios diferentes es de 2.6 gramos por
mililitro. Encuentre los intervalos de confianza de 95% y 99% para la concentracin
media de zinc en el ro. Suponga que la desviacin estndar de la poblacin es 0.3.
Solucin:
La estimacin puntual de
95% es 1.96, por lo tanto:
Con un nivel de confianza del 96% se sabe que la duracin media de los focos que
produce la empresa est entre 765 y 765 horas.
Ejemplos:
1. Un fabricante de reproductores de discos compactos utiliza un conjunto de pruebas
amplias para evaluar la funcin elctrica de su producto. Todos los reproductores de
discos compactos deben pasar todas las pruebas antes de venderse. Una muestra
aleatoria de 500 reproductores tiene como resultado 15 que fallan en una o ms
pruebas. Encuentre un intervalo de confianza de 90% para la proporcin de los
reproductores de discos compactos de la poblacin que no pasan todas las pruebas.
Solucin:
n=500
p = 15/500 = 0.03
z(0.90) = 1.645
0.0237<P<0.0376
Se sabe con un nivel de confianza del 90% que la proporcin de discos defectuosos
que no pasan la prueba en esa poblacin est entre 0.0237 y 0.0376.
VARIANZA DE UN ESTIMADOR
Otra propiedad importante de un estimador es su varianza (o su raz cuadrada, la desviacin
estndar).
La importancia de la desviacin estndar es que nos permite darle un sentido numrico a la
cercana del valor del estimador a su valor esperado.
Entre menor sea la desviacin estndar (o la varianza) de un estimador, ser ms probable
que su valor en una muestra especfica se encuentre ms cerca del valor esperado. Para
aclarar esto, considere dos estimadores T1 y T2, suponga que ambos son instigados y
suponga que la varianza de T1 es menor que la de T2 Qu quiere decir esto? Simplemente
que en un entorno fijo del valor del parmetro, los valores de T1 son ms probables que los
de T2. O sea que vamos a encontrar a T1 ms cerca del valor del parmetro que a T2. Esto
hace que nuestras preferencias estn con T1.
Cuando un estimador tiene una varianza menor que otro decimos que el estimador es ms
eficiente.
En el pizarrn vemos algunos estimadores instigados:
distribucin
es una distribucin normal estndar. Supngase que la varianza de
2
la poblacin
es desconocida. Qu sucede con la distribucin de esta estadstica si se
reemplaza
por s? La distribucin t proporciona la respuesta a esta pregunta.
La media y la varianza de la distribucin t son
respectivamente.
=0 y
para
>2,
4. A medida que
, la secuencia de curvas t se aproxima a la curva normal
estndar, por lo que la curva z recibe a veces el nombre de curva t con gl =
La distribucin de la variable aleatoria t est dada por:
grados de libertad.
Sean X1, X2, . . . , Xn variables aleatorias independientes que son todas normales con media
y desviacin estndar
t con
rea de
a la izquierda, es igual al valor t negativo que deja un rea de
derecha de la distribucin. Esto es, t0.95 = -t0.05, t0.99=-t0.01, etc.
en la cola
Para encontrar los valores de t se utilizar la tabla de valores crticos de la distribucin t del
libro Probabilidad y Estadstica para Ingenieros de los autores Walpole, Myers y Myers.
Ejemplo:
El valor t con
= 14 grados de libertad que deja un rea de 0.025 a la izquierda, y por
tanto un rea de 0.975 a la derecha, es
t0.975=-t0.025 = -2.145
Si se observa la tabla, el rea sombreada de la curva es de la cola derecha, es por esto que
se tiene que hacer la resta de
. La manera de encontrar el valor de t es buscar el
valor de
en el primer rengln de la tabla y luego buscar los grados de libertad en la
primer columna y donde se intercepten
se obtendr el valor de t.
Como t0.05 deja un rea de 0.05 a la derecha, y t 0.025 deja un rea de 0.025 a la izquierda,
encontramos un rea total de 1-0.05-0.025 = 0.925.
P( t0.025 < t < t0.05) = 0.925
Tiene una distribucin muestral que es una distribucin ji-cuadrada con gl=n-1 grados de
libertad y se denota X2 (X es la minscula de la letra griega ji). El estadstico ji-cuadrada
est dado por:
para x>0
La tabla que se utilizar para estos apuntes es la del libro de probabilidad y
estadstica de Walpole, la cual da valores crticos
(gl) para veinte valores especiales de
. Para denotar el valor crtico de una distribucin X 2 con gl grados de libertad se usa el
smbolo
(gl); este valor crtico determina a su derecha un rea de
bajo la curva X2
y sobre el eje horizontal. Por ejemplo para encontrar X20.05(6) en la tabla se localiza 6 gl en
el lado izquierdo y
a o largo del lado superior de la misma tabla.
INTERVALOS DE CONFIANZA.
1. Intervalo de confianza para (media) con (desviacin estandar) conocida.
La media muestral
normal:
Por lo tanto, el intervalo de confianza del 95% para la vida media en meses de toda la
poblacin de limpiaparabrisas, es decir para
Con una confianza del 95%, la vida media de la poblacin de limpiaparabrisas que vende
este mayorista est entre 19,824 meses y 22,176 meses.
Si extraemos varias muestras del mismo tamao y calculamos un intervalo de confianza
para cada muestra, el 95% de todos los intervalos van a incluir a la vida media poblacional
en meses de todos los parabrisas que vende este mayorista.
2. Intervalo de confianza para con desconocida.
El administrador de una planta industrial generadora de energa desea estimar, por
intervalo, la cantidad de carbn que se consumi por termino medio semanalmente durante
ao pasado. Para ello toma una muestra de 10 semanas. El consumo medio fue de 11.400
toneladas, la desviacin estndar muestral 700 toneladas. Cul ser el intervalo de
confianza del 95% para el consumo medio semanal durante el ao pasado? (Supongamos
normalidad).
Tenemos X como la distribucin de toneladas de carbn consumidas cada semana del ao
pasado por la planta de energa y su media y su desviacin estndar desconocidas
Por lo tanto la estimacin del error estndar de la proporcin de establecimientos que tiene
claros signos de mala ser 0,057.
El intervalo de confianza del 95% para la probabilidad de xito poblacional p viene dado
por:
Donde
es el valor z*, de manera que el 95% del rea bajo la curva
normal se incluye entre 1,96 y 1,96.
Por lo tanto, con un nivel de confianza del 95%, la proporcin de establecimientos de esta
cadena de comida rpida que tiene mala administracin estar entre 0,20788 y 0,39212.
Si extraemos varias muestras del mismo tamao y calculamos un intervalo de confianza
para cada muestra, el 95% de esos intervalos van a incluir a la verdadera proporcin de
establecimientos con mala administracin
PRUEBAS DE HIPTESIS
Otra manera de hacer inferencia es haciendo una afirmacin acerca del valor que el
parmetro de la poblacin bajo estudio puede tomar. Esta afirmacin puede estar basada en
alguna creencia o experiencia pasada que ser contrastada con la evidencia que nosotros
obtengamos a travs de la informacin contenida en la muestra. Esto es a lo que llamamos
Prueba de Hiptesis
Una prueba de hiptesis comprende cuatro componentes principales:
-Hiptesis Nula
-Hiptesis Alternativa
-Estadstica de Prueba
-Regin de Rechazo
La Hiptesis Nula, denotada como H0 siempre especifica un solo valor del parmetro de la
poblacin si la hiptesis es simple o un conjunto de valores si es compuesta (es lo que
queremos desacreditar)
Como las conclusiones a las que lleguemos se basan en una muestra, hay posibilidades de
que nos equivoquemos.
Dos decisiones correctas son posibles:
Rechazar H0 cuando es falsa
No Rechazar H0 cuando es verdadera.
Dos decisiones incorrectas son posibles:
Rechazar H0 cuando es verdadera
No Rechazar H0 cuando es falsa.
Tamao de los errores al tomar una decisin incorrecta en una Prueba de Hiptesis
Si
entonces la regin se divide en dos partes, una parte estar en la cola
derecha de la distribucin de la estadstica de prueba y la otra en la cola izquierda de la
distribucin de la estadstica de prueba.
Conclusiones de una Prueba de Hiptesis
Si rechazamos la Hiptesis Nula, concluimos que hay suficiente evidencia estadstica
para inferir que la hiptesis nula es falsa
Si no rechazamos la Hiptesis Nula, concluimos que no hay suficiente evidencia
estadstica para inferir que la hiptesis nula es falsa
Estadstica de Prueba
La Estadstica de Prueba es una estadstica que se deriva del estimador puntual del
parmetro que estemos probando y en ella basamos nuestra decisin acerca de si rechazar o
no rechazar la Hiptesis Nula.
Ejemplo:
Siempre se calcula considerando la Hiptesis Nula como si fuera verdadera.
donde
con
).
Anlisis
Dado el modelo de regresin simple, si se calcula la esperanza (valor esperado) del valor Y,
se obtiene:
Derivando respecto a
incrementar en
donde
que
con
).
CORRELACIN
La correlacin trata de establecer la relacin o dependencia que existe entre las dos
variables que intervienen en una distribucin bidimensional.
Es decir, determinar si los cambios en una de las variables influyen en los cambios de la
otra. En caso de que suceda, diremos que las variables estn correlacionadas o que hay
correlacin entre ellas.
TIPOS DE CORRELACIN
1 Correlacin directa
La correlacin directa se da cuando al aumentar una de las variables la otra aumenta.
La recta correspondiente a la nube de puntos de la distribucin es una recta creciente.
2 Correlacin inversa
La correlacin inversa se da cuando al aumentar una de las variables la otra disminuye.
La recta correspondiente a la nube de puntos de la distribucin es una recta decreciente.
3 Correlacin nula
La correlacin nula se da cuando no hay dependencia de ningn tipo entre las variables.
En este caso se dice que las variables son incorreladas y la nube de puntos tiene una forma
redondeada.
GRADO DE CORRELACIN
El grado de correlacin indica la proximidad que hay entre los puntos de la nube de
puntos. Se pueden dar tres tipos:
1. Correlacin fuerte
La correlacin ser fuerte cuanto ms cerca estn los puntos de la recta.
2. Correlacin dbil
La correlacin ser dbil cuanto ms separados estn los puntos de la recta.
3. Correlacin nula
Propiedades
Las notas de 12 alumnos de una clase en Matemticas y Fsica son las siguientes:
Matemticas
Fsica
2
3
4
4
5
6
6
7
7
8
10
10
1
3
2
4
4
4
6
4
6
7
9
10
yi
1
3
2
4
4
4
6
4
6
7
9
10
60
xi 2
xi yi
2
9
8
16
20
24
36
28
42
56
90
100
431
4
9
16
16
25
36
36
49
49
64
100
100
504
y i2
1
9
4
16
16
16
36
16
36
49
81
100
380
2 Calculamos la covarianza.
2
1
2
1
4
5
3
2
0
yi
1
2
3
1
2
3
1
2
fi
2
1
2
1
4
5
3
2
20
xi f i
0
0
0
2
8
10
12
8
40
xi 2 f i
0
0
0
4
16
20
48
32
120
yi fi
2
2
6
1
8
15
3
4
41
yi2 fi
2
4
18
1
16
45
3
8
97
xi yi fi
0
0
0
2
16
30
12
16
76
CONCLUSIN
Concluimos que la estimacin es un proceso que permite decir algo de los hechos
poblacionales (parmetros), utilizando para ello la informacin proporcionada por una
muestra seleccionada de la poblacin de inters generalmente por mtodos aleatorios. Se
analizan las formas adecuadas para el establecimientos del conocimientos numricos o
abstracto de un parmetro de la una poblacin y que evidentemente nos es desconocidos
partiendo de una informacin suministrada por la muestra
Tambin se pudo aprender los dos tipos de estimacin que se pueden efectuar como:
Estimacin Puntual: el cual consiste en asignarle un valor especfico al estimador
Estimacin Intervalo: el cual consiste en asignar un rango de valores, el valor estimador.
El objetivo de la estimacin puntual es usar una muestra para obtener nmeros que
en algn sentido sean los que mejor representan a los verdaderos valores de los parmetros
y en la estimacin por intervalos es el de obtener intervalos estrechos con alta
confiabilidad.
La distribucin t difiere de la de Z en que la varianza de t depende del tamao de la
muestra y siempre es mayor a uno. nicamente cuando el tamao de la muestra tiende a
infinito las dos distribuciones sern las mismas.
En cambio la distribucin ji-cuadrada es la distribucin muestral de s2. O sea que si se
extraen todas las muestras posibles de una poblacin normal y a cada muestra se le calcula
su varianza, se obtendr la distribucin muestral de varianzas.
La correlacin trata de determinar si los cambios en una de las variables influyen en los
cambios de la otra. En caso de que suceda, diremos que las variables estn correlacionadas
o que hay correlacin entre ellas.
EXISTEN 3 TIPOS DE CORRELACIN:
Correlacin directa
Correlacin inversa
Correlacin nula