Vous êtes sur la page 1sur 11

Direccin General de Educacin

Superior Tecnologa
Instituto tecnolgico de Lerma

Alumno:
Daniel Arsenio Caamal Bojrquez

Profesor:
Cancino Crdova Luis Alberto

2
do
Semestre Carrera: Ing. Mecatrnica

Estadstica y control de calidad

Unidad 2
Inferencia estadstica
Resumen
Contenido
Inferencia estadstica .......................................................................................................................... 3
Concepto ......................................................................................................................................... 3
Estimacin ....................................................................................................................................... 4
Prueba de hiptesis ......................................................................................................................... 5
Mtodo clsico de estimacin puntual ........................................................................................... 8
Estimador insesgado ....................................................................................................................... 9
Intervalos de confianza ..................................................................................................................... 10












Inferencia estadstica
Concepto
Es el procedimiento que permite realizar afirmaciones de naturaleza probabilstica
respecto a una poblacin, en base a los resultados obtenidos en una muestra seleccionada
de esa poblacin.
Puesto que las poblaciones son descritas por medidas numricas descriptivas, llamados
parmetros, se puede hacer inferencias acerca de la poblacin haciendo inferencias
respecto a sus parmetros.
Puede definirse la Inferencia Estadstica como
El conjunto de mtodos estadsticos que permiten deducir (inferir) como se distribuye la
poblacin en estudio o las relaciones estocsticas entre varias variables de inters a partir
de la informacin que proporciona una muestra
Para que un mtodo de inferencia estadstica proporcione buenos resultados debe de:
Basarse en una tcnica estadstico-matemtica adecuada al problema y
suficientemente validada.
Utilizar una muestra que realmente sea representativa de la poblacin y de un
tamao suficiente

Objetivos de la Inferencia Estadstica.
El objetivo de la Estadstica es medir y modelar la variabilidad del proceso mediante un
modelo probabilstico.
Para modelar la variabilidad de una variable aleatoria si slo se dispone del conocimiento
de una muestra de la misma se sigue el siguiente modo de actuacin:

1. Planteamiento del problema.
2. Seleccin de la muestra (Muestreo estadstico), en algunos estudios la muestra se
obtiene por simulacin (Simulacin Estadstica)
3. Estudio descriptivo de la muestra, analtico y grfico (Estadstica Descriptiva).
4. En base al conocimiento de los modelos probabilsticos ms utilizados y teniendo
en cuenta el planteamiento del problema y el estudio descriptivo previo, elegir un
modelo de probabilidad (Teora de la Probabilidad).

5. Estimar los parmetros del modelo supuesto a partir de las observaciones
mustrales utilizando los mtodos de Inferencia Estadstica: estimacin puntual,
estimacin por intervalos de confianza y contrastes de hiptesis paramtricos.
6. Chequear que el modelo de probabilidad ajustado a los datos es adecuado y que se
verifican las hiptesis supuestas en el estudio, por ejemplo, que las observaciones
mustrales son independientes, que no existen observaciones errneas,...,etc.
Para ello se utilizan los mtodos de
Inferencia no Paramtrica.
7. Si se acepta que el modelo ajustado es adecuado se puede utilizar para obtener
resultados y conclusiones sobre la variable en estudio. En caso contrario, se debe
reformular el modelo de probabilidad y repetir el proceso desde el paso 4
Estimacin

Efectuar una estimacin es usar las medidas calculadas en una muestra (estimadores)
para predecir el valor de uno o ms parmetros de la poblacin.
Un estimador es a menudo expresado en trminos de una frmula matemtica que da la
estimacin como una funcin de las medidas mustrales.
La estimacin de un parmetro poblacional puede realizarse de dos maneras:
Por punto.
Se usan las medidas de la muestra para calcular un nico valor numrico que es la
estimacin del parmetro de la poblacin.
Por intervalo
Las medidas de la muestra pueden tambin usarse para calcular dos valores numricos
que definen un intervalo el cual, con un cierto nivel de confianza, se considera que incluye
al parmetro. La probabilidad de que una estimacin por intervalo incluya el parmetro se
denomina nivel de confianza
Es el procedimiento utilizado para conocer las caractersticas de un parmetro
poblacional, a partir del conocimiento de la muestra.
Con una muestra aleatoria, de tamao n, podemos efectuar una estimacin de un valor de
un parmetro de la poblacin; pero tambin necesitamos precisar un:
Intervalo de confianza
Se llama as a un intervalo en el que sabemos que est un parmetro, con un nivel de
confianza especfico.
Nivel de confianza
Probabilidad de que el parmetro a estimar se encuentre en el intervalo de confianza.
Error de estimacin admisible
Que estar relacionado con el radio del intervalo de confianza
En otras palabras, la eficiencia se refiere al tamao de error estndar de la estadstica. Si
comparamos dos estadsticas de una muestra del mismo tamao y tratamos de decidir
cul de ellas es un estimador ms eficiente, escogeramos la estadstica que tuviera el
menor error estndar, o la menor desviacin estndar de la distribucin de muestreo.
Tiene sentido pensar que un estimador con un error estndar menor tendr una mayor
oportunidad de producir una estimacin ms cercana al parmetro de poblacin que se
est considerando.
Como se puede observar las dos distribuciones tienen un mismo valor en el parmetro
slo que la distribucin muestral de medias tiene una menor varianza, por lo que la media
se convierte en un estimador eficiente e insesgado.
Coherencia
Una estadstica es un estimador coherente de un parmetro de poblacin, si al aumentar
el tamao de la muestra se tiene casi la certeza de que el valor de la estadstica se
aproxima bastante al valor del parmetro de la poblacin. Si un estimador es coherente se
vuelve ms confiable si tenemos tamaos de muestras ms grandes.
Suficiencia
Un estimador es suficiente si utiliza una cantidad de la informacin contenida de la
muestra que ningn otro estimador podra extraer informacin adicional de la muestra
sobre el parmetro de la poblacin que se est estimando.
Es decir se pretende que al extraer la muestra el estadstico calculado contenga toda la
informacin de esa muestra. Por ejemplo, cuando se calcula la media de la muestra, se
necesitan todos los datos. Cuando se calcula la mediana de una muestra slo se utiliza a
un dato o a dos. Esto es solo el dato o los datos del centro son los que van a representar la
muestra. Con esto se deduce que si utilizamos a todos los datos de la muestra como es en
el caso de la media, la varianza, desviacin estndar, etc. se tendr un estimador
suficiente.
Prueba de hiptesis

Qu es una hiptesis?
Es una proposicin de una o ms poblaciones. La hiptesis es la conjetura o suposicin
que motiva la investigacin
Una creencia sobre la poblacin principalmente sobre sus parmetros:
Media
Varianza
proporcin
Es una rama importante de la inferencia estadstica, se denomina tambin docimasia de
hiptesis o contraste de hiptesis
Una hiptesis estadstica es un supuesto acerca de algn parmetro poblacional o sobre
alguna situacin existente en la poblacin
Hiptesis nula.
Denotada por H
o
, es la primera afirmacin que se va a someter a prueba o comprobacin
experimental para rechazarla o no. Los resultados experimentales nos permitirn seguir
aceptndola como verdadera o si, por el contrario, debemos rechazarla como tal.
La hiptesis nula siempre debe contener un signo igual porque es la hiptesis que se va a
probar y es necesario que incluya un valor especfico del parmetro.
Hiptesis alternativa.
Denotada por H
1
o H
a
es aquella que se acepta cuando la hiptesis nula es rechazada.
Tambin se le conoces como hiptesis del investigador, por ser la afirmacin que
realmente le gustara validar




Prueba de dos colas
Se denomina as a toda la prueba de
hiptesis alternativa H
1
es bilateral. Si
la regin de aceptacin es un intervalo abierto entre dos puntajes crticos.
La prueba de hiptesis H
o
: =
o
contra H
o

o
bilateral de dos colas


Prueba de una cola
Se denomina as a toda la prueba de hipotesis alternativa H
1
es unilateral

Prueba de cola a la derecha.
Si la regin de rechazo est a la derecha del puntaje crtico.
La prueba de hiptesis H
o
:
0
contra H
o
: >
0
unilateral de una cola.



Prueba de cola a la izquierda
Si la regin de rechazo est a la izquierda del puntaje critico
La prueba de hiptesis H
o
:
0
contra H
o
: <
0
unilateral de una cola.
Procedimiento de la prueba de hiptesis.
Previamente debe formularse el problema estadstico, determinar la variable en estudio y
el mtodo estadstico adecuado para la solucin del problema. El procedimiento general
de la prueba de hiptesis de parmetros se resume en los siguientes pasos:
Formula la hiptesis nula H
o
: =
0
o H
o
:
0
o H
o

0
Y la hiptesis
alternativa adecuada H
a
:
0
o H
o
: <
0
o H
o
>
0

Especificar el nivel de significacin
Seleccionar la estadstica apropiada a usar en la prueba
Establecer la regla de decisin, determinando la regin critica de la prueba.
Calcular el valor del estadstico de la prueba a partir de los datos de la muestra
Tomar la decisin de rechazar la hiptesis H
o
si el valor del estadstico de la prueba est en
la regin critica. En caso contrario, no rechazar H
o


Mtodo clsico de estimacin puntual

La inferencia estadstica est casi siempre concentrada en obtener algn tipo de
conclusin acerca de uno o ms parmetros (caractersticas poblacionales). Para hacerlo,
se requiere que un investigador obtenga datos mustrales de cada una de las poblaciones
en estudio. Entonces, las conclusiones pueden estar basadas en los valores calculados de
varias cantidades mustrales.
Por ejemplo, representamos con (parmetro) el verdadero promedio de resistencia a la
ruptura de conexiones de alambres utilizados para unir obleas de semiconductores. Podra
tomarse una muestra aleatoria de 10 conexiones para determinar la resistencia a la
ruptura de cada una, y la media muestral de la resistencia a la ruptura se poda emplear
para sacar una conclusin acerca del valor de. De forma similar, si es la varianza de la
distribucin de resistencia a la ruptura, el valor de la varianza muestral s2 se podra utilizar
para inferir algo acerca de.
Cuando se analizan conceptos generales y mtodos de inferencia es conveniente tener un
smbolo genrico para el parmetro de inters. Se utilizar la letra griega para este
propsito. El objetivo de la estimacin puntual es seleccionar slo un nmero, basados en
datos de la muestra, que represente el valor ms razonable de. Una muestra aleatoria de 3
bateras para calculadora podra presentar duraciones observadas en horas de x1 =5.0, x2
=6.4 y x3 =5.9. El valor calculado de la duracin media muestral es = 5.77, y es razonable
considerar 5.77 como el valor ms adecuado de.
Una estimacin puntual de un parmetro es un slo nmero que se puede considerar
como el valor ms razonable de. La estimacin puntual se obtiene al seleccionar una
estadstica apropiada y calcular su valor a partir de datos de la muestra dada. La
estadstica seleccionada se llama estimador puntual de.
El smbolo (theta sombrero) suele utilizarse para representar el estimador de y la
estimacin puntual resultante de una muestra dada. Entonces se lee como "el estimador
puntual de es la media muestral. El enunciado "la estimacin puntual de es 5.77" se
puede escribir en forma abreviada.
Ejemplo:
En el futuro habr cada vez ms inters en desarrollar aleaciones de Mg de bajo costo,
para varios procesos de fundicin. En consecuencia, es importante contar con mtodos
prcticos para determinar varias propiedades mecnicas de esas aleaciones. Examine la
siguiente muestra de mediciones del mdulo de elasticidad obtenidos de un proceso de
fundicin a presin:
44.2 43.9 44.7 44.2 44.0 43.8 44.6 43.1
Suponga que esas observaciones son el resultado de una muestra aleatoria. Se desea
estimar la varianza poblacional. Un estimador natural es la varianza muestral:

En el mejor de los casos, se encontrar un estimado para el cual siempre.
Sin embargo, es una funcin de las Xi mustrales, por lo que en s misma una variable
aleatoria.
Error de estimacin entonces el estimador preciso sera uno que produzca slo pequeas
diferencias de estimacin, de modo que los valores estimados se acerquen al valor
verdadero.
Estimador insesgado

Se le llama sesgo ya que es la diferencia que hay entre el valor esperado y el valor del
parmetro que se va a estimar.
Se le denomina insesgado cuando la diferencia entre el valor esperado y el valor del
parmetro que se va a estimar sea cero.
Un ejemplo podra ser:
Cuando se va a calcular la media de una poblacin sera un estimador insesgado ya que la
media aritmtica de la muestra seria el mismo valor esperado y este es igual a la media
poblacional.
Otra propiedad razonable que podemos pedir al estimador de un parmetro es que, en
promedio, sus valores coincidan con . Cuando sucede esto decimos que el estimador es
centrado o insesgado.

Podemos fijarnos que en la diana del tirador insesgado, el centro de masas de los disparos
coincide con el centro de la diana (que representa el verdadero valor del parmetro).
Como ya vimos anteriormente, el concepto de centro de masas est relacionado con la
esperanza de una variable aleatoria y, precisamente as, obtenemos la definicin formal
de estimador insesgado: un estimador T de un parmetro diremos que es centrado o
insesgado si su esperanza es precisamente .


Si, al contrario, tenemos un estimador U sesgado, la desviacin respecto al verdadero
valor a estimar se mide por el sesgo:



De manera que el sesgo de un estimador puede ser:
Positivo: Si producen, en promedio, estimaciones por exceso.
Cero: Si es un estimador centrado o insesgado.
Negativo: Si producen, en promedio, estimaciones por defecto.

Intervalos de confianza

En estadstica, se llama a un par o varios pares de nmeros entre los cuales se estima que
estar cierto valor desconocido con una determinada probabilidad de acierto.
Formalmente, estos nmeros determinan un intervalo, que se calcula a partir de datos de
una muestra, y el valor desconocido es un parmetro poblacional. La probabilidad de xito
en la estimacin se representa con 1 - y se denomina nivel de confianza. En estas
circunstancias, es el llamado error aleatorio o nivel de significacin, esto es, una medida
de las posibilidades de fallar en la estimacin mediante tal intervalo.

El nivel de confianza y la amplitud del intervalo varan conjuntamente, de forma que un
intervalo ms amplio tendr ms probabilidad de acierto (mayor nivel de confianza),
mientras que para un intervalo ms pequeo, que ofrece una estimacin ms precisa,
aumenta su probabilidad de error.
Para la construccin de un determinado intervalo de confianza es necesario conocer
la distribucin terica que sigue el parmetro a estimar,
2
. Es habitual que el parmetro
presente una distribucin normal. Tambin pueden construirse intervalos de confianza
con la desigualdad de Chebyshev.

En definitiva, un intervalo de confianza al 1 - por ciento para la estimacin de un
parmetro poblacional que sigue una determinada distribucin de probabilidad, es una
expresin del tipo [
1
,
2
] tal que P[
1

2
] = 1 - , donde P es la funcin de
distribucin de probabilidad de .

En el contexto de estimar un parmetro poblacional, un intervalo de confianza es un
rango de valores (calculado en una muestra) en el cual se encuentra el verdadero valor del
parmetro, con una probabilidad determinada.
La probabilidad de que el verdadero valor del parmetro se encuentre en el intervalo
construido se denomina nivel de confianza, y se denota 1- . La probabilidad de
equivocarnos se llama nivel de significancia y se simboliza . Generalmente se
construyen intervalos con confianza 1- =95% (o significancia =5%). Menos frecuentes
son los intervalos con =10% o =1%.
Para construir un intervalo de confianza, se puede comprobar que la distribucin Normal
Estndar cumple 1:
P(-1.96 < z < 1.96) = 0.95
(Lo anterior se puede comprobar con una tabla de probabilidades o un programa
computacional que calcule probabilidades normales).
Luego, si una variable X tiene distribucin N( , ), entonces el 95% de las veces se
cumple:


Despejando en la ecuacin se tiene:

El resultado es un intervalo que incluye al el 95% de las veces. Es decir, es un intervalo
de confianza al 95% para la media cuando la variable X es normal y es conocido.
II- Intervalo de confianza para un promedio:
Generalmente, cuando se quiere construir un intervalo de confianza para la media
poblacional , la varianza poblacional es desconocida, por lo que el intervalo
para construido al final de II es muy poco prctico.
Si en el intervalo se reemplaza la desviacin estndar poblacional por la desviacin
estndar muestral s, el intervalo de confianza toma la forma:

La cual es una buena aproximacin para el intervalo de confianza de 95% para con
desconocido. Esta aproximacin es mejor en la medida que el tamao muestral sea
grande.
Cuando el tamao muestral es pequeo, el intervalo de confianza requiere utilizar la
distribucin t de Student (con n-1 grados de libertad, siendo n el tamao de la muestra),
en vez de la distribucin normal (por ejemplo, para un intervalo de 95% de confianza, los
lmites del intervalo ya no sern construidos usando el valor 1,96

Vous aimerez peut-être aussi