Vous êtes sur la page 1sur 12

ESTADISTICA GENERAL

DISTRIBUCIONES MUÉSTRALES E INTERVALOS DE CONFIANZA

Los objetivos de la inferencia estadística son:


1. La estimación de parámetros consiste en el cálculo de estadísticos en muestras, con el fin de
obtener información sobre el valor de los parámetros de la población. Esta inducción se basa en la
teoría de probabilidades y sólo es posible cuando se conoce la conducta o "distribución muestral"
de las estadísticas.
2. La docimasia de hipótesis consiste en conocer la probabilidad de ocurrencia, bajo la hipótesis nula,
del resultado obtenido en la investigación, basándose en la distribución muestral de la estadística
utilizada para medir tal resultado.
DISTRIBUCIONES MUÉSTRALES
Una estadística muestral proveniente de una muestra aleatoria simple tiene un patrón de
comportamiento (predecible) en repetidas muestras. Este patrón es llamado la distribución muestral
de la estadística. Si conocemos la distribución muestral podemos hacer inferencia. Las distribuciones
muéstrales adoptan diferentes formas según las estadísticas investigadas y las características de la
población estudiada.

DISTRIBUCIÓN MUESTRAL DE LA MEDIA MUESTRAL


La distribución muestral de la media muestral es la distribución de los valores de las medias
muéstrales de todas las posibles muestras del mismo tamaño n tomadas de la misma población. Si
sacamos muestras aleatorias de tamaño n de una población con media μ y desviación estándar σ,
entonces la distribución muestral de la media muestral tiene las siguientes propiedades:
1. El promedio de todos los valores posibles de medias muestrales es igual al parámetro μ. En otras
palabras, la media muestral x̅ es un estimador insesgado de μ.
μx̅ = μ

2. Error estándar de la media muestral: Es la desviación estándar de las posibles medias muestrales.
σ
σx̅ =
√n
El error estándar disminuye si el tamaño de la muestra aumenta.
Se puede interpretar como el grado de variabilidad que tiene la media muestral con respecto a
la media poblacional. En otras palabras es una medida de la incertidumbre que existe al estimar
la media poblacional a partir de la media muestral

Lic. Yarina Silvia Cuba Andía Página 1


ESTADISTICA GENERAL

3. Si la muestra es obtenida sin remplazo de una población finita de tamaño N, entonces el error
estándar es

σ N−n
σx̅ = √
√n N − 1
N−n
El coeficiente N−1 es denominado factor de corrección para población finita. Se observa que

cuando N → +∞ el factor de corrección tiende a uno


4. Si la población original tiene distribución Normal, entonces para cualquier tamaño muestral n la
distribución de la media muestral es también Normal
σ
Si X ~ N(μ, σ) ⇒ x̅ ~ N (μ, )
√n
5. Si la población de origen no es Normal pero podemos calcular su media y desviación estándar y el
tamaño muestral (n) es “suficientemente” grande la distribución de la media muestral es
aproximadamente Normal
σ
Aun si X no es N(μ, σ) ⇒ x̅ ~ N (μ, )
√n

Este resultado se conoce como el Teorema del Límite Central.

TEOREMA DEL LÍMITE CENTRAL

Este es uno de los teoremas más importantes en probabilidad y en general en estadística. Si x̅ es


la media de una muestra de tamaño n que se toma de una población normal con media μ y
x̅−μ
varianza σ2 entonces la variable Z = σ tiende a la distribución normal estándar a medida que n
⁄ n

tiende a infinito. Es decir:
x̅ − μ (x̅ − μ)√n
Z=σ = ~ N(0,1)
⁄ n σ

Observación: cuando se desconoce la varianza poblacional y se tiene que estimar a partir de los
̅ )2
∑(Xi −X x̅−μ
datos de la muestra como S 2 = n−1
entonces la estadística T = s tiene una distribución t de
⁄ n

Student con n –1 grado de libertad

DISTRIBUCIÓN MUESTRAL DE UNA PROPORCIÓN MUESTRAL

La distribución muestral de la proporción muestral es la distribución de los valores de las


proporciones muestrales de todas las posibles muestras del mismo tamaño n tomadas de la misma
población.

Lic. Yarina Silvia Cuba Andía Página 2


ESTADISTICA GENERAL

Si P representa la proporción de elementos en una población con cierta característica de interés, es


̂ = x la
decir, la proporción de “éxitos”, donde “éxito” corresponde a tener la característica y sea P n
̂ tiene
proporción de éxitos en la muestra, entonces si n es grande la variable estandarizadora de P
P(1−P)
distribución aproximadamente normal de media P y varianza n
es decir:

̂−P
P
Z= ~ N(0,1)
√P(1 − P)
n

Entonces la distribución muestral de la proporción tiene las siguientes propiedades:

̂ es igual al parámetro P. En otras palabras, p es


1. El promedio de todos los valores posibles de P
un estimador insesgado de P:
μP̂ = P

2. Error estándar de la proporción muestral: Es la desviación estándar de las posibles proporciones


muestrales y mide la dispersión de la proporción muestral:

P(1 − P)
σP̂ = √
n
Si analizamos la fórmula, vemos que la desviación estándar de p disminuye si el tamaño de la
muestra aumenta.

3. Si la muestra es obtenida sin remplazo de una población finita de tamaño N, entonces el error
estándar es

P(1 − P) N − n
σP̂ = √ √
n N−1
N−n
El coeficiente N−1 es denominado factor de corrección para población finita. Se observa que
cuando N → +∞ el factor de corrección tiende a uno

ESTIMACION DE PARAMETROS

Al realizar una investigación estadística a menudo se sabe o se supone que la población (discreta o
continua), de la cual se selecciona una muestra aleatoria, tiene una forma funcional específica f(x)
cuyo parámetro o parámetros se intenta determinar. Si el parámetro a determinar es denotado por
θ, entonces, la distribución de la población será denotada por f(x,θ). Los métodos de inferencia
estadística consisten en seleccionar una muestra aleatoria de la población, de manera que a partir
de la información que se obtenga de la muestra:

Lic. Yarina Silvia Cuba Andía Página 3


ESTADISTICA GENERAL

1. Determinar el valor del parámetro desconocido θ, ó


2. Decidir si θ, o alguna función de θ, es igual a algún valor preconcebido θ0 de θ.
El primero de estos procedimientos se denomina estimación del parámetro. El segundo
procedimiento se conoce como prueba de hipótesis del parámetro θ.

El método de estimación del parámetro puede ser puntual o por intervalo. En el primer caso, la
estimación del parámetro θ es un número. Mientras que en el segundo caso la estimación incluye
un intervalo en el que están comprendidos los valores del parámetro. Existen, no obstante, multitud
de circunstancias en las que el interés de un estudio no estriba tanto en obtener una estimación
puntual para un parámetro, como determinar un posible “rango” de valores o “intervalo” en los que
pueda precisarse, con una determinada probabilidad, que el verdadero valor del parámetro se
encuentra dentro de esos límites.

Las técnicas que abordan este tipo de situaciones, se encuadran dentro de la estadística Inferencial
bajo el título de “Estimación por Intervalos de Confianza”.
ESTIMADOR.- Cuando se toma una muestra de n observaciones a partir de una población
determinada, se llama estimador θ̂ de un parámetro θ, a cualquier función de las observaciones
muéstrales. Pero no toda función de la muestra es un buen estimador del parámetro, un buen
estimador, es aquel que está más cerca del parámetro que se estima. Para que un estimador puntual
sea bueno debe tener ciertas propiedades. Una de estas propiedades es que sea insesgado,
propiedad conocida también como no-sesgado, imparcial o sin vicio además debe ser eficiente.
1.- Insesgabilidad.- Se dice que un estimador es insesgado, cuando su valor esperado es igual al
parámetro que se estima:
E (θ̂) =θ
Los estimadores o estadísticos son variables aleatorias; para cada una de las muestras posibles
pueden asumir valores diferentes, y cada valor o intervalo de valores posibles tiene asociada una
probabilidad. Un estimador tiene, entonces, una distribución de probabilidad y por lo tanto puede
calcularse su esperanza. El hecho que la esperanza del estimador sea igual al parámetro a estimar,
por supuesto no asegura ni aproximadamente que de una estimación a realizar surgirá un resultado
igual al parámetro, sólo se trata de una propiedad teórica, que afirma que si se toman todas las
muestras posibles, el promedio de los valores del estimador o sea su valor esperado será igual al
parámetro. Si existiera una diferencia entre la esperanza del estimador y el parámetro a estimar,
esa diferencia se denomina "sesgo”.

Lic. Yarina Silvia Cuba Andía Página 4


ESTADISTICA GENERAL

Sesgo = E (θ̂)-θ
2.- Eficiencia.- Esta propiedad es muy importante, porque se refiere precisamente a la variabilidad
delos estimadores a la cual se hizo referencia al hablar de insesgamiento. La varianza de un
estimador, proporciona una idea del grado de confianza que se puede tener en el mismo. Ante dos
estimadores insesgados (o por lo menos consistentes) θ̂1 y θ̂2 es más eficiente θ̂1 si:

Var (θ̂1 )<Var (θ̂2 )


Generalmente la comparación se hace realizando el cociente entre ambas varianzas; si es menor
que 1, el estimador del numerador es más eficiente que el del denominador y viceversa.
3.- Consistencia: Un estimador es consistente si la probabilidad de que el valor estimado coincida
con el del parámetro aumenta a medida que el tamaño de la muestra crece.
4.- Suficiencia: Un estimador es suficiente respecto a un parámetro si agota la información
disponible en la muestra aprovechable para la estimación.
La siguiente figura simboliza, en forma de diana, el cumplimiento de las dos primeras propiedades
que debe satisfacer un estimador (figura adaptada de Wonnacott y Wonnacott, 1990):

Estadístico 1 Estadístico 2
Insesgado, eficiente Insesgado, ineficiente

Estadístico 3 Estadístico 1
Sesgado, eficiente Sesgado, ineficiente

Lic. Yarina Silvia Cuba Andía Página 5


ESTADISTICA GENERAL

INTERVALO DE CONFIANZA
Se llama intervalo de confianza en estadística a un par de números entre los cuales se estima que
estará cierto valor desconocido con una determinada probabilidad de acierto. Formalmente, estos
números determinan un intervalo, que se calcula a partir de datos de una muestra, y el valor
desconocido es un parámetro poblacional. La probabilidad de éxito en la estimación se representa
por 1-α y se denomina nivel de confianza. En estas circunstancias, α es el llamado error aleatorio o
nivel de significación, esto es, una medida de las posibilidades de fallar en la estimación mediante
tal intervalo.
ESTIMACIÓN POR INTERVALOS DE CONFIANZA PARA LA MEDIA
Sea desconocida la media poblacional de una cierta variable que deseamos estudiar, sacamos una
muestra y Si la población de la cual se extraen las muestras es normal se trata de obtener un
intervalo de forma que tengamos una probabilidad alta (1− α) % de que la media poblacional este
en ese intervalo. El nivel de confianza del intervalo (1− α)*100% lo fijamos nosotros, se suele trabajar
con 95% y a veces con 99% o el 90%; es decir, con probabilidad 0.05, 0.01 o 0.1
Si se cumple una de las siguientes hipótesis:
IC PARA LA MEDIA CON VARIANZA IC PARA LA MEDIA CON VARIANZA
CONOCIDA DESCONOCIDA
El tamaño de la muestra es mayor de 30 con El tamaño de la muestra es menor de 30 con
media poblacional μ y desviación estándar media poblacional μ y desviación estándar
poblacional σ conocido, la variable sigue un poblacional σ desconocido, la estadística deja
modelo normal. El intervalo de confianza para de tener distribución normal estandarizada y
la media poblacional es: tiene una distribución t Student
𝑆
𝐼𝐶𝜇 = 𝑥̅ − 𝑡1−𝛼/2;𝑛−1 ≤𝜇
𝜎 𝜎 √𝑛
𝐼𝐶𝜇 = 𝑥̅ − 𝑍1−𝛼/2 ≤ 𝜇 ≤ 𝑥̅ + 𝑍1−𝛼/2
√𝑛 √𝑛 𝑆
≤ 𝑥̅ + 𝑡1−𝛼/2;𝑛−1
√𝑛
Donde 𝑍 es el valor que en la distribución
Donde 𝑡1−𝛼/2;𝑛−1 es el valor que se encuentra
N(0,1) deja a su derecha un área de α /2, 𝑥̅ es la
en la tabla t-student con n-1 grados de libertad,
media en la muestra, 𝜎 es la desviación típica y
𝑥̅ es la media en la muestra, 𝑆 la desviación
n el tamaño de la muestra.
típica y n el tamaño de la muestra.
TAMAÑO DE LA MUESTRA PARA ESTIMAR μ

Lic. Yarina Silvia Cuba Andía Página 6


ESTADISTICA GENERAL

El tamaño de muestra para un error de estimación ε y un nivel de confianza determinado se


deduce la ecuación, resultando:

2 2
𝑍1−𝛼 ⁄2 𝜎 𝑁 𝜎 2
𝑛= 2 2 2
𝑛 = (𝑍1−𝛼⁄2 )
𝑍1−𝛼 ⁄2 𝜎 𝑁 + 𝑒 (𝑁 − 1) 𝑒

𝜎
Donde el error de estimación es: 𝑒 = 𝑍1−𝛼⁄2
√𝑛

Ejemplo 1: Un experto en tránsito de una región, desea conocer el promedio de velocidad que los
vehículos particulares emplean al cruzar por cierta zona de carretera identificada como altamente
peligrosa. Para esto, toma una muestra de las velocidades de 51 vehículos y encuentra que en la
misma presenta una desviación estándar de 22 kilómetros/hora y una media de 112
kilómetros/hora. . Estime la velocidad promedio de los vehículos de la población, y calcula, para un
nivel de confianza del 99%, suponiendo que la variable se distribuye normalmente.

Interpretación:

Lic. Yarina Silvia Cuba Andía Página 7


ESTADISTICA GENERAL

Ejemplo 2: En una encuesta se pregunta a 10000 personas cuántos libros lee al año, obteniéndose
una media de 5 libros. Se sabe que la población tiene una distribución normal con una desviación
típica 2.
a) Hallar un intervalo de confianza al 80% para la media poblacional.

Interpretación:

b) Para garantizar un error de estimación de la media poblacional no superior a 0,25 con un nivel de
confianza del 95%, ¿a cuántas personas como mínimo sería necesario entrevistar?

Ejemplo 3: Se considera los siguientes tiempos de reacción de un producto químico en segundos:

tiempos medios de reacción 1.4 1.2 1.3 1.5 2.2


frecuencia 6 4 3 5 6

Obtener un intervalo de confianza del 90% para el tiempo medio de reacción suponiendo que la
variable es normal.

Lic. Yarina Silvia Cuba Andía Página 8


ESTADISTICA GENERAL

Interpretación:

Ejemplo 4: En un concurso nacional en talentos a puntuación media de una muestra de 20 jueces,


elegidos al azar, para una misma prueba, presentó una media de 9,8525 y una desviación típica de
0,0965. Calcular un intervalo de confianza con un 95% para la nota media. (Suponemos que la
variable que mide la puntuación sigue una distribución normal.)

Interpretación:

Ejemplo 5: El tiempo de conexión a internet de los alumnos de cierta universidad, sigue una
distribución normal con una desviación típica de 15 minutos. Para estimar la media del tiempo de
conexión, se quiere calcular un intervalo de confianza que tenga una amplitud menor o igual a 6
minutos, con un nivel de confianza del 95 %. Determina cuál es el tamaño mínimo de la muestra que
es necesario observar.

Lic. Yarina Silvia Cuba Andía Página 9


ESTADISTICA GENERAL

Interpretación:

ESTIMACIÓN POR INTERVALOS DE CONFIANZA PARA LA PROPORCIÓN


Sea una muestra aleatoria de tamaño n escogida de una población de Bernoulli B(1,p), cuyo
parámetro p es la proporción de éxitos en la población. El estimador puntual de p es la estadística
proporción de éxitos en la muestra definida por:
∑𝑛𝑖=1 𝑋𝑖 𝑋
𝑝̅ = 𝑜 𝑝̅ =
𝑖=1 𝑛
IC PARA LA PROPORCION

Si 𝑝̅ es la proporción de éxitos en una muestra aleatoria de tamaño n, entonces, el intervalo de


confianza del (1− α) 100 % para la proporción p es:

𝑝̅ (1 − 𝑝̅ ) 𝑝̅ (1 − 𝑝̅ )
𝐼𝐶𝑝̅ ,(1−𝑝̅ ) = 𝑝̅ − 𝑍1−𝛼/2 √ ≤ 𝑝 ≤ 𝑝̅ + 𝑍1−𝛼/2 √
𝑛 𝑛

Z es el valor que en la distribución N(0,1) deja a su derecha un área de α /2, n el tamaño de la


muestra.
TAMAÑO DE LA MUESTRA PARA ESTIMAR 𝑝
El tamaño de muestra n para un error de estimación ε y un nivel de confianza de 100(1-α)% es:
𝑝. 𝑞 𝑍1−𝛼⁄2 2
𝑛= 2 𝑛=( ) 𝑝(1 − 𝑝)
𝑒 𝑝. 𝑞 𝑒
(𝑍 ) + 𝑁
1−𝛼⁄2

𝑝̂(1−𝑝̂)
Donde el error de estimación es: 𝑒 = 𝑍1−𝛼⁄2 √
𝑛

Ejemplo 1: Un fabricante de reproductores de discos compactos utiliza un conjunto de pruebas


amplias para evaluar la función eléctrica de su producto. Todos los reproductores de discos

Lic. Yarina Silvia Cuba Andía Página 10


ESTADISTICA GENERAL

compactos deben pasar todas las pruebas antes de venderse. Una muestra aleatoria de 500
reproductores tiene como resultado 15 que fallan en una o más pruebas. Encuentre un intervalo de
confianza de 90% para la proporción de los reproductores de discos compactos de la población que
no pasan todas las pruebas.

Interpretación:

Ejemplo 2: Se realizó una encuesta a 350 familias preguntando si poseían ordenador en casa,
encontrándose que 75 de ellas lo poseían. Estima la proporción real de las familias que disponen de
ordenador con un nivel de confianza del 95%.

Interpretación:

Lic. Yarina Silvia Cuba Andía Página 11


ESTADISTICA GENERAL

ESTIMACIÓN POR INTERVALOS DE CONFIANZA PARA LA VARIANZA

Sea una muestra aleatoria de tamaño n, escogida de una población normal con varianzaσ2 ,
parámetro desconocido, un estimador puntual de σ2 es la varianza muestral:

∑ni=1(X i − X
̅)2
Ŝ 2 =
n−1

IC PARA LA VARIANZA

Luego si Ŝ 2 es la varianza de una muestra aleatoria de tamaño n seleccionada de una poblacion


normal, entonces el intervalo de confianza (1− α) 100 % para σ2 es:

(n − 1)Ŝ 2 (n − 1)Ŝ 2
ICσ2 = ≤ σ2 ≤
λ2 α λ2α
1−2 ,n−1 2 ,n−1

2
Donde λ1− α
,n−1
y λ2α,n−1 son los valores de la tabla chi-cuadrado con n-1 grados de libertad
2 2

Ejemplo: una maquina produce piezas metálicas en forma cilíndrica. Para estimar la variabilidad de
los diámetros, se toma una muestra aleatoria de 10 piezas producidas por la maquina encontrando
los siguientes diámetros en centímetros: 10.1 9.7 10.3 10.4 9.9 9.8 9.9 10.1 10.3 9.9 encuentre
un intervalo de confianza del 95% para la varianza de los diámetros de todas las piezas producidas
por la maquina. Suponga que los diámetros de las piezas se distribuyen según la normal.

Resolución:

Interpretación:

Lic. Yarina Silvia Cuba Andía Página 12

Vous aimerez peut-être aussi