Vous êtes sur la page 1sur 6

UNVERSIDAD DE SAN CARLOS DE GUATEMALA

CENTRO UNIVERSITARIO DE PETN


CURSO BSICO DE ESTADSTICA PARA PROFESORES
Facilitador: Amlcar Rolando Corzo Mrquez
NOTAS DE LA CLASE INTRODUCCIN A LA TEORA DEL MUESTREO
Poblacin: coleccin de elementos acerca de los cuales deseamos hacer una inferencia.
Muestra: subconjunto representativo de la poblacin.
Modelos estadsticos simples:
La media aritmtica se define como la suma de los datos dividida entre el nmero de los
mismos.

Media de una muestra :

Media de una poblacin:

Propiedades de la Media:
La media es sensible al valor exacto de todos los datos de la distribucin, No sucede as
ni con la mediana ni con la moda.
La suma de las desviaciones con respecto a la media es igual a cero.
Hagamos un ejemplo: X: 3,4,5,6,7
La media es muy sensible a los datos extremos, ms que la mediana o la moda.
La suma de los cuadrados de las desviaciones de todos los datos en torno a su media es
la ms pequea posible. Debido a esto la media se usa en la estadstica inferencial
En la mayora de los casos, de todas las medidas utilizadas para calcular la tendencia
central, la media es la menos susceptible a las variaciones debidas al muestreo, vara
menos que la mediana y la moda.
Media, desviacin, suma de cuadrados, varianza [SS/(N-1)] y desviacin estndar.
La desviacin estndard es una medicin de qu tan bien la media representa los datos.
Datos 1, 2, 3, 3 y 4. El grfico muestra cmo se desvan los datos de la media.

Miremos un ejemplo:
Tenemos dos juegos de datos:
Calificacin 1:
3, 2, 3, 3 y 2
Calificacion 2:
4, 2, 5, 1, y 2

Asumamos que estas son la calificacin dada por los alumnos (en promedio) a un
profesor.
Qu modelo representa mejor el rendimiento docente?
Estadsticos descriptivos
N
Calificacin 1
Calificacin 2
N vlido (segn
lista)

Mnimo
5
5

Mximo

2.00
1.00

3.00
5.00

Media
2.6000
2.8000

Desv.
tp.
.54772
1.64317

Miremos el comportamiento en forma grfica:

Es claro que la calificacin 1 representa un desempeo mejor, aunque la media es la


misma.
La Distribucin Normal:
La media, la mediana y la moda son indicadores de la forma que tiene una distribucin.
Pueden indicar si hay sesgo:

O indican la curtosis en la distribucin:

La desviacin estndar es un estadstico importante en el anlisis inferencial estadstico.


Nos indica la exactitud de la media como modelo de los datos. Indica la forma como se
distribuyen los datos.

Entonces, qu es una distribucin normal estndar?


Es un modelo estadstico de la distribucin terica de una variable que sirve para calcular
probabilidades de ocurrencia de un evento.
Se utiliza una distribucin con media cero ( = 0) y desviacin estndar uno ( = 1).
Cualquier variable en anlisis debe transformarse a puntuaciones Z para hacer
inferencias.
MUESTRA
Como se ha dicho, en la estadstica inferencial se obtiene una muestra para poder, a
partir de ella hacer inferencias sobre la poblacin.
Se debe preguntar el investigador es mi muestra representativa de la poblacin?
En un estudio se toman mltiples observaciones. Las muestras pueden variar ligeramente
entre s, a la caracterstica de esa variacin entre todas las muestras se le llama error
estndar. Un valor pequeo de error estndar indica que la mayora de las medias de las
muestras son similares a la media de la poblacin, por lo tanto, nuestras muestras podran
reflejar correctamente a la poblacin.

Al calcular la desviacin estndar de las medias de las muestras, podremos saber cunta
variabilidad existe entre las medias de las diferentes muestra, esto es conocido como el
error estandar de la media (standar error of the mean SE).

DISTRIBUCIONES MUESTRALES
Una distribucin muestral es una descripcin matemtica de todos los resultados posibles
y la probabilidad asociada a cada uno.
Estimacin puntual: es un estadstico dado sin indicar un rango de error.
Muestreo repetido: implica tomar una muestra y calcular sus estadsticos, luego tomar una
segunda muestra y calcular sus estadsticos, una tercera, una cuarta y as sucesivamente.
El muestreo repetido revela la naturaleza del error de muestreo.
Error de muestreo: es la diferencia entre el valor calculado de un estadstico de la muestra
y el valor real de un parmetro de la poblacin: x - .
DISTRIBUCIN MUESTRAL DE VARIABLES DE INTERVALO/RAZN
En la Oficina del Censo de los Estados Unidos, se reportaba que para el ao 2000, la
poblacin de mdicos en los Estados Unidos tena una edad promedio de 48 aos, con
una desviacin estndar de 6 aos. Dado que la edad de los mdicos es una variable que
se distribuye de manera normal, cmo se comporta la distribucin de sus valores? El
grfico siguiente muestra el comportamiento de la distribucin de la variable con = 48 y
= 6.

Ahora suponga que se toman 10,000 muestras, cada una de 144 mdicos y para cada
muestra se le calcula la media. Las medias calculadas de las muestras se disponen en el
eje x y con sus frecuencias en el eje y se construye un histograma. Las medias de las
muestras tendrn una distribucin normal cuya desviacin estndar ser el error estndar
de la media. Cmo sera la curva?
Error estndar: el error estndar de la media es la desviacin estndar de una distribucin
muestral. El error estndar mide la dispersin del error de muestreo que ocurre cuando se
muestrea repetidamente un poblacin.

Dado que la desviacin estndar de la poblacin es 6 y el tamao de cada muestra es


144 mdicos, entonces el error estndar (la desviacin estndar de la distribucin
muestral) es:
S = 6/ 144 = 0.5.

El error estndar como se sabe se ve afectado por el tamao de la muestra y el nivel de


confianza esperado, adems de por la caracterstica intrnseca de los datos.
Ley de los Grandes Nmeros: Entre mayor sea el tamao de la muestra, menor ser el
error de estimacin.
Teorema del Lmite Central: sin importar la forma de una distribucin de puntuaciones
brutas, su distribucin muestral ser normal cuando el tamao de muestra se
suficientemente grande1 y su media se centrar en la media de la poblacin verdadera.
Intervalos de Confianza:
Otra forma de determinar la representatividad de mi muestra es construir un intervalo de
confianza.
Un intervalo de cofianza es un rango de valores posibles de un parmetro, expresado con
un grado especfico de confianza.
Intervalos de confianza usuales son del 90%, 95% o 99%
La media ser siempre el centro del intervalo de confianza.
Lmite inferior = X (Z * SE)
Lmite superior = X + (Z * SE), donde:
X = media, Z = la distancia estandarizada asociada al porcentaje de confianza, y SE = el
error estndar de la distribucin muestral.
Nivel de confianza: es el grado de confianza calculado en que un procedimiento
estadstico realizado con datos muestrales producir un resultado correcto para la
poblacin muestreada.
Nivel de error esperado es la diferencia entre el nivel de confianza declarado y la
confianza perfecta del 100%.
NIVELES DE CONFIANZA USUALES:
90%, Z asociado 1.64.
IC 90% = X +/- 1.64* EE
95%, Z asociado 1.96
IC 95% = X +/- 1.96 * EE
99%, Z asociado 2. 576
IC 99% = X +/- 2.576 * EE.

Para algunos autores suficientemente grande pueden ser 28 o 30 casos, en las ciencias sociales suele
utilizarse ms de 121 casos.

Vous aimerez peut-être aussi