Vous êtes sur la page 1sur 7

1

ERROR ESTNDAR DE LA MEDIA



Supongamos que el director de un consultorio quiere decidir si suprimir o no un horario
diario de atencin especial. Quiere saber si l@s usuari@s se opondrn o no y para ello
solicita nuestra ayuda.

La primera idea que se nos ocurre es que debemos preguntar a l@s usuarios sobre su
acuerdo o desacuerdo con la medida, sin embargo, y aun cuando esto parece lo ms
indicado, caemos en cuenta que la cantidad de usuari@s atendid@s, podra hacer
nuestra labor inviable. Despus de pensarlo un poco concluimos que no necesitamos
tener la totalidad de las opiniones, sino una muestra que nos d una buena nocin de la
opinin general.

Supongamos que, para fines de esta discusin, el 76% de tod@s l@s usuari@s de la
poblacin estn en contra de que se suprima, tambin supongamos que se pregunta a
las primeras 25 persona interrogadas en el consultorio cul es su opinin al respecto y
20 (80%) dijeron que estaban en contra de que se suprimiera. Ahora podemos tratar
con medidas cuantitativas.

Un parmetro es una caracterstica cuantitativa de una poblacin. La proporcin de
usuari@s, dentro del total, en contra de la supresin del horario (76%) es un parmetro
de esa poblacin. La media de una poblacin es un parmetro con el smbolo especial
(pronncielo mu). La desviacin estndar de una poblacin tambin es un
parmetro, se designa con el smbolo especial (Sigma) o

, cuando la poblacin
necesita ser identificada.

El statisticum es una caracterstica cuantitativa de cierta muestra. La proporcin de
usuari@s en su grupo de 25, que estuvieron en contra de la supresin del horario (80%)
es un statisticum de esa muestra. La media de una muestra est representada por el
smbolo M o

.

En este orden, as mismo, la desviacin estndar de una muestra (S) tambin es un
statisticum.

En suma un estadgrafo puede hacer inferencias de parmetros de una poblacin
basndose en el statisticum de una muestra.

SELLECCION DE LA MUESTRA

Supongamos que alguien ha estado parado en el corredor, fuera del centro de salud
esperando a quienes salen. Entonces decide escoger a 25 personas para preguntarles
acerca del problema del horario. Supongamos que en su muestra le toco incluir 24
madres por segunda vez y a una madre primeriza. Aun cuando las madres por segunda
vez podran no tener ninguna necesidad particular del horario especial, comparada con
la de otr@s usuari@s, tal procedimiento de muestreo har que cualquier investigador
se sienta incmodo.

2

El punto es que las inferencias ms seguras acerca de las poblaciones son hechas
con base en muestras que son representativas de esas poblaciones. Aun cuando
hay nmero de tcnicas especiales para lograr esta meta de representacin precisa,
limitaremos nuestra discusin a la seleccin al azar, ya que esta es la base de todos los
mtodos de muestreo.

Cuando usamos el trmino muestra al azar, queremos decir que los individuos que
forman la muestra fueron seleccionados al caso, esto quiere decir que, cada individuo
de la poblacin tuvo iguales oportunidades de haber sido seleccionado.

Ahora podemos ver porque el procedimiento de muestreo no fue al azar. Se tomaron 25
personas que estaban en cierta parte del edificio, en una hora y da determinado de la
semana. Para todos aquellos usuarios que no estaban all para ser seleccionados, la
probabilidad fue de cero.

Un mtodo simple de seleccin al azar que podra utilizarse sera el de escribir, por
separado en hojas de papel, el nombre de cada uno de l@s usuari@s del consultorio, y
ponerlos en un sombrero muy grande, revolverlos bien, y sacara los nombre de 25
usuari@s para la muestra.

Un mtodo ms prctico sera usar la tabla de nmeros al azar tambin llamados
ramdon, para seleccionar las listas de todos l@s usuari@s y luego usar la tabla
nuevamente para seleccionar un usuari@ de cada lista escogida.

Ahora, lo ms importante de recordar acerca de muestras de poblaciones, es que un
grupo extremadamente grande de muestras diferentes puede ser tomado de la mismo
poblacin (excepto en el caso extraordinario de que una muestra incluya casi toda la
poblacin). Ya que los statisticum derivados de estas diferentes muestras estarn
basados en diferentes subgrupos, no podemos esperar que el valor del statisticum de
una muestra al azar sea igual al parmetro de la poblacin, como tampoco podemos
esperar obtener exactamente 5 caras si lanzamos al aire una moneda 10 veces.

LOS STATISTICUM DE LAS MUESTRAS COMO CALIFICACIONES INDIVIDUALES

Supongamos que cada uno de cinco estudiantes de nuestro curso accede a escoger
una muestra al azar, independientemente uno del otro, de la poblacin total de
usuari@s del consultorio y hacen que cada un@ juzguen su deseo de mantener el
horario de atencin especial. La escala de calificacin tiene nueve puntos, del 1 (a
nadie le interesa) al 9 (yo me atiendo todos los das).

Nuestros cinco investigadores relevan la informacin y regresan con un conjunto de 10
juicios en cada muestra. Cada uno de ellos calcula una media para su muestra de 10
juicios.




3

M1=4,0
M2=7,0
M3=6,0
M4=4,0
M5=4,0

Por qu no tratar ahora estas cinco medias como una muestra de cinco medias de una
poblacin de todas las medias de las muestras posibles? Si el investigador decide
calcular la media de estas medias, y encuentra que es 5,0; ntese que ste es el mismo
valor que sera obtenido si se reunieran los cincuenta usuarios en una sola muestra y se
encontrara la media de esta muestra ms grande. Tambin puede estimar la
variabilidad de estas cinco medias y calcular su desviacin estndar.

La desviacin estndar de las medias de la muestra es igual a





Se encuentra que la desviacin estndar de 1,41 es muy grande y que se necesita una
estimacin mejor que la que puede obtenerse con muestras de 10 usuarios. Se ordena
nuevamente a los investigadores aumentar su muestra a 25 usuarios cada una. Esta
vez se halla que la variabilidad de las medias ha sido reducida, comparada con la de las
medias de la muestra de 10.

M1=6,5
M2=5,5
M3=6,5
M4=4,5
M5=4,5



La desviacin estndar de las medias de la muestra es igual a



Los investigadores se complacen con los resultados de su muestreo y empiezan a
desinteresarse en la encuesta del consultorio y a interesarse en la forma en que las
medias de la muestra se autodestruyen, en tanto que el descenso de la variabilidad de
La media de las medias de las muestras es igual a 25/5 =5,0
La media de las medias de la muestra es igual a 5,50
4

las medias pudo haberlos satisfecho lo suficiente como para decidir que se debe
conservar el horario de atencin especial, aumenta su curiosidad por comprobar si la
variabilidad de las medias continuar disminuyendo segn el tamao de las muestras
aumente. Esto es, a medida que se incremente el tamao de la muestra de 10 a 25, la
variabilidad de la media de la muestra disminuye aproximadamente 1/3. Esto puede
significar que el descenso en la variabilidad de las medias est relacionado con el
ascenso proporcional o absoluto del tamao de la muestra. Para comprobar estas
posibilidades, se decide duplicar el tamao de las muestras de 25 a 50 y ver qu
sucede con la varianza de las medias. Desafortunadamente cuando se decide realizar
nuevamente el experimento, se pierde el equipo de relevamiento de datos. Los
investigadores salen y renen 4 muestras de 50 usuarios cada una. Los resultados son
tabulados y calculadas las medias; a continuacin se presentan los resultados:

M1=5,32
M2=4,34
M3=5,78
M4=5,92
M1=5,32


y la desviacin estndar es igual



Nuevamente, la variabilidad de las medias ha descendido aproximadamente 1/3.
Podra aumentarse tambin el tamao de las muestras y encontrar que la variabilidad
de las medias se redujo todava ms. Esto nos da una regla general: a medida que el
tamao de la muestra aumenta, la variabilidad de las medias de la muestra disminuye.

En otras palabras se puede hacer inferencias acerca de los parmetros de poblaciones
con ms confianza si se est dispuesto a emplear el tiempo y el esfuerzo extra que se
requiere para aumentar el tamao de la muestra.

Desde ahora debemos diferenciar entre Statisticum (de una muestra) y Parmetros de
poblacin. Anteriormente hemos usado M y S sin diferenciar, entonces, su uso como
Statisticum o cmo parmetro. Porque y no haban sido introducidos todava.
Ahora correctamente, z=(X- )/ y no (X-M)/S. De cualquier manera, la diferenciacin
entre parmetro y statisticum debe hacerse, ya que es fundamental para entender la
inferencia estadstica.

La media de las medias de la muestra es igual a 5,34
5

DISTRIBUCIN DE MUESTRAS

Otra razn importante a parte de las estudiadas para trabajar con la distribucin normal
es que, la distribucin de las medias de las muestras tomadas normales y anormales,
tienden a ser normales. Este fenmeno es tan fidedigno que ha sido formalizado como
el teorema de lmite central: a medida que el nmero de casos de cada muestra
aumenta y a medida que el nmero de las muestras aumentan, la distribucin de las
medias de las muestras se aproxima a la distribucin normal. Este teorema puede
ilustrarse observando distribuciones de las muestras de las medias obtenidas, haciendo
rodar dados perfectamente balanceados. Cada dado tiene 6 caras y la posibilidad de
rodar sobre cualquier lado es de 1/6. Si hacemos rodar un solo dado varias veces, la
distribucin de las medias ser rectangular obviamente, no una distribucin normal- .
La razn es que tenemos un gran nmero de muestras (segn establece el teorema),
pero nicamente tenemos un caso en cada muestra. De hecho, con N=1 por cada
muestra.

Ahora supngase que aumentamos el tamao de la muestra a 2. Esto es, hacemos
rodar 2 dados y encontraremos la media del nmero de puntos que aparece cada vez.

Si hacemos rodar muchas veces los dados, obtendremos una distribucin que no es
normal, aunque considerablemente ms cercana que la anterior a la distribucin normal.

Finalmente, si utilizamos 3 dados, los hacemos rodar varias veces y encontramos la
media del nmero de puntos para cada giro, la distribucin ser una aproximacin ms
cercana a la distribucin normal.

Considerando lo que hemos hecho. Hemos muestreado a partir de una distribucin no
normal. A medida que aumentamos el tamao de la muestra (de 5 a 10 y a 25), la forma
de distribucin se acerca ms y ms a la distribucin normal.

Mientras que distribuciones reales raramente parten de la distribucin normal,
encontramos an que las muestras de las medias de tales distribuciones tienden a
distribuirse normalmente. Esto es verdadero durante un amplio rango de distribuciones
(distribuciones normales y no normales), ya que el teorema del lmite central no
especifica la forma de la poblacin de donde son tomadas las muestras.

Aunque hemos asegurado que el teorema del lmite central se aplica por iguala
distribuciones normales y no normales, esto an no se demuestra. Por esta razn,
supongamos que programamos nuestro computador para usar una poblacin normal
con una media de 50 y una desviacin estndar de 12. De esta poblacin tomaremos
muestras al azar de cuatro calificaciones cada una (esto es N=4) y encontraremos la
media para cada una de 10000 muestras. Despus, tomamos muestras al azar de 16
cada una, encontramos la media para cada una de las muestras y repetimos la
operacin 10000 veces tambin. Finalmente tomamos muestras de 144 calificaciones
cada una, encontramos la media para cada muestra y repetimos el proceso 10000
veces.

6

Si desarrollramos las operaciones ya enunciadas tendramos que:

1. Las medias para muestras N=4, N=16 y N=144 estn, todas, muy cercanamente
a la distribucin normal.
2. La variabilidad e las medias decrece a medida que el tamao de las muestras
aumenta.

Pueden calcularse las desviaciones estndar de cada una de las distribuciones
propuestas, estimando el rango de la distribucin y dividindolo entre 6 (en lugar de 5,
puesto que se utiliz un gran nmero de medias). Estos clculos, para las distribuciones
de las medias, basados en las muestras 4, 16 y 144 casos, son, ms o menos 6, 3 y 1,
respectivamente.

Se trata, por supuesto, de un proceso muy laborioso para generar muestras: primeo
encontrar las medias de esas muestras y despus calcular la desviacin estndar de
esas medias. Un procedimiento mucho ms fcil que ser ms seguro en cuanto a
tiempo y esfuerzo-, consiste en estimar la variabilidad de medias partiendo del
conocimiento de la variabilidad en la poblacin. La siguiente frmula hace exactamente
esto, puede verse fcilmente que la variabilidad de las medias est relacionada con la
variabilidad de la poblacin. Por lo tanto, la frmula




relaciona la variabilidad de las muestras de las medias con la de las calificaciones
individuales de las muestras. La frmula indica que la desviacin estndar de las
medias es iguala a la desviacin estndar de la poblacin dividida entre la raz
cuadrada del tamao de la muestra . As, de la poblacin que tiene una desviacin
estndar de 12, y muestras de tamao 4, 16 y 144, esperaramos, de la frmula, que





Cuando se toman muestras de 4, y que
7



cuando N=16, y que




Cuando N=144. Como puede verse esto se aproxima cercanamente a las desviaciones
estndar estimadas previamente a partir de los rangos de las distribuciones.

Es interesante notar que por lo general NO se denomina desviacin estndar de las
medias; en su lugar, el trmino apropiado es error estndar de la media . En
realidad ningn error resulta implicado, el nombre es slo una prolongacin en tiempos
anteriores, cuando la variabilidad se pensaba nicamente como error de medida.

Ejemplo. Supngase que conocemos la media y la desviacin estndar de todos los
estudiantes de sexo masculino de cierto instituto =70 y =2. Supngase, adems,
que queremos saber la variabilidad de las muestras de las medias de 16 estaturas de
esta poblacin. Podemos calcular M para cada posible muestra de 16 estudiantes y
posteriormente encontrar la desviacin estndar de tales medias, pero no viviremos
tanto tiempo como para terminar tal cometido. Podramos tambin utilizar la frmula de
error estndar de la media y obtener exactamente la misma respuesta.






La desviacin estndar de las medias de todas las muestras posibles de 16
calificaciones es igual cada una, a 0,50.

Vous aimerez peut-être aussi