Glass y Stanley Cap 12. Inferencia Estadística. Estimación

MI IOl>OS
240
7.
1.5'TAl)IS11(.0~
AlUC.i\00~
i\ LAS CILN(IAS
SO<IAII!.
12
Puna todo II lo suficientemente grande, la distribucin chi-cuadrado 5<: acerca a ~a di tnbucin normal. La media y la desviacin tipica son II y fo, respecuvamentc, indepcndicntemcnte del valor de 11 Hallar el pcrccntil 95 de la distribuci~ chi-<:uadrad~ d~ la
Tabla e del Apndice A para un II de 20 y compararlo con el perccntil 95 de una dstribucin normal con una media 11 ... 20 y una desviacin tpica fo = fa.
INFERENCIA
ESTADISTICA:
ESTIMACION
Probar que la varianza de una distribucin t con II grados de libertad es ig"'.al a 11/(n - 2).
8. [Sugerencia: t~ es el mismo de la distribucin F con ~ y n ,uados de libertad. Como
E(,.)= O y
= E[t - E(t)]1, la varianza de i, es E(t.).]
ut
12.1
POBLACIONES Y MUESTRAS:
PARAMETROS Y ESTADISTICOS
FJ objetivo de la inferencia estadstica en investigacin cientfica y tecnologa

radica en conocer clases numerosas de objetos, personas o eventos a partir de otras
relativamente pequeas, compuestas por los mismos elementos. En resumen, el
razonamiento por inferencia procede de lo particular a lo general, de lo conocido
a lo desconocido, y puede decirse que es la contraparte de la deduccin, que pro
cede de lo general a lo particular, como el silogismo. El razonamiento inferencia!
!IC emplea para responder a preguntas en estadstia aplicada, como la que sigue:
ccQu es lo que se sabe acerca de la velocidad promedio de lectura de nios de
10 aos (clase grande) cuando se observa que 100 nios de dicha edad (clase pe
quea) leen en promedio 84,8 palabras por minuto? Se da el nombre de poblacin
a cualquier conjunto o conglomerado numeroso de objetos por estudiar. Pero
esta definicin es tan general que prcticamente no dice nada y, de hecho, no ad
quiere verdadero significado sino cuando se asocia a la definicin de muestra, que
es alguna parte, o subconjunto de una poblacin, ordinariamente seleccionada
o de modo deliberado, para que las propiedades de la poblacin se pongan de
relieve. Tericamente, las poblaciones pueden ser finitas o infinitas, aunque estas
ltimas son algo artificiales o conceptuales: por ejemplo, el conjunto de todos
los nmeros positivos o de todas las posibles longitudes de una vara o de todos
lanzamientos de un dado que podran hacerse hasta la eternidad. Por oposicin, toda poblacin de cnudadcs fl,icac es finita: todos los habitantes del hemisferio
''
241
MI' IOl)OS
l'ST/\IJIS1 ICOS APLICADOS
A LAS CU NCIAS SOC'IALF
cidental, todos tos refrigeradores fabricados en el Canad en la l.tima d~cada,

los distritos escolares de los Estados Unidos. Aunque una poblac1_n finita se~
uy grande, como el proverbial nmero de granos de ar~n~ en la tierra. o ! 50.
supone que el proceso de contar los elementos tiene un hm.1te. Pero, en ~ermin~s
e estadstica inferencia!, no es necesario ocuparse demasiado de la diferencia
ntre poblaciones finitas e infinitas siempre y cuando el ta~ao de la muestra
ea 100 veces inferior a la poblacin de la cual se tom, ya que ~1 esta razn se _manene existen tcnicas adecuadas de inferencia que darn ese~~1almente los mismos
esultados para poblaciones finitas o infinitas. Con la condicin de que la poblan sea suficientemente grande (con ms de algunos centenares de elementos) Y
preciablemente mayor que su muestra se trabaja con la hipt_esis de ~ue se trata
e una poblacin infinita. Generalmente se habla de poblaciones virtualmente
nfinitas entendiendo por esto que son muy grandes, pero finitas y, adems, que
ara su estudio se emplearn tcnicas estadsticas que suponen una pobl~c1n
nfinita No disc~tiremos aqu mtodps de estadstica inferencia! para poblaciones
initas, como en el caso de que la muestra sea muy ~quea o de que represe~te
ms del 1/100 de la poblacin entera. El texto de W1lham G. Cochran, Sampling
Teclmiques (1963) trata este tema de modo sobresaliente.
. .
En tos captulos precedentes hemos expuesto c~o pueden t?mar~ ~e~1c10nes del tipo de la media, mediana, varianza y percentiles de poblac1ones, asm:i1smo,
e pueden calcular la correlacin entre la estatura .Y el peso, para la poblac.1n de
alumnos de clases de secundaria de los Estados Unidos. Los ~atores de las diversas
medidas descriptivas de poblaciones se conocen como parmetros, pero cuan.do
se refieren a muestras se denominan estadigrafos. As como el parmetro d:scribe
una poblacin, el estadigrafo describe una muestra y por
gener~l, los primeros
se denotan con una letra griega y los segundos con una l_atma. El smbolo g repr~senta la media de una muestra, mientras que la letra griega representa la media
de una poblacin; asimismo, la varianza de una muestra se denota por s2 Y la de
ta poblacin por <J2
Puede considerarse el estadgrafo de una muestra como una estimacin del

parmetro de una poblacin. Una medida de estimacin o estimador es _una funcin de las puntuaciones de una muestra que da lugar a un valor _denominado e~
timacin el cual suministra informacin sobre el parmetro. Por ejemplo, la m:d1a
de ta' muestra es un estimador de las puntuaciones promedio de ta. poblacin.
Una muestra aleatoria de 100 nios de ocho aos puede tener una media de ~04,65
en el California Test of Mental Maturity, caso en el_ cual el valor 1~,65 sena una
estimacin de ta puntuacin promedio de la poblacin total a partir de la cua.l se
.'
seleccion la muestra.
12.2
MUESTREO ALEATORIO
INl'8RllNCIA
F.Sl'/\l>ISI ICA: ESTIMACION
241
pero tam~in pueden elaborarse planes muy refinados de muestreo que dan lugar
a complejos mtodos de estimacin. En este texto nos limitaremos al muestreo
aleatorio simple, pero como en estadstica elemental no se le denomina sino como
muestreo, cuando el lector se encuentre con este trmino, ya est advertido
de que nos referimos al muestreo aleatorio simple. En tratados de estadistica avanzada se estudian programas ms refinados de muestreo como el que se hace por
conglomerados, en dos fases, etc. (Cochran, 1963.)
Para que una muestra d lugar a estimaciones adecuadas de parmetros, debe
representar con precisin la poblacin, pero cmo puede saberse si una muestra
representa una poblacin a menos que se conozcan sus caractersticas? Y en este
caso, cul es la utilidad de muestrear la poblacin ya conocida? Esta legtima
duda se resuelve slo cuando se sabe que el muestreo aleatorio de una poblacin
siempre dar Jugar a muestras que a la larga, la representarn adecuadamente,
aunque eventualmente no suceda as (sobre todo con muestras demasiado pequeas), Por ejemplo, un muestreo aleatorio de todos los profesores de secundaria
de California puede resultar en la seleccin (altamente improbable, por cierto)
de 20 profesoras de francs. De hecho, nunca se puede tener la seguridad de que
lal muestreo sea representativo o no de la poblacin y lo nico que se puede afirmar es que, bajo todo aspecto, es aleatoriamente representativo de ella.
Una de las caractersticas ms importantes del muestreo al azar es que puede
determinarse el tipo de no representatividad que, a la larga, cabe esperar de
numerosos muestreos similares, cosa que no es posible con otros tipos de seleccin.
Por ejemplo, sera ilgico esperar una muestra representativa de la poblacin
adulta de estadounidenses, si para ello se escogieran los primeros 50 hombres
que pasaran por la calle cuyos apellidos empezaran con T. Pero, fuera de que no
n representativa, lo que ignoramos es cmo y hasta qu punto no Jo es. Ahora
bien, si se toman al azar 50 individuos de la poblacin adulta de norteamericanos,
podramos responder con precisin matemtica el interrogante de cul es la
probabilidad de que 50 adultos escogidos al azar entre toda la poblacin adulta
de Estados Unidos tengan una pulgada ms de estatura que el promedio de dicha
poblacin ?.
El razonamiento por inferencia estadstica se basa en estimar un parmetro

a partir de una muestra y posteriormente determinar cun representativa es del
parmetro; no es, pues. extrao que la inferencia estadstica se base en hiptesis
acerca del muestreo aleatorio de poblaciones.
EL CONCEPTO DE UNA
DISTRIBUCION MUESTRAL
11 estadstico evala lo representativa que puede ser una muestra al azar estudiando
11111 distribuciones muestra/es, concepto bsico para toda una rama de la estadstica
Las muestras y estimaciones que se calculan ~ partir ~e poblaciones dan cierta

idea acerca de las caractersticas de estas ltimas. Existen numerosos mtodo,
de seleccionar muestras a partir de poblaciones, uno de los cuales, y tal vez el mth
empicado, es el mue treo simple aleatorio, discutido en detalle en la Sec. 10.6,
lnkrcncial. Cualquier estadgrafo o estimador tiene determinada distribucin mue lr.l P<i fcil imaginar el proceso de seleccionar a partir de una poblacin suce ivas
mu\4-.tms con determinados II y calcular el valor re pcctivo de determinado csulhl\lor. por ejemplo, lu media .f. Al repetir esto indefinidamente.
se podriu hacer
MI I Ol)Ol> t \ 1 Alll\ 11( U\ Al'l lt \llll\
1 \\
1 11 M 1"
',(')( IAI I'
distribucin de frecuencias de estos ccntcnar~s de mediuv de tu~ mue tras e,

ogidas, caso en el cual tal distribucin _ser s_em~Jantc a la de la media de I~ mue,-.
as de tamao n de una poblacin. S1 se dibuja un pollgo~o de f~cue~c!ru. Y. '14!
astada a una escala, tal que su rea sea 1, la curva obtenida sena casi idntica
ta distribucin de ta media de las muestras.
.
..
:g
.
)(
't)
,:::,
D
D
et
0,40
0,30
0,20
0,10
o
FIG. 12.1
Distribucin
de probabilidad de una poblacin.
Sea, por ejemplo, determinada poblacin con varios centenares de ~lemento,

cuya medicin da lugar a puntuaci?n~ de O, 1, 2, ... , 9, t~~ con la misma pr~
babi lid ad de ocurrencia. Por consurmente, con una probab1ltd_ad de O, 1 O, la v.,_
riable aleatoria X tomar cualquiera de estos valores. En la F1g. 12.1 se mue tra
a distribucin de probabilidades para una poblacin, de la cual se tomar.on al
azar cien muestras, con n = 2 y cuyas respectivas med~as se calcularon. La primera
muestra comprendla tos dgitos (3, 2), siendo su med1~ de (3 : 2)/2 = 2,5. En ~1
Fig. 12.2 se ilustra et polgono de frecuencias de las cien medias de muestras a I
calculadas.
INI I RI
CIA ISl/\1}1
11<.'A
245
ESTIMACIO
E ta figura da una idea de lo que seria la distribucin real de 2 de mucstru-,

con 11 = 2 tomadas de la poblacin ilustrada en la Fig. 12.1. El grfico de la Figura 12.2 constituye una aproximacin emplrica a la distribucin de las medias ,
de dichas muestras.
Para determinar la distribucin muestral de un e tadgrafo, por lo general
no es necesario recurrir a procedimientos empricos (como los de la Fig. 12.2).
sino que existen tcnicas matemticas refinadas que resuelven preguntas como
<< En qu se diferencia la distribucin de medias de muestras con tamao II de una
distribucin normal? o << En qu se diferencia la distribucin del coeficiente
de correlacin-producto-momento entre X y Y tomado de muestras de tamao 11,
de la de una poblacin en la cual X y Y no correlacionan?. El conocimiento de
matemticas avanzadas, necesario para comprender las derivaciones de la mayora
de las distribuciones de muestras, hacen necesario omitir su prueba en este texto.
El teorema del lmite central es uno de los ms importantes de la estadi rica
inferencia] y se refiere a la distribucin muestra! de la media 2 .. Si de una poblacin infinita cuya media es y cuya varianza es a2 se seleccionan al azar muestras
de tamao n, cmo ser la distribucin muestral de las medias X? Si n es lo suficientemente grande (desgraciadamente no es posible ser ms explicito respecto
de la magnitud de n), las medias de las muestras se distribuirn casi normalmente
y. adems, la media de todas las medias ser igual a . o sea a la media de la poblacin; asimismo, la varianza de las medias de las muestras ser igual a <12/11,
donde a2 es l varianza de la poblacin.
,. = 15
:,
e,} =100
..
.t
15
.!!
u
e
A
.\
10
\i
:,
...!
FIG. 12.3
V\
.&J_,
o
FIG.
(11
I~
10
x.
12.2 Distribucin de frecuencias de 100 medias de 100 muestras

2) tomadas de la poblacin de la Fig. 12.1.
Distribucin de X para una poblacin .
El siguiente ejemplo ilustrar el teorema del limite central. Supongamos que

para la poblacin de la Fig. 12.3, la media es = 15 y la varianza es u2 = 100
)' que se seleccionan 100 muestras al azar. Segn el teorema del limite central, la
distribucin de las medias X. de dichas muestras ser aproximadamente normal,
con una media de 15 y una varianza de <1~/n = 100/100 = 1. En la Fg. 12.4 se
Ilustra esta distribucin de medias X .
Resulta sorprendente que, independientemente de la forma de la poblacin,
la~ medias de muestras suficientemente grandes se distribuyan normalmente,
pero esto mismo es una de las tres razones por las cuales resulta tan importante
la distribucin normal en estadstica. La forma de la poblacin determina la magnuud necesaria de" para que i se di tribuya de manera aproximadamente normal.
Pero, de hecho. lo mih p, ohuhl l'' que muestras de 100 sean lo suficientemente
141
MHTOOOS
esrworsrtcos
APLICADOS
..
A tAS ('lllNCIAS
SOCIALES
(X.):i:15
2 =1
'
"x.
:,
J::
11
18
12
19
x.
FIG. 12.4 Distribucin de las medias

aleatorias de magnitud 100 tomadas de
ta poblacin de la Fig. 12.3.
grandes para dar lugar a distribuciones de medias X. aproximadamente normales,

y esto para cualquier poblacin. . .
.
.
.
No es dificil probar que una distribucin muestra! de
tiene una. media y
una varianza uz, donde y a1' son, respectivamente, la media ~ la vananza d~ la
poblacin muestreada. X es la variable en e~tudio, con una media X. Y una vana~za u2. Un muestreo aleatorio de tamao n tiene Xi, X2, ... , X,, e~emen!os, Y. en el,
el orden de los subndices no indica la magnitud de la puntuacin, smo simplemente el orden de eleccin de los elementos. Por ejemplo, el elemento X1 fue el
primero en seleccionarse, etc. Por consiguiente, el conj~nto de todas las. ~untuaciones posibles X1, tomadas de todas I~ muestr~ pos1b~es d~ la poblacin, formara a su vez una poblacin con m~d1a y vananza. u . Dicho d~ otra ;onna,
Xi, X2, , X,, son variables ~leatonas con una media de y vananza ~ .
La media de la muestra es igual a (X1 + X2 + ... + X,,)/n. La media de la
distribucin de X. es igual al valor esperado de X ..
x.
E('.)
+ X2 +
E[(X1
.! E(X +Xi+
n
= .! [E(X1) +
n
INIJl:Rl!NCIA
ESTAl>ISTICA:
l!STIMACION
247
serla. la varianza de las medias de las muestras, si a partir de una poblacin con
media u, se forma una distribucin que consta de medias de muestras al azar de
magnitud n? Puede esperarse que la varianza de las medias de las muestras sea
menor que la de la poblacin, siempre y cuando todas las muestras consten de dos
o ms observaciones (es decir, que n ~ 2). Ntese que si las muestras tienen un
n. de l, la media seria igual a la observacin en s, y repitiendo el proceso de seleccin de muestras de tamao I, la distribucin de estas medias es simplemente un
muestreo de la poblacin original y, en este caso, la varianza u2 de la poblacin
y la de la distribucin de medias de muestras de tamao I sera la misma
(u2/n = u2/l = u2).
Supongamos que se desea haJJar la varianza de las medias de muestras de tamao n = 2 tomadas de una poblacin dada, cuya varianza es u2 Para cada muestra
se calcula la media X. = (X1 + X2)/2, siendo X1 y X2 designaciones arbitrarias
para el orden en que se hicieron las observaciones y, por tanto, independientes
del tamao de la pun.tuacin. Por consiguiente, tanto X1 como X2, tendrn, en todas
las muestras aleatorias, una varianza de u2. Como las muestras se seleccionan al
azar, no existe relacin alguna entre el tamao de la primera puntuacin y el de la
segunda. As, pues, el diagrama de dispersin de los puntos (X1, X2), en centenares
de muestras, no mostrara ninguna correlacin entre s, tal como se muestra en
laFig. 12.5.
~N
=E
:,
..
e
e
-e
;
+ X,,)/nJ
+ X,,)
'ti
:,
E(X1)
+ ... + E(X
11)].
(12.1)
Ahora bien la primera observacin que escogimos arbitrariamente, X., se

distribuye com~ las dems muestras de la ~sma p~blac~n X2 u o~r~ X1, pue~to
que de todos modos, su media es y su vananza u . As1, pues, el ultimo termmo
de la Ec.... (12.1) es igual a
(/)
Prim8!a observacin en la muestra. X,

FIG. 12.S Diagrama de dispersin de la relacin entre la primera (X1) y la segunda (X2)
observacin de muestras aleatorias tomadas de
una poblacin .
.! ( + + ... + ) = .! (n) = .
n
Dicho en palabras, el valor esperado de X., que es la media de la pob~acin de /11

distribucin muestra/ de medias muestreadas, es igual a , o sea la media de la po
btacion en cuestin.
Cul ser la variacin al azar de X. en sucesivas muestras? Es decir. cul
All se muestra claramente que en centenares de observaciones de muestras

diferentes, X, y X2 no se correlacionan, siendo entonces el coeficiente de correlaciu y la covarianza entre la primera y segunda observacin igual a cero.
Ahora bien. la varianza de todas las muestras aleatorias de X. = (X1 + X2)f2
11c denota por
241
MI IOl)US
I SIADISIICOS
Al'l l('Allm
A '""
e II N( IA'l SOCIAi 1 'l
(12.2)
u,
Las a2 no son sino los valor promedios esperados para s2; E[s;] = u;.
Ec. (12.2) indica que la varianza de X. es igual a la varianza de la mitad del valor
de la suma de X, y X2 En la Sec. 5.8 vimos que si se multiplica una variable por
una constante, la varianza de dicha variable se multiplica por el cuadrado de In
constante. En consecuencia,
(12.3)
En la Sec. 7.9 tambin se vio que en caso de que la correlacin sea nula, la varianza de la suma de dos variables es igual a la suma de sus varianzas. As, pues,
INI l'RllNC'IA
USIAl)ISll(;A.
fll,"flMACION
241
Como todas las variables tienen igual varianza u2, la Ec. (12.7)
birsc as,
(;1)'(cr +u'+
... +
(l)'(nu') =;.u'
u9) ~ ;
puede e cri-
( 12.8)
Esta ecuacin expresa una relacin fundamental: J varianza de las medias

dt muestras aleatorias de tamao n tomadas de una poblacin cuya varianza es <12
rs igual a <12/n.
Tradicionalmente, se ha denominado <12 [n error de la media en trminos de
varianza y la raz cuadrada positiva de la Ec. (12.8) se conoce por el error tlpico
dt' la media,
(12.9)
(12.4)
La varianza tanto de X1 como de X2 de muchas muestras a 1 eatonas es

consiguiente, la Ec. (12.4) puede transformarse en
(t)( u!,
+ u!
1)
= (!)(2~) =
J,./2.
u,"2 por
(12.5)
Esta ecuacin expresa que la varianza de la media de muestras de tamao 2.

tomadas de una poblacin cuya varianza es <12, es igual a <12/2. En este caso, n = 2
y <1~ = <12/2. Este resultado no es una coincidencia, ya que siempre~. vlido para
muestras aleatorias de tamao n, u~ = <12 [n. Veamos esta proposicin ms detalladamente.
Si se seleccionan de una poblacin con varianza <12 muestras aleatorias de ta
mao n, entonces. la varianza de la media X. = (X1 + X2 + ... + X")/n, para
todas las muestras viene dada por
a
<1:t.
I
= <1(z1+z,+
.. +,z:,.)/fl'
(12.6)
El lado derecho de La Ec. (12.6) muestra que <Ti es la varianza de la suma de

las n variables no correlacionadas, X1, X2, , X", dividida por n. As, pues,
Toda variable X, (i = 1, 2, ... , n) tiene una varianza de u2, no correlacionada

con las dems n 1 variables. Por consiguiente, La varianza de la suma de n variables independientes es la suma de las varianzas de las variables, puesto que 111,
covarianzas n(n - 1 )/2 son nulas. De este modo,
(~t,~~
+z1+ ... +z,.l
(~J(<T!, + <T!. + + <Y;,.).
(12.7)
El error tpico de la media es la desviacin tpica de la distribucin de medias

de infinitas muestras, todas con tamao n, de una poblacin cuya 'varianza es <12
Obsrvese que en las Figs. 12.3 y 12.4 La poblacin de la cual se seleccionaron las
muestras tiene una desviacin tpica de 10, pero la desviacin tpica de la distribucin de medias de muestras aleatorias de tamao 100 tomadas de dicha poblacin era l. Lo anterior confirma la Ec. (12.9).
10
J100
q,_ =-==
l.
La estimacin del coeficiente de correlacin de una poblacin constituye un

nuevo concepto de lo que es una distribucin muestra!. Probablemente, en La poblacin de nios de 12 aos de los Estados Unidos, las variables X inteligencia
verbal, Y, tiempo de reaccin, no se correlacionan, pero supongamos que
I toda la poblacin estadounidense de 12 aos se le aplica una prueba de tiempo
de reaccin (Y) y La Escala de Inteligencia de Wechsler para nios (X), se hace
al diagrama de dispersin de estos datos y se calcula, adems, el coeficiente de
correlacin entre X y Y. Supongamos, adems, que la superficie normal bivariada
(vase Sec. 6.7) describe adecuadamente a dicho diagrama de dispersin y que
el valor del coeficiente de correlacin producto-momento (denotado por La letra
riega p) es cero, es decir, que p,.1 = O. (Como el coeficiente de correlacin describe la poblacin, lo consideramos como un parmetro y no un estadgrafo; segn
la.'1 convenciones, denotamos los parmetros con letras griegas y los estadgrafos
con latinas. Es as cmo p es el coeficiente de correlacin de una poblacin y r el
de la muestra de dicha poblacin). Para el caso anterior, puede seleccionarse una
muestra de 80 nios, calcularse sus puntuaciones en X y Y y hallar el valor de la
correlacin entre inteligencia verbal y tiempo de reaccin r,.1. Una vez hecho
r!IIO, se reincorpora la muestra de 80 a la poblacin y se selecciona otra muestra,
lt' calcula su r,., y se reincorpora a la poblacin. Si este proceso se repite indefinidumente, puede acumularse un nmero suficientemente grande de valores de r,,1
Jlllru muestras de 80 tomadas de una poblacin normal bivariada en la cual Px, es
1111111 u O. Cmo seria entonces In distribucin de frecuencias de un gran nmero
Ml!l'OOOS ESTAOISl'ICOS
HO
APLICAl>OS A I AS CII NCIAS SOCIAi l 'l
de ~octlcicntcs de correlacin de muestras? Esto se sabe sin necesidad de seleccionar

cc11,tcnares de muestras y calcular el r respectivo. Puede probarse matemticamente
que::, para muestras aleatorias de 80 tomadas de una poblacin normal bivariadu
en la cual p = O, la distribucin de r se aproxima a la normal con media de O y
var-ianza 1/(n - I} = 1/79. En la Fig. 12.6 semuestra tal distribucin.
E(r)
<Tr
=O
= 0,11
FIO. 12.6 Distribucin aleatoria terica para muestras al azar de r con

magnitud de 80 tomadas de una poblacin normal bivariada cuyo p es cero.
La desviacin tpica de una distribucin muestral de r se conoce como el error

tpico del coeficiente de correlacin y, en el caso particular mencionado, es igual
a 0,1 J. Este error tpico de r se denota por a..
Aproximadamente el 68 % de las muestras tendrn valores de r entre -0,11
y ..+0,11 y el 95 % darn valores de r entre -0,22 y +0,22. Aunque no todas, la
mayora de las muestras tendrn un r entre -0,33 y +0,33. Si se selecciona uno
muestra de 80 personas de una poblacin cuyo valor de p se desconoce y al esiudiaf la relacin entre X y Y se halla un r = 0,08, se podra afirmar categricamente que el p de la poblacin no es cero? Si lo anterior qued bien comprendido.
nadie afirmara semejante cosa. Midiendo en la Fig. 12.6 la proporcin del rea
bajo la curva que se halla a la derecha del valor de r = 0,08, se ve que un 23 %
de las muestras de 80 tomadas de una poblacincuyo p = O dar valores de r mayores
de 0,08. Obsrvese que el 23 % de las muestras de 80 dar valores de r menores
que -0,08 ~s decir, que, cuando p = O, el 46 % de las muestras dar valores de
r con un margen de diferencia respecto de cero mayor que 0,08-; puede apreciar
se entonces que no existen bases para pensar que un r de 0,08 de una muestra de
80 indica que el valor p de la poblacin tiene alguna probabilidad de no ser nulo.
Este tipo de razonamiento es muy parecido a una teora de estadstica inferencia!
que se estudiar detenidamente en este captulo.
12.4
PROPIEDADES
DE LOS ESTIMADORES
A pesar de la importancia de la estadstica inferencial, lo primeros ensayos po,

fo,mali1,ar las propiedades de los estimadores no tuvieron lugnr sino hasta comicn
INFERENCIA
ESTADISTICA: ESTIMACION
211
zos. de ~ste sigl.o y se deben a Sir Ronald Fisher. Los conceptos de consistencia y
eficiencia relativa tratados e~ esta seccin se deben a l.
Anteriormente se seal que un estimador es el valor del estadgrafo de una
muestra qu~ permite inferir algo respecto del parmetro de la poblacin. Por ejemplo, la media de una muestra X. es un estimador de la media de la poblacin y
~bas se calculan de modo anlogo. Es lgico que X. prediga , pero, adems,
existen otros tratamientos para muestras que dan lugar a estimaciones de. Por
qu no pod~~ empl~se la mediana o la moda de una muestra para estimar ?
Esta proposicin es viable, pero, segn los criterios ms reconocidos de evaluacin
de estimadores, i. es la mejor estimacin de .
En esta seccin nos ocuparemos, adems, de las propiedades de las medidas
de estimacin de la mediana, la varianza (u-2), la desviacin tpica (u) y el coeficiente de correlacin (p) de una poblacin. Asimismo, estudiaremos diversos mtodos
para e~timar dichos parmetros, as como las razones por las cuales se prefiere
un estimador a otro y, adems, expondremos detalladamente tres propiedades
de dichas medidas.
No tendenciosidad
(estimador insesgado)
Se dice de un estimador que no es tendencioso o insesgadosi la media de la distribucin de medidas de las muestras es igual al valor del parmetro estimado.
Independientemente de la naturaleza de la poblacin, la media X es un estimador insesgado de. Ntese, en las Figs. 12.3 y 12.4 que tanto el valor. de la media
de la poblacin como el de la muestra es de 15, lo cual ilustra esta propiedad de
i. en tanto que medida de estimacin de . Si se toman al azar muestras de una
distri~ucin normal (o de cualquiera que sea simtrica), la mediana tambin ser
un estimador no sesgado de la media de la poblacin , o sea que el promedio de
medianas de un nmero infinito de muestras aleatorias tomadas de una distribucin normal es igual a (que, en este caso, evidentemente es la meda medana
y moda de la distribucin normal).
'
. Hay muchos ejemplos de estimadores sesgados. Supongamos que se desea
estimar el p de una poblacin con distribucin normaJ bivariada, y que su valor
sea p = 0,25. Para cualquier poblacin finita la media de la dstribucin de coeficientes de correlacin r ser menor que 0,75 y, por tanto, res una media de estimador sesgado de p. La Fig. 12.6 contradce lo anterior, puesto que all se encontr
q.ue la media de los r de muestras con n = 80 era igual a cero y el p de la poblacin de l~ muestras era nulo; as, pues, r constitua un estimador insesgado o
no ten~enc1oso de p, pero esto sucede nicamente en el caso en que p = O. Si p toma
cualquier otro valor entre + 1 y 1, siempre se hallar un sesgo en r como estimacin de p (Olkin y Pratt, 1958, derivaron una medida de estimacin de p in
sesgada, pero su clculo es bastante complejo; los mismos autores construyeron
tablas para hallar una estimacin no sesgada del coeficiente de correlacin de
una poblacin).
Si bien en este capitulo se pone de manifiesto por primera vez la no renden-
MlIODOS
262
lSlAOISII('()',
Al'lltAIIO'
/\ 11\', (IIMIAS
SO<.IAII\
ciosidad, esta propiedad ya haba entrado en juego en la descripcin de variacioncen el Cap. 5. En la Sec. 5.5 medimos la variacin de una muestra con la Irmulu
s; = :E (X, i.)2/(n - 1 ). Aparentemente, seria ms natu~al medirla con el pro
medio de las desviaciones aJ cuadrado respecto de la media de la muestra Y no
como lo hicimos, colocando en el denominador de s2 (n 1) en lugar de ~' Pero
ya estamos en capacidad de exponer en detalle las razones de esta seleccin. /..11
cantidad s2 constituye una medida no sesgada de estimacin de fa varianza de fa po
bfacin u2~ mientras que :E (X1 - i,)2/n s es un estimador negativamente sesgado
de u2 O sea que,
y solamente se aproxima a la igualdad cuando n+ co.

Supongamos que calcularon las s2 de muestras aleatorias de una poblacin
con varianza u2 El promedio de las varianzas de numerosas muestras sena exac
tamente igual a u2 y, por consiguiente,
es un estimador insesgado de <r. Pero,
por el contrario, si se hubiera calculado para toda muestra, :E (X1 i.)2/n, el
promedio de dichas cantidades seria menor que u2, concretamente menor que
[ (n - )/n Ju2 Es claro que si n es r~lativamente ~rande~ del orde~ de l 00 o may~1,
como el valor de (n - l )/n se aproxima a l, la diferencia entre s" y :E (X, i.) /11
sera muy pequea, pero aun as, haba un sesg~ en la es~mac!n de u2 A ve C'I
se dice que como estimacin de u2, :E (X1 - 2.) /n es asintticamente sesgada,
en razn de que a medida que n aumenta el sesgo disminuye.
Sea una distribucin normal, con una media = O y varianza u2 = 100. Con
un nmero infinito de muestras aleatorias de tamao n = 6 y calculando tanto
como :E (X, - i. )2 /6 para todas las muestras, se obtendran las dos distribu
ciones ilustradas en la Fig. 12.7.
s;
INI I RI NCIA P.SlAOISllCA
eSTIMACIO
253
dil\lribucin de 1: (X1 X.)2/6 es igual a 83,33, que indica, en este caso, el sesgo
en la estimacin de u2, derivado de emplear nen lugar den - 1 en el denominador
de las varianzas de las muestras; dicho sesgo es igual a (11 - 1 )/n = 5/6.
Es vlido preguntarse cmo se lleg a determinar que el denominador de la
varianza de la muestra deba ser de n - 1 y no 11 - 2, 11 - 3 o n - t. En ningn
&:ll!!O se lleg a esta decisin empricamente, puesto que existen pruebas maternaneas que establecen la no tendenciosidad des! como medida de estimacin de u2
Aunque no muy dificil, esta prueba es dispendiosa y, por tanto, no la presentamos
14ul. Remitimos al lector a Edwards (1964, pgs. 29-36).
Por el hecho de que
sea una medida de estimacin insesgada de u2. podemos concluir que la desviacin tpica de la muestra es una estimacin precisa de
la desviacin tpica de la poblacin? En ningn caso.
De hecho, una transformacin no lineal de un estimador insesgado no por fuerza
Implica que sea preciso; es as cmo la desviacin tpica de una muestra es una
111imacin sesgada de la desviacin tpica de la poblacin, pero el monto del sesgo
depende de la forma de la poblacin. Si fa poblacin es normal, la media de la distribucin muestral de s es algo menor que u. Especficamente.
s;
E(s) =
4)
, = (4n
--u.
4n - 3
{12.10)
Si n es bastante grande, el sesgo de s ser pequeo, pero persistente. A medida

-+ co, la expresin entre parntesis de la Ec. (12. l O) se acerca a I y el sesgo
de!faparece.
que n
s;
..
'
e
.,
~
u.
I(X-X.)2 = ( n-1) 52
n
n
"
2
I(X-X.)2
s,. = n-1
TABLA 12.1
Parmetro
ql
FIG. 12.7 Distribucin muestra! de S: y de l: (X, 2.)1/6 de muestras

aleatorias de magnitud 6 tomadas de una distribucin normal con varianza CT2 = 100.
Ntese que la media de las varianzas de las mue~~ es 100, 1que es el ~alor de
u2, lo cual comprueba, en este caso, la no tendenciosidad de s11 La media de 111
"
p,,7
TENDENCIOSIDAD Y NO TENOENCIOSIDAD OE OMRSOS ESTIMADORES OE

PAIWIETROS DE VARIAS POBLACIONES
Naturaleza de
la poblacin
Cualquier poblacin
Simtrico
Simtrico y unimodal
Asimtrico
Asimtrico
Cualquier poblacin
Normal
Normal bivariado
Estimador
R
Mediana
Moda
Mediana
Moda
s:
s,,
,,,.,
Eoaluaci del
estimada,
lnscsgado
lnscsgado
Lnscsgado
Sesgado
Sesgado
lnsesgado
Negativamente asimtrico
Negativamente asimtrico
Para u~ interesante discusin del estimador insesgado de la dcsvia.cin tipica,

~tase Cureron (19686). Jarren (1968), Curetoo (196&) y Bolch (1968) en este orden.
La Tabla 12. t presenta algunos parmetros as como sus estimadores e indiloncs acerca de su tcndcnciovidad o no tendenciosidad. Al estudiarla, tngase
Ml!TOOOS l!STAl)ISTICOS
264
Al'l,IC:-AOOS
A I AS CllNCIAS
SOCIAi
lS
siempre en mente que, para estimar el mismo pa~metro, ~ued~n emplearse ~!versos estadgrafos y que el hecho de que una medida de estJmac1~n sea o no sesgada, depende en parte de la forrn6 de la distribucin de las medidas tomadas de
la poblacin.
Consistencia
Una segunda propiedad de los estimadores es su consistencia. Aunque se~gado,
un estimador consistente tiende a aproximarse al valor del parmetro estimado
a medida que la muestra aumenta de tamao, siendo algunos de ellos sesgados
y consistentes, como, por ejemplo, la desviacin tpica s, en tanto que. estimacin
de <1. Si se selecciona una muestra muy grande, el valor de s se aproximar al de
<1 y cuanto mayor sea la muestra, ms cercanos ser~n am?os ~alor~s. Puede cornprobarse lo anterior, si en la Ec. (12.10), n se aproxima ~ infinito. s.1endo u~ ta~I()
inexactos, podemos decir que la condicin de consistencia de un est1m~dor implica
que si se efectuaran exactamente los mismos clculos en la _POblac1n total, se
obtendra el mismo valor, es decir, el del parmetro. La media de la muestra es
una medida consistente de estimacin de , puesto que al aumentar n hasta igualar
la poblacin, 1. sera igual a. (Y, adems, la media de la muestra es un estimador
insesgado de .) El requisito de consistencia es muy importante, ya que rara ve,
se encuentran medidas de estimacin apropiadas que no lo sean, y las pocas que
existen son muy controvertidas.
Eficiencia relativa
La tercera propiedad de los estimadores es su eficiencia: sta se re~ere a la ~re~!
sin con la cual tales medidas pueden estimar un parmetro, es decir, la varabili
dad que pueden tomar en muestras sucesivas. En algunos ejemplos anteriores,
cuando tombamos la varianza o la desviacin tpica de un estadgrafo, nos hemos
encontrado con dicha variabilidad. El error de la media expresado en trminos
de varianza , ~.x, es una medida de la eficiencia de X.; como estimador
de Y del
error de coeficiente de correlacin, expresado en trminos de vananza, es asurusrno

una medida de la eficiencia de r, en tanto que medida de estimacin de p.
El error de una medida de estimacin expresado en trminos de su varianza e\
una de las propiedades ms importantes de sta y se refiere a la varianza de lw,

distribuciones de las muestras del estadgrafo.
Supongamos que se desea estimar el valor de la media de una poblacin no~ul
Se podra calcular la media a partir de la media X. de la muestra de taro.ano n,
as como a partir de la mediana Md; se sabe, adems, que ambos est~d1grafo"'
son consistentes. Cul de los dos debe escogerse? A esto se responde cons1dera~do
ta eficiencia relativa de ambas medidas. Cul de los dos v~a menos ~n sucesivo"
muestras? Cul de los dos tiene un menor error en trminos de varianza?
Si la varianza q2 de una poblacin normal es 50 y el 11 de lu muestra es 10. c11
INl1flRBNCIA
ZI&
ESTAOIS1 ICA: l!STIMACION
tonces la varianza de 2., en sucesivos muestreos aJeatorios ser de <11/n = 50/10

5.
Pero, qu es lo que sabemos acerca de la varianza de la mediana de la muestra,
o~,'/ Si se calcula la mediana de miles de muestras al azar, todas con n 50, tomadas de una poblacin normal con media y varianza <12, la distribucin de
frecuencias de estas medianas ser nonnaJ con media y varianza de (l ,57)<12/11,
que no es sino el valor del error de la mediana expresado en trminos de su varianza. En la Fig. 12.8 se muestran las distribuciones de medias y medianas de
muestras de tamao 10 tomadas de una distribucin normal cuya varianza es 50.
Distribucin
de
(ox.
x.
muestra!
Oi,tribucin
muestre!
deMd
= 2,24)
CoMd
= 2,80)
25
20
FIG. 12.8 Distribucin muestra! de las medias 2. maestrales y de la mediana Md de muestras al azar de tamao 10 tomadas de una poblacin normal
bivariada cuya media - 20 y cuya varianza u1 ... SO.
En la Fig. 12.8, el error de la mediana en trminos de varianza es igual a

(l,57}cr2/n = (1,57)(5) = 7,85, lo cuaJ indica que la mediana vara ms que la
media en sucesivas muestras. Ntese que, si bien solamente el 16 % de las medias
de las muestras ser mayor que 25, aproximadamente el 26 % de las medianas
superar este valor. As, pues, 2. constituye una medida de estimacin de ms
eflcie?te que Md. Para una mayor precisin, la eficiencia de 2. respecro de Md se
describe como la razn de sus errores en trminos de varianza. En tal caso,
eficiencia relativa =
cil/n _
(l,57}cr2/
-~
1,57
= O 637 = 63 7 %
'
Indicando con esto que, para medidas normalmente distribuidas, independientemente de la magnitud de n, la mediana es aproximadamente dQS tercios menos
eficiente que la media aritmtica.
Una de las interpretaciones del coeficiente de eficiencia relativa es que si se
emplea la mediana de 100 observaciones como medida de estimacin de, puede
obtenerse el mismo valor de estimacn calculando la X de una muestra de 64
observaciones.
Para escoger un ptimo estimador de un parmetro, generalmente se combina el criterio de no tendenciosidad (insesgado) y de eficiencia. Por ejemplo, tanto
111 media, la mediana y la moda podran competir por ser las mejores medidas
de estimacin de la en una poblacin normal. Lo primero que se podra plantear
llt'rla cul de todos estos estadgrafos es insesgado como estimadorj. Todos ello
Hlisfacen este criterio. La siguiente pregunta podra ser entonces: ;Cul es el
ms eficiente, es decir, cul tiene el mnimo error en trminos de varianza? 1 a
261
METODOS
l:STAOIS11COS
APLICADOS
A IAS ULNCIAS
SOCIALU
IM
r Rf
CIA ESTADISTICA:
ESTIMACIO
257
moda es la menos eficiente, seguida de la mediana y de la media, que es la campeo

na en eficiencia para predecir . La razn de su amplio uso para estimar la media
de la poblacin , radica en que tieF un menor error en trminos de varianza que
cualquier otra medida de estimacin e . Esta frase resume la importancia de la
no tendenciosidad y la de eficienci .
12.6
ESTIMACION DE INTERVALOS
Los temas tratados hasta este captulo pertenecen a una rama de la teora de la
estimacin de parmetros que se denomina punto de estimacin, puesto que con
sideramos que un solo valor, o si se quiere, un punto sobre una lnea, puede estirnui
un parmetro; por ejemplo, para efectos de estimacin del promedio de aos de
servicio de la poblacin de profesoras de escuela primaria, puede escogerse una
muestra de 100 maestras, cuya 2. sera 3,47 aos. Este nmero representa un solo
punto en la escala de los nmeros y, por tanto, es un punto de estimacin de .
El segundo tipo de estimacin se basa en el concepto de la estimacin por puntos
y se denomina estimacin del intervalo, de suma importancia en estadstica inferenciul
y que habremos de encontrar repetidas veces en el resto de este libro.
Una estimacin del intervalo de un parmetro es un segmento en el continuum
de la escala de los nmeros, en algn punto del cual se supone, se halla el valoi
del parmetro por estudiar. Por ejemplo, en la estimacin de , el resultado di.'
escoger una muestra de una poblacin podra ser el intervalo (25,91, 38,65), dentro
de cuyos lmites -25,91 lmite inferior y 38,65 lmite superior- probablemente
est comprendido el valor de . En lugar de calcular un solo punto como estimacin
de un parmetro, tenemos ahora todo un conjunto de puntos adyacentes, es decir,
un intervalo, uno de cuyos puntos probablemente coincidir con el valor del pu
rmetro. La nocin de estimacin del intervalo es dificil de comprender en razu
del modo cmo se determina con exactitud la probabilidad de que el parrncuu
realmente se halle dentro del intervalo.
Para ilustrar la estimacin del intervalo, refirmonos a X como estimado,
de , as como a lo que sabemos acerca del teorema del limite central respecto lit
la distribucin muestra} de 2 .. Sabemos que si se escogen aleatoriamente mur,
tras de tamao na partir de una poblacin con media y varianza a2, la distribucin
muestral de 2. tendr tambin una media y una varianza de a2/n, y sin es lo ~11
ficientemente grande, la curva ser casi normal. En la Fig. 12.9 se muestra la d1
tribucin de 2 .
En esta figura, la desviacin tpica de la distribucin muestral de medias, o r11
el error tpico de la media es a/Jn. Siendo la distribucin normal el 68 % de hn
observaciones se hallarn dentro de una desviacin tpica de , es decir, que 11
68 % de los valores de las medias de diversas muestras se hallaran dentro del i11111
valo (a/Jn) a + (a/.J'E_). Aproximadamente el 95 % de las medias s11hy11
ce en el intervalo ,, - (2a/Ji,) a ,, + (2a/f,,), puesto que aproximadamente I
95 % del rea bajo la curva normal se halla dentro de dos desviaciones tlp1,1i.
respecto de la media. Mediante una tabla apropiada, podemos determinar e III
,.--
3a
..Ji,
,.-- 2a
../
_____
,,.-..Ji,
O'
__,
,.+!!..
./
,.+
2a
,.+ 3a
./
..Ji,
68%
95%
FIG. 12.9 Distribucin de muestras de X. para muestras aleatorias de ta
mallo n tomadas de una poblacin.
lamente c~ntas desviacione_s tpicas debemos apartamos en cualquier direccin

0 cualquier
otro poi;entaJC bajo l~ curva. Por ejemplo, en la Tabla B del Apndice A se ve
que el 5 % del rea bajo la curva normal se halla por encima de una puntuacin
I de ,64 Y el 5 % ~ halla por debajo de un valor z de - 1,64. En otras palabras,
ti 90 ~ del rea bajo la ~rva normal se halla dentro de una desviacin tpica hacia
tualqwer lado de~ ~~a, es decir, dentro de un margen de 1,64a. En la
F1a. 12.9, lo anterior indica que el 90 % de las medias de las muestras sucesivas
hallaran. ~entro del intervalo (l,64a/Jn) y + (1,64a/Jn). O sea con
una probabilidad de 0,90 una muestra aleatoria tendr una media 2. mayor que
11 (1,64a/Jn) y menor que + (1,64a/Jn).
As, pues, el 90 % de las muestras al azar resultantes de una poblacin normal
darn lugar a medi~ de muestras ~entro de una distancia de 1,64a/Jn O menos
. El punto crucial del razonamiento subyacente a la estimacin del intervalo
el siguiente: Si el 90 % de las .2. se hallan a una distancia de de {l,64a/j;;).
,.,,onces el sumarle o restarle dicho valor da lugar a un intervalo que va desde
I (l,64a/Jn) hasta X. + (1,64a/Jn) y que tiene una probabilidad de 90 %0 de
,aptar dentro de sus lmites el valor de . La Fig. 12.10 ilustra esto.
La media que result del muestreo aleatorio n de la poblacin se halla a una
,-.viaci? tpica a/Jn por~~
de, lo cual era de esperar, puesto que ante
de seleccionarse, la probabilidad de que esto sucediera dentro de un intervalo
f'UIYOr 1,64a/Jn era de 0,90. Como esta media particular
se halla dentro de
lana desviacin tpica de, al sumar o restar l,64a/Jn de X., el intervalo resultante
todos modos, incluir 1. De hecho, este intervalo, que va desde 2. - ( 1,64<1 , 11
ua 2. + ( 1.64a/ n) incluye cualquier punto que se halle a una distancln de
de la media p~ e~tablecer mtervalos que incluyan 80 %. 90 %, 99 %
X.
251
1111 1111111,
1 ',I
\1 )l',1 1( O\
\ l'I IC \1111',
\ 1 \',
t II M 1 \',
\11( 1 \ 1 1 \
1"'11
Rt
1',(11\
151 \1)1\IIU\
rsruwcro-,
251
prenden dentro de us limites la media de la poblacin y el 10 % de los cuales no

la comprende. Evidentemente, la probabilidad de que un intervalo escogido al
a,ar capte el valor de dentro de sus limites es de 0.90 y la de que 110 lo capte e,
Je 0,10.
El enunciado matemtico anterior es conciso. no ambiguo y muy e clareccdor.
Como X. se distribuye normalmente. con media p y varianza u2/11. la variable
1.r. - p)/(a/J,,) tiene tambin una distribucin normal con media O y varian111
1,64
1.
Entoncc-,
probabilidad (- t,64
}n
FIG. 12.10
Ilustracin de cmo el intervalo e tablccido
capta el valor de 11 dentro de sus lmites.
respecto de
i.
igual O menor que 1,64<1/J,,, y como la distancia a la cual se halla de i. e

d~ slo u/J,,, estar captada en el intervalo. Qu valores debe to'.11ar X. pa111
que II se halle dentro del intervalo de l ,64a/fi, unidades ~e X.? Evidentemente
si i se halla por encima de + (1.64u/J,,) o por debaJo_ de _ - (l,64u/ 111
entonces j se hallar a una mayor distancia de ,, que la distancia comprcndulu
en el interv~lo de l ,64a/
La probabilidad de que esto ocurra es de O, 1 ~ puesto
que el valor de l ,64a/J,, se escogi en razn de la pr?babilidad de que el intervalo
tuviera una probabilidad de 90 % de incluir las medias de las muestras. Es obvin
111
que el 10% de las medias se hallarn fuera del intervalo que comprende 11-(1,64<1/
hasta t+(l,64a/fi,). En la Fig. 12.11 se ilustra este caso.
j
Jn.
g_
X.+1,64/,j
FIG. 12.11
Ilustracin de cmo el intervalo establecido respecto de X
puede no captar el valor de Je dentro de sus limites.
Consideremos ahora el conjunto de medias de muestr~ ale~torias con 11 11

en la cual todo elemento se denota X.. Podemos construir un intervalo rc,~111,
de cada una de estas medias sumando o restando de cada valor l ,64u/ " l 11 11
en el cual tendremos un conjunto infinito de intervalo-. IJO ",, de los cuale- u1111
< :,;.
<
l,64) = 0.90.
(12.11)
Es decir, que la probabilidad de que la distancia entre X. y p medida en unidades de
a/Jn
sea mayor que -1,64 y menor que 1,64 es de 0,90. Si la desigualdad

dentro del parntesis se multiplica por
se resta el valor de X. en toda la deslaualdad y se multiplica por -1 para cambiar la direccin, la Ec. (12.11) se conviene en
probabilidad{[x. - (t,64
u/Jn,
j;)] < < [x. + (1,64 j;)]} = 0.90.
A11I, pues, la probabilidad de que sea mayor que X. (l .64a/J,,) y menor que
(l,Ma/J,,) + X. es de 0,90.
Un intervalo de confianza es aquel en el cual se conoce la probabilidad de que
ti valor del parmetro se halle dentro de sus lmites, probabilidad que debe empicarse para identificar dicho intervalo. En el ejemplo anterior, tenamos un inlrrvalo de confianza de 0,90 o de 90 %. El coeficiente de confianza es la probabilidad
de que dentro de todos ellos un intervalo escogido al azar (..f. zu/J,,) capte
ti parmetro. En el ejemplo anterior, el coeficiente de confianza escogido era de
0.90. Tambin puede enunciarse esto de la siguiente manera: Determinamos un
Intervalo con un coeficiente de confianza de 0,90. Y, finalmente, se dice que se
~ un intervalo de confianza respecto de la medida de una muestra, pero sobre
un parmetro, porque, para determinada poblacin, el parmetro slo toma un
talor. Por ejemplo, X. (l,64a/J,,) es el intercalo de confianza 0,90 respecto
,Ir f .. sobre JI.
'-o determinar y emplear el iote"aJo de confianza. Presentaremos a contilUacin un ejemplo de la aplicacin de la estimacin del intervalo expuesto con
ucho detalle para que pueda comprenderse mejor la teora explicada anteriormente.
Dentro de sus limitados recursos, un investigador desea determinar con la
xima precisin po ible el CI promedio de 35.000 alumnos de cuarto elemental
lltdmntc la Escala de Inteligencia para Nios de Wechsler (WISC). Esta es una
ucba individual que 111nk ejecucin. inteligencia verbal y una combinacin de
1bo, que constituye d l 1 cncrul. y solamente puede ser administrada por cxa-
Ml!TOl)OS ESTAl:>ISTICOS
ZIO
APLICADOS A LAS CIENCIAS SOC'IAl,I S
minadores muy entrenados. El investigador tiene fondos para pagar solamente

900 administraciones de dicha prueba.
Este individuo tiene buenas razones para creer que los alumnos de cuarto elemental de su regin se distribuyen de modo tan heterogneo como los de la muestra
original normativa del WJSC, pero asimismo. tiene razn aJ pensar que la puntuucin promedio de su grupo puede diferir un tanto del grupo normativo. Por .consiguiente, desea ha11ar una varianza de 225 p~el CI general de su grupo. igual
a la varianza de la muestra original".
Nuestro investigador est entonces en capacidad de tomar 900 Cl del WIS '
con una varianza de 225 de una poblacin de 35.000 y como estimacin de u calcular X . Desea un intervalo con un coeficiente de confianza de 0,99. Con una muestra de 900 se puede tener la seguridad de que en sucesivos muestreos, X. se distribuir de modo aproximadamente normal respecto de , con un error tpico de
<J/J,i = j225/900 = 0,5. En la Tabla B del Apndice A puede ?et~rmfoa.rs.e
que el 99 % del rea bajo la curva normal se halla dentro de 2,58 desviaciones upicas respecto de la media. En la Fig. l 2. l2 se ilustra la distribucin de X. en muestras
de 900 tomadas de una poblacin con <12 = 225 y en la cual la distancia en trminos de <Jj, a lo largo de la lnea de base, es de 0,5. Por consiguiente, el 99 % del
rea bajo esta curva se halla dentro de un valor de de 1,29, puesto que
2,58(0,5) = 1,29.
.
La interpretacin del intervalo de confianza a menudo se presta a confusin.
Por ejemplo, puede pensarse errneamente que, si el intervalo de confianza 0,95
sobre . respecto de una media de 46,25 abarca valores que van desde 36,25 ha.111
56,25, el 95 % de las medias de las muestras se hallarlan dentro de d_icbos valore~,
lo cual es una interpretacin incorrecta del intervalo de confianza. S1, por casualidad, el valor de 46,25 se ha11a muy lejos (digamos 3<Jj) hacia la derecha o hacia
ta izquierda de (y, en este caso, esto no puede determinarse), entonces, menos
de ta mitad de las medias se hallarn entre 36,25 y 56,25.
_
El enunciado correcto se expone diciendo que la probabilidad de que X. se
aparte de (l ,96<J/J,i) es de 0,95. Escrito en smbolos:
prob {[ X.
- ( 1.96 ;;) J < < [X."+ ( 1.96 ;;) J}
= 0,95.
(12.12)
Se entiende que el enunciado de probabilidad se refiere al espacio muestra! de

todos los intervalos que podran formarse tomando uno de cada muestra. La Ecuacin (12.J 2) es perfectamente clara, puesto que comprende la variable X. respect
El estudiante se habr percatado de la arbitrariedad de la asercin de que u2 es conocido y 1111
lo es, puesto que casi siempre o ambos se conocen o ambos se desconocen. En este caso, sup~si~os cstu
situacin para fines de claridad en la estimacin. puesto que el problema sera muy complejo sr se h11
biera de estimar tanto u1 como a partir de la misma muestra. Es mucho ms comn el caso en t111r
se desconoce tanto u2 como . La teora de distribucin que solucion el problema de la estirnaci
de intervalos puede considerarse como el albor de los mtodos modernos de estadstica inferencial, V
no se conoci hasta principios de siglo. Se le debe a W. S. Gosset. cuyo seudnimo era Student (190K)
y aludiremos a l as como a su investigacin, que marc capitulo tan importante en In estadlsticn r11
un prximo capitulo.
INfll'RPNCIA
~IAl)IS11C/\:
ESTIMACION
,u-1,50
,u-1,00 ,u-0,50
211
,u
,u+0,50
,u+l,00
.u+l,50
99%
FIG. 12.12 Distribucin muestra! de f. de muestras aleatorias de magnitud 900 tomadas de una poblacin cuya se desconoce y cuya varianza
es u1 "" 225.
de la cual se estn haciendo los enunciados de probabilidad. Sin embargo, es incorrecto decir que hay 95 % de probabilidades de que 46,25 se aparte de 1,
l ,96<J/J,i con base en una sola muestra cuya media se le asign un valor de 46 25
No es legtimo escribir
'
prob {[46,25 - (1,96 ;;)
J < < [46,25 + (t,96 ;;) ]} = 0,95.
fll enunciado anterior no tiene sentido, puesto que ninguna de las cantidades implicadas cambia de muestra a muestra.
Existen 99 % probabilidades de que la media de una muestra aleatoria se halle
I menos de 2,58<J/Jn unidades de. Para n~estro ejemplo, 2,58<JJJ,i = (2,58)(0,5) =
1.29.. Aunque ~1 valor d~ 5<:3 desconocido, lo anterior siempre es cierto y, por
eonsigurente, si nuestro investigador suma o resta 1,29 de todas las medias de su
muestr~, ~btiene ~na probabilidad de 0,99 de captar el valor verdadero de dentro
de l~s lmites del mtervalo de confianza que construy. Caso de que obtenga una
media de 103,72 en su muestra de 99, el intervalo de confianza de 0,99 de respecto de X. se calcula de la siguiente manera:
X, 2.58 ;; = 103,72 1,29 = (103'.72 - 1,29. 103 72 + 1,29)
= (102,43,
105,01).
A veces se expresa est~ diciendo qu~ la probabilidad de que (102,43; 105,01)

01pte a es de 0,99. Ademas de no ser cierto, esto se presta a confusiones. El valor
de I' se halla o no ~ halla dentro de estos limites, pero como ste no se conoce,
no podemos saber s1 realmente se halla o no en este intervalo; lo nico que sabemos es que solamente estas dos posibilidades son lgicas. No siendo el intervalo
1111101)0\
IZ
1 \1
1)1',II('()\
1'11(
\1)11\
\ 1 \\
111 M IA'> ',O( 11\I I \
1'111 IU M 1 \ 1 ', 1 \111'
102,43; 105,01) un espacio muestra! (~~ase Sec. 10.2) al h?~cr referencia a~~. m'.
ene ningn sentido hablar de probabilidades. Las proba?1hdadcs Y el coeficiente
e confianza se aplican al proceso sucesivo de formar intervalos de confianza
R. von Mises. uno de tos dos o tres responsables de las nociones. modernas d~ ~,o
habilidad en estadstica. dijo (1939. pgs. 1 !-14): Nuestra tcona de ~~obabrlidad
no tiene nada que ver con preguntas tales como: 'hay alguna p111hab1hdad ~e que
Alemania entre en guerra con Liberia'!' ... puede afirma.rse. ~u~ para aplicar la
eora de probabilidad, debemos disponer ~e una sec~~nc1a ilimitada de observa.
ciones similares, Si nuestro investigador repit~a seleccin de ~u muestra~ construye
ntervalos de confianza sobre JI indefinidamente, entonces st ~uede decirse que el
99 % de los intervalos obtenidos captan el valor de JI, El ~spac10 muestral en/, ct~~~
tin es el conjunto de todos los intervalos de confianza posibles. Pero: en la_ pracucu.
os investigadores no seleccionan sino una muestra. con lo cual es imposible ~""'''
si el intervalo de confianza obtenido abarca o no el parme~ro, puesto que puc~cn
darse ambas posibilidades. Lo nico que se sabe es_ ~ue s1 se repite la seleccin
un nmero indefinido de veces, se tiene una probab1hdad. de que el v3!or del0 r,1
rmetro se halle dentro del intervalo de confianza escogido en el 99 %, 95 ." 11
cualquier otro porcentaje de las veces. Si el coeficiente de confianza es lo suficicn
temente amplio, 0 nico que se puede hacer es creer que el intervalo realm~1~1c
comprende el valor del parmetro. (Existen buenas razones para escoger cocficien
tes de confianza altos -0,90, 0,95, 0,99 o mayores an-). Claro que con algo
de inteligencia se tendr en cuenta la bajsima probabilidad (0,01, 0,05 o 0,10) de
haberse equivocado.
La siguiente
expresin
Z1-c.121
;; ,
X,+ Zi-(/21
;;)
( 12 1
es anloga a la anterior:
X.
,J;
(J
Z1-c111
(12.14)
IS IIM \C'ICI,
En los datos a continuacin

l.
161
).C
ilustran
la.
Ecs. (12.13)
y (12.14):
= 400 y q1 = 36. con un coeficiente de confianza escogido arbitra, w

mente igual a 0.95. es decir. que 1 - :x = 0.95. de modo que 2 - O.OS
En la Tabla B del Apndice A se ve que el 100(:x 2) ''o = 2.5 0 del rea
bajo la curva normal se halla por encima de la puntuacin de 1.96. A'1.
pues, =o.9,s = t.96.
11
2. La media de la mue tra de 400 ob crvacione-, e;, 51.04.

Podemos hallar el intervalo de confianza sobre
como sigue:
f c. ( 12.14)
51,04
Esquema de la determinacin de IDl Intervalo de confianza sobre Jt rcspcct_o de J' p11r11

muestras grandes en las cuales se conoce a2 Supongamos q~e se selecciona~ muetras con un II lo suficientemente
grande como para garant11.1~ la normalidad 11,
la distribucin de las X., pero que a la vez se desconoce la media 1 de la poblucum
y se conoce su varianza, q2 Se construye entonces un intervalo de confian~ sob
JI respecto de la media g_ con un coeficiente de confianza de 1 - ex; por ejemplo,
si se desea un valor de 0,95, ex = 0,05. (Esta manera, un tanto desusa~a, de ~cnot,11
el coeficiente de confianza se basa en razones que se comprenderan mejor de,
pus de ms experiencia estadstica inferencia!, adems de obed~r a un pre
dente histrico. En la Sec. 13.4 se expone el origen de esta notac1_~)
En Ja Tabla B del Apndice A se encuentra el valor de la puntuacin = por c11
cima del cual se halla el t OO(ex/2) % del rea bajo la curva normal. Esta pun~uarnu1
= se denota por = 1 _ c ..,21 y el intervalo de confianza de 1 - ex respecto de X , i.111
dado por la frmula
( X. -
ne \
1)
(1,96)-
6
20
= (50,45.
JI
re ... pecto de
Y mediante la
51,63).
lkitnninacin de intervalos de confianza respecto de coeficientes de correlacin

muestras. El ltimo ejemplo de la teora de la estimacin de intervalo se relkrc a una tcnica de mayor utilidad que la expuestas anteriormente y que es el
nuervalo de estimacin del coeficiente de correlacin p en una distribncion normal
#,11 arlada (vase Sec. 6. 7).
Generalmente se estima p calculando un punto de e timacin r de una mueslrll aleatoria, a pesar de que. como ya se dijo. r es un estimador se gado de p. Sin
embargo, r no ofrece un sesgo considerable y cuanto mayor sea 11. menor ser el
error (es, pues, asintticarnente
sesgado. puesto que el e go de aparece con
1111 11 infinito).
,Cmo se establece un intervalo de confianza respecto de r de modo que capte
ti valor de p dentro de sus limites en el 95 % de las ocasiones? La teora e la mi ma
r11 la que se basa la estimacin de . pero en este Cebo surgen algunas complica~ umes que deben obviarse.
La teora de la estimacin de intervalos se refiere a: (1) hallar la di tribucin
dr lu,; muestras de r; (2) hallar el error tpico de r: (3) sumar y restar algn mltiplo
drl error tpico de r a partir del valor de r con el objeto de determinar el intervalo
de confianza. Sin embargo, ya en el primer paso tropezamos con serias dificultades.
la, mismas que encontraron los estadsticos de principio de iglo al tratar problemas inferenciales respecto de r, a saber: para hacer una inferencia estadstica
tt,pccto de p. primero debe conocerse el error tpico de r, pero para esto. debe
onecerse el valor de p. Esta situacin no tiene solucin. puesto que si conocemo
p. no tiene sentido construir un intervalo de confianza para que lo prediga.
Para cualquier valor de p, se conoce la distribucin muestral de r tomada de
111u1 poblacin normal bivariada con un coeficiente p. Para p = O y 11 = 30 o mayor .
.. divtribucin de r es ca i normal, con una media de O y una desviacin tpica a,
l,11111 a 1/~.
Sin embargo. para p = 0.60. la distribucin de r 110 es nortn&al, su media JI, o E(r) no es igual a 0,60 y u desviacin tpica <1, e, igual a
O,K0
1: a,i. pucv, l:1 d,,1nh11rn\n mucvtrul t.." marcadamente avimctrica hacia
derecha. ;,Ctdl ,cliu la cl1,111h11~u\11 mucvtrul cuando ,,
P In 111 poblucrn
1./11 -
214
MllOOOS
I SIAl>ISIIC()'I
APII( Al)Cl'I A 1 ..\\
t II
N(IA\
OC IAll 'i
en la cual X y Y se relacionan de modo lineal perfecto (si p,,1 -= 1. esto debe ser
asl por necesidad) es posible escoger una muestra en la cual r sea diferente de 1 'I
La desviacin tlpica de la distribucin de r a partir de muestras aleatorias de
tamao n tomadas de una poblacin normal bivariada cuyo coeficiente de correlacin es p, es
<1,
Jl n-1
p2.
+ r)/(l
ZII
-3,0
-2,8
-2,6
-2,4
-2,2
3,0
2,8
2,6
2,4
2,2
2,0 s:5
1,8 ..:
1,6 'O
....
1,4
1,2
1,0
0,8
0,6
0,4
0,2
-2,0
A medida que p aumenta desde O a + 1, la distribucin de r se vuelve ms asimtrico

hacia la izquierda y a medida que p disminuye de O a -1, la distribucin se vuelve
ms asimtrica hacia la derecha. El estudiante puede apreciar la tremenda dificultad
para emplear la informacin de las muestras de r en la determinacin de intervalo,
de confianza sobre p; Fisher (1890-1962) les dio solucin a estos problemas en
1921, determinando que una transformacin matemtica del coeficiente de corre
lacin de las muestras dara lugar a una cantidad con una distribucin muestra!
cuya varianza seria siempre la misma, independiente del valor de p. Esta transf or
macin se conoce como la transformacin 2 de Fisher, que, para cualquier r, M:
denota por 2, y para cualquier p, 2P. La siguiente es la frmula de 2,:
2, = log, J (l
INII RI N('IA I Sl Al>l', 11( A l:Sl IMACIO
....
-0,6
-0,4
-0,2
o._._~~~'-::;:;-.~;t;;,~~~~-!::--J~-L_i__.L:1
o
o 0,20 0,40 0,60 0,80
r
r).
(12.1 S)
FIG. 12.13
Relacin entre r y la transformacin de F!S'her de (T
d
d ta F' 3 0
r. orna o
e
1g. .1 del texto de Julian C. Stanley, MNSUrcmaits in Toda
h Is
~~
1964, con autorizacin de Prenlice-Hall lnc., Englcw"~~Clm-S:
1~
Para hallar la transformacin 2 de p slo hay que sustituir p por r en dicha

ecuacin:
zp =
log,
Je.+
p)/(1 - p).
Este simbolismo matemtico puede sorprender un tanto. De hecho, nadie calen

la 2, con dicha ecuacin, sino que, para ello, se empica una tabla (Tabla G del
Apndice A). All, se da 2, para valores de r desde O hasta 1,000, con aproximacio
nes de 0,001. Si r es negativo, se le aade el signo menos a 2,. Comprebese que
un Z, de 0,418 corresponde a un r de 0,395 y que un r = -0,775 da lugar a un
2, de -1,033. En la Fig. 12.13 se presenta el grfico de la transformacin de r en/
Supongamos que tenemos una distribucin de r de miles de muestras de ma
nitud n, tomadas de una poblacin normal bivariada cuya correlacin es p. hl
lugar de hacer la distribucin de frecuencias de los r obtenidos, supongamos <111,
se hace una distribucin de los 2,. 1 distribucin de frecuencias 2, sera casi "'"
mal, con una media de 2. y una varianza de 1/(n - 3) y su aspecto seria como d
de la Fig. 12.14.
La transformacin Z de Fisher es lo que necesitbamos para poder construu
intervalos de confianza respecto de r. La desviacin tpica de 2,, en numero,"
muestras aleatorias ser 1/~, independientemente del valor de p. As, pueen muestreos sucesivos, el 90 % de los 2, se hallarn a una distancia de una dcsvm
cin pica 1,64<1(1/~)
de 2P y el 95 % a una distancia de 2p, 1,96(1/ 11 1)
La distribucin de Z, es aproximadamente normal, independientemente de 111
magnitud de 11. Por consiguiente. podemo determinar la probabilidad de incluu
z,
Media=
Desvlo tpico = _1-
..l=3
z--1-
z,
Z+-1-
, ,,r,;:.-3
FIG. 12.14 Distribucin muestra! de transformaciones

de Fishcr de
~ra _muestras aleatorias. de magnitud n lomadas de una distribucin 00~
bivariada con un coc6c:ientc de correlacin p.
I" dentro de los intervalos fi~ados, sumando o restando algn mltiplo de I/~
1 7.,. Podemos conceptualizar el problema considerando que
se distrib
normalmente, con media de 2P y desviacin tpica de I/ c---;3'
uye
v n - .>, y entonce
l,
11,
11
z,.
3
\ti 101)()\
61
r \1)1\
1\
1 lt ()\ i\l'I 11
110\
.
dit de
e distribuye a su vez normalmente, con una me 1.1
e 1. Por consiguiente.
Ze.
J
1 96 e: Z,
prob [
1/,111
Z, - Ze
2,58,
prob [
t.96
oy
una desviacin
0,95.
0,99.
2,58
1//11_
\ 1 \\ t 11 -.( 1 \\ \()( 1 \11 \
1ip11 .. 1
IMIRI
(li\
ISI
Dl\11(/1
217
lSllMAC'ION
,le 1111t1n on cnc/icir111t!i de rarrelactn. Es a,; cmo leyendo la Tabla G hacia a11.h.
hullumos los valores de r correspondientes a las respectivas puntuaciones % de
0.032 y 0,468 que son 0,032 y 0,436. Por consiguiente. el intervalo de confianza 0.95
respecto de r = 0,245, abarca calores desde 0,032 hasta 0.436. Podemos estar ca,,
seguros de que el coeficiente de correlacin p de la poblacin se halla entre 0.032
y 0,436.
12.8
CONCLUSION
y el intervalo
Z r
1 96
>
.Jn-
- 3 z, +
( 12.16)
J 11 -
1,96
incluye entonces Zp, con una probabilidad de 0,95;
z, .
2,58
.Jn-3
rte el intervalo incluye
z,
.1
2,5&
.J
( 12.17)
n-3
z,,
con una probabilidad de 0,99.

.
il~stracin de las Ecs. (12.16) y (12.17) supongamos que se_selecc101~t;
84 245 de lo que se supone es una poblaci n norma
una muestra con 11 = O , , r '
'
6
d
95
bivariada. Se desea un intervalo con un cocfici_ente de con. a~zad A 'ndicc A
En primer lugar. se transforma r en Z, mediante la Tabla
e P
por~~;;
to
20,245 = 0,250.
r tpico de Z, multiplicado por 1.96. da:
En segundo lugar. el erro
1 96
1
~
.J84 - 3
1,96
9
= 0,218.
.
1 d
fi
deZ de195% sustituyendovaloresenlaEc.(12.16)
Se halla el nterva o e con anza
,,
'
Los lmites inferior y superior del intervalo son
z.,
- 1 96
1
.Jn -
= o,250 - o ,218 = o,o32

3
z, +
1,96
.J-n 1-
= 0,250 + 0.218
= 0.468,
respectivamente.
.
b bilid d d O <)'I
(O 032 O 468) se obtuvo supomendo una pro a t i a

e ,
El interva o ,
, ,
. Z d
D
t 11 iodos
e!
. ,
intervalo incluya la transformac,on
~ e PF. I<' . "s . 111
para
que dicho
1
1111 111
tntorvaio tic co11/io11:o , ., ms claro si las p1111f11mmm., 7. tu: '/\ 11, .,,. '""''
''
FI propsito de este captulo era presentar la teora as como algunas aplicaciones

de ta estimacin de intervalos, y se hizo tan detalladamente con el objeto de que
has bases de esta utilsima tcnica en estadstica inferencia! queden bien firmes.
l:n captulos posteriores el estudiante encontrar numerosos ejemplos de la aplicabilidad de intervalos de confianza, cada uno de los cuales ser diferente de lo,
presentados hasta el momento. Se describirn nuevas distribuciones tericas referentes a distribuciones muestrales de otros estadlgrafos de importancia y se
mostrar asimismo la solucin del problema de asignar un intervalo de confianza
respecto de 2., cuando se desconoce <12 Veremos. adems. cmo adscribir ntervalos de confianza respecto de la diferencia entre d11, v-timaciones de muestras,
digamos entre 2.1 y 2.2 (o sea, las medias de dos grupos diferentes de observavrones de ta misma variable) con el fin de estimar la diferencia entre dos parmetros. por ejemplo, 1 y 2 (Esta tcnica es de alta utilidad para comprobar la . uperioridad de una poblacin respecto de otra.) Sin embargo, la base es la mi ma
para la mayora de los ejemplos citados en captulos posteriores (con una nica
excepcin que se presenta en el Cap. 16).
En el Cap. 13. introduciremos un nuevo campo de la estadstica inferencia!
'iUC es el contraste de hiptesis, metodologa sta ampliamente usada en invcvllacin educativa y otras ciencias de la conducta y estrechamente emparentada
1.on el concepto de estimacin de intervalos. De hecho, aunque a veces el estudiante
~e estadstica no se percate de ello, la estimacin de intervalos y el contraste de
hptesis son las dos caras de una misma moneda.
,ROBLEMAS Y EJERCICIOS
Seleccionar una muestra aleatoria de ocho estudiantes a partir de la siguiente serie de 16
(empicar la Tabla A del Apndice E):
Juan
Maria
Alicia
Roben o
Alejandro
Tomv
Mu111icio
U.uh.11.1
Juana
Susana
Marta
Jaune
Felipe
Pablo
Edith
N1col:h
METOl)OS ESTADISTICOS
288
2.
APLICADOS A L1\S CIENCIAS SOCIALl'I
En cul de los siguientes pares, ambos trminos indican lo mismo?

a. 1: el error tipico de X.; 2: la desviacin tlpica ce ta distribucin muestral aleatorio
de
b. 1 : <1~/11; 2: error ti pico de i ..
c. 1 : error de i. en trminos de varianza; 2: varianza de la distribucin muestral de /?,.
d. 1: varianza de la poblacin r,2; 2: errorde X., en trminos de varianza, multiplicado
por n.
.
e. J: media de la distribucin muestra) de sJ6x; 2: <1x
INI JlRPNCIA
H.
x.
3.
Recordando la relacin entre la media y la mediana de una distribucin positivamente

asimtrica, en la Fig. 12.7 se ve que, en_..general, la distribucin muestra) des! toma dichn
forma. La probabilidad de obtener un valor mayor que <1! es superior o inferior a 0,50?
s:
4.
Se selecciona una muestra de tamao n, cuya media y varianza son respectivamente 220
y 50. Calcular el error en trminos de varianza y el error tpico de i. para diversas magni-
tudes de muestras con el fin de completar la siguiente tabla:
n
a. 2
b. 4
c. 8
d. 16
e. 32
f. 64
g. 1000
h. 2000
5.
6.
7.
Al seleccionar muestras de tamao n de una poblacin normal con media de y varianza

de a2, el error de X. en trminos de varianza es a2 /n, pero el error de la mediana en trminos
de varianza es 1,57 a2/n. Para estimar en determinado problema, se dispone de = 100,
a2 = 25, y n = 25 y <le.~.; el error de X. en trminos de varianza es de a2/n = 25/25 = l.
Si se escogiera la Md para calcular, qu magnitud debera tener el n de la muestra para
qu~ el error de. Md en trminos de varianza, a~, fuera tambin igual a l?
Se toma una muestra de tamao n a 'partir de una poblacin con media y varianza u1
Permite la magnitud de la muestra suponer que X. se distribuye normalmente? Determina,
las probabilidades de que i. se halle entre los siguientes pares de puntos:
a.
b.
c.
d.
e.
+ a/ ' n y - a/ Vn
+ l ,64a/ Y;; y - l ,64a/ v;
+ 2,S8a/ Vn y - 2,S8a/ v;;
+ 0,61Sa/ v';; y - 0,61Sa/ ,1;;
+ 3a/ v;; and /1 - 3a/ ,1;;
Se seleccion al azar una muestra de l 00 personas, cuya X. es de 106, 75, a partir de una pobln
cin cuya varianza es 16, pero cuya media , se desconoce. Determinar el intervalo de con
fianza 0.95 sobre respecto de X..
llSTAl;)IS'flCA:
211
Determinar los intervalos de confianza 0,95 y 0.99 sobre para los siguientes casos:
a. n ... 28, r "" +0,36
9.
1:STIMACIO
b. n ... 12, r - -0.65
c. n = 300, r
~l de los siguientes estadgrafos, en muestras aleatorias de tamao

varianza (error en trminos de varianza)?
17
a. "
=Xi+
... + X,.
n
b.
X ""Xi+
..
(n
+ X,.
1)
+0,14
II
'
tiene meno,

Glass y Stanley Cap 12. Inferencia Estadística. Estimación

Transféré par

Informations du document

Copyright

Formats disponibles

Partager ce document

Partager ou intégrer le document

Options de partage

Avez-vous trouvé ce document utile ?

Ce contenu est-il inapproprié ?

Droits d'auteur :

Formats disponibles

Glass y Stanley Cap 12. Inferencia Estadística. Estimación

Transféré par

Droits d'auteur :

Formats disponibles

MI IOl>OS

FJ objetivo de la inferencia estadstica en investigacin cientfica y tecnologa

l'ST/\IJIS1 ICOS APLICADOS

A LAS CU NCIAS SOC'IALF

cidental, todos tos refrigeradores fabricados en el Canad en la l.tima d~cada,

Puede considerarse el estadgrafo de una muestra como una estimacin del

F.Sl'/\l>ISI ICA: ESTIMACION

El razonamiento por inferencia estadstica se basa en estimar un parmetro

Las muestras y estimaciones que se calculan ~ partir ~e poblaciones dan cierta

MI I Ol)Ol> t \ 1 Alll\ 11( U\ Al'l lt \llll\

',(')( IAI I'

distribucin de frecuencias de estos ccntcnar~s de mediuv de tu~ mue tras e,

de probabilidad de una poblacin.

Sea, por ejemplo, determinada poblacin con varios centenares de ~lemento,

E ta figura da una idea de lo que seria la distribucin real de 2 de mucstru-,

12.2 Distribucin de frecuencias de 100 medias de 100 muestras

Distribucin de X para una poblacin .

El siguiente ejemplo ilustrar el teorema del limite central. Supongamos que

FIG. 12.4 Distribucin de las medias

grandes para dar lugar a distribuciones de medias X. aproximadamente normales,

Ahora bien la primera observacin que escogimos arbitrariamente, X., se

Prim8!a observacin en la muestra. X,

Dicho en palabras, el valor esperado de X., que es la media de la pob~acin de /11

All se muestra claramente que en centenares de observaciones de muestras

e II N( IA'l SOCIAi 1 'l

Esta ecuacin expresa una relacin fundamental: J varianza de las medias

La varianza tanto de X1 como de X2 de muchas muestras a 1 eatonas es

Esta ecuacin expresa que la varianza de la media de muestras de tamao 2.

El lado derecho de La Ec. (12.6) muestra que <Ti es la varianza de la suma de

Toda variable X, (i = 1, 2, ... , n) tiene una varianza de u2, no correlacionada

+z1+ ... +z,.l

(~J(<T!, + <T!. + + <Y;,.).

El error tpico de la media es la desviacin tpica de la distribucin de medias

La estimacin del coeficiente de correlacin de una poblacin constituye un

APLICAl>OS A I AS CII NCIAS SOCIAi l 'l

de ~octlcicntcs de correlacin de muestras? Esto se sabe sin necesidad de seleccionar

FIO. 12.6 Distribucin aleatoria terica para muestras al azar de r con

La desviacin tpica de una distribucin muestral de r se conoce como el error

A pesar de la importancia de la estadstica inferencial, lo primeros ensayos po,

y solamente se aproxima a la igualdad cuando n+ co.

INI I RI NCIA P.SlAOISllCA

Si n es bastante grande, el sesgo de s ser pequeo, pero persistente. A medida

FIG. 12.7 Distribucin muestra! de S: y de l: (X, 2.)1/6 de muestras

TENDENCIOSIDAD Y NO TENOENCIOSIDAD OE OMRSOS ESTIMADORES OE

Para u~ interesante discusin del estimador insesgado de la dcsvia.cin tipica,

error de coeficiente de correlacin, expresado en trminos de vananza, es asurusrno

El error de una medida de estimacin expresado en trminos de su varianza e\

una de las propiedades ms importantes de sta y se refiere a la varianza de lw,

ESTAOIS1 ICA: l!STIMACION

tonces la varianza de 2., en sucesivos muestreos aJeatorios ser de <11/n = 50/10

En la Fig. 12.8, el error de la mediana en trminos de varianza es igual a

moda es la menos eficiente, seguida de la mediana y de la media, que es la campeo

lamente c~ntas desviacione_s tpicas debemos apartamos en cualquier direccin

de la media p~ e~tablecer mtervalos que incluyan 80 %. 90 %, 99 %

prenden dentro de us limites la media de la poblacin y el 10 % de los cuales no

igual O menor que 1,64<1/J,,, y como la distancia a la cual se halla de i. e

Consideremos ahora el conjunto de medias de muestr~ ale~torias con 11 11

Es decir, que la probabilidad de que la distancia entre X. y p medida en unidades de

sea mayor que -1,64 y menor que 1,64 es de 0,90. Si la desigualdad

j;)] < < [x. + (1,64 j;)]} = 0.90.

,Ir f .. sobre JI.

APLICADOS A LAS CIENCIAS SOC'IAl,I S

minadores muy entrenados. El investigador tiene fondos para pagar solamente

- ( 1.96 ;;) J < < [X."+ ( 1.96 ;;) J}