Académique Documents
Professionnel Documents
Culture Documents
240
7.
1.5'TAl)IS11(.0~
AlUC.i\00~
i\ LAS CILN(IAS
SO<IAII!.
12
Puna todo II lo suficientemente grande, la distribucin chi-cuadrado 5<: acerca a ~a di tnbucin normal. La media y la desviacin tipica son II y fo, respecuvamentc, indepcndicntemcnte del valor de 11 Hallar el pcrccntil 95 de la distribuci~ chi-<:uadrad~ d~ la
Tabla e del Apndice A para un II de 20 y compararlo con el perccntil 95 de una dstribucin normal con una media 11 ... 20 y una desviacin tpica fo = fa.
INFERENCIA
ESTADISTICA:
ESTIMACION
Probar que la varianza de una distribucin t con II grados de libertad es ig"'.al a 11/(n - 2).
8. [Sugerencia: t~ es el mismo de la distribucin F con ~ y n ,uados de libertad. Como
E(,.)= O y
= E[t - E(t)]1, la varianza de i, es E(t.).]
ut
12.1
POBLACIONES Y MUESTRAS:
PARAMETROS Y ESTADISTICOS
''
241
MI' IOl)OS
.'
seleccion la muestra.
12.2
MUESTREO ALEATORIO
INl'8RllNCIA
241
pero tam~in pueden elaborarse planes muy refinados de muestreo que dan lugar
a complejos mtodos de estimacin. En este texto nos limitaremos al muestreo
aleatorio simple, pero como en estadstica elemental no se le denomina sino como
muestreo, cuando el lector se encuentre con este trmino, ya est advertido
de que nos referimos al muestreo aleatorio simple. En tratados de estadistica avanzada se estudian programas ms refinados de muestreo como el que se hace por
conglomerados, en dos fases, etc. (Cochran, 1963.)
Para que una muestra d lugar a estimaciones adecuadas de parmetros, debe
representar con precisin la poblacin, pero cmo puede saberse si una muestra
representa una poblacin a menos que se conozcan sus caractersticas? Y en este
caso, cul es la utilidad de muestrear la poblacin ya conocida? Esta legtima
duda se resuelve slo cuando se sabe que el muestreo aleatorio de una poblacin
siempre dar Jugar a muestras que a la larga, la representarn adecuadamente,
aunque eventualmente no suceda as (sobre todo con muestras demasiado pequeas), Por ejemplo, un muestreo aleatorio de todos los profesores de secundaria
de California puede resultar en la seleccin (altamente improbable, por cierto)
de 20 profesoras de francs. De hecho, nunca se puede tener la seguridad de que
lal muestreo sea representativo o no de la poblacin y lo nico que se puede afirmar es que, bajo todo aspecto, es aleatoriamente representativo de ella.
Una de las caractersticas ms importantes del muestreo al azar es que puede
determinarse el tipo de no representatividad que, a la larga, cabe esperar de
numerosos muestreos similares, cosa que no es posible con otros tipos de seleccin.
Por ejemplo, sera ilgico esperar una muestra representativa de la poblacin
adulta de estadounidenses, si para ello se escogieran los primeros 50 hombres
que pasaran por la calle cuyos apellidos empezaran con T. Pero, fuera de que no
n representativa, lo que ignoramos es cmo y hasta qu punto no Jo es. Ahora
bien, si se toman al azar 50 individuos de la poblacin adulta de norteamericanos,
podramos responder con precisin matemtica el interrogante de cul es la
probabilidad de que 50 adultos escogidos al azar entre toda la poblacin adulta
de Estados Unidos tengan una pulgada ms de estatura que el promedio de dicha
poblacin ?.
EL CONCEPTO DE UNA
DISTRIBUCION MUESTRAL
11 estadstico evala lo representativa que puede ser una muestra al azar estudiando
11111 distribuciones muestra/es, concepto bsico para toda una rama de la estadstica
lnkrcncial. Cualquier estadgrafo o estimador tiene determinada distribucin mue lr.l P<i fcil imaginar el proceso de seleccionar a partir de una poblacin suce ivas
mu\4-.tms con determinados II y calcular el valor re pcctivo de determinado csulhl\lor. por ejemplo, lu media .f. Al repetir esto indefinidamente.
se podriu hacer
1 \\
1 11 M 1"
.
..
:g
.
)(
't)
,:::,
D
D
et
0,40
0,30
0,20
0,10
o
FIG. 12.1
Distribucin
calculadas.
INI I RI
CIA ISl/\1}1
11<.'A
245
ESTIMACIO
,. = 15
:,
e,} =100
..
.t
15
.!!
u
e
A
.\
10
\i
:,
...!
FIG. 12.3
V\
.&J_,
o
FIG.
(11
I~
10
x.
141
MHTOOOS
esrworsrtcos
APLICADOS
..
A tAS ('lllNCIAS
SOCIALES
(X.):i:15
2 =1
'
"x.
:,
J::
11
18
12
19
x.
x.
E('.)
+ X2 +
E[(X1
.! E(X +Xi+
n
= .! [E(X1) +
n
INIJl:Rl!NCIA
ESTAl>ISTICA:
l!STIMACION
247
serla. la varianza de las medias de las muestras, si a partir de una poblacin con
media u, se forma una distribucin que consta de medias de muestras al azar de
magnitud n? Puede esperarse que la varianza de las medias de las muestras sea
menor que la de la poblacin, siempre y cuando todas las muestras consten de dos
o ms observaciones (es decir, que n ~ 2). Ntese que si las muestras tienen un
n. de l, la media seria igual a la observacin en s, y repitiendo el proceso de seleccin de muestras de tamao I, la distribucin de estas medias es simplemente un
muestreo de la poblacin original y, en este caso, la varianza u2 de la poblacin
y la de la distribucin de medias de muestras de tamao I sera la misma
(u2/n = u2/l = u2).
Supongamos que se desea haJJar la varianza de las medias de muestras de tamao n = 2 tomadas de una poblacin dada, cuya varianza es u2 Para cada muestra
se calcula la media X. = (X1 + X2)/2, siendo X1 y X2 designaciones arbitrarias
para el orden en que se hicieron las observaciones y, por tanto, independientes
del tamao de la pun.tuacin. Por consiguiente, tanto X1 como X2, tendrn, en todas
las muestras aleatorias, una varianza de u2. Como las muestras se seleccionan al
azar, no existe relacin alguna entre el tamao de la primera puntuacin y el de la
segunda. As, pues, el diagrama de dispersin de los puntos (X1, X2), en centenares
de muestras, no mostrara ninguna correlacin entre s, tal como se muestra en
laFig. 12.5.
~N
=E
:,
..
e
e
-e
;
+ X,,)/nJ
+ X,,)
'ti
:,
E(X1)
+ ... + E(X
11)].
(12.1)
(/)
.! ( + + ... + ) = .! (n) = .
n
241
MI IOl)US
I SIADISIICOS
Al'l l('Allm
A '""
(12.2)
u,
Las a2 no son sino los valor promedios esperados para s2; E[s;] = u;.
Ec. (12.2) indica que la varianza de X. es igual a la varianza de la mitad del valor
de la suma de X, y X2 En la Sec. 5.8 vimos que si se multiplica una variable por
una constante, la varianza de dicha variable se multiplica por el cuadrado de In
constante. En consecuencia,
(12.3)
En la Sec. 7.9 tambin se vio que en caso de que la correlacin sea nula, la varianza de la suma de dos variables es igual a la suma de sus varianzas. As, pues,
INI l'RllNC'IA
USIAl)ISll(;A.
fll,"flMACION
241
Como todas las variables tienen igual varianza u2, la Ec. (12.7)
birsc as,
(;1)'(cr +u'+
... +
(l)'(nu') =;.u'
u9) ~ ;
puede e cri-
( 12.8)
(12.4)
+ u!
1)
= (!)(2~) =
J,./2.
u,"2 por
(12.5)
<1:t.
I
= <1(z1+z,+
.. +,z:,.)/fl'
(12.6)
(~t,~~
(12.7)
q,_ =-==
l.
Ml!l'OOOS ESTAOISl'ICOS
HO
E(r)
<Tr
=O
= 0,11
12.4
PROPIEDADES
DE LOS ESTIMADORES
INFERENCIA
ESTADISTICA: ESTIMACION
211
zos. de ~ste sigl.o y se deben a Sir Ronald Fisher. Los conceptos de consistencia y
eficiencia relativa tratados e~ esta seccin se deben a l.
Anteriormente se seal que un estimador es el valor del estadgrafo de una
muestra qu~ permite inferir algo respecto del parmetro de la poblacin. Por ejemplo, la media de una muestra X. es un estimador de la media de la poblacin y
~bas se calculan de modo anlogo. Es lgico que X. prediga , pero, adems,
existen otros tratamientos para muestras que dan lugar a estimaciones de. Por
qu no pod~~ empl~se la mediana o la moda de una muestra para estimar ?
Esta proposicin es viable, pero, segn los criterios ms reconocidos de evaluacin
de estimadores, i. es la mejor estimacin de .
En esta seccin nos ocuparemos, adems, de las propiedades de las medidas
de estimacin de la mediana, la varianza (u-2), la desviacin tpica (u) y el coeficiente de correlacin (p) de una poblacin. Asimismo, estudiaremos diversos mtodos
para e~timar dichos parmetros, as como las razones por las cuales se prefiere
un estimador a otro y, adems, expondremos detalladamente tres propiedades
de dichas medidas.
No tendenciosidad
(estimador insesgado)
Se dice de un estimador que no es tendencioso o insesgadosi la media de la distribucin de medidas de las muestras es igual al valor del parmetro estimado.
Independientemente de la naturaleza de la poblacin, la media X es un estimador insesgado de. Ntese, en las Figs. 12.3 y 12.4 que tanto el valor. de la media
de la poblacin como el de la muestra es de 15, lo cual ilustra esta propiedad de
i. en tanto que medida de estimacin de . Si se toman al azar muestras de una
distri~ucin normal (o de cualquiera que sea simtrica), la mediana tambin ser
un estimador no sesgado de la media de la poblacin , o sea que el promedio de
medianas de un nmero infinito de muestras aleatorias tomadas de una distribucin normal es igual a (que, en este caso, evidentemente es la meda medana
y moda de la distribucin normal).
'
. Hay muchos ejemplos de estimadores sesgados. Supongamos que se desea
estimar el p de una poblacin con distribucin normaJ bivariada, y que su valor
sea p = 0,25. Para cualquier poblacin finita la media de la dstribucin de coeficientes de correlacin r ser menor que 0,75 y, por tanto, res una media de estimador sesgado de p. La Fig. 12.6 contradce lo anterior, puesto que all se encontr
q.ue la media de los r de muestras con n = 80 era igual a cero y el p de la poblacin de l~ muestras era nulo; as, pues, r constitua un estimador insesgado o
no ten~enc1oso de p, pero esto sucede nicamente en el caso en que p = O. Si p toma
cualquier otro valor entre + 1 y 1, siempre se hallar un sesgo en r como estimacin de p (Olkin y Pratt, 1958, derivaron una medida de estimacin de p in
sesgada, pero su clculo es bastante complejo; los mismos autores construyeron
tablas para hallar una estimacin no sesgada del coeficiente de correlacin de
una poblacin).
Si bien en este capitulo se pone de manifiesto por primera vez la no renden-
MlIODOS
262
lSlAOISII('()',
Al'lltAIIO'
/\ 11\', (IIMIAS
SO<.IAII\
ciosidad, esta propiedad ya haba entrado en juego en la descripcin de variacioncen el Cap. 5. En la Sec. 5.5 medimos la variacin de una muestra con la Irmulu
s; = :E (X, i.)2/(n - 1 ). Aparentemente, seria ms natu~al medirla con el pro
medio de las desviaciones aJ cuadrado respecto de la media de la muestra Y no
como lo hicimos, colocando en el denominador de s2 (n 1) en lugar de ~' Pero
ya estamos en capacidad de exponer en detalle las razones de esta seleccin. /..11
cantidad s2 constituye una medida no sesgada de estimacin de fa varianza de fa po
bfacin u2~ mientras que :E (X1 - i,)2/n s es un estimador negativamente sesgado
de u2 O sea que,
s;
eSTIMACIO
253
dil\lribucin de 1: (X1 X.)2/6 es igual a 83,33, que indica, en este caso, el sesgo
en la estimacin de u2, derivado de emplear nen lugar den - 1 en el denominador
de las varianzas de las muestras; dicho sesgo es igual a (11 - 1 )/n = 5/6.
Es vlido preguntarse cmo se lleg a determinar que el denominador de la
varianza de la muestra deba ser de n - 1 y no 11 - 2, 11 - 3 o n - t. En ningn
&:ll!!O se lleg a esta decisin empricamente, puesto que existen pruebas maternaneas que establecen la no tendenciosidad des! como medida de estimacin de u2
Aunque no muy dificil, esta prueba es dispendiosa y, por tanto, no la presentamos
14ul. Remitimos al lector a Edwards (1964, pgs. 29-36).
Por el hecho de que
sea una medida de estimacin insesgada de u2. podemos concluir que la desviacin tpica de la muestra es una estimacin precisa de
la desviacin tpica de la poblacin? En ningn caso.
De hecho, una transformacin no lineal de un estimador insesgado no por fuerza
Implica que sea preciso; es as cmo la desviacin tpica de una muestra es una
111imacin sesgada de la desviacin tpica de la poblacin, pero el monto del sesgo
depende de la forma de la poblacin. Si fa poblacin es normal, la media de la distribucin muestral de s es algo menor que u. Especficamente.
s;
E(s) =
4)
, = (4n
--u.
4n - 3
{12.10)
que n
s;
..
'
e
.,
~
u.
I(X-X.)2 = ( n-1) 52
n
n
"
2
I(X-X.)2
s,. = n-1
TABLA 12.1
Parmetro
ql
Ntese que la media de las varianzas de las mue~~ es 100, 1que es el ~alor de
u2, lo cual comprueba, en este caso, la no tendenciosidad de s11 La media de 111
"
p,,7
Estimador
R
Mediana
Moda
Mediana
Moda
s:
s,,
,,,.,
Eoaluaci del
estimada,
lnscsgado
lnscsgado
Lnscsgado
Sesgado
Sesgado
lnsesgado
Negativamente asimtrico
Negativamente asimtrico
La Tabla 12. t presenta algunos parmetros as como sus estimadores e indiloncs acerca de su tcndcnciovidad o no tendenciosidad. Al estudiarla, tngase
Ml!TOOOS l!STAl)ISTICOS
264
Al'l,IC:-AOOS
A I AS CllNCIAS
SOCIAi
lS
siempre en mente que, para estimar el mismo pa~metro, ~ued~n emplearse ~!versos estadgrafos y que el hecho de que una medida de estJmac1~n sea o no sesgada, depende en parte de la forrn6 de la distribucin de las medidas tomadas de
la poblacin.
Consistencia
Una segunda propiedad de los estimadores es su consistencia. Aunque se~gado,
un estimador consistente tiende a aproximarse al valor del parmetro estimado
a medida que la muestra aumenta de tamao, siendo algunos de ellos sesgados
y consistentes, como, por ejemplo, la desviacin tpica s, en tanto que. estimacin
de <1. Si se selecciona una muestra muy grande, el valor de s se aproximar al de
<1 y cuanto mayor sea la muestra, ms cercanos ser~n am?os ~alor~s. Puede cornprobarse lo anterior, si en la Ec. (12.10), n se aproxima ~ infinito. s.1endo u~ ta~I()
inexactos, podemos decir que la condicin de consistencia de un est1m~dor implica
que si se efectuaran exactamente los mismos clculos en la _POblac1n total, se
obtendra el mismo valor, es decir, el del parmetro. La media de la muestra es
una medida consistente de estimacin de , puesto que al aumentar n hasta igualar
la poblacin, 1. sera igual a. (Y, adems, la media de la muestra es un estimador
insesgado de .) El requisito de consistencia es muy importante, ya que rara ve,
se encuentran medidas de estimacin apropiadas que no lo sean, y las pocas que
existen son muy controvertidas.
Eficiencia relativa
La tercera propiedad de los estimadores es su eficiencia: sta se re~ere a la ~re~!
sin con la cual tales medidas pueden estimar un parmetro, es decir, la varabili
dad que pueden tomar en muestras sucesivas. En algunos ejemplos anteriores,
cuando tombamos la varianza o la desviacin tpica de un estadgrafo, nos hemos
encontrado con dicha variabilidad. El error de la media expresado en trminos
de varianza , ~.x, es una medida de la eficiencia de X.; como estimador
de Y del
INl1flRBNCIA
ZI&
x.
muestra!
Oi,tribucin
muestre!
deMd
= 2,24)
CoMd
= 2,80)
25
20
FIG. 12.8 Distribucin muestra! de las medias 2. maestrales y de la mediana Md de muestras al azar de tamao 10 tomadas de una poblacin normal
bivariada cuya media - 20 y cuya varianza u1 ... SO.
eficiencia relativa =
cil/n _
(l,57}cr2/
-~
1,57
= O 637 = 63 7 %
'
Indicando con esto que, para medidas normalmente distribuidas, independientemente de la magnitud de n, la mediana es aproximadamente dQS tercios menos
eficiente que la media aritmtica.
Una de las interpretaciones del coeficiente de eficiencia relativa es que si se
emplea la mediana de 100 observaciones como medida de estimacin de, puede
obtenerse el mismo valor de estimacn calculando la X de una muestra de 64
observaciones.
Para escoger un ptimo estimador de un parmetro, generalmente se combina el criterio de no tendenciosidad (insesgado) y de eficiencia. Por ejemplo, tanto
111 media, la mediana y la moda podran competir por ser las mejores medidas
de estimacin de la en una poblacin normal. Lo primero que se podra plantear
llt'rla cul de todos estos estadgrafos es insesgado como estimadorj. Todos ello
Hlisfacen este criterio. La siguiente pregunta podra ser entonces: ;Cul es el
ms eficiente, es decir, cul tiene el mnimo error en trminos de varianza? 1 a
261
METODOS
l:STAOIS11COS
APLICADOS
A IAS ULNCIAS
SOCIALU
IM
r Rf
CIA ESTADISTICA:
ESTIMACIO
257
12.6
ESTIMACION DE INTERVALOS
Los temas tratados hasta este captulo pertenecen a una rama de la teora de la
estimacin de parmetros que se denomina punto de estimacin, puesto que con
sideramos que un solo valor, o si se quiere, un punto sobre una lnea, puede estirnui
un parmetro; por ejemplo, para efectos de estimacin del promedio de aos de
servicio de la poblacin de profesoras de escuela primaria, puede escogerse una
muestra de 100 maestras, cuya 2. sera 3,47 aos. Este nmero representa un solo
punto en la escala de los nmeros y, por tanto, es un punto de estimacin de .
El segundo tipo de estimacin se basa en el concepto de la estimacin por puntos
y se denomina estimacin del intervalo, de suma importancia en estadstica inferenciul
y que habremos de encontrar repetidas veces en el resto de este libro.
Una estimacin del intervalo de un parmetro es un segmento en el continuum
de la escala de los nmeros, en algn punto del cual se supone, se halla el valoi
del parmetro por estudiar. Por ejemplo, en la estimacin de , el resultado di.'
escoger una muestra de una poblacin podra ser el intervalo (25,91, 38,65), dentro
de cuyos lmites -25,91 lmite inferior y 38,65 lmite superior- probablemente
est comprendido el valor de . En lugar de calcular un solo punto como estimacin
de un parmetro, tenemos ahora todo un conjunto de puntos adyacentes, es decir,
un intervalo, uno de cuyos puntos probablemente coincidir con el valor del pu
rmetro. La nocin de estimacin del intervalo es dificil de comprender en razu
del modo cmo se determina con exactitud la probabilidad de que el parrncuu
realmente se halle dentro del intervalo.
Para ilustrar la estimacin del intervalo, refirmonos a X como estimado,
de , as como a lo que sabemos acerca del teorema del limite central respecto lit
la distribucin muestra} de 2 .. Sabemos que si se escogen aleatoriamente mur,
tras de tamao na partir de una poblacin con media y varianza a2, la distribucin
muestral de 2. tendr tambin una media y una varianza de a2/n, y sin es lo ~11
ficientemente grande, la curva ser casi normal. En la Fig. 12.9 se muestra la d1
tribucin de 2 .
En esta figura, la desviacin tpica de la distribucin muestral de medias, o r11
el error tpico de la media es a/Jn. Siendo la distribucin normal el 68 % de hn
observaciones se hallarn dentro de una desviacin tpica de , es decir, que 11
68 % de los valores de las medias de diversas muestras se hallaran dentro del i11111
valo (a/Jn) a + (a/.J'E_). Aproximadamente el 95 % de las medias s11hy11
ce en el intervalo ,, - (2a/Ji,) a ,, + (2a/f,,), puesto que aproximadamente I
95 % del rea bajo la curva normal se halla dentro de dos desviaciones tlp1,1i.
respecto de la media. Mediante una tabla apropiada, podemos determinar e III
,.--
3a
..Ji,
,.-- 2a
../
_____
,,.-..Ji,
O'
__,
,.+!!..
./
,.+
2a
,.+ 3a
./
..Ji,
68%
95%
FIG. 12.9 Distribucin de muestras de X. para muestras aleatorias de ta
mallo n tomadas de una poblacin.
X.
251
1111 1111111,
1 ',I
\1 )l',1 1( O\
\ l'I IC \1111',
\ 1 \',
t II M 1 \',
\11( 1 \ 1 1 \
1"'11
Rt
1',(11\
151 \1)1\IIU\
rsruwcro-,
251
1,64
1.
Entoncc-,
probabilidad (- t,64
}n
FIG. 12.10
Ilustracin de cmo el intervalo e tablccido
capta el valor de 11 dentro de sus lmites.
respecto de
i.
Jn.
g_
X.+1,64/,j
FIG. 12.11
Ilustracin de cmo el intervalo establecido respecto de X
puede no captar el valor de Je dentro de sus limites.
< :,;.
<
l,64) = 0.90.
(12.11)
a/Jn
u/Jn,
A11I, pues, la probabilidad de que sea mayor que X. (l .64a/J,,) y menor que
(l,Ma/J,,) + X. es de 0,90.
Un intervalo de confianza es aquel en el cual se conoce la probabilidad de que
ti valor del parmetro se halle dentro de sus lmites, probabilidad que debe empicarse para identificar dicho intervalo. En el ejemplo anterior, tenamos un inlrrvalo de confianza de 0,90 o de 90 %. El coeficiente de confianza es la probabilidad
de que dentro de todos ellos un intervalo escogido al azar (..f. zu/J,,) capte
ti parmetro. En el ejemplo anterior, el coeficiente de confianza escogido era de
0.90. Tambin puede enunciarse esto de la siguiente manera: Determinamos un
Intervalo con un coeficiente de confianza de 0,90. Y, finalmente, se dice que se
~ un intervalo de confianza respecto de la medida de una muestra, pero sobre
un parmetro, porque, para determinada poblacin, el parmetro slo toma un
talor. Por ejemplo, X. (l,64a/J,,) es el intercalo de confianza 0,90 respecto
'-o determinar y emplear el iote"aJo de confianza. Presentaremos a contilUacin un ejemplo de la aplicacin de la estimacin del intervalo expuesto con
ucho detalle para que pueda comprenderse mejor la teora explicada anteriormente.
Dentro de sus limitados recursos, un investigador desea determinar con la
xima precisin po ible el CI promedio de 35.000 alumnos de cuarto elemental
lltdmntc la Escala de Inteligencia para Nios de Wechsler (WISC). Esta es una
ucba individual que 111nk ejecucin. inteligencia verbal y una combinacin de
1bo, que constituye d l 1 cncrul. y solamente puede ser administrada por cxa-
Ml!TOl)OS ESTAl:>ISTICOS
ZIO
= 0,95.
(12.12)
INfll'RPNCIA
~IAl)IS11C/\:
ESTIMACION
,u-1,50
,u-1,00 ,u-0,50
211
,u
,u+0,50
,u+l,00
.u+l,50
99%
FIG. 12.12 Distribucin muestra! de f. de muestras aleatorias de magnitud 900 tomadas de una poblacin cuya se desconoce y cuya varianza
es u1 "" 225.
de la cual se estn haciendo los enunciados de probabilidad. Sin embargo, es incorrecto decir que hay 95 % de probabilidades de que 46,25 se aparte de 1,
l ,96<J/J,i con base en una sola muestra cuya media se le asign un valor de 46 25
No es legtimo escribir
'
fll enunciado anterior no tiene sentido, puesto que ninguna de las cantidades implicadas cambia de muestra a muestra.
Existen 99 % probabilidades de que la media de una muestra aleatoria se halle
I menos de 2,58<J/Jn unidades de. Para n~estro ejemplo, 2,58<JJJ,i = (2,58)(0,5) =
1.29.. Aunque ~1 valor d~ 5<:3 desconocido, lo anterior siempre es cierto y, por
eonsigurente, si nuestro investigador suma o resta 1,29 de todas las medias de su
muestr~, ~btiene ~na probabilidad de 0,99 de captar el valor verdadero de dentro
de l~s lmites del mtervalo de confianza que construy. Caso de que obtenga una
media de 103,72 en su muestra de 99, el intervalo de confianza de 0,99 de respecto de X. se calcula de la siguiente manera:
= (102,43,
105,01).
1111101)0\
IZ
1 \1
1)1',II('()\
1'11(
\1)11\
\ 1 \\
102,43; 105,01) un espacio muestra! (~~ase Sec. 10.2) al h?~cr referencia a~~. m'.
ene ningn sentido hablar de probabilidades. Las proba?1hdadcs Y el coeficiente
e confianza se aplican al proceso sucesivo de formar intervalos de confianza
R. von Mises. uno de tos dos o tres responsables de las nociones. modernas d~ ~,o
habilidad en estadstica. dijo (1939. pgs. 1 !-14): Nuestra tcona de ~~obabrlidad
no tiene nada que ver con preguntas tales como: 'hay alguna p111hab1hdad ~e que
Alemania entre en guerra con Liberia'!' ... puede afirma.rse. ~u~ para aplicar la
eora de probabilidad, debemos disponer ~e una sec~~nc1a ilimitada de observa.
ciones similares, Si nuestro investigador repit~a seleccin de ~u muestra~ construye
ntervalos de confianza sobre JI indefinidamente, entonces st ~uede decirse que el
99 % de los intervalos obtenidos captan el valor de JI, El ~spac10 muestral en/, ct~~~
tin es el conjunto de todos los intervalos de confianza posibles. Pero: en la_ pracucu.
os investigadores no seleccionan sino una muestra. con lo cual es imposible ~""'''
si el intervalo de confianza obtenido abarca o no el parme~ro, puesto que puc~cn
darse ambas posibilidades. Lo nico que se sabe es_ ~ue s1 se repite la seleccin
un nmero indefinido de veces, se tiene una probab1hdad. de que el v3!or del0 r,1
rmetro se halle dentro del intervalo de confianza escogido en el 99 %, 95 ." 11
cualquier otro porcentaje de las veces. Si el coeficiente de confianza es lo suficicn
temente amplio, 0 nico que se puede hacer es creer que el intervalo realm~1~1c
comprende el valor del parmetro. (Existen buenas razones para escoger cocficien
tes de confianza altos -0,90, 0,95, 0,99 o mayores an-). Claro que con algo
de inteligencia se tendr en cuenta la bajsima probabilidad (0,01, 0,05 o 0,10) de
haberse equivocado.
La siguiente
expresin
Z1-c.121
;; ,
X,+ Zi-(/21
;;)
( 12 1
es anloga a la anterior:
X.
,J;
(J
Z1-c111
(12.14)
IS IIM \C'ICI,
161
).C
ilustran
la.
Ecs. (12.13)
y (12.14):
f c. ( 12.14)
51,04
( X. -
ne \
1)
(1,96)-
6
20
= (50,45.
JI
re ... pecto de
Y mediante la
51,63).
1./11 -
214
MllOOOS
I SIAl>ISIIC()'I
t II
N(IA\
OC IAll 'i
en la cual X y Y se relacionan de modo lineal perfecto (si p,,1 -= 1. esto debe ser
asl por necesidad) es posible escoger una muestra en la cual r sea diferente de 1 'I
La desviacin tlpica de la distribucin de r a partir de muestras aleatorias de
tamao n tomadas de una poblacin normal bivariada cuyo coeficiente de correlacin es p, es
<1,
Jl n-1
p2.
+ r)/(l
ZII
-3,0
-2,8
-2,6
-2,4
-2,2
3,0
2,8
2,6
2,4
2,2
2,0 s:5
1,8 ..:
1,6 'O
....
1,4
1,2
1,0
0,8
0,6
0,4
0,2
-2,0
....
-0,6
-0,4
-0,2
o._._~~~'-::;:;-.~;t;;,~~~~-!::--J~-L_i__.L:1
o
o 0,20 0,40 0,60 0,80
r
r).
(12.1 S)
FIG. 12.13
Relacin entre r y la transformacin de F!S'her de (T
d
d ta F' 3 0
r. orna o
e
1g. .1 del texto de Julian C. Stanley, MNSUrcmaits in Toda
h Is
~~
1964, con autorizacin de Prenlice-Hall lnc., Englcw"~~Clm-S:
1~
zp =
log,
Je.+
p)/(1 - p).
z,
Media=
Desvlo tpico = _1-
..l=3
z--1-
z,
Z+-1-
, ,,r,;:.-3
I" dentro de los intervalos fi~ados, sumando o restando algn mltiplo de I/~
1 7.,. Podemos conceptualizar el problema considerando que
se distrib
normalmente, con media de 2P y desviacin tpica de I/ c---;3'
uye
v n - .>, y entonce
l,
11,
11
z,.
3
\ti 101)()\
61
r \1)1\
1\
1 lt ()\ i\l'I 11
110\
.
dit de
e distribuye a su vez normalmente, con una me 1.1
e 1. Por consiguiente.
Ze.
J
1 96 e: Z,
prob [
1/,111
Z, - Ze
2,58,
prob [
t.96
oy
una desviacin
0,95.
0,99.
2,58
1//11_
1ip11 .. 1
IMIRI
(li\
ISI
Dl\11(/1
217
lSllMAC'ION
,le 1111t1n on cnc/icir111t!i de rarrelactn. Es a,; cmo leyendo la Tabla G hacia a11.h.
hullumos los valores de r correspondientes a las respectivas puntuaciones % de
0.032 y 0,468 que son 0,032 y 0,436. Por consiguiente. el intervalo de confianza 0.95
respecto de r = 0,245, abarca calores desde 0,032 hasta 0.436. Podemos estar ca,,
seguros de que el coeficiente de correlacin p de la poblacin se halla entre 0.032
y 0,436.
12.8
CONCLUSION
y el intervalo
Z r
1 96
>
.Jn-
- 3 z, +
( 12.16)
J 11 -
1,96
z, .
2,58
.Jn-3
z,
.1
2,5&
.J
( 12.17)
n-3
z,,
por~~;;
to
20,245 = 0,250.
r tpico de Z, multiplicado por 1.96. da:
En segundo lugar. el erro
1 96
1
~
.J84 - 3
1,96
9
= 0,218.
.
1 d
fi
deZ de195% sustituyendovaloresenlaEc.(12.16)
Se halla el nterva o e con anza
,,
'
Los lmites inferior y superior del intervalo son
z.,
- 1 96
1
.Jn -
z, +
1,96
.J-n 1-
= 0,250 + 0.218
= 0.468,
respectivamente.
.
b bilid d d O <)'I
1111 111
tntorvaio tic co11/io11:o , ., ms claro si las p1111f11mmm., 7. tu: '/\ 11, .,,. '""''
''
,ROBLEMAS Y EJERCICIOS
Seleccionar una muestra aleatoria de ocho estudiantes a partir de la siguiente serie de 16
(empicar la Tabla A del Apndice E):
Juan
Maria
Alicia
Roben o
Alejandro
Tomv
Mu111icio
U.uh.11.1
Juana
Susana
Marta
Jaune
Felipe
Pablo
Edith
N1col:h
METOl)OS ESTADISTICOS
288
2.
INI JlRPNCIA
H.
x.
3.
s:
4.
Se selecciona una muestra de tamao n, cuya media y varianza son respectivamente 220
y 50. Calcular el error en trminos de varianza y el error tpico de i. para diversas magni-
tudes de muestras con el fin de completar la siguiente tabla:
n
a. 2
b. 4
c. 8
d. 16
e. 32
f. 64
g. 1000
h. 2000
5.
6.
7.
a.
b.
c.
d.
e.
+ a/ ' n y - a/ Vn
+ l ,64a/ Y;; y - l ,64a/ v;
+ 2,S8a/ Vn y - 2,S8a/ v;;
+ 0,61Sa/ v';; y - 0,61Sa/ ,1;;
+ 3a/ v;; and /1 - 3a/ ,1;;
Se seleccion al azar una muestra de l 00 personas, cuya X. es de 106, 75, a partir de una pobln
cin cuya varianza es 16, pero cuya media , se desconoce. Determinar el intervalo de con
fianza 0.95 sobre respecto de X..
llSTAl;)IS'flCA:
211
Determinar los intervalos de confianza 0,95 y 0.99 sobre para los siguientes casos:
a. n ... 28, r "" +0,36
9.
1:STIMACIO
c. n = 300, r
a. "
=Xi+
... + X,.
n
b.
X ""Xi+
..
(n
+ X,.
1)
+0,14
II
'
tiene meno,