Vous êtes sur la page 1sur 21

t

t
t.
r

l1
1

ESTADSTICA PARA LAS


CIENCIAS SOCIALES
El potencial
de la imaginacin estadstica

F erris J. Ritchey
Departamento de Sociologa
Universidad de Alabama, Birmingham
Traductor
Edgar Rubn Coso Martnez
Traductor Profesional

Revisin Tcnica
Mtra. Cecilia Balbs Diez Barroso
Coordinadora del rea de Psicologa Educativa
Escuela de Psicologa
Universidad Anhuac
Campus Poniente
Lic. Graclela Infesta Oomfn&Uez
SOCIOLOGA

.... p, 257

McGRAW-HILL
MXICO BUENOSAIRES CARACAS GUATEMALA LISBOA MADRID
NUEVA YORK SAN JUAN SANTAF DE BOGOT SANTIAGO SO PAULO
AUCKLAND LONDRES MILN MONTREAL NUEVA DELHI
SAN FRANCISCO SINGAPUR ST. LOUIS SIDNEY TORONTO

Introduccin: teora cientfica y desarrollo de hiptesis comprobables

255

CAPTULO

w
i
1

1!

j
--

DE HIPTESIS
ntroduccin: teora cientfica y desarrollo de hiptesis comprobables
Como se expuso en el captulo 1, se calculan estadsticas inferenciales para mostrar
relaciones de causa y efecto y para probar hiptesis y teoras cientficas. Una teora
se prueba realizando predicciones especficas sobre los datos. Por ejemplo, al estudiar desrdenes civiles como disturbios, quiz se postulara una "teora de protesta", que seale que la conducta alborotadora se estimula por la prctica de autoridad represiva, tal como ocurre en los incidentes de brutalidad policiaca. Esta teora
proporciona conceptos (como desorden civil, disturbios, represin y protesta), as
como ideas sobre el funcionamiento del mundo social (como la idea de que la autoridad estatal abusiva conduce a la protesta). Ms importante an, una teora dirige
nuestros pensamientos para que sea posible concebir un conjunto de proposiciones
respecto de las relaciones entre variables medibles. Por ejemplo, si la autoridad
represiva conduce a la protesta, entonces las medidas de protesta deben ser altas
(tales como la alta incidencia de desrdenes civiles y disturbios), en situaciones
donde la represin estatal tambin es alta (como en el caso de la brutalidad policiaca). En resumen, una teora consiste en un conjunto de ideas lgicamente organizadas, interrelacionadas, que explican un fenmeno de inters, y permiten probar la
consistencia de esas ideas contra los hechos observables. El proceso de determinar
qu hechos son vlidos y cules no lo son se llama comprobacin de hiptesis, el
tema de este captulo.
Antes de considerarse como una explicacin cientfica adecuada, una teora
debe lograr dos cosas: 1) tener sentido y mejorar el entendimiento, y 2) brindar
predicciones empricas (es decir, observables y medibles). En otras palabras, las
proposiciones cientficas, sin importar qu tan razonables parezcan, no son simplemente aceptadas por su valor aparente. Un cientfico debe establecer el hecho de
que una teora lleva a predicciones tiles. Las ideas abstractas de una teora deben
tener un lado prctico.
Relacionar las ideas bien organizadas de una teora en los eventos reales constituye el lado creativo de la imaginacin estadstica. Requiere "ver el futuro", por
lo menos con respecto de cmo se comportar un fenmeno de inters. Una teora
"impulsa" la generacin de hiptesis motivndonos a pensar en trminos de demostrar nuestros puntos. Una hiptesis constituye una prediccin sobre la relacin
entre dos variables, que afirma que los cambios en la medida de una variable independiente
correspondern a los cambios en la medida de una variable dependiente. Una hiptesis es
una prediccin que necesita comprobacin y sta se da por medio de la observacin y el anlisis de datos. (La palabra hiptesis comparte su raz con hipottico,

'

-------------1

COMPROBACIN

254

256

Capituio 9

Inferencia estadstica

Cmprobacin de hiptesis

palabra que significa "imaginemos por el momento".) Las hiptesis ponen en prcs
tica ideas tericas, estipulando que dada la lgica de la teora, los hechos observables deben aparecer de cierta forma. El proceso cientfico funciona a partir de la
nocin de que si los datos resultan como la teora sugiere, dicha teora sera una
explicacin valiosa del fenmeno que se investiga. En contraste, si el hecho no apoya las predicciones, esa teora no es consistente y debe rechazarse o modificarse de
manera sustancial. En un amplio sentido, la comprobacin de hiptesis tiene el
propsito de corroborar la teora.

Pregunta 2. Obtendr mejores calificaciones en mis exmenes diarios de estadstica si estudio ms para cada uno?
Hiptesis: A mayor tiempo de estudio (variable independiente), mejor calificacin en el examen (variable dependiente).
Observacin: Estudie ms y observe qu ocurre.
Pregunta 3. Sufrir una lesin si me paro delante de un autobs en movimiento?
1.

Hiptesis
Prediccin sobre la relacin entre dos variables que afirma que los cambios en la medida de una variable independiente correspondern a los cambios en la medida de una
variable dependiente.
Corroborar una teora implica realizar predicciones sobre cmo funcionan los
fenmenos naturales y sociales. Una hiptesis se formula antes de la recoleccin de
los datos; as, uno debe imaginar cmo resultarn los datos. Por ejemplo, podramos hipotetizar que la brutalidad policiaca (una variable independiente) estimula
la conducta alborotadora (nuestra variable dependiente). Despus probamos esta
hiptesis reuniendo datos de una muestra obtenida de otras ciudades de tamaos
y economas similares. Para corroborar nuestra teora, debemos demostrar que las
ciudades con altas tasas de brutalidad policiaca tienen disturbios con mucha frecuenda; mentras que las ciudades con poca brutalidad policiaca tienen menos. Si
no se encuentra este patrn, rechazaremos la teora de la protesta de la conducta alborotadora. Slo aceptamos una teora despus de que se corrobora con predicciones empricas.

Propsito terico de una prueba de hiptesis


Corroborar la teora sometiendo a prueba ideas contra hechos.

2.

Una hiptesis de ciencia fsica: Dadas las leyes fsicas conocidas de que dos objetos no pueden ocupar el mismo espacio al mismo tiempo, y de que los objetos
de mayor masa que se mueven a velocidades ms altas desplazarn a objetos de menor masa y velocidad, la masa del autobs debe arrollar a la persona
de menor masa.
Observacin: Prese delante del autobs.
Una hiptesis de la ciencia del comportamiento: Habr una mayor incidencia de
lesiones de cabeza y cuerpo (variable dependiente) en las vctimas de choques
con autobuses que en personas que no han experimentado tales choques (variable independiente).
Observacin: Analice los archivos de un hospital. (Esto se llamara estudio re-

trospectivo,

porque estara estudiando experiencias

Sugerencia: Pruebe esto con datos retrospectivos

del pasado.)
o maniques de choques.

La ltima pregunta ilustra el hecho de que realmente empleamos enormes cantidades de informacin corroborada empricamente en nuestra vida diaria. No tenemosque paramos delante de un autobs para saber que las lesiones ocurrirn. En
otras palabras, algunas relaciones entre dos variables pueden ser aceptadas a travs de simple "sentido comn". Pero la mayora de las cosas requieren ms que
sentido comn. El sentido comn se ampla observando datos y manteniendo una
actitud mental escptica (vase "Insensatez y falacias estadsticas" al final de este
captulo).

Inferencia estadstica

Realizacin de predicciones empricas


Un desafo de la comprobacin cientfica de hiptesis consiste en deducir cmo
realizar predicciones empricas. En realidad, formular tales predicciones no resulta
difcil. A menudo lo hacemos en la vida diaria. A continuacin se incluyen algunas
preguntas que quiz formule y algunas hiptesis que tal vez pruebe hoy, junto con
las observaciones empricas que usted podra realizar para probarlas.
Pregunta l. Debo llevar un paraguas hoy?
Hiptesis: Un aumento en la nubosidad (variable independiente)
con un aumento en la lluvia (variable dependiente).
Observacin: Mire por la ventana.

257

est asociado

Inferir significa extraer una conclusin sobre algo. La inferencia estadstica implica extraer conclusiones sobre una poblacin con base en los estadsticos de una muestra.
Como se discuti en el captulo 2, las inferencias estadsticas deben tomar en cuen
ta el error de muestreo. Puede esperarse que una medicin realizada en una muestra est ligeramente desviada del verdadero parmetro de la poblacin.

Inferencia estadstica
Extraer conclusiones sobre una poblacin con base en las estadsticas de una muestra.

Ittferenda estadstica

258

Captulo 9

Comprobacin de hiptesis

Conocer el error de muestreo resulta importante al realizar una inferencia estadstica. Por ejemplo, suponga que deseamos comparar las calificaciones de los estudiantes que viven fuera del campus con las calificaciones de aquellos que habitan en las residencias del campus. Las viviendas fuera del campus estn localizadas,
en grandes ciudades, donde la mayora de los estudiantes .trabajan y muchos son
mayores, viven en casa o cran nios. En contraste, las residencias del campus se
localizan en "pueblos de la universidad", relativamente pequeos, donde los estudiantes estn lejos de casa y viven en dormitorios o apartamentos pnvados para
estudiantes. La mayora de los estudiantes en campus residenciales no trabaja, y
ello les deja tiempo suficiente para concentrarse en el estudio y tener una rica vida.
universitaria. Las diferencias en el contexto social de los dos tipos de campus con-:
ducen a una teora de "conflicto de rol": los estudiantes de fuera experimentan.
presiones de empleo y de familia que interfieren con sus estudios. Esta teora
tiva" la hiptesis de que, en promedio, los estudiantes de fuera del campus obtienen calificaciones ms bajas que aqullos en residencias universitarias. En esta hi
ptesis, el tipo de campus es la variable independiente; y el prnmedio es la v.ariable
dependiente. La hiptesis se prueba comparando el promedio.en los dos tipos de
campus. Si se extrae una muestra de 200 estudiantes de cada tipo de campus, podramos encontrar que el promedio de la muestra residencial es de 2.68, rruentrasla
de quienes viven fuera es de 2.64. L~ diferencia en el promedio. entre e:tas.dos
muestras constituye el efecto del tipo ae campus sobre el promedio. En este eiemplo, el efecto observado es .04 (es decir, 2.68 menos 2.64) .. Est~ clculo estadstico
muestra! sugiere que los conflictos de rol afectan las calificaciones, de modo que
reduce en .04 puntos el promedio de los estudiantes que viven fuera del campw;.
Sin mayor conocimiento, uno concluira inmediatamente que, de hecho, nnden menos los estudiantes que viven fuera en la escuela que aquellos que viven en
el campus. Sin embargo, vacilamos en extraer esta conclusin, debido a que no
comparamos la media de todos los estudiantes, sino slo muestras de ellos. Observamos estadsticos muestrales, no los parmetros reales ( es decir, el verdadero promedio de las poblaciones de los campus). Por lo tanto, es posible que la diferencia
de .04 entre las medias de las muestras resulte del error de muestreo. Mientras que
el propsito terico de la comprobacin de hiptesis es corroborar la teora, la com:
probacin de hiptesis tambin tiene un propsito ms especifico: determinar s1
los efectos estadsticos observados, calculados para una muestra, son reales en la
poblacin o son simplemente un resultado del error de muestreo. Por ejemplo, al
comparar los promedios de los campus, es la diferencia de .04 en el promedio, un
efecto real del tipo de campus o tan slo un reflejo del error de muestreo?

"rrw '

Propsito estadstico de una prueba de hiptesis


Determinar si los efectos estadsticos calculados a partir de una muestra indican
1) efectos reales en la poblacin o 2) error de muestreo.
Cmo medimos el error de muestreo y cmo lo usamos para hacer inferencias
estadsticas? La respuesta yace en nuestra habilidad para predecir los resultados

259

de la muestra. Para lograr que una hiptesis sea convincente, hay que ser capaces
de estipular -antes de observar los datos de la muestra-exactamente
cules pue-

den ser los posibles resultados de la muestra. En otras palabras, se debe describir
una distribucin muestra! utilizando la teora de la probabilidad. Slo entonces
extraemos una muestra y recopilamos los datos en los sujetos de la misma. Entonces se comparan los resultados de la muestra con las predicciones descritas por la
distribucin muestra!.
En el ejemplo del promedio es posible realizar semejante prediccin. Podernos
hipotetizar que si no hay diferencias en el promedio de las dos poblaciones del campus,
la diferencia entre. estos promedios es cero. Esta hiptesis establece que la variable
tipo de campus no tiene efecto en la variable promedio. Si de hecho ste es el caso, entonces una vez que se ha realizado el muestreo, se espera encontrar que la diferencia
en las medias de las muestras debe ser cero o un valor muy cercano a cero. Decir" muy
cercano" significa reconocer que el error de muestreo causara las diferencias en los
estadsticos de la muestra, para quedar ligeramente alejado de cero, incluso cuando
los parmetros de la poblacin sean iguales. Decidimos lo que significa "ligeramente
alejado" contra lo que est "significativamente alejado" mediante el clculo de las
probabilidades de los resultados del muestreo. En este caso, evaluaramos la pregunta: Con muestras de 200 estudiantes de cada campus, cuando ambos campus tienen
el mismo promedio, cul es la probabilidadde observar una diferencia de .04 simplemente debida al error de muestreo normal? Lo que hacemos en una prueba de hiptesis es determinar si el efecto de muestreo observado (es decir, la diferencia de .04
entre los promedios de las dos muestras) se debe 1) a la diferencia real entre los promedios de las dos muestras, o 2) slo se debe al error de muestreo.
. Resurnie_:1:to,para tomar una decisin respecto de la veracidad de una hiptesis, se deben predear dos cosas. !'._rimero, predecir matemticamente el resultado
de un parmetro. En este ejemplo del promedio, predecimos que si los dos campus
tienen el mismo promedio, la diferencia entre estos dos parmetros ser cero. Segund?, se deben predecir todos los posibles resultados rnuestrales al incluir el er:;r
de muestreo; en otras palabras, utilizarnos la teora de la probabilidad para describir la distribucin muestra! que resultara con el muestreo repetido. Usando estas
dos predicciones, entonces especificamos la probabilidad precisa de que nuestro
resultado, obtenido de un muestreonico, sea significativamente diferente del resultado que se predijo. En este caso, cul es la probabilidad de observar una diferencia de .04 puntos en el promedio entre las dos muestras de los campus, cuando
de hecho "no hay diferencia" entre las medias de la poblacin? La diferencia entre lo
que se observa (una diferencia de .04 puntos) y lo esperado (ninguna diferencia
entr,e los campus) se denomina efecto de la prueba del proceso de comprobacin de
hiptesis. El efecto de la prueba de hiptesis constituye la observacin esencial
para extraer una conclusin. Al realizar una prueba de hiptesis, los trminos comunes empleados para referirse al efecto de la prueba son efecto estadstico, efecto de
prueba y efecto de la prueba estadstica. Los clculos precisos de los efectos de prueba
y sus probabilidades de ocurrencia dependen de emplear la imaginacin estadstica para proyectar distribuciones muestrales. Ahora vamos a aprender la lgica de
la comprobacin de hiptesis. Las distribuciones muestrales juegan un rol fundamental en este proceso.

-,,
260

Captulo 9 Comprobacin de hiptesis

La lgica de la comprobacin de hiptesis

261

La lgica de la comprobacin de hiptesis

l
~

Supongamos que estamos en clase cuando un individuo extrao y atractivo entra


al saln vestido como vaquero de rodeo o msico country. l lleva un sombrero con
pluma, una camisa a cuadros, un pauelo en el cuello color turquesa, una gran
hebilla en el cinturn con la forma del estado de Texas y las botas ms brillantes
que hayamos visto. Se presenta como Billy "Tex" Cooper de Dallas, Texas.
Tex dice que oy que los cursos de estadstica trataban de predecir el futuro y
le gustarla aprender ms sobre esto, pues desea convertirse en un jugador profesional. Saca un par de dados de su bolsillo y propone un juego. l dice: "Escuchen.
Lanzar estos dados cuatro veces. Cada vez que salga 7, todos ustedes me pagarn
un dlar. Cada vez que salga otra combinacin -2, 3, 4 y as sucesivamente- les
pagar a cada uno de ustedes un dlar." Le pedimos ver sus dados y parecen legtimos.
Parece un excelente trato. Por qu? Porque nuestro conocimiento de la probabilidad nos dice que debe existir una ventaja a nuestro favor en esta situacin.
La teora de la probabilidad nos permite deducir lo que pasar a la larga, es decir, cuando se lanzan los dados una y otra vez. Si matemticamente es posible
proyectar qu tan menudo caer cada lado de un dado, se determinar si algunas combinaciones de dos dados surgirn con ms frecuencia que otras.
Es ms, empleando la regla multiplicativa de probabilidad, predecimos con facilidad cualquier combinacin de resultados cuando se lancen los dados cuatro
veces. En otras palabras, utilizando la experiencia prctica y la teora de la probabilidad, podemos producir la distribucin muestra! para el evento de lanzar dos dados.
Como aprendimos en el captulo 7, una distribucin muestra] constituye una
descripcin matemtica de todos los posibles resultados de los eventos muestrales
y la probabilidad (p) de cada uno. La figura 9-1 representa una matriz que ilustra la
distribucin muestra! para el lanzamiento de dos dados, es decir, todas las posibles
combinaciones y la probabilidad de cada combinacin. La matriz revela que existen 36 posibles resultados. Cuando en el primer dado cae 1, el segundo dado puede
ser 1, 2, 3, 4, 5 o 6. Cuando en el primer dado cae 2, el segundo dado puede ser
nuevamente 1, 2, 3, 4, 5 o 6, y as sucesivamente. Mirando la esquina superior izquierda de la matriz, se observa que cuando ambos dados caen en 1, la combina
cin es 2, el menor resultado posible. sta es la nica manera de obtener un resulta
do de 2 y hay 36 posibles combinaciones totales; as, la probabilidad de lanzar un2
con dos dados es 1 de 36. La combinacin de 3 ocurre de dos maneras: en el primer
dado cae 1 y en el segundo dado cae 2 o en el primer dado 2 y en el segundo dado
l; as, la probabilidad de lanzar un 3 es 2 de 36. Mirando la esquina superior derecha de la matriz, notamos que cuando el primer dado es 6 y el segundo tambin, la
combinacin es 12, el mayor resultado posible, con una probabilidad de 1 de 36. Al
observar la diagonal de la esquina inferior izquierda a inferior derecha, notarnos
que la combinacin de 7 ocurre ms frecuentemente que cualquier otra, con una
probabilidad de 6 de 36. El resto de la matriz da las combinaciones para todos los
otros posibles lanzamientos, con cada resultado posible ( del 2 al 12) situados
transversalmente en las diagonales.

FIGURA 9-1
Matriz de todas las
pasibles combinaciones
en el lanzamiento de
dos dados

1 ~0=2
00=3
~ 00=
1 DO=s
[8)[]=6
6 U8=1
2

Segundo lado
4

00=3
00=
OD=s
00=
[8)0=7
UO=s

00=4
DO=s
00=6
00=7
r:::1F.1=8
LJLJ
[}JF.1=9
LJ

OD=s
00=6
00=1
DQ=s
;;,
:=9
LJ
no =lo
~

..

00=6 00=1
0[8)-7 DO
oo=s
=s
00=9 GJ[] =9
;;,;;,-10
;;,~
=10
LJ=
uu=11

cio

oF.-1_11
uu-

~~
Llu=12

La matriz de la figura 9-1 se resume en la t bl 9


.
descripcin de la distribucin muestra!
~ 1 Y proporciona una clara
li
d
para e 11 anzarruento de dos d d E
ista e todos los posibles resultados y de la probabilidad ( ) d
d a os. s una
!~:r!::::~:P~~=~:::::i:;o7a1
de la grMica de :ste~~;os\u~:~~~eJ:
muestreo repetido en el captulo 7, ista~i~~h~:~on~s que se produjer;m con el
este caso a una puntuacin de 7) con frecuencias :diga a su Ptu;to maximo (en
nos movemos hacia las "colas" de 1
r
gr
almente mas baas cu_ando
d
curva. lomando nota de que 7
6

1i1?~~:2;:;7;;~~i\:~:s~:~I~~!.rl;;~~i::::b:d::;:::E;:i:sf
::~!~~~~;a~~~s~:o~i~~~~le!:::ap::s::t~~~~:~;~:~(;:r
~~::~~~ ~:
use dados.)
'
gammon cualquier otro uego de azar que

Volviendo al caso de r; d b
ex, e emos tener una ventaja. La probabilidad d
gane con un solo lanzamiento con un 7 es 6/36 o .1667. Usando la regla de

1: :~

TABLA9-1

D' trib

is

"
ucion
muestral del lanzamiento de dos dados

Resultado posible
2
3

5
7
8

9
10
11
12
Totales

ru total no suma

l debido al error de redondeo.

Fraccin p
1/36
2/36
3/36
4/36
5/36

6/36

= .0278
= .0556
= .0833
=

.1111

= .1389
= .1667
5/36 = .1389
4/36 = .1111
3/36 = .0833
2/36 = .0556
1/36 = .0278
36/36 = 1.0001

Grfico de asteriscos

L_as seis pasos de la inferencia estadstica


262

Capitulo 9

En esencia, la lgica de la comprobacin de hiptesis involucra decidir si aceptar o


rechazar una declaracin con base en las observaciones de los datos.
Ahora procederemos a aprender los seis pasos de la comprobacin de hiptesis. Tambin hacemos referencia a estos procedimientos como los seis pasos de la
inferencia estadstica, pues organizan los procesos lgicos involucrados en la extraccin de una conclusin respecto a una poblacin con base en la observacin de
una muestra.

ara eventos alternativos, la probabilidad de que nosotros ganem?s un _solo


p
lanzamiento
es d e 30/36 , o. 8333 -las probabilidades de todos los demas posible;
resultados combinados-.
,
Deberamos sentirnos bastante bien en este momento. Aqu tenemos a este encantador muchacho, vestido de manera elaborada,_que declara ser lo b~tante 1g
b
b bilidad la cual es la esencia del iuego v las apuestas. (1 Y pensanorante so re probat t futos por sobrevivir a un curso'de estadstica hasta este
mos que somos as an e

cin

punto!)
'! lanza los dados y obtiene 7. Le pagamos el dlar y
Pero supongamos que e
.
.,
.
rtuni
ensamos que, por supuesto, en cualquier combrnaoon, 7 tiene la mayor opo
1
~ad de salir. l lanza los dados una segunda vez y obtiene un 7, y pagamos de
nuevo. Lanza una tercera vez y obtiene un 7, y pagamos otra vez. ~a
unat;arta
vez y obtiene un 7, y pagarnos una vez ms. Espere un minuto! go no es a ien

Los seis pasos de la inferencia estadstica

aquA estas alturas se puede sospechar que Tex es un estafado: y que los dados
estn cargados (de cierta manera que slo aparece el 7) o que esta_usando un Juego
de manos ara cambiar a un par cargado antes de lanzar. Por que surgen nuestm
ch En parte porque su aparicin en clase es inesperada Y_ tenemos prep11sospe as
dif
t y nos aruman a amesgar
cios contra las personas que visten de manera
eren e

(P
t si usted est leyendo esto en el oeste de Estados
nuestro dinero. or supues o,
.
P
bi
Unidos uede ser ue no parezca estar vestido de manera_difer~te.) ero tam ien
sos ech!mos debido a que la teora de probabilidad nos dice q~e esperar de cuatro
[~amientos de dos dados, incluso antes de ser lanzados. Cul es l~ probab~da1d
de que un par de dados legtimos obtengan 7, ~atro veces seguidas. Utilizan o a
regla multiplicativa para eventos compuestos.

p [7, 7, 7, 7] = (.1667) (.1667) (.1667) (.1667) = .1667' = .0008

i
1
1

'

1
l

263

Comprobacin de hiptesis

Esto es 810 000. En otras palabras, si 10 000 jugadores hubiera_n_Ianzado su~1d~d~s


cuatro veces y todos los dados estuvieran marcados y pesados legzttmamente, so o e

d
habran lanzado 7 en todas las ocasiones. No podemos estar com
esos iuga ores
h
" os
letamente sezuros (Iex realmente puede tener suerte); pero sospec amos que n
0
hicieron"
ue Tex es un estafador. Probablemente concluiremos que lanzar
cuatro veces~ !e el efecto de los dados cargados, no es efecto de la buena suerte en
el lanzamiento de dados legtimos al azar.
. , _ d
Aunque no se=imos procedimientos estrictos, probamos la hiptesis e q~e
0
r d
comprobacin de hiptesis tiene los elementos de es e
Tex es un tramposo. ro
b
t
' d la prounta se realizan predicciones con ase en a eona e
evento; urge una preg
,
did
1 1 la probabili
babilidad, un evento se observa y sus efectos son me 1 os, se _c_a cu a
dad de que ocurra el efecto de prueba y se extrae una conch1S10n. .
.
Cuando usted se pregunt si cargar un paraguas hoy, hizo lo rrusmo.

la

Hiptesis:
Va a llover.
.
.
Prediccin: Si va a llover, debera haber nubes en el cielo.
. .,
Observacin: El cielo est azul y despejado. Esto n? apoya la pred1coon:
L-a probabilidad de que llueva sin nubes_es sumamente baa:sa_
Conclusin: Rechazo la nocin de que va a llover. DeJO el paraguas en ca _., ~

La comprobacin de hiptesis empieza con una pregunta de investigacin: "una


meta que puede ser declarada en trminos de una hiptesis" (Bailey, 1987:10). En el caso
de "Tex el jugador" nuestra pregunta de investigacines: Texes un estafador? La
comprobacin de hiptesis tambin termina con un enfoque en la pregunta de investigacin, donde la contestarnos de forma directa, no tcnica. Todos los procedimientos estadsticos realizados entre el planteamiento de la pregunta de investiga
cin y su contestacin, son meramente herramientaspara lograr la meta terica de
incrementar el entendimientoacerca de una pregunta de investigacin que hemos
juzgado como importante.
Para conducir una prueba de hiptesis, deben realizarse predicciones acerca \
de eventos muestrales observados de manera emprica. Especficamente, debemos \
anticipar los resultados del muestreo generando una distribucin muestral. Con )
respecto a si Tex es un estafador, cmo podemos hacer esto? Podemos predecir
cmo caen los dados cargados? No, no podemos. Los dados cargados pueden caer
en cualquier nmero de formas, dependiendo hacia dnde estn "cargados". Sabemos, sin embargo, que un par de dados legtimos rodarn de las formas predecibles
descritas en la tabla 9-1. As, cambiaremos la pregunta de investigacin para pre
guntar, "No es Tex un estafador?" porque si no lo es, podemos predecir lo que,
harn los dados. Una hiptesis debe enunciarse de forma tal, que sea posible pre- !
decir los resultados del muestreo. A esta hiptesis la llamamos la hiptesis estads- '.
tica porque predice resultados estadsticos.
)
Una vez armados con estas predicciones, observamos el evento muestra! real
-cuatro lanzamientos de los dados de Tex-, qu representa un muestreo de su
comportamiento. Como se dijo arriba, nuestra observacin revelar que los cuatro
7 seguidos de Tex constituyen un evento muestra] con una probabilidad de ocurrencia muy baja con dados legtimos (es decir, p = .0008). Debemos decidir si esta")
ocurrencia inusual: 1) fue el efecto del error de muestreo aleatorio (muy buena
suerte de Tex), o 2) fue el efecto de una alteracin no aleatoria de los dados. El error
de muestreo aleatorio implicara dados legtimos y cada uno de sus lados con igual
probabilidad de caer en un lanzamiento. La alteracin no aleatoria implicara que
los dados han sido modificados ( como cargarlos con plomo hacia un lado) para dar
a algunos lados una mayor probabilidad de salir. Una probabilidad de .0008 parece . "
improbable de obtener con dados legtimos, y as rechazamos la declaracin de que
el resultado sea un efecto del error de muestreo aleatorio y concluimos, en cambio,
que Tex es un estafador. Las observaciones no se ajustaron a los resultados esperados para un par de dados legtimos.

Captulo 9

Los seis pasos de la inferencia estadstica

Comprobacin de hiptesis

Lo que logra cada uno de los seis pasos de la inferencia estadstica


Los seis pasos de la inferencia estadstica se resumen en la tabla 9-2. La pr~paracin
de la prueba de hiptesis involucra: formular la pre_gunta de investi~aa~n; identificar la oblacin del estudio, sus variables y sus ruvele: de medicin: listar l~ in
formaci~n conocida (o "especificaciones") sobre los parame~os de la poblacin y
los estadsticos de la muestra; y seleccionar la prueba estadstica_ apropiada. Examinemos los pasos y analicemos sus interrelac10nes usando el eemplo de Tex el
jugador.
TABLA 9-2 Los seis pasos de la inferencia estadstica o comprobacin
de hiptesis
Preparacin de la prue~a
.
'6 . list l s especificaciones incluso las variables (por ejemplo, X-=
E
l regunta de investigacr n,
e a
'
- d
.. n~~e __; ~ sus niveles de medicin, la(s) poblacin(es) bajo estudio yfa(s) muestra(~) y tamano e
'
( ) l
l rueba estadstica proporaone observaoones de estadsticos y
la(s) muestras ; se eccione a p
,
parmetro
s; y trace un diagrama conceptual.
Seis pasos
Usando el smbolo H para hiptesis:
l. Enuncie la hiptesis estadstica (o "nula"). Enuncie la hiptesis alternativa y estipule la direccin de

==;~

la prueba (si es de una cola o de dos colas).


. ,
,
de tal manera que usted sabr qu resultados estadsticos
aleatorio si esta hiptesis
verdadera.

::'!:5:::r;:;:

es

La hiptesis alternativa se

aceptasi la hiptesis estadstica se rechaza.


2. Describa la distribucin muestra!.
6 d los resultados muestrales que son probables de ocurrir,
La distribucin m~estral ~ .una pr~~
n ~
distribucin muestra! consiste en un listado de
cuando la hiptesis estadstica es v
era. na .
~
b bilidad de cada uno.
todos tos resultados muestrales posibles y una estipulaoon de la pro a

Determine el nivel de significancia (a) escogido. Indique de nuevo si la prueba es de una o dos
3.
colas. Especifique el valor crtico de la prueba.
Alfa a) es la cantidad de error de muestreo que estamos dispuestos~ t~lerar al lleg~r - una
concl~sin. El valor critico de la prueba se obtiene de las tablas estadsticas en el apndice B.
4. Observe la muestra en cuestin; calcule los efectos de la prueba, el estadstico de la prueba y el
valor p.

tre lo ue se observ en la muestra y lo que se hipotetiz (en el


El efecto de la prueba es la diferencia en
,q ul
edir 1 robabilidad del efecto observado.
aso 1) El estadstico de la prueba es una form a para m
ap
. .
ual
ue el
vala; p es la probabilidad (p) de resultados rnuestrales tan inusuales como o mas mus es q
resultado observado bajo la suposicin de que la hiptesis estadstica es verdadera.

r1
5.

Tome la decisin de rechazo.

Compare el valor p con u:


.
d
nfi
1 u.
Si p S ex, rechace la hiptesis estadstica y acepte la hiptesisaleatona al ruve eco anza Si p > u, no rechace la hiptesis estadstica

1
es estimaciones en trminos cotidianos.
6. Interprete y aplique los resultados, y proporcione as mejor

265

Preparacin de la prueba. Primero formulamos la pregunta de investigacin, que


es: Tex es un estafador? Esto se probar con los resultados del lanzamiento de dos
dados, una variable de nivel de razn. La poblacin ser todo el comportamiento
de juego de Tex. Sin embargo, nuestra muestra est limitada a observar cuatro lanzamientos de los dados, y anotamos cuatro 7. El estadstico de prueba es el clculo
de probabilidades usando las reglas de probabilidad.
Seis pasos
Paso l. El primer paso de la comprobacin de hiptesis consiste en enunciar la
hiptesis estadstica; una hiptesis enunciada de tal forma que sabremos qu resultados estadsticos ocurrirn en el muestreo repetido aleatorio si esta hiptesis es
verdadera. As, probaremos la hiptesis estadstica de que Tex es honesto porque si
esto es verdad, podemos predecir los resultados muestrales de "dados legtimos",
como se muestra en la tabla 9-1. Entonces, la hiptesis estadstica se declara de
manera tal que a partir de ella, se puede generar una distribucin muestra!. Muchos textos emplean el trmino hiptesis nula para la hiptesis estadstica; pero ambas
no siempre son lo mismo, Al final del captulo analizaremos cundo es apropiado
utilizar el trmino nula.
En el paso 1, tambin enunciamos una hiptesis alternativa, que es la hiptesis
que aceptaremos si se rechaza la hiptesis estadstica. En este caso, la hiptesis alternativa es que Tex es un estafador. Si los dados ruedan de manera imprevisible, en el
ltimo paso del proceso rechazaremos la idea de que los dados son legtimos y
aceptaremos esta alternativa. La hiptesis estadstica existe para ser rechazada o
no. La hiptesis alternativa es nuestra conclusin en aquellos casos donde se rechaza la hiptesis estadstica.
La hiptesis alternativa ser una inversin de la hiptesis estadstica o viceversa. Una prueba de hiptesis se disea para ofrecer dos opciones en una conclusin:
la hiptesis estadstica y su alternativa. Si se encuentra dificultad al determinar la
hiptesis estadstica, invierta la pregunta de investigacin colocando no en su declaracin. Despus observe ambas declaraciones y vea cul lleva a resultados
muestrales predecibles. Como en el caso de Tex el jugador, a menudo es la hiptesis
alternativa la que deseamos confirmar. Sin embargo, es completamente necesario
que se establezca y enuncie una hiptesis estadstica para que podamos generar
una distribucin muestra! y completar los pasos de la prueba de hiptesis. A menos que podamos realizar predicciones muestrales empricas, no es posible proceder. No tiene importancia si la pregunta de investigacin es apoyada por la hiptesis estadstica o por la hiptesis alternativa. No obstante, la prueba de hiptesis
descansa en la hiptesis estadstica. Finalmente, en el paso 1 tambin estipulamos 1
si la hiptesis alternativa es direccional (de una cola) o no direccional (de dos co- !
las). En breve trataremos esta cuestin.
Paso 2, El segundo paso en la comprobacin de hiptesis consiste en describir
la distribucin muestra!. sta es una proyeccin de todos los resultados muestrales
posibles y la probabilidad de cada resultado cuando la hiptesis estadstica es verdadera. En otras palabras, si Tex es honesto, debemos esperar los resultados y probabilidades de la tabla 9-1, ya que esto es lo que sucede con dados legtimos. La
tabla 9-1 contiene la distribucin muestral de los lanzamientos de dos dados legtimos.

266

'

!
1
1

1
f
1

l
l

l
"<''

1'
!

l
1
j

Capitulo 9

Comprobacin de hiptesis

Por supuesto, hemos producido distribuciones muestrales antes para calcular


intervalos de confianza. Sin embargo, en una prueba de hiptesis la distribucin
muestral se enlaza con la hiptesis estadstica, ya que esta distribucin describe los
resultados muestrales esperados asumiendo que la hiptesis estadsitica es verdadera.
Paso 3. En el paso 3, declaramos un nivel de significancia (simbolizado por la
letra griega alfa, a). ste es el nivel del error de muestreo que estamos dispuestos a tolerar
al extraer nuestra conclusin. Esperamos un grado de error de muestreo porque sa; bemos que los estadsticos de una muestra son estimaciones de parmetros. Recuerde que en el captulo 8, al calcular intervalos de confianza, nos referimos al
nivel de significancia como el error esperado. Con la comprobacin de hiptesis, el
-- principio es el mismo. El nivel de significancia es la probabilidad de cometer el
\ error de rechazar la hiptesis estadstica cuando, de hecho, es verdadera y no debej ra rechazarse. Ms adelante se analizar el nivel de significancia con mayor detaL lle. Por el momento, digamos slo que si Tex lanza "un resultado" tan inusual que
con dados legtimos ocurre menos de 5 de 100 veces, asumiremos que esto no se
debe slo a la suerte, sino a los dados cargados. As, establecemos
el nivel de
significancia a al .05.
Paso 4. En el paso 4, observamos nuestro evento muestral en cuestin y su
resultado estadstico, en este caso los cuatro lanzamientos de dos dados de Tex.
Entonces calculamos el valor de_p, que es la probabilidad de este resultado muestra!
bajo la condicin de que la hiptesis estadstica es verdadera ( es decir, los dados
son legtimos, normales). Anteriormente, encontramos que la pes .0008, un resultado muestra! inusual al emplear dados legtimos, lo que sugiere un efecto de manipulacin de los dados. (La nocin de "o ms inusual que" en el paso 4 de la tabla
9-2 ser dirigida despus.)
Paso 5. En el paso 5 comparamos el valor p del paso 4 con el nivel de significancia
(a) establecido en el paso 3 (es decir, a= .05)y observamos que, de hecho, el evento
muestra] de Tex tuvo una probabilidad de .0008, que es menor a .05. As, rechazamos nuestra hiptesis estadstica de que Tex es honesto y aceptamos la hiptesis
alternativa de que es un estafador. Lo que estamos afirmando es que los cuatro 7 de
Tex no pueden ser explicados de manera razonable como el efecto normal, al azar,
del error de muestreo esperado en cuatro lanzamientos de un par de dados legtimos. As, concluimos que los dados son ilegtimos o estn "cargados".
Este paso de una prueba de hiptesis se llama la decisin de rechazo y es en el
centro de cada prueba de hiptesis. Es el paso donde comparamos dos probabilidades: la probabilidad a del paso 3 (la probabilidad del error o de extraer una
conclusin incorrecta), y el valor p del paso 4 (la probabilidad del resultado observado o del efecto de la prueba). La decisin de rechazo destaca la importancia de la
teora de la probabilidad, que ofrece la distribucin muestra] proyectada, de la cual
calculamos el valor p. La distribucin muestra[ prev el futuro y proporciona un
lineamiento para evaluar la probabilidad de nuestro evento muestra! nico. La teora de la probabilidad constituye la esencia del anlisis estadstico.
Paso 6. Por ltimo, en el paso 6, interpretamos nuestros resultados y los
aplicamos proporcionando las mejores estimaciones en trminos cotidianos (es
decir, lenguaje no tcnico). As diramos: "Tenemos razn para creer que Tex

Las seis pasos de la inferencia estadstica

267

es un estafador." Predecimos que sus dados personales caen en 7 ms a


d
de lo esperado con dados legtimos. Debemos pedirle tranquilamen~e
menu .
re pe
t
' que se ret
,
ro a vez porte un arma, as que con discrecin llamemos a la polica del
campus!
No intentaremos asimilar todos los detalles de la comprobacin de hi tes
de una vez, pero los elementos esenciales se ilustran en el ejemplo de Tex iuea
dor. _Siguiendo _los seis pasos de la inferencia estadstica listados en la tabla
el
~1gu;fnte consutuye un esquema de esta prueba de hiptesis (omitiendo al~os
eta es Y abreviando algunos smbolos). Antes de cada problema muestra e':i este
texto, se proporoone una breve lista de verificacin de los seis pasos de Ia inf
_
era estadstica.
eren

!i

d-2

. ~i~fJ' ns~i eff .J~if2aci~- de'l()ssets.psos'


.,,

de Ia=iJ.erenda: estadstica

Preparacin de la prueba
~nuncie la pregunta de Lr1vestigacin; liste las "especificaciones", incluyendo las va
nables (por ejemplo, X = ... , Y = .. .), sus niveles de medicin, la(s) poblacin(es) bao
e~tud10, Y la(s) muestra(s) y su(s) tamao(s); seleccione la prueba estadstica ofrez~a
o servacones de estadsticos y parmetros; y elabore un mapa conceptual. '
Seis pasos
Usando el smbolo H para hiptesis:
l. Enuncie la H estadstica y la H alternativa y estipule la direcci d 1
prueba.
n e a
2. Describa la distribucin muestra!.
3. Determine el nivel de significancia (a) y especifique el valor crtico de la
prueba.
4. Observe los resultados muestrales en cuestin, y calcule 05 efectos de la
_ prueba, el estadstico de la prueba y el valor p.
o. Tome la decisin de rechazo.
6. Interprete Y aplique las mejores estimaciones en trminos cotidianos.

Preparacin de la prueba

:;:s;':: de investigac~n:

Tex el jugador es un estafador? Especificaciones: la varia. los resultados de_ un par de dados, variable a nivel de razn. Poblacin: la
totalidad del comportamiento de juego de Tex. Muestra: cuatro lanzamientos de un
par de dados de Tex. Prueba estadstica: clculo de las probabilidades del lanz _
rruento de dos dados. Observacin: Cuatro 7.

-l
Los seis pasos de la inferencia estadstica

268

Capitulo 9

Valor p: p ( de un resultado tan inusual como cuatro 7 seguidos cuando los dados
son legtimos]= p [7, 7, 7, 7] = .0008.

Poblacin
de estudio

5. Decisin de rechazo:

La totalidad del
comportamiento
de juego de Tex

p < a, .0008 < .05


Rechace la hiptesis estadstica y acepte la hiptesis alternativa, con un nivel
de confianza de 95 por ciento.

X: resultados del
lanzamiento
de dos dados

6. Interprete y aplique las mejores estimaciones en trminos cotidianos:


Conclusin: Rechazamos que Tex sea honesto y concluirnos que es un estafador.
Es altamente improbable que de un par de dados legtimos surjan cuatro 7.
Mejor estimacin: Podemos estimar que sus dados producen un nmero de 7
inusualmente alto.

Seis pasos

Recuerde. Todas las pruebas de hiptesis siguen la misma lgica que sta. Si usted
empieza a perder de vista la lgica del proceso, regrese a este simple ejemplo.

l. Hiptesis estadstica: Tex y sus dados son legtimos.

Hiptesisalternativa: Tex es un estafador (es decir, l no es honesto Y sus dados


estn cargados).

El marco hipottico de la comprobacin

2_ Distribucin muestra/ (de la tabla 9-1): Si la hiptesis estadstica es verdadera y


los dados, de hecho, son legtimos, los lanzamientos repetidos de los dados
producirn los siguientes resultados:

Resultados posibles
2
3
4

5
6
7

l
1

269

Comprobacin de hptesis

8
9
10
11
12

p
.0278
.0556
.0833
. 1111
.1389
.1667
.1389
.1111
.0833
.0556
.0278

El valor p de cualquier evento compuesto


puede ser calculado utilizando estos
resultados de un solo lanzamiento y la reoc)a
multiplicativa de probabilidad .

3. Nivel de significancia: a = .05 (la especificacin del valor crtico de la prueba


para ser cubierto despus).
4. Observacin: Efectos de la prueba, el estadstico de la prueba y el va 1or P
Observacin: Tex lanz cuatro 7 seguidos.
.
l ue
Efecto de la prueba: Una gran diferenoa entre lo que observamos Y o q
esperarnos con dados legtimos.
(Los efectos de la prueba y los estadsticos de la prueba se estudian con mayor
profundidad en el captulo 10.)

de hiptesis

De nuevo, la palabra hipottico significa "imaginemos por el momento". Observe


que en los pasos 1 al 4, de los seis pasos de la inferencia estadstica, formulamos
enunciados hipotticos o del tipo "si esto es verdad". En el paso 1 enunciamos la
hiptesis estadstica "imagine por el momento que Tex es honesto". No afirmamos
que sea honesto y, de hecho, sospechamos lo contrario. Simplemente imaginamos
que por el momento esta lptesis estadstica es verdadera. En otras palabras,
hipotetizamos.
En el paso 2 continuamos hipotetizando al predecir los resultados muestrales
para el caso de que "la hiptesis estadstica sea verdadera", cuando los dados y la
persona que los lanza son honestos. Tex quiz sea honesto o no; pero describimos
lo que pasa si lo es, porque sta es la manera en que realizamos predicciones matemticas. Conocer el funcionamiento de los dados legtimos nos proporciona una
base para la comparacin. La distribucin muestra! -que es hipottica porque no
lanzamos los dados un nmero infinito de veces- ofrece una vara de medida, con
la cual comparar el comportamiento del lanzamiento de dados de Tex.
En el paso 3 establecemos qu tan inusual debe ser un resultado del muestreo,
cuando la hiptesis estadstica es verdadera, para que lo rechacemos. En el paso 4 calculamos la probabilidad de nuestro resultado muestra! bajo la condicin de que la hiptesis estadstica sea verdadera. En otras palabras, nuestro clculo de los cuatro lanzamientos de dados de Tex se realiza con base en el comportamiento de los dados
legtimos. En cada uno de los primeros cuatro pasos del proceso de inferencia, no
afirmamos que la hiptesis estadstica Juera verdadera sino tan slo describimos
cmo deben aparecer los datos si los dados son legtimos. Los cuatro pasos son
imaginarios en el sentido de que empleamos nuestro conocimiento e imaginacin
estadsticos, para prever lo que pasa en el mundo natural si la hiptesis estadstica
es verdadera. Slo en el paso 5 tomamos una decisin y decidimos lo que en reali-

270

Captulo 9 Comprobacin de hiptesis

Entendimiento del lugar de la teora de probabilidad en la com b . , d . .


.
pro acron e nzptestS

dad creemos que es verdadero: la hiptesis estadstica o la alternativa. Al probar


una hiptesis, en cada uno de los pasos del 1 al 4 afirmamos: "Sostenemos esto. Si
la hiptesis estadstica es verdadera, esto es lo que pasa en el muestreo repetido."

Entendimiento del lugar de la teora de probabilidad


en la comprobacin de hiptesis

/
l

1
l

1
1l

---------1

J{

nfasis en los valores p


En el paso 4, calculamos p [de un resultado muestra] tan inusual o ms inusual que
el observado, asumiendo que la hiptesis estadstica es verdadera]. Esta probabilidad
se denomina valor p de la prueba de hiptesis. El valor p de una prueba de hiptesis es una medida de lo inusual de un resultado muestra/ cuando la hiptesis estadstica es
verdadera.

Valor p de una prueba de hiptesis


::.:;':.:delo inusual de=

resultado muestral cuando L, hiptesis estadstica

fi

valor P nos dice qu tan frecuente es ue en el


.
la diierenca observada entre el "result d q
muestreo repetido se obtenga
a o muestra1 observ d O,, l ,,
muestrales esperados" De nuevo , la d"
.
a
Y os resultados
tferenaa entr /
se llama efecto de la prueba de hi tesis La
e o que .se ?bserva.y lo que se espera
decidir si este efecto es real y signlficativ; pruefa de hipotess gira alrededor de
de muestreo. En el paso S, la ma ,itucl
:=p emente es.el resultado del error
hiptesis estadstica o la rechazar!os.
alar p determma si aceptaremos la

a.:i

Ahora debe estar convencido de que calcular probabilidades constituye la operacin matemtica esencial en la comprobacin de la hiptesis. Observe que en los
seis pasos de la inferencia estadstica (tabla 92) comentamos muchas veces acerca
de la "probabilidad". Primero, en el paso 2, la distribucin muestra] es una prediccin de todos los posibles resultados muestrales y la probabilidad de cada resultado cuando uno imagina que la hiptesis estadstica (del paso 1) es verdadera. Se
gundo, en el paso 3, establecemos el nivel de significancia (a), el nivel de
probabilidad crtica que puede llevamos a rechazar la hiptesis estadstica. Tercero, en el paso 4, calculamos la probabilidad de nuestro resultado muestra] en cuestin, imaginando an que la hiptesis estadstica es verdadera. En el paso 5, comparamos las dos probabilidades: la ca.lculada en el paso 4 y aquella establecida en
el paso 3. Esta comparacin nos lleva a una conclusin: ya sea que rechacemosla
hiptesis estadstica y aceptemos la hiptesis alternativa, o "no rechacemos" la hi
ptesis estadstica y la sostengamos. Si usted empieza a perder de vista la lgica de lo
que trata la comprobacin de hiptesis, recuerde que est basada en la comparacin de dos
probabilidades: aquella de lo que realmente ocurre en nuestra muestra nica observada y aquella de lo que esperamos que ocurra en el muestreo repetido.
En el caso de Tex el jugador, nuestra habilidad para determinar a qu grado es un
estafador, depende de conocer las probabilidades de uri lanzamiento de dos dados.
En esta introduccin a la comprobacin de hiptesis usamos intencionalmente un
clculo simple de un valor p. Otras pruebas de hiptesis estadsticas requieren distribuciones muestrales y clculos matemticos diferentes. Para la mayora de las pruebas estadsticas, el estadstico de prueba es una puntuacin to una formulacin simi
lar que mide las probabilidades en una curva aproximadamente normal. Los valores
p se toman de las tablas estadsticas en el apndice B.

ver-

,IJ

271

Efecto de una prueba de hiptesis

=1

Diferencia entre Jo
paso 1).
que se observa en la muestra (en el paso 4) y lo hipotetizado (en el

Entender los valores p resulta esencial _ d .


, .
cin de hiptesis. Apliquemos el pens~enf' orrunar la lgica de la cornprobaO
preguntas Qu
f
proporoonal al formular las siguientes
,
,
pasa con orme aumenta Ja magnitud d
, . . .
ca cuando el valor p resulta pequeo O grande?
e un va1 or p? Que s1gmfiCuando el valor pes grande en relacin a alfa es decir
mos la hiptesis estadstica Un 1
d
. 'cuando P > a, no rechazamuestra] observado no es m u dfer or p gran e nos indica que nuestro resultado
Y erente o no es "l
,, d l
P.r la hiptesis estadstica; en otras palabras, el efect~:~a r:::sultadopr_:'dicho
ei.emplo, suponga que formulamos una hiptesis de ue 1 p
a es .pequeno. Por
ctiantes universitarios es de 23 ao 5. t fu
q edad media de los estus. 1 es o era verdad
I d d
.
muestra representativa suficientemente <>rande res lt e:o, a e a media de una
Suponga que realmente extraemos un O tr
u : m.uy cerca de 23 aos.
de 22.8 aos. Nuestra experiencia en~ ~::ra:r que esta hene.tu1a edad media
sugiere que este efecto deprueba peq _ 0
~'~ de ctistnbuaones rnuestrales
ueno-una curerencia d ']
muy bien ser el resultado del error de muestre0 . al U e so o: 2 anos-pudo
cercana a 23 no constitu

.
norrn na media muestra] tan
ocurrencia si recurrir~~~lr;ulcado musual; tendra una alta probabilidad de
dad. Cuando hav una e
- uestreo repetido. El valor P mide esta probabilien el paso 4 y el ;alor
:::~::enc1aen~e el v~lor observado del estadstico
en el paso 1, el clculo precis; de la ;r~~:i~d~~e:ichot
en la ~ptesis estadstica
valor p grande. Este valor p ~rande dice si la ed e es e resu tado producir un
existe una buena probabilidad de q
d. d ad media de la poblacin es 23,
ue 1 me ra e la muestra est alr d d d 23
anos, con una variacin cercana a .2 aos. Un ef et O d 2 e. ~ or e
rechazar la nocin de que 23 e
e anos no es suficiente para
.
. , .
anos representa la edad media d
bl . , " E
Jerga aentfica decimos: no hay ,,
df
.
, .
e a po acion. n
tre lo que se observa lo ue s una . erencia estadisticamente significativa" enresultado del error muJstreoe i:poreltiza. La dferenca fcilmente podra haber
rrna.

cie

dj'

Cuando el valor p es pequeo en relacin a alf


d .
mos la hiptesis estadstica. Un valo
~' es ear,. cuando p < a, rechazar P pequeno nos indica que asumiendo que la

Capulo 9

Entendimento del lugar de la teora de probabilidad en la comprobacin de hiptesis

Comprobaci11. de hiptesis

hiptesis estadstica es verdadera, nuestro resultado rnuestral es inusual o est "lejano" de lo que esperaramos. Esta gran brecha ( o efecto) sugiere que la suposicin
de una hiptesis estadstica verdadera es errnea y debera rechazarse. Por ejemplo, suponga que en otra universidad los investigadores hipotetizan que la edad
media del cuerpo estudiantil es de 23 aos. Extraen una muestra representativa,
suficientemente grande, y obtienen una media de 29.3 aos. Este efecto de prueba
es grande (6.3 aos); pero el valor p ser pequeo. El valor p pequeo les dice: es
poco usual extraer una muestra con una media de 29.3 aos de una poblacin cuya
media es 23, as corno es inusual lanzar cuatro 7 consecutivos con un par de dados
legtimos. Si este valor p es particularmente pequeo, es decir, menor que a, ya no
aceptarn 23 aos corno una estimacin razonable de la edad media del cuerpo
estudiantil de la universidad. Su experiencia sobre el muestreo repetido y la generacin de distribuciones rnuestrales les dice que un efecto de prueba tan grande
resulta inusual. La hiptesis estadstica de 23 aos ser rechazada. Los valores p
pequeos ocurren cuando la observacin de la muestra no se ajusta razonablemente al parmetro hipottico. Recuerde la simple ilustracin. Cuando ninguna nube
se observa, rechace la hiptesis de que pronto llover. La probabilidad ( o valor p)
de observar lluvia con un cielo despejado es-ciertamente pequea y, as, se rechaza
la hiptesis de la lluvia.
En resumen, existe una relacin inversa entre el tamao del efecto de prueba y
su valor p calculado; esto es:

Un efecto de prueba pequeo

Un valor p grande (en el paso 4)

( es decir, una diferencia pequea


entre el resultado muestra!
observado en el paso 4 y el
resultado hipotetizado del paso 1)

( es decir, cuando la hiptesis


estadstica es verdadera, existe una
alta probabilidad de que los
resultados observados v los
esperados coincidan; as, en el
paso 5 probablemente"no
rechazaremos" la hiptesis
estadstica)

Un efecto de prueba grande

Un valor p pequeo (en el paso 4)

( es decir, una diferencia grande


entre el resultado muestra!
observado en el paso 4 y el
resultado hipotetizado del paso 1)

( es decir, cuando la hiptesis


estadstica es verdadera, una gran
diferencia entre los resultados
observados y los esperados es
inusual; as, en el paso 5
probablemente "rechazaremos" la
idea de que la hiptesis estadstica
es verdadera)

273

Relaciones entre tamao del efecto, valores p


y decisiones de rechazo
Un efecto de prueba pequeo Un efectode prueba grande r++

un valor p grande r++


un valor p pequeo

r-r+

"no rechazar" la hiptesis


estadstica
"rechazar" la hiptesis
estadstica

El significado de "tan inusual como o ms inusual que". En el paso 4 de la tabla


9-2, el valor p se define como la probabilidad (p) de los resultados muestrales tan
nusua'.es mmo o ~s _inusuales que el resultado observado bajo la suposicin de que
l~ hiptesis estad1stic~ es verdadera_- La palabra o constituye una seal para empiear la regla de adicin de probabilidad y lo que hacemos es sumar las probabilidades. Para simplificar el ejemplo de Tex el jugador, no seguimos esta regla por
completo; aunque nuestra conclusin habra sido la misma. Si hubiramos seguido
esta regla, habramos sumado la probabilidad de todos los lanzarnentos consecutivos, que tenan una probabilidad ms baja de ocurrir que los cuatro 7. Por ejemplo,
habramos sumado la probabilidad de lanzar cinco 7, seis 7, siete 7 y as sucesivamente, porque cada uno de estos resultados habra sido ms inusual que el lanzarruento de cuatro 7. Por qu incluye probabilidades que son "ms inusuales"?
Porque si a Tex lo llamamos estafador por lanzar cuatro 7, ciertamente habramos
hecho lo_ mismo si lanzara cinco o ms 7 consecutivos. ste es el caso porque las
probabilidades de estos eventos son incluso menores que para los cuatro 7. En todas las pruebas de hiptesis restantes calcularemos la suma de todos los resultados
tan inusuales como o ms inusuales que el observado. En el captulo 10 veremos
que esto involucra simplementecalcular reas en las colas de curvas de probabilidad, como lo hicimos con la curva normal en el captulo 6.

El nivel de significancia
(21:': tan pe~ueo tiene que ser un valor p para que rechacemos la hiptesis estadstica? Aqu es donde el paso 3 de los seis pasos de la inferencia estadstica entra
en juego: la estipulacin del nivel de significancia, a. En trminos simples, el nivel
de significancia es el punto critico de probabilidad a partir del cual ya no estamos dispuestos a sostener que nuestro resultado muestra/ se deriva del error de muestreo aleatorio.
Indica qu tan extremo debe ser un resultado muestral, para que empecemos a
cuestionar s la hiptesis estadstica es verdadera. Por ejemplo, a nuestro personaje
lanzador de dados, Tex, lo llamamos estafador despus de que lance dos 7 seguidos (p [7, 7] = .0278),tres 7 seguidos (p [7, 7, 7] = .0046),cuatro 7 seguidos (p [7, 7, 7,
7] = .0008),etctera? Qu tan improbable e inusual debe ser su "evento muestra!"
antes de que rechacemos la hiptesis de que l est usando dados legtimos?

La funcin del nivel de significancia en una prueba


de hiptesis
Especificael punto crticode probabilidada partir del cual ya no estamosdispuestos
a sostenerque nuestroresultadomuestra!se derivadel error de muestreoaleatorio.

i 274

i
J

l'

1
1

1
f

.,l
l

Captulo 9

Comprobacin de hiptesis

. Entendimiento del iugar de la teora de probabilidad en la comprobacion d 1 . .


e upo esrs

Nos hemos referido a las probabilidades a como regiones crticas. Una regin
crtica es un rea de una curva de probabilidad que define el punto de probabilidad,
donde nos volvemos crticos respecto de la verdad de la hiptesis. Cuando el valor
p es tan pequeo que es igual o menor que a, rechazarnos la hiptesis estadstica.
El trmino significancia implica que el nivel de probabilidad a es un punto con
un significado importante. Cuando rechazamos la hiptesis estadstica, afirmamos
que existe una "diferencia estadsticamentesignificativa" entre lo que observamos
y lo que hipotetizamos. Esta diferencia (o efecto) es tan grande que ya no creemos
que la hiptesis estadstica sea verdadera. La diferencia entre lo que Tex hizo y lo
que unos dados legtimos hacen es tan grande que significa algo -activa una seal
de alarma-. Ya no aceptamos que sus dados sean legtimos; es poco probable que
salgan cuatro 7 seguidos por casualidad.
Resulta esencial que decidamos qu tan crticos seremos antes de hacer nuestra
observacin muestral. Es decir, debemos determinar a en el paso 3, antes de que
observemos los datos de la muestra (paso 4). Por qu? Si esperramos hasta despus de observar el resultado muestra] en el paso 4, podramoscolocar a a un nivel
ligeramente superior que el valor p calculado; y esto nos asegurara rechazar la
hiptesis estadstica. Si esperramos hasta despus del paso 4, podriamos arreglar
la prueba de hiptesis para obtener el resultado que deseamos. Por ejemplo, suponga que no nos gusta la manera en que Tex viste y queremos darle una leccin.
Podramos incriminarlo asegurndonos de rechazar la hiptesis de que es honesto.
Tan slo esperaramos hasta que l lanzara cuatro veces los dados, calcularamosel
valor p y luego elegiramos un valor a ligeramente mayor. Al "encontrar" que p <
a, rechazaramos la hiptesis estadstica. Sin embargo, desde el punto de vista de la
integridad cientfica, esto constituye una trampa. Permitira que el prejuicio personal entrara en el proceso cientfico. Y aparte de la integridad cientfica, esto sera
deshonesto. Nos volveramos tramposos y seramos nosotros, no Tex, quienes deberan ir a la crcel.
Al analizar datos, resulta tentador atisbar los resultados antes de establecer el
nivel de significancia. En el mundo de la investigacin cientfica, obtener los resultados que desearnos apoyara los argumentos de nuestra teora, nos abrira camino
para publicar en revistas cientficas con buena reputacin y nos hara famosos.
En el mundo de los negocios, obtener los resultados que deseamos quiz refuerce
nuestro estatus con el jefe (mostrando, por ejemplo, que hubo un incremento
estadsticamente significativo en las ganancias de la compaa). En las encuestas
polticas, obtener los resultados que deseamos tal vez induzca a los votantes indecisos. De hecho, el anlisis estadstico puede ser manipulado colocando un nivel a
ventajoso. Pero no sucumba a la tentacin! Los cientficos profesionales propiamente especializados ven a la manipulacin de datos como algo poco tico. Adems, como discutimos en el captulo 1, el proceso de la investigacin cientfica tiene controles (tales como las revisiones realizadas por expertos, de los artculos
sometidos para publicacin en revistas) para descubrir conductas poco ticas o
descuidadas. Estos controles no slo minimizan el error humano sino tambin la J
vanidad humana.
Otra razn para establecer a antes de mirar nuestros datos muestrales es que
querernos ser ~p,~, de sealar exactamente qu tan seguro, estarnos de

"""'j

275

conclusin. Nuestro nivel de significancia nos e .


.
matemticos precisos. Recuerde ue en el
-~ mute realizar esto en trminos
significancia y el nivel de confian~a estn . cap1 o 8 se rnenc10n que el nivel de
ve] de significancia (o error esperado)
rnversamlenterelacionados. A menor ni.
tante entender que a menos de ue . , mayor ruve de confianza R esulta tmporlemos el varmetro para nuestra vmr.rebmlos a cada sujeto de una poblacin V calcu,
ana e, nunca podremos esta 100
'
seguros de nuestra conclusin. En otras alabras 1
.
r
por ciento
dsticos de muestras son meramenteesacone: das concl~s1onesbasa.das en estaesperado para cualquier conclusin basad
e los parametros. Existe un error
fue deshonesto con base en slo cuatr 1 a en. una muestra. Concluimos que Tex
dad de que hayamos cometido un e o arizarruentos de dados. Existe la probabiliseguros de que no se debi simplem7;: ~tque no rodemos est.ar completamente
Algunos individuos desafortunados s
~ suerte. os eventos must1ales ocurren.
este libro fue uno de ellos) Al , ti '; a canzados por relmpagos (el autor de
decidir de antemano , . gdun po ,~rtunado gana la lotera estatal. Debemos
que consi eramos inusual" y esta d ., d b
da en procedimientoscientf
. . .
eas1on e e estar basaices, no en prejuicios personales.
Eleccin del nivel de significancia. Es en el
.
.
renda estadstica, donde determinamos el nivJ~s: s:' de fos seis pasos de la infea en el paso 5, donde tomamos la" decisin derecha ~canoa, a. Regresamos a
a. Cuando p < a, rechazamos la hi tesis estadsticaza comparando el valor p con
la hiptesis estadstica Como ex pli
'cuando P > a, no rechazamos
.,

P camos antes a menos que obs


blacin
entera, nuestros resultados son slo es . '
.
erv,emosa 1a poy las conclusiones realizadas a artir d
nma~ron:5 Y, la decisin de rechazo
conclusin basada en una muestr ti e stas quiza esten equivocadas. Cualquier
tulo 8, donde nos referimos a a c:m~:~ :~;e::::~~:t;:mo
vimos en el capen lugar de una equivocacin O

amos a esto un error


probabilidades de ocurrencia'. ~s:;~::~::~~:~~:ss~tipular
con precisin sus
trolar las oportunidades de tomar una m 1 d . i , 1o
canoa nos permite conL
.
a a ecrsion o un "error"
recha::,;1
1::1~::~~~:~:;:~~fa:e~ltados
verdaderos .y la decisin de
si la hiptesis estadstica es verdadera f l . enga presente que nunca sabremos
o a sa, a menos que tomemos de "muestra" a la

~!~~:

TABLA 93

esu lt a d os posibles de las decisiones de rechazo


La verdad desconocida

Nuestra
decisin
de rechazo
Rechazamos la
hiptesis estadstica
No rechazamos
la hiptesis estadstica

euando la hiptesis
estadstica es
en realidad verdadera
Error tipo J
Decisin correcta

sobre los parmetros


Cuando la hiptesis
estadstica es
en realidad falsa.

Decisin correcta
Error tipo U

:,76

Captulo 9

Comprobacin de hiptesis
Entendimiento del lugar de la feorfa de probabilidad en la com
' .. d . . .
..
prooacron e h1potesis

poblacin entera y obtengamos el verdadero parmetro. Realizamos una prueba estadstica con el conocimiento de que tal vez extraigamos una conclusin equivocada.
AU11que nunca sabremos con seguridad cundo lo hacemos, cuando rechazamos la hiptesis estadstica, siendo sta falsa, hemos tomado la decisin correcta.
De forma similar, cuando no rechazamos la hiptesis estadstica siendo sta verdadera, hemos tomado la decisin correcta. Sin embargo, cuando rechazamos una hiptesis estadstica verdadera, cometemos un error tipo l. En cualquier prueba donde
rechacemos la hiptesis estadstica, existe la probabilidad de que no la debimos
rechazar. Por ejemplo, podra ser que Tex simplemente tuvo suerte? De la misma
forma, en cualquier prueba de hiptesis donde no rechazamos la hiptesis estadstica, existe la probabilidad de que debimos haberla rechazado. sta es una cuestin
de no rechazar una hiptesis estadstica falsa y le llamamos un error tipo II. ste habra
sido el caso si se concluyera que Tex era honesto, cundo de hecho no lo era.
Nunca sabremos con seguridad si tomamos la decisin correcta o cometimos
un error. Podemos, sin embargo, manejar y controlar la magnitud de tales errores
de diversas maneras. Primero, si rechazamos la hiptesis estadstica, no pudimos
haber cometido un error tipo II, porque este tipo de error involucra no rechazar una
hiptesis. De igual manera, cuando no rechazamos la hiptesis estadstica, sabemos que no pudimos haber cometido un error tipo I, porque este error involucra
rechazar una hiptesis. Segundo. fcilmente podemos controlar la cantidad de error
tipo I que estamos dispuestos a permitir. ste es el caso porque el nivel de
significancia CI. que establecimos a nuestra propia discrecin, es la probabilidad de
cometer un error tipo I. As,

nmero de formas, no tenemos ninguna base matemt


..
probabilidades de estos resultados falsos No b t t
~a fcil para calcular las
lamente ~ al establecer nuestro niver' alfa Es ant e, po emos controlar indirec.
.
s o . ocurre porque a
"
.,
inversamente
relacronados
es decir confo
. y ., estn
.
'
'
orme CI. se incrementa, "., necesanamente

d ,snunuye,
y viceversa. Aunque
t .
no calculamos ~ s b
d o a se establece en un valor alto prcamente
esto f 'lit 1
, a ernos que cuan.
.
,
ac1
a
e rechazar la hi t
..
Esto disminuye la probabilidad de no rech
b
'P esis estadrstica.
I
disminuye la oportunidad de no rechazarla~:n:::s ~a~:luto y, por consiguiente,

Errortipo I
!:::i::dvertidamente la decis.in incorrecta de rechazar una lptesis estadstica
a = P [ de cometer un error tipo IJ

:::~:a

~ = p [de cometer un error tipo II]

Por desgracia, es muy difcil controlar ~- Es posible establecer ci. porque se basa en
la distribucin esperada de resultados descrita por la distribucin muestral=-cuando
la hiptesis estadstica es verdadera-. Sin embargo, beta, depende de que la hiptesis estadstica resulte falsa. Puesto que una hiptesis puede ser falsa en cualquier

Errortipo II

inadvertidamente la decisin incorrecta de no rechazar una hiptesis estadsti-

e: = p [ de cometer un error tipo I]


De nuevo, la hiptesis estadstica se rechaza cuando el valor p del paso 4 es
pequeo. Si hubiramos decidido establecer un CI. bajo (por decir, .001), esto hara
difcil rechazar la hiptesis estadstica, porque el valor p tendra que ser muy pequeo para" caber" al .001. Al hacer que la hiptesis estadstica sea muy difcil de
rechazar, hacemos que sea difcil rechazarla por error. As, cuando establecemos un
a bajo, reducimos la probabilidad de un error tipo I-de rechazar la hiptesis estadstica cuando de hecho es verdadera-.
En contraste, si escogemos determinar un a .alto (por decir, .1-0), facilitamos
rechazar la hiptesis estadstica, porque el valor p del paso 4 no tendra que resultar muy bajo para ser menor que un ci. de .10. Al facilitar que una hiptesis estadstica sea rechazada, reducimos la probabilidad de cometer el error de no rechazarla
cuando es falsa (es decir, reducimos la probabilidad de cometer un error tipo II).
Usamos el smbolo griego beta para significar la probabilidad de un error tipo
ll. As,

277

~ = P [ de cometer un error tipo TI]


. D_e nuevo, es a, el nivel de significancia, el ue establece
.
decidir sobre su valor no resulta problemti.co d qd
1
. mos. Sin embargo,

.
, a o que os c1entificos e
. po particular siguen convenciones (tradiciones) que se basan en I ti n ~ carnguntas que estn siendo estudiadas en Jo

. , . os pos e precuatr~ niveles CI. convencionales se /resenta}~; ~atr~:b~:e~_::~osaceptarn. Los


relacin entre estos niveles y la probabilid d d
ch
, . cual muestra la
El nivel de significancia (e) debe establ a e re azar una hiptesis estadstica.
.
ecerse en un valor bai
d
cuencias de cometer un error ti o I
.
.
JO cuan o 1 as censeestadstica es que una nueva dro~a pte::r::ne:\Jx~;aeemplo:
si nuestra hiptesis
remos rechazar esta hiptesis prernatur
t
(es decir, venenosa), no que,
amen
eycometerune
ti I A blecenamos a en un valor bajo (por decir OOl) E t
. , rror po . si, estacia de que la droga es se ra ara ue r ' , s O req~erma lila fuerte evidensocial, el nivel a conv~on~. es qOS echazaral modssu toxicidad. En la investigacin
, unruve mo erado Amen
d
una buena razn para hacerlo de otra fo
.

. os que uste tenga


rrna, siga esta convenan.
El nivel de confianza
Cuando rechazamos la hiptesis estadstica al
.
. .
hemos decid.ido esencialmente ue e t
. _ruve 'por decir, .OS de srgnificancia,
riesgo de rechazar la hiptesis es1 d s. amos :puestos a tomar un 5 por ciento de
isnca cuan o, de hecho, es verdadera. Por ejem-

Entendimiento del lugar de la teora de probabilidad en la comprobacin de hiptesis


Captulo 9

TABLA

279

Comprobacin de hiptesis

9-4 Niveles convencionales de significancia y la probabilidad


de rechazar una hiptesis estadstica
Nivel
de significancia"'

Probabilidad
de rechazar la
hiptesis estadstica

Usos tpicos

(a)

Investigacin exploratoria, donde se conoce poco

.10

Alta

sobre un tema.
.
Niveles convencionales en investigacin mediante
encuestas e instrumentos de evaluacin
psicomtrlca y educativa. .
.
.. , . , .
Niveles convencionales en nvestigacicn biolgica.
de laboratorioy mdica, sobre todo cuando un
error tipo I amenazala vida (como probar la
toxicidad de drogas).

.05 y .01

Moderada

.01 y .OQl

Baja

-Estos niveles convenc.onales se aplican a anlisis es

tadsticosbvariados. En el modelamientoestadstico .U:'t:ltivaria~o


.

go que asumimos de cometer un error tipo I. Cuanto menos riesgo asumamos de


rechazar la hiptesis estadstica (es decir, cuanto ms bajo especifiquemos a), ms
confianza tendremos en nuestra conclusin cuando decidamos rechazarla.
En la nica situacin en que tenernos una certeza del 100 por ciento acerca de
una conclusin es cuando se observa a cada sujeto de una poblacin, es decir cuando se realiza un censo. En esta situacin poco usual, los clculos resultantes no
constituyen estimaciones (es decir, estadsticos) sino parmetros reales. Aqu, el
error de muestreo no representa un problema; es decir, tenemos una probabilidad
de cero correspondiente al error de muestreo. Por ejemplo, la oficina de los archivos de la universidad local quizs emplee archivos computarizados, para proporcionar un promedio exacto de la poblacin actual de estudiantes, el parmetro real
de la poblacin. En la mayora de las investigaciones, como las encuestas por telfono en hogares de Estados Unidos, no tenernos acceso a todas las observaciones
de una poblacin.Por fortuna, nuestra habilidad para manejar y controlar el error
de muestreo vuelve innecesario el gastar grandes sumas de dinero encuestando a
poblacionesenteras.

tablecido tan alto corno .S. Tales anlisis van mas

como LISREL,el ajuste del modelo debe ser probado con un ruve a es
all del alcance de este texto.

Direccin de la prueba: pruebas de una cola y de dos colas

establecimos a al .05 cuando probamos la hiptesis de que Tex era honesto;


plo,
s un estafador pero nunca estaremos seguros (tomo
1 11
Rec~::;ss:s:Jcit~:i:-:un 5 por cient~ de probabilidad de que simplemente
sus
d
d ue lo acusramos falsamente. Pero, de la misma ma:~Ya ::;,:r
~ent~'ae probabilidad de que tomramos la d~ci-si~
ta, 'no rechazramos falsamente su honestidad. Llamamos_a esto e nrve e - fianza. la confianza que tenemos de que no cometimos un error tipo I, y es igual a 1 a

~:::

t;:~-

Nivel de confianza

-~1

Nivelde confianza= 1 - nivelde signilicancia


= 1 - a.
. 1 d signilicancia de .05 corresponde a un nivel de confianza de 95 por
~:n:~~~e i";;ual forma, un nivel de signilicancia de .01 corresponde a un nivel de
confianza de 99 por ciento, y as sucesi':'amente.
t 1 intervalos de conDefinimos estos trminos en el capitulo 8 con respec o a os
-

Otra cuestin que influye en el tamao del valor p y, por consiguiente, en la probabilidad de rechazar la hiptesis estadstica, es si podemos predecir en qu direccin
caer nuestro estadstico muestra! observado. Es decir, caer la observacin
muestral, arriba o abajo del parmetro hipotetizado? Por ejemplo, suponga que
sospechamos que la puntuacin media de los estudiantes de la Universidad Estatal
enla Prueba de Admisin a la Universidad (PAU), aplicada por la American Coilege
Testing Corporation, es ms alta que el promedio nacional que es de 21, porque
esta escuela es muy selectiva con respecto a sus aspirantes. En otras palabras, estamos prediciendo un resultado que es mayor que el promedio nacional y en la direccin positiva. Debernos,sin embargo, enunciar la hiptesis estadstica corno "igual
a" el promedio nacionalde 21, para que se pueda predecir una distribucinmuestra!.
Por fortuna, podemos agregar informacin sobre la direccin del resultado, en la
segunda parte del paso 1 de los seis pasos de inferencia estadstica, la declaracin
de la hiptesis alternativa. Especficamente, donde X= puntuacin PAU y x = a la
media hipotetizada de X para la poblacin de la universidad estatal:
Paso 1: Hiptesis estadstica:

fianza.
, El 1 d
f anza y el
T as ro iedades matemticas son las mismas aqu1. ruve e con i
nivel d!siinilicancia (o error ~e mt~~::::;::;:e~J;~~c:i::~~:t::t:;~~:
el nivel de corudfian,:~'Juetenedmo~;:;amos afirmando que si la hiptesis estadstica
cos Al nivel e sie".u,cancia e .
. .
h rees e~ realidad 'Verdadera y realizamos nuestros procedimi~ntos 100 veces, rec . aza _
mos incorrectamente esta hiptesisestadstica verdadera solo 5 veces.Por consigwen
te tomaremos la decisin correcta 95 de las veces.As, estamos 95 por cient~se~r;s de la conclusin que extrajimos de este nico procedmuento_decom?ro ac10~
de hiptesis. Nuestro nivel de confianza est inversamente relac10nadocon el nes

Hiptesis alternativa:

x (Universidad estatal) =
x

21

.
.
> 21 una cola
(Universidad estatal)
'

Llamamos a sta, una prueba de una cola porque, como veremos en captulos
subsecuentes,el valor p para sta se calcular utilizando slo un lado (o cola) de la
curva de la distribucin rnuestral. Para una prueba de hiptesis corno sta, de hecho existen tres opciones paro enunciar la hiptesis alternativa.

Entendimiento del lugar de la teora de probabilidad en la comprobacin de hiptesis

Captulo 9 Comprobacin de hiptesis

Como lo demostraremos despus, es ms fcil rechazar la hiptesis estadstica con


una prueba de una cola. La mayora de las veces, rechazar la hiptesis estadstica y
aceptar la hiptesis alternativa constituyen el resultado que apoya nuestra teora.
Entonces, emplear una prueba de una cola carga el procedimiento a nuestro favor.
Por consiguiente, para evitar ser acusados de trucar nuestras estadsticas, debemos
proporcionar una justificacin para emplear una prueba de una cola, y debemos
tomar esta decisin independiente de la observacin de los datos (en el paso 4). De
acuerdo con lo anterior, escogemos una de las tres opciones antes del paso 4. Por
ningn motivo prevemos el paso 4 para determinar la direccin de nuestra prueba.

Use slo una de estas tres opciones para enunciar


la hiptesis alternativa:
Opcin 1: Nos piden determinar si la puntuacin media PAU de la universidad
estatal no es diferente de 21. No tenemos ninguna razn para suponer de ante-

.
d :
or O menor que ?1 Esto es una prueba no direccional o
mano sipo na ser rnay
-
.

d
prueba de dos colas, y el paso 1 de nuestros seis pasos de la inferencia esta is-

rica sera como sigue:


Paso 1: Hiptesis estadstica:

Hiptesis alternativa:

x (Universidad estatal)

= 21

,e

21, dos colas

(Universidad estatal)

Opcin 2: Nos piden determinar si la puntuacin media PAU de la universidad


estatal es mayor que 21. Tenemos razn para creer d':' antemano que los_estudiantes de esa universidad estatal tienen un promedio mayor ~~e el nacional,
de 21. Por ejemplo, quizs estamos conscientes de que las p_olfcas_ de admisin a la universidad son duras y que exigen_ una puntuacin PAU alta para
ingresar. Esto se llama prueba direccional positiva, o prueba de una cola en la
direccin positiva:
Paso 1: Hiptesis estadstica:

Hiptesis alternativa:

x (Universidad estatal)

=21

> 21, una cola

.
(Universidad estatal)

Opcin 3: Nos piden determinar si la puntuacin media PAU de la universidad


estatal es menor que 21. Tenemos razn para creer de antemano que los estu:
diantes de la universidad estatal obtienen puntuaaones peores que el pro~~dio nacional de 21. Por ejemplo, quizs estamos conscier;tes de que las P, ti
cas de admisin de la universidad no son muy duras y, asi. se admiten mucn~s
solicitantes con puntuaciones PAU relativamente_bJS: Esto seUama prue
direccional negativa, 0 prueba de una cola en la direccin negativa.

Paso 1: Hiptesis estadstica:

Hiptesis alternativa:

= 21
x (Universidad estatal)
u
' x (Universidad

< 21, una cola


estatal)

De nuevo, stas son las tres opciones. Usaramos

281

slo una de ellas en una sola

prueba de hiptesis.
Por qu se debe estipular la direccin antes de que observemos los dato~'. ti;:
direccin se especifica en el paso 1 de los seis pasos de la inferencia esta 1S

Cundo usar una prueba de una cola? Entonces, cundo sabemos si enunciar
la hiptesis alternativa como una prueba de una o de dos colas? sta es una cuestin para descifrar la pregunta de investigacin. En la investigacin cientfica, usualmente una teora proporciona la justificacin para una prueba de una cola. Por
ejemplo, en un estudio sobre la desigualdad de gnero en la industria, el argumento terico es que, es probable que las mujeres sufran discriminacin en niveles de
sueldo y promociones. Esto tiene sustento en los hallazgos de investigaciones anteriores. Tendra sentido, entonces, enunciar nuestra pregunta de investigacin como:
se les est pagando menos a las mujeres, comparadas con los hombres del mismo
rango y antigedad? Quiz sabernos que el salario medio anual de los hombres es
de $31 000. Nuestra teora nos dice que si las mujeres realmente sufren discriminacin, sus salarios anuales promediarn menos de $31 000. Estos argumentos conceptuales justifican la ventaja de una prueba de una cola.
La direccin siempre se establece en la hiptesis alternativa. En este caso de
equidad de gnero, la pregunta de investigacin sera: es el salario anual medio de
mujeres menor que $31 000? Una prediccin en la direccin negativa. Mientras esta
expectativa se enuncia en la hiptesis alternativa, la hiptesis estadstica debe declararse corno "igual a $31 000", porque slo esta declaracin nos dice qu esperar
de los resultados de la muestra. La prueba de hiptesis procede con un enfoque en
si la hiptesis estadstica es verdadera. Por consiguiente, proyectamos que el salario anual medio de una muestra de mujeres caer alrededor de $31 000 dentro de un
rango de error calculado, por decir, ms o menos $500. No podramos declarar
"menos de $31 000" como la hiptesis estadstica, porque si la media de la poblacin de mujeres es, de hecho, menor que $30 000, cul es el sueldo -$29 000,
$28 000, $20 000-? No sabemos y no podemos sealar cul es el parmetro alternativo hasta que el parmetro hipotetizado de $31 000 est excluido. Slo decir
"menor que" no proporciona informacin suficiente para describir la distribucin
muestra! en el paso 2. As, la direccin "menor que" se establece en la hiptesis
alternativa.
Para establecer la direccin de una prueba estadstica, examine cuidadosamente la pregunta de investigacin. S hay frases que impliquen una direccin positiva

(mayor que, ms que, incremento, ms pesada que, ms grande que, ms rpido, ganancia),
es correcto realizar una prueba de una cola, positiva. Si existen frases que impliquen una direccin negativa (menor que, disminucin, prdida, ms corto que, ms lento
que), una prueba de una cola, negativa, es la indicada. Por supuesto, cuando no hay
ninguna estipulacin de direccin, emplearnos una prueba de dos colas.

283

Seleccin de la prueba estadstica a emplear


Capitulo 9

Comprobacin de hiptesis

TABLA 95
1. Pregunte:
2. Pregunte:

3. Pregunte:
4. Pregunte:

l. De una cola en la direccin

Utilice una prueba de una cola,


positiva, en la hiptesis alternativa y un signo>.

positiva
El contenido de la pregunta de
investigacin incluye trminos
como mayor que, ms, increment~,
ms rpido, ms pesado y ganancia.
2. De una cola en la direccin
negativa
El contenido de la pregunta de
investigacin incluye t~?s
como menor que, menos, dismmu_cin, ms lento, ms ligero Y prdida.

5. Pregunta:

Utilice una prueba de una cola,


negativa, en la hiptesis alternativa y un signo <.

Emplee una prueba de dos col~s,


neutral, en la hiptesis alternativa y un signo *

1-s-e-le_c_c-io-,
n-d-e--=1=--a_p_ru_e~b-a_e_s:-;t~a-;d~s~t:::ic::-::a:-a:::-;::e::m::-;p~l-:;e::-;:ar

1
1

l. Una "prueba de medias para una muestra nica" o "prueba t" (captulo 10).
sta se aplica para una sola variable de intervalo/razn u ordinal de tipo intervalo de una muestra. Por ejemplo, con una muestra de 100 estudiantes, la
puntuacin media PAU para los de nuevo ingreso de la universidad local es
igual al promedio nacional de 21? La distribucin muestra! es la distribucin t
aproximadamente normal con gl n - l.
2. Una "prueba de proporciones para una muestra nica grande" (captulo 10).
sta se aplica para una sola variable nominal/ ordinal para una muestra nica,
donde P p [ de una categora de xito]. Por ejemplo, la proporcin de mujeres
en escuelas de medicina es igual a la proporcin de mujeres en la poblacin en
general de Estados Unidos (52 por ciento)? Una muestra es suficientemente
grande si la ms pequea, sea P., o Q.,, multiplicada por n, es mayor o igual a 5
(es decir, [(P=nocl (n)] 2 5 del captulo 8). La distribucinmuestral es la distribucin t aproximadamente normal con gl = ce ,
3. Una "prueba de proporciones para una muestra nica pequea" o "prueba de
distribucin binomial" (captulo 13). sta se aplica a una sola variable dicotmica
(es decir, de dos categoras) nominal/ ordinal para una muestra nica, cuando
[(p m=o,l (n)] < 5. Por ejemplo, la proporcin de mujeres en una comisin de
siete miembros del condado es igual a la proporcin de mujeres en la poblacin general del condado (54 por ciento)? La distribucin muestra! se llama

de una prueba estadstica

Cuntasvariables estamos observando paraesta prueba?


Cules son los niveles de medicin de las variables? Es decir, son variables
nominales/ordinales (paracalcular conteos y proporciones) o de intervalo/razn
(paracalcularmedias)?
Estamos tratandocon una muestra representativade unasola poblacin, o con ms?
Cul es el tamaode la muestra, y/ o cuntos grados de libertadestn disponibles
para la prueba?
Existen circunstanciaspeculiares a considerar?

Este curso de estadstica bsica cubre las siguientes pruebas estadsticas:

3. De dos colas no direccional


El contenido de la pregunta de
investigacin no incluye ninguna declaracin sobrela direccin
o simplemente afirma desigualdad.

Criterios para la seleccin

,
n las frmulas estadsticas correctas para un problema
Cmo sabemos cuale~ s~ili il de la comprobacin de hiptesis consiste en declaparticular? La parte mas , e
, .
ele . las distribuciones muestrales Y
rar correctamente las luptesis estadisticas, y
grr 1
ms fciles si se sigue un
d .
adas Estas tareas se vue ven
frmulas esta istlcas aprop1 . . 1
li
1
lecciones. Estos criterios se presenconjunto sistemtico de entenas a rea zar as e
tan en la tabla 9-5.
.
.
ortante al determinar el tipo de
Mientras cada uno de estos criten_oslrnes itm~ til Usted quiz desee repasar los
it rio 2 resulta especia
en e u .
prue b a a usar, e l en e i . ,
,
2) Un unto til a recordar es que la media,
cuatro niveles de medicin ( c~pitulo
:
la desviacin estndar se calculan
las puntuaciones de desviacin. la ~ana:ales
de ti o intervalo. As, las prueslo para variables de intervalo/ razon u d ll van el !ombre de prueba de medias,
O
bas estadsticas para esta,5 _vanables_a menu
e
la. variables de nivel nornidiferencias de medias o anal1s1s de vanant.
c~:~:::en:as
porcentajes o propornal/ ordinal tpicamente m_:1olucran e e; ~o van el nombre, de prueba de proporcur
ciones de casos en categonas, y a menu o e
nes o prueba de diferencias de rango.

E;

distribucin binomial.
4. Una "prueba de diferencia de medias para dos grupos" (captulo 11). sta se
aplica a dos situaciones similares. La primera es en el caso de una variable de
intervalo/ razn u ordinal de tipo intervalo en la que se compara a dos grupos
de poblaciones diferentes, como: el promedio de los estudiantes de la universidad local es igual al de los estudiantes de la universidad estatal? La segunda
es en el caso de una variable de intervalo/ razn u ordinal de tipo intervalo,
comparada para dos categoras de una variable nominal/ ordinal para una
muestra nica y poblacin, como: entre los estudiantes de la universidad local, existe una diferencia en el promedio de los hombres y de las mujeres? En
estas pruebas, el enfoque se ubica en la media de la variable de intervalo/
razn, que es tpicamente la variable dependiente. La distribucin muestra! es
la distribucin i, que es aproximadamente normal.

j 284

Captulo 9

Comprobacin de hiptesis

Sugerencias de estudio

285

-,

l
---------- ------i

5. Una prueba de" anlisis de varianza" de diferencias de medias entre tres o ms


grupos (captulo 12). sta es una extensin de la prueba de diferencia de medias para dos grupos (prueba nmero 4, explicada arriba). Aqu comparamos
las medias para a) tres o ms muestras de diferentes poblaciones o b) dentro de
una muestra nica, tres o ms grupos de una variable nominal/ ordinal, como
la variable nominal especializacin,con categoras de artes y ciencias, educacin, ingeniera y as por el estilo. Por ejemplo, el promedio difiere entre la
universidad local, la universidad estatal y la universidad comunitaria? o hay
una diferencia en el promedio para la escuela de especialidades en la universidad local? La distribucin muestral se llama distribucin F.
6. Una prueba "chi cuadrada" de una relacin entre dos variables nominales (captulo 13). Por ejemplo, existe una relacin entre la preferencia religiosa (catlica, protestante, juda u otra) y la actitud hacia el aborto (a favor de la vida, a
favor de la libre eleccin o indeciso)? La distribucin muestral se llama distribucin de chi cuadrada.
7. Una prueba de "correlacin lineal simple" de la relacin entre dos variables de intervalo/razn u ordinales de tipo intervalo (captulos 14 y 15).
Por ejemplo, entre los estudiantes universitarios hay una correlacin entre el
promedio de preparatoria y el promedio de la universidad? En otras palabras,
el promedio de preparatoria es un buen predictor del promedio de la uni
versidad? La distribucin muestra] es la distribucin t aproximadamente normal.
8. Una "prueba de correlacin rho de Spearman de rangos ordenados" de la relacin entre dos variables ordinales (captulo 16). Por ejemplo, existe una relacin entre el rango de clase de la preparatoria y el orden de terminacin en una
competencia de debate a nivel escolar? En otras palabras, los mejores estudiantes en clase ocuparon los primeros lugares en tal competencia? La distribucin muestra] se llama distribucin de la rho de Spearman.
9. Una "prueba del coeficiente de correlacin gamma de rangos ordenados" de la
relacin entre dos variables ordinales, con pocos rangos (como bajo, media y
alto) y muchos sujetos en la muestra en cada uno de esos rangos (captulo 16).
La distribucin muestra! es la distribucin normal.

TABLA 96

Nombre
de la prueba
Prueba de medas
para una muestra.
nica (captulo 10)

Estadstico
de la prueba
1=Xx

Nm.
Tamaode la muestra/
de muestras
grados de libertad
gf = n-1

Prueba de proporciones
Extensin de la
para una muestra nica ecuacin binomial:
pequea (captulo 13)
(P + Q)"

Nm., tipo y nivel


de medicin
de las variables

Peculiaridades
o suposiciones

Una variable de
intervalo/ razn u
ordinalde tipo intervalo

Prueba de proporciones
para una muestra nica
grande (captulo 10)

Una variable
nominal/
ordinal
[(p,,,~.,) (n)I < s

Una variable nominal


dicotmica { es decir,
dos categoras)

Prueba de diferencia
de medas para dos
grupos, dos muestras,
grupos independientes
(captulo 11)

Pruebade diferencia
de medias para dos
grupos, una muestra,
grupos independientes
(captulo 11)

Cuando las varianzas


de los grupos
son iguales,
si ri1 + n2-2

Cuando las varianzas


de los grupos
son iguales,
gl = n, + n,-2

Prueba de diferencia
de medias de dos
grupos, una muestra,
grupos no independientes,
apareados (captulo 11)

La tabla 96 proporciona una gua de asistencia para la seleccin de las prueba


y frmula apropiadas.

Anlisis de varianza

Sugerencias de estudio
Los siguientes captulos describen procedimientos para las pruebas de hiptesis
analizadas anteriormente. Avance a travs de esos captulos y analice las similitudes y diferencias entre las pruebas. Todas siguen la lgica de la inferencia estadstica. Sera recomendable memorizar los seis pasos de la tabla 9-2 para que su redaccin no interfiera en su comprensin.

Pruebas estadsticas, sus aplicaciones y frmulas

(prueba de diferencia
de medias para tres
o ms grupos)
(captulo 12)

Una variable
dependiente de
intervalo/razn u
ordinal de tipo
intervalo; se comparan
las medias para las dos
muestras (es decir, grupos)
Una variable
independientedicotmica
nominal u ordinal y una
variable dependiente
de intervalo/razn u
ordinalde tipo intervalo

El clculo del
error estndar
deoende de si
los' dos grapas
tienen varianzas
iguales

El clculo de
estndar
depende de si
error

los dos grupos


tienen varianzas
iguales

Dos variables de intervalo/


~zn u ordinal de tipo
intervalo con eI mismo
diseo de puntuacin O
una variable nica de
intervalo/razn u ordinal
de tipo intervalo medida
dos veces paralos
mismos sujetos
n no radicalmente
diferente de
un grupo a otro

Una variable
independientenominal
u ordinalcon tres
o ms grupos y una
variable dependiente
de intervalo/
razn u ordinal de
tipo intervalo

Asume que
todos los grupos
tienen varianzas

iguales

(contima)

1286

Captulo 9

Ccmprooacn de hiptesis

Acerca de las expresiones: el trmino convencional de hiptesis nula

287

mujeres de igual rango (un enunciado direccional). Puesto que no sabemos cunto
::T~A~B~L~A~9:-~6:__~P~ru::-_e:b:as:._::e:st:a:d::st:i:ca=s=,~s~u~s-a~p~l-ic_a_c_i_o_n_e_s~y-f__nn~u-l_a_s_<_c_on~cl_u_y_e_)-:--~-:--~~~~~~~~..,.ms, se debe probar el enunciado neutral, no direccional -<le que se les paga igual
a hombres y mujeres-y llamamos hiptesis nula a esta nulilicacin de la pregunta
l
',_
Nm., tipo y nine
de la investigacin. La popularidad de este trmino se debe al hecho de que es un
d
t /
de medicin
Peculiaridades
Nombre
Estadstico
Nm.
Tamao e a muesdra
de las variables
o suposdones
recurso para identificar la hiptesis estadstica cuando no es aparente en la pregun__.'.~~~~:_~~~~~d~e:la!:ru:e:b:__~d~e~m:1:es~tr~as::..._~gr::_::ad:o~sd:e:l:ib:erl:a
~~~~~-:--~~~~~~~::::::~~de 111 prue a
ta de investigacin. Por ejemplo, con Tex el jugador encontramos la hiptesis estadstica nulificando la pregunta Tex es un estafador?
gl = (j -1) (e -1)
Dos variables
Requiere al
, Prueba de chi
~' = L (0 E)'
nominales/
menos cinco
Por desgracia, el trmino nula puede ser confuso porque conceptualmente no
J cuadrada de asociacin
E
ordinales
casos por casilla
es consistente. La nulificacin implica que cualquiera que sea la pregunta de inves! (captulo 13)
tigacin, se demuestra probando una declaracin opuesta o no direccional cuando,

Las variables
Dos variables de
gl = n-2
i Correlacin lineal
de hecho, la nulificacin no siempre se requiere. A veces la pregunta de investigadeben
intervalo/razn u
j simple y regresin
relacionarse
ordinales de tipo intervalo
cin se contesta sin rechazar una hiptesis nula, corno con la comprobacin para la
(captulos 14 y 15)
linealmente
representatividad de la muestra (captulo 10). Esta inconsistencia es problemtica.
En un esfuerzo para determinar la hiptesis estadstica -una que es verdaderaRequiere pocos
Dos
varia
bles
n~ 10
mente comprobable-- un investigador puede rutinaria pero errneamente anular
Correlacin rho
rangos
6lD2
ordinales
j de Spearman de
empatados
la pregunta de investigacin. Por ejemplo, qu pasara en la pregunta de investi' =! n(n2l)
j rangos ordenados
gacin para decidir si a hombres y a mujeres se les paga igual? No nos es posible
I (captulo 16)
usar lo opuesto como una hiptesis estadstica. Es ms, los intentos por anularla
Tolera muchos
Dos
variables
No aplica
llevan a confusiones por el uso de dobles negaciones. Si uno se pregunta:" Tex es
Coeficiente de
rangos
ordinales
deshonesto?" Se prueba que "Tex no es deshonesto" o que "Tex es honesto?" se
empatados
desarrolla una confusin adicional al decidir si anular significa anular una declaracin, anular el efecto de la prueba, o anular (es decir, falsificar) una teora -cuestiones filosficas que complican los esfuerzos en una investigacin-. Los estuConforme avance por esos captulos, perciba en los ejemplos que la selecci~n
diantes en particular perciben las inconsistencias del trmino hiptesis nula, y esto
de una prueba depende especialmente del nivel de medida de las vanable:. 51 aun
los lleva a la frustracin y a la disminucin de confianza.
l dificulta distinguir los niveles de medicin, revise ese terna en el capitulo 2.
En contraste, referirse a la hiptesis comprobable como hiptesis estadstica es
se \arnbin observe que para cada prueba de hiptesis, tratamos con dos probaconsistente. Aplica de la misma manera a todas las pruebas estadsticas. La hiptebilidades: la probabilidad a estipulada en el paso 3 y el valor p"(la p [de resultados
sis estadstica es aquella que siempre se enuncia de tal manera que pueden predecirse
trales tan inusuales O ms inusuales que el resultado observado cuando la
los resultados estadsticos. Si esta hiptesis estadstica o su hiptesis alternativa
hiptesis estadstica es verdadera]) calculado en el paso 4. Por ltimo, resulta esen. contesta la pregunta de investigacin es un asunto aparte. Es ms, sin excepcin,
cial la comprensin de las curvas normales y aproximadamente normales, po_rque
esta manera de redactar la hiptesis estadstica centra su atencin en el requisito de
tales curvas de probabilidad son las distribuciones muestrales para la mayona de
que una declaracin slo es probable, si somos capaces de proyectar resultados
las pruebas de hiptesis.
.
muestrales a partir de ella (es decir, una distribucin muestral).
Debe ser capaz de trabajar con problemas estadsticos y extraer las conclus10:
A pesar de los problemas presentados por el trmino hiptesis nula, su uso es
nes correctas aunque usted no entienda completamente los seis pasos de la inferen
convencional. Los estudiantes en este curso con frecuencia encontrarn el trmino
cia estadstica. No pierda la fe. Despus de trabajar suficientes proble:1'as,se famien cursos posteriores sobre metodologa y encuestas. As, en este texto sealaremos
liarizar con la redaccin y los procedimientos de cada paso. En algun momento,
cuando el trmino nulo sea consistente con el trmino hiptesis estadstica para que
las cosas caern en su lugar y el proceso global ser claro.
los estudiantes ya no estn desprevenidos en futuros cursos de metodologa.

,11.

lI

Acerca de las expresiones: el trmino convencional de hiptesis nula


En el diseo de los procedimientos de comprobacin de hipte~is estads~cas,
muchos textos emplean el trmino hiptesis nula en lugar de hzpotesis eztadieticaUna hiptesis nula es aquella que se establece para ser rechazada o anulada. Esta
denominacin llama la atencin por el hecho de que para muchas preguntas de
investigacin debemos probar una hiptesis opuesta o neutra. Por ejemplo. suponga que creemos que a los hombres en una compaa se les paga mas que a las

INSENSATEZ Y FALACIAS ESTADSTICAS

El sentido comn informado: rebasando el sentido comn


a travs de la observacin de los datos
Tanto en el mundo social corno en el fsico se puede aprender mucho a travs del
sentido comn -aplicando un proceso de razonamiento a una situacin-. Pero

j 288

Captulo 9 ComprobaC'in de hiptesis

Preguntas para el captulo 9

289

l
1

1
1

los cientficos se mantienen activos porque muchos de los procesos de la naturaleza no son tan obvios. De hecho, los cientficos sociales han establecido desde hace
mucho que como seres humanos somos propensos a prejuicios y falsedades simplistas que creemos, porque el sentido comn nos dice que son verdaderos. Hay
muchos mitos y supersticiones sobre la realidad, especialmente de la realidad social. La ciencia y la imaginacin estadstica con su procedimientode comprobacin
de hiptesis nos anima a cuestionar las observaciones ms estrechamente,las evaluemos contra resultados predecibles, y desafiemos mitos y prejuicios.
El sentido comn, por ejemplo, lleva a muchas personas a concluir "obviamente" que las mujeres son fsica y emocionalmentems dbiles que los hombres. En
efecto, en promedio, los hombres tienen mayor fuerza corporal. Pero la fuerza fsica
tiene muchas dimensiones que desafan el hecho de la aseveracin del predominio
masculino. Por ejemplo, menos mujeres nacen muertas; adems, las nias tienen
menor tasa de mortandad infantil y mayor esperanza de vida. La fortaleza emocional tambin es difcil de precisar. Muchas personas asumen que los hombres son
emocionalmentems fuertes que las mujeres porque las mujeres lloran con mayor
frecuencia. Pero, entonces, por qu cometen los hombres ms del 90 por ciento de
todos los crmenes violentos emocionalmente cargados, como lesiones y asesinatos? La confusin radica en las restricciones culturales de cmo hombres y mujeres
expresan sus emociones? Cmo puede medirse la fuerza emocional de manera
confiable y justa? Para entender por completo la fuerza fsica y emocional, debemos empezar con una clara definicin de lo que realmente es la fuerza. Mientras el
sentido comn explica mucho de la realidad, una mayor comprensin requiere de
un razonamiento astuto, prediccin significativa, y observacin y medicin exactas. La observacin metdica extiende e informa al sentido comn.
Lo anterior no quiere decir que un informe cientfico dado constituye la ltima
palabra en un aspecto determinado. Cualquier teora cientfica siempre est abierta
para su modificacin posterior. Tampoco quiere decir que los cientficos estn creando y adhirindose a sus propios mitos. Por ejemplo, mucha de la investigacin
cientfica a fines del siglo XIX apoy la nocin de que las mujeres eran inherentemente
menos inteligentes que los hombres. Pero en la ciencia tales mitos tienden a no
resistir la prueba del tiempo. El proceso de la investigacin cientfica ha construido
sistemas de control y balances que aumentan las oportunidades para descubrir los
mitos. La comprobacin de hiptesis es un proceso importante que separa hechos
esenciales de hechos aparentes pero perjudiciales.

2. De~a y distinga los propsitos tericos y estadsticos par


b
hpotess. Ilustre con un ejemplo.
compro ar una
3. Al comprobar una hiptesis, determinamos si los efectos observados en la
muestra son debidos a diferencias reales en parmetros de la pobl . ,
.
plemente son debidos al error de muestreo. Matemticamente . ules o n la,
dos cuestio
d b
, l cua es son as
nes que_ e emos predecir para empezar semejante rueba?
4. Rechazamos una hiptesis estadstica cuando el valor p . es grande pe.
O
Explique.
l
queno.7
5. Ctl es~a relacin entre el tamao del efecto de una prueba estadstica y el
va or P c _culado_paraesa prueba? Ilustre con un ejemplo.
6. En_lengu".)e cotidiano, qu es el nivel de significancia de una prueba de hi ,
tesis Y cual es su funcin en la prueba?
po7. Relaaone lo siguiente:
a) Error tipo I
b) Error tipo II
e) Alfa (a)
d) Beta(~)

-p [ error tipo IJ
__ Rechazar la hiptesis estadstica cuando de
hecho es verdadera
__ p [error tipo IIJ
-- No rechazar la hiptesis estadstica cuando
de hecho es falsa

8. Una distri~ucin muestral es hipottica. Qu significa esto?


9. ~on va1:ables de qu~ niveles de medicin utilizamos las pruebas de medias?
10. l_ on vanables de que niveles de medicin utilizamos las prueb d
cienes?
as e proporll. Con variables de qu niveles demedicin utilizamos las pru b d
ordenados?
e as e rangos
12. Por qu de_bemos escoger el nivel de significancia antes de observar los resul-

tados estadsticos de nuestra muestra?

13. Liste los seis pasos de la inferencia estadstica


14. Mencione los criterios para la seleccin de una prueba estadstica.

15. Ahora que usted conoce la distribucin muestral para el lanzamiento de un


par de dados (tabla 9-1), emplee su imaginacin estadstica ara mejorar su
estrategia p~ra el uego de mesa Monopolio. (Quiz desee insieccionlr el juego en cuestin para contestar tales preguntas.)
) ~anar el juego depende de poseer las ms valiosas propiedades y recolectar

Preguntas para el captulo 9

l. Una teora (conjunto de ideas sobre cmo funciona el mundo emprico)motiva

hiptesis (predicciones especficas acerca de qu observaciones pueden esperarse cuando una teora es verdadera). Suponga que estamos probando una
teora de la discriminacin racial, para explicar la segregacin residencial (es
decir, la tendencia de que un barrio sea ocupado por una sola raza). Con respecto a la conducta de agentes de bienes races, qu hiptesis es motivada por
esta teora?

ecuentemente l_a renta de stas. Dado esto, si usted pudiera escoger poseer
de ~ropiedades (o calles) para empezar el juego, qu color escogena.7coplor
orque?
b) ~ul es la cuestin mds perjudicial que un jugador recin enviado a la crce puede hacer en el s1gmente turno si no posee las propiedades prpuras O
anaranadas?
e) ~as cuatro lineas de ferrocarriles no pagan mucha renta por lo que a menuo no vale la pena comprarlas o poseerlas. Sin embargo, hay circunstancias
en qu~ s~ propiedad es ventajosa. Cundo sucede esto? Sugerencia: La regla
de adicin de la probabilidad es muy til aqu.
~

Ejercicios para el captulo 9


Cnpftulo 9

Comprobacin de hiptesis

el captulo 9
l. Practique el arte de identificar hiptesis estadsticas y concebir distribuciones
muestrales. En trminos generales, prediga qu resultados rr:-uestrales putc!de
esperarse que ocurran con el muestreo repetido, cuando las si_gmenteshiptesis estadsticas son verdaderas (le sera til un repaso del capitulo 7).
a) Hiptesis estadstica: La edad media de los estudiantes en el campus es de
21 aos.
~
I

b) Hiptesis estadstica: Entre las corpo:aciones de Fortune :,_OO, e porcentaje


de miembros que son mujeres en la oficina corporah~~ es solo 20 por ,;i~nto~
e) Hiptesis estadstica: El peso medio de las barras de Much-o-colate es .7~
onzas.
.
.
d) Hiptesis estadstica: El msn:uctor ~o est_sesgado hacia los hombres o las
mujeres para otorgar una calificacin de diez.
2. Practique el arte de identificar hiptesis_estad~ticas y concebir distribuciones

muestrales. En trminos generales, prediga que result~dos de la mu~stra espera que ocurran con el muestreo repetido, cuando las si~entes hiptesis estadsticas son verdaderas (le sera til un repaso del capitulo 7).
a) Hiptesis estadstica: La mitad del pblico televidente mira un noticiero

nocturno.
,
l -1
b) Hiptesis estadstica: La velocidad media _de los automovlles en a u tima
recta de la carretera interestatal es de 80 millas por hora.
, .
_
e) Hiptesis estadstica: Cuarenta por cient_o de los estudiantes del ltimo ano
de preparatoria han consurrudo alcohol ilegalrnente._
.
d) Hiptesis estadstica: La edad media de los vicepresidentes corporahvos es
de 49 aos.
3. Una pregunta de investigacin constituye una meta del proyecto, _que puede
declararse en trminos de una hiptesis. Practique el arte de_ determ1:1ar si cada
una de las siguientes preguntas de investigacin conshtuiran la h1potes1sestadstica o la hiptesis alternativa. Argmnente su respuesta.
a) En promedio, los conductores exceden el_ lmite de velocidad de 70 millas
por hora en la ltima recta de la carretera interestatal?
.
._
b) Usando una muestra de 30 de los 125 Jugadores, el peso promedio d_el eqm
po de futbol de este ao es igual al del ao pasado, que fue de 224 libras?
e) Este casino emplea dados cargados?
4. Una pregunta de investigacin constituye una meta deldprodyecto,_que pue~:
declararse en trminos de una hiptesis. Practique el arte . e_ eter:1ar si ca
una de las siguientes preguntas de investigacin consttuiran la hiptesis estadstica o la hiptesis alternativa. Argmnente su respuesta.

291

a) En promedio

ocurren ms de seis actos violentos por semana en cada serie


de televisin dramtica en horario preferente.
b) En una apuesta, Albert lanz 10 monedas y en todas obtuvo cara. Sus monedas tienen doble cara?
e) Es verdadero el estereotipo de que ms del 90 por ciento de las personas sin
hogar son adictas al alcohol o a las drogas?

5. La direccin y el signo de la prueba de hiptesis se especifican en la hiptesis


alternativa. Decida si las siguientes hiptesis alternativas son de una cola en
direccin positiva, de una cola en direccin negativa o de dos colas no
direccional. Adems, indique el signo matemtico y explique su eleccin.
a) Hiptesis alternativa: Ms del 50 por ciento de las vctimas de cncer

pulmonar son o han sido fumadores.


Hiptesis alternativa: El promedio de estudiantes hombres y mujeres no es
el mismo.
e) Hiptesis alternativa: En las escuelas del distrito central de la ciudad, menos del 60 por ciento de los graduados de preparatoria siguen sus estudios
universitarios.

b)

6. La direccin y el signo de una prueba de hiptesis se especifican en la hiptesis

alternativa. Decida si las siguientes hiptesis alternativas son de una cola en


direccin positiva, de una cola en direccin negativa, o de dos colas no
direccional. Tambin, indique el signo matemtico y explique su eleccin.
a) Hiptesis alternativa: Ms del 80 por ciento de los presos en la crcel del

condado son encerrados por cargos relacionados con las drogas.


b) Hiptesis alternativa: Para la nueva droga Fixitall, la tasa de cura del grupo
experimental que recibi la droga es mayor que aquella del grupo de control, que slo recibi un placebo (es decir, una pldora de azcar).
e) Hiptesis alternativa: Los porcentajes de bautistas y metodistas que creen
que la Biblia est libre de errores no es el mismo.
7. La profesora Srrth est estudiando la desigualdad de gnero en una gran empresa de comunicaciones. Con base en su experiencia pasada y en las teoras
que se ofrecen en la literatura especializada, ella tiene razones para creer que
las mujeres de la empresa tienen un ingreso medio ms bajo que los hombres.
En la hiptesis estadstica, ella supone que los ingresos medios de hombres y
mujeres son iguales.
a) Por qu declara la hiptesis estadstica de esa forma, en lugar de decir que
la media para los hombres es ms alta?
b) En la hiptesis alternativa, debera usar una prueba de una cola o de dos
colas? Por qu?
e) En el paso 3 de la prueba ella establece un nivel de significancia (a) de .05.
En el paso 4 de la prueba calcula un valor p de .03. En el paso 5, rechazar la
hiptesis estadstica o no la rechazar?

Captulo 9

Comprobacin de hiptesis
Aplicaciones opcionales en computadora para el captulo 9

293
8. En un estudio sobre patrones de trabajo entre abogados, un investigador supone que aquellos que se especializan en leyes laborales corporativas trabajan
ms horas por semana que aquellos que se especializan en ley estatal. En la
hiptesis estadstica, el investigador hipotetiza que la media de horas trabajadas por semana para los dos grupos es igual.
a) Por qu enuncia la hiptesis estadstica de esa manera, en lugar de decir

que la media para abogados corporativos es mayor?

11. Calcule las siguientes probabilidades para el lanzamiento d


tres veces.

a) p [2, 12, 2]

9. Este ejercicio lo familiarizar con las relaciones entre niveles de significancia,


valores p y decisiones de rechazo. Para los siguientes niveles de significancia
y valores p, indique si usted rechazara o no la hiptesis estadstica.

a)

b)
e)
d)
e)
j)

Valor p
(del paso 4 de

Nivel de significancia
(a del paso 3 de
los seis pasos)

los seis pasos)

.OS
.OS
.01
.001
.01
.05

.0476
.3297
.0476
.0028
.0006
.4996

Decisin de rechazo:
Rechazar la hiptesis estadstica
o no rechazar la hiptesis estadstica

10. Este ejercicio lo familiarizar con las relaciones entre los niveles de significancia,
los valores p y las decisiones de rechazo. Para los siguientes niveles de
signficancia y valores p. indique si usted rechazara o no la hiptesis estadstica.

a)
b)
e)
d)
e)
f)

Nivel de signjficancia
(a del paso 3 de
los seis pasos)

Valorp
(del paso 4 de
los seis pasos)

.001
.05
.01
.OS
.001
.01

.0007
.0650
.0099
.0399
.0110
.0101

Decisin de rechazo:
Rechazar la hiptesis estadstica
o no rechazar la hiptesis estadstica

e) p [3, 7, 9]

12. Calcule las siguientes probabilidades para el lanzamiento d


d
tres veces.
e un par e dados

b) En la hiptesis alternativa, debe usar una prueba de una cola o de dos co-

las? Por qu?


e) En el paso 3 de la prueba ella establece un nivel de significancia (a) de .05.
En el paso 4 de la prueba calcula un valor p de .23. En el paso 5, rechazar la
hiptesis estadstica o no la rechazar?

b) p [7, 6, 7)

.
e un par de dados

a) p [4, 5, 10]

b) P [lo, 10, lOJ

e) p [2, 7, 2]

13. ;;;'{~~::~:~::.ad de lanzar un par de dados dos veces y obtener un 12 en

14.

~~i;~==~!:ad de lanzar un par de dados dos veces y obtener un 2 en

Aplicaciones opcionales en computadora para el captulo 9


Si en su clase emplea las aplicaciones corn ut .
l
abra los ejercicios del ca tulo 9 en
. P aaona es que acompaan este texto,
1
Statistical Imagination. Lrs ejerciciose i!JSt~:~mpacto_ Compu,ter Aplications far The
mientos estadsticos bivariados en el
5 para ~:n~;;;tac1on hacia los proced-

spf

Vous aimerez peut-être aussi