Vous êtes sur la page 1sur 435

r· "-

\
...J

' Esta obra proporciona al lector los conocimientos bási-


-
w
2
d'.:
cos acerca de la bioestadística y su aplicación en el área
de las ciencias de la salud. e
Esta nueva edición corregida y aumentada ofrece al
lector notables mejoras con respecto a las ediciones an-
, teriores. Entre ellas se encuentra el estudio de las gráfi-
Base para el análisis de las ciencias de
J cas de t81lo, hojas y de caja con valofes extremos, así como la salud.
· , el tema de las medidas arregladas y la prueba de califica-
, ción con signo de Wilcoxon. Asimismo, se pone un mayor
énfasis en las aplicaciones por computadora y se ofrece
un nuevo apéndice con los comandos más usuales para
el cálculo estadístico.
-
DANIEL
El texto de los capítulos fue revisado cuidadosamente
. y se agregaron nuevos ejercicios y preguntas de repaso,
· los cuales suman más de 600 en esta nueva edición. Todo
ello convierte a esta obra en una guía clara y práctica para
los.estudiantes y profesionales de las ciencias de la salud
y áreas afines.
3i'ed

··JRlEG.A

~
:11:~~'II
'~Jl,11111ilf
]9681 8519651 ) ¡
\-.!!!!,>
_,¡::;,....:,_
luTEHA
NORIECA EDITOW
'
(

(
etqwo10:::, • e1anzaual\ • ei,ieds3 • o:>1x~w
SlHOllOl V'.)lfHON
VHHnl

·pn1es e1
ap se,:1ua,:1 se1 ap S!S!l\!Ue 1a eJed asee

H91JSJpe¡sao1q •
VERS!.óN AlJTORIZADA EN ESPAJilOL DE LA OBRA
PUBLICADA EN INGLl:S CON EL TITULO:
BIOSTASTISTICS:
A FOUNDATION FOA ANALYSIS
IN THE HEALTH SClENCES
e JoHN WiLEY & SoNs, INC.

CoLABORADOR EN LA TRADUCCIÓN: A n1i esposa


FRANCISCO LEÓN HERNÁNDEZ
LICENCIADO EN MATEMÁTICAS APLICADAS Y
Mary
COMPUTACION DE LA ESCUELA NACIONAL DE y a ,nis hijos
ESTUDIOS PROFESIONALES, AcATLÁN, Mtx1co.
lean,
REVISIÓN: Carolyn
GUILLERMINA YANKELEVICH
NIEDREDOVlCH ylohn
DOCTORA EN CIENCIAS. ]NVESTIGADOAA TITULAR
EN EL DEPARTAMENTO DE BIOMATEMÁTICAS.
INSTITUTO DE INVESTIGACIONES 810MÉDICAS.
UNIVERSIDAD NACIONAL AUTÓNOMA DE MÉXICO.

LA PRESENTACIÓN Y DISPOSICIÓN EÑ COl'LJUNTO DE

810EST ADfSTICA. BASE PARA EL ANÁLISIS


bE LAS CIENCIAS DE LA SALUD

SON PROPIEDAD DEL EDITOR. NINGUNA PARTE DE


ESTA OBRA PUEDE SER REPRODUCIDA O TRANSMI-
TIDA, MEDIANTE NINGÚN SISTEMA O MÉTODO,
ELECTRÓNICO O MECÁNICO (1NCLUYENOO EL FOTO-
COPIADO, LA GRABACIÓN O CUALQUIER SISTEMA DE
RECUPERACIÓN Y ALMACENAMIENTO DE INFOA·
MAClóN), SIN CONSENTIMIENTO POR ESCRITO DEL
EDITOR.

DERECHOS RESERVADOS:

© 1997, EDITORIAL UMUSA, S.A DE C.V.


GRUPO NOAIEGA EDITORES
8.o.LDERAS 95, MÉXICO, 0.f.
C.P. 06040
51° 521-21-05
91(800) 7-06-91
~ 512-29-03
E-MAIL:
cnoriega @maH.in!ern&t.éom .mx

CANIEM NúM. 121

TERCERA REIMPRESIÓN
DE LA TERCERA EDICIÓN

HECHO EN MÉXICO
ISBN 968-18-5196-X .,
Prefacio

La presente edición de esta obra está dirigida al mismo público que las edi-
ciones anteriores: estudiantes universitarios avanzados y profesionales de
' las ciencias de la salud, quienes necesitan un libro de consulta acerca de la
metodología estadística.
Al igual que las ediciones anteriores, ésta requiere pocos conocimien-
tos matemáticos previos. Sólo se requiere una destreza razonable en álge-
bra para comprender los conceptos y métodos que fundamentan los cálcu-
los. Asimismo se hace énfasis en el aprendizaje basado en la comprensión
intuitiva de los principios, y no en la comprensión de conceptos matemáti-
cos complejos.
Desde la publicación de la primera edición, el uso cada vez mayor de la
microcomputadora ha tenido un gran impacto en la enseñanza de la estridís-
tica. Existen muy pocos estudiantes que no poseen una computadora per-
sonal o no tienen acceso a una de ellas. Ahora más que nunca, el profesor de
estadística puede concentrarse más en enseñar conceptos y principios y
dedicar menos tiempo a corregir los errores de cálculo que cometen los alum-
nos. Debido a la disminución del tedio y cansancio que implica la realización
de largos cálculos manuales, el estudiante actualmente tiene muchas más
razones que sus predecesores para encontrar que sus cursos de estadística
son una experiencia agradable.
Consecuentemente, en esta edición se destacan aún más las aplicaciones
por computadora. Para muchas de las técnicas que se exponen en esta edi-

8 Prefacio Prefacio 9

ción. ~e ofrecen los con1andos del progran1a ~1INITAB en los casos en que Asimismo, agradece la cooperación de Minitab, Inc., por haber permi-
puedan ser aplicados. (MINITAB es una marca registrada. Para mayor infor- tido la utilizaciónde la versión actualizada del paquete de software MINITAB
mación acerca del software para el análisis de datos, escribir o llamar a Orive para ejemplificar el uso de la microcomputadora en el análisis estadístico.
Enterprise 3081. State College, PA 16801; teléfono 814-238-3280; telex Un agradecimiento especial para los colegas en la Georgia State Uni·
881612). En esta edición también se incluyen salidas impresas de los resul- versity, los profesores Geoffrey Churchill y Brian Schott, quienes elabo·
tados calculados mediante dicho programa. El apéndice I contiene algunos raron los programas para computadora para generar algunas de las tablas
de los con1andos 111ás usuales del mismo; entre los que se incluyen coman- de los apéndices; al profesor Hardeo Sahai del departamento de Bioes~
dos para entrada. edición y clasificación de datos. tadística y Epidemiología en la Universidad de Puerto Rico, quien hizo
A continuación se 1nencionan algunas de las mejoras incorporadas en algunas sugerencias valiosas para mejorar el libro. A pesar de la ayuda de
la presente edición: tanta gente, el autor asume la responsabilidad absoluta de cualquier defi·
1. Para introducir al estudiante a las técnicas de explicación para el ciencia o inexactitud que pudiese aparecer en esta obra.
análisis de datos, se incorporó el estudio de la gráficas de tallo y hojas y de
caja con valores extremos. WA YNE W. DANIEL
2. Se incorporaron algunas nuevas secciones y ejercicios en la parte
final de cada capítulo, Jo cual da un total de más de 600 ejercicios y pre·
guntas de repaso.
3. Se agregó a la sección de medidas de tendencia centra\ el tema de las
medias arregladas. Ésta se calcula la mayoría de las veces como parte de los
cálculos del programa MINITAB para las medidas descriptivas.
4. La solución a los problemas que !se utilizan.como ejemplos se iden-
tifican claramente con letra negrita.
5. Se amplió el tema estadístico de iáji·cuadrada, con el propósito de
que el procedi1niento sea intuitivamente más interesante para el alumno.
6. En el capítulo 11, titulado Estadística paramétrica y no paramétrica,
se incorporó el tenia de la prueba de calificación con signo de Wilcoxon.
7. También se agregó el tema de análisis de regresión lineal noparamétri· 1
caen el capítulo mencionado. 1'
El autordeseaexpresar su agradecimiento a los lectores de las ediciones
anteriores y profesores que utilizaron el libro para impartir sus clases por 1
las excelentes sugerencias para el mejoramiento de la obra. En particular,
desea agradecer a quienes hicieron recomendaciones detalladas para esta
revisión:

Mark Alhanese
Jorge Aragon
University of Iowa
University of Austin, Texas
1
Theresa Barz St. John's University l
Charles M. Biles
Jean Lambert
Humboldt State University
University ofMontreal
!
Jeannine R.aymond California State University, Fresno 1
Bruce Tru mbo California State University, Hayward j

.--...
1
il
Contenido

Capítulo 1 Organización e integración de datos 17


1.1 Introducción 17
1.2 Algunos conceptos básicos 17
1.3 Computadoras y análisis bioestadístico 20
1.4 Arreglo ordenado · 22
1.5 Datos agrupados y distribución de frecuencia 24
1.6 Medidas de tendencia central 39
1. 7 Medidas de dispersión 44
1.8 Medidas de tendencia central calculadas a partir de datos
agrupados 50
1.9 Variancia, desviación estándar y datos agrupados 58
1. 1O Resumen 62
Preguntas y ejercicios de repaso 62
Bibliografía 66

Capítulo 2 Algunos conceptos básicos de probabilística 69


2.1 Introducción 69
2.2 Dos perspectivas de la probabilidad: objetiva y subjetiva 70
2.3 Propiedades elementales de la probabilidad 72
2.4 Teoría y notación de conjuntos (nociones básicas) 73
2.5 Técnicas de conteo: permutaciones y combinaciones 78
2.6 Cálculo de la probabilidad de un evento 86
2. 7 Resumen 95
Preguntas y ejercicios de repaso 95
Bibliografía 98

, Capítulo 3 Distribuciones de probabilidad 101


3.1 Introducción IOl
3.2 Distribución de probabilidad de variables discretas IOl
3.3 Distribución binomial I05
3 .4 Distribución de Poisson 114

11
12 Contenido Contenido 13
3.5 Distribucione~ de probabilidad continua 119 Capítulo 6 Pruebas de hipótesis 245
3.6 Distribución nonnal 122
134 6.1 Introducción 245
3.7 Resun1en
6.2 Prueba de hipótesis: la inedia de una sola población 252
Preguntas y ejercicios de repaso 134
137
6.3 Prueba de hipótesis: la diferencia entre las medias
Bibliogrt(/i'n
de dos poblaciones 269
139 6.4 Comparación por parejas 280
Capítulo 4 Algunas distribuciones de muestreo importantes
6.5 Prueba de hipótesis: proporción de una sola población 287
4.1 Introducción 139 6.6 Prueba de hipótesis: diferencia entre las proporciones
4.1 Muestreo aleatorio simple 139 de dos poblaciones 290
4.3 Distribuciones muestrales 143 6.7 Prueba de hipótesis: variancia de una sola población 293
4.4 Distribuciones de la media de la muestra 144 6.8 Prueba de hipótesis: relación de las variancias
4.5 Distribución de la diferencia entre las medias de dos poblaciones 296 1
'
de dos n,uestras 155 6.9 Resumen 300
4.6 Di~tribución de la proporción de la muestra 160 Preguntas y ejercicios de repaso 301
4. 7 Distribución de la diferencia entre las proporciones Bibliografía 341
de dos 111uestras 164
4.8 Resun1cn 167
167 Capítulo 7 Análisis de la variancia 345 1
Preguntas y ejercicios de repaso
Bibliogr(~jfa 170 7 .1 Introducción 345
7 .2 Diseño completa1nente aleatori zado 347
Capítulo 5 Estimac'1ón 171 7 .3 Diseño de bloques con1pletos aleatori zados 373
5.1 lntroduc.::ión 171 7 .4 Experiinento factorial 383
5.2 Intervalo de confianza para: la media de una población 175 7.5 Temas diversos 397 1,
5.3 La distribución r 183 7 .6 Resu,nen 401
5 .4 1ntervalo de confianza para la diferencia entre las medias Preguntas y ejercicios de repaso 401
de dos poblaciones . 189 Bibliografía 446
5 .5 Intervalo de confianza para una proporción de población 197 1
5.6 Inter,·a\o de confianza para la diferencia entre
Capítulo 8 Regresión y correlación simple 453 1
la:-. proporciones de dos poblaciones 199
). 7 Detenninación del tamafio de la muestra para la estimación 8.1 Introducción 453 !
de 111edia:-.
5 .8 Deterrninación del tan1afio de la muestra para la estimación
202 8.2 Modelo de regresión
8.3 Ecuación de regresión de la 1nuestra
454
-156
!
d...-: proporciones 205 8.4 Evaluación de !a ecuación de regresión -167 1
5 .9 I nLér\"a]o de confianza para la variancia de una población 8.5 Uso de la ecuación de regresión -185 l
con r.listribución normal 208 8.6 Modelo de correlación -191
, 1
5.1 O Inte-r,·.:tlo de confianza para la razón de las variancia~ 8.7 Coeficiente de correlación -192
de dos poblaciones con distribución normal 213 8.8 Algunas precauciones ,06 1
5. J 1 Re;-,u111en 218 8.9 Resu1nen 507 1
218 Preguntas y ejercicios de repa:-.o 509
Pregunta., y ejercicios de repaso
242 r B i b!io g rl~((a 535 l
..
Bib! i o g r<(/i"n
l
j
!I
r'
Contenido 15
14 Contenido
11.12 Resumen 755
ca;:,ítulo 9 Regresión y correlación múltiple 539 Preguntas y ejercicios de repaso 755
9.1 Introducción ~39
1 Bibliografía 759
9 .2 Modelo de regresión múltiple 540
9.3 Obtención de la evaluación de regresión múltiple 542 Capítulo 12 Estadísticas vitales 763
9.4 Evaluación de la ecuación de regresión múltiple 553 12.1 Introducción 763
9.5 Uso de la ecuación de regresión múltiple 561 12.2 Tasas y razones de mortalidad 764
9.6 Variables cualitativas independientes 566 12.3 Medidas de fertilidad 772
9.7 Modelo de correlación múltiple 584 12.4 Medidas de morbilidad 775
9 .8 Elección de variables independientes para la ecuación 12.5 Resumen 777
de regresión múltiple 593 Bibliografía 777
9.9 Resumen 594
Preguntas y ejercicios de repaso 595 Apéndice I Algunos comandos básicos para ef manejo
Bibliografía 636 de datos con el programa MINITAB 779

Capítulo 1O Distribución ji-cuadrada y el análisis Apéndice II Tablas estadísticas 785


de frecuencias 639 .,
Respuestas a los ejercicios con numeración impar 863
10.1 Introducción 639
10.2 Propiedades matemáticas de la distribución ji-cuadrada 639
Índice 875
10.3 Prueba de bondad de ajuste 643
10.4 Prueba de independencia 657 i·
10.5 Prueba de homogeneidad 668
10.6 Resumen 676
Preguntas y ejercicios de repaso 676
Bibliografía 693

Capítulo 11 Estadística no paramétrica


y de libre distribució0 697
11'.1 Introducción 697
11.2 Escaias de medición 699
11.3 Prueba del signo 701
11.4 Prueba Wilcoxon de calificación con signo 710
11.5 Prueba de la mediana 714
11.6 Prueba de Mann-Whitney 718
11.7 Prueba de bondad de ~juste de Kolmogorov-Smirnov 723
11.8 Análisis unilateral de variancia por rangos ~'\."
de Kruskal-Wallis 729
11.9 Análisis bilateral de variancia por rangos de Friedman
11. l O Coeficiente de correlación por rangos de Spearman
11.11 Análisis no paramétrico de regreSión
737
742
751
,1 !
~
rr¡'1¡
1¡ 1
~r Organización e integración de datos

~,,,1

t
1
lj
1.1 INTRODUCCIÓN _ _ _ _ _ _ _ _ _ _~ ~ ' " - -

1
c.¡
'
Los objetiyos de este libro son dos: 1) enseñar al es~udia~I7, .~,o_rga_nizar y
procesar datos; 2) enseñarle cómo tomar decisiones a part~f ;~.~ µn gr~)) vp-
lumen de d.atos al examinar sólo una pequei)a parte de ello&: Los conce.ptos
y métodos necesarios para lograr el primer objetivo se presentan bajo el títu-
lo de estadística descriptiva, y el segundo objetivo se logriijp~d.iante el estu-
dio de lo que se conoce como estadística inferencia!. En e~te capítulo se es-
tudia !'a estadística descriptiva. Del capítulo 2 al 4 se estudian los tópiéos
que conforman la base de la inferencia estadística y en e~ _re~to del ~ibro se
expone lá estadística inferenciaI: · "·,- · ·
P·uestO que este libro está diseñado para personas que se preparan para
iniciar o que ya cursan una carrera en ciencias de Ia salud·: el má.terfal y los
ejer_cicios refleJan los problemas y actividades qu~ tales·person'as pfoba-
blemente encuentren en la práctica de su trabajo. · ·

1.2 ALGUNOS CONCEPTOS BÁSICOS _ _ _ _ _ _ __

Primero se definen algunos términos que aparecen a lo largo del libro:

Esta.dística El significado de este término estáin1plícitoen la sección ante-


. rior. Pero, para ser más precisos, se puede decir que la estadística _es la dis-

!
18 Organización e integración de datos Algunos conceptos básicos 19
ciplina que se ocupa de 1) la recolección, organización y procesamiento de Estos conteos o frecuencias, como se denominan, son el número que se mane-
datos, y 2) la obtención de inferencias apartirde un volumen de datos cuan- ja cuando el análisis involucra variables cualitativas.
do se observa sólo una parte.
Variable aleatoria Siempre que se determina la estatura, el peso o la edad
Bioestadística Las herramientas de la estadística se utilizan en muchos de un individuo, el resultado frecuentemente se refiere aun valorde la varia-
campos: negocios, educación, psicología, agricultura y economía, por men- ble respectiva. Cuando los valores se originan como resultado de factores
cionar sólo unos cuantos. Cuando los datos que se analizan proceden de las aleatorios (al azar), la variable se llama variable aleato,:~a. Los y al ores resul-
ciencias biológicas o médicas, se prefiere el término bioestadística paradis- tantes de los procedimientos de medida se denominan.observaciones o
tinguir las herramientas y conceptos de la estadística general. Esta apli- mediciones.
cación particular es la que se estudia en este libro.
Variables aleatorias discretas Las variables pueden también caracteri-
zarse con respecto a su discreción o continuidad. Puesto cfue la defhlición
Variable Una característica se clasifica como variable si, tal y como se
rigurosamente matemática de las variables discreta y con'ti,nua va IT1ás.allá
observa, se encuentra que ésta toma diferentes valores en diferentes per-
de los límites de este libro, en su lugar se presentan definiciones 'menos for-
sonas, lugares o cosas. Esto se hace por la siinple razón de que la carac-
n1ales y un ejemplÜ para cada una.
terística no es la mis1na cuando se observa en diferentes poseedores de la
Una variable discreta se caracteriza por separaciolles o interrupciones
misn1a. Algunos ejemplos de varitib\es son presión sanguínea diástolica,
en la escalu de valores que puede to,nar. Estas separaciones o interrup-
frecuencia cardiaca, estaturas de adultos varones. peso de niños en edad
ciones indican la ausencia de valores entre los_ distintos valores específi-
preescolar y la edad de los pacientes que ven a un dentista.
cos que la variable puede asumir. Algunos ejemplos ilustran el punto. El
nú1nero de admisiones diarias a un hospital genera! es una variable aleato-
Variables cuantitativas Una variahle cuantitativa es aquella que puede ria discreta puesto que el núrnero de adnlisiones por día debe.representarse
111edirse en fonna usual. Por ejen1plo. se pueden obtener mediciones de la con números enteros tales como O, 1, 2 o 3. El número de admisiones en un
estaturi.l de los varones adultos, del peso Je los niños en edad preescolar y <lla detern1inado no puede ser 1.5, 2. 997 o 3 .3333. El número de caries, pér-
de la edad de los p~u.:ientes que consultan al dentista. Estos son eje111plos de <lidao cc1ídade dienles en niños de escuela primaria es otro ejernplo de varia-
variables c11ant itat i \'as. Las 1ne<l iciones hechas sobre variables c uant itat i- ble discreta.
v as con llevan infonnación respecto a cantidad.
1
\ ariahlc aleatoria continua Una variable ale(ltoria continua 110 posee
t
Variables cualitativas Algunas características no pueden ser medidas las separaciones o interrupciones cípicc.1s en lllla variable aleatoria dis-
t como laest<.ltur1.1, peso y edad. Muchas de el las sólo se pueden clasificar, por creta. U na variable aleatoria continua puede toinar cualquier valor dentro
! ejemplo, cuando a una persona 1nuy enfern1a se le da un diagnóstico médi- de un intervalo especificado de valores. Entre los ejemplos de variables con-
co o cuando se afinnaque alguien pertenece a un grupo étnico dado, o bien. tinuas se encuentran las variadas 1nediciones que pueUen hi.tcc:rse en indi-
r se dice que una persona, lugar o cosa posee o no alguna característica de viduos, coino su estatura, peso y circun ferenciacraneana. Sin i tnport.'.lr cuán
r interés. En tales casos la rnedición consiste en unaclasi ficación. Y las varia- cerca estén las estaturas Je dos personas, teórican1ente siernpre es posible
! bles a las que uno se refiere se llaman i·ariablescualiuaivas. La.s mediciones encontr1.1r otra persona cuya estatura se encuentre entre las dos estaturas de
hechas sobre este tipo de variables contienen inforrnación respecto a los referencia.
' atributos. Sin embargo, las observac_iones sobre variables que son inherentemente
Aunque en el caso de las variables cualitativas las n1ediciones no se lle- continuas, debido a las limitaciones de los instrumentos de 1nedición dis-
} van a cabo en el sentido usual de la palabra, se puede contar el núlnero de ponibles, se registran co1no si fueran discretas. La estatura, por ejemplo,
personc1s, lugares o cosas pertenecientes a varias categorías. El a<l1ninistrador norrnalinente se redondea h¿lcia el cur1rto, n1edia o pulgada con1p]eta más
r de un hospital, por ejen1plo, puede contar el nún1ero de pacientes interna- cercanos, considerando que esa tnedición puede hacerse tan precisa como
• dos durante un día, con base en cada uno de los diagnósticos de a<llnisión.
'1
se desee al utilizar un instrumento de medición exacta .
lii r
Organización e integración de datos Co,nputadoras y a11á/isis bioestadístico 21
20
Población. Las personas habitualmente piensan que una población es una El predominio actual de las computadoras y l_adisponibilidad de gran
colección de entidades, generalmente personas. Sin embargo, una pobla- cantidad de programas de software para estadística han revolucionado
ción o colección de entidades puede estar compuesta de animales, plantas el cálculo estadístico. El lector interesado en buscar paquetes de soft-
o células: Para propósitos de este libro, una población de entidades se define ware estadístico encontrará muy útil el libro de Woodward et al. 1 En este
conio [á·./1iayor colección de entidades de interés en un nioniento particu- libro se describen aproximadamente 140 paquetes. Cada descripción con-
lar. Si ·se torna la medición de alguna variable con base en cada una de las tiene información detallada del hardware y de los requerimientos adi-
entidades en una población, se obtiene una población de valores para esa cionales de software, información acerca del precio y li;!. formade obten-
variable. Por lo tanto, una población de valores se puede definir corno la ción, documentación disponible, asesoría por vía telefQnica, funciones
,nayor colección de valores para la variable aleatoria, los cuales son de estadísticas, capacidad de elaboración de gráficas y títulos de reseñas
interés en un moniento particular. Por ejemplo, si se tiene interés en cono- publicadas. El artículo de Carpen ter et al. 2 también es muy útil para ele-
cer el peso de todos los niños inscritos en el sistema de educación primaria gir programas de software estadístico. Los autores proponen y d_efinen
del estado, la población está formada por todos esos pesos. Si se tiene interés características comparativas importantes para elegir un paquete.. Tam-
sólo en el peso de los estudiantes inscritos en el primer grado, se tiene una bién describen las características generales de los requerimientos.de hard-
población diferente, compuesta por los pesos de los estudiantes de primer ware y del sistema operativo, documentación, facilidad de uso y opciqn_es
grado. Por tanto, las poblaciones se determinan o definen con base en el cam- estadísticas que probablemente se espera encontrar. En el artícu'lo se exa-
po de interés. Las poblaciones pueden ser finitas o infinitas. Si una pobla- minan y comparan 24 paquetes. El artículo de Berk 3 está enfocad~ tiácia
ción de valores consiste de un número fijo de esos valores, se dice que la aspectos importantes del software estadístico para microcomputadoras:
población es finita. Si, por otra parte, una población consiste de una suce- documentación, lenguaje de control, entrada de datos, listado y edición,
sión ir.finita de valores, entonces es una población infinita. gráficas, manejo de datos, procedimientos estadísticos, salidas, co-
mercialización, ambiente del sistema y asesoría. El interés principal de
Muestra Una muestra puede definirse sin1plemente como una parte de una Berk es encontrar un paquete que favorezca una buena práctica estadís-
población. Al suponer que una población se con1porie de los pesos de todos tica. Una persona que utiliza por primera vez una computadora encon-
los niños inscritos al Sistema de educación primaria del estado y se escoge trará muy útil el artículo de conceptos básicos de complltación escrito
para el análisis sólo cierto número de los pesos, entonces se tiene única- por Sadler. 4 Las reseñas acerca del software estadístico disponible ipare-
mente una parte de la población (de pesos), es decir, se tiene una ,nuestra. cen con frecuencia de The American Statistician, publicación cuatrimes-
Existen muchas clases de mÚestras que pueden escogerse de entre una pobla- tral de la Asociación Estadística de los Estados Unidos (American Sta-
ción y que se estudian en los siguientes capítulos. tistical Association ).
La utilidad de la computadora en las ciencias de la salud no se limita al
aná1isis estadístico. El lector interesado en aprender más acerca del uso de
1.3 COMPUTADORAS Y ANÁLISIS BIOESTADÍSTICO, _ __ la computadora en biología, medicina y otras ciencias de la salud, encon-
trará de mucha ayuda los libros de Krasnoff ,5 Ledley, 6 Lindberg 7 Sterling
La difusión relativamente reciente de luso de la computadora ha tenido un yPolack8 y Taylor. 9
gran impacto, particularmente en el análisis bioestadístico y, en general, en Los avances actuales en el uso de computadoras en biología, medicina
investigaciones de ciencias de la salud: La necesidad de efectuar un gran y campos afines son reseñados en varias publicaciones especializadas. Algu-
número de cálculos aritméticos como parte del análisis estadístico de los nas de ellas son Computers in Biology and Medicine, Computer and Bio-
datos sólo vive en el recuerdo de aquellos investigadores y practicantes niedical Research, lnternational Journal o/ Bio-Medical Computer, Com-
cuyas caíreras son anteriores a la llamátlá. "revolución de las computado- puter Methods and Progranis in Biomedicine, Computer and Medicine,
ras". Las computadoras pueden ejécutattálculos más'rápídos y mucho más Computer in Healthcare y Coniputer in Nursing.
precisos de lo que puede un técnícci·human·o. El -uso de las computadoras Las impresiones por computadora se utilizan en todo el libro para mc:>strar
hace poSible que los investigadores ded'ié¡uen más tiempo a mejorar la cali- el uso de las computadoras en el análisis bioestadístico. Para este propósi-
dad de los datos originales y a la interpretación de resultados. to Se utilizó el paquete de software estadístico MINITAB para computado-
•i
."
22 Organivu:ión e integración de datos A"eglD ordenado .23

ra personal. En el Apéndice I, al final del libro, sepresentaunalistadealgunos valores ele una colección (población o muestra) ordenada de mayara menor.
comandoS básicos para el manejo de datos en este paquete. Si la cantidad de mediciones a ordenar es de un tamaño considerable, entonces
el uso de la computadora para preparar el. arreglo ordenado es altamente
deseable.
1.4 ARREGLO ORDENADO _ _ _ _ _ _ _ _ _ _ __
Ejemplo 1.4.1 La tabla 1.4.1 muestra unalistade-lasedade& de los pacientes
Cuando se tornan las mediciones de una variable aleatoria sobre los ele- admitidos en un hospital de enfermedades cróniCas durante un mes. La tabla
mentos de una población, los valores resultantes normalmente llegan al refleja el orden en el que los-pacientes fueron admitidos. · ·· · ·, ~' ·
investigador o estadístico como una masa de datos desordenados. A menos Como puede observarse, se requiere una búsqueda considerable para
que el número de observaciones sea muy pequeño, no es muy probable que obtener información tan elemental como la edad del paciente más joven y
esos datos proporcionen mucha información hasta que sean clasificados en la del más viejo.
algún orden. El primer paso para la organización de estos datos es la pre-
paración de un arreglo ordenado. Un arreglo ordenado es un listado de los Tabla 1.4.2. Arreglo
Tabla 1.4.1. Edades (en años) de pacientes admitidos en un hospital
ordenado de las edades de
pacientes admitidos en un
ljj,
.
I
para enfernledades crónicas durante cierto mes.
hospital para enfermedades
Número Edad Nll;,,.ero Edad Número Edad Número Edad crónicas durante cierto mes.
ll
1
1 !O 26 48 51 63 76 53 14 37 58
22 52 53 77 33 Í¡
2 27 39 1 15 39 60
!1
3 24 28 6 53 88 78 3 2 16 40 61
4 42 29 72 54 48 79 85 2 17 42 61
5 37 30 14 55 52 80 8 2 18 42 63
6 77 31 36 56 87 81 51 3 21 46 63
7 89 32 69 57 71 82 60 5 22 46 69
8 85 33 40 58 51 83 58 5 22 48 69
9 28 34 61 59 52 84 9 6 22 48 70
!O 63 35 12 60 33 85 14 6 24 48 71
11 9 36 21 61 46 86 74 6 24 49 72
12 10 37 54 62 33 87 24 7 25 51 74
13 7 38 53 63 85 88 87 7 27 51 76
14 51 39 58 64 22 89 7 7 27 51 77
15 2 40 32 65 5 90 81 7 28 52 81
16 1 41 27 66 87 '91 30 7 28 52 81
17 52 42 33 67 28 92 76 8 29 52 85
18 7 43 1 68 2 93 7 9 30 53 85
19 48 44 25 69 85 94 6 9 32 53 85
20 54 45 22 70 61 95 27 10 . 32 53 85
21 32 46 6 71 16 96 18 10 33 53 87
22 29 47 81 .72 42 97 17 10 33 54 87
23 2 48 11 73 69 98 53 11 33 54 87
24 15 49 56 74 7 99 70 12 33 56 88
25 46 50 5 75 !O 100 49 14 36 58 89
24 Organización e integración de datos Datos agrupados)' distribució11 de frecuencias 25
Solución La tabla 1.4.2 presenta los mismos datos en forma de arreglo orde- Aquellos que deseen guías más específicas para decidir cuántos in-
nado:ElcorisuJtar la tabla 1.4.2 permite determinar rápidamente la edad del tervalos de clase son necesarios, pueden utilizar la fórmula propuesta por
paciente-más joven, la del paciente más viejo y otros datos que pueden ser Sturges. 10 Esta fórmula se enuncia k = l + 3.322(log n), donde k es el
10
necesarios en un caso de urgencia. número de intervalos de clase y 11 es el número de valores en el conjunto de
Si la organización y cálculos adicionales de los datos se hace manual- datos en observación. La respuesta que se obtiene con la regla de Sturges
mente, el trabajo se facilita al trabajar con el arreglo ordenado. Es innece- no es definitiva y se debe considerar únicamente como una guía. El número
sario preJ)arar el arreglo ordenado si los datos se analizan por computado- de intervalos de clase especificado por la regla deberá incrementarse o dis-
ra, a menos que se requiera para propósitos de referencia o para algúl). otro minuirse por conveniencia y para lograr una presentación más clara.
uso. La computadora no necesita construir ningún arreglo ordenado antes Por ejemplo, supóngase que una muestra tiene 275 observaciones que
deformar la distribución de frecuencias y efectuar otros análisis-de datos. se quieren agrupar. El logaritmo base 10de275 es2.4393.Con la aplicación
=
de la fórmula de Sturges se obtiene k = 1 + 3.322(2.4393) 9. En la prácti-
ca, otras consideraciones pueden sugerir el uso de 8 o menos, o quizás I Oo
1.5 DATOS AGRUPADOS Y DISTRIBUCIÓN DE FRECUENCIAS más intervalos de clase.
Otra pregunta que se debe responder se refiere a la dimensión del inter-
Aunque un conjunto de observaciones puede hacerse más comprensible y valo de clase. Aunque algunas veces es imposible determinar esto último,
más significativo por medio de un arreglo ordenado, es más útil el resumen los intervalos de clase generalmente tienen la misma dimensión. Ésta se
que se obtiene mediante la agrupación de datos. Antes de la era de las com- determina mediante la división de la amplitud entre k, que es el número de
putadoras, uno de los principales objetivos de la agrupación de grandes con- intervalos de clase. Simb5licamente, la dimensión de los intervalos de clase
juntos de datos era el de facilitar el cálculo de varias medidas descriptivas, esta dada por
como porcentajes y promedios. Debido a que las computadoras pueden eje-
cutar esos cálculos sobre-grandes conjuntos sin agrupación previa, actual- R
mente el propósito principal de ello es el de resumir la información. Uno w=-¡; (J.5.1)
debe tener en mente que los datos contienen información y que el resumen
es una fonna sencilla para determinar su naturaleza. donde R (la amplitud) es la diferencia entre la observación más pequeña y
Al agrupar un conjunto de observaciones se debe seleccionar un con- la más grande dentro del conjunto de datos. Generalmente, este procedi-
junto de intervalos contiguos que no se traslapen, para que cada valor en el miento deja una dimensión que no es conveniente para su uso y nuevamente
conjunto de observaciones pueda ser puesto en uno y sólo uno de los inter- se debe utilizar el sentido común para elegir la dimcnsión(normalmente cer-
valos. Estos intervalos nof111almente se identifican como intervalos de clase. cana a la que se obtiene con la ecuación 1.5. l) que sea más conveniente.
Una de las primeras consideraciones cuando se agrupan datos es la de
cuántos intervalos se deben incluir. Resulta inadecuado incluir demasiado Ejemplo 1.5.J La tabla 1.5.1 muestra los pesos en onzas de los tumores
pocos intervalos, porque se perdería información. Por otro lado, si se uti- malignos extirpados del abdomen de 57 pacientes. Se pretende conocer cuán-
lizan muchos intervalos, el objetivo de r~sumir no se consigue. La mejor tos intervalos de clase se deben usar para la dis.tribuéión de frecuencia de
guía en este caso, así como para otras decisiones tomadas con base en datos los datos. También se pretende conocer la dimensión de los intervalos.
agrupados, es el conocimiento de los datos. Puede ser que los intervalos de
clase queden determinadó's por los precedentes, corno en el caso de las tabu-
Solución Para dar una idea del número de intervalos a utilizar, la aplicación
laciones anuales, en las que los intervalos de clase de los años anteriores se de la regla de Sturges indica:
conservan para propósitoS compar'ativos'. Una regla empírica habitualmente
seguida establece que deben ser entre sei's y 15 i'n~e'rvalos. Si hay menos de
seis intervalos, los datos s_e han tesumido en ex'ceso y la información que
k = l + 3.322(log57)
contienen se pierde. Si hay' más d~ 15 intervalos, los datos no fueron resumi- + 3.322( l. 7559)
dos lo suficiente. ''
=7
26 Organización e integración de datos Datos agrupados y distribución de frecuencias 27
Tabla 1.5.l. Pesos en
onzas de tumores malignos Puede observarse que hay siete de esos intervalos, es decir, el núrñero
retirados del abdomen de de intervalos calculados con la regla de Sturges.
57 pacientes. Existen otras reglas empíricas que son muy útiles para determinar el
-- número de intervalos de clase. Cuando la naturaleza de los datos lo permite,
68 65 12 22
63 las dimensiones de 5, 1O y otras que sean múltiplos de 1O, hacen que los
43 32 43
42 25
resúmenes tengan un mayor alcance. Cuando se utilizan estas dimens¡-ones,
49 27
27 74 38
es recomendable que el límite inferior de cada intervalq· termine· en O o en
49
30 51 42 5. Normalmente, lOs intervalos de clase se ordenan de menor a mayor, es
28
36 36 27 23 decir, el primer intervalo de clase contiene las mediciones más pequeñas y
28 42 31 19 el último contiene las mediciones más grandes. Cuando éste es el caso, el
32 28 50 46 límite inferior del primer intervalo de clase debe ser menor o igual a la me-
79 31 38 30 dición más pequeña del conjunto de datos y el límite superior debe ser ma-
27 28 21 43 yor o igual a la medición más grande.
22. 25 16 49 Aunque los paquetes de software para microcomputadora contienen ru-
23 45 24 12 tinas para construir los intervalos de clase, frecuentemente requieren que el
24 12 69 usuario registre la dimensión del intervalo y el número de intervalos desea-
25 57 47
44
dos. Para determinar el número de valores que caen dentro de cada interva-
51 23
lo de clase, simplemente se buscan los valores uno por uno y se marcan a un
lado del.intervalo correspondiente. En la tabla 1.5 .2 se muestra este proce-
dimiento.
Una tabla de este tipo se conoce como distribución de fr:ecuencias. En
Ahora, al dividir la amplitud entre 7 para dar una idea de la dimensión ella se muestra cómo se distribuyen los valores dentro de los intervalos de
de los intervalos de clase, se obtiene: clase especificados. Al consultarla, es posible determinar la frecuencia'';
de ocurrencia de los valores dentro de cualqulera de los interValos.
En ocasiones, esto puede ser de utilidad para conocer la proporción, en
!!_ = 79 - 12 = 57 = lugar del número de valores que caen dentro de un intervalo de clase en par-
k 7 7 9.6

Es evidente que un intervalo de clase con una dimensión de 1O sea más


conveniente y significativo para el lector. En este punto es posible construir Tabla 1.5.2. Distribución de tfecuencias de los
los intervalos. Puesto que el valor más pequeño en la tabla 1.5.1 es 12 y el pesos (en onzas) de tumores malignos retirados
mayor es 79, entonces los intervalos inician con 10 y terminan con 79. Se del abdomen de 57 pacientes.
obtienen los siguientes intervalos: Intervalos de clase Frecuencia
10-19 Jllt 5
10-19
20-29 Jllt JlltJ/1( //// 19
20-29 30-39 J/1( Jllt 10
30-39 40-49 J/1(JH( //! 13
40-49 50-59 //// 4
50-59 60--09 //!! 4
60-69 70-79 // 2
70-79 - .:¡
Total 57 1 '

'" 'i
r' 28 Organización e integració11 de datos Daios agrupados y distribución de frecuencias 29
11 !
'' ticular. Esta información se obtiene dividiendo el número de valores en un Frecuencia
intervalo de clase particular entre el número total de yalores. Si en el ejem- 20~
plo anterior se pretende conocer la proporción.de valores entre 30 y 39, iriclu- (

sive, se divide 10 entre 57, para obtener .18. Esto indica que 1Ode 57, o 10/ 57, 181-

o.-18.:de tOs valores caen entre30 y ·39_ Y al multiplicar. 18por100 se obtiene


el paréentaje de valores entre 30 y 39. Con lo anterior se puede decir que el 16 ([ ~: '.)
! ..-
18 por ciento de los 57 valores están enLre 30 y 39. Finalmente, se identifi-
14
ca la proporción de valores que caen dentro un intervalo de clase como la
frecuencia relativa de ocurrencias en ese intervalo.
Para determinar la frecuencia de valores que caen dentro de dos o más
1, ,::·
intervalos de e Jase, se obtiene la suma del número de valores que caen den- JO
tro de los intervalos de clase correspondientes. Análogamente, si se pre- ';1ir,
tende conocer la frecuencia relativade ocurrencia de valores que caen den- J. :, .-1 ·.-l'l-j-jj e
8
tro de dos o más intervalos de clase, entonces, se suman las frecuencias ,:.;,¡ :
relativas respectivas. Se pueden sumar, o acumular, las frecuencias y las fre- '\.;, '.,-¡ ,_.:,";, -.
6
cuencias relativas y facilitar la obtención de información acerca de las
frecuencias o frecuencias relativas de dos o más intervalos de clase conti-
guos. La tabla 1.5.3 muestra los datos de la tabla 1.5.2 con las frecuencias
4
..
acumuladas,frecuencias relativas y frecuencias relativas acunzuladas.
Si el interés está centrado en la frecuencia relativa de los valores que
caen entre 40 y 69, entonces se utiliza la columna de las frecuencias relati-
º'
9.5
29.5
,¡t N\1f, jj; '.~~
495 .
.
_, ... ,,;,;:!,
69.5
'
vas acumuladas de la tabla 1.5.3 y se resta .5964de .9649 para obtener .3685. 19.5 39.5 59.5 79.5
X
El histograma Es posible p"résentaruna distribución de frecuencias ( o una Figura 1.5.1 Histograma de pesos (en onzas) de los·tumores malignos
distribució:n de frecuencias relativas) gráficamente en forma de un his- extirpados del abdomen de 57 pacientes.
togranta, coffio s~ rnuéstra en: la figura 1.5 .1. Para construir un histograma,
los valores de la variable respectiva se ponen sobre el eje horizontal, y las Tabla 1.5.4. Datos de la tabla I .5.2. que
muestran los límites de clase reales.
Tabla 1.5.3. Distribuciones de frecuencia, frecuencia acumulada, frecuencia Lí111ite de clase reales Frecuencia
relativa y frecuencia 8.cumu]ada relativa de los datos del ejemplo l .5.1.
9.5-19.5 5
Frecuencia 19
Intervalos Frecuencia Frecuencia 19.5-29.5
acumulada 29.5-39.5 10.
de clase Frecuencia acumulada relativa relativa
39.5-49.5 13
10-19 5 5 .0877 .0877 49.5-59.5 4
20-29 19 24 .3333 .4210 59.5-69.5 - 4
30-39 10 34 .1754 .5964 69.5-79.5 2
40-49 13 47. .2281 .8245 j
50-59 4 51 .p702 .8947
60-{;9 4 .9649
1 frecuencias ( o frecuencias relativas, si así se quiere) de ocurren_cia en el eje
55 .0702
70-79 2 57 .0351 LOOOO vertical. Sobre cada intervalo de clase, arr¡badel eje horizontal, se levanta
1
una barra rectangular, o celda, como algunas veces se le nombra, hasta que
Total 57 LOOOO ¡ intercepte con la frecuencia respectiva; Las hartas del histograma deben ser
'1
30 Organización e integración de datos Datos agrupados y distribución de frecuencias 31
adyacentes y es necesario tornaren cuenta los límites correctos de los inter- porción de una subárea particular con. respecto al área total del histograma
valos de clase para.prevenir una separación de barras en la gráfica. es igual a la frecuencia relativa de ocurrenciá de valores entre los puntos
El nivel de precisión que se observa en los datos obtenidos y que tjenen corresponPientes sobre el eje horizontal.
mediciolles sobre una escala continua indica algún orden de redondeo. El 11
orden de iedondeo refleja la preferencia personal del informante o las limi- Análisis por computadora Muchos paquetes de software para computa-
taciones de los instrumentos de medición empleados. Cuando una distri- dora contienen programas para la construcción de histogramas .. U no de estos
bución de frecuencia se construye a partir de los datos, los límites de los paquetes es el MINITAB. La figura 1.5.2 muestra el histograIIlaconstruido
intervalos de clase frecuentemente reflejan el grado de precisión de los da- mediante el programa MINITAB, con los datos del ejemplo'l .5.1.
tos originales. Esto mismo se ha efectuado en el ejemplo. Sin embargo, se Después de que los datos han sido registrados en la corµ'(}utadora pre-
sabe que algunos de los valores que caen, por ejemplo, dentro del segun- viamente programada, ésta construye el histograma con un primer punto
do intervalo de clase, probablemente serán menores que 20 mientras que medio igual a 14.5 y una amplitud de intervalo de 10. Con los datos alma-
otros serán'mayores que 29 cuando la medición es precisa. Al considerar cenados en la columna 1, los comandos del programa MINITAB son los si- 1
1
la continuidad implícita de la variable, y suponiendo que los datos fueron guientes:

redondeados al entero positivo menor más próximo, entonces es lógico 1
suponer que 19 .5 y 29.5 son los límites correctos para este segundo interva- BISTOGRA.M C1;
lo. Los límites correctos para cada intervalo de clase se toman corno se mues- INCREl!IENT 10;
tra en la tabla 1.5.4. . · START .AT J.ll.5 •
. Si se elabora una gráfica utilizando estos límites de clase como la base
de los rectángulos, no habrá separaciones y se obtendrá el histograma mostra-
do en la figura 1.5.1. El polígono de frecuencia Una distribución de frecuencia también puede
Nótese que cada u nade las observ:aciones se ubica en una unidad de área ser mostrada gráficamente por medio de un polígono de frecuencia. Para
del histograma. Puesto que se tienen 57 observaciones, el histograma con- dibujar este polígono, primero se hace una marca arriba del punto medí o de
tiene un total de 57 unidades. Cada barra contiene una porción del área total, cada intervalo de clase, representado sobre el eje horizontal de la gráfica,
dependiendo de la frecuencia. La segunda barra, por ejemplo, contiene 19/57 como se muestra en la figura 1.5. l. La altura con respecto del eje horizon-
del área. Por tanto, ésta es la frecuencia relativa de ocurrencia de valores tal de una marca dada corresponde a la frecuencia del intervalo de clase. Al
entre 19.5 y 29 .5. A partir de esto se observa que las subáreas del histogra- unir las marcas mediante líneas rectas se obtiene el polígono de frecuencia.
ma definidas por las barras corresponden con las frecuencias de ocurrencia La figura 1.5.3 muestra el polígono de frecuencia para los datos del ejem-
de valores entre los límites dé la escala horizontal de las áreas. La pro- plo 1.5.l.
Nótese que el polígono cae sobre el eje horizontal en los puntos que
corresponderían a la marca en caso de haber celdas adicionales en cada
extremo del histograma correspondiente. E,sto permite que el área total sea
Midpoint Count delimitada. El área total bajo el polígono de frecuencia es igual al área bajo
14.5 s ***** el histograma. La figura 1.5.4 muestra el polígono de frecuencia de la figu-
24.5 19 ******************* ra 1.5.3 sobrepuesta al histograma de la figura 1.5.1. Esta figura permite
34.5 10 ********** observar la relación entre las dos formas gráficas para un mismo conjunto
44.5 13 ************* de datos.
54.5 4 ****
64.5 4 ****
74.5 2 •• 1' Despliegues de tallo y hojas Otro sistema gráfico muy útil para represen-
tar conjuntos de datos cuan ti tati vos re \ati vamente pequeños es el despliegue
Figura 1.5.2 Histograma construido con computadora y el paquete de software 1 de tallo y hojas. Un despliegue de esta naturaleza presenta una fuerte simili-
MINI~AB ~sancto los datos del ejemplo 1.5.1. tud con el histogran1a y tiene el mismo propósito. Un despliegue construi-
¡¡
32 Organización e integración de datos Datos ágrupados y distribución de frecuencias 33
1 20 20
'1
! • 1
18 18f- 1 1

16
f~11
1
1
16f- 1 1
1 1
14 1
14 f- 1
I'
1 1
12 1
12 1
1
i 1 1
'º tt
¡ 'º
1
1 >--
1
1 1
B
l
¡
B
1
1
1
1 1
1 1
• •
1
1
1
1
1
1
1
1
1
r- -1 1 1
1
4

2
I 4
1
1
1
1
1
1
1
1
1
1
1
t--
1
1
1
2 1 1
1
1
1
1
1
i r-"'1
1 1 1
o 9.5 29.5 49.5 69.5 o
19.5 39.5 59.5 79.5 9.5 29.5 49.5 69.5
19.5 39.5 59.5 79.5
Figura J.5.3 Polígono de frecuencia. Pesos en onzas de tu1nores malignos
Figura 1.5.4 Polígono de frecuencias y el histograma del ejemplo t .5.-1.
¡
,. extirpados del abdomen de 57 pacientes.
11 a la derecha de sus respectivos tallos. Cuando las hojas se forman con más de
do correctamente, al igual que un histograma, proporciona información un dígito, todos los dígitos después del primero se pueden borrar. Los deci-
'¡.
11
respecto a la variación del c·onjunto de datos, muestra-la ubicación de lama- males, cuando ocurren en los datos originales, se omiten enel despliegue. Los
yor concentración de mediciones y revela la presencia o ausencia de simetría. tallos·se·separan de sus hojas mediante una linea vertical. Así, se obsérvaque
Una ventaja del despliegue de tallo y hojas sobre el histograma es que preser, un despliegue también es un arreglo ordenado de los datos:
1
1
va la información contenida en las mediciones individuales. Tal informa- Los despliegues de tallo y-hojas son más eficientes en conjuntos de da tos
' ción se pierde·cuando las mediciones son asignadas a los intervalos de clase relativamente pequeños. Como una norma, no es aconsejable utilizarlos en
del histograma. Otra -ventaja adicional del despliegue es el hecho de que informes anuales o en otros medios de difusión para e1 público en general.
pµede construirse durante eliproceso de marcaje, de tal forma que el paso Son una ayuda básica para que investigadores y tomadores de decisiones
intermedio (la preparación de un,arreglo ordenado) es eliminado .. comprendan la naturaleza dé sus datos. Los histogramas son más adecua-
Para construir un despliegue se divide cada medición en dos partes. La dos para las publicaciones de circulación externa. El siguiente ejemplo ilus-
primera se llama tallo, y la seg_unda parte se llama hojas. El tallo se forma con tra la construcción del despliegu~ de tallo y hojas.
uno o niás dígitos iniciales de la medición, y las hojas se forman con.Jos dígi-
tos restantes. Todos los números divididos se muestran en un solo despliegue; Ejemplo 1.5.2 Utilizar los datos del peso de tumores mostrados en la tabla
los tallos forman una columna ordenada de menor a mayor. En·Jacolumna de 1.5 .1 para construir un despliegue de tallo y hojas.
tallos se·incluyen todos aquellos que·se encuentren dentro de la·variedad
de los datos, aún cuando una medición co·n ese tallo no esté en el cOnjllnto de Solución Puesto qu·e todas 13.s mediciones son.números de dos· dígito':i:;, se
datos. Los renglones dél despliegue contienen las hojas ordenadas y listadas tienen tallos ·y hojas de, un dígito cada unó. Por 'ejemplo, ·1a mediCió.n tiene
·. -, ·,-'-\'·,,,

'II
Organización e integración de datos ~jercicios
34
en la de arriba. El número 48 sobre la quinta línea indica que hay 48 ob"sért
Ste-m. Leaf vaciones en esa línea y en todas las de·abajo. Elnúmeroentíe paréntesis dice
1 ; 2 2 2 6 9 que hay 10 observaciones en esa línea. Los paréntesis illdican Já"tínea que
2 1 2 2 3 3 3 4 4 5 5 5 7 7 7 7 6 6 6 ,6
oo1 1 2 2 6 6 6 6 contie!]e la observación central si el número total de observaciones es impar,
3
4 2 2 2 3 3 3 4 5 6 7 9 9 9 o las dos observaciones centrales si el nú1nero total de observaciones es par.
5 o1 1 7
6 3 5 6 9 EJERCICIOS
7 4 9
1.5.1 Nivel de glucosa diluida en la sangre de 100 niños:
Figura 1.5.5 Despliegue de tallo y hojas para los datos del peso de tumores de ia
56 61 57 77 62 75 63 55 64 60
tabla 1.5.l.
un tallo de 6 y una hoja de 8. La figura 1.5.5 muestra el despliegue de tallo
60 57 61 57 67 62 69 67 68 59
65 , 72 65 61 68 73 65 62 75 80
y hojas para los datos. 66 61 69 76 72 57 75 68 81 64
El paquete de software estadístico MINlTAB se puede utilizar para cons- 69 64 66 65 65 76 65 58 65 64
truirestos despliegues. La figura 1.5.6 muestra el despliegue construido por 68 71 72 58 73 55 73 79 81 56
este paquete. Los datos provienen de la tabla 1.4.1. C.on los datos en la colum- 65 60 65 80 66 80 68 55 66 .. n
na l, los comandos MINITAB son los siguientes: 72 73 73 75 75 74 66 68 73 65
73 74 , 68 59 69 55 67 65 67 63
67 56 67 62 65 75 62 63 63 59
STEM AND LEAf C1;
INCREltENT l.O.
Elaborar:
a) Una distribución de Frecuencias.
b) Una distribución úe frecuencias relativas.
El subcomando increment específica la distancia desde el primer tallo
e) Un histograma. d) Un polígono de frecuencia.
hasta el siguiente. Los números en la primera columna de la izquierda en la
figura 1.5.6 proporcionan la información respecto al número de observa-
ciones (hojas) en una línea dada por encima de ella, o el número de·obser-
Niño Puntaje Niiio Pu11taje Nitlo Puntaje Ni,lo P"untaje
vaciones en esa línea y en la de abajo. Por ejemplo, el número 30 sobre la
segunda línea indica que hay 30 observaciones (u hojas) sobre esa línea y 1 114 16 90 31 137 46 118
2 115 17 89 32 120 47 110
.·5tem-and-leaf of ages N = 100 3 113 18 106 33 138 48 108
Leaf Unit = 1.0 4 112 19 104 34 111 49 134
19 o 1122235566677777899 5 113 20 126 35 100 50 118
30 1 00012445676 6 132 21 127 36 116 51 114
42 2 122244577869 7 130 22 115 37 101 52 142
(10) 3 0223333679 8 128 23 116 38 111 53 120
46 4 022668869 9 122 24 109 39 110 54 119
39 5 111222333344666 10 121 25 108 40 137 55 143
24 6 0113399 11 126 26 122 41 119 56 133
17 7 012467 57 85
12 117 27 123 42 115
11 6 11555577769
13 115 28 149 43 83 58 117
Figura 1.5.6 Despliegue de tallo y hojas preparado mediante el programa MINITAB 14 88 29 140 44 109 59 147
·a partir de los da"tos de edades de pacientes registrados eri la tabla l.4. ~. 15 113 30 121 45 117 60 102
:'·~
l!I"
36 Organización e integración de datos
Ejercicios 37
1.5.2 Utilizarclos datos de la labia 1.4.1 para elaborar: Construir a partir de estos datos:
._ a) 1,.Jnll; distribución de frecuencias. a) Una distribución de frecuencias.
1, ,, [J) Una distribución de frecuencias relativas. b) Una distribución de frecuencias relativas.
',
C) ·.un ~istograma. á) Un polígono de frecuencia. e) Un histogran1a. d) Un polígono de frecuencia.
1
I.5.3 Los pqntajes indicados en la tabla de la partebajadela página anterior proce- 1.5.5 La siguiente tabla muestra el número de horas de sueño de 45 pacientes de
den de un exan1en de inteligencia aplicado a un grupo de niños que participó un hospital como consecuencia de la administración de cierto anestésico.
en un experimento.
7 ID 12 4 8 7 3 8 5
Construir:
12 11 3 8 1 1 13 10 4
a) Una distribución de frecuencias.
4 5 5 8 7 7 3 2 3
b) U!ia distribución ¡;le frecuencias relativas.
8 13 1 7 17 3 4 5 5
e) U:n histograma. á) Un polígono de frecuencia.
3 1 17 10 4 7 7 11 8
1.5.4 Se tenla y cinco empleados de un hospital general fueron invitados a realizar
cierta tarea. Se registró el tiempo requerido por cada empleado para termi- Construir a partir de estos datós:
nar la tarea y los resultados son los que se muestran enseguida a) Una distribución de frecuencias.
b) Una distribución de frecuencias relativas.
e) Un histograma. d) Un polígono de frecuencia.
' En1pleado Tienipo E111pleado Tie,npo Enipleado Tien1po
i 1 1.3 26 2,2 51 3.2
1.5.6 Los siguientes datos corresponden al número de niños que nacieron durante
un año, en 60 hospitales comunilarios;
2 1.5 27 2,3 52 3.0
1 3 1.4 28 2.6 53 3A 30 55 27 45 S6 48 45 49 32 57 41 56
4 1.5 29 2.8 54 3.4 37 55 , 52 34 54 42 32 59 35 46 24 57
5 l. 7 30 2,1 55 3,2 32 26 40 28 53 54 29 42 42 54 53 59
11 1
28 50
: i 6 LO 31 2.3 56 4.5 39 56 59 58 49 53 30 53 21 34
I I
7 1.3 32 2.4 57 4,6 52 57 43 46 54 31 22 31 24 24 57 29
(,; '
1
8 1.7 33 2.0 58 4,9
¡', 1
9 1.2 34 2.8 59 4, 1 Construir a partir de eStos datos:
,,1
r,1 1 10 1.8 35 2,2 60 4,6 a) Una distribución de frecuencias. e) Un histograma.
'11 1.1 36 2.5 61 4.2 b) Una distribución de frecuencias relativas.
1111
12 1.0 37 2.9 62, 4,0 1.5.7 En un estudio acerca de los niveles de resistencia física de estudiantes varones
J1 1 13 1.8 38 2.0 63 .4.3 de reciente ingreso a la universidad se registraron JoS punt:ijes indicados en la
14 1.6 39 2.9 64 4.8 tabla de la parte alta de la página siguiente para algunos ·eJercicios de rutina.
15 2.1 40 2.5 65 4.5 Construir a partir de estos datos:
16 2.1 . 41 3,6 66 5.1 a) Una distribución de frecuencias.
ij ¡ 17 2J 42 3.1 67 5.7 b) Una distíibución de frecuencias relativas.
18 2.1 43 3.5 68 5.1 e) Un P.olígono de frecuencia. . d) Un histograma.
¡ 1 19 2.4 44 3.7 69 5.4
il I
.,20 2.9 45 3.7 70 5.7
1.5.8 Las edades indicadas en la tabla de la parte media de la página siguiente co-
rresponden a 30 pacientes atendidos en la sala de urgencias de un hospital un
.[ 21 2.7 46 H 71
72,.
6.7
viernes por la noche. Construir un despliegue de tallo y hojas.con esos datos.
22 2.3 47 3.1 6.8
23 2,8 48 .. 3.5 73 6,6 1.5.9 Los datOs que se indican en la tabla de la parte baja de la página siguiente
.24 2,0 49 3.6 74 6.0 corresponden a los cobros realizados a 25 pacientes en la sala de urgencias de
dos hospitales de la ciudad. Construir un despliegue de tallO y hojas para cada
' '
25
.,
2,7 50 3.5 75 6.1
1
¡.
conjuntO de datos.¿ Qué es lo que sugiere lacom.paración de Íos dos despliegues
para los dos hospitales? '·

, __ 'r --~~-·--·-· -·
Medidas de tendencia central 39
38 Organización e integraci6n de datos
1
1.6 MEDIDAS DE TENDENCIA CENTRAL
254 281 192 260 212 179 225 179 181 149 '·'
Aunque las distribuciones de frecuencia sirven f\ propósitos útiles, hay
182 210 235 239 258 166 159 223 186 190
135 233 204 219 211 245 151
muchas situaciones en que.se requiere otro tipo,cte resumen de datos. Lo
180 188 220
151 157 204 238 205 229 191 200 que se necesita, en muchos casos, es la posibilidad.de ··condensar los datos a
198 190
222 18.7 134 193 264 312 214 227 190 212 través de tan sólo unas cuantas medidas descriptivas_ Lás,mediOas descripti-
165 194 206 193 218 198 241 149 164 225 vas se pueden calcular a partir de los datos de una muestraio·de los datos de
265 222 264 249 175 205 252 210 178 159 una población. Para distinguirlas entre sí se tienen las siguientes defini-
220 201 203 172 234 198 173 187 189 237 cienes: 1.
272 195 227 230 168 232 217 249 196 223
232 191 175 236 152 258 155 215 197 210 l. Una medida descriptiva calculada a partir de los datos de una muestra se llama
214 278 252 283 205 184 172 228 193 130 estadística.
218 213 172 159 203 212 117 197 206 198 2. U na medida descriptiva calculada a partir de los datos de uoa población se llawa
169 187 204 180 261 236 217 205 212 218 parámetro.
191 124 199 235 139 231 116 182 243 217
251 206 173 236 215 228 183 204 186 134 Algunos tipos de medidas descriptivas se pu.eden ca}cular a p~ir qe 1

11
188 195 240 163 208 un conjunto de datos. Sin embargo, este capítulo se limita al estudio de las ;!,1'
medidas de tendencia central y de las medidas de disPersión. Las medidas
de tendencia central se consideran en esta sección y las medidas~de disper-
/:
sión en la siguiente.
35
En cada una de las medidas de tendencia central, de las que se discuten
32 21 43 39 60
36 12 54 45 37 53 sólo tres, solamente un valor representativo del conjunto de datos se conside-
1
ra como el representativo del to90. Las medidas de tendencia central conlle-
45
36
22
23
45
38
64
55
35
10
44
56
34
55
45
22
46
57
¡ van información respecto al valor promedio de un conjunto de valores. Tal
como se verá, la palabra promedio se puede definir en diversas fonnas.
Las tres medidas de tendencia central de uso más frecuente son: la
media, la moda y la mediana.

HOSPITAL A La media aritmética La medida de tendencia central más conocida es la


media aritmética. Esta es la medida descriptiva que la mayoría de las per-
249.10 202.50 222.20 . 214.40 205.90 sanas tienen en mente cuando se_ habla de "promedio". El adjetivo "aritméti-
214.30 195. IO 213.30 225.50 191.40 ca" distingue a esta media de otras que se puedan calcular.- Puesto que no se
201.20 239.80 245.70 213.00 238.80
estudian otras medias en este libro, no debe ser causa de confusión si al
171.10 222.00 212.50 201. 70 184.90 [:
248.30
referirse a la media aritmética sólo se dice media. La media se obtiene
209.70 233.90 229.80 217.90
' sumando todos los valores en una población o muestra y se divide entre el
HOSPITAL B número de valores sumados. Para obtener la edad promedio de la población
1. de 100 pacientes registrados en la tabla 1.4.1, se procede de la siguiente
199.50 184.00 173.20 186.00 214.10 l
fonna:
125.50 143.50 190.40 152.00 165.70
154:70 145.30 154.60 190.30 135.40 10 + 22 + ··· + 70 + 49 - 3920 - 39 20
167.70 203.40 186.70 155.30 195.90 edad media = 100 .
100
168.90 166.70 178.60 150.20 212.40
'!i1,

40 Organizo.cWn e integración de datos Medidas de tendencia central 41

Los tres_puntos sobre el .numerador representan valores que no se muestran Observacion Observación
para economizar espacio. · de la población de la muestra
ij' 1
i ·,_,,,'. .Seña conveniente generalizar el procedimiento para obtener la,media Núniero Número Valor
:1 1

li 'j repreSefltar aquel en fórma notacional más compacta. Se inicia por desig- X¡2 x, JO
nar .a ·la variable· aleatoria con la letra mayúscula X. En este ejemplo X re- x,
'lI. X20 54
presenta a la. variable aleatoria de edad. Los valores específicos para una x,. x, 21
variable aleatoria se representan con la letra x. Para referirse al primer, al 33
x62
'•
,,
segundo, al tercer valor y así sucesivamente, se añade un subíndice a la X. x,. 53
Por ejemplo, a partir de la tabla 1.4.1 se tiene:
Supóngase que se tiene disponible una muestra que se compone de las
XJ = 10, X2 = 22, ... , y X100 = 49 siguientes cinco (n = 5) observaciones, provenientes de la tabla 1.4.1. La
sustitución de estos valores en la ecuación 1.6.2 da:
En general, un valor típico para la variable aleatoria se designa con X¡ y el
valor final en una población finita de valores con xN, donde N es el número
de valores en la población. Finalmente se utiliza la letra griega µ para sim- ¿" ,, 10 + 54 + 21 + 33 + 53 171
; ... ¡
bolizar la mediá de la _población. Ahora se puede escribir la fórmula general x 34.2
para_ la media de una población finita como sigue: n 5 5
']'
·¡ N
La media aritmética tiene ciertas propiedades, algunas deseables y otras
11.,
¿ x,
j.., 1
no. Algunas de estas propiedades son las siguientes:
¡¡ µ - -
N (1.6.1)
"ifi l. Es única. Para un conjunto de datos hay una y sólo una media aritmética.
2. Simplicidad. El cálculo y comprensión de la media aritmética son sencillos.
3. Puesto que todos}' cada uno de.IqSvalores en el conjunto de datos entran en el
~l sím?olo LN

_significa q~~ _todos IOs válores para la varia~le se suman dés-


¡,,, 1 .
cálculo· de Ía media, ésta es afectada por cada valor. Por lo tanto, los valores
extremos influyen sobre ia media y en algunos casos pued~n distorsio.narla y
de el primero hasta el último. Este símbolo (Í:) se conoce como signo de llega a ser indeseable coíno medida de tendencia central.
sunzatoria y se utiliza extensamente en este libro. Cuando por el contexto
sea obvio cuálesison lo·s valores que se suman;·1os síinbóios~dé arriba y de A continuación se muestra un ejemplo de cómo los valores extremos
abajo del signo L,se ofniten. pueden afectar la media. Considérese la siguiente situación: 5 médicos
._ Cuando- se:Calcrila lá ·media para una rhueStr"a:· de valores, el procedi- que trabajan en cierta área son llamados a declarar sus gastos al realizar
miento recién descrito'fequiere algunas moHifiCa:·Ciones eÍí la notación. Se cierto procedimiento. Supóngase que se reporta lo siguiente: $35, $35,
utiliza X para identificar a la media de la mu~stta y h pa:ra indicar el número $35.50, $35.50 y $180. El gasto medio para los 5 médicos es de $64.20,
de valores en la muestra. Por lo tanto, larnediadelá muestra se.expresa corno un valor que no es muy representativo para los datos en conjunto. El único
sigue: ,L valor atípico del conjunto tuvo el efecto de inflar la media.
,'

La mediana La mediana de un conjunto finito de valores es aquel valor



¿x, que divide al conjunto en dos partes iguales, de forma que el -número de
f = i=I valores mayor o igual a la median3. es iiuaI 31 número de v~lores menores o
n. (1.6.2) 1 iguales a ésta. Si __el nú~ero de valores .es impar, la mediana. -es el valov
1
\ medio siempre y cúando todas las variables sean arregladas en magnitudes

11
1 .
¡
42 Organización e integración de dalos Ejercicios

de mayor a menor. Cuando el número de valores en el conjunto es par, no


existe un solo valor tnedjo, sino que existen dos valores medios. En tal Número Valor Número Valor
caso, la mediana correspcinde a la-inédia de es.is dos magnitudes. 1 56 6 65
Esto se ejemplifica al encontrar la mediana de los datos contenidos en 2 62 7 65
la tabla 1.4.2. En ella, los valores ya están ordenados, de modo que sólo se 3 63 8 68
requiere encontrar los dos valores medios. Éstos corresponden a las obser- 4 65 9 70
5 65 10 72
vaciones 50 y 51. Tales valores son 36 y 37, y la mediana, por lo tanto, es
(36 + 37) / 2 = 36.5.
Obténgase ahora la mediana para la muestra que contiene· los valores Calcular:
10, 54, 21, 33 y 53. Al ordenar estos datos de menor a mayor se obtendrá la a) La media. b) La mediana.
secuencia 10~ 21, 33, 53 .y 54. Puesto que se trata de un número impar de e) La moda.
valores, la medirula corresponde con el valor medio, es decir, 33.
Entre las propiedades de la mediana se encuentran las siguientes: 1.6.2 Los siguientes datos corresponden al peso post-operatorio de 10 animales
experimentales incluidos en una muestra:
l. Es única. Al igual que en el caso de la media, existe solamente una mediana para
un conjunto de datos. e
2. Simplicidad. Es muy sencillo calcularla.. Número Peso (Kg) Número Peso(Kg)
il!
3. Los valores extremos no tienen efectos importantes sobre la mediana, lo que sí -- '!_

ocurrP: con la media. 13.2 6 14.4 11''


2 15.4 7 13.6 !
La moda La moda de un conjunto de valores es aquel valor que ocurre con 3 13.0 8 15.0
,,
mayor frecuencia. Si todos los valores son diferentes, no hay moda. Por otra 4 16.6 9 14.6 !
parte, un conjunto de valores puede tener más de una moda. Nuevamente, al 5 16.9 10 13.1
observar la tabla 1.4.2, se encuentra que el 7 ocurre cinco veces, siendo el l
que ocurre con máyor frecuencia, correspondiendo entonces a la moda. ~
Calcular:
Para ilustrar un conjunto de valores que tienen más de una moda, con-
a) La media. b) La mediana.
sidérese un laboratorio con diez empleados cuyas edades son: 20, 21, 20,
20, 34, 22, 24, 27, 27 y 27. Se puede decir que estos datos tienen dos modas 1.6.3 Una muestra de 15 pacientes que hicieron una visita inicial al departamento
20 y 27. Una muestra que consista de los valores 10, 21, 33, 53 y 54 no estatal de salud, viajaron las siguientes distancias:
tiene ~oda, puesto que todos los valores son diferentes.
La moda se puede utilizar _para describir datos i;::ualitativos. Por ejem-
plo, supóngase que los pácientes de una clínica de salud mental durante un Distancia Distancia
año dado recibieron uno de los siguientes diagnósticos: retardo mental, sín- Paciente (millas) Paciente (tnillas)
drome cere~ral orgánico, psicosis, neurosis y trastornos. de personalidad. El 5 8 6
diagnóstico que ocurriera con mayor frecuencia en el grupo de pacientes se 2 9 9 13
denominaría diagnóstico modal. 3 11 10 7
4 3 11 3
5 12 12 15
''
EJERCICIOS _ _ _ _ _ _~ - - - - - - - - - -
6 13 13 12 I i
7 12 14 15 1·''
15 5 '1

j
1.6.l Los siguientes datos representan el nivel de glucosa en sangre, en ayunas, de
· una muestra de 10-niños:
.
11
Medidas de dispersiÓIJ 45
44 Organiza,ció1J e integración de datos
los valores son iguales, no hay dispersión, pero si no todos son iguales,
Encontrar: entonces existe dispersión en los dato&:::La ,magnitud de· la dispersión es
a) La distancia media del trayecto recorrido.

l
pequeña cuando los valores, aunque diferentes;, son cercanos entre sí. La
b) La distancia mediana reconida.
figura 1.7 .1 muestra los polígonos de frecuencia .para dos poblaciones que
'i, tienen medias iguales, pero diferente magnitud de.·variabilidad. La pobla-
1.6.4 Una muestra de 11 pacientes admitidos para diagnóstico y evaluación en un
departamento psiquiátrico recién inaugurado en un hospital general experi- ción B, más variable que la población A, es más dispersa. Si los valores
mentó los siguientes tiempos de pennanencia: están ampliamente esparcidos, la dispersión es mayor. Otros téiminos sinó-
nimos al de dispersión, son: variación, expansión y esparcimiento.
Tie1npo de pern1a11e11cia Tien1po de per111anencia
Nú.n1ero (días) Nú1nero (días)
La amplitud Una forma de medir·Ia variación en un conjunto de valores es
calculando la a,nplitud. Ésta es la diferencia entre el valor más·pequeño y el
1 29 6 14 más grande en un conjunto de observaciones. Si se representa la amplitud
il.t
1! !j
2 14 7 28 como R, el valor mayor xl, y el valor menor como xs' la amplitud se calcula
"'
¡I ~
3 11 8 14
como sigue:
l' 4 24 9 18
5 14 10 22
R = XL - Xs (1.7.1)
r:1 11 14
!:l
':)!
í'I
!ji
",J Encontrar: Al utilizar los datos de la tabla 1 .4.2 se tiene:
"'i
li a) El tiempo promedio de permanencia de los paciP.ntes.
b) La mediana. e) La moda.
¡1 R - 89 - 1 - 88
¡:11 1.6.5 A veinte pacientes en el área de convalescencia de un hospital se les dio a
,].
escoger uno de cuatro tipos de carne para el almuerzo. Sus elecciones fueron La utilidad de la amplitud es limitada. El hecho de tomar en consideración
como sigue; pollo, pescado, pescado, hígado, pollo, pollo, pastel de carne, pollo, sólo dos valores· hace que sea una medida pobre de dispersión. Su ventaja
pescado, pastel'de carne, hígado, pescado, pastel de carne, pollo, pollo, po- principal es la simplicidad de su cálculo.
llo, lúgado, pescado, p~tel de carne y pollo. ¿Cuál fue la elección modal?

1.6.6 Los siguientes datos son el número de minutos que requirieron 15 estudiantes
varones de nivel universitario para correr una milla.

5.77 6.86 5.00 7.33 7.67


, 5.48 . 7.24 6.05 7,65 .. 6.75
6.66. 8.31·' ..... 6.43 ff,75 5.73

Calcular a partir de estos d~ltos:


a) La media. b) La, mediana. ., ,,Población B
',
1.7 MEDIDAS DE DISPERSIÓN _ _ _ _ _ _ _ _ _ __ ',
La dispersión de un conjunto de observaciones se refiere a la variedad que "
Figura 1.7.1 Dps dist_ribuc.ioncs de frecuencia con igual media pero diferente
muestran éstas. Úna medida de dispersión conlleva infonnación respecto a canti4~d.pe dispersión.
la cantidad total de variabilidad presente en el conjunto de datos. ~i todos
1
'./
46 Organización e integración de datos Medidas,de dispersi6n 1

La v~riancia Cuando los valores de un conjunto de observaciones se en-


1
cuentran µbicatlos cerca de su media, la dispersión es menor que cuando
,, nL x¡ - ª""L"•
n ( n )'
están.esp~cido~.. -Dado que ello es correcto, se puede pensar intuitiyamente • 1-'- 1 l
que es. posible medir la dispersión en función del esparcimiento alrededor (l.7.3)
n(n - 1)
de. su media. Esta medición se efectúa mediante lo que se conoce corno
varíancia. Para .calcular la variancia. se resta la media de cada uno· de los Cuando se calcula la variancia para una población de .valores, se sigue el
valores· individuales, las diferencias se elevan. al cuadrad() y después se procedimiento descrito arriba, sólo que ahora se divide.entre N y no entre
suman entre sí. Esta suma de desviaciones elevadas al cuadrado de los valo- N - l. Si a 2 representa la variancia de una población finita,.las fórmulas
res con respecto a la media se divide entre el tamaño de la muestra menos I definitoria y de cálculo, respectivamente, son las siguientes:
para obtener la variancia de la muestra. Si la letra s2 sírnboliza la variancia
de la muestra, el procedimiento descrito se expresa como sigue: N

n
L (•, - µ>'
L (x¡ - X)2 cr' ¡ .. ¡

N (I.7.4)
2 i= l
J (I.7.2)
n - 1
N ( N )'
N ;~, x; - i~I x;
El cálculo de la variancia se ilustra con la muestra ya familiar proveniente cr' N·N (1.7.5)
de la tabla 1.4.1.

,, ( 10 - 34.2) 2 + (54 - 34.2)"! + (21 - 34.2) 2 + (33 - 34.2) 2 + (53 - 34.2) 2 La variancia representa unidades al cuadrado, por lo que no eS ufla
s" -
4 medida adecuada de dispersión si se pretende expresar este concepto e"n tér-
minos de las unidades originales. Para obtener la medida de dispersión en
~ -.-
1506.8 = 376.7
unidades originales, simplemente se obtiene la raíz cuadrada de la variancia.
El resultado se llama desviación estándar. En general, la desviación están-
La razón de dividir entre n - _l, en lugar de n, como hubiera de esper:1,lrse, es dar de una muestra se obtiene mediante la siguiente fórmula:
una consideración teórica ·conocida como grados de libertad. En el cálculo
de la variancia, se puede decir que hay n - 1 grados de libertad. El razona-
miento es como sigue: la suma de las desviaciones de los valores individua-
les con respecto de sus medias es igual a cero, hecho que puede demos-
0

trarse. Si se conocen los valores den - 1 de las desviaciones a partir de la


s - • r,
vs-=
yi _;_
,=J __
(x, - ;;)'
n - 1 (1.7.6)

media, entonces se conoce el n-ésimo valor; .:Yª que queda determinado La desviación estándar de una población finita se obtiene con la raíz cuadra-
automática1nente debido a la restricción de· que todos los valores de n su- da de la cantidad resultante de la ecuación 1.7.4.
men cero. Desde un punto de vista práctico, dividir las diferencias al cua-
drado entre n - 1 en lugar de entre n resulta nec"esario por razones del uso El coeficiente de variación La desviación estándar es útil como medida de
de la variancia de la muestra en los procedimientos de inferencia que se variación en un conjunto de datos. Sin embargo, cuando se quiere comparar
estudian posteriormente. El concepto de grados de libertad se discutirá nue- la dispersión de dos conjuntos de datos, la comparación de las dos desvia-
vamente más adelante. Los .estudiantes interesados en .profu~~izar en este ciones estándar puede dar un resultado equivocado. Esto puede ocurrir si las
aspecto pueden consultar el artículo de Walker. 11 . . · dos variables involucradas tienen medidas en diferentes unidades. Por ejem-
Cuando el número de observaciones es muY-gíande, el uso de la ecua- plo: se pretende conocer, para una población dada, si los niveles de coles-
ción 1.7 .2 resulta tediosa. La siguiente fónnula puede ser menos problemá- terol en el suero; medidos en miligramos por cada 100 mi, son más variados
tica, sobre todo cuando se utilizan calculadoras de escritorio· o de bolsillo. que el peso del cuerpo, medido en libras.
~::
48 Organización e integración de datos
Medidas de dispersión
49
Además, aunque se utilice la misma unidad de medición, las dos medias
pueden ser diferentes. Si las desviaciones estándar de los pesos de los niños El coeficiente de variación también es útil para comparar los resulta~
del primer grado son comparados contra las desviaciones estándar de los dos obtenidos por diferentes personas que efectúan investigaciones que
1 .pe~o,<; de los estudiantes de secundaria de reciente ingreso, se encontrará que involucran la misma variable. Debido a que el coeficiente de variación es
esta ·última es numéricamente mayor que la anterior, debido a que los pesos independiente a la escala de medición, constituye una estadística útil para
•rrúsmos son~mayores y no porque la dispersión sea 1nayor. comparar la variabilidad de dos o más variables medidas en ·escalas diferen-
.. ,,;;:Lo que se necesita en situaciones como esta es una medida de variancia tes. Por ejemplo, podría emplearse el coeficiente de vari.ación.para com-
relativa en lugar de una de variancia absoluta. Tal medida la constituye el parar la variabilidad de los pesos de una muestra de sujetos cuyos pesos se
¡: expresan en libras y la variabilidad en peso de otra muestra, ex"presada en
coeficiente de variación, el cual expresa la desviación estándar como un por-
centaje de la media. La fórmula es como sigue: kilogramos. . ,
:1 ,
il {¡ Los paquetes de software para computadora propofcionari' ufla varie-
'!' t
. s dad de posibilidades para el cálculo de las medidas descriptivas. En la figu-
C.V. - e (100)
:,,¡,
: 1.1' X
(1.7.7)
ra 1.7.2 se muestra una impresión de las medidas descriptivas disponibles
en el paquete MINITAB. Con los datos de la columna l, 'el comando Ml-
::1 Ii NITAB (para efectuar el cálculo) es:
,1 • ·,:' Se aprecia entonces que la media y las desviaciones estándar se expre-
1;
:1 i san en la misma unidad de medición, por lo que la unidad de medición se
:"¡ . cancela al calcular el coeficiente de variación. Entonces se obtiene una me-
r .
dida independiente a la unidad de medición. DESCRIBE C1
lt Los siguientes resultados ~orrespond.en a dos muestras formadas por
hombres: ·

Muestra 1 Muestrci2- N !EAN !EDIAN TRnEAN STDEV


.' SE!EAN

"ll
'
Edad 25 años 5 34.20 33.00 34.20 19.4]. 8.68
11 años
Peso 1nedio
Desviación estándar
154 libras
10 libras
80 libras
10 libras t nIN
10.00
HX
54.00
Q1
15.50.
Q3
53.50

Figura 1.7.2 La impresión de mediciones descriptivas disponibles en el paquete


de softWare estadístico de la MINITAB.
¡, Una comparación de las desviaciones estándar puede conducir a la
· collclusión de que·las dos muestras tienen·lgual variabilidad. Sin embargo,
si se calculan los coeficientes de variabilidad, se obtiene para los 25 años de Los datos son las mediciones de la muestr~ JO, 54, 2J_, 33 y 53. En la
1 edad: impresión Ql y Q3 son el primer y tercer cuartil respectivamente. Estas
mediciones serán descritas más adelante en este capítulo.
c.v.= ~-(100) = 6.9 TRMEAN significa medias arregladas. Las media arreglada se utiliza
J,I algunas veces en lugar de la media aritmética, como medida de tendenciá
11 y para los 11 años de edad: central. Se calcula después de que algunos val.ores.extremos son excluidos.
Por lo tanto, la .media arreglada no tiene la desvehtaja :de·:Ser influenciada
C.V ..= ~'(100¡,,; 12.5 indebidamente por los valores extremos como en el-caso-de-la.media arit-
mética. El término SEMEAN significa error. estándar de'.[a media'. Esta
Si se comparan estos resu.ltados, la imPrésión reC:ibida·es diferente. media, al igual·que la media arreglada, se estudiará,con detalle en t;1n capítu-
lo .próximo.
'
50 Organización e integración de datos Medidas de tendencia central calculadas a partir de datos agrupados 51

EJERCICIOS,~.--'~~~~~~~--'-~~~~~~~ suposiciones, los resultados son ún.icamente aproximacioó'es a los valores


-_'.; .,_ <":';.!l{,::_..¡_ .• reales.
1.7.i,; A partir del ejercicio .1.6.1, calcular.
;_ a) __ l:,a~plitud .. b) La variancia s2. I~a media calculada a partir de datos agrupados Al calcular la media a
,¡;_e~ La _desviación estándar s. partir de los datos agrupados, se supone que todos los valores que caen den-
1,7;2 A partir del ejercicio 1.6.2, calcular:
tro de un intervalo de. clase específico se localizan.en el punto medio del
a) La amplitud. b) La variancia s 2-_ intervalo. El punto medio de un intervalo de clase se obtiene al calcular la
e). La desviación estándar s. d) El coeficiente de variación .. media de los límites superior e inferior del intervalo. El punto medio del
primer intervalo de clase para la distribución que se muestra en la tabla
1.7.3 A partir del ejercicio 1.6.3, calcular:
1.5.3 es igual a (10 + 19) /2 = 29/2 = 14.5. El punto me<;lio.de 19.s iqtervalos
a) La amplitud. b) La va:riancia s 2 .
de clase s1:1cesivos _se calculan sumando la dimensión.del in~er:valo.i.P~.n.tq-,
e) La desviación estándar s. d) El coeficiente de variación.
medio anterior. Por ejemplo, el punto medio del segundo intervalo de clase,
1.7.4 A partir del ejercicio 1.6.4, calcular: en la tabla 1.5.3, es igual a 14.5 + 10 = 24.5. ",·,g
a) La amJ)litud. b) La varia~cia s 2 • Para calcular-la media, se multiplica cada punto medio por·Ia frecuen-
e) La desviación estándar s. d) El coeficiente de variación.
cia correSpondiente, se suman esos productos y se divide entre la suma· de
1.7.5 Los siguientes puntajes se refieren a la fuerza de asimiento de la mano dere- las frecuencias. Si los datos representan una muestr'!- de observaciohes,,¡los
cha de 12 adolescentes varones postpuberales: 30, 21, 62, 18, 53, 29, 65, 19, cálculos de la media pueden indicarse simbólicamente mediante:
62, 56, 63, 64. l\
Calcular:
a) La media. b) La mediana
2.,• mJ; le
11
-
x=--
Í= 1 1
e) La amplitud. d) La variancia. k !
e) La desviación estándar. Í.,f,
i=I (1.8.1)

donde k, es el número de intervalos de clase, m¡ es el punto medio del


1.8 MEDIDAS DE TENDENCIA CENTRAL i-ésimo intervalo y/¡ es la frecuencia del i-ésimo intervalo dé Clase.
CALCULADAS A PARTIR DE DATOS AGRUPADOS _ __ Cuando se calcula la media a partir de los datos agrupádos, es·con-
Tabla 1.8.1. Tabla de trabajo para calcula1 la media de los
Después de que los datos han sido agrupados, tal vez se quiera calcular datos agrupados en la tabla 1.5.3.
algunas medidas descriptivas, como la media y la varíancia. Muchas veces Media Frecuencia
el investigador no tiene acceso a los datos originales en los que está intere~ Intervalo de clase de clase
sado, pero tiene la distribución de frecuencia. Los.datos se publican a me- de clase m, f, mJ,
nudo en forma de distribución de frecuencia sin una lista complementaria t0-19 14.5 5 72.5
de los valores individuales. o medidas descriptivas. Los lectores interesados 20-29 24.5 19 465.5
en una medida de tendencia central o en una de dispersión para estos datos 30-39 34.5 10 345.0
deberán calcularla por sí mismos. 40-49 44.5 t3 578.5
Cuando los datos se agrupan, las observaciones individuales pierden su 50-59 54.5 4 2t8:0
identidad. Al mirar una distribución de frecuencia, es posible determinar el 60-69 64.5 4 258.0
número de observaciones que caen dentro de varios intervalos de c-lase, pero 70-79 74.5 2 149.0
los valores reales no se pueden detenninar. Por esta razón .se deben hacer Total 57 2086.5
ciertas suposiciones respecto a los .valores cuando se calcula una medida
descriptiva a partir ,je los datos agrupados. Como consecuencia de estas
11"
·"
Organbació11 e integración de datos Medidas de tendeticia central calculadas a partir de datos agrupados 53
52
\'.en_iev..te preparar una tabla como la 1.8.1, la cual ha sido elaborada cori los donde L.1 es el límite inferior real del intervalo . ciue
.
contiene
.
a la mediana; U.1
datos de la tabla 1.5.3. es el límite superior real del intervalo que contiene a Ja mediana; j es el
Ahora, se puede calcular la media. número de observaciones que faltan para alcanzar a la mediana después de
que el límite inferior del intervalo que contiene la mediana ha sido alcanza-
'I ' do, y/¡ es la frecuencia del intervalo que contiene a la mediana.

r·¡· i -
I-mJ.
¡ .. ¡
-
= 2086.,
-- - 36.6
:;7
11
La moda con datos agrupados Se ha definido a la moda de un conjunto
..
;11! '!
'
IJ;
¡ .. ¡
de valores como el valor que ocurre con mayor frecuenciá. Cuando se desig-
l :' na la moda de datos agrupados normalmente se hace referencia a la clase
1.,: ,nodal, que es el-intervalo de clase con mayor frecuencia. En,.el ejemplo
i,·:.
111' t
·se procede de la misma forma para calcular una media a partir de una
población 'de Valores agrupados dentro de un número finito de clases.
1.5.1 la clase mo_dal puede ser la segunda clase, 20 - 29 o .19_.'5 - 29.5, si. se
utiliz_an los límites de clase reales. Si se debe especificar un solo .valor para
La mediana con datos agrupados Cuando se calcula una media a partir la moda de datos agrupados, éste se toma_ como el punto medio de la clase
'
'· ''
, 1 de datos agrupados, se supone que los valores dentro de un intervalo de modal. En este ejemplo ésta es 24.5. El supuesto es que todos los valores
'
' '•: clase se localizan en el punto medio; sin embargo,para el cálculo de la me- del intervalo caen en el punto medio.
diana,·eJ supuesto es,que.están distribuidos uniformemente a través del,in,- El lector se preguntará por qué se utiliza (n + l) / 2 en lugar de n 12
1 tervalo. para localizar la mediana cuando se calcula a partir de los datos agrupados.
;11 El primer paso para calcular la mediana a partir de los datos agrupados En este ejemplo parecería que 57 /2 = 28.5 no ubica ninguna observación
que ap.arezca entre las observaciones 28 y 30. Si se utiliza (n + 1)/2 para el
es localizar el intervalo de clase en el cual se encuentra. Esto se logra encon-
trando el intervalo que contiene el valor n 12. En los datos del ejemplo 1.5. 1 ejemplo, el cálculo es (57 + 1)/2 = 29, el cual está a la mitad entre 28 y 30.
hay 57 observaciones, siendo el valor n 12 igual a 28.5. En la tabla 1.5.2 se En otras palabras, se -puede decir que la mediana observada es la obsei:-
obse.rva que los primeros dos intervalos de clase dan cuenta de 24 de las vacióll 29, una vez que los datos son ordenados. Esto concuerda con Ia regla
observaciones y que 34 de ellas están incluidas en los tres primeros interva- para determinar la observac_ión mediana cuando se tiene un número impar
los de clase. Por ·lo tanto, el valor de la mediana está en el tercer intervalo de de mediciones.
clase, entre.ZSt.5.y.,39,.5,, en el.caso de que se!c_onsideren,.Jo5:,}ímites de clase · Para mostrar que 57 /2 = 28.5 ubica efectivaménte una óbservaCión a la
reales._La p~gunta, ahora:es: ¿qué·tanto se ·debe·profun'dizar dentro de ese mitad entre: 28 y 30, es necesario tomar en cuenta que el -cálcúlo de la me-
intervalo, antes de encoiltrar la mediana? B.aj_o el supuesto de que los valores .diana a partir de los datos agrupados supone que las observaciones en cual-
están distribúido·s 'ühifoirhemente a tra'v:é~: .d~l -il1ter\'~JQ:...~.)óg¡~o que uno quier intervalo siempre se distribuyen uniformemente en .él. En el ejemplo,
debiera mover.se una distancia igual a (28.5'.- 24j / 10 'cte la di";tarJ~ia total del las 10 obser_vacion~s en el tercer intervalo de clase (ver la tabla 1.5.3) se
intervalO de clase, puesto que después de alcaázai 'el límite inferior del inter- suponen distribuidas uniformemente sobre el intervalo. Es decir, se cree que
valo de ,clas_e gue contiene a la mediana, se reG_uiekn 4 1/ 2 observaciones más el intervalo se divide en 10 unidades iguales, cada una con una dimensión
del total de 10 en el intervalo. El valor de la mediana, entonces_, es igual al de .una onza. Se considera que una observación se localiza en el punto
valor del líntl~rinferior del intervalo que co~tiene ~ la mediana~_ más 4.5 / l O medio de cada unidad. Este concepto se ilustra en la figura 1.8.1.
de la dimenfi9Q_;del iritei:vaIO. Para los datos de-la tabla 1.5.3 se tiene que la Cuando se recorre en el tercer intervalo una distancia de (28.5 - 24) =
mediana es 29,5 + .(4.5/10)(10) = 34. .. 4.5 unidades, se llega a la observación 29, a la mi,tad entre las observaciones
f . ' ' .,
En ger1:.~rat,. la mediana se puede calc~lar. a partir de datos agrupados 28 y 30. En la figura 1.8. 1 se observa que el valór de la variable en el punto
con la siguiente, fórmula: es 34, el cual Se tóma como la mediana de las 57-dbsei-vaciones.

Percentiles y cuartiles La media y la mediana son casos especiales de la


mediana - L¡ +
.
f (U, -
J,
L,)
(!.8.2)
familia de parámetros conocidos como parámetros de localiZllción. Estas
medidas descriptivas se llaman parámetros de localización· porque p_ueden
..,.,.
56 Organización e integración de datos Medulas de tendencia central calculadas a partir de datos agrupados 57

·Gr:.áfi_ca de caja con valores extremos (Box and Whisker) Un dispositivo


visual muy útil para comunicar información contenida en un conjunto de
dato-S ·~s_J~-gráfica de caja con valores extren1os (Box and Whisker). Para la o
)¡ ro
const~~ción de esta gráfica se utilizan los cuartiles de un conjunto de datos
'
' 1

complementados con los siguientes cinco pasos:


"'
~

l. Representar a la variable de interés sobre el eje de las x.


2. Dibujar sobre el eje horizontal un cuadro de tal forma que el extremo izquierdo o
~
esté alineado con el primer cuartil Q I y el extremo derecho del cuadro quede
alineado con el tercer cuartil Q3. o
3. Dividir el cuadro en dos partes con una línea vertical que se alinee con la media- ro

1' na Q2. "'"'


" 4. Dibujar una línea horizontal desde el extremo izquierdo del cuadro hasta el pun- o •
¡¡
'
to en donde se alinee con la n1edición más pequeña en el conjunto de datos.
"' "'<
i1
1
5. Dibujar otra línea horizontal desde el extremo derecho del cuadro hasta el punto
donde se alinea con la medición más grande en el conjunto de datos.
"'"'
N
00

o
."' - t::
z
:E
!
El examen de la gráfica para el conjunto de datos revela información res-
pecto a magnitud de la dispersión, localización de la concentración y sime-
o
"'
o.
E
V
'¡¡'
- !'!
o
o.

1 ¡ tría de los datos.
El siguiente' ejemplo ilustra la constru~ción de la gráfica de caja con .
"'
.;
o
~
.
- :9
.

¡ valores extremos. · '


.
o
~
w
m
"-
c.
w
o
E
o
..
a,
;;
u
w
o
o
E
Ejemplo 1.8.2. Construir la gráfica de caja con valores extremos a partir de " X V

los datos del peso de tumores que aparecen en la tabla 1.5.1.


"' -
V
w
o
o
" X
V
w

Solución El arreglo ordenado l?ara los datos. es el siguiente:


M
,; + eo
> .;
o N
o o M >
M u o
o -.

·~.
"" -
o
·;, u ":
12 12 12 16 19 21 22 · 22' 23 23 23 24 24 u
25
31
25
31
25 27 27 27 27 28 28 28 28 30 30 "'
N
o

o
-
u ,e
o !'.!
32 32 36 36 38 38 42 42 42 43 43 u 'ó
• !'!
43
65
44
68
45
69
46
74
47
79
49 49 49 50 51 51 57 63 o
N

N
-
"'"'o
"' "'- o
u o
¡¡::: ""O
w
o

"'
.;
,..; .... "'
.; ow
'O

Las mediciones más pequeña y más grande son 12 y 79, respectivamente. El


o
-•..=
¡.;
~-;;
"-·--
• 'O

primer cuartil es la medición Q1 = (57 + 1) / 4 = medición 14.5 que es igual o ""~ ~·

a 25. La medíana es la me.dición Q2 = (57 .+ 1)/2 = medición 29 o 32, y el


tercer cuartil es la medición Q3 = 3(57 + 1) I 4 = medición número 43.5 que
es ig\la1 a 46.5. La gráfica resultante se muestra en la figura 1.8.2.
Medidas de tendencia central calculadas a partir de datos agrupados 55
54 Organit.ación e integraeión de datos
Númerodeunidades

Localización de la obse,vación
·' · enel·conjunlodecl.:ttos
Valor de { 30
1

• , • , • , •
25 26
31
2

27
32
J

28
33
I•I,,•I,,.,,
44.55

2~
34
30
35
6

31
36
7

32
37 1
8

33
38
9 10

34
39
Tabla 1.8.2. Distribución de las estaturas de 250 estudiantes de bachiller~to de
sexo masculino.
Estatura (pulgadas) Punto medio Frecuencia Frecuencia acumulada
la variable 29.5 J0.5 31.5 32.5 J3.St34.5 35.5 36.5 3 7.5 38.5 39.5 3 3
62--63 62.5
64--65 64.5 20 23
Media = 29.5 + 4.5 = 34
66--67 66.5 38 61
Figura 1.8.1 Diagrama que muestra el cálculo de la mediana a partir de los datos 68--69 68.5 62 123
agrupados en la tabla 1.5.3. 70-71 70.5 63 186
72'-73 72.5 50 236
utilizarse para designar ciertas posiciones sobre el eje horizorltal cuando se
74-75 74.5 12 248
elabora una gráfica de la distribución de una variable. En ese sentido, los 250
76-77 76.5 2
parámetros de' localización "ubican" la distribución sobre el eje horizontal.
Por ejemplo, una distribución con una mediana de 100 se localiza a la de- traque la medición 175 está en el intervalo de clase 70-71. La fórmula 1.8.2
recha de una distribución con una mediana de 50 en la gráfica de las dos para calcular el P70 es como sigue:
distribuciones. Otros parámetros de localización son los percentiles y cuar-
tiles. Se puede definir un percentil como sigue: 75 123
p 70 - 69.5 + (l ; ) (71.5 - 69.5)
3

- 71.15
DEFINICIÓN _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ __
El resultado anterior indica que el 70 por ciento de estudiantes en la muestra
Dado un conjunto den observaciones xl' x2, ... , x 11, el p-ésimo miden menos que 71.15 pulgadas.
percentil P es el valor de X, tal que· p por ciento o menos ob- En general, la localización del k-ésimo percentil Pk está dado por
servaciones son menores que P y (100 - p) por ciento o menos
de las observaciones son mayores que P.
(1.8.3)

Los subíndices en P sirven para distinguir un percentil de otro. El déci- El vigésimo quinto percentil representa el pri,ner cuartil y es denotado
mo percentil, por ejemplo, se designa como P 10, el septuagésimo se designa por Q • El quincuagésimo percentil (la mediana) se ~o~oce c~mo segund?
1
por P70 Y así sucesivamente. El percentil quincuagésimo es la mediana y se cuartil o cuartil medio, denotado por Q2, y el septuagesxmo quinto percenhl
designa coll PsÓ· ,Todos los percentiles se calculan 'con el triétodo descrito es el tercer cuartil, Q 3. .
anteriormente para el cálculo de la mediana. Nohnalmente, -los percentiles Cuando se pretende calcular los cuartiles de datos no agrupados,_se uti-
se calculan sólo para-grandes conjuntos de datos.
El siguiente ejemplo ilustra el cálculo de un percentil diferente de la
mediana.
i lizan las siguientes fórmulas:

Q, ~ ésima observación ordenada


4
Ejemplo 1.8.1 Se pretende calcular el _septuagésimo percentil con los datos 2(n + 1) = ~ ésima observación ordenada
de la tabla 1.8.2 que muestra la distribución de las estaturas de n = 250 4 2
estudiantes varones.
3(n+I) d
::.o.e__.:...."' ésima observación ordena a
4 f.
Solución Puesto que el 70 por ciento de 250 es 175, el septuagésimo per- ,.'I

centil se encuentra en la medición 175. Al observar la tabla 1.8.2 se encuen-


-,, .. :. .,. ~ ·1·::i

58 Organivu:ión e integración de datos Variancia, desviación estándar y datos agrupados 59


Al ex'aminar la figura 1.8.2 ésta revela que el 50% de las mediciones
están entre 25 y 45, que son los valores aproximados del primer y tercer
cuartil, respectivamente. La barra vertical dentro del cuadro mues~ra que la L• (m; - x)'f.
(1.9.I)
$2 = _;-_,_ _ __
medi.;i.na es alrededor de 32. La línea horizontal ITlayor a la derecha indica
que la distribución de pesos está inclinada hacia la derecha, aunque de ma- • -i
L¡;
nera no muy extrema. ¡.., l

Muchos paquetes de software estadístico tienen la capacidad para donde los símbolos tienen la misma defmición dada en la ecuación 1.8.1.
construir gráficas de caja con valores extremos. La figura 1.8.3 muestra En ocasiones se prefiere la siguiente fónnula para el cálculo de la va-
una, construida con la MINITAB a partir de los datos de la edad de pa- riancia de una muestra:
cientes que aparecen en la tabla 1.4.1. Se colocan los datos en la columna 1
y se registra el siguiente comando:
• ( k
nL m¡[; - L m;[;)'
2 I"' l 1 "- \ (1.9.2)
BOIPLOT C1 s -
n(n - 1)
donde
La figura 1.8.3 muestra que, para los datos de 1a· edad de los pacientes, el
primer cuartil es aproximadamente 15, la mediana es aproximadamente 36 n -

L¡;
y el tercer cuartil es aproximadamente 60. A partir de esta figura se puede ;= 1
ccncluir que el paciente más joven tiene alrededor de 1 año de edad y el
más viejo tiene alrededor de 89. Estas conclusiones se confirman al consul-
La fórmula para definir a cr2 es la misma para s2 con la excepción de que µ
tar el arreglo ordenado de la tabla 1.4.2.
La gráfica de caja con valores extremos, así corno la de tallo y hojas,
son ejemplos de lo que se conoce como técnicas de análisis de exploración
sustituye a X y el denominador es L,' Í¡· La fórmula de cálculo para cr 2

i=I
de datos. Estas técnicas, populares debido al resultado del trabajo de Tukey, 12 tiene N ·Nen el denominador en lugar de n(n - 1).
permiten que eL investigador examine datos de manera que éstos revelen A partir de los datos de la tabla 1.5.3, el cálculo de la variancia y la des-
tendencias y relii.ciones, identifiquen características únicas del conjunto de viación estándar se efectúan con estas fórmulas. Para lograrlo, otra tabla de
datos y faciliten su descripción e integración. Breckendrige 13 utiliza el
análisis de exploración de datos en el estudio de los cambios en el patrón de j trabajo como la 1.9.1 será de utilidad.
Al dividir el total de la columna 6 entre el total de la columna 3,
edad fértil. El libro de Du Toit et al. 14 ofrece una revisión de los métodos ' menos 1, se tiene
más conocidos y ampliamente utilizados para el análisis y presentación grá-

L• (m, -
fica de datos, con énfasis en técnicas de exploración.
ii.) f,
2

2 ;~¡ 13347.37 " 238.3459


s ------
1.9 VARIANCIA, DESVIACIÓN ESTÁNDAR • -i
L¡; 56
Y DATOS AGRUPADOS, _ _ _ _ _ _ _ _ _ _ _ __ i= ¡

Cuando se calcula la variancia y la desviación estándar a partir de datos La desviación estándar es


agrupados se supone que todos los valores que caen en un intervalo de clase
específico se localizan en el punto medio del intervalo. Esta suposición tam- , - v'238.3459 - 15.44
bién se hace cuando se calculan la media y la moda. Por lo tanto, la varian-
cia de una muestra está dada por
Si se utiliza la fórmula de cálculo de la ecuación 1.9.2, se tiene
i
,~
·-.,~... ~ "

f
..
~
'
-~~
,.
. ,!' 60 Organización e integración de datos 1 Ejercicios 61

57(89724.25) - (2086.5) 2
52 = - 238.3459
.,.; l!'}U"l0lt'l000 ~
. 57(56)
CNl'--ll',CNOOlt'l
.,.
~

-"'• ro
·-• ....:..,¡,:G'ic<)....:....:o
~

---,n-,.o-
inOO'Ot'OO'<t'O
O '<t' Ol t- 00 <.C -
~
~

:;;
!:l
--CN---' "'"'
.!:l ¡ EJERCICIOS

"O ,O>l")U")lt')lf}>.l'll.t')
1

•o CN CN CN CN CN CN <N

'
"O
•c.o
~
·.- ciciciciOOci
-00>oot-t0>.0
C',l<.0-'0"IOl-U"l
En ]os siguientes ejercicios, los conjuntos de datos serán considerados como mues-
tras.
,¡' --C'l'<t'lO

11
:J
)1
•""•o" i 1.9.1 Del ejercicio J.5.1, calcular:
\I
• ~
U")O)Q,:t')s::t',:t<IN ~
~ '' a) La inedia. b) La mediana.
il "O
'"
Or---c<'l<.OIOOO
c-,j...:..:i:-:....:c<)(N .,.
~ e) La clase modal. d) La variancia.
11
•o ~
.,.
,:t<OO'<t'_.00_.l'-
~ ooc-.1-00 ~ ¡ e) La desviación estándar.
~~ -~~ :'.;

"O
f 1
1 •" 1.9.2 Del ejercicio 1.5.2, calcular:
"O
o
'.'l . ------- ~
í a) La media. b) La mediana.

•• '" "? e) La clase modo!!. á) La variancia.


-
'<!" .,,.. '!:l" "<t' "St' "' ""'
o
'0
o
- -.-
;;; 1 a:i :.ó
.,."' .,.
~ CN ci a:i tri
\OC',ll'-C<"l
~ ~ .,.
-
<O
~
~

"'
l
1
~) La desviación estándar.

·;:
i
1.9.3 Del ejercicio 1.5.3, calcular:
•o
"O
-: -: -: 0:-. O: O: O:
'
'
~ a)' La media. b) La mediana.
'"1
.!:l
>,
-~o
~

•' 1
-
G',l(NC\lr-r-r-r-
~
1
1 - CN t,11.
j
:
j
e) La clase modal.
e) La desviación ·estándar.
d) La variancia.

o •I,
·e• ¡, 1.9.4 Del ejercii;:io 1.5.4, calcular:
•> a) La media. b1 La mediana.
• l.,.,
·-·
•"
;;
o
;;;
-· . -~e
e~e.-:3--=:
, e
l!}~;::~,,t<,,t<CN ~
~ fi
~:~;
e) La clase ffiodal.
e) ·La desviación estándar.

1.9.5 Del ejercicio 1.5.5, calcular:


á) La variancia.

o
•" et~ Q) La media . b) La mediana.
•c.
....,
o
-~
e) La variancia. d) La desviación estándar.

• ......"•E ~ .... in ,n ,n ,n 1.9.6 Del ejercicio 1.5.6, calcular:


"• ~('.)'i:: "t;tslo
l!} l!} l!}
..,i<~.;:.;:.;:.;:..¡ a) La media . b) La mediana.
"O -(Ng!'),,t<\.t')!.C),...

• , '
:;;
e) La variancia. d). La desviación estándar.
,...• "- " '
' 1.9.7 Del ejercicio 1.5.7, calcular:
b) La mediana.

-.e: -' 'i°t11''?~17


.-i ' a) La media.
1
e tÍ) La desviación estándar.
"',..; ,,;"' 1 e) Lá váriancia.
'
:;;• "1 en ai O) o, O'l ai a, ;;; ~
1.9.8 Los sigut~ntes dalos corresponden aJ peso en onzas de 100 niños que nacie-
,...• ' e 0 11 i
,. . . °"
3]~ º ºº e<'l º º
U'l º
IO º
t- ,... ~ '" ron en un hospital de beneficencia. Construir una gráfica de caja con valores
'
1 extremos con estos datos.
i
.··~~·
-\-_.~1~lVfii;¿·,¡--
' '·,,l¡
' 63
62 Organit.ación e integración de datos Preguntas,y ejercicios de repaso.,·

o) Percentiles. p) Cuartiles.
122 134 88 105 103 89 94 156 84 33 q) Parámetro de localización. r) Análisis de exploración de datos.
141 113 ·'l:106 86 90 123 99 89 105 113 4. ¿Qué es un arreglo ordenado? i"¡!
139 129 101 95 109 138 90 104 12'3 136 S. Definir y comparar las características de la media, la mediana y la moda. lit
116 125 109 119 111 116 117 113 128 97 6. ¿Cuáles son las ventajas y limitaciones de la amplitud como medida de dispersión?
162 125 142 114 86 102 110 110 111 65
88 97 143 114 124
7. ¿Qué es una distribución de frecuencias?_
125 131 123 94 131
57 119 122 8. ¿Qué es una distribución de frecuencia relativa?
103 120 110 90 103 127 132
117 85 133 9. Explicar la diferencia entre una estadística y un parámetro.
131 67 120 121 114 105 114
107 117 10. Explicar por qué se utilizan - l para calcular la v_ariancia de la muestra. r11:
66 145 121 103 98 · 104 107 134
91 114 93 11. ¿Cuál es el propósito del coeficien~e de variación?
97 106 123 137 137 124 126 12. ¿Cuál es el propósito de la regla de Sturges?
13. ¿Qué es un histograma?
1.10 RESUMEN 14. ¿Qué es un polígono de frecuencia?
15. ¿Qué supuestos (restricciones) requiere el cálculo de la media, la moda y la me-
En este capítulo se define a la estadística como un área dedicada a la re- diana a partir de los datos agrupados?
colección y descripción de datos así como a la elaboración de inferencias. 16. ¿Qué significa el térnüno límite real de clase?
En la primera parte se presenta un vocabulario básico de estadística. Se 17. Describir una población de datos para un campo específico de estudio, donde el
explican varios procedimientos estadísticos descriptivos, entre los que se conocimiento de la tendencia central y la dispersión sean de utilidad. Obtener
incluye la organización de datos por medio de arreglos orderiados, distribu- valores reales o teóricos a partir de esa población y calcular la media, mediana,
. la moda, la varia:-icia y la desviación estándar utilizando las técnicas· para datos
ción de frecuencias, distribución de frecuencias relativas, histogramas y
polígonos de frecuencia. Se presentan los conceptos de tenqencia central no agrupados.
18. Recolectar un conjunto de datos reales o teóricos de un campo específico de
y variación, al igual que los métodos para calcular las medidas ¡nás comu-
estudio y construir una distribución de frecuencias, una distribución de fre-
nes: media, mediana,. moda, variancia y desviación estándar. Se presentan 1,
cuencia relativa, un histograma y un polígono de frecuencia.
conceptos y métodos de tal forma que hacen posible el manejo de datos 19. Calcular la media, la mediana, la clase modal, la variancia y la desviación están- !
agrupados y no agrupados. Se incluye una introducción al análisis ?e ex- dar para el conjunto de datos del ejercicio 18, utilizando las técnicas para datos
ploración de datos mediante la descripción de las gráficas de ·caja cOn val O- agrupados.
res extremos y el desplegado de tallo y hojas. En particular, la computadora 20. Encontrar un artículo en una revista especializada donde se haya calculado
es una herramienta útil parci calcular medidas descriptivas y construir varios alguna medida de tendencia central y dispersión.
tipos de distribución a· partir de grandes conjuntos de datos. La disponibili- 21. En un estudio diseñado para investigar la efectividad de una anestesia local.
dad de una computadora evita la necesidad de fórmulas para los datos agru- varias dosis fueron suministradas a 15 animales de laboratorio para \levar un re-
pados de la sección 1.8 y l,9, cuando se dispone de los datos originales. gistro de duración (en minutos). Los resultados son los siguientes:

Duración Dliración
Animal de la respue~·ta Aninial de la respuesta
PREGUNTAS Y EJERCICIOS DE REPASO !1
31 9 22
1
l. Explicar qué significa estadística descriptiva. 14 10 20
2
2. Explicar qué significa estadística inferencia!. 19 11 32
3
3. Definir: 17 12 19
4
a) Estadística, b) B ioestadística. e) Variable. 34 13 27
5
d) Variable cuantitativa. e) Variable cualitativa. /) Variable aleatoria. 25 14 11
6
g) Población. h) Población finita. i) Población infinita. 17 15 23
7
j) Muestra. k) Variable discreta. l) Variable continua.
B 35
111) Despliegue de tallo y hojas. 11) Gráfica de caja con valores extremos.
,n
1
¡1··1/J
'~ . '
;,;

Preguntas y ejercicios de repaso 65


64 Organización e integración de datos
se registraron los siguientes niveles de estrógeno. Calcular la n1edia, mediana,
Calcular la media, mediana, variancia y desviación estándar para los datos de la
variancia y desviación estándar.
muestra

22. Eri la siguiente tabla aparecen los datos del ·consun10 diario de grasa (en gra- 61 58 54 54
,.,.·¡' i'
·mos) para una muestra de 150 varones adultos en un país en vías de desarrollo. 81 56 81 75
~ Elaborar una distribución de frecuencia y un his1ogran1a. Calcular media, Gi 80 92 59
h
mediana, variancia y desviación estándar. 63 83 71 58
i\}1
82 92 69 94
~~' ¡
22 62 77 84 91 102 117 129 137 141
:¡''¡:'¡.:,
' 1 [,
:,1.
42
37
56
69
78
82
73
93
96
93
105 .
100
117
114
125
124
135
135
143
142
1 25. La siguiente Labia muestra la distribución de edades de casos de una cierta en-
fermedad infonnados duranle un año en un eslado parlicular.

~ ¡ I'i 30 77 81 94 97 102 119 125 138 142


Edad Nún1erode casos
,, 1 : 116 · 121 131 152
46
63
89
85
88
81
99
94
95
93
100
106 114 127 133 155 5-14 ,,
"' 11' !: 51 80 88 98 97 106 119 122 134 151 15-24 10
! . ~I 52 70 76 95 107 105 117 128 144 150 25-34 20
68 79 82 96 109 108 117 120 147 153 35--44 22
67 75 76 92 105 104 117 129 148 164 45-54 13
62 85 77 96 103 105 116 132 146 168 55---fi4 5
53 72 72 91 102 101 128 136 143 164
1-otal 75
65 73 83 92 103 118 127 132 140 167
68 75 89 95 107 111 128 139 148 168
68 79 82 96 109 108 117 130 147 153 1 Calcular la media de la mueslra, mediana, variancia y desviación estándar.
26. Dar tres sinónimos de variación (variabilidad).
27 .. Como parte de un proyecto de investigación, los investigadores obtuvieron los
23. Los siguientes datos representan el valor de la hemoglobina (en g/100 mi) di: siguientes datos respecto a los niveles de peróxido lípido en el suero informa-
10 niños que recibieron tratamiento contra la anemia homolítica::. dos -por un laboratorio para una muestra de 1O individuos adultos bajo trata-
miento de diabetes me11itus: 5.85, 6.17, 6.09, 7.70, 3.17, 3.83, 5.17, 4.31, 3.09,
•""' 5.24. Calcular la media, mediana. variancia y desviación estándar.
- 28. Los siguientes datos representan los valores de suero lípido obtenidos a partir
9. 1 8.3
de la muestra de 10 adultos aparentemente sanos: 4.07, 2.71, 3.64, 3.37, 3.84,
!O.O 9.9
gj: ,ll'-' '
3.83, 3.82, 4.21, 4.04, 4.50. Para estos datos, calcular la media, variancia y des-
IL4
7.5 viación estándar,
12.4
29. Las siguientes edades son de 48 pacientes recibidos· en la sala de urgencias de
9.8 6.7,
un hospital. Construir un despliegue de tallo y hojas a partir de esos datos.

Calcul31: la media, mediana, variancia y desvjación estándar. 32 63 33 57 35 54 :is 53 42 5¡· 42 48


43 46 Gl 53 12 13 16 16 31 ~. n 28
24. Veinte mujeres en edad de postmenopausia y a quienes se les practicó una his- 25 23 23 22 21 e,
17 13 30 14 n I~ 28
terectoriiía durante los años de pre-meílopauSia, recibieron una terapia de estró· 17 2i" 21 24 22 23 (j l 55' 34 42 13 26
geno s!~tético durante cu~.tro meses en .do~ffs_ diarias. Desp_l:l~s del tratamiento
Organización e integración de datos Bibliografía 67
66
30•. Ciertos investigadores·comp~n dos métodos de obtención de muestras de san-
9. THOMAS R. TAYLOR, The Principle~·of Medical Computing, Blackwell ti
gre para estudios de coagulación. Los siguientes datos son los valores de tiempo
Scientific Publications, Oxford, 1967. .'.I·'
10. H. A. STURGES, ''The Choice of a Class- Interval", Journal of the American
de tromboplastina parcial activada en arterias, registrados en 30 pacientes de dos
Statistical Association, 21 (1926), 65-66.
grupos. Construir la gráfica de caja con valores extremos a partir de cada conjun-
11. HELEN M. WALKER, "Degrees of Freedom", The Journal of Edl:lcational
to de mediciones. Comparar las dos gráficas. ¿Indican una diferencia en la dis-
Psychology. 31 (!040), 253-269. ·
tribución de tiempo de tromboplastina parcial activada en arterias de ambos
12. JOHN·W. TuKEY, Exploratory Data Analysis, Addiso'ri-Wesley, Reading, Mass.,
métodos?
1977.
Método 1

20.7
3 l.2
29.6
38.3
34.4
28.5
56.6
22.8
22.5
44.8
29.7
41.6
1 13. MARY B. BRECKENRIDGE, Age, Time, and Fertiliry: Applications of Exploratory
Data Analysis, Academic Press, Nueva York, 1983. q.,-.· ,, 1_; •
14. S. H. C. DU _TotT, _A. G. W. STEYN Y R. H. STUMPF, Gra¡jhicál Expl.orcitory
30.1 33.9 39.7 45.3 Data Analysts, Spnnger-Verlag, Nueva York, 1986. ,í>:'-'1 .·,-,. il:
24.9 29.0
22.9 20.3 28.4
46.1
35.5
35.0
22.8
46.1
54. 7
22.1
1 Otras publicaciones ,~
:

52.4 20.9 !

l. HARVEY J. BRIGHTMAN, Statistics in Plain English, South-Wester~: Ci~ci.~n¡ti. 1

Método2

23.9 23.2
5G.2
24.6
30.2
49.8
27 .2
22.6
21.8
48.9
1 !986.
2. WILFRED J. DIXON y FRANK J. MASSEY, JR., fntroductio11 to Statisticaf A~alysÍs,
4.-edición, McGraw-Hill, Nueva York, 1985.
..

53.7 3 l.fi
41.3 34.l 26.7 20.1 · 3. BERNARD G. GREENBERG, "Biostatistics", en Hugh Rodman Leavell y E. Gur-
23.l 34.6
21.I 40.7 3~.8 21.4 ney Clark, Prei•entive Medicine, McGraw-Hill, Nueva York, 1965.
38.9 24.2
35.7 20.2 27.4 23.2 4. GEORGE W. SNEDECOR y W!LLIAM G. COCHRAN, Statistica[ Methods, 7.ª edi-
4 l.3 23.7 ción, The Iowa State Univcrsity Press, Ames, 1980.
5. ROBERT G. D. STEEL y JAMES H. TDRRIE. Principies and Procedures of Sta-
BIBLIOGRAFÍA tistics: A Bion1etrical Approach, 2." edición, McGraw-Hill, Nueva York, 1980.

Obras citadas Revistas y artículos


l. I. AL TMANN y A. C1occo, "Introduction to Occupational Health Statistics I",
l. WA.YNE A. WOODWARD, ALAN C. ELL!OTI, HENRY L. GRAY -y DoUGLAS C.
Journal of Occupational Medicine, 6 ( 1964), 297-301.
MATLOCK, Directory, of Statistical Microcon1pt1ter Soft-.vare, Edición /988,
2. W. f. BüDMER, "'Understanding Statistics", Jo11rr1al of the Royal Statistical
Marc~l Dek.ker, Nueva York, 1987.
Sociery-A, /48 ( 1985), 69-8 l.
2. JAMES CARPENTER. DENNlS DELORJA y DAVID MORGANSTEIN, '"Statistical
3. DARRELL L. BUTLER y WILLIAM NEUDECKER, "A Comparison of lnexpensive
Software for Microcomputers", Byte. abril (l 984), 234-264.
Statistica\ Packages for Microcomputers Running MS-DOS'', Behavior
3. KENNETH.N. BERK, "Effeclive Microcomputer:Statistical Soft\vare", The
Research Methods, Instrtunents and Colliputers. 21 (1989), 113-120.
Arnerican Statisticiatt, 41 ( 1987), 222-228.
4. Editorial, "Limitations of Computers in Medicine", Canadian Medica[ As·
4. CHARLES SADLER, "A Primer for the Novice: Basic Computer Concepts",
sociation Journal, 104 (1971 ), 234-235.
Orthopedic Clinics of North An1erica, 17 (octubre 1986), 515-517.
S. A. R. FEJNSTEJN, "Clinical Biostatistics 1, A New Name and Sorne Other
5. S1DNEY O. KRASNOFF, Con1pttters in Medicine, Charles C Thomas, Springfield,
Changes of the Guard", Clinical Pharn1acology and Therapetttics (1970),
lll., 1967.
135-138.
6. ROBERT STEVEN LEDLEY, Use of Coniputers in Biofogy and Medicine,
6. ALVA R. FEINSTEIN, "Clínica! Biostatistics VI, Statiscical Malpractice-and the
McGraw-Hill, Nueva York, 1965.
Responsibility of a Consultant", Clinical Pharn1acology and Therapeutics, I l
7. DoNALD A. B. LINDBERG, The Con1puter and Medica! Care, Charles C
(1970), 898-914.
Thomas, Springfield, 111., 1968.
7. LYON HYAMS, "The Practica! Psychology of Biostatistical Consultation",
8. THEODOR 0. STERLlNG y SEYMOUR V. POLLACK, Con1p11ters and the Life
Biometrics, 27(1971), 201-211.
Sciences, Columbia University Press, Nueva York, 1965.

r •
I?¡
!~ ¡.i!
!i!'
,·q
68 Organización e i11tegración de datos

8. ]OHANNES JPSEN, "Statislical Hurdles in the Medical Career", An1erica11


Statistician, 19 Gunio 1965), 22-24.
9. D. W. MARQUARDT, "The lmportance of Statisticians", Jour11al of rhe
2
11, A111erican Statistical Association, 82 ( 1987), 1-7.
1,,
10. RICHARD K. MEANS, "lnterpreting Statistics: An Art", Nursing Outlook, 13 Algunos conceptos básicos de pr9babilística
,,¡ (mayo 1965). 34-37.
11. CAROL M. NEWTON, "Biostalistical Computing", Federation Proceeding, Fe-
iJI ¡ .:! ,1
deration of Anierican Societies far Experbne11tal Biology, 33 (1974). 2317-
2319.
t.¡ .
12. E. S. PEARSON, "Studies in the History of Probability and Statistics. XIV Sorne
1,·¡ ,,·..·' lncidents in the Early History of Biometry and Statistics, -1890-94", Bio-

,:'¡,
11 'ifi[ .,,:
n,etrika, 52 (1965), 3-18.
13. ROBERT l. ROLL\VAGEN, "Statistical Methodology in Medicine", Ca11adia11
i' i !
Medical Association Joun1al, 112 ( 1975), 677.
14. D. S. SALSBURG, "Toe Religion of Statistics as Practiced in Medical Journals",
¡,
:11

i1
1 ,¡,
·'

¡,, 1 Tite An1erican Statistician; 39 (1985), 220-223.


;, 1 15. HAROLD M. SCHOOLMAN, "Stalistics in Medica\ Research", The New England
, 11'I
'

'
'
)oun,al of Medicine, 280 (l 969), 218-219.
"' 16. STANLEY SCHOR y IRVING KARTEN, º'Statistical Evaluatibn of Medica] Jourr.al
2.1 INTRODUCCIÓN------------~-~
Manuscripts", Journal of the Anierican Medica! Association, 195 ( 1966},
i 1123-1128.
La teoría de la probabilidad es el fundamento para la inferencia -estadística.
17. H. C. SELVIN y A. STUART, "Data-Dredging Procedures in Surgery Analysis",
A111erican Statisticia11, 20 (junio 196-6), 20-22.
Sin embargo, esta teoría, que es una rama de la matemática, ·no es el tem,
principal de este libro, por lo que sólo se estudian los conceptos más impor-
1 18. ROBERT L. STEARMAN, "Statistica\ Concepts in Microbiology", Bacteriological
1 Reviews, 19 (1955), 160-215.
19. HARRY E. UNGERLEIDER y COURTLAND c. SMITH, "Use and Abuse of Sta-
tantes. Los estudiantes que quieran abordar este tema, pueden ·consultar los
libros de probabilidad de autores como Bates, 1 Dixon,2 Mosteller et al.,3 Ear..
;! tistics", Geriatrics, 22 (febrero 1967), 112-120 . et al., 4 Bennan, 5 Hausner, 6 y Mullins y Rosen.7 También son dé·gr"an utilida<·
. ¡:
·,.,.·.
20. JAMES P. ZIMMER_MAN~.·"Slatistical Data and Their Use", Physical Therapy, 49
(1969),. 301-302.
'los libros de estadística matemática de Freund y Walpole,8 Hogg y Craig, y
9

Mood 'et al. 10 Para quienes se interesan en la historia de la probabilidad, se


,1
recomiendan:los libros de Todhunter 11 y David. 12 En estos últimos, por ejerr,
:1 plo, aprende que el primer matemático que calcllló correctamente una probr
bilidad teórica fue el italiano Giroldamo Camado (1501'1576). Los objetivos
de este capítulo son que el estudiante aumente su caPacidad matemática en t.,
área de probabilidad y brindarle asesoría en }a comprensión de los conceptl
más importantes. El avance a lo largo de este capítulo contribuirá de maner
importante a lograr el dominio de los procedimientos de la inferencia
. estadística que se presentan en el resto del libro. ·
El concepto de probabilidad no es ajeno a los trabajadores de la salu
: puesto que lo- encuentran frecuentemente· en la Comunicación diaria. pr ..
; ejemplo, se suele ·escuchar que un paciente tiene una oportunidad de sobre-
, vivir a. utia op-erat.ión de 50-50. O bien, una médica que está 90 ·por cien~._,
· segura de que un paciente tiene alguna enfermedad particular. Una enf1
mera .. de sani~ pú~lica dirá que 9 de .cada 10 pa~ientes suspenderán ,...,
tF
Algunos conceptos básicos de probabilística Dos perspectivas de la probabilidad: objetiva y subjetiva 71
70
cita. Tal como lo muestran estos ejemplos, mucha gente expresa la probabil- Si P(E) se lee como "la probabilidad de E', esta definición se expresa
idad en términos de porcentajes. Trabajando con la probabilidad matemáti- como:
camente, es más conveniente expresarla como fracción. (Los porcentajes
resultan de la multiplicación de las fracciones por l OO.) De esta forma se P(E) "'
¡.; (2.2.1)
mide la probabilidad de ocurrencia de algún hecho en un número entre cero
y uno. Para el hecho más probable, el número más cercano es uno, y, para el
hecho menos probable, el número más cercano es cero. Un hecho que no La proximidad de la frecuencia relativa a la probabilidad depende de la
ruede ocurrir tiene probabilidad de cero y un evento cuya ocurrencia es se- repetibilidad de algún proceso y de la posibilidad de contar el número de
J gura tiene probabilidad de uno. repeticiones, así corno el número de veces que algún evento de interés ocu-
•1 rre. En este contexto, la probabilidad de observar alguna característica E
para un evento se define co1no sigue:
,1 2.2 DOS PERSPECTIVAS DE LA PROBABILIDAD:
OBJETIVA Y SUBJETIVA _ _ _ _ _ _ _ _ _ _ __
.d
DEFINICIÓN _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _~
1 Hasta muy recientemente, los estadísticos y matemáticos enseñan la proba-
bilidad como un fenómeno objetivo, derivado de procesos objetivos.
¡j Si a\gtín proceso es repetido un gran número de veces n, y si
El concepto de probabilidad objetiva se puede dividir bajo los títulos de
t l l) probabilidad clásica o "a priori", y 2)frecuencia relativa o ''a posteriori". algtín evento resultante, con la característica E ocurre m veces,
la frecuencia relativa de la ocurrencia de E, ni In, es aproxi-

.•
La probabilidad clásica data del siglo XVII en los trabajos de dos ma-
• temáticos, Pascal y Fennat. 11 - 12 Gran parte de esta teoría fue creada para madamente igual a la probabilidad de R.
' intentar resolver problemas relacionados con los juegos de azar, como el
juego de los dados. Algunos ejemplos tomados -de dichos juegos ilustran
perfectamente los principios de la probabilidad. Por ejemplo, si un dado Para expresar esta definición en forma compacta se escribe
¡i:
normal es lanzado, la probabilidad de que caiga un 1 es igual a 1/6 y es lo
' mismo para los otros cinco lados. Si una carta es sacada al azar de un rhazo P(E) - "' (2.2.2)

bien barajado, la probabilidad de sacar un corazón es de 13/52. Las proba- "
., bilidades como éstas se calculan a través del razonamiento abstracto. No es
necesario lanzar un dado o sacar una carta para calcular esas probabilidades. Sin embargo, se debe tener en cuenta que, hablando estrictamente, nJ/11
es únicamente una estimación de P( EJ.
"':' Al lanzar un dado, se dice que cada uno de los seis lados tiene probabilidad
igual de aparecer; si no hay razón que favorezca alguno de los seis lados. En los primeros años de la década de 1950, L. J. Savage 13 dio un gran
•'
.,
Análogamente, si no hay razón que favorezca el sacar alguna carta en par- impulso a lo que se conoce como probabilidad "personalista" o subjetiva.
Este enfoque sostiene que la probabilidad mide la confianza que un indivi-
ticular, se puede decir que cada una de las 52 cartas tienen la misma proba-
., bilidad de salir. La probabilidad se define en el sentido clásico como sigue: duo tiene en la certeza de una proposición particular. Este concepto no de-
pende de la repetibilidad de ningún proceso. De hecho, al aplicar este con-
.. : DEFINICIÓN _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _- ,
cepto de probabilidad, se puede calcular la probabilidad de un evento que
sólo puede ocurrir una vez, por ejemplo, la probabilidad de descubrir una

... Si un evento puede ocurrir de N formas, las cuales se excluyen
cura para el cáncer en los próximos diez años .
Aunque el punto de vista subjetivo de la probabilidad ha gozado de
.. mutuamente y son igual_mente proQables, y si ,n de estos even-
tos poseen una característica E, la probabilidad de ocurrencia
gran popularidad, los estadísticos que tienen orientación tradicional atín no
la aceptan del todo.
~

.. de E es igual anz/ N.

... Ji
11¡
72 Algunos conceptos básicos de probabilística Teoría y notación de conjuntos (nociones básicas)

2.4 TEORÍA Y NOTACIÓN DE CONJUNTOS


73
..
2.3 PROPIEDADES ELEMENTALES DE LA PROBABILIDAD_

En 1933 el matemático ruso A. N. Kolmogorov fonnalizó el enfoque axio-


(NOCIONES BÁSICAS) _ _ _ _ _ _ _ _ _ _ __

George Cantor ( 1845-1918) presentó la teoría de conjuntos a finales del


.
11¡

111¡ .
mático de la probabilidad. Las bases de este enfoque están inmersas en tres
propiedades, de las que se deriva todo un sistema de teoría de la probabili- siglo XlX. Ésta constituye una herra1nienta 1natemática importante en lit i
muchas ramas de la matemática, incluyendo probabilidad. Por esta razón, se
dad a través del uso de la lógica mate1nática.
incluye en este capítulo la teoría de conjuntos, con un mínimo de conceptos. lo¡
l. Dado algún proceso (o experimento) con 11 resultados mutuan1ente excluyentes
Los libros de Brewer, 15 Stoll 16 y Maher, 17 entre otros, sirven para completar .
(llamados eventos), E 1 E 2, ... , Ew la probabilidad de cualquier evento E 1 es un el estudio.
.
número no negativo. Es decir

P(E,) ea O (2.3.1)
Un conjunto es una colección finita de objetos distintos. Los objetos
que con1ponen al conjunto se llaman ele111e11tos o 1nie111bros. Para represen-
tar conjuntos se utilizan letras mayúsculas.
..
Un conjunto puede ser descrito en cualquiera de las siguientes formas:
,.,
En otras palabras, todos los eventos deben tener una probabilidad ma-
yor o igual a cero, requerimiento lógico en vista de la dificultad de concebir
una probabilidad negativa. Un concepto clave en el enunciado de esta pro-
l. Al nombrar cada uno los ele,nentos.
Ejen1plo:
.
piedad es el término resultados 111utua111ente exclu_\-·entes. Se dice que dos •
..•'
CONJUNTO ELEMENTOS DEL CONJUNTO
eventos son mutuamente excluyentes si no pueden ocurrir simultáneamente.
A= {paciente número 1, paciente nú1nero 2, paciente número 3)
2. La suma de las probabilidades de todos los resultados mutuainente excluyentes

-•,
B = { fám1aco A, fám1aco B, fármaco C, fánnaco D} ·
es igual a l.
C= {animal 1, animal 2, ... , animal 11) i
D = { Sra. Srnith. Sra. Janes, Sra. King}
P(E,) + P(E,) + · · · + P(E,,) ~ 1 (2.3.2)
2. Al describir el tipo de elementos con los que se forma el conjunto. •
Esta es la propiedad de exhaustividad y se refiere al hecho de que el
observador de un proceso probabilístico debe contemplar todos los eventos
Ejcn1plos:

posibles, y cuando se toman todos, su probabilidad es igual a 1. El requeri- •''
••
CONJUNTO ELEMENTOS DEL CONJUNTO
miento de que los eventos sean mtituamente exclusivos, especifica que los
eventos E 1, E 2, ..• , En no se traslapen. A = { todos los pacientes del cuarto piso. en condiciones graYes)
B = { todos los fármacos utilizados en un experimento}
3. Considérense dos eventos mutuamente excluyentes, E, y ~- La probabilidad de C = { todos los animales utilizados en un experimento}
D = { todos las enfenneras de salud pública que trabajan en una clínica)
~
ocurrencia de E¡ o Ejes igual a la suma de sus probabilidades individuales.
~
P(E, o E¡) ~ P(E,) + P(E,) (2.3.3) Algunos conceptos adicionales relativos a conjuntos aparecen a conti-
~
nuación: - ~
Supóngase que dos eventos no son mutuamente excluyentes, es decir,

l
que pueden ocurrir al mismo tiempo. En un intento por calcular la probabi- l. El conjunto unitario es un conjunto compuesto por sólo un elemento.
lidad de ocurrencia de E¡ o E., el problema de traslape ocurre y entonces el 2. Un conjunto que no contiene elen1cntos se llama co11j11nro \'GCÍO o nulo y se re-
1
procedimiento se vuelve muy cotnplicado. presenta por n1edio del símbolo 0.
Antes de usar estas propiedades para calcular la probabilidad de un eYento, 3. El conjunto de todos !os elen1entos en los cuales se tiene interés se llama con-
junto 1111irersal, el cual se representa por el sín1bolo U.
es importante revisar algunos conceptos básicos de la teoria de conjuntos y téc-
4. Si el conjunto A contienen uno o n1ás elen1entos que pertenecen a By así cada A
nicas de conteo. Estos temas son expuestos en la siguiente sección.

1
L.._
-"'•
,¡ 74
Algunos conceptos básicos de probabilística
Teoría y notación de conjuntos (nociones básicas) 75
elemento de A es un elemento de B, entonces se dice que A es un subconjunto
de B. A u B = { todos los pacientes internados en marzo 1O de 199 l }
s. Por definición, el conjunto nulo es un subconjunto de todos los demás conjuntos. Los conjuntos A y B están disjuntos porque no hay ningún paciente que
6. Dos conjuntos son iguales si y sólo si contienen los mismos elementos. tenga 30 años o menos y tenga más de 30 al mismo tiempo. La unión de dos
\ conjuntos disjuntos se muestra en la figura 2.4.2.

El siguiente es un grupo de operaciones útiles con conjuntos. En algu-


1 nos casos, las diferentes relaciones entre conjuntos se ilustran mediante dia- u u u
gramas de Venn, los cuales representan al conjunto como parte de un plano.

1. La unión de dos conjuntos, A y B, es otro conjunto compuesto por todos los ele-
mentos que pertenecen a A o a B o a ambos. El símbolo u se utiliza para desig-
nar la unión de dos conjuntos.

Ejemplo: En una clínica de salud mental, el trabajo de un servidor so-


• • A B
Figura 2.4.1. Unión de dos conjuntos.
AUB

cial consiste en atender a un grupo de pacientes A, donde


u u u
A = {pacientes 1, 2, 3, 4, 5, 6} =todos los pacientes

• ••••
que reciben terapia farmacológica

y el conjunto de pacientes B, donde:

B = {pacientes, 2, 4, 7, 8, 9, 10, 11} = todos los pacientes A B AUB


que reciben psicoterapia de grupo Figura 2.4.2. Unión de dos conjuntos disjuntos.

A u B = {pacientes 1, 2, 3, 4, 5, 6, 7, 8, 9, l O, 11 } = todos los pacientes


l. La intersección de dos conjuntos, A y B, es un conjunto formado por todos los
que reciben terapia farmacológica psicoterapia de grupo o elementos que están en A y en B. El símbolo n se utiliza para asignar la inter-
ambas.
sección de dos conjuntos.
Se dice que los conjuntos A y B se intersectan porque tienen al menos
un elemento en común. En este caso, los elementos comunes son los pa- En el ejemplo anterior, el de los pacientes internados en la clínica de
cientes 2 y 4. salud mental, la intersección de los conjuntos A y B consistiría de todos los
En la figura 2.4.l se muestran los tres conjuntos. En el cuadro de la pacientes que reciben terapia farmacológica y psicoterapia de grupo. es
derecha el área totalmente sombreada representa al conjunto A,__.. B. decir, los pacientes 2 y 4. En notación de conjuntos se escribe A n B =
Si los dos conjuntos no tienen elementos en común, se dice que son dis- {todos los pacientes que reciben terapia farmacoló.gica psicoterapia de
juntos. Por ejemplo, de los pacientes que ingresaron e! 1O de marzo de 199 I grupo}. En la figura 2.4.1, A í'i B es el área con doble so1nbreado y repre-
al hospital, 1O tienen más de 30 años de edad, y 5 tienen 30 o menos. Se senta el traslapo de los conjuntos A y B.
definen los siguientes conjuntos: El ejemplo de los pacientes internados en f'} hospital el 10 de marzo de
1991 ilustra el hecho de que la intersección de dos conjuntos disjuntos da
A = { todos los pacientes con más de 30 años de edad internados en como resultado el conjunto nulo.
marzo !Ode 1991}
B = { todos los pacientes de 1Oaños de edad o menos internados en l. Si el conjunto A es un subconjunto del conjunto unlversal U, el co111ple111e11!0 de
marzo !Ode 1991) A es otro subconjunto de U, y estará formado por los elementos en U que no
están en A. El complemento de A se designa como A.
77
Ejercicios
76 Algunos conceptos básicos de probabilística
especificadas, es posible especificar otros conjuntos usando los conceptos de
Tabla 2.4.1. Clasificación por edades de empleados técnicos y profesionales de un
intersección, unión y complemento. Por ejemplo, el conjunto B 1 n A4 forma-
grupo de hospitales
do por médicos cuya edad es de más de· 35 años, y n(B I n A4) = 75. ~
Categoría del trabajo
., '
:S '.!:°)
,1.,
26-~'1()
A:,
~1-:Ei
A,
> 3:"> Total
El conjunto 8 u A está formado por el personal del laboratorio clíni-
2 2
~'
1~
co, o por el personal con edades entre 26 y 30 años, o con ambas caracterís-
B1 Médicos O 5 o·
.o ¡5 105 ticas, y n(B u A ) = 120 + 513 - 30 = 603. Para calcular 11(8 2 u A2), el
~
B, Servicios clínicos de laboratorio 20 30 35 3:) 120 2 2
nú1nero (30) que es tanto el personal del laboratorio clínico como el perso- ~·
s; Servicios de alimentación 3 (i G 10 25 nal con edad entre 26 y 30 años se resta porque está dos veces, es decir, está ¡~'
B4 Servicios de registros médicos 7 15 8 12 42 incluido tanto en la figura 120 como en la figura 513. El complemento de
B5 Servicios de enfermería 2UO .:$i5 442 203 1220
A , A. está formado por las personas de 35 años o menos, por lo tanto n(A. 4 ) ~
8 6 Fannacia l 12 8 3 24 4 4
8 7 Tecnología radiológica 4 10 19 12 45 =1766-385 =1381. ~
8 8 Servicios terapéuticos 5 o·
.o 15 10 53 ~
8 9 Otros servicios técnicos 20 35 50 25 130 1.,.
y profesionales EJERCICIOS-----------------
~
·rot<1l 260 513 608 38,7 1766
2.4.1 La siguiente tabla muestra el número de pacientes internados en un hospital
psiquiátrico en un período de un año. Los datos están tabulados en forma
1,
entrecruzada por diagnóstico y edad. ~
Supóngase que de 50 mujeres que recibieron cuidados prenatales, 4 Edad (años) ~
tienen sangre tipo AB. Si las 50 mujeres conforman el conjunto universal A,
U, el subconjunto A estará formado con las 4 mujeres de sangre tipo AB, y A, A, A, A, 6.'i y
~
A, A} Total
el complemento de A, A, está formado con las 46 mujeres que tienen otro !5 a 24 2.'i a 34 ~,; a 44 45 a 54 .'i.'i a 64 m;is
Diagnóstico <l.'i ~
tipo de sangre. El conjunto complemento se muestra en la figura 2.4.3. ;,H
11
" 11 7 '!.7 '!.O
'
"'
B Reacci,ífl psicótica
I
invo\utiva '.!·I
.1
Ejemplo 2.4.1 Con frecuencia, es útil poder identificar conjuntos y subcon-
juntos representados por datos de tabulación cruzada, tal como se muestra
8 2 ReaccÍÓfl maniaco- ll ' " '11

.
depresiva
~
10:) H 7 CH9
:", \lO l 10 1110
en la tabla 2.4.1, en la que aparece el personal profesional y técnico de un B, Esquizofreflia 16'.!
grupo de hospitales, tabulado·según.la edad y puesto. El número de elemen- B~ Reacciones 11 '!.!i H l7 '!.9 1'
"
psiconcuróticas
~
'..!'!..J
tos de un conjunto A se representa con n(A) y se utiliza la notación de con-
8 5 Alcoholismo
" 7 11
,,
71
.,
l)i'l '!.ti
' 1'.{
juntos para identificar algunos de los subconjuntos definidos en la tabla.
En la tabla 2.4.1 los conjuntos A 1 hasta A4 están formados por el personal
8 Drogadicción
6 ",, ' ' ' 1()'.{() ~
'!.'!.), '!.~l\l '!.~/, ]!() '!.·\
!'!.li
~
Total
que entra en los grupos de edad especificados y los conjuntos 8 1 hasta 8 9
están formados por el personal que cae dentro de las categorías de empleo Con base en los datos de esta tabla. explicar con palabras los siguientes con- ~
juntos y dar el número de pacientes en cada uno:
~
b. B.-, n Al;

l
a . .-\. 1 n H:1
c. B:1 U.--\., d ..\; U B_·,
e. A 1 f. (..\.1 U .-l..~,l n B.1

2.4.2 De los 50 pacientes en el tercer piso de un hospital, 35 son mujeres y 12

Figura 2.4.3. Diagrarna de Vcnn que n1ucstra [os conjunto~ A y A.


tienen n1ás de 70 años de edad. De entre los pacientes de 70 años. ocho son
~1
~~~~~--------................1
tS:

78 Algunos conceptos básicos de probabilística Técnicas de conteo: permutacio11es y co"1hinaciones 79


mujeres. ¿Cuántos de entre los 50 pacientes son mujeres o no tienen 70 años
Formas de llenar Formas de llenar Número
de edad? (Utilizar un diagran1a de Venn para responder a la pregunta.) Formas de llenar Formas de llenar
la primera posición la segunda posición la tercera posición la cuarta posición de los arreglos

A~B ~-----0
2.5 TÉCNICAS DE CONTEO: 2
PERMUTACIONES Y COMBINACIONES _ _ _ _ _ __ ....______ e 8 e 3

En esta sección se presentan algunas técnicas útiles para contar el número


-------- o o• o• '5
e e
d~ eventos que cun1plen con algún conjunto de condiciones. Estas técnicas 6

sÜn útiles para calcular la probabilidad de un evento cuando el número de ~A C B 7


eventos posibles es muy grande.
• _.......,..---- o o •
'. ....______ e A e 9
Factoriales Dado un número entero positivo n, el producto de todos los 10
-------- O oA o
números enteros desden hasta 1 se llama factorial den y se escriben! A 11
e e
Los siguientes son ejemplos de factoriales 12

~A e A 13
l O! 10 · 9 · 8 · 7 · 6 · 5 · 4 · 3 · 2 · 1 14
-
o.'
e~ o o
5·4·3·2· 1 15
~B -A ;
:! : 2· l 0------A 16

D=CC---- A • 17
y en general
• A
e
"
19
B
n! = 11(11 - l)(n - 2)(11 - 3) · ... · l
•e
º~:======
e 20
A 21
Por definición O! = 1. Tarnbién se puede escribir
e A 22

101 = 10 · 91 ~e===:=:::, A

A
23
24
5! = 5 · 4!
n!=n(n-l)! Figura 2.5.1. Diagrama de árbol que muestra los posibles arreglos de cuatro
,. objetos puestos en hilera.
Por medio de factoriales es posible responder preguntas respecto al número
de formas en que pueden acomodarse los objetos. Permutaciones Unapennutació11 es un arreglo ordenado de objetos.
Los 24 arreglos de los medios de cultivo mostrados en la figura 2.5.1
Ejemplo 2.5.l Se tienen cuatro envases con medio de cultivo y en cada uno son las posibles permutaciones de cuatro objetos tomados de cuatro en cua-
de ellos se incuba un organismo diferente. ¿En cuántas formas se pueden tro. En ocasiones hay más objetos que posiciones para llenar. Supóngase
acomodar en un anaquel'? que en el ejemplo anterior se tienen sólo dos posiciones disponibles en el
' anaquel. ¿En cuántas formas se puede llenar estas dos posiciones utilizando
Solución La respuesta es 4! = 4 · 3 · 2 · 1 = 24 formas. Una gráfica auxiliar, los cuatro cultivos?
llamada diagrama de árbol, es muy útil para visualizar las posibilidades. Las
'
letras A. B, C y D representan los cultivos, y las posiciones :-.e representan Solución Para responder a esta pregunta es necesario determinar e! número
como primera, segunda, tercera y cuarta posición. El diagrama de árbol en de posibles perrnutaciones para cuatro cosas tomadas de dos en dos. Se
la figura 2.5.1 representa los posibles arreglos. tienen cuatro objetos A. B, C y D con los cuales llenar la primera posición.
~
80 ~
Algunos conceptos básicos de probabilistica Técnicas de conteo: permutaciones y combinaciones 81
~
Formas de ,!enar Formas de llenar Número
la primera p:sición la segunda posición n(n - l)(n - 2) · · · (n - r + l)(n - ,·)(11 - r - l) · · Jo¡

e
de permutaciones
,,P,. =
(n - r)(n - r - 1) · · · 1 ~-
·~======= e
o
2
3
El denominador y los términos en el numerador fuera de (n - r + J) se
cancelan quedando el lado derecho de la ecuación 2.5. l.
~
...
·~===
En el siguiente ejemplo se ilustra el cálculo de permutaciones. .ii..
A
e
4
5 Ejemplo 2.5.2 En un departamento de salud del estado, hay cinco oficinas ·i..i
adyacentes que serán ocupadas por cinco enfermeras A, B, C. D y E. ¿De
o 6 ri..

e~===
cuántas formas se puede asignar las oficinas a las enfermeras?
! }11-.
A 7
Solución La respuesta se obtiene con el cálculo de 5 P5 : ¡¡....
e
o
e
9 5, .....
.p_ ~ . ~ 5 · 4 · 3 · 2 · 1 ~ 120
' ' (5 - 5)'

º~=====::: B
A

e
Figura 2.5.2. Diag.rama de árbol que n1uestra las pennutacioncs de cuatro cosas,
TO
11
12
,Si fueran seis enfermeras y a cuatro de ellas se les asigna cuatro ofici-
nas contiguas, entonces, se necesita calcular el número de permutaciones de
seis objetos, tomados de cuatro en cuatro:
tomadas de dos en dos.
6! 6 · 5 · 4 · 3 · 2!
Después de llenar esa posición se tienen tres objetos con los .que se ha de 0P4=(6-4)! 360
2'
llenar la segunda posición. El diagrama de árbol (figura 2.5.2) es de gran
utilidad para ilustrar el proc~dimiento.
De acuerdo con la figura 2.5.2, el número de permutaciones posibles es Combinaciones Una co111bi11ación es un arreglo de objetos sin importar el
4 · 3 = 12 permutaciones posibles de cuatro cosas. tomadas de dos en dos. orden. Por medio de 11 C, se representa el número de combinaciones de 11
La letra n representa el número de objetos distintos de los que se derivará cosas, tomadas de r en r.
un arreglo ordenado, y r representa er número de objetos en el arreglo. El En la figura 2.5.2 las permutaciones de cuatro cosas, tomadas de dos en
número de posibles arreglos ordenados se expresa como el número de per- dos, se forma~ con los 12 arreglos siguientes:

,~
mutaciones de 11 objetos tomados de r en r y se escribe en forma abreviada
como 11 P,.. En general AB
AC
,,P, = n(n - l)(n - 2) · · · (n - r + l) (2.5.1) AD
BA
~
Tan1bién se puede calcular 1,Pr por medio de una fracción que involucre fac-
toriales como sigue:

,,Pr = (n
11 !
r)!
BC
BD
CA
CB
CD
¡~
(2.5.2)
DA
DB
La ecuación 2.5.2 desarrollada es
DC

• - . --~~-,= =
1"1
• 82 Algunos conceptos básicos de probabilística Técnicas de conteo: permutaciones y combinaciones

10! 10 · 9 · 8 · 7 · 6!
83

Se observa que exactamente la mitad de los pares son idénticos, con ex- 210
1 cepción del orden en que aparecen las letras. Al empatar estos pares se tiene: ,oCo = 6!4l 6[4,3,2, 1

AB AC AD BC BD CD Permutaciones de objetos que no son todos los diferentes En el estudio


BA CA DA de permutaciones, se considera el caso donde todos los objetos permutados
CB DB DC
son diferentes. En algunas ocasiones se puede tener, en un conjunto de obje-
tos para permutar, uno o más subconjuntos de elementos que son idénticos.
En algunos casos probablemente no es necesario hacer una distinción
Surge ahora la pregunta de cuántas permutaciones son posibles bajo estas
~ntre los arreglos AB y BA, por ejemplo. Se pueden considerar como un
circunstancias. Parece lógico que el número pudiera ser menor que cuando
mismo subconjunto, en cuyo caso el orden no cuenta y se refieren al arreglo
todos los objetos son diferentes.
como combinación. Mientras que en el ejemplo del cultivo se tienen 12 per-
mutaciones, se tienen únicamente 6 combinaciones. En otras palabras, se
tienen dos permutaciones por cada combinación. En general se tienen r! per- Ejemplo 2.5.4 En el caso de las enfermeras A, B, C, D y E, a quienes se les
1
mutaciones por cada combinación de II objetos tomadas de r en r, o dicho de asignó oficinas contiguas, supóngase que dos de las enfermeras quieren que
otra manera, se tienen r! veces tantas pennutaciones como combinaciones: sus oficinas estén pintadas de blanco, otras dos las quieren de amarillo y la
enfermera restante la quiere de verde. ¿Cuántas secuencias de color son
,,Pr = r!,1Cr (2.5.3) posibles?

Si la ecuación 2.5.3 se resuelve para nCr, se tiene:


Solución Se supone que el color de las dos oficinas blancas y amarillas son
idénticos. La secuencia posible de colores para las oficinas contiguas es la
,1Pr siguiente:
,.Cr
r!
BBAAV AABBV ABBAV
Para obtener la fórmula para conocer el número de combinaciones de n BBAVA AABVB ABBVA
cosas tomadas de r en r el numerador se escribe de acuerdo a la ecuación 2.5.2. BBVAA AAVBB ABVBA
• BVBAA AVABB AVBBA
n' VBBAA VAABB VABBA
(.
,1 'r -- r!(n - r )'· (2.5.4) BABAV ABABV BAABV
BABVA ABAVB BAAVB
! Ahora se puede mostrar que al usar la ecuación 2.5.4, para obtener el BAVBA ABVAB BAVAB
número de combinaciones para cuatro elementos tomados de dos en dos. se BVABA AVBAB BVAAB
obtiene seis: V BABA VABAB VBAAB
¡

4! 4 · 3 · 2! Tal como se puede apreciar, hay 30 secuencias posibles. Si cada enfermera


' ,G·2 = 2!2! = 2 · 1 · 2! 6
hubiese querido un color diferente, entonces, habría 5P 5 = 5 ! = 120 posibles

. ' Ejemplo 2.5.3 Supóngase que el conductor de una terapia de grupo en una
secuencias.
Supóngase que las dos oficinas blancas son distinguibles, ya que una de
ellas es blanca ostión, y las amarillas también son distinguibles: una es
clínica de salud mental tiene 10 pacientes con los que forma un grupo de 6.
¿Cuántas combinaciones posibles de pacientes son posibles. amarillo claro y la otra es amarillo oscuro. Las diferencias se marcan como
subíndices: B 1, B 2, A 1, A 2 . Se puede tomar cualquiera de las secuencias
Solución La respuesta es anterion~s y obtener tres secuencias adicionales al permutar los subíndices.
84 Algunos conceptos básicos de probabilística

Esto se hace pennutando los subíndices de blanco, y dejando los amarillos


Ejercicios

Ejemplo 2.5.5 Supóngase que el departamento de servicios de alimentos de


85 t
¡...
fijos. De esta forma se obtienen 2! permutaciones. Se obtienen 2! secuen-
cias adicionales al permutar los subíndices del amarillo y dejando los blan- un hospital en un día sirve dos vegetales blancos, dos verdes y dos amari- ¡~
cos sin cambio. Puesto que sólo hay una verde, no es importante su efecto
llos. ¿Cuántos arreglos distinguibles de estos vegetales se pueden hacer si ¡lto,,
sólo se tiene interés en los vegetales distinguibles según su color? ilto,,
sobre las pennutaciones, pues sólo hay 1! permutaciones. Sin embargo, si
hubiera dos verdes distinguibles, entonces, se tendría que tomar en cuenta
Solución Con la ecuación 2.5.5 se calcula la siguiente respuesta:
ljt,,,¡
2! permutaciones posibles. A partir de la primera secuencia se tienen cuatro l. .
posibles secuencias cuando se distinguen las oficinas blancas y amarillas:
6' 720
nP:!.2.2 90
B1 B2 A1 A, V 2!2!2! 8
82 B1 A1 A, V
81 B2 A2 A, V
82 81 A
Un caso especial de importancia de la ecuación 2.5.5 ocurre cuando
2 A, V
sólo existen dos tipos de objetos, es decir, cuando r son de un tipo y n - r
Dado que esto se puede hacer para cualquiera de las 30 secuencias anterio-
son de otro tipo. En este caso se tienen: 1'...""
res, se puede apreciar que hay 30 · 2 ! · 2! · 1! = 120 secuencias cuando todos 1i...
los objetos son diferentes. Por supuesto, esto es igual a ? = 120 secuen- n!
cias, como se vio con anterioridad.
5 5 P ~n-r ,,(;r
,, = r!(n - r)'· (2.5.6)

Si ll Pll¡ , /!,, ... , 11¡ es igual al número de secuencias distinguibles que


pueden forrnafse con 11 objetos, tomados den en II cuando n , es de un tipo, De acuerdo con esto, se aprecia que el número de permutaciones distin-
1
n 2 es de un segundo tipo, ... , y nk son del k-ésimo tipo y 11 = 11 + 11 +... + tas de n cosas·, de las que r son de un tipo y n - r son de otro tipo, es igual al
1 2
nk, se pueden generalizar estos resultados como sigue: número de combinaciones den cosas diferentes tomadas de r en r.

111 = (,,P,,'- ,,, .... , 11 ,)11 1!11:/ ... n1,!

Si se resuelve para // P11¡, ll1, ... , 11¡ se obtiene EJERCICIOS~~~~~~~~~~~~~~~~~

2.5.1 Calcular las siguientes expresiones:


.n!
,.P,,, ,,.,, .... "• a. 1;P._,_ b. 1 P~ c. 1,,J',,
11 1!n'.?! ... n¡,! (2.5.5) d. úc':!. e. ,c.~ f. 111C5
g. ¡;C,, h. '.Je.~ i ..~c._,_
Con el mismo ejemplo se tiene 2.5.2 Una enfermera de salud pública prepara un programa para reunirse con
madres en estado de gravidez. Tiene que cubrir cuatro temas en cualquier
orden.
~
-,
5 P2.'.?.1 "·
2!2!1 !
120
4
30
a) ¿Cuántos programas diferentes puede preparar?
!. . . . .

b) Suponer que en el último momento se da cuenta que tiene tiempo sólo

que es el número de secuencias previamente listadas.


para tres temas. ¿Cuántos temas diferenles puede presentar si.considera que
todos son de igual importancia?
2.5.3 Para el almuerzo, un paciente hospitalizado puede elegir una de cuatro
carnes, dos de cinco vegetales y uno de tres postres. ¿Cuántos menús dife-
""'
!. . . .

'~
Otro ejemplo es el siguiente.
rentes puede formar si selecciona el número especificado de cada grupo?

!~
t:...
./
87
• Cálculo de la probabilidad de un evento
86 Algunos conceptos básicos de probabilística
eventos favorables divididos entre el número total de eventos posibles. Por
2.5.4 Un terapista físico al planear su programa de trabajo encuentra que hay siete lo tanto, la respuesta a la pregunta es
actividades por cubrir ese día.
a) Si puede desempeñar sus actividades en cualquier orden, ¿cuántos pro- n(A¡) 260 .15
gramas puede preparar? P(A 1) - -;;fu¡ 1766 -
b) Si decide tomarse la tarde libre de tal forma que sólo puede atender tres
L.
actividades, ¿cuántos programas puede preparar?
2.5.S Un educador de salud tiene tres carteles para pegar en la antesala del centro Probabilidad condicional En ocasiones, el conjunto de todos los "resulta-
de salud. ¿De cuántas formas puede presentar los carteles?
dos posibles'' puede constituir un subconjunto del conjunto universal. En
2.5.6 Supóngase que en un laboratorio hay cuatro trabajos para hacer en una tarde
otras palabras, la población de interés se puede reducir mediante algún con-
_t, y cinco gentes para hacerlos. ¿De cuántas formas se puede asignar a cuatro
de las cinco gentes los cuatro trabajos? junto de condiciones no aplicables a la población total. Cuando se calculan
2.5.7 Una investigadora tiene cuatro fármacos que quiere probar, pero sólo tiene las probabilidades con un subconjunto del conjunto universal como denomi-
suficientes animales experimentales para probar 3 de los fánnacos. ¿Cuán- nador, el resultado es una probabilidad condicional.
tas combinaciones puede probar? El concepto de probabilidad condtcional se ilustra con los datos de la
,' 2.5.8 Un educador de salud tiene comprometidos a cuatro jefes de comunidad, tabla 2.4.1. Si se desea calcular la probabilidad de que un empleado selec-
dos hombres y dos mujeres, para que aparezcan en un programa de opinión. cionado aleatoriamente de entre 1766 de ellos sea un médico, es una proba-
¿De cuántas fonnas puede colocar a estas personas en una hilera si desea bilidad no condicionada debido a que no se han impuesto condiciones sobre
distinguir a los participantes del panel sólo con base en su sexo? el conjunto de todos los posibles resultados, y se calcula como sigue:
2.5.9 Ocho animales experimentales son inoculados con un cierto fánnaco, tres
con el tipo A, tres con el tipo B y dos con tipo C. Cada animal debe ser n(B 1) 105
' puesto en una de las ocho cajas adyacentes para su observación. Si los ani· P(B 1) - n( U) - 1766 - .OG
males son distinguibles sólo por el tipo de fármaco recibido, ¿cuántos
arreglos diferentes son posibles?
Sin embargo, supóngase que se reduce el conjunto de todos los posi-
2.5.10 Hay diez candidatos para ocupar tres vacantes en la dirección de un h9spital.
( ¿De cuántas formas se pueden ocupar las tres vacantes? bles resultados a aquellos empleados que tienen más de 35 años de edad
2.5.11 ¿De cuántas formas pueden siete gentes entrar a la fila de una cafetería, si (conjunto A ). Ahora, ¿,cuál es la probabilidad de que un empleado sea un
médico dado 4 que es seleccionado aleatoriamente de entre el conjunto de
sólo hay una fila?
empleados de más de 35 años de edad? En la tabla 2.4.1 hay 385 miem-
' bros del conjunto A (empleados con más de 35 años de edad). También
' 4
' se aprecia que 75 de ellos son médicos y que esos 75 son el número de
2.6 CÁLCULO DE LA PROBABILIDAD DE UN EVENTO _ __ miembros del conjunto B n A • Así, la respuesta a la pregunta se calcula
I 4
como sigue
A continuación se utilizan los conceptos y técnicas de la sección anterior
n(B 1 n A 4 )
para calcular las probabilidades de evento específico. Se presentan también P(B 11A 1) n(A,)
algunos conceptos complementarios.
'
-
-
75
385
=

19
,'
Ejemplo 2.6.1 Para fines ilustrativos se usará el ejemplo 2.4.1 y los datos
•' de la tabla 2.4.1. Supóngase que un empleado es elegido aleatoriamente de
. entre todos los empleados. ¿ Cuál es la probabilidad de que esta persona
tenga 25 años de edad o menos?
La línea vertical en P(B 1 1A4) se lee ''dado".
Se puede obtener la probabilidad condicional, P(B I l A4) en otra forma .
Supóngase que se divide el numerador y denominador entre n( U), el núme-
~ Solución La posibilidad de elegir algún empleado es igual a la posibilidad ro en el conjunto universal, es decir, el número total de empleados. Esto da:
,'
de elegir a cualquier otro y la probabilidad se define como el número de
88 Algunos conceptos básicos de probabilística Cálculo de la probabilidad de un e1•ento 89

n(B 1 n.4_1 ) sea Un médico, por ejemplo, la probabilidad se calcula utilizando el total
n(U) marginal, 105, e ignoran.do la clasificación de edades.
P(B, IA,) En general se puede decir que cuando uno o más criterios de clasifi-
n(A 4 )
n(U) cación son ignorados al calcular una probabilidad, la probabilidad resultante
se llama probabilidad ,narginal.
El numerador de esta expresión es la probabilidad de que un empleado Ahora, respecto al numerador de P(B 1 1A4), este numerador es la proba-
seleccionado aleatoriamente de entre todos tenga ambas características: ser bilidad de la ocurrencia conjunta de B 1 y A4 , es decir, es la condición de que
médico y tener más de 35 años de edad. La ecuación completa se escribe: simultáneamente ocurra que el sujeto seleccionado sea un médico y que ten-
ga más de 35 años de edad. Ya se mencionó anterionnente que si dos even-
,s tos, A y B, no pueden ocurrir simultáneamente, es decir, que A n B = 11,
P(B,IA,)
P(B I n A._1) 17ti6 .042.5
. 19 entonces A y B son mutuamente excluyentes. Al consultar la tabla 2.4.1 se
f'(A 4 ) - '"' - .2190 -
lí66
tiene para el conjunto de empleados que A n B = Sli, puesto que los eventos
"ser un médico" y "tener 35 años de edad o n1enos", son mutuamente ex-
Este resultado sugiere la siguiente definición general para la probabilidad cluyentes.
condicional: La tercera propiedad de probabilidad dada previamente establece que la
probabilidad de ocurrencia de cualquiera de los dos eventos mutuamente
excluyentes es igual a la suma de sus probabilidades individuales. En el
DEFINICIÓN~~~~~~~~~~~~~~~~~--, ejemplo, la probabilidad de que sea un médico o que tenga 25 años de edad
o menos se calcula de la siguiente forma:
La probabilidad condicio!1::I de A dadv B es igual a la
probabilidad de A n B dividida entre la probabilidad de B, con P(B¡) + P(A¡)
¡o;;
1766 +
260
!766 = .06 + .15 .21
la probabilidad de B diferente de cero.

¿Cuál es la probabilidad si los dos eventos no son mutuamente exclu-


Esto es yentes? Este caso es cubierto mediante la regla de la adición, la cual esta-
blece lo siguiente:
P(,1 n B)
P(AIB) P(B) a/e O
P(B) (2.6.1)
DEFINICIÓN _ _ _ _ _~ - - - - ~ - ~ - - - - - - ,
Cuando se pregunta, ¿cuál es la probabilidad de que un empleado, ele-
gido aleatoriamente de entre todos los empleados (tabla 2.4. l ), tenga más de Dados dos eventos A y B, la probabilid?d de que ocurra el
35 años de edad?, se pregunta por la probabilidad ,narginal. Esta probabi- evento A. el evento B o ambos, es igual a la probabilidad del
lidad provee el denominador para la probabilidad condicional, P(B 1A ). El evento A tnás la probabilidad del evento B. menos la probabi-
1 4
punto de interés está en la probabilidad asociada al total n1arginal y no en lidad de que ocurran simultáneamente.
otros criterios de clasificación. Al calcular

P(.4 4 ) = 1~~6 = .2180


La regla de adición puede escribirse como
está implícita una falta de interés en la clasificación de B. Análogamente, si
el interés está en la probabilidad de que un empleado elegido aleatoriamente P(A U B) - P(A) + P(B) - P(,1 n B) (2.6.2)
r#
'
1
90 Algunos conceptos básicos de probabilística Cálculo de la probabilidad de un evento 91
Con los datos de la tabla 2.4. I calcúlese la probabilidad de que e!
Obsérvese nuevamente la ecuación 2.6.3
{
empleado elegido aleatoriamente sea un médico o tenga 35 años de edad o
ambas características.
P(A n B) - P(B)P(,{IB)

P(B 1 U A,) - P(B 1 ) + P(A,) - P(B 1 n A )


4 Supóngase que el evento B no tiene efectos sobre la probabilidad de A. En
!05 J85 75
~ Ji66 + 1766 - 1766 otras palabras, supóngase que la probabilidad del evento A es la misma,
- .23 independientemente de que el evento B ocurra o no. En tal caso P(A I B) =
P(A), por lo que se dice que A y B son éventos independientes.
En el siguiente ejemplo se ilustra el concepto de independencia.
También hay que notar que los 75 empleados que tienen 35 años y son
médicos están incluidos tanto en los 105 que son médicos como entre los
Ejemplo 2.6.2 En un grupo de preparatoria, que consta de 60 mujeres y 40
385 que tienen más de 35 años de edad. Puesto que al calcular la probabili-
varones, se observa que 24 chicas y 16 muchachos usan lentes. Si un estu-
dad esos 75 han sido sumados dos veces al numerador, deben ser restados
una vez para evitar duplicidad. diante es elegido aleatoriamente, la probabilidad de que el estudiante use
lentes, P(E), es 40/ IOO o .4. ·
Otra regla importante para el cálculo de la probabilidad de un evento es
la regla de la multiplicación. Esta regla se sugiere en la definición de la
a) ¿Cuál es la probabilidad de que un estudiante elegido aleatoria-
probabilidad condicionada y en la ecuación 2.6.1:
mente use lentes dado que es un estudiante varón?

P(A n B) Solución La formula para calcular la probabilidad condicior.al da como


P(AIB) - P(B) , P(B) ,fo O
l. resultado:
Si se reescribe la ecuación 2.6. l se tiene:
P(EnB) 161100
1 P(EIB) e P(B) - 401100 - ·4
P(A n B) - P(B)P(AIB) (2.6.3)
De esta forma, la información adicional de que el estudiante sea un varón
La ecuación 2.6.3 indica que la probabilidad de la ocurrencia conjunta
no altera la probabilidad de que el estudiante use lentes y P(E) = P(E I B).
de los eventos A y B es igual a la probabilidad condicional de A dado B
Se puede decir que los eventos "ser varón" y "usar lentes" en ese grupo, son
' multiplicado por la probabilidad marginal de B.
independientes. Se puede mostrar que los eventos "usar lentes". E, y "no ser
Para ejemplificar se utiliza la ecuación 2.6.3 para calcular la probabi-
varón", B, también son independientes:
lidad de que un empleado elegido en forma aleatoria de entre un grupo de
empleados, sea médico y tenga más de 35 años de edad. P(E n li) 241100 24
P(Elli) .4
P(li) 601100 60
::
P(B I n A,) - P(A,)P(B ¡IA 4 ) b) Si los eventos de que el estudiante use lentes y sea un varón ocurren
{
385 i.'i
= 1766 • 385
simultáneamente, ¿cuál es la probabilidad conjunta de ocurrencia?
'5
= 1766
Solución Con el uso de la regla dada en la ecuación 2.6.3 se tiene

Por supuesto, esto concuerda con el cálculo que puede hacerse de manera P(E n B) = P(B)P(EIB·
directa a partir de la tabla 2.4.1, al obtener la razón del número de los resul-
pero, tal como ya se mostró, los eventos E y B son independientes, enton-
tados favorables, 75, para el total de resultados posibles, 1766.
ces, se sustituye P(E I B) por P( E) para obtener

~
92 Ejercicios 93
,4/gunos conceptos básicos de probabilística

EJERCICIOS~~~~~~~~~~~~~~~~~
P(E n E) - P(B)P(E)
40" 401
1100A 2.6.1 Utilizar el ejercicio 2.4.l para cak:ular:
100

.16 a. P(A 1 n B~) b. P(Br, U A,;) c. P(B.1 UA. 1 )


d. f'(!l.,; U B,,) e. P(A¡) f. P[(A. 4 U Ar,) n B:11

En general, cuando dos eventos, A y B, son independientes y tanto P(A ) 2.6.2 La tabla en la página siguiente se refiere a los primeros 1 000 pacientes inter-
como P(B) son diferentes de cero, la probabilidad de su ocurrencia conjun- nados en una clínica de atención a niños con retraso mental según su tlasifi-
ta es igual al producto de sus probabilidades individuales. Esto es, cación de diagnóstico y niveles de inteligencia. Calcular para este grupo:
a) P(A 3 n 8 4 ).
P(A n E) - P(A)P(B) b) La probabilidad de que un paciente, elegido al azar, tenga severos pro-
(2.6.4)
blen1as de retraso mental.
si e) La probabilidad de que un paciente, elegido al azar. no tenga problemas
de retraso mental o esté en la frontera (umbral).
d) La probabilidad de que un paciente, elegido al azar, padezca retraso pro-
P(A) 4c O, P(B) 4c0 fundo y tenga síndrome de Down.
e) La probabilidad de que el paciente tenga severos problemas de retraso
Antes de terminar esta sección es conveniente realizar un repaso. La 1nental dado que tenga .síndrome de Down.
probabilidad de un evento A es igual a 1 menos la probabilidad de su co1n- 2.6.3• En un grupo de 502 personas se detenninó que la distribución de grupos de
plemento A, y sangre es la siguiente:

P(A) - 1 - P(A) (2,6.5) Grupo sa11g11(nt'o N1í111er(,

Esto se deduce de la tercera propiedad de probabilidad, puesto que el o :!2li


,\ 20G
evento A. y su complemento A, son mutuamente excluyentes.
B 50
.,e 20
Ejemplo 2.6.3 Suponer que, de 1200 admisiones al hospital durante cierto
periodo, 750 son admisiones privadas: Si se designa a éstas como el conjun- ·roial 502
to A, entonces Aes igual a 1200 menos 750, o 450. Resulta el cálculo
Si una persona es elegida al azar de entre este grupo, ¿cuál es !a probabilidad
P(A) = i50 / 1200 = .625 de que pertenezca a los siguientcs·grupos de sangre·]
y a) O, b) A, e) B d) AB
2.6.4 Supóngase que los daros del ejerCicio 2.6.3, clasificados por género, son los
P(A¡ - 450/1200 - .3i5 que se indican en la tahla de la página 95.
Para este grupo de personas. ¿se puede decir que el género y grupo sanguí-
y, por tanto, neo son independientes') Demostrar este enunciado a través del cálculo de las
probabilidades apropiadas.
l'(A) - 1 - P(A) 2.6.5 Si la probabilidad de ser zurdo en un grupo de personas es de .05. ¿cuál es la
probabilidad de ser díestro (suponer que nadie es an1bidiestro) .
.375 = 1 - .625 2.6.6 La probabilidad de que un paciente seleccionado aleatoriamente de entre la
.3i5 = .37.~ población de un hospital sea del sexo tnasculino, es de .6. La probabilidad de
que un paciente varón sea operado es de .2. Si un paciente elegido aleatoria·


~
95
Algunos conceptos básicos de probabilística Preguntas y ejercicios de repaso
94
Sexo

Grupo sanguíneo Masculino Fe1neni110 Total


,S! oo oe.o oe<". ~

3 fg
N
lg C
o 113
103
113
103
226
206
E.:': ""' - A
B 25 _,
')" 50
AB !O !O 20

~
o ~¡u.")
·:: u.") u.") o ~
~
~¡o
~ ~ ·rota! 251 251 502
'~
" mente de entre los internos es hombre, ¿cuál es la probabilidad de que el
"'~1~('-(.0
~~.:::c-.i
~
N
<C ocj~ paciente esté internado para cirugía'?
2.6.7 En una población de pacientes hospitalizados, la probabilidad de que uno de
e\!os, elegido aleatoriamente, tenga problemas cardiacos es de .35. La proba-
,g bilidad de que un paciente con problemas cardiacos sea un fumador es de
" -% .86. ¿ Cuál es la probabilidad de que el paciente elegido al azar de entre la
jJ
o ~
.,.'3!"'7'::X:\C
... - oc
<C
~ \C Io
- - <C

."
"¡;

"¡;
>
~
~
~ población sea fumador y lenga problemas cardiacos?

z, .,~¡r---,r~ 2,7 RESUMEN----------------


"' ~
-
...::·"'

"
l..") G<"l
oc 1

En este capítulo se presentan algunas de las ideas básicas y conceptos de pro-


babilidad. El objetivo es proveer. intuición suficiente sobre la materia, de ma-
nera que el aspecto probabilístico de la inferencia estadística pueda ser fá-
,..,.s¡::r:"1"::-.I
~ ~ :: ~ = ºI: cilmente comprendido y apreciado.
~~

PREGUNTAS Y EJERCICIOS DE R E P A S O - - - - - - - -
'<::
ºI
~ ~ =
1: ~ - = -1
-
<.C oce
~
::: ,,!::
~ ~
l. Definir \os siguientes conceptos:
b) Probabilidad objetiva
a) Probabilidad
"
~
e) Probabilidad subjetiva
d) Probabilidad clásica
: : ·= -~ e) Conceptos de frecuencia
fJ Eventos mutuamente

rte~ !i l!¡
excluyentes
relativa de probabilidad
h) Probabilidad marginal
o g) Independencia
j) Probabilidad condicional
i) Probabilidad conjunta
§
~-52t.~':.I~· 2. Nombrar y explicar las tres propiedades de probabilidad.
?~ -=-=~':);:;~;:::
l'..r.lU10 O
,
ei,:: 3. ¿Qué es un conjunto'? Dar tres ejemplos de conjuntos.
::e- e::" ' ::e.... ::::... ::e:<r. 4. Definir los siguientes conceptos:
'
a) Conjunto unitario b) Conjunto vacío
e) Conjunto universal d) Subconjunto
e) Conjunto disjunto j) Complen1enco
Preguntas y ejercicios de repaso 97
96 Algunos conceptos básicos de probabilística
azar de entre las 25 solicitantes, ¿cuál es la probabilidad de elegir una persona
S.¿Bajo que condiciones se consideran iguales dos conjuntos?
de más de 30 años o con grado de maes!ría?
6.Definir y dar un eje,nplo de la unión de dos conjuntos.
14. La siguiente tabla muestra 1 000 aspirantes a la escuela de enfermería, clasifi-
7.Definir y dar un ejemplo Je la intersección de dos conjuntos. cadas de acuerdo a las calificaciones obtenidas en el examen de ingreso a la
8.¿Qué es un diagrama de Venn?
escuela profesional y la calidad del bachillerato de procedencia.
9.Definir y ejemplificar los siguientes concepcos:
a) Factorial b) Permutación
e) Combinación d) Regla de adición
Calidad de la secundaria
e) Regla de multiplicación Baja Pro1nedio Superior
10. El conjunto C está fom1ado por los habitantes de cierta ciudad que votaron a
P1111taje {P) !Al {SI Total
favor de la íluoración del agua. El conjunto D está formado por los habitantes
de la 1nisma ciudad que tienen niños en edad de preescolar. Definir: 105 60 55 220
Bajo (B)
a)CuD b)AnD Medio (M) 70 175 145 390
e) e d) fj Aho {A) 25 65 300 390
11. A cien mujeres casadas se les preguntó qué método de control natal preferían.
La siguiente tabla muestra [as 100 respuestas de clasificación entrecruzada por Total 200 300 500 1000
nivel de educación.
a) Calcular la.probabilidad de que una aspirante, elegida al azar:
Nivel educativo J. Obtenga una puntuación baja en el examen.
/l-1érodo 2. Proceda de un bachillerato de alto nivel.
de control Secundaria Bachilferato licencia111 ra 3. Obtenga una calificación baja y proceda de un bachillerato de alto
11(/{(II (A¡ 18) (CJ Total nivel.
4. Que obtenga una calificación baja, dado que procede de un bachille-
s 15 8 7 30
T ralO de alto nivel.
3 7 20 30 5. Haya obtenido una calificación alta o que proceda de un bachillera-
V 5 5 15 25 to de alto nivel.
w 10 3 2 15 b) Calcular las siguientes probabilidades:
1·01al 33 23 44 l. P(A) 2. P(H) 3. P(M)
100
4. P(A I H) 5. P{M n P) 6. P{H I S)
15. Si la probabilidad de que una enfermera de salud pública encuentre en casa a
un paciente es de .7, ¿cuál es la probabilidad (suponiendo que son indepen-
Especificar el número de miembros de cada uno de los siguientes conjuntos: dientes) de que en dos visitas hechas en un día, ambos pacientes estén en casa?
a¡S b) vn e e¡ A d) w 16. La tabla de la página siguiente muestra los resultados de 500 entrevistas du-
e) ú' f) B g) TnB hJ(TnC) rante una investigación para estudiar las opiniones de los habitantes de cierta
ciudad respecto a la localización del aborto. Los datos están clasificados de
12. L1n trabajador social de psiquiatría tiene 10 clientes para visitar en una semana. acuerdo con el án;a en la que fue aplicada la entrevista. ·
Los clientes son tres alcohólicos. cuatro drogadictos, dos pacientes esqui- a) Si un cuestionario es elegido aleatoriamente de entre los 500, ¿cuál es
zofrénicos y un nu1niacodepresivo. ¿Cuántos arreglos de visitas puede elabo- la probabilidad de que:
rar el trabajador social si desea distinguirlas únicamente con base en el diag- 1. El entrevistado vote a fa\·or de la legalización del abono?
nóstico? 2. El entrevistado vote en contra de la legalización?
13. En un depana1nento de salud del estado se recibieron 25 solicitudes de empleo 3. El entrevistado se abstenga?
para un puesto de enfennera de sanidad pública. De las solicitantes, diez tienen 4. Que el encuestado viva en el área A'? E? C? D? E?
más de 30 años de edad y quince tienen n1enos de 30 años. Diecisiete tienen gra- 5. El entrevistado vote ¡¡ favor de la legalización del abor\o dado que
do de bachiller so!arnente y ocho 1ienen grado de 1naestría. De las que tienen vive en el área B?
1nenos de 30 año~. seis tienen grado de maestría. Si se efcctúJ una elección al

--------~----· •
ff'
r;i
,, 98 Algunos conceptos básicos de probabilística Bibliografía 99
3. FREDERJCK MOSTELLER, ROBERT E. K. RüURKE y GEüRGE 8. THOMAS, JR ..
Resultado Probability With Slatistical Applications, 2." edición, Addison-Wesley,
Área de A favor En contra Indecisos Reading, Mass., 1970.
la ciudad (F) (Q) 4. BOYO EARL, \VJLLIAM MooRE y WENDELL L SMITH, /11trod11ction to Proha-
(R) Total
bility, McGraw-Hill, Nueva York, 1963.
A IOO 20 5 _,
19-
5. S!MEON M. BERMAN, Tf,e E/e111e11ts of Prohability, Addison-Wesley. Readin!!.
B 11.1 5 5 125 Mass .. i 970. ~
D 50 60 15 125 6. _r...1ELV!N HAus:-.i::R, Elenientary Probabi!ity Theory, Harper & Row, Nueva
E 35 50 40 125 'r:'ork, J97i.
Tota! 300 135 65 7. E. R. lv1ULL1NS, JR. y DAVID ROSEN, Concepts of Probability, Bodgen and
500
Quigley, Nueva York, 1972.
6. Que el encuestado se abstenga o que viva en el área D ? 8. JOHN E. FREUND y RONALD E. wALPOLE, Mathen1atical Statistics, 4." edicíón,
b) Calcular las siguientes probabilidades Prentice-Hall, Englewood Cliffs, N.J., 1987.
l. P(A n R) 2, P(Q v DJ 3, P(D) 9. ROBERT V. HoGG y ALLEN T. CRAIG, /11trod11ctio11 to Mathen1atical Statistics,
4. P(Q I DJ 5. P(B I R) 6. P(F) 4.~ edición, Macmillan, Nueva York,·1978.
17. En una población, la probabilidad de que un individuo, elegido aleatoriamente, 10. ALEXANDER tvt. Mooo, FRAt-;KL!N A. GRAYBILL y DUANE c. BüES, /11trod11ctio11
haya sido expuesto a un a!ergeno y tenga una reacción frente al mismo es de to the Theory ofStatistics, 3." edición, McGraw-Hill, Nueva York, 1974 .
.60. La probabilidad de que un indi\'iduo expuesto a! alergeno experimente una 11. 1. TODHUNTER, A History of lite Mathen1atical Theory of Probability, G. E.
reacción es de .8. Si un individuo es elegido aleatoriamente de esta población, Stechert,NuevaYork, 1931.
¿cuál es la probabilidad de que haya estado expuesto a[ alergeno'? 12. F. N. DA VID, Ga111es,Gods and Ganibling, Hafner, Nueva 'York, 1962.
18. Suponer que el 3 por ciento de una población de adultos ha intentado suici- 13. L. J. SAVAGE, Foundations of Statistics, 2." edición revisada, Dover, Nueva
darse. También se sabe que el 20 por ciento de esa población vive en condi- York, 1972.
' L'iones extremas de pobreza. Si estos dos eventos son independientes, ¿cuál es 14. A. N. KOLMOGOROV, Fo1111dations of the Theory of Probahility, Chelsea, Nueva
la probabilidad de que un individuo elegido aleatoriamente, haya intentado sui- York, l 964. (Publicación alemana original de l 933.)
cidarse y además viva en condiciones extremas de pobreza? 15. JOSEPH BREUER, An J111rod11ction to the Theory of Sets, Prentice-Hall, Engle-
19. En una población de mujeres, el 4 por ciento tienen cáncer de pecho, el 20 por wood Cliffs. N.J., 1958. (Traducido por Howard F. Fehr.)
ciento son fu1nadoras y el 3 por ciento son fumadoras y tienen cáncer de pecho. 16. ROBF.RT R. STOLL, Set Theory and Logic, Dover, New York, 1979.
Si una mujer es elegida al azar de entre esa población, ¿cuál es la probabilidad 17. LAV.'RENCE P. MAHER, JR., Finite Sets, Theory, Counting, and Applicatio11s,
de que tenga cáncer de pecho, o sea fumadora o tenga ambas características? Charles E. Merril!, Columbus, Ohio, 1968 .
• 20. La probabilidad de que una persona elegida al azar de entre una población pre-
• sente los síntomas característicos de una enfermedad es de .2 y la probabilidad
de que una persona elegida aleatoriamente presente esa enfermedad de .23. La
• probabilidad de elegir a una persona que tenga los síntomas y también la enfer-
medad es de .18. Si una persona elegida al azar de entre esa población no pre-
senta los síntomas. ¡.cuál es la probabilidad de que tenga la enfermedad'?

BIBLIOGRAFÍA----------------~

l. GRACE E. BATES, Probabi!ity, Addison-Wesley, Reading. Mass .. 1965.


2. JOHN R. DixoN, A Progran11ned lntroducrion to Probahi!1ty. Wi!cy. Nueva
York, 1964.
.IOJ

3
Distribuciones de probabilidad

3.1 INTRODUCCIÓN--------------~

En el capítulo anterior se presentaron los conceptos básicos de probabilidad


y los métodos para calcular la probabilidad de un evento. En este capítulo se
desarrollan esos conceptos y se exploran formas para calcular las probabili-
dades de un evento bajo condiciones un poco más complicadas.

3.2 DISTRIBUCIÓN DE PROBABILIDAD


DE VARIABLES D I S C R E T A S - - - - - - - - - - -

Para iniciar el estudio de las distribuciones de probabilidad, se considera en


primer lugar la distribución de probabilidad de una variable discreta, la cual
se define como sigue:

DEFINICIÓN _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _----,

La diit¡;ibución de probabilidad de una variable aleatoria dis-


creta • una tabla, una gráfica, una fórmula u otro sistema uti-
lizado para especificar todos los valores posibles de una variaH
ble aleatoria discreta junto con sus probabilidades respectivas.

101
d

102
Distribuciones de probabilidad Distribución de probabilidad de variables discretas 103
Tabla 3.2.1. Distribución de probabili-
dad del número de hijos por fan1ilia en Solución Esto se hace mediante una tabla en la que se listan, en una colum-
una población de 50 familias na x, los valores posibles que asume X y en una columna P(X = x) la proba-
Frecuencia de bilidad con la que X asume un valor particular x. Véase la tabla 3.2. l
., ocurre11cia de x Alternativamente, se puede presentar esta distribución de probabilidad
P(X = x)
o 1
en forma gráfica, como en la figura 3.2.1. En dicha figura, la longitud de
1150
4 cada barra vertical indica la probabilidad para el valor correspondiente de x.
4/51)
2 6 En el ejemplo 3.2.1 se observa que los valores de P(X = x) son todos
6/50
3 4 positivos, menores que 1, y la suma de los mismos es igual a 1. Éstas no son
4/50
4 9 sólo características particulares de este ejemplo, sino' que son características
9150
5 10 para todas las distribuciones de probabilidad de variables discretas. Por
10150
6 7 tanto, se dan las siguientes propiedades indispensables en una distribución de
7150
7 4 4150 probabilidad para una variable dis<.:reta:
8 2 2/50
9 2 (1) O ,s P(X = x) ,s
2/50
10 1 1150
50 (2) LP(X = x) = l
50/50

También se observa que cada una d~ las probabilidades de la tabla 3.2. 1


Ejemplo 3.2.1 Una enfermera de salud pública atiende a 50 familias, en la frecuencia relativa de ocurrencia de cada valor de X.
Constníyase la distribución de probabilidad para X, que es el número de Cuando se tiene disponible esta distribución de probabilidad, es posible
hijos por familia en esa población.
hacer afirmaciones acerca de la variable aleatoria X. Supóngase que la enfer-
mera que atiende a 50 familias, aleatoriamente elige una familia para visitar.
Probabilidad
¿cuál es la probabilidad de que la familia tenga tres hijos? En la tabla 3.2.1
10/1 l se deduce que la respuesta es de 4/50 = .08, es decir, P(X = 3) = .08. ¿Cuál
es la probabilidad de que la familia, elegida aleatoriamente, tenga tres o
9/ l -
cuatro hijos? Para responder a esta pregunta se utiliza la regla de la adición.
8/50)
Puesto que la probabilidad de tres hijos es de .08 y la de cuatro es de .18,
,· 7/50 entonces la probabilidad de elegir una familia que tenga tres hijos o cuatro
. ' 6/50 hijos es de .08 + .18 = .26. Esto puede expresarse concretamente como:
.' 5/50
P(X = 3 o X = 4) - P(X = 3) + P(X = 4) = .26
,1 4/50 ~

,, 3/50 Distribuciones acumuladas Algunas veces es más conveniente trabajar


2/50 con la distribución de prÜbabilidad acuniulada de una variable aleatoria. La
,<
distribución de probabilidad acumulada para la variable discreta, cuya dis-
1/50
,,
o
0 1 2 J 4 5 6 ] 8
/_1_
9 10 X
tribución de probabilidad esta dada en la tabla 3.2.1, se obtiene sumando
sucesivamente las probabilidades P(X = x) que aparecen en la última colum-
na. La distribución de probabilidad acumulada resultante se muestra en la
Figura 3.2.1. Representación gráfica de la distribución de probabilidad tabla 3.2.2.
del número de hijos por familia en una población de 50 familias.
Al consultar la distribución de probabilidad acumulada es posible res-
ponder a preguntas como las siguientes:
104 Distribuciones de probabilütad Distribución binomial 105
Tabla 3.2.2. Distribución de probabilidad acumulada tudian con detalle tres de estas distribuciones teóricas de probabilidad: bino-
del número de hijos por familia en una población de 50 mial, de Poisson y nor,nal.
familias
Frecuencia de
' ocurrencia de x P(X = x) P(X s x) 3.3 DISTRIBUCIÓN BINOMIAL _ _ _ _ _ _ _ _ _ __
o 1 1150 l/50
4 4/50 La distribución binomial es una de las distribuciones utilizadas más amplia-
5150
2 6 6/50 mente en estadística aplicada. La distribución se deriva de un procedimiento
l l/50
3 4 4/50 conocido como ensayo de Bernoulli, nombrado así en honor del matemátiCo
15/50
4 9 suizo James Bernoulli (1654-1785), quien realizó contribuciones impor-
9/50 24/50
5 10 I0/50 tantes en el campo de la probabilidad, incluyendo, particularmente, la dis-
34/50
6 7 7150 41/50 tribución binomial. Cuando en un solo ensayo de algún proceso o experi-
7 4 4/50 45150 mento puede ocurrir sólo uno de dos resultados mutuamente excluyentes,
8 2 2150 47/50 como vida o muerte, alivio o enfermedad, macho o hembra, el ensayo sella-
9 2 2/50 49/50 ma ensayo de Bernoulli.
ID 1 l/50 50/50 Una secuencia Qe ensayos de Bernoulli forma un proceso de Bernoulli,
50 50/50 si se cumplen las siguientes condiciones:
1. En cada ensayo ocurre uno de dos posibles resultados, mutuamente excluyen-
l. ¿Cuál es la probabilidad de que una familia seleccionada al azar de entre el tes. Uno de los posibles resultados se denota (arbitrariamente) como un éxito
grupo de 50, tenga menos de cinco hijos? Lo que se necesita para responder y el otro como fraca\O.
la pregunta es P(X < 5), lo cual se obtiene al determinar el valor de la proba- 2. La probabilidad de un éxito, denotado por p, permanece constante de un
bilidad acumulada para los valores de X = Ohasta X = 4. En la tabla se observa ensayo a otro, y la probabilidad de fracaso, l - p. se denota con q.
que dicho valor es de 24/50 = .48. 3. Los ensayos son independientes, es decir, el resultado de algún ensayo en
2. ¿Cuál es la probabilidad de que una familia, seleccionada aleatoriamente, ten- particular no es afectado por el resultado de cualquier otro ensayo.
ga cinco o más hijos? Esta pregunta se responde mediante el concepto de
complemento. El conjunto de familias con cinco o más hijos es el comple- Ejemplo 3.3.1 Se dese;a calcular la probabilidad de x éxitos en n ensayos
mento del conjunto de familias con menos de cinco hijos, y la suma de ambos de Bernoulli. Por ejemplo, supóngase que en cierta población el 52 por
es Igual al conjunto universal de 50 familias. Puesto que la probabilidad total ciento de todos los nacimientos que se registraron son varones. La inter-
es l, y se tiene que P(X < 5) =.48, la probabilidad que se requiere, P(X ~ 5), es
igual a 1 - P(X < 5) = l - .48 =.52. pretación de esto es que la probabilidad del nacimiento de un varón registra-
do es de .52. Si aleatoriamente se escogen cinco registros de nacimientos den-
3. ¿Cuál es la probabilidad de que una familia, elegida aleatoriamente, tenga en-
tre tres y seis hijos, inclusive'? Lo que se pide es P(3 5 X 5 6), que es igual a tro de esa población, ¿cuál es la probabilidad de que exactamente tres de
P(X :5 6) - P(X < 3). La probabilidad de que X sea menor o igual que 6 es la ellos pertenezcan a varones?
probabilidad acumulada hasta X= 6 o 41/50 ::: .82, y la probabilidad de que
X sea menor que 3 es la probabilidad acumulada hasta X= 2 o 11/50 = .22. Solución Desígnese la ocurrencia de un registro para el nacimiento de un
Por lo tanto, se considera que P(3 :5 X :5 6) =.82 - .22 = .60. varón como "éxito" y se aclara que ésta es una designación arbitraria con
fines de claridad y conveniencia y no refleja ninguna opinión re~pecto a la
La distribución de probabilidad que aparece en la tabla 3.2.1 fue desa- preferencia relativa del nacimiento de varones versus mujeres. La ocurrencia
rrollada a partir de la experiencia real, de tal forma que encontrar otra varia- de un registro de nacimiento para un varón se designa como éxito, puesto que
ble siguiendo esta distribución seria por casualidad. Las distribuciones de lo que se busca son registros de nacimientos de varones. Si se buscasen re·
probabilidad de muchas variables de interés se pueden determinar o asumir gistros de nacimientos de mujeres, éstos serían designados como éxitos y el
con base en consideraciones teóricas. En las siguientes secciones se es- registro de nacimientos de varones serían designados como fracasos.

-- -
rf.
e:'
1 106
Distribuciones de probabilidad Distribución binomial 107
También es conveniente asignar el número I a un éxito (registro del Cuando se extrae una sola muestra de cinco elementos a partir de una
nacimiento de un varón) y un O para un fracaso (registro del nacimiento de población específica, sólo se obtiene una secuencia de éxitos o fracasos. La
una mujer).
pregunta, ahora, es: ¿cuál es la probabilidad de obtener la secuencia nú-
El proceso que finalmente resulta en un registro de nacimiento se con-
sidera como un proceso de Bemoulli. mero l, la secuencia número 2, ... ,ola secuencia número 10? Con la regla
de adición se sabe que esta probabilidad es igual a la suma de las probabili-
Supóngase que, de los cinco registros de nacimiento seleccionados re- dades individuales. En este ejemplo se requiere sumar las 10 q2p3, lo que
sulta esta secuencia de sexos;
equivale a multiplicar q 2p 3 por 10. Ahora se puede responder la pregunta
original: ¿cuál es la probabilidad de observar tres éxitos (registros de un
VMVVM nacimiento de un varón) y dos fracasos (registro del nacimiento de una
mujer) en una muestra aleatoria de 5 elementos extraída de la población
En forma codificada se escribe de la siguiente forma:
especificada? Puesto que en la población, p;:: .52 y q;:: (1 - p);:: (1 - .52)
;:: .48, la respuesta a la pregunta es:
10110
10(.48)2(52) 3 =10(.2304)(.140608) = .32
Puesto que la probabilidad de un éxito se denota con p y la probabilidad
de un fracaso se denota con q, la probabilidad de la secuencia de los resulta-
dos anteriores se calcula por medio de la regla de multiplicación: Fácilmente se puede anticipar que listar el número de secuencias se
hace más y más difícil y tedioso según crezca el tamaño de la muestra, por
P(l,0,1,1,0) = pqppq = q'p' lo cual es necesario un método sencillo para contar el número de secuen-
cias. Este método es dado por la ecuación 2.5.6, puesto que hay n objetos,
La regla de la multiplicación resulta adecuada para calcular esta probabili- algunos de los cuales son de un tipo y el resto son de otro. El número de
dad puesto que se busca la probabilidad de un varón, una mujer, un varón, secuencias en este ejemplo, calculadas con la ecuación 2.5.6 es 5 C'2 ;::
un varón y una mujer, en ese orden. En otras palabras, se requiere la proba- 5!/2!3!;:: 120/12;:: 10. En general, si se consideran igual al número total de
bilidad conjunta de cinco eventos. Por razones de sencillez, se utilizan las objetos, x igual al número de objetos de un tipo y 11 - x al número de objetos
comas en lugar de la notación de intersección, para separar los resultados de del otro tipo, el número de secuencias es igual a 11 Cx= n!lx!(n -x)!, que es
los eventos. igual al número de combinaciones de n cosas tomadas de x en x.
La probabilidad resultante es la de obtener la secuencia específica en el En el ejemplo, x ;:: 3 es el número de éxitos, por lo que n - x ;:: 2 es el
•i
orden en que se muestran. Sin embargo, el interés no está en el orden de número de fracasos. La probabilidad de obtener exactamente x éxitos en n
,1 ensayos se escribe como:
ocurrencia de los registros del nacimiento de varones y mujeres, sino, como
,I se ha manifestado previamente, en la probabilidad de ocurrencia de exacta-
,, Núniero Secuencia
mente tres registros de nacimiento de varones de
entre cinco registros seleccionados aleatoria-
f(x) = ,.C,.c¡"--'p~ = .,Cxpxq"--'
;:: O, en caso contrario
para X O, 1.2, ... , n
(3.3.1)
;l 2 l! 100 mente. En lugar de ocurrir en la secuencia mos-
,, 3
4
10011
11010
trada anteriormente (secuencia número 1), los Esta expresión se llama distribución binomial. En la ecuación 3.3.1./{x)
5
tres éxitos y dos fracasos pueden ocurrir tam- ;:: P(X = x), donde X es la variable aleatoria, es decir, el número de éxitos en
•• 6
11001
bién en alguna de las secuencias adicionales n ensayos. Se empleafix) en el lugar de P(X;:: x) debido a que es más corta
10101
•• 7 dadas en la tabla adjunta .
O1110 y porque su uso es universal.
,, 8 00111 Cada una de esas secuencias tiene la misma La distribución binomial puede presentarse en forma tabular como en la
9 probabilidad de ocunir y es igual a q 2p3, que esta
., 01011 tabla 3.3.1.
10 O110 l probabilidad calculada para la primer secuencia Se establece el hecho de que la ecuación 3.3.l es una distribución de
mencionada.
probabilidad mostrando que:

"
108 Distribuciones de probabilidad Distribución binoniial 109
Tabla 3.3.1. La distribución binomial 6
/(4) 10C,(. 7) (.3)'
Nú111ero de éxitos, x Probabilidad, j(x)
10!
o "Cuq"-ºpº 416
¡r.117649)(.0081)
1 ,,Ciq"- tp1
2 ,.Cz(j"-ip':2 .2001

X Tabla binomial El cálculo de una probabilidad empleando la ecuación


,,C"q"-"p"
3.3.1 puede ser una labor difícil si el tamaño de la muestra es grande. Por
n ,.Cnq"-"p" fortuna, las probabilidades para diferentes valores den. p y x ya están tabu-
Total ladas, por lo que sólo es necesario consultar la tabla adecuada para obtener
la probabilidad deseada. La tabla A del Apéndice 11 es una de muchas tablas
disponibles. Dicha tabla presenta la probabilidad en la que x es menor o
igual a algún valor específico. Es decir, la tabla presenta las probabilidades
l. j{x) :?: O para todos los valores de x. Esto proviene del hecho de que n y p no
acumulativas desde x = O hasta algún otro valor específico.
son números negativos, por lo que nCx, pr y (1 - p)11 - .t tampoco Jo son,
entonces sus productos son mayores o iguales a cero. El uso de la tabla se muestra utilizando el ejemplo 3.3.2 en el que se
2. Lftx) ::: l. Esto se considera cierto al reconocer que L11 C_/I' - x ¡res igual a requiere calcular la probabilidad de x = 4 cuando 11 = 1O y p = .3. De
[( l - p) + p] = 111 = l, que es la expresión binomial familiar. Si el binomio acuerdo al estudio de la distribución de probabilidad acumulativa en la
11

(q + p )" es desarrollado se tiene: sección anterior, se sabe que P(x = 4) puede calcularse restando P(X $. 3)
de P(X $. 4). Si en la tabla A se localiza ap = .3 para 11;;::: 10, se encuentra
que P(X $. 4) :::.8497 y P(.'{ $. 3);;::: .6496. La resta del primero menos el
(q +fa)"= q" + nqn-Jpl +;¿(no- l)q"-'2p'2 + ... + nqlpn-1 + p"
segundo es igual a .8497 - .6496 ;;::: .200 l, lo cual coincide con el cálculo
manual.
Si los ténninos de la expansión son comparados, ténnino a término, con Al observar nuevamente el ejemplo de los registros de nacimiento, el
losfix) de la tabla 3.3.l se aprecia que son equivalentes, término a término, objetivo era detern1inar la probabilidad de observar exactamente tres regis-
puesto que: tros de naci1niento de varones, donde 11 ::: 5 y p::: .52. Al utilizar la tabla A,
/(0) = 0 C0 q"- 0p' ~ q" primero se localizan ::: 5. Sin embargo, se encuentra que la tabla A no con-
tiene una entrada para p ::: .52. Una breve consideración convence de que
/(!) ~ 0 C,q"- 1p1 = nq"- 1p1
se puede obtener el resultado deseado si se reelabora la pregunta como
n(n - 1) sigue: Si la probabilidad de registrar el nacimiento de una mujer es de .48 y
/(2J ~ .c2q"- 2p2 ~ q"- 2p'
2 11 ::: 5, ¿cuál es la probabilidad de observar exactamente dos registros de
nacimiento de n1ujeres si la probabilidad de elegir un registro de este tipo es
de .48 y n ::::: 5?
/(n) = ,,l'.,q"-"p" = p" Se puede encontrar p ::: .48 en la tabla A para 11 ::: 5 y considerar que
Ejemplo 3.3.2 Otro ejemplo del uso de la distribución binomial. Supóngase P(X,; 2) = .5375 y P(X,; 1) =.2135. Al restar se obtiene: .5375 - .2135 =
que se sabe que el 30 por ciento de cierta población es inmune a alguna .324. lo cual coincide con el resultado previamente obtenido.
enfermedad. Si se escoge una muestra aleatoria de 1O elementos de entre Muchas veces interesa determinar las probabilidade-s no para valores
esta población, ¿cuál es la probabilidad de que dicha muestra contenga exac- específicos de X sino para un intervalo como, por ejemplo. la probabilidad
tamente cuatro personas inmunes? de que X se encuentre entre, digamos, 5 y 10. Por ejemplo:

Soluci6n Se tiene que la probabilidad de elegir una persona inmune es de .3. Ejemplo 3.3.3 Supóngase que se conoce que en cier1a población el 10 por
Al utilizar la ecuación 3.3. l se encuentra que ciento de la mis1na es daltoniana. Si se extrae una muestra aleatoria de 25
f
(
110
Distribuciones de probabilidad Distribución bi11omial 111
gentes de entre la población, usar la tabla A del apéndice II para calcular la de utilizar la tabla binomial, la probabilidad de un fracaso es tratada co1no la
probabilidad de que:
probabilidad de un éxito. Cuando p es mayor que .5 las probabilidades acu·
mulativas se pueden obtener a partir de la tabla A empleando la siguiente
a) Cinco o menos sean daltonianos
relación:

Solución Esa probabilidad está en una entrada de la tabla y no es necesario P(,'( 5 xln, p> .5) = P(X 2= n - xln, 1 - p) (3.3.3)
sumar o restar. La probabilidad P(X S: 5) == .9666.
Finalmente, al utilizar la tabla A para calcular la probabilidad de que X sea
b) Seis o más sean daltonianos.
mayor o igual a alguna x. cuando p > .5, se utiliza la siguiente relación:

Solución Este es el conjunto complemento del conjunto especificado en el P(X 2! xln, p> .5} = P{X :S n - xln, l - p) (3.3.4)
inciso a, por lo tanto:

Ejemplo 3.3.4 En cierta comunidad, en una tarde dada, del 85 por ciento de
P(X" 6) - l - P(X,; 5) - l - .9666 .0334 las familias, alguno de los miembros está en casa. Un equipo de investi-
gación sanitaria selecciona una muestra aleatoria de 12 familias para dirigir
e) Entre seis y nueve inclusive sean daltonianos.
una inspección vía telefónica. Con la tabla A, calcúlese la probabilidad de
que:
Solución Se calcula restando la probabilidad de que X sea menor o igual a a) El equipo encuentre a alguien en casa de entre 7 familias exacta-
5 a la probabilidad de que X sea menor o igual a 9. Esto es:
mente.

P(6 s X,; 9) - P(X,; 9¡ - P(X,; 5¡ - .9999 - .96fi6 - .0333 Solución El replanteamiento del problema es como sigue. Si en el 15 por
ciento de las familias no hay nadie en casa, ¿cuál es la probabilidad de que
d) Dos, tres o cuatro sean daltonianos.
el equipo que conduce la inspección no obtenga respuesta en 5 de 12 lla-
madas? La respuesta se calcula como sigue:
Solución Es la probabilidad de que X esté entre 2 y 4 inclusive,
P(.\ = 5111 = l~. p .151 = P(.'< s 5) - P(X s 4)
P(2 s X .s 4} = P{X s 4) - P\X s;: l) = .9020 - .2712 = .íi308
_, .995-{ - .9761 = .0193
,¡ Empleo de la tabla A cuando p > .5 La tabla A no incluye las probabili- b) En el equipo encuentre a alguien en casa de 5 familias o menos.
dades para valores de p mayores que .5. Sin embargo, las probabilidades se
,1
obtienen replanteando el problema en térnlinos de la probabilidad de un fra- Solución La probabilidad que se busca es:
.1 caso, 1 - p, en lugar de la probabilidad de un éxito, p. Como parte del
.I replanteamiento, también se debe pensar en términos del número de fraca- /'(.\ s Si11 = l:?.p = .t(ji P(.\ :2: I:? - 5111 = !~. p= .l.'.íJ
sos, n - x, en lugar del número de éxitos, x. Esta idea se resume como sigue:
.• 1 P(.\. :2: 7111 = l:?,p = .15)

.1 F'(,\ = x111. p> .50) = P(X = u - xl11. l - p) (3.3.2)


/!(,\ :5 6111 = 12. p= .15)
_; -~)993 = .0007
Con palabras. !a ecuación dice: ··ia probabilidad de que X sea igual a
algún valor específico. dado el !ar:naño de una muestra y la probabilidad de e) El equipo encuentre a alguien en casa de 8 o más familias.
éxito mayor a .5, es igual a la probabilidad de que X sea igual a 11 - .r dado e!
tamaño de la muestra y la probabilidad de un fracaso, 1 - p. Con la finalidad Solución La probabilidad que se busca es
112 Distribuciones de probabilidad
Ejercicios 113
P(X ,e Sin= 12.p = .85) = P(X,;; 41n = 12.p = l.,)= .Yi61 e
"
o'
La figura 3.3.1 muestra una representación visual de la solución para •u'
los tres incisos del ejemplo 3.3.4. ~
La distribución binomial tiene dos parámetros, n y p. Son parámetros en o
el sentido de que son suficientes para especificar una distribución binomial. g'
·~
La distribución binomial es en realidad una familia de distribuciones con
'"
"'">o
VI
cada uno de los valores posibles de n y p designando un miembro diferente
de la familia. La media y la variancia de la distribución binomial son µ = np
-~
y cr 2 = np( 1 - p), respectivamente. u
,=
La distribución binomial, formalmente hablando, es aplicable en situa- e
ciones donde el muestreo se realiza a partir de una población infinita o a ""
·;;
partir de una población finita con restitución. Puesto que en la práctica real 2
o
las muestras son normalmente extraídas sin restitución a partir de una po- E
•o
e
blación finita, lógicamente surge la pregunta respecto a la conveniencia de
:§,
una distribución binomial en estas circunstancias. La conveniencia del uso
"!
de esta distribución depende de qué tan drástico es el efecto de esas condi-
ciones en la constancia de p de un ensayo a otro. Normalmente se considera "'"'c.
o
que cuando II es pequeño en relación con N. el modelo binomial es adecua- E
o
do. Algunos autores conciben que ,1 es pequeño en relación con N, si N es al '¡¡'

"'"' "'"' "'"'


ü
inenos 1O veces más grande que 11.
-"
"e
~

-... ""·-
o o ru ru ru •O
::;:: ;::;:: '=' '='
e- '=' ·¡:¡
o
·::: -!:l
o o "'VI "' o
º""
~t
Al
•'
En cada uno de los siguientes ejercicios. supóngase que N es suficienten1ente
grande en relación a n y que es posible utilizar la distribución binomial para calcu-
lar las probabilidades que se piden.
"' "
"'" ."" .."" ."" "'"
.g•
••E
3.3.1 Supóngase que el 24 por ciento de cierta población tiene sangre tipo B. A "cro o
partir de una muestra de 20 individuos extraída de esa población, calcular la 'u o
u
probabilidad de: e
,o u
·¡:¡
·=
§
a)Encontrar exactamcn1e tres personas con sangre tipo B. ""' "'
e u
b) Encontrar tres o más personas con esa característica.
e) Encontrar menos de tres. -"'
o
~
o
2
e
u
d) Encontrar exactamente cinco.
"'
...; ··3
"l 'uo
3.3.2 En una población grande. el 16 por ciento de los n1iembros son zurdos. En
"'• •'
una muestra aleatoria de 10 individuos. encontrar:

a) La probabilidad de qu~ haya cxaclan1cnte dos zurdos.


-=•
.~-g
"'
u

u
r!
•• 114 Distribuciones de probabilidad Distribución de Poisson JIS
b) P(X ~ 2).

.
1

'
'
e) P(X<2).
d) P(I~X~4) .

3.3.3 Supóngase que la probabilidad de aliviarse de cierta enfermedad es de .4. Si


en 1837. 1•2 Esta distribución ha sido empleada ex.tensamente en biología y
medicina. Haight,2 en el capítulo 7 de su libro, presenta un repertorio muy
amplio de aplicaciones.
Si x es el número de ocurrencias de algún evento aleatorio en un inter-
15 personas caen enfennas (supóngase que se trata de una muestra aleatoria) valo de espacio o tiempo (o algún volumen de materia), la probabilidad de
1 '
' ¿cuál es la probabilidad de que: ' que x ocurra es dada por
.1 j
•¡ a) Tres o más se alivien?
e) Cinco o más?
b) Cuatro o más? f(x) X = 0,1,2,.
(3.4.1)
d) Menos de tres?
ti
. '
'
3.3.4 Supóngase que la tasa de mortalidad para ciertas enfem1edades es de .10 y
que. !_O personas de una comunidad contraen la enfermedad. ¿Cuál es la pro-
La letra griega A. (lambda) es el parámetro de la distribución y es el número
promedio de ocurrencias del evento aleatorio dentro del intervalo ( o volu-
babilidad de que:
men). El símbolo e es la constante (con cuatro decimales) 2.7183.
a) Nadie sobreviva'!
e) Al menos tres mueran?
b) El cincuenta por ciento muera?
d) Exactamente tres mueran?
Se puede mostrar que j(x) ;::: O para cada x y que Ur, x) = 1, por lo que la

distribución satisface los requerimientos para la distribución de probabi-


3.3.5 La ~~obabilidad d~ que una persona que padece migraña obtenga alivio con
lidad.
un _tarmaco especifico es de .9. A tres enfermos de migraña, escogidos alea-
to~1amente. se les administra el fánnaco. Calcular la probabilidad de que el Proceso de Poisson Como se ha visto, la distribución binomial resulta de
• numero de enfermos que encuentren alivio sea de: un conjunto de suposiciones acerca de un proceso implícito para formar un
• conjunto de observaciones numéricas. Lo mismo ocurre en el caso de la dis-
a) Exactamente cero. b) Exactamente uno. tribución de Poisson. Los siguientes puntos describen lo que se conoce
e) Más de uno. e[) Dos o menos. como proceso de Poisson.
• e) Dos o tres .
/) Exactamente tres.
l. Las ocurrencias de los eventos son independientes. La ocurrencia de un even-

.
.,
:
3.3.6 En una en~uesta a un gr_upo de estudiantes de enfermería que aspiran al grado
de_ maestna, el 75 por ciento declaró que esperan ser promovidos a un puesto
mas _alto un mes después de recibir el grado. Si este porcentaje se aplica a la
to en un intervalo de espacio o tiempo' no tiene efecto en la probabilidad de
una segunda ocurrencia del evento en el mismo o en algún otro intervalo .
2. Teóricamente. es posible la ocurrencia de un evento un número infinito de
veces den1ro del intervalo.
., totalidad de,la población, calcular, para una muestra de 15. la probabilidad
de que el numero que espera una promoción un mes después de graduarse 3. La probabilidad de una sola ocurrencia del evento en un intervalo dado es
sea de: proporcional a la dimensión del intervalo .
•• ¡
4. En cualquier fracción iníinitcsin1al del intervalo, la probabilidad de más de
,1 a) 6. b) Al menos 7. una ocurrencia del evento es insignificante.
e) No más de 5. d) Entre 6 y 9, inclusive. Una característica interesante de la distribución de Poisson es el hecho
•¡
de que la media y la variancia son iguales .
La distribución de Poisson se emplea cuando se cuentan los eventos o
., 3.4 DISTRIBUCIÓN DE POISSON _ _ _ _ _ _ _ _ _ __ entidades, distribuidos al azar en espacio o tiempo. Es fácil intuir cuando
.,' cierto proceso obedece a la ley de Poisson y bajo esta suposición es posible
La siguien~e distribución discreta a considerar es la distribución de Poisson calcular las probabilidades de ocurrencia de eventos o entidades en alguna
llamada a~1 en. honor del_ matemático francés Simeon Denis Poisson ( 1781-
" Por razones de simplificadón. el proceso de Poisson se e.~pone en términos de intervalos,
1840), quien tiene amplio reconocimiento por la publicación de su trabajo aunque intervengan otras unidat.les tales como volumen
.,• 110
Distribuciones de probabilidad Distribución binomial 111
gentes de entre la población, usar la tabla A del apéndice II para calcular la
probabilidad de que: de utilizar la tabla binomial, la probabilidad de un fracaso es tratada co1no la
probabilidad de un éxito. Cuando p es mayor que .5 las probabilidades acu-
a) Cinco o menos sean daltonianos mulativas se pueden obtener a partir de la tabla A empleando la siguiente
relación:
Solución Esa probabilidad está en una entrada de la tabla y no es necesario P(.Y. :s xl11, p > .5) = P()( 2::: n - xln, l - p) (3.3.3)
sumar o restar. La probabilidad P(X ~ 5) = .9666.

b) Seis o más sean daltonianos. Finalmente, al utilizar la tabla A para calcular la probabilidad de que X sea
' mayor o igual a alguna x, cuando p > .5, se utiliza la siguiente relación:
Solución Este es el conjunto complemento del conjunto especificado en el P(X 2: :dii,p > .5) = P(X :s n - xln, l - p}
inciso a, por lo tanto: (3.3.4)

P(X 2c 6) ~ 1 - P(X s 5) ~ 1 - .9666 Ejemplo 3.3.4 En cierta comunidad, en una tarde dada, del 85 por ciento de
.0334 las familias, alguno de los miembros está en casa. Un equipo de investi-
e) Entre seis y nueve inclusive sean daltonianos. gación sanitaria selecciona una muestra aleatoria de 12 familias para dirigir
una inspección vía telefónica. Con la tabla A, calcúlese la probabilidad de
que:
Solución Se calcula restando la probabilidad de que X sea menor o igual a
5 a la probabilidad de que X sea menor o igual a 9. Esto es: a) El equipo encuentre a alguien en casa de entre 7 familias exacta-
mente.
P(6,; X s 9) ~ P(X s 9) - P(X,; 5) ~ .9999 - .961i6 ~ .0333
Solución El replanteamiento del problema es como sigue. Si en el 15 por
dJ Dos, tres o cuatro sean daltonianos. ciento de las familias no hay nadie en casa, ¿cuál es la probabilidad de que
el equipo que conduce la inspección no obtenga respuesta en 5 de 12 lla-
madas? La respuesta se calcula como sigue:
Solución Es la probabilidad de que X esté entre 2 y 4 inclusive,
?(.\' = 5!11 = l':2.. p .15l = P(.X s 5) - P(.\ :s 4)
P(2 :s X s 4) = P(X :s 4) - P(X :s l) = .9020 - .2712 = .6308
.. ¡ .995-t - .9761 = .0193
-1 Empleo de la tabla A cuando p > .5 La tabla A no incluye las probabili-
b) En el equipo encuentre a alguien en casa de 5 famili.is o menos .
•1 dades para valores de p mayores que .5. Sin embargo, las probabilidades se
obtienen replanteando el problema en térnlinos de la probabilidad de un fra-
.1 Solución La probabilidad que se busca es:
caso, 1 - /J, en lugar de la probabilidad de un éxito. p. Como parte del
_¡ replanteamiento, también se debe pensar en términos del número de fraca- /'(.\ :s = 12. p= .t()1
5111 P(.\ :2: 12 - 3ín = l':2..J; = .!:'i¡
sos, n - x, en lugar del número de éxitos, x. Esta idea se resume como sigue:
,1 P(.\ :2: /In = 12. p = .13)
_¡ F)L\' = x111. p> .5U; = P(X = 11 - xl11. 1 - p;
(3.3.2) P(.\S61n = 12.p = .13)
-! -~)993 = .0007
Con palabras. la ecuación dice; ''!a probabilidad de que X sea igual a
algún valor e:specífico, dado el tarnaño de.una muestra y la probabilidad de
e) El equipo encuentre a alguien en casa de 8 o más familias.
éxito mayor a .5, es igual a la probabilidad de que X sea igual a n - x dado el
tamaño de la muestra y la probabilidad de un fracaso, 1 - p. Con la finalidad
Solución La probabilidad que se busca es
' 110
Distribuciones de probabilidad
gentes de entre la población, usar la tabla A del apéndice JI para calcular la
probabilidad de que:
Distribución binomial

de utilizar la tabla binomial, la probabilidad de un fracaso es tratada co1no la


probabilidad de un éxito. Cuando p es mayor que .5 las probabilidades acu-
mulativas se pueden obtener a partir de la tabla A empleando la siguiente
111

a) Cinco o menos sean daltonianos


relación:
Solución Esa probabilidad está en una entrada de la tabla y no es necesario P(,'<.::::::: xl11, p > .S) = P()( ~ n - xln. 1 - p) (3.3.3)
sumar o restar. La probabilidad P(X ~ 5) = .9666.

b) Seis o más sean daltonianos.


Finalmente, al utilizar la tabla A para calcular la probabilidad de que X sea
mayor o igual a algunax, cuando p > .5, se utiliza la siguiente relación:

Solución Este es el conjunto complemento del conjunto especificado en el P(X 2: xln, p > .5) = P(X :s: n - xl11, 1 - p) (3.3.4)
inciso a, por lo tanto:

Ejemplo 3.3.4 En cierta comunidad, en una tarde dada, del 85 por ciento de
P(X ac 6) = 1 - P(X,; 5) = 1 - .9666 .0334 las familias, alguno de los miembros está en casa. Un equipo de investi-
gación sanitaria selecciona una muestra aleatoria de 12 familias para dirigir
e) Entre seis y nueve inclusive sean daltonianos.
una inspección vía telefónica. Con la tabla A, calcúlese la probabilidad de
que:
Solución Se calcula restando la probabilidad de que X sea menor o igual a
a) El equipo encuentre a alguien en casa de entre 7 familias exacta-
5 a la probabilidad de que X sea menor o igual a 9. Esto es:
mente.

P(6,; X,; 9J = P(X s 9) - P(X,; 5¡ = .9999 - .9666 = .0333


Splución El replariteamiento de! problema es como sigue. Si en el 15 por
ciento de las familias no hay nadie en casa, ¿cuál es la probabilidad de que
d) Dos, tres o cuatro sean daltonianos.
el equipo que conduce la inspección no obtenga respuesta en 5 de 12 lla-
madas? La respuesta se calcula como sigue:
Solución Es la probabilidad de que X esté entre 2 y 4 inclusive,
P(.\ = ,='i:11 = 12. p .15) = P(.Y. ::s 5) - P(.X s 4)
., P(2 :s: A" s 4) = P(X :s: 4) - P(X :s: l) = .9020 - .2712 = .f.i3íJ8
.995-1 - .9761 = .0193

.! Empleo de la tabla A cuando p > .S La tabla A no incluye las probabili-


b) En el equipo encuentre a alguien en casa de 5 familias o menos.
.1 dades para valores de p mayores que .5. Sin embargo, las probabilidades se
obtienen replanteando el problema en térn1inos de la probabilidad de un fr:a-
.1
Solución La probabilidad que se busca es:
caso, ! - p, en lugar de la probabilidad de un éxito. p. Como parte del
.1 replanteamiento, también se debe pensar en términos del número de fraca- P(.\ ::s 5111 = 12. p= .t()1 = }1 (.\";;,,: 12 - 5i11 = 12. p = .l.JJ
sos. 11 - x, en lugar del número de éxitos, x. Esta idea se resume como sigue:
.1 = P(.\" 2::: 7111 = 12. p = .15)
_¡ J)(,\" = xln, p> .50) = P(,':( = 11 - xln. 1 - p) P(.\::s:6111 = 12.p = .15)
(3.3.2)
.! .999:l = .0007
Con palabras, la ecuación dice: '·!a probabilidad de que X sea igual a
algún valor específico, dado el tarnaño de una muestra y la probabilidad de
e) El equipo encuentre a alguien en casa de 8 o más familias.
éxito mayor a .5, es igual a la probabilidad de que X sea igual a 11 - x dado el
tamaño de la muestra y la probabilidad de un fracaso, 1 -p. Con la finalidad
Solución La probabilidad que se busca es
r
•¡
' 1
118 Distribuciones de probabilidad
EJERCICIOS _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ __
Distribuciones de probabilidad conti11ua

a) Exactamente I O.
e) No más de 12.
e) Menos de 7.
b) Al menos 8.
d) Entre 9 y 15 inclusive.
119

3.4.l Supóngase que se sabe que en cierta área de una gran ciudad el número pro-
'¡ medio de ratas por n1anzana es de cinco. Supóngase que el número prome-
J i dio de ratas sigue una distribución de Poisson, encuentre la probabilidad de
3.5 DISTRIBUCIONES DE PROBABILIDAD CONTINUA _ __
que en una n1anzana elegida aleatoriamente.
'1 a) Existan exactamente cinco ratas.
' b) Existan más de cinco ratas. Las distribuciones de probabilidad consideradas hasta ahora, binomial y de
' 1
e) Existan menos de cinco ratas. Poisson, son distribuciones de variables discretas. Ahora se consideran las
J
d) Existan entre cinco y siete ratas, inclusive. distribuciones de variables aleatorias continuas. En el capítulo l se vio que
I i una variable continua es aquella que puede asumir cualquier valor en un inter-
3.4.2 Supóngase que en un período de varios años el número promedio de muertes valo específico de valores. Consecuentemente, entre cualquiera de dos valores
por cierta enfermedad no contagiosa es de 10. Si el número de muertes por asumidos por la variable continua existe un número infinito de valores.
esa enfennedad sigue la distribución de Poisson, ¿cuál es la probabilidad de Para comprender la naturaleza de la distribución de una variable aleato-
que durante el año en curso. ria continua, considérense los datos presentados en la tabla 1.5.1 y en la figu-
a) Exactamente siete personas mueran por esa enfermedad? ra l.5.1. En la tabla hay 57 valores para la variable aleatoria, pesos en onzas
b) Diez o más personas mueran por esa enfermedad? de los tumores malignos. El histograma de la figura 1.5.1 está construido con
e) No haya muertes por esa enfennedad? puntos específicos localizados sobre una línea que representa 1~ medición de
interés y construyendo una serie de rectángulos, cuyas bases son las distan-
3.4.3 Si el número promedio de accidentes graves por año en una fábrica grande cias entre dos puntos específicos sobre la línea y Cuyas alturas representan el
(donde el número de empleados es constante) es de cinco, calcúlese la proba- número de valores de la variable que caen entre los dos puntos especificados.
bilidad .de que en el año en curso haya: Los intervalos delimitados por cualquier par de puntos especificados conse-
a) Exactamente siete accidentes.
cutivos se llaman intervalos de clase.
b) Diez o más accidentes.
e) Cero accidentes.
d) Menos de cinco accidentes.
f(•I
• >

,, 3.4.4 En un estudio respecto a la efectividad de un insecticida con'tra cierto insecto,


se fumigó una gran área de tierra que, más tarde, se examinó por cuadrantes
elegidos aleatoriamente y se contó el número de insectos vivos por cuadran-
",, te. En este experimento se mostró que el número promedio de insectos vivos
"
,, por cuadrante, después de fumigar es de .5. Si el número de insectos vivos por
sección sigue una distribución de Poisson, cuál es la probabilidad de que
cierto cuadrante elegido tenga:
•!
a) Exactamente un insecto vivo.
,, b) Cero insectos vivos.
"
,, e) Cuatro insectos vivos.
d) Uno o más insectos vivos.

'
• 3.4.5 En cierta población, cada año se diagnostica un promedio de 13 nuevos casos
de cáncer esofágico. Si la incidencia anual de este tipo de cáncer sigue una
rí l1tn X

Figura 3.5.1. Histograma resultante de un gran número de valores y pequeños


distribución de Poisson, calcúl.:se la probabilidad de que en un año el nú-
intervalos de clase.
mero de nuevos casos diagnosticados de cáncer sea:
120 Distribuciones de probabilidad Distribuciones de probabilidad continua 121
f(x)
es difícil intuir que cuanto más se aproxima al infinito el número den obser-
vaciones y las dimensiones de los intervalos de clase se aproximan a cero,
el polígono de frecuencia se aproxima a una curva suave tal como lo mues-
tra la figura 3.5.2. Estas curvas se utilizan para representar gráficamente las
distribuciones de variables aleatorias continuas. Esto tiene algunas conse-
cuencias importantes cuando se trabaja con distribuciones de probabilidad.
Primero, el área total bajo la curva es igual a uno corno lo es para el his-
tograma, y la frecuencia relativa de ocurrencia para los valores entre dos
puntos específicos cualesquiera, sobre el eje de las x, es igual al área total
delimitada por la curva, el eje de las x y las rectas perpendiculares le-
• vantadas sobre ambos puntos del eje de las x tal como lo muestra la figura
Figura 3.5.2. Representación gráfica de una distribución continua
3.5.3. La probabilidad de cualquier valor espec{fi.co de la variable aleatoria
Como se estudió en el capítulo 1, las subáreas del histograma corres- es cero. Esto es lógico, puesto que un valor específico se representa como
ponden a las frecuencias de ocurrencia de los valores de la variable entre los un punto sobre el eje de las x y el área por encima de ese punto es cero.
límites de la escala horizontal de subáreas. Esto proporciona un método En un histograma, según se ha visto, las subáreas de interés se calculan
para calcular la frecuencia relativa de ocurrencia de valores entre dos pun- sumando áreas representadas por las columnas (celdas). En el caso de una
tos específicos. Tan sólo es necesario determinar la proporción del área total curva, ésta no presenta celdas, por lo que se debe buscar un método para
del histograma que se encuentra entre dos puntos específicos. Esto se puede calcular las subáreas. Este método es suministrado por el cálculo integral.
hacer más convenientemente consultando las columnas de frecuencia relati- Para calcular el área bajo la curva entre dos puntos cualesquiera, a y b, se
va o frecuencia relativa acumt:l;:;.da en la tabla 1.5.3. integra la función de densidad de a a b. Una función de densidad es una fór-
Imagínese ahora una situación donde el número de valores de la variable mula empleada para representar la distribución de una variable aleatoria
aleatoria es muy grande y. la dimensión de los intervalos de clase es muy pe- continua. La integración es el caso límite de la sumatoria, aunque no se
queña. El histograma resultante seria como el que se muestra en la figura 3.5.1. efectúa ninguna integración, puesto que las matemáticas involucradas están
Si se conectan los puntos medios de las celdas del histograma en la más allá del alcance de este libro. También, como se Ye más adelante, para
figura 3.5 .1 para formar un polígono de frecuencia, se obtendrá una figura todas las distribuciones continuas a considerar existe una forma más fácil
más suave que el polígono de frecuencia de la figura 1.5.3. En general, no para calcular el área bajo la curva.
Aunque la definición de una distribución de probabilidad para variables
aleatorias continuas está implícita en el estudio anterior, a modo de resumen
f(x} se presenta como sigue en forma más concreta.

DEFINICIÓN _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _~

A una función no negativaftx) se le llama distribución de pro-


babilidad (t1:1mbién llamada, algunas veces. función de densidad
de probabilidad) para la variable aleatoria continua X. si el área
total delimitada por su curva y el eje de las x, es igual a l y si la
subárea delimitada por la curva, el eje de las x y por las líneas
perpendiculares levantadas sobre dos puntos cualesquiera a y b
• b • da la probabilidad de que X está entre los puntos a y b.
Figura 3.5.3. Gráfica de una distribución continua que muestra el área entre a y b.

-
f

122 Distribuciones de probabilidad Distribución normal 123

3.6 DISTRIBUCIÓN N O R M A L - - - - - - - - - - - - tribución de probabilidad. Debido a la simetría ya mencionada, e! 50 por


ciento del área está a la derecha de la perpendicular que se levanta sobre la
A continuación se estudia la distribución más importante en toda la estadís- media, y el otro 50 por ciento está a la izquierda.
tica: la distribución normal. La fóm1ula para esta distribución fue publicada 4. Si se levantan perpendiculares a una distancia de una desviación estándar
por Abraham De Movre (1667-1754) el 12 de noviembre de 1733. 3 Otro desde la media hacia ambos lados, el área delimitada por esas perpendicu-
matemático importante en la historia de la distribución normal es Car! lares, el eje de las x y la curva será de un 68 por ciento del área total, aproxi-
madamente. Si los límites laterales se extienden a dos desviaciones estándar
Friedrich Gauss ( 1777-1855 ). A esta distribución frecuentemente se le Ba-
en ambos lados de la media, estará incluida aproximadamente el 95 por cien-
rna distribución de Gauss como reconocimiento a sus contribuciones.
to del área, y extendiéndolos a una distancia de 3 desviaciones estándar,
La densidad normal esta dada por
aproximadamente el 99.7 del área total estará englobada. Las áreas aludidas
se muestran en la figura 3.6.2
J(x} = __J_ e-(x-µ)'.'2cr~.
-x<x<x 5. Los parámetros µ y CJ determinan completamente la distribución normal. En
V'2na (3.6.1) otras palabras, por cada valor diferente de µ y CJ se especifica una distribu-
ción normal diferente. Los valore~ diferentes de µ trasladan la gráfica de la
En la ecuación 3.6.1, 1t y e son constantes conocidas, 3.14159 y distribución a lo largo del eje de las x tal como se muestra en la figura 3.6.3.
2.71828, respectivamente, que se utilizan con frecuencia en matemáticas. Los valores de CJ determinan el grado de aplanamiento o levantamiento de la
Los dos parámetros de la distribución son µ, la media, y cr, la desviación gráfica de la distribución que se muestra en la figura 3.6.4.
estándar. Para los propósitos de esta obra, se considera que µ y a para una
distribución normal, respectivamente, son las medidas de tendencia c;:ntral Distribución normal estándar La última característica mencionada de la
y dispersión como se discutió en el capítulo 1. Sin embargo, puesto que una distribución implica que la distribución normal es realmente ur.a familia de .,*
variable aleatoria distribuida aleatoriamente es continua y toma los valores distribuciones en la que un miembro se distingue de otro según los valores
entre -= y +oo, su media y desviación estándar se pueden definir con mayor deµ y cr. El miembro más importante de esta familia es la distribución nor-
precisión, aunque tales definiciones no se pueden dar sin utilizar el cálculo. n1al estándar o distribución nonnal unitaria, Uamad~sí porque tiene una
La gráfica de la distribución normal produce la conocida curva en forma de media igual a cero y una desviación estándar igual a ·1~· Esta distribución se
campana mostrada en la figura 3.6.1 puede obtener a partir de la ecuación 3.6.1, creando una variable aleatoria
Las siguientes son algunas de las características más importantes de la z = (x- µ)/cr. La ecuación para la distribución normal estándar se escribe:
distribución normal.
J -:2,2
-x<z<x
1. Es simétrica respecto a su media,µ. Tal como se muestra en la figura 3.6.1, [(,) -- - e
v'2ii
la curva hacia cualquiera de los lados deµ es una imagen de espejo de In del (3.6.2)
otro lado.
2. La, media. la mediana y la moda son todas iguales. La gráfica de la distribución norrnal estándar se muestra en la figura 3.6.5.
3. El área total bajo la curva sobre el eje de las x es una unidad de área. Esta Para calcular la probabilidad de que z tome un valor entre dos puntos
característica se deduce del hecho de que la distribución normal es una <lis- cualesquiera sobre el eje de las z, por ejemplo z0 y z 1• se debe calcular el
área delimitada por las perpendiculares levanradas en esos puntos, la
curva y el eje horizontal. Tal como se mencionó anteriormente, las áreas
bajo la curva de una distribución continua se calculan integrando la fun-
ción entre los dos valores de la variable. Entonces, en el caso de la normal
unitaria, para calcular el área entre z0 y z1, es necesario calcular la siguiente
integral:
, l

Figura 3.6.1.

Gráfica de una distribución normal.
• f.,, \r:;::..e-c"-:!dz.
....
Distribución normal 125
124 Distribuciones de probabilidad

.68

.16 [ lo lo 1 .16
-,,..........,, ,, ,, ,, X

µ-laµµ+lo' X 1-'1< ~ <µJ


Figura 3.6.3. Tres distribuciones normales con diferentes medias pero con la
"' misma variabilidad .

.95

.025 )._,
~ '" '" 'Y-...025

, ~
JJ - 2a ¡., 2o
'
lb!
t

0 1< 0 2< 0 J
X

Figura 3.6.4. Tres distribuciones nonn'ales con diferentes desviaciones estándar y


con la misma media .

.997 o= l

0015 3o Jo
L oois
µ - Ju I' + 3o ,
' •
lt) ' •o
Figura 3.6.2. Subdivisión del área bajo la curva nonnal (áreas aproxin1adas). Figura 3.6.5. La distribución normal estándar.

Por fortuna, no es necesario efectuar esta operación, porque existen ta-


blas disponibles que proporcionan los resultados de todas las integraciones
en las que se pueda estar interesado. La tabla C del Apéndice II es una
muestra de esas tablas. En dicha tabla están calculadas las área bajo la
curva, desde --oo, y los valores de z se encuentran en la columna izquierda.
El área sombreada de la figura 3.6.6 representa el área que se lista en la
tabla comprendida entre --oo y z0, donde z0 es el valor especificado por z.
A continuación se ilustra el uso de la tabla B con varios ejemplos.

Ejemplo 3.6.J Dada la distribución normal estándar, calcular el área bajo la o ~


Figura 3.6.6. Área dada por la tabla C del Apéndice II.
curva, sobre el eje de las z entre z = -oo y z = 2.

l
rf
127
126 Distribucio11es de probabilidad Distribución normal

Solución Resulta útil dibujar la gráfica de la distribución normal estándar y


sombrear el área que se pide, tal como se muestra en la figura 3.6.7. Si se
localiza z = 2 en la tabla C y se lee el valor correspondiente en el cuerpo de
la tabla, se encuentra que el área pedida es de .9772. Esta área se puede
interpretar de diferentes formas: carric la probabilidad de que una z elegida
aleatoriamente de entre una población de valores de z esté entre ---= y 2;
como la frecuencia relativa de ocurrencia (o proporción de valores de z O 2
entre -oo y 2 o bien se puede decir que el 97.72 por ciento de los valores de Figura 3.6.7. Área entre -oo y z =2 para la distribución norma! estándar.
•z están entre--= y 2.
Ejemplo 3.6.2 ¿Cuál es la probabilidad de que una z. tomada al azar de
entre los valores de z, esté entre -2.55 y +2.55?

Solución La figura 3.6.8 muestra el área que se pide. En la tabla C se da el


área entre -oo y 2.55. El área se encuenlra al localizar el valor de 2.5 en la
primer columna de la izquierda de la tabla y buscar sobre el renglón hasta -2.55 O 1-2.55 "
encontrar la entrada de la columna encabezada por .05. El área es de .9946. Figura 3.6.8. Curva nonnal estándar para P(-2.55 < z < 2.55).
Si se obs~rva la gráficü. dibujada se aprecia que el área calculada es mayor
que la que se pide, por Jo que es necesario restar de .9946 el área a la
izquierda de -2.55. Al consultar la tabla C, ésta muestra que el área a la iz-
quierda de -2.55 es de .0054. Por tanto, la probabilidad que se busca es:

P(-2.55 < z < 2.55) = .9946 - .0054 = .9892.


-2.74 O 1.53 •
Figura 3.6.9. Curva normal estándar que muestra la proporción de los valores de:::
Supóngase que se pide calcular la probabilidad de que z está entre -2.55
y 2.55 inclusive. La probabilidad que se pide se expresa como P(-2.55 :;; z :5 entre z = -2.74 y z = 1.53.
2.55). Como se mencionó en la sección 3.5, P(z = Z¡J) = O, entonces P(-2.55 Solución. El área deseada se muestra en la figura 3.6.10. Para obtener
$ z $ 2.55) = P(-2.55 < z < 2.55) = .9892. el área a la derecha de :: = 2.71 se resta el área entre -oo y 2.71 de l. Así

P(z.2!2.71) 1 - P(, s 2.71)


Ejemplo 3.6.3 ¿Cuántos valores de x están entre ~2.74 y 1.53?
1 - .9966
Solución La figura 3.6.9 muestra el área que se pide. En la tabla C se .0034
encuentra que el área que está entre -oo y 1.53 es de .9370 y el área entre
-oo y -2.74 es .0031. Para obtener la probabilidad se resta .0031 a .9370.
Eje,nplo 3.6.5 Dada la distribución normal estándar calcular P(.84 $ zS
Esto es
2.45).
P(-2.74 =s 1; ::;:-; l.53) = .9370 - .0031 = .9339 Solución. El área que se desea calcular se muestra en la figura 3.6.11.
Primero se obtiene el área entre -oo y 2.45 a la que se le resta el área entre
Ejemplo 3.6.4 Dada la distribución normal estándar, calcular P(::: ~ 2.71 ). -oo y .84. En otras palabras
128 Distribuciones de probabilidad Ejercicios 129
P(.84 s: z s: 2.45) = P(z s: 2.45) - P(z s: .84) 3.6.13 P(c > ,, ) = .0384.
= .9929 - . 7995 3.6.14 P(z 1 $ z $ 2.98) = .1117.
3.6.15 P(-: 1 S:zS:z 1)=.8J32 .
. 1934
Aplicaciones Aunque su importancia en el can1po de la estadística es indis-
cutible. uno puede darse cuenta de que la distribución normal no es una ley
inherente a todas las características mesurables que ocurren en la natu-
raleza. Sin e1nbargo, es verdad que muchas de estas características tienen
una distribución aproximadamente normal. En consecuencia, aún cuando no
existe ninguna variable que en la práctica se encuentre distribuida con pre-
O 2.71 cisión, la distribución normal se puede utilizar como modelo para nor-
Figura 3.6.10. Curva normal estándar que muestra P(z ~ 2.71 ). malizar la distribución de muchas variables de interés. Al utilizar la dis-
tribución normal como modelo, es posible establecer afirmaciones de proba-
bilidad más útiles y mucho más convenientes para algunas variables que si
se utilizara un modelo más complicado.
La estatura y la inteligencia humana son considerados frecuentemente
como·ejen1plos de variables que tienen aproximadamente una distribución
normal. Por otro lado, Elveback et. al. 4 y Nelson et al. 5 aseguran que
muchas distribuciones importantes para el campo de la salud pueden ser
O .84 245 descritas apropiadamente mediante una distribución normal. En los casos en
Figura 3.6.11. Curva norma! estándar que muestra P(.84 S z: S: 2.45). que una variable aleatoria tiene distribución aproximadamente normal, o
en aquellos en que la falta de datos completos hace razonable considerar
EJERCICIOS _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _~ esta suposición, la distribución normal es una gran ayuda para el estadístico
en su esfuerzo para resolver problemas práclicos relativos a esa variable.
Dada la distribución nonnal estándar, calcular: Hay varias razones más por las que la distribución normal es muy r'
importante en estadística, las cuales serán consideradas a su debido tiempo.
3.6.1 El área bajo la curva entre z =O y'z = l .43. Por ahora, se considera la forma de responder a preguntas sencillas de pro-
3.6.2 La probabilidad de que una z. sacada al azar, tenga un valor entre z = -2.87 babilidad acerca de variables aleatorias cuando se sabe o es razonable supo-
y z = 2.64.
ner que éstas presentan una distribución aproximadamente normal.
3.6.3 P(z ~ .55).
3.6.4 P(z ~ -.55 ).
3.6.5 P(c <-2.33). Ejemplo 3.6.6 Un terapista físico piensa que los puntajes en una prueba de
3.6.6 P(z < 2.33). destreza manual tienen una distribución aproximadamente normal, con una
3.6.7 P(-1.96$z$ l.96). media de I O y una desviación e:-.tándar de 2.5. Si a un individuo, elegido
3.6.8 P(-2.58 $ z $ 2.58). aleatoriamente, .<..e le aplica el exarnen. ¿cuá! es la probabilidad de que logre
3.6.9 P(-1.65 $z$ l.65). un puntaje de 15 o más puntos?
3.6.10 P(z = .74).
Solución Primero hay que dibujar la gráfica de la distribución y sombrear
Dadas la siguientes probabilidades, calcular z : el área correspondiente a la probabilidad que se pide. Véase la figura 3.6.12.
1
Si la distribución fuese una distribución normal estándar con una media
3.6.11 P(z $ z, J = .0055. igual a O y una desviación estándar igual a I, sería posible utilizar la rabia C
3.6.12 P(-2.67 $ z S: Z¡}.::: .97 J 8.
para calcular fa probabilidad con poco e.\fuerzo. Por fortuna, es posible

'-
r
i
130 Distribuciones de probabilidad Ejercicios 131

-
11
íl
15 - 10 5
' 2
2.5 2.5
1 a '- 2.5 Por tanto, se aprecia que z0 es igual a 2.
1 Al analizar con mayor detenimiento estas relaciones, se nota que la dis-
tancia desde la media, 1O, para el valor de interés de x, \ S, es 15 ~ 1O = 5,
que es una distancia de dos desviaciones estándar. Cuando los valores de x
µ=10 15 X
son transformados a valores de z. la distancia del valor z (de interés) desde
Figura 3.6.12. Distribución normal para ta distribución aproximada de los puntajes
de una prueba de destreza manual. su media, O, es igual a la distancia del valor correspondiente x desde su
media, 10, en unidades de desviación estándar. Ya se vio que, efectiva-
transformar cualquier distribución nonnal en una nonnal estándar. Lo que mente, la distancia es de dos unidades de desviación estándar. En la dis-
se hace es transformar todos los valores de X en los valores correspondien- tribución de z, una desviación estándar es igual a uno y, consecuentemente,
tes de z. Esto significa que la media de X se debe igualar a O, que es la el punto sobre la escala de z se localiza a una distancia de desviación
media de z. Ambas distribuciones se muestran en la figura 3.6.13. Se debe estándar de 2 (unidades) desde O, z::; 2, resultado que se obtiene al utilizar
determinar qué valor de z. por ejemplo z0 , corresponde a una x de 15. Esto la formula. Al consultar la tabla C se encuentra que el área a la derecha de
se hace con la siguiente fórmula.: z = 2 es .0228. Este análisis se resume a la siguiente forma:

' - X
---
-

0-
f'
(3.6.3)
/'(x 2:: 15) = P (z 2=
15-10)
i . .5 = P(z 2= 2) = .0228

Para responder a la pregunta original, se dice que la probabilidad de que un


la cual transforma cualquier valor de x, de cualquier distribución normal. en individuo, elegido aleatoriamente, obtenga 15 o más puntos en el examen es
el valor correspondiente de z en la distribución normal estándar. Para este de .0228.
ejemplo se tiene: -~·
Ejemplo 3.6.7 Supónga'>e que se sabe que el peso en una población de indivi-
duos tiene una distribución aproximadamente normal, con una media de 140 li-
bra<; y una desviación estándar de 25 libras. ¿Cuál es la probabilidad de que una
persona, elegida aleatoriamente de entre ·ese grupo, pese entre 100 y 170 libra5?
Solución La figura 3.6.14 muestra la distribución de pesos y la distribución
de z para la cual se transformaron los valores originales para determinar las
probabilidades que se piden. Se calcula el valor de z que corresponda a una
xde los IOOcon
10 15
'
' - llJIJ -
25
140
- 1.6

Analóg~mente, para x = 1700 se tiene


170 - 140
,,- 1.2
-"
o ~ i En la tab];_i C se encuentra que el área entre -oo y 1.6 es de .0548 y el
Figura 3.6.13. Distribución norn1al de los punLajes sobre destreza n1anua] (.r) y la élrea entre -oo y 1.2 es de .8849. El área buscada es la resta de .8849 - .0548
distribución normal estándar(:).
= .8301. Resu1niendo:
Ejercicios 133
132 Distribuciones de probabilidad
EJERCICIOS~~~~~~--~~~~~~~~~~~

P( ]()() s; x S 170)
.!00 - l ·lll s
}'l zs 170 - 1411)
25 3.6.16 Supóngase que las edades de inicio de cierta enfern1c<lad 1ienen una dis-
tribución aproximadamente normal, con una media de 11.5 años y una
P( - l.6 s z: s 1.2) desviación estándar de 3 años. Un niño contrae recientemente la enferme-
P(--x s z: s 1.2) F'(-x s z s -1.6) dad. ¿Cuál es la probabilidad de que el niño tenga:
a) Edad entre 8 1/ 2 y 14 1/ 2 años?
.8849 - .0548
b) Más de 10 años?
.8301 e) Menos de 12?

3.6.17 En un estudio de dactilografía, una característica cuantitativa muy impor-


La probabilidad buscada es .8301. tante es el total de surcos en los 1O dedos de un individuo. Supóngase que el
total de surcos en los dedos de los individuos en una población tienen dis-
Ejemplo 3.6.8 En una población de 10 000, con los individuos descritos en tribución aproximadamente nonnal con una media de 140 y una desviación
el ejemplo 3.6.7, ¿cuántas personas se espera que pesen más de 200 libras? estándar de 50. Calcular la probabilidad de que un individuo, elegido al azar
• de entre esa población, tenga un total de surcos en los dedos:
Solución Primero se calcula la probabilidad de que una persona, elegida a) De 200 o más.
aleatoriamente de entre esa población, pese más de 200 libras. Es decir b) Menos de 100.
•e) Entre 100 y 200.
d) Entre 200 y 250.
J>(x > 200) P( z > '.200 '.!~ l--10) P(z > '.l.--1) 1 - .9~!18 .008'.l e) En una población de 10 000 personas, ¿cuántos puede esperarse que
tengan un total de 200 surcos o más'?

De las 1O000 personas se espera que JO 000( .0081) = 82 pesen más de 3.6.18 Si la capacidad de la cavidad craneana de una población tiene una distribu-
200 libras. ción aproximadamente nonnal, con una media de 1400 ce y una desviación
estándar 125 ce, calcular la probabilidad de que una persona, elegida aleato-
riamente de entre esa población, tenga una capacidad de cavidad craneana: ij[
a) Mayorque1450cc. b) Menorquel350cc. 1¡;!
e) Entre 1300 y 1500 ce.

3.6.19 Supóngase que el tiempo promedio de permanencia hospitalaria por enfer-


n1cdad crónica para un tipo de paciente es de 60 días, con una desviación
estándar de 15. Si es razonable suponer que se liene una distribución apro-
ximada1nente normal para el tiempo de hospitalización, calcular la probaQ.i-
"º 140 170
' Jidad de que un paciente, elegido aleatoriamente de entre ese grupo, tenga
una hospitalización:
a) ~1ayor que 50 días. b) Menor que 30 días.
e) Entre 30 y 60 días. d) Más de 90 días.

3.6.20 Si el nivel total de colesterol en cierta población tiene una distribución aproxi-
madamente normal. con una inedia de 200 mg/100 ml y una desviación están-
-1.6 O 1.2 dar de 20 n1g/JOO ml, calcular la probabilidad de que un individuo, elegido al
Figura 3.6.14. Distribuciones de pesos (.r) y la distrihución nnnna! e~1ándar (:::) azar de cnt~e esa población. lenga un nivel de colesterol:
correspondiente.
r
f

134 Distribuciones de probabilulad Ejercicios y preguntas de repaso 135


a) Entre 180 y 200 mg/100 mi. b) Mayor que 225 mg/100 mi. 10. Dar un ejemplo de variable aleatoria que pueda distribuirse de acuerdo a la ley
e) Menor que 150 mg/100 mi. d) Entre 190 y 210 mg/100 mi. de Poisson.
11. Describir la distribución normal.
3.6.21 Dada una población con distribución normal, con una media de 75 y una 12. Describir la distribución normal estándar y decir cómo se utiliza en estadística.
variancia de 625, calcular: 13. Dar un ejemplo de variable aleatoria que pueda seguir, a! menos aproximada-
a) P(SO ~ x ~ 100). b) P(x > 90). mente, una distribución normaL
1 e) P(x < 60).
e) P(30SxS 110).
d) P(x ~ 85). 14. Utilizar los datos de la respuesta a la pregunta 13 para demostrar el uso de la
distribución normal estándar para responder a preguntas de probabilidad rela-
cionadas con la variable seleccionada.
-¡;1 3.6.22 Los pesos de una población de mujeres jóvenes con la mayoría de edad 15. Ei método usual para enseñar una habilidad de cuidado propio para débiles
tienen una distribución aproximadamente normal con una media de 132 mentales, es efectivo en el 50 por ciento de los casos. Un nuevo método es
l. libras y una desviación estándar de 15. Calcular la probabilidad de que una ensayado con 10 enfermos. Si el nuevo método no es mejor que el habitual,

¡ joven, elegida aleatoriamente de entre esa población, pese:


a) Más de 155 libras.
e) Entre 105 y 143 libras.
b) 100 libras o menos.
¿cuál es la probabilidad de que siete o más individuos lo aprendan?
16. Los registros del personal de un gran hospital muestra que el 10 por ciento de
los empleados de mantenimiento y aseo renuncian un año después de ser con-
tratados. Si IO nuevos empleados son contratados:
1
,,
., a) ¿Cuál es la probabilidad de que exactamente la mitad de ellos se encuentren
3.7 RESUMEN _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _~
1 trabajando un año después?
b) ¿Cuál es la probabilidad de que nínguno renuncie un año después?
En este capítulo, los conceptos de probabilidad descritos en el capítulo ante- e) ¿Cuál es \a probabilidad de que 3 de ellos renuncien antes de terminar el año?
1 rior se abordan con mayor profundidad. Se analizan los conceptos de varia-
17. En cierto país en desarroHo, el 30 por ciento de los niños están desnulridos. En
ble~ aleatorias discretas y continuas, así como las distribuciones de proba-
una muestra aleatoria de 25 niños de esa área, ¿cuál eS la probabilidad de que
bilidad. Se examina detalladamente, muy en especial, dos distribuciones de el número de niños d..-:snutridos sea:
probabilidad discreta, la binomial y la de Poisson, y una distribuciónº de pro-
babilidad continua, la normal. También se estudia cómo esas distribuciones a) Exactamente l O?
ieóricas permiten formar enunciados de probabilidad, para las variables b) Menosde5?
aleatorias que son de interés para el profesional de la salud e) Cinco o más?
d) Entre tres y cinco inclusive?
e) Menos de siete, pero más de cuatro?

EJERCICIOS Y PREGUNTAS DE REPASO _ _ _ _ _ _ __ 18. En promedio, dos estudiantes por hora son enviados para tratamiento en la sala
de primeros auxilios en una gran escuela primaria.
l. ¿Qué es una variable aleatoria discreta? Dar tres ejemplos que sean de interés a) ¿Cuál es la probabilidad de que durante una hora dada, tres estudiantes
para el profesional de la salud. lleguen a la sala de primeros auxilios para tratamiento'?
2. ¿Qué es una variable aleatoria continua? Dar tres ejemplos que sean de interés b) ¿Cuál es la probabilidad de que durante una hora dada, do5 o meno5 estu-
para el profesional de la salud. diantes sean enviados a la sala de primeros auxilios?
3. Definir la distribución de probabilidad para una variable aleatoria discreta. e) ¿Cuál es la probabilidad de que entre tres y cinco estudiantes, inclusive,
4. Definir la distribución de probabilidad para una variable aleatoria continua. sean enviados a la sala de primeros auxilios durante una hora dada?
5. ¿Qué es la distribución de probabilidad acumulada? 19. En pron1edio. cinco fumadores pasan por la esquina de cierta calle cada 10
6. ¿ Qué es un ensayo de Bernoulli?
minutos. ¿Cuál es la probabilidad de que durante un periodo dado de 10 mi-
7. Describir la distribución binomial.
-nutos, el número de fumadores que pasen sea de:
8. Dar un ejemplo de variable aleatoria que pueda seguir una distribución bino-
mial. a) Seis o menos? b) Siete o más?
9. Describir la distribución de Poisson. e) Exactamente ocho?
136 Distribuciones de probabilidad Bibliografía 137

20. En una área 1nc1ropolitana hay en pron1edio un suicidio por n1es. ¿Cuál es la 28. Dada una variable aleatoria X distribuida normalmente, con a= l O y P(X S 40)
probabilidad de que durante un mes dado, el número de suicidios sea: =.0080, calcularµ.
0Mb*= 0~=*=' 29. Dada una variable aleatoria X distribuida nonnalmente, con cr =15 y P(X '$. 50)
e) Más de tres? = .9904, calcularµ.
30. Dada una variable aleatoria X distribuida normalmente, con cr = 5 y P(X ~ 25)
21. El IQ (coeficiente intelectual) de los individuos admitidos en la escuela estatal =.0526, calcularµ.
para retrasados n1cntalcs tiene una distribución aproxin1adamente normal con 31. Dada una variable aleatoria X distribuida normalmente, conµ= 5 y P(X:;; 10)
una media de 60 y una desviación estándar de 10. = .0778, calcular a.
a) Calcular la cantidad de individuos con un IQ n1ayor a 75. 32. Dada una variable aleatoria X, distribuida normalmente, con µ = 30 y P(X :5 50)
b) ¿Cuál es la probabilidad de que un individuo, elegido al azar, tenga un IQ = .9772, calcular cr.
entre 55 y 75?
e) Calcular P(50 S: X S: 70).

22. Un supervisor de enfermería encontró que el equipo de enfermeras, en prome- BIBLIOGRAFÍA----------------


dio, termina cierta tarea en JO minutos. Si el tiempo requerido para completar
la tarea sigue una distribución aproximadamente normal con una desviación es- Obras citadas
tándar de 3 minutos, calcular:
a) La cantidad proporcional de enfermeras que terminan una tarea en menos 1, NORMAN L. JOHNSON y SAMUEL KoTZ, Discrete Distributions, Houghton-Mif-
de 4 minutos. flin, Boston, 1969.
b) La cantidad proporci0nal de enfermeras que necesitan más de 5 minutos 2. FR:A.NK A. HAIGHT, Handbook of the Poisson Distribution, Wiley, Nueva York,
para terminar una tarea. 1967.
e) La probabilidad de que una enfermera a la que recientemente se le asignó la 3. HELEN M. WALKER, Studies in the History of Sratistical Method, Williams &
tarea, termine en 3 n1inutos. Wilk.ins, Baltimore, 1931.
4. LILA R. ELVEBACK, CLAUDE L. GULLIVER y F. RAYMOND DEATiNG, JR., ·'Health,
23. Los puntajes logrados en una prueba de aptitud para estudiantes de enfermería Normality and the Ghost of Gauss'', The Journal of the A,nerican A,Jedical
sigue una distribución aproximadamente normal, con una media de 500 y una Associarion, 211 (1970), 69-75.
variancia de l 0000. 5. JERALD C. NELSON, ELIZABETH HA YNES, RüDNEY W!LLARD y JAN KUZMA, "The
a) ¿Qué proporción de los individuos examinados logrará menos de 200 pun- Distribution of Euthyroid Serum Protein-Bound Iodine Levels", The Jo11n1al of
tos? rite An1erican Medica! Association, 216 ( J 971 ), '1639-1641.
b) Una persona está por resolver uo examen. ¿Cuál es la probabilidad de que
logre un puntaje de 650 o más puntos? Otras referencias
e) ¿Qué proporción logrará puntajes entre 350 y 675 (puntos)?
1. SAM DUKER. "Toe Poisson Distribution in Educational Research", Jour11al of
24. Dada una variable binomial con una media de 20 y una variancia de 16, calcu- Experir11e11tal Educatio11. 23 {1955), 265-269.
lar II y p. 2. M. s. LAFLEUR, P. R. H!Nk!CHSEN, P. C. LANDRY y R. B. MooRE, "Toe Poisson
25. Supóngase que una variable X se distribuye normalmente, con una desviación Distribution: An Experimental Approach to Te2.ching Statistics". Physics
estándar de 10. Dado que e! .0985 de los valores de X son mayores que 70, Teacher, JO (1972), 314-321.
¿cuál es valor de la media de X'?
26. Dada una variable aleatoria X distribuida norma!Jnentc, calcular el valor nun1é-
rico de k, tal que P(µ - kcr :5 X :5 µ+ka)= .754.
27. Dada la variable aleatoria X distribuida nonnalmente, con una media de 100 y
una desviación estándar de 15, calcular el valor numérico de k, tal que:
a) P(X S k) = .0094. b) P(X ~ k) = .1093.
e) P(IOO S X s k) = .4778.
d) P(k' S X S k) = .09660, donde k' y k son equidistantes de µ.

L
f

' 4
Algunas distribuciones
de muestreo importantes

4.1 INTRODUCCIÓN _ _ _ _ _ _ _ _ _ _ _ __

Antes de examinar el tema de estudio de este capítulo es conveniente repa-


sar algunos de los conceptos importantes estudiados hasta ahora. En el capí-
tulo l se estudia la organización y procesamiento de datos, así como los
conceptos de tendencia central y dispersión y la fonna de calcular sus medi-
das descriptivas. En el capítulo 2 se presentan las ideas fundamentales de la
probabilidad, y en el capítulo 3 se considera el concepto de distribución
de probabilidad. Estos conceptos son importantes para comprender la infe-
rencia estadística, tema de estudio que abarca la mayor parte de este libro.
Este capítulo sirve para vincular los conceptos ya n1encionados, de natu-
raleza esencialmente descriptiva, con la mayoría de los temas subsecuentes,
seleccionados del área de estudio de la inferencia estadística.

4.2 MUESTREO ALEATORIO S I M P L E - - - - - - - - -

En términos generales, existen dos tipos de muestreo, probabil(stico y no

i probabil(stico, aunque en este libro se estudia únicamente el primero, debi-


do a que únicamente para el muestreo probabilístico existen procedimientos
estadísticamente seguros que permiten inferir, a partir de la muestra extraí-
da, la población de interés.

139
140 Algunas distribuciones de 1nuestreo i111porta11tes Muestreo aleatorio simple 141

DEFINICIÓN~~~~~~~~~~~~~~~~~~ adelante; por ahora, es necesario estlldiar la manera en que se selecciona


una muestra aleatoria simple. Para asegurar una selección totalmente aleato-
Una muestra probabilística es una muestra extraída de una ria, se debe seguir algún procedimiento objetivo, pues se intenta evitar el
población, de tal fonTia que cada elemento tiene una probabili- uso de juicios subjetivos para decidir qué elementos de la población consti-
dad conocida de estar incluido en la muestra. tuyen una muestra aleatoria. En el siguiente .ejemplo se muestra un método
para elegir una muestra aleatoria simple a partir de una población.
Ejemplo 4.2.1 Supóngase que la población de interés se compone de los
De cualquier población finita de tamaño N, es posible extraer un nú-
J 50 valores de la concentración de azúcar en la sangre, tomados en ayunas,
mero de muest"ras diferentes de tamaño n. (Esta afirmación se hace para la
que aparecen en la tabla 4.2.1. Se desea extraer una muestra aleatoria sim-
hipótesis de que N es lo suficientemente grande como para permitir el
ple de tamaño 1O, utilizando los números aleatorios de la tabla D.
muestreo. Como regla, las poblaciones pequeñas, por razones obvias, no
son muestreadas. En lugar de ello, se examina la población completa.) Solución Una forma de seleccionar una muestra aleatoria simple es hacien-
do uso de una tabla de números aleatorios como la tabla D del apéndice 11.
El primer paso es localizar un punto de partida aleatorio en la tabla. Esto se
DEFiNICIÓN puede hacer de varias formas: una de ellas es quitar la vista de la página
mientras se toca con la punta del lápiz. El punto de partida aleatorio es el
Una muestra de tamaño n, extraída de una población de tama- dígito, más c.ercano al lugar donde apunte lápiz. Supóngase que el punto de
ño N. se llama ,nuestra aleatoria si111ple, si cada muestra posi- partida aleatorio, obtenido mediante el procedimiento descrito, se encuentra
ble de tamaño n tiene la misma probabilidad de ser selec- en la intersección del renglón 21 y la columna 28. El dígito en ese punto es
cionada. 5. Puesto que se tienen únicamente 150 valores para elegir, sólo se puede
utilizar números aleatorios del l al 150. Resulta conveniente seleccionar
números de tres dígitos, de manera que sean elegibles solamenle los
El sistema de extracción de muestras que satisface la definición anterior números del 00 l al 150. El primer número de tres dígitos para el punlo de
se llama ,nuestreo aleatorio sin1ple. partida aleatorio es 532, un número que no se puede utilizar. Al recorrer la
Más adelante se demuestra el procedimiento del muestreo aleatorio sim- tabla hacia abajo, aparecen los números 196, 372. 664, 928 y finalmente el
ple, pero antes se considera la cuestión de si se muestrea con reemplazo o 137, que es un número que sí se puede utilizar. El 137-ésirno valor de la
sin ree,npla;,o. Cuando se utiliza un muestreo con reemplazo, cada elemento tabla 4.2, 1 es 92, y éste constituye el primer valor de la muestra. Se procede
de la población está disponible para cada extracción. Por ejemplo, como a registrar el número aleatorio y el valor correspondiente del ni\'el de azúcar
parte de un estudio de tiempo de estancia, se extrae una muestra de una en la sangre a partir de los datos en la tabla 4.2.2. Los números aleatorios
población de pacientes antiguos de un hospital. Supóngase que el muestreo se registran para ver cuáles fueron seleccionados. Pues[o que se trata de una
comprende la selección de una muestra de expedientes tomados del departa- rnuestra sin reemplazos, no se incluye dos veces un mismo valor. Al conti-
mento de registro médico, de los pacientes dados de alta. En un muestreo nuar con el misn10 procedimiento. se obtienen los nue\"e números aleatorios
con reemplazo se selecciona un expediente para incluirlo en la muestra, se restantes junto con sus respecti\·os \'alares del nivel de azúcar en la sangre.
registra el tiempo de estancia y se devuelve el expediente al archivo. Al tal corno se muestra en la tabla 4.2.2. Nótese que, cuando se llegó al. final de
devolver el expediente a la "población" éste puede ser extraído nuevamente, la columna. sin1ple1nente. se aYanzó tres dígitos hasta el 028 y se continuó
en cuyo caso, el tiempo de estancia sería registrado otra vez. En un mues- hacia arriba de la colu111na. Tan1bién. se pudo haber comenzado desde la
treo sin reemplazos, el expediente extraído no es devuelto al archivo des- parte de arriba de dicha columna con el nú1nero 369.
pués de registrar el tiempo de estancia, sino que se separa hasta extraer toda De esta fom1a se ha ex.traído la muestra aleatoria simple de tan1año I O a
la rnuestra. Con este procedimiento, un expediente debe aparecer sólo una panir de la población de 150 valores. En todo estudio futuro, siempre que se
vez en la muestra. En la práctica, por lo general, un muestreo siempre se utilice el térn1ino de n1uestra aleatoria simple. se entenderá que dicha mues-
hace sin reemplazo. La importancia y significado de esto se explica más tra fue extraída de esta fonna 0 en una equivalente.
i

L
r
Distribuciones muestrales 143
142 Algunas distribuciones de muestreo importantes
Tabla 4.2.2. Muestra de 1O valores de azúcar
en sangre, tomados de los datos
de la tabla 4.2.1.
Niín1ero Niín1ero del individuo
aleatorio en la n1uestra Valor
' c~=~==~=~r-~~~---~x-~~~-xcc~~-c
-2
:;: -- - -
~ocx~c~c~~xccc-~~~x-c~oxco~oc~
---- -- - -- -- 137
114 2
1 92
108
1 028 3 108
' .§ -~1~T~=~x~=-~~~~=~x~=-~~T~=~oo~c
l
085 4 102
.~
""' -------------
~~~l~~J~~~~~~~~~~~~~~TTTTTT~TTT~
018
0-12
5
6
93
85
053 7 90
' ~==~x=~=x~=~-===~~=-~cooco~c~ooc
-T~~~x~~-=~-~X~I-T~~~=·~x~=~~oo~ 108 8 93
"oo 1
-2
$ -- - - - ---- -- - -- - - 144
126
. 9
10
88
106
:;,
>
s
""oo
:':; -
""-.s;; 3~8;33S3§@Q~~633S35~=~~!~2~~~~ Muchas de las computadoras que actua\n1ente hay en el mercado tienen
la capacidad para generar números aleatorios. El investigador puede utilizar

"""o:7. "'
'
computadoras para generar los números aleatorios que necesite, como una
alternativa a utilizar tablas impresas de números aleatorios. De hecho. los
o
o
-2
:;:
tZ§~2S~S~28~~t~2~g~2g~~§~;;ss~
-- - -- - -- -- - - --- números "aleatorios" generados por computadora en realidad son niín1eros
>, 1
o pseudoaleatorios porque son el resultado de una fórmula determinística. Sin
§ o embargo. según el punto de vista de Fishman, 1 estos números parecen servir
o' ~ satisfactoriamente para muchos propósitos prácticos.
"§ =========~~~~~~~~~~xxxxxxxxxx~
-~~~~=~x~=-~r~~~=~oo~c-~~~~=~x~c

""E
o
s ""
2 EJERCICIOS-----------------
,."' S6Qfª;;~ª33~;;~g~g~¿s:g~5~g33~
- - -- -- ---
o -2
o
o 1
:;: - - - - - 4.2.1 Mediante el uso de la tabla de números aleatorios, seleccionar un nuevo
•; punto de partida aleatorio. Extraer una muestra aleatoria sitnple de tamaño
s
o 10 a partir de los datos de la tabla 4.2. I. Calcular !a media, la variancia y la
"o'
•o g desviación estándar para la n1uestra.
~~~;.~~~~~~~~~+~~~~~~~~2J.~~~~~ª
~"
-t.2.2 Obtener una muestra aleatoria simple de tan1año 5 a partir de los datos de la
"""f ]"' labia 1.5.1. Calcular la media. la variancia y la desviación estándar.
""
>
o E
?. g
- ;;~f~S;2;;;2~S~338§~&~3ª§5~!;;
-2 - - - --- - - - - -- -
-. "
,..¡ E
"
"
"
:;:
s
4.3 DISTRIBUCIONES MUESTRALES ~ - - - - - - - -

En esta sección se estudia el ten1a principal de este capítulo, las distribu-

"''~ -2.." ~
.,! :-§ - 71 :--: -:- ,:-. :.:: t- X::-.,=: - 71 ,,.-, -:- ._-. ·..= r- X::',,=: - 71 :'": -r- t.."":<= t- X ::'. ,=:
2 ----------7!717171717171717171:'": ciones 111111:strales. Es necesario destacar la importancia de un entendinlien-
~ :-;: to claro de eStas diSiribucioileS.-);<l que este concepto es ·Ia-cla\'e ·para cotn-
"" prender la inferencia estadística. por lo que esta parte del libro se inicia con
la siguiente definición.
Distribuciones de la media de la muestra 145
144 Algunas distribuciones de 111uestreo importantes
bución siguiendo los Pasos del procedimiento descrito en la sección an-
DEFINICIÓN~~~~~~~~~~~~~~~~~~
terior.
La distribución de todos los valores posibles que puede asumir Ejemplo 4.4.1 Sea una población de tamaño N = 5, la cual se compone de
una estadística, calculados a partir de muestras del mismo las edades de cinco niños que son pacientes externos de una clínica de salud
tamaño, extraídas aleatoriamente de la misma población, se lla- mental. Las edades son las siguientes: x 1 = 6, x2 = 8, x~ = 10, x 4 = 12, x5 =
ma distribución ,nuestra! de esa estadística. 14. La mediana µ para esa población es igual a LX,- IN~ 1O y la variancia es

Las distribuciones muestrales pueden construirse empíricamente a partir .,


L(x, - µJ' 40
de poblaciones finitas y discretas. Para ello, se procede como sigue: cr·
N , 8

l. De una población finita de tamaño N, se extraen de manera aleatoria todas las


muestras posibles de tamaño 11. Se calcula otra medida de dispersión como sigue:
2. Se calcula la estadística de interés para cada muestra.
3. Listar en una colu1nna los distintos valores observados de la estadística. y en "
L,(X, - µ.)-.,
40 = 10
otra columna las frecuencias correspondientes de cada valor observado. s' ,\' - 1 = 4

Elaborar la distribución muestra! es una tarea formidable si la población


Esta cantidad se utilizará en el siguiente capítulo. Por ahora, se extraen
es de un ta1naño muy grande e imposible si la población es infinita. En este
todas las muestras posibles de tamaño n = 2 a partir de esta población. Estas
caso, es posible obtener aproximaciones de las distribuciones muestrales
muestras junto con sus medias se encuentran en la tabla 4.4. l.
tomando un gran número de mue~tras de un tamaño dado. En este ejemplo se observa que, cuando el muestreo se efectúa con
Nonnahnente, para una distribución muestra!, se tiene interés en cono-
reemplazos, hay 25 muestras posibles. En general, cuando el muestreo se lle-
cer tres cosas: inedia, \'ariancia y fon11afu11cio11al (apariencia gráfica). 11
va a cabo con reemplazos, el número de muestras posibles es igual a N •
Es bien conocida la dificultad que existe para elaborar una distribución
muestra\ de acuerdo al procedimiento anterior cuando la población es muy Tabla 4.4.1. Todas las muestras posibles de tamaño 11 = 2 de una población de
grande. También constituye un problema cuando la población es infinita. En tamaño N = 5. Las muestras por arriba o por abajo de la diagonal principal resultan
este caso, lo mejor que se puede hacer es aproximar la distribución del mues- cuando la muestra se extrae sin reemplazos. Las medias muestrales aparecen entre
treo para la estadística. paréntesis.
Ambos problemas pueden evitarse por medio de la matemática. Aunque Segundo muestreo
los procedimientos que intervengan no son compatibles con el nivel mate- 12 14
10
mático de este libro, las distribuciones muestrales pueden deducirse rna-
fi
"
6, 8 ó, 10 6, 12 Ó, 14
temáticamente. El lector interesado puede consultar cualquiera de los 6". ó, J
( (O)
I fi I (7) (8) (9)
muchos libros de estadística matemática. por ejemplo, el de Hoel, 2 o el de
Anderson y Bancroft. 3 H, fj 8. 8 H, JO 8, 12 8. 14
8
(7) 81 41 ( 10) (11)
En las siguientes secciones se estudian algunas de las distribuciones
muestrales más frecuentes. Primer 10 JO, 6 JO, H !O, 1 10. 1'.? 10. 14
muestreo (8) (9) Oi 11) ( !2)

12 12, 6 !2, 8
4.4 DISTRIBUCIONES DE LA MEDIA DE LA ~ll!ESTRA _ __ (Y) 1101

14 14, 6 14, H 14, 10


l 1na distribución muestra] importante es la distribución de la media de la ( 1() J ( 11) 112)
n1uestra. A continuación se da un ejen1plo de cón10 elaborar e~ta di,.,tri-
(
i

¡ 146 Algunas distribuciones de muestreo importantes 1! Distribuciones de la media de la n1uestra 147

1
Tabla 4.4.2. Distribución muestra! de X calculada a
partir de las muestras de la tabla 4.4.1.
¿(,, - µ.,)'
2

i a Frecuencia Frecuencia relativa


CT:¡

(6 - I0) 2
N''

+ (7 10) 2 + (7 - 10r+ ... + (14 - 10)'


1! 6 1 11 25
2 / 25
25
7 2
8 3 3 ! 25
100 ~ 4
1 9
JO
4
5
4 / 25
5/ 25
25
11 4 4/ 25
-1 12 3 3I 25
También se puede advertir que la variancia de la distribución muestral
13 2 2/ 25
14 1 l/ 25 no es igual a la variancia de la población. Sin embargo, es interesante obser-
var que la variancia de la distribución. muestra! es igual a la variancia de la
Total 25 25 / 25

Para elaborar una distribución muestral para X se listan los diferentes f(:,:) !

valores de X en una columna y sus frecuencias de ocurrencia en otra, como 6


se observa en la tabla 4.4.2.
Obsérvese que los datos de la tabla 4.4.2 satisfacen los requerimientos 5

de una distribución de probabilidad. Las probabilidades individuales son 4


todas mayores que O y la suma es igual a 1.
En un párrafo anterior se estableció que para una distribución muestra! 3

se tiene interés en la forma funcional de la distribución, su media :t su va- 2


riancia. 1
En la figura 4.4. l se muestra el histograma de X junto con la distribu-
ción de la población. Es notable la diferencia entre la apariencia del his- oYrD [J,[J,CJ CJ ,
tograma de la población y la del histograma de la distribución muestral de
6 8 10 12
"
Distribución de la población
X. Mientras que el primero está distribuido uniformemente, el segundo crece
f(.i)
gradualmente hasta un punto máximo y después decrece formando una figu-
ra simétrica. El siguiente paso es calcular la media, representada por µ.r de 6
la distribución muestral. Para hacerlo, se suman las 25 medias de la muestra
5
y se divide entre 25. Así:
4

Ix,
6+7+7+8+ + 14 250
3

-~=N"= 10
25 <r
.o '
Es ~-nier~s":n_te _f!g!~[_ q~e __ la _ip~~i~ de la distr_i_~uci~n__ muestra! _p~ra_'.~ o_L1 1 1 1 1 1 1 1 1 1 1 1 , 1 1, 1 1 1 ,
6- 7 8 9 10-- 11 1-2 13 ---14 i
tiene los mismos valores que la media de la población original: Distribución muestral de X
1 Finalmente, el cálculo de la variancia de X. representada por cr.,2, se cal-
cula como sigue: Figura 4.4.1. Distribución de la población y distribución muestra} de X.
148 Algunas distribuciones de muestreo importa11tes Distribuciones de la inedia de la 111uestra 14,
población divida entre el tamaño de la n1uestra utilizada para obtener la dis~ seguridad de que la distribución muestra! está al menos distribuida en forma
tribución n1uestral. Esto es: aproximadamente normal bajo tres condiciones: l) cuando se hace el mues-
treo a partir de una población con distribución normal; 2) cuando se hace el
., IT K muestreo a partir de una población que no muestra una distribución normal
(T~ = 11 4
2

La raíz cuadrada de la variancia de la distribución muestra!, .,


. .J ar= a1...J;;,
se
y la muestra es grande, y 3) cuando se hace el muestreo a partir de una
población cuya forma funcional se desconoce en tanto que el tamaño de la
muestra es grande.
!1
llama error estándar de la inedia o, sin1plemente, error estándar. Al llegar a este punto, surge una pregunta lógica: ¿qué tan grande debe ~
Estos resultados no son coincidencias sino eje1nplos de la.s característi- ser la muestra para que el teorema del límite central sea aplicable? No 1
cas de las distribuciones muestrales en general cuando el muestreo es con existe una sola respuesta, pues el tamaño de la n1uestra depende de la condi- ¡
reemplazo o cuando se efectúa a partir de una población infinita. Para gene-
ralizar, se debe distinguir enLre dos situaciones: muestreo a partir de una po-
ción de no normalidad en la población. Una regla empírica establece que, en •
ti
1'
la mayoría de las situaciones prácticas, una muestra de tamaño 30 es sufi-
blación que sigue una distribución normal y muestreo a partir de una pobla- ciente. En general, la aproximación a la normalidad de la distribución mues-
ción que no sigue una distribución normal. tral para X llega a ser muCho mejor a medida que crece el tamaño de la
muestra.
il

Cuando el 1n11estreo se reali:a a partir de una población que sigue una Los resultados anteriores se han dado bajo la premisa de que el mues-
distribución nonnaf. la distribución de fa inedia de la 11111estra tiene las treo es con reemplazos o que la muestra fue extraída de una población in-
siguientes propiedades: finita. ·En general, no se efectúan muestreos con reemplazo y, en muchos ,11·
casos prácticos, éstos se deben hacer a partir de una población finita, por [
l. La distn'b11ció11 de _r será 11on11al. r
tanto, es necesario conocer el comportamiento de la distribución muestra!
2. La inedia. µ_r, de la distribución de X será i&11al a la 111C'dia de la pob/aciú11 de fa
de la media de la muestra bajo estas condiciones. Antes de hacer l.t1alquier ~
cual se extrajo.
afirmación general, conviene revisar nuevamente los datos de la tabla 4.4.l. 1~
3. Ln variancia, sf. de la distribución de .\" será (~uaf a la 1·ariancia de la pobla-
ción, dividida e11rre el tan1afiu de h111111esrra. Las medias de la muestra que resultan cuando el muestreo es sin reen1plazos
se presentan en la diagonal principal y son las mismas que están por debajo
Cuando el muestreo se efectúa a partir de una población que no sigue de dicha diagonal, siempre y cuando se ignore el orden en que se hicieron
una distribución nonnal, se utiliza un teorema matemático importante, co- las observaciones. Se observa que hay 10 muestras posibles. En general,
nocido como teorema del lín1ite central. La importancia de este teorema en cuando se ex.traen sin reemplazos muestras de tamaño n a partir de una
la inferencia estadística se resume en el siguiente párrafo. población finita de tamaño Ne ignorando el orden en que son extraídas las
Dada una población de cualquier Jonna funcional no nonnaf con una muestras, el número de muestras posibles se obtiene mediante la combi-
inedia,µ, y varianciafinita, a 2. fa distribució111nuesrraf de X. calcula- nación de N cosas tomadas n a la vez. En el presente ejemplo se tiene que:
da a partir de 11111estras de ta111a11o 11 de dicha población. será casi
l\/! o.
., 5. 4. 3 1
norn1af con inedia, µ, y varia11cia a 2!n. c11a11do la ,nuestra es 11111y .,.e,, = n!(,V ~ n)! = 2!3! = · = 1O posibles muestras
grande. 2!3!

Obsérvese que el teorema del límite central permite to1nar n1uestras a La media de Ja<; 1O medias muestrales es:
partir de poblaciones con distribución no nonnal y garantizar que .se obten-
gan aproximadamente los misn1os resultados que si la población tu\'iera una
distribución normal, siempre que se tome una muestra grande.
I,, 7 + 8 + 9 + ·. · + 13 100
La importancia de esto se demostrará más adelante al aprender que una
µ¡ = .ve,, 10 10 - 10

distribución muestal con distribución normal es una herramienta importante Nuevamente se aprecia que la media de la distribución muestra! es igual
en la inferencia estadística. En el caso de la media de la n1uestra. se liene la a la media de la población.

- ------·---·
r'

1
150 Algunas distribuciones de 1nuestreo importantes 1
, Distribuciones de la media de la muestra 151
La variancia de la distribución muestra! se calcula como sigue: l. Cuando el mueslreo se realiza a partir de una población distribuida nom1almente
,,t, con una variancia de población conocida:
Ic,, - µ,¡' _ 30
! ';
2 -
ª"-x - ---.,~.cr,,- - w - 3
a)µ¡=µ.
b) CT¡= cr ¡ { ;
e) La distribución muestra\ de X es nonnal.

en esta ocasión se observa que la variancia de la distribución muestra} no es 2. El muestreo se efectúa a partir de una población que sigue una distribución no
nonnal, con una variancia de población conocida :
igual a la variancia de la población dividida entre el tamaño de la muestra,
a) µX=µ -
• porque cri = 3 :t. 8 / 2 = 4. Sin embargo, existe una relación interesante que
b) CT¡= cr 1-/n, donde n IN'!, .05
se descubre al multiplicar cr 2 / n por (N - n) / (N - 1). Esto es:
2
o N-n 8 5-2
-·----·---3
n N-I 2 4
ax = (cr f Yn)
v2i
N
e) La distribución muestra\ de X es aproximadamente normal.

Este resultado indica que, si se multiplica la variancia de la distribución Aplicaciones Como se verá en capítulos posteriores, el conocimiento y
muestra! que se obtendría si el muestreo fuese con reemplazos, por el factor comprensión de las distribuciones muestrales son necesarios para entender
(N - n) ! (N - 1), se obtiene el valor de la variancia de la distribución mues- los conceptos de la inferencia estadística. La aplicación más sencilla de la
tra! que resulta cuando el muestreo es sin reemplazos. Es posib!-e genera- distribución muestra\ de la media de la muestra es el cálculo de la probabili-
lizar estos resultados con el siguiente enunciado. dad de obtener una muestra con una media de alguna magnitud especifica-
da. Esto se ilustra con algunos ejemplos.
Cuando el muestreo es sin ree,nplazos a partir de ttna población fini-
Ejemplo 4.4.2 Supóngase que en una población grande de seres humanos,
ta, la distribución muestra! de X tendrá una media µ y variancia
la dimensión del radio craneal sigue una distribución aproximadamente nor-
2 mal, con una media de 185.6 mm y una desviación estándar de 12.7 mm.
<T N - n
¿Cuál es la probabilidad de que una muestra aleatoria de tamaño 10 de esta
n N - l
población tenga una media mayor que 190?
Si el tamaño de la muestra es muy grande, el teorema del límite central es Solución Se sabe quy la muestra individual que se estudia es sólo una de
aplicable y el muestreo de X tendrá una distribución aproximadamente normal. todas las muestras posibles de tamaño 10 que pueden ser extraídas de la
El factor (N - n) / (N - 1) se llama corrección por población finita y se población, de modo que la media a la que conduce es una de las X que for-
puede omitir cuando el tamaño de la muestra es pequeño en comparación con man parte de la distribución muestra! de X que, teóricamente, puede infe-
el tamaño de la población. Cuando la población es mucho más grande que la rirse de esta población.
muestra, la diferencia entre a 2tn y (a 2!n)[(N -11) / (N - l)J es insignificante. Cuando se dice que la población tiene una distribución aproximada-
Por ejemplo, si una población está fonnada de 10000 observaciones y una mente normal, se supone que la distribución muestra} de X sigue, para casos
muestra de esta población se compone de 25 observaciones, la corrección por prácticos, una distribución normal. También se sabe que la media y la
población finita es igual a (10000 - 25) / (9999) = .9976. Multiplicar .9976 desviación estándar de la distribución muestra! son iguales a 185.6 y
2
por a /n es casi equivalente a multiplicar por l. La mayoría de los estadísticos ~( 12.7)2/10 = 12. 7/~IO = 4.02, respectivamente. Se supone que la población
no utilizan la corrección por población finita a menos que la muestra cor· es grande con respecto a la muestra, de manera que la corrección por pobla-
,;
tenga más del 5 por ciento de las observaciones de la población. Es de..:tr, la ción finita puede omitirse.
corrección de pobL1ción finita generalmente se ignora cuando n/N $ .05.
1
1
Las características de la distribución muestra! de x se resumen en las
siguientes condiciones:
En el capítulo 3 se aprendió que siempre que se tenga una .variable
aleatoria con distribución normal. puede transformarse fácilmente en una
distribución normal unitaria. Ahora la variable aleatoria es X, la media de

1
Ejercicios
153
152 Algunas distribuciones de muestreo i111portantes
o= 12.7mm
esta distribución es µ-X y su desviación estándar es O"-:X = cr/..¡;; Al modificar
adecuadamente la fórmula anterior, se obtiene la siguiente fórmula para
transformar la distribución normal de X en la distribución nonnal unitaria.
~
µ " 1B5.6mm
.....__ x
X - µ.'<
¡ --~- ,;,
(TI Vn (4.4.1) (al \il

La probabilidad que responde a la pregunta formulada se representa en t.,


el área a la derecha de X = 190 bajo la curva de la distribución muestra!. 11·
Esta área es igual al área de la derecha de
:\
O:¡; -Fo
_ 12,7 ,, 4.02 ¡¡
¡¡
190 - 185.6 4.4
1.09
' 4.02 4.02 .1379

X
!'¡'- 185.6 190

Al consultar la tabla normal unitaria. se encuentra que el área a la de- (b(


recha de 1.09 es . J 379; por lo tanto, se puede decir que la probabilidad de
que una n1uestra de tamaño 1O tenga una media mayor que 190 es .13 79.
La figura 4.4.2 muestra la relación entre la población original, la dis-
tribución muestra! de X y la distribución normal unitaria.

Ejemplo 4.4.3 Si la media y desviación estándar de la concentración de


hierro en el suero en hombres sanos es de 120 y 15 microgramos por cada .1379
100 ml, respectivamente, ¿cuál es la probabilidad de que una muestra
O 1.09
aleatoria de 50 hombres normales tenga una media entre 115 y 125 micro-
gramos cada 100 ml? ,,,
Figura 4.4.2. Distribución de la población, distribución muestra! y distribución nor-
Solución No se especifica la forma funcional de la población de valores de mal estándar; ejemplo 4.4.2 a) distribución de la población; b) distribución mues-
las concentraciones de hierro en el suero, pero dado que se tiene una muestra tra! de X para muestras de tamaño 10; e) distribución normal estándar.
de tamaño mayor que 30, se puede utilizar el teorema del límite central para EJERCICIOS-'--------------
transformar la distribución muestra! resultante de X con distribución de x
aproximadamente normal (la cual tiene una media de 120 y una desviación 4.4.1 Suponer que los salarios por hora de cierto tipo de empleados de un hospital
estándar de 15/,/50 = 2.12) en la nonnal unitaria. La probabilidad buscada es tienen distribución aproximadamente normal. con una media y desviación
estándar de $4.50 y $.50, respectivamente. Si se obtiene una muestra aleato-
ria de tamaño 16 a partir de esa población, calcular la probabilidad de que la
1
- ·115 - 120 125 - 12o' media del salario por hora para dicha muestra sea:
P(l 15 s x s 125) = P ( 2.12 s z :s: 2.12 ) a) Mayor que $4.25. b) Entre $4.25 y $4.75.
e) Mayor que $4.80. d) Menor que $4.20.
- P (-2.36,;,,; 2.36)
.9909 - .0091 Considérese la distribución mue.stral de la media de la muestra para 11 =16 .
e) ¿Qué porcentaje de las medias muestrales son mayores que $4.65?

__________
.9818

______.........
154 Algunas distribuciones de muestreo importantes Distribución de la diferencia entre las medias de dos muestras 155

f) Suponer para es!e problema que ,vC11 = 100000. ¿Cuántas medias muestra- de 6.0. A partir de una _muestra aleatoria simple de tamaño 40 extraída de esa
les son mayores que 4.30? población, calcular la probabilidad de que la media de la muestra:
a} Sea mayor que 11. b) Sea menor o igual que 7.5.
4.4.2 Se ha encontrado que después de un periodo de entrenamiento, el tiempo e) Esté entre 7 y 10.5.
medio que requieren ciertas personas minúsvalidas para desempeñar una ta-
rea en particular es de 25 segundos con una dtsviación estándar de 5 segun-
dos. Suponiendo que los valores de tiempo tienen una distribución normal,
4.5 DISTRIBUCIÓN DE LA DIFERENCIA
encontrar la probabilidad de que una muestra de 25 individuos proporcione
una media: ENTRE LAS MEDIAS DE DOS MUESTRAS------
a) De 26 segundos o más. b) Entre 24 y 27 segundos.
e) De 26 segundos o menos. d) Mayor que 22 segundos. Con frecuencia, el interés en una investigación se enfoca hacia dos pobla-
ciones. Específicamente, puede ser que un investigador desee saber algo
4.4.3 Si las concentraciones de ácido úrico en hombres adultos normales siguen acerca de la diferencia entre las medias de dos poblaciones. En una investi-
una distribución aproximadamente normal, con una media y desviación es- gación, por ejemplo. el investigador deseará saber si es razonable concluir
tándar de 5.7 y l mg por ciento, respectivamente, encontrar la probabilidad que dos medias poblacionales son dife'rentes. En otra situación, es posible que
de que una muestra de tamaño 9 proporcione una media: el investigador quiera conocer la magnitud de la diferencia entre ellas. Un
a) Mayor que 6. b) Entre 5 y 6. equipo de investigación médica, por ejemplo, requerirá saber si el nivel
e) Menor que 5.2.
medio de colesterol en el suero es mayor en un grupo de oficinistas que en
un grupo de obreros. Si los investigadores concluyen que las medias de la
4.4.4 Para cierto sector amplio de población en un año determinado, suponer que el
población son diferentes, es posible que deseen saber qué tanto difiefen: El
número medio de días de incapacidad es 5.4, con una desviación estándar de
conocimiento acerca de la distribución muestral de la diferencia entre dos
2.8 días. Encontrar la probabilidad de que una muestra aleatoria de tamaño
49 de esa población tenga una media: medias es muy útil en investigaciones de este tipo.
a) Mayor a 6 días. b) Entre 4 y 6 días.
e) Entre 4 1/ 2 y 5 1/ 2 días. Eje1nplo 4.5.1 Supóngase que se tienen dos poblaciones de individuós. Una
de ellas (la población 1) ha ex:perimentado alguna condición que se consi·
4.4.5 Dada una población distribuida normalmente, con una media de 100 y una des- dera está asociada al retardo mental, y la otra (la población 2) no ha ex:peri-
viación estándar de 20, encontrar las siguientes probabilidades para una mentado tal condición. Se cree que la distribución de pontajes de inteligen·
muestra de tamaño 16: cia de cada una de las poblaciones presenta una distribución aprox:imada-
a) P(x~ 100). b) P(96~x~ 108). n1ente normal con una desviación estándar de 20.
e) PCX :S 110). Supóngase también que se toma una muestra de 15 individuos de cada
población y se calcula en cada muestra la media de los pontajes de inteli-
4.4.6 Dada;µ= 50, cr = 16 y n = 64, calcular:
gencia, con los siguientes resultados: x 1 = 92 y X2 ;;: 105. Si no hay difere.n-
a) P(45:::::; X:::::; 55). b) P(X > 53).
e) P(X<47). d) P(495XS56).
cia entre las dos poblaciones con respecto a la media real de los pontajes de
inteligencia, ¿cuál es la probabilidad de obserYar una diferencia de esta
4.4.7 Supóngase que una población se compone de los siguientes valores: !, 3, 5, magnitud (X 1- X2) o mayor entre las medias de las muestras?
7, 9. Construir la distribución muestra! de X a partir de muestras de tamaño
dos seleccionadas sin reemplazo. Calcular la media y la variancia. Solución Para responder a esta pregunta es necesario conocer la naturaleza
4.4.8 Utilizar los datos del ejemplo 4.4.1 para obtener la distribución muestra! de X de la distribución muestra! para la estadística pertinente, es decir, la diferen-
a partir de muestras de tamaño tres, con selecciones sin reemplazo. Calcular cia entre las dos n1edias de las n1uestras, X 1~ X2. Es importante notar que se
--la media y-la variancia. busca la probabilidad asociada a· Ia diferencia entre las medias de dos mues- -
4.4.9 En una población de jóvenes de 17 años de edad, la media del espesor del tras en lugar de la de una sola media.
pliegue subescapular (en milímetros¡ es de 9.7, con una desviación estándar Aunque en la práctica no se intentaría construir la distribución muestra!
156 Algunas distribuciones de muestreo importantes Distribució11 de la diferencia entre las 1nedi.as de dos 11111estras 157
Tabla 4.5.1. Tabla de irabajo para construir la distribución de la diferencia entre Para el presente ejemplo habría una distribución normal con una media
las medias de dos poblaciones. igual a O (si no hay diferencia entre las medias reales de la población) y una
Muesrras Muestras Medias Medias Todas las variancia de [(20) 2 115] + [(20) 2 115] = 53.33. La gráfica de la distribución
de la de la ,nuestra/es n1ues1rafe5 diferencia.~ muestra! se muestra en la figura 4.5.1.
pobla- pobla- de lapo- de lapo- posibles e11-
ció11 J ción 2
Se sabe que la distribución normal descrita en el ejemplo 4.5. l se puede
blación I blación 2 /re las 111uesrras
transformar en una distribución normal estándar mediante la modificación 11
n,.
n,.
n.,
n,,
X\1
X21
X12
X22
X11 - X12 de una fórmula estudiada con anterioridad. La nueva fórmula es como "
11
X11 - X22 sigue: ¡1
n,.

., .,
n32 X31 i32 ¡ll - i32
(X 1 -- X.._J - (µ 1 - µ:.!) ,,
nN, en¡ , n,,,cn 2 2 xt,,cn~/ '= li:
.x¡,;,'n1 l - x,,,,cn2~
V
i,;,cn¡I CT) Cf~ '
-+- 1
deseada, es posible adquirir una idea conceptual acerca de la forma en que 111 JI':! (4,5.)) [/l
podría efectuarse cuando el muestreo se realiza a partir de poblaciones fini-
tas. Se comenzaría por seleccionar de la población 1 todas las muestras El área abajo la curva de X1 -X, que corresponde a la probabilidad bus-
posibles de tamaño 15 y calcular la media de cada muestra. Se sabe que hay cada es el área a la izquierda de X~ - X2 = 92 - 105 = -13. El valor de z
N C111 de tales muestras, donde N 1 es el tamaño del grupo y n = 15. De la corresponde a -13, suponiendo que no hay diferencia entre las dos pobla-
1
n{isma forma, se podría seleccionar todas las posibles muestras de tamaño ciones, es
15 de la población 2 y calcular las medias. Se tomarían todos los pares posi- -13 -13
- 13 - O
bles de las medias muestrales, una de la población l y otra de la población 2 - l .i8
V53.3 7.3
V
así como su diferencia. En la tabla 4.5.1 aparecen los resultados siguiendo (20)' (20)'
--+--
este procedimiento. Cabe aclarar que, los 1 y los 2 en la última línea de la IS IS
tabla no son exponentes sino indicadores de población 1 y 2, respectiva-
mente. Al consultar la tabla C, se encuentra que el área bajo la curva normal uni-
Lo que se pretende es calcular la distribución de la diferencia entre las me- taria a la izquierda de -1.78 es igual a .0375. Para responder a la pregunta
dias de las muestras. Si se elabora una gráfica de las diferencias de las original, se puede decir que, si no hay diferencia entre las medias pobla-
muestras contra sus frecuencias de ocurrencia, se podría obtener una dis- cionales, la probabilidad de obtener una diferencia mayor o igual que 13
tribución normal con una media igual a µ 1 - µ 2, la diferencia entre las entre las medias de las muestras es de .0375.
medias reales de los grupos o poblaciones, y una variancia igual a (a~/n ) + El procedimiento anterior es válido incluso cuando el tamaño de las
1
(cr~/n 2). Esto es, el error estándar de la diferencia entre las medias mues- muestras 11 1 y 11 2 son diferentes y cuando las variancias cr~ y cr} tienen val~-
trales sería igual a ,J(cri/11 1) + (cr~/11 2). res diferentes. Los resultados teóricos sobre los que se basa este procedi-
' miento, se resumen de la siguiente forma.

Dadas las poblaciones con una distribución nonnal, con inedias µ 1 .':
~ ~
µ1 , y l'ariancias a~ y a~. respectiva111ente, la distrib11ció1111111estral de
02_ -·-·--~.n
~,-~2 ~ ~ la diferencia X 1 ~ ~f::!· entre las 11iedias de 11111estras independientes de ta·
11101/0 11 1 y 11 2 extraídas de esas poblaciones sigue,~ 1111a distribución
norn1al con ,nedia µ 1 - µ2, y 1·ariancia (0'1 / 11 1) + (O'~l n 2).

p~-~·µ1-~·0 ~-~ 1
Muestreo de poblaciones no normales La mayoría de las veces el investi-
Figura 4.5.1. Gráfica de la distribución muestra! de X1 -X 2 cuando no existe gador se enfrenta a uno de los siguientes problemas: 1) la necesidad de 1 !I
diferencia entre las medias de las poblaciones, ejemplo 4.5. J. i
extraer muestras de una población con distribución no normal o 2) extraer
1:

r
,J

Algunas distribuciones de muestreo importantes Ejercicios 159


158
muestras de poblaciones cuya forma funcional se desconoce. Una solución
para estos problemas consiste en tomar muestras grandes, dado que, cuando el - - ol 0

tamaño de las muestras es grande, el teorema del límite central es aplicable y


' :C1 - :C2 n; + ñ;1 = 4.05

la distribución de la diferencia entre las dos medias de las muestras sigue una
distribución aproximadamente nonnal, con una media igual a µ 1 - µ2 y una va- .1093
riancia (cr1 / n 1) + (cr~ / n2). Para calcular probabilidades asociadas a valores
específicos de la estadística, el procedimiento es el mismo que el dado cuando 11- - - = 15 ji - :¡2
;el - X2
• el muestreo se hace a partir de poblaciones con distribución normal.

Ejemplo 4.5.2 Supóngase que se ha establecido que para cierto tipo de


pacientes el tiempo promedio de visita domiciliaria hecha por una enfer-
mera es de 45 minutos con una desviación estándar de 15 minutos y para un
segundo tipo de paciente, el promedio de visita domiciliaria es de 30 minu-
tos con una desviación estándar de 20 minutos. Si la enfermera visita al azar
.1093
a 35 clientes del primer tipo y 40 del segundo tipo, ¿cuál es la probabilidad
de que el tiempo promedio de visita domiciliaria difiera entre los dos grupos
O 1.23
por 20 minutos o más?
Figura 4.5.2. Distribución muestra! de X1 -.X2 y la respectiva distribución normal
estándar, ejemplo de visiLas il do1nici\io.
Solución No se menciona nada respecto a la forma funcional de las pobla-
ciones, por lo que se supone que esta característica se desconoce, o que las minutos es de . l 093. La curva de X1- r 2 y la curva normal unitaria se mues-
poblaciones no presentan una distribución normal. Puesto que las muestras tran en la figura 4.5.2. ··
son grandes (mayores que 30) en ambos caos, se hace uso de los r~sultados
del teorema del límite central. Se sabe que la diferencia entre las medias de
las muestras sigue una distribución aproximadamente normal con las si-
EJERCICIOS-----------------
guientes media y variancia:
4.5.1 Un investigador se siente inclinado a creer que los niveles de vitamina A en
J.Lx, - x, = J.L1 - J.L 2 = 45 - 30 = 15 el hígado de dos poblaciones de seres humanos tiene, cada una, una distribu-
,,
a.'.;
<)
a¡ +(T~ ( 15 )
2
(20) 2 ción normal. Se supone que las variancias de las dos poblaciones son las
x, ;;:, = - - = - - + - - - 16.4286 siguientes:
n'.! 35 40
"' Población\: cr 21 = 19.600
El área bajo la curva de X 1 - X2 que se busca se encuentra a la derecha Población 2: o;= 8100
de 20. El valor correspondiente de: en la distribución normal unitaria es: ¿Cuál es la probabilidad de que una n1uestra aleatoria de tamaño 15 de la
primer población y otra de tamaño l Ode la segunda población proporcionen

' - (Xi - X2) - (µ1 - J.L2) 20 - 15 5


1.23
un valor de X 1 - X~ mayor o igual a 50. si no hay diferencia entre las dos

V2 ª'--= \/ 16.4286 4.05 medias de la población?


+
l 112
4.5.2 En un análisis de gastos familiares anuales para el cuidado general de la
salud. se investigaron dos poblaciones con los siguientes resultados:
En la tabla C se encuentra que el área a la derecha de z !:: 1.23 es
- .8907 = .1093. Por lo tanto, se puede decir que la probabilidad de que Población 1: ,, 1 =40. X1 =$346
las visitas al azar de la enfermera 'difieren entre las dos medias con 20 o más Población 2: ,z,. == 35. X,=
. 300
160 Algunas distribuciones de muestreo importantes Distribución de la proporción de la muestra 161

Si se sabe que la variancia de las poblaciones es de cr~ = 2800 y cr~ = 3250, en una cie dos categorías mutuamente excluyentes, daltónico o no daltóni-
respectivamente, ¿cuál es la probabilidad de obtener resultados de muestras co. En la sección 3.3 se da la misma información y se pide calcular el
(X 1 - X2) tan a1npllos como los n1ostrados si no hay diferencia entre las número con la característica de interés, mientras que en el presente ejem-
medias de las dos poblaciones? plo se busca la proporción de la nuestra que posea tal característica. Me-
4.5.3 Dadas dos poblaciones con distribución normal y con medias iguales y va- diante el uso de una tabla lo suficientemente grande de probabilidades
riancias cr 21= 100 ya1 =80, ¿cuál es la probabilidad de que dos muestras de bino1niales, co1no la tabla A, es posible determinar la probabilidad asocia- ¡¡
tamaño n 1 = 25 y n2 = 16, respectivamente, proporcionen un valor de X 1 - X2
da con el número correspondiente a la proporción de interés. Como se verá
mayor o igual que 8?
4.5.4 Dadas dos poblaciones con distribución nonnal y con medias y variancias de
más adelante, esto no será necesario, porque se dispone de un procedi-
miento que, en general, es más conveniente cuando el tamaño de la mues-
¡i:
cr~ = 240 y cr~ = 350. ¿cuál es !a probabilidad de que dos muestras de tamaño
n 1= 40 y n 2 = 35, respectivamente, proporcionen un valor de X 1 - X 2 mayor o tra es grande. f\'.
La distribución muestral de la proporción de la muestra se puede obte- i11j
igual que 12?
4.5.5 Para una población de hombres jóvenes de 17 años de edad y otra población ner experimentalmente de la misma fom1a que se sugiere para el caso de la i'
1,1,1
de mujeres jóvenes de 17 años de edad, las medias y desviaciones estándar media aritmética y la diferencia entre dos medias. A partir de la población,
respectivamente del grosor del pliegue subescapular son como sigue: para los" que se supone es finita, se tomarían todas las muestras posibles de un tama-
varones es de 9. 7 y 6.0; para las mujeres es de 15.6 y 9.5. Si se obtiene una ño dado y, para cada muestra se calcularía la proporción de la muestra, fa.
muestra aleatoria simple de 40 varones y otra de 35 mujeres a partir de dicha Después se elaboraría una distribución de frecuencia de P. numerando los !! !i
población, ¿cuál es la probabilidad de que !a diferencia entre las medias de valores distintos de Pjunto con sus frecuencias de ocurrencia. Esta distribu-
las muestras (Xchicas - Xchicos) sea mayor que 10? ción de frecuencia (al igual que la distribución de frecuencias relativas
correspondientes) constituye la distribución muestral de P.
Cuando la muestra es grande, la distribución de las proporciones de la
4.6 DISTRIBUCIÓN DE LA PROPORCIÓN DE LA MUESTRA~ muestra es aproximadamente normal de acuerdo al teorema del límite cen-
tral. La inedia de la distribución µ¡:,, que es el promedio de todas las propor-
En las secciones anteriores se estudiaron las distribuciones muestrales para ciones posibles de la muestra, será igual a la ¡roporción real de la pobla-
estadísticas calculadas a partir de variables medidas. Sin embargo, fre- ción, p, y la variancia de la distribución ap será igual a p(l - p) In.
cuentemente se tiene interés en la distribución muestra! de estadísticas, tales Entonces, para responder a las preguntas acerca de la probabilidad respecto
como la proporción muestra! que es resultado de los datos de conteos o fre- ap, se utiliza la siguiente fórmula.
cuencias.
¡, - p
'f,(I - /')
Eje,np/o 4.6.1 Supóngase que en una población de seres humanos, el .08 (4.6. l)
son daltónicos. Si la proporción de la población se designa corno p, se puede "
decir para este ejemplo que p = .08. Si se eligen aleatoriamente 150 indivi~ La pregunta que surge ahora es: ¿qué tan grande debe ser !a muestra -
duos de esa población, ¿cuál es la probabilidad de que una proporción de 1 "'
para que sea \'álido el uso de la aproximación normal? Un criterio amplia- i ¡¡
individuos daltónicos tenga un tamaño del .15? mente utilizado es que np y 11(1 - p) deben ser mayores que 5, y en el pre-
sente texto se sigue dicha regla.
Solución Para responder esta pregunta es necesario conocer algunas de las Ahora se está en posibilidad de responder a la pregunta referente al dal-
propiedades de la distribución muestral de la proporción de la muestra. Se tonismo del ejemplo de 150 individuos de las cuales .08 son daltónicos.
designará la proporción de la muestra con el símbolo P. Puesto que np y n(l -p) son mayores que 5(150 X .08 = 12 y 150 X .92 =
El lector reconocerá la similitud entre este ejemplo y los que se presen- l 38), se puede decir que, en este caso p sigue una distribución aproximada-
tan en la sección 3.3, que se refieren a la distribución binomial. Además, la mente nonnal, con una media µ¡1 = p = .08 y ai n
= p(l - p) l = (.08)(.92) I
1

\'ariable daltonismo es dicotómica, porque un individuo se puede clasificar 150 = .00049. La probabilidad buscada es el área bajo la curva de Pa la

L
r
163
162 Algunas distribuciones de muestreo i111portantes
1! Ejercicios

derecha de .15. Esta área es igual al área bajo la curva normal estándar a la de- Ejemplo 4.6.2 Suponer que se conoce que en una población de mujeres el
recha de 90 por ciento de las que comienzan su tercer mes de embarazo han tenido
algún cuidado prenatal. Si se extrae de esta población una muestra aleatoria
¡, - ¡, .l.5 - .08 .07
,~,~ V.llll(H9 .0222
3. 15 de tamaño 200, ¿cuál es la probabilidad de que la proporción de la muestra de
tas mujeres que han tenido algún cuidado prenatal sea menor que .85?
y------;-
Solución Se puede suponer que la distribución muestra! de p presenta una
La transformación para la distribución normal estándar se lleva a cabo de la distribución aproximadamente normal, con µp = .90 y aj=
(.1)(.9) / 200 =
manera usual: z se calcula al dividir el error estándar entre la diferencia de .00045. Se calcula:
un valor de la estadística y su media. Al utilizar la tabla C se tiene que el
.85 - .90 -.05
área a la derecha de:::= 3.15 es 1 - .9992 = .0008. Por lo tanto, se puede
decir que la probabilidad de observar P ~ .15 en una muestra aleatoria de ' - V.00045 .0212
-2.36

tamaño n = 150 de una población en la que p = .08 es .0008. De hecho. si se


extrajera una muestra de este tipo, mucha gente la consideraría un evento
extraño. El área a la izquierda de -2.36 bajo la curva normal estándar es .0091. Por
La aproximación normal puede mejorar con la corrección por conti- lo (anto, P(p :5 .85) = P(z :5-2.36) = .0091.
nuidad, un mecanismo que hace un ajuste en el caso en que una distribución
continua se aproxime a una distribución discreta. Suponer que se tiene x =
EJERCICIOS~~~~~~~~~~~~~~~~~
nf;, el número en la muestra que posee la característica de interés, cuando la
porción es f,. Para aplicar la corrección por continuidad se calcula:
4.6.1 Si de una población de adultos, el .15 están sometidos a un tipo especial de
dicta, ¿cuál es la probabilidad de que una muestra aleatoria de tamaño .100
.\' + .5 muestre las siguienles proporciones de individuos a dieta:
- p
a) Mayor o igual que .20? b) Entre .10 y .20?
·, " para x < 11p e) No más de .12?
\.p1¡!11 (4.6.2)
4.6.2 Se cree que en una ciudad e! 20 por ciento de las familias tiene por lo menos
o bien
un miembro que sufre de algún malestar debido a la contaminación atmos-
.\ - .;) férica. Una muestra aleatoria de 150 familias produjo un valor de f; = .27. Si
---¡, el valor de! 20 por ciento es correcto, ¿cuál es la probabilidad de obtener una
" para .\· > 11 j) proporción mayor o igual de la muestra'?
\' pq l II (4.6.3) 4.6.3 En una muestra al azar de 75 adultos, 35 de ellos consideran que el cáncer de
mamas es curable. Si en la población de la cual se extrajo la muestra, la pro-
donde q ::: 1 - p. La corrección por continuidad no produce una gran dife- porción real de quienes piensan que dicho tipo de cáncer es curable es de .55.
rencia cuando n es grande. En el ejemplo de arriba 11/J = 150(.15) = 12.5 y ¿cuál es la probabilidad de obtener una proporción muestra! menor o igual
que la obtenida en esta muestra?
22.5 - .;J 4.6.4 Se sabe que un mcdican1ento est,índar utilizado para tratar cierta enfermedad
- .08 es eficaz en un lapso de tres días en el 75 por ciento de los casos. Al evaluar
150
·, J.01 la eficacia de un nuevo medicamento para tratar la niisma enfermedad, se
\.
1
.000--l-9 administró a l 50 personas que la padecían. Al término de tres días. se habían
recuperado 97 personas. Si este nuevo 1nedicamento es tan efectivo corriO-ef
y P(P;?: .15) = 1 - .9987 = .0013. Este resultado no es muy diferente al que primero, ¿cuál es la probabilidad de obtener una proporción de pacientes que
se obtiene sin la corrección por continuidad. se recuperan tan pequeña como ésta?
Algunas distribuciones de 1nuestreo itnportantes Distribución de la diferencia entre las proporciones de dos ,nuestras 165
164
4.6.5 Dada una población en la que p = .6 y una muestra aleatoria de esta pobla- Dadas dos poblaciones suficientemente pequeñas, es posible extraer de
ción de tamaño 100, calcular: la población 1 todas las muestras aleatorias posibles de tamaño n 1 y calcular
a) P(p ~ .65). b) P(P S .58). a partir de cada conjunto de datos de la muestra la proporción de la muestra
e) P(.56 S f, S .63). P 1
• De la población 2, se pueden extraer independientemente todas las
muestras aleatorias simples de tamaño n" y calcular, para cada conjunto de
4.6.6 Se sabe que el 35 por ciento de los miembros de una población sufren de una datos de la muestra, la porción de la niuestra ji 2• Es posible calcular las
o más enfermedades crónicas. ¿Cuál es la probabilidad de que, en una mues- diferencias entre todos los pares posibles de proporciones muestrales, donde
tra aleatoria de 200 individuos, 80 o más de ellos tengan al menos una enfer- un miembro de cada par tendría un valor PI y el otro un valor P2. La dis-
medad crónica? tribución muestra} de la diferencia entre las dos porciones- de las muestras
consistiría de todas las diferencias existentes acompañadas de sus frecuen-
cias (o frecuencias relativas) de ocurrencia. Para poblaciones grandes finitas
4.7 DISTRIBUCIÓN DE LA DIFERENCIA o poblaciones infinitas, es posible obtener un cálculo aproximado de la dis-
ENTRE LAS PROPORCIONES DE DOS MUESTRAS---- tribución muestra) de la diferencia entre las porciones de las muestras,
tomando un gran número de muestras aleatorias simples independientes
Con frecuencia se tienen las proporciones de dos poblaciones en las cuales para proceder de la fonna descrita.
se tiene interés y se desea averiguar la probabilidad asociada con una dife- Para responder a preguntas respecto a la diferencia entre las propor-
rencia de las proporciones calculadas a partir de muestras extraídas de cada ciones de dos muestras, se utiliza la siguiente fórmula:
.,
una de dichas poblaciones. La distribución muestra! pertinente es la dis- '·
tribución de la diferencia entre las proporciones de dos muestras. Las carac-
terísticas de esta distribución n1uestral :,e resumen co1no sigue:
cp, - P,l ~ CP, - P,l 1:

' ' /p,(I - p,) + p,(I - p,)


Si se extraen 111uestras aleatorias independientes de tan1a/lo n 1 y 11 2 de v· ll¡ llz (4.7.1)
dos poblaciones de variables dicotó111icas, donde la proporción de las
1'

~
obsen·aciones con la característica de interés en a111bas poblaciones
es p 1 y p 2, respecriva111ente, la distribución de la diferencia entre las Ejemplo 4.7.1 Suponer que la proporción de consumidores moderados a
proporciones de las ,nuestras, ji 1 - P1, es aproxi111ada1ne11te 11orn1al grandes consumidores de drogas ilegales es de .50 para la población 1, en
1;1
tanto que en la población 2, la proporción de .33. ¿Cuál es la probabilidad
con una n1edia de :1
de que muestras de tamaño 100, extraídas de cada una de las poblaciones,
~
µ¡,, - ¡,, = /J1 - /!'2 proporcione un valor de P1 - P2 i~al a .30?
~

v una variancia de Solución Se supone que la distribución muestra] de P1 - P2 es aproximada-


mente normal, con una media de
., ¡,, e 1 ~ p,) ~ p,1 1 ~ ¡,, 1
a¡,, - ¡,, 11¡ 1/., µ..¡,, -j,._, = .50 - .33 .l 7

cuando n 1 y n 2 son grandes. y una variancia de

(.33)(.67) (.5)(.5)
Para elaborar físicamente la distribución muestra! de la diferencia entre 2
ªP1 -
.
P,
+--
100 100
las proporciones de dos 1nuestras, se procede en la fonna descrita en la sec-
ción 4.5 para obtener la distribución 1nuestral de la diferencia entre dos .004711
medias.
!
1
!i 166 Algunas distribuciones de muestreo importantes Preguntas y ejercicios de repaso 167
¡¡
El área correspondiente a la probabilidad buscada es la que se encuentra misma en ambas poblaciones, ¿cuál es la probabilidad de que la muestra pro-
bajo la curva de P1 - f; 2 a la derecha de .30. Al transformar a la distribución porcione una diferencia, P1 - P2• de .16 o más?
normal estándar se obtiene 4.7.2 Se tienen bases para suponer que el 40 por ciento de las casas en cierta área
de la ciudad están en malas condiciones. Una muestra aleatoria de 75 casas
(p, - p,) - (p, - p,) .30 - .li de esa área y otra compuesta de 90 casas de otra sección proporcionaron una
l ~ -~=~=~=~= l.89 diferencia, P1 - f, 2 , de .09. Si no hay diferencia en la proporción de casas en
, /P,(I - P,l + p,(I - P2) V.004il l
v· n¡ 712
malas condiciones entre estas dos áreas, ¿cuál es la probabilidad de observar
una diferencia de esta n1agnitud o mucho mayor?
4.7 .3 El resultado de una investigación sanitaria revela que el 55 por ciento de los
" Al consultar la tabla C, se encuentra que el área bajo la curva nonnal están- individuos de la población A y el 35 por ciento de los de la población B no
dar que está a la derecha de z = 1.89 es 1 - .9706 = .0294. Por lo tanto, la padecen enfennedades cardiovasculares. Suponer que se extrae una muestra
probabilidad de observar una diferencia igual a .30 es de .0294. aleatoria simple de tamaño 120 a partir de la población A. y una muestra alea-
1 .¡,.
toria simple independiente de tamaño 130 de la población B. ¿Cuál es la
¡, Ejemplo 4.7.2 Se sabe que en una población de adolescentes el 1O por cien- probabilidad de que la diferencia entre las proporciones de las muestras PA -
·1¡ to de los varones son obesos. Si la misma proporción de mujeres en esa P8 . esté entre .30 y .40?
población son obesas, ¿cuál es la probabilidad de que una muestra al azar de
250 varones y 200 mujeres proporcione un valor de P -P ~ .06?
1 2
4.8 RESUMEN----------------
Solución Se supone que la distribución muestra! de P1 - P2 es aproximada-
mente normal. Si la proporción de individuos obesos es la misma en ambas En este capítulo se estudia el muestreo y las distribuciones muestrales. Se
poblaciones, la media de la distribución es igual a Oy la variancia es: define el muestreo a!ea:tqrio simple, que es el tipo de muestreo básico para
la inferencia estadística, y se explica el procedimiento para extraer este tipo
a?p, . ~ p,(I - p,) + p,(l - P,l ~(.l)(.9)
--+---
(.l)(.9) de muestras. Se presenta el concepto de distribución muestra! y se estudian
- P" n 1 n2 250 200 · las siguientes distribuciones muestrales importantes:
.0008 I
l. Distribución de la media de una muestra única.
P P
El área de interés bajo la curva de 1- 2 es la que se encuentra a la derecha 2. Distribución de la diferencia entre las medias de dos muestras.
de .06. El valor correspondiente de z es: 3. Distribución de proporción de la muestra.
4. Distribución de la diferencia entre las proporciones de dos muestras .
.06 - o
' V.00081 ~ 2.I I Se destaca la importancia de estos aspectos y se exhorta al lector para '
que se asegure de que los ha comprendido, antes de pasar al siguiente ca-
pítulo.
Al consultar la tabla C se encuentra que el área a la derecha de z = 2.11
es 1 - .9826 = .0174.

PREGUNTAS Y EJERCICIOS DE R E P A S O - - - - - - - -
EJERCICIOS _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ __
l. ¿Cuáles son los dos tipos de muestreo?
2. ¿Por qué no se estudia en este libro el muestreo no probabilístico?
4.7.1 En una población _de_!].i_~9_s_c;:9.n~t~_Q_Q __1Aem:-ª_IJ_~__;;_ªb_e__q_~ __l_~_pr_opo_r_c.ión de 3. Definir o explicar los siguientes ténninos:
los que son hiperactivos es de .40. Se extrajo una muestra aleatoria de tama- ---(íf-M Uestra·prübab il ís tica.
ño 120 de esa población y otra de tamaño 100 a partir de otra población de b) tvluestra aleatoria simple.
niños con el mismo problema. Si la proporción de niños hiperactivos es la e) Muestreo con reemplazo.
Pi
168 Algunas distribucione.f de muestreo importantes Preguntas y ejercicios de repaso 169 !
d) Muestreo sin reemplazo. ambos medicamentos, siguen una distribución normal con variancias igt!,ales
e) Distribución muestra!. de 60. Co1no parte de la evaluación de los dos medicamentos, el medicamento
A se aplicará a 15 sujetos y el medicamento B se administrará a 12 indi\ iduos.
1

4. Explicar cómo se puede conformar la distribución muestra! a partir de una El investigador está interesado en saber entre qué valores estaría el 95 por cien-
población finita. to central de todas las diferencias entre las medias de las muestras, si ambos
5. Describir la distribución muestra! de la media de una muestra cuando el mues- medicamentos son igualmente eficaces y si el experimento se repitiera un gran
treo es con reen1plazo a parlir de una población que sigue una distribución nún1ero de veces utilizando estos tamaños de muestras.
normal. 17. Suponer que la concentración de albúmina e'n el suero de cierta población de
6. Explicar el teorema del límite central. individuos sigue una distribución normal, con una inedia de 4.2 g/100 mi, y
7. ¿En qué forma difiere la distribución muestra! de la media de la muestra cuan- una desviación estándar de .5. Una muestra al azar de nueve de esos individuos
do el muestreo es sin reemplazo, de la distribución muestra] que se obtiene de sometidos a una dosis diaria de cierto esteroide oral, produjo una concentra-
un muestreo con reen1plazo? ción media de albúmina en el suero de 3.8 g/100 mi. Con base en estos resulta-
8. Describir la distribución muestra! de la diferencia entre las medias de dos dos, ¿es probable que el esteroide oral disminuya la concentración de albúmina
muestras. en el suero?
9. Describir la distribución muestra! de la proporción de la muestra cuando se 18. Una encuesta llevada a cabo en una área grande de la ciudad revela que, entre
extraen muestras grandes. los estudiantes de preparatoria, el 35 por ciento han fumado n1arihuana, en
10. Describir la distribución muestra! de la diferencia entre las medias de dos mues- una u otra ocasión. Si en una muestra aleatoria de 150 de esos estudiantes sólo
tras cuando se extraen muestras grandes. 40 de ellos adnlitieron haber fumado marihuana, ¿qué es lo que se puede con-
ll. Explicar el procedimiento a seguir para obtener la distribución muestra! de la cluir?
diferencia entre las proporciones de las muestras con base en muestras grandes 19. El sesenta· por ciento de los empleados de una gran con1pañía faltaron a su traba- {
extraídas de una población finita. jo debido a enfermedad tres o más días en el último año. Si se toma una mues~
i¡:
,,,,
12. Suponer que se sabe que el tiempo de respuesta a un estímulo particular en tra aleatoria simple de J 50 empleados, ¿cuál es la probabilidad de que una pro-
individuos sanos es una variable aleatoria con distribución normal, con una porción de la muestra que tuvo tres o más faltas debido a enfermedad esté entre 1
media de 15 segundos y una variancia de 16. ¿Cuál eS la probabilidad de que
una muestra al azar de 16 individuos proporcione un tiempo de respuesta de 12
.50 y .65'
20. Una trabajadora social especializada en problemas psiquiátricos piensa que tan-
!,,
,1
segundos o más? to en la comunidad A como en la B, la proporción de adolescentes que padecen 1,
13. Cierta empresa tiene 2000 empleados. Durante un año reciente, el gasto medio
por empleado debido a servicios médicos personales fue de $31.50, y la des-
algún problema emocional o mental es de .20. En una muestra de 150 adoles-
centes de la comunidad A, 15 de ellos presentaron problemas emocionales o
1
1:
viación estándar de $6.00. i,Cuál es la probabilidad de que una muestra aleato- mentales. En una muestra de 100 adolescentes de la comunidad B, se presentan ,,
!
ria simple de 36 empleados proporciÜne una media entre $30 y $33?
14. Suponer que en cierta población de adictos a las drogas la duración media de
16 casos. Si la trabajadora social está en lo correcto, (.Cuál es la probabilidad de
observar una diferencia tan grande como la que se observa entre estas dos
;
abuso es de 5 "años y la desviación estándar es de 3 años. i,Cuál es la probabili- muestras?
dad de que una muestra aleatoria simple de 36 individuos proporcione una 21. Se supone que dos medicamentos, A y B, tienen la misma efecti\"idad para
media de abuso entre 4 y 6 años? reducir los niveles de angustia en cierto tipo de personas con alteraciones emo-
15. Suponer que el consumo medio de proteínas de una población es de 125 gra- cionales. Se supone que la proporción de personas en las que los medicamentos
mos, mientras que para otra población el consumo medio es de 100 g. Si los tienen eficacia es de .SO. A una muestra aleatoria de 100 personas con alte-
valores de consumo diario de proteínas de ambas poblaciones siguen una dis- raciones emocionales se les aplicó el medicamento A y 85 de ellos experimen-
tribución normal con una desviación estándar de 15 gramos, (,Cuál es la proba- taron una disminución en su nivel de angustia. El medicamento B resultó efec-
bilidad de que las muestras aleatorias e independientes de tamaño 25 a partir de tivo en 105 individuos de una muestra aleatoria independiente de 150 indivi-
cada población proporcionen una diferencia entre las medias de las muestras duos con el mismo problema. Si los dos medícamentos tienen igual efectividad
de 12 o menos?
como se cree, ¿cuál es la Probabilidad de obtener una diferencia entre las pro-
16. Suponer que dos medicamentos que se supone sirven para reducir el tiemro de
porciones de las muestras igu¡;.l o mayor que la que se observó?
respuesta a cierto estímulo son estudiados en un laboratorio. El investigador 22. ¿Cuántas muestras aleatorias simples (sin reemplazos) de tamaño S se pueden
está inclinado a creer que los tiempos de respuesta, después de administrar efectuar a partir de una poblacíón de I O?
f
1
170 Algunas distribuciones de muestreo importantes
1
23. Se sabe que el 27 por ciento de una población de adultos nunca han fumado.
Considerar la distribución muestra! de la proporción de una muestra basada en 5
.,¡
muestras aleatorias simples de tamaño 110 extraídas de esa población. ¿Cuál es
la forma funcional de la distribución muestra]?
) 24. Con base en el ejercicio 23, calcular la media y la variancia de la distribución Estimación
~ muestra!.
25. Con base en el ejercicio 24, ¿cuál es la probabilidad de que una muestra aleato-
ria simple de tamaño 110, extraída de esta población, proporcione una propor-
ción muestra! menor que .18?
26. En una población de individuos que murieron de cáncer pulmonar provocado
por exposición a asbesto, se encontró que el promedio de años transcurridos
entre la exposición y el fallecimiento fue de 25 y la desviación estándar de 7
años. Considerar la distribución muestra! de las medias de las muestras con
base en una muestra de tamaño 35, extraída de esa población. ¿Cuál será la
fonna de tal distribución?
27. Con base en el ejercicio 26, ¿cuál es la media y la variancia de la distribución 5.1 INTRODUCCIÓN---------------
muestra!?
28. Con base en el ejercicio 26, ¿cuál es la probabilidad de que una muestra aleato- En este capítulo se analiza la esti,nación, que es la primera de las dos áreas
ria simple de tamaño 35, extraída de esa población, proporcione una media generales de lo inferencia estadística. La segunda área general, pruebas de
entre 22 y 29?-
hipótesis, se estudia en el siguiente capítulo.
En el capítulo 1 se define la inferencia estadística como el procedimien-
BIBLIOGRAFÍA _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _~ to por medio del cual se toman decisiones acerca de un gran volumen de
datos, estudiando sólo una pequeña porción de ellos. Específicamente, el
Obras citadas gran volumen de datos y la pequeña porción de ellos a los que se hace refe-
rencia en la definición, son una población y una muestra extraída de ella,
1, ÜEORGE S. FISHMAN, Concepts and Methods in Discrete Event Digital Simu- respectivamente. De acuerdo con ello se tiene la siguiente definición de la
lation, Wiley, Nueva York, 1973. inferencia estadística.
2. PAUL G. HoEL, lntroduction to Mathe1natical Statistics, l.ª edición, Wiley,
Nueva York, 1962.
3. R. L. ANDERSON y T. A. BANCROFr, Statistical Theory in Research, McGraw- DEFINICIÓN _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _~
Hill, Nueva York, 1952.
La inferencia estadística es el procedimiento por medio del
Otras publicaciones cual se llega a inferencias acerca de una población mediante
los resultados que se obtienen a partir de una muestra extraída
l. JOHN E. FREUND y RONALD E. WALPOLE, Mathen1atical Statistics, I ." edición,
Prentice-Hall, Englewood Cliffs, N.J., 1980. de esa población.
2. RICHARD J. LARSEN y MORR[S L. MARX, An lntroduction to Mathe,natical
Statistics and lts Applications, Prentice-Ha!l, Englewood Cliffs, N.J., 1981.
3. WILL!A/1.f MENDELHALL y RICHARD L. SCHEAFFER, Mathen,atical Statistics lVith El proceso de estimación implica calcular. a partir de los datos de una
Applications, Duxbury Press, North Scitua!e, Mass., 1973. muestra, alguna estadística que se ofrece como una aproximación del pará-
4. JOHN A. RICE, Mathe,natical Statistics llnd Data Analysis, Wadsworth & Brooks me.tro corres)Jondíente de ·1a-poo1aciónde -1á·cua1 fue extraída la muestra.
Cole, Pacific Grave, Calif., 1988. El razonamiento en el que se basa la estimación en el campo de las cien-
cias de la salud se apoya en la suposición de que los trabajadores en este

171
172 Estimación Introducción 173
campo tienen interés en los parámetros de varias poblaciones. Si éste es el En muchos casos, es posible estimar un parámetro por medio de más de
caso, existen dos buenas razones por las que se debe confiar en los proce- un estimador. Por ejemplo, se puede utilizar la mediana de la muestra para
dimientos de la estimación para obtener información respecto a dichos pará- estimar la media de la población. ¿Cómo decidir entonces qué estimador se
metros. Primero, muchas poblaciones de interés, aunque finitas, son tan gran- debe utilizar para estimar un parámetro en particular? La decisión se basa
des que el costo de un estudio del 100 por ciento sería prohibitivo. Segundo, en criterios que reflejan la "bondad" de los estimadores particulares. Cuan-
las poblaciones infinitas son imposibles de examinar completamente. do se miden contra estos criterios, algunos estimadores son mejores que
Supóngase que al administrador de un gran hospital le interesa saber la otros. Uno de estos criterios es la propiedad de ser insesgado.
edad promedio de los pacientes internados en el transcurso de un año. Es Se dice que un estimador, por ejemplo T. para el parámetro 8 es un esti-
posible que considere demasiado laborioso consultar al registro de cada mador insesgado de 8 si E(T) :::: 8. E(n significa "el valor esperado de T'.
paciente internado en el transcurso de ese año y, en consecuencia, decide Para una población finita, E(n se obtiene tomando el valor promedio de T
examinar una muestra de los registros a partir de la cual sea posible calcular calculado a partir de todas las muestras posibles de un tamaño dado que
una estimación de la edad promedio de los pacientes internados en ese año. =
puedan extraerse de la población. Es decir, E(T) µT. Para una población
Un médico general puede estar interesado en saber qué porción de cier- infinita, E(D se define en ténninos del cálculo matemático.
to tipo de individuos tratados con un determinado medicamento presentan En el capítulo anterior se ha visto que la media de la muestra, la propor-
efectos secundarios indeseables. Sin duda, su idea de población consiste en
i
ción de la muestra, la diferencia entre las medias de dos muestras y la dife- ¡
todas aquellas personas que alguna vez han sido o serán tratadas con este rencia entre las proporciones de dos muestras son cada una estimadores in-
medicamento. Aplazar un diagnóstico hasta que haya observado a la pobla- sesgados de sus parámetros correspondientes. Esta propiedad está implícita
ción completa podría tener efectos adversos en el ejercicio de su profesión. cuando se dijo que los parámetros eran las medias de las distribuciones del
Estos dos casos ejemplifican el interés por estimar la media y la propor- muestreo correspondiente. Por ejemplo, dado que la media de la distribu-
ción de una población, respectivamente. Otro parámetro, cuya estimación se ción muestra! de X es igual a µ, se sabe que X es un estimador insesgado de
estudia en este capítulo, son la diferencia entre dos medias, entre dos pro- µ. En este libro no se estudian los otros criterios para un buen estimador. El
2
porciones, la variancia de la población y la razón de dos variancias. lector interesado encontrará que Freund y Wa\pole 1 y Wood et al., entre
Se encontrará que es posible calcular dos tipos de estimación para cada otros, los estudian con todo detalle. Un estudio mucho menos riguroso
uno de estos parámetros: una estimación puntual y una estimación por inter- 3
desde el punto de vista maten1ático puede encontrarse en Yamane.
valos. Una estimación puntual es un solo valor numérico utilizado para esti-
mar el parámetro correspondiente de la población. Una estin1ación por Poblaciones muestreadas y poblaciones objetivo El investigador en el
inten,alos consta de dos valores numéricos que definen un intervalo que,
con un grado específico de confianza, se considera que incluye al parámetro
área de salud que utiliza los procedimientos de inferencia estadística debe
estar al tanto de las diferencias entre dos tipos de población: la población
¡i
por estimar. Estos conceptos se explican en las siguientes secciones. ,nuestreada y la población objeti\'o. La población muestreada es la pobla-
:r·
i.
Es conveniente notar que se ha dado el nombre de estimación a un solo ción de la cual se extrae una n1uestra. La población objetivo es la población 1.
valor calculado. La regla para calcular este valor o estimación se conoce
como estin1ador. Los estimadores generalmente se presentan como fónnu-
de la cual se ha extraído realmente una muestra. La población objetivo es
la población de la cual se desea hacer una inferencia. Estas dos pobla-
¡·\'
'
i
las. Por ejemplo, ciones pueden ser las mismas o no. Los procedi1nientos de inferencia
estadística permiten inferir respecto a las poblaciones muestreadas (siem-
}";x, pre y cuando se hayan utilizado los métodos de muestreo correctos). Sólo
i = ~- cuando la población objeti\'o y la población muestreada son las mismas. se
n pueden utilizar procedimientos de inferencia estadística para llegar a con-
clusiones acerca de la población objetivo. Si la población muestreada y la
es un estimador de la media de la población, µ. El valor numérico indivi- población objeti,·o son diferentes, el investigador puede llegar a conclu-
dual que resulta de la evaluación de esta fórmula se conoce como estima- siones respecto a la población objetivo sólo con base en consideraciones
ción del parámetro µ. no estadísticas.
'

'
i
1
1
1!:
'
f
174 Estimación Intervalo de confwnza para la media de una población 175
Por ejemplo, supóngase que un investigador quiere estimar la efectivi- de dichas generalizaciones pueden ser útiles o pueden clasificarse desde
dad de un método para tratar la artritis reumatoide. La población objetivo erróneas hasta desastrosas.
está formada por todos los pacientes que sufren esta enfermedad y no es En algunos casos puede aplicarse aleatoriedad en un experimento aun
práctico extraer una muestra de esta población. Sin embargo, el investigador cuando los individuos disponibles no sean seleccionados aleatoriamente de
puede extraer una muestra de todos los pacientes con artritis reumatoide de alguna población bien definida. Al comparar dos tratamientos, por ejemplo,
alguna clínica específica. Estos pacientes constituyen la población mues- a cada sujeto se le puede asignar aleatoriamente uno u otrÓ de los tratamien-
treada y, si se utilizan métodos de muestreo adecuados, es posible hacer tos. Las inferencias en tales casos se aplican a los tratamientos y no a los
inferencias respecto a esta población muestreada con base en la información sujetos y, en consecuencia, dichas inferencias son válidas.
~ de la muestra. Si el investigador quiere hacer inferencias acerca de todos los
pacientes con artritis reumatoide, debe utilizar métodos no estadísticos.

Quizá el investigador sepa que la población muestreada es similar con
lf
5.2 INTERVALO DE CONFIANZA
respecto a todas las características importantes, a la población objetivo. Es PARA LA MEDIA DE UNA POBLACIÓN _ _ _ _ _ __
decir, es posible que el investigador sepa que la edad, sexo, gravedad de la
enfermedad, tiempo de evolución de ésta, así como otros datos, son simi-
Supóngase que un grupo-de investigadores quiere estimar la media de una po-
lares, y con base en este conocimiento el investigador puede extrapolar sus
blación que sigue una distribución normal y que, para ello, extraen una
descubrimientos a la población objetivo.
muestra aleatoria de tamaño II de la población y calculan el valor de X. el
En muchos casos, la población muestreada y la población objetivo son
cual utilizan como una estimación puntual deµ. Aunque este estimador deµ
idénticas y, cuando esto ocurre, las inferencias en tomo a la población objeti-
posee todas las cualidades de un buen estimador, se sabe que, debido a los
vo son directas. Sin embargo, el investigador debe estar consciente de que
caprichos del muestreo, no se puede esperar que X sea igual a µ.
éste no siempre es el caso, a fin de que no caiga en la trampa de hacer inferen-
Por lo tanto, sería mucho más significativo estimarµ mediante un inter-
cias erróneas respecto a una población diferente a la que ha sido muestreada.
valo que de alguna forma muestre la magnitud de µ.
Para obtener dicha estimación por intervalos, se debe aprovechar el
I\iluestras aleatorias y no aleatorias En los ejemplos y ejercicios de este
conocimiento acerca de las distribuciones muestrales. En este caso, puesto
libro se supone que los datos analizados provienen de muestras aleatorias.
que el interés está en la media de la muestra como estimador de la media de
La estricta validez de los procedimientos estadísticos estudiados depende de
una población, es necesario recordar lo que se sabe respecto a la distribu-
esta suposición. En muchos casos, en las aplicaciones de la vida real, es
imposible o impráctico utilizar muestras verdaderamente aleatorias. En ción muestra\ de la media de la muestra.
En el capítulo anterior se aprendió que si el muestreo se realiza a partir de
experimentos con animales, por ejemplo, los investigadores frecuentemente
una población con distribución normal, la distribución muestra! de la media
utilizan los aniinales con que cuentan o su propia raza de crianza. Si los
de la muestra presenta una distribución normal con una media µI igual a la
investigadores tuvieran que depender de material seleccionado al azar se
media de la población, µ, y una variancia cr;., igual a cr2/n. Se podría elaborar
llevaría a cabo muy poca investigación de este tipo. Una vez más, las con-
sideraciones no estadísticas deben tomar parte en el proceso de genera- una gráfica de la distribución muestra! si se supiera en qué lugar del eje X se
lización. Los investigadores pueden afirmar que las muestras realmente utili- localiza. Con base en el conocimiento adquirido acerca de la distribución nor-
zadas equivalen a muestras aleatorias simples, dado que no hay razón para 1naL en general, se sabe aún n1ás sobre la distribución X para este caso. Por
creer que el material utilizado no es representativo de la población de la ejemplo, se sabe que sin importar dónde se localiza, aproximadamente el 95
cual se desea hacer inferencias. por ciento de los valores posibles de X que constituyen la distribución. están
En muchos proyectos de investigación en el área de la salud se utilizan a± dos desviaciones estándar respecto a la media. Los dos puntos que están a
muestras de conveniencia en lugar de muestras aleatorias. Puede ser que los dos desviaciones estándm de la media son µ - 2crx y µ + 1crx, de modo que el
en
investigadores tengan que confiar en voluntario.5 O pe'fso-nas-dlspOñ-l61eS, inteÍ\'alo· de µ ± 10'- contiene aproximadamente el· 95 por ciento de los va\o- -
'
como los estudiantes de su clase. Nuevamente, se debe hacer suposiciones res posibles de X. Aunque µ y µ.r son desconocidas. arbitrariamente se puede
con base en consideraciones no estadísticas. Sin embargo. las conclusiones poner sobre el eje de la X la distribución muestra! de X.
176 Estimación lnJervalo de confianza para la media de una población 11
177 '

Solución Un intervalo de confianza de aproximadamente el 95 por ciento


para µ está dado por

i ± 2cr.,
'>2 o• 'TI
"" 2o ;- 2a ¡ an -

22
+
-

::!::
..::V¡t

2(2.12)
" •
,, 17.76, 26.24

•,
,, Examínese la composición de esta estimación del intervalo: éste contiene en
su .centro la estimación puntual paraµ; se identifica a 2 como un valor de la
distribución normal estándar que indica en ± cuántos errores estándar están
'• aproximadamente el 95 por ciento de los valores posibles de X. Este valor
de z se conoce como coeficiente de Confiabilidad. El último componente, ªx
... es el error estándar o desviación estándar, de la distribución muestra! de X.
En general, una estimación por intervalos se expresa como sigue:
Figura 5.2.1 Intervalos de confianza del 95 por ciento paraµ.
estimador± (coeficiente de confiabilidad) X(error estándar) {5.2.1)
Dado qL!e se desconoce el valor de µ, la expresión µ ± 2cr no dice
mucho. Sin embargo. se tiene una .estimación puntual de µ que
1
es
X. ¿Re- En particular, cuando el muestreo se realiza a partir de una distribui;:ión
sultaría útil obtener un intervalo en torno a esta estimación puntual deµ? La normal.con variancia conocida, una estimación por intervalos paraµ se
respuesta es sí. Supóngase que se forn1an intervalos a partir de todos los expresa como
\"alores posibles de X calculados a partir de todas las muestras posibles de
tamaño n de la población de interés. De esa forma se tendría un gran i ::!:: Zr¡ - o.l'.!.)CTX (5.2.2)
número de intervalos de la forma x ± 2a.i:' cuyas dimensiones son toc;las
iguales a la del intervalo en tomo a la·µ desconocida. Aproximadamente el ¿Cómo se interpreta este intervalo? En este ejemplo, donde el coefi-
95 por ciento de estos intervalos tendría centros que caen dentro del interva- ciente de confiabilidad es igual a 2, se dice que, al repetir el muestreo,
lo ±2crx en tomo a µ. Estas ideas se muestran en la figura 5.2.1. En dicha aproximadamente el 95 por ciento de los intervalos construidos mediante la
figura se observa que X1, X3, X4 caen dentro del intervalo 2crx en torno aµ y, fórmula 5.2.2 incluyen la media de la población. Esta interpretación se basa
en consecuencia, los intervalos 2crx alrededor de las medidas de la muestra en la probabilidad de ocurrencia de diferentes valores de X. Es posible ge-
incluyen el valor deµ. Las medias muestrales X1 y X no caen dentro del in- neralizar esta interpretación si se designa el área total bajo la curva de X,
5
tervalo 2cr.r en torno aµ, y los intervalos de 2crx en tomo a ellas no inclu- que queda fuera del intervaloµ± 2cr.P como a y el área dentro del intervalo
yen aµ.
como 1 - a y puede darse la siguiente interpretación probabilística de la
fórmula 5.2.2.
Ejemplo 5.2.J Supóngase que un investigador está interesado en obtener una
estimación del nivel promedio de alguna enzima en cierta población de seres En el ,nuesrreo repetido, a partir de una población con distribución
humanos. El investigador toma una muestra de JO individuos, determina el 11orn1al, el 100( 1 - a) por ciento de todos los intervalos de la for,na
nivel de la enzima en cada uno de ellos y calcula la media muestra! X= 22. X± z( 1 _ o1i¡º.r incluirán, a la larga, la inedia de la población, µ.
:\demás, se sabe que la variable de interés sigue una di<.tribución aproximada- La cantidad 1 - a., en este caso .95, se conoce como coeficiente de con-
mente normal con una variancia de 45. Se desea est!n1ar el valor deµ. fianza y el intervalo X± z0 _ a12.¡ºx se conoce como intervalo de confian::_a

L
f'
lf 178 Estimación Intervalo de confianza para la inedia de una población 179

~(
paraµ. Cuando (1 - a)= .95, el intervalo recibe el nombre de intervalo de bases teóricas para construir intervalos de confianza para las medias de la
confianza del 95 por ciento para µ. En este ejemplo se dice que se tiene el población. En la mayoría de los casos prácticos las variables no siguen una
95 por ciento de confianza de que la media de la población está entre 17 .76 distribución aproximadamente normal, no se conocen las variancias de la
y 26.24. Esto se conoce como interpretación práctica de la fórmula 5.2.2. población o suceden ambas cosas. En el ejemplo 5.2.3 y la sección 5.3 s.e
En general se expresa como sigue: explican los procedimientos que se utilizan en situaciones menos ideales,
pero más comunes.
Se tiene el 100(1 - a) por ciento de confianza de que el intervalo
único calc11lado, X± z0 _ o12Jcr.t contenga la n1edia de la población, µ. 1\1uestreo a partir de poblaciones que no presentan una distribución
normal No siempre es posible o prudente suponer que la población de
En este ejemplo es preferible utilizar, en lugar de 2, el valor más exacto interés muestra una distribución normal. Gracias al teorema del límite cen-
de z, 1.96, que corresponde a un coeficiente de confianza de .95. El investi~ tral, esto no será un problema si se puede seleccionar una muestra lo sufi-
gador puede utilizar cualquier coeficiente de confianza que desee. Los valo- cientemente grande. Se ha aprendido que, para muestras grandes, la dis-
res que se utilizan con más frecuencia son .90, .95, y .99, que corresponden tribución muestra] de X presenta una distribución aproximadamente normal
a los factores de confianza de 1.645, 1.96 y 2.58, respectivamente. sin importar cómo está distribuida la población original.

Ejemplo 5.2.2 Un fisioterapista desea estimar, con el 99 por ciento de con- Ejemplo 5.2.3 Un equipo de investigadores está interesado en la puntuali-
fianza, la media de fuerza máxima de un músculo particular en cierto grupo dad de los pacientes en las citas concertadas. En un estudio de flujo de
de individuos. Se inclina a suponer que los valores de dicha fuerza muestran pacientes en los consultorios de médicos generales se encontró que, en
una distribución aproximadamente normal con una variancia de 144. Una promedio, una muestra de 35 pacientes llegaba 17 .2 minutos tarde a las
muestra de 15 individuos que participaron en el experimento proporcionó citas. Una investigación previa había demostrado que la desviación estándar
una media de 84.3. era de 8 minutos aproximadamente. Se tuvo la sensación que la distribución
de la población no era normal. ¿Cuál es el intervalo de confianza del 90 por
Solución En la tabla C, el valor de z que corresponde a un coefiCiente de ciento paraµ, que es el promedio real de impuntualidad en las citas?
confianza de .99 es de 2.58. Este es el coeficiente de confiabilidad. El error
estándar es de a_=
X
12 / fü = 3.10, por tanto, al intervalo de confianza del Solución Dado que el tamaño de la muestra es bastante grande (mayor que
99 por ciento para µ es: 30) y se conoce la desviacióil estándar de la población, la situación se
aproxima al teorema del límite central y se supone que la distribución mues-
84.3 ± 2.58(3.10) tra! de X presenta una distribución aproximadamente normal. Al consultar la
84.3 ± 8.0 tabla C se encuentra que el coeficiente de confiabilidad que corresponde a
un coeficiente de confianza de .90 se aproxima a 1.645 si se interpola. El
76.3, 92.3. error estándar es de O-., = 8 I .J35 = 1.35, de modo que el intervalo de con-
fianza del 90 por ciento paraµ es
Se dice que se tiene el 99 por ciento de confianza de que la media de la
población esté entre 76.3 y 92.3 ya que, al repetir el muestreo, el 99 por
17.2 :t: 1.645( 1.35)
ciento de todos los intervalos que podrían ser construidos en la forma
descrita incluirían a la media de la población. 17.2 :t 2.2
15.0, 19.4
-Situaciones-en -las -que .la -variable de-interés--sigue una distribución
aproximadamente normal con una variancia conocida son muy raras y casi
nunca se presentan en la práctica. El propósito de los ejemplos anteriores, Frecuentemente, cuando la muestra es lo suficientemente grande para
en los que se supone que existe esta condición ideal, fue el de formular las aplicar el teorema del límite central, la variancia de la población se des-
180 Estimación Intervalo de confianza para la media de una población 181

conoce. En ese caso, se sustituye esta variancia con la de la muestra en


la fórmula, para construir el intervalo de confianza para la media de lapo- THE ASSUMED SIGMA =0.bOO
blación.
N MEAN STDEV SE MEAN 95.0 PERCEHT C.I.
Análisis por computadora Cuando se requiere de los intervalos de con- 35 0.71~ 0.511 0.10l ( 0.519, 0.917)
fianza, se economiza una buena cantidad de tiempo mediante el uso de la
computadora, la cual puede ser programada para construir los intervalos a Estos datos indican que la media de la muestra es .718, la desviación están-
partir de los datos originales. dar es 5.11 y el error estándar de la media, cr / ..J--;;, es .6 /-JE= .l 01.
Se tiene un 95 por ciento de confianza de que la media de la población
Ejemplo 5.2.4 Los siguientes datos corresponden a los valores de la activi- está en alguna parte entre .519 y .917.
dad (micromole.s por minuto por gramos de tejido) de cierta enzima medida
en tejido gástrico normal de 35 pacientes con carcinoma gástrico. Otras estimaciones de la tendencia central Tal como se ha visto, la media
es muy sensible a los valores extremos, es decir, aquellos que se desvían
considerablemente de muchas de las mediciones en el conjunto de datos. A
.360 1.189 .614 .788 .273 2.464 .57 l dichos valores se les conoce como sesgos. También se puede apreciar que la
1.827 .537 .374 .449 .262 .448 .97 l mediana, que no es sensible a las mediciones extremas, algunas veces se uti-
.372 .898 .4 l l .348 1.925 .550 .622 liza en lugar de la media como medida de tendencia central cuando los ses-
.6 IO .319 .406 .413 .767 .385 .67-1 gos están presentes. Por la misma razón, se prefiere el uso de la mediana de
.521 .603 .533 .662 1.177 .307 1.499 la muestra como estimador de la mediana de la población cuando se requiere
Íealizar inferencias acerca de la tendencia central de la población. No sola-
mente se utiliza la mediana de la muestra como una estimación puntual para
Mediante el uso del paquete de software para computadora MINITAB, se la mediana de la población, sino. que también es posible construir un interva-
desea construir un intervalo con el 95 por ciento de confianza para la media lo de confianza para la mediana de la población. En esta obra no se propor-
4
de la población. Supóngase que la variancia de la población es igual a .36. ciona la fónnula, pero ésta se puede encontrar en el libro de Rice.
No es necesario suponer que la población muestreada de valores sigue una Los estimadores que son insensibles a los sesgos se llaman estin1adores
distribución normal, puesto que el tamaño de la muestra es lo suficiente~ eficaces. Otra medida y estimador eficaz de tendencia central es la media
mente grande para aplicar el teorema del límite central. ajustada. Para un conjunto de datos que contienen n mediciones se calcula
el 1OOa por ciento de la media ajustada como sigue:

Solu~ión Se introducen los datos de la columna l y se registra el siguiente


l. Ordenar las mediciones.
comando MINITAB:
2. Descartar las mediciones más pequeñas y más grandes que lOOa por ciento. El
valor recomendado para a está entre .1 y .2.
3. Calcular la media aritmética de las mediciones restantes.
ZINTERVAL 95.b C1
Nótese que la mediana podría considerarse corno el 50 por ciento de la
media ajustada. La fórmula para calcular el intervalo de confianza basada
Este comando indica a la computadora que el factor de confiabilidad es:..'., se en la media ajustada no aparece en esta obra. El lector interesado puede
desea un 95 por ciento de intervalos de confianza, la desviación estándar es consultar el libro de Rice. 4 Recuérdese que la media ajustada para un con-
.6 y los datos están en la columna 1. Se obtiene la siguiente impresión: junto de datos es una de las medidas descriptivas calculadas mediante el
programa MINITAB en respuesta al comando DESCRIBE.
'
i
,¡;,
• ' r¡
182 Estimación La distribución t 183
EJERCICIOS~~~~~~~~~~~~~~~~~ Suponer que la población de tales valores presenta una distribución normal
con una desviación estándar de 350 y construir intervalos de confianza al 95
5.2.1 En un experimento diseñado para estimar el número promedio de latidos del por ciento para la media de la población.
corazón por minuto para cierta población, se encontró que el número prome-
dio de latidos por minuto para 49 personas era de 90. Si resulta lógico supo-
ner que esos 49 pacientes constituyen una muestra aleatoria y que la pobla- 1
5.3 LA DISTRIBUCIÓN 1 - - - - - - - - - ~ - ~ - -
ción sigue una distribución norma!, con una desviación estándar de 10, cal-
cular:
En la sección 5.2 se describe un procedimiento para obtener un intervalo de
a) El intervalo de confianza del 90 por ciento para J.L
confianza para la media de una población. El procedimiento requiere del
b) El intervalo de confianza del 95 por ciento paraµ.
conocimiento de la variancia de la población de la que se ex.trae la muestra.
e) El intervalo de confianza del 99 por ciento paraµ.
Puede parecer un tanto extraño que se tenga conocimiento de la variancia de
5.2.2 Se encontró que la concentración media de bilirrubina en el suero de 16 niños la población y no se conozca el valor de la media de la población. De he-
de cuatro días de nacidos era de 5.98 mg/100 ce. Si se supone que la concen- cho, es común, en situaciones como las que se han presentado, que se des-
tración de bilirrubina en los niños de cuatro días de nacidos sigue una dis- conozca tanto la variancia como la media de la población. Esta situación
tribución aproximadamente normal con una desviación estándar de 3.5 presenta un problema respecto a la construcción de los intervalos de con-
mg/100 ce., calcular: fianza. Por ejemplo, aun cuando la estadística
a) El intervalo de confianza del 90 por ciento paraµ.
b) El intervalo de confianza del 95 por ciento paraµ. X- µ
,----
e) El intervalo de confianza del 99 por ciento para J.L º J Vn
5.2.3 En un estudio acerca de la duración de hospitalización dirigido por varios hos-
presenta una distribución normal cuando la población también tiene una dis-
pitales en cooperación, se extrajo una muestra aleatoria de 64 individuos con tribución normal y sigue una distribución aproximadamente normal cuando
úlcera péptica de la lista de todos los pacientes con esa enfermedad intetnados n es muy grande, independientemente de la forma funcional de la poblac~ón,
alguna vez en los hospitales participantes. Se determinó para cada uno de
no se puede hacer uso de esto hecho porque cr se desconoce. Sin embargo, no
ellos el tiempo de hospitalización. Se encontró que la duración media de hos-
todo está perdido y la solución más lógica para este problema es la siguiente.
pitalización fue de 8.25 días. Si se sabe que la desviación estándar de la po-
blación es de 3 días, calcular: Se utiliza la desviación estándar de la muestra, s = ..,J"i.(i¡- x)2 / (n - 1), para
a) El intervalo de confianza del 90 por ciento paraµ. sustituir acr. Cuando el tamaño de la muestra es grande, por ejemplo mayor
b) El intervalo de confianza del 95 por ciento paraµ. que 30, la confianza en s como una aproximación de a es por lo general sus-
e) El intervalo de confianza del 99 por ciento paraµ. tancial, por lo que se justifica la utilización de la teoría de la distribución
normal para construir un intervalo de confianza para la media de la pobla-
5.2.4 Una muestra de 100 hombres adultos aparentemente sanos, de 25 años de
ción. En tal caso, se procede como se indica en la sección 5.2.
edad, muestra una presión sistólica sanguínea media de 125. Si se supone Cuando se tienen muestras pequeñas es imprescindible encontrar otro
que la desviación estándar de la población es de 15, calcular: procedimiento para construir intervalos de confianza.
a) El intervalo de confianza del 90 por ciento paraµ. Como resultado del trabajo de Gosset, 5 escrito bajo el pseudónirno de
b) El intervalo de confianza del 95 por ciento paraµ. "Student", se dispone de otra alternativa, conocida como distribución t de
5.2.5 Algunos estudios acerca de la enfermedad Alzheimer han mostrado un incre- Student, con frecuencia abreviada como distribución t.
mento en la producción de 14C02 en pacientes con ese padecimiento. Duran- La cantidad
te un estudio, se obtuvieron los siguient~s valores de 14C0 _a partir_de _16 biop- µ
sias de neocorteza de pacientes con la eñferinedild: ·-----2 ----- ---- --- - --- ---
X -

v'ñ
5/
1009, 1280, ll80, l255, 1547, 2352, 1956.1080,
1776, 1767, 1680, 2050, 1452, 2857, 3100, 1621 sigue esta distribución. La distribución t tiene las siguientes propiedades:
184 Estimación LA distribución t 185 1
La distribución t, al igual que la distribución normal estándar, se ha ta-
bulado ampliamente. Una de estas tablas es la tabla E del apéndice 11. Tal
como se puede apreciar, se debe tomar en cuenta el coeficiente de confianza
y los grados de libertad cuando se utiliza la tabla de la distribución t.
El procedimiento general para construir intervalos de confianza no se
ve afectado por la necesidad de utilizar la distribución t en lugar de la dis-
tribución normal estándar. Aun es necesario usar la relación expresada por

estimador± (coeficiente de confiabilidad) x (error estándar)

Lo que es diferente es el origen del coeficiente de confiabilidad. Éste se


obtiene a partir de la tabla de la distribución t en lugar de la tabla de la dis-
tribución normal estándar. Para ser más específicos, cuando se obtienen
Figura 5.3.1 Distribución t para diferentes grados de libertad. muestras a partir de una distribución nornwl cuya desviación estándar, a, i
1
se desconoce, el 100(1 - a) por ciento del intervalo de confianza para la .i
1. Tiene una media de O. .i
2. Es simétrica con respecto a la media
media de la población, µ, esta dado por
~ !!
3. En general. tiene una variancia mayor que 1, pero ésta tiende a 1 a medida que s :¡
aumenta el tamaño de la muestra. Para df> 2, la variancia de la disiribución tes i ± t(I _ a/2)Vn
(5.3.1)
df I (df - 2), donde df representa los grados de libertad. En forma alterna, puesto :!
que df = n - 1 paran > 3, se puede escribir la variancia de la distribución t como
(11- l)/(11-3). Es importante aclarar que el requisito para el uso válido de la distribución t
4. La variable r va de -oo hasta +oo. es que la muestra debe ser extraída de una población con distribución nor-
5. La distribución t es realmente una familia de distribuciones, puesto que hay una mal. Sin embargo, la experiencia ha demostrado que se pueden tolerar des-
distribución diferente por cada valor de la muestra de 11- 1, que es el divisor que viaciones moderadas de este requisito. Como consecuencia, la distribución t 1
se utiliza para calcular s2 • Recuérdese que n - l representa los grados de líber- se utiliza incluso cuando se sabe que la población original se desvía de la :¡
tad. En la figura 5.3.l se muestran las distribuciones t correspondientes a algu- normalidad, La mayoría de los investigadores requieren que, al menos, pue-
nos valores de los gracias de libertad.
de sostenerse el supuesto de una distribución de población en forma de
6. Comparada con la distribución nonnai," la distribución res menos espigada en el 1
centro y tiene colas más largas. En la figura 5.3.2 se compara la distribución t
montículo.
con la distribución normal.
Ejemplo 5.3.1 Se desea estimar la concentración media de amilasa en suero 1
7. La distribución r se aproxima a la distribución normal a medida que n - 1 se
aproxima al infinito. de una población sana. Las mediciones se efectuaron en una muestra de 15 l
individuos aparentemente saludables. La muestra proporcionó una media de-
96 unidades/100 ml, y una desviación estándar de 35 unidades/! 00 ml. La
,,.-, Distribución normal
variancia se desconoce.
'// ',,· - - - Distribución t
Solución Es posible utilizar la media de la muestra, 96, como una esti-
_____ .,,,,. /j
')
mación puntual de la media de la población, pero, dado que se desconoce la

"- -- X
desviación estándar, puede suponerse que los valores de la población siguen
al menos una distribución aproximadamente normal antes de construir un
intervalo de confianza para µ. Se puede suponer que dicha hipótesis resulta
Figura 5.3.2 Comparación entre la distribución normal y la distribución t.
razonable y que se desea un intervalo de confianza del 95 por ciento. Se
1

186 Estimación Ejercicios 187

1 fü
tiene el estimador X y el error estándar es s /-{;;, = 35 / = 9.04. Ahora es EJERCICIOS~~~~~~~~~~~~~~~~
necesario encontrar el coeficiente de confiabilidad, es decir, el valor de t
asociado a un coeficiente de confianza de .95 y n - 1 = 14 grados de liber- 5.3.1 A nueve pacientes que sufren la misma incapacidad física, y por lo tanto son
tad. Dado que un intervalo de confianza del 95 por ciento deja .05 del área comparables, se les pidió que llevarán a cabo cierta tarea como parte de un
experimento. El tiempo promedio necesario para realizar la tarea fue de siete
bajo la curva de t igualmente dividida entre las dos colas, se necesita el
minutos con una desviación estándar de dos minutos. Suponiendo que la dis·
valor de t a la derecha del cual se encuentra .025 del área. En la tabla E se
tribución de los datos es nonna!," construir intervalos de confianza del 90, 95
localiza la columna encabezada por t_ 975 . Este es el valor de ta la izquierda y 99 por ciento para el tiempo medio real necesario para que este tipo de
del cual está .975 del área bajo la curva. El área a la derecha de este valor es pacientes efectúe la tarea.
igual al valor deseado .025. El siguiente paso es localizar el número 14 en la
columna de los grados de libertad. El valor de la intersección del renglón 5.3.2 El administrador de un hospital tomó una muestra de 25 cuentas vencidas con
marcado con el número 14 y la columna encabezada por t. 975 es el valor de t el propósito de estimar el monto medio de la deuda. A partir de dicha muestra,
buscado. Se encuentra que este valor de r, que es el coeficiente de confiabi- calculó con una media de $250 y una desviación estándar de $75. Si todas las
lidad, es de 2.1448: Ahora se construye el intervalo de confianza del 95 por cuentas vencidas siguen una distribución normal, calcular los intervalos de
ciento como sigue: confianza del 90, 95 y 99 por ciento paraµ.

5.3.3
90 ± 2.1448(9.04)
90± 19
77, 115
5.3.4

Este intervalo se puede interpretar desde dos puntos de vista: tanto el


probabilístico como el práctico. Se dice que se tiene el 95 por ciento de con-
fianza de que la media real de la población,µ, esté entre 77 y 115 ya que en
5.3.5.
muestreos repetidos, el 95 por ciento de los intervalos construidos de una
manera semejante incluyen a µ.

Decidir entre z y t Cuando se obtiene un intervalo de confianza para la Sujeto Valor :Sujeto i/aior
media de una población, se debe decidir si se debe usar un valor de z o de t
1 .007 9 .012
como factor de confiabilidad. Para hacer una elección adecuada se debe con- 10 .006
2 .030
siderar el tamaño de la muestra, si la población muestreada sigue una dis- 3 .025 ll .010
tribución normal y si la variancia de la población es conocida. La figura 4 .008 12 .032
5.3.3 muestra un diagrama de flujo que se puede utilizar para decidir rápida- 5 .030 13 .006
mente si el factor de confiabilidad debe ser z o t. .009
Si el propósito es construir un intervalo de confianza con el programa
6
7
.038
.007
.005
'"
15
16
.014
.Oll
MINITAB para la media de la población cuando el estadístico tes el factor de 8
- confiabilidad adecuado, el comando se inicia con la palabra TINTERVAL. El
resto del comando es el mismo que para el comando ZINTERVAL. Construir un intervalo de confianza de 95 por ciento para la ffieéi{U de Ya pOb\ación.
Estimación Intervalo de confianza para la diferencia e11tre las medias 189
188
5.4 INTERVALO DE CONFIANZA PARA LA DIFERENCIA
ENTRE LAS MEDIAS DE DOS POBLACIONES----~
~ }------,
En ocasiones se presentan casos en los que se desea estimar la diferencia

o
§-~i
15 iii -
entre la media de dos poblaciones. A partir de cada población se extrae una
muestra aleatoria independiente y de los datos de cada una se calculan las
z ;;: "s! "§..
':?..!!!~ medias muestrales XI y x 2, respectivamente. En el capítulo anterior se
~
aprendió que el estimador X1 - X2, proporciona una estimación insesgada de
µ - µ , que es la diferencia entre las n1edias de las poblaciones. La varian-
iñ f--------, 1 2
cia del estimador es (cr 12 / n 1) + cr22 / n 2 ). También se aprendió que, según
¡~
~) .
¡EID~
~
-= o .. 1 ]i
las condiciones, la distribución muestra\ de X1 - X2 puede presentar al menos
una distribución aproximadamente normal, de modo que en muchos casos
z ~ se utiliza la teoría adecuada a las distribuciones normales para calcular un
intervalo de confianza para µ 1 - µ2. Cuando se conocen las variancias de la
"

:¡;¡ población, el intervalo de confianza del 100(1 - a) por ciento para µ 1 - µ2
m @ti
§ti ~ g está dado por
~;.!!! ~ ·g %
~ ~ ,, ')

u¡ <T2
~

~
1- .~

",.,, :::::
e (.X 1 - .X:!) ± :. 1 _ a -+-
(5.4.1)
a 11] 11 2
·-"' "1 "': "ª- 13"
e:·=,¡¡
g;g ~ ~ [ Esto se ilustra a continuación, primero para el caso donde el muestreo se
,s • e ;_ §
8. § .5 ,., a realiza a partir de una distribución nonnal y luego para el caso en que no es
"'~ ·g ~ }------, ~
posible suponer que la población sigue una distribución nonnal.
~,g .o -o ,
'j¡

o ;.:
~
g2 Ejemplo 5.4.1 A un equipo de investigación le interesa conocer la diferen-

--·
ü*
1 111 "-e:
~
cia entre las concentraciones de ácido úrico en pacientes con y sin mon-
%!.!!!
~
~ -
·-
:s
;:¡
-o -"
·g -§
e:¡
golismo. En un gran hospital para el tratamiento del retardo mental, una
muestra de 12 individuos con mongolismo proporciona una media de X1 =
4.5 mg/100 mi. En un hospital general se encontró que una muestra de 15
-o c.
~ e:¡ individuos normales de la rnisina edad y sexo presenta un nivel medio de
e
ui .. ~~
¡,.~
~
c. -o X = 3.4. Si es razonable suponer que las dos poblaciones de valores n1ues-
- 'j¡ ,...... 2
iñ >---< E• e ·:$ -~ - tran una distribución norn1al y sus variancias son iguales a 1, calcular el
~ ..= -o -
.5
·• ~ -~o-G ~ E'ª intervalo de confianza del 95 por ciento paraµ 1 - µ 2.

~ ~-'!
"
Solución Para una estimación puntual de µ 1 - µ 2 se utiliza X1 - X2 = 4.5 -

.o~B~
..,,'g
§·g ál
3.4 = 1.1. El coeficiente de confiabilidad correspondiente al .95, localizado
ij <:.)
§ • 1< en la tabla C, es 1.96. El error estándar es
"' '": "~ >ó
& _;
·• "
..!ll
f"'",•
'<• ·~
"'
<":l ·'-'
-
!:::
~ ªi ª" '(¡!
5] cr~, - ~

~ + 11: = V12 + l5 =
.39
iñ ..
i~ [

~
Estimación Intervalo de confianza para la diferencia enire las medias 191
190
Por lo tanto, el intervalo de confianza del 95 por ciento es La distribución t y la diferencia entre las medias Cuándo se desconocen
Jas variancias de la población y se requiere estimar la diferencia entre las
1.l ± 1.96(.39) medidas de dos poblaciones con un intervalo de confianza, se puede utilizar
la distribución t para extraer el factor de confiabilidad si son satisfechas
l. l ± .8 ciertas suposiciones. Es necesario saber o considerar lógico suponer que las
.3, 1.9 dos poblaciones muestreadas presentan una distribución normal. Con res-
pecto a las variancias de las poblaciones, se distinguen dos situaciones: 1) la
Se dice que se tiene una confianza del 95 por ciento de que la diferencia situación en la que las variancias de las poblaciones son iguales, y 2) la si-
real, µ 1 - µ 2 , está entre .3 y 1.9 debido a que en muestreos repetidos el 95 tuación en la que no lo son. Cada situación se estudia en forma individual.
por ciento de los intervalos construidos de esa manera incluiría la diferencia
entre las medias reales. Variancias iguales de las poblaciones Si la suposición acerca de igualdad
de las variancias de las poblaciones está justificada, las dos variancias de las
Muestreo a partir de poblaciones no normales La construcción de un muestras calculadas a partir de las m(Jestras independientes pueden cons-
intervalo de confianza para la diferencia entre las medias de dos poblaciones, truirse como estimaciones de la misma cosa, es decir, la variancia común.
cuando el muestreo se realiza a partir de poblaciones no normales, se lleva a Parece lógico, entonces, tomar ventaja de este hecho en el análisis en cues-
cabo en la forma descrita en el ejemplo 5.4. l si las muestras, n 1 y n2 , son tión. Esto es precisamente lo que se hace para establecer una estimación
grandes. Una vez más, éste es un resultado del teorema del límite central. conjunta para la variancia común. Esta variancia se obtiene mediante el cálcu-
lo promedio ponderado de las dos variancias de las muestras. Cada varian-
Ejemplo 5.4.2 A un grupo de investigadores les interesa comparar el status cia de las muestras es ponderada con base en sus grados de libertad. Si los
económico de los pacientes atendidos en dos hospitales. El ingreso promedio tamaños de las muestras son iguales, este promedio ponderado es la media
familiar de una muestra de 75 pacientes internados en el hospital A fue de XI aritmética de las variancias de las dos muestras. Si el tamaño de las dos
= $68000, mientras que el promedio de una muestra de Sú pacientes del hos~ muestras es distinto, el promedio ponderado aprovecha la infonnación adi-
pita! B es de X2 = $44500. Si las desviaciones estándar de las poblaciones cional proporcionada por la muestra mayor. La estimación conjunta se
son cr 1 = $6000 y cr2 = $5000, calcular el intervalo de confianza del 95 por obtiene con la fórmula:
ciento paraµ 1 - µ 2, que es la diferencia entre las medias de la población.
..
rp
{11 1 - l)s7 + {n 2 - l)s 2 2
Solución La estimación puntual de µ 1 - µ 2 es X1 - X2 = $68000 - $44500 = 1!1+112-2 (5.4.2)
$23500. A partir de la tabla C se deduce que el coeficiente de confiabilidad
es de 2.58. El error estándar es Entonces, el error estándar de la esti1nación es:
,"'+ .,,_.,
s- s·
ª.,. _,, ~ v(6~~ºJ' + ( 5000
80
J' 890 V TI¡ lit

y el intervalo de confianza del 100(1 - a) por ciento para µ 1 - µ 2 se obtiene


El intervalo de confianza del 99 por ciento es de la siguiente forma:
, .
$23500 ± 2.58(890)
$23500 ± 2296
- - -- - --- ---- -
~-+
(X¡ - X2) - f(I - altl
V s-s-
::..J!._ + ::..J!._
11¡ 11':! (5.4.3)

521204,525796 El número de grados de libertad utilizado para determinar el valor de r que


se usa para construir el intervalo es de 11 1 + 11 2 -2. que es el denominador de
La interpretación de este intervalo se hace en la forma acostumbrada. la ecuación 5.4.2. Este intervalo se interpreta en la forma habitual.
Estimación Intervalo de confuinza p(lra la diferencia entre las niedias 193
192
Ejemplo 5.4.3 Para ilustrar este punto, se toma el ejercicio 5.3.l Supo- Cochran. 16 El procedimiento de Cochran se encuentra también en Snedecor
niendo que además de examinar a las personas aparentemente sanas se y Cochran. 17
hicieron también las determinaciones de amilasa en el suero a 22 individuos El problema gira en tomo al hecho de que la cantidad
hospitalizados que forman una muestra independiente. Supóngase que la
media y la desviación estándar de esta muestra son 120 y 140 unidades/mi.
(x, - x,) -
., ., s;
(µ., - µ.,)
respectivamente. La muestra de 15 personas sanas representa a la muestra 2.
La estimación puntual del µ 1 - µ2 es de 120 - 96 = 24. Se desea construir
un intervalo de confianza para la diferencia entre las concentraciones
V s¡
-+-
nI n2

medias de arnilasa del suero en individuos aparentemente sanos y la media no sigue una distribución t con 11 1 + 11 2 - 2 grados de libertad cuando las
para los pacientes hospitalizados. variancias de las poblaciones son distintas. Consecuentemente, la distribu-
ción r no se puede utilizar en la forma habitual pata obtener el factor de con-
Solución Se procede bajo la suposición de que las dos poblaciones en estu- fiabilidad del intervalo de confianza para la diferencia entre las medias de
dio presentan una distribución normal y que sus variancias son iguales. El dos poblaciones que tienen variancias diferentes. La solución propuesta por
primer paso es obtener, por medio de la ecuación 5.4.2, una estimación con- Cochran consiste en el cálculo del factor de confiabilidad, tí _oíl mediante
junta de la variancia común como sigue: la siguiente fórmula:
U'¡l¡ + U!'.!/':!.
14(35)' + 21(40) 2 1; - o./ 2
5-" = 1450 U!¡ + W:z (5.4.4)
p 15 + 22 - 2

El interva!o de confianza del 95 por ciento para µ 1 - µ 2 es como sigue: donde \r 1 = sf /


11 1, tt'2 = s~ I n 2, r1 = t 1 _ a.Jl paran 1 - l grados de libertad y t 2
= t _ wi para n 2 - 1 grados de libertad. Un intervalo aproximado de con-
1
, / 1450 1450 fianza del 100( 1 - a) por ciento paraµ 1 - µ 2 está dado por
020 - 96) ,,, 2.0301 y15 + 22 2 2
SJ 5,,
24 ± (2.0301)(12.i5) {i¡ - i2) ::!::: 1;1 - «l'.!1 - + _.::.
n1 n2 (5.4.5)
24 ± 26
Ejemplo 5.4.3 Se obtuvieron los siguientes resultados durante el análisis de
-2, 50
la actividad total del complemento serológico (CH 50) en 20 individuos apa-
Una vez mas que se dice que se tiene un 95 por ciento de confianza de rentemente sanos y en 10 sujetos enfermos:
que la diferencia real, µ 1 - µ2, está entre -2 y 50 ya que, el muestrear varias
Individuos
veces, el 95 por ciento de los intervalos así construidos incluyen a µ 1 - µ 2. " '
Enfermos 10 ti'.!.6 33.8
Variancias poblacionales distintas Cuando no se acepta que !as variancias Nonnales ~() 47.~ 10.l
de dos poblaciones de interés son iguales, aun cuando pueda suponerse que
las dos poblaciones presentan distribuciones nonnales, no es adecuado uti- Los investigadores tenían razones para suponer que las poblaciones mues-
lizar la distribución t como se acaba de describir para construir los interva- treadas se distribuyen en fonna aproximadamente nonnal, pero se rehusa-
los de confianza. ban a suponer que las variancias desconocidas de ambas poblaciones eran
Una solución al problema de variancias distintas fue propuesta por iguales. Encontrar el intervalo de confianza del 95 por ciento paraµ 1 - µ 2.
Behrens 6 y posteriormente fue verificada y generalizada por Fisher. 7 ·8
Neyman, 9 ScheffélO.ll y Welch12.1 3 también proponen soluciones. El pro- Solución La estimación puntual de µ 1 - µ 2 es de 62.6 - 47.2 = 15.4. Para
blema ha sido discutido en detalle por Aspin, 14 Trickett y colaboradores'15 y el intervalo de confianza es necesario utilizar la ecuación 5.4.4 y calcular el
r-
i.
194 Esh·mación -"
I! ~ >------i ~
"
f! valor del factor de confiabilidad. En la tabla E se encuentra que t 1 :::: 2.2622 •
y r, =2.0930. El cálculo de w 1 =(33.8)2 / 10 =114.244 y w 2 =(!O.! )2 / 20 = líu
ti s.foos. Por medio de la ecuación 5.4.4 se calcula o
z
ea"!i
~-~=
·-~
"'º~
...,.... -8 -

o
·g

i ,. ~

114.24-1(2.2622) + 5.1005(2.0930) 2
2.255 ~ >--------i ~
114.244 + 5.1005 o

e .~a-
-
.-
7ñ <-•
Con la ecuación 5.4.5, el intervalo de confianza del 95 por ciento para • "'-g
• ],.. "3--=
-.
o\
z r------1 E
1:::, a, n:,
µ 1 - µ, es cé ~ V C.
J
_, /33.S' 10.1' º-"
is.4 ± 2.25=> y 10 + 2() ~ >------i ~
i o "
o "
15.4 ± 2.255( 10.9245)
¡i · )
..i ;3 >.
--o ·;:::8
15.4 ± 24.6 ~ ,!1,._
¿,¡ :,:; -"' 1 .... ,z
,_eti eEo
~
~·- -8
-9.2, 40.0 -i
Cuando se construye un intervalo de confianza para la diferencia entre ~ 1--------i "' " c.
_g g
.g o
las medias de dos poblaciones es recomendable el uso de la figura 5.4.1
para decidir rápidamente si el factor de confiabilidad es z. to t'.
c·t:-¡¡;
:2 7ñ E
J;J~g
~"E
o
:-g ..
u

ne :;:; ;.a
8.::, .§
"'~ ·g -s,;:;: "o
~
:.,
~1l .n
EJERCICIOS, _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ __ oo "c.
~ f------i u o
~" o
5.4.1 En un estudio practicado a niños con problemas de lento aprendizaje, 11 2g
varones y 10 niñas, después de un año de combinar escuela y terapia se o
z
·~1
Í'Í-~~ ~
u <-:!
a
sometieron a tests que constatan los logros. Se desea conocer la diferencia "'o -
_,.s;¡~
-·cr. ""*
'J
entre los puntajes medios de niños y niñas. El puntaje medio de los varones
fue de X1 = 67.0 y el de las niñas de X2 == 61.5. Si es razonable suponer que ~,------, ~ fo
-~
los puntajes de niños semejantes en circunstancias sitnilares siguen una dis- .g ·g
tribución nonnal con desviaciones estándar de a 1 == 11 y cr 2 = 1O. calcular: e
a) El intervalo de confianza del 90 por ciento para µ 1- µ 2 . ~ "''gi
~
c. c.
:g
u, ).....---1 E a, l'6
b) El intervalo <le cont'ianza del 95 por ciento paraµ 1 - µ 2 •
e) El intervalo de confianza del 99 por cien lo paraµ 1 - µ 2.
.5
o
O">
·O ·~· -o
e
o ~
u
-o
"~
~ >------< .S
'J:
5.4.2 Una muestra de 10 niñas y una muestra de 10 niños de 12 años de edad pro- 03
E 13
porcionaron valores de estatura media de X 1 = 59" y X2 == 58.5". Suponiendo
que la estatura sigue una distribución normal con a 1 == 2" y cr 2 == 3''. calcular: 1¡¡]8.
·G 2 E
-~º-ª
a) El intervalo de confianza del 90 por cien lo paraµ 1 - µ2.
b) El intervalo de confianza del 95 por ciento para µ 1- µ 2.
~

-~-..
<'X \::! o 2
-
~
~,-,:
e) El intervalo de confianza del 99 por ciento para ~L 1 - µ 2. lT, '::;
~
• =
u
5.4.3 La diferencia entre los tiempos medios de pern1anem.:ia hospitalaria entre los :, 5
pacientes con diagnósticos diferentes resulta de interés para los planifi· .':.' ·'=
:.. ~

10:::
196 Esti,nación Intervalo de confianza para una proporción de población 197
cadores de salud. Una muestra de 100 pacientes con la enfern1edad A, inter· Suponer que las poblaciones siguen una distribución normal con variancias
nados en un hospital de cnfem1edades crónicas, permanecieron en el hospital iguales y calcular los intervalos de confianza del 90, 95 y 99 por ciento para
durante 35 días en promedio. Otra muestra de 100 pacientes con la enfer- la diferencia entre las medias de las poblaciones.
medad B permanecieron durante un promedio de 28 días. Sí las variancias de
la población son 100 y 255. respectivamente, calcular: 5.4.8 A dos grupos de niños se les hicieron pruebas de agudeza visual. El grupo
a) El intervalo de confianza del 90 por ciento para µA - µ 8 . estuvo formado por 11 niños que recibieron la atención de médicos privados.
b) El intervalo de confianza del 95 por cien!o para µA - µ 8 . La calificación media para este grupo fue de 26 con una desviación estándar
e) El intervalo de confianza del 99 por ciento para µA - µ8. de 5. El segundo grupo, que incluyó 14 niños que recibieron atención médica
por parte del departamento de salud pública, tuvo una calificación promedio
5.4.4 Se llevó a cabo un estudio para con1parar las concentraciones de lipa-proteí- de 21 con una desviación estándar de 6. Suponer que las poblaciones siguen
nas de alta densidad en hombres adultos con trabajos sedentarios y con traba- una distribución normal con variancias iguales y calcular los intervalos de
jos manuales. Los datos de la muestra proporcionaron los siguientes resul- confianza del 90, 95 y 99 por ciento para µ 1-µ 2.
tados:
Trabajadores sedentarios: X= 56.5, s = 14.1, n = 55 5.4.9 El tiempo promedio de recuperación de una muestra de 20 pacientes dados de
Trabajadores manuales: X= 51.3, s = 13.5, 11 = 50 alta de un hospital general es de 7 días, con una desviación estándar de 2
días. Una muestra de 24 pacientes dados de alta de un hospital de enfer-
Construir un intervalo de confianza del 95 por ciento para la diferencia entre medades crónicas tuvo un tiempo promedio de recuperación de 36 días con
las medias de las poblaciones. una desviación ·estándar de 10 días. Suponer que la población sigue una dis-
tribución normal con variancias desiguales y calcular el intervalo de confian-
5.4.5 Utilizando como referencia los ejercicios 5.3.3 y 5.3.4. suponer que las va- za del 95 por ciento para la diferencia entre las medias de las poblaciones.
riancias de las poblaciones son iguales. Construir los intervalos de confianza
del 90, 95 y 99 por ciento para ta diferencia entre las dos n1edias. 5.4.10 En un estudio de factores que se consideran responsables de los efectos
adversos del tabaquismo sobre la reproducción humana. se midieron los
5.4.6 La medición del diámetro transversal del corazón de hombres y mujeres niveles de cadmi(1 (nanogramos por gramo} en el tejido de la placenta de
adultos da los siguientes resultados: una muestra de 14. mujeres embarazadas que fumaban y una muestra aleato-
ria independiente de H~ mujeres no fumadoras. Los resultados fueron los
siguientes:
Grupo Ta111aílo de la 11111estra '
{nn) (C!ll)
No fumadoras: 10.0, 8.4, 12.8, 25.0, 11.8, 9.8, 12.5, 15.4, 23.5,
Varones 12 13.21 I.05 9.4, 25.1, 19.5, 25.5, 9.8, 7.5, 11.8, 12.2, 15.0
l\.1ujeres 9 11.00 1.01 Fumadoras: 30.0, 30.l, 15.0, 24.1, 30.5, 17.8, 16.8, 14.8,
13.4, 28.5, 17.5, 14.4, 12.5, 20.4

Si las poblaciones siguen una distribución normal con ,·ariancias iguales, Construir un intervalo de confianza del 95 por ciento para la diferencia entre
construir intervalos de confianza del 90, 95 y 99 por ciento para µ 1 - µ 2. las medias de las poblaciones. ¿E~ probable que el nivel medio de cadmi.o
registrado sea mayor entre las fumadoras que entre las no fumadoras? ¿Por
5.4.7 Veinticuatro animalés de laboratorio con deficiencia de \"Ítamina D fueron qué se llegaría a esta conclusión?
divididos en dos grupos iguales. El grupo 1 recibió un tratamiento consis-
tente en una dieta que proporcionaba la vitamina D. El segundo grupo no fue
tratado. Al término del periodo experimental. se midieron las concentra- 5,5 INTERVALO DE CONFIANZA
ciones de calcio en suero. obteniéndose los siguientes resultados: PARA UNA PROPORCIÓN DE POBLACIÓ1-----~

Grupo tratado: X= 11.1 mg / 100 n1l. s = 1.5 Muchas preguntas de interés para que el técnico en salud tienen relación
Grupo sin trata,niento: X= 7.8 mg I l 00 n1l. s = 2.0 con las proporciones de población. ¿Qué proporción de los pacientes que
Estimación Intervalo de conflllnza para la diferencia entre las proporciones
198 199
reciben un tipo especial de tratamiento se recuperan? ¿Qué proporción de .41 ,e 1.96(.028)
alguna población tiene cierta enfermedad? ¿Qué proporción de una pobla-
ción es inmune a cierta enfermedad? .41 ::!:: .05
Para estimar la proporción de una población se procede en la misma .36 • .46
forma que cuando se estima la media de una población. Se extrae una mues-
tra de la población de interés y se calcula su proporción P. Ésta se utiliza Se puede decir que se tiene el 95 por ciento de confianza de que la propor-
como el estimador puntual para la proporción de la población. Un intervalo ción real, p, esté entre .36 y .46 ya que, al repetir el muestreo, el 95 por
de confianza se obtiene mediante la siguiente fórmula general: ciento de los intervalos construidos en la fonna de este intervalo incluyen a
la proporción p real.
estimador± (coeficiente de confiabilidad) X (error estándar)
EJERCICIOS _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ __
En el capítulo anterior se vio que cuando np y n(l -p) son mayores que
5, se puede considerar que la distribución muestral de P se aproxima bas- 5.5.1 El encargado de archivo de expedientes médicos extrajo al azar una muestra
tante a una distribución normal. Cuando se cumple esta condición, el coefi- de 100 expedientes de pacientes y encontró que en el 8 por ciento de ellos la
ciente de confiabilidad es algún valor de z de la distribución normal están- carátula tenía al menos un detalle que contradecía al resto de la información
en el expediente. Construir los intervalos de confianza del 90, 95 y 99 por
dar. Fue visto que el error estándar es igual a <Jp = ...Jp( l - p) / n. Puesto qu~
ciento para la porción real de los expedientes que contienen dichas discre-
p. que es el parámetro que se trata de calcular, se desconoce, se debe utilizar p pancias.
como una estimación. Así se estima a crp por medio de ...JP( l - P) l n y el inter-
5.5.2 Una encuesta efectuada a una muestra aleatoria de 150 familias en cierta
valo de confianza 100(1 - a) parap por medio de comunidad urbana reveló que, en el 87 por ciento de los casos, por lo menbs
uno de los miembros de la familia tenía alguna forma de seguro relacionado
jJ.:tz(l-o.i 21 VjJ(l jJ)ln (5.5.1) con la salud. Construir los intervalos de confianza del 90, 95 y 99 por ciento
para p, la proporción real de familias en la comunidad con la característica de
interés.
Este intervalo se interpreta tanto desde el punto de vista práctico como
5.5.3 En un estudio diseñado para establecer Iá. relación entre un medicamento y
probabilístico. cierta anomalía en los embriones de pollo, se inyectaron con el medicamento
50 huevos fecundados al cuarto día de incubación. En el vigésimo día de
Ejemplo 5.5.1 Se 11evó a cabo una encuesta para estudiar los hábitos y acti- incubación se examinaron los embriones y se observó la presencia de la
tud hacia la salud dental de cierta población urbana de adultos. De los 300 anomalía en 12 de ellos. 'Encontrar los intervalos de confianza del 90, 95 y
adultos entrevistados, 123 de ellos dijeron que se sometían regularmente a 99 por ciento para p.
5.5.4 En una muestra aleatoria simple de 125 varones desempleados, expulsados
una revisión dental dos veces por año. Se desea construir un intervalo de
todos el!os de la escuela preparatoria entre las edades de 16 y 21 años inclu-
confianza del 95 por ciento para la proporción de individuos de la población
sive, 88 de ellos declararon que eran consumidores regulares de bebidas
muestreada que se somete a una revisión dental dos veces al año. alcohólicas. Construir el intervalo de confianza del 95 por ciento para la pro-
1~:
; : ·] porción de la población.
1 ¡! Solución La mejor estimación puntual de la proporción de la población es
P- 123 I 300 = .41. El tamaño de la muestra y la estimación de p son de
.' magnitud suficiente como para justificar el uso de la distribución normal 5.6 INTERVALO DE CONFIANZA PARA LA DIFERENCIA
_estándar_ par.a.construir- el --intervalo -de--confianza.--El coefiG-iente -de confia- ENTRE LAS PROPORCIONES DE DOS POBLACIONES_._
bilidad que corresponde a un nivel de confianza de .95, por ejemplo, es de
1.96 y la estimación del error estándar. ªfo es -,/p(I - p)/n = -,/.4J(.59) / 300 = A menudo se tiene interés en conocer la magnitud de la diferencia entre dos
.028. El intervalo de confianza del 95%para p, con base en estos datos, es poblaciones. Es posible que se quiera comparar, por ejemplo, entre hombres
200 Estitnación Ejercicios 201
y mujeres, dos grupos de edades, dos grupos socioeconómicos o dos grupos Se puede decir que se tiene un 95 por ciento de confianza de que la di-
de diagnóstico con respecto a la proporción que posee alguna característica de ferencia real está entre .02 y .22, porque sabemos que, al repetir el mues-
interés. Un estimador puntual insesgado de la diferencia entre dos propor- treo, cerca del 95 por ciento de los intervalos que se pueden construir en la
ciones de las poblaciones se obtiene al calcular la diferencia de las pro- forma recién descrita incluyen la diferencia verdadera.
porciones de las muestras, f; 1 - f; 2• Tal como se ha visto, cuando n I y 11 son Es importante notar que los signos negativos sólo reflejan el hecho de
2
de gran tamaño y las proporciones de la población no están muy cerca de O que se obtuvieron mejores resultados al utilizar el nuevo tratamiento. Podría
o de J, es posible aplicar el teorema del límite central y utilizar la teoría de haberse construido igualmente el intervalo en tomo a f, 2 - P,,
en cuyo caso
la distribución normal para obtener los intervalos de confianza. El error los puntos extremos del intervalo habrían sido los mismos, pero los signos
estándar de la estimación se calcula mediante la siguiente fórmula: habrían sido positivos.

a- __ - , /p,(I - p,) + p (1 2 - p2 ) ¡
Pi V. n1 EJERCICIOS~~~~~~~~~~~~~~~~~
P1 n2
i
dado que se desconocen las proporciones de la población. Un intervalo de
confianza del 100(1 - a) por ciento para p 1 - p 2 se obtiene así:
5.6.1 A partir de una muestra de 150 personas seleccionadas de los pacientes inter-
nados en un gran hospital durante un periodo de dos años, 129 de ellos tenían
algún tipo de seguro de hospitalización. En una muestra de 160 pacientes
:l
:1
seleccionados en forma similar de un segundo hospital, 144 de ellos tuvieron .i
(p, - p,) ± '11 - o.'2)yt,(I - p,) + p,(I - p,) algún tipo de seguro de hospitalización. Calcular los intervalos de confianza
'i
n1 n2 (5.6.1) del 90, 95 y 99 por ciento para la diferencia real en las proporciones de las
poblaciones. :1
Es posible interpretar este intervalo desde el punto de vista probabilístico y
práctico.
5.6.2 En una encuesta efectuada en dos secciones de una gran área metropolita-
na se obtuvieron los siguientes resultados con respecto a presión sanguínea lj:'
Ejemplo 5.6.1 Un grupo de investigadores desea comparar los efectos de anonnal. ,.
1,
dos tratamientos sobre los tiempos medios de recuperación de pacientes con 1,
cierta enfennedad. Doscientos pacientes fueron divididos aleatoriamente en Nú,nero de Nú111ero de personas i:!
Área 1'
dos grupos iguales. Del primer grupo, cuyos elementos recibieron el tra- personas exaniinadas con presión anor,nal
tamiento habitual, 78 se recuperaron en un plazo de. tres días. De los otros
!
1 200 20
100, que fueron tratados con un nuevo método, 90 se recuperaron en tres
¡
2 250 38
días. El médico quiso estimar la diferencia real entre las proporciones de las
dos poblaciones que pudieron recuperarse en un plazo de tres días. Construir los intervalos de confianza del 90, 95 y 99 por ciento para la dife-
rencia entre las proporciones de las dos poblaciones.
Solución La mejor estimación puntual de la diferencia en las proporciones
P
es 1 - P2 = .78 - .90 = -.12. El intervalo de confianza del 95 por ciento 5.6.3 En un estudio diseñado para identificar los efe"ctos secundarios de dos me-
dicamentos, a 50 animales se les administró el medicamento A y a los 50
para p 1 - p 2 es
restantes se les administró el medicamento B. De los 50 que recibieron el
• , , /(.78)(.22) (.90)(.10) medicamento A, 11 mostraron efectos secundarios no deseables. mientras
(.,s - .90)"' 1.95v
100 + 100 que sólo 8 de los que recibieron el medicamen10 B reaccionaron en forma
similar. Calcular los intervalos de confianza del 90, 95 y 99 por ciento para
-.12 ± 1.96(.05)
PA - Ps·
-.12 ::!::: .10
5.6.4 En cierta comunidad se efectuó un análisis neurológico a 110 empleados de
-.22. -.ci una fábrica de herbicidas. el cual mostró que 44 tenían anormalidades neu-

,!li
Determinación del tamaño de la ,nuestra para la estimación de medias 203
202 Estimación

rológicas. En una muestra de 150 residentes que no eran empleados de la Supóngase que se desea obtener un intervalo que se extienda d unidades
fábrica, 16 individuos mostraron anonnalidades neurológicas. Construir un hacia uno y otro lado del estimador. Ello se enuncia:
intervalo de confianza del 95 por ciento para la diferencia entre las propor-
ciones de las poblaciones. d = (coeficiente de confiabilidad) X (error estándar) (5.7.1.)

.
1
5.7 DETERMINACIÓN DEL TAMAÑO DE LA MUESTRA
Si el muestreo va a ser con reemplazos, a partir de una población infini·
ta o de una que sea lo suficientemente grande como para ignorar la correc-
PARA LA ESTIMACIÓN DE MEDIAS _ _ _ _ _ _ __ ción para población finita, la ecuación 5.7. l se transforma en:
(I
La pregunta de qué tan grande debe ser una muestra surge inmediatamente d = z \In (5.7 .2)
al inicio del planteamiento de cualquier encuesta o experimento. Esta es una
pregunta importante y no se debe tratar a la ligera. Tomar una muestra más
grande de Io necesario para obtener los resultados deseados es un desperdi- la cual, cuando se resuelve paran, da.
cio de recursos, mientras que, por otro lado, las muestras demasiado pe- '} •>
z-cr-
queñas con frecuencia dan resultados que carecen de uso práctico. En esta n = d'l (5.7.3)
sección se estudia cómo determinar el tamaño de la muestra de acuerdo con
la situación. A continuación se proporciona un método para determinar el
Cuando el muestreo se hace sin reemplazos a partir de una población finita
tamaño de la muestra que se requiere para estimar la media de la población
y pequeña, se requiere de la corrección para población finita y la ecuación
y en la siguiente sección se aplica este método para determinar el tamaño de
5.7.l queda de la siguiente forma:
la muestra cuando se desea estimar la proporción de una población. Me-
diante extensiones directas de estos métodos, es posible determinar el tama-
ño necesario de las muestras para situaciones más complicadas.
rr,~,
El objetivo de la estimación por intervalos es el de obtener intervalos
d- ZVnV~ (5.7.4)
estrechos con alta confiabilidad. Si se observan los componentes de un
que al resolverse paran, resulta:
intervalo de confianza, se ve que su dimensión está deterrninada por la mag-
nitud de la cantidad. i\'z2 o'l
n = J1(;\' - 1) + z"'cr~ (5.7.5)
(coeficiente de confiabilidad) X (error estándar)
En caso de que se pueda ignorar la corrección para población finita, la
ya que la magnitud total del intervalo es el doble de esta cantidad. Para un ecuación 5.7 .5 se reduce a la ecuación 5.7 .3.
determinado error estándar, el aumento de confiabilidad implica un coefi- Las fórmulas para el tamaño de la muestra requieren del conocimiento
ciente de confiabilidad mayor. Sin embargo, un coeficiente de confiabili- de cr2 pero, corno ya se ha señalado, la variancia de la población casi siem·
dad mayor, para un error estándar fijo, produce un intervalo de mayor di- 2
pre se desconoce. Como resultado, es necesario estimar a . Las fuentes de
mensión. 2
estimación de a que se utilizan con más frecuencia son las siguientes:
Por otra parte, si se fija el coeficiente de confiabilidad, la única forma
de reducir la dimensión del intervalo es la reducción del error estándar. l. Se extrae una muestra piloto o preliminar de la población y se utiliza la varian-
2
Dado _que el error estándar es igual a cr I ,/;; y como cr es una constante, la cia calculada a partir de esta muestra como una estimación de cr • Las observa-
única forma de obtener ~_n__ error_ es_t~~Q_ar _1!1!:_i:!_qf~s_torna[__JJ1_1Jl_m_u_es_tra -ciones utilizadas en la muestra piloto se- toman como---parte de-la-muestra final.
grande. ¿ Qué tan grande debe ser la muestra? Esto depende del tamaño de de modo que 11 (el tamaño calculado de la muestra)-11 1 (el tamaño de la muestra
cr, que es la desviación estándar de la población, así corno del grado de con- piloto) = 11 1 (el número de observaciones necesarias para satisfacer el requeri-
fiabilidad y dimensión del intervalo deseados. miento total del tamaño de la muestra).
Determiuaciú11 del ta111allo de la 11111estra para la eSti111ación de proporciones 205
204 Estimación
EJERCICIOS-----------------
2. A partir de estudios anteriores o si,nilares es posible ob1ener estimaciones de a 1.
3. Si se cree que la población de la cual se extrae la muestra posee una distribución
5.7.1 La administradora de un hospital desea estimar el peso medio de los bebés
aproximadamente normal, se puede aprovechar el hecho de que la amplitud es nacidos en su hospital. Si se desea un intervalo de confianza del 99 por cien-
aproximadamente igual a seis desviaciones estándar y calcular a "" R / 6. Este to con una amplitud de 1 libra, ¿qué tan grande debe ser la muestra de los
método requiere algún conocimiento acerca de los valores mínimo y máximo de registros de nacimiento? Supóngase que un estimador razonable para cr es 1
la variable en la población. libra. ¿De qué tamaño debe ser la muestra si el coeficiente de confiabilidad
se hace descender al .95?
Ejemplo 5.7.1 Un nutriólogo del departamento de salud, al efectuar una
encuesta entre una población de muchachas adolescentes con el fin de 5.7.2 El director de la sección de control de la rabia del departamento de salud
determinar su ingestión diaria promedio de proteínas, buscó el consejo pública, desea extraer una muestra de los registros de mordidas de perro
de un bioestadístico con respecto al tamaño de la muestra que debe reportadas durante el transcurso del año anterior para estimar la edad media
tomar. de las personas mordidas. Requiere un intervalo de confianza del 95 por
ciento, decide utilizar un valor del 2.5 parad y a partir de estudios anteriores,
¿Que procedimiento debe seguir el bioestadístico para asesorar al
estima que la desviación estándar de la población está alrededor de los 15
nutri61ogo? Antes de que el estadístico pueda ayudar el nutri6Jogo, éste
años. ¿Qué tan grande debe ser el tamaño de la muestra?
debe proporcionar tres elementos de información: la dimensión deseada del
intervalo de confianza, el nivel de confianza deseado y la magnitud de la
5.7.3 Un médico desea conocer el valor medio de glucosa en sangre en ayunas
variancia de la población. (mg/100 ml) de pacientes atendidos en una clínica para diabéticos durante el
transcurso de los últiinos IOaños. Detemünar el número de registros que el mé·
Solución Supóngase que el nutriólogo requiere un intervalo con una di- dico debe exanünar para obtener un intervalo de confianza del 90 por ciento
mensión de aproximadamente 10 unidades, es decir, la estimación se de- para µ si la dimensión requerida para el intervalo es de 6 unidades y una
bería encontrar alrededor de las 5 unidades del valor real en ambas direc- muestra piloto presenta una variancia de 60.
ciones. Supóngase que se decide por un coeficiente de confianza de .95 y
que con base en su experiencia previa percibe que la desviación estándar de 5.7.4 Se desea estimar la edad n1edia en la que a los pacientes de esclerosis múlti-
la población es probablemente de alrededor de 20 gramos. El estadístico ple se les diagnosticó el padecimiento por primera vez. Se requiere un inter-
valo de confianza del 35 por ciento con una dimensión de 10 años. Si la va-
tiene ya la información necesaria para calcular el tamaño de la muestra:
riancia de la población es de 90. ¿_qué tan grande deberá ser la muestra?
z = 1.96, cr = 20, y d = 5. Supóngase que el tamaño de la población es
grande, así que el estadístico puede ignorar la corrección para población
finita y utilizar la ecuación 5.7.3. Con las sustituciones adecuadas, el valor
den se calcula como 5.8 DETERMINACIÓN DEL TAMAÑO DE LA MUESTRA
PARA LA ESTIMACIÓN DE PROPORCIONES _ _ _ __
2 2
( 1.96) (20)
n - (5) El método para estimar el tamaño de la muestra cuando se requiere estimar
61.47 la proporción de una población es esencialmenle el mismo que se describió
para estin1ar la n1edia de una población. Se aprovecha el hecho de que la
mitad del intervalo deseado. d , se puede igualar al producto del coeficiente
Se recomendó que el nutriólogo tome una muestra de tamaño 62. Al de confiabilidad y el error estándar.
calcular el tamaño de una muestra a partir de las ecuaciones 5.7 .3 o 5.7 .5, el Si se supone que el muestreo ha sido hecho de manera aleatoria y que
resultado se redondea ai siguiente número entero mayor si los cálculos dan existen condiciones que garanticen que la distribución de Psea aproximada-
un número con decimales. n1ente norn1al, se obtiene la siguiente fórn1ula para 11 cuando el n1uestreo es
con ree111plazo, cuando se realiza a partir de una población infinita o cuando
206 Estilnación Ejercicios 207
la población muestreada es lo suficientemente grande como para hacer Solución Si es posible ignorar la corrección para población finita, se tiene
innecesario el uso de la corrección para población finita. que

z2pq ( 1.96) 2 (.35)(.55)


n = n = 349.6
7 (5.8.I) (.05)

donde q = 1 - p. Por lo tanto, el tamaño de la muestra es de 350.

Si la corrección para población infinita no puede pasarse por alto, la


fórmula paran es
EJERCICIOS~~~~~~~~~~~~~~~~~

l'v'z2pq
5.8.I Un epidemiólogo desea saber qué pr_oporción de adultos que viven en una
n = d-(N - l) + ,-pq (5.8.2) gran área metropolitana tienen el subtipo ay del virus B de la hepatitis.
Detenninar el tamaño de la muestra que pudiera ser necesario para estimar
Cuand~, N es grande en comparación con 11 (es decir, n / N::::; .05) se una proporción real cercana al .03, con una confianza del 95 por ciento. Se
puede pasar por alto la corrección para población finita y la ecuación 5.8.2 sabe que en una área metropolitana similar, la proporción de adultos con esa
se reduce a la ecuación 5.8.1. característica es de .20. Si los datos para otra área metropolitana no estuvie-
Como puede observarse, ambas fórmulas requieren que se conozca p, ran disponibles y no se pudiera obtener una muestra piloto, ¿cuál sería el ta-
maño requerido de la muestra?
que es la proporción de población que posee la característica de interés.
Obviamente, dado que éste es el parámetro que se desea estimar, será des-
5.8.2 Se planea realizar una encuesta para determinar qué proporción de los estu-
conocido. Una solución para este problema consiste en tomar una muestra diantes de secundaria de un sistema escolar metropo!itaflo han fumado regu-
piloto y calcular una estimación para utilizarla en lugar de p dentro de la larmente marihuana. Si no se cuenta con una estimación de p de estudios an-
fórmula paran. Algunas veces el investigador tendrá noción de algún límite teriores. no se puede extraer una muestra piloto, se desea un coeficiente: de
superior para p que podrá utilizar en la fórmula. Por ejemplo, si se desea confianza del .95 y se decide utilizar el valor de d = .04 y con ellos de1ermi-
estimar la proporción de alguna población que presente una cierta condi- nar el tamaño adecuado de la muestra. ¿De que tamaño deberá ser la muestra
ción, es posible que se crea que la proporción real no puede ser mayor que, para obtener un intervalo de confianza del 99 por ciento?
digamos, 30. Se sustituye entonces p por .30 en la fórmula para n. Si es
imposible obtener una mejor estimación, se puede igualar p a .5 y re.solver 5.8.3 El administrador de un hospital desea saber qué proporción de pacientes
para 11. Dado que p = .5 en la fórmula proporciona el máximo valor de 11, dados de alta están inconforn1es con los cuidados recibidos durante su hospi-
este procedimiento dará una muestra lo suficientemente grande para alcan- talización. Si d = .05, el coeficiente de confianza es de .95 y no se dispone de
ninguna otra información. ¿qui! tan grande debe ser [a muestra? ¿Qué tamaño
zar la confiabilidad y !a dimensión del intervalo deseado. Sin embargo,
debe tener si el valor de pes de aproxirnadainente .25'?
puede ser más grande de lo necesario y resultará más costosa que si se dis-
pusiera de una mejor estimación de p. Este procedimiento se debe utilizar 5.8.4 LTna agencia de planilícación de la salud des.:a saber. en una región geográfi-
únicamente si no se dispone de un;i mejor estimación de p. ca detcrnlinada, qué proporción de pacientes admitidos en hospitales para
tratamiento de traumatismos abandonaron el hospital por defunción. Se re·
Eje1nplo 5.8.J Se planea realizar una encuesta para determinar qué propor- quiere de un intervalo de confianza del 95 por ciento con una dimensión de
ción de familias en cierta área carece de servicios n1édicos. Se cree__ 9!:!.~. .J~1.__ _ .06. y a partir de otra eYidencia. se estima qu,;: la proporción de la población
- - proporción-·no pueae- se·r mayor-q1.1e----:33 .--se- de"Sea -un -ifltérva!o de confianza -Cs"d0 :20. -~.QUJ tan grande debe ser la múé-stfa? _____ -
del 95 por ciento con d = .05. ¿De qué t::imaño se debe seleccionar la mues-
tra de familias?
208 Estimación
Intervalo de confwnza para la variancia de una población 209
5.9 INTERVALO DE CONFIANZA PARA LA VARIANCIA
DE UNA POBLACIÓN CON DISTRIBUCIÓN NORMAL _ _ ¿,¡ 2+8+···+2
' E(s
2
) = ,t;. = 100 = 10
Estimación puntual de la variancia de la población En las secciones 10 10
anteriores se sugirió que, cuando se desconoce la variancia de la pobla-
ción, es posible utilizar la variancia de la muestra como un estimador. Es Tabla 5.9.1. Variancias calculadas de las muestras que
posible que el lector se pregunte respecto a la calidad de este estimador. aparecen en la tabla 4.4.1.
Se ha estudiado sólo un criterio de bondad, el de ser insesgado, de manera Segundo muestreo
que debe constatarse que la variancia de la muestra es un estimador inses- 6 8 10 12 14
gado de la variancia de la población. Para ser insesgado, el valor prome-
6
dio de la variancia de la muestra sobre todas las muestras posibles debe
8
ser igual a la variancia de la población. Esto es, debe cumplirse la expre-
2 2 Primer IO
sión E(s ) = a . Para ver si esta condición se cumple en una situación par-
muestreo 12
ticular, se considera el ejemplo de la sección 4.4 para obtener una dis- 14
tribución muestra!. En la tabla 4.4.1 se presentan todas las muestras posi-
bles de tamaño 2 a partir de la población cuyos valores son 6, 8, 10, 12 y
lo cual, tal como se puede observar, no es igual a cr2, sino a S2 = L(x¡- µ) 2 /
14. Se recordará que las dos mediciones de dispersión se calcularon como
sigue: (N - 1).

¿(x; - µ)' ¿(x; - µ)'


rr' N
8 y s' N-1
10

Si se calcula la variancia de la muestra s 2 = L(x¡ - X) 2 / (n - 1) para cada


una de las muestras posibles que aparecen en la tabla 4.4.1, se obtienen las
variancias de las muestras anotadas en" la tabla 5.9.1.
Si el muestreo es con reemplazos, el valor esperado de s2 se obtiene al
tomar la media de todas las variancias posibles de las muestras en la tabla
5.9.1. Al efectuar este procedimiento se tiene

¿,,
E(s 2
) ' 0+2+ +2+0 200
= ,V' = 25 8
25

Y, por ejemplo, se aprecia que cuando el muestreo es con reemplazos E(s 2)


=cr2, donde 52 =L(x.-X)lt(n-1) y a,,= Í:(x.-µ) 2 1 N.
Si se considera el' caso donde el muestreo
- ' es sin reemplazos, el valor x'
2 Figura 5.9.1 Distribuciones de ji-cuadrada para algunos valores de los grados de li-
esperado de 5 se obtiene al tomar la media de todas las variancias por enci-
ma (o por abajo) de la diagonal principal. Esto es bertad k. (Fuente: Paul G. Hoel y Rayn1ond J. Jessen. Basic Statisticsfor Bussiness
and Econnniics. V./ilcy, 1971. Usado con autorización.)
210 Estimación Intervalo de confUJnza para la variancia de una población 211

Estos resultados son de ejemplos de principios generales, ya que es • colas de la distribución. Puede designarse a estos dos valores de 2 como x
posible demostrar en ténninos generales que: X~ yxZ 1 _ o12J' respectivamente. El intervalo de confianza del 100(1 - a)
por ciento para (n - l)s 2 / cr2, entonces, esta dado por
E(s 2) = cr 2, cuando el muestreo se realiza con ree,nplazos
E(s 2) = S2, cuando el muestreo se realiza sin ree,nplazos 2 (n - l)s2 2
Xo.12< cr <x<i - o./ 2)

Cuando N es grande, N - 1 y N son aproximadamente iguales y, en con-


secuencia, cr2 y S2 serán aproximadamente iguales. Ahora se puede manejar esta expresión de tal forma que se obtenga una
,,
expresión con cr2 únicamente como el término central. Primero se divide
:f1 Estos resultados justifican el uso de s 2 = :Í.(x¡ -X) 2 J (n - 1), cuando se cada término entre (n - t )s 2 para obtener
calcula la variancia de la muestra. Asimismo, debe notarse que, a pesar de
2
que s es un estimador insesgado de cr2, s no es un estimador insesgado 2 2
Xo.12 < J < X11 - a12i
de a. Sin embargo, el sesgo disminuye rápidamente a medida que aumenta (n-l)s ' ~
u (n-l)s 2

n. Los lectores interesados en profundizar en este punto pueden consultar


los artículos escritos por Cureton 18 y Gurland y Tripathi. 19
Si se toma el recíproco de esta expresión se tiene

Estimación por intervalos de la variancia de una población Con una (n - l)s 2 (n - l)s 2
2
estimación puntual disponible resulta lógico preguntarse acerca de la cons- ~~~->cr>2
Xo.12 X( 1 - at2¡
trucción de un intervalo de confianza para la variancia de una población. El
éxito al construir un intervalo de confianza para cr2 depende de la capacidad
para encontrar una apropiada distribución muestra!. Es importante notar que el sentido de las desigualdades cambió cuando se
En general, los intervalos de confianza para cr2 se basa en la distribu- tomó el recíproco. Si se invierte el orden de los ténninos se tiene
ción muestra! de (n - l )s2 / cr2 . Si se extraen muestras de tamaño n de una
(n - l)s 2 ,, (u - l)s 2
población con distribución normal, esta cantidad tiene una distribución 2 <cr-< 2
X( l - a/2) Xa/2 (5.9.1)
conocida como distribución ji-cuadrada con n- 1 grados de libertad. En el
capítulo siguiente se hablará más acerca de esta distribución; aquí sólo se
dirá que es la distribución que sigue la cantidad (n - 1)s2 / cr2 y que resulta que es el intervalo de confianza del 100(1 - a) por ciento para cr2. Si se
útil para calcular los intervalos de confianza para cr2 cua.ndo se cumple el toma la raíz cuadrada de cada término de la expresión 5.9.1, se obtiene el
supuesto de que la población sigue una distribución normal. siguiente intervalo de confianza del 100(1 - a) por ciento para cr, que es la
En la figura 5.9.l se muestran algunas distribuciofles ji'-cuadrada para desviación estándar de la población:
diferentes grados de libertad. En la tabla F se encuentran los percentiles de
x
la distribución ji-cuadrada, designados por la letra griega 2. Los ·encabeza-
V (n - !Js 2
2 <a<
v(n -., !),'
x
dos de las columnas dan los valores de 2• a la izquierda de los cuales está X11 - 0.12¡ X~ni (5.9.2)
x
una proporción del área total bajo la curva igual al subíndice de 2. Las
denominaciones de los renglones son los grados de libertad. Ejemplo 5.9.1 Con base en el ejemplo 5.6.1, suponer que la población de
Para obtener un intervalo de confianza del 100( 1 - a) por ciento para cr 2 las concentraciones de amilasa en suero, a partir de la cual se extrajo una
se obtiene primero el intervalo de confianza de 100( 1 - a) _por ciento__pjlra muestra de tamaño 15, tiene una distribución normal. Construir el intervalo
- -- --- -- -- (n - I)S 2 I cr 2. Para efectuar este procedimiento se seleccidnan los valores de de confianza del 95 pórCíérito-para cr2.
x 2
de la tabla F, de tal modo que a/ 2 quede a la izquierda del valor menor
y a I 2 a la derecha del valor mayor. En otras palabras, los dos valores de 2 x Solución la muestra proporciona un valor de s 2 = 1225. Los grados de li-
se seleccionan de modo que se divide a a en partes iguales entre las dos bertad son n - 1 = 14. Los valores adecuados para 2 a partir de la tabla F x
Intervalo de confianza para la razón de la.s variancias de dos pobla.ciones 213
212 EstimacWn
5.9.3 Se calculó la capacidad vital forzada de 20 varones adultos sanos. La varian-
son x~1 _ a/ 2);;: 26.119 y x;n = 5.629. El intervalo de confianza del 95 por cia de la muestra fue de 1000000. Construir los intervalos de confianza del
ciento para cr2 es 90 por ciento para cr 2 y a.

5.9.4 En un estudio de los tiempos de circulación sanguínea en el miocardio, se


(14)(1225) , < 14(1225) obtuvieron los tiempos de circulación aparente en una muestra de 30 pa-
9 6. 1 b"
• < cr 5.6·29 cientes con enfermedad de la arteria coronaria. Se encontró que la variancia
de la muestra fue de 1.03. Construir los intervalos de confianza del 99 por
656.6 l Ol < ª:! < 3046. 722$
ciento para a 2 y a.

El intervalo de confianza del 95 por ciento para a es 5.9.5 Una muestra de 25 hombres física y mentalmente sanos participó en un
experimento acerca del sueño en el cual se fegistró el porcentaje del tiempo
25.62 < cr < 55.20 total transcurrido durante cierta etapa del sueño de cada uno de los partici-
pantes. La variancia calculada a partir de los datos de la muestra fue de 2.25.
Se dice que se tiene un 95 por ciento de confianza de que los paráme- Construir los intervalos de confianza del 95 por cien10 para a 2 y a.
tros estimados se encuentren dentro de los límites especificados, ya que se
sabe que, a la larga, al muestrear varias veces, el 95 por ciento de los inter- 5.9.6 Se midieron las concentraciones de hemoglobina en 16 animales expuestos a
un compuesto químico nocivo. Se registraron los siguientes valores: 15.6,
valos construidos como se ilustró incluirían los parámetros respectivos.
14.8. 14.4. 16.6, 13.8, 14.0. 17.3, 17.4. 18.6. 16.2. 14.7. 15.7. 16.4. 13.9,
14.8, 17.5. Construir los intervalos de confianza para a 2 y a.
Aunque este método para obtener los intervalos 4e confianza para cr 2 se
utiliza ampliamente, no carece de inconvenientes. Primero, la suposición de 5.9.7 Veinte muestras de la calidad del aire, tomadas en una misma región durante
nonnalidad para: la población de la cual se extrae la muestra es muy impor- un período de 6 meses, presentaron las siguientes cantidades de partículas de
tante y los resultados pueden ser engañosos si se ignora dicho supuesto. materia (microgramos por metro cúbico de aire).
Otra dificultad con estos intervalos resulta del hecho de que el esti-
mador no está en el centro del intervalo de confianza, como en el caso del 68 22 36 32
intervalo de confianza para µ. Esto se debe a que la distribución de ji- 42 24 28 38
cuadrada, a diferencia de la normal, no es simétrica. La consecuencia prácti- 30 44 28 27
28 43 45 50
ca de ello es que el método descrito 'para la obtención de los intervalos de
79 74 57 21
confianza para a 2 no produce los intervalos de confianza más cortos po-
sibles. Tate y Kleu 20 proporcionan tablas utilizables para vencer esta difi- Considerar que estas mediciones proceden de una muestra aleatoria toma-
cultad. da a partir de una población que sigue una distribución nonnal, para cons-
truir los intervalos de confianza del 95 por ciento para la variancia de la
población.
EJERCICIOS _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ __

5.9.1 A cada uno de los miembros de una muestra de 51 estudiantes de enfermería


5.10 INTERVALO DE CONFIANZA PARA LA RAZÓN
se les hizo una prueba estandarizada para medir su nivel de responsabilidad. DE LAS VARIANCIAS DE DOS POBLACIONES
Se obtuvo un valor de s2 = 12. Construir el intervalo de confianza del 95 por
CON DISTRIBUCIÓN NORMAL _ _ _ _ _ _ _ __
ciento para cr 2 y cr.
Con frecuencia se tiene interés en comparar dos variancias, y una manera de
5.9.2 El recuento de glóbulos blancos de una muestra de l O hombres adultos con hacerlo es obtener su razón, o1
I a{. Si las dos variancias son iguales, su
algún tipo de leucemia produjo una varfancia de 25000000. Cons1ruir los razón sería igual a 1. Por lo general, las variancias de las poblaciones de
intervalos de confianza del 95 por ciento para cr 2 y cr.
1,
I'
'
Intervalo de confmnza para la razón de fas variancias de dos poblaciones 215
Esh°macjón
214
recha de los cuales, respectivamente, está a I 2 del área bajo la curva. El
interés son desconocidas y, en consecuencia, toda comparación que se tenga término central se puede volver a escribir para esta expresión, de modo que
que hacer deberá basarse en las variancias de las muestras. Para ser especí-
la expresión completa es
ficos, es posible que se desea estimar la razón de las variancias de dos po-
blaciones. Una vez más, dado que esta es una forma de inferencia, se debe ., .,
. .\"] ()'~ .
confiar en alguna distribución muestra!, en este caso (s1 / crf) I (si I crj), f-«12<--:2"·:!<f(l -0.12)
0'1
siempre que se satisfagan ciertos supuestos. Dichos supuestos son que 5i y
.\:.!

s~ sean calculados a partir de muestras independientes de tamaño n I y n2,


respectivamente, y que dichas muestras sean extraídas de poblaciones dis- Si se divide todo entre ?i I ~. se tiene que
tribuidas normalmente.
• " f"
Si los supuestos son satisfechos, (sf I cr1) I (s1 / cr~) sigue una distribu- -,-,--,, < crt
fo./'!
--., < (!
,,- ul'.!\
,,
ción conocida como distribución F. En un capítulo posterior se estudia este s¡ls~ cr¡ sJ/.1~
tema con mayor detalle, pero hay que notar que esta distribución depende
de dos valores de- grados de libertad, uno que corresponde al valor n 1 - 1 Tomando los recíprocos de los tres ténninos, se obtiene
utilizado para calcular sf y el otro al valor n2 - 1 utilizado para calcular s~. ? •• ,, ., .,

Comúnmente se conocen corr,o grados de libertad del numerador y grados .0/s~ cr¡ s¡/~~
-.--> -,,> -_---
de libertad del denominador. La figura 5.10.l muestra algunas distribu- fc,12 a~ f,1 - o./2¡

ciones F para diferentes combinaciones de los grados de libertad del nume-


rador y del denominador. La tabla G contiene, para combinaciones específi- y si se invierte el orden, se obtiene el siguiente intervalo de confianza del
cas de grados de libertad y valores de a, los valores de Fa la derecha de los 100(1 - a) por ciento para crT I cr~:
cuales se tiene a/ 2 del área bajo la curva de F.
Para encontrar el intervalo de confianza del 100(1 - a) por ciento para 5 5
2¡ 2
J___L._ < cr2
---,! < 5_12¡
__
52
2
crT I a~, se comienza con la expresión f(l - o.! 2 ) cr2 Fa.12
(5.10,l)

52 ¡ (J":.! Ejemplo 5.10.1 Un grupo de investigadores seleccionan una muestra aleatoria


Fo.12-< ~ /~ < F(i - o.t2i simple de tamaño 21 a partir de una población de adultos aparentemente sanos
s'.! ª:.1
(muestra 1), así corno una muestra aleatoria simple independiente de tamaño
16 de una población de pacientes con el mal de Parkinson (muestra 2). La
donde F aJ2 y F(I _ r,Jl) son los valores de la tabla Fa la izquierda y la de-
variable de interés fue el tiempo de reacción a un estímulo en particular. La va-
LO riancia para la muestra l fue de 1600 y para la muestra 2 fue de 12225. Se
0,8
desea formar al intervalo de confianza del 95 por ciento para I 01 ai.
{(Fi
0,6 Solución Se tiene la siguiente información
OA n 1 = 21, n 2 = 16

02
2
S¡ = 1600, sª = 1225

o.o 'rl
O
1
0.5
1
1.0
1
1.5
~
2.0
.L
2.5 3.0
::±:::::s
3.5 4.0
grados de libertad del numerador= 20
F grados de libertad del denominador= 15
_Eigura-5.10.1 Distribución F para varios grados de libertad (de Docu111enta·Geigy, a.= .05
Scientific Tables, séptima edición, 1970. Cortesía de Ciba-Geigy Limited, Basilea, F = 389 F_ 975 = 2.76
025
Suiza).
216 Estimación Ejercicios 217
En este punto es necesario hacer una laboriosa pero inevitable digresión Otros procedimientos para hacer inferencias acerca de la igualad de dos
y explicar cómo se obtuvieron los valores F. 915 :::: 2.76 y F.rn. :::: .389. El variancias cuando las poblaciones muestreadas no tienen una distnbución
5
valor F. 915 en la _intersección de la columna encabezada por el número 20 y normal se pueden encontrar en el libro de Daniet.21
el renglón marcado por el número 15 es 2. 76. Si se tuviera una tabla más
amplia de la distribución F. no habría problema para encontrar a F_ ; sim-
025
plemente se localizaría a F. 025 tal como se localizó a F_ • Se tomaría el EJERCICIOS_~-~~-~~-~~~~-~~~
975
valor encontrado en la intersección de la columna encabezada por el nú-
mero 20 y el renglón 15. Para concluir todo percentil posible de F, se ten- 5.10.1 Se registraron las concentraciones de oxitocina (picogramos por mililitros)
dría que hacer una tabla 1nuy larga. Sin embargo, afortunadamente existe en líquido amniótico de dos muestras de mujeres. La primera muestra
una relación que permite calcular valores menores de los percentiles a partir incluyó 25 mujeres parturientas con contracciones de parto. La segunda
de la tabla que se presenta en esta obra. La relación es como sigue: muestra incluyó 16 mujeres sin contracciones de parto. Las variancias de
cada muestra fueron de si= 40000 y s} = 10000, respectivamente. Cons-
truir el intervalo de confianza del 95 por ciento para la razón de las varian-
1
F - o.,df1,df2 - Fa,df .df1 cias de las dos poblaciones.
2 (5.10.2)
5,10.2 Se midieron las concentraciones de nicotina en muestras de orina de dos
donde d/1 representa los grados de libertad del numerador y d/ representa
2 grupos de hombres adultos. El grupo 1 estuvo formado con 25 fumadores
los grados de libertad del denominador. Se procede como sigue.
aparentemente sanos y el grupo 2 estuvo formado por 31 fumadores con
Se intercambian los grados de libertad del numerador y-del denomina- cáncer en la vejiga. Las variancias de las muestras fueron s1
= 1.00 y s~ =
dor y se localiza el valor adecuado de F. Para el ejemplo, se localiza 2.57, 3.5. Construir el intervalo de confianza del 90 por ciento para cr~ / o1.
que e.c;tá en la intersección de la columna encabezada por el número 15 y el
renglón 20. Se to,na el recíproco de ese valor, 1 / 2.57 = .389. En resumen, 5.10.3 Se anaEzaron estadísticamente los índices de ataques cardiacos de dos
el límite inferior de confianza (LIC) y el límite superior de confianza (LSC) muestras de pacientes que padecían infarto al miocardio. Las variancias de
para cr21 ¡ cr2,
' son como sigue:
. las muestras fueron de 12 y 10. Hubo 21 pacientes en cada muestra. Cons-
truir el intervalo de confianza del 95 por ciento para la razón de las varian-
l1 e ': . .§.L. , ,=--1- - c
5t- Fr,-31 d¡. die uc - sf
' ¡¡} I ·'
l cias de las dos poblaciones.
s~ F iJ,r: df1, d/2 (5.10.3)
. 11-01 5.10.4 Treinta y dos adultos afásicos sometidos a terapia del habla fueron divididos
,. en dos grupos iguales. El grupo 1 recibió el tratamiento 1 y el grupo 2
si 1 recibió el tratamiento 2. El análisis estadístico de los resultados de la efec-
LSC - 2
,,
I /F1 tividad de !Os tratamientos dio las siguientes variancias: s~ = 8, sl
= 15.
- a/ 2, Jf.//, Jr;,, (5.10.4)
:',·::;cl-:-i Construir el intefVa\o de confianza del 90 por ciento para a] I a1.
Ahora se puede obtener el intervalo de confianza del 95 por ciento para
crf I cri al sustituir los valores adecuados en la expresión 5.10.1: 5.10.5 Se calcularon las variancias de las muestras para los volúmenes de flujo
(ml) de dos grupos de pacientes que sufren ·de una alteración en el tabi-
que interauricular. Los resultados y tamaños de las muestras fueron los si-
1600 / 1225 CT¡ ]600 /]225
<::,< guientes:
2. 76 "' .389
n 1 =31,sf=35000
.4 73 < "' < 3:36
::i
"' n =41, si= 20000
2

A este intervalo se le dan las interpretaciones probabilística y práctica ade- Construir el intervalo de confianza del 95 por ciento para la razón de las dos
cuadas.
variancias.
I'
,:·.

218 Estimación
Preguntas y ejercicios de repaso 219
5.10.6 Se registraron las respuestas de las concentraciones de glucosa frente a la
8. ¿Qué uso tiene el teorema del límite central en la estimación?
administración de glucosa oral en 11 pacientes con la enfennedad de Hu-
9. Describa la distribución t.
tington (grupo l) y en 13 individuos de control (grupo 2). El análisis
10. ¿Cuáles son las suposiciones que fundamentan el uso de la distribución t para
estadístico de los resuhados proporcionó las siguientes variancias de las
estimar la media de una sola población?
muestras: sf = 105 y s? = 148. Construir el intervalo de confianza del 95 por
11. ¿Qué es la corrección de población finita? ¿Cuándo se puede pasar por alto?
ciento para la razón de las dos variancias.
12. ¿Cuáles son las suposiciones que fundamentan el uso de la distribución t para
estimar la diferencia entre las medias de dos poblaciones?
5.10.7 Las mediciones en la secreción gástrica de ácido clorhídrico (miliequi-
13. El análisis de los gases de la sangre arterial practicado a 15 hombres adultos
valentes por hora) en 16 individuos nonnales y en 10 individuos con úlcera
duodenal proporcionaron los siguientes resultados: físicamente activos proporcionó los siguientes valores de Pa0 2 en reposo:

Individuos normales: 6.3, 2.0, 2.3, 0.5, I.9, 3.2, 4.1, 4.0, 6.2, 6. l, 75,80,80, 74,84, 78,89, 72,83, 76, 75,87, 78, 79,88
3.5, l.3, 1.7, 4.5, 6.3, 6.2
Calcular el "intervalo de confianza del 95 por ciento para la media de la po-
Individuos con úlcera: 13.7, 20.6, 15.9, 28.4, 29.4, 18.4, 21.l, 3.0,
blación.
26.2, 13.0
14. ¿Qué proporción de pacientes asmáticos son alérgicos al polvo? En una mues-
tra de 140 individuos, el 35 por ciento tuvo reacciones positivas en la piel ante
Construir un intervalo de confianza del 95 por ciento para la razón de las
la presencia de polvo. Construir un intervalo de confianza del 95 por ciento
variancias de las dos poblaciones. ¿Qué suposiciones se deben tomar en
para la proporción de la población.
cuenta para que este procedimiento sea válido?
15. Se llevó a cabo una encuesta de higiene industrial en una área metropolitana de
1 gran tamaño. De 70 plantas manufactureras visitadas, 21 recibieron una califi-

i ,,
5.11 RESUMEN----------------
cación pobre en lo.que se refiere a la ausencia de medidas de seguridad. Cons-
truir un interval-e de confianza del 95 por ciento para la proporción de la pobla-
·;: ción con una calificación pobre.
1 En este capítulo se estudia una de las principales áreas de la inferencia 16. Con base en el problema anterior; ¿qué tan grande debe ser la muestra para
1. estadística: la estimación. Se estudian tanto las estimaciones puntuales estimar la proporción de población dentro de .05 con un intervalo de confianza

como las de intervalos. Se ilustran los conceptos y métodos relacionados die! 95 por ciento (.30 es la mejor estimación disponible de p ):
;j: a) Si es posible pasar por alto la corrección de población finita?
con la construcción de los intervalos de confianza de los siguientes pará-
metros: medias, la diferencia de dos medias, proporciones, la diferencia en- b) Si no se pasa por alto la corrección de población finita y N = 1500?'
tre dos proporciones, variancias y la razón de dos variancias.
17. En una encuesta dental, llevada a cabo por un grupo de salud, se solicitó a 500
adultos que dijeran el por qué de su última visita al dentista. De los 220 que

tenían una educación inferior a la secundaria, 44 señalaron que lo habían hecho
PREGUNTAS Y EJERCICIOS DE REPASO _ _ _ _ _ _ __ por razones pr.eventivas. De los restantes 280, quienes tenían educación secun-
daria o un nivel superior, 150 señalaron que lo habían hecho por la misma
1. ¿Qué es la inferencia estadística? razón. Construir un intervalo de confianza del 95 por ciento para la diferencia
2. ¿Por qué es la estimación un tipo importante de inferencia? entre las dos proporciones de las poblaciones.
3. ¿Qué es la estimación puntual? 18. Un grupo de investigadores de cáncer de mama reunió los siguientes datos en
4. Explicar el significado del ténnino "insesgado". cuanto al tamaño de los tumores:
5. Definir los siguientes conceptos.
a) Coeficiente de confiabilidad. b) Coeficiente de confianza.
Tipo de
e) Error estándar. d) Estimador.
run1or "
,
____ 6. __ Escribir la .fónnula.general. para un intervalo..de confianza. - - -1--- - --
7. Enunciar las interpretaciones probabilísticas y prácticas de un intervalo de con- A 21 3.85 cm 1.95 cm
fianza. B 16 2.80 cm 1.70 cm
220 Estimación 221
Preguntas y ejercicios de repaso
Construir un intervalo de confianza del 95 por ciento para la diferencia entre mismo problema recibió el medicamento B. El número de horas de sueño
las medias de las poblaciones. experimentadas durante la segunda noche después de iniciado el tratamiento
fueron los siguientes:
19. Se encontró que clerto medicamento es efectivo para el tratamiento de las
enfermedades pulmonares en 180 de los 200 casos tratados. Construir un inter-
A: 3.5, 5.7, 3.4, 6.9, 17.8, 3.8, 3.0, 6.4, 6.8, 3.6, 6.9, 5.7
valo de confianza del 90 por ciento para la proporción de las poblaciones.
20. Setenta pacientes con úlceras con estancamiento en la pierna fueron divididos B: 4.5, 11.7, 10.8, 4.5, 6.3, 3.8, 6.2, 6.6, 7.1, 6.4, 4.5,
en dos grupos iguales. Cada grupo recibió un tratamiento distinto para el ede- 5.1, 3.2, 4.7, 4.5, 3.0
ma. Al finalizar el experimento, la efectividad del tratamiento fue evaluada en
términos de reducción del volumen de la pierna, detenninado por el desplaza-
miento de agua. Las medias y desviaciones estándar de ambos grupos aparecen Construir un intervalo de confianza del 95 por ciento para la diferencia entre
en la siguiente tabla: las medias de las poblaciones. Suponer que las variancias de ambas pobla- ,,:1
ciones son iguales. 1'
Grupo (tratamiento) X
24. Los niveles altos de colesterol en suero han sido por largo tiempo asociados
con el incremento del riesgo a enfermedades cardiovasculares. Se han efectua-
A 95 ce 25 do numerosos estudios en un esfuerzo por lograr una mayor comprensión de la 1
B 125 ce 30
naturaleza de esta asociación. Las siguientes concentraciones de colesterol
(col.) en suero fueron recolectadas de una población de individuos aparente-
Construir un intervalo de confianza del 95 por ciento para la diferencia entre mente sanos. Seleccionar una muestra aleatoria simple de tamaño 15 de esta 1:
las medias de las poblaciones. población y construir un intervalo de confianza del 95o/o para la media de la 1
21. ¿Cuál es el nivel promedio de bilirrubina en el suero de los pacientes interna- población. Después comparar los resultados con los obtenidos por los otros con-
dos en un hospital para el tratamiento de la hepatitis? Una muestra de JO discípulos. ¿Qué suposiciones son necesarias para que el procedimiento de esti-
pacientes arrojó los siguientes resultados:
mación sea válido?
20.5, 14.8, 21.3, 12.7, 15.2, 26.6, 23.4, 22.9, 15.7, 19.2
Individuo Colesr. l11di1·h/110 Cofest. IJ1divid110 Colest. Individuo Colest.
Construir un intervalo de confianza del 95 por ciento para la media de la po- :1. ZJÓ 4. ¡~9
l. 231 2. 219
blación. ·292 8. 227
159" 6. 185 7.
22. Se midieron las concentraciones de PH de la saliva en dos muestras aleatorias 5. 12. 180
JO. 239 11. 196
independientes de niños de escuela primaria. Los niños de la muestra A no 9. 20:, 197
2'.{9 15. 186 16.
l'.t 304 14.
tenían caries, mientras que los niños de la muestra B tenían una alta incidencia 19. 226 20. 228
17. 2-18 18. 152
de caries. Los resultados fueron los siguientes: 23. 221 24. 189
21. 238 22. 209
27. 216 28. 233
25. 209 26. 169
A: 7.14, 7.J l, 7.61, 7.98, 7.21, 7.16, 7.89 3 l. 181 32. 195
29. 19:{ 30. 159 _,_
9-9
7.24, 7.86, 7.47, 7.82, 7.37, 7.66, 7.62, 7.65 35. 227 '.{6.
33.
__ :i
99- '.{4. 225
39. 220 -10. 177
B: 7.36, 7.04, 7.19, 7.41, 7.10, 7.15, 7.36, 37. 2.J-4 38. 217
43. 218 44. 166
7.57, 7.64, 7.00, 7.25, 7.19 4 l. 190 -12. 220
47. 180 4H. 2.J-9
-15. 192 46. 219
51. 229 -9
O-· 250
49. 209 :iO. 217
Construir un intervalo de confianza del 90 por ciento para la diferencia entre 206 S6. 2:"i8
5.J-. 226 :"15.
las medias de las poblaciones. Supóngase que las variancias de las poblaciones 53. 161 218
228 59. 282 60.
son iguales. 57. 20ti 58.
62. 206 G3. 244 64. 249
23. Se recetó el medicamento A a una muestra aleatoria de 12 pacientes quepa- 6 l. 224
2-1:, 67. 212 68. 251
decían insomnio. Una muestra aleatoria independiente de 16 pacientes con el fi:",. 2i6 66.
207 7 I. 177 72. 200
69. 196 iO.
(Co111i111ía en la págint: siguiente)
(Continúa)
(Co11ti11tia)
Individuo Coles!. !11dii·id110 ColeSt. Individuo Colest. Individuo Colest.
Individuo Coles!. Individuo Cole~·t. Individuo Colest. Individuo Colest.
73. 189 74. 218 75. 257 76. 144
199 78. 242 79. 221 80. 271 239 250. 221 251. 257 252. ::::36
77. 249.
81. 203 82. 216 83. 236 84. 226 201 254. 183 255. 222 256. 269
253.
85. 191 86. 216 87. 214 88. 204 258. 195 259. 208 260. 262
156 257.
89. 180 90. 180 9 I. 198 208 262. 183 263. 170 264. 186
92. 237 26 l.
93. 215 94. 252 95. 214 96. 197 266. 221 267. 202 268. 19i
200 265.
97. 172 98. 234 99. 218 100. 231 205 270. 2-19 271. 221 272. i43
269.
10 l. 193 102. 252 103. 200 104. 231 196 274. 241 275. 236 2i6. 223
273.
105. 208 106. 189 107. 223 108. 202 277. 212 278. 197 2i9. 248 280. 159
109. 209 110. 221 11 l. 186 112. 241 28 \. 218 282. 216 283. 186 284. 254
113. 244 114. 226 115. 265 116. 150 285. 196 286. 253 287. 259 288. in
117. 187 118. 188 119. 180 120. 177 289. 169 290. 200 291. 218 292. 222
121. 262 122. 212 123. 197 · 124. 259 29:t 179 294. 206 295. 208 296. 220
125. 177 126. 214 127. 250 128. 275 297. 210 298. 207 299. 226 300. 195
129. 240 130. 193 131. 228 132. 201 30 l. 204 302. 237 303. 160 304. 265
133. 237 134. 222 135. 169 136. 189 305. 212 306. 220 307. 171 308. 233
137. 220 138. 187 139. 248 140. 243 309 191 310. 256 311. 238 312. 154
14 l. 284 142. 260 143. 220 144. 179 3l'.l. 2'.19 314. 243 3[5. 175 316. 221
145. 171 146. 217 147. 286 148. 267 317. 25! 318. 280 319. 208 320. 167
149. 322. 203 32'.t 239 324. ·254
281 150. 201 15 l. 217 152. 229 160
153. 259 154. 223 155. 292 156. 218
321.
325. 211 326. 205 327. _,,
9-· 328. 264
157. 257 158. 249 159. 263 160. 241 329. 188 '.)30. 216 '.131. 221 332. 27?.
161. 193 162. 208 163. 295 2:16 3'.1--l. 206 335. 160 '.~36. 218
164. 250 :~33.
165. 262 166. 268 167. 215 168. 248 248 338. 268 339. 224 340. 22-1
3:r1.
234 343. 156 34-1. 26fi
169. 179 170. 265 171. 244 l 72. 196 '.l-11. 189 342.
173. 207 174. 220 175. 196 176. 249 174 346. 202 347. 2:~o 348. 2Gl
3--15.
177. 237 178. 250 179. 199 180. 222 l'.18 350. 20t '.151. 262 352. 2-16
349.
181. 174 182. 240 183. 218 18-1. '.{53. 192 354. 223 355. 162 356. 2-1!
199
185. 207 186. 248 187. 358. 259 359. 207 360. 215
180 188. 258 :l57. 2-19
189. 248 190. 362. 199 363 268 36-1. 206
224 191. 221 192. 270 '.16 l. 212
193. 221 194. 201 195. 231 196. 192 :~65. 184 '.166. 268 367. 21:1 368. 168
197. 370. 153 371. 220 372. 20:~
193 198. 219 199. 238 200. 208 :169. 155
20 l. 213 202. 37--l. 253 375. 283 376. 199
150 203 248 204. 202 373. 261
99- 3i9. 229 :~80 ?.12
205. 199 206. 195 207. 244 208. 227 '.177. 22--1 378. --' 2:10 38-1. 106
209. 227 210. 154 211. 176 212. 184 :~81. [87 '.)82. l8'.~ 383
213. 2 [5. 386. 23-1 :~87 193 388. 2-18
204 214. 178 200 216. 228 '.11'\5. 2.'.>--l
217. 209 2 !8. 2:~ 1 390. 223 391. 220 392. 265
166 219. 21 l 220. 245 '.~B9.
221. '.19--l. 269 395. 211 396. ¡ i-1
245 222. 22-1 223. 242 22-1. 227 :19:1. 175
225. 192 226. 206 227. 234 228. 221 2'.19 39ti. 191 399 219 --100. 198
'.197.
229. --102. 225 -103. 204 --104. 2::,1
216 230. 242 23 l. 201 232. 224 --101. 227
233. 154 234. 208 235. 172 236. 227 261 --106. 26:1 407. 195 408. 234
- ___ ,,_____ 212-~8. 3q__s-'-- -- - ---- --- --25¡-------~r2.- ---255
237. 244 239 219 240. 2-19 -109. 1,_
-q 41 o. 215 411. -
2-l i. 222 242. 229 243. 247 24-L 23ó 199 41--l. 222 -115. 224 410 235
--113.
245. 259 246. 224 247. 186 2-1H. 281 19:) 418. 221 --119. 28~1 420. 21-l
--117.
(Continúa) (Co11ti11úa)

222 223
(Continúa) (ContinlÍa)
lndi~·iduo Colest. l11d1\·id110 Coles!. Individuo Coles!. lndh·iduo Colesr.
Individuo Coles!. Individuo Coles!. Individuo Coles!. Individuo Colest.
421. 229 422. 240 423. 593. 201 594. 194 595. 200 596. 223
239 424. 229
425. 241 426. 191 427. 597. 219 598. 215 599. 200 600. 208
181 428. 245
429. 181 430. 185 431. 601. 2GO G02. 259 60'.l. 223 604. 262
220 432. 188
433. 161 434. 247 435. 605. 220 606. 229 607. 155 608. 198
232 436. 203
437. 232 438. 188 439. 609. l 8fi 610. 199 611. 201 612. 238
222 440. 191
441. 208 442. 211 443. 613. 163 614. 210 615. 234 616. 174
177 444. 171
445. 248 446. 206 447. 617. 262 618. 226 619. 263 620. 202
230 448. 218
449. 192 450. 205 62 l. 220 622. 165 623. 233 624. 222
451. 183 452. 243
453. 206 454. 222 625. 182 626. 201 627. 223 628. 202
455. 191 456. 219
457. 202 458. 171 629. 263 630. 2!0 631. 198 632. 180
459. 194 460. 237
461. 240 462. 178 633. 173 634. HJO 635. 177 636. 240
463. 242 464. 201
465. 231 466. 637. 212 638. 259 639. 197 640. 191
182 467. 246 468. 272
469. 212 470. 209 641. 212 642. 206 643. 221 644. 254
471. 235 472. 187
473. 230 474. 645. 229 646. 197 647. 220 648. 223
157 475. 221 476. 266
477. 200 478. 199 649. 230 650. 202 651. 231 652. 253
479. 240 480. 224
481. 222 482. 653. 209 654. 188 655. 222 656. 246
200 483. 187 484. 278
485. 230 486. 657. 263 65H. 241 659. 200 660. 257
165 487. 243 488. 212
489. 289 490. 661. 239 662. 177 663. 225 664. 281
195 491. 241 492. 196
493. 243 665. 218 fi6G. 194 667. 279 668. 270
494. 217 495. 256 496. 223
497. 233 498. 669. 225 670. 200 671. 183 672. 228
142 499. 245 500. 229
50 l. 228 673. 156 674. 212 675. 258 676. 272
502. 209 503. 172 504. 243
505. 189 506. 677. 231 678. 20'.~ 679. 253 680. 209
239 507. 187 508. 170
509. _,,
9--
510. 183 511. 260 512. 240 681. 216 682. 192 683. 234 684. 230
513. 247 514. 685. 179 686. 225 687. 276 688. 153
194 515. 175 516. 192
517. 234 689. 21)~! 690. 194 691. 265 692. 235
518. 212 519. 246 520. 185
52 l. 161 693. 203 (i94. 2'.~2 695. 221 696. 168
522. 192 523. 236 524. 232
525. 249 697. 212 íi98. 229 699. 234 700. 182
526. 202 527. 213 528. 239
529. 221 70 l. 188 702. 2'.')8 7113. 218 704. 194
530. 248 531. 281 532. 228
533. 184 705. 194 706. 205 707. 207 708. 202
534. 280 535. 264 536. 263
537. 232 709. __ ¡_
?:'•) 710. 173 711. 205 712. 235
538. 230 539. 205 540. 259
541. 211 542. 713. :117 714. 265 715. 232 716. 255
229 543. 277 544. 188
545. 202 546. 717. 213 7 !8. 228 719. 271 720. 250
214 547. 238 548. 225
549. 253 721. 247 722. 2 !O 723. 262 724. 238
550. 204 55 l. 185 552. 210
553. 208 554. 725. 212 720. 221 727. 257 728. 197
241 555. 214 556. 259
557. 242 558. 729. 269 730. 234 731. 201 732. 250
161 559. 191 560. 214
561. 177 562. 219 733. 197 734. 223 735. 174 736. 261
563. 163 564. 200
565. 187 566. 189 7:17. 240 738. 265 739. 212 740. 223
567. 236 568. 162
569. 221 570. 189 74 l. 178 742. 250 743. 246 744. 230
571. 213 572. 242
573. 235 574. 745. 286 7<:6. 299 747. 177 748. 242
232 575. 231 576. 194
577. 216 578. 245 749. 263 750. 191 751. 196 752. 276
579. 235 580. 223
58 l. 203 582. 753. 169 754. 186 755. 220 756. 206
231 58:t 253 584. 215
585. 278 586. 757. 254 758. 207 759. 222 760. 222
240 587. 263 588. 244
589. 237 590. 7fi J. 246 762. 225 763. 241 764. 216
214 591. 266 592. 2.JU
(Co11ti111ía)
rC011ti11IÍ(IJ
225
224
(Co11ti11/la) Preguntas y ejercicios de repaso 227
/11divid110 Coles!. Individuo Colest.
Individuo Colesr. l11dil·id110 Colest. (Continúa)
21:3 766. l8:1 767. 241 768. 162
765. Individuo Cole.1·1. l11di1·hl110 Colest. Individuo Colest. Individuo Coles/.
770. 203 771. 200 772. 28[
769. 248
209 774. 203 775. 193 776. 244 937. 221 938. 190 9'.19. 172 940. 211
773.
184 778. 186 779. 226 780. 202 94 l. 179 942. 172 943. 267 94-1. 2H:~
777.
236 782. 17"1 783. 243 784. 208 945. 225 946. 247 947. 294 94H. 24.~
78 t.
785. 274 786. 224 787. 215 788. 213 949. 188 950. 162 951. 195 952. 233
7t'.9. 261 790. 20 l 791. 198 792. 187 95'.t 2'.14 954. 230 95:). 227 956. 228
793. 211 794. 251 795. 211 796. 237 957. 239 958. 202 959. 208 960. 179
k 797. 23 I 798. 217 799. 238 800. 220 9G!. 227 962. 217 963. 228 ()64. '.!:11
;lj
804. 231 !165. 225 966. 177 967. 2(){i
;¡ 80 l.
805.
226
171
802.
806.
205
203
803.
807.
187
204 808. 246 969. 229 970. 214 971. 172
9ti8.
972.
227
217
809. 210 810. 260 811. 240 812. IH7 973. 218 974. 224 975. 243 976. 219
·-··! 813. 225 814. 198 815. 229 8lti. 199 977. 259 978. 213 979. 208 980. 2t,7
817. 216 818. 201 819. 253 820. 242 981. 228 982. 256 983. 216 984. 174
¡! :' 82 l. 204 822. 212 82'.1. 2'.~ 1 824. 287 98S. 228 986. 202 987. 191 988. 2:"¡.¡
/i
!,·¡ B""_,, 247 82ti. 237 827. 161 828. 182 989. 243 990. 179 991. 284 992. 207
r·,, 829. 220 8:10. 249 83 !. 171 832. 176 9()3. [ 7{) 994. 220 99). 219 9!Hi. Ell
,,
1;1:
833. 259 834. 142 835. 222 836. 27:", 997. 21() 998. 218 (J!l9. 220 !000. 19:">
¡< 837. 182 838. 256 839. 246 840. 204
ti''·
¡ 1:::- 841. 287 842. 258 843. 226 844. 183
847. li4 848. 201 25. Con base en el ejercicio 24, seleccionar una muestra aleatoria simPie de tama-
111:: 845. 195 846. 188
Pt::
,:1, 849. 282 850. 216 851. 215 852. 224 ño 50 a partir de la población y construir un intervalo de confianza del 95o/c
1,¡,,, para la proporción de individuos en la población que tienen lecturas mayores
l,p' 853. 186 854. 169 855. 195 856. 238
:i:y 857. 227 8S8. 28:~ 859. 209 860. 2-13 que 225. Comparar después los resultados con los de otros condiscípulos.
t!1H 26. Los siguientes valores son el peso en gramos de los bebés recién nacidos en un
.~l. i
\!1'.; 861. 196 862. [85 863. 258 864. 170
,;(:.
867. 211 868. 197 hospital de la comunidad durante un periodo de 3 años.
865. 259 86ti. 222
869. 195 870. 217 871. 252 872. 230
ii![i 288 874. 273 875. 244 876. 194 Bebé Peso Bebé Peso Bebé Peso Bebé Peso
873.
· j:,¡
:.i 877. 171 878. 232 879. 182 880. _,
29-
,:11 l. 2Hfifi 2. 2661 3. :tí7'.1 4. 36'.19
, <fa'"I 881. 203 882. 179 883. 146 884. 230
' :i. 27H:1 fi. '.~;)9!i 7. '.1741 H. 3555
885. 259 886. 240 887. 251 888. 249 \j_ 12. '.1627
'.1h2 l l O. 29!7 11. '.1Gl-i0
889. 269 890. 222 891. 277 892. 2-!j !f).
['.\. '.1242 t4. 2HG-I 1:"1. 3!90 2-!96
893. 204 894. l'.16 895. 184 896. 155 30]7 20. -!157
[ 7. 2!i22 tH. 3827 19.
897. 255 898. 25-! 899. 262 900. 215 :ti!! 2-!. ]086
2 [. 2H07 22. '.$:"12!i 2:t
90 l. 283 902. 267 903. 231 904. 191 <r
_ :J. :10:11 26. -11 fi2 _,
,,- _
:12:1:1 28. 23Hti
906. 207 907. 164 908. 215
905. 252 21!. --1:tl--l :10. :ri-to :1 l. 408S :12. 4-lfiH
909. 252 910. 203 91 l. 286 912. 265 '.) l l () :l;í. :14 73 '.l!i. -179!-i
:1:1. 4fi]8 34.
913. 216 914. 27 ¡ 915. 201 91 ti. 221 40. 2654
'.17. :l:1fi0 3H. 2:)4f'i 39. :11 05
917. 218 918. 281 919. 220 920. l 9li
41. :101; l 42. :171¡:1 --1::1. 4064 H. 282!!
921. 244 922. 226 923. 230 924. 208 '.l!i:) [ -18. 24:'lfi
-t:"). :10:")() 4ti. '.l·l:i2 -17.
-92s. 255 92ti. 227 - 927. 216 - --928. --22-3-- -- -·---:~·1 :··- 52. - - - -- :[4-.:r1
-1:1. 2Htil :iO. '.~!l'.F-1 2793
929. 230 930. 2:16 9:11. 211 9:12. 2U~I '.l!J7fi :"1:"i . 27'.IH ,'ifi. '.15:14
:"1'.l. :1 l :l9 .'i-1.
933. 229 934. 22:1 935 205 9:lti. 17:J :)7. 4 7:12 5!J. 2:114 !)O. 4137
260'.l :í8.
( Continiill) (Co11ti111Ía en la página siguiente)
226
(Continúa)
(Continún)
Peso Bebé Peso Bebé Peso Bebé Peso
Bebé Peso Bcln! Peso Bebé Peso Bebé Peso Bebé
2939 242. 2524 24'.1. 3456 244. 2885
61. :1739 62. 4042 63. 3572 64. 4589 241.
246. 4195 247. 2967 248. 4278
6",. 3689 66. 3463 67. 2858 68. 3287 245. 3233
3089 250. 3458 251. '.{725 252. 3007
69. 4002 70. 3604 71. 4276 72. 3186 249.
2768 254. 3103 9·.
-:>:J. 3873 256. 2348
7'.t 3104 74. 3178 75. 2513 76. 4380 253.
258. 3161 259. 1986 260. 3037
77. 2552 78. 3544 79. :~384 80. 4661 257. 3029
3961 262. 2871 263. 2810 264. 3756
8 J. 3195 82. 3446 83. 3174 84. 2597 26 J.
3116 266. 3399 267. 2920 268. 4314
85. 3567 86. 3297 87. 3364 88. 2961 265.
2504 270. 2613 271. 3140 272. 2529
89. 2673 90. 2286 91. 3357 92. 2947 269.
274. 3306 275. 3537 276. 3324
93. 4166 94. 2949 95. 2452 96. 3587 273. 2879
3411 278. 2652 279. 2554 280. 3249
97. 3231 98. 2052 99. 2937 100. 3197 277.
282. 3354 283. 311 O 284. 3373
101. 3570 102. 4180 103. 3046 104. 2752 281. 3473
286. 2981 287. 2219 288. 4262
105. 4668 106. 3490 107. 3418 108. 2958 285. 3169
290. 2983 291. 2321 292. 3169
109. 3819 110. 3937 111. 3514 112. 4268 289. 4902
294. 3390 295. 2622 296. 2833
113. 2767 114. 3276 115. 4091 116. 2717 293. 4332
298. 3550 299. 3229 300. 3558
117. 3233 118. 3477 119. 3325 120. 2170 297. 5024
302. 3741 303. 3303 304. 3845
121. 3488 122. 3851 123. 3707 124. 3038 30 l. 3334
306. 2281 307. 3709 308. 2903
125. 3748 126. 2779 127. 3437 128. 2729 305. 3240
3830 311. 2999 312. 3981
129. 3569 130. 2938 131. 4015 132. 2810 309. 2902 310.
314. 3990 315. 3997 316. 3307
13'.{. 4461 134. 2409 135. 3385 136. 2750 313. 3486
318. 2649 319. 3622 320. 3011
137. 3670 138. 2451 139. 2429 140. 3506 317. 2934
322. 3589 323. 2328 324. 3945
14 J. 2890 142. 3024 143. 3093 144. 4888 321. 2833
326. 3791 327. 2746 328. 2620
145. 3539 146. 2803 147. 3132 148. 3338 325. 3148
330. 2959 331. 4330 332. 3254
149. 3813 150. 3898 151. 2864 152. 3769 329. 2931
3774 335. 3581 336. 2818
153. 3099 154. 4188 155. 3975 156. 2676 333. 3164 334.
338. 3027 339. 2355 340. 1689
157. 4267 158. 3332 159. 3581 160. 3512 337. 3695
342. 2832 343. 2912 344. 3014
16 l. 3321 162. 3347 163. 4258 164. 3866 341. 2983
3791 347. 2183 348. 2604
165. 2527 166. 4092 167. 4294 168. 2925 345. 3405 346.
3269 351. 3421 352. 4629
169. 3606 170. 3113 171. 3569 172. 3083 349. 3121 350.
354. 3696 355. 2865 356. 2578
173. 2286 174. 2564 175. 2891 176. 3773 353. 3083
358. 3143 359. 2783 360. 4049
177. 3916 178. 3510 179. 4064 180. 3462 357. 3978
362. 2379 363. 2559 364. 2318
181. 3729 182. 3903 183. 2706 184. 3631 361. 2505
366. 2478 367. 3224 368. 3575
185. 4048 186. 2364 187. 3348 188. 3107 365. 3927
370. 3483 37 J. 3662 372. 3399
189. 4309 190. 2600 191. 3526 192. 5108 369. 3976
374. 3160 375. 4617 376. 4031
193. 3129 194. 3814 195. 3902 196. 2649 373. 3701
378. 2710 379. 4010 380. 3709
197. 2751 198. 3031 199. 3586 200. 3650 377. 3920
382. 4016 383. 3453 384 3920
20 l. 2817 202. 3694 203. 2886 204. 2638 381. 3406
386. 2309 387. 2807 388. 2287
203. 4276 206. 3374 207. 3739 208. ?493 385. 3156
390. 2894 391. 2705 392. 3438
209. 3104 210. 3033 211. 2179 212. 2839 389. 3724
394. 2348 395. 3791 396. 3951
213. 2998 214. 3967 215. 3691 216. 1810 393. 3941
398. 3319 399. 2175 400. 3393
217. 3194 218. 3407 219. 3931 220. 3336 397. 2546
402. 2817 403. 3020 404. 3212
221. 4031 222. 2751 223. 3101 224. 2194 401. 386i
406. 2537 407. 3126 408. 2483
225. 2254 226. 2553 227. 3712 228. 3615 405. 2820
410. 3091 411. 3870 412. 3568
229. 3490 230. 3403 231. 3747 232. ··99
:J:>-- 409. 4027
414. 3736 415. 2705 416. 4078
233. 4658 234. 2858 235. 3348 236. 2196 413. 4284
418. 3049 4)9. 263::i 420. 3040
237. 2513 238. 2649 239. 4033 240. 2542 417. 3187
( Co11ri11tía)
228 ( Co111i11úa)
229
(Continúa)
(Continúa)
Bebé Peso Bebé Peso Bebé Peso Behé Peso
Bebé Pe.~o Bebé Peso Bebé Peso Bebé Peso
305[ 598. 3606 :,99. :\407 tiOO. 290\)
4509 422. '.{968 423. 3635 424. 3691 597.
421. 32-!4 602. 28~) l 603. 4..¡99 604. '.{384
345'.~ 426. 3116 427. 2933 428. 2143 601.
425. 3608 606. 3264 607. 2215 608. .t229
'.~511 4'.~0. 2301 431. 3579 432. 2952 605.
429. 610. 3894 611. 355'.1 fi 12. '.{230
434. '.~ 118 4'.15. 3235 436. 3607 609. '.~417
433. 4318 308--1
613. 3249 614. 3279 615. 3188 616.
437. 3357 4'.~8. 3354 439. '.~081 440. 2414 4:\25
617. 4135 618. 3702 619. :~758 620.
441. 3549 442. 3008 443. 3144 444. '.l716 '.J 1'.{fi
62 l. 3116 622. 2526 623. 3:121 G2-I.
445. 3561 446. 3576 447. 337'.~ 448. 3750
2.t2S
625. 2876 626. 4727 627. 4.t2.t 628.
449. '.~891 450. '.~749 451. 3587 452. 4128
3849 630. 368 1 631. 4248 632. 2631)
453. 4062 45-!. 3395 455. 4161 456. 2640 629.
633. 3780 634. 3454 635. 407ti 636. 3465
457. 3269 458. 3393 459. 3056 460. 3139
637. 3460 638. 3387 639. 3506 640. .,1.,141
461. 3067 462. 32.t8 463. 3462 464. 3775
641. 3144 642. 3019 643. 3.t71 644. .tl3.t
465. 3784 466. 3603 467. 3271 468. 3309
645. 4240 646. 3520 647. 3174 648. 3310
469. 2986 -!70. 3008 471. 3794 472. 3741
649. 3050 650. 3356 651. 2:i'.t1 6 ,_,
.,,
4115
473. 4206 474. 3530 475. 4165 476. 3035
653. 3349 654. 2983 · 655. '.{615 G56. 3260
477. 3456 478. 3133 479. 4222 480. 3133
657. 3602 658. 3592 659. 3219 660. 1746
481. 3348 482. 3022 483. 4499 484. 3836
66 l. 3682 662. 2817 663. 4173 664. 305-l
485. 3272 486. 2559 487. 4022 488. 2552
665. 3118 666. 3285 667. 2768 668. '.~597
489. 4138 490. 3535 491. 3552 492. 3506
669. 2468 670. 3149 671. 3868 672. 4161
493. 3215 494. 3818 495. 34 72 496. 3190
673. 3621 674. 3744 675. 245! 676. 323-l
497. 3220 498. 3286 499. 3628 500. 2967
677. 3029 678. 3859 679. 3081 680. 3220
50 l. 3138 502. 2899 503. 2963 504. 3453
3210 682. 3782 683. 3.,187 684. 380~)
505. 3771 506. 2041 507. 3588 508. 2655 681.
685. 3713 686. 3177 687. 3067 688. 3719
509. 3047 510. 2625 511. 3377 512. 4111
689. 2701 690. 2443 691. 3498 692. 2G9t-i
513. 37(9 514. 2585 515. 3618 516. 4202
3575 694. 3608 695. 3783 696. 3656
517. 3280 518. 3787 519. 3567 520. 2910 693.
697. 3030 698. 3363 699. 3.t60 700. 4175
52 l. 3418 522. 2826 523. 2677 524. 3673
2997 702. 4347 703. 3899 7ll-!. 4371
525. 2959 526. 3160 527. 3256 528. 3697 70 l.
3233 706. 3177 707. 3285 708. 3126
529. 3-!97 530. 3557 531. 3794 532. 2408 705.
2803 710. 3434 711. 3093 712. 3718
533. 3913 534. 3340 535. 2395 536. 3126 709.
713. 2574 714. 3122 715. -1207 716. 3634
537. 3356 538. 3547 539. 2471 540. 3179
2735 718. 2075 719. 3-!78 720. -!! 18
541. 2957 542. 3903 543. 3140 544. 3082 717.
3283 722. 4082 723. 385.t 72-!. 330J
545. 3767 546. 2913 547. 262 l 548. 4972 72 !.
3347 726. 33.,13 727. 3683 728. 29[3
549. 3319 550. 3524 551. 3060 552. 3117 723.
3628 730. 3345 731. 2278 732. '.13-l:'1
729.
553. 2866 554. 3131 555. 3667 556. 2133
7'.J3. 3885 734. 313.t 735.
,,_
1--, 7:{6. :l [8()
557. 3130 558. 2369 559. 2426 560. 3204 '.{752
7:~7. 298.t 738. 3604 739. 1878 7.tü.
561. 3620 562. 3774 563. 3501 564. 3412
741. 2512 742. 2979 7.t:t 3491 7+ 3.tS. 7
565. 3016 566. 3497 567. 4233 ::-68. 2266 3.t6ti
745. 4364 746. 3656 747. 29--!l i--18.
569. 4483 570. 2552 571. 3076 5,'2. 29i9 .,1512
749. 2703 i50. 2361 75!. 2652 752.
573. 3958 574. 2671 575. 2324 576. 257
753. 3557 73.t. 4114 753. 2-Hi5 756. .t07'.!
577. 3239 578. 2189 579. 4531 580. 3521>
757. 359:1 738. 305'.1 i59. 2862 760. 3'.\59
581. 3143 582. 3332 583. 2652 584. 2425
587. ·-·-·-37~4---·- -53s:·· --·-·-2·¡-34 - 761. 2968 762·. ------------2..2.2.7---i'.63 .... __ _ __ 257.--1- 7G4. 2941 _
585. 3641 586. 3051 '.l5()8
765. 3212 766. 2382 i67. 2~118 768.
589. 3183 590. 3585 591. 3065 592. 3233 --9
769. 2'.190 770. 3508 7i l. -1 ! 5 i 11 _. 2607
593. 3702 594. 3351 595. 3128 596. 2745
(Co11tinúa)
(Co11ti11tíll)
231
230
(Continúa) (Conri111ía)

Bebé Peso Bebé Peso Bebé Peso Peso Bebé Peso Bebé Peso
Bebé Peso Bebé Peso Bebé

774. 4338 775. 2814 776. 2810 3403 951. 4211 952. 3347
773. 4138 949. 2841 950.
2897 778. 3146 779. 3707 780. 3046 954. 4130 955. 2934 956. 3572
777. 953. 2744
4003 782. 3173 783. 3214 784. 2418 958. 3933 959. 2710 960. 2206
78 I. 957. 3122
2944 786. 2619 787. 3074 788. 2591 962. 2066 963. 3394 964. 3475
785. 961. 2319
3805 790. 3005 791. 3189 792. 2542 966. 3146 967. 2931 968. 3845
789. 965. 2376
3216 794. 2914 795. 3456 796. 3579 3141 971. 3508 972. 3667
793. 969. 2739 970.
797. 2136 798. 3973 799. 3406 800. 2577 974. 2845 975. 3381 976. 3717
973. 3506
801. 3438 802. 2581 803. 3139 804. 3276 3188 979. 3390 980. 2330
977. 2695 978.
805. 3251 806. 3468 807. 3176 808. 2899 982. 3i32 983. 3599 984. 3266
981. 4122
809. 3986 810. 3579 811. 2626 812. 3976 3370 987. 3520 988. 2371
985. 3749 986.
3052 991. 3623 992. 4857
813. 3856 814. 3273 815. 2061 816. 3965 989. 4517 990.
817. '.')927 995. 3747 996. 3590
2989 818. 3505 819. 2996 820. 3721 993. 2860 994.
999. 4540 1000. 2328
82 l. 3215 822. 4115 823. 2691 824. 4429 997. 3375 998. 2366
825. 4142 826. 2743 827. 2401 828. 2050 2562 1003. 3481 1004. 3665
1001. 2816 1002.
1007. 2344 1008. 4944
829. 3267 830. 3703 831. 3482 832. 4369 1005. 3957 1006. 4449
2607 I O11. 2336 1012. 3412
833. 3785 834. 5281 835. 3604 836. 3219 1009. 3346 1010.
837. 3745 838. 3640 839. 3734 840. 4106 2839 1015. 3764 1016. 3876
1013. 4142 1014.
841. 4462 1019. 3309 1020. 2910
3450 842. 3765 843. 2514 844. 3344 1017. 4045 1018.
1023. 3014 1024. 3305
845. 3414 846. 3470 847. 4048 848. 4325 2215
849. 2309 850. 3651 851. 3204 852. 24 77
1021.
1025.
3717
2985
1022.
1026.
__
4 99-, 1027. 2680 1028. 2810
2786 1031. 4557 1032. 3706
853. 2618 854. 2491 855. 2370 856. 2511 1029. 4254 1030.
857. 3024 858. 3744 859. 3123 860. 3560 3720 1035. 3599 1036. 3169
1033. 4104 1034.
1039. 4174 1040. 3618
861. 3123 862. 2522 863. 2977 864. 2722 1037. 3091 1038. 2590
865. 3088 1043. 2776 1044. 3228
2632 866. 3496 867. 3709 868. 2901 1041. 2761 1042.
1047. 3879 1048. 3141
869. 2853 870. 3315 87 l. 2953 872. 2152 1045. 3254 1046. 2283
1051. 3470 1052. 3084
873. 2936 874. 3526 875. 4918 876. 3210 1049. 2516 1050. 3383
1055. 3709 1056. 2259
877. 3577 878. 2910 879. 3586 880. 3968 1053. 3387 1054. 3468
1059. 3918 1060. 2682
881. 3600 882. 3657 883. 3189 884. 2518 1057. 2456 1058. 3224
885. 4036 887. 3746 2560 1063. 4123 1064. 3703
886. 3312 888. 3842 1061. 3498 1062.
889. 1067. 3570 1068. 4280
4112 890. 3425 891. 3076 892. 3470 1065. 2861 1066. 2661
893. 2597 894. 2951 895. 2907 896. 3767 3576 1071. 3466 1072. 3324
1069. 2189 1070.
897. 3448 898. 899. 2613 3668 1075. 2659 1076. 3412
3119 900. 2976 1073. 2562 1074.
90 l. 3938 902. 3672 903. 3677 904. 3935 2642 1079. 3367 1080. 3271
1077. 3199 1078.
905. 3572 906. 2997 4107 1083. 2788 1084. 3861
907. 2700 908. 3382 1081. 3312 1082.
909. 2914 910. 3668 911. 3169 912. 3782 3562 1087. 3400 1088. 2395
1085. 3215 1086.
913. 3770 1091. 3780 1092. 2612
914. 2770 915. 3067 916. 3226 1089. 3372 1090. 3464
917. 2651 918. 3194 919. 2641 920. 2808 2850 1095. 4055 1096. 4282
1093. 3954 1094.
921. 3766 1099. 3261 11 OO. 2758
922. 3353 923. 3049 924. 4055 1097. 2766 1098. 3075
925. 3334 926. 3815 927. 3801 928. 3461 4365 1103. 3534 1104. 3902
1101. 3457 1102.
929. 4029 930. 3165 931. 2719 932. 2721 4129 1107. 2271 1108. 4364
1105. 3049 1106.
933. 3739 934. 3010 1111. 2384 1112. ~.682
2303 935. 3500 936. 2725 1109. 3556 1110.
937. 3833 938. 3466 939. 3642 940. 2049 3410 1115. 4023 1116. 2892
1113. 3115 1114.
941. 3066 942. 944. 4064 2879 1119. 3599 1120. 2626
3341 943. 3916 1117. 3507 1118.
945. 4211 946. 3082 947. 3559 948. 3962 2444 1123. 2463 1124. 3121i
112 J. 2932 l 122.
(Co11ti111Ía)
(Continúa)
232 233
234 Estin1ación Preguntas y ejercicios de repaso 235
(Conriniía)
Individuos con infarto al miocardio (continuación)
Bebé Pe.~o Behé Peso Bebé Peso Bebé Peso Individuo Individuo A.L.
Individuo AL Individuo A.L. A.L.
1125. 2421 1126. 3765 1127. 3610 1128. 3!06 13.--l
4 l. 6.9 42. 6.5 43. l 7. 7 44.
I 129. 2937 l 130. 3729 l 13 l. 3177 l 132. 4169 47. 10.6
10.9 13.0 48.
l!33. 2291 l 134. 2235 1135. 3862 l 136. 3271
45.
49.
15.t-i
7.9
46.
:)0. 2.8 51. 15.2
.,
o •. 22.'.{
l 137. 3888 l l38. 2787 l 139. 3970 1140. 2972 il.5
53. 9.i 54. 15.2 55. 10. l 56.
l 14 l. 3374 1142. 2512 l 143. 3388 1144. 4084 59. 7.2
57. 15.4 58. 17.8 12.6 60.
1145. 3356 l 146. 3434 1147. 4709 l 148. 4642
l 149. 2761 l 150. 3118 1151. 3815 1152. 3521
l 153. 3289 1154. 2964 l 155. 2849 l 156. 3720 Individuos sanos
l 157. 3344 l 158. 3428 1159. 2517 1160. 2873 AL
Individuo AL Individuo AL Individuo AL Individuo
l 161. 2996 1162. 2940 1163. 3078 1164. 2776
ll65. 3049 l 166. 2500 1167. 3710 l 168. 3578 l. 17 .1 2. 22.9 3. 10.4 4. 30.9
l 169. 4439 l l 70. 2869 1171. 3137 l l 72. 2514 o. 32.7 ti. 9. l. 7. 20.l 8. 19.2
l l 73. 3165 l l 74. 3120 1175. 2910 1176. 3187 9. 18.9 10. 20.3 l l. 35.6 12. 17.2
l l 77. 2381 l l 78. 3535 1179. 4255 ll80. 3351 13. 5.8 14. 15.2 15. 22.2 16. 21.2
l 18 l. 3155 l l 82. 4051 l 183. 3960 l 184. 3768 11. 19.3 18. 25.6 19. 42.4 20. 5.9
1185. 2605 l 186. 3443 1187. 3293 l l 88. 3644 21. 29.6 22. 18.2 23. 21.i 24. 29.1
l 189. 3596 1190. 3296 l 19 l. 4101 1192. 3282 25. 12.4 26. 15.4 .9•,. 21.7 28. 19.3
l 193. 4076 l l 94. 2690 1195. 2814 l 196. 3725 29. 16.4 30. 23.1 3 l. 19.0 32. 12.9
18.5 34. 21.6 3·o. 25.0 36. 20.0
l l 97. 2507 l l 98. 3162 l 199. 3918 1200. 2742 33.
31. 51.7 38. 20.5 39. 25.9 40. 2-1.6
Obtener una ,nuestra aleatoria de tamaño 20 a partir de esta población y construir --12. 21. l 43. 11. 1 44. 3'2.7
4 l. 22.-1
un intervalo de confinnza del 95 por ciento para la media de la población. 13.2 46. 22.1 47. 13.5 48. 5.3
45.
Comparar posteriorn1ente los resultados con los de otros condiscípulos. ¿Qué 50. 20.2
-19. 29.0
suposiciones son necesarias para que el procedimiento de estimación sea válido?
27. Con base en el ejercicio 26, obtener una muestra aleatoria simple de tamaño 35 miocardio y 50 varones aparentemente sanos de la misma edad y condición
a partir de la población y construir un intervalo de confianza del 95 por ciento social. Una variable de interés en el estudio fue la proporción de ácido lino-
para la media de la población y compararlo con el construido en el ejercicio 26. leico (A.L.} en los ácidos lipotriglicéridoS del plasma de los individuos. Los
28. En un estudio de !a función de las grasas en la etiología de las enfermedades datos para esta variable son los dados en la tabla anterior.
isquémicas del corazón se seleccionaron las siguientes poblaciones: 60 indivi-
duos varones entre 40 y 60 años de edad, quienes habían tenido un infarto al Construir el intervalo de confianza para la diferencia entre las medias de la
Individuos con infarto al miocardio población. ¿Qué sugieren los datos acerca de los niveles de ácido linoleico en
las dos poblaciones muestreadas?
Individuo A.L. Individuo A.L. Individuo AL Individuo A.L.
l. IS.O 2. 17.6 3. 9.6 4. 5.5 29. Los datos de la tabla de las páginas siguientes son la estatura (en pulgadas) de
5. 16.8 6. 12.9 7. l 4.0 8. 8.0 l 000 niños de 12 años de edad.
9. 8.9 10. 15.0 l l. 9.3 12. 5.8
13. 8.3 14. 4.8 15. 6.9 16. 18.3 Seleccionar una muestra aleatoria simple de tamaño 15 a partir de esta pobla·
l 7. 24.0 18. 16.8 19. 12. l 20. 12.9 ción y construir un intervalo de confianza del 99 por ciento para la media de la
21. 16.9 22. 15. l 2_3._____ 6_1 ---- _94, [6.6 po~lación. ¿Qué suposiciones_ s_o~ necesarias para que este pr~c~dimiento ..sea _____
25. 8.7 26. 15.6 27. 12.3 28. 1-1.9 válido?
29. 16.9 30. 5.7 3 l. 14.3 32. 14. 1
33. 14.l 34. 15.l 35. 10.6 36. 13.6
37. 16.4 38. 10.7 39. 18.1 40. 14.3
(ContinlÍa en la página siguiente)
(Co11ti111ía)
Muchacho Estarura M11chacho Esrarura Muchacho Estatura Muchacho Esratura Muchacho Estar11ra fvluc/1acho Esrantra Muchacho Estatura Muchacho Estatura
l. 60.7 2. 62.4 3. 59.7 4. 56.2 bl.';f 179. 63.3 180. 58.7
177. 57.4 178.
s. 55.2 6. 58.6 7. 59.1 8. 59.5 182. 61.0 !83. 62.0 184. 58.2
181. 56.9
9. 56.5 10. 61. I l l. 55.8 12. 55.9 62.4 187. 58.7 188. 56.8
185. 61.2 186.
13. 61.0 14. 62.9 15. 57.2 16. 56.7 56.2 191. 55.2 192. 55.5
189. 55.5 !90.
17. 61.7 18. 56.3 19. 55.8 20. 62.1 194. 60.8 195. 54.8 196. 63.5
l 93. 63.9
60.6 22. 59.0 23. 62.3 24. 59.2 57.4 200. 56.7
.,.,.
2 J. 197. 62.4 198. 62.4 199.
25. 57.8 26. 64.l 54.3 28. 58.0 202. 63.5 203. 63.2 204. 61.4
20 l. 58.7
29. 62.0 30. 59.3 31. 62.8 32. 64.4 62.4 207. 59.4 208. 56.0
205. 58. l 206.
60.6 35. 56.5 36. 66.2 212. 58.1
33. 57.9 34.
209. 55.8 21 o. 62.5 211. 59.8
37. 60.3 38. 58.6 39. 56.8 40. 61.ü 214. 58.l 215. 55.6 216. 63.2
213. 55.7
41. 59.4 42. 62.9 43. 60.6 44. 58.5 55.0 219. 61.4 220. 58.5
217. 55.5 218.
45. 61.7 46. 57.8 47. 62.2 48. 55.6 222. 58.7 223. 62.8 224. 63.0
221. 56.7
49. 62.8 50. 59.3 51. 55.7 52. 55.2
225. 59.2 226. 62.7 227. 56.6 228. 54.4 '
53. 59.4 54. 56.7 55. 54.6 56. 55.8 55.2 230. 6-!.9 231. 60.l 232. 62.6
229.
57. 59.4 58. 60.3 59. 61.5 60. 62.0 234. 64.5 235. 61.7 236. 56.4 1
233. 60.6
61. 57.5 62. 57.4 63. 60.6 64. 59.5 238. 60.8 239. 59.3 240. 61.7
237. 59.3
65.
69.
57.6
60.9
66.
70.
57.0
59.8
67.
71.
61.2
56.3
68.
72.
57.0
57.8
241. 58.9 242.
246.
57.9
58.l
243.
247.
59.'.I
58.0
244.
248.
54.1
63.3
\,1
245. 6'.L2
73. 58.7 74. 60.2 75. 54.8 76. 58.4 53.9 251. G2.6 252. fi3.i 1
249. 59.1 250.
77. 56.2 78. 58.5 79. 57.8 80. 59.5 254. 62.S 255. 55.8 2:)6. 58..t .''';'
25:1. 60.2
81. 53.7 82. 57.2 83. 58.3 84. 55.5 9·· 59.3 259. 57.8 260. ;)8.2
59.4 258.
85. 63.2 86. 57.3 87. 54.3 88. 63.4
-:JI.

261. 63.7 262. 60.6 263. 55.7 26-1. 56.8 1


89. 58.6 90. 57.i 91. 59.2 92. 58.5 56.5 267. 58.0 2G8. 56.3
93. 59.4 94. 59.4 95. 57.7 96. 57.9
265.
269.
55.6
58.3
266.
270. 56.2 271. 61.4 2i2. 59.5 '1
97. 60.0 98. 59.4 99. 62.8 !OO. 57.4 27--1-. 61.5 275. 5:t8 276. 59.7 :{
54.0
101. 59.2 102. 56.6 !03. 59.7 104. 54.9
273.
_, ,.
r- 58J{ 218. 55.1 279. 6:t2 280. 60.~ ''el
105. 62.4 106. 62.0 !07. 59.6 108. 62.3 282. 61.:) 28'.). 58.6 284. 60.0
281. 59.4
109. 60.8 11 O. 56.6 111. 56.5 112. 59.2 59.:\ 2:87. 58.2 288. 55.5
286.
ll3. 56.I 114. 59.1 115. 56.8 ll6. 61.0
285. 58.6
61.\ 291.
- - ,,
:J / ,_ 2:~2. tJ~l.2
289. 61.8 290.
i 17. 58.7 II8. 61.3 II9. 54.2 120. 57.3 61.7 2:95. 6:ti 29!i. .'J9.9
293. 56.2 294.
121. 62.7 122. 56.9 123. 62.7 124. 53.3 60. l 2~!9. fi:I .5 :)OO. 6-1.6
297. 59.5 298.
125. 62.7 126. 60.7 127. 60.8 l 28. 59.5 :18.2 '.H)'.1. 6 !.4 :~0--1-. 58.8
30 l. 5ti.2 302.
129. 55.0 !30. 57.9 13 l. 57.0 132. 61.7 60.:1 )\07. 5{i.9 '.Hl8. 59.1
'.\OS. 63.2 JU6.
133. 54.9 134. 55.4 135. 63.l 136. 58.8 55.l :111. 58.5 :,12. (i(J.2
J09. 5ti.9 310.
137. 62.3 138. 57.6 139. 62.4 140. 64.2 61.2: 31:-J. fr-1.i :)16. 57.]
:113. 5~1.4 :, 1-1.
14 l. 60.5 142. 60.8 143. 62.2 144. 63.0 60.0 :11 ~l. 57.8 :,20. !iü.5
:~ 17. 59.2 '.) ! 8.
145. 57.2 146. 57.5 14 7. 60.I l 48. 61.8 58.D :t2:1. 5\l.2 :12--1. 5 7 .t-1
:121. 59.:) :\22.
1--19. 59.1 150. 58.8 l 51. 62.8 152. 54.9 :\2{i. (ill.7 :127. 62.9 :'l2H. .'i~l.9
:125. :,:J.8
153. 61.5 154. 57.0 155. 63.6 156. 57.5 :\30. 57.4 :ti!. 5(i.9 :tl2. !iO.I
'.\29. 51.i
157. 57.8 158. 59.7 159. 55.5 160. 62.7 :)J4. 5:).:1 :t\5 3-!.4 $'.l!i. 1i:t l
:)3$. 58.9
161. 60.9 162. 59.I 163. 57.6 164. 61. l '.\:)8. 58.() :tl\t. GtUi :1-10. :i,).li
:t\7. 58.9
165. 58.2 166. 58.3 !67. 60.8 168. 60.6 :1-12 . lil.5 :1-1:1. 58.:, :1-!4. :1\Ui
3--1-1. ."ili.!i
169. 58.1 170. 62.4 17 l. 59.6 172. 64.8 .)H.7 J-fi. (i'.?.2 ;\.18. .":i!i.:I
:\-15. .-1ti.O :1-111 .
173. 64.4 174. 57.6 175. 61.7 l 76. 62.1 :1::;o. !',O. l :1:1 l. ;-¡-; 1 '.1:i2. lil.<I
:)-1 ~l. :14.4
(ContinlÍa en la página siguiente) (Cnuti111ínl
236 237
6fZ 8fZ
(l)!lll!/110_)) (l?/IU!IIIO:J)
\;·11<:: "()()!. r·,·c "(iti9 "8()() t·"8t.: "!..ti()
l ·¡:;g "t6f (,.f!J
e ·};(,f 1::·!..~' 1"8f ·¡¡;;q
(l'R<... (Hi!l 11·:1<.: "(.:"ti!l ,· 1 ·¡-¡)\l f-" !. t.: ·1::6~!
f'!ll? ·n;;s- (f(J9 "GI q !."\-E? "81'.? ¡:;·¡.iq '.!.!f
___ (i.:U~J_ -- - "{,¡j() !.JJ!} _ ______j__(__il! - "(l{i0\l~__(~)~!~l.:_ _~·_c(icc89
crc;q 91S: f"li<..: ·q¡q r,·¡;g "ti<:: !f69 f,¡q- ------
"HR!l '.:"8<.: '!.8(1 ()"8'.: "!lR\l 8"80 'fR9
1:;·f;g ·¡:;¡~· !l" !9 . [ ¡q ¡;;·¡g ·01 f ó"L<;; ·5oq
!l'!I':.' '!-8() !-"L<..: ·r8!l (i"09 -¡;R!l <.:·1:<..: ·1 R!l
"OR!l !,"(,\) "(i!..9 (i"!.f "R..'..!-1 <.;·9<_; "LL9
f'9S "80'.: };·oy "!.()':: 9·09 ·gos 9·9q "f{)f:
i-;'"R':: ()' !9 "t(!<; t"Lt 'f,()f
()"ti<..: "9!.9 FG<..: "C.:!.!-1 ¡-·¡;9 "t..'..!I ¡;·¡g "\-;!.9 "60f ¡;·og ·¡oq ['
"0..'..9 ¡¡·¡9 ·599
l-"09 ·oos· J"t9 "66r "86t t"tf ".!.6t
!'i.!l':.: '(,!.9 ti'()!-) "J!.9 ()"t!l
6'?,\;" ·95¡. O"RS "f6t L"Lf "t6t S"t9 "f,6t
i·r!i<..: "899 L"'::'.: "!..9!1 tr6'.: ·999 ()" J 9 ·qgg
~l"l"'!-1 "G6t L'Rf '\6t 6"óf "()6t 8"8f "6Rt
1--:· !. <..: ·r~19 ()"6~' ·1;99 ~:·09 '6!19 S"!..f ·¡99
~:·¡;;g '88!- 8"f.9 '!8t r·sc; '98} (J"Hf "'::Bf-
¡..;·¡q '099 6"!-C.: "(i<_;g ¡·¡,9 "R(!l !l"O!l "!.S9
g·¡g
·91.;9 ~)"8f "<;(\! L"L9 ¡-c_:9 6·09 ·1::sg
"f-8f, !-"8f "f,8f' fi"t':: "?,8f, 8"6':: ·¡gr
!f!.C.: 8"6f "{)8!-
i-r¡;c_: "tit9 6"Lt "6Lt t'6S "8!.J, 9'l;g "LLt
!.."(i(__; ·¡;<_;g !-'Lf "l ':.'!l (i'f,(;: ·o'.:!I
5·¡9 '9Lt "flt g·t,g 't!.t !.."6f "V.LV
0·09 ·¡.¡¡-g q·gc_: '!.!-!l 1::·Rf "9t9 !!"09 ·c_:tg
s·og ·1:1-~1 "(,t9 \'8S "I t!I
6'Lf ·zt..r ·¡ Lt, o·r.g "0!..t 6"19 "691"
[."09 "t-t9 L"09
t'óS "89t 6"6t "L9t 6"6f "99t 6'6S ·sgt
(_;-og "Ot-9 ~·og -6~;9 !1"90 "8f9 !.'09 "L\:9
¡;;·r,g ·rgt 8'8f ·r,g¡, 6"8S ·¡:;gt, f."!.f ·¡gt,
t,"8<1 ·gr,9 F9C.: "fl:9 R'LS •t1:9 t"IC ·1,;{:9
8"19 ·09r 8"8':: '6ft 9"6f "8\:"t ó"6':: "Lft
¿;·r,g ·¡;~;g 6"8<1 ·¡¡;g 0'6f "(ll;g FL~· "(i69
·9q¡- 6"09 ·gq¡- f'09 "tft g·¿q ·r.,;;t
t "t(d "869 9·5q "!..(,9 t"~C.: ·9¡;9 ¡¡·¡.¡e; '(69
r,·¡g '6ft '::"6<:: ·¡qt, 6"69 "Oft f,"Lf
"!-(,9 9·9¡¿ ·1~¡;9 6"19 ·0¡;9 rl"!iS ·¡ 69 '6tt
8"1,9 c;·¿q
J'<..:f .Ll!l "8tt 6"19 "Ltt 6"09 "9tf, r,·¡,g "ftt
r·tg "()(,9 6"09 "619 1,;'()0 ·¡,119
9"óf "!-t+ ¡·gg ·r.tt O'Lf "6tt f't9 'Itt
f;" I e ·9¡9 8"61., ·q¡g (i"f{_; "t 1!1 8't-<..: ·~:19
9"8f ·¡,¡g 0"8f ·¡ ¡9 '019 1,;·Rs "(i09
6"09 '()tt J"Hf "Gf.t 8'Lf ·Rr.v t,·¡.¡1_: . !..f,t

t"6f "809 ¡ ·g~· "!.09 ~;· f;c_: '909 c;·t..c.: ·~o9 n;g ·g};t- !-l"fif -~f,J, f>"LS ·,se g·gq ·r.r.,
o·og "6f.t ¡;·nq "[f,t 6"6S ·or.t "6(,t
9"8f "t-09 !-J"t-9 "f09 c.:·og ·;:;09 }i"CC "]09
C"6f ·g¡;t,
8"69
"LG11 8"6f "L6t q·qq ·g¡t 6"(,f ·q¡;;t,
!.."19 "009 6"L~; '66C.: 6"L<_: "Rti<..: ¡;· 1~l
o·oc; "f•6t };'8S "f,6t ¡;·gq "66t o·qq ·¡¡:;¡,
r,· !S ·951_: (;;'~9 "\:6':: (_:'(;'.: "j-()(__; ¡;·c_:f "\;6'::
1"69 "()(,t ¡·¡;g ·5¡p ()"Li:i '81t g·¡;g "Lit
8'09 "66f ¡;·9q "JGf 0·09 ·occ; 6"GI.:: '68'::
(_t6S ¡·zg ·98<; t"8S ·ggq ¡:;·09 ·g¡¡. r·gs "fil> 6"6':: "tlf, t.:·Lq -~; l t
"88f L"8f . !.8<1
. ! 8S l"6<1 ·¡:;1t c;;·5q ·¡¡¡, e;;·¡ 9 'OJt ~:"8f ·50,
9"!S 't-8f r,·ss ·l:ss 6'9f ·¡:;R<; L"HS
S"8S "8()f:- íff,9 "LOt ,·09 '90t 6"tf ·11ot
0"09 '08S Si"8S ·5¿q l"8S "8!.f 5·1_:q "ll':: l)'fi<..: ·1,or
g·c;c; ·r,¿q ·~:ot O"Lf "60t 9·09 ·1ot
6'09 '9!f r,·¡:;g 'C.:Lf "t!.f 0·"9 !·l"!J<..: "()()f- irii~- "()(}}: 6"8Cd .86\; (i"8<;i "L6f.
5·¿q ·;:;¿e; v·sc; ·1 ¿12 o·qc; "OLS g·¿s ·5gf
(i ·ii<..: "!)(J\; irr;i: "(__;(j}; l"f-<:?
·ggq "t6f. f,"8f ·r,¡:;¡,
l 't9 "89<1 c;·5c; 'L9':: o·.g ·ggc; 8"09 6"1..:0 ·¡;¡¡¡; ¡;·¡;c,;· . 16}; r,·¡;g
. 19f '06f. 6'09 "68f,
i;· LS "f:-9S 0·19 'f,9C.: t'8f ·zgs Hs L'l!l "NH}; t"l9 '!..8}: ¡;·¡g
o·(g ·¿qq "98f, 1-fRf ·qf.lt,
6"6S "09<1 o·¿g ·5qq S"8S "8Sf $f [9 ¡·qc_;
"f-8$: "f'.8}; g·qq '68f, g·pq
·g<_:f 0·5g ·qqc_: 9·¡9 ·rqi;; g·gs ·r,gq "!Rf;
9"6S ¡;·09 "OR}: L"O!l
"6tS "ó!f: 6'8':: ·glr. ¡:;· 19 .LLE
¡¡·¡;g "6fS 6"8<1 "l ff t'l9 ·oqf 5·ss f,(()9 "9!.$: F[q "'::!.f. ¡:;·og 'tlt l'R':: 'f,!f.
o·Lq "8t': 5·5q 'Ltf f.'8S ·gti;; g·gc; 'ftf
i·¡-s ·¡;L¡..; H"<:_'t; "ILS g·¡g "OLf;
¡:;·gq ·rr,; ··¡g ·ir<.: 6"19 ·1ts 8"tf '691s
6"09 "f,f,':;
"8!H: 1·19 "L9f. Cl9 ·gg, l"RS ·qgt,
o·og ·ors S'6':: "6f.': o·gs "8f.f 9·09 'Lf,f 1. ¡ !) ·¡-.9~; }:·,;e_; "}:91: (}"69
'f,f,f "69t g·5q 'J9t
s·sg ·gf,f g·gg 'ff.':: g·¿q "tf,f 8"8S
6"Lf "09}: !.."09 "6Sf. 6"69 ·sc;r, "LS!s
·¡:;f,S 0'9S ·ot,q g·gg ·5¡;c; S:"09
g·¡;s "Jf,f 1"8S ~:-(i'd ·111..:1: 9·¡;9 ·~·i:_:f: 'f.9E:
·s¡;c; 9·5,;; "L6S ·g¡;g f;"8':i ·g¡;g ¡;·og ·tsr. ¡·99
1·09 L"6f
v1n1v1s1 Ol(JD1¡:Jnp¡ v.1n1111s3 01/J!Jl/JllJ,V D.1111/JIS] OIJJD1JJ11J,V IJ.{II/DJS3 O!JJD1/Jn¡v
D.JIIJDJS3 O!/JV1(J11W D.JllJVJS3 O!!-)V!f)!1J,V /J.IIIJIJJS;J 01pn1p11¡,v !JJ!IJIJJS] m¡,;v1¡JnW
(V!)U!JUO:))
(IJII///JUO.))
(Continúa) 241
Preg(111tas y ejercicios de repaso
Muchacho Esta:ura Muchacho Estatura Muchacho Estatura A1uchacho Estatura
(Continúa)
701. 59.2 702. 56.0 703. 54.2 704. -,)
:J-.1
- J.1uchacho Es1a1J1ra A.f uchacho Estalura A1uchaclw Es/atura Muchacho Estatura
705. 53.2 706. 59.6 707. 59.3 708. :19.7
709. 58.4 7 I O. 56.l 7 l l. 59.1 712. 61.8 873. .15.!'i Hl-t . :Í:°')Ji K/5. :"1·1.~l Hlfi. :i9.9
713. 62.0 714. 58.0 715. 58.3 716. 60.6 877. f'J -
l-.:J K78. 57.2 H79. fi2.:') HHO. 64.6
717. 58.0 718. 58.9 719. 60.2 720. 61.3 88 l. 59.1 HH2. G1.4 HH:t 60.J 884. 62.1
72 l. 56.2 722. 58.5 723. G0.3 724. 60.0 885. 59.l HH6. 5'.L2 H87. 58.J 888. 61.8
725. 63.5 726. 57.4 727. 61.0 728. 57.1 8H9. - - ')
;l I ·- 8~Hl. fil .2 H91. ?if,.'2. 892. :JH.0
729. 54.5 730. 56.3 731. 61.2 732. 56.2 89:'5. SH.5 .'-l\14. 37.9 H95. !il.-t H9!i. ¡¡ 1.:1
733. 59.7 734. 57.9 735. 59.3 736. 53.8 897. :,f:i.5 H98. :'18./ 89~1. ()0.4 IJ()(), fi3.:1
737. 57.4 738. 55.5 739. 61.2 7-10. 57.9 901. 57.fi 902. 59.2 9U'.1. ti].() 91)-1. SH.4
741. 52.5 742. 90H. 62.1 ', '¡
61.8 743. 61.7 744. 57.4 905. 62.5 !JOfi. 05.2 !107. .J9.7
745. 63.0 746. 56.9 747. 59.8 748. :,6.6 52.H 9!2. 62.H '
60.I 909. S9.7 ~JI O. !JI l.
749. 58.l 750. 63.7 751. 56.0 752. 58. l 913. 60.5 ~¡ 14. 58.7 915. 58.,"i !JI f-i. 57.4
753. 61.2 754. 64.3 755. 58.7 756. 58.I 917. 54.9 918. 62.0 91D. :í8.:-l q20. 59.3
757. 56.9 758. 58. l 759. 59.0 760. 63.2 92 l. !i2.4 922. fi0.5 1~2:1. li:t:{ !-1'.!4. 5H.7
761. 60.2 762. 60.4 763. 62.8 764. 61.8 925. fi2.9 92fi. f¡(J.!:-J 927. ti2.:l '.l'..!H. 59.:1
765. 61.9 766. 60.3 767. 56.4 768. 54.7 92!-I. 5~¡_(J ~1:~o. .lH.:1 9:11. fi2.:·) \J:{:.'. ;lh.O
769. 6!.3 770. 60.8 77 J. 56.3 ii'!.. fi4 .9 933. 5fi.2 {.J'.{4. :,:1.8 9'.15. Yl.~l 9?,fi. 5~!.5
773. 59.2 774. 61.2 775. 60.J 77/-i. 61.8 937. 59.fi ~J:18. GG.6 9'.{9. :1:,.1 940. G0.4
777. 62.9 778. fil.O 779. 58.2 180. 56.l 941. 58.5 9.12. 60.1 9-t'.1. fiO.] 444. G0.2
781. 61.6 782. 56.5 783. 61.1 184. 58.2 945. 5!~. 7 94fi. li!.I 9-17. 56.9 q-18. :18.7
785. 64.1 786. 56.9 78i. 60.6 788. ?,9.2 '::149. 58.IJ (15(). :17.fi !J.?]. .19.0 '.-152 . 59.H
789. 54.3 790. 59.4 791. 56.9 792. 57.G 953. :ífi.4 9.14. fi0.6 955. 57.fi 95fi. 59.:~
793. 58.8 794. 57.3 795. fiO.I 796. 58.4 957. 5H.2 U58. !i2.7 95!:-J. 57. l Ul)O. 5fi.H
797. 60.6 798. S9.3 799. S6.6 HOO. 6/J.2 !::!G l. t¡\i.4 9fi2. SH.4 963. 54.S !lfi4. 57.0
80 l. 62.4 802. 55.5 803. 56.8 H04. 61.0 965. n1.1 !Jfi6. fi0.2 967. 61 .O 96H. 5H. l
805. 56.4 806. 59.9 807. 58.7 808. 5':-1.i 969. ;,8.8 970. li3.8 971. Sh.'.1 912 62.fi
809. 57.9 810. S6.7 811. 61.1 812. 57.6 97:1. .1fi.7 974. ;)9.9 975. .)9.2 916 . 5H.7
813. 60.6 814. 56.5 815. 57.3 811:i. fi:1.H 977. 62.4 ~178. 57 .5 979. 60.] 9XO. 58.CJ
811. 61.3 818. 6 l.5 819. 59.4 82(). .19.5 \)81. :):'i.7 9H2. :J7.6 9,'!3. .18.8 984. 58.2
82 l. 63.8 822. 64.'3 823. fi2.0 H24. .19.:l 98.í 6.'-l. '.~ '.iHfi. .19.8 987. fi(l.4 9HH. }H.I
825. 61.0 826. 60. l -,.
so- 57.0 H28. 63.3 989. 5 7.fi ~!90. 57.8 99!. 56.8 9:-12. 59.8
829. S9.9 830. 59.7 831. fl3.9 83'..'.. 60.'.2 ~19'.t :l'i.H ~194. :°JH.4 995 5K.6 (19h 54.:J
833. 52.8 834. 59.2 835. :19.6 l{ifi. 57.G 997. :i9.l \JSJH. 59.f) 99~1. f-j J.5 ]()00. :°')9.2
837. SS.8 838. 59.l 839. 60.l H41J. 5 7.3
84 l. 58.9 H42. Gl.2 8-13. 1-il.3 844. )9.4
845. 53.6 30. Con base en el ejercicio 29. "clccc1on<.1r un::i 1nucslrj aleatoria ~iznp!e de tan1a-
t!46. 6'.2.3 847. S6.7 H4H. 5fi.S
849. 58.8 ño 35 a partir de esta pohl.:icicín y construir un intervalo de confianza del 99 por
850. 59.6 8S l. 57.7 852. (ifJ.7
853. 57.7 ciento para la n1cdia de la poh!acitín. Cornpararlo con el que <.,e obtuvo en el
854. 59.3 855. 60.5 li5fi. :·¡9, 7
857. S9.5 H58. (i l. 2 859. 58.0 1-il)(J lil).3
ejercicio 29.
861. 61.9 H62. .'")7.5 863. :,7.0 Hfi-1. 57.7
865. 64.0 H6fi. S9.3 H67. .14 .!l 8!)8 !i J. 7
869. 58.4 870. :19.1 H'i l. .1:1.3 H'i~ . ."¡:J.H
,c·ontí111ía)
240
Bibliografía 243
242 Estimación

BIBLIOGRAFÍA _ _ _ _ _ _ _ _ _ _ _ _ _ _ __ a Normal Distribution". Journal of tite Anzerican Statistical Associatio11, 5-1


(1959), 674-682.
21. WAYNE W. DANIEL, Applied No11paran1etric Sratistics, 2." edición, PWS-Kent,
Obras citadas
Boston, 1989.
l. ]OHN E. FREUND y RONALD E. WALPOLE, Mathen,atical Statistics, I .ª edición,
Otras publicaciones
Prentice-Hall, Englewood Cliffs, N.L., 1980.
2. ALEXANDER M. Mooo, FRANKLIN A. GRA YBILL y DUANE C. BOES, lntroduction
1. H. A. AL-BAYYATI, "A Rule of Thumb for Detennining a Samplc Size in
to the Theo1y of Statistics, l.ª edición, J\.1cGraw-Hill, Nueva York, 1974.
Comparing Two Proportions", Technon1etrics, 13 {1971 ), 675-677.
3. TARO Y AMANE, Statistics: An /11trod11ctio11 Analysis, 2." edición, Harper &
2. ]ACOB CoHEN, Statistical Power Analysis far the Be!uivioral Sciences, 2.ª edi-
Row, Nueva York, 1967.
ción, Erlbaum. Hillsdale, N.J., l988.
4. 10HN A. RICE, Mathenzatical Statistics and Data Analysis, Vladsworth &
3. ARMAND J. GALFO, "Teaching Degrees of Freedonl as a Concept in Inferential
Brooks Cole, Pacific Grove, Calif., 1988.
Statistics: An Elementary Approach", School Science a11d Mathenzatics, 85
S. W. S. GosSET {"Studenl"), "The Probable Error of a Mean", Bion1etrika. 6
(1985¡, 240-247.
(1908), 1-25.
4. HELENA CHMURA KRAEMER y SUE 'f.HIEMANN, How Many Subjects? Statistica{
6. W. V. BEHRENS, "Ein Beitrag zu Fehlerberechnung bei wenige Beobach-
Power Analysis in Research, Sage, Newbury, Calif., 1987.
tungen", landil'irtsschftliche Jahrbiicher, 68 ( 1929), 807-837.
S. F. F. RACTLIFFe, "The Effect on the t Distribution of Nonnormality in the
7. R. A. FISHER, "The Comparison of Samples with Possibly Unequal Variances".
Sampled Population", Applied Statistics, 17 (1968), 42-48.
Annals of E11genics. 9 ( 1939), 174-180.
8. R. A. FISHER, ''The Asymptotic Approach to Bchrens' Integral with Further
:t1 Tables for che d Test of Significance", Annals of Eugenics, I 1 { 1941 ), 141-172.
I!,. 9. J. NEYMAN, "Fiducial Argument and the Thcory of Confidence Intervals",

H
l'lf
., ~
10.
Bio,netrika, 32 (1941). 128-150.
H. ScHEFFÉ, "On So\utions of the Bchrens-Fishcr Problcm Based on the t-Dis-
tribution", The Annals of Matlten1arical Statistics, 14 ( 1943). 35-44.
11. H. SCHEFFÉ, ''A Note on the Behrens-Fisher Proble1n", The An11als of Mathe-
'' n,atical Statistics, 15 ( 1944 ), 430-432.
¡-
1' 12. B. L. WELCH, "Toe Significance of the Difference Bctween Two Means When
1 The Population Variances Are Unequal", Bio111etrika, 29 ( 1937), 350-361.
13. B. L. WELCH,"The Generalization of 'Student's' Problem Whcn Severa\
ri
,; ¡ Different Population Variances Are In volved", Bio,netrika. 34 ( 1947), 28-35.
14. ALICE A. AsPrN, "Tables far Use in Comparisons Whose Accuracy lnvolves
! 1
:!. 11 •
Two Variances s, Separately Estimated", Bio111etrika, 36 ( 1949), 290-296.
15. W. H. TRJCKETI, B. L. WELCH y G. S. ]AMES, "Further Critica] Valucs for the
Two-Means Problem". Biontetrika. 43 ( 1956), 203-205.
i 16. WJLLIAM G. COCHRAN, "Approximate Significance Levcls of the Behrens-
Fisher Test", Bion1etrics, 20 ( 1964), 191-195.
17. GEORGE w. SNEDECOR y WrLLIAl\.l G. COCHRAN, Statistical Merhods, 6." edi-
ción, Toe Iowa State University Press, An1es, 1967.
18. EDWARD E. CURETON, ··unbiased Estin1:1tion of thc Standard Deviation'', The
An1erica11 Statistician, 22 {febrero 1968), 22.
19. JOHN GURLAND y RAN C. TRlPATHI, "A Simple Approxin1ation for Unbiased
-------- ---Est(mar10-ñ-Oltfie-sr:anc1arffTieViaf1on"-;-TneAme/:icau Stat1sf{C/Zlll~:·r1octubíc____ ,__ _
1971), 30-32.
20. R. F. TATE y G. W. KLETI, "Optin1al Confidence Intervals for the Variance of
6
Pruebas de hipótesis

\ 11

'\
:1

6.1 I N T R O D U C C I Ó N - - - - - - - - - - - - - - - i
En el capítulo anterior se estudia un tipo de inferencia estadística, la esti-
mación. El otro tipo, las pruebas de hipótesis, es el tema de estudio en este \
capítul;-. Como ocurre con la estimación, el propósito de las pruebas de 1
hipótesis es ayudar al 1nédico, investigador o ad,ninistrador a ton1ar una '
decisión en torno a una población, al exa111inar una ,nuestra de ella. La
1J
estimación y las pruebas de hipótesis no son tan distintas como se podría
suponer por el hecho de que en la mayoría de los libros de texto se dedica
un capítulo por separado a cada una. Como se explica más adelante, es posi-
ble utilizar intervalos de confianza para llegar a las mismas conclusiones
que se alcanzan al utilizar los procedimientos de prueba de hipótesis que se
estudian en este capítulo.
Se presentan en esta sección algunos conceptos básicos, indispensables
para comprender la prueba de hipótesis. Los detalles específicos de pruebas
particulares aparecen en las secciones siguientes.
Una hipótesis se define simplemente como una proposición acerca de
una o 111ás poblaciones. En general, la hipótesis se refiere a los parámetros
de las poblaciones para las cuales se hace la proposición. El administrador de
un hospital puede suponer que el periodo promedio de permanencia de los
pacientes internados en el hospital es de cinco días; una enfermera del área
de salud pública puede suponer que un determinado programa educativo
hará que mejore la comunicacióÍl entre enfermera y paciente; un médico

245
Introducción 247
246 Pruebas de hipótesis
que se suponen ciertas en la población de interés. En general, la hipótesis nula
puede suponer que cierto medicamento será eficaz en el noventa por ciento se establece con el propósito expreso de ser rechazada. En consecuencia, el
de los casos en que se utilice. Por medio de las pruebas de hipótesis se complemento de la conclusión que el investigador desea alcanzar se convierte
determina si tales proposiciones son compatibles o no con los datos dis- en el enunciado de la hipótesis nula. En el proceso de prueba, la hipótesis nula
ponibles. puede ser rechazada o no rechazada. Si la hipótesis nula no se rechaza, se dirá
Los investigadores se interesan en dos tipos de hipótesis: de investi- que los datos sobre los cuales se basa la prueba no proporcionan evidencia sufi-
gación y estadísticas. La hipótesis de investigación es la conjetura o suposi- ciente que cause el rechazo. Si el procedimiento de prueba conduce al rechazo,
se concluye que los datos disponibles no son compatibles con la hipótesis nula,
,, ción que motiva la investigación. Puede ser el resultado de años de obser-
pero sirven como apoyo a alguna otra hipótesis. Esta otra hipótesis se conoce
¡¡ vación por parte del investigador. Una enfermera de salud pública, por
ejemplo, puede haber notado que ciertos pacientes respondieron más rápida- como hipótesis alternativa y puede designarse mediante el símbolo HA.
1 mente a un tipo particular de programa de educación sanitaria. Un médico
recordará numerosos casos en los cuales ciertas combinaciones de medidas Cuando las hipótesis son del tipo considerado en este capítulo, el indi-
1 terapéuticas fueron más efectivas que cualquiera de ellas por separado. Los cador de igualdad(=,$ o 2'.) debe aparecer en la hipótesis nula. Por ejemplo,
proyectos de investigación a menudo se llevan a cabo gracias al deseo de suponer que se requiere responder a la pregunta: ¿se puede concluir que la
1 tales profesionales de la salud para determinar si sus teorías o sospechas se media de una población es diferente de 50? La hipótesis nula es

1, pueden apoyar o no al ser sometidas a los rigores de la investigación cien-


tífica. H0: µ=SO
¡;, Las hipótesis de investigación conducen directamente a las hipótesis
·:¡ j estadísticas. Éstas se establecen de tal forma que puedan ser evaluadas por y la hipótesis alternativa es
medio de técnicas estadísticas adecuadas. En este texto, las hipótesis que se
HA:µ;,,SO
,¡¡í'
•1''· estudian son de este tipo. Para los ejemplos y ejercicios se supone que las
1
!!,
¡ hipótesis de investigación ya se han considerado.
Por conveniencia, las pruebas de hipótesis sé presentan como un proce-
Supóngase que se requiere concluir que la media de la población es mayor
que 50, se tienen las hipótesis:
dimiento de nueve pasos. Nada hay de mágico o sagrado acerca de este for-
mato particular; simplemente divide el proceso en una secuencia lógica de H0 : µ~SO HA:µ>SO
acciones y decisiones.
Si se quiere saber si es posible concluir que la media de la población es
l. Datos. Es necesario comprender la naturaleza de los datos que forman la base de menor que 50, las hipótesis son
los procedimientos de prueba, ya que esto detennina la prueba particular que se
ha de utilizar. Se debe determinar, por ejemplo, si los datos constan de conteos H0: µ~SO HA:µ< SO
o medidas.
En resumen, es posible establecer las siguientes reglas empíricas para
2. Suposiciones. Como se estudió en el capítulo relacionado con la estimación,
decidir qué proposición se utiliza como hipótesis nula y cuál como hipótesis
diferentes suposiciones conducen a modificar los intervalos de confianza. Lo
mismo ocurre en las pruebas de hipótesis: un procedimiento general se modifica alternativa.
según las suposiciones. De hecho las mismas suposiciones que son importantes a. La conclusión a la que se espera llegar como resultado de la prueba ge-
en la estimación, también lo son para las pruebas de hipótesis. Se ha visto que neralmente se usa como hipótesis alternativa.
éstas incluyen, entre otras. suposiciones respecto a la normalidad de la distribu- b. La hipótesis nula debe contener una proposición de desigualdad. ya sea =.
ción de la población. igualdad de variancias e independencia de las muestras.
:So~-
3. Hipótesis. En las pruebas de hipótesis se trabaja con dos hipótesis estadísticas c. La hipótesis nula es la que debe ser comprobada.
que deben enunciarse explícita.mente. La psimera.J;s_Ja.hi.pfltesis q~dd.ze p~ ___ , ___ _ d.--t.:as-h ipótesis-n ula-y----a1 terna ti va ·son complementarias. -Es..dec.ii:,-las dos con-______ _
barse, mejor conocida como hipótesis nula, y que se designa por el símbolo H0. templan detalladamente todos los valores posibles que los parámetros de
La hipótesis nula a veces se conoce como hipótesis de no diferencia, ya que es suposición pueden asumir.
una proposición de conformidad con (o no diferencia respecto a) condiciones
l11troducció11 249
248 Pruebas de hipótesis
sigue una distribución normal estándar si la hipótesis nula es verdadera y si
Debe señalarse que ni las pruebas de hipótesis ni la inferencia estadísli-
ca conducen a la prueba de una hipótesis, sino que sin1plemente indican si satisface las suposiciones.
ésta es apoyada o no por los datos disponibles. Por lo tanto, cuando no es 6. Regla de decisión. Todos los valores posibles que la estadística de prueba
posible rechazar una hipótesis nula, no se dice que es verdadera, sino que puede asumir son puntos sobre el eje horizontal de la gráfica de la distribu-
puede ser verdadera. Cuando se habla de aceptar una hipótesis nula, se tiene ción de dicha estadística y se dividen en dos grupos: uno de ellos constituye
presente está limitación y no se desea comunicar la idea de que la acepta- lo que se conoce como región de recha:o y el otro forma la región de
ción implica la demostración. acepración. Los valores de la estadística de prueba que forman la región de
rechazo son aquellos que tienen la menor probabilidad de ocurrir si la
4. Estadística de prueba. La estadística de prueba es alguna estadística que se hipótesis nula es verdadera, mientras que los que forman la región de acep-
puede calcular a partir de los datos de la muestra. Como regla, existen muchos tación tienen la mayor probabilidad de ocurrir si la hipótesis nula es ver·
valores posibles que puede asumir la estadística de prueba y el valor particular dadera."La regla de decisión seíiala que se debe rechazar la hipótesis nula
observado depende de la muestra particular extraída. Como se verá más ade- si el valor de la estadísrica de prueba que se calcula a partir de la muestra
lante, la estadística de prueba sirve como un produc1or de decisiones, ya que la es uno de los valores de la región de rechazo, y que no se debe rechazar la
decisión de rechazar o no la hipótesis nula depende de la magnitud de la es- hipótesis nula si el valor calculado de la estadística de prueba es uno de los .¡
1.adística de prueba. Un ejemplo de estadística de prueba es la cantidad valores de la región de aceptación.
i - µ()
La decisión en cuando a qué valores van hacia la región de rechazo y
' alvñ cuáles van hacia la región de aceptación se toma con base en el nivel de sig-
nificación deseado, que se designa por a. El término nivel de significación
donde µ0 es un \·alar supuesto de la media de una población. Esta estadís1i-
ca de prueba est:i relacionada con la estadística refleja el hecho de que algunas veces las pruebas de hipótesis reciben el
nombre de "pruebas de significación" y un valor calculado para la estadísti-

. - i - µ
---
alvñ
ca de prueba que cae en la región de rechazo se dice que es significativo. El
nivel de significación, a, designa el área bajo la curva de la distribución de
la estadística de prueba que está por encima de los valores. sobre el eje hori-
que ya es familiar. zontal, que constituyen la región de rechazo. Se ve entonces que a es una
probabilidad y, de hecho, es la probabilidad de rechazar una hipótesis nula
La siguiente es la fórmula genefal para una estadística de prueba que se verdadera. Dado que rechazar una hipótesis nula verdadera sería un error,
aplica en muchas de las pruebas de hipótesis estudiadas en este libro: parece razonable que se deba hacer pequeña a la probabilidad de cometerlo
y, de hecho, esto es Jo que se hace. Se elige un valor pequeño de a para
, . d b estadística relevante - parámetro supuesto hacer que la probabilidad de rechazo para una hipótesis nula sea pequeña.
estad 1sttca e prue a= Los valores de a que se encuentran con más frecuencia son .01, .05 y .10.
error estándar de la estadística relevante
El error que se comete cuando se rechaza una hipótesis nula verdadera
En este ejemplo, X es la estadística relevante, µ 0 es el parámetro supuesto y se conoce como error del tipo J. El error del tipo ll se comete cuando no se
cr I ,r¡; el error estándar de X, la estadística relevante. rechaza una hipótesis nula falsa. La probabilidad de cometer un error del
tipo 11 se designa por ~·
5. Distribución de la estadútica de prueba. Se ha señalado que la clave para la Siempre que se rechaza una hipótesis nula se tiene el !'iesgo concomi-
inferencia estadíslica es la distribución muestra!. Es necesario recordar esto en tante de cometer un error del tipo 1, al rechazar una hipótesis nula ver-
los casos en que sea necesario especificar la distribución de probabilidad de la
dadera. Siempre que no se rechaza una hipótesis nula, existe el riesgo de
estadística de prueba. Por ejemplo, la distribución de la estadística de prueba.
aceptar una hipótesis nula falsa. En general, aunque se hace pequeño a a,
i - µo no se ejerce control sobre ~, a pesar de saber que en la mayoría de las situa·
.. = a!Vn cienes prácticas es mayor que a.
250 Pruebas de hipótesis Jntroducció11 251
CONDICIÓN DE LA HIPÓTESIS NULA
Evaluar
Verdadera Falsa los datos

Acción No rechazar Acción correcta Error de tipo 11


posible Ho
Revisar las
Rechazar H 1 Error de tipo I Acción correcta suposiciones

Figura 6.1.1. Condiciones en las que es posible cometer un


error de tipo I y un error de tipo 11.
Formular
la hipótesis
Nunca se sabe si se ha cometido o no uno de estos errores, cuando se
rechaza o no se rechaza una hipótesis nula, ya que se desconoce el ver-
dadero estado de las cosas. Si el procedimiento de prueba conduce al re-
Seleccionar
chazo de la hipótesis nula verdadera puede ser un consuelo el hecho de que la estadística
de prueba
al hacer pequeño a a, la probabilidad de cometer un error del tipo I también
es pequeña. Se se acepta la hipótesis nula, no se conoce el riesgo concu-
rrente de cometer un error del tipo II, ya que por lo común se desconoce p, Determinar
la distribución
pero en general, como se ha señalado, se sabe que es mayor que a. IJe la estadístT
de .e_rueba
La figura 6.1. l muestra las posibles acciones que el investigador puede
emprender para varias condiciones de una prueba de hipótesis y las condi-
ciones en las que se produce cada uno de los dos tipos de error. Formularla
regla
de decisión
7. Cálculo de la estadística de prueba. A partir de los datos contenidos en la
muestra, se calcula un valor de la estadística de prueba y se ¡;ampara con
las regiones de aceptación y rechazo que ya fueron especificadas. Calcul~
la estadí;iica I
8. Decisión estadística. La decisión estadística consiste en el rechazo o no re- de prueba
chazo de la hipótesis nula. Se rechaza si el valor calculado de la estadística
de prueba cae en la región de rechazo, y no se rechaza si el valor calculado
de la estadística de prueba cae en la región de aceptación. No re~azar )----..-< Formular
la decisión
9. Conclusión. Se H 0 se rechaza, se concluye que HA es verdadera. Si H0 no se estadlstiea
rechaza, se concluye que H0 puede ser verdadera.
Cor.:luir que f1o Concluir que HA .'
Es importante aclarar que cuando la hipótesis nula no es rechazada, puede ser verdadera es verdadera
tampoco se puede decir que se acepta. Se debe decir que la hipótesis nula
1
; 1
"no se rechaza". Se evita el uso de la palabra "aceptar" en este caso porque Figura 6.1_2. Pasos del procedinüento de P,rueba de hipótesis.
'
pudiera haberse cometido el error de tipo 11. Dado que, frecuentemente, la
probabilidad de cometer un error de tipo 11 puede ser realmente alta, no se hipótesis nula, la decisión clínica o administrativa se refleja, por lo general.
pretende cometerlo al aceptar la hipótesis nula. en el hecho de que la decisión es compatible con la hipótesis alternativa. En
La figura 6.1.2 muestra en un diagrama de flujo los pasos a seguir cuan- general, se cumple lo opuesto si no se rechaza la hipótesis nula. Sin embar-
do se aplica una prueba de hipótesis. go, la decisión administrativa o clínica puede tener otras fonnas, como la
• -lJ-no-de-1 os-preipósitos-de-1 as-pruebas- de-h-i pótesfs-es-ayudara--1-os-adrni ~- --·- decisión. de reunir másdatos. --· - -·---- -
nis tradores y médicos en la toma de decisiones. En general, la decisión Sin embargo, en este punto es necesario destacar que el resultado de la es-
clínica o administrativa depende de la decisión estadística. Si se rechaza la tadística de prueba sólo es una parte de la evidencia que influye sobre la
252 Pruebas de hipótesis
Prueba de hipótesis: la ,nedia de una sola población 253

decisión administrativa o clínica. La decisión estadística no debe interpre- Solución Con base en el conocin1iento de pruebas de hipótesis, se puede
tarse como definitiva, sino que debe considerarse junto con toda la demás contestar que es posible concluir que el nivel medio de la enzima es diferen-
información importante de que disponga el experimentador. te de 25, sólo si se puede rechazar la hipótesis nula que indica que la media
Con base en estos comentarios generales se estudian a continuación es igual a 25. Mediante el uso del procedimiento de prueba de hipótesis,
pruebas de hipótesis específicas. explicado en la sección anterior. se puede ayudar a los investigadores a to-
mar una decisión.

6.2 PRUEBA DE HIPÓTESIS: l. Datos. Los datos disponibles para los investigadores son las determinaciones de
LA MEDIA DE UNA SOLA POBLACIÓN _ _ _ _ _ __ 1-a enzima hechas en una muestra de 10 individuos extraída de la población de in-
terés (ver el ejemplo 5.2.1 para observar los datos). A partir de esta muestra se
En esta sección se estudia la prueba de una hipótesis en tomo a la media de ha calculado que la media de la misn1a es X= 22.
una población según tres condiciones distintas: l) cuando el muestreo se 2. Suposiciones. Se supone que la muestra de valores proviene de una población
1
realiza a partir de una población de valores que siguen una distribución nor- que sigue una distribución normal. Supóngase ta1nbién que la población liene
mal con variancia conocida; 2) cuando el muestreo se realiza a partir de una una variancia conocida de cr 2 = 45. !
población con distribución normal y con variancia desconocida, y 3) cuando 3. Hipótesis. La hipótesis a probar. o hipótesis nula, es la siguiente: la concentra- 1
'!
el muestreo se realiza a partir de una población que no presenta una dis- ción de la enzima es igual a 25. La hipótesis alternativa indica que la concen-
tribución normal. Aunque la teoría para las condiciones 1 y 2 depende de tración n1edia de la enzima de la población es diferente de 25. Es importante
notar que se está identificando la hipótesis alternativa con la conclusión a la que
1 ¡
poblaciones con distribución nonnal, es una práctica común aplicar la teoría I'
se quiere llegar. de n1anera que si los datos permiten rechazar la hipótesis nula,
cuando las poblaciones !mportantes sólo están distribuidas en fonna aproxi-
la conclusión de los investigadores tendrá 1nayor peso, dado que la probabilidad '
!
madamente normal. Esto es satisfactorio mientras la desviación de la nor-
co1nplementaria de rechazar una hipótesis nula verdadera es pequeña. Es nece-
malidad es 1noderada. Cuando el muestreo se realiza a partir de una pobla- sario asegurarse de esto al asignar un valor pequeño a a. que es la probabilidad
ción que sigue una distribución normal y se conoce la variancia de la po- de con1eter un error de tipo l. Se puede presentar la hipótesis relevante en foITTJa
blación, la estadística de prueba para H : µ e:; µ es abre\·iada de la siguiente manera:
0 0

i - µo H0 :µ=25
z - ;;,¡;, (6.2.1)
H0:µ*25

4. Estad(stica de pn1eba. Dado que se está probando una hipótesis acerca de la


la cual, cuando H0 es verdadera, tiene una distribución normal estándar. Los
media de una población y que se supone que ésta sigue una distribución normal,
ejemplos 6.2.1 y 6.2.2 ilustran la prueba de hipótesis en estas condiciones. y puesto que la variancia de la población es conocida, la estadística de prueba se
obtiene mediante la ecuación 6.2.1.
Muestreo a partir de poblaciones con distribución normal: variancias S. Dist1ib11cid11 de la esrud(stica de prueba. Con base en el conocimiento acerca de
de población conocidas Co1no se hizo notar en el capítulo 5, nuevamente las distribuciones ,nuestrales y de la distribución nonnal. se sabe que la estadís-
se destaca que las situaciones en las que la variable de interés sigue una dis- tica de prueba tiene una distribución norn1al con una media de O y una variancia
tribución normal con variancia conocida son casos poco comunes. El si- de 1. si H 0 es \'Crdadera. Existen 1nu..:hos \'alares posibles para la estadístic_a de
prueba que se pueden generar en la situación actual: uno por cada n1uestra posi-
guiente ejemplo, sin embargo, sirve para ilustrar el procedimiento.
ble de ta1naño 10 que pueda ser extraída de la población. Dado que se extrajo
una s.ola n1uestra. se tiene sólo uno de esos \·alares posibles en el cual basar la
Ejemplo 6.2.J Un grupo de investigadores está interesado en conocer la decisión.
concentración media de una enzima en cierta población. Por decirlo así, se 6. Regla de decisión. La regla de decisión indica que H0 se ha de rechazar si el
preguntan lo siguiente: ¿Es posible concluir que el nivel medio de la enzi1na valor calculado de la estadística de prueba cal;" en la región de rechazo y no se
en esta población es diferente de 25? ha de rcrhazar si cae en la región de aceptaci0n. A continuaci0n es nccc~ario
254 Pruebas de hipótesis frueha de hipótesis: la n1edia de una sola població11 255

especificar las regiones de rechazo y aceptación. Se puede empezar por pre-


' • 1
guntar cuál debe ser la magnitud de los valores de la estadística de prueba para
rechazar a H0. Si la hipótesis nula es falsa, esto se debe a que la media real es
menor que 25 o a que la media real es mayor que 25. Por lo tanto, los valores
de la estadística de prueba suficientemente pequeños o suficientemente gran-
c,}2 = .025 .95
des causan el rechazo de la hipótesis nula. Estos valores extremos constituyen c,}2 = .025
la región de rechazo. ¿Qué tan extremo debe ser un valor posible de la estadís-
tica de prueba para ser clasificado dentro de la región de rechazo? La respues- -t.96 o 1.96 •
ta depende del nivel de significación elegido, es decir, del tamaño de la proba- ------,----J'--~~~-J'--~~~
Región de rechazo Regíón Región de rechazo
bilidad de cometer un error del tipo L Supóngase que se quiere que la pro-
de aceptación
babilidad de rechazar una hipótesis nula verdadera sea a = .05. Dado que la
Figura 6.2.1. Regiones de rechazo y aceptación para el
región de rechazo está formada por dos partes, los valores suficientemente
ejemplo 6.2. l.
pequeños y los suficientemente grandes de la estadística de prueba, una parte
de a está asociada con los valores grandes y la otra parte con los valores
pequeños. Parece lógico que se pueda dividir a a en partes iguales y que a/ 2
= .025 esté asociada con valores pequeños y que a I 2 = .025 se asocie con rechace H0 si se obtiene cualquier otro valor. El valor de a y, en consecuen-
valores grandes. cia, la regla de decisión deben ser establecidos antes de reunir los datos.
Esto evita que los resultados de la muestra influyan en la decisión que se va

¡ ¿Qué valor de la estadística es tan grande que, cuando la hipótesis nula


es verdadera, la probabilidad de obtener un valor igual o mayor es de .025?
a tomar. Esta condición de objetividad es muy importante y debe conser-
varse en todas. las pruebas.
En otras palabras, ¿cuál es el valor de z a la derecha del cual está .025 del
I¡ área bajo la distribución normal estándar? El valor de z a la derecha del cual
está .025 del área es el mismo valor entre -oo y hasta el cual está .975 del
7. Cálculo de la estadística de prueba. A partir de la muestra se calcula

22 - 25 -3
área. Se busca en el cuerpo de la tabla C hasta encontrar .975 o su valor z == = - - = -1.41
V45! 10 2.1213


más cercano y se leen las anotaciones correspondientes al margen para
obtener el valor de ;,,;. Para el presente ejemplo, z = 1.96. Un razonamiento 8. Decisión estadística. Con base en la regla de decisión, no se puede rechazar la
1•1
''
¡
¡
·1
similar permite encontrar que -1.96 es el valor de la estadística de prueba hipótesis nula dado que -1.41 no está en la región de rechazo. Se puede decir
tan pequeño que, cuando la hipótesis nula es verdadera, la probabilidad de que el valor calculado de la prueba estadística no es significativo al nivel .05.
obtener un valor así de pequeño o menor es de .025. Nuestra región de re- 9. Conclusión. Se concluye que µ p11ede ser igual que 25 y que las acciones del
chazo, entonces, consiste en todos los valores de la estadística de prueba administrador o médico deben estar de acuerdo con esta conclusión.
1 mayores o iguales que 1.96 o menores o iguales que -1.96. La región de
aceptación se compone de todos los valores intermedios. Se puede estable- Valores p En lugar de decir que un valor observado de la estadística de
cer la regla de decisión para esta prueba como sigue: Rechazar H0 si el prueba es significativo o no significativo, muchos autores de obras de inves-
i·alor calculado de la estadística lÍe prueba es;?:: 1.96 o~ -1.96. De otra tigación prefieren infonnar la probabilidad exacta de obtener un valor tanto
forma, no se rechaza H0. Las regiones de la aceptación y rechazo se mues- o más extremo que el observado, si la hipótesis nula es verdadera. En el pre-
tran en la figura 6.2.1. Los valores de la estadística de prueba que separan sente caso, estos autores darían el valor calculado de la estadística de prue-
las regiones de aceptación y rechazo se llaman valores críticos de la esta- ba junto con la proposición p = .1586. Dicha proposición significa que la
dística de prueba y la región de rechazo se conoce también como región probabilidad de obtener un valor tan extremo como 1.4 l en cualquier direc-
crítica. ción, cuando la hipótesis nula es verdadera. es de .1586. Este valor se ob-
-- -·- - ..-------la-i:eg-1 a-de-de---e-i-5-i én-ind·i(;-fl-que-se-e-ale-u-1 e-u-n-v-al EJ.F-¡=iam-1-a---e-s-t-ad-fst-ie-a- de- --- tiene·-de--la- tabl-a-C------y-e-s-la-probabil idad.de...obser-Nar.....:;_2::...J..41 o a .:..5...=l4 I__
prueba a partir de los datos de la muestra y que se rechace H0 si se obtiene cuando la hipótesis nula es verdadera. Es decir, cuando H 0 es verdadera.
un valor mayor o igual que 1.96 o menor o igual que -1.96 y que no se la probabilidad de obtener un valor de:. n1ayor o igual a 1.41 es de .0793. y_la
Prueba de hipótesis: la media de una sola población 257
256 Pruebas de hipótesis
conclusión mediante el uso de un intervalo de confianza del 100(1 - a)
probabilidad de observar un valor de z menor o igual que -1.41 es de .0793.
La probabilidad de que ocurra cualquiera de estos casos, cuando H0 es ver- por ciento. El intervalo de confianza del 95 por ciento paraµ es
dadera, es igual a la suma de las dos probabilidades individuales y, en conse-
cuencia, en este ejemplo, se dice que p = .0793 + .0793 = .1586. La cantidad 22 ± l.96V457Ti'i
p se conoce como el valor p de la prueba. 22 ± 1.96(2.1213)
22 ± 4.16
DEFINICIÓN _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _~ 17.84, 26.16

El valor p para la prueba de una hipótesis es la probabilidad


Dado que este intervalo incluye a 25, se dice que 25 es un candidato para la
de obtener, cuando H 0 es verdadera, un valor de la estadística
media que se está estimando y, por lo tanto,µ puede ser igual a 25 y H0 no
de prueba tan extremo o más (en la dirección adecuada) que el
valor calculado en realidad. se rechaza. Esta es la misma conclusión a la que se llegó mediante el proce-
dimiento de pruebas de hipótesis.
Si el parámetro supuesto, 25, no se hubiera incluido en el intervalo de
confianza del 95 por ciento, es decir, si el límite inferior del intervalo calcu-
El valor p para una prueba puede definirse también como el valor más lado hubiera sido mayor que 25 o si el límite superior hubiera sido menor
pequeño de a por el cual la hipótesis nula se puede rechazar. Por ejemplo, si que 25, se habría dicho que H se rechaza en el nivel .05 de significación.
0
p es igual a .001, se sabe que se podría haber seleccionado un valor a tan En general, cuando se prueba una hipótesis nula por ,nedio de un i11tervar
pequeño como .001 y aun rechazar la hipótesis rnuia. Se se hubiera selecr lo de con.fianza bilateral, se rechaza a H 0 en el nivel a de significación si
cionado un valor más pequeño que .001, no hubiese sido posible rec~azar la el parátnetro sup11esto no está contenido denrro del intervalo de confianza
hipótesis nula. Una regla general que vale la pena recordar es: Si el valor p del 100( 1 - a) por ciento. Si el pará111etro supuesto está contenido den-
es ,nenor o igual que a., es posible recha::_ar la hipótesis 1111/a. Si el valor tro de dicho inten1alo, no es posible rechazar H0 en el nivel a de signifir
pes ,nayor que a., no es posible recha::..ar la hipótesis nula. cación.
El informe de valores p como parte de los resultados de una investir
gación proporciona más información al lector que afirmaciones tales como Prueba de hipótesis unilateral El intervalo de hipótesis ilustrada por el
''la hipótesis nula se rechaza en el niv"e! .05 de significación" o "los resulta- ejemplo 6.2. l es un ejemplo de prueba bilateral, llamada así porque la
do~ no fueron significativos en el nivel .05". Al informar el valor p asociado región de rechazo se divide entre los dos lados o colas de la distribución de
con una prueba se permite al lector saber con exactitud qué tan éxtraño o la estadística de prueba. Una prueba de hipótesis puede ser unilateral, en
qué tan co1nún es el valor calculado de la estadística de prueba dado que Hq cuyo caso toda la región de rechazo está en una u otra cola de lá distribur
es vertjí:!-dera. Se recomienda consultar los libros de Gibbons y Pratt, 1 Hahn- ción. El que se utilice una prueba unilateral o bilateral depende de la natur
y Daniel 3 para un tratamiento más extenso acerca de la materia de los valor raleza de la cuestión planteada por el investigador.
res p. También resulta de interés el artículo de Margan y Margan ...¡ Si tanto los valores pequeños como los grandes causan el rechazo de
una hipótesis nula, lo indicado es utilizar una prueba bilateral. Cuando úni-
camente los valores suficientemente "pequeños" o suficientemente "granr
Prueba de H Opor medio de un intervalo de confianza Anteriormente se
des" causen el rechazo de la hipótesis nula, Jo indicado es utilizar una pruer
estableció que es posible utilizar intervalos de confianza para probar hipóter
sis. En el ejemplo 6.2.1 se utilizó un procedimiento de prueba de hipótesis ba unilateral.
para probar H 0: µ = 25 contra la alternativa HA:µ 'et 25. No fue posible rer
Ejemplo 6.2.2 Con base en el ejercicio 6.2.1, suponer que, en lugar de prer
chazar la hipótesis nula H 0 debido a que el valor calculado de la estadística
de prueba cayó en la región de aceptación. guntarse si se pudiera concluir que µ-.¡:. 25, los investigadores se hubieran
A continuación se muestra cón10 se hubiera podido llegar a esta misma preguntado: ¿se puede concluir que µ < 25'? A esta pregunta podría respon-
258 Pruebas de hipótesis Prueba de hipótesis: la media de una sola población 259
derse que se puede llegar a esta conclusión si es posible rechazar la hipóte- -1.645. Finahnente, se especifican las regiones de aceptación y se rnuestran en
~is nulaµ 2: 25. la figura 6.2.2.
La regla de decisión señala que se rechaza H0 si el valor calcu!aJo de la
Solución Mediante el uso del procedimiento de l0s nueve pasos y con base estadística de prueba es n1cnor o igual que-l.645.
en una prueba unilateral se llega a una decisión. 7, Cálculo de la estadística de prueba. A partir de los datos, se calcula que

l. Datos. Ver el ejen1plo anterior. 22 - 25


Y45/ lü ~ -
¡
2. Suposiciones. Ver el ejen1p\o anterlor. 1.-!I
3. Hipótesis
H 0 : µ:?:25 8. Decisión estadística. No se puede rechazar la hipótesis nula debido a que -1.41
>-1.645.
HA:µ<25
9, Conclusión. Se concluye que la media real de la población puede ser mayor o
igual que 25 y se deberá actuar en consecuencia.
La desigualdad de la hipótesis nula in1plica que ésta conste de un nún1ero infini-
to de hipótesis. La prueba sólo se hará en el punto de la igualdad, ya que es posi-
ble mostrar que si H 0 se rechaza cuando la prueba se hace en el punto de la
igualdad, ésta sería rechazada si la prueba se hubiera hecho para cualquier otro El valor p para esta prueba es .0793, ya que P(z. ~ -1.41), cuando H es
0
valor deµ indicado en la hipótesis nula. verdadera, es de .0793, valor que se da en la tabla C cuando se determina la
magnitud del área a la izquierda de -1.41 bajo la curva nonnal estándar.
4. Estadística de prueba Puede probarse una hipótesis nula unilateral ·por medio de un intervalo de
:\' - µ11 confianza unilateral. Sin embargo, en este libro no se estudia la elaboración •
z.::::: a!Vii e inlerpretación de este tipo de intervalos de confianza. Se sugiere que el
lector consulte el estudio de este te,na en el libro de Daniel. 5
5. Distribución de la estad!'.rtica de prueba. Ver el ejemplo anterior. Si la pregunta de los investigadores hubiera sido: ·"¿es posible concluir
6. Regla de decisión. Sea nuevamente u= .05. Para determinar dónde .ubicar la que la media es mayor que 25?", al seguir el procedimiento de los nueve
región de rechazo, es necesario preguntarse respecto a la magnitud de los valo- pasos se habría llegado a una prueba unilateral con toda la región de recha-
res que causarían el rechazo de la hipótesis nula. Sí se observa la hipótesis, se zo en la cola superior de la distribución de la estadística de prueba y a un
ve que los valores suficientemente pequeños causarían el rechazo y que los valor de +1.645.
valores grandes tienden a reforzar la hipótesis nula. Es de desear que la región
de rechazo esté donde están los valores pequeños. es decir. en la i.:ola inferior de Muestreo a partir de una población con distribución normal: variancia
la distribución. Esta vez, dado que se tiene una prueba unilateral. todo a irá en de la población desconocida Como ya se ha señalado, en general se
la única cola de la distribución. Al consultar la tabla C. se em..:ucntra que el \"Uior desconoce la variancia de la población en situaciones reales que tienen que
de ~ a la izquierda del cual está .05 de! área bajo !a curva normal estándar es de ver con la inferencia estadística en torno a la media de una población.
Cuando el muestreo se realiza a partir de una población que sigue una dis-
a = 1 tribución normal con una variancia desconocida, la estadística de prueba
1 para H0 : µ = µ 0 es

.t - µ()
.95
.os .\"/y;; (6.2.2)
,Mf!I
.o~ ·o z Figura-6;:;.. __ Rcy_~ne 1.: la cual, cuandO H0 es Verdii.dera, sigue url"a distribución t de Student con
-v----1 rec~azo Y aceptacion para n - ] grados de libertad. El siguiente ejemplo ilustra el procedimiento de
Región de rechazo Región de aceptación el CJCinp!o b. 2 ·2 · prueba de hipótesis cuando se supone que la población sigue una distribu-
260 Pruebas de hí'pótesis Prueba de hipótesis: la media de una sola població11 261
ción normal y se desconoce la variancia. Esta situación es muy común en la 9. Conclusión. La conclusión basada en estos datos es que la media de la po-
vida real. blación de la cual se extrajo la muestra es difercn1e de 120.

Ejemplo 6.2.3 Varios investigadores reunieron las concentraciones de ami- El valor p exacto para esta prueba no se puede obtener de la tabla E
lasa en el suero de una n1uestra aleatoria de 15 personas aparentemente debido a que ésta sólo contiene los valores t para percentiles seleccionados.
sanas. Desean saber si es posible concluir que la media de la población de la Sin embargo, el valor p puede considerarse como un intervalo. En este
cual se extrajo la muestra es distinta de 120. La media y desviación estándar ejemplo, -2.65 es menor que -2.624, el valor ta la izquierda del cual está
calculadas a partir de la muestra son 96 y 35 unidades I l 00 mi, respectiva- .01 del área bajo t con 14 grados de libertad, pero mayor que -2.9768, a la
mente. izquierda del cual está .005 del área. En consecuencia, cuando H 0 es ver-
dadera, la probabilidad de obtener un valor de t menor o igual que -2.65 es
Solución Los investigadores pueden confinnar su hipótesis si logran re- menor que .01, pero mayor que .005. Es decir, .005 < P(t ::f -2.65) < .01.
chazar la hipótesis nula que dice que la media real es 120. Esto sugiere una Dado que la prueba es bilateral, debe permitirse la posibilidad de un valor
prueba de hipótesis bilateral que se lleva a cabo mediante el uso del proce- calculado de la estadística de prueba tan grande en la dirección opuesta
dimiento de los nueve pasos. como el observado. La tabla E revela que .005 < P(t ~ 2.65) < .01. El valor
p, entonces, es de .01 < p < .02. La figura 6.2.4 muestra el valor p para este
l. Datos. Los daros consisten en las concentraciones de amilasa en suero ob- ejemplo.
tenidas de 15 personas aparentemente sanas. Si en el ejemplo anterior la hipótesis hubiera sido
2. Suposiciones. Las 15 concentraciones constí1uyen una n1uestra aleatoria de
una población de concentraciones con distribución normal. Se desconoce la H 0 : µ;, 120
variancia de la población.
3. Hipótesis HA:µ< 120
H0 :µ=120
el procedimiento de prueba habría conducido a una prueba unilateral con
HA:µ ,e 120
toda la región de rechazo en la cola inferior de la distribución, y si la hipó-
4. E;tadística de prueba. Dado que se desconoce la variancia de la población. tesis hubiera sido
la estadística de prueba se obtiene mediante la ecuación 6.2.2. H0 :µ5120
5. Distribución de la estadís1ica de prueba. La estadística de prueba sigue una HA:µ>120
distribución r de Student, con 11 - 1 grados de Jiber1ad, si H es verdadera.
0
6. Regla de decisión. Sea a = .05. Dado que se tiene una prueba bilateral, se se habría tenido una prueba unilateral con toda la región de rechazo en la
pone a 12 = .025 en cada cola de la distribución de la estadística de prueba. c"ola superior de la distribución.
Los valores de r a la derecha e izquierda de los cuales está .025 del área son
2.1448 y -2.1448. Estos valores aparecen en la tabla E. Las regiones de
aceptación y de rechazo se muestran en la figura 6.2.3.
La regla de decisión indica que es necesario calcular un valor para la
estadística de prueba y que se debe rechazar H0 si el Yalor de t calculado es
mayor o igual que 2.1448 o n1enor o igual que -2. J 448.
7. Cálculo de la estadística de prueba

96 - 120 -24
t = = - - = -2.65 -2.1448 o 2.1448
35 I VTI 9.04
Región de rechazo Región de aceptación Región de rechazo
8. Decisión estadística. Se rec;haza H 0, ya que -2.65 cae en la región de re-
chazo. Figura 6.2.3. Regiones d\' rechazo y aceptación para el ejemplo 6.2.3.
r
262 Pruebas de hipótesis Prueba de hipótesis: la inedia de una sola pvb/acián 263
l. Datos. Los datos constan del número de recetas pedidas a 150 personas, con
Área~ .01 Área~ .01
X=5.8ys=3.l
.01 >Área > .OOS
----~ 2. Suposiciones. Los datos constituyen una muestra aleatoria de una población
.01 > Área > .005
~ ! Area = .005
que no presenta una distribución normal.
1 3. Hipótesis

-2.9768 -2.65 -2.624 O 2.624 2.65 2.9768 H0: µ ~ 5


.02>p> .01
HA:µ> 5
Figura 6.2.4. Detenninación del valor p pura el ejemplo 6.2.3.
4. Esradística de prueba. La estadística de prueba está dada por la ecuación
6.2.3 dado que a se desconoce.
5. Distribución de la estadística de prueba. En virtud del teorema del límite
l\'1uestreo a partir de una población que no presenta una distribución central, la estadística de prueba sigue una distribución aproximadamen!e
normal Si, como ocurre con frecuencia, la muestra en la cual se basa la nonna! conµ= O si H0 es vercta9era.
prueba de la hipótesis acerca de la media de una población proviene de una 6. Regla de decisión. Sea Ct. = .05. El valor crítico de la estadística de prueba es
población que no presenta una distribución nonnal y si la muestra es grande de 1.645. Las regiones de aceptación y de rechazo se ilustran en la figura
(mayor o igual que 30), es posible utilizar el teorema del límite central y 6.2.5. Se rechaza H0 si se calcula z;:::: 1.645.
usar z = (X - µ 0 ) I (cr ¡.,¡--;¡)como la estadística de prueba. Si no se conoce la 7. Cálculo de la estadística de prueba
desviación estándar de la población, la práctica común es utilizar la des-
viación estándar de la muestra como una estimación. La estadística de prue-
ba para H0 : µ = µ0 , entonces, es ' -3_uV1so -
- 5.8 - 5_0 .8
.25
3.2

8. Decisión estadística. Se rechaza H0 ya que 3.2 > 1.645.


' - X -

s!Vn
µo

(6.2.3)
9. Conclusión. Se concluye que el número medio 'de recetas por persona al año
para esta población es n1ayor que .5. El valor p para esta prueba es .0007.

la cual, cuando H0 es verdadera, sigue una distribución semejante a la dis-


tribución normal estándar si n es grande. El razonamiento para sustituir a cr Si se hubiera conocido la variancia de la población, el procedimiento
con s es que la muestra grande, necesaria para que el teorema del límite habría sido idéntico al anterior, excepto que el valor conocido de cr, en lugar
central sea aplicable, proporcione una desviación estándar de la muestra que del valor de la muestra, s, hubiera sido utilizado como denominador de la
se acerque lo suficiente acr. estadística de ptueba calculada.
Según lo que hubieran querido concluir los investigadores, se podría ha-
Ejemplo 6.2.4 En una encuesta sanitaria de cierta comunidad se entrevistó ber hecho, con los datos obtenidos, una prueba bilateral como unilateral,
a 150 personas. Uno de los elementos de infonnación obtenido fue el nú- con la región de rechazo en la cola inferior de la distribución.
mero de recetas médicas por persona durante el año anterior. El número Cuando se prueba una hipótesis respecto a una sola media de una pobla-
promedio para las 150 personas fue de 5.8 con una desviación estándar de ción, se puede utilizar la figura 5.3.3 para decidir rápidamente si la estadís-
3.1. El investigador desea saber si estos datos proporcionan evidencia sufi- tica de prueba es z o t.
ciente para indicar que la media de la población es mayor que 5.
Análisis por computadora Para ilustrar el uso de la computadora para
Solucion Se drce que los datos proporc,_onan suficte_nte ev1dcnc1a para con-
·' · · · · · 1 probar
__ hipótesis
__ __ se emplea el siguiente
- ejemplo.
---- ----
-----c-Juirqm:hrrneaia de la poD!aCíofles-·m.ayor qüe-·5 si puede rechazac;e ta
hipótesis nula que propone una inedia menor o igual que 5. Puede llevarse a Ejemplo 6.2.5 Los siguientes datos son de la circunferencia craneal (en
cabo la siguiente prueba: centímetros) de 15 niños recién nacidos.
264 Pruebas de hipótesis Ejercicios 265

TTEST 34.5 C1;


ALTERNATIVE + 1 •

.05
Si la hipótesis alternativa hubiera sido µ < 34.5, el co1nando MTNITAB
sería
o 1.645 •
Región de aceptación Región de rechazo TTEST 34.5 C1;
Figura 6.2.5. Regiones de rechazo y aceptación para el ejemplo 6.2.4. ALTERNATIVE -1.

Si z es la estadística de prueba adecuada, la primer palabra del comando de


33.38 32.15 33.99 34.IO 33.97
MINITAB es ZTEST. Los comandos siguientes son los mismos que para la
34.34 33.95 33.85 34.23 32.73
prueba de t.
33.46 34.13 34.45 34.19 34.05
A partir de la impresión se deduce que el valor calculado para la es-
Se desea probar H0: µ:::: 34.5 contra HA: µ-=t 34.5. tadística de prueba es --4.31 y que el valor p para la prueba es .0007.
Cuando las estadísticas z y t son pruebas estadísticas inadecuadas para
Solución Se supone que las condiciones para utilizar la estadística t se utilizarlas con los datos disponibles, es deseable el uso de una técnica no
cumplen. paramétrica para probar una hipótesis respecto a una sola medida de tenden-
Se registran los datos de la columna 1 y se escribe el siguiente comando cia central. Uno de estos procedimientos, la prueba del signo, se estudia en
del programa MJNITAB el capítulo 11.

TTEST 34.5 C1 EJERCICIOS~~~~~~~~~~~~~~~~~~

Para cada uno de los siguientes ejercicios utilizar el procedimiento de prueba de hi-
pótesis de los nueve pasos para los niveles de significación dados. Calcular el valor
Para obtener la siguiente impresión
p para cada prueba.

TEST OF .l!IU = 3lf.SOO VS !!O N.E. 34.500 6.2.1 El administrador de un centro de salud desea saber si el tiempo medio inver-
N !1.EAN STDEV SE MEAN T P VALUE tido por los pacientes en la sala de espera es mayor que 20 minutos. Una
15 33.7"1A 0.630 0.163 -IJ.3]. 0.0007 muestra de 100 pacientes permanecieron, en promedio, 23 minutos en la sala
de espera entre el registro y la atención por algún médico del centro de salud.
La desviación estándar de la muestra fue de 10. Sea a= .05.
Los comandos del programa MINITAB para cada prueba unilateral re- 6.2.2 Fue efectuado un experimento para estudiar los efectos de cierto tipo de ciru-
quieren un subcomando. El subcomando es + l para una prueba unilateral gía cerebral en ratas. Después de la cirugía, las ratas fueron entrenadas para
con la región de rechazo en la cola derecha de la distribución de t y -1 para llevar a cabo una serie de tareas. Después del entrenamiento fueron estimu-
una prueba unilateral con zona de rechazo en la cola izquierda de la dis- ladas para llevar a cabo la tarea y se calificó a cada una de ellas con base en
tribución. Por ejemplo, si la hipótesis alternativa ·para el ejemplo hubiera su desempeño. El puntaje medio para las 16 ratas utilizadas en el experimen-
tenido µ > 34.5, el comando de MINITAB hubiera sido to fue de 90 con una desviación estándar de 10. ¿Proveen estos datos la sufi·
266 Pruebas de hipótesis Ejercicios 267
ciente evidencia para indicar que la media de la población es menor que 95? ¿Proporcionan estos datos suficiente evidencia para indicar que la media de
Sea et.= .10. ¿Qué suposiciones son necesarias para que el procedimiento sea la población es mayor que 25? Sea a= .05.
válido?
6.2.10 Después de seguir un programa de capacitación en supervisión de hospitales
6.2.3 Una encuesta en 64 laboratorios médicos reveló que el precio medio cobra- durante una semana, 16 administradores de hospital obtuvieron una califi-
do por realizar cierta prueba es de $12 con una desviación estándar de $6. cación media de 74 en una prueba llevada a cabo como parte de la eYalua-
¿Proveen estos datos la suficiente infonnación para indicar que la media de ción del programa de capacitación. La desviación estándar de la muestra fue
la población es mayor que l O? Sea a= .05. de 12. ¿Es posible concluir a partir de estos datos que la media de la po-
blación es mayor que 70'? Sea a= .05. ¿Cuáles son los supuestos que se de-
6.2.4 Se hizo un estudio de una muestra de 25 expedientes de enfennos crónicos ben cumplir?
atendidos como pacientes externos. El número medio de consultas por pa-
ciente fue de 4.8 y la desviación estándar de la muestra fue de 2. ¿Es posible 6.2.11 Se extrajo una muestra aleatoria de 16 informes de urgencias de los archivos
concluir a partir de estos datos que la media de la pob!ac:ión es mayor que de un servicio de ambulancias. El tiempo n1edio (calculado a partir de los
cuatro visitas por paciente? Suponer que la probabilidad de cometer un error datos de la muestra) para que las ambulancias llegaran a sus destinos fue de
de tipo I es de .05. ¿Cuáles son los supuestos que se deben cumplir? 13 minutos. Suponer que la población de tiempos.sigue una distribución
nonnal con unu variancia de 9. ¿Es posible concluir, en un nivel de .05 de
6.2.5 En una muestra de 49 adolescentes que se prestaron como sujetos para un significación. que la media de la población es 1nayor que JO minutos?
estudio inmunológico, una variable de interés fue la prueba del diámetro de
reacción de la piel á un antígeno. La media de la muestra y la desviación 6.2.12 Los siguientes datos son los consumos de oxígeno (en ml.J durante !a incu-
estándar fueron 21 y 11 mm de eritema, respectivamente. ¿Es posible con- bación de una muestra aleatoria de 15 suspensiones celulares.
cluir a partir de estos datos que la media de la población es menor que 30?
Sea a= .05. 14.0, 14.1, 14.5, 13.2, ll.2, 14.0, 14.1. 12.2
ll.l, 13.7, 13.2. 16.0, 12.8, 14.4, 12.9
6.2.6 Nueve animales de laboratorio fueron infec1ados con cierta bacteria y Juego
inm:unosuprimidos. El número medio de organismos aislados posteriormente ¿Proporcionan estos datos suficiente evidencia, a un nivel de .05 de signifi-
de los tejidos de dichos animales fue de 6.5 (datos codificados) con una des- cación, de que la media de la población no es igual a 12 mi? ¿Qué supuestos
viación estándar de .6. ¿Es posible concluir a partir de estos datos que la me- se deben cumplir? ,,
dia de la población es mayor que 6? Sea a= .05. ¿Que supuestos se deben
cumplir? 6.2.13 Una mues~ra aleatoria de· 20 profesores universitarios aparentemente sanos
proporcionó los siguientes valores de capacidad respiratoria máxima. ¿Es
6.2.7 Una muestra de 25 estudiantes de enfermería de primer año tuvo una califi- posible concluir que la media máxima de respiración es de 110 litros por
cación media de 77 en una prueba para 1nedir su actitud hacia el paciente minuto?
moribundo. La desviación estándar de la muestra fue de l O. ¿Proporcionan
estos datos evidencia suficiente como para indicar, a un nivel de signifi- 132, 33. 91. 108. 67. 169, 54, 203. 190. 133
cación de .05, que la media de la población es menor que 80? ¿Qué supues- 96, 30. 187, 21, 63, 166, 84. 110, 157, 138
tos se deben cumplir?
Sea a= .O l. ¿Qué supuestos se deben cu1nplir?
6.2.8 Se desea saber si es posible concluir que el consumo n1edio diario de calorías
de la población rural de un país en desarrollo es de menos de 2000. Una 6.2.14 Los siguientes datos son las presiones sistólicas sanguíneas (en mm Hg) de
muestra de 500 individuos produjo un consumo medio de 1985 y una des- 12 pacientes son1etidos a terapia medicamentosa contra la hipenensión:
----------~v~ia~c~io~-n"--"e~stwá~ondaar~de-2LO,-Sea-a~~-------------------

6.2.9 Una encuesta de 100 hospitales de tamaño similar reveló un censo medio 183, 152. 178. 157, 19-1. 163. 1--14. 11--1. 178. 152, 118. 158
diario en el servicio de pediatría de 27 con una desviación estándar de 6.5.
Prueba de hipótesis: la diferencia entre las medias de dos poblaciones 269
268 Pruebas de hipótesis

¿Es posible concluir con base en estos datos que la media de la población es 6.2.19 Una n1uestra aleatoria simple de 16 individuos extraída de una población de
menor que 165? Sea a= .05. ¿Qué supuestos se deben cumplir? adultos proporcionó un peso promedio de 63 kg. Suponer que los pesos de la
población siguen Una distribución aproximadamente nonnal con una varian-
6.2.15 ¿Es posible concluir que la edad media de defunción por la enfennedad de cé- cia de 49. ¿Proporciena la muestra de datos la suficiente evidencia para con-
lulas falcifonnes por homocigosis es menor que 30 años? Una muestra de cluir que el peso medio tic la población es menor que 70 kg? La probabilidad
50 pacientes proporciona las siguientes edades en años. de con1eter un error de tipo l es de .O 1.

15.5, 2.0, 45.1, l. 7' .8, I. l, 18.2, 9.7, 28.1, 18.2 6.3 PRUEBA DE HIPÓTESIS: LA DIFERENCIA
27.6, 45.0, 1.0, 66.4, 2.0, 67.4, 2.5, 6 l.7, 16.2, 31. 7 ENTRE LAS MEDIAS DE DOS POBLACIONES _ _ _ __
6.9, 13.5, 1.9, 31.2, 9.0, 2.6, 29.7, 13.5, 2.6, 14.4,
20.7, 30.9, 36.6, 1.1, 23.6, .9, 7.6, 23.5, 6.3, 40.2 La prueba de hipótesis que comprende la diferencia entre las medias de dos
23.7, 4.8, 33.2, 27.1, 36.7, 3.2, 38.0, 3.5, 21.8, 2.4 poblaciones se utiliza con más frecuencia para determinar si es razonable o
no concluir que las dos son distintas entre sí. En tales casos, se puede for-
mular una u otra de las siguientes hipótesis.
Sea a= .05. ¿Qué supuestos deben cumplirse?

l. H 0 : µ. 1 - µ:! = O. H. 1 : µ 1 - µ.., "F O


6.2.16 Los siguientes datos se refieren a los niveles de presión intraocular (en mm
2. H 0 : ).L 1 - µ:! e::: O, HA:µ¡ - µ.~<o
Hg) registrados en una muestra de 21 individuos de edad avanzada. H_.1 : µ 1 - µ.~>O
3. H 0 : µ 1 - µ~ s: O.

14.5, 12.9, 14.0, 16.1, 12.0, 17.5, 14.1, 12:9, 17 .9, 12.0
16.4, 24.2, Sin embargo, es posible probar la hipótesis de que la diferencia es igual
12.2, 14.4, 17.0, !O.O, 18.;, 20.8, 16.2, 14.9
19.6 que, mayor o igual que o menor o igual que algún valor distinto de cero.
Con10 se hizo en la sección anterior, la prueba de hipótesis que tienen
que ver con la diferencia entre las medias de dos poblaciones se discute en
¿Es posible concluir a parlir de estos datos que la media de la población de tres diferentes contextos: l) cuando el muestreo se realiza a partir de pobla-
la cual se extrajo la n1uestra es mayor que 14? Sea a= .05. ¿Qué supuestos cione$ con distribución nonnal y variancias conocidas; 2) cuando el mues-
se deben cumplir?
treo se efectúa a partir de poblaciones con distribución normal y con varian-
6.2.17 Suponer que los puntajes para el IQ (coeficiente de inteligencia) de una po- cias desconocidas, y 3) cuando el n1ues1reo se lleva a cabo a partir de pobla-
blación adulta siguen una distribución aproximadamente normal, con una ciones que no presentan distribución normal.
desviación estándar de 15. Una muestra aleatoria simple de 15 adultos proce-
dentes de esta población tiene un IQ medio de 105. Con base en estos datos, Muestreo a partir de poblaciones con distribución normal: se conocen
¿es posible concluir que el IQ medio para la población es diferente de 100? las variancias de las poblaciones Cuando cada una de las dos muestras
La probabilidad de con1eter un error de tipo les de .05. aleatorias simples independientes son extraídas de una población que si-
gue una distribución normal con variancia conocida. la estadística de
6.2.18 Un equipo de investigación se inclina a suponer que la presión sis1ólica san- prueba para probar la hipótesis nula de igualdad de las medias de las po-
guínea en una población de hombres sigue una distribución aproximada- blaciones es
mente normal con una desviación estándar de 16. Una muestra aleatoria
simple de 64 hombres presentó una media de presión sistólica sanguínea de
(.'\' 1 - .'\''.!) - (µ1 - µ2)u

V" ,
133. ¿Proporcionan estos datos suficiente evidencia para concluir, co~ un
nivel de .05 de significación, que la media de la población es mayor que a¡ a;;
130? - + ___:.
:. l ,,, (6.3.1)
270 Prueba5 de hipótesis Prueba de hipótesis: la diferencia entre las inedias de dos poblaciones 271
donde el subíndice O indica que la diferencia es un parámetro incluido en la
•• 1
hipótesis. Cuando H0 es verdadera, la estadística de prueba de la ecuación
6.3.1 sigue una distribución normal estándar.

Ejemplo 6.3.1 Un equipo de investigadores desea saber si los datos que


han recolectado proporcionan la evidencia suficiente para indicar una
diferencia entre las concentraciones medias de ácido úrico en el suero de -1.96 o 1.96
individuos normales e individuos con síndrome de ÜO\Vn. Los datos pre-
sentan las concentraciones de ácido úrico en el suero de 12 individuos con Región de rechazo Región de aceptación Región de rechazo
síndrome de Down y 15 individuos sanos. Las medias son x = 4.5 mg /
1 Figura 6.3.1. Regiones de rechazo y aceptación para el ejemplo 6.3. 1.
100 mi yx 2 = 3.4 mg/ml.
S. Decisión estadística. Se rechaza H0 porque 2.82 > l.96.
Solución Se dice que los datos suministran tal evidencia si es posible re- 9. Conclusión. Se concluye que. de acu~rdo con estos datos, hay indicios de que
chazar la hipótesis nula que indica que las medias son iguales. La decisión las n1edias de las poblaciones son diferentes. Para esta prueba, p = .0048.
se logra mediante el procedimiento de los nueve pasos de la prueba de hipó-
tesis.
En e! capítulo anterior, el intervalo de confianza al 95 por ciento para

l. Datos. Ver el enunciado de[ problema.


~t
1 -µ 2, calculado a partir de los mismos datos, va de .3 a 1.9. Dado que este
intervalo no incluye el O, se dice que O no es un valor candidato para ser la
2. Suposiciones. Los datos corresponden a dos muestras aleatorias simples inde- diferencia real y se concluye que la diferencia no es cero. De esta forma se
pendientes, cada una extraída de una población que sigue unu di:aribuci6n nor-
ma!. con una variancia igual a 1. llega a la misma conclusión por medio de un intervalo de confianza.
3. Hipótesis Aunque en este ejemplo las variancias fueron iguales, éste no es un re-
quisito cuando se conocen las variancias de las poblaciones, y si hubieran
lío: µ1 µ:¿ = o sido desiguales se habría seguido el mismo procedimiento de pruebas de
H,,,_: µ¡ µ:¿ =/:. o hipótesis.

1\.-luestreo a partir de poblaciones con distribución normal: se descono-


Una forma alternativa para enunciar las hipótesis es la siguiente:
cen las ,·ariancias de las poblaciones Como se ha visto, cuando las va-
riancias de las poblaciones son desconocidas existen dos posibilidades. Las
flo: µ1 = µ~ variancias de las dos poblaciones pueden ser iguales o distintas. Se consid1;;:-
11.~: µ¡ =/:. µ:,
ra el primer caso donde se sabe, o es razonable suponer, que son iguales.

4. Estadística de pr11ebc1. La estadística de prueba se obtiene mediante la ccuackín


6.3.1. Poblaciones con Yariancias iguales Cuando se desconocen las variancias
de las poblaciones, pero se supone que son iguales, se considera, de acuerdo
5. Distrib11ciú11 de la estadfstica de prueha. Cuando la hipótesis nula es \·crdadera.
[a estadísr¡ca de prueba sigue una distribución norrnal estándar. con lo aprendido en el capítulo 5, que es adecuado ponderar las variancias
6. Regla de decisi611. Sea a= .05. Lo~ valores críticos de;; son ±J .96. Se rechaza de las 1nuestras por medio de la siguiente fórmula:
H0 a menos que -1.96 < -:,akulad~ < l .96. Las regiones de rechazo y fü;eptación
se muestran en la figura 6.3. ! . (11 1 - l)si + (11~ - l)s~
s2 = --
7. Cdlculo de la estadística de pr11_e}!9. __ _ ¡, 11¡ + n'.! - 2

(-l.:> - 3.-l¡ - () l. 1 Cuando cada una de las dos nn1estras aleatorias siinples independientes se
= ~.8:1
\ V,2. + '/is .]'.-! extrae de una población que sigue una distribución normal cuyas variancias
Pruebas de hipótesis Prueba de hipótesis: la diferencia e11tre las medias de dos poblaciones 273
272
son desconocidas pero iguales. la estadística de prueba para probar H 0: µ 1 = luego, se calcula
µ 2 se obtiene mediante la siguiente fórmula:
(120-96)-0 24
-- - 1.88
(.X 1 - i2) - (µ1 - µ2)0
t - ----cF.F-or-- 1450 + 1450 12.75
'\jsp+s¡ 15 22
Vn 1 n2 (6.3.2)
8. Decisión estadística. No es posible rechazar H0 porque-2.0301 < l.88 < 20301;
la cual, cuando H 0 es verdadera, sigue una distribución t de Student con n 1 + es decir, 1.88 cae dentro de la región de aceptación.
n 2 - 2 grados de libertad. 9. Conclusión. Con base en estos datos, no es posible concluir que las dos medias
de la población son diferentes. Pa~a esla prueba .10 > p > . 05 porque 1.6896 <
Ejemplo 6.3.2 Un grupo de investigadores colectó datos acerca de las con- I.88 < 2.0301.
centraciones de amilasa en el suero de muestras de individuos sanos y de
individuos hospitalizados. Desean saber si es posible concluir que las medias Poblaciones con variancias desiguales Cuando dos muestras aleatorias
de las poblaciones son distintas. Los datos son las mediciones de amilasa en simples independientes han sido extraídas de poblaciones que siguen una
suero de n 2 = 15 individuos sanos y 11 1 = 22 individuos hospitalizados. Las distribución normal con variancias desconocidas y diferentes, la estadística
medias muestrales y sus desviaciones estándar son las siguientes: de prueba para probar H 0: µ 1 = µ 2 es

X1= 120 unidades/mi s 1 = 40 unidades/mi (i¡ - i~) - (µ¡ - µ2)0


t'
X2 = 96 unidades/mi s 2 = 35 unidades/mi
+-
S'2'
~ I n2 (6.3.3)
Solución

l. Daros. Ver el enunciado de:! problema. El valor crítico de t' para un nivel a de signific_ación y una prueba
2. Suposiciones. Los datos corresponden a dos muestras aleatorias simples inde· bilateral es aproximadamente
pendientes. cada una extraída de una población con distribución normal. Se
desconocen las variancias de las poblaciones, pero se supone que son iguales. w 1t 1 + IV~li
J'¡ - o:. I '2 (6.3.4)
3. Hipótesis · W¡ + U•~

Ho:µ1-µ2=0,
HA: µ1-µ2*º· s1
donde w = I nl' w 2 = si I n 2, t 1 = t 1 -a/ 2 para n 1 - 1 grados de libertad, y
1
t = t _a para 11 - l grados de libertad. El valor crítico de t' para una
4. Estadística de prueba. La estadística de prueba se obtiene mediante la ecuación 2 1 12 2
prueba unilateral se encuentra al calcular r' 1 _ o: mediante la ecuación 6.3.4,
6.5.2.
5. Disrribución de la estadística de prueba. Cuando la hipótesis nula e~ verdadera, en la que se utiliza t 1 = r1_apara n 1 - l grados de libertad y t2 = t 1_ 0 para
la estadística de prueba sigue una distribución r de Student con n 1 + 11 2 - 2 gra· n2 - l grados de libertad.
dos de Jibenad. Para una prueba bilateral se rechaza H 0 si el valor calculado de t' es
6. Regla de decisió11. Sea a= .05 los \·alares críticos tle t son ± 2.0301. Se rci.:haza mayor o igual al valor crítico dado por la ecuación 6.3.4, o es menor o igual
H0 a menos que -2.0301 < t,akul~da < 2.030 l. al negativo de ese valor.
7. Cálculo de la e.Hadísrica de prueba. Primero se ponderan las variani.:ias de las Para una prueba unilateral con la región de rechazo en la cola derecha
muestras para obtener de la distribución muestra!, rechazar H0 si el cálculo de t' es igual o mayor a
la t' crítica. Para una prueba unilateral con una región de rechazo en la cola
;! ] (-.1(J )"-' T ] ·t('.1;) ¡"-' izquierda, rechazar H 0 si t' es igual o menor al negativo de la t' crítica calcu·
sf, ~J + 1--1
145()
lada por medio de la adaptación de la ecuación 6.3.4.
1
j.
Prueba de hipótesis: la diferencia entre las medias de dos poblaciones 275
1 274 Pruebas de hipótesis

Ejemplo 6.3.3 Un grupo de investigadores quiere saber si dos poblaciones l.\tluestreo a partir de poblaciones que no presentan distribución normal
i difieren con respecto al valor medio de la actividad total del complemento Cuando el muestreo se realiza a partir de poblaciones que no presentan dis-
Ii r del suero (CH 50 ). Los datos se componen de las mediciones de la actividad tribución normal, es posible utilizar los resultados del teorema del límite
total del complemento del suero (CH 50) en 11 2 = 20 individuos aparente- central si la magnitud de las mueslras es grande (por ejemplo, ~ 30). Esto
mente sanos y 11 1 = 10 individuos enfermos. Las medias de las n1uestras y permite el uso de la teoría normal. Cuando se extraen dos muestras aleato-
desviaciones estándar son rias simples independientes de gran magnitud de una población que no
sigue una distribución normal, la estadística de prueba para probar H0 : µ 1 :;::
x, = 62.6, S¡ = 33.8 µ 2 es
X2 :::: 47.2, S2::::: 10.!
Solución
' 2 2

l. Datos. Ver el enunciado del problema.


2. Suposiciones. Los datos corresponden a dos muestras aleatorias independientes,
V O"¡
-+-
rt I
ª2

rt2 (6.3.5)
cada una extraída de una población con distribución nornu1!. Las variancias de
la cual, cuando H0 es verdadera, sigue una distribución nonnal unitaria. Si se
las poblaciones se desconocen y son diferentes.
3. Hipótesis conocen las variancias de las poblaciones, se utilizan; pero si se desconocen,
se utilizan como estimaciones las variancias de las muestras, que necesaria-
f.¡u: µl µ~ = o mente se basan en muestras grandes. Las variancias de las muestras no se
HA:µ¡ µ,, " u ponderan porque la igualdad de las variancias de las poblaciones no es una
condición necesaria cuando se utiliza la estadística z.
4. Estadística de prueba. La estadística de prueba se obtiene mediante la ecuación
6.3.3. Ejemplo 6.3.4 El administrador de un hospital quiere saber si la población
5. Distribución de la estad(stica de prueba. La estadística que se obtiene por la que concurre a un hospital A tiene un ingreso medio familiar mayor al de la
ecuación 6.3.3 no sigue una distribución t de Studcnt. Por lo tanto. los valores población que concurre a un hospital B. Los datos consisten en los ingresos
críticos se obtienen por n1edio de la ecuación 6.3.4. familiares de 75 pacientes internados en el hospital A y 80 pacientes inter-
6. Regla de decisión. Sea a= .05. Antes de calcular t' se calcula H'¡ = (33.8) 2 / 10 = nados en el hospital B. Las medias de las muestras son X1 = $6800 y x2 ==
114.244 y w2 = ( 10. l )2 / 20 = 5.1005. En la tabla E se encuentra que t 1 =2.2622
$5450. La respuesta a la pregunta sería afirmativa si el administrador puede
y t2 = 2.0930. Por medio de la ecuación 6.3.4 se calcula
rechazar la hipótesis nula en la que µ 1 es menor o igual que µ 2, donde µ 1 y
µ 2 son los parámetros para las poblaciones A y B respectivamente.
, = 114.244(2.2622) + 5.1005(2.09:~0) =
9
'J:'j!'"
t 114.244 + 5.1005 .... ~. ::i
Solución
La regla de decisión es, entonces, rechazar H0 si a! calcular tes :2: 2.255 o:::; 2.255.
1. Cálc11lo de la esrad(stica de prueba. Por n1cdio de la ecuación 6.3.3. se calcula l. Datos. Ver el enunciado de! problema.
2. Suposiciones. Los datos corresponden a dos muestras aleatorias independientes.
(62.6 - 47.2) - O 15.-l Cada una fue extraída de una población que no sigue una distribución normal y
l' = 10.9:! = 1.-ll con desviaciones estándar de cr 1 = $600 y cr 2 = $500, respectivamente
(33.8)' (10.1)'
--.-+-- 3. Hipótesis
10 20 lío: µ¡ - µ'..! ~ O
8. Decisión estadística._]:'..!:!_~~~--2.255 < 1.41 < 2.255, no es 12osilil~_!~ch;1_~-- - ----0-bten-- !!A; µJ - µ2 >O
-----------z"á.f-H0. ----
9. Conclusión. Con base en estos resultados. no se puede concluir que !as dos 110 : µ¡ !S µ2
medias de las poblaciones son diferentes. H.,i: µ¡ > µ~
276 Pruebas de hipótesis Ejercicios 277
4. Estadística de prueba. Dado que se tienen muestras grandes, el teorema del lí-
y sj = 12. ¿Eslos datos proporcionan evidencia suficiente para indicar que la
mite central pennite utilizar la ecuación 6.3.5 como estadística de prueba.
vitamina Des efectiva para disminuir el número de ataques convulsivos? Sea
5. Distribución de la estadística de prueba. Cuando la hipótesis nula es verdadera,
a=.05.
la estadística de prueba sigue una distribución aproximadamente nonnal es-
tándar.
6.3.2 Un epidemiólogo desea comparar dos vacunas antirrábicas para averiguar si
6. Regla de decisión. Sea a= .01. Esta es una prueba unilateral con un valor crítico
es posible concluir que existe diferencia en su efectividad. Las personas que
de z igual a 2.33. Se rechaza H0 si Zc:akulada;?: 2.33. previamente habían sido vacunadas contra la rabia se dividieron en dos gru-
7. Cálculo de la estadística de prueba
pos. El grupo 1 recibió una dosis de refuerzo de la vacuna del tipo 1, y el
(6800 - 5450) - O 1350 grupo 2 recibió una dosis de refuerzo de la vacuna del tipo 2. Las respuestas
' ~
(600) 2
(500) 2
- - ~ 15.17
89
de los anticuerpos se registraron dos semanas después. Las medias, desvía·
ciones estándar y el tamaño de las muestras para los dos grupos fueron los
-+-
75 80 siguientes:

8. Decisión estadística. Se rechaza H0 ya que z = 15.17 está en la región de re- Grupo Tan1aiio de la 11111estra x
chazo.
10 4.5 2.5
9. Conclusión. Estos datos indican que la población que concurre al hospital A
2 9 2.5 2.0
tiene un ingreso medio familiar mayor que el de la población que concurre al
hospital B. Para esta prueba, p < .0001 ya que 15.17 > 3.89. Cuando se prueba Sea a= .05.
una hipótesis respecto a la diferencia enlre las medias de dos poblaciones se
puede utilizar la figura 5.4.1 para decidir rápidamente si la estadística de prueba 6.3.3 Se registraron los valores medios de la velocidad de conducción de un nervio
debe ser z o t. motor en 10 personas internadas en el centro de control de envenenamientos
de un hospital metropolitano, con diagnóstico de envenenamiento con
metilmercurio. Se hicieron también determinaciones similares en 15 per-
Algunas veces ni la estadística z ni la estadística t son estadísticas de
sonas aparentemente sanas. Las medias y desviaciones estándar son las
prueba adecuadas para utilizarlas con los datos disponibles. Cuando esto
siguientes:
ocurre, es conveniente el uso de una técnica no paran1étrica para probar una
hipótesis respecto a la diferencia entre las mediciones de tendencia central
de dos poblaciones. La prueba de la rntdiana y la estadística de prueba de '
Mann-Whitney, que se estudian en el capítulo 11, se utilizan con mayor fre- Ind. envenenados 55 6
cuencia como alternativa para las estadísticas z y t. Ind. normales 63 5

¿Proporcionan estos datos evidencia suficiente para indicar que las medias de
EJERCICIOS _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ __ las poblaciones representadas por las muestras son diferentes? Sea a= .05.
6.3.4 ¿Es posible concluir que los niños crónicamente enfennos tienden, en prome·
dio, a tener menos confianza en sí mismos que los niños sanos? Se aplicó
En cada uno de los siguientes ejercicios seguir el procedimiento de los nueve pasos una prueba diseñada para estimar la confianza en sí mismos a 16 niños cróni-
para la prueba de hipótesis y i.:alcular el valor p -para cada prueba. Establecer las camente enfermos y a 21 niños sanos. Los puntajes medios y desviaciones
suposiciones que sean necesarias para que el procedimiento sea válido. estándar fueron los siguientes:
6.3.J Setenta pacientes que sufren de epilepsia se dividieron al azar en dos grupos
iguales. El grupo A recibió un tratamiento que incluía dosis diarias de vita-
mina D. El grupo B recibió el 111ismo tratan1iento con la excepción de que a
'
Niños enfermos 22.5 4.1
este grupo se le dio un placebo en lugar de la vitamina D. El nún1ero medio
Niños sanos 26.9 3.2
de ataques convulsivos observados durante el periodo de trata1niento en los
dos grupos de XA = J 5 y X8 = 24. Las variancias de las muestras fueron s~ = 8 Sea a= .05.
278 Pruebas de hipótesis Ejercicios 279

6.3.S Un investigador de enfermería desea saber si los graduados de los programas 6.3.8 Se midieron las concentraciones de protoporfirina en dos muestras de indi-
de enfennería a nivel bachillerato y los graduados en programas asociados de viduos. La muestra I consistió de 50 varones adultos alcohólicos con sidero-
enfermería difieren en cuando a los puntajes medios obtenidos en un estudio blastos anulares en la médula ósea. La muestra 2 consistió de 40 varones
de personalidad. Una 1nuestra de 50 graduados de programas asociados (gru- adultos no alcohólicos aparentemente nonnales. Los niveles medios de pro-
po A) y una muestra de 60 graduados de bachil!erato (grupo B) propor- toporfirina y las desviaciones estándar de las dos muestras son las siguientes:
cionaron las siguientes medias y desviaciones estándar
Muestra
Muestra , '
' l 340 250
A 52.5 10.5 1 2 45 25
B 49.6 l l.2
¿Es posible concluir con base en estos datos que los niveles de protoporfirina
Con base en estos datos, ¿qué puede concluir el investigador? Sea a= .05. son más altos en la población de alcohólicos que en la población no alcohóli-
ca'! Sea a= .01.
6.3.6 Una prueba diseñada para medir las actitudes de las madres en cuanto al tra-
bajo de parto y expulsión se aplicó a dos grupos de nuevas madres. La mues- 6.3.9 Un investigador está interesado en saber si los niños nacidos prematuramente
tra 1 (asistentes) concurrieron a clases de instrucción prenatal impartidas en con acidosis metabólica tardía y los niños prematuros que no tienen dicha
el departamento de salud. La muestra 2 (ausentes) no asistieron a dichas enfermedad difieren en lo que respecta a las concentraciones en la orina de
clases. El tamaño de las muestras, medias y desviaciones estándar de los cierta sustancia química. Las concentraciones medias, desviaciones estándar
puntajes de las pruebas son las siguientes: y el tamaño de la muestra para ambos grupos son las siguientes:

Muestra n , Muestra
"
.,
'
l 15 Con la condición 35 8.3 5.5
4.73 l.U
40 3.6

2 22 3.00 l.5 Sin la condición -l.8

¿Proporcionan estos datos la evidencia suficiente para indicar que las asistentes, ¿Qué puede concluir el investigador con base en estos resultados? Sea a= .05.
en promedio, tienen puntajes más elevados que las ausentes? Sea a= .05.
6.3.10 Varios investigadores desean saber si es posible concluir que dos pobla-
6.3.7 Se midieron las concentraciones de cortisol en dos grupos de mujeres al ciones de niños difieren respecto a la edad promedio en la cual pueden ca-
momento de dar a luz. AJ grupo I se le practicó una operación cesárea de minar por sí solos. Los investigadores obtuvieron los siguientes datos
urgencia después de inducido el parto. Las del grupo 2 dieron a luz mediante (edades en meses).
operación cesárea o vía vaginal después de presentarse el trabajo de parto Muestra en la población A:
espontáneamente. E! tamaño de las muestras, los niveles medios del cortisol
y las desviaciones estándar fueron los siguientes: 9.5. 10.5, 9.0, 9.75, !O.O, 13.0. 10.0, 13.5, !O.O. 9.5. !U.O, 9.75

Muestra de la población B:
Muestra
" '
lU 435 65 12.5, 9.5, 13.5, 13.75, 12.0, 13.75, 12.5, 9.5, 12.U, 13.5, 12.0, 12.0
2 12 645 80
¿Qué pueden concluir los investigadores? Sea a= .05.
------¡;-Propoteionah estos··aatos la evidencia suficiente para indicar que existe una
diferencia en las concentraciones n1edias del cort1sol en las dos poblaciones? 6.3.11 ¿La privación sensorial tiene algún efecto sobre la frecuencia de las ondas
Sea a= .05. alfa de las personas? Se divide aleatoriamente en dos grupos a veinte volun-
280 Pruebas de hipótesis Co,nparación por parejas 281
tarios. Los individuos en el grupo A se son,etieron a un periodo de priva- Con frecuencia no existen diferencia reales entre dos poblaciones con
ción sensorial durante 10 días, mientras que los individuos del grupo B sir- respecto a la variable de interés, pero la presericia de fuentes extrañas de
vieron co1no grupo de control. Al terminar el periodo experimental, se mi- variación pueden causar el rechazo de la hipótesis nula de no diferencia. Por
dió la frecuencia de las ondas alfa a partir de los electroencefalogramas de
otra parte, las diferencias reales también pueden ser enmascaradas por la
las personas. Los resultados son los siguientes:
presencia de factores extraños.
Grupo A: 10.2. 9.5, 10.1. JO.O, 9.8, 10.9, 11.4, I0.8, 9.7, I0.4 El objetivo de la prueba de comparaciones por pares es eliminar al má-
ximo las fuentes de variación por medio de la fonnación de parejas simi-
Grupo B: 11.0. 11.2, 10.1, 11.4, 11.7, 11.2, 10.8, 11.6, I0.9, I0.9
lares con respecto a tantas variables como sea posible.
Sea a=: .05. Las observaciones relacionadas o por pares se pueden obtener de mu-
6.3.12 ¿Es posible concluir que. en promedio. los linfocitos y las células tumorales chas formas. Los mismos individuos pueden ser examinados antes y des-
difieren en tamaño? Los siguientes datos son el tamaño de las células (en pués de recibir algún tratamiento. Se pueden fonnar parejas del mismo sexo
µm) de 40 linfocitos y 50 células tumorales obtenidas a partir de la biopsia al azar para asignarles aleatoriamente un tratamiento o un placebo. A los
del tejido de pacientes con melanoma. pares de gemelos o hermanos se les puede asignar aleatoriamente que re-
ciban dos tratamientos, de tal forma que los miembros de una sola pareja
reciban diferentes tratamientós. Al comparar dos métodos de análisis, el
Linfocitos material que se va a analizar se divide en partes iguales, de modo que una
9.0 de las partes se analice mediante un método y la otra mediante otro. O bíen,
9.4 4.7 4.8 8.9 4.9 8.4 5.9
6.3 5.7 5.0 3.5 7.8
se puede formar parejas e individuos que co111partan una característica, por
10.4 8.0 8.0
S.6 7.0 6.8 7.1 5.7 7.6 6.2 7.1 ejemplo, la destreza digital, que esté relacionada estrechamente con la me-
0

7.4 8.7 4.9 7.4 6.4 7.1 6.3 8.8 dición de interés, por ejemplo, el puntaje obtenido después de un tratamien-
8.8 5.2 7.1 5.3 4.7 8.4 6.4 8.3 to en alguna prueba que requiera manipulación digital.
En lugar de llevar a cabo el análisis con observaciones individuales, se
Células t11111orales puede utilizar como variable de interés la diferencia entre los pares indivi-
duales de observaciones.
12.6 14.6 16.2 23.9 23.3 17.1 20.0 21.0 19.1 19.4
16. 7
Cuando las diferencias de las muestras forman una muestra aleatoria
15.9 15.8 16.0 17.9 13.4 19.1 16.6 18.9 18.7
20.0 17.8 13.9 22.1 13.9
simple extraída de una población que sigue una distribución normal, la es-
18.3 22.8 13.0 17.9 15.2
17 .7 15. l 16.9 16.4 22.8 19.4 19.6 18.4 18.2 20.7
tadística de prueba para probar la hipótesis acerca de la diferencia de la me-
16.3 17.7 18.1 24.3 11.2 19.5 18.6 16.4 16.1 21.5 dia de la población µdes

Sea a= .05. J- µd
SJ (6.4. 1)

6.4 COMPARACIÓN POR PAREJAS donde des la diferencia de la media muestra} SJ= SJ'l;;, y s¡es la desviación
estándar de las diferencia muestrales. Cuando H0 es verdadera la estadística
En el análisis referente a la diferencia entre las medias de dos poblaciones, se de prueba sigue una distribución t de Student con n - l grados de libertad.
supone que las muestras son independientes. Un método que se utiliza con Nuevamente, el parámetro supuesto en la ecuación 6.4.1 estaría mejor
frecuencia para averiguar la efectividad de un tratamiento o procedimiento especificado mediante el símbolo µdO. Pero, otra vez, para evitar una nota-
experimental es aquel que hace uso de observaciones relacionadas que resul- ción engorrosa, el cero se puede eliminar.
tan de muestras no independientes. Una prueba de hipótesis que se basa en Aunque para empezar se tienen dos muestras -niveles antes y des-
este tipo de datos se conoce como prueba de con1paraciones por parejas. pués- no hay por qué preocuparse de la igualdad de las variancias, como
282 Pruebas de hipótesis Comparación por parejas 283
Tabla 6.4.1. Concentraciones de colesterol en suero de 12 sujetos 3. Hipótesis. La hipótesis nula y alternativa son las siguientes:
antes del progran1a de ejercicios y dietas
Colesterol en suero Diferencia Ha: µ¿ e:! O
(antes-después) H.,.: µd< O
Individuo Antes (X 1J Después (X-:) d,

201 2()0 -1 4. Estadística de prueba. La estadística de prueba adecuada se obtiene mediante la


2 231 236 +5 ecuación 6.4.1.
3 221 216 -5 5. Distribución de la estadística de prueba. Si la hipótesis nula es verdadera, la
4 260 233 -27 estadística de prueba sigue una distribución t de S1udent con 11 - ¡ grados de li-
5 228 22-1 -4 bertad.
6 237 216 -21 6. Regla de decisión. Sea a= .05. El valor crítico de tes -1.7959. Se rechaza H0 si
7 326 296 -30 el valor calculado de tes menor que el valor crítico. Las regiones de aceptación
8 235 195 -40 y rechazo se muestran en la figura 6.4.1.
9 240 207 -33 7. Cálculo de fa estadística de prueba. A partir de las diferencias d¡, se calculan las
10 267 247 -20 siguientes mediciones descriptivas:
11 284 210 -i4
12 201 209 +8 Ld,
cuando se trata de muestras independientes, porque la variable es la diferen-
d- n
(-1) + (5) + (-5) + ... + (8)
12 ---
-242
12
-20.17

2
cia entre los datos obtenidos a partir de un mismo individuo y, por lo tanto,
sólo existe una variable.
Ird, - J¡' nLdf - (Id,) 12(10766) - (-242) 2
s,2 n - 1 n(n - 1) 12( 11)
535.06
Ejemplo 6.4.1 Doce individuos participaron en un experimento para estu-
diar la efectividad de cierta dieta, combinada con un programa de ejercicios, Nótese que d =X2 -X 1.
para la reducción de los niveles de colesterol en suero. La tabla 6.4.1 mues-
tra los niveles de colesterol en suero para los 12 individuos al principio del -20.17 - O -20.lí
programa (antes) y al final del mismo (después). La tabla también contiene t - - -3.02
V535.06 / 12 6.68
las diferencias, d¡, entre las mediciones antes y después.
La pregunta a contestar es: ¿proporcionan los datos la evidencia sllfi- 8. Decisión estadística. Se rechaza 110 porque -3.02 está en la región de rechazo.
ciente para concluir que el programa de ejercicios y dieta es efectivo para la 9. Conclusión. Se puede concluir que el programa de ejercicios y dieta es efectivo.
reducción de los niveles de colesterol en el suero? Para esta prueba, .O l > p > .005 porque -2.718 > -3.02 > -3.1058.

Solución Se puede decir que existe la suficiente evidencia para concluir


que el programa de ejercicios y dieta es efectivo si es posible rechazar la
hipótesis nula que indica que el cambio en la media de la población µá es
cero o positivo. Es posible tomar una decisión por medio del procedimiento
de los nueve pasos de la prueba de hipótesis. a~ .OS

l. Datos. Los datos son los niveles de colesterol en el suero de 12 individuos. antes
y d espues
• d e ¡ programa experimenta
· · · · y d.1eta.
Ide eJerc1c1os ~ ~-17959 o
-----é!c.C-SSrrapuuu,ri.icivn"l's:-bísdtferenc1as que se oOservan fóírlfari-Ja· riit.Te"si:friD.Te"aRiria s1n1- -- .
, . . . . . ., Región de rechazo Región de aceptacion
ple extra1da de una población de diferencias con d1stnbuc1on normal --1ue po- . .. ¡ · 6 ¡
drían ser generadas bajo las mismas circunstancias. Figura 6.4.1. Regiones de rechazo y accptacion para e eJemp 1o .4. .
284 Ejercicios 285
Pruebas de hipótesis
EJERCICIOS, _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ __
Un intervalo de confianza del 95 por ciento para µd se puede obtener
como sigue:
En los siguientes ejercicios poner en práctica el procedimiento de los nueve pasos
de la prueba de hipótesis en el nivel de significación especificado. Determinar el
J.± t0 _ .. 1':.nsd valor p para cada prueba.

-20.17 ± 2.2010(6.68) 6.4.1 Diez animales de laboratorio fuero11 sometidos a condiciones que simulaban
una enfermedad. Se registró el número de latidos cardiacos por minuto antes
-20.17 ± 14.70 y después del experimento de la siguiente forma:
-34.87, -5.47
Latidos por minuto Latidos por minuto
Ani111a! Antes Después Aninial Antes Después
En el análisis de datos por parejas, si se conoce la variancia de la pobla- 70 115 6 100 178
ción de las diferencias, la estadística de prueba adecuada es 2 84 148 7 1!O 179
3 88 176 8 67 140
4 110 79 161
' - ¿-
0,1!Vn
f.Ld

(6.4.2)
5 105
191
158
9
10 86 157

¿Proporcionan estos datos la evidencia suficiente para indJCar que la condición


Es improbable que crd se conozca en la práctica. experimenial aumenta el número de latidos del corazón por minuto? Sea a= .05.
Si no se puede hacf:r la suposio::ión de que los valores d¡ siguen una dis- 6.4.2 Se llevó a cabo un estudio para averiguar si un nuevo procedimiento terapéu·
tribución normal, es posible utilizar el teorema del límite central si n es tico es más eficaz que el procedi1niento estándar para mejorar la destreza di-
grande. En tal caso, la estadística de prueba es la ecuación 6.4.2 con sd gital de cienas personas discapacitadas. Se utilizaron veinticuatro parejas de
empleado para estimar crd cuando, corno es generalmente el caso, se des- individuos en el estudio y cada pareja se formó con base en el grado del ím·
conoce esta última. pedimento, inteligencia y edad. A uno de los miembros de cada pareja se Je
El uso de la prueba de comparaciones por parejas no deja de tener sus asignó aleatoriamente el nuevo tratamiento, mientras que el otro recibió el
problemas. Si son utilizados diferentes individuos y se les asigna aleato· lratamiento estándar. Al término del período experimental, se sometíó a cada
individuo a una prueba de destreza digital y se obtuvieron las siguientes pun·
riamente dos tratamientos, el tratat de formar parejas con los individuos
tuaciones. Sea a= .05.
con respecto a una o más variables importantes puede requerir una gran
inversión en tiempo y dinero. Otra desventaja es la pérdida de grados de Nuero Estándar Par N11e1·0 Esrá11dar
Par
libertad. Si no se utilizan observaciones por parejas se tienen 2n - 2 gra-
54 13 ·9 41
dos de libertad disponibles, comparados con n - 1 cuando se utiliza este 49 O-
procedimiento. 2 56 42 14 73 67
15 ·9 57
En general, para decidir si se utiliza o no el procedimiento de compara- 3 70 63 º-
4 83 77 16 73 70
ciones por parejas, se debe tener en cuenta tanto los aspectos económicos 72
5 83 83 17 78
como por las ventajas que provee el control de variaciones extrañas. 64 62
6 68 51 18
Si ni z ni t son estadísticas de prueba adecuadas para utilizarlas con los 82 19 71 64
7 84
datos disponibles, el investigador podría utilizar alguna técnica no para- 8 63 54 20 42 44
métrica para probar una hipótesis acerca de la diferencia entre las medianas. 9 67 62 21 51 44
En el capítulo 11 se presenta la prueba del signo, que puede ser utilizada en 10 79 71 22 56 42
esos casos. 11 88 82 23 40 35
12 48 50 24 81 63
286 Pruebas de hipótesis ¡>rueba de hipótesis: proporción de u11a sola población 287
6.4.3 Quince muchachos de 12 años de edad fueron medido~ por dos enfermeras
diferentes. Los resultados son los siguientes: Flujo sanguíneo durante Flujo sanguíneo durante
Sueiio Sueiio Sueiio Suello
Individuo activo tranquilo Individuo
lndii·iduo E11fern1era l Enfern1era 2 activo tranq1tilo
Individuo Enfenuera 1 Enfern1era 2
38.8 26.8 ll 55.3 "1-t.l
142.9 143.0 9 142.1 142.5 2 51.3 34.t-l 12 47.4 46.1
2 150.9 151.5 10 159.9 160.0 3 43.8 31.8 13 3')
•. o- 26.5
3 151.9 152. l ll 14 l.9 142.0 4 6..J:.!:l 56.ti IS 60.6 53.2
4 158.! 158.0 12 140.8 141.0 5 29.8 29.0 15 32.D 30.6
5 151.2 151.5 13 14 7.1 ¡;
148.0 -13 ...J 37.2 [!i 60.6 53.'.!
6 160.2 160.5 14 143.6 144.0 7 ..J:-1.H 30.3 17 45.7 3'.!.l
7 157.8 158.0 15 139.9 141.0 33.9
8 150. 1 150.0 "
9 62.7
25.2
4'.!.2
18
!9
63.ü
69.9
4!:I.'.!
5 1.9
10 40.l 29.3 '.!() :13.6 28.7

¿Estos datos justifican la conclusión de que hay diferencia en la exactitud de


las dos enfermeras? Sea a::: .05. Construir e! intervalo de confianza de! 95
por ciento para µd.
6.5 PRUEBA DE HIPÓTESIS:
PROPORCIÓN DE UNA SOLA POBLACIÓN _ _ _ _ __
6.4.4 Diez varones de 16 años de edad fueron medidos al momento de levantarse
por la mañana y al acostarse por la noche con los siguientes resultados La prueba de hipótesis de proporciones poblacionales se realiza casi en la
misma forma utilizada para las medias cuando son satisfechas las condiciones
necesarias para emplear la curva normal. Pueden efectuarse pruebas unila-
Estatura (cm) Estatura (cm) terales o bilaterales. dependiendo de la cuestión que se plantee. Cuando se
lndiviclt:o Maiiana Tarde Individuo Mañana dispone de una muestra lo suficientemente grande para la aplicación del teo-
Tarde
rema del límite central, la estadística de prueba es
16Y.7 168.2 6 lf-i8.8 166.:'i
2 [68.5 165.5 7 l6Y.2 167.4
3 16}.9 164.4 8 167.Y I fifi.3
j; - /Ju

5
177.7 175.7 9 18 !.8 17Y.7 ' ~ ' ¡¡;:;¡:, (6.5.1)
179.6 !76.6 10 163.~ 161..1 V---:-
¿Proveen e~tos datos la e\·idencia suficiente para indicar que los varones de la cual, cuando H0 es verdadera. sigue una distribución aproximadamente
16 años de edad son más bajos de estatura por la tarde que por !a mañana? normal estándar.
Construir el intervalo de confianza del 95 por ciento para µd.
Eje111plo 6.5.l Suponer que hay inten~s por saber que proporción de la
población de conductores de automóviles utilizan con regularidad el cintu~
6.4.5 Un grupo de investigadores desea saber si es posible concluir (a::: .05¡ que el rón de seguridad del asiento. En una encuestra de 300 conductores adultos
flujo craneano de sangre en recién nacidos saludables es diferente según !a de automóviles, 123 de ellos dijeron que regularmente utilizaban el cinturón de
etapa del sueño. Se colectaron los datos de 20 indL\id.uo.s .du[ante ..sueño acti-
--------c,~o-';:y-duniliie suefi~--tranquilo. Tales resultados fueron los siguientes: seguridad del asiento. ¿Es-posible concluir·rr-p.rrtirde·estos·--datos-que--:-err-\-a---
población n1uestreada. la proporción de quienes utilizan regulannente el
cinturón de seguridad del asiento no es del .50?
288 Pruebas de hipótesis Ejercicios 289
Solución estos datos la evidencia suliciente para indicar que la proporción de indivi-
duos con anemia de células falciformes en la población muestreada es n1ayor
l. Datos. Los datos se obtienen a partir de las respuestas de los 300 conductores de que .06? Sea a= .05.
P-
los cuales 123 poseen la característica de interés, es decir, .41.
2. Suposiciones. La distribución muestra! de P presenta una distribución aproxi- 6.5.2 Una muestra de l 00 empleados de un hospital, los cuales habían estado en
madamente normal de acuerdo con el teorema del límite central. Si H es ver- contacto con sangre o sus derivados, fue examinada para averiguar si pre-
0
dadera, p =.5 y el error estándar, ap = --J(.5)(.5) I 300. Es importante observar sentaban evidencia serológica de hepatitis B. Se encontró que veintitrés de
que se utiliza el valor hipotético p para calcular crp. Esto se hace debido a que ellos presentaron resultados positivos. ¿Es posible concluir a partir de estos
toda la prueba está basada en la suposición de que la hipótesis nula es verdade- dalos que la proporción de individuos que presentaron resultados positivos
ra. El utilizar la proporción de la muestra, fo, para c.:alcular <Jp, no sería con- en !a población muestreada es inayor que .1 S? ~ea a= .05.
gruente con este concepto.
3. Hipótesis 6.5.3 Antes del inicio de un programa de inmunización contra la rubeola en una
área metropolitana, una encuesta reveló que 150 integrantes de una muestra
Ho: p "" .50 de 500 niños de primaria habían sido inmunizados contra esta enfermedad.
H_,,:p 4= .50 ¿Son compatibles estos datos con el punto de vista de que el 50 por ciento de
los niños de primaria de dicha área habían sido inmunizados contra rubeola?
4. Estadística de prueba. La estadística de prueba se obtiene mediante la ecuación Sea a= .05.
6.5.1.
S. Distribución de la esradística de prueba. Si la hipótesis nula es verdadera, la 6.5.4 El siguiente cuestionario fue respondido por una muestra aleatoria simple de
estadística de prueba 1nuestra una distribución aproximadamente norma! con 250 ginecólogos. En los recuadros aparece el número de ginecólogos que
una media de cero. eligió la respuesta correspondiente.
6. Regla de decisión. Sea a= .05. Los valores críticos de z son ±1.96. Se rechaza
H0 a menos que - 1.96 < Zcakulada < 1.96. l. ¿Cuándo es necesario elegir, qué procedimiento prefiere para obtener muestras
7. Cálculo de la estadística de prueba endometrio?

' a
.41 - .50 - .OY
-3.11
a. Dilatación y raspado ~
(.5)(.5) .0289
300 · b. Aspiración Vobra ~
8. Decisión esradística. Se rechaza H0. ya que -3.11 <-1.96. 2. ¿Ha revisado durante el año pasado a una o más mujeres embarazadas con altas
9. Conclusión. Se concluye que la proporción de la población que usa regular- concentraciones de plomo en la sangre?
mente el cinturón de seguridad del asiento no es de .50. Para esta prueba, p <
.002, ya que -3.1 J < -3.09. a. Sí 0
b. No 1 225 1

EJERCICIOS _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ __
3. ¿Acostumbra con10 rutina poner al tanto a sus pacientes e1nbara2adas de que
Para cada uno de los siguientes ejercicios, llevar a cabo el procedimiento de los nue-
el fun1ar es ricsgoso para el feto?
ve pasos para la prueba de hipótesis al nivel de significación designado. Calcular el
valor p para cada muestra.
a.Sí~
6.5.1 En una muestra de 1500 residentes de un barrio de la ciudad, quienes panici-
paron en un programa selectivo de salud. 125 pruebas proporcionaron resul-
b. No 1121
L___J
tados positivos en cuanto a la anemia de células falciforn1es. ¿Proporcionan
Pruebas de hipótesis p,ueba de hipótesis: diferencia e11tre las proporciones de dos poblaciones 291
. 290
! ¿Es posible concluir a partir de estos datos que de la población muestreada
z
(f,, - p,) - (p, - P,),

l
más del 60 por ciento prefiere el método de dilatación y raspado para obte- &¡,, - ¡,., (6.6.2)
ner muestras de endometrio? Sea a= .05.

6.5.5 De acuerdo con los datos del ejercicio 6.5.4, ¿es posible concluir que, de la Ja cual sigue una distribución aproxi1nadamente normal estándar si la hipó-
población muestreada, menos del 15 por ciento de los ginecólogos ha atendi- tesis nula es verdadera.
1 do durante el año pasado a una o más mujeres embarazadas con altas concen-
traciones de plomo en la sangre? Sea a= .05.
Ejemplo 6.6.1 En un estudio para comparar un nuevo tratamiento para la
migraña con el tratamiento habitual. 78 de los 100 individuos que reci-
6.5.6 De acuerdo con los datos del ejercicio 6.5.4, ¿es posible concluir que más del
90 por ciento de los médicos pone al tanto a sus pacientes de que fumar es bieron el tratamiento habitual respondieron favorablemente. De los 100
riesgoso para et feto? Sea a= .05. individuos que recibieron el nuevo tratamiento, 90 respondieron satisfacto-
riamente. ¿Proporcionan estos datos la evidencia suficiente para afirmar que
el nuevo tratamiento es más efectivo que el habitual?
6.6 PRUEBA DE HIPÓTESIS: DIFERENCIA ENTRE
LAS PROPORCIONES DE DOS POBLACIONES _ _ _ __ Solución

l. Datos. Los datos son las respuestas de 100 individuos al tratamiento habitual y
La prueba que se utiliza con más frecuencia con relación a la diferencia en- las de JOO individuos para el nuevo tratan1iento. El número de respuestas favo-
tre las proporciones de dos poblaciones es aquella en la que su diferencia rables fue. respectivamente, 78 y 90. Se calcula
es cero. Sin embargo, es posible probar que dicha diferencia es igual a
algún otro valor. Es posible efectuar pruebas tanto unilaterales como bila- ¡,, = 78/ IOO = .78, ¡,, = 90/ 100 = .90, y
terales. _ YO + 78
Cuando la hipótesis nula que va a probarse es p 1 ~ p 2 = O, se supone que f• - 100 + 100 - ·84
las proporciones de las dos poblaciones son iguales. Esto se utiliza como
justificación para combinar los resultados de las dos muestras y obtener una 2. Suposiciones. Se supone que la distribución n1uestral de P2 - P1 sigue una dis-
estimación ponderada de la proporción común supuesta. Si se adopta este tribución aproximadamente normal con una media p 2 - p 1 SO y un error están-
dar estimado que se obtiene mediante la ecuación 6.6.1 cuando la hipótesis nula
procedimiento, se calcula
es verdadera y se ponderan las estimaciones muestrales.

Xi + X2 3. Hipótesis
¡, - n1 + n2
llo:Pi - P1::::; o
/{A: p'!. - P1 > Ü
donde x 1 y x 2 son, respectivamente, el número de la primera y segunda
muestra que poseen la característica de interés. Esta estimación ponderada 4. Estadística de prueba. La estadística de prueba se obtiene medi::tntc la ecuación
de p = p 1 = p 2 se utiliza para calcular 0¡, -P; el error estándar estimado para 6.6.2.
1
el estimador como sigue: -
S. Distribución de la estadística de prueba. Sí la hipótesis nula es verdadera, la
ª . - yfi,--_
p, - Pi n¡
j,) + f,(l - P>
n2
estadística de prueba sigue una distribución aproximadamente normal unitaria.
(6.6.J)
- - - - - ------ 6. Regla de decisión .....Sea-(i__=.....05._EW:.aLor---ei:íLico.-de-.¡;-es-1_64.5.....Sc-~ec.haza-/40 -si el
valor de z es mayor que 1.645.
La estadística de prueba se convierte en
Pruebas de hipótesis Prueba de hipótesis: variancia de una sola población 293
292
7. Cálculo de la estadística de prueba un año de edad atendidos en cierto grupo de departamentos de salud locales
en un periodo de un año. Se obtuvo la siguiente información respecto a la
(.90 - .i8) .12 anemia.
2.32
- '(.841(.16) (.84)(.16) .0518
--+-- Grupo Nún1ero Nú,n. de
100 100
étnico de elen1entos anén1icos
8, Decisión estadística. Se rechaza H0 porque 2.32 > 1.645.
450 105
9. Co11clusió11. Estos datos sugieren que el nuevo tratamiento es más efecti\'o que
2 375 120
el habitual (p = .0102).

¿Proporcionan estos datos la suficiente evidencia para indicar una diferencia


en las dos poblaciones con respecto a la proporción de anémicos? Sea a= .05
EJERCICIOS~~~~~~~~~~~~~~-~-

6.6.4 En un análisis de obesidad se obtuvieron los siguientes resultados a partir de


En cada uno de los siguientes ejercicios, utilizar el procedimiento de los nueve muestras de hombres y mujeres entre las edades de 20 y 75 años:
pasos para la prueba de hipótesis. Determinar el valor de p de cada prueba.
n Nú111. de ind. con sobrepeso
6.6.1 Se efectuó una co1nparación con respecto a las distancias desde su dotnicilio
hasta el hospital entre una 1nuestra de pacientes dados de alta dentro de los Varones 150 21
Mujeres 200 48
seis prin1eros meses después de su ingreso en un hospital del estado para en-
fennedades mentales, y otra muestra de pacientes que fueron dados de alta
¿Es posible concluir a partir de estos datos que en las poblaciones muestrea-
después de seis meses pei:o dentro del siguienle años después de su adnlisión.
das existe diferencia en las proporciones de individuos con sobrepeso? Sea
Los resultados son los siguientes:
a= .05.
NIÍ111ero de individuos
Duración que 1·ive11 a 111ás de
de la pen11anencia 20 niilfas del hosf!_ira/ 6.7 PRUEBA DE HIPÓTESIS:
" VARIANCIA DE UNA SOLA POBLACIÓN _ _ _ _ _ __
S 6 meses 100 i5
Más de 6 meses 150 90
En la sección 5.9 se estudia la manera de construir un intervalo de confianza
para la variancia de una población con distribución normal. Los principios
¿Proporcionan estos dalos la suficiente evidencia para indicar que la propor- generales que se presentan en dicha sección pueden ser utilizados para pro-
ción de quienes viven a más de 31.6 km del hospital es distinta en ambas bar una hipótesis respecto a la variancia de una población. Cuando los datos
poblaciones? Sea a= .05. disponibles para el análisis forman una muestra aleatoria simple, extraída de
6.6.2 Un epidemiólogo en un país en desarrollo comparó una muestra de 90 per- poblaciones que siguen una distribución normal, la estadística de prueba
sonas adultas que padecían ciena enfermedad neurológica. con una muestra para probar hipótesis acerca de la variancia de una población es
de 100 personas de control comparables pero que no padecían dicha enfer-
X2 = (n - l)s2 / ª2 (6.7.1)
medad. Encontró que 69 de las personas que padecían la enfermedad y 67 del
grupo de control es1aban empleadas en labores de subsistencia. ¿Es posible
que el epidemiólogo concluya a partir de estos dalos que las dos poblaciones
x
la cual, cuando H 0 es verdadera, sigue una distribución 2 con 11 - 1 grados
de libertad.
representadas por las muestras difieren respecto a la proporción cn1pleada
en ocupaciones de subsistencia? Sea a =.05. Ejemplo 6.7.1 Una muestra aleatoria simple de 15 estudiantes de enfermería
6.6.3 Se desea saber si los niños de dos grupos étnicos difieren con respecto a la que participaron en un experimento efectuó una prueba para medir su
proporción de anén1icos. De cada grupo se extrajo una n1ucstra de niños de destreza 1nanual. La variancia de las observaciones de la muestra fue de
~
294 Pruebas de hipótesis Ejercicios 295
1225. Se desea saber si es posible concluir a partir de estos datos, que la va- Aunque en este ejemplo se realizó una prueba bilateral, es posible efec-
riancia de la población es distinta de 2500. tuar también pruebas unilaterales mediante la modificación lógica del pro-
cedimiento anterior.
Solución La determinación del valor p para esta prueba es complicada por el
hecho de que se trata de una prueba bilateral y una distribución muestra! asi-
l. Datos. Los datos son los puntajes del exarncn de destreza manual de 15 estu- métrica. Cuando se tiene una prueba bilaterai y una distribución muestra!
diantes de enfermería. La variancia de la muestra se calcula como s2 = 1225. simétrica como la normal estándar o t, es posible, como ya se señaló,
2. Suposiciones. Los datos fonnan una muestra aleatoria de tamaño 15 de una duplicar el valor p unilateral. El problema surge cuando se intenta hacer
población de puntajes de destreza manual que siguen una distribución normal. esto con una distribución muestra! asimétrica, como la distrib1,1ción de ji-
3. Hipótesis
cuadrada. Gibbons y Pratt I sugieren que en estas situaciones, ·se registre en
H 0: o2 2500 el informe el valor p unilateral junto con la dirección de la desviación
HA: (T2 e/e 2500 observada de la hipótesis nula. De hecho, es posible seguir este procedi·
miento en el caso de distribuciones muestrales simétricas. Sin embargo, lo
4. Estadística de prueba. La estadística de prueba se obtiene mediante la ecuación anterior parece favorecer la dupli°cación del valor p unilateral cuando la
6.7.1. prueba es bilateral e involucra una distribución muestra! simétrica.
5. Distribución de la estadística de prueba. Cuando la hipótesis nula es verdadera, En el ejemplo anterior, se registra el valor p como sigue:
x
la estadística de prueba sigue una distribución 2 con n - l grados de libertad.
p > .OS (prueba bilateral). Los datos de la muestra sugieren una va-
x
6. Regla de decisión. Sea a= .05. Los valores críticos de 1 son 5.629 y 26.119. Se
rechaza H0 a menos que el valor calcu!udo de la estadística de prueba esté entre riancia de menos de 2500, pero esta hipótesis-no está apoyada por la
5.629 y 26.119. Las regiones de aceptación y rechazo aparecen en la figura prueba.
6.7.1.
Si el problema se plantea en términos de la des'(iación estándar de la po-
7. Cálculo de la estadística de prueba
blación, es posible elevar al cuadrado la desviación estándar y efectuar la
0 (14)(1225) - 6.86 prueba como se indica en los párrafos anteriores.
x- - 2500
8. Decisión estadística. No se rechaza H 0 porque 5.629 < 6.86 < 26.119.
9. Conclusión. Con base en estos datos, no es posible concluir que la variancia de EJERCICIOS _ _ _ _ _ _~ - - - - - ~ ~ - - -
la población es diferente de 2500.
En cada uno de los siguientes ejercicios, llevar a cabo el procedimiento de los nue·
ve pasos y determinar el valor p para cada prueba.

6.7.1 Como parte de un proyecto de investigación, se seleccionó una muestra de 25


infantes nacidos en los hospitales de un área metropolitana. La desviación
estándar de los pesos de los infantes de la muestra fue de 150 gramos.
¿Proporcionan estos datos la evidencia suficiente para afirmar que la varian-
cia de la población es mayor que 10000? Sea.a= .05.

6.7.2 A cada uno de los integrantes de una muestra aleatoria de 30 estudiantes de


o 5.629 26.119 xi,. enfermería, quienes participaron en un proyecto de investigación, se le aplicó
- ~ - \ ;========~ -----,--- ·una.prueba diseñada para·e-Stirriar su· nivel de creatlv1dad. La desv,aciOñ
Región de rechazo Región de aceptación Región de rechazo estándar de los puntajes obtenidos fue de l l. ¿Es posible concluir a partir de
Figura 6.7.1. Regiones de rechazo y aceptación para el ejemplo 6.7.1. estos datos que la variancia de la población es menor que 400? Sea a= .05.
Pruebas de hipótesis Prueba de hipótesis: relación de las varia11cias de dos poblaciones 297 '
296
6.7.3 Se registraron los valores de la capacidad vital de una muestra de diez mente existe entre las variancias de las muestras indica una diferencia ver-
pacientes con obstrucción crónica severa de las vías respiratorias. La varían~ dadera en las variancias de la población o si la diferencia es de tal magnitud
cia de las diez observaciones fue de .75. Probar la hipótesis nula que indica que pudiera haber aparecido como resultado sólo del azar cuando las va-
que la variancia de la población es de 1.00. Sea o:= .05. riancias de las poblaciones son iguales.
Dos métodos de análisis químico pueden dar los mismos resultados en
6.7.4 Se registraron los valores de hemoglobina (g 'ií) de una muestra de 20 niños promedio. Sin embargo, es posible que los resultados obtenidos por medio
que fonnaban parte de un estudio de leucemia aguda. La variancia de las
de un método sea más variable que los resultados del otro. Sería conve-
observaciones fue de 5. ¿.Proporcionan es1os datos la suficiente evidencia
niente contar con algún método que permita determinar si es probable que
pa~a indicar que la variancia de la población es mayor que 25? Sea a= .05.
esto sea cierto.
6.7.S Una muestra de 25 adnlinistradores de hospitales grandes participó en un es- Las decisiones referentes a la comparabilidad de las variancias de dos
tudio para investigar la naturaleza y el grado de frustración y tensión emo- poblaciones se basan por lo general en la prueba de la relación de varian-
cional asociados con el trabajo. A cada participante se Je hizo una prueba con cia, que es una prueba de la hipótesis nula que indica que las variancias de
el fin de estimar el grado de tensión emocional que experimentaba como dos poblaciones son iguales. Cuando se prueba esta hipótesis, de hecho se
resultado de los deberes y responsabilidades asociados a su trabajo. La va- está probando la hipótesis de que su relación es igual a l.
riancia de los resultados obtenidos fue de 30. ¿Es posible concluir a partir de En el capítulo ,tnterior se estudió que, cuando son satisfechas ciertas
estos datos que la variancia de la población es mayor que 25? Sea a= .05. suposiciones, la cantidad (sf / o"f) /(si/crf) sigue una distribución F con
n 1 - 1 grados de libertad en el numerador y n2 - 1 grados de libertad en el
6.7.6 En un estudio aplicado a 15 pacientes con enfermedad sarcoide pulmonar se
midieron las concentraciones de gases en la sangre. La variancia de los valo-
denominador. Si la hipótesis indica que crf crf,
= se supone que la hipótesis
res de Pa0 2 (en mm Hg) fue de 450. Probar la hipótesis nula según la cual la es verdadera y cr se anula en la expresión anterior para quedar s1 I si, que
vw-ü1ncia de la población es mayor que 250. Sea a= .05. sigile la misma distribución F. La relación s} si se designa mediante siglas
R.V., la relación de la variancia.
6.7.7 Un análisis del líquido amniótico de una muestra aleatoria simple de 15 Para una prueba bilateral, se sigue la convención de colocar la variancia
mujeres embarazadas proporcionó las siguientes cantidades del total de pro- mayor en el numerador y se obtiene- el valor crítico de F para a I 2 y los
teína (gramos por cada IOmi): grados de libertad adecuados. Sin embargo, para una prueba unilateral, se
determina cuál de las dos variancias se ha de poner sobre el numerador
.69, 1.04, .39, .37, .64, .73, .69, 1.04 mediante el enunciado de la hipótesis nula. Por ejemplo, para la hipótesis
.83, 1.00, .19, .61, .42, .20, .79
nula que dice que crf::;;; cri, la estadística de prueba adecuada es R.V. = s} I s1.
¿Proporcionan estos datos la evidencia suficiente para indicar que la varian- Se obtiene el valor crítico de F para a (y no para o12) y los grados de liber-
cia de la población es mayor que .05? Sea a= .05. ¿Qué suposiciones se tad adecuados. De modo semejante, si la hipótesis nula es a}~ cr}, la
deben satisfacer? estadística de prueba adecuada es R.V. = s1 / sf En todos los casos, la regla
de decisión es recházar la hipótesis nula si la R.V. calculada es mayor o
igual que el valor crítico de F.
6.8 PRUEBA DE HIPÓTESIS:
RELACIÓN DE LAS VARIANCIAS DE DOS POBLACIONES Ejemplo 6.8.1 Una muestra aleatoria de 22 estudiantes de fisioterapia efec-
tuó la misma prueba de destreza manual que las enfermeras mencionadas en
Como se mencionó, el uso de la distribución t para construir intervalos de el ejemplo 6.7 .1. La variancia muestra! de los estudiantes de fisioterapia fue
confianza.y probar hipótesis para la diferencia entre las medias de dos de 1600. Se desea saber si estos datos proporcionan la evidencia suficiente
poblaciones supone que las variancias de las poblaciones son iguales. Como para concluir que la variancia de los puntajes de la prueba de destreza ma-
regla, las únicas indicaciones acerca de las magnitudes de las variancias nual de la población representada por los estudiantes de fisioterapia es
respectivas son las variancias calculadas a partir de las muestras extraídas mayor que la variancia de la población representada por la muestra de estu-
de las poblaciones. Sería conveniente saber si la diferencia que indudable- diantes de enfermería.
1
298 Pruebas de hipótesis Ejercicios 299
ifi
!!.•
, Solución

t. Datos. Las variancias de la muestra son 1600 y 1225, respectivamente.


2. Suposiciones. Los datos forman muestras aleatorias independientes, cada una
extraída de una población con distribución normal. Estas son suposiciones gene-
rales que se deben satisfacer para que la siguiente prueba sea válida.
3. Hipótesis
O 239 F12ou1
'---~~~~~~~ '
H 0 : cr¡' <
- a Región de aceptación Región de rechazo
/fA:a~>a Figura 6.8.1. Regiones de rechazo y aceptación para el ejemplo 6.8.1.

4. Estadística de prueba 6.8.2 Se inyectaron organismos viables del Toxoplasrna gondii en 21 conejillos de
Indias normales y en 21 conejillos de Indias con toxoplasmosis crónica, vein-
R.V. = s21 ls22 ticuatro horas después se efectuaron las mediciones del diámetro del eritema
en el sitio de reacción. Las varirincias muestrales calculadas a partir de estas
5. Distribución de la estadística de prueba. Cuando la hipótesis nula es verdadera, observaciones fueron de 10 mm 2 para el grupo infectado y de 3 mm2 para el
la estadística de prueba sigue una distribución F con n 1 - 1 y n 2 - 1 grados de grupo normal. ¿Es posible concluir a partir de estos datos que la variancia de la
libertad. población del grupo infectado es mayor que la del grupo normal? Sea a= .05.
6. Regla de decisión. Sea a= .05. El valor crítico de F, rxtraído de la tabla G, es
1 6.8.3 Se efectuó una prueba para estimar el nivel de angustia de una muestra de
2.39. Es importante observar que la tabla G no contiene una entrada para el
numerador de 21 grados de libertad y, por lo tanto, 2.39 se obtiene mediante
pacientes varones y de una muestra de pacientes mujeres poco antes de prac- '
1 ticarles la misma intervención quirúrgica. Los tamaños de las muestras y las
el uso de 20, que es el valor más cercano a 21 en la tabla. Se rechaza H0 si
variancias calculadas a partir de los puntajes obtenidos son los siguientes:
R.V. ~ 2.39. Las regiones de aceptación y rechazo aparecen en la figura 6.8.1. -6.
7. Cálculo de la estadística de prueba . ,,
Varones: n = 16. r 150
1600 3 Mujeres: n = 21. ,, 275
R.V. - 122:, = l. 1
¿Proporcionan estos datos la evidencia suficiente para indicar que en las
8. Decisión estadística. No es posible rechazar a H0 pofque 1.31 < 2.39, es decir, la poblaciones representadas, los puntajes obtenidos por las mujeres son más
relación calculada cae dentro de la región de aceptación. variables que los obtenidos por !os hombres? Sea a= .05.
9. Conclusión. No es posible concluir que las dos variancias son iguales. Dado
que la R.V. calculada 1.31 es menor que 1.96, el valor p para esta prueba es 6.8.4 En un experimento para estimar los eft!ctos del humo de cigarrillo sobre las
mayor que .10 ratas, se expuso a 11 animales al hun10 de cigarrillos sin filtro y no se expuso
a otros 11 animales de control. AJ· término del experimento se midió la fre-
cuencia del movimiento ciliar (batimientos/min a 20ºC) en cada animal. La
EJERCICIOS _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ __ variancia para el grupo expuesto fue de 3400 y de 1200 para el grupo no
expuesto. ¿Indican es1os datos que las varlancias de las poblaciones son dife-
En cada uno de los siguientes ejercicios, aplicar la prueba de los nueve pasos y rentes? Sea a= .OS.
determinar el valor p para cada prueba.
6.8.5 Se comparó la eficacia de dos analgésicos con base en el tiempo transcurrido
6.8.1 Se analizaron los valores del índice cardiaco (litros/minuto/M2 ) en dos grupos desde su administración hasta el momento del cese del dolor. Treinta pa-
de pacientes después de una operación de reemplazo de válvula. Los tam~~~ cientes recibieron el medicamento 1 _y otros 1_3 el medicamento 2. Las va-
- ---~eras muestras y las variancias fueron las siguientes: n 1 = 16, s¡ = 3.75. n2 =
. ··------- "j
riancias de las muestras son s{ = 64 y s~ = 16. Probar la-hipótesis nula que
10, sj = 1.8. ¿Proporcionan estos datos la evidencia suficiente para indicar que indica que las variancias de las dos poblaciones representadas son iguales.
existe una diferencia en las variancia'i de las poblaciones? Sea a= .05 Sea a= .05.
Preguntas y ejercicios de repaso 301
300 Pruebas de hipótesis
paraciones por parejas, proporción de una población, diferencia entre las
6.8.6 Se efectuaron detenninacion;s del vol¡imen de células etnpacadas en dos gru-
pos de niños con cianosi~ congénita. Los tan1.a1idfde las muestras y las va- proporciones de dos poblaciones, variancia de la población y relación de
riancias fueron las siguientes: " las variancias de dos poblaciones.

Grupo
" ,'
PREGUNTAS Y EJERCICIOS DE REPASO _ _ _ _ _ _ __
JO 40
2 16 85
l. ¿Cuál es el propósito de la prueba de hipótesis?
¿Proporcionan estos datos la evidencia suficiente para concluir que la variancia 2. ¿Qué es una hipótesis?
de la población 2 es mayor que la variancia de la población l? Sea a= .05. 3. Mencionar y explicar cada uno de los nue\·e pasos del procedimiento para la
prueba de hipótesis.
6.8.7 Las muestras aleatorias simples independientes del esfuerzo de dos cepas de 4. ¿Qué es el error de tipo I?
ratones utilizadas para un experimento proporcionaron las siguientes me- 5. ¿Qué es el error de tipo 11?
diciones de los niveles de glucosa en la sangre después de una experiencia 6. Explicar cómo se establece la hipótesis nula y la hipótesis alternativa.
traumática. 7. ¿Cuáles son las suposiciones que fundamentan el uso de la estadística tal pro-
bar hipótesis relativas a una sola media? ¿Y a la diferencia entre dos medias?
Cepa A: 54, 99, !05, 46, 70, 87, 55, 58, 139, 91 8. Mencionar en qué casos se puede utilizar la estadística z para probar hipótesis
Cepa B: 93, 91, 93, 150, 80, !04, 128, 83, 88, 95, 94, 97 acerca de:
a) La media de una sola población.
¿Proporcionan estos datos la evidencia suficiente para indicar que la va- b) La diferencia entre las medias de dos poblaciones.
riancia es mayor en la población de ratones de la cepa A que en la población e) La proporción de una sola población.
de la cepa B? Sea a= .05. ¿Qué suposiciones son necesarias? d) La diferencia entre las proporciones de dos poblaciones.
9. Al probar una hipótesis acerca de la diferencia en1re las medias de dos pobla-
ciones, ¿cuál es el razonamiento que fundamen1c la ponderación de las varian-
6.9 RESUMEN _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ __ cias de las muestras?
10. Explicar el razonamiento que fundamenta el uso de la prueba de comparación
En este capítulo se analizan los conceptos generales de la prueba de hipóte- por parejas.
sis. Se propone un procedimiento general para llevar a cabo la prueba de 11. Dar un ejemplo relacionado con el propio campo de interés en donde la prueba
de con1paración por parejas sea adecuada. Utilizar datos reales o ficticios y
hipótesis, que consiste de nueve pasos.
poner en práctica la prueba de hipótesis más conveniente.
12. Dar un ejemplo relacionado con el propio can1po de interés en donde sea con-
l. Describir los datos.
2. Determinar las suposiciones necesarias. veniente probar una hipótesis respecto a la diferencia entre las medias de dos
3. Determinar las hipótesis nula y alternativa. poblaciones. LTtilizar datos reales o ficticios para poner en práctica el procedi-
4. Especificar la estadística de prueba. miento de los nueve pasos para la prueba de hipótesis.
13. Resolver el ejercicio 12 para la meJia de una sola población.
5. Especificar la distribución de la estadística de prueba.
14. Resolver el ejercicio 12 para la proporción de una sola población.
6. Proponer la regla de decisión.
15. Resolver el ejercicio 12 para !a diferencia entre las proporciones de dos pobla-
7. Calcular la estadística de prueba a partir de los datos de la muestra.
8. Establecer la decisión estadística basada en los resultados de la muestra. ciones.
9. Conclusión. 16. Resolver el ejercicio 12 para la variancia de una población.
17. Resolver el ejercicio 12 para la relación de las variancias de dos poblaciones.
Se describen en detalle y se ilustran con ejemplos adecuados algunas 18. LTn grupo de in\"estlgadores desean saber si la población adulta de las zonas
rural y urbana de un país en \·ías de desarrollo difieren con resp~cto a la preva-
pruebas de hipótesis específicas. Éstas incluyen pruebas relacionadas con
lencia de !a ceguera. Una inYestigación re\·eló la siguiente información·
las medias poblacionales, la diferencia entre las medias poblacionales, com-
1
¡¡':
302 Pruebas de hipótesis pregu,ztas y ejercicios de repaso 303
!, Grupo N1í111ern de 11111estras N1ín1ero de ciegos ¿Proporcionan estos datos la evidencia suficiente para indicar que las medias
~I de las poblaciones son distintas? Sea a= .05. Detenninar el valor p.
Rural 300 24 21. Un estudio en 90 mujeres que habían dado a luz recientemente, elegidas al azar
Urbano 500 15 de los registros de un departamento de bienestar social, reveló que 27 de ellas
tuvieron un problema de infección intrapartum o postpartum. Probar la hipóte-
¿Proporcionan estos datos la evidencia suficiente para indicar una diferencia en sis nula que dice que la proporción de la población con un problema de infec-
la prevalencia de ceguera de las dos poblaciones? Sea a = .05. Determinar el ción intrapartum o postpartum es menor o igual que .25. Sea a = .05. Deter-
valor p.
minar el valor p.
19. Durante un experimento en el que se utilizaron animales de laboratorio, se re- 22. En una muestra de 150 pacientes admitidos a un hospital de urgencias con cier-
gistraron los siguientes datos acerca del flujo sanguíneo corticorrenal en condi- to diagnóstico, 128 de ellos presentaron vómito. ¿Proporcionan estos datos la
ciones de control y durante la administración de cierto anestésico. evidencia suficiente para indicar. a[ nivel .01 de significación, que la propor-
ción de la población es menor que .92? Determinar el valor p.
Flujo sanguíneo corticorrenal 23. Un grupo de investigadores nlidió el volumen total de líquidos corporales en
(mi/ g I rnin) 15 animales de laboratorio. La media y la desviación estándar son respectiva-
Durante la adll1inistració11 mente, 45 y 5 ce. ¿Proporcionan estos datos la evidencia suficiente para indicar
Anin1al Control que la media de la población es mayor que 40 ce? Sea a= .05.
del anestésico
24. Una muestra de ocho pacientes internados en un hospital con diagnóstico de
2.35 2.00
2 9__ ::,::,
.. cirrosis biliar presentó una concentración media de IgM de 160.55 unidades
1.71
3 1.95
por mililitro. La desviación estándar de la muestra fue de 50. ¿Proporcionan
2.22
4 2.79 estos datos la evidencia suficiente para indicar que la media de la población es
2.71
5 mayor que 150? Sea a== .05. Dett::mlinar el valor p.
3.2 t 1.83
6 2.97 25. Algunos investigadores han observado una 1nayor resistencia de las vías respi-
2.14
7 3.44 ratorias en fumadores que en no fu1nadorcs. Suponer que en un estudio llevado
3.72
8 a cabo para comparar el porcentaje de retención traqueobronquial en las par-
2.58 2. 10
9 tículas en gemelos monocigóticos, sólo uno de los cuales es fumador, propor-
2.66 2.58
10 cionó los resultados indicados en la tabla siguiente.
2.3! 1.32
11 3.43 3.70
12 2.37 l.59
13 1.82 2.07 Porcentaje de retención
1"' 2.98 2.15
15 2.53 Ge111e{o fu111ador Ge111elo 110 fi1111ador
2.05
60.6
¿Es posible concluir con base en estos datos que el anestésico retarda el flujo 12.U
sanguíneo conticorrenal? Sea a== .05. Detenninar el valor p. 56.0
20. Un grupo de inves1igación en alergias llevó a cabo un estudio en el que se 75.2
analizaron dos grupos de individuos. Como parte de la investigación, se hi- 12.5
cieron detenninaciones de eosinófi!os sanguíneos en cada individuo con los 29.7
siguientes resultados: - - 9
:ll ·-
¡~q. 7

B
304 Pruebas de hipótesis
Condicib11 Condición Condición
----- ------
¿Apoyan estos datos la hipótesis de que la evacuación traqueobronquial es más f¡¡dh·id110 .. 1 N !11dirid110 A 8 /11dii·iduo A n
lenta en los fumadores? Sea a= .05. Detennine el valor p para esta prueba. --
82 !24 Jli3 83. 90 124 84. 99 189
26. Un grupo de investigadores desea saber si la situación de tensión psicológica
85. 20/'l 79 86. 22:J i6 87. 203 154
causa incrementos en los niveles de fosfoquinasa creatina en el suero de indivi-
88. 130 182 H9. 99 100 90. 209 140
duos aparentemente sanos. Se dispone de las siguientes concentraciones (!U/litro)
91. IH:'1 11.:l 92. 190 190 93. 148 193
para la población de individuos. Las de1enninaciones fueron hechas mientras 16'.1
94. HH 146 95. 141 143 96. 62
experimentaban tensión psicológica (A) y después, cuando los sujetos disfruta- 1n
97. 2:16 Eii 98. 198 161 99. 150
han de un periodo de calma psicológica aparente (B). Para ayudar a los investi-
100. !45 10:1 l (l !. 201 162 102. 164 201
gadores a tomar una decisión, seleccionar una muestra aleatoria simple a partir 132
103. 207 20:'I 104. 178 179 105. 145
de esta pobl~ción, efectuar un análisis pertinente de los datos de la muestra y 147
I Ofi. 1~9 158 !07. 60 147 108. 125
elaborar un informe descriptivo de los hallazgos y conclusiones. Posterior- 59 91
109. 140 16! 110. 148 58 1 11.
mente, comparar los resultados con los de los demás condiscípulos. 173 153
112. 128 !:'JI 1 [3. 135 183 114.
115. 82 1:10 1!6. 175 126 117. 140 176
Condición Condición Condición 183
--- ---- 118. 140 :'J(j 119. 187 160 120. 165
/11di1·fd110 A B /11dh·id110 A 8 /J1di1·iduo .1 B 121. 126 J;) 7 122. 142 132 123. 167 183
¡_ 173 3. 120 135 124. 120 201 _,_
! ') - 154 122 126. 125 159
193 250 2. 90
127. l :'I ! \ IS 128. 119 150 129. 129 93
4. 154 49 5. 149 83 6. 146 123
l '.10. 111 \()4 ['.{ l. 150 228 1:12. l S'.~ 184
7. 180 126 8. 128 177 9. 180 164
133. 5.'J [ ()8 134. 118 159 135. l~I 134
10. 66 12! 1 ¡_ 129 200 12. 1/() 75
1'.ifi. 171 J:'14 ¡::¡7. 137 86 l'.'18. 175 102
13. 121 182 14. 135 169 15. l:i:i 234
16. 165 67 17. .,
¡ o· 53 18_ 129 l 19 13\1. {j() I ó4 !40. 202
13'.i
13'.i
93
141.
144.
175
104
164
137
142. 140 17.'J 14:l.
19. 118 241 20. 109 138 21. 89 11 :1
145. 129 130 !46. 118 158 147. 265 160
22. 115 1 !2 '.?3. 119 !04 24 200 115 150. 114 215
148. 171 21 ! 149. 110 71
2.'J. 158 224 26. !30 138 - '.
9- 197 22'.i
15 l. 153 116 152. 11 O 119 ¡53_ 190 154
28. 165 172 29. 80 68 30. 161 lfi4
169 156. 115 14
154. 187 139 155. 131
'.i l. JH9 '.?'.)'.? '.)2. 175 106 33. !20 266 152 105
1"
157. 130 74 158. 182 130 159.
'.i4. 117 ]\1() 35. H 15$ 36. 102 :'!Y 148 143
160. 192 145 161. 64 179 162-
'.i7. 174 119 38. 99 93 '.i9. !26 Hi2
135 213 165. 202 124
163. 182 220 164.
40. 47 1:Hl 4 ¡_ l'.'12 89 42. 177 !97 90 162
166. 84 167 167. 121 121 168.
43. 1-l-l 189 H. 177 207 45. ]f-i! J(J9 138 88
169. 187 133 170. 137 72 17 l.
46. K4 ¡4 7 47. 180 193 48. 198 l IO 204 157
172. 187 193 173. 137 96 174.
49. J:jH :,.:7 30. 116 1:1:1 5 J. ] ifi 11:i 120 145
175. 148 102 176. 185 157 177.
;-12. 111 !.19 5'.i. l 09 115 :i4. 181 114
125 113 179. 196 185 180. 207 79
178.
:'J.1. !OH 202 :"jli. :1 / 1]4 :)7. I:i5 64
83 184 183. 174 90
181. 145 154 182.
:'JN. '.?:)!) 79 ."19. !()?, !)6 (i{) 1:'iH ]1-il
118 146 !8S. 136 175 186. 123 176
61. 2(1{) 184.
241) 01 62. l.'i!i 167 fi'.i IN'!
102 136
187. 86 172 188- 102 109 189.
64. !/!) 2'.-Hi ll5. 11 '.i 126 61i. l.iH [8.1
190_ 150 102 19 !. 222 148 I 92. 174 96
fil. l lH 141 68. I Hl I HíJ !i!l. I JI) f)IJ
¡95_ 75 116
70. 12-t ! 37 il. 173 !!l:'J -.,
'- :¿41 ,_
1-') 193. 179 210 194. 188 21
149
96 152 197. 152 187 198. 150
13. 141 I l(i 14. ! ,-J(I '.!'.!9 /:J. ,_
1-,¡ 142
196.
20 l. 77 213
199. 130 168 200. 161 134
16. 17!:I ! :'I l 77. ! 4tl l.).J 7X. ¡;q l :-,'.! 74
202. 103 55 203. 127 152 204. 146
79. 149 ~41i HO. l 40 Hi!J xr. l 011 !J\I
206. 200 106 207. 90 192
205. 130 24

305
Condh:ión Conllil·iún (.'ondh:ión Conr:lici.(,11 Condicióu Coudl.ción
!11dii·id110 A Ji /11dil'id110 A H /11dirid1111 A B buli1·id110 A H Ílc{li1·id1,o A B f!lifi~·i,Í!IU A B
---------- -· -~------------
208. 83 111 209. 122 112 210. 122 178 334. 123 113 335. 170 151 336. 83 155
211. 233 176 212. 154 150 213. 125 194 337. 121 150 338. 121 216 339. 199 83
214. 164 193 215. 187 143 216. 192 157 3-10. 94 138 341. 195 199 342. 92 126
217. 99 154 218. 97 69 219. 140 69 343. 212 71 344. 1fi4 80 3'15. 216 15'2
220. 137 181 221. 178 223 222. 207 121 346. 178 181 347. 219 115 3'"18. 1'12 179
223. 123 187 224. 151 155 225. 206 159 349. 143 175 350. 104 134 351. 124 139
226. !02 150 227. 166 55 228. 171 147 352. 122 165 353. 158 13 354. 129 183
229. 154 148 230. 197 112 231. 111 103 355. 83 137 356. 144 101 357. 183 202
232. 148 110 233. 78 140 234. 192 124 358. 132 139 359. 134 163 360. 97 114
235. 239 101 236. 131 120 237. 67 183 361. 179 106 362. 141 150 363. 98 188
238. 42 178 239. 121 80 240. 180 126 364. 191 62 365. 181 130 36t:i. 165 275
241. 70 164 242. 81 193 243. 167 182 367. 119 184 368. 161 138 369. 103 154
244. 119 146 245. 109 119 246. 175 184 370. 159 37 371. · 130 19 372. 115 2(6
247. 152 162 248. 94 120 249. 64 186 373. 120 128 374. 189 17 375. 125 224
250. 127 193 251. 77 210 252. 190 184 376. 125 169 377. [90 128 378. 127 140
253. 169 160 254. 158 53 255. 11 1 122 379. 105 157 380. 98 118 381. 154 152
256. 123 185 257. 39 147 258. 152 177 382. 113 140 383. 68 146 384. 191 138
259. 211 159 260. 149 70 261. 137 89 385. 190 99 386. 191 115 387. 153 157
262. 79 309 263. 127 132 264. 116 166 388. 141 178 389. 143 142 390. 71 218
265. 150 190 266. 130 169 267. 59 122 39 l. 135 117 392. 153 212 393. 145 193
268. 205 136 269. 149 78 270. 149 243 394. 117 101 395. 163 100 396. 185 163
271. 177 162 272. 147 174 273. 153 179 397. 213 22 l 398. 96 1()() 399. 39 95
274. 185 119 275. 140 171 276. 119 90 400. 226 132 401. 88 !49 402. 151 167
277. 88 78 278. 137 131 279. 173 175 403. 140 101 404. 124 116 405. 105 124
280. 59 113 281. 199 122 282. l (j() 129 406. 50 149 407. 159 222 408. 131 101
283. 80 182 284. 122 !07 285. t 31 147 409. 154 218 410. 140 132 411. 126 202
286. 73 115 287. 229 13G 288. 242 124 412. 79 76 413. 120 151 414. 163 56
289. 97 138 290. 127 8-, 291. 132 70 415. 110 70 416. 147 257 417. 153 172
292. 84 151 293. 120 15!", 294. 161 203 418. l 91 121 419. 217 155 420. !02 1.54
295. 137 91 296. 194 14:l 297. l 7H 161 421. 242 117 422. 179 219 423. 115 66
298. 205 178 299. 114 77 300. 120 1!l:"l 424. 76 125 425. 156 230 426. 205 224
301. 93 181 302. 12:, 91 30'.t l l -1 99 427. 114 151 428. 96 108 429. 99 155
304. 190 128 305. l'.16 129 :U)6. 11-1 l '.i8 430. 170 156 431. 141 196 432. 162 131
307. 109 190 308. 16-t 178 '.\09. 70 173 433. 179 90 434. 205 140 435. 114 149
310. 56 67 31 l. 156 116 :l 12.
-,,
,_ 159 436. 165 44 437. 121 193 438. 130 139
313. 74 140 314. 74 162 315. ! 2ti 90 439. 250 188 440. 90 190 441. 95 21 l
316. 53 154 317. 158 178 318. 182 157 442. 163 171 443. 157 164 444. 92 135
319. 101 192 320. 127 15'.1 :ti l. 11-1 171 445. 173 123 446. 98 174 447. 155 123
322. 201 120 323. l'.)7 178 '.124. 7~1 240 448. 192 92 449. 152 142 450. 158 259
--~25 8-1--1--22 32-i-i-.----86--- 52 327.- - -1 ()~)-- 1·2fi.- 45L 189 --142---A.52 IA:Z___ .453. __ 13l ____l.i2_ _ _
328. 120 187 329. 101 112 :l:HJ. 1X4 192 454. 159 87 455. 98 164 456. 124 217
331. 169 144 332. 12:'i 82 :r1:t l(i9 !ll 457. 83 156 458. 148 201 459. 131 140

306 307
·----------- Condición Condición Condición
Condición Condición CúndiciSn
!ndi1'iduo A B !ndii·h/110 A B Individuo A B
l,;dirid110 A R !ndii·iduo A B /11áirid110 A B
---· 586. 87 69 587. 199 93 588. 143 152
186 134 461. 151 146 462. 88 168
460. 589. 219 205 590. i36 128 591. 98 165
463. 149 130 464. 89 189 465. 104 168
592. 161 210 59'.~. 201 155 594. 165 71
148 143 467. 103 83 468. 106 139
466. 595. 120 177 596. 23 118 597. 180 182
469. 69 86 470. 49 121 471. 173 160
598. 123 157 599. 220 196 600. 148 119
163 114 473. 207 202 474. 134 156
472. 601. 113 156 602. 162 209 603. 115 154
475. 125 204 476. 73 170 477. 160 160
604. 73 128 605. 116 92 606. 173 127
478. 205 183 479. 213 57 480. 254 142
607. 48 93 608. 161 191 609. 183 212
481. 67 133 482. 172 237 483. 138 82
610. 128 97 611. 95 141 612. 212 191
484. 158 170 485. 221 149 486. 76 102
613. 119 128 614. 140 75 615. 99 166
487. 207 164 488. 110 165 489. 196 157
616. 194 132 617. 178 68 618. 142 139
490. 102 193 491. 202 141 492. 139 134
619. 123 73 620. 131 73 621. 205 149
493. 87 176 494. 237 113 495. 169 140
622. 136 136 623. 173 52 624. 188 134
496. 222 45 497. 181 157 498. 65 102
625. 172 72 626. 130 67 627. 108 96
499. 207 68 500. 56 !08 501. 221 40
628. 140 100 629: 193 184 630. 81 224
502. 173 126 503. 183 129 504. 224 155
631. 212 58 632. 169 193 633. 175 150
505. 97 229 506. 206 198 507. 81 178
634. 195 135 635. 130 151 636. 140 138
508. 124 142 509. 136 201 510. 143 135
6'.l7. 130 207 638. 63 158 639. 67 223
51 J. 136 99 512. 170 43 51 '.~. 118 143
640. 202 124 64 l. 127 129 642. 200 l 73
514. 72 _121 515. 146 110 516. 130 197
643. 91 179 644. 129 142 G45. 116 93
517. 178 200 518. 91 87 519. 133 171
646. 163 101 647. 127 166 648. 148 177
520. 165 161 52 l. 176 140 522. 110 42
649. 123 88 650. 232 153 65 J. 172 74
523. 235 192 524. 54 109 525. 160 97
652. 155 111 653. 50 176 654. 134 125
526. 161 119 527. 173 75 528. 107 164
655. 102 122 656. 183 170 657. 94 96
529. 132 90 530. 147 196 531. 124 193
658. 103 200 659. 117 170 660. 122 204
532. 129 125 533. 273 110 534. 90 178
661. 48 146 662. 145 136 663. 130 123
535. 209 146 536. 229 217 537. 105 141
664. 114 101 665. 159 106 666. 127 129
538. 173 181 539. 154 225 540. 149 ti5
667. 168 169 668. 178 109 669. 135 87
541. 92 144 542. 129 11-l 5--1'.1. 141 191
670. 151 70 671. 181 160 672. 109 136
544. 198 192 545. 114 150 546. 124 159
673. 184 125 674. 90 247 675. 107 131
547. 222 139 548. 107 169 549. 147 156
676. 186 82 677. 207 l 04 678. 142 167
550. 220 21 551. 82 156 552. 17H 91
679. 62 99 680. 154 176 681. 196 114
553. 196 121 554. 248 122 S55. (86 111
682. 141 201 683. 170 148 684. 207 154
556. 101 124 557. 116 1--16 558. 1:17 109
685. 109 155 686. 201 128 687. 170 192
559. 167 173 560. 11:\ 95 561. l'.15 20(i
688. 200 199 689. 76 99 690. 148 159
562. 162 158 563. 140 !34 56-.J. 111 152
691. 111 91 692. 78 98 693. 32 158
565. 240 167 566. 61 141 .:,G7. 5() 1)8
694. 217 106 695. 166 219 696. 79 177
568. 165 192 569. 160 131 570. 191 12-!
697. 184 143 698. 199 192 699. 178 109
571. 146 192 572. 6--1 1-Hl 573. 148 110
700. 202 61 70 l. 141 229 702. 121 158
574. 125 170 575. 193 201 576. 25[ 91
703. 169 134 704. 158 130 705. 211 106
577. 154 131 578. fi8 '.! 1--1 579. 217 15J
706. 241 117 707. 120 210 708. 243 252
580, 264 186 58 l. 11.:l 1--IH .:,82. 1:i:1 12.:1
709. 99 119 710. 192 122 711. 115 45
583. 152 l55 584. 111 1:r~ .:",H.:,. 11 i 171

309
308
,. Condición Condición Condición Condición Condición
Condición
Individuo A B /11divid110 A B Individuo J11divid110 A ¡¡ /11dh·iduo A B Individuo A B
A B
712. 83 130 713. 163 99 714. 197 187 838. 185 112 839. 165 216 840. 180 98
715. 134 84 716. 260 160 717. 186 103 84 l. 65 166 842. 66 180 843. 109 122
718. 139 53 719. 64 118 720. 257 164 844. 131 186 845. 142 110 846. 138 190
72 l. 99 128 722. 155 141 723. 150 192 847. 178 191 848. 165 234 849. 121 184
724. 179 183 725. 153 222 726. 181 129 830. 93 223 851. 134 158 852. 139 162
727. 142 178 728. 115 114 729. 166 157 853. l '.~8 121 854. 74 143 855. 34 150
730. 91 145 73 l. 216 148 732. 121 126 836. 77 134 857. 96 48 858. 200 173
733. 204 194 734. 193 176 735. 113 174 859. 139 124 860. 175 133 861. 134 103
736. 91 198 737. 175 121 738. 198 109 862. 164 !37 863. 106 85 864. 153 179
739. 185 145 740. 166 184 74 l. 93 20 l 865. 203 176 866. 160 100 867. 68 204
742. 152 122 743. 170 190 744. 124 118 868. 207 l 73 869. 139 141 870. 122 123
745. 112 124 746. 153 161 747. 179 151 871. 128 200 872. 244 111 873. 70 143
748. 94 150 749. 217 96 750. 139 136 874. 82 117 875. 163 70 876. 265 169
751. 176 173 752. 74 229 753. 146 192 877. 203 206 878. 213 159 879. 75 177
754. ll4 235 755. 213 164 756. 143 173 880. 152 135 88 l. 110 103 882. 155 105
757. 171 145 758. 124 132 759. 83 178 883. 181 115 884. 142 52 885. 65 16!
760. 91 107 761. 107 136 762. 98 177 886. 150 111 887. 236 156 888. 196 56
763. 130 74 764. 150 113 765. 189 72 889. 146 105 890. 160 90 891. 148 137
766. 178 96 767. 177 151 768. 164 151 892. 205 164 893. 162 156 894. 204 154
769. 157 117 770. 116 112 771. 895. 128 195 896. 201 181 897. 76 163
165 89
772. 167 177 773. 126 109 774. 191 103 898. 206 181 899. 157 101 900. 123 164
775. 253 188 776. 167 90 777. 181 162 90 l. l 16 129 902. 113 191 903. 79 169
778. 128 161 779. 192 120 780. 164 904. 156 !69 905. 113 196 906. 132 140
160
78 l. 195 160 782. 200 128 783. 132 140 907. 141 90 908. 159 179 909. 56 171
784. 135 141 785. 160 89 "Ul6. 160 191 910. 141 92 91 l. 260 162 912. 113 134
787. 50 144 788. 153 54 789. 85 913. 110 117 914. 120 130 915. 143 145
14 7
790. 133 218 79 l. 172 172 792. 139 916. 248 96 917. 162 115 918. 159 128
132
793. 103 125 794. 145 125 795. 143 144 919. 155 208 920. 205 96 921. 143 173
796. 170 145 797. 208 79 922. 216 99 923. 164 120 924. 168 183
798. 119 140
799. 100 180 800. 138 203 80 l. 159 148 925. 78 193 926. 188 150 927. 193 174
802. 168 164 803. 250 127 804. 209 156 928. 88 119 929. 169 154 930. 148 137
805. 114 116 806. 221 170 807. 217 93 l. 111 112 932. 164 113 933. 119 64
145
808. 145 228 809. 240 137 810. 123 136 934. 146 130 935. 112 188 936. 141 199
811. 144 162 812. 142 132 813. 172 119 937_ 70 186 938. 93 120 939. 137 112
814. 103 97 815. 143 168 816. 186 72 940. 105 112 941. 129 134 942. 223 54
817. 79 116 818. 135 151 819. 124 200 943. 135 173 944. 172 199 945. 35 129
820. 88 155 82 l. 215 139 822. 76 151 946. 194 181 947. 185 91 948. 148 147
823. 166 94 824. 221 202 825. 92 108 949. 107 131 950. 161 131 951. 127 168
826. 137 134 827. 201 134 828. 169 171 952. 190 135 953. 133 132 954. 149 114
829. 126 91 - - 830._____ 218 -- 102_ _83 l. 144 _ 83__ _ 955. 118 212 956. 203 119 957. 166 109
832. 269 154 833. 126 221 834. 96 188 958. 161 137 - ~q·s~r- 19·3 ---69 Ybo-:---1us--r13
835. 119 30 836. 121 102 837. 188 207 96 l. 215 116 962. 72 141 963. 168 130

310 311
i
312 Pruebas de hipótesis Niños a término ¡:¡
i'!
Indi- ¡(
!ndi- !ndi- J,1di- !11di-
Condición Condición Condición 1·iduo Tie111po 1·id110 Tie111po 1·id11v Tie111po riduo Tie111po viduo Tie111po
/11dl\·id110 A B l!1dh·id110 A B h1di1·id110 A B 53. 10 54. 11 55. 12
51. 14 52. ll
173 965. 99 183 966. 116 177 57. 12 58. 14 59. 11 60. 12
964. 130 56. 12
967. 196 161 968. 61 164 969. 59 95 62. 12 63. 13 64. 13 65. 11
6 J. 12
970. !03 115 971. 146 189 972. 118 220 66. 13 67. 12 68. 12 69. 14 70. 13
973. 128 145 974. 87 158 975. 85 177 72. 12 73. 11 74. 13 75. 11
71. 13
976. 180 200 977. 120 203 978. 149 !08 76. 12 77. 12 78. 12 79. 12 80. 13
979. 233 101 980. 188 111 981. 135 185 8 l. 13 82. 12 83. 12 84. 11 85. 9
982. 98 199 983. 160 154 984. 151 106 86. 13 87. 13 88. 13 89. 12 90. JI
985. 121 125 986. 149 137 987. 173 150 92. 12 93. 12 94. 14 95. 12
91. 13
988. 100 107 989. 99 122 990. 156 146 97. 12 98. 1J 99. JO !OO. 13
96. 12
991. 77 197 992. 210 172 993. 160 179 102. 11 103. 14 104. 12 105. 11 !,1
101. 11
994. 135 105 995. 254 73 996. 186 J07. 1J 108. JI !09. JO 110. 14
156 106. 11
997. 100 129 998. 191 11 O 999. 76 165 112. 12 113. 13 114. 12 115. 12
111. JI
1000. 127 208 1001. 95 150 1002. 131 117. 13 118. 12 119. 11 120. 11
92 116. 13
1003. 135 122. 11 123. 13 124. 12 J 25. 11
135 1004. 184 126 !005. 157 155 121. 13
127. 11 128. 1J 129. JI 130. 14
126. 12
]32. 12 J 33. 13 13-1. 11 135. 13
131. 13
27. Un estudio acerca de! sisten1a de coagu!ación sanguínea de los recién nacidos 137. 10 138. 12 139. 12 140. 13
136. 13
proporcionó los siguientes datos sobre el tiempo de protombina en segundos de 142. 1J 143. 12 144. 10 145. 12
141. 12
la sangre. recolectada de 500 niños a término y 500 niíios nacidos prematura- 147. 12 148. 13 149. JI 150. !2
146. 13
mente, todos ellos sanos. Seleccionar una muestra aleatoria simple de tamaño 152. 13 153. 11 154. 11 155. 11
151. 13
16 a partir de cada una de estas poblaciones para efectuar una prueba de hipó- 157. 12 158. 11 159. 11 160. 13
156. 11
tesis adecuada y determinar si es posible concluir que las dos poblaciones 162. 13 163. 13 164. 12 165. 10
161. 9
difieren con respecto al tien1po medio de !a protrombina. Sea a= .05. Poste- 167. 13 168. 11 169. 12 170. 13
166. 11
riormente. comparar los resultados con los de los den1ás condiscípulos. ¿Qué 173. 11 174. 13 175. 12
171. 12 172. 13
suposiciones son necesarias para que l? prueba sea válida? 177. 12 178. 12 179. 12 180. JI
176. 13
182. 13 ]83. 12 184. 12 185. 12
18l. 11
188. 12 189. 12 190. 1J
Niños a término 186. 11 187. 12
192. 13 193. 12 19-1. 12 195. 12
lndi- lndi- lndi- Indi- Indi- 191. ll
197. 12 198. 13 199. 13 200. 1J
viduo Tie111po 1·id110 Tie111po 1·iduo Tien1po 1·id110 Tie111po 1·id110 Tiempo 196. 11
202. 13 203. 12 204. 12 205. 12
201. 13
J. 14 2 14 3. 12 4. 13 ~ 11 209. 11 210. JJ
206. 11 207. 11 208. 13
6. 11 7. 13 8. 12 9. 14 ¡~ 12 21,-1. 13 215. 13
2 J J. JJ 212. JI 213. 14
I J. 12 12. ]] 13. 12 14. 12 15. 12 219. 12 220. 13
216. 12 21 7. 12 218. 11
16. 13 17. 12 JL 12 19. JO 20. 12 224. 10 225. 12
22 l. 12 222. 11 223. 11
21. 11 22. JO 23. 13 24. 12 25. 12 229. 12 230. 12
226. 13 227. 14 228. 12
26. 13 27. 13 H. 12 29. 11 w. 12 231. 14 232. 12 233. 12 234. 11 235. 14
31. 12 32. 13 u. 12 34. 12 35. 13 236. 14 237. 11 238. 13 239. 12 240. 12
36. 13 37. 12 38. 12 39. 11 w. 12 244. JJ 245. 14
24 J. 12 242. 12 243. 13
4 J. 14 42. 11 43. JO 44. 12 45. 13 249. 13 250. 11
246. JO 2':1:7. 12 248. 1J
46. 11 47. 12 g 12 49. 13 50. 12 254. JJ 255. 12
251. 12 252. 13 253. 12

313
1
J Niños a término Niños a término
Indi- Jndi- !11di- Jndi- Indi- /ndi- lndi- l11di- !11di- Indi-
viduo Tien1po 11id110 Tien1po viduo Tien,po viduo Tien1po viduo Tien,po ~·id110 Tien1po viduo Tien1po viduo Tien1po viduo Tiempo viduo Tie111po
256. 13 257. l3 258. 12 259. 13 260. 12 461. ll 462. 12 463. 9 464. 12 465. 14
261. 13 262. 12 263. 13 264. l3 265. 12 466. lO 467. ll 468. 11 469. ll 470. ll
266. 13 267. 11 268. 12 269 .. 11 270. ll 47l. l2 472. JO 473. l4 474. 14 475 12
271. 11 272. 13 273. 13 274. 13 275. 12 476. 12 477. l2 478. 13 479. 15 480. ll
276. 12 277. ll 278. 12 279. 12 280. ll 481. ll 482. ll 483. 11 484. 12 485. 12
281. 12 282. 13 283. 12 284. 10 285. 12 486. 12 487. l2 488. 13 489. 12 490. 12
286. 12 287. 12 288. 12 289. l l 290. 12 491. lO 492. 12 493. 12 494. 12. 495. 10
291. 12 292. ll 293. 11 294. 13 295. 13 496. 12 497. 11 498. l3 499. 10 500. 1.3
296. 11 297. 12 298. 12 299. 12 300. 12
301. 12 302. 12 303. 11 304. 11 305. 12
306. 12 307. 11 308. 11 309. 11 310. 12 Niños pren1aturos
311. 11 312. 12 313. 11 314. 13 315. 11 lndi- Indi- lndi-, Indi- Indi-
316. 11 317. 12 318. 10 319. 13 320. 13 viduo Tien1po viduo Tie,npo viduo Tie111po viduo Tien1po viduo Tiempo
321. 13 322. 12 323. l3 324. 13 325. 13 l. 12 2. 14 3. 16 4. l4 5. 14
326. 12 327. 13 328. 10 329. 15 330. 10 6. 14 7. l5 8. l3 9. 12 lO. 15
331. 10 332. 13 333. 11 334. 12 335. 12 l l. l4 12. 15 13. 15 l4. 14 15. 13
336. 12 337. 11 338. 12 339. 12 340. 12 16. 13 17. 14 18. l7 19. 12 20. 15
341. 13 342. l3 343. 12 344. 12 345. 10 21. l3 22. 14 23. 15 24. 14 25. 14
346. 11 347. 12 348. 11 349. 13 350. 10 26. 13 2i. 16 28. l2 29. 12 30. l3
351. 14 352. l3 353. 13 354. 10 35S. 12 3 l. 14 .32. 14 33. 14 34. 16 35. 13
356. 13 357. 14 358. l3 359. 13 360. 11 36. 15 37. 16 38. l6 39. a¡ 17 40. 15
361. 13 362. 10 363. 12 364. 13 365. 12 4 l. 16 42. 14 43. 13 44. 14 45. 13
366. 10 367. 12 368. ll 369. ll 370. 14 46. 15 47. 15 48. l5 49. 15 50. 14
37 l. 13 372. 11 373. 13 374. 12 375. 13 51. 15 -9 13 53. 13 54. 14 55. l5
º-·
376. 14 377. l3 378. 11 379. 14 380. 11 56. 14 57. 14 58. 13 59. 16 60. 13
38 l. 11 382. 12 383. l2 384. 11 385. 11 6 l. l3 62. 14 63. 13 64. 14 65. l3
386. 13 387. ll 388. 11 389. l2 390. 13 66. 15 67. 14 68. 15 69. 14 70. 13
391. l l 392. 11 393. ll 394. 13 395. 12 71. 15 72. 14 73. 14 74. 16 75. l5
396. 10 397. l2 398. 12 399. l2 400. 12 76. 12 77. 12 78. 14 79. 14 80. 14
401. 12 402. 11 403. ll 404. 12 405. 11 81. 13 82. 15 83. l8 84. l4 85. l6
406. 12 407. 12 408. l2 409. 12 410. 12 86. l4 87. l5 88. 14 89. 16 90. l3
411. 10 412. 12 413. 11 414. 13 415. 13 91. 12 92. 16 93. l4 94. IS 95. l4
416. 12 417. 13 418. 12 419. 12 420. 14 96. l6 97. 13 98. 17 99. 15 100. l5
42 l. 12 422. lI 423. 13 424. 14 425. 10 10 l. 14 102. l8 103. l6 (04. 14 105. l4
426. 12 427. 13 428. 12 429. 13 430. l2 106. 13 107. 12 108. 14 109. 12 110. l6
431. ll 432. l4 433. 13 434. 12 435. 11 111. 15 112. 14 113. 12 114. 15 115. l6
436. 14 437. 11 438. 11 439. -13 440. 11 116. 14 J 17. 13 118. 15 119. 9 120. 16
441. 13 442. 11 4c13. 12 444. 12 4-15. 12 121. l6 (22. 14 123. 14 124. 15 12S. l4
446. 11 447. 10 448. 12 449. 14 450. 11 __ 126 .. ____ J..3.-L21.---l 3 --1-28.---------l.-6-----l-29. -- -1--2---I--30. -1-4----------
---4·5-1--:---t-3---452:-----i--:3--,.33:------i~- . ·45,f ---12 455. 13 1 133. 15 13-1. 16 135. 14
131. 13 132. ll
456. 11 457. 12 458. 12 459. 11 460. 12 136. 13 I.37. 15 138. l5 139. 14 1-10. 12

314 11,
Preguntas y ejercicios de repaso 317
Niños prcn1aturos
Indi- !11di- !11di· I11di- Indi- Niños pren1aturos
vid110 Tien1po riduo Tie111po 1·id110 Tien1po viduu Tie111po viduo Tie111po
l11di- /11di- !ndi- !11di- Indi-
141. 13 142. 13 143. 12 144. 14 145. 13 1·iduo Tie111po l'iduo Tie111po l'id110 Tie1npo 1·iduo Tie,npo viduo Tie111po
146. 11 147. 16 148. 14 149. 14 150. 12 14 350. 15
346. 13 347. 9 348. 13 349.
151. 12 152. 13 153. 15 154. 17 155. 15 355. 15
35 l. 12 :{52. 14 35'.{. 14 354. 13
156. 14 157. 13 158. 14 159. 13 160. 15 359. 360. 12
356. 15 357. 14 358. 14 15
161. 13 162. 15 163. 14 164. 16 165. 13 364. 17 365. 14
36 l. 14 362. 16 363. 14
166. 13 167. 12 168. 13 169. 12 170. 14 369. 16 370. 11
366. 13 367. 15 368. 15
171. 12 172. 15 173. 13 174. 11 175. 13 374. 15 375. 12
371. 13 :172. 14 373. 15 il
176. 13 177. 15 178. 13 179. 13 180. 15 15 380. 15
376. 15 377. 16 378. 13 379. 1

181. 14 182. 12 183. 12 184. 16 185. 13 384. 16 385. 15


38 J. 15 382. 15 383. 15
186. 13 187. 14 188. 12 189. 14 190. 16 389. 13 390. 13
386. 15 387. 15 388. 16
191. 14 192. 14 193. 14 194. 12 195. 15 394. 12 395. 17
391. 17 392. 12 393. 11
196. 12 197. 14 198. 16 199. 16 200. 14 399. 12 400. 16
396. 13 397. 13 398. 16
201. . 13 202. 12 203. 12 204. 13 205. 15 404. 15 405. 14
40 l. 13 402. 15 403. 14
206. 13 207. 14 208. 12 209. 15 210. 14 409. 14 410. 13
-106. 13 -107. 16 408. 12
211. 12 212. 15 213. 14 214. 14 215. 16 17 4 15. 15
411. 13 ·t 12. 13 413. 14 -114.
216. 17 217. 13 218. 14 219. 15 220. 16 419. 12 420. 14
-!16. 14 417. 14 41R. 16
221. 14 222. 15 223. 14 224. 13 225. 13
-121. 14 4')9 14 423. 14 -!24. 13 .,.
4 '>" 15
226. 14 227. 15 228. 13 229. 15 230. 13 429. 12 430. 15
426. 13 42/. 14 428. 11
231. 14 232. 11 233. 15 234. 13 235. 14 434. 13 435. 15
431. 15 432. 15 433. 13
236. 15 237. 13 238. 13 239. 14 240. 11 439. 14 440. 12
436. 18 4'.17. 14 438. 14
241. 13 242. 14 243. 15 244. 14 245. 13 -!-14. 14 445. IG
441. 15 -142. 1:°J -!43. 14
246. 14 247. 13 248. 14 249. 15 250. 15 -1-19. 15 450. 13
-!46. 15 447. !l.i 448. 15
251. 14 252. 13 253. 15 254. 17 255. 14 454. 14 -155. 13
451. 15 452. 15 45'.t 14
256. 15 257. 13 258. 12 259. 15 260. 15 459. 14 460. 14
456. 15 4S7. 12 -!58. 13
261. 14 262. 14 263. 14 264. 14 265. 15 14 465. 13
461. l:'1 462. Hi 46:t 16 464.
266. 14 267. 15 268. 15 269. 15 270. 11 -!69. 16 -170. 15
466. 16 ·Hi7. 15 468. 15
2íl. 12 272. 14 273. 11 274. 16 275. 12 -174. 12 475. 13
471. 12 4í2. 14 473. 14
276. 12 277. 13 278. 14 279. 15 280. 14 -!79. 14 480. 16
4í6. 14 477. 15 478. 13
281. 12 282. 16 283. 14 284. 12 285. 15 -!S-!. 13 -!85. 14
48 l. 12 4K2. 15 48'.t 14
286. 14 287. 14 288. 14 289. 17 290. 19 -1?'\9. 12 490. 14
-H~6. 13 487. !ti 488. 14
291. 13 292. 13 293. 14 294. 13 295. 15 -!94. 15 495. 15
-191. 1~{ 492. 13 -19:l. 15
296. 14 297. 12 298. 16 299. 14 300. 15 1:~ -199. 12 soo. 16
-196. 11 49í. 13 498.
301. 16 302. 11 303. 14 304. 12 305. 15
306. 12 307. 13 308. 13 309. 16 3i0. 15
28. Los siguientes datns de la cin.:unl'erc1K·iJ cr::tncana (en centín1etros) pro\'ienen
31 I. 13 312. 15 313. 14 314. 14 315. 15
de un::t pohlación Je ;1dolcscen1es Yarones con un cromosoma sexual anorn1al
316. 12 317. 11 318. 15 319. 12 320. 16
l CSA) y una pohlacii'in nurn1a! de cnnlrol (NC). Se fonnaron parejas de indi-
321. 13 322. 13 323. 13 324. 16 325. 13
\'iduos según la edad. grupo étnico y condición socioeconón1ica. Seleccionar
326. 15 327. 14 328. 16 329. 15 330. 15
una muestra ;1leatoria sin1ple de 1nn1aii.o 20 a partir de la población y efec·
331. 14 332. 15 333. 12 334. 15 335. 15
tuar una prucha de hipótesis adecuada p::ira de1en11inar si es posible concluir
336. 13 337. 13 338. 14 339. 14 340. 16
que los indi\'iduus con el 1..Tnn1osn1na anormal tienden a tener n1ás pequeña la
341. 16 342. 13 343. 14 344. 17 345. 15
cahc1a que lns int.lividu(1s norn1a\1.':s. Sea r1. = .05. Cnnstruir un in1ervalo de

316
l
¡ 318 Pruebas de hipótesis Pa- Pa-
confianza del 95 por ciento para la diferencia de las medias de las poblaciones. reja CSA NC reja CSA NC
¿Qué suposiciones son necesarias? Comparar los resultados con los de las 73. 50.7 54. l 74. 58.2
demás condiscípulos. 1 75. 55.3 57.7 76.
56.4
53.1 54.6
77. 57.8 58.0 78. 50.5 50.0
Pa- Pa- 79. 53. 1 56.5 80. 55.3 57.1
reja CSA NC reja 81. 57.0 58.7 82.
CSA NC 57.0 58.3
l. 50.3 83. 57.9 58.l 84. 54.8 57.2
53.2 2. 55.2 58.1
3. 54.5 85. 56.0 58.I 86. 50.2 50.3
56.0 4. 49.7 53.7
5. 51.5 55.5 87. 56.8 58.3 88. 52.7 54.5
6. 58.2 58.2
7. 52.2 54.7 89. 52.7 55.6 90. 54.7 -- ?
8. 56.5 58.6 O I ·-
9. 58.9 58.8 91. 56.7 58.7 92. 52.B 55.3
10. 53.6 57.8
I l. 54.7 57.8 93. 55. l 58.2 94. 52.4 57.6
12. 53.7 55.7
13. 55.9 60.9 95. 56.0 58.3 96. 56.7 58.3
14. 55.9 58.7
15. 59.3 60.2 97. 50.3 57.I 98. 53.2 56.0
16. 56.8 58.4
17. 55.7 58.5 99. 47.8 50.7 100. 50.4 50.9
18. 55.3 57.6
19. 54.9 58.7 10 l. 54.5 57.7 102. 54.4 57.9
20. 57.9 58.3
21. 52.5 57.7 103. 54.4 56.8 [04. 57.8 58.4
22. 57.6 59.4
23. 54.8 59.3 105. 55.3 58.l 106. 53.9 57.5
24. 54.6 57.7
25. 57.4 58.2 107. 57.2 58.3 108. 55.7 57.3
26. 54.6 56.6
27. 56.9 58.8 109. 53.2 54.8 110. 56.2 58.7
28. 55.6 58.9
29. 54.3 1 11. 53.L 55.2 112. 55.3 58.3
58. l 30. 53. 1 56.5
31. 55.7 57.6 113. 56.3 58.l 114. 54.6 58.7
32. 50.2 52.8
33. 54.4 56.6 115. 56.3 58.2 116. 57.0 58.1
34. 57.2 58.2
35. 53.7 58.3 11 7. 53.6 55.8 118. 5i.5 58.3
36. 56.0 57.6
37. 54.9 56.4 119. 50.8 54.7 120. 53.l 56.0
38. 58.l 58.l
39. 52.5 53.3 121. 56.0 57.3 122. 54.0 56.7
40. 50.4 52.9
41. 52.4 53.0 123. 55.4 56.3 124. 50.8 53.2
42 56. l 57.4
43. 55.7 57.8 125. 55.0 57.4 126. 53.7 55.3
44. 56.6 57. l
45. 53.3 57. 1 127. 55.3 58.3 128. 57.3 57.2
46. 56.5 58.8
47. 54.8 56.3 129. 55.5 57.5 130. 53.8 57.0
48. 58.1 58.2
49. 52.6 54.4 131. 53.4 58.5 132. 57.1 58.8
50. 51.8 54.1
51. 52.4 56.8 133. 57.0 58.4 134. 49.9 54.6
52. 57.4 57.2
53. 55. l I:{5. -9 ')
:J-.- 55.8 136. 55.8 58.5
58.1 54. 54.l 57.5
55. 54.6 58.6 137. 50.9 53.'.1 138. 54.0 55.4
56. 57.7 58.5
57, 53.9 58.5 139. 55.3 58.9 140. 54.7 56.1
58. 51.2 50.3
59. 55.8 56.6 I el !. 53.2 56.J 142. 56.8 58.5
60. 58.3 58. l
61. 57.3 57.9 14:). 54.8 58.5 IH. 56.0 58.7
62. 50.8 55.8
63. 55.5 58.4 lel5. Sel.O 56.2 146. 53.0 54.9
64. 58.3 58.I
65. 55.0 58.7 14 7. :J __ ::,
- <) -
54.8 148. 485 58.2
66. 57.2 58.4
67, 149. Sti.7 58.6 150. 58.'.) 58.4
69.
51. l 52.8 68. 53.8 58.2
1:"l l. 50.-l :33.1
,
¡ :- ')__ 5i.4 57.-l
50.7 ·o..B 70-----56,-7---------S-8-:-8
71. l:">:I. 52.6 50.1 1:J--1.·- 5).'., 5~.2
56.6 58.7 72. 52. l 55.5 58.6 [56. 5el ..~ 5i.5
[55. 53.ti

319
'

Pa- Pa- Niños incapacitados para el aprendizaje


reja CSA NC reja CSA NC
lndi- /11di- lndi- Indi- Indi-
157. 51.3 Si.J 158. 53.7 58.2 11iduo Tie1npo viduo Tien1po viduo Tie,npo 1·id110 Tien1po viduo Tiempo
159. 51.8 55.2 160. 55.2 58.1 236. 14.6 237. 26.2 238. 24.9 239. 24.8 240. 30.9
161. 57.6 58.3 162. 55.9 58.8 241. 25.7 242. 31.3 243. 23.l 244. 17.5 245. 22.7
163. 58.3 58.5 164. 55.6 58.8 246. 23.7 247. 24.0 248. 20. 7 249. 23.8 250. 26.9
165. 53.8 56.5 166. 55.7 58.5 251. 23.6 252. 20.9 253. 29.7 254. 18.I 255. 27.9
167. 55.3 56.7 168. 56.0 58.9 256. 13.0 257. 23.2 258. 21.5 259. 26.4 260. 22.7
169. 56.0 58.1 170. 55.7 58.2 261. 26.6 262. 29.1 263. 28.6 264. 24.2 265. 34.9
17 l. 54.3 58.9 172. 54.6 57.2 266. 22.6 267. 26.2 268. 11.3 269. 30.0 270. 22.7
173. 57.9 58.7 174. 54.9 58.7 271. 22.1 272. 18.4 273. 18.2 274. 18.l 275. 26.9
175. 55.3 58.l 176. 52.8 56.6 276. 27.0 277. 23.8 278. 21.9 279. 17.4 280. 29.0
177. 53.2 55.8 178. 56.7 58.4 281. 19.0 282. 30.4 283. 26.4 284. 26.3 285. 28.l
l 79. 58.5 58.2 180. 54.8 57.6 286. 27.9 287. 19.9 288. 24.5 289. 22.2 290. 24.4
181. 54.2 56. l 182. 57.1 58.I 291. 29.2 292. 23. 7 293. 24.9 294. 17.6 295. 24.5
183. 52.8 55.6 184. 57.6 58.4 296. 31.5 297. 15.1 298. 23.5 299. 25.2 300. 26.6
185. 56.3 58.0 186. 53.7 56.5 30 l. 21.5 302. 31.4 303. 27.3 304. 24.2 305. 27.1
187. 56.9 58.2 188. 56.3 58.4 306. 27.2 307. 27.4 308. 19.5 309. 21.6 310. 21.3
189. 54.7 56.5 190. 55. l 57.7 311. 26.I 312. 30.I 313. 27.8 314. 31.9 315. 22.3
191. 56.0 58.3 192. 54.5 57.6 316. 24.6 317. 25.5 318. 25.9 319. 21.8 320. 21.9
193. 55.2 57.0 194. 54.7 56.8 321. 26.6 322. 30.1 323. 26.4 324. 16.4 325. . 29.5
195. 54.9 58.l 196. 56.6 58.l 326. 20.5 327. 21.8 328. 22.9 329. 14.7 330. 25.7
197. 56.2 58.2 198. 54. l 57.8 331. 24.9 332. 23.2 333. 20.5 334. 24.0 335. 22.9
199. 57.2 58.3 200. 55.5 57.7 336. 23.6 337. 17.5 338. 24.9 339. 10.1 340. 25.3
20 l. 54.4 58.6 202. 52.8 56.4 34 l. 23.8 342. 24.8 343. 27 .3 344. 25. l 345. 22.9
203. 53.0 57. l 204. 52.2 54.4 346. 22.2 347. 26.2 348. 29.3 349. 20.7 350. 25. I
205. 58.2 58.5 206. 52.4 55.6 351. 17.4 352. 26.7 353. 22.2 354. 23.1 355. 27.5
207. 48.0 58.0 208. 53.6 57.6 356. 25.5 357. 11.0 358. 22.6 359. 39.8 360. 14.8
209. 52.7 55.2 210. 55.8 58.9 361. 15.9 362. 26.3 363. 24.5 364. 16.3 365. 16.1
211. 53.7 56.5 212. 5 l.5 55.0 366. 21.7 367. 21.2 368. 20.1 369. 18.2 370. 23.2
213. 55.1 56.5 214. 57.7 58.3 371. 20.2 372. 23.3 373. 16.2 374. 24.4 375. 25.3
215. 54.4 56.7 216. 53.8 56.9 376. 30.4 377. 22.7 378. 23.2 379. 19.8 380. 31.3
21 7. 52.9 55.1 218. 54.9 58.1 381. 33.9 382. 33.l 383. 19.8 384. 22.6 385. 27.5
219. 56.1 58.4 220. 57.8 58.6 386. 26.5 387. 25.6 388. 23.7 389. 21.2 390. 19.7
22 l. 52.3 53.8 222. 5 l.9 55.2 391. 20.l 392. 25.8 393. 20.3 394. 29.9 395. 17.5
223. 54.4 57.3 224. 57.6 58.3 396. 20.6 397. 29.4 398. 16.0 399. 21.8 400. 23.3
225. 55.0 58.5 226. 55.6 57 .l 401. 30.3 402. 33.4 403. 27.0 404. 25.8 405. 28.9
227. 55.7 57.0 228. 53.6 56.7 406. 16.5 407. 24.5 408. 24.7 409. 31.4 410. 24.6
229. 53.5 55.4 230. 54.3 57.8 411. 26.0 412. 26.9 413. 22.9 414. 21.8 415. 22.9
231. 52.8 54.7 232. 56.2 58.0 416. 23.1 417. 23.1 418. 26.5 419. 11.4 420. 25.3
233. 57.5 58.8 234. 57.9 58.1 421. 28.5 422. 23.8 423. 28.1 424. 29.5 425. 27.2
235. 54.9 58.5 236. 57. l 58.5 426. 23.4 427. 15.8 428. 23.2 429. 25.3 430. 30.6
237. 56.l 57.8 238. 53.2 57.3 43 I. 23.2 432. 30.8 433. 22.9 434. 27 .5 435. 20.2
239. 52.9 56.4 240. 56. l 57.5 436. 26.6 437. 28.9 438. 23.3 439. 21.8 440. 18.5

320 337
Niños incapaci.tados para el aprendizaje

[ndi-- huli-- fndi· f11di-- l11di- Niños aptos para el aprcndizajl!


i·iduo Tien1po 1·id110 1i'e111po 1·id110 Ti('ll!po 1·id110 Tie111po viduo Tien1po
¡11di-- fndi-- /11di-- h1di-- !ndi--
441. 29.7 442. :~o. 1 443. 24. l 44..J. 19.8 -145. 18.5 viduo Tie111po 1·i(lt10 Tie111po riduo Til•111p11 1:id11n Tieinpo riduo Tie111po
-----
446. 2!.i. l 447. l :l.2 448. 23.2 449. :'17.7 450. 30.0 22.1 117. 25.4 118 27 .3 119. 23.2 !20. 27.6
116.
451. 30.9
1 456. 19.9
452.
-157.
23.3
2--l.8
45'.l.
458.
23.7
28.3
454.
459.
'.10.9
29.0
455.
·HiO.
16.2
'.F.i.O
J 21.
126.
~)2.6
25.4
122.
127.
28.0
26. l
123.
128.
27.1
23.6
124.
129.
27.8
29.7
125.
130.
26.9
26.2
46L 2:3.6 4fi2. 2.S.5 4t):I. 3'.1.2 --Hi·L 29.4 4!i5. 25.!s 30.4 132. 27.6 !33. 26.2 [34. 26.7 135. 28.I
L3 l.
466. 25.5 -Hi7. 17.8 468. 2'.1.8 4/i(!. :'11.fi 470. 25.'.I 31). ! 137. 23.2 I38. 24.3 139. 23.8 140. 23.2
136.
471. 24.7 472. 21.5 473. 20.0 47·L 18.2 475. 19.8 24.ü 142. 29.0 143. 20.0 144. 29.8 145. 23.5
l ..J l.
476. 25.6 477. 20.I 478. 23.7 47!1. 25.2 480. 19.8 146. 22.8 147. 25.4 148. 27.7 149. 26.3 150. 27.3
481. 29.3 482. 29.0 48:t 15.1 484. 12.8 485. 27.2 t5 l. 28.ü 152. 28.5 153. 31.8 154. 26.6 155. 20.4
-186. 25.9 487. 26.I 488. 2:).0 ·189. 28.8 -190. 22.9 156. 25.7 157. 28.0 158. 27.4 159. 25.0 160. 32.2
491. 28.9 492. 17.2 49'.I. 19.2 4~-l. 21.2 4:95. 28.3 161. 29.4 162. 30.9 163. 24.2 164. 23.7 165. 27.0
496. 31. l 497. 25.0 498. 21.9 409. 25.2 500. 20.8 166. 27.0 167. 28.0 168. 29.2 169. 29.2 170. 27.2
17 !. 2..J.I 172. 2i.O L73. 23.8 174. 24.4 175. 27.6
176. '22,7 177. 28.9 178. 26.7 179. 27.5 180. 23.5
Niños aptos para el aprl'ndizajc 181. 30.3 182. 27.7 183. 24.9 184. 21.8 185. 30.7
186. 27.2 187. 29.0 188. 31.2 189. 24. 7 190. 28.9
/11di-- /11di-- /11di-- /11di-- /11di· 32.0 l 93. 25.3 194. 28. 7 195. 27.0
191. 26.3 192.
1·id110 Tie111po i·iduo Tic111po 1·id110 Ticn1po i·fr/110 Tie111po 1·iduo Tie,npo
196. 28.5 197. 24.9 198. 25.I 199. 30.4 200. 24.9
l. 32.0 9 :10.6 3. 29.l 4. :\ 1.8 o. 2:",.3 20 l. 27.3 202. 25.8 203. 28.6 204. 24.8 205. 26.9
6. 26.0 7. 24.2 8. 2i.5 9. 20.8 10. 28.2 206. 28.9 207. 21.6 208. 21.6 209. 22.3 210. 30.2
11. 28.3 12. 23.9 13. 28.4 14. 22.3 15. :10.4 211. 24.6 212. 3/J. l 213. 23.3 214. 29.7 215. 32.9
lfi. 2.S ...i 1i. :lo.o 18. :Hl.U 19 '.'11.2 20. ~;:1.5 216. 31.8 217. 30.7 218. 27.2 219. 32.0 220. 19.9
2 !. 28.5 22. 28.1 2:1. 25.7 2·1. 32.8 25. 24.5 221. 2..J.2 222. 30.2 223. '.12.2 224. 34.5 225. 31.6
26. 24.5 27. ~4.9 28. :~0.6 29. :10.4 :10. 2-t.O 226. 23.0 227. 32.6 228. 3 L1 229. 26.6 230. 28.9
31. 22.7 32. 20.4 3:;. 27.U 3--1. 25.8 :'15. 28.5 231. 22.2 232. 30.6 233. 26.6 234. 29.7 235. 28.7
36. 26.4 37. 29.5 38. 26.4 :l9. 28.4 40. 2:",.[ 236. 30.9 237. 27.0 238. 26.0 239. 23.7 240. 26.6
41. 26.2 42. 28.0 43. :'11.4 H 29.5 45. :{0.1 241. 28.7 242. 29.9 243. 32.3 244. 26.3 245. 27.2
46. 24.7 4i. 29.0 48. 28.0 49. 25.4 50. 25.K 246. 26.2 247. 23.6 248. 20.9 249. 31.5 250. 27.2
51. 23.8 5'' 27.2 53. 27.0 .:l4. 28.8 55. 29.9 251. 27 .8 252. 25.3 253. 21.7 254. 31.6 255. 23.2
56. 22.4 57. 2..i.1 ~)!'{, 25.0 59. '.Hl.2 60. 28.:l 256. 27.8 257. 23.7 258. 22.2 259. 28.6 260. 29.6
61. 29.! 62. 27.0 6:í. :10.i 64. :12.!i 6:'i. 23.2 261. 25.2 262. 28.4 263. 25.6 264. 27 .8 265. 27.9
66. 29.9 67. 25.8 68. 20.5 \)~). :10.5 70. 28. l 266. 25.7 267. 29. I 268. 32.0 269. 26.0 270. 26.8
71. 20.6 72. 29.1 7'.1. 22.8 74. 21.3 7:í. 2--1.5 271. 23.5 272. 25.5 273. 22.5 274. 23.6 275. 24.1
76. 29.I 77. 22.8 78. 23.3 79. 22.1 80. 32.4 276. 25.l 277. 28.3 278. 28.2 279. 26.8 280. 31.0
81. 31.4 82. 25.6 83. 32.2 s..i. 30.6 85. 25.l 281. 21,3 282. 26.7 283. 24.9 284. 24.3 285. 25.1
86. 30.4 87. 29.3 88. 28.8 89. 25.l 90. 26.4 286. 27.3 287. 28.5 288. 25.8 289. 21.3 290. 26.7
91. 28. ! 92. 32.1 93. 26.3 94. 26.5 2~ l. 29.4 202. 28.2 2':l'.I. 28.5 29--l. 24.5 2!J5. ~li.~
95. 26.4
96. 32.8 97. 26.7 98. 31.7 99. 27.0 2~Jfi. 24.5 297. 24.4 291-l. '.F1.5 299. 28.0 :100. 2~).9
100. 28.3
IOt 28.5 102. --29.4- .l-03.--- ----2-1.2- --104. --26.3 -105. ----- 27.6----- .3J.l.L 27 O 302. _!-17.J '.10'.t '.!'.).() :104. 2().7 '.)1)5. '.12.8
!06. 25.7 107. 28.l 108. 23.0 109. 9- •
~ 1.3 110. 26.5 306. 20 ..1 ~{07. 23.:{ :{(),'s. :l'.1.-1 :1011 ~7.5 '.I 1O. 2:1.K
111. 28.4 112. 23.5 113. 30.6 114. 2:1.4 115. 27.2

339
338
Pruebas de hipótesis 341
340 1 Bibliografía
31. Se nlidieron los niveles de circulación de estrona en una muestra de 25 mujeres
Niños aptos para el aprendizaje
postmenopáusicas que siguieron un tratamiento de estrógeno. La media mues-
lndi- lndi- lndi- lndi- /11di- tral y la desviación estándar son 73 y 16, respectivamente. A un nivel del .05
viduo Tien1po 1·id110 Tie111po l'iduo Tien1po viduo Tie111po i·iduo Tien,po de significancia, ¿es posible concluir con base en estos datos que la media de la
311. 26.1 312. 27.0 313. 28.4 314. 27.2 315. !!6.9 población es n1ayor que 70?
316. 26.2 317. 29.5 318. 28.8 31 ~l. 24.6 '.i20. 26.3 32. Se realizaron determinaciones ·de la resistencia vascular sistémica en una mues-
321. 23.8 322. 28.8 323. 22.8 :-124. 31.5 325. 25.5 tra de 16 pacientes con deficiencia cardiaca crónica y congestiva mientras
326. 27.2 327. 28.9 328. 24.5 329. 28.7 3'.10. 33.5 recibían un tratamiento. La media muestral y la desviación estándar son 1600 y
331. 30.0 332. 27.8 333. 25.0 3:~4. 25.9 :.,35. 26.l 700, respectivamente. Con un nivel del .05 de significancia. ¿es posible con-
336. 28.1 337. 27.2 338. 28.9 339. 25.5 340. 23.0 cluir, con base en estos dalos, que la media de la población es menor que
341. 33.8 342. 23.5 343. 23.4 ::S44. 25.6 345. 27.5 2000?
346. 30. I 347. 27.I 348. 33.5 349. 26.1 350. 26.2 33. La longitud n1edia de 14 niiios varones recién nacidos fue de 53 cm, con una
35 l. 29.4 352. 26.9 353. 24.8 '.i54. 28.6 355. 30.3 desviación estándar de 9 cm. ¡.Es posible concluir con base en estos datos que
356. 22.6 357. 25.9 358. 26.8 359. :,2.9 360. 27.6 la media de la población no es de 50 cm? Sea la probabilidad de cometer un
361. 25.4 362. 22.3 363. 25.8 364. 27.5 365. 29.1 error de tipo I igual a .1 O.
366. 31.2 367. 31.6 368. 18.8 '.169. 29.8 370. 25.-1
371. 25.6 372. 30.4 373. 28.0 37-t. --·'
99 - 375. 27.1
28.0 380. 31.:;¡
376.
381.
31.6
26.0
377.
382.
26.0
27.5
378.
383.
27.7
25.2
'.179.
'.18-t. 26.2 385. 28.8 1 BIBLIOGRAFÍA
386. 29.8 387. 25.0 388. 23.2 389. 26.0 390. 30.4
Obras citada
391. 28.2 392. 27.1 393. :1.i.::s :;¡94, 29.3 395. 25.8
399. 26.9 400. 31.0 1. JEAN D. GIBBONS y JOHN \V. PRATT, "P-values: Interpretaüon and Metho-
396. 27.8 397. 28.5 398. 27.3
402. 24.2 403. 33.2 404. 2'.l.6 40'.'i. 21.3 dology", The An,ericl111 Staristician, 29 (1975), 20-25.
40 l. 27.6
28.1 409. 24.8 410. 25.6 2. ANITA K. BAHN, ''P and the Null Hypothesis", Annals of lntenial Medicille, 76
406. 25.3 407. 25.9 408.
411. 26.3 412. 24.7 413. 26.l 414. 30.H 415. 27.4 (1972), 674.
418. 30.2 419. 25.6 -120. 26.9 3. WAYNE W. DANIEL, "What are p-va\ues? How Are They Calculated? How Are
416. 31.9 417. 27.5
423. 31.6 424. 31.7 425. 25.9 They Re\a!cd to Levels of Significance?", Nursing Research, 26 (1977), 304-
421. 30.3 422. 33.1
426. 27.7 427. 26.8 428. 31.5 -129. 22.1 430. 22.2 306.
32.7 434. 22.9 435. 28.2 4. LARRY A. MORGAN y FRANK w. MORGAN, "Personal Computers, p-values and
43 l. 30.3 432. 26.1 433.
436. 24.9 437. 28.3 438. 34.3 439. 23.6 440. 2H.9 Hypotheses Testing", Mathe111atics Teacher, 77 (1984), 473-478.
23.4 444. 26.1 445. 28.4 5. WAYNE W. DANIEL, Introductor)' Statistics 1,1.·ith Applications, Houghton
441. 28.9 442. 26.0 443.
446. 25.3 447. 29.5 448. 27.9 -149. 24.7 450. 21i.2 Mifflin, Boston, 1977.
451. 29.7 452. 28.5 45:t 31.7 454. 18.3 455. 28.0
456. 24.2 457. 30.1 458. 24. l 459. - '·-
0-9 460. 26.8 Revistas y artículos
461. 25.2 462. 31. l 463. 24.0 464. 27.8 -165. :IH.0 1. ARNOLD BlNDER, "Further Considerations of Testing the Null Hypothesis and
466. 30.8 467. 24.8 468. 26.1 469. 26.0 -170. 30.-t the Stratcgy and Tac tics of Investigating Theoretical Models", Psychological
471. 25.1 472. 27.5 473. 23.5 474. 28.7 --175. 27.5
Revic\1·. 70 ( 1963). 107-115.
476. 22.6 477. 21.6 478. 23.8 479. 28.1 .J80. :10.8 2. C. ALLEN BoNEAU. "The Effccts ofViolations of Assumptions Underlying the t
481. 28.3 482. 27.8 483. 25.2 484. 22.9 485. 26.8 Test", Psycho{ogical B11lleti11, 57 ( 1960), 49-64.
486. 29.2 487. 27.7 488. 28.3 489. 20.6 490. 29.0 3. DoNNA R. BROGAN. "Choosing an Appropriate Statistical Test of Significance
491. 25.4 492. 26.5 493. 23.'.{ 494. 27.9 495. ~8.0 far a Nursing Research Hypothcsis or Question". lVesterll Journal of Nursing,
496. 26.4 497. 32.3 498. 28.7 ·199. 21.9 500. (
_,}- -
.1
3 (1981). 337-363.
4. C. J. BURKE. ",6- Bricf Note on One-tailed Tests'', Psychological Bullerin, 50
(1953). 384-387.
l
! 343
342 Pruebas de hipótesis
Obras co111ple111c11tarias
5. c. J. BL'RKE ... Furlh<.'r R<.:inarks on Onc-tai!cd Tests ... Psychological Bulletin,
51 (195...¡), 587-590. 1. \V. l. B. BEVl'.RIDGE. Tftl' Art of Scieurific /in·eJtigatiu11. J.ª edkión, \V. \\'.
6. \VAYNE \V. Ü..\NIEL. ··s1atistical Significance versus Practica! Significance··, Norton. Nueva York. 1957.
Scie11ce Ed11catio11, ól (1977). -123-427. 2. HERBF.RT A. DAVID. Thc i'vlct/1od (!{ Puired Co111pariso11s. 2." edición, Oxfurd
7. EL:GE!\F: S. Eocr:-.GTo.,, ... Statistical Irf"crt!ncc and Nonrandon1 San1ples ... Linivcr!-,ity Press, Nueva York. !988.
P\\"l'ho!ogic(/f B11/ictí11. fJó ( ! 966). -185-487. 3. D\\"IGHT J. 1:-.GLE. Pri11cip/cJ of Researc/1 in Biology and Medicine, J. B. Lip-
8. WARD ED\\"ARDS ... Tactii.:al Nlltc on the Relatíon Bet\\..·een Scientífic and
pincott. Filadelfia. 1958.
Stntistic.1! Hypothcscs··. P.1ychological B11lleri11. 63 ( 1965). 400-402. 4. E. L. LF.Hl'tAN, Te.1ring S!({fistic{lf Hypor!Jeses. Wilcy, Nueva l:'ork, 1959.
9. \VJLL!A'.\1 E. FEl:-SBl-:RG, "Tcaching thc Typc I and II Errors: The Judical Pro-
::ess ... Tl1c An1crica11 Srllristícic111. 25 (junio 197 l ). 30-32.
10. l. J. GooD. "\\"h:u Are Degrces of FreedomT', The An1ericl1J1 Statistician, 27 Otras publicacio11es
(1973). 227-228. l. D ..\YID BAKAN, ··The Test or Signil"1cance in Psychologica\ Resean.:h". en One
11. DAV!D A. GRANT. "Testing thc Null Hypothesis and lhe Strategy and Tactics of lY!ethod: To1r(lrd a Reco11.1rn1ctio11 (!{ Psychological lnvestigation, Jossey-Bass,
lnvestigating Tbeorctica[ Mode!s". Psycho!ogical Re1·ieu., 69 (1962), 54-61. San Franci!-.co. !9(17.
12. \\-·. E. HICK. "A Note on One-tailed and Two-tailed Tests'", Psychologica! 2. \V1LL!A~1 H. KRL'SKAL. '"Tc~t of Significance"". en /11ter11ario11al Encyclopedia
Re1·ieH·. 59 r 1952 l. ~ 16-3 l 8. ofrhe Social Sciences, /../ ( 1968), 238-250.
13. L. Y. Jo.-..:Es. ··Tests of Hyrotheses: One-sided vs. Two-sided Alternatives··.
Psychulogicu! B11/!eti11 . ../ó ( 19..J.9 J. 43-46.
14. L. V. Jo:-..i::s. ··A Rejninder on Onc-talled Tests", Psychological Bu!letin. 51
( 1954 ). 5X5-586.
15. SANFORU LABO\'IT/.. ··criteria for Selecting a Significance Leve 1: A Note on the
Sacrcdnc~~ of .os··. Tl1e A111erican Sociologisr, 3 ( 1968), 220-222.
16. \\'rt.LlA~I LL'RI~:. ""Thc Impertinent Questioner: The Scientist's Guide to the
Statistician · s l\1ind'". A111erica11 Scie11tisr. 46 ( ! 958 ), 57-61.
17. M. R.1\1..\RKS. "Ünc- and T\\'O-tailed Tests"'. Psychological Revie_ii', 60 (1953),
207-208.
18. C. A. l\·fcGrLCHR!ST y J. Y. H..\RR!SON, "Testing of 1\-leans with Different Alter-
natives". Techno111errics. /0(1968), !95-198.
19. l\.1ARY G. NATRELLA. ""The Relation Between Confidence Intervals and Tests of
Significance". A111erica11 Srarisrician, 14 (1960), 20-22. 33.
20. O. B. Ross. JR .. ··use of Controls in Medica! Research", Journal of rhe Atne-
rican N!edica! Associarion. /./5 (1951), 72-75.
21. WJLLJA~r \V, ROZF:BOO,\I, ""Thc Fallacy of the Null-Hypothesis Significance
Test", Psychologiccrl B11lleti11, 57 ( 1960). 416-428.
22. H. C. SEL\'IN. ··A Critiqut! ofTests of Significance in Survey Research".
A111erica11 Sociolngical Rcril'1r, 22 ( 1957), 519-527.
23. JAi\1ES K. SK!PPER . .'\:,,THO~Y L. GL:ENTHER y GILBERT NASS, "The Sacredness
of .05: A Note Concerning the Uses of Significance in Social Science", The
A111erica11 Socinlogi.l't, 2 ( 1967), 16- ! 8.
24. \\i'ARREN R. W!LSON y Hü\\"ARD l\11LLER, '"A Note on the Inconc]usiveness of
Accepting the Null Hypothesis", Psychological RevieH', 71 (1964), 238-242.
25. WARREN \VJLSO'-;. Hü\VARD l. MJLLER y JEROLD s. lü\VER, "'Much Ada About
the Null Hvpothe,;_L<~•. f'.sµ:/10lag.ico! B,,lferiu 97 ('...l....96+),188-196,-----------+--------
26. R. F. WI\'.CH y D. T. CA~!PBELL, ""Proof? No. Evidence'? Yes. The Significance
of Tests of Significance"". A111crica11 Sociologist, 4 ( 1969 ), 140-143.
7
Análisis de la variancia

7.1 INTRODUCCIÓN _ _ _ _ _ _ _ _ _ _ _ _ _ __

En los capítulos anteriores se estudian los conceptos elementales de estadís-


tica, los cuales constituyen las bases para éste y los capítulos siguientes.
En este capítulo se estudia el análisis de variancia, el cual se define
como una técnica en la que la variancia total de un conjunto de datos se
divide en varios co,nponentes y cada uno de ellos se asocia a una fuente
especifica de variación, de nianera que durante el análisis es posible
encontrar la magnitud con la que contribuye cada una de esas fuentes en la
variación total.
El desarrollo de este terna de estudio se debe principalmente al trabajo
de R. A. Fisher, 1 cuyas contribuciones a la estadística, desde 1912 hasta
23
1962, tuvieron una gran influencia en toda la estadística moderna. ·
El análisis de variancia tiene amplia aplicación en el análisis de datos
derivados de experimentos. Los principios par<l el diseño de experimentos
se estudian en varias obras, entre ellas las de Cochran y Cox, Cox,5 Da~
4

6 7 10
vies, Federer, Finney,8 Fisher,l John,9 Kernpthorne, Li y Menden~11

haII. 12 No se estudia aquí este tema, porque al hacerlo sería necesario por lo
menos un capítulo adicional. Sin embargo, algunos conceptos importantes
del diseño experimental aparecen conforme se estudia el análisis de la va~
riancia.
Las relaciones entre los temas pueden resumirse señalando que, cuando
se diseñan experimentos teniendo el análisis en mente, los investigadores

345
346 Análisis de la variancia Dise;io con1pletan1ente aleatori:ado 347
pueden. antes de: efectuar un experimento, identificar las fuentes de varia- 5. Distribución de la estadística de prueba.
ción que consideran importantes para elegir un disefio que les perniita n1edir 6. Regla de decisión.
el grado de contribución de esas fuentes a la variación total. El análisis de 7. Cálculo de la estad(stica de prueba. El resultado de los cálculos aritméticos se
variancia se utiliza para dos propósitos: 1) estimar y probar hipótesis resun1e en una tabla llamada análisis de variancia (ANO\' A por sus siglas en
respecto a variancias poblacionales, y 2) esti1nar y probar hipótesis respecto inglés). Las entradas en ta tabla faciiitan la evaluación de los resultados del anfi.tisis.
a las medias de !as poblaciones. En este capítulo se estudia el segundo 8. Decisión esuidútica.
punto. Sin embargo, como se verá más adelante, las conclusiones respecto a 9. Co11clí1sió11.
ias medias dependen de las magnitudes de las variancias observadas.
Para utilizar correctamente el análisis de variancia como una herramien- El uso de computadoras Los cálculos que se requieren para el análisis de
ta de la inferencia estadística es necesario satisfacer un conjunto de suposi- variancias son más largos y complicados que los que se presentan en los
ciones fundamentales. Para un estudio detallado de estas suposiciones, con- capftulos anteriores. Por esta razón la computadora asume una función im-
sultar el artículo de Eisenhart. 13 Aunque no se debe esperar que un experi- portante para este análisis. Todos los ejercicios que aparecen en este capítu-
mentador encuentre que todas las suposiciones son satisfechas a la perfec- lo pueden ser realizados por medio de computadora utilizando los paquete.s
1
ción, es importante que quien utilice las técnicas de análisis de variancias que se mencionan en el capítulo l. bos resultados de los paquetes estadísti-
tenga mucho cuidado de satisfacerlas y sea capaz de reconocer cuándo éstas cos pueden variar ligeramente de los que se presentan en este capítulo, pero
no son plenamente satisfechas. Las consecuencias al no satisfacer las esto no es un problema grave para quienes utilizan computadora para
suposiciones se estudian en un artículo de Cochran 1-i que complementa el analizar los datos de los ejercicios. Los conceptos básicos del análisis de va-
de Eisenhart. Debido a que los experimentos en los que las suposiciones son riancias que se presentan en este capítulo proporcionan las bases necesarias
satisfechas perfectamente no se presentan con frecuencia, Cochran sugiere para entender la descripción de los programas y los resultados de cualquiera
que los resultados del análisis de variancias sean considerados más corno de los paquetes estadísticos.
aproxin1aciones que como resultados exactos. Estas suposiciones se expo-
nen en las siguientes secciones.
El análisis de variancias se estudia según la fonna en que se utiliza en el 7.2 DISEÑO COMPLETAMENTE ALEATORIZADO - - - - -
análisis de los resultados de dos diseños de experimentación diferentes: los
diseños completamente aleatorizados y los diseños de .bloques completos En el capítulo 6 se estudia la forma de probar la hipótesis nula de no dife-
aleatorizados. Aunado a esto, el concepto de experimento factorial se utiliza rencia entre las medias de: dos poblaciones. Con frecuencia, el investigador
en diseños completamente aleatorios, sin que esto agote las posibilidades. tendrá interés en probar una hipótesis de esta clase. El estudiante, al en-
En las referencias bibliográficas (4-12) se encuentran algunos estudios acer- frentar por primera vez este problema puede inclinarse a sugerir que todos
ca de otros diseños. los pares posibles de medias muestrales se deben probar por separado me-
Para presentar el análisis de variancias según los diferentes diseños, se diante la prueba t de Student. Supóngase que hay cinco poblaciones involu-
sigue el procedin1iento de los nueve pasos, expuesto en el capítulo 6. A conti- cradas. El número posible de pares de la n1edia muestra! es 5 C2 = 10. Dado
nuación, se plantean nuevamente estos pasos y se incluyen algunos concep- que es muy laborioso llevar a cabo muchas pruebas t, sería deseable dispo-
tos nuevos, necesarios para su adaptación al análisis de variancias. ner de un método de análisis más eficiente. Sin embargo, una consecuencia
muy importante que podría desprenderse de la realización de todas las prue-
l. Descripción de datos. Además de describir los datos de la n1uestra en la fom1a bas t posibles es que es muy probable llegar a una conclusión falsa.
usual, éstos se despliegan en forma tabular. Por ejemplo, suponer que se extrajeron cinco muestras a partir de po-
2. Suposiciones. Junto con las suposiciones que fundamentan el análisis, se presen- blaciones que tienen medias iguales. Como se vio en el párrafo precedente.
ta el modelo de cada diseño estudiado. El modelo se compone de una represen- sería necesario efectuar 10 pruebas si éstas se efectuaran por separado. Si se
·taei-én---s-imbó-1-i-ca-de-urr-vatorreprese·nrativo· de-Jos·da:tós qué· se ·nan-aea1ratiiár: · ---, - - ·--e"lige un nivel de s1gnlf1cac1on a - .05 para··cada prueba;-hrprobabitidad de-·-- - -
3. Hipótesis. no rechazar una hipótesis de no diferencia en cada caso sería de .95.
4. Estadísrica de prueba. Mediante la regla de multiplicación para la probabilidad, si las pruebas son
1
'
Diseño completa1nente a/eatorizado 349
348 Análisis de la variancia
Tabla 7.2.1. Tabla de valores muestralcs para el diseño
independientes una de otra, la probabilidad de no rechazar la hipótesis de no completamente aleatorizado
º=
diferencia en los 10 casos podría ser (.95) 1 .5987. La probabilidad de re-
Tratamiento
chazar al menos una hipótesis de no diferencia, entonces, sería de 1 - .5987
= .4013. Puesto que se sabe que la hipótesis nula es verdadera en todos los 2 3

casos de este ejemplo, al rechazar la hipótesis nula se comete un error de x,. x., X13 x,.
tipo I. Entonces, a la larga, al probar todos los posibles pares de medias a x\!l X22 X23 X2t
partir de las cinco muestras, se podría cometer un error de tipo I en el 40 x,. x,, Xs, x,.
por ciento de los casos. El problema se hace más complicado en la.práctica,
porque tres o más pruebas t realizadas a partir de los mismos datos podrían X x,,., x,.:
"• •
X •
"•
no ser independientes entre sí. Total T, T, T, T, T
Dado lo anterior, es claro que se requiere un método para hallar una

.
deferencia significativa entre varias medias. El análisis de variancias consti- Media .i.l .i.2 .i.3 .i.k i ..

tuye dicho método.


• ",
El tipo más simple de análisis de variancia es el que se conoce como
análisis unilateral de variancias, para el cual se investiga una sola fuente de
T LT,
j= 1
I Ix,j
i= 1 Í-" 1
total de las observaciones

variación o factor. Esto es una extensión a tres o más muestras del procedi·
miento de la prueba t (capítulo 6), para utilizarlo en dos muestras indepen· i
T
N -

Ln,
N j=I
dientes. Dicho de otra fonna, se puede decir que la prueba r al utilizarla con
dos muestras independientes es un caso especial del análisis unilateral de va-
riancias. Eje,nplo 7.2.1 En un análisis sobre los efectos de la glucosa en la libera-
En una situación típica, tal vez se quiera utilizar el análisis unilateral de ción de insulina a varias muestras del tejido pancreático de animales experi-
variancias para probar la hipótesis nula que indica que tres o más tratamien- mentales, se les asignó aleatoriamente un tratamiento con uno de los cinco
tos son igualmente efectivos. El experimento se diseña de tal forma que los estimulantes diferentes. Posteriormente, se determinó el total de insulina
tratamientos de interés se asignan de manera totalmente aleatoria a los indi· liberada. Los experimentadores querían saber si es posible concluir que hay
viduos u objetos en los que se han de realizar las determinaciones para una diferencia entre los cinco tratamientos con respecto a la cantidad media
medir la efectividad de los tratamientos. Por esta razón, el diseño se llama de insulina liberada.
diseño de experimentaéión completamente aleatorio. Las mediciones (u ob-
servaciones) que resultan de un diseño de este tipo junto con las medias y Solución
totales que puedan ser calculados a partir de aquéllas se presentan, por
razones de conveniencia, como en la tabla 7 .2.1. Los símbolos que se uti- l. Descripción de datos. El tratamiento J se aplicó a cinco especímenes, los trata~
lizan en la tabla 7 .2.1 se definen como sigue: mientas 2 y 3 se aplicaron a seis especímenes, siete especímenes recibieron el
tratamiento 4 y el tratamiento 5 se aplicó a ocho especímenes. Las cantidades de
insulina liberada mediante cada uno de los tratamientos se muestran en la tabla
xu es el i-ésimo resultado delj-ésimo tratamiento (hay un total de k trata-
mientos) 7.2.2.
2. Suposiciones. ,<\.ntes de establecer las suposiciones, es necesario especificar el
i = l, 2, ... , nj,j = 1, 2, ... , k modelo para el experimento descrito aquí.

TJ = f
i=J
xij = total de los j-ésimos tratamientos El modelo Para enunciar el modelo para este ejemplo, se debe empezar por
identificar un valor representativo del conjunto de datos representados por la
T muestra que aparece en la tabla 7 .2.2. Se utiliza el símbolo xij para represen·
X}.. = -1. = media de los j-ésirnos tratamientos tar dicho valor.
nj
l
350 i\nálisis de la variancia Dise1io co'11pleta1ne11te alealorizado 351
Tabla 7.2.2. Insulina liberada Dadas k poblaciones, es posible calcular µ al tomar el promedio de las
Estimulante medias de las k poblaciones, esto e:s.
2 3 4 ;
¿µ.;
1.53 3.15 3.89 8.18 5.86 µ. ~

1.61 3.96 3.68 5.6--t 5.46 k (7.2.3)


3.i5 3.59 5.70 7.36 5.69
2.89 1.89 5.62 5.33 fi.·!!.J En general así como una observación dentro del grupo difiere de la
3.26 1.45 5.79 8.82 7.81 media de su grupo por cierta cantidad, la media de un grupo particular
1.56 5.33 5.26 9.03 difiere de la gran media por una cantidad determinada. La cantidad por la
7.10 7.49 cual la media del grupo difiere de la gran media se conoce como efecto
8.98 del rratanllento. Se puede escribir el efecto delj-ésimo tratan1iento como
Total 13.04 15.60 30.01
- --
47.69 56.81 163.15
rviedia 2.61 2.60 5.00 6.81 7.10 5.10 T¡=JJ.;-µ (7.2.4)

En cada grupo (o población) representado por los datos, cualquier valor es una medida del efecto sobre µ. por haber sido calculada a partir de las
1"·
en particular guarda la siguiente relación con la media real,µ., del grupo: es dbservaciones que recibieron delj-/sin10 tratamiento.
igua! a la media real del grupo, más alguna cantidad que puede ser cero, una Al resolver la ecuación 7.1.4 para ~L)' se obtiene
cantidad positiva o una negativa. Esto significa que un valor en particular
en un grupo dado puede ser igual. mayor o menor que la media del grupo. µ, = µ + ,, (7.2.5)
Se llama error a la cantidad en que difiere cualquier valor de la 111edia del
grupo. Este error se representa por ,nedio de! símbolo eiJ" El término error
no significa equivocación. Se utiliza para referirse a la variación no contro- Sí se se substituye el mien1bro de la derecha de l;r:ecuación 7.2.5 porµ¡
lada que existe entre los miembros de alguna población. Dada una pobla- en la ecuación 7 .1.1. se tiene ·
ción de varones adultos. por ejemplo, se sabe que las estaturas de algunos
individuos están por arriba de la estatura media de la población, mientras ·'-i¡ = µ + 11 + l.'1/' !, 2 .... '111: J l.~ ..... k (i.2.6)
que otras estaturas están por abajo de esa media. Estas variaciones se deben
a una gran cantidad de factores hereditarios y ambientales. Si a la media de
y el 1nodelo queda especificado.
algún grupo, µ., se suma un error dado, e11 • el resultado sería x , la obser- Al observar el modelo. es posible apreciar que la observación represen-
11
vación que se cÍesvía de la media grupal por una cantidad eij" tativa del conjunto total de datos bajo análisis está formada por la gran
media. un efecto del tratamiento y un término de error que representa la
Se puede escribir esta relación si_mbólicamente como desviación de las observaciones de la media de su grupo.
En este ejemplo se supone que el interés r::idica sólo en los k tratainien-
x,1 = µ 1 + e,1 (7.2.1) tos representados en el experimento. Cualquier inferencia se aplica sólo a
dichos trata1nientos. No es recomendable extender la inferencia hacia una
Al resolver para eij se tiene
colección 1nayor. Cuando se imponen tales restricciones para el objetivo de
e,1 = x'l - µ1 la inferencia. uno se refiere al n1odelo con10 111odefo de efectos jijas o 111ode-
(7.2.2)
lo l. El estudio en este libro se limita a este modelo.
- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - -

Si se tienen k poblaciones íen este ejemplo k = 5), es posible referirse a


l
1
a1Tfforliiaci-On·-refererrtca olios tnodeto-s-se----encuentra·----en-}o~-teulos·--
de Eisenhart. 13 \-\:iJk y Kernpthorne. 15 Cru111p. 16 Cunningham y Hen-
la gran media de todas !as observaciones en todas poblaciones, como µ. derson, 17 Henderson, 18 Rutherford. 19 Shultz:!O y Sear!e. ~ 1
352 Análisis de la variancia Diseño co1npletan1ente aleatorizado 353

Suposiciones del modelo Las suposiciones para el modelo de efectos fijos


son como sigue: o~=oª=u}=oiaoJ

a. Los k conjuntos de dalos observados constituyen k muestras aleatorias


independientes de las poblaciones respectivas.
b. Cada una de las poblaciones de las que provienen las muestras sigue una
distribución normal con media µ y variancia a}
1
c. Cada una de las poblaciones tiene la misma variancia. Esta es, af =
' ' 1 . . ,
= ai J-!1 =µ2=1-'3"'µ4~1-'5
... =a¡;= a-, a vananc1a comun.
Figura 7.2.1. Gráfica de las poblaciones representadas
d. Las 1.1 son constantes desconocidas y Í,-r. = O, dado que la suma de todas
por el ejen1plo 7.2.1 cuando H0 es verdadera y se satis-
las desviaciones de µ a partir de sus medias,µ, es cero.
1 facen las suposiciones.

Tres de las consecuencias de la relación Si H0 es verdadera y se satisfacen las suposiciones de igualdad de va-
riancias y poblaciones distribuidas normalmente, la gráfica correspondiente
e,1 = x,1 - µ. es como la que aparece en la figura 7 .2.1. Cuando H0 es verdadera, las me-
1
dias de las poblaciones son iguales y las poblaciones están centradas en el
descrita en la ecuación 7.2.2 son: mismo punto (la media co1nún) sobre el eje horizontal,. Si todas las pobla-
ciones siguen una distribución normal con variancias iguales, las distribucio-
a. Las e;¡ tienen una media igual a O, dado que la media de xi) esµ/ nes son idénticas, de 1nanera que al trazar sus gráficas se superponen unas
b. Los eij tienen una variancia igual a la variancia de los X¡-, dado que ei) y x. con otras, por lo que una sola gráfica ~s suficiente para representarlas.
difierer:t sólo por una constante; esto es, la variancia del ~rror es igual a cr~ Cuando H0 es falsa puede ser porque una de las medias de la población
que es la variancia común especificada en la suposición. es diferente de las otras. que son iguales o, quizás, porque todas las medias
c. Los eij siguen una distribución normal (e independiente). de la población son diferentes. Éstas son sólo dos de las posibilidades cuan-
do H 0 es falsa. Hay muchas otras posibles combinaciones para la igualdad o
3. J{ipótesis. Es posible probar la hipótesis nula que dice que todas las medias del
desigualdad de las medias. La figura 7.2.2 muestra una gráfica de las pobla-
tratamiento o la población completa son iguales, contra la alternativa de que los
ciones cuando las suposiciones son satisfechas, pero H 0 es falsa porque no
miembros de al menos un par sean diferentes. Es posible establecer la hipótesis
fonnalmente como sigue: · hay dos medias poblacionales que sean idénticas.

Ho: µ¡ = µ.2 = ··· = µ.k 4. Estadistica de prueba. La estadística de prueba para un análisis de variancia uni-
lateral es una relación calculada de la variancia, la cual ~e designa por R.V.,
JJA: no todas las µ son iguales
1 igüal que en el capítulo 6. Las dos variancias a partir de las que se calcula la
Si las medias de las poblaciones son iguales, el efecto de cada tratamiento es R.V., se calculan a su vez con los datos de las muestras. Los métodos que sirven
igual a cero, así que, alternan1ente, las hipótesis se pueden establecer como: para el cálculo. se analizan más adelante.

H0 : T
1
= O, j=l,2, ... ,k
H.~: no todas las 1 = O
1
Para es1e ejemplo se tiene

Ho: µ1 = µ2 = µ3 = µ., = µ5 µ.I 1-':¡ 1-1:J µ4 µ5

Figura 7.2.2. Gráfica de !as poblaciones representadas en el ejen1plo 7 .2.1 cuando


H.4: no todas las µ son iguales
1 se cuinplcn las suposiciones de \·:.i.riancias iguales y poblaciones con distribución
Utilícese un nivel de significación, a, de .05. normal, pero cuando H0 es falsa dchiJo a que ninguna de las medias de las pobla-
<:ionc~ e~ igual a 01ra.
'
¡,_,
354 Análisis de la variancia

5, Distribución de la estadística de prueba. Como se expuso en la sección 6.8, la


R.V. sigue una distribución F cuando H0 es verdadera y las suposiciones son
IO~
Diseño co"1pletamente aleatorizado 355

satisfechas.
6. Regla de decisión. En general, la regla de decisión es: rechazar la hipótesis nula ,- •
••
si el valor calculado de la R.V. es mayor o igual que el valor crítico de F para el
nivel a.
7. Cálculo de la estadística de prueba. Se define el análisis de variancias como el ..... •

proceso por medio del cual la variación total presente en un conjunto de datos 1
es dividida en componentes atribuibles a diferentes fuentes. El término varia- •
ción utilizado en este contexto se refiere a fa su111a de las desviaciones al cua- ,~ .x...
.,,
drado de las observaciones con respecto a s11s n1edias, o en forma abreviada,
s11n1a de cuadrados. •
,~ •
La gráfica de la figura 7 .2.3 representa los datos del ejemplo 7 .2.1. En
'
~
1
1 • •

ella se puede apreciar la relación entre X__ , que estima laµ del modelo; las Xj '
g • ••
estiman las medias de las muestras; las xij' las observaciones más recientes; y 1 51:::=""X:.
5 x, ~]

·~
los é¡¡ son las estimaciones de los eif del modelo. •
E
'j ~1 3

La suma total de cuadrados Antes de efectuar cualquier división, primero •


1
. ' .•
'''
.

es necesario obtener la suma total de cuadrados, que es la suma de los •



cuadrados de las desviaciones de cada observación individual a partir de la
media de todas las observaciones tomadas en conjunto. Esta st1111a total de
,- •

• x., • X:2
cuadrados se define como

sc,o,ai =
k
L L (x¡, -
", '2 - . 1
.i .)"!. 1 •• 1
(7.2.7)
i= ¡ i= t
,_
,, Fi gura 7.2.3. Gráfica de los datos dados
donde L indica que es necesario sumar las desviaciones al cuadrado para 1
en la tabla 7.2.2 para el ejemplo 7 .2. ! .
i= ! 1
o 1 1 1

' índica que es necesario sumar los k totales


cada grupo de tratamientos, y L
2 4
' a IO

j= 1
",
' 3
Muestra
4 5

de grupo que se obtienen al aplicar L. El lector reconocerá la ecuación


i= 1 La suma total de cuadrados para este ejemplo es
7.2.7 como el numerador de la variancia que puede calcularse a partir del
(163.15) 2
conjunto completo de observaciones tomadas en conjunto. sctmal = ( l .53 )
2
+ ( 1.61 )2 + + (8.98) 2
32
La ecuación 7.2.7 puede reescribirse como sigue:
26617.923
" ", T:! - 994.3529
--~ 32
'~
5
c,,,,,,, - 1=:E[ :E~.f~---
l /=
(1.2.s>
1
- 994.3529
831.81008
la cual es más conveniente para propósitos de cálculo. 162.54282
Análisis de la i·ariancia Diseiío comp/eta,nente aleatori~do 357
356
,\hora se procede con la partición de la suma total de cuadrados. Es Suma de los cuadrados dentro de los grupos La partición de la suma to-
posible, sin cambiar su valor, incluir -X.j + X.J dentro de los paréntesis de la tal de cuadrados está completa ahora, y es posible apreciar en este caso que
t.'cuación 7.2.7. El ·1ector reconocerá esta cantidad co1no un bien elegido hay dos componentes. Corresponde ahora investigar la naturaleza y fuente
cero que no cambia el valor de la expresión. El resultado de esta suma es de estos componentes de variación.
Si se examina el primer término de la derecha de la ecuación 7.2.12. se
k "·
aprecia que el primer paso en el cálculo indicado requiere que se efectúen
sc/º'ª1 = L L (x,¡
¡= l 1=)
x_, ~ + :i:_, - x i'.!
(7.2.9) ciertos cálculos dentro de cada grupo. Estos cálculos comprenden el cómpu-
to, dentro de cada grupo. de la suma de las desviaciones al cuadrado de
Si los términos son agrupados y desarrollados se tiene las observaciones individuales respecto de su n1edia. Cuando estos cálculos
L• indica que es
k ",
sc,ma1== L L [(x,¡
¡= j I"- 1
i.¡) + (.i.J - .x_ )]'.! se han llevado a cabo dentro de cada grupo, el símbolo
j =1
~ 11, k ", necesario obtener la suma de los resultados de cada uno de los grupos. Este
- ,=¿ L (x,, - .<f + 2 L L (x, 1
- X_ 1 )(X_ 1 - .\: .) componente de variación se llama su,na de cuadrados dentro de los grupos
l i= ¡ ¡= l i= ¡ y se designa corno SCdentru· Esta cantidad se conoce en ocasiones como
k ",
suma de cuadrados residual o de error. La expresión se puede escribir, en
+ I ¿1x, - x.f
¡=] 1= l (7.2.10)
una forma más conveniente, como sigue;
k ", k ", k (T)2
El término de enmedio puede ser escrito como '\' "<;' - 2 "<;' "<;' 2 'y 1
scdemro= L., L.,(x,¡ - x 1 ) = L,¡ L.,xij - ¿¿--
1~1,=! ;=li=! j=I nj
(7.2.14)
",
2 L'
¡= l
(x.j - X.)L(x, 1 - i,,l
1= J (7.2.11) Al utilizar los datos de la tabla 7 .2.2, se encuentra que la suma de cuadrados
dentro de los grupos para el ejemplo 7 .2.1 es
Un examen de la ecuación 7.2.11 revela que su término es igual a cero,
dado que la suma de las desviaciones de un conjunto de valores respecto (1.53) 2 + (1.61) 2 + · · · + (8.98) 2
", sedentro=
de su media como en L (x,.. - )
X} -) es igual a cero. r(l3.04J'
5 +
(15.60)'
6
(30.01)'
+--6-+
(47.69)'
7 +
(56.81)']
8
i= 1 •

Ahora, es posible escribir la ecuación 7 .2.1 O como 994.3529 (34.00832 + 40.56 + 150.10002 + 324.90516 +
k ", k ", (403.42201)
sc1,,,1.11 = I L (x;, -x,)'+¿¿I<,
j=] 1= [ ¡=] 1= [
- X .):1
- 994.3529 952.99551
= 4l.35i39
k ~ k
L L (x,¡ - .x_,):1 + L 11/:i_l - :i f!
(7.2.12)
¡= l 1=] ¡= ! Suma de cuadrados entre grupos El siguiente ténnino a examinar es el
segundo a la derecha de la ecuación 7.2.12. La operación necesaria para
Cuando el número de observaciones es el n1isn10 en cada grupo. el últi-
éste término es la obtención para cada grupo de la desviación al cuadrado
mo término a la derecha se puede reescribir para obtener
de la media grupal con respecto a la gran n1edia y multiplicar el resultado

setmal -- •
"<;' "<;' (x
L., L., i¡
- x_,)2 + , ¿• (.i:; .'\: . )2
por el tamaño del grupo. Finalmente, se debe sumar estos resultados a todos
los grupos. Esta cantidad es una n1edida de !a variaci6n entre grupos y se
,= l i= 1 ¡= l (7.2.13)
conoce como la .n1111a de cuadrados entre grupos o SCemre· La fórmula de
cálculo es como sigue:
donde n = n1 = n2 = ··· = 111_.
358 Análisis de la variancia Diseño completamente aleatorizado 359
k ",
• - )2
¿;-1__ T~ IN
72 ¿ ¿(x,, - x.,):!
scen1re = In, (x,¡
j= 1
x. ~
Ir.

1= 1 n1 (7.2.15)
¡= J 1 = J (7.2.16)
• - 1)
La SCentre para el ejemplo se calcula como sigue: Í: (n1
¡= 1

se ~ (13.04)'
(15.60¡ 2 (30.01¡ 2 (47.69)' (56.81) 2 ( 163.15) 2 Esta es la primera estimación de cr2, la cual puede llamarse variancia dentro
entre 5+6+6+7 + 8 de íos grupos, dado que ésta es la suma de los cuadrados dentro de los gru-
32
~ 952.99551 831.81008 pos de la ecuación 7.2.14, dividida entre los grados de libertad convenien-
tes. El estudiante advertirá que ésta es una extensión para k muestras del
~ 121.18543 procedimiento de ponderación de variancias, donde la ponderación se uti-
liza para la distribución t. La cantidad en la ecuación 7 .2.16 se acostumbra
En resumen. entonces, se encuentra que la suma de cuadrados es igual a llamarla cuadrado de medias dentro de los grupos, en lugar de las varian-
la suma de cuadrados entre los grupos, más la suma de cuadrados dentro de cias dentro de los grupos. El cuadrado de las medias dentro de grupos
los grupos. Esta relación se expresa como sigue: ( CMdenrrr,)' para el ejemplo, es

scdenf/V= 41.35739
se/(}{(!/: sce11rre + scdentrv CMdentro= 27 1.5317552
27
Para el ejemplo se tiene
El cuadrado medio dentro de grupos es una estimación válida de cr 2
162.54282 121.!8543 + 41.35739 sólo si las variancias de las poblaciones son iguales. Sin embargo, no es
162.54282 ~ 162.54282 necesario que H0 sea verdadera para que el cuadrado medio dentro de gru-
pos sea una estimación válida de cr2. Esto es, el cuaéiíado medio dentro de
A partir de las sumas de cuadrados que se ha calculado es posible obtener
grupos estima a cr2 sin importar si H0 es verdadera o falsa, siempre que las,
dos estimaciones de la variancia común de la población, cr2. Puede de-
variancias de las poblaciones sean iguales.
mostrarse que cuando las suposiciones son satisfechas y todas las medias de
la población son iguales, tanto la suma de cuadrados entre los grupos. como la
Segunda estimación de cr2 La segunda estimación de cr2 se puede obtener
suma de cuadrados dentro de los grupos proporcionan estimaciones inde-
a partir de la fórmula ya conocida para la variancia de las medias de las
pendientes o insesgadas de cr2 cuando se dividen entre sus respectivos gra-
dos de libertad. muestras, crJ = cr2 / n. Si la ecuación es resuelta para cr2, la variancia de la
población a partir de la cual se extrajeron las muestras, se tiene
Primera estimación de cr2 Dentro de cualquier muestra, la expresión
a 2 = na! (7.2.17)
", Una estimación insesgada de cr~.
2 (x, - i J·)' x calculada a partir de los datos de la rnues-
i=I
tra, es proporcionada por
nj - 1
L• (x,,- - x. .)2
proporciona un~ estimación insesg~da de la v~r~~ncia real para la población
---------'"''--"ª-'""'"'ª"l-!'P•ro.\1-1gn~-mues-tr-a-;-B--a-J-o--la-"SUpos1c10n-de-que-m1:las las vanan-
I [=I
k - 1

cias de la población son iguales, es posible ponderar las k estimaciones para Si esta cantidad -se sustituye en la ecuación 7 .2.17, se obtiene la esti-
obtener mación para cr2
1
Diseño completa1nente aleatori;,ado 361
360 Análisis de la variancia

"'
k
n ~ (XJ - X )-,,
Si las dos estimaciones son aproximadamente iguales, la R.V. será casi igual
a 1. Una relación próxima a 1 tiende a apoyar la hipótesis de medias iguales
1= 1
en las poblaciones. Por otra parte, si el cuadrado medio entre grupos es con-
k - 1 (7.2.18) siderablemente mayor que el cuadrado de la media dentro de los grupos,
El lector reconocerá el nu1nerador de la ecuación 7.2.18 como la surna R.V. será considerablemente n1ayor que 1. Un valor de la R.V. con esta
de cuadrados entre los grupos para el caso especial en que todos los tama- característica ocasionará dudas sobre la hipótesis de igualdad de las medias
ños de las muestras son iguales. Cuando se divide esta suma de cuadrados de las poblaciones.
entre los grados de libertad asociados k - 1, se obtiene Jo que se conoce Se sabe que debido a la variabilidad del muestreo, aun cuando la hipóte-
como el cuadrado de la inedia enrre grupos. sis nula es verdadera, es poco probable la igualdad de los cuadrados medios
Cuando todos los tamaños de las muestras no son iguales. una esti- de entre y dentro de los grupos. Por lo tanto, antes de concluir que las dife-
mación de cr2 basada en la variabilidad entre las n1edias de las muestras se rencias no se deben a la fluctuación del muestreo, es necesario decidir qué
obtiene mediante tan grande debe ser la diferencia observada. Dicho de otra forma, ¿qué tan
grande debe ser un valor de la R.V. para concluir que la diferencia observa-
k
da entre las dos estimaciones de a 2 no es resultado únicamente del azar?
I n1 (XJ - X. .)
2

¿=J
Prueba F Para responder a la pregunta anterior se debe considerar la dis-
k- 1 (7.2.19)
tribución muestra} de la relación las variancias de dos muestras. En el capí-
Para el ejemplo se tiene el siguiente cuadrado de la media entre grupos tulo 5 se aprendió que la cantidad (s1 / cr1) / (s~, / cr1) sigue la distribución F
cuando las variancias de las muestras se calculan a partir de muestras extraí-
sce/1(/"(' 121.l 8543 das de forma independiente y aleatoria de una pobiación que sigue una dis-
CMel!lre= ~ ) - 30.296358 tribución normal. La distribución F, presentada por R. A. Fisher a principios
4
de la década de 1920, se ha convertido en una de las distribuciones de
Si, además, la hipótesis nula es verdadera, puede esperarse que esas dos mayor uso en la estadística moderna. Ya se tiene conocimiento de su uso en
estimaciones de a 2 tengan una magnitud n1uy semejante. Si la hipótesis nu1a la construcción de intervalos de confianza para las variancias de la pobla-
es falsa, esto es, si todas las medias reales de grupo no son iguales, se puede ción y para probar hipótesis acerca de éstas. En este capítulo se apreciará
esperar que el cuadrado medio entre las grupos, que se calcula mediante el que la distribución Fes fundamental para el análisis de variancias.
uso de las desviaciones al cuadrado de estas medias con respecto de la media En el capítulo 6 se aprendió que, cuando las variancias de la población
conjunta, sea mayor que el cuadrado de la media dentro de los grupos. son iguales, se anulan en la expresión (s~ / cr~) / (s~, / a~) para dejar s1 / s~,
Para comprender el análisis de la variancia es necesario tener en cuenra la cual sigue una distribución F. La distribución Fes realmente una familia
que el cuadrado de la media entre grupos proporciona una estimación válida de distribuciones, y la distribución F que se utiliza en una situación deter-
2 minada depende del número de grados de libertad asociados con la varian-
de cr cuando la suposición de igualdad de variancias de la población se
cumple y cuando H 0 es verdadera. Ambas condiciones, una hipótesis nuia cia muestra! del numerador (grados de libertad del nun1erador) y del nú-
verdadera y variancias igllales en las poblaciones, se deben cumplir para mero de grados de líbertad asociados con la variaílcia muestra! en el deno-
que el cuadrado medio entre grupos sea una estimación válida para a 2. minador ( grados de libertad del de110111inador).
Una vez que se determina la distribución F adecuada, el tamaño de la
La relación de variancias Lo que se necesita ahora es co1nparar las dos R.V. observada que causará el rechazo de la hipótesis de la igualdad de las
estimaciones de cr2 mediante el cálculo de la siguiente relación de variancia, medias de la población depende del nivel de significación elegido. El nivel
que representa la estadística de prueba requerida. de significación elegido determina el valor crítico de F. que es el valor que
separa la región de aceptación de la región de rechazo.
R.V.:::: cuadrado de la media entre los grupos Corno se ha visto, la R.V. se calcula, en situaciones de este tipo. colo-
cuadrado de la media dentro de los grupos cando el cuadrado medio entre grupos en el 11u1nerador y al cuadrado medio
-
362 Análisis de la variancia Diseño completamente aleatorizado 363
dentro de los grupos en el denominador, por lo que el valor de los grados de Tabla 7.2.4. Tabla ANOVA del ejemplo 7.2.1
libertad del numerador es igual al número de grupos menos 1, (k - l ), y el
. k k Fuente se g. l. CM R.V.
valor de los grados de libertad del denominador es igual a Len - 1) = Ln. - Entre muestras 121.18543 4 30.296358 19.78
j"' 1 J Í"' 1 J
k = N - k. Para el ejemplo se tiene Dentro de las muestras' 41.35739 27 l .53 l 7552
~

Total 162.54282 31
grados de libertad del numerador= 5 - l = 4
grados de libertad del denominador= 32 - 5 = 27 Es posible aligerar la carga de cálculos en otra forma. Puesto que se
/uta!
es igual a la suma de sce11rre Y scde11rro' y dado que scentre es más fácil de
La tabla ANOVA Los cálculos que se han efectuado se pueden resumir y calcular que sedentro' se efectúa el cálculo de sctoraf y scelllre' y se resta esta
mostrar en una tabla como la 7.2.3, conocida como tabla ANO VA. última para obtener scdeiuro·
La tabla 7.2.4 es la tabla ANOVA para el ejemplo.
k " 8. Decisión estadística. Para llegar a una decisión es necesario comparar la R.V.
Es importante observar que, en la tabla 7.2.3, el término¡~ ;fr7j / N = con el valor crítico de F. el cual se obliene a través de la tabla G con 4 y 27 gra-
T_~ / N ocurre tanto para la expresión SCenrre como para SC,11,aI· Pari econo- dos de libertad y, si el nivel de significación es de .05, el valor de Fes 2.73. Las
mizar tiempo y labor de cálculo, se puede tomar ventaja de este hecho. Sólo regiones de aceptación y de rechazo que resultan se muestran en la figura 7.2.4.
es necesario calcular esta cantidad una vez y utilizarla tal corno se requiere.
Dicha cantidad se conoce como término de corrección y se identifica con la Puesto que el valor calculado de la R.V., 19.78, es mayor que el valor
letra C. crítico F. 2.73, es necesario explicar el por qué de la diferencia. Al respecto
existen dos explicaciones.
Tabla 7.2.3. Tabla de análisis de variancia para el diseño complccamcnte Si la hipótesis nula es verdadera, esto es, si las dos variancias de las
aleatorizado
muestras son estimaciones de una variancia común, se;."'53.be que la probabi-
Fuente de Grados lidad de obtener un valor mayor o igual que 2.73 es de .05. Se obtuvo un '
Sun,a de
variación
d, Razón de
valor mucho mayor que 2.73 el cual, si la hipótesis nula es verdadera, puede
cuadrados
libertad Cuadrado medio I variancia
considerarse como un suceso muy extraño. Es posible concluir, si se desea,
Entre
SSA =
• (iJ -
í:n i.) 2
k - 1 CAfe/!lre MS que la hipótesis nula es verdadera y suponer que debido a la casualidad se
muestras 1 V.R.
j= 1 = scemrf(k - l) MS
T?ATi
¿--'-~
.
=
J~ n N 1 1
Dentro de ",
ssw I ¿ ~ xj> 2 N - k CMde111ro

.
las muestras = (x 9
J- l i= ! == SCdemr1/(N -k)
",
= ." '\' '
L.. L..x'-1 "' (T
- L.. )'

.
J
¡=! i=l
1~ 1
-~
n 1

Total ", .95


SST = ¿ ¿ (x, -
j • I i= 1
x. )'
,V - l
.05

--= :z: :Z:xJ--:- ---,-


A

1~ ti- 1
"1 72

¡,;,
1-- ___ 2.73 F¡,.n_, _ _ _ _ _ __

Región de aceptación Región de rechazo


SSA =:: scl:1111"<' ssiv = sc, ,. ,,,
1 111 SST ::= S C101, 11 Figura 7.2.4. Regiones de acepta-::ión y rechazo para el eje1nplo 7.2.1
364 Análisis de la 1aria11cia
1 Diseño completa1nente aleatorit.ado 365
obtuvo un conjunto de datos que originaron un evento extraño. Por otro es posible que uno quiera analizar la respuesta al n1ismo tra1amienfo (en el
lado, posiblemente se prefiera .suponer que el valor calculado de la R.V. no sentido usual de la palabra) de algunas cepas de animales. Sin embargo, uno
representa un evento extraño producto del azar, sino que, en lugar de ello, puede referirse a la cepa de animales como el "tratamiento".
refleja el hecho de que existe algo que actúa y que no es el azar. Se con~ También hay que precisar que. aunque todas las técnicas de análisis de
cluye que ese otro "algo" es una hipótesis nula falsa. variancia se aplican frecuentemente a datos que resultan de los experimen-
Esta última es la explicación que generaln1ente se da para los valores de tos controlados, las técnicas también se utilizan para analizar datos recolec-
R.V. que son mayores que el valor crítico de F. Dicho de otra forma, si el tados en encuestas, suponiendo que las suposiciones básicas son satisfechas
valor calculado de R.V. es mayor que el valor crítico de F, la hipótesis nula razonablemente.
se rechaza.
Vale la pena recordar que la hipótesis original a probar es Análisis por computadora La figura 7 .2.5 muestra los resultados para el
ejemplo 7 .2.1 proporcionados por el programa de análisis de variancia uni-
Ho: µ¡ = µ.2 = µ3 - µ,; = µs lateral, el cual se encuentra incluido en el paquete de software MINITAB.
Los datos fueron registrados en columnas desde la I hasta la 5 y se tecleó el
¿El rechazo de la hipótesis acerca de las variancias implica un rechazo de la comando
hipótesis de la igualdad de las medias de las poblaciones? La respuesta es
sí. Un valor grande de la R.V. resultó del hecho de que el cuadrado medio
AOVONEWAY C1, C2, C3, C4, es
entre los grupos era considerablemente mayor que el cuadrado medio dentro
de los grupos. Dado que el cuadrado medio entre los grupos se basa en la
dispersión de las medias muestrales en tomo a su media, esta cantidad será Al comparar la tabla ANOVA de la salida impresa con la tabla 7.2.4. se
grande cuando exista una gran discrepancia entre los tamaños de las medias observa que en la primera se utiliza la etiqueta "factor" en lugar de "entre
muestrales. Debido a esto, un valor significativo de la R.V. indica que se muestras". Los diferentes tratamientos son clasificados en la salida impresa
rechace la hipótesis nula que indica la igualdad entre todas las medias de las como nivel"es. Así. el nivel l = tratamiento 1. el nivel 2 = tratamiento 2 y así
poblaciones. Dado que en el ejemplo, 19.78 es mayor que 2.73, se rechaza sllcesivamente. La salida impresa proporciona las cinco medias muestrales,
la hipótesis que dice que las variancias observadas de las muestras son esti- así corno las desviaciones estándar y la desvinción estándar ponderada. Esta
maciones de una variancia común. Para esta prueba, p < .005, puesto que última cantidad es igual a la raíz cuadrada del cuadrado medio del error que
19.78 > F_ 995 = 4.74. aparece en la tabla ANOVA. Finalmente, la salida impresa de la computa-
dora proporciona una representación gráfica de los intervalos de confianza
9. Co11c{usió11. Se concluye que no todas las medias poblacionales son iguales. del 95 por ciento para la n1edia de cada una de las cinco poblaciones repre-
sentadas por los datos de la 1nuestra. El paquete l\1INITAB puede propor-
Advertencia El diseño completamente aleatorizado es sencillo y, por lo cionar análisis adicionales mediante el uso de comandos adecuados. El
tanto, ainpliamente utilizado. Sin embargo, se debe utilizar sólo cuando las paquete también contiene programas para análisis bilaterales de variancias,
unidades que reciben el tratamiento son homogéneas. Si las unidades expe- los cuales se estudian en las siguientes secciones.
rimentales no son homogéneas, el investigador deberá usar otro diseño, Si los datos disponibles para el análisis no satisfacen las suposiciones
como alguno de los que se estudian más adelante en este capítulo. para el análisis unilateral de Yariancias como se estudia aquí. es posible uti-
Aunque en el eje,nplo anterior los tamaños de las muestras son diferen- lizar el procedimiento de Kruskal-\Vallis. una técnica no paramétrica que se
tes, éste no es un requisito indispensable, ya que el diseño completamente discute en el capítulo 11.
aleatorizado y su análisis pueden emplearse cuando los tamaños de las
muestras son iguales. Prueba para diferencias significati\'as entre pares indi,iduales de me-
En ti ejen1pl0, los cinco tratamientos lo son en el sentido usual de la dias Siempre que el análisis de variani:;ias conduce a rechazar la hipótesis
palabra. Sin embargo, éste no es siempre el caso, ya que el término '·tra- nula de no diferencia entre las medias de las poblaciones, surge la pregunta
tamiento" se usa en forn1a genérica en el diseño experimental. Por ejemplo, respecto a qué par de medias son diferentes. De hecho. Jo que con frecuen-
366 Análisis de la variancia Diseño cotnpletamente aleatorizado 367

ANALYSIS OF VARIANCE
planean antes de analizar !º.sdat~s. Un~ di~ere.ncia ~ntre cualq~ier p~r d.e
medias que exceda una m1n1ma d1ferenc1a s1gn1ficativa se considera s1gn1-
ficativa en el nivel de significación utilizado para calcular la MDS. Gene-
SOURCE DF SS MS F p
ralmente, el procedimiento MDS se utiliza sólo cuando el análisis de varian-
FACTOR 4 121.19 30.30 19.78 0.000
ERROR 27 41.36 1.53 cia en conjunto conduce a una R. V. significativa. Algunos ejemplos del uso
TOTAL 31 162.54 MDS se encuentran en el libro de Steel y Torrie. 22
Duncan'.!3-26 ha realizado una gran cantidad de investigaciones sobre el
tema de comparaciones múltiples con el resultado de que, actualmente, se
LEVEL N MEAN STDEV INDIVIDUAL 95 PCT CI'S
FOR MEAN BASED ON utiliza ampliamente la nueva prueba de amplitud múltiple de Duncan. La
POOLED STDEV aplicación de esta prueba al caso de tamaños desiguales de muestras se estu-
-- +----- +----- +----- +-- dia en el libro de Kramer. 27
C1 5 2.608 0.996 ( ---•---) Cuando el objetivo de un experimento es comparar algunos tratamien-
C2 6 2.600 1.099 (--*--) tos con uno de control y no entre sí, p_or lo general se sigue el procedimiento
C3 6 5.002 0.957 (--*--)
C4 7 6.813 1.430 (--*--) debido a Dunnet 28 ·29 para comparar el tratamiento de control contra cada
es 8 7.101 1. 439 (--*--) uno de los otros tratamientos.
-- +----- +----- +----- +-- Otros procedimientos de comparación múltiple que se utilizan son los
propuestos por Tukey, 30JI Newman, 32 Keuls, 33 y Scheffé. 3435 Las ventajas
PO OLED
STDEV = 1. 238
2.0 4.0 6.0 8.0 y desventajas de los diferentes procedimientos se estudian en Bancroft, 36 ••
Daniel y Coogler37 y Winer. 38 Daniet 39 ha elaborado una bibliografía res- '
pecto a procedimientos de comparación múltiple.
Figura 7.2~5. Resultados por computadora para el ejemplo 7.2.1.

cia no se desea hacer es llevar a cabo una prueba de significación en todos y


Prueba D'\-'S de Tukey Un procedimiento de compa1ación múltiple desa-
rrollado por Tukey 31 se utiliza frecuentemente para probar la hipótesis nula
"'
cada uno de los pares de medias de los tratamientos. En el ejemplo 7 .2.1, en
respecto a la igualdad de todos tos posibles pares de medias del tratamiento
el que se tienen cinco tratamientos, se desea saber, después de rechazar
cuando todas las muestras son del mismo tamaño. Cuando se utiliza esta
H 0 : µ 1 = µ 2 = µ 3 = µ 4 = µ 5, cuál de las 10 hipótesis individuales posibles
prueba, se elige un nivel global de significación de ex. La probabilidad es a,
debe ser rechazada. Sin embargo, el experimentador debe tener precau~
entonces, que una o más de las hipótesis nulas es falsa.
ción al probar las diferencias significativas entre las medias individuales y
La prueba de Tukey, que generalmente se conoce como prueba DVS
siempre debe asegurarse de que su procedimiento es válido. El punto
(diferencia verdadera111e11te sig11ificati1·a), utiliza un solo valor contra el que
crítico en el procedimiento es el nivel de significación. Aunque se haga
se comparan todas las diferencias. Este valor, llamado DVS, se obtiene
que la probabilidad, a, de rechazar una hipótesis nula verdadera para la
mediante
prueba sea pequeña, la probabilidad de rechazar a[ menos una hipótesis
verdadera cuando se prueban varios pares de medias es, como se ha visto,
C!vf,.esidiwl
mayor que a. DVS =qa.k.N-1.: /! (7.2.20)
Durante varios años se han sugerido diversos procedimientos para efec-
tuar comparaciones individuales. El procedimiento más antiguo y tal vez el
más ampliamente utilizado en el pasado, es el procedimiento de Fisher, la donde a es el nivel de significación elegido. k es el número de med.ias en el
n1íni1na diferencia significativa ( MDS;. expuesto en la primera edición de su experimento, N es el total de observaciones en el experimento, 11 es el nú-
-----~!Tbro-'fhe Des1g11 o¡-E.tperllnenrs 1 en 1935. Este procedimiento, el ctii:if es J mero deciliservaciones en un tratamiento. ECNI es ehrror-o~eJ -cuadrado
una prueba t de Student que utiliza una variancia ponderada del error. es vá- medio dentro de los grupos de la tabla ANOV.<\. y q, que se obtiene de la
lida sólo cuando se efectúan comparaciones independientes o que se tabla H del apéndice I con a. k y N -k.
368 Análi.{is de la variancia Diseño co11tpletan1ente aleatori:.ado 369

Se calculan todas las diferencias posibles entre los pares de medias y Tabla 7 .2.6. Prueha~ de eomparacitín n1úhip\e con los dato<:; del ejem¡ilo 7 .2.1, Y la
cualquier diferencia que proporcione un valor absoluto que exceda la DVS prueba DVS
se considera significatiYO. Decisión
Cuando todas las muestras no son del n1ismo tamaño, como en el ejemplo /-!ipríresis DVS-,,. estadística
7.2.1, la ecuación 7.2.20 no es aplicable para la prueba de Tukey de DVS. Sin No rechazar H0
embargo, Spj~tvoll y Stoline40 han extendido el procedimiento de Tukey pard
Ho: µ.1 = µ:! DVS* = 4.14
yl.5317552
= 2.29 dado que .01 < 2.29
5
los casos en que los tamaños de las 1nuestras son diferentes. Su procedimien-
Hu: µ1 yl.5317552· Rechazar H0
to, que es aplicable en experimentos que comprenden tres o más tratamientos µ:<
DVS* 4.14 = 2.29
= dado que 2.39 > 2.29
y niveles de significación de .05 o menos, consiste en la sustitución den por 5
nj, que es el más pequeño de los tamaños de muestra asociados con las mues- Ho: µ 1 µ,,
DVS* = 4.14
vl.5317552
= 2.29
Rechazar H 0
tras cuyas medias se van a comparar. Si esta nueva cantidad se designa como dado que 4.20 > 2.29
5
DVS*, se tiene como un nuevo criterio de prueba la expresión: Rechazar H0
Hu: µ1 µ:,
DVS* = 4.14 yl.5317552 = 2.29 dado que 4.49 > 2.29
5
CM,.e.,idua/
DVS*=qa.k.N-k n* (7.2.21) Ho: µ:.> = µ.:! yl.5317552 Rechazar H0
1 DVS* = 4.14 = 2.09 dado que 2.40 > 2.09

Cualquier valor absoluto de la diferencia entre las medias de dos mues- Ho: µ.:.> = µ.,,
._ 6
vl.5317552 _ C) Rechazar H0
tras, una de las cuales se calcula partir de una n1uestra de tamaño nj (que es DVS* - 4.14
6
- -.09 dado que 4.21 > 2.09
más pequeña que la 1nuestra de la cual se calcula la otra media), que excede Rechazar H0
H.,: µ.:! = µ.,-, vl.5317552
la DVS* se considera significativo. DVS* = 4.14 = 2.09 dado que 4.50 > 2.09
6
No rechazar f/0
Eje,nplo 7.2.2 !\1ediante los datos del ejemplo 7.2.l se ilu~tra el uso de la H,1: µ:l = µ,
DYS* = 4.14 vl.5317552 = 2.09 dado que 1.81 < 2.09
prueba de DVS. 6
Ho: µ. ..¡ = µ,, vl.5317552 Rechazar H 0
DVS* = 4.14 = 2.09 dado que 2.1 O> 2.09
Solución El primer paso es preparar una tabla con todas las posibles dife- 6
rencias (ordenadas) entre !as medias .. Los resultados de este paso para el No rechazar H0
Ho: µ,, µ, vl.5317552
ejemplo se n1uestran en la tabla 7.2.5. DVS* = 4.14 = 1.94 dado que .29 < J.94
7
Suponer que o: =.05. Al buscar en la tabla H en a= .05, k = .5 y N - k =
27, se encuentra que q está alrededor de 4.14, si se efectúa una interpo-
lación. En la tabla 7 .2.4 se 1iene que CAfn,sidual = 1.5317552. Las hipótesis que se pueden probar, el valor de DVS* y la decisión esta-
dística para cada prueba, se muestran en la tabla 7.2.6.
Los resultados de las pruebas de hipótesis que se muestran en la tabla
Tabla 7.2.5. Diferencias entre n1cdi.is (\·alor absoluto) del CJCn1plil 7.2.2 7.2.6 pueden resumirse mediante la técnica sugerida por Duncan. 26 Las
llas medias se extrajeron de la tabla 7.2.2)
medias de las muestras se despliegan sobre una línea aproximadamente a
,, '. \ ·, escala. Cualquier par de medias de las muestras que no sean significativa-
.\' ~ :.! .Üll :!.-!() l.:!¡ -l.."10
mente distintas son subrayadas por la misma línea. Cualquier par de medias
.Ol
'1 = :!.!)! :!.:i'.J l.:!() 1,.¡q no subrayado por la misma línea es significativamente distinto. Así, para el
\ ., = :i.(10 l.:,.; I ~.JO ejemplo, se escribe
.\
1
= ll.,<..;I :!!)
\-=/JI) 2.60 261 5.00 6.81 7.10
Análisis de la vari.ancia Diseño co1npletan1e11te aleatori:.ado 371
370
EJERCICIOS~~~~~~~~~~~~~~~~~~ Estímulo
11 111
En cada uno de los siguientes ejercicios, aplicar los nueve pasos de la prueba de
hipótesis para análisis de variancias. Determinar el valor p para cada prueba. 16 ¡¡ 8
7 111
7.2.1 Se desea saber si cuatro tratamientos para la inflan1ación de coyunturas di-
14
14 7 ,,
fieren en cuanto a efectividad. Cuatro grupos de pacientes se sometieron a l'.3 8 111
los diferentes tratamientos. Al final de un periodo determinado, cada grupo 13 4 6
fue sometido a una prueba para cuantificar la efectividad del tratamiento. Se 12 8 7
obtuvieron los siguientes puntajes: 12 9 10
17 ¡; !J
17 8 11
Tratamiento
17 6 11
2 3 4 19 4 9
64
88
72
76
70
90
58
74
66
95
90
80
14
IS
20
"
5
10
9
5
"
80 80 60 87
79 75 82 88 ¿Proporcionan estos datos la suficiente evidencia para indicar una diferencia
71 82 75 85 real entre las medias de las poblaciones? Sea a= .05.

Sea a= .05 7.2.4 Se efectuaron determinaciones de azúcar en la sangre (mg/100 nil) de 10


especímenes en cada una de cinco cepas de animale_s..:~xperimentales con los
7.2.2 Un experimento condujo a comparar tres 1nétodos de empaque para cierto siguientes resultados.
alimento. El criterio fue el contenido de ácido ascórbico (mg/100 g) después
de un periodo de tiempo. Se obtuvieron los siguientes datos
Cepa
1\tlétodo de empaque
(: lJ E
A B e
A

124
"
111 117 l 04 142
14.29 20.06 20.04 139
1 1fi 101 142 l~H
19.10 20.64 26.2'.\
101 130 121 130 133
19.09 [8.00 22.74
118 108 123 103 120
16.25 19.56 24.04
118 127 121 121 127
15.09 19.47 2'.1.'.17
120 129 148 119 149
16.6[ 19.07 25.02
110 122 l 41 106 150
19.6'.{ 18.'.\8 2:t27
127 103 122 107 149
[06 122 139 107 120
¿Proporcionan estos datos la suficiente evidencia para indicar, a un nivel de 130 127 125 115 116
significación de .01, que hay una diferencia entre los métodos de empaque?
-------
--~1~.~2~.3~Se utilizaron-tres grupos de an1mal'es en un experiITlento para comparar e'l ... ¿Pr;;-Porcionan estos datos la suficlerit~ evidencTUJJir'a indicar una diferencia
tiempo de respuesta, en segundos, de 1res diferentes estín1ulos. Se obtu· en la concentración media de azúcar en !a sangre de diferentes cepas? Sea
vieron los siguientes resultados. e,= .05.
372 Análisis de la 11aria11cia Diseíio de bloques co111plelos alealori:::ados 373

7.2.5 Tres n1édicos desean co1nrarar el licn1po de conYalcsccncia de sus pacientes Dieta
hospitalizados después de una intervención quirúrgica n1cnllí sin co1nplica· A 11 e 1)
ciones. Se eligió una n1ucstra de ochu registros de los archivos de cada
n1édico y se observaron los siguientes tiempos de convalcsccncia. ..J:.84 4.62 5.~4 4.:'Jf-!
-t.57 4.41 5.00 4.f-!9
4.72 4.4'.{ 4.82 4.!l()
J\1édico 4.5:'J 4.2J 4.95 4.8]
.\ B e -t.t14 5.28 5.2fi
-t.45 4.90
4 4 5
4.98
5 :l
"
4 :l
"
4 :l :l 7.2.12 Un grupo de inve~tigadores desea comparar cuatro programas de aptitud
ti :l
li '5 3
física diseñados para directivos. A cada miembro de un conjunto de treinta
directivos se le asignó aleatoriamente uno de los cuatro programas. La si-
:l
'
;) :l ':1 guiente tabla muestra la diferencia entre las puntuaciones de la condición
física obtenidas por cada uno de los directivos, antes y después de participar
en el programa.
¿Sugieren cslos datos una diferencia en cl Licn1po pron1cdio de convalcsccn-
cia de los pacientes de cada 1nédico? Sea a= .01. Programa
.\ B e: [)

7.2.6 Con !os datos del ejcrcii.:io 7.1. L aplicar J:1 prueba Je Tuk.cy de la DVS
con a= .01. 13 11 12 22
2-t 13 19 26
7.2.7 Con los datos del cjcn:icio 7.'2.2, aplicar la prueba <le Tukey de la DVS
con a= .05. 19 20 9 22
18 14 14 22
7.2.8 Con los datos del ejercicio 7.2.3, aplicar la prut."!ha de Tukey de la DVS
con a== .05. 9 11 21 26
7.2.9 Con los datos del ejercicio 7.2.J, aplicar la prueba de Tukey de la DVS 21 21 7 19

con a== .01. 17 14 6


7.2.10 Con los datos del ejercicio 7.2.5, aplicar la prueba de Tukey de la DVS con 22 s
a= .Ol. 24
7.2.11 Los siguien!e:; datos son el porcentaje que represen1a el peso de cierto órga-
no con respecto al peso total de cada uno de 30 aniinales de fahoratorio. Los
¿Es posíblc concluir que los cuatro programas difieren en cuanto a efectivi-
cuatro tra1amien1os corresponden a las difen.·ntcs dielas alin1enticias de los
dad? Sea a= .05.
animales. Probar la hipótesis nula de no diferencia en los efectos <le la dieta
Y probar si existen diferencias significatiYas entre todos los pares posibles
de n1edias. Sea a= .05. ·
7.3 DISEÑO DE BLOQUES COMPLETOS ALEATORIZADOS~

Dieta De todos los diseños experimentales que se utilizan, al parecer el disello de


bloques co1npletos aleatori:::.ados es el que se ha utilizado más ampliamente.
A B e D
Este diseño fue creado, el 1925, por R. A. Fisher,-l41 quien buscaba métodos
4.34 -t.-17 4.71 ..¡_..¡¡,; para el mejoramiento de experimentos en el can1po agrícola. El noinbre del
4.73 4.65 4.(19 :':i.O'.? diseño reíleja su origen en la experin1entación agrícola. donde el terreno de
Análisis de la variancia Diseño de bloques co1npletos aleatorizados 375
374
íl1,
cultivo se divide en bloques y éstos en parcelas que reciben los tratamientos En general, los datos de un experimento que utiliza el diseño de bloques
!i bajo investigación. completos aleatorizados se muestra en la tabla 7.3.1. Se debe observar la
El diseño de bloques completos aleatorizados es un diseño en el que las siguiente notación nueva:
unidades (llamadas unidades experin1e11tales) a las que se aplican los tra-
tamientos se subdividen en grupos homogéneos llamados bloques, de modo el total del i-ésimo bloque = T;

Ix,
que el número de unidades experimentales en un bloque es igual al número j=l
(o algún múltiplo del mismo) de tratamientos en estudio. Los tratamientos
se asignan posteriormente, al azar. a cada una de las unidades experimen- •
Ix, r
tales dentro de cada bloque. Es importante tener en cuenta que cada tra- j-" ! = __!.:.
la media del i-ésimo bloque = X,.
tamiento aparece en todos los bloques y cada bloque recibe todos los -k k
tratamientos.
El objetivo al utilizar el diseño de bloques completos aleatorizados es
y el gran total = T . .

Ir, "
Ir,
aislar y eliminar del término de error la variación atribuible a los bloques, y
/7 1 i= l
asegurar que las medias del tratamiento estén libres de los efectos del
bloque. La efectividad del diseño depende de la capacidad de conseguir blo-
ques homogéneos de unidades experimentales. Esta capacidad depende del lo cual indica que el gran total se puede obtener sumando los totales de los
conocimiento de los investigadores acerca del material experimental. Cuan- renglones o sumando los totales de las columnas.
do el diseño se utiliza apropiadamente, el cuadrado medio del error en la La técnica para analizar los datos de un diseño de bloques completos
tabla ANOVA se reduce, aumenta la R.V. y mejora la probabilidad de re- aleatorizados se llama análisis de variancia bilateral, porque una obser-
chazar la hipótesis nula. vación se clasifica con base en dos criterios: el bloque al cual pertenece y el
En experimentos con animales, si se piensa que las diferentes cepas de grupo de tratamientos del cual forma parte.
animales responderán de manera diferente a un mismo tratamiento, dichas
cepas se pueden utilizar como un factor para formar bloques. Las camadas Ejemplo 7.3.1 Un fisioterapeuta deseaba comparar métodos para enseñar a
también pueden utilizarse como bloques, en cuyo caso un animal de cada los pacientes el uso de un mecanismo protético. Intuía que la rapidez de
camada recibe un tratamiento. En experimentos en que intervienen seres comprensión sería diferente en pacientes de diferentes edades y deseaba di-
humanos, si se desea eliminar las diferencias que resultan de la edad, los señar un experimento en el que la influencia de la edad pudiera ser tomada
individuos pueden agruparse de acuerdo con la edad, de tal forma que cada en cuenta.
persona recibe el tratamiento respectivo. El diseño en bloques completos
aleatorizados también se puede utilizar de manera efectiva cuando el experi- Tabla 7.3.1. Tabla de valores muestra!es par el diseño de bloques completos
mento se lleva a cabo en más de un laboratorio (bloque) o cuando se re- aleatorizados
quieren varios días (bloques) para terminarlo. Tratamientos
Algunas de las ventajas del diseño en bloques completos aleatorizados Bloques k Total Media
comprenden el hecho de que es fácil de entender y calcular. Además, algu-
1 2
' x., T, .i¡_
X1:.1 X¡:\
nas complicaciones que surgen el transcurso de un experimento son fáciles X11

2 X:.1:.1 X:.1:1 X':.!.~ T':.!.. .i':.!..


de controlar cuando se utiliza este diseño. X:.11

3 X:11 X:1:.1 X:1:1 x~k T:1. X:1.


Resulta conveniente señalar que el análisis de comparaciones por pare-
jas que aparece en el capítulo 6 es un caso especial del diseño de bloques T,, .i,,_
X,.¡ X,,2 x,,:1 x,,*
completos aleatorizados. El ejemplo 6.4. l puede ser tratado de tal forma, "
- - - - - - - - --~q~Ue los dos niveleS de colesi~erol sOn !OS efectos del tratamiento y los 12 1-----Totat--·--fy ----q'~2- - - - ~ :1- - -.•- - T . ~__ r_

individuos a quienes se les tomó la medición del nivel de colesterol son los Media :i_ ¡ i':.!. -·
bloques.
i_:1
·"·*
376 Análisis de la ••ariancia Diseíio de bloques con1pletos aleatoriz.ados 377
Solución El diseño en bloques cón1ple1os aleatorizados es el diseño ade- el efecto del método de tratan1iento, más el efecto de su edad, más otros fac-
cuado para el fisioterapeuta. tores que no se toman en cuenta.

l. Datos. Se eligieron tres pacientes de cada uno de los cinco grupos de edades para
que participaran en el experi,nento, y a cada paciente de c3da grupo. aleatoria- Suposiciones del modelo
mente, se le asignó uno de los métodos. Los métodos de instrucción constituyen
los tres tratamientos y los cinco grupos .de edades son los bloques. Los datos se a. Cada xij que se observa constituye una muestra aleatoria independiente de tama-
n1uestran en la tabla 7.3.2.
ño 1 a partir de una de las kn poblaciones representadas.
2. Suposiciones. E! n1odelo para el diseño de bloques cornpletos aleatorizados y las b. Cada una de estas kn poblaciones sigue una distribución nonnal con una media
suposiciones en que se basa son como sigue:
µ'1 y variancia cr 2 igual. Esto implica que los el] siguen una distribución nonnal e
independiente con una media igual a O y variancia cr 2.
El modelo c. Los efectos de tratamiento y de bloque son aditivos. Esta suposición se interpre-
ta corno la no existencia de interacción entre los tratamientos y bloques. En
otras palabras, una combinación particular tratanüento-bloque no produce un
X'} = µ + ¡3, + T
1
+ e,1 (7.3.1) efecto mayor o menor que la suma de sus efectos individuales. Es posible mos-
1, 2, .. , n; j-1,2 ..... k trar que cuando esta suposición se satisface '
"l:
·'
En este modelo ' - í;~. - o
Í:º,
xij es un valor típico de la población total. Í"' l ,= 1

µ es una constante desconocida. Las consecuencias de contravenir esta suposición son resultados engañosos. An-
~i representa un efecto de bloque que refleja el hecho de que la unidad experi- derson y Bancroft42 sugieren que no es necesario interesarse en la suposición de
mental cae en el i-ésimo bloque. adición a menos q11e la n1edia mayor sea en más del 50 por ciento más grande
rj representa el efecto de un tratamiento, que refleja el hecho de que la unidad que la media menor. El problema de no aditividad también se estudia en Tu-
experimental recibe elj-ésimo tratamiento. key43 y Mandel. 44
eij es un componente residual que representa todas las fuentes de variación que no
sean tratamientos ni bloques.
Cuando estas suposiciones son verdaderas, t y pi
son un conjunto de
constantes fijas, y se tiene una situación que se a]usta al modelo de efectos
Para el ejemplo, es posible decir que el valor de una observación en
fijos.
particular es ti resultado de la existencia de un paciente en el estudio, más

3. Hipótesis. Es posible probar


Tabla 7.3.2, Tiempo (en días) que se requiere para aprender a usar una prótesis
Grupo l\fétodo de enseñanza Ho: T1 o. ) - ]. 2..... ¡
de edades A B e Total lñedia
Menos de 20 años contra la alternativa
i 9 JO 26 8.6i
20 a 29 años 8 9 JO 27 9.00
30 a 39 años 9 9 12
HA: no todas las rj = O
30 10.00
40 a 49 años 10 9 12 31 10.33
50 años y más 11 12 Una prueba de hipótesis respecto a los efectos de bloque no se efectúa,
14 37 12.33
Total por lo general, bajo las suposiciones del modelo de efectos fijos por dos
45 48 58 151
Media razones. Primero, el interés principal está en los efectos del tratamiento,
9.0 9.6 l l.fi 10.07 siendo el propósito general de los bloques proporcionar una forma de elimi-
"I
1
378 Análisis de la variancia Diseño de bloques completos aleatorizados 379
nar Jas fuentes extrañas de variación. Segundo, aunque las unidades experi- Donde C es un término de corrección y en esta situación se calcula
mentales se asignen al azar a los tratamientos, los bloques no se obtienen de como sigue:
manera aleatoria.
Para el ejemplo, se tienen las siguientes hipótesis

H 0: 'tj = O, J=l,2,3
C = (,t, .t:X/kn
T 1 I kn (7.3.8)
HA: no todas las tj= O
Sea a= .05
Los grados de libertad adecuados para cada componente de la ecuación
4. Estadística de prueba. La estadística de prueba es la R.V.
7.3.3 son:
5. Distribución de la estadística de prueba. Cuando H 0 es verdadera y las suposi- bloques tratamientos residuales (error)
total
ciones se cumplen, la R.V. sigue una distribución F.
6. Regla de decisión. Se rechaza la hipótesis nula si el valor calculado de !a esta- k11 - 1 ¡,, - 11 + (k - 1) + (n - l)(k - 1)
dística de prueba es mayor o igual que el valor crítico de F.
7. Cálculo de la estadística de prueba. Puede mostrarse que la suma total de los
cuadrados para el diseño de bloques completos a!eatorizados puede dividirse en Los grados de libertad residuales, al igual que la suma de cuadrados resi-
tres componentes, cada uno atribuible a los tratamientos (SC1rai)· bloques dual, se obtiene con10 sigue:
(SCbloq_) y error (SCre.,·id1.1al). Los cálculos algebraicos son tediosos y serán omiti-
dos. La partición de la suma de cuadrados se puede expresar mediante las
siguientes ecuaciones:
(kn - 1) - (n - 1) - (k - 1) = kn - 1 - n + 1 - k + 1
= "(k - 1) - l(k - 1) = (n - l)(k - 1)

k " k " k "


¿ ¿ (x,¡ - X. .J' ¿ ¿(x, - x )' + ¿ ¿ 1,, .t )'1 Para el ejemplo se calculan las siguientes sumas de cuadrados:
¡= 1,= 1 ¡= l 1= 1 ¡=l 1= ¡

(151)'
+
k
L L (x,, - .x,. - .-r_¡ + .x. ):¿
e (3)(5)
2280 l = ¡ 520.0667
15
¡= J = J
1
(7.3.2)
setotal = 7':!. + g':.!. + + 14 2 - 1520.0667 = 46.9333
esto es
2 2 2
26 + 27 + . ' . + 37
sclotu/ = scb/oq. + se/rol. + screJidiwl sc,1oq. = '3
- 1520.0667 = 24.9333
Las fórmulas de cálculo para las cantidades en la ecuación 7.3.2 y 7.3.3 45"1 + 482 + 58 2
son como sigue: setrat. - _ - 1520.0667 = 18.5333

"'"''
k " J
sclotal = L., L., x,, - e
,= l 1= l
' (7.3.4) scresidrwl = 46.9333 - 24.9333 - 18.5333 = 3.4667
"T'!.
sebloq. = "'--'- -
,~I k
e (7.3.5) Los grados de libertad son en total (3)(5) - l = 14, los bloques son 5 - 1
= 4, los tratamientos son 3 - 1 = 2 y el error residual (5 - 1)(3 - 1) = 8.

~
* T"1, - -----,L7a•tabill'ANOVrt-L-trs- resutnrdn-s1:l:e---1us -crrtcut-os-dé·J-----dis·e ño--cte-btoq u es~- -
/1'iit. = I
, n- (7.3.6)
completos aleatorizados se pueden desplegar en una tabla ANOVA como la
screúdrwl = sc/11/(l{- scblnq. - sc,,.ar. (7.3.7) 7.3.3.
Análisis de la variancia Ejercicios 381
380
Tabla 7.3.3. Tabla ANOVA para el diseño de bloques con1p!etos aleatorizados Cuando los datos disponibles para el análisis no satisfacen las suposi-
ciones del diseño de bloques co1npletos a\eatorizados como se estudia aquí,
F11e11te se g. l. CM R.V. el procedimiento de Friedman que se estudia en el capítulo 11 constituye
¡k ¡1 CM1,m. == CA1rn,i/ una alternativa no paramétrica conveniente.
Tratamientos scln/1.
scllll:/<k - 1> CM,~,iJ1111/
Bloques sch/or¡. (11 - 1) CM h/0<¡. --
SC1,1,,, .!(n - !)
1
EJERCICIOS _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ __
Residual sc,e,·j,J,w/ (r¡ - l ¡r k - ¡) CM
S rn1d1wr--
c,esid1w!(n - l)(k- J)
Para cada uno de los siguientes ejercicios. llevar a cabo el procedimiento de los
Total scr,"<11. kn - J nueve pasos de la prueba de hipótesis para el análisis. de \'ariancias. Calcular el
valor p para cada ejercicio.
7.3.1 Se analizaron tres sistenias para el servicio de alimentación en cinco hospi-
Tabla 7.3.4. Tabla ANOV A para e! ejemplo 7 .3.1.
tales. La variable de interés es el tiempo (en minutos) en1pleado para servir
Fuente SC g. l. CM R. V. los alin1entos. En cada hospital se sirvió la conüda de n1ediodía según cada
Tratamientos 18.5333 2 9.26665 21.38 método, obteniéndose los siguientes resultados:
Bloques 24.9333 4 6.233325
Residual 3.4667 8 .4333375 :\létodo
Total 46.9335~ 14 f!ospital ., B e
i.SG 9.68 11.65
Para el ejemplo se tiene la tabla ANO VA que se 1nuestra en la tabla 7 .3.4.
2 9.98 9.69 10.69
3 i.23 10.-49 11. ¡¡
8. Decisión esradística. Es posible mostrar que, cuando el n1odelo de efectos fijos 10.72
4 8.22 tl.55
se aplica y la hipótesis nula de no efectos del tratamiento (todas las 't¡ == 0) es
5 7.59 8.30 12.36
Yerdadera, tanto el cuadrado medio del error. o residual, co1110 el cuadrado
n1edio de los tratarnienloS son estimaciones para la variancia con1ún cr~. Por lo
tanto, cuando la hipótesis nula es verdadera, la cantidad Después de eliminar los efectos propios del hospital, ¿sugieren estos datos
una diferencia entre los n1étodos en el tiempo medio empleado para servir !a
CAf1rn1.. / CM,.nid1wl
comida'! Sea a= .05.
sigue una distribución F con k- 1 grados de libertad del numerador y (11 - 1) X 7.3.2 Dieciséis indi\'iduos con sobrepeso participaron en un análisis para con1parar
(k- l) grados de libertad del denominador. La relación de variancias calculada, cuatro dicta~ para reducción de peso. Los individuos forn1aron grupos de
por !o tanto. se con1para con el valor crítico de F. acuerdo con el peso inicial y a cada uno de los cuatro sujetos de cada grupo se
le asignó. al azar, una de las cuatro dietas de reducción de peso. A.l terminar el
Para el ejemplo, el valor crítico de F con 2 y 8 grados de libertad y a=
periodo expcritnental se consideró la p<!rdida de peso en libras como sigue:
.05 es 4.46. Puesto que la relación de variancias calculada, 21.38, es mayor
que 4.46, se rechaza la hipótesis nula de no efectos en el trata1niento según
la suposición de que un R.V. de esa magnitud refleja el hecho de que dos
cuadrados medios de las muestras no estiman la misma cantidad. La única Régimen
Peso
explicación distinta para esta R.V. rnayor sería que la hipótesis nula es en i1lif ,'a[ f libras) ., B e D

realidad verdadera y que se ha observado un conjunto inusual de resultados. 24 23


150a 174 I" :.16
Se rechaza la segunda ex.plicación en favor de la primera.
175a 199 15 29 2'."l _,

9. Conclusión. Se concluye que no todos los efectos de tratan1iento son iguales a 200 a 225 15 27 25 2-4
cero o, dicho de otra forma, no todas las medias de los tra1an1ientos son i[!ualcs. ~1ús de 225 IH :Hl 33 :~ 1
Para esta prueba p < .005. ~
¡ 382 Análisis de la variancia Experimento factorial 383
Después de eliminar las diferencias debidas al peso inicial, ¿estos datos pro- 1.3.5 Analizar los datos del ejercicio 6.4.1 como un diseño de bloques completos
porcionan suficiente evidencia para indicar una diferencia en los efectos de a!eatorizados.
la dieta'? Sea a= .01. 7.3.6 Cuatro individuos participaron en un experimento para comparar tres méto-
7.3.3 Un equipo de remotivación en un hospital psiquiátrico efectuó un experimen- dos de liberación de tensión nerviosa. Cada individuo fue puesto en una si-
to para comparar cinco métodos para remotivar a los pacientes. Estos últimos tuación de tensión nerviosa en tres ocasiones diferentes. Por cada vez se uti-
se agruparon de acuerdo con el nivel inicial de motivación. A cada paciente lizó un método diferente para reducir la tensión nerviosa en cada individuo.
de los cinco grupos se le asignó, al azar, uno de los cinco métodos. Al final La variable de respuesta es el total de reducción del nivel de tensión nerviosa
del periodo experimenta!, un equipo, formado con un psiquiatra, un psicólo- antes y después de la aplicación del tratamiento. Los resultados son los
go, una enfermera y un trabajador social, evaluó a los pacientes. Ningún siguientes.
miembro del equipo supo el método asignado a cada paciente. El equipo
asignó a cada paciente una calificación como medida de su nivel de moti- Tratamiento
vación. Los resultados son los siguientt!s.
J11divid110 A B e:
Nivel I\Jétodo de remotivación 16 26 22
inicial de 2 [6 20 23
n1otivació11 A B e D E
17 22
3 21
Nulo 58 68 60 68 64 4 28 29 36
Muy bajo 62 70 65 80 69
Bajo 67 78 68 81 70
Promedio 70 81 70 89 74 ¿Es posible concluir a partir de estos datos que los tres métodos difieren en
efectividad? Sea a= .05.

¿Proporcionan estos datos la evidencia suficiente que indique una diferencia


en los puntajes medios entre los métodos? Sea a= .05. 7.4 EXPERIMENTO FACTORIAL _ _ _ _ _ _ _ _ _ _~
7.3.4 La enfermera supervisora de un departamento de salud local quería analizar
el efecto de la hora del día en la duración de las visitas domiciliarias realiza- En los diseños experimentales que se han considerado hasta ahora, el interés
das por el personal de enfermería. Pensaba que !as diferencias individuales
ha recaído en los efectos de una sola variable, los tratamientos. Sin embar-
entre las enfermeras podían ser grandes, por lo que utilizó a las enfenneras
go, frecuentemente se desea estudiar simultáneamente los efectos de dos o
como un factor de formación de bloques. Recolectó además los siguientes
más variables. Las variables de interés reciben el nombre de factores. El
datos:
experimento en que se investigan dos o más factores simultáneamente se
llama experi,nento factorial.
Las diferentes categorías designadas de los factores se conocen como
Duración de la visita se~ún la hora del día
niveles. Por ejemplo, suponer que se analizan los efectos de tres dosis de
Ten1pra110 en Media Ten1pra110 en Media
E11fern1era la niaiiana cierto medicamento sobre el tiempo de reacción. Se dice que el factor
n1añana la tarde tarde medicamento ocurre en los tres niveles. Suponer que el segundo factor de
A 27 28 30 23 interés en el análisis es la edad, y se piensa que deben incluirse dos grupos
B 31 31) -,
r 21/ de edade.s de menos de 65 y de 65 años y 1nás. Por lo tanto. se tiene dos
e 35 38 34 30 niveles para el factor edad. En general. se dice que el factor A ocurre en los
D 20 18 2() I{ niveles a y el factor 8 en los niveles b.
En un experimento factorial no sólo es posible estudiar los efectos de
-1------ .fae-tere-s-i nd-i-v-ietl-a-le-s .- -s i-ne-ta-mb ié-n.--si-~x pe.rimen to __ s.e efecoí a...adecuada e-_ __
¿Proporcionan estos datos evidencia suficiente para indicar una diferencia en la mente. la interacción entre los factores. Para ilustrar el concepto de interac-
duración de las visitas domiciliarias en las diferentes horas del día'? Sea a= .05. ción, consid¿rese el siguiente ejemplo.
A11álisis de la ~·ariancia Experimento factorial 385
384
Ejemplo 7.4.1 Supóngase, en térn1inos de los efectos sobre el tiempo de re-
acción, que se conoce la verdadtra relación entre tres niveles de dosis de
cierto medicamento y la edad de las personas que toman dicho medicamen-
o
o
E

=·g
~
e 25
•O
30

20
~ · , 1:
-
Edad
o
E
30
25 ___..,
Dosis del medicamento

to. Suponer, ade1nás, que la edad ocurre en dos niveles: '~ó\'enes" (menores •e: • ~ ,s .-----:::::/'' ¡·~ ..-----::''
de 65 años) y "viejos'' (de 65 años y más). Si se conoce la verdadera rela-
ción entre estos dos factores, se conocerá, para los tres niveles de dosis, el
,o •
·g
o
~
'O ,o
5
:...-----
~~

!I'
s 20
.sug & 15
<ll 10

5
:::-----~
efecto medio sobre el tiempo de reacción de los individuos en los dos gru- a:• o o
b, b2 b;¡ .., "2
pos de edades. Supóngase que el efecto se mide en términos de la reducción
Dosis del medicamento Edad
en el tiempo de reacción a algún estímulo. Suponer que las medias son las
Figura 7.4.1. Efectos de la edad y del medicamento cuando no existe interacción.
que se muestran en la 1abla 7 .4.1.
Se deben notar las siguientes características importantes de los datos en plo, que la diferencia entre los niveles l y 2 del factor B es -5 para el grupo
la tabla 7.4.1. joven de edades y +5 para el grupo viejo de edades.
2. La diferencia entre las medias para ambos niveles del factor A no es la misma en
l. Para ambos niveles del factor A, la diferencia entre las medias para dos niveles todos los niveles del factor B. La diferencia entre las medias del factor A son de
cualesquiera del factor Bes la misma. Es decir, para ambos niveles de! factor A, -10, O y 15 para los niveles 1, 2 y 3, respectivamente, del factor B.
la diferencia entre las n1edias para los niveles 1 y 2 es 5, para los niveles 2 y 3 la 3. Las curvas de los niveles de los factores no son paralelas, como se muestra en la i.
diferencia es JO, y para los niveles 1 y 3 la diferencia es 15. figura 7.4.2.
2. Para todos los niveles del factor B. la diferencia entre las medias para los dos
niveles de! factor A es la misma. En este caso la diferencia es 5 en los tres nive- Cuando los datos de la población presentan las características que
les del factor B.
aparecen en la tabla 7 .4.2 y la figura 7 .4.2 se dice que hay interacción entre
3. Una tercera característica aparece cuando los datos se grafican como se 111uestra
los dos factores. Es importante indicar que el tipo de interacción que se :1
en la figura 4.7. l. Se observa que todas las curvas que corresponden a los distin-
muestra en este ejemplo es sólo uno de los muchos tipos de interacción que ,11
tos niveles de un factor son todas paralelas.
pueden ocurrir entre dos factores.
Cuando los datos de la población poseen las tres características men- En resumen, entonces, es posible decir que existe interacción entre dos
cionadas, se dice que no existe interacción. factores si un ca111bio en uno de los factores produc.e un can1bio en respues-
La presencia de interacción entre dos factores puede afectar las carac- ta a un nivel del otro factor diferente del que se produce en otros niveles de
11
terísticas de los datos en varias formas', dependiendo de la naturaleza de la ese factor.
1,
interacción. El efec10 de un tipo de interacción se ilustra cambiando los Las ventajas del experimento factorial incluyen las siguientes:
datos de la tabla 7.4.1 como se muestra en la tabla 7.4.2.
l. La interacción de los factores se puede estudiar.
il

Las características importantes de los datos en la tabla 7.4.2 son las
2. Se ahorra tiempo y esfuerzo.
siguientes:
En el experimento factorial todas las observaciones se pueden utilizar
l. La diferencia entre la~ medias para los ni\·elcs cualesquiera del factor B no es la
para estudiar los efectos de cada uno de los factores sujetos a estudio. La
misma para ambos ni\·eles del factor,.!\. Se observa en la tabla 7.4.2. por ejem-

Tabla 7.4.1. Reducción media del tiempo de reacción (milisegundos) de sujetos en Tabla 7.4.2. Datos de la tabla 7.4.1 ,nodificados para mos1rar el efecto de un tipo
de interacción
dos grupos de edades en dos dosis de un medicamento
Factor B - Dosis del medicamento Factor B - Dosis del n1edicamento
Factor A - Edad 1• J = '.! ) = 3
Factor A - Edad J • J = '.! } "" 3

Jóvenes (i = 1) 5 10 20 Jóvenes (i = 1) µ" J µI:! JI) µ¡J 20


µ" µ.,11 µ¡·1
Viejos (i = 2J 1.-, µ,,,, JI) I-L2:1 o
Viejos (i :: 2¡ µ.~ 1 JI) µ.:!\/ 15 µ.11:1 25 µ:!I
¡[ 386 Análisis de la variancia Experimento factorial 387

5<
o~ o
~ e

25 Edad
~

fü e
30
25
Un arreglo factorial se puede estudiar con cualquiera de los diseños que
se han explicado. El análisis de un experimento factorial por medio de un

:::><:"'
,.;::;: ,o :.::; ·O
-w ·oo 20 iii "9 20 diseño completamente aleatorizado para dos factores se ilustra a conti-
Uw medicamento
~ i• 15 C CD 15 b,
•O •O • nuación:
·g ~ 10
Bi 10 b,
a 5 a Los resultados de un diseño completa1nente aleatorizado de dos factores
u u 5

,, "' a:•
w b, puede presentarse en forma tabular, como se muestra en la tabla 7 .4.3.
a: o ,, ,, o
"• ", En esta tabla se tienen a niveles para el factor A, b niveles para el factor
Dosis del medicamento Edad B y n observaciones para cada combinación de niveles. Cada una de las ab
Figura 7.4.2. Efectos de la edad y del medicamcnlo cuando hay interacción. combinaciones de los niveles de un factor A con los niveles de un factor B
se consideran como un tratamiento. Además de los totales y medias que se
alternativa, cuando se investiga dos factores, sería efectuar que experimen- muestran en la tabla 7 .4.3, es posible apreciar que el total y la media de la
tos diferentes, uno para estudiar cada uno de los dos factores. Si se hiciera
esto. algunas de las observaciones proporcionarían información sólo de uno
ii-ésima
J
celda son, respectivamente, T,;;, = k=i x,,,, y X--= T .. In. El subíndice i
1 , IJ lf·
de los factores y el resto proporcionaría información únicamente del otro va de 1 a a y j va de I a b. El total de ·observaciones es nab.
factor. Para lograr el nivel de exactitud del experimento factorial, se necesi- Para mostrar que la tabla 7 .4.3 representa datos de un diseño completa-
tarían más unidades experimentales si los factores fueran estudiados a tra- mente aleatorizado, se considera que cada co,nbinación de niveles de fac-
vés de dos experimentos. Por lo tanto, se aprecia que un experimento de dos tores es un tratamiento y que se cuenta con n· observaciones para cada tra-
factores es más accesible que dos experimentos de un factor. tamiento. Un arreglo alternativo de los datos se obtendría numerando las ob-
servaciones de cada tratamiento en una columna separada. La tabla 7.4.3
3. Dado que los diversos factores se combinan en un experimento, el resultado también se puede utilizar para presentar los datos de un diseño de bloques
tiene un campo de aplícación más amplio. aleatorizado de dos factores, si se considera la primera observación en cada
celda como parte del bloque l, la segunda observación en cada celda como
parte del bloque 2 y así sucesivamente, hasta la n-ésima observacióA en
Tabla 7.4.3. Tabla de datos n1uestralcs de un experimento completamente cada celda, la cual se considera como parte del bloque n.
aleatorizado de dos factores Es importante notar la similitud entre los datos para el experimento facto-
FACTOR B rial, anotados en la· tabla 7 .4.3 y los datos del bloque completo aleatorizado de
Factor A e ¡, la tabla 7 .3.1. Para que el experimentador pueda probar que e:X.iste interac-
Totales Medias
ción, el experimento factorial requiere de al menos dos observaciones por
.\'11 r .\'l'..'I .\'11,1 celda, mientras que el diseño de bloque completo aleatorizado sólo requiere
TI _\ 1 de una observación por celda. Se utiliza el análisis de variancia bilateral para
X .\ l"..!n _\ ¡¡,,,
" analizar los datos de un experimento factorial del tipo que se presenta aquí.
2 X'..'I ! .\:.!'..'I .\'..'Id
T.,
.\.. 1 Ejemplo 7.4.2 En un análisis del tiempo invertido en visitas domiciliarias
.\:.! ¡,, .\",.!",.!,. .\''..',,,,
individuales por enfermeras de salud pública, se obtuvieron datos de la
duración de la visita, en minutos, para una muestra de 80 enfermeras. Tam-
a .\'"¡¡ .\',,'..'! .\',,¡,¡ bién se registró la edad de cada una de las enfermeras y el tipo de enfer-
1:, .\., 1 medad de cada paciente visitado. Los investigadores querían obtener, a par-
x,,1,, ·\,:.!,, -\,,¡.,,
tir de su inyestigación, respuestas a las siguientes preguntas:
--Tofüles T., T., T,, T
Medias l. ¿El tic1npo n1cdio de visita difiere entre los diferentes grupos de edad de enfer-
_\ ¡ .\:.! .\_¡, _\ meras'!
Análisis de la variancia Experimento factorial 389
388
2. ¿_El tipo de paciente iníluye en el tiempo medio de visita? Tabla 7.4.4. Duración -de la visita do1niciliaria en minutos realizada por enfer-
3. ~.Hay interacción entre las edades de las enfermeras y el tipo de paciente? meras de salud pública por grupos de las edades de la enfermeras y tipo de paciente
Niveles del Factor B (grupo de las
Solución edades de la enfermeras)
Niveles del
I 2 3 4
l. Datos. Los datos acerca de la duración de la visita domiciliaria que se obtu- Factor A (tipo (20a (30a (40a (50"
vieron durante el análisis se muestran en la tabla 7.4.4. de paciente) 39) 49) 111ái)
Torales Medias
29)
2. Suposiciones. Para analizar estos datos, se supone un modelo de efectos fijos y 28
l (cardiacos) 20 25 24
un diseño completamente aleatorizado para dos factores. 31
25 30 28
22 29 24 26 534 26.70
Modelo El modelo de efectos fijos para el diseño completamente aleato- 27 28 25 29
rizado de dos factores se escribe como 21 30 30 32

2 (con cáncer) 30 30 39 40
x,11¡ = µ + a, + 13, + (c:v.j3),1 + *
l',1
(7 .4.1) 45 29 42 45
j = l. 2..... b; k = l, 2 .... , n 30 31 36 50 765 38.25
i = 1, 2.... , a:
35 30 42 45
36 30 40 60
donde xijk es una observación representativa, µ es Una constante, a repre-
senta el efecto debido al factor A,~ representa un efecto debido al factor B, 3 (con enfermedad 31 32 41 42
cardiovascular) 30 35 45 50
(a~~) representa un efecto debido a la interacción de los factores A y B, y 38.30
40 30 40 40 766
eíjk representa el error experimental.
35 40 40 55
30 30 35 45

Suposiciones para el modelo 4 Tuberculosis 20 23 24 29


21 25 25 30
28 30 28 509 25.45
a. Las observaciones en cada una de las ab celdas constituyen una muestra 20
aleatoria independiente de tamañcf 11, extraída de una población definida por 20 30 26 n
la combinación particular de los niveles de los dos factores. En el ejemplo. 19 31 23 30
se tiene una n1uestra de 16 pohlaciones. 557 596 659 762 2574
Totales
b. Cada una de las ab poblaciones sigue una distribución normal.
2i .8 e 29.8 32.95 38.10 32.18
c. Todas las poblaciones tienen la misma variancia. Med· "º
3. Hipótesis. Se pueden probar las siguientes hipótesis: a1 b 1 a2b'l a:i.b 3 a'lb 4
Celda a 1 b1 a 1 b1 a 1 b:, ª1b4
Totales 13 l 146 176 ISO 199 240
HA: no todas las a¡:::: O 115 142
Medias 28.4 26.2 29.2 35.2 30.0 39.8 48.0
HA: no todas las ~j:::: O 23.0
HA: no todas las (a~)ij == O a 4b¡ a~b 2 04b'J a~b 4
Celda 0:1b1 ª:\b"l ª:1h:, ª:,b4
Seaa=.05 144
16i 20! 232 100 I3i 128
Totales 166
Antes de recolectar los datos, los investigadores probablemente deci- 3:t4 40.2 46.4 20.0 27.4 25.6 28.8
Medias 33.2
dan probar sólo una de las hipótesis posibles. En este caso seleccionan la
hipótesis que prefieran, eligen un nivel de significación a., y proceden en
la fonna sencilla ya conocida. Este procedimiento no ofrece las complica-
Análisis de la )'ariancia Experimento factorial 391
390
o b o
ciones que podrían aparecer si los investigadores quisieran probar todas las a b "

hipótesis. L L L (x,¡,
i= lj= l k.= l
i _)2 í: í: í: (<;
i= !j= 1 "-"' l
i )2

Cuando se· prueban las tres hipótesis, la situación se complica por el


" b o
hecho de que las tres pruebas no son independientes en el sentido de la
probabilidad. Si a es el nivel de significación asociado a la prueba como un
+ í: í: í: (,,, - ,,f
i=lj=IA=! (7.4.3)
todo, y a:, a", a'" son los niveles de significación asociados con las hipóte·
sis l, 2 y 3, respectivamente, KimbalJ.4 5 demostró que o bien
sc,o,al = scrrat. + seresidual (7.4.4)
a< 1 - (1 - a')(! - a")(! - a"') (7.4.2) La suma de cuadrados para los tratamientos puede seccionarse ·en tres términos
como sigue:
Si a'= a"= a"'= .05, entonces a< 1 -(.95) 3, o a< .143. Esto signifi· " b o " b o
ca que la probabilidad de rechazar una o más de las tres hipótesis es un í: í: í: (i; x )' í: í: ¿(,.
i=tj=lh=I
i. )2
i=l1=lk=I
poco menor que .143 cuando se elige un nivel de significación de .05 para
" b o
las hipótesis y todas son verdaderas. Para demostrar el procedimiento de
prueba de hipótesis para cada caso, se efectúan "tres pruebas. Sin embargo, + L L Í:U'¡
,= lj"" ¡ A= 1
i )2

el lector debe enterarse de los problemas que implica la interpretación de


resultados. El problema se estudia en Dixon y Massey 46 y en Guenther. 47 " b o

Para el ejemplo, es posible probar las siguientes hipótesis sujetas a las + í: í: í: (x,
i--' Jj= l A= 1
- .. -
x, . + X- .. )'
Xi
(7.4.5)
condiciones que se mencionan arriba.
o bien
a. H 0 : a 1 = a'..! = ª:1 = a 4 = O
H. 4 : no todas las a,.= O se,,,,. = SCA + SCB + SCAB
b. H 0 :l31 = 13'..! == 13:1 = 13, = O
HA: no todas las .B, = O Las fónnulas de cálculo para varios componentes son como sigue:
c. H 0 : todas las (ex~);¡= O
" b o
HA: no todas las (aj3)ij = O
Let a. = .05 sclotal""' ¿ ¿ Lxfjl, -e
i=lj=lft,,,¡ (7,4.6)
" b

4. Estadística de prueba. La estadística de prueba para cada conjunto de hipótesis


°" °" T'
L.; L.;
¡__, lj=\
•J·
- e
sc,rar. = ---
(7.4.7)
es la R.V. n
S. Distribución de la estadística de prueba. Cuando H0 es verdadera y se cumple seresidual= sc/(l[a[- sctrat. (7.4.8)
con las suposiciones, cada una de las estadísticas de prueba sigue una distribu- "
ción F. LTi
SCA = !..:.._l______ - C
6. Regla de decisión. Se rechaza H0 si el valor calculado de la estadística de prueba bn (7.4,9)
es mayor o igual que el valor crítico de F. b

7. Cálculo de la estadística de prueba. Mediante una adaptación del procedimiento


1
°"-,
L., T'·l
e
usado al dividir la suma total de cuadrados para e! diseño completamente alea-
- SCB
- = --~
------.in --- - .. ---------f-'1-.4-,IOJ-- -
- - -----------wrizadu---se-puetleoemostrar que la suma total de cuadrados bajo el presente
modelo puede dividirse en dos ténninos como sigue:
Análisis de la variancia Experimento factorial 393
392
y Tabla 7.4.6. Tabla ANOVA para el ejemplo 7.4.2.

SeAB = Se,,m - SeA - SeB (7.4.11) Fuente se g. l. CM R.V.

A 2992.45 3 997.48 67.95


En las ecuaciones anteriores
B 1201.05 3 400.35 27.27

f ,=±I x,,,)'/alm AB 608.45 9 67.61 4.61


C = ( Tratamientos 4801.95 15
(7.4.12) 939.60 64 14.68
i= 1 1 """' 1 Residual

Para el ejemplo, se tiene que Total 5741.55 79

Tabla ANOVA En general, los resultados de los cálculos para el modelo de


e= (2574)'/80 = 82818.45 efectos fijos en un experimento completamente aleatorizado de dos factores
2 se pueden exponer como se muestra en la tabla 7 .4.5.
sctotal = (20 + 25 2 + ... + 30 2 ) - 82818.45 = 5741.55
Los resultados para el ejemplo se muestran en la tabla 7 .4.6
p2 2 'I
11
se, , = ., + 142 + · · · + 144 - - s2s1S.45 = 4801.95
ra. 5 S. Decisión estadísticu. Si se cumplen las suposiciones establecidas al principio, y si
cada hipótesis es verdadera, puede demostrarse que cada una de las relaciones de
534' + 765 2 + 7662 + 509 2 variancia anotadas en la tabla 7.4.5 sigue una distribución F con los grados de li·
SeA = - 82818.45 = 2992.45
20 bertad indicados. Los valores críticos de F para probar las tres hip61esis del ejem·
plo son 2.76, 2.76 y 2.04, respectivamente. Puesto que los grados de. libertad del 1
2 2 2 2 1
557 + 596 + 659 + 762 denominador iguales a 64 no aparecen en la tabla G, se utiliza 60 como grados ¡
SeB = - 82818.45 = 1201.05
20 de libertad en el denominador. Se aprecia que cada una de las tres hipótesis se 1:
, ¡:
rechaza a un nivel de significación de .05. El lector debe advertir nuevamente
SeAB = 4801.95 - 2992.45 1201.05 608.45 que, si las tres pruebas se hacen simultáneamente, la probabilidad dÍ! rechazar al i
'I
menos una hipótesis cuando todas son verdaderas es un poco mayor que .05. De
scresidual = 5 7 41.55 4801.95 939.60
acuerdo a las hipótesis establecidas en el caso 3, se tiene que p 1 < .005, p 2 <
.,i
.005 y p 3 < .005.
9. Conclusión. Cuando se rechaza H0 : a. 1 = a. 2 = a. 3 :: a.4 , se concluye que existen 1
'fabla 7.4.5. Tabla de análisis de variancia para un experimento co1npletamente diferencias entre los niveles de A, es decir, en el tiempo promedio empleado en
a\eatorizado de dos factores (modelo de efectos fijos) las visitas domiciliarias con diferentes tipos de pacientes. De forma análoga,
11
cuando se rechiiza H 0 : ~ 1 = ~2 = ~3 = ~4 se concluye que existen diferencias
Fuente se g.1. CM R.V. entre los niveles de B, o diferencias en el tiempo promedio empleado en las visi·
1 CMA =SCA/ tas domiciliarias entre las diferentes enfermeras cuando se agrupan por edades.
A sct:llíre a - CMA/CM,esiduui
(a - 1) Cuando se rechaza H : (a~)r =Ose concluye que)os factores A y B interactúan;
0
B SCB b - 1 CMB = SCB/ CM BICM residual es decir, combinaciones difbrentes de los niveles de los dos factores producen
(b - 1) diferentes efectos. Cuando la hipótesis de no interacción se rechaza, el interés en
AB CMAB =SCABI A/SAB I .\lSE
SCAB (a-l)(b-1)
(a - l )(b - 1)
los niveles de los factores A y B, por lo general. se subordina al interés por los
efectos de la interacción. En otras palabras, existe más interés por saber qué com-
li
Tratamientos sc1n,1. ab - binaciones de los niveles son significativamente distintas.
Residual ab(11 - 1) CMresidual= 11
sc,esidua/
sc,esidua/
Hasta ahora, sólo se ha rrs.tacio el caso donde el número de observa- li
ab(n - 1)
ciones en cada celda es el mismo. Cuando el número de observaciones por
Total sc101111 abll - 1 celda no es el mismo para todas las celdas, el análisis se hace más compli-
394 Análisis de la varia11cia Ejercicios 395
cado. Muchos de los libros citados cubren el análisis correspondiente a tales mientos experimentales. Se identificó a las madres pertenecientes a tres gru-
situaciones. por lo que se sugiere que el lector los consulte para mayor pos socioeconómicos. Después de la consulta, cada una de las madres fueron
información. entrevistadas por un segundo equipo de especialistas, quienes asignaron a
cada una de ellas una calificación para 1nedir su nivel de comprensión de las
instrucciones de cuidado de sus niños, proporcionadas por el primer equipo.
Se obtuvieron los siguientes resultados.
EJERCICIOS~~~~~~~~~~~~~~~~~~

Para cada uno de los siguientes ejercicios. llevar a cabo el análisis de variancias, Método de consulta
Grupo socio-
probar la hipótesis correspondiente con e! nivel de significación que se indica y calcu-
econóniico Rutina A B
lar el valor p asociado a cada prueba.
56 46 47 28 28 42
1 29 33 28 30
7.4.1 En una clínica de tratamiento para retardados mentales se llevó a cabo un 53 42
experimento para comparar tres métodos de enseñanza básica de capacita-
51 21 59 47 68 75
ción en cuidado personal y tres n1étodos diferentes de recompensa. A! final 11 27 45
36 53 77 84
de! periodo experimenta!, cada individuo efectuó un examen para medir el
grado en que aprendió. Los resultados se muestran en la siguiente tabla. 45 41 55 71 44 68
lll 37 76 85
31 77 76
~té.todos
Reconzpensas A B e a. Efectuar un análisis de variancia con estos datos y probar las tres hipóte-
52 58 58 sis posibles. Sea a'= .O 1, a"= .05, a"'= .01.
76 56 24 b. ¿Cuál es la magnitud de a, el nivel de significación para la prueba como
Ninguna
60 68 32 un todo?
58 74 39
60 60 56
1 7.4.3 En un análisis de los efectos de diferentes dietas y terapias de grupo para ayu-
dar a personas con sobrepeso a adelgazar, un investigador utilizó 40 mujeres
Elogio 78 70 66 con sobrepeso. quienes fueron cuidadosamente agrupadas en relación con
75 74 54 todas las variables pertinentes posibles, como la edad, peso inicial y condición
72 77 49 física. Las personas fueron agrupadas al azar en 4 grupos de 10. y cada grupo
98 76 12
94 80 74 Dieta
Tangible
96 84 76 Terapia de grupo 111
11 IV
98 80 70
15 25 19 22
a. Llevar a cabo un análisis de variancia de estos datos y probar que la hipóte- 12 19 24 22
sis que indica que el efecto de la recompensa es igual a cero, Jo mismo que Sí 18 21 18 18
el efecto de los tratamientos y de la interacción. Sea a'= a"= a'"= .01. 16 22 16 19
13 19 21 15
b. ¿Cuál es la magnitud de a, el nivel de significación para la prueba como
un todo? 9 13 13 33
7.4.2 Un equipo de salud mental en un departamento de salud local. realizó un 9 15 13 30
estudio acerca de la comprensión de las n1aQres respecto a las instrucciones. ---1 - ~-l>l-0-- - - - l-3-----1-2 --- -Sl---
que recibían sobre el cuidado de sus hijos después de ser atendidos en una 7 15 18 27
clínica de evaluación y diagnóstico de salud mental. Se co1npararon tres 9 12 15 28
1nétodos de consulta: el procedimiento de consulta rutinaria y dos procedí-
396 Análisis de la variancia Temas diversos 397
P.rogranza
se sujetó a una dieta diferente. Cada grupo, además, se dividió aleatoriamente Tratamiento psiquiátrico
en dos grupos. Uno de estos dos grupos participó en una sesión de terapia de de terapia
!isica A B e D
grupo dos veces por semana, mientras que el otro grupo no participó. Al ter-
minar el periodo experimental, el total de peso perdido por persona se muestra 11.0 9.4 12.5 13.2
en la tabla anterior. Efectuar un análisis de variancia con estos datos y probar 9.6 9.6 11.5 13.2
las tres hipótesis posibles. Sea a'= a" =a'"= .05. 10.8 9.6 10.5 13.5
7.4.4 Se llevó a cabo un análisis para comparar la eficiencia de tres medicamentos
para retardar el tiempo de reacción de animales experimentales ante ciertos 10.5 10.8 10.5 15.0
estímulos. Animales de la misma camada fueron adiestrados para responder 11 11.5 10.5 11.8 14.6
al estímulo mediante tres métodos diferentes y se usaron tres animales para 12.0 10.5 11.5 14.0
cada combinación de método y medicamento. La siguiente tabla muestra el
tiempo de respuesta en segundos después de la administración del medica- 12.0 11.5 11.8 12.8
mento. 111 1 1.5 11.5 J 1.8 13.7
11.8 12.3 12.3 13. l

l 1.5 9.4 13.7 14.0


I\tedicamento
IV l l.8 9.1 13.5 15.0
Método de e11trenan1ie11to A B e 10.5 10.8 1·)•. o• 14.0
5 8 10
8 8 12 11.0 11.2 14.4 13.0
i 10 \' 11.2 11 B 14.2 14.2
10
!O.O 10.2 ¡3.5 13.i
6 10 15
11 8 12 14 I l.:! 10.8 11.5 11.8
6 11 14 n 10.8 l l.5 10.2 12.8
11.8 10.2 11.5 12.0
i 12 16
III 8 12 16 ¿Es posible concluir con base en estos datos que los diferentes programas de
10 14 18 tratamiento psiquiátrico tienen diferentes efectos? ¿Es posible concluir que
los programas de terapia física difieren en cuanto a efectividad? ¿Es posible
concluir que existe interacción entre los programas de tratamiento psiquiátri-
Llevar. a cabo un análisis de variancia con estos datos y probar las tres co y los de terapia física? Sea a= .05 para cada prueba.
hipótesis. Sea a'= a" =a"'= .05.

7.4.5 Un grupo de investigadores en un centro de traumatología quieren desarrollar 7.5 TEMAS D I V E R S O S - - - - - - - - - - - - - -


un programa para ayudar a víctimas de daño cerebral por·uaumatismo a
recuperar un nivel aceptable de independencia. Se llevó a cabo un experi- Un texto general de introducción no puede empezar por cubrir todos los
n1ento en el que intervinieron 72 individuos con el mismo grado de daño aspectos de cada tema relacionado. Aunque en este capítulo, por ejemplo, se
cerebral. El objetivo fue comparar las combinaciones diferentes de trata-
cubre la mayoría de los conceptos de análisis de· \'ariancias, muchos temas
mientos psiquiátricos y terapia física. A cada individuo se le asignó una de
no se estudian por cuestión de breYedad. Para proporcionar cierto conoci-
las 24 combinaciones de cuatro tipos de tratamiento psiquiátrico y 6 progra-
mas de terapia física. Habían tres individuos en cada combinación. La varia- miento de algunos de los problemas que se puede encontrar Y de algunos
ble de respl~csta es el número de n1eses transcurridos entre el inicio de la te- análisis adicionales que son factibles para el análisis de variancias, se co·
rapia y el tiempo en el que el paciente fue capaz de \'alerse por sí mismo. Los mentan algunos tópicos importantes aquí. Para mayor información, consul-
resultados son los siguientes. tar los textos sobre diseño experimental y análisis de \'ariancias que se
1
398 Análisis de la variancia Temas diversos 399
encuentran en la sección de referencias bibliográficas. Muchos contienen Transformaciones Ocasionalmente, las suposiciones que fundamentan el
información más completa de uno o más de estos temas. análisis de variancia no se cumplen en los datos. Cuando esto sucede, un
procedimiento alternativo es realizar una transfonnación de datos, de modo
Datos faltantes Aun cuando un experimento puede llevarse a cabo con el que se cumplan las suposiciones con más aproximación. Una transfor,na-
mayor de los cuidados, pueden ocurrir accidentes que conduzcan a la falta ción se refiere a un cambio en la escala de medición.
de algunas de las observaciones cuando llega el momento de realizar el Tres objetivos frecuentes en el uso de la transformación son hacer que
análisis. Puede haber observaciones fa!tantes en experimentos con animales la variancia sea independiente de la media, lograr la normalidad y lograr la
si alguno muere. En experimentos relacionados con seres humanos, un indi- aditividad de efectos (eliminar la interacción). Por lo general, una sola
viduo puede estar incapacitado para participar en el experimento debido a 1ransformación logra dos o más objetivos simultáneamente. Algunas de las
una enfermedad. En experimentos de laboratorio pueden destruirse cultivos transformaciones de mayor uso son las siguientes:
y soluciones como resultado de un accidente. Un experimento puede con-
cluirse sin contratiempos, pero algunos de los resultados registrados se pue- t. Tra11sfon11ació11 logaríunica. Cuando se utiliza esta transfonnación, se toman
los logaritmos (generaln1ente logaritmos comunes) de las mediaciones. Se uti-
den perder o destruir.
liza esta transformación cuando la media está correlacionada positivamente con
En general, es posible seguir uno de tres procedimientos cuando faltan
la variancia.
datos: 2. Tran:,,fornraciún de la raíz cuadrada. Con esta transformación se toman las
raíces cuadradas de las mediciones, se utiliza cuando los datos consisten en con-
l. En algunos casos, es posible proceder con el análisís en la forma habitual. Por teos, como el número de muertes que ocurren en varios grupos de animales de
ejen1plo, si en un diseño de bloques con1ple1os aleatorizados falta un b_]oque laboratorio. Cuando se encuentran conteos de cero, se agrega .5 a cada conteo
completo o bien un tratamiento completo, es posible llevar a cabo el análisis antes de obtener la raíz cuadrada.
habitual sobre los datos restantes, siempre que queden al menos dos bloques y 3. Tran:,,fonnación del ángulo seno. Esta transfonnación se utiliza cuando los datos
dos tratamientos. son proporciones o porcentajes. La transforn1ación da 9 = angsen ..fp, donde 9 es
2. Es posible utilizar los datos restantes por medio de métodos adecuados para el la media transformada y p la media origina!.
caso de números distintos de subclases. Estos proccdin1ientos, que son más com- 4. Tra11:,,fon11ación recíprocc1. Cuando la vnriancia crece como la cuarta potencia
plejos que los métodos que se presentan en este capítulo. pueden consultarse en de la media, se puede utilizar la transfom1ación recíproca. Cada observación ori-
algunas de las obras de referencia. ginal, 9, se reeinplaza por su recíproco, 1 I 9.
3. Sin embargo, por lo general es preferible estimar los datos faltantcs. Se utiliza,
por lo general, uno de dos métodos para este propósito. En muchos de los libros de texto de estadística general y diseño experi-
mental mencionados anteriormente se estudian las transformaciones. Ade-
Uno de los métodos comprende la estimación de los valores faltantes, más, el tema se estudia con más detalle en los libros escritos por Que-
de modo que la suma de cuadrados de error experimental se minimiza cuan- nouille,52 Sokal y Roh!P-' y Pearce, 5-1 y en un artículo de Bartlett. 55 Federer7
do se lleva a cabo el análisis habitual. Una desventaja de este método es que proporciona algunas otras referencias.
conduce a una suma de cuadrados de los tratamientos sesgada que debe co-
rregirse. Ostle y Malone 4 8 dan ejemplos numéricos de este método. Los ..\lternatiYas no paramétricas Un procedimiento alternativo que se puede
valores faltantes se estiman frecuentemente por medio de una técnica cono- seguir cuando las suposiciones para el análisis de variancia no se cumplen.
cida como análisis de covariancia. Una ventaja que ofrece el uso de este es el método 110 para1111!rrico de análisis. Estos n1étodos. en general. se tstu~
análisis es que proporciona una suma de cuadrados del tratamiento insesga- dian con mayor detalle en el capítulo 11, donde se dan alternativas no
da al igual que una suma residual de cuadrados mínima. Ejemplos de la paramétricas apropiadas para alguno de los diseños experimentales ya estu-
aplicación de este método se encuentran en Steel y Torris.22 En Federer7 se diados.
encuentra una extensa bibliografia_acerca deL..ternn dt! los dams-fukances.~~-~~~-~~~---~~~---~~·-~-~-~--·~-~ .-~-
·~~-·~~~~-

Algunas referencias que no cita Federer son los artículos de G]enn y Kra- Eficiencia Generalmente es i1nportante conocer cuánta mejora puede
mer,49 Kramer y Glass,50 y Baird y Kramer.51 esperarse en el experimento mediante el uso di;;: un tipo di;;: diseño en luga~
Análisis de la variancia Preguntas y ejercicios de repaso 401
400
de otro. Por ejemplo, el investigador puede preguntarse si vale la pena uti- 4. Dise,lo de parcelas dil·ididas. El diseiio de parcelas dil·ididus es un tipo espe-
lizar un diseño de bloques completos aleatorizados en lugar de un diseño cial de diseño de bloque incon1pleto que suele utilizarse en experimentos fac-
completamente aleatorizado. Inclusive, si no es posible o conveniente elegir toriales. Se aplican niveles de uno o más fac\ores a las parcelas con1pletas que
entre varios diseños, el investigador probablemente quiere investigar las se dividen en subparcelas. a las cuales se aplican los niveles de uno o más fac-
ventajas de aumentar el tamaño de la muestra o el número de muestras. Las tores adicionales.
comparaciones de este tipo se evalúan con base en la eficiencia o eficiencia
relativa. Básicamente, la eficiencia se calcula como la relación de las va-
riancias que resultan del uso de los diseños que son comparados y por lo 7.6 RESUMEN _ _ _ _ _ _ _ _ _ _ _ _ _ _ __
general se expresan corno porcentajes. Un estudio más completo se puede
encontrar en Cochran y Cox, 4 Steel y Torrie, 22 Scheffe, 34 Ostle y Malone48 El objetivo de este capítulo es presentar al estudiante las ideas y técnicas
y Sokal y Rohlf.53 básicas del análisis de variancias. Se incluye un análisis detallado de dos
Otros diseños Los dos diseños experimentales que se consideran en este tipos de diseño, el completamente aleatorizado y el de bloques completos
capítulo no son los únicos que se pueden utilizar. La condensación necesaria aleatorizados. También se presenta el concepto de experimento factorial y
en un libro de texto de introducción general no permite que se traten en cómo se utiliza con el diseño completamente aleatorizado. Algunos temas
forma más completa los diseños que se encuentran con mayor frecuencia. El adicionales se estudian brevemente y quienes deseen continuar con cual-
lector que quiera investigar las posibilidades debe consultar los textos de quier aspecto del análisis de variancia encontrará una bibliografía muy útil
56
diseño experimental que se mencionan en la bibliografía. Los diseños adi- al final del capítulo. La extensa bibliografía de Herzberg y Cox indica
cionales que se estudian en esos libros incluyen los siguientes. más lecturas.

l. Diseiio de cuadrado latino. Cuando es posible, y conveniente, identificar y ais-


lar dos fuentes extrañas de variación en un experimento, se puede en1plear una
extensión del diseño de bloques completos aleatorizatlos conocido como di- PREGUNTAS Y EJERCICIOS DE R E P A S O - - - - - - - -
se/lo de cuadrado latino. El término "cuadrado lalino .. se utilizó por primera
vez en un contexto de análisis de variancia por R. A. Fisher,41 quien lo ton1ó l. Definir el concepto de análisis de variancia.
del matemático suizo Leonhard Euler ( 1707-1783 ). 2. Para cada uno de los siguientes diseños. describir una situación en un campo de
En el diseño de cuadrado latino se asigna una de las fuentes de variación interés particular donde el diseño pueda ser un diseño experimental adecuado.
extraña a las columnas del cuadrado; la segunda fuente de variación extraña se Utilizar datos reales o ficticios y efectuar el análisis de variancia pertinente
asigna a los renglones del cuadrado; por último, los tratamientos, que por !o para cada uno.
general se designan n1ediante letras latinas, se asignan de tal forma ·que cada a) Diseño completamente aleatorizado.
tratamiento ocurra una vez, y sólo una vez, en cada renglón y en cada columna. b) Diseño de bloques completos aleatorizados.
El ni.ímero de renglones, columnas y tratamientos es igual en todos los casos. c) Diseño completamente aleatorizado con un experimento factorial.
2. Diseiío de cuadrado grecolatino. Ésta es una extensión del diseño del cuadrado
latino que permite la identificación y el aislamiento de tres fuentes extrañas de 3, Se midió la frecuencia cardiaca (latidos por minuto) en cuatro grupos de adul-
variación. Este diseño toma su nombre del hecho de que otra variable, repre- tos; controles normales (A), pacientes con angina (B). individuos hipersensi-
sentada por letras griegas. se sobrepone a las letras la1inas (tratamientos¡ de un bles {C) y pacientes recuperados de infarto del miocardio (D). Los resultados
.:::uadrado !atino, de modo que cada letra griega ocurre una vez en cada ren- son los siguientes:
glón, una vez en cada columna y una vez con cada letra latina.
3. Diseiio de bloque inconipleto. Si debe incluirse un gran número de tratamientos
en un experi1nento. tal \·ez no sea posible en1plear el diseño de bloques con1- ,
.. B e D
pletos a!eatorizados. Una alternativa es íncluir en un bloque sólo una parte del fil
83 81 75
tratamiento. Los bloques que resultan de este proccdin1iento se conocen como 75
fil fi5 68
bloques incon1pletos. 78
81) 77 HU
-----
402 Análisis de la variancia Preguntas y ejercicios de repaso 403

A B <: J) Nivel de exposición


63 87 80 80 Aninial Bajo Moderado Alto
67 95 74 68 1 36 43 4:l
89 89 78 65 2 33 38 39
71 10,1 69 68 3 35 41 '.'\:~
73 89 72 69 4 3.¡
39 ]9
70 78 76 711 5 41 28 :t~
66 83 75 79 6 41 44 26
57 91 69 61 7 44 30 3()
8 45 31 29

¿Proporcionan estos datos la suficiente evidencia para indicar una diferencia


en la frecuencia cardiaca media entre esos cuatro tipos de pacientes? Sea a = Con base en estos datos, ¿es posible Concluir que los tres niveles de exposi-
.05. Detenninar el valor p. ción, en promedio, tienen un efecto diferente sobre la frecuencia respiratoria?
Sea a =.05. Determinar el valor p.
4. Se eligieron muestras aleatorias de cada uno de tres tipos de individuos: em-
pleados de una fábrica de plaguicidas con un alto grado de exposición, 6. Se efectúo un experimento para analizar los efectos de tres medicamentos dis-
agricultores expuestos al plaguicida por varias semanas cada año, y personas tintos y tres tipos de situaciones de tensión nerviosa causantes de ansiedad en
sin exposición conocida al plaguicida. Se efectuaron determinaciones de adolescentes. La siguiente tabla muestra la diferencia entre los registros antes
acetilcolinesterasa en muestras de sangre de cada persona con los siguientes y después del tratamiento de 18 personas que participaron en el experimento.
resultados:

Enipleados Granjeros No expuestos Situación Medicamento


de tensión (Factor B)
6.4 6.5 7.'.1
6.6 (.!__actor A) A B e
6.8 7.5
6.8 7.0 7.8 4 1
6.9 7.1 7.9 5 3 o
9.5 9.7 10.8
6.1 6.2 6.9 6 6 6
11
7.5 7.7 8.5 6 6 3
8.2 8.-! 9.--l
4.1 5 7 4
--1.2 .f.0 111
5.5 4 4 5
5.6 ti.:\

¿Proporcionan estos datos la evidencia suficiente que indique una diferencia, Efectuar un análisis de variancia de estos datos y probar las tres hipótesis posi-
en promedio, entre los tres grupos? Sea a= .05. Determinar el valor p. bles. Sea a'= a"= a"'= .05. Determinar los valores p.

---- - - --------S: -Se-mt-dt6-1a trecuen-c:1a resp1rJJona (respiraciones por nunuto) en ocho a:n,ma es · -----',.--1.,-1rsi"gaiem:e-ta:bta1rraestraius.esuttados-de-madurez---em-ee-i0n-al-de-2-7-afütl-tes-- - - - -
de laboratorio en tres niveles de exposición a! monóxido de· carbono. Los re- jóvenes de sexo masculino clasificados por edad y grado de cvnsumo de mari-
sultados son tos siguientes: huana.
Preguntas y ejercicios de repaso 405
404 Análisis de la variancia 1 '<!
Medicamentos
Uso de la mariguana (Factor B)
Edad !11dú·id110 w X y z
( Factor A) N1111ca Ocasiona/111e11te Diaria111e11re
A 1.5 1.8 l. 7 J.Y
25 18 17
B 1.4 1.4 1.3 l.:"J
15-19 28 23 24
19 I~
e 1.8 1.6 1.5 1.9
22 1.3 1.2 1.2 1.4
D
E 2.0 2.1 2.2 2.3
28 !() 18
F 1.1 1.0 1.0 1.2
20-2--1 :12 2.J. 22
1.5 1.6 1.5 I.7
30 20 20 1 G
H l.5 1.5 1.5 l. 7
I ti 1 1.2 l.() 1.3 1.5
25 14
25-29 '.{:'>
:{O
16
15 12
8 1 J 1.5 1.6 1.6 1.9

¿Es posible concluir con base en estos datos que los medicamentos tienen dife-
Efectuar un análisis de la variancia de estos datos. Sea a'= a"= a'"= .05. rentes efectos? Sea a= .05. e!,

Calcular los valores p. ¡¡


10. Las determinaciones de la aldolasa en el suero de tres muestras de niños dieron
:1
8. Los siguientes valores son las cantidades de cierto con1puesto químico presente los siguientes resultados:
:]¡
en una cantidad unifonne de tejido de 25 animales de laboratorio, de cuatro
especies distintas. Probar la hipótesis nula que indica que, en promedio, las Individuos con Individuos !
cuatro especies contienen la n1isma cantidad del compuesto químico y probar distrofia 111usc11- con li
que existe una diferencia significat!\·a entre todas las parejas posibles de ine- Conrroles lar prógresiva po!io111ielitis I'.,
dias muestrales. Sea a= .05. 14.00 1.50
.30
.30 5.JO 1.10
Especies .30 12.00 .80
.40 7.10 1.30
:1 4

65.7
'
! 86. 7 H(i.X 1:~~). [
.40 8.00
4.20
.90
.60
.40
70.'.l 1'ili.O 102.ti J .j 7.:1 6.'.~0 .50
.50
76.1 188.5 8.J..--1 l:HJ.O .50 3.00
78.3 l 7H.9 90.3 1:"10. 1 .50 6.00
68.7 180.2 98.0 1-t~. l .30
7~. I KH.:"1 l.J.-t ..J
76. l l]H.:l
H0.2 ¿Proporcionan estos datos suficiente evidencia que indique que las pobla-
ciones difieren con respecto a los niveles medios de a\dolasa en el suero? Sea ¡i¡
;!:
a= .01. Probar que existe una diferencia significativa entre todas las parejas !ii

9. Se llevó a cabo un experimento para probar el efecto de cuatro 111cdicamentos posibles de medias de las muestras.
ili
¡,¡
distintos sobre el tiempo de coagulación de la sangre (en n1inutos). Se extra-
11. La siguiente tabla n1ucstra las concentraciones arteriales de epinefrina en plas- ·'
jeron muestras de sangre de 10 personas y se dividieron igualmente en cuatro
grupos a los cuales se asignó. al azar. uno de los cuatro medican1entos. Los ma (nanogramos por n1ililitro) que se encontraron en 10 animales de laborato-
resultados son los siguientes: rio durante tres tipos de anestesia.
Análisis de la variancia p,eguntas y ejercicios de repaso 407
406
•I l\Iuestra
' Animal
Anestesia 1 2 3 4 5 6 7 8 9 !O A B e D
i/
A .28 .50 .68 .27 .31 .99 .26 .35 .38 .34 2946 3!86 2300 2286
B .20 .38 .50 .29 .38 .62 .42 .87 .37 .43 2913 2857 2903 2938
e 1.23 I.34 .55 1.06 .48 .68 1.12 1.52 .27 .35 2280 3099 2572 2952
3685 2761 2584 2348
¿Es posible concluir, a partir de estos datos, que los tres tipos de anestesia, en 2310 3290 2675 2691
promedio. tienen diferentes efectos? Sea a= .05. 2582 2937 2571 2858
3002 3347 2414
12. Se detenninó el valor nutritivo de cierto fruto comestible en un total de 72 2408 2008
unidades que representan 6 frutos de cada una de las cuatro vnriedades culti- 2850
vadas en cada una de tres regiones geográficas. Los resultados son los si- 2762
guientes:
¿Proporcionan estos datos la suficiente evidencia para indicar, a un nivel de
Variedad significación de .05, que las cuatro poblaciones difieren con respecto al peso
Región geográfica w X y z medio al nacer? Probar que existe una diferencia significativa entre todas las
parejas posibles de medias.
6.9 !LO 13. l 13.4
IL8 7.8 12.1 14.1
1 J4. La siguiente tabla muestra los valores de agresión de 30 animales de Jaborato·
6.2 7.3 9.9 13.5
A rio bajo tres condiciones de crianza distintas. Se asignó al azar un animal de
9.2 9.1 12.4 13.0
cada una de 10 camadas a cada una de las tres condiciones de crianza.
9.2 7.9 l l.3 12.3
6.2 6.9 I LO 13. 7
Condición de crianza
8.9 5.8 12. l 9.1
9.2 5.1 7.1 13.1 Exrren1adc1111e11te Mode.radc11ne11te No
Can1ada saturada saturada satiirada
5.2 5.0 13.0 13.2
B
7.7 9.4 13.7 8.6 1 30 20 10
7.8 8.3 12.9 9.8 2 30 10 20
5.7 5.7 7.5 9.9 3
4
30
25
20
15 'º
ID
6.8 7.8 8.7 11.8
5 35 _,
9- 20
5.2 6.5 10.5 13.5 ID
6 30 20
5.0 7.0 10.0 14.0
e 7 20 20 ID
5.2 9.3 8.1 10.8 10
8 30 30
5.5 6.6 10.6 12.3 ,-_,
7.3 10.8 10.5 14.0
9
10
25
30 20

20

Probar que existe una diferencia entre las variedades, una diferencia entre las ¿Proporcionan estos datos la suficiente evidencia que indique que el nivel de
regiones, e interacción. Sea a:= .05 para todas las pruebas. amontonamiento tiene un efecto sobre la agresión? Sea a= .05.
. ·--

13. Se seleccionó aleatoriamente una muestra de re5istros de nacimiento a partir de 15. La siguiente tabla muestra las estimaciones de la capacidad vital de 60 hom·
cuatro poblaciones. Los pesos (en gramos) de los bebés al nacer, son los siguientes: bres adultos, clasificados por ocupación y grupo de edades.
408 Análisis de la varia.ncia 1 Pregu11tas y ejercicios de repaso 409

Ocupación Fuente se g. f CM R.V. p


Grupo de edad A B e D A 12.3152 2 6.15759 29.4021 <.005
B 19. 7844 3 6.59481 31.4898 <.005
4.:~ 1 4.68 -t.17 5.75
AB 8.94165 6 1.49027 7.11596 <.005
4.89 6.18 3.77 5.70
Tratamientos 41.0413 ll
4.05 4.48 5.20 5.53
Error 10.0525 48 0.209427
4.44
4.59
4.~3
5.92
5.28
4.44
5.97
5.52
-
Total 5 l.0938 59
4.13 3.41 3.89 4.58
4.61 3.64 3.64 5.21 a) ¿Qué tipo de análisis se utilizó?
2 3.91 3.32 4.18 5.50
4.52 3.5 l 4.48 5.18
1 b) ¿Qué se puede concluir del análisis? Sea a= .05.

4.43 3.75 4.27 4.15 19. Considerar la siguiente tabla ANOV A


3.79 4.63 5.81 6.89
1
4.17 4.59 5.20 6.18
3 4.47 4.90 se g. l. CM R.V.
5.34 6.2 l F11e11re
4.35 5.31 5.94 7.56 2 2.52917 1.0438
Tratamientos 5.05835
3.59 4.81 5.56 6.73 1 Error 65.-12090 r_, 2.4230

Probar que existen diferencias entre las ocupaciones, diferencias entre los gru- a) ¿Qué diseño se utilizó?
pos de edades y que hay interacción. Sea Sea a= .05 para todas las pruebas. b) ¿Cuántos tratamientos se compararon?
16. Completar la siguiente tabla ANOVA y decir qué diseño se empleó.
e) ¿Cuántas observaciones se analizaron?
d) Con un niYel de significación de 0.5, ¿es posible concluir que existe diferencia
entre los tratamientos? ¿Por qué?
Fuente se g. l. CM R.V. p
Tratamientos 154.9199 4 20. Considerar la siguiente tabla ANOVA
Error
Total 200.4773 se g. l. CM R.V.
39 Fuente
Tratamientos 231.5054 2 115.1521 2.824
Bloques 98.5000 7 14.0114
17. Completar la siguiente tabla ANOV A y establecer qué diseño se en1pleó. 14 40.9821
Error 513.1500

Fuente se g. l. CM R.V. p a) ¿Qué diseño se utilizó?


Tratan1ien1os 3 b) ¿Cuántos tratamientos se compararon?
Bloques 183.5 3 e) ¿Cuántas observaciones se analizaron?
Error 26.0 d) Con un nivel de significación de .05, ¿es posible concluir que los tratamientos
~- tienen diferentes efectos? ¿Por qué?
Total 709.0 15
21. Se desea ·efectuar un análisis para determinar si las mediciones de ácido siálico
en el suero Jípido de reserva (ASSL) pueden emplearse para detectar cáncer
18. Considerar la siguiente tabla ANOVA. mamario. Las siguientes mediciones de ASSL (mg/dl) corresponden a cuatro
410 Análisis de la variancia

poblaciones de individuos: controles normales, A; pacientes con manifestación Población


Nú111ero de
del cáncer mamario, B; pacientes con cáncer mamario primario, C~ y pacientes
con cáncer mamario metastásico recurrente, D. Seleccionar una muestra aleato~
fa observación A B e D

ria simple de tamaño 10 a partir de cada población y llevar a cabo un análisis 3l. 14.5 22.5 18.2 22.4
adecuado para determinar si es posible concluir que las cuatro medias de las 32. 18.5 23.4 22.2 17.9
poblaciones son diferentes. Sea a = .05 y determinar el valor p. Probar todos 33. 17. l 24.l 18.4 24.7
los pares posibles de las medias de las muestras para el nivel de significación. 34. 14.8 21.0 22.0 19.1
¿Qué conclusiones se pueden sacar del análisis? Preparar un informe verbal de 35. 12.3 19.9 18.1 2S. l
los hailazgos. Comparar los resultados con los demás alumnos. 36. 12.3 15.2 18.6 23.5
37. 12.3 22.1 16.8 23.6
38. 19.4 19.5 21.5 26.6
Ntímero de Población 15.6 25.9 22.5 23.3
39.
la obsen ación
1
A B e ]) 40. 14.3 24.6 18.5 19.5
41. 15.8 23.0 17.S 25.2
l. 18.8 24.3 19.0 22.3
42. IS.O 16.6 19.7 22.4
2. 17 .3 22.2 12.5 17.3
43. 18.8 23.0 19.0 23.6
3. 16.4 19.0 2 t.0 20.8
44. 13.4 25.5 19.4 22.8
4. 18.9 2 !.5 21.5 26.I
45. 19.7 17 .5 18.9 22.4
o. 14.7 24.6 18.5 25. l
46. 17.5 16.5 19.2 28.0
6. l'.1.3 2 l.2 22.1 2-:1.8
47. 15.6 22.6 16.0 18.2
7. 16.9 18.8 26.2 23.0 20.8
48. 10.8 23.8 22.4
8. 17 .9 21.2 19.1 23.8
49. 20.2 19.9 20.2 26.6
9. 18.0 2(J.1 22.2 25.1 20.6
50. 15.7 23.5 20.7
!O. 20.9 22.6 18.8 25.3
51. 18.2 14.9 21.0 18.7
11. 18.8 18.6 16.4 22.9 25.7
52. 13.0 21.6 20.2
12. I l. 1 15.9 20.9 23.4
53. 17.5 13.4 18.6 24.7
13. 18.3 19.2 17.8 19.7
54. 17.5 18.9 19.9 19.1
14. 13.3 22.3 26.5 21.9
55. 1 !.2 2..J:.I 19.8 22.9
15. 17.9 21.6 20.5 22.6
56. 17.2 26.6 26.9 29.5
16. 18.6 20.3 23.1 20.2
57. 17.8 23.3 22.3 21. I
17. 15.1 15.2
18. 18.8 20.3
20.0
19.4
27.6
21.5
58. !7.8 [O.-! -9- -~•
{ 29.9
59. 15.7 20.(i 20.8 20.2
19. 12. l 17.3 25.2 14.5 22.9
60. 20.3 14.0 16.9
20. 16.4 23.0 17.0 19.4
21. 20.1 24.7 22.5 22.7
61. 15.7 22.7 2'.t2 --·-
99 9

62. ]9.6 24.0 !9.1 26.1


22. 16. 7 20.2 22.6 23.3 22.i
6'.l. 11.4 17.H 1<J.<J
23. 18.3 12.6 25.8 22.2 20.6
64. 16. 1 21.8 22.8
24. 16.3 16.8 21.4 20.3
65. 14.5 20.5 20.0 25.0
25. 12. l 18.8 20.4 23.7
66. 14.7 '21.5 :?.1.9 18.:3
26. 17.9 23.9 21.4 13.1
67. 20.2 l8.2 18.:! 20.-1
2í. 18.6 15.1 20.5 18.i
68. 1:?.. l 18.0 '2'.2.:t :2:1.0
28. 18.5 2 !.3 17.4 22..L.... ·-----rn:c¡-- -~ 1--r;H----'!h~----
29. 13./ 21.3 20.8 23.0
70. [5.0 11.1 21.U ~!i.~J
30. 18.3 16.6 17.5 22.4

411
Población Nún1ero de Población
Nún1ero de
la observación A B e ll la observación A B e D

20.9 18.6 19.!¡ 2:~.0 111. 19.3 18.0 13.5 25.0


7 l.
J:~.4 18.6 [6.7 24.1 112. 13.2 22.2 17.2 23.7
72.
19 - 18.9 21.4 22.:1 113. 18.9 20.5 17.2 25.4
73.
74.
-·'
15.9 19.8 18.·1 l!L7 114. 12.2 15.9 14.8 25.9
16.2 17.5 25.1 115. 19.6 21.7 21.2 21.6
75. 20.8
19.:, 21.H 2G.I 116. 14.1 13.4 17 .7 13.9
76. 15.4
22.0 24 ..'."i 27.5 117. 10.6 20. I 26.5 27.3
77. I fi.2
15.4 22.0 118. 14.7 20.8 18.3 22.2
78. IG.9 IH.3
20.] 2'.t-t 24.l 119. 15.0 17.7 15.5 26.8
79. Ji.O
27.8 ]9.8 120. 13.3 19.4 19.9 24.4
80. 19.0 19.5
19.8 25.8 121. 18.1 23.5 22.3 21.9
81. 20.4 20.6
19.8 25.4 122. 17.0 16.6 19.5 24.5
82. 16.9 20.3
26.6 2 l.8 123. 15.7 16.7 20.0 23.8
83. 1-t.l 20.7
23.5 ro
_ 1._ 124. 16.4 16.7 20.3 21.4
84. 20.8 18.3
22.9 125. 19. l 15.2 22.4 23.5
85. 15..t 16.7 16.2
20.5 2-t.--t 126. 14.I 20.7 22. l 20.6
86. 16.3 16.3
22.9 28.'.1 127. 17.7 17.8 23.8 21.7
87. 1:,.7 20.9
]8.6 24.9 128. 15.6 !9.0 23.4 17 .8
88. 18..-1 2 l.5
25.6 25.0 129. 12.--l 16.! 19.8 24.1
89. 16.6 23.6
2'.1.2 130. 17.4 17.0 16.7 23.0
90. 1:1.7 25.'.1 16.9
16.2 19.7 131. l-1.1 24.5 20.8 22.5
91. 16.9 24.6
1().2 20.6 132. 20.6 21.1 25.9 27.7
92. 19.--l 17.9
24.i 133. 16.2 20.7 20.3 20.3
93. 18.7 2 !.3 19.1
15.I 29.3 134. 19.1 23.7 15.7 21.2
94. 15.8 ló.'.1
2'.tfi 135. 12.6 18.9 21.-t 25.3
95. 14.3 19.9 2íJ.O
22.8 18.2
96.
97.
12.2
13. 7
13.3
21.9
19.9
23.4
23.0
22.4
136.
137.
20.6
15.3
,..
19.3
_'.).'.) 18.5 23.8
23.2 138. 16.3 19.2 17.5 22.3
98. 13.0 17.4 14.8
139. 13.4: 19.9 22.8 25.8
99. 13.6 22.2 24.7 24.9
26.3 19.9 26.7 140. 20.G 20.6 24:.0 28.4
100. 14.5
16.8 15.5 18.0 22.8
101. 13.6 19.0 23.8 25.8 14 l.
21.6 142. 15.2 16.9 17.0 19.i
102. 19. I 27.1 19.8
24.2 14:'.l. 15.S 2 l.~l 23.3 23.4:
103. 11.1 19.5 13.6
22.2 11-l. ISA 11-l.l 15.3 24.i
104. 13.5 25.4 19.6
105. 13. 7 24.3 22.6 24.3 14:5. -,
1<) - 22.K 22.li 21.9
21.2 146. !~.5 19.9 20.6 30.5
106. 18.2 20.8 16.6
107. 16.0 24.0 147. !!l.6 22.h 2:~.9 21.H
17. I 19.3
108. 1·11'( IK.9 20.H 20.7 22 ..'i
16.3 22.2 16.9 21.4
109. 21.5 23.0 [-19. 15.:l 2'.\.9 1:t l 22.1
16.6 19.7
110. 26.4 !:'10. 16.9 1!i.:, !:-l.2 22.0
16.6 19.5 2 1.5

412 413
" Nlln1ero de Población Número de Población
/a observación A B e o /a observación A B e o
151. 15.7 21.4 2 l./J 21.9 191. l l.4 17.9 18.0 20.2
152. 19.3 16.7 18.5 23.!J 192. 15.5 20.7 22.4 18.7
153. 20.5 21.8 21.0 22.8 193. 18. l 13.3 16.7 22.7
154. 11. l 19.5 19.7 24.5 194. 18.9 18.4 19.8 24.7
155. 17.8 20.0 19.I 25.3 195. 20.7 18.1 19.5 24.1
156. 14.4 22.7 28.0 23.0 196. 15.3 22.6 17.6 28.9
157. 16.8 19.3 18.6 23.! 197. 15.2 21.2 22.8 28.0
[58. 16.6 2:3.2 20.4 21.1 198. 19.3 22.4 19.1 17.7
159. 11.4 11.7 15.5 26.9 199. 20.8 22.2 21.0 24.0
160. 16.7 19.2 18.1 2 l. 7 200. 18.8 25.0 21.7 25.3
lo l. 20.9 20.2 22.0 !9.3 201. 15.0 18.l 18. I 25.l
162. 15.0 24.4 EJ.6 17.8 202. 11.5 16.1 20.2 25.9
163. 14.0 26.I 21. ¡ 20.J 203. 13.9 19.8 23.4 23.4
164. 17.5 18.7 17.8 18.1 204. 14.3 27.0 19.8 19.8
165. 14. I 25.3 22.9 22.0 205. 20.1 21.8 22.2 17.6
166. 20.6 19.8 21. i 2f:i.!J 206. 14.3 21.3 19.3 21.7
167. 15.5 14.8 23.3 24.2 207. 19.5 16.5 21.6 20.5
168. !4.7 21.1 22.3 23.8 208. 13.3 17.9 IS.O 17.8
169. 20.2 19.1 20.8 2 !.O 209. 17.0 22.0 15.0 25.7
170. 17.2 24.5 19.8 24.;J 210. 16.0 19.3 19.6 24.6
171. 12.8 14.6 2 !.6 1!J.6 211. 12.5 18.7 IS.O 26.7
172. 17.6 23.3 21.8 18.fi 212. 14.8 16.3 19.8 21.4
173. 17.2 21.5 22.8 2 l.3 213. 16.6 18.6 15.2 28.0
174. 11.2 2 l.O 19.6 20.l 214. I l.5 22.4 17.5 24.5
175. 15.I 23.6 17.3 27.2 215. 18.6 16.5 22.7 24.6
176. 12.4 21.1 20.8 25.2 216. 15.4 17.4 19.3 20.7
177. 11.8 23.7 20.8 21.9 217. 20.4 15.3 23.2 24.7
178. 13.2 20.2 13.8 25.3 218. 17.7 20.7 19.2 29.0
179. 16.4 21.b 19.1 17.8 219. 20.3 20.4 21. 7 22.7
180. 16.3 18.0 19.U 22.fi 220. 20.3 20.8 18.6 27.9
181. 9· • 23.0 18.3
17.5 17. 1 14.2 27.6 22 l. 17.7 -:>.:>
182. 1 !.O 16.8 24.I 17.7 222. 15.1 23.1 20.6 25.0
183. 15.9 22.0 17.7 21.9 223. 18.5 21.0 15.5 20.9
184. 20.8 17.9 17.9 2-LO 22-:1. 17.5 23.3 21.9 27.6
185. 16.4 19.7 13.3 22.2
99·
--:>. 16.4 16.5 17.4 20.2
186. 20.9 22.9 18.4 24.5 226. 11.5 [7.7 21.1 25.6
187. 15.4 13.0 20.1 24.0
99-
__ 1. 14.0 19.4 25.4 20.2
188. 16.2 ! 7.2 18.! 22.S. l 3.'.) 14.l 18.2 16.4
27.6
8 --- -2-2. t 22-~. t6.-5 22.2 '....·~--
2?:t
190. 11.3 20.8 iti.2 !8.3 2$0. i5.9 l ~l.:~ 21.5 21.1

414 415
Nún1ero de Población Nún1ero de Población
fa observación A H e D fa observación A B e D

231. 16.8 20.2 21. 7 22.5 271. 16.9 16.5 13.2 22.8
232. 17.8 16.4 20.6 24.7 272. 13.9 19.1 20.6 24.3
233. 10.7 24.2 2 l.9 26.9 273. 20.7 17.9 17 .O 26.9
234. 15.2 18.6 20.2 22.7 274. 15. l 26. l 19.1 26.5
235. 20.7 2 l.5 20.0 26.7 275. 14.3 24.4 20.6 26.4
236. 15.0 20.4 23.2 24.5 276. 13.5 23.3 24.7 27.5
237. 14.1 24.5 20.7 21. 7 277. 17. l 15. l 20.8 15.2
238. 17 .5 22.4 18.6 24.4 278. 18.4 17.9 14. 7 20.2
239. 20.l 22.3 19.0 21.9 279. 14.2 19.4 16.2 24.4
240. 16.2 20.3 21.8 22.0 280. 16.3 13.3 25.I 17.6
241. 18.4 16.3 21. 7 21.2 281. 14.7 20.4 19.5 22.6
242. 17.8 19.6 18.2 26.1 282. 19.3 21.6 20.1 29.9
243. 13. 1 20.3 15.9 23,l 283. 13. 7 19.9 19.4 33.7
244. 15.2 15.5 20.8 21.7 284. 20.7 19.6 22.7 26.0
245. 19.5 22.0 17.4 26.6 285. 11.5 17.5 23.4 23.1
246. 15.5 20.9 22.ü 22.0 286. 19.0 15.3 19.2 25.7
247. 19.9 17.9 21.6 21.0 287. 12.3 18.5 18.9 20.2
248. 15 ..~ 16.7 22.8 21.9 288. 20.0 19.3 19.2 20.9
249. 18.9 25.2 20.0 25.0 289. 15.8 21.7 22.5 27.9
250. 20.9 23.2 18 2 24.2 290. 15.5 21.9 19.4 26.7
25 l. 18.3 18.8 18.0 28.0 291. 20.8 14.6 21.0 22.6
252. 14.0 20.0 26.7 24.5 292. 20.6 25.1 22.7 18.8
253. 13.0 21.9 21.7 2fi.i 293. 13.4 17.7 21.5 24.4
254. 294. 11.2 23.8 19.0 22.1
,..
-JJ.
16.3
17.0
!7.0
20.6
21.1
22.0
23.0
29.9 295. 18.0 19.3 19.6 17.3
256. lfi.4 20.7 22.4 24.4 296. 19.0 23.4 25.4 21.0
,--
.. JI. 15. 7 22.5 17.0 22.3 297. 19.5 22.8 20.4 19.8
258. 15.5 23.7 18.1 27.3 298. 20.0 23.8 21.6 25.6
259. 17.0 16.2 23 ...J 21.i 299. 12.4 20.5 19.4 25.6
260. 18.4 16.6 17 .1 18.7 300. 16.7 18.0 25.3 20.2
261. 12.7 22.6 22.7 24.6 30 !. 14.5 19. l 20.7 28.2
262. 16.6 17.9 23.0 25.I 302. 20.3 17.1 19.8 20.8
263. 15.6 17.4 lfi.3 24.0 303. 11.3 19. 7 15.5 22.1
264. 14.7 20.I 25.G 1Y.O 304. 19.2 14.3 14.8 22.1
265. 11.3 16.1 22.4 29.0 305. 20.4 22.5 20.5 22.1
266. 16.4 23.6 21 7 20.0 306. 14.8 20.6 17.2 26.8
267. l 1.9 18.5 23.0 20.2 307. 18.4 20.3 23.4 24.4
2G8. 15.6 16.H 24.2 24.1 308. l l.8 19.3 19.7 23.3
269. 309. 18.9 22.5 22.3 21.8
18.9 26.0 21.7 19.5
270. 310. 13.4 22.0 18.0 19.8
1 1.2 23.3 20.9 19.9
31 l. 16.4 22.8 13.3 23.4

1 417
416
.
11·1

i
1 1 Preguntas y ejercicios de repaso 419

Nll111ero de Población 22, La sarcoidosis, que se produce en todo e[ inundo. es una enfermedad granulo-
matosa sistémica de causa desconocida. El examen de la enzima convertidora
/a observación A B e D
de angiotensina del suero (ECAS) es útil para el diagnóstico de sarcoidosis
312. I I.3 21.l 15.2 23.6 activa. La actividad de ECAS norn1almente se incrementa en pacientes con
313. 16.3 19.7 15.7 22.0 di-:ha cnfcrn1edad. nlicntras que los individuos sanos, aquellos que se han
314. 12.7 16.8 19.9 22.3 re-:uperado. y pacientes con otro tiro de radeci1nientns granulomatosos pre-
315. 17.0 22.5 19.9 25.9 sentan concentracionc:- normales del compuesto. Los siguientes da1os corres-
316. 16.5 23.0 16.7 25.0 ponden a la ECAS de cuatro pohlaciones de individuos clasificados de acuer-
317. 16.7 13.3 18.7 20.9 do a su estado respecto a la sarcoidosis: nunca la han padecido, A: activa, B:
318. 17.9 18.4 21.7 20.6 estables, C; recuperados, D. Sele1.x:ionar una muestra aleatoria simple de 15
319. 13.6 17.4 26.6 20.4 individuos a partir de cada población y efectuar un análisis para determinar si
320. 13.7 25.7 22.6 21.3 es posible concluir que ]as medias poh!acionalcs son diferentes. Sea a= .05.
321. 18.0 19.l 23.1 21.5 Usar la prueba de Tukcy para prohar la existencia de diferencias significativas
322. 17.6 18.6 18.6 25.7 entre pares individuales de n1edias. Preparar un infonne escrito de los hallaz:-
323. 13.5 18.4 23.6 21.8 gos. Con1parar los resultados con los· <le los demás alumnos.
324. 13.6 15.2 2'.t6 25.7
325. I I.6 17 .3 27.1 25.4
326. 15.8 22.2 21.9 22.3 Núniero de Población
327. 15.9 21.0 18.2 24. l la observación A B e D
328. 13.0 22.5 22.0 2-4. l
l. 108.4 198.3 89.1 64.8
329. 14.9 18.7 19.1 24.4
2. 73.8 174.l 117.0 70.4
330. 13.0 25.2 21.5 23.6
3. 65.9 168.2 113.3 65.0
331. 16.1 20.4 18.8 23.5
4. 86.7 189.9 108.4 85.6
332. 14.3 22.9 16.5 14.9
5. 102.7 169.9 132.1 98.5
333. 18. J 24.1 16.7 26.8
6. 101.2 183.6 I 15.1 81.2
334. 16.0 24.2 24.4 19.9
7. 98.9 163.4 102.3 80.5
335. 16.0 23.0 21.5 22.7
8. 94.2 193.8 130.2 69.3
336. 16.9 19.3 24.8 20.I
9. 118.4 183.7 114.2 76.4
337. 20.7 22. l l 9.3 24.9
JO. 87.4 192.9 112.9 88.3
338. 19.0 16.5 17.8 24.0
11. JO 1.8 174. l 120.2 70.4
339. 11.6 19.4 (9.4 30.5
12. 88.2 168.8 126.0 72.9
340. 12.3 19.5 17.5 23.4
13. 87.5 187.6 110.8 72.7
341. 12.3 16.9 21.2 23.0
14. 73.9 191.6 103.8 75.5
342. 14.4 20.5 15.5 9· 9
-:J.-
15. 90.5 183.8 105.4 87.8
343. 14.3 19.0 17.5 24.2
16. 87.6 190.6 103.8 78.2
344. 20.9 (8.1 15.8 22.8 139.4 74.4
345. 13.2 26.1 23.6 ,- -
-1.:J
17. 87.5 188.4
107.9 6 l.6
346. 18. 88.5 187.5
19.2 13.2 19.8 25. !
19. 96.3 171.7 121. 7 89.3
347. 19. I 25.1 lfi.9 25.7
20. 81.0 169.0 109.9 89.5
348. 19.3 2 1.8 16.l 16.6
21. 63.3 171.2 108.9 61.4
349. 12.9 16."1 22.0 '24. I
~ .- 18.$
22. 102.2 184.3 108.7 81.4
- .'6 74.6 174.6 135.8 90.1
23.
24. 77.3 !57.2 J.07.5 71.0

1
418
Nú111ero de Población Núniero de Población
la observación A B e D la observación A B e D

25. 91. 7 171.5 109.0 86.2 65. 94.1 194.2 111.1 83.4
26. 97.0 186.9 114.4 97.7 66. 82.9 169.8 121.5 70.7
27. 72.4 160.7 107.5 89.5 67. 91.9 161.6 112.4 83.9
28. 94.6 164.3 113.8 70.4 68. 80.7 182.3 91.0 84.4
29. 88.7 166.3 115.0 84.4 69. 112.6 167.3 105.8 90.8
30. 73.2 150.0 112. l 70.3 70. 98.0 156.8 114.6 81.0
31. 84.3 161.4 91.8 81.6 71. 90.1 161.0 137.4 69.0
32. 90.3 163.7 97.3 57.7 72. 69.3 171.1 93.7 87.4
33. 71.3 166.3 137.0 87.5 73. 100.9 159.4 117.5 67.0
34. 98.9 170.9 113.3 89.1 74. 81.9 173.3 117.8 89.9
35. 86.8 173.9 137.0 80.8 75. 78.6 171.7 118.9 82.l
36. 86.2 178.0 115.6 83.9 76. 100.2 173.7 99.8 76.4
37. 81.7 162.2 94.4 55.I 77. 92.6 171.2 90.1 59.2
38. 105.9 173. l 99.2 75.7 78. 93.3 178. l 86.5 56.9
39. 79.8 175.8 120.2 71.2 79. 109.2 178.8 111.6 95.8
40. 85.9 157.7 106.2 86.8 80. 91.6 176.7 115. 7 86.6
41. 92.7 159.0 108.0 83.4 81. 76.3 165.5 109.7 62.4
42. 117.3 156.4 107 .8 107.1 82. 95.8 194.6 104.9 89.5
43. 103.8 196.2 101.5 113. 7 83. 97.3 183.6 102.0 70.1
44. 86.1 180.2 126.7 88.2 84. 90.3 185.9 126.8 90.7
45. 114.0 166.9 113.4 74.I 85. 108.4 180.0 96.7 83.0
46. 78.3 153.8 110.9 102. I 86. 75.5 197.0 100.5 83.4
47. 87.8 158.5 l27.3 75.9 87. 104.6 175.1 115.2 73.8
48. 92.4 179.7 109.1 81.3 88. 101.5 178.8 95.8 63.1
49. 78.4 209.5 79.9 114.6 89. 100.4 152.1 101.2 76.6
50. 78.7 172.2 113.7 94.2 90. 85.3 158.0 110.4 92.5
51. 80.7 180.3 109.2 77.6 91. 88.4 158.8 118.3 68.2
52. 84.1 185.4 117.8 69.1 92. 91.5 158.7 127.0 90.4
53. 107.5 162.0 108.6 60. l 93. 82.5 164.4 104.7 69.3
54. 104.5 165.5 115.8 54.5 94. 102.9 187.9 129.5 76.8
55. 107.8 163.1 124.4 72.5 95. 95.5 190.2 124.7 69.3
56. 79.6 186.3 l'.{0.6 79.6 96. 98.7 188.6 120.7 71.3
57. 74.0 167.4 108.2 72.9 97. 108.1 197.3 108.8 87.4
58. 100.2 174.1 82.I 66.0 98. 68.7 177.2 116.1 64.0
59. 73.6 209.4 101.4 71.3 99. 72.9 182.0 84.0 79.4
60. 93.l 176.3" 114.2 60.0 100. 87.4 170.4 112.1 77.1
61. 109.2 178.2 11 O.fi 81.4 101. 59.8 188.6 133.1 93.8
62. 97.5 157.4 95.5 55. l 102. 83.5 160.3 110.9 75.2
63. 90.8 195.0 111.3 67.8 103. 91.7 185.7 98.9 74.9
64. 82.5 161.5 126.7 54.5 104. 90.4 172.5 104.4 75.3

420 421
Niín1ero de Población Nlln1ero de Población
/a obser1,:ació11 A B e D la observación A B e D

105. 77.8 182. 1 94.1 77.3 145. 85.4 l 90. l 124.8 58.3
106. 67.0 184.4 108.7 68.l 146. 77.6 173.8 101.1 79.6
107. 79.4 188.3 112.3 82.8 147. 98.5 176.4 114.9 61.4
108. 85.4 168.8 127.8 72.8 148. 98.2 181.2 122.3 78.5
109. 89.I 174. l 123. 1 73.7 149. 88.0 199.0 124.0 75. l
110. 87.2 190.8 110.4 74.3 150. 85.8 188.9 98.7 85.7
1 1l. 81.9 183.3 119.9 80.2 151. 97.2 179. l 133.3 85.2
112. 111. 1 157.6 100. l 85.3 152. 76. l 175.5 125.0 69.2
113. 108.9 174. I 109.I 96.9 153. 92.2 185.2 83.7 57. 1
114. 105.9 183.7 142.2 66.4 154. 101.8 182.9 120.9 79.4
115. 96.8 178. l 103.1 65.2 155. 63.2 190.9 110.3 86.2
116. 81.3 173.4 Il0.6 67.1 156. 72.5 182.2 109.5 61.9
117. 93.4 185.0 103.6 84.8 157. 97.0 179.6 93.7 61.5
118. 104.5 184.8 120.2 10 l. 7 158. 83.0 172.2 110.2 61.1
119. 72.7 193.7 104.3 69.5 159. 86.8 171.0 102.6 84.0
120. 79.2 193. 1 86.9 110.3 160. 72.8 183.l 121.8 61.ó
12 l. 61.6 193.0 106.4 73.0 161. 108.0 169.4 100.5 80.6
122. 87.2 177.2 102.2 62.8 162. 104.9 186.2 108.3 91.6
123. 103. l 175.4 92.3 73.2 163. 113.0 177.2 !07.I 55.7
124. 97.6 180.9 75.2 68.8 164. 102.4 165.1 117.5 83.6
125. 76.4 175.8 103.6 82.0 165. 89. 1 167.0 111.6 71.3
126. 63.8 148.6 109.1 86.3 166. 87.8 167.7 115.5 64.9
127. 88.I 181.8 120.5 60.5 167. 99.2 181.5 109.8 55. l
128. 96.8 192.3 118.2 80.2 168. 102.9 175.9 106.4 62.7
129. 94.4 173.6 121.3 70.3 169. 77.1 167.4 108.6 75.8
130. 85.2 179.7 103.2 68.4 170. 77.3 169.0 105. l 97.9
13 l. 115.9 185.9 110.9 84.7 17 l. 99.0 188.6 !07.I 77.3
132. 116.2 184.3 127.3 73.5 172. 91.5 170.6 89.4 75.5
133. 101.1 173. l 92.7 82.3 173. 75.8 183.2 105.5 64.8
134. 96.l 177.6 117.5 70.7 174. 67.5 180.4 124.4 67.4
135. 111.3 14 l.9 122.3 82.5 175. 108.9 170.1 111.8 90.9
136. 95.7 168.4 93.0 87.4 176. 96.4 184.5 119.6 73.5
137. 84.1 176.0 103.0 6fi.5 177. 88.2 161.6 124.9 69.2
138. 76.9 203.5 89.2 88.2 178. JO 1.2 175.3 136.4 78.2
139. 77. 1 183.8 92.8 95.2 179. 125.2 169.4 138.2 67.0
(40. 101.8 174.1 131.0 77.4 180. 87.6 162.5 101.6 92.4
141. 81.6 186.3 125.4 70.5 181. 95.1 179.9 95.9 53. l
[42. 83.7 165.7 103.6 67.6 182. 110.5 186.8 108.8 65.6
·4. sn¡---·--T -l-9&8-------5&+ ------ ----
144.
·- ~ -------t-05~-------t8 .
88.0 167.9 97.4 104.9 184. 85.6 173.4 102.2 75.2

422 423
1

N1'111ero de Población Nún1ero de Población


la observación A B e D fa observación A B e D

185. 94.2 188.0 114.0 89.0 225. 105.4 177.0 l 18.4 76.7
186. 94.5 169.3 107.9 72.8 226. 78.9 204.3 136. l 78.2
187. 87.8 187.3 98.4 87.8 227. 92.1 184.4 126.8 62.3
188. 84.4 185. I 112.8 73.3 228. 79.1 184.I 142.6 87.5
189. 86.1 178.5 102.0 69.7 229. 108.2 185.5 92.5 94.0
190. 85.5 172.5 107.7 79.8 230. 73.0 175.8 100.9 74.2
191. 79.7 213.0 133.9 57.8 231. 103.2 171.5 105.0 76.4
192. 96.8 196. I 129.9 48.I 232. 96.1 185. I 107.0 72.2
193. 81.9 181.5 98.9 74.6 233. 101.3 174.0 78.3 88.2
194. 68.9 175.0 92.1 73.6 234. 78.7 183.5 94.I 57.2
'1
'
195. 105.5 189.2 131.5 75.7 235. 94.0 200.2 103.0 85.7 1
196. 95.7 168.6 97.0 83.8 236. 86.6 181.6 93.9 85.7
i
197. 91.5 185.3 132.9 73.0 237. 81.2 162.l 112.9 70.7 ''
198. 86.9 238. 83.4 182.7 109.9 78.3 '
183.8 106.1 70.2 '
199. 100.4 193.8 90.5 93.6 239. 90.9 153. l 89.9 99.4 ''
82.9 i:.1
200.
201.
202.
105.5
85.6
so.o
157.9
173.7
158.3
103.3
105.6
124.4
97.7
82.9
240.
241.
242.
83.1
71.8
100.4
191.9
197.6
170.9
116.2
99.1
121.9
86.4
62.5
¡r
77.0
203. 91.9 196.4 98.6 243. 104.5 187.4 10 I.5 74.8
84.9
204. 90.4 244. 102.2 180.1 106.2 85.l
186.9 129.4 62.7
205. 245. 79.1 177.6 114.8 85.5
105.0 171.9 109.1 87.4
206. 114.2 246. 90. l 175.8 115.2 73.1
189.4 13 l.3 72.3
207. 91.6 195.4 247. 81.7 174.0 84.l 72.1
107.6 79.0
208. 107.7 185.8 82.5 248. 95.2 173.6 120.8 74.7
87.8
209. 107.7 · 185.J 111.8 249. 107. l 186.0 104. l 65.9
84.6
210. 88.4 188.7 94.7 250. 89.3 167.5 126.7 66.6
86.l
211. 100.3 185.3 109.2 251. 89.9 177.6 124.5 91.4
47.3
212. 78.3 175.0 93.9 252. 90.6 170.7 121.6 88.9
60.2
213. 95.I 197.9 113.7 253. 63.8 196.3 126.0 62.1
95.3
214. 96.6 201.9 122.5 254. 92.l 179.9 104.0 96.5
78.0
215. 85.7 160.5 113. 7 67.3 255. 82.5 184.7 120.6 105.7
216. 73.6 181.7 126.9 256. 101.8 199.0 120.4 72.9
97.6
217. 82.3 195.8 115.5 257. 97.4 177.9 112.2 68.9
66.2
218. 94.7 185.4 105.2 258. 77.7 156.3 109. l 82.5
82.2
219. 69.6 169.3 116.2 259. 84.5 177. 7 115. 7 88.9
68.0
220. 99.1 164.9 96.4 260. 99.0 160.6 108.7 63.9
55.7
221. 91.4 182.3 114.9 261. 103.7 176. l 89.8 76.9
64.3
222. 96.7 165.2 118.0 262. 94.9 170.6 106.9 77.8
91.4
223. 73.3 165.7 93.3 263. 60.9 186.0 124.2 75.6
96.0
224. 84.5 139.3 121.9 264. 96.4 171.3 98.l 83.3
73.9
ji
'I'
424 1 425
1
¡
J
Núniero de Población N1í111ero de Población
la observación A B e D /a observación A B e D

265. 89.7 173.3 116.7 86.I 305. 99.2 171.1 128.8 54.1
266. 94.7 168.6 102.4 91.9 306. 99.3 171.3 120.5 87.8
267. 82.4 162.7 102.4 47.4 307. 87.9 180.5 129.9 78.0
268. 104.3 175.8 95.4 79.7 308. 61.7 197.0 133.8 81.3
269. 93.7 169.3 95.2 73.6 309. 91.4 179.8 97.6 86.7
270. 105.1 180.9 83.7 82.9 310. 93.2 184.9 108.4 76.4
271. 100.7 162.3 105.8 69.2 31 l. 104.3 189.0 IOI.2 85.3
272. 90.4 184.5 104. l 76.7 312. 91.l 173.8 119.4 60.2
273. 97.2 180. I 117.3 86.8 313. 74.7 188. 1 110.5 76.7
274. 86.5 174.0 114.0 58.7 314. 73.1 180.7 104. l 73.0
275. 84.2 162.5 86.8 81.0 315. 99.5 173.6 114.9 85.4
276. 91. l 166.8 98.4 72.5 316. 73.1 168.1 130.0 70.9
277. 89.0 175.2 120.0 60.4 317. 104.4 171.5 129.5 87.5
278. 70.9 170. 1 101.7 78.7 318. 70.3 185.5 116.4 63.0
279. 90.5 200.9 120.8 88.6 319. 73.7 183. l 121.3 73.3
280. 95.6 193.9 124.3 75.6 320. 84.2 177.8 81.2 81.4
281. 87.1 148.4 106.4 76.2 321. 93.2 162.7 112.6 81.6
282. 84.4 171.0 99.8 95.3 322. 99.8 172.8 121.7 102.3
283. 86.4 204.5 90.0 78.7 323. 76.3 170.5 114.8 76.6
284. 95.5 166.1 102.5 84.9 324. 79.7 187.2 116.8 74.2
285. 104.8 161.2 I 10.5 73.9 325. 95.l 180.7 103. I 72.6
286. 90.8 178.7 99.9 73.0 326. 83. I 174.2 II 1.7 71.2
287. 100.7 174. 7 112. l 72.0 327. 77.9 185.4 108.9 81.2
288. 112.6 153.4 114.5 71.2 328. 89.4 175.8 97.7 71.3
289. 68.7 189.4 111.3 68.8 329. 72.6 170.2 95.3 65.4
290. 90.8 180.2 109.l 63.1 330. 82.0 184.9 IOI.3 79.2
291. 93.4 194.2 122.6 62.I 331. 104.7 199.4 107.I 76.8
292. 86.4 181.8 126.0 78.8 332. 97.4 154.4 105. l 81.9
293. 87.9 174.5 94.8 90.8 333. 93.3 191.0 !06.5 82.6
294. 107.0 188.4 11 7.0 89.8 334. 91.2 191.0 102.9 70. I
295. 76.7 178.5 105.4 74.5 335. 89.5 177.4 103.4 87.7
296. 74.4 175.2 108.I 80.7 336. 86.5 179.9 116.9 87.9
297. 87. l 177. l 106.5 78.1 337. 92.6 171.9 133.8 85.4
298. 78.6 173.~ 120.8 80.5 338. 102.2 147.2 92.9 82.9
299. 88.8 189.6 94.] 72.2 339. 96.9 199.9 99.I 94.0
300. 89.6 201.9 109.5 75.6 340. 87.9 186.6 109.1 89.8
30 l. 94.6 180.8 106.0 73.0 341. 84.5 166.6 118.3 83.2
302. 113. l 196.8 106.2 93.8 342. 103.i 172.9 110.4 89.9
3 104. i83.4 98.1
..
8 . -so.~ 108:'.l -. ."i--------- -
304. 78.3 173.7 122.8 78.8 344. 83.7 188.4 121.3 71.5

426 427
Preguntas y ejercicivs de repaso
429

Población
Nún1ero de Población Nrí111ero de
la ol,servación A B e D
la observación A B e o
87.7 156.l 113.0 81.6
345. 57.2 l 74.4 121.2 75.2 385.
76.6 164.8 115.9 78.9
346. 103.9 174.3 135.3 71.8 386.
99.l 174. l 109.8 90.6
347. 92.1 183.8 92.0 81.4 :l87.
77.8 168.9 96.4 68.7
348. 104.6 183.0 104.9 85.0 388.
79.7 182.6 127.0 90.0
349. 94.9 185.0 94.5 66.1 389.
93.6 17 1.2 116.4 77.7
350. 115.5 186.5 131.0 65.9 :~90.
9'.l7 181. 7 106.6 68.8
351. 79.6 172.7 104.3 82.4 391.
93.5 188.0 117.9 70.1
352. 96.1 182.0 121.9 83.9 392.
88.2 180.8 125.4 83.4
353. 83.7 181.7 85.8 88.2 393.
104 ..'.:I 164.2: 111.5 59.8
354. 100.9 166.4 !06.2 84.5 394.
99.0 158.0 101.8 75.9
355. 94.0 154.l 128.6 74.8 395.
88.5 154.8 98.8 75.7
356. 93.4 162. l 110.6 81.0 396.
98.7 184.7 106.8 97.9
357. ! !O.O 192.2 115.5 72.2 397.
90.1 177.8 10:ts 68. l
358. 82.8 182.8 114.9 75.5 398.
97.0 204.1 124.1 65.0
359. 82.4 l 72.1 97.2 84.0 399.
76.:l 173.5 98.0 82.7
360. 96.2 191.0 115.8 71.6 400.
361. 108.4 179.7 105.2 88.6
362. 105.2 175.I 95.5 97.6 24. Suponga e\ lector que es el asesor estadístico de un in\·cstigador en medicina
363. 87.1 181.1 123.4 99.2 interesad\\ en Íll\'Csligar respecto a Iris relaciones entre las concentraciones de
364. 103.4 184.5 103.0 84.1 ácidn fólico cn la sangre de 1nujeres ndultas y la calidad de su dieta. El investí-
365. 83.7 196.0 105.-1 91.1 gador dispone de tres pohhicinnes de indi\·iduos: aquellas cuya calidad de die-
366. 92.8 170.3 !06.3 42.9 ta se considera hucna. lns que siguen una di('1a regular y aquel\cis que siguen
367. IOJ.5 182.7 98.4 92.6 una pohre. Para c,1d.1 indi\·iduo se dispone 1an1bién del valor del ácido fólico
368. 98.2 193.4 139.7 86.8 en glóhulns rojos (AFGR} <enµ :1/Jitro de glóbulos rojos). Obtener una mues-
369. 112.7 154.l 116.7 67.8 tra alcntoria sin1plc de 1an1añn 10 a partir de cadn población y de1em1inar si el
370. !07.7 166.1 96.9 69.4 investigador puede concluir que las tres poblnciones difieren con respecto al
371. 94.2 166.4 116. 7 91.7 valor n1edio de AFGR. Utilizar la prueba de Tukey para todas las compara-
372. 97.6 166.7 94.2 77.2 cioncs posibles. Sea a.= .05 y calcular el valor p. Crnnparar los resultados con
373. 81.9 166.6 !09.8 80.4
los de los de1n,'is aluinnos.
374. 75.6 l 9 l. l 112.6 84.9
375. 105.2 166.0 134.8 63.2
376. 92:.5 182.4 107.1 79.7
377. N1í111ero
Individuos con la enfermedad
79.1 180.8 88.5 l l0.3
378. 98.8 189.6 ! JO.O 82.3 de obse1Tació11 Ninguna .\ 8 e l}

379. -9.
88.0 174.6 110.9 1~.:J
102 G-t J:'IO 82 123
l.
380. 92.1 18 1.4 127.3 80.2 136 51 11:1
:'16
381. 74.0 199.5 105.0 89.2
2.
"
G:'1 -12 ]$/
-,,,_ l:IH
382. :t
59.8 171.6 130.3 88.3 (ii '.'l~J 107 ¡¡ 126
4.
383. 83.2 189.1 99.6 71.9 !S.? -1:'l 1:1:-) 1,Ji
5. GH ~ji
384. 75.2 178.5 114.5 47.2 J:1i X5 J:{X
l). :°lH 4"'

428
Nún1ero Individuos con la enfermedad Ntiniero Individuos con la enfermedad
de observación Ninguna A B e de observación
D Ninguna A B e D
7. 77 61 138 80 124 50. 71 69 155 124
94
8. 55 67 120 51 102 51. 72 58 160 139
80
9. 80 40 138 76 125 52. 77 57 138 67 125
10. 78 89 165 95 103 53. 74 81 155 101 96
11. 87 47 138 82 124 54. 76 54 127 83 122
12. 89 44 163 92 128 55. 68 75 175 93 113
13. 60 42 144 67 133 56. 87 38 133 61 137
14. 75 69 129 55 96 57. 94 75 148 75 143
15. 64 37 131 69 117 58. 43 13 124 96 115
16. 53 55 138 45 120 59. 69 24 150 62 102
17. 54 38 148 92 125 60. 68 52 131 88 113
18. 59 46 127 38 131 61. 51 H 130 70 117
19. 73 71 134 66 117 62. 63 62 143 111
66
20. 55 38 170 53 128 63. 99 5fi 143 71 82
21. 54 59 131 63 128 64. 77 62 148 82 105
22. 52 67 144 62 11 O 65. 83 60 161 87 97
23. 84 49 172 56 115 66. 61 23 166 93 134
24. 64 58 115 57 123 67. 93 ó2 149 63 98
25. 85 72 154 90 132 68. 42 73 134 52 120
26. 68 42 140 82 118 69. 80 75 145 67 103
27. 74 66 128 88 126 70. 82 47 125 66 133
28. 83 64 157 73 108 71. 92 55 154 80 14'.\
29. 53 50 154 53 112 ,_
-9
88 74 141 94 133
30. 56 39 151 36 113 73. 60 59 156 89 104
31. 54 50 151 88 108 74. 78 63 143 76 117
32. 61 69 154 81 105 75. 54 20 134 83 121
33. 59 63 137 81 97 76. 50 67 ¡45 69 127
34. 66 66 157 68 95 77. 91 72 135 67 130
35. 95 38 133 93 142 78. 88 74 141 56 120
36. 75 48 173 58 99 79. 90 36 148 1{){) 118
37. 77 76 172 61 119 80. 78 63 161 80 107
38. 69 37 130 86 109 81. 63 5'.~ 148 6'.1 96
39. 73 58 145 52 135 82. 98 44 155 60 103
40. 71 35 136 69 105 83. 59 30 15-1 93 114
41. 60 55 140 70 145 84. 94 51 t 71 110 115
42. 79 56 140 63 135 8:'i. 85 59 119 57 1 ¡ :\
43. 80 61 141 82 104 86. 74 57 125 103 109
44. 69 30 142 72 125 87. 51 4$ l (5 64 110
45. 85 67 149 97 104 88. 72 ,_
-9
!..t6 71 122
46. 51 51 145 64 105 89. 90 69 119 91 ¡ 1:--;
,.
48.
54
55
-12
67
135 114 107 .
()(
-- b ,o
,,
; --·

164 83 125 91. 83 57 144 \ llil


49. 62 54 147 94 124 92. ;jJ . ., l-1:3 ,'\/ J-19
º-
~30 431
Núnzero Individuos con la enfermedad Núniero Individuos con In enfermednd
de observación Ninguna A B e D de observación Ninguna A B e D

93. 78 44 140 82 142 136. 88 50 144 68 126


94. 103 48 166 69 112 137. 67 78 147 74 92
95. 64 35 157 79 107 138. 85 65 148 50 125
96. 52 40 153 63 96 139. 83 63 135 81 122
97. 99 39 142 67 109 140. 71 59 136 66 122
98. 50 59 146 78 128 141. 55 27 130 69 110
99. 85 59 137 61 !08 142. 63 55 136 85 114
100. 64 32 128 62 136 143. 65 68 165 49 132
!01. 52 50 167 75 123 144. 48 70 138 58 !01
102. 84 40 132 64 108 145. 86 44 140 65 125
103. 44 59 151 88 119 146. 77 28 140 97 129
104. 74 51 158 93 119 147. 59 42 128 79 119
105. 75 61 120 95 110 148. 67 81 161 94 144
106. 78 61 127 52 122 149. 79 44 139 55 !09
!07. 77 56 149 74 126 150. 54 39 136 73 141
108. 67 35 159 88 119 15 l. 46 44 144 66 111
109. 59 47 134 87 116 152. 75 45 145 83 122
llO. 53 34 124 51 11 O 153. 57 64 128 42 108
111. 48. 56 129 79 !09 154. 59 26 157 83 94
l 12. 66 44 139 54 118 155. !07 26 189 81 110
113. 42 59 130 81 119 156. 86 32 130 60 111
114. 70 64 138 79 100 157. 50 50 156 67 114
115. 34 43 119 70 116 158. 57 42 141 95 107
116. 92 51 164 78 123 159. 56 60 148 41 117
117. 69 55 161 85 135 160. 68 53 148 112 138
118. 72 44 117 64 111 161. 58 44 158 67 117
119. 76 . 74 136 78 125 162. 72 46 165 68 .,
¡,-
120. 72 40 137 77 95 163. 84 35 154 56 129
121. 76 55 151 48 97 164. 46 34 164 50 113
122. 64 38 144 50 122 165. 77 52 161 91 94
123. 64 52 140 74 126 166. 66 36 125 55 127
124. 62 49 131 91 119 167. 95 53 129 69 121
125. 62 47 141 78 115 168. 31 43 161 88 117
126. 56 48 133 67 109 169. 65 69 153 114 101
127. 74 49 125 86 118 170. 45 31 133 85 122
128. 88 32 157 92 131 17 l. 60 71 145 49 112
129. 75 60 156 50 131 172. 103 79 168 48 120
130. 82 30 168 57 108 173. 80 62 149 102 !09
13 l. 89 55 154 64 104 174. 68 63 153 54 107
132. 58 71 140 76 112 175. 79 75 140 73 !00
133. 93 45 128 73 120 176. 78 40 128 54 102
134. 76 36 131 68 89 177. 70 48 121 65 81
135. 91 51 166 75 88 178. 90 20 134 77 124

432 433
Ntin1ero Individuos con la enfermedad Nún1ero Individuos con la enfermedad
de observación Ni11g1111a A B e D de observacüJn Ninguna A B e [)

179. 66 39 166 80 134 222. 114 62 153 60 98


180. 88 73 186 84 223. 60 43 ¡•9 113
118 º- 64
181. H 41 138 39 138 224. 63 51 172 81 ]2.S
182. 78 79 164 92 2'). 72 41 151 70 !-12
150 -º·
18::i. 74 58 130 68 177 226. 89 66 139 136
184. 42 40 165 105 142 227. 34 54 109 'º54 !::17
185. (i ! 66 11 1 79 112 228. 88 50 146 65 1 [O
186. 66 42 MI 84 112 229. 73 6j 135 44 128
187. 69 54 124 66 93 230. 82 35 121 (')
>. 115
188. 6ti 61 134 49 l (6 231. 68 72 160 58 109
189. 61 50 135 91 124 232. 80 54 l.J.9 71 113
190. 65 89 129 65 129 233. ,:c¡g 72 !Jfi 48 147
19 l. 44 62 145 54 103 234. 65 39 168 65 127
192. 69 61 165 49 104 235. 64 • 45 170 76 !07
19:J. 77 39 168 76 158 236. 98 64 132 7:'I 130
194. 69 38 129 78 118 237. 56 60 ll!'l 76 97
195. 51 86 144 91 123 238. 57 76 160 51 r:i2
196. 73 H 133 42 140 239. 48 37 168 62 12-1
197. 88 46 129 97 14 7 240. 67 55 [fil 84 137
198. 78 63 138 57 130 241. 83 15 l 70 71 115
199. 81 44 133 65 242. 58 58 ¡ .").:.
· () 54 J l!J
133
200. 73 47 134 56 125 243. 71 50 161 97 100
201. 60 60 123 68 114 244. 60 47 128 40 103
202. 82 75 135 60 136 245. 59 76 128 89 113
203. 81 36 160 114 121 246. 89 71 159 69 [21
204. 103 57 152 53 130 247. 64 41 170 68 122
205. 91 34 144 75 127 248. 70 57 l:í9 70 154
206. ·56 61 151 66 126 249. 71 fi.':i 159 84 112
207. 57 77 115 77 109 250. 104 64 119 76 101
208. 31 34 137 60 113 25 l. 86 46 147 71 131
209. 62 39 157 78 111 252. 83 72 130 47 99
210. 58 52 159 84 130 253. 81 S7 135 7.¡ 118
211. 60 58 138 74 87 234. 59 3.¡ 158 47 117
212. 65 36 160 63 115 255. 88 66 139 64 ]33
213. 59 49 154 72 137 256. 43 S6 141 8() 112
214. 76 48 178 77 115 257. 48 47 181 M3 1()fi
215. 47 53 128 89 94 258. 47 59 157 48 110
216. 60 33 114 86 114 259. 106 G9 141 78 120
217. 58 71 137 86 122 260. 101 fi4 153 68 102
218. 49 50 129 71 130 261. 73 50 l '.16 58 109
219. - ,. ,, o 73 13:>
220. 71 37 142 82 119 263. 69 41 151 74 105
221. 48 60 145 64 86 264. 88 {j() 141 97 1'2.1

434 435
436 Análisis de la variancia 1 Preguntas y ejercicios de repaso 437

ta -se considera buena, las que siguen una dieta regular y aque11as que siguen
Indi\'iduos con la enfermedad
Nú111ero una pobre. Para cada individuo se dispone tan1bién del valor del ácido fólico Íli
de obsen,ació11 Ninguna A B e D
en glóbulos rojos (AFGR) (en µ 71 /litro de glóbulos rojos). Obtener una mues-
265. 52 48 156 84 111 ira aleatoria simple de tamaño 10 a partir de cada población y determinar si el
266. 60 32 128 92 103 investigador puede concluir que las tres poblaciones difieren con respecto al
267. 76 47 148 86 128 valor medio de AFGR. Utilizar la prueba de Tukey para todas las compara-
268. 83 51 126 81 72 ciones posibles. Sea a= .05 y calcular el valor p. Comparar los resultados con
269. 46 68 117 78 109 los de los demás alumnos.
270. 61 63 148 88 125
271. 91 38 168 68 109
272. 85 63 161 57 91 Nú.n1ero Calidad de la dieta Calidad de la dieta
Nú111ero de
273. 85 62 141 85 113 de obser- Buena Regular Mala
BuellLl Regular Mala observación
274. 64 55 165 72 126 vació11
285 233 174 2. 283 238 190
275. 78 38 161 54 116 l.
314 211 197 4. 311 248 175
276. 67 41 132 66 107 3.
319 199 203 6. 311 236 165
277. 71 68 119 95 109 5.
307 214 171 8. 299 244 195
278. 87 79 102 71 118 7.
290 254 196 10. 281 248 199
279. 79 41 134 104 130 9.
285 241 176 12. 289 240 180
280. 82 69 124 60 125 11.
289 255 197 14. 277 218 178
281. 42 72 139 97 138 13.
282 218 18 i 16. 301 250 180
282. 73 36 136 62 117 15.
283 254 202 18. 322 241 188
283. 97 68 162 71 138 17.
233 174 20. 292 221 190
284. 74 63 148 92 128 19. 274
276 245 200 22. 280 231 194
285. 54 80 140 68 115 21.
312 220 167 24. 289 259 188
286. 61 39 122 57 122 23.
300 219 197 26. 308 227 213
287. 110 49 126 87 84 25.
218 198 28. 291 223 208
288. 79 47 165 68 140 27. 266
294 269 202 30. 285 243 205
289. 45 61 153 66 130 29.
289 232 179 32. 302 231 184
290. 77 77 128 63 114 31.
298 236 217 34. 287 251 211
291. 89 64 151 81 117 33.
252 223 212 36. 275 205 192
292. 80 33 158 90 89 35.
266 228 195 38. 281 240 195
293. 90 48 113 59 130 37.
230 182 40. 303 239 197
294. 77 56 138 41 88 39. 293
281 235 218 42. 246 232 185
295. 62 30 125 62 128 41.
236 208 44. 312 212 236
296. 54 42 142 71 129 43. 302
233 173 46. 28í 229 187
297. 92 61 125 78 115 45. 289
235 194 48. 2í6 263 170
298. 58 37 147 90 115 4í. 297
301 229 195 50. 280 233 215
299. 63 59 134 79 128 49.
304 260 204 52. 285 270 226
300. 75 40 167 70 103 51.
282 215 192 54. 328 233 197
53.
220 205 56. 291 239 190
24. ~uponga el lector que es el asesor estadístico de un investigador en medicina 55. 306
278 226 183 58. 316 220 222
interesado en investigar respecto a las relaciones entre las concentraciones de 57.
212 195 60. 274 226 192
ácido fólico en la sangre de mujeres adultas y la calidad de su dicta. El investi· 59. 311
225 202 62. 311 233 197
gador dispone de tres poblaciones de individuos: aquellas cuya calidad de die- 61. 2:-19
,,
Nli111ero Calidad de la dieta N, d Calidad de la dieta N1ín1ero Calidad de la dieta Calidad de la dietu
de abser- u111ero e N1í111ero de
de obser-
. , _______
vac1onc_ Buena Regular
~ - - Mala ohsen·ación Buena Regular Mala Buena Regular Mala observació11 Bue11a Regtilar Mala
vación
63. 291 240 185 64. 307 246 205 147. 305 224 187 148. 312 262 211
65. 282 254 189 66. 305 214 199 149. 313 241 179 150. 270 261 182
67. 324 239 203 68. 299 241 207 151. 290 242 200 152. 283 220 191
69. 293 210 217 70. 286 2:15 180 153. 254 244 233 154. 269 217 203
7l. 2.78 260 218 72. 295 245 2-16 155. 303 207 197 156. 279 237 207
73. 296 257 186 74. 307 239 207 157. 272 234 193 158. 293 250 177
75. 3!8 254 213 76. 313 229 178 159. 271 242 175 160. 295 249 216
77. 291 229 207 78. 285 254 197 161. 278 254 216 162. 295 228 213
79. 303 229 179 80. 277 238 208 163. 311 234 179 164. 260 235 17-6
81. 277 240 190 82. 287 266 221 165. 273 232 164 166. 322 228 189
83. 299 235 200 84. 272 239 194 167. 319 216 196 168. 314 240 177
85. 296 206 200 86. 288 220 176 169. 306 230 207 170. 283 233 191
87. 294 221 190 88. 298 243 215 171. 278 227 193 172. 300 248 204
89. 287 232 208 90. 298 240 187 173. 319 246 217 174. 302 271 204
91. 289 253 176 92. 282 236 201 175. 265 269 205 176. 284 223 200
93. 307 225 226 94. 290 218 198 177. 305 225 194 178. 306 237 189
95. 265 223 233 96. 297 222 199 179. 273 247 209 180. 299 214 173
97. 296 229 192 98. 289 251 181 181. 286 234 205 182. 269 236 221
99. 287 223 210 100. 288 232 203 183. 259 230 226 184. 282 266 235
!01. 287 243 196 !02. 282 252 202 185. 273 246 207 186. 297 232 189
!03. 269 235 194 !04. 272 250 178 187. 314 214 177 188. 273 271 183
105. 306 204 187 106. 302 230 200 189. 322 261 208 190. 286 254 192
107. 303 228 203 108. 302 222 192 191. 321 228 196 192. 292 229 203
109. 305 239 246 110. 300 232 197 193. 298 230 181 19-l. 299 240 183
111. 271 240 201 112. 274 230 203 195. 294 225 208 196. 300 246 182
113. 278 220 195 114. 316 237 197 197. 313 255 208 198. 279 252 196
115. 271 206 191 116. 281 250 196 199. 282 258 174 200. 276 229 196
117. 296 239 198 118. 281 262 212 201. 325 238 190 202. 296 233 178
119. 323 227 183 120. 301 249 174 203. 289 236 174 204. 311 232 216
12l. 297 232 190 122. 288 222 231 205. 314 230 2[3 206. 303 210 212
123. 299 223 214 124. 296 212 167 207. 302 242 241 208. 328 237 192
125. 289 239 195 126. 309 227 200 209. 302 228 182 210. 301 243 205
127. 279 231 203 128. 319 212 182 211. 309 222 186 212. 300 269 187
129. 300 263 180 130. 304 220 187 213. 277 252 185 214. 309 247 209
131. 289 245 174 132. 321 231 164 215. 307 234 188 216. 331 220 191
133. 288 254 188 134. 274 221 204 217. 288 265 173 218. 285 208 190
135. 282 231 203 136. 291 254 182 219. 277 223 211 220. 308 224 180
137. 300 224 221 138. 287 262 190 221. 291 226 193 222. 274 223 212
139. 321 227 172 140. 297 236 199 223. 306 238 192 224. 324 230 194
141. 281 231 l 2 42 286 22.3. 2-1 226 lS'> 926 290 29 6 9 13

143. 317 269 197 144. 300 232 217 227. 298 232 191 228. 271 248 182
145. 297 229 181 146. 324 245 198

438 439
Nún,ero 1 Pregu11tas y ejercicios de repaso 441
Calidad de la dieta Calidad de la dieta
de ob~·er· Ni1n1ero de
vación Buena Regular Mala obsen·ació11 Buena Regular Mala N1i111ero Calidad de la dieta Calidad de la dieta
Nú111ero de
de obser·
229. 295 243 214 230. 325 246 227 Buena Regular Mala observación Buena Regular Mala
vación
231. 311 250 193 232. 322 256 207
233. 328 258 190 234. 302 311. 308 220 186 312. 272 225 188
204 222
235. 281 251 218 236. 295 240 313. 313 228 190 314. 301 251 175
199
237. 299 244 204 238. 302 315. 274 225 206 316. 294 232 214
258 186
239. 289 218 212 240. 317. 301 250 202 318. 283 226 210
312 238 203
241. 273 222 189 242. 298 319. 291 242 193 320. 285 243 173
250 177
243. 303 234 193 244. 321. 277 242 168 322. 308 249 213
324 261 191
245. 291 252 181 323. 301 259 192 324. 309 234 210
246. 316 227 176
325. 276 226 195 326. 276 250 222
247. 309 262 206 248. 258 227 194
327. 280 229 217 328. 302 262 214
249. 331 236 208 250. 306 229 217
329. 286 246 191 330. 305 258 198
251. 289 234 203 252. 302 260 222
331. 278 234 192 332. 292 210 236
253. 282 226 204 254. 310 218 213
333. 266 248 188 334. 295 233 174
255. 320 231 209 256. 297 226 199
335. 302 237 199 336. 285 238 178
257. 316 260 209 258. 289 224 192
337. 286 255 194 338. 284 222 216
259. 307 234 191 260. 307 249 191
339. 296 229 214 340. 285 261 184
261. 297 229 197 262. 283 229 187
341. 297 209 191 342. 295 244 192
263. 284 258 199 264. 285 232 204
343. 299 240 208 344. 299 209 210
265. 300 220 203 266. 306 224 190
345. 331 221 202 346. 288 202 189
267. 288 223 189 268. 292 249 228
347. 314 213 191 348. 273 237 218
269. 294 223 200 270. 283 261 199
349. 295 248 200 350. 284 245 196
271. 305 257 186 272. 271 245 215
273. 290 230 190 274. 279 247 192
275. 305 227 188 276. 298 251 199
277. 292 25. Trescientos cincuenta hombres adultos con edad entre 30 y 65 años participa·
215 208 278. 301 227 203
279. ron en un análisis para investigar la relación entre el consumo de carne y las
279 235 187 280. 286 224 208
281. 294 concentraciones de colesterol. Cada individuo comió carne de res como único
237 210 282. 298 255 184
283. 315 240 alimento durante 20 se111anas, carne de cerdo como único alimento durante
191 284. 300 258 209
285. 273 otras 20 sen1anas y pollo o pescado co1no único alimento durante 20 semanas
245 199 286. 303 224 197
287. 284 225 más. Al final de cada periodo se n1idieron las concentraciones de colesterol
224 288. 286 236 213
289. 317 (mg/100 mi) en cada individuo. Los resultados se muestran en la siguiente
253 191 290. 32 l 240 188
29 l. 292 217 204 292. 290 tabla.
219 184
293. 283 216 176 294. 301 240 187
295. -9>0."i 226 185 296. 294 Dieta Dieta
226 192
297. 292 242 202 298. 284 219 167 Pollo o Pollo o
299. 295 234 198 Individuo Res Cerdo pescado Individuo Res Cerdo pescado
300. 293 253 208
301. 268 253 201 302. 288 220 193 197 222
l. 241 245 249 2. 218
303. 291 258 167 304. 276 245 187 162
3. 261 199 221 4. 190 215
305. 244 233 192 306. 285 236 206 5. 238 191 207 6. 256 182 193
307. 302 243 183 308. 273 232 196 7. 248 160 205 8. 224 180 227
309. 328 227 200 310. 313 256 193 238 180
9. 225 208 203 10. 227
11. 178 114 200 12. 185 209 154

440
1
Dieta Dieta Dieta Dieta
Polio o Pollo o Pollo o Poll(/0-
Individua Res Cerdo pescadu /ndh·iduo Res Cerdo pescada Individuo Res Cerdo pescado Individua Res pescado
Cerdo

1' 13.
15.
194
221
225
187
211
169
14
16.
224
211
271
169
204
27 l
95. 229 125 242
238
96.
98.
198 206 233
9i. 179 206 234 234 227
17. 241 197 204 !.'l. 164 141 188 99 230 213 220 100. 227 219 202
19. 169 208 202 20. 215 226 166 250 102. 162
2 l. 268 _,
29' 176 22. 181 209 147
10 l.
103.
239
220
217
203 191 104. 232
204
240
183
224
23. 203 212 192 24. 180 19..Jc 179 105. 209 212 218 106. 201 182 208
25. 2UH 213 203 26. 99·
27. 216 175 251 28.
18i
182
-- ' l 76 107. 219 202 198 108. 162 160 140
163 193 109. 251 225 255 110. 214 189 198
29. 192 222 146 30. 271 166 112.
209 11 1. 222 189 229 201 267 213
31. 235 202 212 32. lfj6 222 114. 14 7
193 113. 149 151 203 178 192
33. 218 207 179 34. 193 238 116. 217
233 115. 258 184 227 235 211
35. 168 220 223 36. 184 214 176 117. 213 226 229 118. 181 211 207
37. 212 202 216 38. 268 179 163 198 120. 155 231 195
119. 154 206
39. 252 217 216 40. 233 206 228 183 230 122. 196 2.51 198
12 l. 214
41. 175 186 225 42. 202 208 188 182 124. 246 164 9--
123. 177 190 .00
43. 259 191 227 44. 195 172 205 232 231 126. 242 197 198
125. 199
45. 198 212 198 46. 152 195 181 265 128. 196 216 235
127. 240 201
47. 212 217 217 48. 245 230 227 218 1·30. 216 193 183
129. 264 171
49. 243 251 272 50. 176 246 203 238 132. 179 197 170
13 l. 194 206
51. 217 190 177 52. 160 222 204 222 134. 190 231 245
133. 219 202
53. 222 227 158 54. 190 212 259 150 136. 234 213 236
135. 243 216
55. 250 237 217 56. 269 186 215 177 138. 216 267 176
137. 159 253
57. 187 198 188 58. 136 283 209 238 161 140. 166 210 245
139. 181
59. 194 236 233 60. 210 242 178 213 142. 260 201 294
141. 193 296
61. 213 175 273 62. 227 216 190 169 144. 198 134 185
143. 184 237
63. 201 133 239 64. 229 211 205 195 146. 177 217 207
145. 156 233
65. 239 244 205 66. 209 263 171 197 148. 190 218 224
147. 210 208
67. 196 214 253 68. 206 213 194 234 268 150. 194 211 215
149. 186
69. 173 187 154 70. 188 173 174 210 152. 193 198 281
151. 204 242
71. 214 216 188 72. 225 202 182 194 154. 200 199 240
153. 191 276
73. 251 168 220 74. 191 198 170 155. _,,
9-- 220 226 156. 193 252 186
75. 203 203 174 76. 218 229 205 171 158. 198 253 208
157. 204 254
77. 260 181 201 78. 191 198 249 160. 197 186 217
159. 198 222 244
79. 172 264 180 80. 194 166 199 198 162. 192 227 217
161. 193 214
81. 213 206 218 82. 239 226 199 164. 207 173 199
163. 228 211 165
83. 185 218 176 84. 193 254 229 166. 246 228 222
165. 210 175 179
85. 175 231 234 86. 171 151 155 168. 176 180 246
167. 205 189 168
87. 196 206 247 88. 206 239 170. 129 194 199
188 169. 215 229 228
89. 176 233 201 90. 193 236 217 221 217
266 171. 177 185 193 172.
2.:>.:> 202 2.:>.? 92. 180 207 243 173. 222 194 192 174. ------rnr---196 l I j"
93. 203 263 181 94. 162 221 176. 125 229 171
249 175. 225 154 251

442 443
Dieta Dieta
Dieta Dieta
Pollo o Pollo o
Pollo o Pollo o Individuo Res Cerdo pescado Individuo Res Cerdo pescado
Individuo Res Cerdo pescado Individuo Res Cerdo pescado
259. 229 168 227 260. 252 181 239
177. 157 189 202 178. 221 239 177 262. 231 206 191
261. 154 198 255
179. 170 200 215 180. 278 251 133 183 264. 211 229 210
263. 165 226
181. 249 211 211 182. 220 201 187 177 266. 228 298 243
265. 243 210
183. 185 208 224 184. 239 201 166 176 268. 179 166 213
267. 188 210
185. 222 191 247 186. 205 175 209 178 270. 158 248 209
269. 229 162
187. 237 199 255 188. 255 213 225 162 272. 233 233 173
271. 180 221
189. 218 219 220 190. 209 173 182 230 274. 211 152 232
273. 206 188
191. 200 228 238 192. 170 203 233 203 276. 208 246 193
275. 264 242
193. 200 175 233 194. 227 270 178 221 278. 214 187 204
277. 250 220
195. 182 213 196 196. 210 188 159 182 280. 212 255 251
279. 239 219
197. 239 222 193 198. 176 187 207 175 282. 234 26 l 172
281. 214 207
199. 237 185 203 200. 229 188 209 173 284. 229 224 217
283. 215 173
201. 172 171 190 202. 188 200 215 155 286. 201 238 203
285. 198 213
203. 245 241 254 204. 172 240 239 288. 170 178 218
287. 156 235 215
205. 232 238 193 206. 234 180 206 290. 190 188 204
289. 207 204 165
207. 245 184 219 208. 165 221 285 292. 213 213 204
291. 225 226 254
209. 225 168 264 210. 234 228 192 294. 237 198 244
293. 208 204 201
211. 241 213 175 212. 178 200 261 296. 170 203 211
295. 177 232 203
213. 197 271 216 214. 215 191 131 298. 231 209 190
297. 193 243 208
215. 240 140 227 216. 203 197 200 300. 185 181 200
299. 189 200 196
217. 157 187 231 218. 200 234 137 302. 237 188 177
301. 169 194 223
219. 247 219 200 220. 205 178 187 304. 160 213 195
303. 237 182 173
221. 179 198 163 222. 215 210 164 306. 165 157 260
305. 163 224 220
223. 208 202 208 224. 225 244 217 308. 200 2'.~4 193
307. 241 223 216
225. 200 237 163 226. 165 213 210 310. 170 203 233
309. 211 177 224
227. 207 228 206 228. 178 249 177 312. 280 241 190
311. 178 201 153
229. 173 132 210 230. 160 195 266 314. 194 187 258
313. 254 207 237
231. 224 203 199 232. 246 230 203 316. 232 211 250
315. 162 258 163
233. 134 224 247 234. 228 190 239 318. 190 219 131
317. 152 219 223
235. 209 176 157 236. 193 231 203 320. 228 207 15~
319. 228 l lO 210
237. 192 223 197 238. 193 211 229 322. 170 178 202
321. 270 233 225
239. 238 167 199 240. 244 193 185 324. 216 199 25:)
323. 216 245 189
24 l. 228 276 187 242. 258 239 269 326. 237 224 282
325. 212 165 185
243. 224 185 199 244. 231 214 218 :128. 193 229 1:'19
327. 227 185 166
245. 207 220 162 246. 172 190 186 219 '.)30. lt\2 222 159
329. 285 229
247. 234 187 190 248. 245 156 258
331. 236 171 174 3'.12. 217 2-10 ..,
oo-
249. 206 240 209 250. 196 179 186 213 :~:l-l. 180 160 1~2
'.133. 260 218
251. 199 176 236 252. 219 205 200 186 :tHi 200 156 216
3'.'15. 224 132
253. 186 272 220 254. 168 221 211 :tHl. 118 211 221
337. 216 19-1 215
255. 264 194 203 256. 176 196 217 224 :~-10. 171 21-l I K~l
339. 177 186
257. 202 212 143 258. 169 216 225

445
444
446 Análisis de la variancia Bibliogru}i'c1 447
Dieta 2. R. A. F1s1-u~R. C111lfrih11tio11.1· to l\tf(lthen1atical Statistics. Wiley. Nueva York,
;i) Dieta
Pollo o 1950.
Jndivid110 Res Cerdo Pullo o
pescado Indiriduo Re, 3, RONALD A. F1SHER. Srati.l"fical 1\1etl1ods for Resc:1rch \.Vorkers, 11.° edición.
Cerdo pescado
Hafner, Nueva York. 1958.
341. 230 175 214 342.
r
240 167 216 4. WrLLIAJ\l G. COCHR.-\:\ y GERTRL'DE lvl. Cox. Experilnentaf Designs. \Vi!ey.
343. 210 202 223 344. 260 18 l 178 Nueva York. 1957.
345. 220 233 192 346. 202 196 140 5. D. R. Cox, Planl/ing r~fExperi111e11rs. \\'ilcy, Nueva York, 1958.
347. 157 201 243 348. 194 189 178 6. Ü\VEN L. DAVIF.S (ed.J. The Desig11 cmd A11afysis of Experi111e11ts, Hafner. Nue·
349. 150 195 212 350. 205
-- '
99"'
141 va York. 1960.
7. WALTER T. FF.RF.DF!L Experin1e11tal /Jesign. Ivlacmillan. Nueva York. 1955.
8. D. J. FINNF.Y. E.rperi111e11ud f)esign a11d /r.1· St(lfisticaf Basis. The University of
Seleccionar una muestra aleatoria simple de 10 individuos a partir de los Chii.:ago Prcss. Chi...:agP. l 955.
350. Utilizar un análisis bilateral de variancia para determinar si es posible 9. PETER \V. !'vi. JnH:--. Stati.wical l)esig11 and A11af_r.1·is of Experi111e11ts. rvtacmillnn,
concluir que existe diferencia en la concentración media de colesterol de !a Nueva YPrk. 1971.
población según las tres dietas. Sea a == .05. Comparar los resultados con los 10. ÜSCAR KE1'-1PTHOR.,f-.. Tite Desig11 01.<d A11a!ysi.1· of Experi111e11ts, Wi[ey. Nueva
de !os de1nás alumnos. York, 1951.
26. En un estudio de la relación entre el hábito de fumar y las concentraciones de 11. C. C. L1. /11trod11ctio11 ru Experi111e11taf Srotisrics. l\1cGraw-Híll, Nueva York.
colesterol liporrotéico de alta densidad (CLAD) se obtuvieron los siguientes 1964.
datos (codificndos para fncilidad de cálculo) a partir de muestras de hombres 12. \V11.LIA.\I P,-fE\DE:\H.-\1.L. ll/rroduction to Linear A4ode!s and the Design and

aduhos no fumadores, ligeramente fumadores, fun1adores moderados y alta- Ancdysis of Experi11l('llfS. \-Vads\vorth. Bc!rnonl. Cal .. 1968.
mente fumadores. Se desea saber sí estos datos proveen suficiente evidencia 13. CHL'RCHII.L EISE:\H.-\RT. ··Thc Assun1.ptinns Undcrlyíng the Analysis of

para indicar que las cuatro poblaciones difieren con respecto a las concentra- Variance ... Bio111erric,. 21 ! 1947l. J-21.
ciones medias de CLAD. La probabilidad de cometer un error de tipo I es de 14. W. G. CoC"HR.-\, ... S\llllL' Cnnscqucni.:cs \\'ben the Assumptions for che
.05. Si se encuentra una diferencia significativa global, determinar qué pares An,1 lysi~ ol' \' ari:uh.:~· ..\rL' N\1( SatisficLI". Bio111errics. 3 ( 194 7). 22-38 .
de media~ indi1·iduales de las muestras presentan una diferencia significativa. 15. tvl. B. \\'JLK y O. K~\IPT!-IOR\F.. "Fixcd. i\lixcd and Random l\.1odels". Joun1al
of du: A111crica11 Srurisrical As.w1cii:1rio11. 50 ( 1955 J. 1 ! 44-1167.
r,. .. ..J:~:~- -1 n
16. S. L. CRU.\IP. "Thc Estilnation of \'ariani.:c Con1ponents in Analysis of
Variancc··. Bio111erric.1·.1 (1946). 7-1 l.
17. E. P. Cu1x:-:1~GHA.\I y C. R. HE"IDF.RSO.-.;, ",A..n lterative Procedure far Estimating
Fixcd Effci.:ts ancl \'aríance Coznronents in rvtixed l\.·todel Situations", Bio-
111etrics. 2-1 ( 196gJ, 13-25.
18. C. R. Hté:-.DERSo.,. "Estini.Hinn nf Variance nnd Covariance Cornponcnts".
Bio111etricx. 9 ( l tJ~:; 1. 22(1-252.
19. J. R. RL'THl:i{Hll!TJ. ··A l\ptc un \'nrian~·c in the Co1nponents ofVariance
rvtodcl". T!w .-\n11:rin111 Srari.1ticio11. :!5 l_iunio !971 ). l. 1.
20. E. F. SC'HL"I Ti'. J1,. "Rules of Thun1h for Dctcnnining Expectations ofl\1ean
Squarcs in ."'.11:ily~i-. p¡'\'ari:H1CL'··. Riu111,·1rics. ! I ( 1955). 123-135.
21. S. R. SE,\Rl.~-- ··Tupis:-. in \'ari~1ncc Cun1roncnt Estimation". Bio111errics. 27
BIBLIOGRAFÍA _ _ _ _ _ _ _ _ _ _ _ _ _ _ __ (!971). 1-76.
22. ROBFRT G. D. Sri:H. y J-\.\IF~ H. ToRRIE. Principies and Proced11res of Sta-
Obras citadas tisrics. t-.f...:Gr,111·-(-f1!I. Nue1·a Y,1rk. 1960.
2::\ Ü:\\"IP B DL-'\C.\\". Si,,11ifict111ct Tcst.1· (or Dif{erences Ber11·ee11 Rc111/..:ed
l. R. A. FISHER. T/11: De.1ig11 r~(Experi,nenrs. 8." edición. 01ii·er and Bovd. Edin- Vc1rit11cs {)nnrn fi·o111 ;\'11r111nf Po¡111/ario11J. Ph.D. Thcsis (1949) ln1va State
burgh. 1966. ' Co!lcgL' ..0\111cs. 1171,jg.~.
Análisis de la variancia Bibliografía
449
448
24. DAVID B. DUNCAN, ··.A.. Significancc Test for Differences Between Ranked 44. JOHN MANDb.L, .. A Ncw Analysis or Variancc Model for Non-Additive Data"',
Trcatmcnts in nn An:1!ysis of YariJ.nce'', Virtinia Jo11r11al of Scie11ce, 2 (1951 ), Tech110111('lrics. /3(1971).1-18.
171-189. 45. A. W. K1MHALL, "On Dcpcndcnt ·rcsts of Significancc in thc Analysis of
25. DAVID B. DuNCAN ... On thc Properties of the Multiple Co1nparisons Test''. Variancc ... A,111(1/s r!( Mo1h,·nu1tical Stotistics, 22 ( 195 1). 600-602.
Virginia Jo11nud of Science. 3 ( 1952), 50-67. 46. WLLFRED J. DlXON y FRANK J. MASSEY. lntroduction to Statisticaf Analysis,
26. DAVID B. ÜUNC'AN, .. Muhiplc Rangc and Multiple-F Tests", Bio111etrics. / J 4." edición. McGraw-Hill. Nueva York. 1983.
(1955), 1-42. 47. WtLL!A~·1 C. GUENTHER, Anolysi.1· <!(Variance. Prcntice-Hall, Englcwood Cliffs,
27. C. Y. KRAMER, ·'Extension of Multiplc Range Tests to Group Means with N.J., 1964.
Unequal Nu1nhcrs of Rcplications'·, Bio,netrics, 12 ( J 956), 307-31 O. 48- BERNARD ÜSTLE y Ll~llA c. MALO,°\E, Statisrics ÍI/ Rescarch, 4." edición, The
28. C. W. DUNNETT ... A l\1ultiple Co1nparisons Procedure far Comparing Severa] Iowa SLatc Univcrsity Prcss, An1cs. Iov.ra. 1988.
Treatmcnts v:ith a Control". Jo11rnnl of rhe A111erica11 Statistical Associario11, 49_ W!LI.IAM ALEXANDER GLENN y CLYDE YouNG KRAMER ... Analysis of Variance
50(1955). 1096-1121. of a Randon1izcd Block Dcsign wilh Missing Observations'', Applied Statistics,
29. C. W. DUNNETT. "Ne\v Tables for Multiple Cornparisons with a Control", 7(1958), 173-185.
Bio111etrics, 20 (1964 ). 482-491. 50. CLYDE YOUNG KHAMER y SUZANNE GLASS, "Analysis of Variance of a Latín
30. J. W. TUKEY, "Comparing Individual Means in the Analysis of Variance", Square Design \Vith Mi~sing Obscrvalinns", Applied Staristics, 9 ( 1960), 43-50.
Bio111etric.1·, 5 ( 1949). 99-114. 51. HUGH RnBERT BAIRD y C1.YDE YouNG KRAMER. "'Analysis ofVariance of a
31. J. W. TUKEY. "'The Problem of Multiple Comparisons", Dino, Princeton Balanced Jncoinp!ctc Block Dcsign \\'Ílh Missing Obscrvations". Applied
Univcrsity. 1953: citado en Roger E. Kirk, Experin1ental Design: Procedures Suai.Hics. 9 ( 1960), 189-198.
fur the Beha1·ioral Scicncl's. Brooks/Cole. Belmont, Cal., 1968. 52. M. H. QL'L'.\ol.:11.1.1-:. /ntrod11c101:r Stalislics. Pcrg:.nnon. Londres. 1950.
32. D. NE\VMAN ... The Distrihution of the Range in Samples fron1 a Normal Popu- 53. RoBERT R. SoK,\I. y F. JA;'.!ES Rolil.1-", /:lirnnetry, 2.° edición, W. H. Free111an.
lation in Terins oran lndepcndcnt Estimate of Standard Dcviation", San Francisco. 1981.
Bio111etrik(I, 3 ! ( 1939). 20-30.
54. S. C. PEARCE. /Jiolo;.;ical Stoli.\lics: An /11trod11ction. McGraw-Hill. Nueva
33. M. KEULS. "Thc Use of the S1udcnLized Range in Connection with the Analysis
York, 1965.
ofVariancc". E11pli_rtica. I (1952). 112-122.
55. M.S. 8ARTLETr. ··Thc Use ur·rransfonnations'', Bio111etric.1·, 3 (1947). 39-52.
34. HENRY SCHEFPÉ. "'A ;\1ethod for Judging Ali Contrasts in the Ana!ysis of
56. AGNES M. H1-_1(/.HI-_HG y D. R. Cox. "'Reccnl Work on thc Design of Ex-
Variancc'·. 8in111ctrika . ..Jn ( 1953 ). 87-104. pc.ri1ncnt:-.: A Bihliography anU a Revie\v··. }011r11af <~f the Royal Stalistical
35. HENRY SCHEFF~:. Ana/ysi.1· of \loriance, \Vi ley, Nueva York ( 1959). SocÍl'fY (Serie A). 132 ( l 969 J. 29-() 7.
36. T. A. BAt\'CROFT. Topics in huernu:diate Statistical Methuds, Volumen I, The
lo\.va Stmc Univcrsity Prcss. Ames.·1968.
37. WAYNE \V. D,\!\"IEL y CAROL E. COOGLER, ··scyond Ana!ysis ofVariance: A Otras publicacio11e.\'
Comparison of So1nc ~,fultiple Coinparison Procedurcs", Physical Therapy. 55
1. GEOl-1-REY J\1. CI.Al<KI-.. Sto1is1ics and Experi111c111af Design. An1crican Else\'icr,
(1975). 144-150.
38. B. J. \Vi:,,.'ER, S1u1i,1ticol Principies i11 Experi111enta! Desig11, 2.ª edición. NuevaYork.1969.
McGr,l\v-Hill. Nuc\'a 'fork. 1971. 2. RICHARD A. ÜA\lO:\. Jis. y \VAi.TER R. HARVEY, E.rperi111ental De5ign, ANOVA,
39. \VAYNE \V. ÜA!',;IEL. A/ultiple Crnnpe1riso11 Procedures: A Selected Bibliogra- and Regrel'sion. Harpcr & Rn\.V. Nueva York. 1967.
phy. Vanee Bihliographics. t\Ionticcl!o. 111.._junio 1980. 3. M. N. D..i.s y N. C. Grn1. /Jesign and Ana/y.lis r~( Experi1ne11Ts. 2.3 edición.
40. E!-HL SPJOT\"OU. y J\.11CHAE!. R. STOL!NE, .. An Extension of the T-Mcthod of \Vilcy. :-.:uc\·a York. !986.
Multiplc Co1np:.1ri~on to [ncludc thc Cases \.\"ith Unequal Sa,nple Sizes ... 4. D. J. F1;,,;,1-:Y. An /11trorl1u·tio11 r,, the Thcory r!f Experi111e11tal Design. Thc
Journaf ofthe A111ericc111 St(lfisTical A.1·)·ociatio11. 68 (1973), 975-978. Univer:-.ity (>f Chic:1g() !'re~"· ('hica_l:'(). 1960.
41. R. A. F!SHF.R, .. Thc Arrangcn1cnl of Ficld Experiments", lo11r11af of Ministry of 5. CHARl.1-'S R. HJCK'>. F11ndl111u'nlul c·1111cepts in thl' /Je.l"i¡:n E,:peri111e11ts, 2.3 edi-
Agriculture, 33 1J926J. 503-513. ci(in. Ho!t. Rincharl & \Vin,-.Lon. Nueva York. 1973.
42. R. L. A!'\DEksos y T. A. BA."CROFT. S!atisticol Theory in Research, McGraw- 6, YOSl-:f HOCIIHl.ll(i y 1\JIT c. TA\1!1-\'.\E. /1/11/tiple Co111pari.1·011 Protedt1r('S, Wi-
Hill, Nueva York. 1952. lcy. Nw.:Y:1 Y(lrk. 19K7.
43. J. \V. TVKEY ... Onc Dcgrcc of Frecdon1 for Non-Additi\'ity", Bio111etrics, 5 7. G1-.01-1·Rl·.Y K1.1•1·1 t.. /)csi<..:11 nnd A11ril_r.1il'.· A Rr·.1·c!1rchcr's H<111dhook, Prcn1ice-
(1949). 232-24:!. Hall. Engli.:\\"(H)d ('lill,-.. N.J .. 1973
'1
1 450 Análisis de la variancia Bibliografía 451
8. ALAN J. KLOCKARS y GILBERT SAX, Mu/tiple Co111parisons, Sage, Beverly
Hills, Cal., 1986. 11. K. L. Q. REA!l. "ANOVA Prohlc1ns \VÍLh Sin1plc Numbers", The A111erica11
Srati.1·ricia11. 39 ( 1985 ). 107-1 r l.
9. WAYNE LEE, Experi111e11tal Desig11 and A11alysis, W. H. Freeman, San Fran-
cisco, 1975. 12. KEN SIROT:\IK. "On Lhc f\.1caning ni' thc Mean in ANOVA (or the Case of the Mis-
sing Ocgrcc of Frccdun1J". Tl,e A111crica11 Sratisrician, 25 (octubre 1971 ), 36-37.
10. HAROLD R. L!NDMAN, A11a{_rsis of Variance in Co111p!ex Experi111enral Designs,
W. H. Frccn1an. San Francisco, 1974. 13. D.-'1.VID !'vi. STCINBERG y Wi!.LI.-\~! G. HUNTER. "Experimenta[ Oesi!!nS: Rcview
and Con11ncnt" ( con coincntarios l. Tec/11un11erric.1·, 26 { [986 ). 71 -130.
11. RUPERT G. MrLLER, JR., Sin111lta11eo11s Statisrica! l11Jere11ce. 2.ª edición, Sprin-
ger-Yerlag, Nueva York. 1981. 14. RAYA. \\'.-'1.i.LER y 0.-'I.VID B. Dlii'iCA'.\. "A Baycs Rule for the Syn1n1ctric Mul-
tiplc Co1nparisons Pnihlcrn". l1111nud (!/' thc A111erica11 Statistical Associatio11.
12. DüUGLAS C. ~IONTGOMERY, Design and A11alysis of Experi111e11ts, Wiley, Nue-
va York, 1976. 6.f. ( 1969 ), J 484-1 50.i.

13. lOHN NETER y \VrLLIA/1.I \VASSERMAN. Applied Linear Statistical Mode{s, Irwin,
Home\vood, Ill .. 1974.
Revistas y art{culos
14. E. G. ÜLDS, T. B. M,i.TTSON y R. E. ÜDEH. Nores 011 the Use of Trans-
fo1rnatio11s i11 the Anal,L~is of Variance, \VADC Tech Rep 56-308. 1956,
Wright Air Dcvelop,nent Center. t. HEA SooK K1~1. A Pracfit·ld Cuide to thc Jl,lultiple Co111parison Procedures,
tvlaster"s Thcsis, Gcnrgia Statc Uni1·érsity, Allanta. 1985.
IS. ROGER G. PETERSON, Design and Analysis of Experi111e11ts, Marcel Dekker,
Nueva York, 1985.

Bibliografía co111ple111e11taria

l. BENJAM[N A. BARNES. ELJNOR PEARSON y ERJC Rr;:1ss, "The Analysis of


Variance: A Graphica! Representation of a Statistical Concept ... lour11a! of the
Anterican Statisrical Associalion, 50 (1955), 1064-1072.
2. DAVID B. DUNC'AN ... Bayes Rules for a Common Multiplc Con1parisons
Problem and Rclated Student-! Prob[cms", Annals of ft.Jathentatical Statistics.
32 (1961), 1013-1033.
3. DAVID B. DUNCAN, ''A Bayesian Approach to Multiple Con1parisons", Tech-
no111etrics, 7 (1965), 171-222.
4. ALVA R. FEINSTEIN, "Clínica! Biostatistics. JI. Statistics Versus Science in the
Design of Experin1ents", Clinica! Phannacology and Therapeurics, 11 ( 1970).
282-292.
5. B. G. ÜREENBERG, "\Vhy Randomize'?, Bion1etrics, 7 ( 1951 ). 309-322.
6. M. HARRJS. D. G. HoRVJTZ y A. 1-1. Mooo, ··on the Determination of Sample
Sizes in Designing Experiments''. lournal of rhe Antt!rica11 Sratistical A.s-
sociatio11. 43 ( 19-1,8). 391-402.
7. H. LEON HARTER, "Mu!tip[e Comparison Proccdures for Interactions". The
American Statisticia11. 2.f. (dicienibre 1970), 30-32.
8. CARL E. HOPKl,'\S y ALAN J. ÜROSS, "'Significance Levcls in Mu!tip!e Com-
parison Tests", Hcafl/¡ Scn:ices Research, 5 (verano 1970). 132-140.
9. RlCHARD J. LIGHT y BARRY H. tvfARGOLIN. ''An Ana]ysis of\'ariance for Catego-
-----------Fiffil----Da~trt.t.! vf 1he An,eiican Stad::,dcu¡ A.\'SO( iallon. 60 ( 19 / 1), 534-:,4-1. 1 --~
10. STUART J. PococK. "Current Issues in the Design and Interprctation of Clinical
Trials", British Aledical Jo11r11a!, 290 ( 1985), 39-..J2.
8
Regresión y correlación simple

8.1 INTRODUCCIÓN--------------

Al analizar los datos en las disciplinas que conforman las ciencias de la


salud, con frecuencia es conveniente obtener algún conocimiento acerca de i
la relación entre dos variables. Por ejemplo, es posible que se tenga interés
en analizar la relación entre presión sanguínea y edad, estatura y peso, la
concentración de un medicamento suministrado y la frecuencia cardiaca, el
nivel de consumo de algunos nutrientes y la ganancia de peso, la intensidad 1¡,1
de un estímulo y el tiempo de reacción, el ingreso familiar y los gastos
médicos. La naturaleza e intensidad de relaciones entre variables como las
anteriores son. examinadas por medio de los análisis, de regresión y corre·
lación, que son dos técnicas estadísticas que, aunque están relacionadas, sir-
ven para propósitos diferentes.
El análisis de regresión es útil para averiguar la forma probable de las
relaciones entre las variables, y el objetivo final, cuando se emplea este
método de análisis, es predecir o estilnar el valor de una variable que co-
rresponde al valor dado de otra variable. Las ideas de regresión fueron
expuestas por primera vez por el científico inglés Sir Francis Galton ( 1822-
1911) en sus infonnes de investigación acerca de la herencia, primero en
chícharos y después en la estatura humana.1·3 Afirmó que la estatura de un
individuo adulto durante la etapa de crecimiento acelerado, sin importar si
desciende de padres altos o bajos, tiende a revertirse hacia la estatura
promedio de la población. Utilizó inicialmente la palabra reversión, y poste-
riormente regresión, para referirse a este fenómeno.

453
454 Regresüín y correlaci<Í11 simple trfodelu de regresión 455

Por otra parte, el análisis de correlación se refiere a la medición de la ajustado no es un requisito para obtener resultados útiles. Los investi-
intensidad de la relación entre variables. Cuando se calculan mediciones de co- gadores deben ser capaces de distinguir entre el caso en que el modelo ele-
rrelación a partir de un conjunto de datos, el interés recae en el grado de gido y los datos son lo suficientemente compatibles como para que puedan
correlación entre las variables. Nuevamente, los conceptos y terminología proceder y el caso en que tengan que rechazar dicho modelo.
del análisis de correlación se debe a Galton, el primero en utilizar la palabra
correlación en 1888. 4 Supuestos que fundamentan la regresión lineal simple Para el modelo
En este capítulo, el análisis se limita a la exploración de la relación de regresión lineal simple son importantes dos variables, X y Y. La variable
entre dos variables. En la siguiente sección se estudian los conceptos y X se conoce por lo general como variable independiente. ya que frecuente-
métodos de regresión y en la sección 8.6 se presentan las ideas y técnicas de mente se encuentra bajo el control del investigador, es decir, los valores de
correlación. En el siguiente capítulo se estudia el caso donde el interés se X pueden ser seleccionados por el investigador para obtener uno o más
centra en las relaciones que existen entre tres o más variables. valores de Y. en correspondencia con los de X. En consecuencia, la otra
Los análisis de regresión y correlación son áreas en las que la rapidez y variable. Y. se conoce como variable depe,1diente, y se habla de regresión
exactitud de la computadora son de gran valor, por lo que los datos para los de Y sobre X. Los siguientes puntos son las suposiciones que fundamentan
ejercicios de este capítulo se presentan de tal forma que pueden ser procesa- el modelo de regresión lineal simple:
dos n1ediante computadora. Como siempre, los requerimientos de entrada y
las características de salida de los programas y paquetes de softv.:are que se l. Se dice que los valores de la variable independiente X son fijos. Esto significa que
utilizan deberán ser analizados con cuidado. los valores de}( son seleccionados previo.mente por-el investigador, de modo que en
la recolección de datos dichos valores no pueden variar. En este modelo, algunos
autores dan a X el nombre de variable 110 aleatoria, y otros, el de variable n1ale·
8.2 MODELO DE REGRESIÓN _ _ _ _ _ _ _ _ _ _ __ tnática. Es necesario señalar en este momento que el enunciado de este supuesto
clasifica :i.l mode!o como 111odelo de regresión clásica. El análisis de regresión tam-
bién puede efectuarse con datos en los que X es una variabte aleatoria.
En el problema típico de regresión, como en la mayoría de los problemas de
2. La variable X se mide sin error. Dado que ningún procedi1niento de medición es per-
estadística aplicada. los investigadores disponen de una muestra de observa- fecto, esto significa que la n1agnitud del error de medición en X es insignificante.
ciones extraída de una población hipotética o real. Con base en los resulta- 3. Para cada valor de X existe una subpob!ación de valores de Y. Para que los pro-
dos del análisis de los datos de la muestra, se pretende llegar a una decisión cedimientos de inferencia estadística de estimación y prueba de hipótesis sean
respecto a la pobl.ación de la que se extrajo la muestra. Por lo tanto, es válidos, estas subpoblaciones deben seguir una distribución nonnal. Para presen-
importante que los investigadores comprendan la naturaleza de las pobla- tar los ejemplos y ejercicios que siguen, se supone que los valores de Y siguen
ciones en las que están interesados. Deben saber lo suficiente respecto a las una distribución normal.
poblaciones para que sean capaces de elaborar un modelo matemático que 4. Todas las variancias de las subpoblaciones de Y son iguales.
la represente o determinar si se ajusta razonablemente a algún modelo ya 5. Todas las medias de las subpob!aciones de Y se encuentran sobre la misma línea
establecido. Por ejemplo, si un investigador va a analizar un conjunto de recta. A esto se Je conoce como suposición de línealidad. Esta suposición se
datos mediante los métodos de regresión lineal simple, debe estar seguro expresa simbólicainente como:
de que el modelo de regresión lineal simple proporciona una representación
µ_,1.~ = a + (3x (8.2,l)
al menos aproximada de la población. No es de esperarse que el modelo sea
una representaci,ó~ fiel de la situación real, dado ~u~ pocas veces se encuen- donde µ _ 1res la media de la subpoblación de valores '._po.ra un valor ~specífico
tra esta caractenst1ca en los modelos de valor practico. Un modelo elabora- 1
de X. y a), p se conocen como coeficientes de regres1on de la poblacion. Geo-
do de forma que corresponda precisamente con los detalles de la situación nlétricamente. a y p representan Ja ordenada al origen y la pe.ndiente de la recta.
es, por lo general, muy complicado para proporcionar alguna información respectivamente. en la que se supone que están todas las medias.
------~-Y.alar Par otra---pm:w-,IGS--f@S-Hlraáes--que---se-6-6ttefleH---a--part-i-r--dekmfrti-s. ------0.--t:os valores } son e3 cadisdcm11c11te ii1depe11die1nes. E11 otras--pal-ttb-ras. al extraer
datos que han sido forzados dentro de un modelo al que no se ajustan tam- la n1 uestra, se supone que los valores de Y obce_nidos para un valor de X de
poco tienen valor. Sin embargo, afortunadamente un modelo perfectamente ninguna manera dependen de los valores de Y elegidos para otro valor de X.
Ecuación de regresiOn de la r11uestra 457
456 Regresión y correlación simple
f(X, YJ
Estas suposiciones pueden resumirse mediante la siguiente ecuación,
llamada modelo de regresión:

)•=a+f3x+e (8.2.2)

donde y es un valor típico de una de las subpoblaciones de Y. a. y Í) son


como se definen en la ecuación 8.2.1. y e se llama término de error. Si se
despeja e en la ecuación 5.2.2. se tiene que

y
e = )' - (a + f3x)

= )' - µ_,·I;,: (8.2.3)

donde se aprecia que e indica la cantidad con la que y se desvía de la media


de la subpoblación de los valores de Y de la cual se extrae. Como conse-
cuencia de la suposición de que las subpoblaciones de los valores de Y si- / ...
guen una distribución nonnal con variancias iguales, las e para cada sub- ,,r ~ "--t-:.:: I/ ':::-:::\
población siguen una distribución normal con una variancia igual a la va-
riancia común de las subpoblaciones de valores de Y.
El siguiente acrónimo es de gran utilidad para recordar muchas de las ,, P11~4
suposiciones nece·sarias para la inferencia en el análisis de regresión lineal: X

Figura 8.2.1. Representación del modelo de regresión lineal simple.


LINI [Linealidad (suposición 5), Independencia (suposición 6),
Normalidad (suposición 3), variancias Iguales (suposición 4)]

En la figura 8.2.1 se ilustra con·una representación gráfica el modelo de mente que están relacionadas en forma lineal. El análisis subsecuente com-
regresión. prende los siguientes pasos:

l. Determinar si las suposiciones que fundamentan la relación lineal se cumplen o


8.3 ECUACIÓN DE REGRESIÓN DE LA MUESTRA _ _ _ __ no en los datos disponibles en el análisis.
2. Obtener la ecuación de la recta que se ajuste m~jor a los datos de la muestra.
3. Evaluar la ecuación para obtener una idea de qué tan fuerte es la relación y cuál
El objeto de interés para el investigador, en la regresión lineal simple, es la
es la utilidad de la ecuación para predecir y estimar.
ecuación de regresión de la población, que describe la relación real entre la va- 4. Si los datos parecen ajustarse satisfactoriamente al modelo lineal, entonces se
riable dependiente Y y la variable independiente X. utiliza la ecuación que se obtuvo de los datos de la muestra para predecir y es-
En un esfuerzo para llegar a una decisión respecto a la forma probable de tin1ar.
esa relación, el investigador extrae una muestra a partir de la población de in-
terés y, con los datos resultantes, calcula una ecuación de regresión que forma Cuando se utiliza la ecuación de regresión para predecir, se predice el
la base para llegar a conclusiones respecto a la ecuación desconocida de valor probable de Y cuandv )( tier.e un "alor dado. Cuando se utiiiza la
regresión de la población. ecuación para esti,nar, se estima la media de la subpoblación de los valores
Al no tener información extensa respecto a la naturaleza de las variables de Y que se supone existen para un valor dado de X.
de interés, una estrategia que se utiliza con frecuencia es suponer inicial-

'~
il 458 Regresián y correfacirí11 .'>imple Ecuacián de regresión de la ,nuestra 459
,¡ y
Ejemplo 8.3.1 Un equipo de profesionales en salud mental de un hospital
psiquiátrico donde el tiempo de permanencia es largo, quieren medir el 130
nivel de respuesta de pacientes retraídos mediante un programa de terapia
120
de remotivación. Para este propósito se contaba con una prueba estandariza-
da, que era costosa y su aplicación tomaba mucho tiempo. Para salvar este 110

obstáculo, el equipo creó una prueba más fácil de aplicar. Para probar la •
utilidad de este nuevo instrumento para n1edir el nivel de respuesta del i 100

ro
N
paciente, el equipo decidió examinar la relación entre las calificaciones '§ 90 •
~
obtenidas con la nueva prueba y las calificaciones obtenidas con la prueba e

estandarizada. El objetivo era utilizar la nueva prueba para averiguar si era lí 80 •


• •
posible demostrar que éste era un buen elemento para pronosticar la califi- 2 70 •
cación de un paciente con respecto a la prueba estandarizada. El equipo
•2
estaba interesado sólo en llevar a cabo el análisis de las calificaciones
.,,
~
60 • •
e
estandarizadas entre 50 y 100, dado que las calificaciones por debajo de 50 •• so
no representan un nivel significativo de respuesta, y las calificaciones arriba ·§'
e 40 f-
de l 00. aunque posibles, rara vez eran alcanzadas por los pacientes en estu- a
"-
dio. El equipo también observó que el uso de calificaciones incrementadas a JO
intervalos de 5 cubriría bien la gama de calificaciones entre 50 y I OO. En
consecuencia, 11 pacientes que registraron ·calificaciones entre 50, 55. 60, 20

65, 70, 75, 80, 85, 90, 95 y 100, respectivamente, fueron seleccionados para 10
participar en la prueba estandarizada. Las variables independiente y depen-
diente son las calificaciones registradas con la nueva prueba y las califica- oo 10 20 30 40 50 60 70 80 90 100 110 X
ciones registradas con la pnteba estandarizada, respectivamente. Los resul· Puntajes con la prueba nueva
tados se muestran en la tabla 8.3. l. Figura 8.3.1. Diagra111a de dispersión de los datos de la tabla 8.3. J.

Es posible apreciar que la suposición de valores fijos para X es satis-


Tabla 8.3.1, Puntajes de pacientes en la prueba estandarizada y en la prueba fecha en este ejemplo. Los valores de X se eligieron con anticipación y no
nueva. ejemplo 8.3.1. s~ permitió que variaran como hubiera sido el caso de haberse seleccionado
pacientes al azar, antes de aplicar la prueba.
El primer paso, generalmente útil en el estudio de la relación entre dos
variables, es preparar un diagra111a de dispersión de los datos, como se
muestra en la figura 8.3. l. Los puntos se grafican asignando los valores de
la variable independiente X al eje horizontal y· los valores de la variable
dependiente Y al eje vertical.
El patrón que se obtiene 1nediante los puntos graficados en el diagrama
de dispersión generalmente sugieren la naturaleza básica y la fuerza de l.u
relación de dos variables. Como se muestra en la figura 8.3. l, por ejemplo,
los puntos parecen estar dispersos en tomo a una línea recta imaginaria. El
'.J,~ 1 diag,au,a de d~rs-té-n---ta-mbiétt muestra, eR geAclral, ql.l€-----WS---p&G+€-~1ue~---
obtuvieron calificaciones altas en !a nueva prueba también registraron cali-
ficaciones altas en la prueba estandarizada. Estos resultados sugieren que la
Ecuación de regresión de la muestra 461
460 Regresión y correlación simple

relación entre las calificaciones en las dos pruebas puede ser representada V•= na+ b~;x. (8.3.2)
mediante una línea recta que cruza el eje Y cerca del origen con un ángulo
de 45 grados, aproximadamente, respecto al eje X. Se ve como si fuera sen-
cillo trazar, a pulso, a través de los puntos, la recta que describe la relación
¿xJ, = a¿x, + b¿x¡ (8.3.3)
entre X y Y. Sin embargo, es muy poco probable que las rectas trazadas por
dos personas sean exactamente la misma. Dicho de otra manera, cada per- En la tabla 8.3.2 se encuentran los valores necesarios para sustituirlos
sona que trace una recta a ojo, o a pulso, obtendría una recta ligeramente en las ecuaciones normales.
diferente. Surge entonces la pregunta de qué recta es la que describe mejor Al efectuar la sustitución de los valores de la tabla 8.3.2 en las ecua-
la relación entre las variables. No es posible obtener una respuesta a esa ciones 8.3.2 y 8.3.3 se tiene que
pregunta al observar las rectas. De hecho, no es probable que alguna de las 916 l la + 825b
rectas trazadas a pulso sobre los puntos sea la que mejor describe la relación
71790 825a + 64625b
entre X y Y, dado que las rectas a pulso reflejan defectos de visualización o
juicio de la persona que las traza. Análogamente, cuando se juzga cuál de Las ecuaciones se pueden resolver mediante cualquier método conocido
dos rectas describe mejor la relación, la evaluación subjetiva está expuesta a para obtener !
las mismas deficiencias. ¡,;
a = -.9973 y b = l.1236 ¡:'
Lo que se necesita para obtener la recta deseada es un método que no
esté expuesto a estas deficiencias. i¡:,·
La ecuación lineal para la r~cta de mínimos cuadrados que describe la
¡_:;
relación entre las calificaciones obtenidas en la prueba estandarizada y las
La recta de mínimos cuadrados El método que se utiliza regularmente
para obtener la recta deseada se conoce como n1étodo de ,nínimos cuadra- que se obtuvieron en la nueva prueba pueden escribirse como:
¡ 1

1 ¡
dos y la recta resultante se conoce como recta de 1níni1nos cuadrados. En el ¡ ;1
siguiente análisis se explica la razón del por qué se le da ese nombre. j = -.9973 + l.l236x (8.3.4) .! 1

De acuerdo con los conceptos básicos del álgebra, la ecuación general


de una recta está dada por la expresión. 1

Tabla 8.3.2. Cálculos intermedios para las ecuaciones nonnales. ejemplo 8.3. l.
y=a+bx (8.3.1)
Punraje con la Puntaje con la
prueba 11ue1·a prueba esra11dari:.ada \~
donde y es un valor sobre el eje vertical, x un valor sobre el eje horizontal, a ,\'~ .\'_)'

el punto donde la recta cruza el eje vertical y b inliica la cantidad con la cual
' ·' :')7'.! 1 :;oso
50 61 2500
y cambia por cada unidad de cambio en x. La ordenada al origen es a y b es '.1025 3i21 '.~355
55 61
la pendiente de la recta. Para trazar una recta con base en la ecuación 8.3.1 59 3600 3481 35.tü
60
se necesitan los valores numéricos de las constantes a y b. Dadas estas cons- 71
___e)
4 <)•) 5041 46 J ;'¡
65
tantes, pueden sustituirse varios valores de x en la ecuación para obtener los iO 80 4900 fi40U 51100
valores correspondientes de y. Después, es posible graficar los puntos resul- .-i625 .1 ¡¡fi 5/()()
i:'i iti
tantes. Dado que dos parejas cualesquiera de esas coordenadas determinan .so !10 6400 8100 i'.!00
una recta, es posible seleccionar dos de ellas para ubicarlas en el sistema de 1(){) , __ ;J
-•)•)- 11236 9010
85
98 SJtlO 960.t SS2il
coordenadas y unirlas para obtener la recta correspondiente a la ecuación. 90
j()() \102.'i !O(HIO (1)()()
Es posible demostrar, mediante matemáticas que están fuera del alcance de ~Ei
!(Hl 114 ](){)()() !2996 I l4(Hl
este libro, que a y b pueden obtenerse al resolver simultáneamente las dos
ecuaciones siguientes, conocidas como ecuaciones nonnales para un con- ·rota! K2:l !ll {¡ (i41i~5 ,'\(IU/1) '¡ i(l(I

junto de datos:
I,

Regresión y correlación simple Ecuación de regresión de la ,nuestra 463


462
y
Esta ecuación indica que, dado que a es negativa. la recta cruza el eje Y
debajo del origen y dado que b, la pendiente, es positiva, la recta se extien-
\30~
de de la parte inferior izquierda de la gráfica a la parte superior derecha de
la misma. Se observa además que, para cada unidad de incremento en x, y


aumenta en una cantidad igual a 1.1236. El símbolo Pindica que y es un
valor calculado a partir de la ecuación, 1nás que un valor observado de Y.
"º[
100

/•
Mediante la sustitución de dos valores convenientes de X en la ecuación il
¡;l 90
I y ~ -.9973 + 1.1236 X

8.3.4 es posible obtener las coordenadas necesarias para trazar la recta. -~


Primero hay que suponer que x = 50, para obtener
"•" 'º1
$
~.
y- -.9973 + Ll236(50¡ 55.18~7 D• 70
•2
~ so¡- "r •
Si se supone que X= 100, se tiene que
"•e 50

J = - .9973 + 1.12'.{fi( 100) = J l 1.~627 "•


:§' 40
,e
<L
La recta, junto con los datos originales, se muestran en la figura 8.3.2. 30
Los valores numéricos de a y b pueden obtenerse mediante otras fónnulas
20
que no implican directamente las ecuaciones riormales. Las fórmulas son las
siguientes: 10

X
o ,o 50 60 70 80 90
,,¿;,, - (I,Jl2>) o 10 20 30
Puntajes con la prueba nueva
100 110 120

b Figura 8.3.2. Datos orig:inalcs y recia de rnínirnus cuadrados para el ejemplo 8.3.1.
n¿x' - (¿x) (8.3.5) Ahora que ya se tiene lo que se conoce como la "mejor·· recta parJ
describir la relación entre las dos variables, es necesario determinar bajo qué
_¿.1-b¿x criterio se considera n1ejor. Antes de enunciar el criterio, es conveniente
a obserYar en la figura 8.3.3 que la recta de mínimos cuadrados no pasa por
(8.3.6) punto alguno de los que se graficaron en el diagrama de dispersión. En otras
" palabras. los puntos observados se des1"Ía11 de la recta en diversas cantidades.
Para el presente ejen1plo, se tiene que La recta que se ha trazado a través de los puntos es mejor en este sentido:

11(71790) - (825)(916) La s11111a de las desviaciones 1·ertica!es al cuadrado de los punros co-
b !. 1236 rrespondientes a los datos obse1Tados ly¡! a partir de la recta de 111í-
11(64625) - (825¡'.!
ni111os cuadrado-\· es 111e11or que fa su111a de las des1·iaciu11es 1·e1-ricales
Dló - 1.1236(82:)J al cuadrado de los pulltos de los datos q11e Jor111an cualquier otra recta.
a -.9973
11
---·---- ---+- -~~~""'1<1,ado-hl-diilillK"'-1:tltÍJ:aLile~,~~~~
Así, se observa que las ecuaciones 8.3.5 y 8.3.6 dan los n1lsmos resulta- cada punto observado (y1 ) hasta la recta de 1nínimos cuadrados J se su1nan
dos que se obtienen tambii.En al resolver las ecuacione., nonna!es los valores obtt:nidos para todos los puntos. el total que resulta será menor
464 Regresión y correlación simple Ejercicios 465
y
1 Reducción del
130 rit,110 cardiaco
Dosis (111g) ( latidos/1nin.)
120 y
X
110 • .5 10
T .75 8
{!l 100
N
·e


Y : -.997J t 1.12J6 z
Desviación j
{ 1/• •' 1.00 12
~•e 90 1.25 12
1.50 14

*••• 80 v,
• 1.75 12
16

.
~
70 2.00
2 2.25 18

',,. '
~

~ 60 2.50 17
e
•• 2.75 20
• 50
3.00 18
1o 40 :1.2.:, 20
o. :LSO 21
JO

20 ' 8.3.2 Los siguientes datos muestran la densidad óptica de cierta substancia en dife-
rentes niveles de concentración.
10

O X
0 'º 20 JO 40 so 60 70 80 90 100 110 120
Nh·el de
Puntajes con la prueba nueva
concentración Densidad óptica
Figura 8.3.3. Datos originales, recta de míni1nos cuadrados y (X) (VJ
desviación vertical para el ejemplo 8.3. l.
80 .08
que el total calculado en forma sem"ejante para cualquier otra recta que 120 .12
pueda trazarse a través de los puntos. Por esta razón, la recta que se ha 160 .18
trazado recibe el nombre de recta de 1nínimos cuadrados. ~{)() :21
240 .28
280 .28
:120 .38
EJERCICIOS _ _ _ _ _ _ _ _ _ _ _ _ _ _ __
360 .40
400 .42
Para cada uno de los siguientes ejen.:icios: a} trazar un diagran1a de dispersión. y b) ob- 4-Hl .50
tener la ecuación de r('gre5,ión y graficarla en el diagrama de dispcr:.ión. 480 .52
520 .60
8.3.1 Se llevó¡¡ caho un experimento para estudiar el efecto de cierto medicamento
para disminuir la frecuencia cardiaca en adultos. La variable independiente
es la dosis en n1iligran1us del medicarncnto. y la variahle dependiente e" la
diferencia entre la frecuencia cJ.rdiaca n1ás baja dc!>pués de !a administración
8.3.3 El administrador de un hospital reunió los siguientes datos respecto al costo
del medicamento y un control nntcs de administrarlo. Se reunieron los
por comida de una co1nida estándar a diferentes volúmenes de preparación.
siguientes dalos:
466 Regresión y correlación simple Evaluación de la ecuación de regresi/J11 467
Nll111ero de
Pro111edio
conlidas ser,idas Costo por co11úda de inteligencia
,! (X¡ (I") Nilniero de niiíos
en la fanlif ic1
de todos los ni/los
:10 de lafan1i/ia
S l.15
J;'¡ !.JO 105
,,

-l5
.98
1.0 1 :1
I O'.?
[04
:,o 1{)()
S:i
,()7

.90
" !!7
!iO .89
"
¡¡ 1() J
70 .X) 7 !J;i
7:1 .7,"i X !l'.I
xo .70 u !!7
!i:) .80 JO l'lH

8.3.6 Las siguientes 1ncdicíones se efectuaron en 20 áreas geográficas. La variable


X es la n1cdición cornbinadade contaminación del aire y agua en la zona, y Y
es !a n1cdici6n del estado de salud de los residentes del área. Entre rnayor sea
el valor de X, hay mayor <:Ontaminación y entre mayor sea el valor de Y, la
8.3.4 Se llevó a cabo un experimento p.:.ra estudiar la relación entre una medición salud es 1nás precaria.
objetiva de la ansiedad y la frecuencia cardiaca en adultos. Se obtuvieron tos
siguientes resultados en 12 adultos norn1ules.
X y X }

73 90 67 76
Rit1110 cardiaco Medición ohjctiva .,
o. 74 73 82
por n1i1111to de la a11:;iedad 68 91 71 93
(.\') (f)
47 62 57 73
:iO 60 63 86 82
:i5 """1 71 78 76 88
ji() -t:, 67 60 91 97
6:"1
"1 80 89 69 80
70 -1'.! 86 82 87 87
7:1 '.{!i 91 105 77 95
so :IX
l(j :11i 8.4 EVALUACIÓN DE LA ECUACIÓN DE REGRESIÓN
90 :10
~¡;, :\;?
1()() Una vez que se ha obtenido la ecuación de regn::sión es necesario evaluarla
:1-1
para determinar si describe adecuadamente la relación entre las dos varia-
ltl;'í
-'
"" bles y si puede utilizarse conveniente1nente con fines de predicción y esti-
mación.
ten ta poblacion la relacion entre X y } es ti11eal, p, ta peudiente de la
8.3.S Se recolectaron los siguientes datos a partir de un estudio de la rela(:ión entre recta que describe esa relación será positiva, negativa o igual a cero. Si~ es
la inteligencia y .el número de hijos por fan1ilia.
cero, los datos de la muestra extraída de la población, a la larga, propor-
Evaluación de f.a ecuación de regresió11 469
468 Regresión y correlación simple
lineal, no es lo suficientemente estrecha para permitir que X sea de gran
cionará ecuaciones de regresión de valor escaso o nulo para efectos de valor para estimar o predecir a Y, o bien, 2) que la relación entre X y Y no es
predicción y estimación. Además, aunque se supone que la relación entre X lineal, es decir algunos modelos semilineales se ajustan mejor a los datos, y
y Y es lineal, es probable que dicha relación se describa mejor mediante un nuevamente X tiene un valor escaso o nulo para predecir o estimar el valor
modelo no lineal. Cuando este es el caso, si se ajustan los datos de la mues- de Y. La figura 8.4.1 muestra las clases de relaciones entre X y Y en una po-
tra a un modelo lineal, tienden a proporcionar resultados compatibles con blación que puede prevenir el rechazo de la hipótesis nula P= O.
una pendiente cero de la población. Así, al efectuar una prueba en la que la Considérense las siguientes situaciones en una población que puede pro-
hipótesis nula, que indica que ¡3 es igual a cero, no se rechaza, se puede con- ducir el rechazo de la hipótesis nula ~ ;;: O. Supóngase que no se cornete un
cluir (bajo la suposición de que no se comete el error de tipo 11 al no recha- error de tipo 1, el rechazo de la hipótesis nula, P::; O, puede deberse a una de
zar una hipótesis nula falsa) 1) que, aunque la relación entre X y Y puede ser las siguientes condiciones en la población: 1) la relación es lineal y de sufi-
y ciente fuerza para justificar el uso de ecuaciones de regresión rnuestral para

1

• •• • • • •• • • •
• • • • •• • • • • • • •
• ••
• • •• • • • • • • • • • •
• • •
• • • ••
• •• • • •
• • • • • •
y; •
X

'ª' X
y

1 y
'ª'

• ••

• •
.. • ••• • •• • • • •
•• • • •
• •• • •
• • • •
• ••
• •

• • • ~-

• • • •


• •
• •
~~~~~~~~~~~~~~~~~~~~~~~~x ~~~~~~~~~~~~~~~~~~x

lb) lb!
Figura 8.4.1. Condiciones en una población que pueden Figura 8.4.2. Condiciones de la población con relación a X
evitar el rechazo de la hipótesis nula Jl = O. a) La relación y Y que pueden causar el rechazo de la hipótesis nula Pe= O.
entre X y Y es lineal, pero ~ está tan cerca de cero que los a) La relación entre X y Y es lineal y con suficiente validez
datos de la muestra no parecen proporcionar ecuaciones para justificar el uso de la ecuación de regresión simple
útiles para predecir Y cuando X es dada; b) La relación entre para predecir y estimar Y para los valores dados de X; b) El
X y Y no es lineal; un modelo curvilíneo proporciona un modelo lineal proporciona un buen ajuste para los datos,
mejor ajuste para los datos; los datos de la muestra no pro- pero un modelo curvilíneo podría proporcionar un mejor
porcionan ecuaciones útiles para estimar Y cuando X es dada. ajuste.
,
ll 470 Regresión y correlación simple Evaluaciá11 de la ecuación de regresiii11 471

predecir y estiinar Y con base en valores dados de X. 2) Los datos se ajustan la recta de regresión con la dispersiórÍ en torno a y, la media de los valores
bien a un modelo lineal, pero algún modelo curvilíneo proporciona un de la muestra de r. Si se toma el diagrama de dispersión para e[ ejemplo
ajuste más adecuado. La figura 8.4.2 ilustra las dos condiciones que pro- 8.3. l y se traza a través de los puntos una recta que intersecta el eje Yen Y y
ducen el rechazo de H0 : J3 = O. que sea paralela ni l'.je X, puede obtenerse una impresión visual de las mag-
De esta fonna se puede apreciar que es aconsejable probar H 0 : J3 ::: O, nitudes relativas de la dispersión de los puntos en tomo a esta recta y la
antes de utilizar una ecuación de regresión de la muestra para predicción y recta de regresión. Esto se ha hecho en la figura 8.4.3.
estimación. Esto se puede hacer mediante el análisis de variancia y la esta- Parece obvio. al observar la figura 8.4.3, que la dispersión de los puntos
dística F. o bien, mediante la estadística t. Ambos métodos se muestran pos- en torno a la recta de regresión es mucho n1enor que la dispersión en tomo a
teriormente, pero anees de esto, es conveniente saber cómo se investiga la la recta y. Sin en1bargo. no es posible decidir que la ecuación es útil con
fuerza de la relación entre X y Y. base en esto únican1ente. La situación puede no ser siempre tan evidente, de
modo que sería 111ucho más conveniente una medida objetiva de algún tipo.
Coeficiente de detern1inación Una forma de evaluar la eficiencia de la El llamado coeficiente de detern1ina~·i()n es dicha medida.
ecuación de regresión es comparar la dispersión de los puntos en torno a Antes de definir el coeficiente de determinación, es necesario justificar
su uso n1ediante cl exan1en de la lógica en la que se basa su cálculo. Primero
se comienza por considerar el punto correspondiente a cualquier valor obser-
'
1
vado,)'¡· y se n1ide la distancia vertical entre dicho punto y la recta y. A esto
140
se le da el nombre Je desviació11 total y se designa por (_v¡ - Y).
130 Si se nlicle la J istancia vertical entre la recta de regresión y la recta y, se
120 obtiene ([; - Y), que se conoce como desviación explicada, ya que muestra
1
J, z -0.9973 + 1.123&- en cuánto disminuye la desviación total cuando la recta de regresión se ajus-
110'
\ •
rn ta a los puntos.
• Finaln1ente. se 111ide la distancia vertical entre el punto observado y la
) 100~ /.. recta de regresión para obtener (y 1 -Y).
que se conoce como desviación inex-
~
e 90

"••
ro 80
n
•2
70
f-, • 8327 •
/ •
plicada. ya que representa la porción de la desviación total que no está "expli-
cada" o to111ada en cuenta por la intrcxlucción de la recta de regresión. Estas
tres cantidades se 1nuestran para un valor característico de Y en la figura 8.4.4.
~
Se aptecia entonces que la desviación total para una Y¡ particular es
"••
e
80 t- ./

igual a la sun1a de las desviaciones explicadas e inexplicadas. Esto puede
escribirse simbólicamente como:

§ 50
e
o (_,·, - )') = (_f - )') + (_,·, - J) (8.4.1)
n.
40 desviación des\·iación desviación
30 total explicada inexplicada

20
Si se niiden estas desviaciones para cada valor de Y¡ y Y. se eleva al
cuadrado cad.t desviación y se sun1an todas ellas para obtener
TO

o
o
i

TO 20 30 40 50
60 70 80
L(Y, - J) 2
- L(j - J) + L(Y, - j)'
2
(8.4.2)
90 100 110 120 X
Puntajes con la grpl:,.bsl rn 1el.'a _ _¡ _ _ _ .. _Sll..lila..._ _ _ _ _ suma...__ __ ______surna ____________ _
----

Figura 8.4.3. Diagrama de dispersión. recta de regresión de la mues- total .:-xplicada inexplicada
tra y recta Y para el ejemplo 8.3.1. de cuadrados de cuadrados de cuadrados
Evaluación de fa ecuación de regresión 473
472 Regresión y correlación simple
y
dos. Es la cantidad que se minimiza cuando se obtiene la recta de mínimos
1
1" cuadrados.
1.a relación entre estas tres sumas de valores al cuadrado, se expresa
130
como
120 ,1 .. -0.9973 + 1.1236r ser= SCR + SEC
<\'I 110
~ Desviación inexplicada Los cálculos necesarios para obtener la suma total de regresión y de

-~ 100 Desviación total ; (y;-j) error para el ejemplo se muestran en la tabla 8.4.1.
•e
~
(y¡ - i) ~ Desviación explicada Para este ejemplo se tiene
2 90 iy - Y>
••
Jli
•2
80 'j • 83.27 .. • STC = SCR + SEC
3798.1822 = 3471.8116 + 326.1455
..
~

e
70
3798.1822 = 3797.9571
~ 60 • •
• La falla en los dos últimos términos a la derecha de la igualdad para dar
l, 50
como suma el total de la izquierda se debe al redondeo.
~
Es posible calcular la suma total de cuadrados mediante la expresión

30

20 L(J, - sl' = Ll
(».)' (8.4.3)
n
10 y la suma de cuadrados para la regresión se calcula de la siguiente forma:
o'---'-~_j__JL_...L~'-----'-~.L......l~...L~'---'-~_j_-
o 10 20 JO 40 SO 60 70 80 90 100 110 120 X
Puntajes con la prueba nueva
Figura 8.4.4. Diagrama de dispersión que muestra la desviación total,
LCi - J) 2
+ b2 L(x; - i) b'[Ix~ - (Lx.)' In]
2
=
(8.4.4)
la desviación explicada y la no explicada para un valor seleccionado de
Y, ejemplo 8.3.1. La suma de error de cuadrados resulta más fácil de obtener mediante resta.
Para el ejemplo se tiene
Estas cantidades se pueden considerar como medidas de dispersión o (916) 2
2
variabilidad. La srona total de cuadrados (SCw,al), por ejemplo, es una STC= 61 2 + 61 2 + ··· + 114 - ~11- ~ 3798.1818
medida de la dispersión de los valores observados de Y en tomo a su media
y"; es decir. ese término es una medida de la variación total en los valores
observados de Y. El lector puede identificar este término como el numerador
SCR = (Ll236) 2[5o 2 + 55 2 + · .. +, 100 2 - ( ::i2]
8

de la fórmula conocida para la variancia muestral. 34 71.8116


La stona de cuadrados explicada mide la cantidad de variabilidad total
en los valores observados de Y que se toma en cuenta mediante la relación y
lineal entre los valores observados de X y Y. Esta cantidad se conoce tam-
bién como la sun1a de cuadrados debida a la regresión lineal (SCR). SCR = STC -3l!IR Si= C
La S!fn1a de cuadrados inexplicada es una medida de dispersión de los 3798.1818 - 3471.8116
valores observados de Y en torno a la recta de regresión, conocida también
como s11111a lle error de cuadrados (SCre.r1.d1Hl 1) o s111na residual de cuadra- = 326.3702
Evaluación de la ecuación de regresión 475
Regresión y correlación simple
474
Los resultados que se obtienen mediante las fónnulas más convenientes
- 00 <:<"l i:- O'l O O'l t-- <:<"l 00 .....
para el cálculo, son los mismos que se muestran en la tabla 8.4.1, excepto
,/ ,,__,~~~~~g~~~~~
¡ ....t o.
,,-
O: o. ~ 'r'l: o.
"'! C\! O: o.
"'o.
0')..,...,,..<.0-0-<.0..,...,.C'l
OOOOOINc<") e<"llNOOOOO
por el redondeo.
Intuitivamente. es 1azonable suponer que, si una ecuación de regresión
1 .._: e-,, r--.
!'-- U"l IN .....
"' ,.... at'J describe correctamente la relación entre dos variables, la suma de cuadrados
~
explicada o de regresión debe constituir una gran proporción de la suma
ººººººººººº
OIN"l"<.O:X:00C<.0"'1"1NC
~

"lo.~a::C'!~O.~C'!~..i:o.¡ "'
1
O') t"- L'°) ~ - 0 -

~gj!:='?ºat'J:::~~~
C<) l.!) f'-. O')

~
11
total de cuadrados. Seria interesante determinar entonces la magnitud de
dicha proporción mediante el cálculo de la razón de la suma de cuadrados
~· 1 1 ¡ ~ explicada respecto a la suma total de cuadrados. Esto es exactamente lo que
oi:--i-....,.<Nat'JOO'><.O..,. se hace al evaluar una ecuación de regresión basada en los datos de la mues-
-O'li:-..,.CINOCN-U"l
"--
~
-.:t'<:<"le<"li:-OO'l:<'lU"llNOU"l tra y el resultado se conoce como coeficiente de determinación, ,2, de la
OCOCOU"lOOC'<IOU"lOO'l
1 c<i ·._.;...;.r-;,:,,j...:e,.;~.,...;<,0 "' muestra. En otras palabras
6 "' "' "' :3 "' "'
~

<O
c<"l e<") i:- i:-
t-- O'l 00 <.O
;,..;; f ....,O'l ..... e<"l
e<")i:- <:<") C<l i:- i:- e<')
U"l i!'I O'l ..... (,O ..,. t--
"I" f'-. O O'l IN "1' C.-:
"'"'
11
!~-~ b'[¿x; - (!,,)'In]
d aq-'<t:0."':~-:'<1:-:t--:~ ' = SCR / SC111,a1
"
·ªc. ,; ¡ "'
i:--1Ni:---1NU"llN
1 1 1 - 1 1 ',
~
·i:; ~(,-~
~ -' - 2,' - (!),)
X IN IN O C\I <.0 IN ,.O IN '!f' <.O O '-' ·'-
u
.E ...
,,___ Ct'J<:<"l'<t'O'>OIN,..00<:<"llNf'-.
i:- i:- <.O - - ·..e
O') in c<"l a, o
oo-:or-...ooCNU"loooc-
"' "
"
~
1 <.O t.O c-i O O IN ll") C t.O ~ ..,¡: "'
"' En el ejemplo, se tiene que, utilizando los valores de las sumas de cuadra-
B :5 O'; O')

" " " " U"l -


C0 L'°) ..... U"l '<!" - ..... f"-- '<!'
U"l C'I IN Ol "'
,; dos calculadas a panir de las ecuaciones 8.4.3 y 8.4.4
e,
~ i:- i:- i:- i:- i:- i:- c<") c<") ::,") <:<") e<") ~
X IN IN IN :,,1 CI :N l"'"' t'- 1' t.. l'--

" C-- f'- ,:.... t-- ,:... ,:,.... IN IN IN IN IN


~. 1 C"! ~ !:'! ~ C"! O'-! r:-: t-: r-: t-: r--: "' ,2
34 7 I.8116
.91
~
37%.!818
:s
~
6! 1 1 1 1
ININ..,.1Ne<"ll'-<.01N'1''-00!
c-tlNCSI- 1 1 e.i--ct'l
-
,"::
r..J'il:.
.g i:- i:- ,:.... i:- i:- i:- i:- i:- i:- t- i:- "' El coeficiente de determinación de la muestra mide la proximidad del
E + C\I O 00 \C ..,. IN C 00 <.O ..,. IN
ajuste de fa ecuación de regresión de la muestra a los valores observados de
"a
~ fJ
m~
000-<:<"lU"l.t--:'IOIN"'f'<.0
.... 00 'OI' C <.O IN :X: U"l ..... .t-. e<')
Y. Si se observa la tabla 8.4.l, se encuentra que cuando las cantidades 6'¡- f¡),
u II O'!:::! ,ri O r.é IN ,:..: c<i 00 .,¡. O ari ...:
U"l <.O ID i:- i:- OC 00 O'l O O _,
""" '"" 1 ...: las distancias verticales de los valores observados de Y a partir de la ecua-
~ ción, son pequeñas, la suma de cuadrados inexplicada es pequeña. Esto con-
E
¡¡ .51 duce a una suma de cuadrados inexplicada grande que, a su vez, conduce a
"'
.2: ~
-S~ un valor grande de r2· Esto se ilustra en la figura 8.4.5.
--a,-o~O(COCO..,¡,
<U
"O
"'
~ ~
:::i -t!
...
(C~.r.r...ocr...:.oaio-
"'
0-, En la figura 8.4.5a se aprecia que todas las.observaciones están próxi-
..s S'~.g
e ~e ª
a:i:-::5
tnas a la recta de regresión y es de esperar que r2 sea grande. De hecho, el
valor calculado de r2- para estos datos es de .986, lo cual indica que aproxi-

-~ ~ i:
~

"'
~
madamente el 99 por ciento de la variación total en los valores de y 1 es apli-
cada por la regresión.

• "'"'
..
iN:<')"1'1.!1\Ct'-:lCO':O En la figura 8.4.5b se ilustra un caso donde los valores de Y¡ están
-r
:E -~ ~ ';::: u ampliamente dispersos en tomo a la recta de regresión, por to que se supone
l:l •:::::
~ ;: ...... que r2 es pequeño. El valor de r2 calculado para los datos es de .403, es
decir, menos del 50 por ciento de la variación total en los Y, es explicada por
la regresión.
476 Regresi6n y co"elaci6n simple
Evaluación de la ecuación de regresidn 477

.. • ecuación de regresión. Por otra parte, un r2 pequeño, que indica una falla de
la regresión para explicar una gran proporción de la variación total en los
• valores observados de Y. tiende a arrojar dudas.sobre la utilidad de la ecua-
ción de regresión para efectuar predicciones y estimaciones. Sin embargo,
• la ecuación se somete a un juicio final hasta que haya sido sujeta a una
• prueba estadística objetiva.
• • 1
Prueba de H 0: ~=O mediante la estadística F El siguiente ejemplo ilus-
• •
.. •
tra uno de los métodos para llegar a una conclusión respecto a la relación
entre X y Y.
)

Ajuste estrecho,

,2 grande Ajuste pobre,
•r 2 pequeña
Ejemplo 8.4.1 Consultar los datos del ejen1plo 8.3.1. Se desea averiguar si
es posible concluir que X y Y tienen una relación lineal. )
)
Solución Los pasos del procedimiento para la prueba de hipótesis son
como sigue: l
l. Datos. Los datos se presentan en el inicio del ejemplo 8.3. l.
2. Suposiciones. Se supone que el modelo simple de regresión lineal y las
suposiciones que la sustentan como se describe en la sección 8.2, son apli-
• •
• • cables .
H.,:~~ O )
•• • • • H0 : ~ ,fo O )

a= .05
4. Estadística de prueba. La estadística de prueba es R.V.
'
,2=1 '
r2 ... o A partir de los tres términos de la suma de cuadrados y los grados de
Figura 8.4.S. r2 como medida de la proximidad del ajuste de la recta de regresión libertad asociados puede elaborarse la tabla de análisis de variancia como se
de la muestra con respecto a las ob~ervaciones de la muestra. indica en la tabla 8.4.2.
En general, los grados de libertad asociados con la suma de cuadrados
El valor máximo que puede tomar r2 es 1, un resultado que se obtiene debida a la regresión son iguales al número de constantes de la ecuación de
cuando toda la variación en los y1 es explicada por la regresión. Cuando
r2 = 1, todas las observaciones caen sobre la recta de regresión. Esta si·
tuación se muestra en la figura 8.4.5c. Tabla 8.4.2. Tabla ANOV A de regresión lineal simple.
El límite inferior de ,2 es O. Este resultado se obtiene cuando coinciden Fuente de
la recta de regresión y la recta trazada a través de !/. En esta situación, variación se g. l. CM R.V.
ningun~ de las variaciones en los Y¡ es explicada por la regresión. La figura Regresión SCR 1 SCR, 1 CMRIMS,esid1w/
8.4.Sd Ilustra un caso donde r1 se aproxima a cero. lineal
Cuando r2 es grande, entonces, la regresión ha explicado una gran pro~ Residual sc,,,sid1wl " - 2 scresiJm,1!( 11 - 2)
porción de la variabilidad total en los valores observados de Y y se acepta la To1al SST "~
Evaluación de la ecuación de regresión 479
Regresión y correlación simple
478
326.3702 ! 9 36.2634
Tabla 8A.3. Tabla ANOV A para el ejemplo 8.3.1. ¡2 = l 379.81818 .9045
3798.1818/ 10
Fuente de variación SC g. l. CM R.V.
Regresión lineal 3471.8116 1 3471.8116 95.74 Se observa que este valor es ligeramente menor que
Residual 326.3702 9 36.2634
Total 3798.1818 10 ,, 326.3702 = 1 - .08593 = .91407
3798.1818

regresión menos 1. En é(caso lineal simple, se tiene dos constantes, a y b, Se observa que la diferencia entre r2 y r 2 se debe al factor (n - 1) ¡ (n - 2).
por lo que los grados de libertad para la regresión son 2 - J = 1. cuando n es grande, este factor se aproxima a l y la diferencia entre ,2 y r~
tiende a cero.
S. Distribución de la estadística de prueba. Es posible mostrar que cuando la Prueba de H 0 : Í1 = O mediante la estadística t Cuando se satisfacen
hipótesis de no relación lineal entre X y Y es verdadera, y cuando las suposi- las suposiciones establecidas en la se~ción 8.2. a y b son estimadores pun-
ciones en las que se basa la regresión se cumplen. la razón que resulta de tuales insesgados de los parámetros correspondientes a y Í1; dado que bajo
dividir el cuadrado medio de la regresión entre el cuadrado medio del error estas suposiciones las subpoblaciones de los valores de Y siguen una dis-
sigue una distribución F con 1 y n - 2 grados de libertad. tribución normal, pueden formarse también intervalos de confianza para a y
6. Regla de decisión. Se recha7.a H0 si el valor calculado para la R.V. es mayor p y probar hipótesis acerca de ellos.
o igual que el valor crítico de F. Cuando las suposiciones de la sección 8.2. se cumplen, cada una de las
7. Cálculo de la estadística de prueba. La sustitución de los valores adecuados distribuciones muestrales de a y b siguen una distribución normal con las si-
en la tabla 8.4.2 proporciona la tabla 8.4.3.
guientes medidas y variancias:
8. Decisión estadística. Puesto que 95. 74 es mayor que 5.12. el valor crítico de
F para l y 9 grados de libertad, se rechaza la hipótesis nula. µ.,. = o. (8.4.6)
9. Cu11c{usió11. Se concluye que el modelo lineal proporciona un buen aju!'ite para
los datos. Para esta prueba, puesto que 95.74 > J 3.61, se tiene p < .005. 2 "' 2
ª,1xU;
ª2 = - - - - -
El coeficiente de determinación de la muestra proporciona una esti· " nL(x; - i) 2 (8.4.7)
mación puntual de p 2, el coeficiente de determinación de la población. Este (8.4.8)
µ, = ~
coeficiente tiene la misma función relativa a la población que la que tiene r2
con la muestra. Indica qué porción de la variación total de la oblación en Y y
es explicada por la regresión de Y sobre X. Cuando el número de grados de
libertad es pequeño, r2 está sesgado positivamente. Es decir, r2 tiende a ser a b2 = --=..t.!:!.
"'

grande. Un estimador insesgado de p2 Jo proporciona L(x, - , 12 (8.4.9)

En las ecuaciones 8.4.7 y 8.4.9 cr~lx es la variancia inexplicada de las sub-


¿(,, - _f)'!. / (11 - :¿¡
poblaciones de valores de Y. ·
p'!. = l - Con el conocimiento de las distribuciones muestrales de a y b pueden
I<.v, - 5')'!!<11 - 1¡ (8.4.5) formarse los intervalos de confianza y probar las hipótesis relativas a a y J3
en la forma acostumbrada. En general, las inferencias respecto a a no son
Obsérvese que el numerador de la fracción en la ecuación 8.4.5 es el de interés. Por otro lado. una gran parte del interés se centra en los proce-
cuadrado medio inexplicado y el denoniinador es el cuadrado medio total. dimientos de inferencia con respecto a p. La razón de esto es el hecho de que
Escas cantidades están incluidas en la tabla de análisis de variancia. Para el Í1 dice mucho acerca de la forma de la relación entre X y Y. Una Í1 positiva
ejemplo ilustrativo. al utilizar los datos de la tabla 8.4.3 se tiene _indica que. en general. Y aumenta a medida que X aumenta. y se dice que
480 Regresión y correlaci6n simple Evaluación de la ecuación de regresión 481 l
existe una relación lineal directa entre X y Y. Una p negativa indica que los es un estimador insesgado de 0'~1.r· Esto es el cuadrado medio inexplicado
valores de Y tienden a disminuir a medida que aumentan los valores de X, y que aparece en el análisis de la tábla de variancia.
se dice que hay una relación lineal inversa entre X y Y. Cuando no hay una Los términos (V¡ - 9)
de la ecuación 8.4.12 se conocen como residuales.
relación lineal entre X y Y, ~ es igual a cero. Estas tres situaciones se pre- )
Algunos programas por computadora para el análisis de regresión dan por
sentan en la figura 8.4.6. lo común los residuales como parte de la información de salida. Cuando
Para probar hipótesis respecto a p, la estadística de prueba cuando se éste es el caso, puede obtenerse s~-Lr elevando al cuadrado los residuales, 1
conoce a~l(' es sumando los términos elevados al Cuadrado y dividiendo el resultado entre
b -- ~.
z = - -
s;
n - 2. Otra fórmula para 1 r es:
(8.4.10)
ª• 2
n - 1
s,ix = - - (s2 - b2s2)
n-2 _l X
(8.4.13)
donde ~o es el valor hipotético de ~. El valor hipotético de p no tiene que
ser cero, pero en la práctica es frecuente que la hipótesis nula de interés sea de s~ y s; son la~ variancias de las observaciones de y y de x, respectiva-
P·~ . mente. Para el ejemplo ilustrativo se tiene
Como regla a;lx es desconocida. Cuando éste es el caso, la estadística \
de prueba es
sJ = 379.8182 y ,, 275.0000
'
b - ~. \
t=-- por lo tanto
(8.4.11)
'• \

donde sb es una estimación de crb y t sigue una distribución t de Student con


,;,, =
1
i 2
[379.8182 - (l.1236) (275.0000)] = 36.2634
n - 2 grados de libertad. Para obtener sb, primero es necesario estimar a2.u·
Un estimador in sesgado para este parámetro lo proporciona el cálculo la cti un resultado que concuerda con el cuadrado medio residual de la tabla 8,4.3.
variancia inexplicada a partir de los datos de la muestra. Es decir, La raíz cuadrada de s 2,1.t· sylx es la desviación estándar de las observa-
¿ (y, - _j) 2
ciones en tomo ala recta de regresión ajustada y mide la dispersión de esos
puntos en tomo a la recta. Entre más grande es s,. 1x menor es el ajuste de la
2 -
s.1lx -
n - 2 (8.4.12) recta respecto a los datos observados. ·
Cuando sf-Ll se utiliza para estimar a 0'~1.r puede obtenerse al estimador
\
y y y deseado e insesgado de aI, mediante la expíesión

;/. • •
2
\
• • • ••• • • • •
2_~
y• • • sb - " ·2 (8.4.14)
• • .L,¡(X1 - i)


••
• ••
• •
•• • • • ••
• • • • •
Puede escribirse la ecuación 8.4.14 en la fonna siguiente, más conve-
niente para el cálculo
~, X X
,,, X l
s,,
(b) 2
SflX
Figura 8.4.6. Diagrama de dispersión para mostrar las relaciones directas, inversas Y
no lineales entre X y Y. a) relación lineal directa; b) relación lineal inversa; e) re·
!ación no linea1. L.f·
"' 2 - (2x.)' In
(8.4.15)
482 Regresión y correlació11 simple Evaluación de la ecuació11 de regresió11 483
Si la probabilidad de observar un valor tan extremo como el valor de la Puesto que 9.85 es mayor que 3.2498, la probabilidad de observar un valor 1
estadística de prueba calculada mediante la ecuación 8.4.11, cuando la hi- tan grande o mayor que 9.85, cuando la hipótesis nula es verdadera, es menor
pótesis nula es verdadera y menor que ex/ 2 (dado que se tiene una prueba que .005. El doble de este valor es 2(.005) = .01.
bilateral), se rechaza la hipótesis nula. 9. Co11cl11sió11. Se concluye que la pendiente de la recta de regresión verdadera es
diferente de cero. La implicación práctica es que se espera obtener mejores
Eje,nplo 8.4.2 Con base en los datos del ejercicio 8.3.1, se desea saber si es predicciones y estimaciones de Y si se utiliza la ecuación de regresión de la
muestra que se puede obtener si la relación entre X y Y se omite. El hecho de
posible concluir que la pendiente de la recta de regresión de la población
que b sea positiva conduce a la creencia de que ~ es positiva y que la relación
que describe la relación entre X y Y es cero. entre X y Y es una relación lineal directa.

Solución
Como se indicó anteriormente, la ecuación 8.4.11 puede emplearse para
l. Datos. Ver el ejemplo 8.3. 1. probar la hipótesis nula según la cual Ppuede ser un valor diferente de cero.
2. Suposiciones. Se supone que el modelo de regresión lineal simple y las suposi- El valor hipótético para p, P0, se sustituye en la ecuación 8.4. t l en lugar de
ciones que lo fundamentan son aplicables. cero. Todas las demás cantidades, igual que los cálculos, son los mismos
3. Hipótesis que aparecen en el ejemplo. Los grados de libertad y el método para deter-
minar la significación también son idénticos.
11.,: ~ - O
H,:~,aO Intervalo de confianza para f3 Una vez que se ha determinado que es
o. = .05 improbable, a la luz de la evidencia de la muestra, que f3 sea cero, el investi-
gador puede interesarse C::n obtener una estimación de intervalo de f3. Es
4. Estadística de prueba. La estadísticu de prueba se ob1iene mediante la ecuación
8.4.11. posible utilizar la fórmula general para un intervalo de confianza:
S. Distribución de la estadística de prueba. Cuando se satisfacen las suposicio-
nes y H0 es verdadera, la estadística de prueba sigue una distribución t de estimador± (factor de confiabilidad) (error estándar de la estimación)
Student con n - 2 grados de libertad.
6. Regla de decisión. Se rechaza H0 si el valor calculudo de t es mayor o igual
Cuando se obtiene el intervalo de confianza para f3, el estimador es b, el
que 2.2622, o bien menor o igual que -2.2622.
factor de confiabilidad es algún valor de z o t (dependiendo de si se conoce
7. Cálculo de la estadística. Primero se calcufa 5¡,. Con base en la tabla 8.4.3, se
tiene que sJtr = 36.2634, de modo que es posible calcular o no 0}1.t y el error estándar del estimador es

%.2634 ~
s'f; =
2 2
[:'>0 + 55 + ...
~
+ 100".!.J
(825) 2
- -11-
= .013 (Tb =
V-'!:,J,.
/ 2

¿{x, - ;¡2

v,; ,
Ahora, es posible calcular la estadística de prueba Cuando o;.l.t es desconocida, o b se estima mediante

1.1236 - O
t = 9.85
v.iITT sb =

8. Decisión estadística. Se rechaza H0 porque 9.85 > 2.2622. El valor p para esta
prueba es menor que .01. puesto que. cuando H0 es verdadera. la probabilidad
de obtener un valor de r igual o tnayor que 3.2498 es de .005 y la probabili- de tal forma que en muchas situaciones prácticas el IOO ( 1 - a) por ciento
dad de obtener un valor de t igual o menor que -3.2498 es también de .005. de) intervalo de confianza para p es
Uso de la ecuacidn de regresión 485 J
484 RegresWn y correlación simplt
l
EJERCICIOS-----------------
b ::!:: l( ! v:_Sylx:
,/ 2
8.4.1 al 8.4.6 Con base en los datos de los ejercicios 8.3.1 a 8.3.6, llevar a
cabo lo siguiente para cada uno de ellos:
(8.4.16)
a) Calcular el coeficiente de determinación.
b) Preparar una tabla ANOV A y probar la hipótesis nula de no relación lineal )
Para este ejemplo, se elaboró el siguiente intervalo de confianza del 95 entre las dos variables.
por ciento para ~: e) Demostrar la hipótesis nula de ~=O utilizando un nivel de significación )
de .05.
1.1236 ± 2.2622v.ot3 d) Determinar el valor p para cada prueba de hipótesis.
l.]236 ± .2579 e) Obtener las conclusiones en términos del problema.
. 8657, l.3815 f) Construir el intervalo de confianza del 95 por ciento para~-
Este intervalo se interpreta en la forma habitual. Desde el punto de vista
probabilístico, se dice que al repetir el muestreo, el 95 por ciento de los
85 USO DE LA ECUACIÓN DE REGRESIÓN _ _ _ _ __
intervalos que se obtienen de esta forma incluyen a ~- La interpretación
práctica es que se tiene el 95 por ciento de confianza de que el único inter-
Si los resultados al evaluar la ecuación de regresión de la muestra indican
valo que se obtenga incluirá a ~-
que existe una relación entre las dos variables de interés, puede darse un uso
Resulta útil observar que el intervalo de confianza que se construyó no
práctico a dicha ecuación. Ello se hace en dos formas. Puede utilizarse para
incluye a cero, de manera que este valor no es un candidato para el pará- predecir el valor probable de Y dado un valor específico de X. Cuando se
metro que se está estimando. Se ~upone entonces que es improbable que satisfacen las suposiciones planteadas en la sección 8.2, puede obtenerse un
~ = O. Esto es compatible con los résultados de la prueba de la hipótesis en intervalo de predicción para este valor pronosticado de Y.
la que se rechazó la hipótesis nula de p;:: O. En realidad, siempre puede pro- Puede utilizarse también la ecuación de regresión para estilnar la media
barse H 0 : P ;:: O en el nivel de significación ex al construir el intervalo de de la subpoblación de los valores de Y que se supone existen para algún
confianza del 100(1 - ex) por ciento para p, y puede rechazarse o no la valor particular de X. Una vez más, si se cumplen las suposiciones estable-
hipótesis, dependiendo de si el intervalo incluye o no el cero. Si el intervalo cidas anteriormente, puede elaborarse un intervalo de confianza para este
incluye el cero, la hipótesis nula no se rechaza; si ocurre lo contrario, dicha parámetro. El valor pronosticado de Y y la estimación puntual de la media
hipótesis se rechaza de la subpoblación de Y serán numéricamente iguales a cualquier valor par-
Debe quedar claro en e~te punto que el no rechazar la hipótesis nula de ticular de X, pero, como se verá, el intervalo de predicción será más amplio
P;:: O no significa que X y Y no estén relacionados. No sólo es posible que que el intervalo de confianza.
se haya cometido un error de tipo 11, sino que tal vez X y Y están rela-
cionadas de alguna forma no lineal. Por otra parte, cuando se rechaza la Predicción de Y para una X dada Suponer que, en el ejemplo ilustrativo
hipótesis nula de que p ;:: O, no puede concluirse que la relación verdadera hay un paciente que tiene una calificación de 70 en la nueva prueba y que se
entre X y Y sea lineal. Una vez más, puede ser que aunque los datos se ajus- desea predecir su calificación en la prueba estandarizada. Para obtener el
tan bastante bien al modelo de regresión lineal (como lo demuestra el hecho valor pronosticado, se sustituye x por 70 en la ecuación de regresión de la
de que la hipótesis nula de p;:: O se rechaza), algún modelo no lineal podría muestra, para obtener
proporcionar un ajuste aún mejor. En consecuencia, cuando se rechaza la
P
Ho: :=: O, lo mejor que puede decirse es que se obtienen resultados más .f ~ - .9973 + J.1236(70)
útiles (que se analizan a continuación) al tomar en cuenta la regresión de Y 78
sobre X que cuando se ignora.

redondeada hasta el entero más próximo.

c;i j
Regresió11 y co"elación simple Uso de la ecuación de regresió11 487
486
Si se decide aplicar al paciente la prueba estandarizada, se pronosticaría El intervalo de confianza de 100(1 - o:) por ciento para µvi.\-• cuando se
que su calificación será de 78. Dado que no se tiene confianza en esta pre- desconoce a}tt• está dado por la expresión ·
dicción, sería preferible un intervalo con un nivel de confianza correspon- r -
diente. Si se sabe, o se considera que se satisfacen las suposiciones de la 1 (x - i) 2
sección 8.2, y cuando se desconoce cr~·lx' el intervalo de predicción del
j ± l( ¡ - al 2¡Sy1x' - + -~·-~-
n Í:(x, - i) 2
100( l - a) por ciento para Y está dado p6r la expresión (8.5.2)

+1- +(x~-.o'
-- Es posible obtener el siguiente intervalo de confianza del 95 por ciento
_'V± f(t - a12¡,Í,1.,
,, "'
¿,¡(x, - .\')-.,
(8.5.I)
para µyl.r = 70 del ejemplo, al efectuar las sustituciones convenientes

donde x es el va1or particular de x en el que se desea obtener un intervalo


de predÍcción para Y y los grados de libertad para seleccionar t son n - 2.
Para el ejemplo ilustrativo, puede construirse el siguiente intervalo de pre-
1s ± 2.2622v=3=5_~26"'3~4

78 :t: 4
V 1
11
(70 - 75)'
- + ----
27 50

dicción del 95 ¡x:,r ciento:


74. 82
l (70 - 75) 2
78 ± 2.2622V36.2634vl + - + - - - - Si se extrajeran repetidamente muestras de la población de pacientes, se
11 2750 llevará a cabo el análisis de regresión y se estimará µrfx =70 con un intervalo
78 ± 2.2622(6.02)( 1.0488) de confianza elaborado en fonna similar, alrededoí del 95 por ciento de
dichos intervalos incluiría a la media real. Por esta razón, se tiene el 95 por
78 ± 14
ciento de confianza en que el único intervalo construido contenga a la me-
64, 92 dia verdadera.
La interpretación de un intervalo de predicción es similar a la interpretación Si se construyen intervalos de confianza para las medias de varias sub-
poblaciones y se grafican los límites inferior y superior sobre el mismo dia-
de un intervalo de confianza. Si se extraen pruebas repetidamente, _se lleva a
cabo un análisis de regresión y se elaboran los intervalos de predicción para grama de dispersión con la recta de regresión, puede obtenerse una banda
los pacientes que obtienen 70 dé calificación en la nueva prueba, casi el 95 de confianza mediante la unión de todos los límites superiores con una
por ciento de ellos incluirá las calificaciones de los pacientes en Ja prueba Tabla 8.5.1. Límites de confianza del 95 por ciento para µl'lx. para cada valor de x,
estandarizada. Ésta es la int~rpretación probabilística. La interpretación ejemplo 8.3. l. ·
práctica es que se tiene el 95 por ciento de confianza en que el único inter-
valo de predicción construido incluya la calificación de los pacientes en la ' s Línlite inferior Limite superior

prueba estandarizada. 50 55.1827 47.5009 62.864:)


55 60.8007 54.1798 67.4216
Estimación de la media de Y para una X dada Si, en el ejemplo ilustrati- 60 66.4187 60.7588 72.0786
vo, se tiene interés en calcular la calificación media de Y para una sub- 65 72.0:367 67.1783 76.8951
población de pacientes que lograron una calificación media de Y para una 70 77.6547 73.3482 81.9612
subpoblación de pacientes que lograron una calificación de 70 en la nueva 75 83.2727 79.1666 87.3788
prueba, nuevamente se.calcularía: 80 88.8907 84.5842 93.1972
85 94.5087 89.6503 99.3671
_; - -.9973 + 1.1236(70) 90 100.1267 94.4668 105.7866
95 105.74-41 99.123$ 112.3656
78 111.3627 103.6809 119.04-43
100
Uso de la ecuación de regresión
489 1
488 Regresión y corrtlación simple
de confianza curvilínea común sobre cualquiera de la variedad de rectas. )
y
8
1 Este tema también se discute en Hoe], 7 Gafarian, Halperin y Gurian9 y en
120
Elston y Grizzle. 10 l
110 En forma similar, las bandas de predicción se pueden elaborar mediante
la graficación de intervalos de predicción de varios valores de X. )
~ 100
N )
~ 90 Análisis por computadora En esta sección se elabora un análisis de los
u
e l
1:•
datos del ejemplo 8.3.l mediante computadora. Se ingresan las mediciones
80
de X en la columna l y las de Y en la columna 2 y se registran los siguientes l

~
•2 70 comandos para etiquetar las columnas que contienen los datos de X y Y.
.,,
~

60
respectivamente:
e
•~ 50
l Hl!E Cl = 1 1', C2 = 'Y'
if. ..
30
Los siguientes comandos producen el análisis junto con su salida impresa.
20 El comando BRIEF 3 se usa para obtener la impresión completa. )
)
10
)
o BRIEP 3
O 10 20 JO 40 50 60 70 80 90 100 110 X
Puntajes con la prueba nueva REGBESS •t• OB l PREDICTOB 'I'
Figura 8.5.1. Banda de confianza del 95 por ciento para µ_i-Lrdel ejemplo 8.3. l.

curva y todos los límites inferiores con otras. La tabla 8.5.1 contiene los La figura 8.5.2 muestra la salida impresa del programa de regresión li-
límites de confianza superior e inferior del 95 por ciento para µ¡·lx por cada neal simple del paquete MINITAB. Es importante observar la columna
uno de los valores de X en el ejemplo; y la figura 8.5.1 muestra a banda de encabezada con Stdev. Fit (ajuste de la desviación estándar) contiene. para
confianza del 95 por ciento que resulta cuando estos valores se grafican. cada valor observado de X, los valores numéricos·de
Nótese que la banda de confianza es más amplia en los extremos que en
la parte media. De hecho, la banda de confianza es más angosta para xp == X 1 (x 11 - i) 2
= 75. La razón de esto es que, cuando x sustituye a X = 75 en la ecuación -+
8.5.2, la cantidad dentro del radical es un mínimo que produce el intervalo n - L,(x - X)2
de confianza más angosto. A medida que x aumenta o disminuye, la canti-
dad dentro del radical se hace más grand/, como sucede también con los
intervalos de confianza asociados. La salida impresa de resultados muestra información ya conocida
Graybill y Bowden5 presentan un método para elaborar bandas de con-
fianza que sean rectas. Sugieren que posiblemente sean preferibles las ban-
das de este tipo a las del tipo curvilíneo mencionadas con anterioridad, ya
que son más fáciles de calcular y de graficar, y tienen un ancho promedio EJERCICIOS---
menor.
En cada uno de los ejercicios del 8.5.1 al 8.5.5, según los datos de los ejercicios del
Dunn,6 quien ha elaborado una banda de confianza que en su opinión es 8.3.1 al 8.3.5, y para el valor X indicado, a) construir el intervalo de confianza
preferible a la de Graybill y Bowden, sugiere que debe preferirse la banda
Modelo de correlación 491
490 Regresión y correlación simple
g,5.6 Construir la banda de confianza del 95 por ciento para ~-Lr para el ejercicio
The regression equation is 8.3.5. ·
y= - 1.00 + l.12 ~ g.S.7 Con base en el ejercicio 8.3.6, sea X= 90.

Predictor Coef Stdev t-ratio p 8.6 MODELO DE CORRELACIÓN _ _ _ _ _ _ _ _ __


Constant -1.000 8.7'19 -0 .. 11 D."112
• 1. l23b 0.1148 e¡. 7'1 0.000
En el modelo clásico de regresión. que ha sido el modelo fundamental en el
estudio hasta este punto, sólo Y. llamada variable dependiente, es aleatoria.
s = b .020 R-sg = "ll.4\ R-sg(adj) = "t0.5% La variable X se define como una variable fija (no aleatoria o matemática) y
Analysis of Variance recibe el nombre de variable independiente. También es necesario recordar
que se han descrito las obs~rvaciones como se obtienen mediante la preselec-
ción de los valores de X y detenninando los valores correspondientes de Y.
SO URCE DF SS MS F p Cuando X y Y san variables aleatorias. se tiene lo que se conoce como
Re gres- 1 3472.0 3472.0 "15. 81 0.000 ,nodelo de correlación. Típicamente, bajo el modelo de correlación, se ob-
sien
Error , 32b.1 31:,.2
tienen observaciones de la muestra mediante la selección de una muestra al
azar de las unidades de llSociación (que pueden ser personas, lugares, ani-
Total 10 37'18.2
males, puntos en el tiempo o cualquier otro elemento sobre el cual se toman
las dos medidas) y al tomar una medida de X y una de Y. En este procedi-
Obs.

1

50
y

1:.1.00
Fit

55.H
Stdev.Fit

3.10
··-
sidttal
5.82
St.Resid

1.1?
miento, los valores de X na se preselec.cionan, sino que son al azar, según la
unidad de asociación seleccionada en la muestrd.
Aunque no se puede llevar a cabo con sentido el análisis de correlación
2
3
SS
bO
61.00
s,.oo
b0.80
bb.lf2
2. ,3
2.so
0.20
- 7. lf2 o·º"
-J..35
bajo ei modelo de clásico de regresión, el análisis de regresión puede lle-
varse a cabo bajo el modelo de correlación. La correlación, que comprende
b5 2.15
"
5 ?O
71.00
!O.DO
72.04
77.bS 1,. '10
-J..Ot;
2.35
-0.18
0.41 dos variables, implica una correlación entre las variables que pone a ambas
b ?S ?b. DO 63.27 1. a2 -?.2? -1.27 sobre un mismo terreno y no las distingue, refiriéndose a una como la
? !O ,a.oo aa.a, l ."10 1.11 0.1"1
, ! !S
,o
,s
lDb.00
"18.00
"tlf.51
J.00.13
2.15
2.50
J.1. 49
-2 .13
2. alf
-0.3"1
variable dependiente y a la otra como la variable independiente. De hecho,
en los procedimientos básicos. de cálculo, que son los mismos que para el
10 lOD.00 105.75 2.CJ3 -5. 75 - l. 0'1 modelo de regresión, puede ajustarse una recta a los datos, ya sea mini-
H 100 1111.00 111.31:, 3. 40 2.blf 0.53 mizando L(v¡ - f¡) 2 , o bien, minimizando L(.,·i - i) 2. En otras palabras,
puede hacerse una regresión de X sobre Y. así como una regresión de Y
Figura 8.5.2. Impresión parcial del análisis por computadora con los datos del sobre X. En general. las rectas en ambos casos serán distintas y surge una
ejemplo 8.3.1. obtenida mediante el uso del paquete de sof1ware MINITAB.
pregu.nta lógica: ¿cuál recta ajustar?
Si el objetivo es únicamente obtener una medida de la intensidad de la
del 95 por ciento para µl'l.r y b) construir el intervalo de predicción del 95 por ciento relación entre las dos variables, no importa qué recta se ajuste, ya que la me-
para Y. · dida que por lo general se calcula será la misma en cualquier caso. Sin em-
bargo, si se desea utilizar la ecuación que describe la relación entre las dos
8.S.1 Con base en el ejercicio 8.3.J, sea X= 2. variables para los propósitos estudiados en las secciones anteriores, es im-
8.S.2 Con base en el ejercicio 8.3.2, sea X= 400. portante decidir cuál recta ajustar. La variable para la que se desea estimar
8.5.3 Con base en el ejercicio 8.3.3, sea X= 50. las medias o hacer predicciones debe tratarse como la variable dependiente.
8.5.4 Con base en el ejercicio 8.3.4, sea X= 100.
es decir, debe realizarse la regresión de esta variable sobre la otras.
8.5.5 Con base en el ejercicio 8.3.5, con X= 5.
492 Regresión y co"elación simpk 493
Coef,ciente de correlación

Bajo el modelo de correlación, se supone que X y Y varían conjunta- f(X, YJ /(X, YJ


mente en lo que se conoce como distribución conjunta. Si la forma de esta
distribución conjunta sigue una distribución normal, se conoce como dis-
tribución normal bivariada. Es posible hacer inferencias sobre esta pobla-
ción con base en los resultados de las muestras extraídas adecuadamente de
ella. Si, por otra parte, se sabe que la distribución conjunta no es normal o si
se desconoce la forma y no existe justificación para suponer que existe nor- )
malidad, se invalidan los procedimientos inferenciales, aunque bien puede
calcularse medidas descriptivas.
)
/

r-1v "- X

i
y y
Deben cumplirse las siguientes suposiciones para que sean válidas las \ / 1 \ / X )
inferencias acerca de la población, cuando el muestreo se realiza a partir de
)
una distribución bivariada. ,,, (b)

l. Para cada valor de X existe una subpoblación de valores de Y que siguen una /(X. Y)
distribución normal.
1 11
2. Para cada valor de Y, existe una subpoblación de valores de X que sigue una dis- )
tribución nonnal.
3. La distribución conjunta de X y Y es una distribución normal llamada distribu- )
ci611 norn,al bivariada. )
4, Todas las subpoblaciones de los valores de Y tienen la misma variancia.
5. Todas las subpoblaciones de los valores de X tienen la misma variancia.

La distribución nonnal bivariada se representa gráficamente en la figura


8.6.l. En esta ilustración se observa que si se corta el montículo en forma y X·
paralela a Y en algún valor de X, el corte revela la distribución normal
1
correspondiente de Y. Asimismo, un corte paralelo a X en algún valor de Y
revela la subpoblación correspondiente de X con distribución normal.
,,, )
Figura 8.6.1. Distribución normal bivariada. a) una distribución normal bivariada;
b) corte para mostrar la suhpoblación de Y, que sigue una distribución normal para
una X dada; c) corte para mostrar la subpoblación X, que sigue una distribución )
8.7 COEFIÓENTE DE CORRELACIÓN _ _ _ _ _ _ _ __ nórmal, para una Y dáda.

La distribución normal bivariada que se analiza en la sección 8.6 tiene cinco signo de p siempre será igual al signo de ~. la mpendiente de la recta de
parámetros: a.x• a\,, µ.x• µv y p. Los primeros cuatro son respectivamente las regresión de la población para X y Y.
desviaciones estáÍldar y las 111edias asociadas con las distribuciones indivi- El coeficiente de correlación de la muestra. r, describe la relación entre
duales. El otro parámetro, p, se conoce como coeficiente de correlación de las observaciones de la muestra en dos variables de la misma fonna que p
la población y mide ia intensidad de la relación lineal entre X y Y. describe la relación en la población.
El coeficiente de correlación de la población es la raíz cuadrada de p 2, Las figuras 8.4.5d y 8.4.5c, respectivamente, muestran los diagramas de
el coeficiente de determinación de la población previamente estudiada, Y dispersión típicos. donde r--+ O (,1--+ 0) y r = +l (,2:;:: 1). La figura 8.7.1
dado que éste toma valores entre O y 1 inclusive, p puede tomar cualquier muestra un diagrama de dispersión típico, donde r = -1.
valor entre-} y +l. Si p;; I, existe una correlación lineal directa perfecta, Por lo general, el interés radica en saber si es posible concluir que p et. O.
entre las dos variables, mientras que p ;; -1 indica una correlación lineal esto es, que X y Y están correlacionadas. Dado que, por Jo general, p se
inversa perfecta. Si p ;; O, las do5. variables no están correlacionadas. El desconoce. se obtiene una muestra aleatoria a partir de la población de
Coeficiente de correlación 495
494 Regresión y correlación simple
y
Tabla 8.7.1. Mediciones de la presión san-
guínea sistólica (mm/Hg) mediante dos
métodos en 25 pacientes con hipertensión
esencial.
Paciente
ntin1ero Método I Método JI
1:~2 130
~ lj8 134
3 144 132
4 146 140
1-lH 1:)0
"
¡; [:i2 144
X 7 EiH 150
Figura 8.7.1. Diagrama de dispersión parar= -1. s 13U 122
!I Jti2 160
interés. se calcular, el valor estimado de p y se prueba H : p = O contra la lhH 150
0
alternativa p:,: O. El procedimiento se ilustra con el siguiente ejemplo. "'
11 ,_
1-,,
17-1
160
178
12
1:i l81J l liR
Eje1nplo 8.7.J Se obtuvieron lecturas de la presión sanguínea mediante dos
1¡ 180 17-1
métodos distintos. en 25 pacientes con hipertensión esencial. Las lecturas
1:') !HS I Hti
sistólicas obtenidas mediante los dos métodos se encuentran en la tabla
8.7.1. l!i 1!1-! ,_
¡-.,
17 I il-J IH'l
El médico desea investigar la intensidad de la relación entre las dos 200 17H
IS
mediciones. 196
19 '.!00
:!O 20-t 188
Solución El diagrama de dispersión y la recta de regresión de los mínimos :!! :!10 180
cuadrados se muestra en la figura 8.7.2. 'l 10 196
''" 210
Los cálculos previos necesarios para obtener la recta de regresión de los 2:i 'llti
mínimos cuadrados se muestran en la tabla 8.7.2. Dado que el investigador :!-1 ~'lO l 91l
quiere obtener una ecuación de regresión y utilizarla para propósitos de esti-
,,~ '2'lU 20'2
-·'
mación y predicción, el coeficiente de correlación de la muestra se obtiene
mediante los métodos estudiados bajo el modelo de regresión. Al resolver las ecuaciones se tiene
Se trataron las lecturas del método I como variable independiente, ya 20.8~)28
que el médico anticipó que le gustaría predecir una lectura del método II, "¡, .8220
dada una lectura del método I.
l\ifediante la sustitución de los valores de la tabla 8.7.2 en las ecuaciones
La ecuación de mínimos cuadrados es
8.3..2 y 8.3.3 se obtienen las siguientes ecuaciones normales:
,· = 20.8928 + .8220x
.¡ l /:? = 1?1(/ + -l·l·IOb El coeficiente de determinación, que es igual a la suma de cuadrados
explicada dividida entre la suma total de cuadrados. es ( mediante las ecua-
'i:',i.~tli = ·1"140(/ + 808·101-1/,
ciones 8.4.3 y 8.4.4)
)
496 Regresión y co"elación simple Coeficiente de correlación 497
1 )

"I•,Y, - (Ix,iv,)

r ~ \)n"j,x¡ - (I•r Y•'i,v; - (1,,)'
• (8.7,2) 1 )
,
\


/'· • Una ventaja de esta fórmula es que r puede calcularse sin haber calcula-
do b. Este es el procedimiento deseable cuando no se anticipa que se uti-
lizará la ecuación de regresión. Con la sustitución de los datos de la tabla
8.7 .2 en la ecuación 8.7 .2 se obtiene ,l

Tabla 8.7.2. Cálculos preliminares para obtener la línea de regresión de mínimos
1
cuadrados del ejemplo 8.7.1.
Médodo / (x) Método// (y) ,, 'Y~ ,,
132 130 17424 16900 17160
138 134 19044 17956 18492
180 200 220 X
132 20736 17424 19008
Método I 144
146 140 21316 19600 20440
Figura 8.7.2. Lecturas de la presión sistólica sanguínea 21904 22500 22200
148 150
(mm Hg) en 25 pacientes con hipertensión esencial. 20736 21888
152 144 23104
150 24964 22500 23700
158
2 130 122 16900 14884 15860
b'[Ix; - IIx,) / ..] 162 160 26244 25600 25920
,,-,, 168 150 28224 22500
25600
25200
27520
l 72 160 29584
Il :_ (1,.)'i" (8.7.1)
174 178 30276 31684
28224
30972
30240
180 168 32400
180 174 32400 30276 31320
Mediante la sustitución de los valores de la tabla 8.7.2 y la ecuación de 34596 34.968
188 186 35344
regresión en la ecuación 8.7 .1 se tiene 29584 33368
194 172 37636
194 182 37636 33124 35308
,.-., (.8220f8U8.408 - (4440) 2 / 25'
200 178 40000 31684
38416
35600
39200
il0,952 - (4172)~/25 200 196 40000
204 188 41616 35344 38352
,9112713 44100 32400 37800
210 180
21 O 196 44100 38416 41160
Finalmente, el coeficiente de correlación es 216 210 46656 44100 45360
220 190 48400 36100 41800
202 48400 40804 44'140
= W = V.Yl 12il3 = .954605 = .95 220
Total 4440 4172 808408 710952 757276
Una forma alternativa para calcular res la siguiente
498 Regresión y correlación simple Coeficiente de co"elación 499

25(757,276) - (4440)(4172) Prueba a utilizar cuando el valor p hipotético es diferente de cero La


utilización de la estadística l, calculada en el ejercicio anterior, es conve-
'~ V25(808,408J - (4440J'V2s(7J0,952J - (4172)'
niente sólo para probar H 0: p =O.Si lo que se quiere es probar H 0: p = p0,
~ .95 donde p 0 es un valor diferente de cero, se debe utilizar un procedimiento
diferente. Fisher 11 sugiere la transformación de r en zr como sigue:
Ejemplo 8.7.2 De acuerdo con los datos del ejemplo 8.7.1, se desea veri-
ficar el valor de la muestra de r :::: .95 tiene una magnitud suficiente para 1 l + r
-~, = -
2 In
1-r--
indicar que en la población las dos variables de interés están correlacio... (8.7.4)
nadas.
donde In es el logaritmo natural. Es posible demostrar que zr sigue una dis-
Solución Se efectúa la prueba de hipótesis como sigue: tribución aproximadamente normal, con media zp == 1/ 2 ln{(l + p) / (1 - p)}
y una desviación estándar esti1nada de
1. Datos. Ver el planteamiento del ejemplo 8. 7.1.
2 Suposiciones. Se piensa que las suposiciones dadas en la sección 8.6 son apli-
cables.
3. Hipótesis vñ"=3 (8.7.5)
Ho: p = O
H.,.: p -:#: O Para probar la hipótesis nula que indica que p es igual a un valor dife-
rente .de cero, Ia estadística de prueba es
4. Estadistica de prueba. Cuando p = O. es posible mostrar que la estadística de
prueba adecuada es
Z, - ZP
z= 1ivñ"=3 (8.7.6)
t = r
~ ,
(8.7.3) que sigue una distribución aproximadamente normal estándar.
Para determinar zr para una r observada, y zP para un valor p hipotético,
S. Distribución de la estadística de prueba. Cuando H0 es verdadera y se cumplen se consulta la tabla I, evitando así el uso .directo de logaritmos naturales.
las suposiciones, la estadística de prueba sigue una distribución t de Studenl con Suponer que en el ejemplo se quiere probar
n - 2 grados de libertad.
6, Regla de decisión. Si a = .05, los valores críticos de ten el ejemplo son H 0 : p = .98
±2.0687. Si a partir de los datos se calcula un valor de t que es mayor o igual a
+2.0687, o bien, menor o igual a-2.0687, entonces se rechaza la hipótesis nula. contra la alternativa
7, Cálculo de la estadística de prueba. El valor calculado de res
H,: p a/a .98
23
1 = .954605 con un nivel de significación de .05. Al consultar la tabla 1, se tiene que
I - .9112713
15.37 r = .95, z, = 1.83178
y para
8, Decisión estadística. Dado que el valor calculado de la estadística de pruebil
excede el valor crítico de t, • se rechaza la hipótesis nula. p = .98, ,, = 2.29756
9. Conclusión. Se concluye que las dos variables están correlacionadas. Puesto que
15.37 > 2.8073, se tiene para esta prueba, p < .OJ. por lo tanto, la estadística de prueba es
Coef&eiente de co"elación 501
500 Regresión y co"elación simple
En algunas situaciones, los datos disponibles para el análisis no cum-
1.83178 - 2.29756 plen con las suposiciones necesarias para el uso de los procedimientos estu-
z = --:-1-:-1:--v;;;2c;c5=-=3- diados aquí para la prueba de hipótesis respecto al coeficiente de corre-
- 2 .1 s lación de la población. En tales casos es más conveniente utilizar la técnica
de correlación de rango Spearman, que se estudia en el capítulo 11.
Dado que -2.18 es menor que el valor crítico de z :;;; -1.96, se debe rechazar
Intervalo de confianza para p Es posible utilizar la transformación de
H0 y concluir que el coeficiente de correlación de la población no es .98.
Fisher para construir intervalos de confianza del 100(1 - a.) por ciento para
Para los tamaños de muestras menores que 25, la transformación Z de
Fisher debe emplearse con precaución. Es posible utilizar un procedimien- p. Se utiliza la fónnula general para el intervalo de confianza
to alternativo, propuesto por Hotelling, 12 para tamaños de muestra mayores estimador± (factor de confiabilidad) (error estándar)
o iguales a I O. En este procedimiento se utiliza la siguiente transformación
de r Primero se convierte el estimador, r, en zr, se elabora un intervalo de
confianza en tomo a zp y se reconvierten los límites para obtener un interva-
z* = z, -
__
32., + r
411 lo de confianza del l 00(1 - a) por ciento para p. La fónnula general se con-
(8.7.7)
vierte en
La desviación estándar de z* es Z, ± z ( l i ~ ) (8.7.10)
1
cr••
v,;-=--r (8.7.8) Para el presente ejemplo, el intervalo de confianza del 95 por ciento
para zp está dado por
La estadística de pru eba es
z* - ~* I.83178 ± I.96( 1 / V25 - 3)
Z* = I ¡ v,;-=--r = ( z* - t •) v,;-=--r
donde (8.7.9) l.83178 ± .41787
(3z0 + p)
~· (llamada zeta) .= z, - 4n
l.41391, 2.24965

Los valores críticos para propósitos de comparación se obtienen a partir Al convertir estos lítnites, que son valores de zr' en valores de r, se tiene
de la distribución normal estándar.
En el ejemplo,-para probar H 0: p =: .98 contra HA: pe;:. .98 mediante la
•,
transformación de Hotelling y a.= .05. se tiene
l.41391 .890
3 3 95 .97-5_________
z* = l.83178 - (LS ~t2s;) + · = 1.76733 2.24965

• = 2 297 6 - 3(2.29756) + .98 = 2 2 83 Por lo tanto, se tiene el 95 por ciento de confianza de que p está contenido
' . 5 4(25) . 18
en el intervalo de confianza de .890 a .975. Debido a los valores limitados
z• = (l.76733 - 2.21883Jv'25 - r de la tabla, estos límites deben considerarse sólo como aproximaciones.
= -2.21 Un método alternativo para elaborar intervalos de confianza para p con-
13
siste en emplear tablas especiales, diseñadas por David.
Puesto que -2.21 es menor que -1.96, la hipótesis nula se rechaza y se
logra la misma conclusión que cuando se utiliza la transformación de
Fisher.
502 Regresión y correlación simple Ejercicios 503

EJERCICIOS,~~~~~~~~~~~~~~~~~~ Prin1er f,!en1elo {X) Segu11do gen1e/o ( Y)


En cada uno de los siguientes ejercicios; 118 115
116 119
a) Elaborar un diagrama de dispersión. 118 116
b) Calcular el coeficiente de correlación de la muestra. 120 119
e) Probar H 0 : p :::: O al nivel de significación de .05 y sacar conclusiones. 122 118
d) Determinar el valor p para la prueba. 122 138
e) Construir el intervalo de confianza del 95 por ciento para p. 122 124
120 128
8.7.1 Una muestra aleatoria de los expedientes de un hospital proporcionó la si- 124 126
guiente información acerca de la duración del internado en días y el ingreso 125 130
familiar anual (redondeado hasta los $500 más próximos) de 15 pacientes 138 130
dados de alta. 140 125
142 164
144 160
Ingreso anual Duración del 145 158
por fanlilia (X) internado (Y) 162 145
180 184
$2000 11
180 190
2500 12 188
182
3000 9
185 180
3500 8
170 174
4000 9 170
172
4500 10
150 160
5000 7 155
152
5500 8 160
155
6000 4
6500
7000
7
5
1,.• 3,604 :v~ • 5'2.832

7500 6 k'· • 3,676 ~l~ = 555,618


8000 3
8500 4 }:x<v, = 543,120
9000 4
8.7.3 Se compararon dos métodos para medir el volumen de sangre expelida por
Lt, = s2.5oor,-; = ª'' cada Yentrículo en 10 animales de laboratorio, obteniéndose los siguientes
resultados
¿x; = 523,750.000 í:x~v, = 510,500 Volumen de sangre (1/min)
Método J (X) Método 11 (Y)
L.1, = 107
.8 .5
1.0 1.2
1.3 1.1
8.7.2 La siguiente tabla muestra la presión sanguínea sistólica en cada miembro de 1.4 1.3
25 parejas de gemelos idénticos. 1.5 1.1
(Continúa fa tobla
1.4 1.8
en la página siguiente)
\
Regresión y co"elación simpk Ejercicios 505
504
Calificación final Calif. dir. estatal
2.0 1.6 (Y)
(X) )
2.4 2.0
2.7 2.4 87 440 )
3.0 2.8 Si 480
87 535 \
88 460
525
l
8.7.4 Los siguientes valores representan IS lecturas que indican el volumen del trá- 88
fico y la concentración de monóxido de carbono tomados en un laboratorio 89 480
para determinar la calidad del aire de cierta ciudad. 89 510
)
89 530
89 545 ',
Volu111en del tráfico 89 600
(auto,nóviles por hora) CO(PPM) 90 495
(X) (Y J 90 545
90 575
100 8.8
91 525
110 9.0
91 575
125 9.5
91 600
150 10.0 1
92 490
175 10.5
190 10.S 92 510 J
92 575
200 10.5
93 540 ·''
225 10.6
93 595
250 11.0
94 525
275 12.1
94 545
300 12.1
94 600 )
325 12.5
94 625
350 13.0 )
375 13.2
400 14.5 L'· = 2,26, p,. 13,425

}:x, = 3,550 L.\', = 167.8


Y,
Lx? = 204,977 = 7,264,525

Lx~ = 974,450 L.r~ = 1,915.36

Lx,,·, = 41.945 Lx.v, = 1,216,685

8.7.5 Una muestra aleatoria de 25 enfenneras seleccionadas de un registro estatal


proporcionó la siguiente información acerca de la calificación obtenida por 8.7.6 Una muestra aleatoria simple de 15 niños aparentemente sanos, con edades
cada una de ellas en un examen aplicado por la dirección estatal, así como la entre 6 meses y 15 años, proporcionó los siguientes datos sobre la edad, X, y
calificación final obtenida en la escuela. Ambas calificaciones se relacionan el volumen del hígado por unidad de peso corporal (ml/kg), Y.
con el área de especialización de la enfennera.
Regresión y correlación simple Resumen 507
506
X y y
fin de ayudar al lector en el uso correcto de estas técnicas. se sugiere lo
X
siguiente:
.5 41 10.0 26
1. Antes de reunir los datos, deben revisarse cuidadosamente las suposiciones que
.7 55 10. I 35
fundamentan los análisis de regresión y correlación. Aunque es raro encontrar
2.5 41 10.9 25
4.1
que se cumplan las suposiciones a la perfección, el usuario debe tener alguna
39 l 1.5 31
idea de la magnitud de la brecha que existe entre los datos que son analizados y
5.9 50 12. l 31
6.1
las suposiciones del modelo propuesto, de modo que pueda decidir si debe elegir
32 14.1 29
otro modelo; procédase con el análisis, pero interprétense los resultados con pre-
7.0 41 15.0 23
caución, o bien, utilícese con plena confianza el modelo elegido.
8.2 42
2. En la regresión lineal simple y el análisis de correlación, las dos variables de
interés se miden sobre la misma entidad, llamada unidad de asociación. Si se tiene
interés en la relación entre la estatura y el peso, por ejemplo, estas dos medidas se
hacen en el mismo individuo. En general, carece de sentido hablar de correlación,
8.8 ALGUNAS PRECAUCIONES----------- por ejemplo, entre las estaturas de un §fllpo de individuos y el peso de otro grupo.
3. Sin importar qué tan grande es la indicación de una relación entre dos variables,
Los análisis de regresión y correlación son herramientas estadísticas muy no debe interpretarse esto como un caso de causa y efecto. Si, por ejemplo, se
útiles cuando se utilizan de manera adecuada. Sin embargo, el uso inade- observa un coeficiente significativo de correlación de la muestra entre las dos
cuado sólo puede conducir a la obtención de resultados sin sentido. Con el variables X y Y, puede significar una de varias cosas:
a) X causa Y.
b) Y causa X.
e) Algún tercer factor, sea directa o indirectamente, causa tanto a X como a Y.
y d) Ha ocurrido un evento improbable y se ha obtenido por casualidad un eleva-
do coeficiente de correlación de la muestra a partir de una población en la
___,
Extrapolación
que, de hecho X y Y no están correlacionadas.
e) La correlación es sencillamente disparatada, situación que puede surgir cuan-

• • • do las mediciones de X y Y no se hacen sobre una unidad común de aso-
ciación .
• 4. La ecuación de regresión de la muestra no debe utilizarse para predecir o estimar
• • fuera del intervalo de valores de la variable independiente representado en la
• muestra. Esta práctica, llamada extrapolación, tiene sus riesgos. La verdadera
• relación entre dos variables, aún cuando sea lineal dentro de un intervalo de la
• • variable independiente, a veces se puede describir mejor como una curva fuera
del intervalo. Si, por casualidad, se extrae la muestra precisamente del intervalo
• • donde la relación es lineal, se tiene únicamente una representación limitada de la
• • población, por lo que proyectar los resultados de la muestra más allá del interva-
lo representado por ella puede conducir a conclusiones falsas. La figura 8.8.1
• muestra algunas trampas de la extrapolación .

Extrapolación 8.9 RESUMEN _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ __

X
En este capítulo se estudian dos herramientas importantes del análisis esta-
Intervalo de muestra
dístico, regresión lineal simple y correlación. Se ha sugerido el siguiente
Figura 8.8.1. Ejemplo de extrapolación. esquema para la aplicación de estas técnicas.
)
508 Regresión y correlaci6n simple Preguntas y ejercicios de repaso 509
l. Identificar el n,odelo. El usuario debe saber cuál de los dos modelos es el más PREGUNTAS Y EJERCICIOS DE REPASO•-------- )
conveniente para dar respuesta a sus preguntas.
2. Revisar las suposiciones. Se ha señalado repetidamente que la validez de las l. ¿ Cuáles son las suposiciones que fundamentan el análisis· de regresión lineal )
conclusiones depende de qué tan bien se ajusten los datos al modelo elegido simple cuando uno de los objetivos es hacer inferencias acerca de la población )
para el análisis. de la cual se extrajeron los datos de la muestra?
3. Obtener la ecuación de regresión. Se ha visto cómo se obtiene la ecuación de )
2. ¿Por qué a la ecuación de regresión se le da el nombre de ecuación de mínimos
regresión mediante el método de los mínimos cuadrados. Aunque los cálcu- )
cuadrados?
los, cuando se hacen a mano, son un tanto largos, complicados y sujetos a
error, éste no es ahora el problema como lo fue en el pasado. Las computado- 3. Explicar el significado de a en la ecuación de regresión de la muestra. )
ras electrónicas se utilizan ahora tan ampliamente que el investigador o las
4. Explicar el significado deben la ecuación de regresión de la muestra.
personas dedicadas a la estadística que no tienen acceso a una de ellas son la
excepción más que la regla. No es necesario hablar en defensa del investi- 5. Explicar los siguientes ténninos:
gador que tiene que realizar una gran cantidad de cálculos si dispone de una a) Suma total de cuadrados. )
computadora. b) Suma de cuadrados explicada.
4. Evaluar la ecuación. Se ha visto que la utilidad de la ecuación de regresíón para c) Suma de cuadrados inexplicada.
)
fines de estimación y predicción se determina mediante el análisis de ·variancia, )
6. Explicar el significado del coeficiente de detenninación y el método para calcu-
el cual prueba la significación del cuadrado medio de la regresión. Se valora la
larlo. )
intensidad de la relación entre dos variables bajo el modelo de correlación al
probar la hipótesis nula de no existencia de correlación en la población. Si esta 7. ¿Cuál es la función del análisis de variancia en el análisis de regresión? )
hipótesis se puede rechazar, es posible concluir, al nivel de significación elegi-
do; que las dos variables están correlacionadas.
8. Describir dos formas en las que se puede probar la hipótesis nula de P= O.
5. Utilizar la ecuación. Una vez que se ha determinado que posiblemente la ecua- 9. ¿Para qué propósitos se puede utilizar la ecuación de regresión? )
ción de regresión describe correctamente la relación entre las dos variables, X y 10. ¿Cuáles son las suposiciones que fundamentan el análisis de correlación simple
Y, es posible utilizarla para uno de dos propósitos: )
cuando la inferencia es un objl"tivo?
a) Predecir que valor puede llegar a tener Y, dado un valor específico de X, o
bien. 11. Qué se entiende por unidad de asociación en los análisis de regresión y corre-
b) Para estimar la media de la subpoblación de los valores Y para un valor lación?
específico de X. ,1
12. ¿Cuáles son \as explicaciones posibles para un coeficienle de correlación signi-
ficativo de la muestra?
Este estudio, necesariamente abreviado, de la regresión lineal simple
y la correlación puede haber dado lugar a más preguntas de las que se han 13. Explicar por qué existen riesgos al utilizar una ecuación de regresión de la )
muestra para predecir o estimar fuera del intervalo de \'alares de la variable
contestado. Se le puede haber ocurrido al lector, por ejemplo, que una )
independien1e representada en la muestra.
variable dependiente puede predecirse con mayor precisión mediante dos
o más variables independientes en lugar de una sola. O quizá se puede 14. Describir una situación del área de interés del lector. donde sería útil el análisis
tener la sensación de que conocer la intensidad de la relación entre varias de regresión simple. Utilice datos reales o ficticios para efectuar un análisis de
variables podría ser más interesante que si se conoce la relación entre sólo regresión completo.
dqs de ellas. La exploración de estas posibilidades es el tema del capítulo 15. Describir una situución del área de interés del lector, dónde sería útil un análi-
siguiente, por lo que las dudas al respecto quedan, al menos, parcialmente sis de correlación sin1ple. Utilizar dalos reales o ficticios para lle\'ar a cabo un
satisfechas. análisis de correlación completo.
Para quienes desean ampliar sus conocimientos acerca del tema, al final En cada uno de los siguientes ejercicios llevar a cabo el análisis requerido y probar
del capítulo se dan varias referencias excelentes además de las ya citadas. las hipótesis en los niveles de significación indicados. Calcular el valor p para cada
prueba.
p,.eguntas y ejercicios de repaso 511
510 Regresión y collelación simpk

J6. Los siguientes valores son los niveles de testosterona en el plasma y la edad de Presián .w111g11í11ea Presión sanguínea Pérdida
sistó/ic{l 111edia sistólica niedia de
Jos prisioneros que sufrían su primera condena por crímenes violentos y por snngre
durante cin1gía Pérdida de durante cirugía
agresión, tomados de una muestra de reos jóvenes. sangre (1111) (111111 Hg) (11d)
(111111 HgJ
Concentraci6n Edad en la prin1e- Concentración Edad en la prinle· 95 274 80 190
de testosterona ra condena de testoterona ra condena 90 170 110 288
1305 11 710 17 125 352 90 205
1000 12 1150 18 105 317 105 150
1175 13 605 20 110 171 90 175
1495 14 690 21 105 150 110 64
1060 lo 700 23 90 245 110 276
800 16 625 24 90 120 140 318
1005 16 610 27 Preparar un diagra_ma de dispersión. Calcular r y hacer la prueba de signifi-
450 30 cación al nivel de .05.
19. En un estudio del efecto de un componente de la dieta sobre la composición de
¿Proporcionan estos datos la evidencia suficiente para indicar que las dos va- los lípidos del plasma, se obtuvieron los siguientes datos en una muestra de 15
riables están correlacionadas? Utilizar un nivel de significación de .05. animales experimentales.
17. Algunos investigadores en salud informaron que existe una relación inversa Medición del Medl<:ió11 d"e la con-
entre las malfonnaciones del sistema nervioso central y la dificultad relaciona- co111po11e11te de ta dieta ce11tració11 en el plasn1a
da con el suministro de agua. Suponer que los siguientes datos se obtuvieron (X) (Y)
de una muestra de 20 zonas geográficas y que se obtuvieron los siguientes 18 38
resultados: 21 40
28 47
Tasa de ,ualfor- Tc1sa de 111a[for- Dificultad 35 54
111ació11 del Dificultad en ,nación del en el sun1i- 47 66
SNC I por I ()()() el s1u11i11isrro SNC (por 111il nistro de 33 52
11aci111ie11tos) de agua (pp1n) 11aci111ienros) agua (ppn1) 59
40
7.2 50 6.3 160 41 60
8. 1 25 12.5 50 28 47
11.2 15 15.0 45 21 40
9.3 75 6.5 60 30 49
9.4 100 B.O 100 06 65
5.0 150 JO.O 155 H 63
5.8 180 5.3 200 3H 57
3.3 250 4.9 240 19 38
3.6 275 7.2 40
4.8 220 11.9 65 Obtener la ecuación de regresión para esos datos, calcular r1· y probar //0 : ~=O
para las pruebas F y t.
Construir un diagrama de dispersión y calcular r. ¿Qué se concluye? Sea 20. Los siguii.::ntes valores son el flujo sanguíneo pulmonar (FSP) y el volumen
a= .05. sanguíneo puln1onar (VSP) registrados en 16 bebés y niños con enfermedad
18. Se registró la presión sistólica sanguínea media durante una intervención congénita dic:l corazón.
quirúrgica y el volumen de sangre perdida de 16 pai.:ientes.
512 Regresión y co"elación simpk Preguntas y ejercicios de repaso 513
y X 3.00 3.54
VSP (mllm 2 J FSP (U111inlm2) 2.08 3.14
2.11 2.76 )
168 4.31
)
280 3.40
391 6.20
420 17.30 Calcular la ecuación de regresión que describe la relación entre las dos varia-
303 12.30 bles, calcular ,2 y probar H0 : ~=O mediante las pruebas de F y t.
429 13.99
605 8.73 22. La siguiente tabla muestra los valores del consumo de metil mercurio y la con-
522 8.90 centración de mercurio en la sangre de 12 individuos expuestos a la primera
224 5.87 sustancia después de consumir peces contaminados.
291 5.00
233 3.51 X y
370 4.24 Consun10 de nitttil· Concentració11 total )
531 19.41 ,nercurio de n1ercurio
516
211
16.61
7.21
(µg Hg:,d!a)
ISO
(11glg)
90
1 )

439 11.60 200 120


230 125
4!0 290
Encontrar la ecuación de regresión que describe la relación lineal entre las 600 310
dos variables. calcular r2 y probar H 0 : ~=O mediante las pruebas F y t. Sea 550 290
a= .05. 275 170
580 375
21. Se compararon, mediante dos métodos, quince muestras de suero humano co.n
105 70
el anticuerpo tuberculina. Los logaritmos de los resultados obtenidos mediante
250 105
los dos métodos fueron los siguientes:
460 205
650 480
Método
A.(Xl BO')
Calcular la ecuación de regresión que describe la relación lineal entre las dos
3.31 4.09 variables, calcular r2 y probar la hipótesis H0: ~=O mediante las pruebas F y t.
2.41 3.84
23. Los siguientes valores son los pesos {en kg) y las concentraciones de glucosa
2.72 3.65
en sangre (en ing/100 mi) de 16 varones adultos aparentemente sanos.
2.41 3.20
2.11 2.97
2.11 3.22 Peso (X) Glucosa (Y)
3.01 3.96
2.13 2.76 64.0 JOB
2.41 3.42 75.3 109
2.10 3.38 73.0 104
2.41 3.28 82. l 102
(Co111i11úa la 1obfo 76.2 (Co111i111íu la tohla
2.09 2.93 105
en fa PtÍRi11,1 sig11ie111e} ('/! la ¡uigina Jiguiente J
Regresión y correlación simple Preguntas y ejercicios de repaso 515
514
95.7 12 l
Tien1po Temperatura Tien,po Ten1peratura
59.4 79
93.4 !07 24 38.8 44 4 l.l
82.l ro r 28 39.5 48 4 l.4
78.9 85 32 40.3 52 41.6
76.7 99 36 40.7 56 41.8
82.1 roo 40 4 l.0 60 4 l.9
83.9 108
73.0 104
64.4 102 Calcular la ecuación de regresión lineal simple y probar la hipótesis H : p = O
0
77.6 87 mediante el uso de la tabla ANOVA y la prueba t. Probar la hipótesis H : p = O
y construir un intervalo de confianza del 95 por ciento para p. Calcular :1 inter-
valo de predicción del 95 por ciento para la temperatura 50 horas después de la
Calcular la ecuación de regresión lineal simple y probar la hipótesis H0 : p :::: O inoculación. Sea a= .05 para todas las pruebas.
n1ediante el uso de la tabla ANOVA y la prueba t. Probar que H0: p = O y cons·
truir un intervalo de confianza del 95 por ciento para p. Para un hombre de 95 kg 26. El edema cerebral, con el consecuente incremento de presión intracraneal, fre-
¿cuál sería la concentración pronosticada de glucosa? Construir el intervalo de cuentemente acompaña a las lesiones producidas por heridas en la cabeza y
predicción del 95 por ciento para este peso. Sea a= .05 para todas las pruebas. otros accidcn1es que afectan la integridad física el cerebro. Los tratamientos
disponibles para el edema cerebral varían en cuanto a efectividad y efectos
24. La siguiente tabla indica las edades (en años) y los valores de la presión sistóli- colaterales indeseables. Uno de estos tratamientos es el glicerol, administrado
ca sanguínea (PSS) de 20 adultos aparentemente sanos. por vía oral o intravenosa. Resulta de interés para los médicos cOnocer la
relación entre la presión intracraneal y las concentraciones de glicerol en el
Edad (X) P. S. (Y) Edad (X) P. S. (Y) plasma. Los siguientes datos fueron extraídos de una población de individuos
hospitalizados con diagnóstico de edema cerebral y que fueron tratados con
20 120 46 128 glicerol. Se midió la presión intracrancal (Y) en unidades torr y las concentra-
43 128 53 136 ciones de glicerol en el plasma (X) se midieron en miligramos por mililitro.
63 14 l 70 146 Suponer que un consul1or en estadís1ica, junto con un equipo de investigación,
26 126 20 124 analiza las relaciones que existen entre estas dos variables. Selecéionar una
53 134 63 143 muestra aleatoria simple de esa población y llevar a cabo un análisis que puede
31 128 43 130 ser de utilidad para los investigadores. Presentar los hallazgos y conclusiones
58 136 26 124 en forma narrativa, utilizando gráficas en los casos que Jo requieran.
46 132 19 121
58 140 31 126
Individuo X y Individuo X y Individuo X y
70 144 23 123
l. 1.8 19. l 2. 3.3 7.6 3. 2.5 lO.i
4. 2.7 14.7 5. 1.8 15.9 6. 1.9 21.0
Encontrar la ecuación de regresión lineal simple y probar la hipótesis H0: p =O 7. 2.7 10.2 8. 2.2 15.7 9. 1.8 19.3
mediante el uso de la tabla ANOVA y la prueba t. Probar la hipótesis H0: p = O 10. 2.0 16.1 11. 2.1 12.9 12. 2.4 15.5
y construir un intervalo de confianza del 95 por ciento para p. Calcular el inter- 13. 2.5 13.9 14. 2.4 14.0 15. 1.8 19.9
valo de predicción del 95 por ciento para la presión sistólica sanguínea de una 16. 2.5 12.0 17. 2.7 9.3 18. 2.3 l4.4
persona de 25 años de edad. Sea a= .05 para todas las pruebas. 19. 1.6 20.7 20. 2.5 l 7.3 21 2.3 13.2
22. 2.9 8.6 23. 3.3 3.6 24. 2.4 15.4
25. Se reunieron los siguientes datos durante un experimento en el cual se inoculó
25. 1.2 24.2 26. 2.3 13.0 27. l.8 16.9
a un animal de laboratorio con un patógeno. Las variables son el tiempo. en
28. 2.0 l 7.3 29. 2.5 15.0 30. 1.5 23.0
horas, después de la inoculación y la temperatura en grados Cclsius.
l11dirid110 X y' Indil-'iduo X y Indi\'iduo X y Individuo X Y Individuo X y Individuo X y

31. 2O 11.6 32. 2.4 5.9 33. 2.4 14.6 154. 3.0 9.8 155. 2.3 10.9 156. 1.6 17.6
34. 2.0 18.5 35. 1.8 15.6 36. 1.8 16.8 157. 2.2 9.8 158. 1.9 15.5 159. 1.3 21.9
37. 0.7 28.7 38. 2.6 10.9 39. 2.8 11.3 161. 2.5 9.1 162. 3.0 5.6 1
160. 1.9 16.3
40. 2.1 15.3 41. 2.8 4.3 42. 1.5 22.7 163. 2.8 12.7 164. 2.4 14.8 165. 2.1 19.9
43. 2.3 13.5 44. 2.1 18.4 45. 2.5 9.6 166. 2.3 14.8 167. 2.4 12.9 168. 2.1 10.1
46. 2.3 7.7 47. 2.6 12.8 48. 2.8 13.7 169. 2.5 11.5 170. l.7 18.1 171. 2.5 15.I
49. 2.2 17.2 50. 2.4 16.8 51. 2.0 17.0 172. 2.7 11.6 173. 1.3 23.6 174. 2.8 12.I
52. 2.2 19.0 53. 2.0 21.0 54. 1.8 18.5 175. 2.6 13.5 176. 1.4 21.0 177. 2.5 13.7
55. 1.7 20.9 56. 2.2 16.2 57. 2.4 14.4 178. 2.6 11.7 179. 2.8 8.2 180. 1.2 24.0
58. .1.4 21.3 59. 3.1 9.3 60. 2.7 11.4 181. 2.3 14.3 182. 1.3 21.4 183. 3.5 7.9
61. 2.4 11.2 62. 1.5 21.2 63. 2.8 13.0 184. 2.3 7.9 185. 2.2 14.5 186. 2.2 12.7
64. 2.2 16.9 65. 2.1 17.3 66. 1.5 22.6 187. 1.8 15.9 188. 2.6 7.7 189. 1.6 19.I
67. 2.1 14.6 68. 2.0 18.2 69. 1.9 16.2 190. l.4 24.0 191. 2.2 13.6 192. 2.1 13.0
70. 2.1 14.4 71. 1.5 18.9 72. 1.3 22.3 193. 1.7 16.6 194. 2.1 14.7 195. 2.3 12.1
73. 1.3 24.1 74. 0.8 29.7 75. 1.8 20.2 196. 1.6 22.8 197. 1.7 17.9 198. 2.2 9.5
76. 2.2 15.5 77. 2.0 12.7 78. 1.5 18.2 199. 3.2 8.1 200. 2.5 16.8 201. 2.3 9,4
79. l.5 21.8 80. 2.4 11.9 81. 1.4 23.5 202. 2.4 12.7 203. 2.3 13.6 204. 2.5 10.2
82. 1.5 16.9 83. 1.7 18.4 84. 2.2 17.7 205. 1.9 11.9 206. 2.2 17.0 207. 2.0 13.5
85. 2.0 18.9 86. 1.4 17.2 87. 2.3 IO. I 208. 2.3 12.6 209. 1.1 21.1 210. 1.9 16.2
88. 2.3 12.9 89. 1.4 22.8 90. 2.5 13.0 211. 2.4 16.4 212. 1.8 19.4 213. 2.4 12.8
91. 2.1 15.7 92. 2.0 20.7 93. 1.6 18.5 214. 2.5 11.4 215. 2.2 14.8 216. 1.6 25. l
94. 2.2 13.3 9;¡. 1.4 22.1 96. 2.0 12.0 217. 1.7 22.0 218. 2.2 12.0 219. 2.6 8.6
97. 2.2 15.0 98. 2.4 13.0 99. 1.4 23.0 220. 2.4 15.7 221. 2.3 7.5 222. 2.1 14.6
100. 1.9 17.9 101. l. 7 22.4 102. 2.2 13.4 223. 2.3 12.4 224. 2.1 17.3 225. 2.9 7.1
103. 1.8 15.4 104. 2.1 13.1 105. 2.0 13.8 226. 2.8 9.4 227. 2.3 12.8 228. 2.0 17.9
106. 2.4 13.3 107. 2.6 7.9 108. 2.2 14.6 229. 2.7 9.8 230. 1.1 26.3 231. 2.2 13.8
109. 2.0 16.7 110. 1.6 14.9 111. 3.1 5.0 232. 2.1 15.0 233. 2.5 8.4 234. 2.1 15.8
112. 3.0 9.9 113. 2.3 10.5 114. 2.7 10.1 235. 1.6 18. 7 236. 2.3 15.5 237. 2.6 10.8
115. 1."6 15.8 116. 2.8 7.7 117. 2.5 14.5 238. 2.6 11.2 239. 1.6 16.1 240. 2.6 10.0
118. 1.2 29.0 119. 1.9 16.3 120. 2.0 18.6 241. 2.1 11.8 242. 2.0 17.5 243. 1.7 16.2
121. 2.5 14.2 122. 2.6 11.4 123. 1.9 1i.3 244. 1.4 23.9 245. 2.5 12.3 246. 2.3 13.0
124. 2.3 10.8 125. 2.7 8.2 126. 2.0 14.8 247. 1.4 20.7 248. 2.3 14.6 249. 2.2 14.0
127. 2.9 10.9 128. I.5 19.3 129. 1.7 15.I 250. 2.2 12.6 251. 2.3 15.2 252. 3.2 4.2
130. 2.1 15.5 131. 2.3 14.8 132. 1.6 Ji ..'\ 253. 1.6 19.2 254. 1.9 18.7 255. 3.2 6.5
133. 2.2 15.5 134. 3.1 7.6 135. 1.8 19.i 256. 2.7 9.6 257. 1.5 20.2 258. 2.5 13.8
136. 1.7 18.8 137. 2.1 17.2 138. 2.2 10.3 259. 1.9 21.0 260. 2.1 15.1 261. 3.2 9.2
139. 1.9 16.1 140. 1.8 17.3 141. l.9 17.8 262. 2.3 13.4 263. 2.1 14.5 264. 2.5 10.5
142. 2.0 19.0 143. 2.2 11.8 144. 2.5 13.4 265. 2.1 13.8 266. 2.6 6.2 267. 2.6 11.7
145. 2.0 18.3 146. 1.8 19.0 14 7. 2.0 12.7 268. 1.8 15.0 269. 2.1 7.4 270. 1.5 19.7
148. 2.7 10.1 149. 2.4 9.1 150. 2.$ 15.7 271. 1.4 23.0 272. 1.7 20.2 273. 2.1 18.1
151. 1.9 17.6 152. 2.5 13.4 153. 2.1 20.6 274. 2.0 20.9 275. 2.9 3.3 276. 1.7 17.3

516 517
¡: Jndiv;duo X y !11dll·id11n X Y /11dii·iduo X Y lndividt1n X Y lndh·iduo X Y Individuo X y
1i 277. 2.1 l 6.9 278. 2.2 20.5 279. 1.8 21.5 400. 2.0 14.7 401. 2.0 17.2 402. 2.7 9.3
280. 1.4 19.8 281. 2.1 13.9 282. 2.6 13. 7 403. 2.6 12.1 404. 2.0 23.3 405. 2.3 10.7
283. 2.1 15.5 284 2.7 13.2 285. 2.4 18.2 406. 2.1 17.I 407. 1.5 21.5 408. 2.4 13.2
286. l. 7 22.3 287. 2.0 22.I 288. 2.5 10.2 409. 2.9 4.8 410. 1.8 18.6 411. 2.3 14.6
289. 2. 7 10.1 290 1.5 25.0 291. 1.3 21.3 412. 1.9 14.2 413. 2.5 9.1 414. 2.7 9.6
292. 1.5 24 .6 293. 1.8 13.4 294. 2.4 15. 7 415. 1.8 21.4 416. 2.3 15.2 417. 1.2 20.5
295. 2.5 9.9 296. 2.3 8.2 297. 2.7 6.2 418. 2.0 13.5 419. 2.1 17.6 420. 2.1 15.7
298. 2.4 14.I 299. 2.1 12.8 300. 2.8 8.9 421. 2.4 11.2 422. 1.5 19.I 423. 2.4 9.3
301. 1.4 26.0 302. 2.3 17.7 303. 2.5 10.5 424. 1.9 18.3 425. 2.5 11.8 426. 2.7 6.6
304. 2.8 11.8 305. 1.9 17.I 306. 2.4 13.3 427. 2.4 16. I 428. 1.4 15.7 429. 2.0 15.3
307. 1.3 20.7 308. 1.6 22.9 309. 1.8 21.5 430. 2.8 9.6 431. 3.1 1.7 432. 2.3 14.3
310. 2.4 14.8 311. 2.3 7.2 312. 2.9 8.9 433. 2.2 12.9 434. 2 .2 11.9 435. 1.8 19.4
313. 2.2 11.6 314. 2.1 16.1 315. 2.5 15.8 436. 2.2 13.8 437. 2.7 7.7 438. 2.1 13.7
316. 1.8 19.5 317. 2.3 13.8 318. 1.9 22.6 439. 2.5 10.9 440. 2.2 11.3 441. 2.1 16.3
319. 1.5 16.6 320. 2.4 16.3 321. 2.9 10.1 442. 2.0 14.3 443. 1.2 24.8 444. 1.8 17.4
322. 2.0 11.0 323. 1.5 16.3 324. 2.6 11.5 445. 2.0 14.5 446. 2.9 7.9 447. 3.2 6.0
325. 1.5 16.9 326. 1.8 16.3 327. 1.5 19.9 448. 1.9 13.8 449. 2.4 8.9 450. 2.2 12.8
328. 2.5 12.7 329. l. 7 21.1 330. 2.5 16.6 451. 2.5 15.l 452. 2.6 10.7 453. 1.9 12.8
331. 1.9 19.4 332. 1.8 15.3 333. 2.5 14.0 454. 1.9 14.3 455. 2.4 15.2 456. 2.2 12.0
334. 1.8 16.5 335. 0.9 24.6 336. 1.6 16. 7 457. 2.6 18.3 458. 2.3 7.5 459. 2.6 10.3
337. 2.1 20.7 338. 2.3 15.4 339. 2.2 12.8 460. 2.3 13.9 46!. 2.0 17.0 462. 2.9 9.0
340. 1.2 21.7 341. 2.0 18.3 342. 3.7 5.7 463. 2.2 12.5 464. 1.9 18.5 465. 2.5 9.0
343. 2.0 19.9 344. 1.6 20.3 345. 2.4 10.5 466. 1.2 23.7 467. 2.9 5.6 468. 1.6 24.7
346. 1.8 9.8 347. 1.8 18.3 348. 1.8 15.0 1.8 22.0
469. 2.2 19.2 470. 2.1 15.9 471.
349. 2.2 17.9 350. 1.7 19.2 351. 2.2 14.1 2.4 13.6
472. 2.2 14.2 473. 1.6 21.7 474.
352. 2.3 16.0 353. 3.4 0.3 354. 2.6 11.5 2.0 12.6
475. 2.3 15.3 476. 1.2 23.7 477.
355. 2.2 12.0 356. 2.1 16.2 357. 2.6 11.7
478. 1.1 28.0 479. 2.6 9.3 480. 2.6 13.2
358. 2.7 12.2 359. 2.3 16.8 360. 1.8 16.1 48!. l.6 21.2 482. 2.1 18.6 483. 3.6 2.1
361. 2.2 12.2 362. 1.8 17.6 363. 2.5 10.4
484. 2.4 10.2 485. 2.1 15.4 486. 2.8 11.4
364. 2.5 10.6 365. 1.9 15.3 366. 2. 7 10.8
487. 2.3 15.7 488. 2.8 7.6 489. 1.8 20.4
367. 2.1 17.2 368. 1.6 15.9 369. 2.1 18.3
490. 2.2 14.2 49!. 1.4 24.2 492. 1.7 18.0
370. 2.1 16.7 371. 2.9 7.6 372. 2.2 12.8
493. 2.4 16.7 494. 2.9 9.0 495. 1.7 16.1
373. 1.0 23.8 374. 0.9 28.1 375. 2.0 15.1
496. 1.9 15.2 497. 1.4 24.3 498. 1.3 19.6
376. 1.3 21.2 377. 2.3 11.8 378. 1.5 20.7
499. 1.7 20.2 500. 1.8 17.0 501. 2.4 11.3
379. 2.2 12. 7 380. 1.4 22.4 381. 1.7 19.2 502. 2.2 17.6 503. 2.4 11.6 504. 2.1 15.5
382. 2.3 13.3 383. 2.7 9.7 384. 1.4 19.3
505. 2.5 16.7 506. 2.3 17.2 507. 1.9 18.2
385. 2.4 13.7 386. 2.4 12.4 387. 2.0 16.9
508. 2.5 13.9 509. 1.5 14.6 510. 3.2 4.1
388. 2.4 9.2 389. 2.0 17.4 390. 2.7 8.9
51 l. 2.3 11.9 512. 2.0 16.0 513. 1.6 18.2
391. 2.9 3.1 392. 2.6 9.1 393. 1.4 21.6
514. 1.2 23.1 515. 2.5 10.3 516. l.6 17.l
394. 2.0 16.4 395. 1.4 22.9 396. 1.5 22.9
517. l.8 16.0 518. 2.0 22.7 519. 2.3 li.6
397. 1.7 17.4 398. 2.2 9.8 399. 1.7 14.0
520. 2.0 16.1 52!. 2.3 18.5 522. 2.0 20.9

518 519
)

)
Individuo X Y lndi\·iduo X Y Individuo X Y
lndb·iduo X Y lndil·iduo X Y /11dil·iduo X Y 2.5 10.6 J
. 646. 17.8 647. 1.7 18.5 648.
1.9
523. 2.0 17.2 524. 1.4 20.6 525. 3.0 8.8 1 1.0 650. 1.6 18.9 651. 1.5 16.3 )
649. 2.6
526. 2.6 9.5 527. 2.2 16.3 528. 2.5 15.4 20.7 653. 2.9 5.9 654. 1.3 23.2
652. 1.8
529. 2.6 15.1 530. 2.0 15.2 531. 1.5 26.3 3.7 656. 1.6 20.2 657. 2.3 12.4
655. 3.1
532. 1.5 23.3 533. 2.5 10.6 534. 2.0 16.5 18.1 659. 2.1 13.7 660. 2.4 7. 7
658. 2.1 )
535. 2.3 8.5 536. 2.4 10.1 537. 2.1 14.9 5.3 662. 2.0 9.5 663. 2.0 11.5
661. 3.1
538. 2.6 8.7 539. 2.7 9.4 540. 2.3 16.0 21.7 665. 1.8 18.1 666. 2.0 20.4
664. 1.3
541. 2.2 16.2 542. 2.0 15.2 543. 2.5 14.4 16.7 668. 2.0 13.0 669. 2.3 13.0
667. 1.9
544. 2.9 9.7 545. 1.9 18.1 546. 2.0 12.9 15.4 672. 2.4 10.2
670. 2.7 15.0 671. 1.7
547. 2.2 16.1 548. 2.7 10.7 549. 1.5 21.2 14.1 675. 1.3 19.2
673. 2.1 18.6 674. 1.8
550. 2.1 16.3 551. 1.8 19.1 552. 2.8 13.9 15.5 678. 1.9 19.6
676. 2.3 14.8 677. 2.0
553. 2.1 13.3 554. 2.4 18.5 555. l. 7 23.4 4.9 681. 1.9 19.2
679. 2.9 9.1 680. 2.8
556. 2.0 12.6 557. 2.1 19.1 558. 2.2 13.4 17.2 684. 1.6 19.1
682. 2.1 18.9 683. 2.0
559. 2.2 14.2 560. 1.5 24.0 561. 2.2 17.6 18.3 687. 1.3 21.9
685. 2.1 17.7 686. 1.9 )
562. 2.9 10.1 563. 2.2 17.2 564. 1.9 15.4 11.5 690. 2.7 14.0
688. 2.4 15.4 689. 2.5
566. 2.2 14.4 567. 1.8 19.1 7.8 693. 2.9 7.3 )
565. 2.4 12.I 2.7 8.3 692. 2.5
691. 2.2 14.6
568. 2.3 15.3 569. 3.2 4.7 570. 2.0 19.9 1.0 26. 7 695. 2. 7 13.1 696. )
694. 1.6 22. I
571. 1.4 21.5 572. 2.1 17.0 573. 2.4 13.8 2.4 15.4 698. 1.2 23.5 699.
697. 2.0 15.3 )
574. 3.0 2.1 575. 2.1 14.8 576. 2.2 17.1 11.4 701. 2.3 10.2 702.
700. 2.4 1.1 24.7
577. 2.3 14. 7 578. 3.0 8.4 579. 2.6 8.8 2.5 12.3 704. 2.5 13.0 705.
703. 2.2 19.3
580. 2.6 9.7 581. 2.0 13.4 582. 2.5 17.0 16.1 707. 1.8 12.1 708.
706. 2.2 2.1 18.1
583. 2.2 19.4 584. 1.9 15.3 585. 2.4 14.0 15.2 711. )
709. 1.8 15.7 710. 2.4
587. 3.0 6.6 588. 2.5 10.4 15.2 714. 1.9 17.1
586. 2.6 9.0 712. 2.5 11.5 713. 1.8 )
590. 2.3 12.5 591. 2.9 10.9 15.5 717. 2.2 10.3
589. 2.5 7.6 715. 2.0 18.3 716. 2.5
593. 2.8 4.8 594. 1.6 18.1 19.9 720. 1.6 19.6
592. 2.3 17.8 718. 1.9 19.3 719. 1.4
597. 1.7 18.7 17.9 723. 2.5 16.3
595. 2.1 13.5 596. 2.3 12.6 2.0 18.8 722. 2.1
721. 2.8 7.5
598. 2.5 13.8 599. 1.9 18.4 600. 3.1 6.0
2.4 17.9 725. 2.0 16.7 726.
724. 2.4 7.4
601. 2.1 18.2 602. 1.3 22.3 603. 1.1 19.1 12.4 728. 3.5 3.4 729.
727. 2.2 2.5 12.7
604. 1.6 18.8 605. 2.2 11.8 606. 2.6 14.6 12.9 731. 2.4 8.7 732. )
730. 1.8 1.9 19.5
607. 2.0 14.3 608. 2.3 19.1 609. 2.1 15.3 14.4 734. 1.6 20.1 735.
733. 2.2 2.1 17.7 )
610. 1.4 22.4 611. 2.5 9.4 612. 1.2 23.6 9.6 737. 2.1 16.4 738.
736. 2.5 2.7 11.0
613. 2.3 14.5 614. 2.1 15.8 615. 1.9 14.5 13.2 740. 2.5 16.5 741.
739. 2.1 1.0 21.2
616. 2.3 11.5 617. 3.1 9.3 618. 2.6 9.1 7.5 743. 2.0 17.3 744.
742. 2.7 1.3 21.7
619. 1.8 22.7 620. 2.l 13.8 621. 1.3 18.6 19.4 746. 1.9 11.8· 747.
745. 1.7 3.0 10.2
622. 1.6 21.5 623. 1.3 22.2 624. 1.7 18.l 9.9 749. 2.4 15.2 750.
748. 2.5 2.5 17.1
625. 1.2 24.0 626. 3.4 4.7 627. 3.4 0.6 11.8 752. 2.6 10.4 753.
751. 2.2 2.2 15.0
628. 2.0 14.6 629. 2.6 12.8 630. 2.2 12.3 16.5 755. 1.7 17.7 756.
754. 1.8 2.5 8.1
631. 2.6 9.9 632. 2.2 13.5 633. 2.5 15.9 12.2 758. 2.8 7.8 759.
757. 2.8 2.5 13.7
634. 2.2 13. l 635. 1.9 19.1 636. 2.0 19.0 17.1 761. 2.0 16.5 762.
760. 2.4 l.l 26.5
637. 3.0 8.3 638. 2.5 11.5 639. 2.2 15.I 13.0 764. 2.2 16.8 765.
763. 2.4
640. 2.0 10.7 641. 1.4 17.8 642. 2.2 16.1 17.5 768. 2.9 4.5
766. 3.3 9.2 767. 1.7
643. 2.6 9.1 644. 1.7 15.0 645. 2.5 12.4

521
520
!ndividuo X }' Individuo X Y Individuo X y
Individuo X }' l11dh•id110 X Y Individuo X y
769. 1.7 17.7 892. 2.4 16.3 89:l. 1.9 17.5 894. 2.3 9.0
770. 2.0 15.0 771. 2.0 16.9
772. 1.9 22.5 895. l.4 21.7 896. 2.0 19.5 897. 1.6 21.4
773. 1.2 20.9 774. 3.0 3.8
775. 2.2 14.8 898. 1.8 17.6 899. 2.0 15.8 900. 2.5 9.8
776. 2.7 7.1 777. 3.7 1.5
778. 2.5 16.4 901. 2.7 6.7 902. 2.6 6.4 903. l.5 20.4
779. 1.8 19.5 780. 2.2 18.9
781. 1.2 22.5 904. 2.1 14.5 905. 3.1 6.5 906. l. 7 20.3
782. l .3 20.5 783. 2.1 17.6
907. 2.5 ll.l 908. l.8 14.5 909. 9 - 14.5
784. 1.7 17.7 785. 2.0 14.5 786. 2.3 16.4
2.7 12.3 911. 2.2 13.3
-·"
787. 1.9 19.1 788. 2.1 18.6 910. 912. 1.5 2 I.5
789. 2.4 12. 7
913. 2.0 13.3 914. 3.0 7.7 915." 1.6 17.4
790. 2.5 13.5 791. 2.9 8.5 792. 1.1 19.2
793. 2.9 8.9 916. 2.6 11.2 917. 2.6 10.7 918. 2.3 12.9
794. 1.9 13.2 795. 2.8 10.7
796. 2.7 11.9 919. 2.9 7.0 920. 1.4 23.0 921. 2.6 . 12.5
797. 1.7 21.2 798. 1.7 18.6
799. 2.1 17.7 922. 1.8 20.4 923. 1.0 29.1 924. 1.5 21.6
800. 2.2 14.5 801. 1.7 16.I
802. 2.0 17.6 925. 2.4 ll .5 926. 2.8 12.3 927. 1.4 19.0
803. 3.0 10.4 804. 2.2 16.4
928. 2,8 10.7 929. ,2.7 7.2 930. 1.5 23.9
805. 2.8 7.2 806. 1.7 20.6 807, 1.7 18.3
808. 2.2 14.1 931. 1.6 16.3 932. 1.6 18.0 933. 1.7 17.5
809. 1.4 18.7 810. 2.5 14.3
811. 2.2 15.3 934. 2.3 16.2 935. 2.2 14.5 936. 2.1 15.4
812. 1.9 16.4 813. 1.3 24.8
814. 2.4 7.3 937. 1.9 17.0 938. 2.0 12.9 939. 2.3 15.4
815. 2.6 10.6 816. 1.8 18.4
817. 1.9 19.2 940. 2.1 19.6 941. 2.6 7.8 942. 2.5 12.5
818. 2.6 12.3 819. 3.3 3.0
943. 1.6 20.7 944. 2.9 14.3 945. 1.5 19.0
820. 1.5 18.1 821. 2.8 9.0 822. 2.7 6.3
823. 2.7 10.2 946. 3.2 6.6 947. 2.0 20.4 948. l. 7 18.8
824. 1.7 17.8 825. 1.9 20.1
949. 2.7 9.5 950. 1.9 14.1 951. 1.9 15.7
826. 2.1 6.9 827. 2.4 ll.O 828. 1.9 18.1
829. 1;9 8.4 952. 2.4 9.8 953. 1.0 24.3 954. 2.9 8.3
830. 2.4 9.7 831. 3.0 6.7
955. 1.8 18.2 956. 1.7 17.0 957. 1.8 14.6
832. 1.6 23. 7 833. 2.5 7.6 834. 3.0 3.2
958. 1.8 20.2 959. 2.4 18.8 960. 2.0 15.8
835. 1.8 16.4 836. 2.1 17.2 837. 2.2 17.9
961. 2.0 16.1 962. 2.0 13.7 963. 2.1 14.7
838. 2.0 14.7 839. 2.2 15.9 840. 2.1 14.4
964. 1.5 23.3 965. 2.4 12.0 966. 1.8 17.0
841. 2.0 19.2 842. 2.7 8.7 843. 1.7 17.1
967. 1.7 18.6 968. 2.1 12.7 969. 2.4 8.8
844. 1.9 16.4 845. 2.4 16.6 846. 1.6 23.3
970. 2.2 13.1 971. 2.7 9.7 972. 2.1 17.0
847. 3.0 5.8 848. 2.4 16.l 849. 0.9 21.I
973. 2.6 8.8 974. 1.9 19.4 975. 1.7 17.2
850. 3.0 8.6 851. 1.8 17.4 852. 1.5 25.8
976. 1.9 18.3 977. 3.1 10.3 978. 2.9 7.1
853. 1.5 17.3 854. 1.6 19.7 855. 2.1 15.3
979. 2.2 16.8 980. 2.6 9.6 981. 1.7 15.7
856. 1.4 28.0 857. 2.4 15.7 858. 2.2 13.4
982. 2.3 15. l 983. 1.8 13.7 984. 2.0 18.5
859. 2.2 12.0 860. 2.6 9.0 861. 1.4 19.5
985. 2.1 ll.3 986. 2.2 14.9 987. 2.5 16.9
862. 2.4 12.0 863. 1.9 17.6 864. l. 7 20.4
988. 1.9 20.2 989. 2.6 9.4 990. 1.9 19.3
865. 1.8 19.2 866. 1.7 18.2 867. 1.7 15.6
991. 2.0 16.1 992. 1.8 17.6' 993. 2.4 12.0
868. 2.1 18.5 869. 2.2 12.8 870. 1.8 18.9
994. 2.2 14.3 995. 2.6 9.2 996. 1.9 18.7
871. 0.9 22.0 872. 2.8 ll .2 873. 2.9 14.7
997. 2.8 12.7 998. 2.4 12.9 999. 2.3 15.4
874. 3.2 12.2 875. l. 7 21.5 876. 1.9 17.9
1000. 2.1 16.8 1001. 2.1 18.3 1002. 1.5 16.2
877. 3.0 4.9 878. 2.4 11.6 879. 2.3 12.3
1003. 1.4 19.1 1004. 2.9 12.6 1005. 3.1 2.9
880. 2.3 13.6 881. l.O 25.9 882. 2.0 15.I
1006. 1.7 18.1 1007. 2.2 15.9 1008. 2.7 7.5
883. 2.3 16.7 884. 2.4 16.6 885. 2.5 11.5
1009. 2.7 6.6 1010. 1.6 20.0 1011. 1.8 23.1
886. 1.7 17.8 887. 2.8 8.9 888. l.i 13.4
1012. 2.5 13.9 1013. 2.1 18.0 1014. 1.7 25.5
889. 2.i 13.1 890. l.5 23.3 891. J.6 21.i

522 523
524 )
Regresión y co"elación si1nple Individuo X /11divid110 X y
Y X Y Individuo
Individuo X Y lndividrto X Y b1dh·iduo X Y 52. 105 167 53. 92 140 54. 114 179
55. 102 148 56. 97 158 57. 115 161
1015. 2.0 18.1 1016. 1.8 18.7 1017. 2.0 15.2 60. 100 128
58. 97 150 59. 99 162
1018. 1.8 15.6 1019. 1.8 19.8 1020. 1.5 18.5 62. 63. 107 167
61. 101 145 96 140
1021. 2.3 1I.I 1022. 2.2 15.5 1023. 2.0 16.7 64. 66. 95 144
84 120 65. 95 120
1024. 2.8 11.6 1025. 1.7 20.5 1026. 2. 7 9.5 110 170
67. 96 132 68. 10! 166 69.
1027. 1.9 19.3 1028. 1.9 19.2 1029. 1.5 21.2 99 144 72. 104 137
70. 120 170 71.
1030. 2.2 17.9 1031. 2.1 16.8 1032. 2.2 II. I 93 149 74. 116 174 75. 93 131
73.
1033. 2.2 12.3 1034. 3.1 5.0 1035. 1.9 18.6 94 143 78. 99 146
76. 88 146 77.
1036. 2.6 13.6 1037. 2.6 17.3 1038. 2.2 12.7 79. 86 120 80. 93 145 8 !. 96 141
1039. 2.2 20.5 1040. 1.7 18.2 1041. 2.4 12.7 83. 85 132 84. 87 127
82. 113 185
1042. l. 7 20. 7 1043. 2.1 14.5 1044. 1.6 18. 7 ,.
8- 117 168 86. 107 152 87. 106 151
1045. 1.7 22.5 1046. 1.7 14.4 1047. 3.0 8.6 89. 94 130 90. 96 170
88. 107 164
1048. 1.9 16.0 1049. 3.2 3.6 1050. l.7 19.9 103 161 92. 104 178 93. 94 132
91.
94. 105 158 95. 120 190 96. 118 163
27. Los datos que aparecen a continuación pertenecen a los pacientes en una pobla- 97. 87 137 98. 101 161 99. 92 154
ción que presentan hipertensión esencial. La variable dependiente Y es la pre- !OO. 110 156 101. 85 128 102. 94 14 1
sión sistólica de la sangre (mn1 Hg) y la variable independiente X es una medi- 103. 100 146 104. 104 164 105. 99 138
da de sodio corporal. Suponer que usted es un consultor en estadística que 106. 96 156 107. 89 137 108. 96 138
asesora a un equipo de investigación interesado en la hipertensión esencial. 109. 116 178 110. 102 145 11 l. 93 129
Seleccionar una muestra aleatoria simple de esa población y llevar a cabo los 112. 106 162 113. 104 153 114. 107 159 )
análisis que pudieran ser de utilidad para los investigadores. Presentar los ha- 115. 103 167 116. 109 156 117. 106 155
llazgos y conclusionec; en fonna narrativa, utilizando gráficas en los casos que 118. 88 127 119. 109 180 120. 108 188
lo requieran. Comparar los resultados con los de los demás alumnos. 121. 102 150 122. 101 160 123. 93 126
124. 100 143 125. 103 153 126. 88 133
lndh·iduo X Y b1dh·id110 X Y lndil'lduo X Y 91 133
127. 90 139 128. 93 135 129.
l. 98 147 2. 99 149 3. 96 175 130. 100 121 131. 105 179 132. 118 168
4. 109 145 5. 91 135 6. 107 149 133. 87 138 134. 96 157 135. 101 168
7. 87 121 8. 110 170 9. 102 163 136. 103 156 137. 114 164 138. 101 136
10. 103 141 11. 117 149 139. 107 173 140. 95 130 141. 90 125
12. 92 135
13. 90 127 14. 93 132 142. 97 141 143. 112 173 144. 98 145
15. 113 181 )
16. 99 152 17. 114 164 145. 97 146 146. 113 178 147. 101 150
18. 103 144
19. 96 148 20. 111 180 148. 107 154 149. 88 127 150. 84 139
21 128 183
22. 92 132 23. 84 135 15 l. 103 148 152. 94 139 153. 85 130
24. 102 141
25. 103 147 26. 117 167 154. 107 153 155. 107 135 156. 85 120
27. 89 129
28. 107 168 29. 104 137 157. 99 138 158. 101 148 159. 102 140
30. 84 120
31. 89 138 32. 102 160 160. 99 139 16 !. 87 153 162. 110 168
33. 93 131
34. 95 144 35. 104 162 163. 110 169 164. 102 159 165. 93 153
36. 90 138
37. 106 173 38. 101 174 166. 113 151 167. 102 170 168. 108 149
39. I!O 152
40. 96 157 41. 98 151 !69. 86 120 170. 102 165 17 l. 124 187
42. 108 153
43. 90 143 44. 94 129 172. 96 155 173. 108 160 174. 80 125
45. 117 170
46. 92 133 47. 110 177 175. 96 147 176. 94 153 177. 99 155
48. 98 138
49. 98 147 50. 102 162 178. 118 174 179. 119 173 180. 106 161
51. 87 131
181. 96 147 182. 100 152 183. 102. 1:10

-,-
;-_.:,


Individuo X y !11dh•id110 X y Individuo X y [ndii·iduo X y /J1dh·id110 X y Individuo X y

184. 112 171 185. 100 155 186. 121 165 316. 99 139 317. 80 120 318. 89 141
187. 87 137 188. 110 180 189. 104 144 319. 108 161 320. 89 154 321. 106 162
190. 95 134 l9L 95 . 147 192. 96 138 322. 90 134 323. 106 167 324. 102 153
193. 80 124 194. 103 144 195. 106 175 325. 97 152 326. 90 147 327. 84 147
196. 105 149 197. 111 144 198. 328. 91 149 329. 96 155 330. 108 158
95 135
199. 104 152 200. 80 130 20 l. 95 147 331. 111 163 332. 80 121 333. 101 158
202. 80 125 203. 103 165 204. 334. 94 137 335. 84 124 336. 92 120
104 159
205. 93 142 206. 107 151 207. 103 161 337. 101 139 338. 104 153 339. 99 130
208. 96 141 209. 92 154 210. 340. 120 179 341. 105 172 342. 88 128
108 160
211. 108 172 212. 80 121 213. 103 170 343. 91 148 344. 121 185 345. 85 127
214. 104 145 215. 105 141 216. 111 173 346. 89 121 347. 80 133 348. 117 171
217. 100 136 218. 11! 164 219. 102 160 349. 110 156 350. 95 139 351. 109, 163
220. 96 138 221. 87 129 222. 112 164 352. 117 197 353. 91 127 354. 103 163
223. 105 163 224. 87 124 225. 100 148 355. 102 171 356. IIO 164 357. 108 176
226. 112 178 227. 114 168 228. 98 145 358. 105 162 359. · 90 132 360. 80 120
229. 105 138 230. 106 150 231. 106 153 361. 105 16-1 362. 107 166 363. 89 142
232. 108 161 233. 103 153 234. 96 142 364. 100 178 36:>. 113 168 366. 109 144
235. 106 163 236. 84 120 237. 95 146 367. 98 164 368. 112 175 369. 110 154
238. 102 152 239. 99 158 240. 92 145 370. 110 159 :~7 l. 103 137 372. 89 121
241. 111 158 242. 96 154 243. 96 139 373. 109 155 374. 102 176 375. 129 187
244. 100 145 245. 102 130 246. 103 152 376. 94 133 377. 93 147 378. 77 123
247. 90 133 248. 100 162 249. 114 158 379. 98 156 380. l 15 166 381. 90 152
250. 115 162 251. 106 181 252. :l82. !08 138 383. 90 161 384. 95 149
80 124
253. 95 144 254. 107 170 255. 85 124 385. 88 122 386. 96 162 387. 90 134
256. 93 129 257. 80 138 258. 99 151 '.l88. 96 146 389. 101 139 390. 84 120
259. 107 151 260. 115 168 261. 102 191 39 l. 103 142 392. 105 155 393. 102 152
262. 99 152 263. 112 158 264. 93 152 394. 99 155 395. 122 180 396. 99 142
265. 117 170 266. 102 130 267. 120 159 397. 100 154 398. 98 142 399. 120 169
268. 104 163 269. 104 151 270. 87 148 400. 118 183 401. 97 147 402. 100 159
271. 96 129 272. 104 153 273. 403. 94 138 404. 89 126 405. 96 165
118 183
274. 94 130 275. 98 167 276. 105 154 406. 95 162 407. 117 191 408. 103 163
277. 101 155 278. 110 158 279. 99 150 409, 95 138 410. 95 158 411. 98 151
280. 104 158 281. 120 179 282. 92 131 412. 110 li4 413. 120 170 414. 95 160
283. 103 144 284. 108 156 285. 101 131 415. 107 155 416. l OI ,.
1-q 417. 81 121
286. 101 145 287. 97 156 288. l I7 156 418. 86 129 419. 95 150 420. 94 123
289. 94 138 290. 91 121 291. 421. !07 161 422. 97 163 423. 105 160
100 14-1
292. 104 156 293. 112 142 294. 424. 93 128 425. 120 180 426. 91 137
111 195
295. 92 161 296. 99 149 297. 427. 109 165 428. 112 161 429. 103 134
113 165
298. 91 147 299. 103 161 300. -!30. 94 128 431. 102 152 432. 111 169
106 154
301. 102 149 302. 107 176 303. 433. 80 12:~ 434. 102 156 435. 117 178
100 120
304. 120 196 305. 100 149 306. 436. 11'.l 159 4:Ji. 93 146 438. 101 139
96 123
307. 106 175 308. 99 161 309. -!39. 95 160 4--10. 100 14i 441. 90 143
107 160
310. 104 139 311. 96 148 312. 89 163 442. 10'.! 153 4--1:t 108 J6i 4-1-1. 94 138
313. 105 161 314. 108 159 315. 445. 87 131 446. 99 156 447. 121 179
84 135

526 527
Individuo X Y lndil,·iduo X y y y
l11divid110 X ~ /11dil·id110 X !11dit·id110 X Y Jndii·iduo X
448. 84 127 449. 107 158 450. 99 154 580 96 137 581. 95 131 582. 96 155
451. 93 153 452. 95 133 453. 96 140 583. 100 166 584. 94 132 585. 100 150
454. 96 144 455. 103 147 456. 86 145 586. 97 143 587. 103 174 588. 88 145 )
457. 106 150 458. 104 161 459. 92 144 589. 99 139 590. 105 139 591. 108 158 )
460. 113 174 461. 92 138 462. 99 151 592. 90 147 593. 115 194 594. 96 138
463. 101 174 464. 94 120 465. 98 144 595. 105 150 596. 103 150 597. 102 149 )
466. 100 145 467. IJ9 171 468. 101 166 598. 103 165 599. 80 125 600. 96 146
469. 102 165 470. 101 150 471. 93 145 601. 114 173 602. 124 182 603. 110 166
474. 97 157 )
472. 100 168 473. 100 137 604. 80 126 605. 98 147 606. 97 137
475. 92 135 476. 100 152 477. 98 163 607. 107 144 608. 108 161 609. 106 168
478. 109 172 479. 85 141 480. 110 167 610. 93 137 611. 114 180 612. 84 126
481. 99 142 482. 91 140 483. 103 155 613. 111 158 614. 91 126 615. 97 145
484. 96 150 485. 87 145 486. 81 143 616. 98 127 617. 101 151 618. 113 164
)
487. 120 200 488. 95 144 489. 91 137 619. 120 177 620. 90 129 621. 95 148
490. 105 157 491. 107 138 492. 86 143 622. 114 159 623. 102 159 624. 109 151
493. 81 129 494. IJ3 187 495. 99 163 625. 94 143 626. 93 132 627. 120 165
)
496. 100 158 497. 83 126 498. 97 145 628. 101 141 629. 90 146 630. 92 137
499. 108 146 500. 113 197 501. 107 150 107 156 632. 113 169 633. 87 127 )
631.
502. 92 128 503. 100 137 504. 105 158 634. J 15 183 635. 94 156 636. 103 156
)
505. 104 163 506. 90 156 507. 97 144 637. 101 156 638. II O 173 639. 98 152
508. 98 134 509. 113 186 510. 87 126 640. 80 135 641. 84 136 642. 105 153
511. 107 167 512. 104 171 513. 89 143 643. 83 144 644. 108 156 645. 109 153
514. 90 126 515. 98 146 516. 113 156 646. 112 172 647. 107 150 648. 97 129
517. 96 142 518. 96 154 519. 82 123 649. 115 160 650. 95 134 651. 99 164 )
520. 89 147 521. 103 157 522. 118 173 652. 103 135 653. 103 150 654. 101 154
523. 102 162 524. 100 152 525. 115 187 655. 106 126 .656. 114 161 657. 107 174
526. 104 171 527. IJ3 178 528. 98 163 658. 99 151 659. 88 144 660. 108 160
529. 108 191 530. 94 164 531. 101 160 661. 113 179 662. 97 130 663. 115 150
532. 100 166 533. 80 143 534. 120 191 664. 101 160 665. 92 122 666. 104 157
535. 101 143 536. 105 159 537. 101 146 667. 102 130 668. 84 146 669. 119 171
538. 120 175 539. 99 145 540. 108 149 670. 95 135 671. 115 173 672. 116 154
541. 86 132 542. 83 139 543. 94 147 673. 80 126 674. 107 168 675. 97 144
544. 90 134 545. 105 182 546. 92 154 676. 84 136 677. 93 135 678. 99 148
547. 96 159 548. 119 157 549. 108 157 679. 97 155 680. 101 164 681. 119 171
550. 103 157 551. 88 139 552. 110 155 682. 92 147 683. 95 139 684. 88 122
553. 103 160 554. 107 182 555. 105 156 685. 92 137 686. 96 151 687. 88 131
556. 117 165 557. 100 154 558. 96 145 688. 102 164 689. 93 144 690. 97 137
559. 108 159 560. 97 162 561. 100 152 691. 90 148 692. 93 155 693. 97 156
562. 104 164 563. IJO 146 564. 104 163 694. 121 183 695. 90 136 696. 111 147
565. 106 161 566. 102 133 567. 101 169 697. 87 134 698. 108 189 699. 104 172
568. 87 157 569. 117 169 570. 96 150 700. 120 171 701. 94 148 702. 114 158
571. 102 155 572. 108 140 573. 97 152 703. 111 166 704. 96 143 705. 101 143
574. 99 157 575. 92 149 576. 84 124 706. 102 153 707. 102 148 708. 109 155
577. 108 152 578. 93 162 579. 92 154 709. 114 166 710. 101 140 711. 90 133

528 529
Individuo X Y Individuo X Y l11dii·id110 X Y !11diFid110 X y lndirid110 X Y /11dii•iduo X Y

712. 84 140 713. 101 177 714. 89 155 844. 98 149 845. 120 159 846. 120 175
715. 97 174 716. 87 159 717. 120 167 847. 101 143 848. 97 139 849. 95 125
718. 88 149 719. 99 136 720. 100 171 850. 106 170 851. 99 150 852. 98 129
721. 115 159 722. 98 148 723. 96 167 853. 97 152 854. 120 172 855. 81 148
724. 85 136 725. 103 160 726. 108 169 856. 108 147 857. 89 157 858. 89 138
727. 104 147 728. 92 136 729. 95 142 859. 99 146 860. 86 150 861. 109 153
730. 94 133 731. 100 147 732. 92 128 862. 90 141 863. 91 139 864. 103 151
733. 90 140 734. 86 142 735. 91 123 865. 104 166 866. 96 127 867. 1!5 177
736. 117 159 737. 114 151 738. 113 160 868. 88 132 869. 93 148 870. 95 139
739. 92 149 740. 106 160 741. 112 178 871. 111 179 872. 97 144 873. 99 141
742. 104 168 743. 103 151 744. 80 124 874. 107 171 875. 94 134 876. 117 191
745. 92 141 746. 98 165 747. 106 159 877. 108 161 878. 86 145 879. · 111 165
748. 90 125 749. 97 148 750. 106 158 880. 97 153 881. 99 171 882. 111 163
751. 103 151 752. 101 129 753. 81 125 883. 113 171 884. 100 146 885. 90 141
754. 97 150 755. 89 128 756. 97 164 886. 99 146 887. 94 131 888. 74 132
757. 90 123 758. 108 148 759. 107 172 889. 91 148 890. 99 141 891. 97 142
760. 87 121 761. 89 125 762. 97 149 892. 99 154 893. 107 161 894. 114 159
763. 108 151 764. 109 158 765. 98 143 895. 94 134 896. 88 157 897. 81 120
766. 111 145 767. 88 141 768. 116 173 898. 80 128 899. 102 156 900. 118 191
769. 111 160 770. 94 136 771. 95 165 901. 111 181 902. 91 130 903. 84 130
772. 103 166 773. 93 134 774. 92 120 904. 84 126 905. 98 154 906. 111 157
775. 119 155 776. 113 186 777. 99 152 907. 100 148 908. 120 175 909. 112 179
778. 88 124 779. 104 137 780. 99 141 910. 80 126 911. 82 142 912. 106 143
781. 111 170 782. 94 150 783. 115 140 913. 80 129 914. 107 177 915. 91 131
784. 93 151 785. 99 143 786. 102 158 916. 86 137 917. 108 150 918. 98 150
787. 81 120 788. 108 173 789. 98 139 919. 113 168 920. 99 131 921. 109 161
790. 103 165 791. 91 131 792. 119 189 922. 109 153 923. 104 155 924. 107 170
793. 88 139 794. 101 162 795. 85 127 925. 105 172 926. 110 127 927. 103 171
796. 111 146 797. 105 154 798. 83 125 928. 100 144 929. 94 120 930. 100 177
799. 96 144 800. 119 195 801. 117 174 93 l. 99 146 932. 104 180 933. 108 163
802. 119 165 803. 104 149 804. 105 158 934. 107 162 935. 90 144 936. 99 178
805. 109 171 806. 91 145 807. 93 123 937. 118 181 938. 83 137 939. 105 152
808. 117 155 809. 114 150 810. 101 157 940. 94 151 941. 85 135 942. 93 137
811. 93 150 812. 104 178 813. 87 132 943. 86 156 944. 104 144 945. 89 144
814. 87 142 815. 94 147 816. 103 141 946. 120 166 947. 99 163 948. 95 140
817. 103 151 818. 84 123 819. 123 143 949. 91 134 950. 97 145 951. 110 145
820. 99 132 821. 83 125 822. 101 153 952. 104 187 953. 102 145 954. 97 144
823. 92 144 824. 89 124 825. 113 177 955. 116 152 956. 99 160 957. 80 124
826. 90 151 827. 107 155 828. 96 143 958. 111 168 959. 102 156 960. . 91 135
829. 98 157 830. 120 179 831. 87 154 961. 115 179 962. 97 154 963. 108 152
832. 114 157 833. 110 172 834. 97 135 964. 93 155 965. 101 140 966. 86 125
835. 101 153 836. 91 143 837. 101 164 967. 112 179 968. 98 139 969. 99 149
838. 110 164 839. 112 172 840. 97 144 970. 108 154 971. 109 169 972. 104 171
841. 100 146 842. 96 158 843. 106 155 973. 93 162 974. 103 145 975. 102 152

530 531
532 Regresión y co"elación si1nple Paclente Dosis )
nún,ero 4 5 6 7 8
lndii·iduo X Y /11di1·id11v X Y Individuo X Y l. 99
2

98
'
77 91 87 89 85 86
9

81
10 J.f..

76 ·."·77
1.2.

66
976. 101 160 977. 93 142 978. 99 146 2. 99 98 91 85 85 82 77 79 70 71 65 '57
979. 112 152 980. 102 154 981. 115 153 3. 95 99 97 89 90 86 86 81 71 81 71 61 )
982. 105 152 983. 102 148 984. 108 162 4. 98 99 99 93 93 88 81 80 78 75 75 71
985. 106 163 986. 111 175 987. 93 127 3. 101 96 89 85 89 93 79 78 77 75 74 63
988. 110 174 989. 101 141 990. 117 194 6. 98 96 91 96 78 79 83 86 77 81 78 71
991. 105 145 992. 92 125 993. 97 147 7. 99 94 94 85 86 80 80 83 83 72 7l 65
90 83 79 79 76 78 81 71 )
994. 111 157 995. 105 142 996. 106 167 8. 99 104 88 77
997. 103 146 998. 80 126 999. 104 161 9. 95 97 94 90 86 86 77 73 74 74 74 69 )
1000. 101 171 1001. 113 172 1002. 105 145 10. 102 100 96 97 82 83 74 80 73 76 70 61
1003. 85 120 1004. 93 155 1005. 85 137 11. 95 97 91 94 90 78 80 79 76 70 73 63
1006. 94 143 1007. 106 149 1008. 92 127 12. 100 105 87 92 84 81 85 87 70 74 80 67
1009. 104 164 1010. 103 167 IOII. 106 154 13. 99 91 88 90 87 85 82 80 73 76 67 70
1012. 103 158 1013. l 16 165 1014. 107 142 14. 95 101 84 89 84 87 90 82 82 79 74 72
1015. 101 139 1016. 112 161 1017. 101 146 15. 99 96 84 88 88 79 74 78 75 74 66 59
1018. 106 171 1019. 112 162 1020. 107 157 16. 95 93 87 93 93 79 86 75 75 72 75 66
1021. 82 140 1022. 95 128 1023. 108 148 17. 100 102 89 94 86 83 78 82 81 66 67 64
1024. 92 126 1025. 82 122 1026. 94 151 18. 103 96 87 96 86 89 84 89 77 65 65 65
1027. 106 156 1028. 102 164 1029. 113 170 19. 102 98 94 81 89 85 86 75 75 79 70 68
1030. 103 160 1031. 107 163 20. 98 98 88 90 90 82 74 77 74 71 72 63 )
1032. 95 134
1033. 101 159 21. 95 101 92 88 84 77 90 78 82 74 62 69
1036. 92 132
1034.
1037.
116
114
159
172
1035.
1038.
90
100
141
153 22. 103 99 90 85 88 84 81 78 75 66 71 60 ''
1039. 85 129 1040. 105 164 1041. 89 122 23. 106 98 99 86 82 85 78 77 72 74 73 64
1042. 95 128 1043. 108 162 1044. 103 145 24. 99 91 92 89 86 82 82 82 77 80 69 66
1045. 95 147 1046. 97 142 1047. 93 130 25. 110 98 91 94 83 84 80 78 71 17 69 74
1048. 93 135 1049. 101 170 1050. 118 189 26. 95 95 84 92 91 85 85 79 78 72 78 66
2i. 89 !01 90 92 89 86 73 83 81 15 70 75
28. 97 93 90 87 85 78 83 83 79 75 71 67
29. 94 97 97 92 90 86 80 82 71 14 69 67
28. Los siguientes datos rcpn."Scntan el total de calcio corporal (expresado como un
30. 97 90 85 89 96 79 85 81 79 70 67 59
porcentaje del valor n1edio normal) en una población de pacientes con artritis
31. 94 103 87 92 92 86 81 81 73 77 76 67
reumatoide que reciben tratamiento de prednisolona. Hay un total de 1200 pa-
32. 103 106 85 89 88 80 83 81 75 17 66 66
cientes. Cien de ellos recibieron el medicamento en cada nivel de dosis. Suponer
33. 98 96 99 86 89 79 82 78 76 67 68 63
que usted desea profundizar respecto a la naturaleza de las relaciones entre la
34. 104 100 89 94 91 87 80 82 76 71 72 68
dosis de prednisolona y el total de calcio corporal. Seleccionar una muestra
35. 105 98 89 88 96 84 80 77 74 71 75 72
aleatoria simple de tres pacientes de cada nivel de dosis y hacer lo siguiente.
36. 96 99 93 86 88 85 81 83 76 72 74 70
a) Utilizar el número total de pares de observaciones para obtener la ecuación
de mínimos cuadrados que describe la relación entre el nivel de dosis (la 37. 103 101 97 82 89 89 83 81 74 76 69 69
38. g¡ 103 89 86 84 78 82 77 82 70 63 70
variable independiente) y el total de calcio corporal.
b) Trazar un diagrama de dispersión de los datos y elaborar una gráfica con los 39. 104 91 86 94 90 81 79 78 74 66 71 71
valores calculados con la ecuación. 40. 100 103 87 95 87 84 88 82 74 i2 63 68
e) Calcular r y probar si existe significación al nivel de .05. Calcular el valor p. 41. 100 96 89 90 89 83 76 77 68 76 74 68
d) Comparar los resultados 1.:on los resultados de los demás mie1nbros del 42. 101 103 92 83 88 73 75 77 84 73 70 66
equipo.

533
_::.
535
Bibliografía
Dosis
Paciente
2 :J .¡ 5 6 7 8 9 JO 11 12 Dosis
número Paciente
4 5 6 7 8 9 10 11 12
75 66 66
43.
44.
98
100
90
103
87 86
90 86
90
84
81
80
76
81
79
79
83
72 76 69 61
núniero 2
'
87 85 91 85 80 81 76 74 76 67
85. 106 106
45, 94 103 89 85 93 83 80 82 69 75 67 64 9ú 83 83 78 76 70 74 66
86. 97 92 87 89
46. 89 92 81 89 86 84 83 76 71 74 78 70 102 91 85 89 91 86 80 80 79 72 72 68
87.
47. 93 !08 80 88 86 79 83 84 71 73 77 70 95 96 96 85 92 86 80 79 83 78 73 68
88.
48. 102 101 92 100 84 75 78 80 76 78 61 72 83 85 74 81 78 66 68 68
89. 95 95 93 83
49. 91 99 88 85 84 86 80 85 75 75 67 74 94 74 79 80 79 72 71 68
90. 103 94 86 90
50. 90 99 90 89 91 87 87 76 79 73 70 66 87 88 83 80 72 67 75 69
91. 96 93 92 91
51. 104 99 92 84 91 85 80 80 72 68 73 72 83 86 90 86 83 87 73 80 66 73
92. 100 97
52. 95 104 89 89 87 84 86 77 77 70 70 76 79 87 83 88 74 79 74 74
93. 97 95 86 92
53. 94 103 89 92 93 88 89 79 74 67 73 66 84 87 82 84 84 79 67 69 74 72
94. 93 98
54. JO! 102 86 92 92 83 83 81 78 75 78 66 88 76 84 77 70 79 70 71
95. 98 93 87 91
55. 95 100 88 95 81 80 83 76 72 67 70 70 91 83 77 81 72 67 67 67
96. 90 99 87 92
56. 94 IOO 88 87 89 81 80 88 75 71 72 75 88 83 79 81 78 68 65 69
97. 97 96 90 90
57. 100 94 85 93 87 77 81 81 76 73 71 65 85 78 83 83 71 81 69 62
98. 95 89 83 96
58. 92 97 89 98 88 83 91 83 79 69 76 67 90 79 75 82 79 69 70 65
99. 99 98 82 92
59. 109 93 96 86 86 82 75 78 80 69 63 70 94 78 84 76 75 73 64 75
!OO. 104 9ú 85 85
60. 93 93 91 88 87 87 82 77 70 79 77 60
6!. 96 96 86 92 94 81 84 83 78 77 75 67
62. 94 95 88 94 84 87 83 81 75 74 65 73 BIBLIOGRAFÍA
63. 99 97 94 96 87 80 81 83 71 70 73 70
64. 96 98 97 86 82 74 88 74 81 70 67 70 Obras citadas
65. 93 103 90 88 95 88 87 87 84 68 69 74
84 82 75 70 77 66 63 l. FRANCIS GALTON, Natural lnherita11ce, Macmillan, Londres, 1899.
66. 90 98 93 86 89
77 81 78 78 73 74 72 2. FRANCIS GALTON, Men1ories of My Life, Methuen. Londres, 1908.
67. 99 95 96 92 90
73 71 66 3. KARL PEARSON, The Lije, Letters and Labours of Francis Galton, Volumen IlI
68. 100 97 88 92 89 82 77 77 74
88 93 87 92 80 91 74 74 67 65 A. Cambridge at the University Press. t 930.
69. 103 106
77 65 72 68
4. FRANCIS GAL TON. "Co-relations and Their Measurement, Chiefly from
70. 103 104 86 90 82 84 78 82
Anthropometric Data'', Proceedings of the Royal Society, XLV ( 1888), 135-145.
71. 92 94 92 94 90 77 86 86 73 76 69 72
S. F. A. GRAYBILL y D. C. BowoEN. "Linear Segment Confidence Bands for
72. 9ú 100 94 86 91 77 84 76 76 79 74 64
Simple Linear Models". Journal of the American Staristical Associatio11, 62
73. 94 97 88 91 93 73 79 88 66 71 70 60
74. 99 98 89 86 92 74 74 75 84 72 71 62 (1967), 403-408.
6. OLIVE JEAN DUNN. "A Note on Confidence Bands for a Regression Line Overa
75. 97 93 98 89 80 89 85 85 78 67 74 65
Finite Range", Journal of the An1erican Statistical Association, 63 (1968),
76. 98 91 86 85 93 80 85 81 76 76 64 70
77. 97 102 83 95 92 83 73 84 79 74 72 63 1028-1033.
7. P. G. HoEL. ''Confidence Regions far Linear Regression", Proceedings of the
78. 96 97 93 93 91 81 84 82 78 78 70 72
Second Berkeley Syn1posi11n1 011 Mathen1arical Statistics and Probability,
79. 98 93 92 89 84 77 82 84 79 77 63 77
University of California Press. Berkeley, 1951, págs. 75·81.
80. 95 86 88 88 95 81 84 82 78 68 74 72
8. A. V. ÜAFARJA:"I. "Confidencc Bands in Straight Line Regression", Journal of
81. 94 92 85 84 89 85 90 83 74 73 72 67
che An1erica11 Srarisrical Association, 59 ( 1964 ), 182·_2 l 3.
82. 96 92 87 90 97 82 81 86 67 72 67 66
9, M. HALPERJ;'I y J. GURIAN. "Confidence Bands in. Linear Regression with
83. 100 95 87 89 87 88 79 84 78 72 67 66 Constraints· in the Independent Variables", Journal of the Statistical Associa-
84. 89 96 95 85 86 84 79 84 78 74 73 67
tion, 63 (1968). !020-1027.

534
536 Regresión y correlación simple Bibüografía 537

10. R. C. ELSTON y J. E. GR!ZZLE, "Estimation ofTin1e Response Curves and Their 2. M. S. BARTLEIT, "The Fitting of Straight Lines lf Both Variables Are Subject
Confidencc Bands", Bio111etrics, 18 ( 1962). 148- l 59. to Error", Bio111etrics. 5 (1949), 207-212.
11. R. A. FISHER, "On the Probable Error of a Coefficient of Correlation Deduced 3. J. BERKSON. ·'Are There Two Regressions?", Journal ofthe An1erican Statisti- )
from a Sn1a!I Sample". Metron, / ( 1921 ), 3-21. cal Association. 45 (1950). 164-180.
)
12. H. HOTELLING, "Ncw Light on the Correlation Coefficicnt and Its Transfonns", 4. DUDLEY J. Co\VDEN, ..A procedure for Con1puting Regression Coefficients",
lourna[ of the Royal Statistical Sociery. Ser B. 15 ( 1953), 193-232. Joun1al ofthe A111erica11 Statistical Association, 53 (1958), 144-150.
13. F. N. DAVID, TC1bles of the Onlinates and Probabifity Integral of the Distri- s. LORRAINE DENBY y DARYL PREGJBON, "An Example of the Use c.f Graphics in )
butio11 of the Correfarion Coejjicient in Sn1all San1ples, Cambridge University Regression", Tite An1erica11 Statistician, 41 (1987), 33-38.
Press, Can1bridge, 1938. 6. A. S. C. EHRENBERG, "Bivariate Regression Is Useless", Applied Statistics, 12 )
(1963), 161-179.
7. M. G. KENDALL, "Regression, Structure, and Functional Relationship, Part r·,
Bion1etrika, 28 ( 1951 ), 11-25.
Otras publicacio11es
8. M. G. KENDALL, ·'Regression, Structure, and Functional Relationship 11",
Bio1netrika, 39 (1952), 96-108.
1. F. S. AcroN, Analysis of Srraight Line Data, Wiley, Nueva York, 1959.
9. D. V. LINDLEY, "Regression Lines and the Linear Functional Relationship",
2. ANDREW R. BAGGALEY, lntennediate (.'orrelarional Methods, Wiley, Nueva
Journal ofthe Royal Statistical Society (suplemento), 9(1947), 218-244.
York, 1964.
10. A. MADANSKY, "The Fitting of Straight Lines When Both Variables Are Sub-
3. CUTHBERT DANIEL y FRED s. \VooD, Firring Equarions to Data, Wiley-Inter-
ject to Error", Journal of the An1erica11 Statistical Association, 54 (1959), 173- )
science, Nueva York, 1971.
4. N. R. DRAPER y H. SM!TH, Applied Regression Analysis, 1.• edición, Wiley,
205.
)
11. A. WALD, "The Fitting of Straight Lines if Both Variables Are Subject to
Nueva York. I 981.
Error", Annals of Mathe111atícal Statistics, 11 (1940), 284-300. )
5. MORDECAI EZEKIEL y KARL A. Fox. Methods of Correlation and Regression
12. W. G. WA~RN, "Correlation of Regression: Bias or Precision", Applied Statis-
Analysis, l.ª edición. Wiley, Nueva York, 1959. )
tics, 20(1911), 148-164.
6. ARTHUR S. GOLDBERGER. Topics i11 Regression Analysis, Macmillan, Toronto,
1968. 13. CHARLES P. W!NSOR. "Which Regression?, Bio111etrics, 2 (1946), 101-109.
7. DAVID G. KLEJNBAUM y LAWR.Et,iCE L. KUPPER, Applied Regression Analysis and
Other Multivariable Methods, Duxbury Press, North Scituate, Mass., 1978.
8. R. L. PLACKETT. Principies of Regression Analysis, Oxford University Press,
Londres. 1960.
9. K. \V. SMILLIE, A11 l11trod11ctio11 to Regression and Correlation, Academic
Press, Nueva York, 1966.
10.. PETER SPRE!'.'T, Models in Regression, Methuen, Londres, 1969. )
11. E. J. W1LL!AMS, Regression Analysis, Wiley, Nueva York, 1959.
12. STEPHEN W!SEMAN, Corre/ation Methods, Manchester University Press, Man-
chester, 1966.
13. DICK R. W1rr1NK, The Application of Regression Analysis, Allyn & Bacon,
Boston, 1988.
14. MARY SUE YoUNGER, Handbciok for Linear Regression, Duxbury Press, North
Scituate, Mass., 1979.

Revistas y artículos

l. R. G. D. ALLEN, "The Assumptioils of Linear Regression", Econonlica, 6 N.S.


(1939), 191-204.
9
Regresión y correlación múltiple

9.1 INTRODUCCIÓN _ _ _ _ _ _ _ _ _ _ _ _ __

En el capítulo 8 se estudian los conceptos y técnicas para analizar y utilizar


la relación entre dos variables. Este análisis puede conducir a una ecuación
que puede utilizarse para predecir el valor de alguna variable dependiente
dado el valor de una variable independiente asociada.
La intuición señala que, en general, debe existir la posibilidad de mejo-
rar la capacidad de predicción al incluir más variables independientes en
dicha ecuación. Por ejemplo, un investigador encuentra que las califica-
ciones de la in'teligencia de las personas pueden predecirse a partir de fac-
tores físicos como el orden de nacimiento, el peso·at nacer y la duración de
gestación, junto con ciertos factores hereditarios y ambientales. La penna-
nencia de una persona en un hospital de enfermedades crónicas puede
depender de la edad del paciente, estado civil, sexo e ingresos, además de
mencionar el factor obvio del diagnóstico. La resi,uesta de un anima1 de la-
boratorio a algún fármaco puede depender de la dosis y de 'la edad y peso
del animal. Una enfermera supervisora desea saber la intensidad de la re-
lación entre la eficiencia de una enfermera 'en el trabajo, su calificación en
el examen de la dirección estatal, sus antecedentes escolares y su califica-
ción en alguna prueba de habilidad o aptitud. O bien, el administrador de un
hospital, al estudiar las admisiones de diversas comunidades atendidas por
el hospital, desea determinar qué factores parecen ser los que influyen en
las diferencias observadas en las tasas de admisión.

539
540 Regresión y correlación múltiple Modelo de regresión 111últiple 541

Los conceptos y técnicas par,1 analizar la asociación entre varias varia- J. Las variancias de lus subpoblacioncs de Yson todas iguales.
bles son extensiones naturales de los que se estudiaron en los capítulos ante- 4. Los valores de Y son independientes. Es decir, los valores de Y seleccionados para
un conjunto de valores de X no dependen de !os valores de Y seleccionados en otro )
riores. Los cálculos. corno es de esperar, son más complejos y tediosos. Sin
conjunto de valores de X. )
embargo, como se indica en el capítulo 8, esto no constituye un problen1a
real siempre que se disponga de u na con1putadora. No es raro encontrar
Estas suposiciones pueden enunciarse en forma más concreta como
investigadores que estudian las relaciones existentes entre una docena de
variables o más. Para quienes tienen acceso a una computadora, la decisión
)'¡ = /3o + f3,x 1¡ + f32x21 + · · · + '31x.t.i + t¡ (9.%.1)
acerca de cuántas variables incluir en un análisis se basa no en la compleji- )
dad y lo largo de los cálculos, sino en consideraciones como su importancia, )
donde Yj es un valor representativo de uná de las subpoblaciones de los
el costo de su inclusión y la importancia de su contribución.
En este capítulo se sigue estrictamente la secuencia del capítulo 8. Pri-
valores de Y, las P; se conocen como coeficientes de regresión, Xp, x 21., •.. ,
.
X1,;· son, respecuvan1ente, 1os va1ores part1cu
. 1ares de las vanables
. l.
1ndepen-
mero se estudia el modelo de regresión, seguido por un á.nálisis del modelo )
dÍentes X1, X.,, ...• X1,;, y e. es una variable aleatoria con media de O y varian-
de correlación. Al considerar el modelo de regresión, se cubren los siguien-
cia o 2, que ei la varianci~ común de las subpoblaciones de los valores de Y.
tes puntos: una descripción del modelo. los métodos para obtener la ecua-
Para construir intervalos de confianza para los coeficientes de regresión y
ción de regresión, la evaluación de la ecuación y los usos que pueden ha-
probar las hipótesis respecto a ellos, se supone que los e1 siguen una dis-
cerse de ella. En ambos modelos se estudian los procedimientos inferen-
tribución normal e independiénte. Las afirmaciones referentes a los e. son
ciales posibles y sus suposiciones fundamentales.
consecuencia de las suposiciones respecto a las distribuciones de los vaiores
de Y. La ecuación 9.2.1 se conoce como el 1nodelo de regresión múlliple.
Cuando la ecuación 9 .2.1 consta de una variable dependiente y dos va-
9.2 MODELO DE REGRESIÓN MÚLTIPLE _ _ _ _ _ __
riables independientes. es decir, cuando el n1odelo se escribe como

En el modelo de regresión 1núltiple se supone que existe una relación lineal (9.2.2) )
YJ = f3o + /31 x11 + f3r2; + e¡
entre alguna variable Y, a la cual se le da el nombre de variable dependiente,
Y k variables independientes, X 1, X2 ... , Xk. A veces. las variables indepen-
puede ajustarse un plano en el espacio tridimensional a los puntos de los
dientes se conocen corno variables explicativas debido a que se utilizan
datos, como se n1uestra en la figura 9.2.1. Cuando el modelo contiene más
para explicar la variación en Y, y como variables de predicción, pues se
de dos variables independientes, se describe geométricamente como un
usan para predecir a Y.
Las suposiciones asociadas con las siguientes:
hiperplano.
En la figura 9.2.1, el obsen·ador debe imaginar algunos puntos como si
estuvieran localizados por arriba del plano y otros como si estuvieran por de-
1. Las X¡ son variables no aleatorias (fijas). Esta suposición distingue al modelo de
regresión del modelo de correlación múltiple, el cual se estudia en la sección bajo. La desviación de un punto respecto del plano" se representa por me-
9.7. Esta condición indica que cualquier inferencia que se haga de los datos de la dio de
?1uestra sólo se aplica,al conjunto de valores de X observados y no a algún con-
JUnto mayor de X. Bajo el modelo de regresión, el análisis de correlación carece "1 = Y1 - f3o - f31x1 1 - f3:1.X2 1 (9.2.3)
de significado. Bajo el modelo de correlación, que se estudia más adelante, pue·
den aplicarse las técnicas de correlación que siguen. En la ecuación 9.2.2, Po representa el punto donde el plano corta al eje
2. Para cada conjunto de valores de X¡ existe una subpoblación de valores de Y. Para Y, es decir. representa la ordenada al origen del plano. ~ 1 mide el cambio
construir ciertos intervalos de confianza y probar la hipótesis, es necesario saber,
promedio en Y para un cambio unitario en X 1 cuando X2 permanece sin
o bien, el investigador debe inclinarse a suponer, que estas subpoblaciones de
alteración y p, mide el cambio promedio en Y para un cambio unitario en
valores de Y siguen una distribución normal. Puesto que se pretende demostrar
estos procedimientos de inferencia. se supondrá que los datos de los ejemplos y
X cuando X 1-pen11anece sin alterar. Por esta razón,
2
P1 y ~2 se conocen
ejercicios de este capítulo presentan una distribución normal. como coeficil'nl<' de regresión parcial.
Obtención de la ec1tació11 de regresión múltiple 543
542 Regresión y correlación múltiple

y
para indicar e_l hecho de que se minimiza la suma de cuadrados de las
desviaciones de los valores observados de Y respecto de los valores de esta
variables calculados a partir de la ecuación estimada.
Las estimaciones de b0 , h 1, •.• , bk de los coeficientes de regresión se
obtienen al resolver la siguiente serie de ecuaciones normales

t nb0 + b1_Lxv + b2¿x21 + ... + b,.¿xlrj = Vi


" 1
ig ¡ l 1
Plano de regresión

boLX1j + b1_Lx1J + b2Lx,jx2, + ... + b,.Lx1jxlrj :.: Lx·11Yi

i b0 Lx21 + h 1_Lx2jx 11 + b2Í:x2; ..¡. • • • + b,.¿x21 x*i = Lx21 y1


(9.3.2)

x, x, b0 Lx1r:¡ + b 1_Lxk)xlj + b2Lx,vx21 + · · · + b1r:Lx1r:J = Lxkjyj


Figura 9.2.]. Plano de regresión múltiple y dispersión de los puntos.
,, Cuando el modelo contiene sólo dos variables independientes, la ecua-
ción de regresión de la muestra es
9.3 OBTENCIÓN DE LA ECUACIÓN DE REGRESIÓN MÚLTIPLE
j 1 = b0 + b1x 11 + h,¡x21 (9.3.3)
Las estimaciones insesgadas de los parámetros f30, P1, ••• , 13k del modelo
especificado en la ecuación 9.2. 1 se obtienen mediante el método de los
El número de ecuaciones necesarias para obtener la estimación de los
mínimos cuadrados. Esto significa que se minimiza la suma de las desvia-
coefic;ientes de regresión es igual al número de parámetros a estimar. Es
ciones elevadas al cuadrado de los valores observados de Y respecto de la
posible resolver las ecuaciones tal como sean establecidas, o bien, pueden
superficie de regresión resultante. En el caso de tres variables, como se
reducirse a un conjunto de k ecuaciones mediante la transfonnación de _cada
muestra en la figura 9.2.1, la suma de las desviaciones al cuadrado de las
valor en una desviación a partir de su media. Por simplificación. se conside-
observaciones. respecto del plano, es un mínimo cuando se estiman f3 0, f3 1 y
ra el caso en el que se tienen dos variables independientes.
f3 2 por el método de mínimos cuadrados, se seleccionan estimaciones de 130,
Para obtener la ecuación de mínimos cuadrados, las ecuaciones nor-
13 1, ... , 13k de la muestra, en tal forma que se minimice la cántidad.
males que a continuación se presentan deben ser resueltas para los coefi-
cientes de regresión de la muestra.
¿e¡ = ¿()', - /3,~ 1, - x
{3 1 21 - • • • -{3x,.¡)

Esta cantidad. conocida como suma de los cuadrados de los reSiduales,


nbo + b1LX11 + b2Lx2, = vi
puede escribirse también como:
J
b0 _Lx 11 + h1Í:x 1 + b2Í:x 11 x21 = Lx1JYJ (9.3.4)

¿(y, - j)'
(9.3.l) boLX21 + b1Lx1r2, + b2Í:X212 = Lx21Y1
544 RegresWn y correlación múltiple Obtención de la ecuación de regresión múltiple 545 )

Cuando se dispone de una computadora, la solución de estas ecuaciones nb:1 + h;Lx; 1 + b2Lx2; = ¿Y;
no presenta ninguna dificultad, ya que la computadora puede ser programa-
da para hacer el trabajo, o bien, se puede utilizar algún paquete de software
,'I¡' ' + b''-'
bo¿,¡Xi; ,, + b''-'-·
1¿_¡X1j ' -- "'
2u1,x':l¡ '
¿,¡xi,Y¡ )
comercial. Sin embargo, si los cálculos se hacen con la ayuda de una calcula-
dora de escritorio o una calculadora de mano, la realización de los cálculos )
aritméticos será una tarea formidable, como lo demuestra el siguiente análi- + b''-'-·
,'I¡' '
bo~X2 1 1u1,x2' 1 + b''-' ,, -- "'
2~X'.l.1 '
¿_¡X21Y1 )
sis. Quienes tienen acceso a una computadora, pueden, si lo desean, omitir
la mayor parte de la explicación acerca de los cálculos. Al utilizar las transformaciones de la ecuación 9.3.5 y la propiedad )
Si se designa a las desviaciones de estas mediciones de las medias Lcx¡ - X) ;;; º·
se obtiene )
mediante Yj, x'1j y x 2j' respectivamente, se tiene
)
nbó + h;(O) + b¡(O) - O
y; = Yj - y )
x(1 =
x:?1 =
X¡j -

x 21 -
i
i 2
1
} (9.3.5) b(}(O) + biL(x 11 - i 1)
2
+ h2L(x 1j - X1 )(x21 - i2) = '¿(x¡j - i¡)(yj - j) )

)
2
b~(O) + biL(x 1¡ - i 1 )(x 21 - i 2 ) + b2¿(x2j - i 2) L(X2¡ - i,)(y¡ - y) )
Si se replantea la ecuación de regresión original de la muestra (ecuación
9.3.3) en términos de esas transformaciones, se tiene )
)
.. = b'O
)} + b'¡X¡J' + b'02j' (9.3.6)
Tabla 9.3.1. Duración de la hospitalización en días, )
donde bQ, b] y b]. son los coeficientes convenientes para las variables trans- edad en años y número de hospitalizaciones previas de )
fonnadas. Las relaciones entre las dos pruebas de coeficientes pueden deter- 15 pacientes internados en un hospital para enferme-
minarse al sustituir las desviaciones de las medias de las variables origi- dades crónicas.
nales en ]a ecuación 9.3.6 y simplificando. Así, se tiene que Duraci611 de la Nú1nero de )
hospitalización hospitalizaciones pre1·i,1.1· Edad
V, - j = b~ + bj(x 11 - f 1) + b2(x21 - i 2) (Y) <Xi) (X~) )

SJ = _Y + b(¡ + b;x 11 - biX'¡ + b2x21 - h2X2 (9.3.7) 15 o 21 )


15 o 18
)~ = hó + )' - bji 1 - híi2 + b;x 11 + b2x2,- 21 o 22
)

28 24 )
Cuando los coeficientes de términos iguales se establecen en las ecuaciones 30 25
9.3.3 y 9.3.4, se obtiene 35 25
40 26
b¡ = bí 35 2 34
2 25 )
30
b2 = b2 2 38
45 )
50 3 44
y, po~ lo tanto,
60 3 51
b11 = b¡, + J - b'1X1 - bíX2 = b¡, + J- b 1X1 - b':lX'./ (9.3.8) 45 4 39
60 4 54
Una nueva red de ecuaciones normales basadas en la ecuación 9.3.6 es 50 5 55
la siguiente
Regresión y co"elación múltiple Obtención de la ecuación de regresión múltiple 547
546
Es importante observar que hó= O. Así, la ecuación 93.8 Lx2,yJ = L<x2¡ - i2)(Y1 - j) = Lx2¡Y, - Lx2;L.1¡ In
b0 = j - h 1i 1 - b<]:X2 - 21,039 - (501)(559)115 = 2368.40
y cuando se substituye a b 1 y b2 con bj y bi_, respectivamente, las ecua- Cuando los datos se sustituyen en las ecuaciones 9.3.9 se tiene

I
ciones normales se condensan en las siguientes:
34.93b, + 257.40b, = 272.27 } (9.3.10)

b,Lxí] + b2LXÍ1X2¡ - LXÍ¡YJ (9.3.9)


257.40b,+ 2241.60b, - 2368.40

Estas ecuaciones pueden ser resueltas mediante cualquier método están-


h1Lxí1x21 + h2Í:x2] = í:x2JY; dar para obtener

b, - .06
Ejemplo 9.3.1 En un estudio sobre la duración de la hospitalización para h2 = 1.05
los pacientes de un hospital de enfermedades crónicas, un grupo de investi-
gadores deseaba saber qué tan correctamente podría predecir la duración de
la estancia (Y}, dadas las siguientes variables independientes: número de
Se obtiene b0 a partir de la relación
admisiones previas (X 1) y edad (X2 ). Los datos de la tabla 9.3.1 se obtu-
vieron de una muestra de 11 = 15 pacientes. Se desea calcular la ecuación de
b0 =j - b 1.i 1 - b,¿&2 (9.3.11)

regresión múltiple de la muestra.


Para el ejemplo, se tiene
Solución La tabla 9.3.2 muestra las sumas de los cuadrados y produc-
tos cruzados de los valores originales necesarios para calcular la suma de Tabla 9.3.2. Suma, <k cu:.iJr,1d:1_, y de productos cruzados para el ejemplo 9.3.1.
los cuadrados y productos cruzados de yj. x¡j y xíj· ,, x,, x~, X1t'21 Xi;J1 X'liJ¡ X¡J xJ ,:
Usando los datos de la tabla 9.3.2, tenemos o o o
15 o 21 315 441 225
15 o 18 o o 270 o 324 225
o 22 o o 462 o 484 441
,,
L•í] = L(xl) - -"1) 2
= Lx,J - (LxlJ)'¡ n 21
28 1 24 24 28 672 1 576 784
r, 30 1 25 25 30 750 1 625 900
,r - 91 - (29) 2 115 - 34.93 35 1 25 25 35 875 1 625 1225
"l) 40 1 26 26 40 1040 1 676 1600
r,,J - L(X21 - x,)' - Lx,J - (L•21)' 1n 35 2 34 68 70 1190 4 1156 1225
30 2 25 50 60 750 4 625 900
2 45 2 38 76 90 17!0 4 1444 2025
- 18,975 - (501) 115 = 2241.60
50 3 44 132 150 2200 9 1936 2500
60 3 51 153 180 3060 9 2601 3600
Lx'ux2J = L<x1, - i1)(x2J - .i2) = Lx11x2, - IxuLx2¡f n 45 4 39 156 180 1755 16 1521 2025
60 4 54 216 240 3240 16 2916 3600
= 1226 - (29)(501) 115 - 257.40 50 5 55 275 250 2750 25 3025 2500

Totales559 29 501 1.226 1,353 21,039 91 18.975 23,775


_Lx'11Y} = L<x1¡ - .i¡)(yj - j) = Lx11Y1 - Lx11L.11 In Medías 3i.27 1.93 33.40

= 1353 - (29)(559) 115 = 272.27


Regresión y correlación múltiple Ejercicios 549
548
b0 - 37.27 - (.06)( 1.93) ( 1.05 )(33.40) " ' = 65 "··' = 78,536,258
Lxi: = 218 .L,x 21
.L,J¡

- 2.08 Lxir',; = 114 Í:x11Y¡ = 93,361 Í:x21Y¡ = 51,334


21

Por lo tanto, la ecuación de regresión múltiple de la muestra es


9.3.2 Un investigador reunió los siguientes datos sobre 15 niños.
_'Y = 2.08 + .06x1i + l.05x2j (9.3.12)

Se ha utilizado un ejemplo que contiene sólo tres variables para facilitar


Orden de Edad de la n1adre al
la comprensión del tema. A medida que aumenta el número de variables, las nacimiento del productu
Calificación de i11teliRt'ncia nacimiento
manipulaciones algebraicas y los cálculos aritméticos se hacen más tediosos (Xi) (X2)
(Y)
y sujetos a error, aun cuando sean extensiones naturales de los procedimien- _,
9"
tos dados en _el presente ejemplo. . llO l
1 2 115 l 24
Snedecor y Cochran y Steel y Torrie dan ejemplos numéricos para 22
120 l
cuatro variables, y Anderson y Bancroft 3 ilustran los cálculos que inter- 24
118 1
vienen cuando se tienen cinco variables. Las técnicas utilizadas por estos \
110 2 20
autores se aplican a cualquier número de variables. 2 20 )
108
Una vez que se ha obtenido la ecuación de regresión múltiple, el siguiente 2 20
105 1 \
paso comprende su evaluación e interpretación. Esta es la faceta del análisis 104 3 24 1
'
que se cubre en la siguiente sección. 98 3
_,
9" '
)

EJERCICIOS _ _ _ _ _ _ _ _ _ _ _ _ _ _ __
99
98
100
90
4
4
5
5
30
24
29
30
,,. )
Obtener la ecuación de regresión para cada uno de los siguientes conjuntos de datos.
93 5 30
9.3.1 En un estudio diseñado para descubrir qué factores podrían estar relacionados
90 6 28
con el peso al nacer. se obtuvieron los siguientes datos en 10 niños recién
nacidos. Totals 1558 45 3¡5
,. )
Peso al nacer Calificació11 de co11dici.-í11 Orden
Lxi: = 111 »J =
Ú2J = 9563
1
163,112
en granios socioeco11ón1ica de 11aci111ie11t<' ,\
(Y) (X¡) (Xz)

1361 8 4 Í:;t1/C21 = 1191 L;t1¡Yj = 4458 Í:x 21 y¡ = 38,620


1588 7 3
1815 4 4
2087 5 3
2268 5 2
2404 4 2
3402 3 2
3629 3
9.3.3 En un estudio acerca de los factores que se pensaba estaban relacionados con
3765 2
los patrones de admisión a un hospital general grande, el administrador del
4083
hospital obtuvo los siguientes datos de 10 comunidades dentro del área de
26402 42 23 trabajo del hospital.
Regresión y correlació11 múltiple Ejercicios 551
550
Índice de Tiempo de Tiempo de
Perso11as por cada I ()(}IJ disponibilidad hospitalización Número de proble111as hospitalizac~ó11
adnlitfrias durante de otros servicios Índice de postoperatorio médicos actuales preoperatono
el periodo de estudio de salud indigencia (Y) (X 1) (X2l
Comunidad (Y) (X1) (X2J
12 4
61.6 6.0 6.3 6
2 53.2 4.4 5.5 5
3 65.5 9.1 3.6 12 3 2
4 64.9 8.1 5.8 8 l 2
5 72.7 9.7 6.8 9 2 2
6 52.2 4.8 7.9
7 50.2 7.6 Total 208 38 43
4.2
8 44.0 4.4 6.0
9
10
53.8
53.5
9.1
6.7
2.8
6.7
Lx1J = 90 "'
¿,,x21
' = 119 »: = 247~

Total 571.6 69.9 55.6


Lx,r21 = 79 }:xi,Y¡ = 430 'Ú21Yi = 519
U-1; = 525.73 Ü2} ""° 331.56 L],2 = 33,349.92

U1/"2¡ = 374.31 Ixljrj ,,. 1104.32 Ix2.1r; = 3183.s,


9.3.S Utilizar como referencia el ejercicio 8.7.5. El investigador dispuso de infor-
9.3.4 El administrador de un hospital general obtuvo los siguientes datos de 20 mación adicional sobre la calificación obtenida por cada enfennera en una
pacientes para cirugía durante un estudio para determinar qué factores pare- prueba de aptitud realizada cuando la enfermera ingresó a la escuela. Los
cen estar relacionados con la duración de la estancia. datos completos son los siguientes:

Tiempo de Tiempo de
hospitalización Número de problenias hospitalización Calif. en el exan1en de apritu1!
postoperatorio médicos actuales Calif. de la dirección el·rc1ta! Calif. final
preoperatori.o (X:z)
(YJ (Y) (X1)
(Xi) (X:z)
440 87 92
6 l l
480 87 79
6 2 l
¡¡ 535 87 99
2 2
460 88 91
9 l 3 84
525 88
16 3 3 71
480 89
16 l 5 78
510 89
4 l l 78
530 89
8 3 l 71
¡¡ 545 89
2 2 76
600 89
13 3 2 89
49.5 90
13 l 4
545 90 90
9 l 2
.5¡5 90 73
17 3 3
52.5 91 71
17 2 4 (continúa)
(continúa)
552 Regresión y co"elación múltipk Evaluación de la ecuación de regresión múltiple 553 1

Calif. de la dirección e.,-r(/Jai Calif. final Calif. en el exan1e11 de c1pl1T1u1 Paciente y X, x, x, x, x, x,


,')") (Xi) (X2)
)
13. 114 50 91.6 2.05 10.2 68 47
575 81 5.6 67 80 )
91 14. 106 45 87.1 l.92
600 91 84 15. 125 52 101.3 2.19 10.0 76 98 )
490 92 70 16. 114 46 94.5 l.98 7.4 69 95
510 92 85 17. 106 46 87.0 1.87 3.6 62 18 )
575 92 71 18. 113 46 94.5 1.90 4.3 70 12
540 93 76 19. 110 48 90.5 1.88 9.0 71 99
595 93 90 20. 122 56 95.7 2.09 7.0 75 99
525 94 94
545 94 94
600 94 93
625 94 73 9.4 EVALUACIÓN DE LA ECUACIÓN )
Total 13,425 2263 2053 DE REGRESIÓN M Ú L T I P L E - - - - - - - - - - - )

Lx 1}' = 204,977 Lx J =
2 170,569 L.vJ = 7,264.525 Antes de utilizar una ecuación de regresión múltiple, es conveniente deter- )
minar primero si, de hecho, vale la pena utilizarla. Al estudiar la regresión )
Ü 1 1 X21 = 185,838 Lxi¡)'¡ = 1.216,685 Lx2,Y¡ = J,101,220 lineal simple, se aprendió que puede evaluarse la utilidad de una ecuación
de regresión considerando el coeficiente de determinación de la muestra y )
9.3.6 Se obtuvieron los siguientes datos a partir de una muestra aleatoria simple de
20 pacientes con hipertensión. Las variables fueron: la pendiente estimada. Al evaluar la ecuación de regresión múltiple, la aten- )
Y= presión arterial media (mm Hg) ción se centra en el coeficiente de determinación 1núltiple y los coeficientes
X 1 = edad (años) de regresión parciales.
X 2 = peso (kg)
El coeficiente de determinación múltiple En el capítulo 8 se estudia con
X3 = área de la superficie del cuerpo (m 2)
detalle el coeficiente de determinación. El concepto se extiende lógicamente
X4 = duración de la hipertensión (años)
hacia el caso de la regresión múltiple. Puede dividirse la variación total pre-
X5 = pulso basal (latidos)min) sente en los valores de Y, en dos componentes: la variación explicada, que
X6 = nivel de tensión nerviosa mide la cantidad de la variación total que es explicada por la superficie de
)
Paciente y x, x, x, x, x, x, regresión ajustada, y la varíación inexplicada, que es aquélla parte de la
variación total que no es explicada por el ajuste de la superficie de regre-
l. 105 47 85.4 1.75 5.1 63 33 sión. La medida de la variación en cada caso es una suma de desviaciones
2. 115 49 94.2 2.10 3.8 70 14 elevadas al cuadrado. La variación total es la suma de desviaciones al
3. 116 49 95.3 1.98 8.2 72 10
cuadrado de cada observación de Y a partir cte la media de las observa-
4. 117 50 94.7 2.01 5.8 73 99
5. 7.0 72 95
ciones ,.,Y se designa por L<.vj - J) 2 o STC. La variación explicada, designada
112 51 89.4 1.89
6. 121 48 99.5 2.25 9.3 71 10
por D.Y- )') 2• es la suma de las desviaciones al cuadrado de los valores cal-
7. 121 49 99.8 2.25 2.5 69 42 culados a partir de la media de los valores de Y observados. Esta suma de
8. 110 47 90.9 1.90 6.2 66 8 desviaciones al cuadrado a veces se conoce como su,na de cuadrados debi-
9. 110 49 89.2 1.83 7.1 69 62 da a la regresión (SCR). La variación inexplicada, que se escribe L,(y. - f¡) 2,
10. 114 48 92.7 2.07 5.6 64 35 es la suma de las desviaciones al cuadrado de las observaciones origi~ales a
11. 114 47 94.4 2.07 5.3 74 90 partir de los valores calculados. Esta cantidad se conoce también como la
12. 115 49 94.l l.98 5.6 71 21 suma de cuadrados en torno a la regresión o la s11n1a de los cuadrados de
(continúa)
554 Regresión y correlación múltiplt! Evaluación de la ecuación de regresión múltiple 555
los errores (SCE). Es posible resumir estas relaciones entre las tres sumas independientes. El valor de R~. 12 ... k indic~ qué proporción de la variación
de cuadrados con la siguiente ecuación: total en los valores de Y observados es explicada por la regresión de Y sobre
X 1, X 2, ...• Xk. En otras palabras, pue.de decirse ~ue R2 . 12 ... k es una medida
2)Y1 - J)' = ¿(J - J)' + ¿(y¡ - J) 2 de la bondad de ajuste de la superficie de regresión. Ésta cantidad es análo-
(9.4,1)
ga a ,2, que se calcula en el capítulo 8.
SIC = SCR + SCE
Ejemplo 9.4.1 Tomar como referencia el ejemplo 9.3.t. Calcular R;'. ... k y
12
suma total de cuadrados ::;; suma de cuadrados debido a la regresión (explicada) probar su significación.
+ suma de los cuadrados de los errores (inexplicada)
Solución
La suma total de cuadrados, la explicada y la inexplicada, se calculan de la
manera siguiente: 2503.16
2 - .85
R,.12 - 2942.93
STC = ¿(y1 - _;¡' = L]j - (vJ In
(9.4.2) Se dice que el 85 por ciento de la variación total en los valores de Y es
explicada por el plano de regresión ajustado.
SCR = ¿(J - J) 2 Para comprobar si toda la regresión es significativa (es decir, para deter-
minar si R;_ 12 ... k es significativa), se lleva a cabo una prueba de hipótesis
como sigué:
= b1 2'xjyJ + b22'x~; + ... + h..\Lxk1yj (9.4.3)
1, Datos. Ver la descripción de los datos en el planteamiento inicial del problema.
SCE = STC-SCR (9.4.4)
2. Suposiciones. Se supone que son aplicables tanto el modelo de regresión múltiple
como las suposiciones en las que se basa, como se presentan en la sección 9.2.
Para el ejemplo ilustrativo, se tiene (con los datos de la tabla 9.3.2 y 3. Hipótesis. En general, la hipótesis nula es H0: P1 = P2 = P3 = ... = P.t = O y la
algunos cálculos anteriores): alternativa es HA: no todas las P1 =O.Para el ejemplo se tiene:

STC = 23,775 - (559) 2 / 15 = 2942.93 "•' P1 =P, =O


HA: no todas las 13;= O
SCR.; (.06)(272.27) + (l.05)(2368.40) = 2503.16
SCE = 2942.93 - 2503. l 6 = 439. 77 Dicho con palabras, la hipótesis nula establece que ninguna de las variables
independientes tiene valor al explicar la variación en los valores de Y.
El coeficiente de determinación múltiple, R~. 12 ... k se .obtiene al dividir
la suma de cuadrados e~plicada entre la suma total de cuadrados. Esto es

Tabla 9.4.1. ·Tabla ANOV A par.1 regresión múltiple

•) =
¿U - J>' Fuente se g.L CM R.V.
R_;.12 ... !t
Debida a CMRICME
"'
"-,<Y1 - j)""
9.4.5)
la regresión
En torno a
SCR

SCE
k

n - }¡ - 1
CMR =SCR/k

CME= SCEI
la regresión (n-k-l)
El subíndice y.12 ... k indica que en el análisis, Y se trata como la varia-
Total sctQtal n - 1
ble dependiente y las variables X, de X 1 a Xk, se tratan como las variables
)
Regresión y co"elación múltiple Evaluación de la ecuación de regresión múlliple 557 )
556
Cálculo de los e¡¡ Los valores C;¡ se conocen como rnultiplicadores de
Tabla 9.4.2. Tabla Ai'.'0\' A para el ejemplo 9.3.1.
Gauss. Para quienes están familiarizados con el álgebra de matrices, resulta
Fuente SC g.l. CM R.V. útil señalar que pueden obtenerse invirtiendo la matriz de las sumas de los
Debida a la regresión 2503.16 2 1251.58 34.15 cuadrados y productos cruzados que pueden construirse utilizando los tér- )
En tomo a la regresión 439.77 12 36.65 minos de la izquierda de las ecuaciones nonnales dadas en la ecuación )
9.3.5. Las e pueden encontrarse sin utilizar el álgebra de matrices al resol-
Total 2942.93 14 )
ver las siguientes series de ecuaciones:
)
4. Estadistica de prueba. La estadística de prueba conveniente es la R.V., que
se calcula como parte del análisis de variancia. La tabla completa ANOVA se
muestra en la tabla 9.4.1. En esta tabla, CMR representa el cuadrado medio
C¡ 1,,t.¡XlJ
" ' ,2 + "'-' ' -
C12u1X21 - ¡} )
debido a la regresión y CME el cuadrado medio en tomo a la regresión, o, tam- (9.4.6) )
bién conocido como cuadrado medio del error. c1,Lx;1x21 + C12Lx2}= O )

Para el ejemplo ilustrativo, el análisis de variancia se muestra en la tabla 9.4.2. )

S. Distribución de la estadística de prueba. Cuando H 0 es verdadera y las suposi-


C21LxíJ + C22}:xí1x2J2= º} )

ciones se cumPlen, la R.V. sigue una distribución F con k y n - k- 1 grados de )


(9.4.7)
libertad. C21Lxi1x21 + C22L,x2i = 1
)
6. Regla de decisión. Rechazar H0 si el valor calculado de la R.V. es igual o mayor
al valor crítico de F. )
En estas ecuaciones, c 12 ::: c 21 . También es importante observar que las ¡· .:-
7. Cálculo de la estadística de pn1eba. Verla tabla 9.4.2.
sumas de cuadrados y los productos cruzados son los mismos que los que se
8. Decisión estadística. Al consultar la tabla G para 2 y 12 grados de libertad, se
encuentra 4ue la R.V. = 34.15 es significativa al nivel de .005 (es decir, p < .005). encuentran en ]as ecuaciones normales (ecuación 9.3.5). :,1'
tl )
9. Conclusióll. Se concluye que la regresión explica una proporción significativa Cuando el análisis comprende más de dos variables independientes, las
del tota_l de la variación en Y. En otras palabras, se concluye que el plano ajusta· e se obtienen al desarrollar las ecuaciones 9.4.6 y 9.4.7, de tal forma que
do proporciona un buen ajuste para los datos. haya una serie de ecuaciones para cada variable independiente. Cada con-
junto de ecuaciones contiene también tantas ecuaciones individuales como )
Inferencias respecto a valores individuales de ~ Un procedimiento variables independientes se tengan. El 1 se coloca a la derecha del signo de
alternativo para evaluar la intensidad de la relación lineal entre Y y las igualdad en todas las ecuaciones que contengan un ténnino de la fonna
v~riables independientes es probar la hipótesis nula de ~¡ ::: O contra la c¡¡L,xf. Por ejemplo. en la ecuación 9.4.6, un l está a la.derecha del signo
hipótesis alternativa ~; '#:- O (i = l, 2, ... , k ). La validez de este procedi~ de igualdad en la ecuación que contiene a c 11 I,xf. Ezekiel y Fox4 han co-
1 ''
miento se apoya en las suposiciones enunciadas al principio: que,-para piado las ecuaciones para el caso de tres variables independienteS y, al igual
3
cada combinación de valores de X¡, existe una subpoblación de valores de que Snedecor y Cochran, 1 Steel y Torrie2 y Anderson y Bancroft, han
5
demostrado el uso del método abreviado de Doolittle, para obtener las e así
Y con distribución normal y variancia a 2 . Cuando se cumplen estas
suposiciones, puede demostrarse que cada una de las estimaciones de la como los coeficientes de regresión. Anderson y Bancroft 3 din un ejemplo
muestra, b¡ siguen una distribución normal con media~¡ y variancia C¡¡a2. numérico para cuatro variables independientes.
Dado que se desconoce a 2, es necesario estimarla. Una estimación la pro· Cuando se incorporan los datos del ejemplo ilustrativo en las ecua-
porciona el cuadrado medio en torno a la regresión, el cual se muestra en ciones 9.4.6 y 9.4.7 se tiene que
la tabla ANOVA. En general, puede designarse a esta cantidad como
s~.12 ...k· Para el ejemplo se tiene que, a partir de la tabla 9.4.2, s~·.IZ:::
34.9:~c 11 + 257.40c 1:.1 -I}
36.65 Y s'".1 2 = 6.05. Sin embargo. es necesario detenerse brevemeóte en
este puntó para explicar el cálculo de e ...
"
25í.40c 11 + ~~41.60r 1:.1 - ()

"°'0,1
Evaluació11 de la ecuación de regresión mIÍltiple 559
Regresión y collelación múltiple
558

34.93c21 + 257.40c22 = º} Solució1J

t. Datos. Verelejcmplo9.3.I.
257.40c2 1 + 224 l .60c22 = l
2. Sttposicio11es. Ver la sección 9.2.
La solución de estas ecuaciones da 3. Hipótesis

C¡¡ = .1861 H0: /3 1 = O

C12 = Cz¡ = -.021371 J H,: /3 1 ,/, O

'" = .0029001 Sea a= .05

4. Estadística de prueba. Ver la ecuación 9.4.8


Ahora se puede regresar al problema de los procedimientos de inferen.
5. Distribuciá11 de la estadística de prueba. Cuando H0 es verdadera y se cumplen
cia referentes a los coeficientes individuales de regresión parcial. Para pro~
las suposiciones, la estadística de prueba sigue una distribución t de Student con
bar la hipótesis nula que indica que P; es igual a algún valor particular, por
12 grados de liber1ad.
ejemplo, [3¡0, puede calcularse la siguiente estadística t: 6. Regh1 de decisión. Rechazar H0 si la t calculada es mayor o igual que 2.1788, o
. bien, menor o igual a-2.1788.
;., J
b; - /3,o 7. Cúlc1ilo de la estadística de prueba. Mediante la ecuación 9.4.8 se calcula
1 -
(9.4.8)
'•· t
b, - O
= -- =
.06
=
.06
= .023
i donde los grados de libertad son igual a n -k - J. y ,,, 6.05v.T86T 2.609928
¡i·,
Ji. 8. Decisión e~"tadística. La hipótesis nula no se rechaza porque el valor de t, .023,
l;L
s1,, = 5.v.12 •.. 1rVC: (9.4.9) está entre -2.1788 y +2. J 788. 1os valores críticos de t para una prueba bilateral

;¡¡
''[ j
cuando ex =.05 y los grados de I ibertad son 12.
El error estándar de la diferencia entre dos coeficientes de regresión 9. Co11clusió11. Se concluye que no hay una relación lineal significativa entre Y y
1 parcial está dado por la expresión X , cuando X2 se n1an1iene conslante. Al menos estos datos no proporcionan evi·
1
dencia de tal relación. En otras palabras, los datos del ejemplo no proporcionan
1 1
1 • r ..
+
suficiente evidencia para indicar que el nú1nero de admisiones previas, cuando
¡! s11,, _ 1,11 = V s_;.lt ... 1,.(c,, cJJ - 2c¡¡) (9.4.10) se utiliza una ecuación de regresión lineal junto con la edad, es una variable útil
1: 1 para predc.:ir la duración de hospitalización. (Para esta prueba: p > 2(.10) = .20].
( de modo que puede probarse H 0 : Pi~ Pjal calcular
A continuación se efectúa una prueba similar para el segundo coefi·
b - b ciente de regresión parcial. P;·
t =' - - ' Hu: /32 = O
So,, - h1¡ (9.4.11)
H.-t: /32 ':F O
a= .05
el cual tienen - k- 1 grados de libe(tad. Los intervalos de confianza para f3¡ b,, - O 1.05 I.05
!=....;...__= = = 3.223
y f}¡ - llj pueden construirse en la forma habitual utilizando un valor de la .325808
,,,, 6.05V.002900l
distribución t para el factor de confiabilidad y los errores estándar dados
anteriormente. En este caso la hipótesis nula se rechaza porque 3.223 es mayor que
2.1788. Se concluye que existe una relación lineal entre X2 y Y cuando X I se
Ejemplo 9.4.2 Con base en los datos del ejemplo 9.3.l, probar la hipótesis mantiene constante. y que la edad, al utilizarla de esta forma. es una va-
nula que indica que el número de admisiones previas es irrelevante para riable útil para predecir la duración de la hospitalización. [Para esta prueba~
predecir la duración de la hospitalización. p < 2(.005) = .01.J
560 Regresión y correlación múltiple Uso de la ecuación de regresión 11níltiple 561 )
Cuando el investigador ha concluido que un coeficiente de regresión 5. Algunos de los h; son significativos, pero no todos ni R2. )
parcial no es igual a O, puede ser que se interese en obtener un intervalo de 6. Ni R2 ni ningún b¡ son significativos. )
confianza para este ~¡- Un intervalo de confianza del 100( 1 - o.) por ciento
para un ~¡ está dado por la expresión Geary y Leser8 identifican estas seis situaciones y, después de señalar
que las <;ituaciones t y 6 no presentan problema alguno (ya que ambas )
b, :::t: [(l - a/2, 11 - Jr. - ti5.Y.)2 11.'\l'c';, implican resultados compatibles), explican con detalle cada una de las
)
demás situaciones.
Para el ejemplo ilustrativo, puede calcularse el siguiente intervalo de )
Nótese que la situación 2 se presenta en el ejemplo ilustrativo, donde se
confianza del 95 por ciento para ~2:
tiene un R2 significativo pero sólo uno de los dos coeficientes de regresión
es significativo. Geary y Leser8 señalan que esta situación es muy común,
1.05 ± (2.1788)(6.0S)V.0029001 especialmente cuando se ha incluido un gran número de variables indepen- )

1.05 ± .71 dientes en la ecuación de regresión, y que el -único problema es decidir si se


elimina o no del análisis una o más de las variables asociadas a coeficientes
.34, 1.76
no significativos.
Puede dar a este intervalo las interpretaciones probabilística y práctica ha-
bituales. Se tiene el 95 por ciento de confianza de que ~2 esté contenido en )
EJERCICIOS _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ __
el intervalo entre .34 y 1.75 ya que, al repetir el muestreo, el 95 por ciento )
de los intervalos que pueden construirse de esta forma incluirán el pará-
9.4.1 Con los datos del ejen:ü.:io 9.3. 1, a) Calcular el coeficiente de determinación
metro verdadero.
múltiple; h) llevar a cabo el análisis de variancia; e) probar el nivel de sig-
Debe tenerse cuidado con los problemas que se presentan al llevar a nificación de cada b; (i > 0). Sea a = .05 para todas las pruebas de signifi-
cabo pruebas de hipótesis múltiples y al construir intervalos de confianza cación. Dctenninar el valor p para todas las pruebas.
múlt-iples a partir de los mismos datOs de la muestra. El efecto sobre a al 9.4.2 Con los datos _del ejercicio 9.3.2, efectuar el mismo análisis sugerido en el
efectuar pruebas de hipótesis múltiples a partir de los mismos datos se estu- ejercicio 9.4.1. )
dia en la sección 7 .2. Surge un problema similar cuando se desea construir 9.4.J Con los datos del ejercicio 9.3.3, efectuar el mismo análisis sugerido en el
J
intervalos de confianza para dos o más coeficientes de regresión parcial. ejercicio 9.4.1.
Los intervalos no deben ser independientes, de modo que. en general, no se 9.4.4 Con los datos del ejercicio 9.3.4, efectuar el mismo análisis sugerido en el ,1
aplica el coeficiente de confianza tabulado. En otras palabras, todos estos ejercicio 9.4.1.
9.4.S Con los datos del ejercicio 9.3.5. efectuar el mismo análisis sugerido en el
intervalos no serían intervalos de confianza del 100(1 - a) por ciento.
ejercicio 9.4.1.
Durand6 proporciona un procedimiento que puede seguirse cuando se desea
9.4.6 Con los datos del ejercicio 9.3.6, efectuar el mismo análisis sugerido en el
obtener intervalos de confianza para más de un coeficiente de regresión par-
ejercicio 9.4. I.
cial. Véase también el libro de Neter et. al. 7
Otro problema que a veces se encuentra en la aplicación de la regresión
múltiple es la incompatibilidad aparente en los resultados de las diferentes
pruebas de significación que pueden llevarse a cabo. En un problema dado
9.5 USO DE LA ECUACIÓN DE REGRESIÓN MÚLTIPLE - - -
para cierto nivel de significación, es posible observar una de las siguientes
situaciones.
En el capítulo 8 se menciona que la ecuación de regresión se utiliza para
. l. 2
R y todos los b¡ son significativos. calcular el valor de Y, Y,
dado un valor partilular de X. De forma análoga,
2 R2 y algunos. pero no todos. los hi son significativos. se puede hacer Jo mismo con la ecuación de regresión múltiple para obtener
3. R2 significativo pero ningún bj es significativo. un valor f¡, dados los valores particulares para dos o más variables X en la
4. Todos \o<; b¡ !>On signifü.:atÍ\'O~ pero no R2 . ecuación.·
Regresión y correlación múlliple Uso de la ecuación de regresüí11 11uil1iple 563
562
Igual que ~n el caso de la regr:sión lineal simple, en la r~gresió~ múlti- Para el ejemplo ilustrativo, suponer que se quiere estimar el tiempo
ple es posible interpretar el valor y en una de dos formas. Pnmero, Y puede medio de permanencia de todos los pacientes de 25 años de edad con dos
interpretarse como la estimación de la media de la subpoblación de los valo- ingresos previos. En otras palabras, dados xlj = 2, y" x 2j = 25, ¿cuál es la
res de Y que se supone que existen para combinaciones particulares de va- estimación de la media de la subpoblación correspondiente de los valores de
lores X¡· De acuerdo con esta interpretación, f¡ se llama estin,ada, y cuando Y? Para obtener la estimación puntual, se sustituye x 1j == 2 y x2j == 25 en la
se utiliza para este propósito, a la ecuación se le llama ecuación de esti- ecuación 9.3.8:
mación. La segunda interpretación indica que f¡ es el valor que rnás proba-
blemente asumirá Y para los valores dados de las X;- En este caso, se Y _; = 2.08 + .06(2) + 1.05(25)
llama valor de predicción de Y. y la ecuación se llama ecuación de predic-
ción. En ambos casos, los intervalos se construyen en función del valor Y = 28.45

cuando las suposiciones de la sección 9.2 se cumplen. Cuando se interpreta--+--- Y


como Úna -estimación de la media de la población, el intervalo se llama Para calcular el error estándar, primero se obtiene x'1 . == (x 1. - x == (2 _
J J ])
intervalo de confian:.a, y cuando f¡ se interpreta como un valor de predic- 1.93) = .07 y x;.
q (x 2J - x 2) =(25 - 33.40)

=-8.40. Al sustituir esto y otros
ción de Y, el intervalo se Ilan1a inten,alo <.le predicción. A continuación se valores apropiados en la ecuación 9.8.3 se tiene
explica cómo construir cada uno de estos intervalos.
28.45 ± (2.1788)(6.05)
Intervalo de confianza para la media de una subpoblación de valores de
Y,· dados valores específico~ de X¡ Como se ha visto, es posible construir xV;'¡ + (.1861¡(.01¡ 2 + (.0029001¡(:::s.40¡ 2 + 2(-.0213111¡(.07J(-8.4o¡
un intervalo de confianza del 100( t - a) para un parámetro mediante el pro- 28.45 ± 7.19
cedimiento general de su1nar y restar del estimador una cantidad igual al 21.26, 35.64
factor de confiabilidad correspondiente a 1 - a, multiplicado por el error
Este intervalo se interpreta en la forma usual. Se tiene un 95 por cien-
estándar del estimador. También se ha visto que en esta situación el esti-
to de confianza de que el intervalo desde 21.26 hasta 35.64 incluye a la
mador es
1 media de la subpoblación de los valores de Y para la combinación espe-
11 _i = bo + h1X1j + b,tx21 + · · . + b,.X1tj (9.5.1) cífica de los valores X¡, dado que estos parámetros podrían incluirse en
! El error estándar de este estimador para el caso de dos variables indepen-
aproximadamente el 95 por ciento de los intervalos que se elaboran en la
forma descrita.
dientes éstá dado por la ecuación
Intervalo de predicción para un valor particular de Y dados valores
particulares de X; Cuando Y se interpreta como el valor que es más pro-
1 ,2 '2 ' 1
bable que Y asuma, cuando se observan valores de X¡, es posible construir
Sy.12 - + C¡ ¡X11· + C2~2j + 2c,~ljx2j
n (9.5.2) un intervalo de predicción de la misma forma que se construye un intervalo
de confianza. La única diferencia entre ambos es el error estándar. El error
donde los valores x;. son valores específicos de X¡ expresados como desvia- estándar
mación,
de la predicción es un poco mayor que el error estándar de la esti-
lo cual produce un intervalo de predicción más amplio que el de
ciones de sus medÍas. La expresión 9.5.2 se generaliza fácilmente para
cualquier número de variables independientes. Ver, por ejemplo, Anderson confianza.
y Bancroft. 3 Los intervalos de confianza del 100(1 - a) por ciento para el El error estándar de predicción para el caso de tres variables está dado
caso de tres variab~es, por lo ta~to, es como sigue: · por la ecuación

,2 + ,2 + 2C12-Y¡' X21' 1 ,2 .\! ••


j ± t(I - al2,,, - ft - l)sy.12 - Ct ¡X¡, C2~'.!¡ 1 Sy.12 1+ - + C¡ ¡X¡¡ + Ct'!-"C'l/ + 2C1zX1¡X21
n (9.5.3) n (9.5.4)
Regresión y con-elación múltipk Uso de la ecuación de regresión múltiple 565
564
de tal forma que el intervalo de predicción del 100( 1 - a) por ciento es the regression equation is

1 2 ' , J = 2.09 + 0.06 x1 + l.DS x2


j ± to - a/2, n - 1t - 1>5:,.12 + - + cux~J + c202, + 2c1r1jx2i (9.5.5)
n Coef staev t-ratio p
Predictor
constant 2.oa6 6.739 0.31 0.762
Para el ejemplo ilustrativo, suponer que un pariente de 25 años de edad 0.963
xl 0.057 2.613 a.02
con dos ingresos previos es nuevamente admitido. En esta nueva admisión 0.3262 3.22 a.DO?
12 l. OS.DO
¿qué tiempo de pennanencia se espera que tenga el paciente? La mejor pre-
dicción puntual se calcula mediante Es decir, Y.
s = 6.059 R-sq = es.o, R-sq(adj) = 62.5%
j - 2.08 + .06(2) + l.05(25)
lnalysis of Variance
- 28.45

es el mismo valor que se obtuvo anteriormente, cuando se interpretó a Y SOURCE DF SS ns F


34.06
p
O.DDD
como en la estimación puntual de la media de la subpoblación. Regression 2 2502.4 1251.2
Error 12 440.5 36.7
Es posible detener los siguientes intervalos de predicción del 95 por
"rotal H 2942.9
ciento mediante la expresión 9.5.5. . )
SOURCE DF SEQ 55
28.45 ± (2.1788)(6.05) 11 1 2122.a t
xVI + ;'¡ + (.1861)(.07)' + (.0029001)(-8.40)' + 2(-.0213711)(.07)(-8.40) 1 380.4 1
28.45 ± 15.0l
12

St.Resid
¡'
l 3.44, 43.46
Obs.
l
xl
O.DO
y
15.DD
Fit
24.14
20.99
Stdev.Fit
2.60
2.55
Residual
-9.14
-5.99
-J.. 6 7
-J.. 09
.)I'
! !.:'

2 o.ao H.DD -o. 77


Se tiene un 95 por ciento de confianza de que este paciente permane- 3 o.oa 21.ao 25.19 2.69 -4 .19
2.01 0.66 O. H
cerá en el hospital entre 13.44 y 43.4~ días. 4 1.aa 2e.aa 27.34
26.39 1.90 l.61 o.2a
5 1.oa 30.DD l.15
1.aa 35.DD 26.39 L.90 6.61
Análisis de computadora La figura 9.4.1 muestra el resultado del análisis 6
l0.56 l.63
7 1.00 40.DD 29.44 l.64
de datos efectuados mediante computadora para el ejemplo 9.3.1. Se uti1iz6 L.57 -2 .9a -o.so
e 2.aa 35.DD 37.90
el programa de regresión múltiple del paquete MINITAB. Los datos fueron 26.45 3.30 l.55 a.3a
9 2.00 30.DD 0.51
registrados en columnas de la I a la 3. y renombrados con el siguiente 45.DD 42.10 2.06 2.90
10 2.ao a.21
comando: 3.DD sa.aa 46.46 2.U J..54
ll 4.19 o.a?
12 3.00 60.DD SS.al 3.71
[ ll!E Cl •t•, C2 •n•, C3 •12•

Los comandos para obtener los resultados del análisis y la salida impre-
J l3
14
15
4.00
4.aa
5.DD
45.DD
60.DD
sa.ao
43.26
59.01
60.12
4.10
3.16
3.53
J..74
o.99
-10 .12
0.39
0.19
-2.as

Figura 9.4.1. Salida impresa parcial del análisis de los datos del ejemplo 9.3. l,
sa son los siguientes:
mediante el uso del programa MINITAB de análisis de regresión.

BBIEF 3
BEGRESS t II Cl 01 2 PBEDICTORS IB C2 C3
566 Regresión y correlación múltiple Variables cualitalivas indepe11die,rtes 567
Es importante observar que l,1 columna etiquetada con Stdev.fit contiene, no), diagnóstico, grupo racial, ocupación y estado inmunológico ante algu-
para cada conjunto observado de valores de X, valores numéricos del error na enfermedad. En algunas situaciones el investigador puede sospechar que
estándar que se obtienen n1ed1ante la ecuación 9.5.2. la inclusión de una o más variables como éstas en la ecuación de regresión
Las entradas bajo SEQ SS muestran la cantidad atribuible a cada una de habrán de contribuir en forma importante para la reducción de la suma de
las variables explicativas X 1 y X2, a partir de la suma de cuadrados de la errores al cuadrado y, por Jo tanto, proporcionan estimaciones más precisas
regresión 2502.4. Los residuos son las diferencias entre los valores obser. de los parámetros de interés.
vador de Y y los ajustados o predichos. Las entradas bajo St.Resid son los Supóngase, por ejemplo, que se estudia la relación entre la presión
errores residuales estandarizados. Los errores residuales estandarizados se sanguínea sistólica (variable dependiente} y el peso y la edad (variables
calculan mediante la división de los residuos sin procesar entre la desvia· independientes). También se desea incluir una variable cualitativa (sexo)
i¡ ción estándar. s, que aparece en la Salida impresa. Los residuos estandariza- entre las variables independientes. O bien, supóngase que se quiere pro-
dos, que aparecen en dicha salida, son el resultado de un procedimiento fundizar al conocimiento respecto a la naturaleza de la relación entre la
'I
;
diferente que no se estudia aquí. capacidad pulmonar y otras variables relevantes. Las variables cuantitati-
I vas que pueden incluirse en el modelo son la estatura, peso y edad, así
como las variables cualitativas sexo·. zona de residencia (urbana, suburba·
i!1 EJERCICIOS
na, rural) y grado de tabaquisn10 (fumador cotidiano, exfumador, nunca ha
fumado).
Para cada uno de los siguientes ejercicios calcular el valor de Yy elaborar para los
1 valores de X¡, a) intervalos de confianza del 95 por ciento; b) intervalos de predic- Para incorporar una variable Cualitativa independiente en el modelo de
I' regresión múltiple, ésta debe ser cuantificada de alguna forma. Esto puede
ción del 95 por ciento.
11 9.S.l Utilizar como referencia el ejercicio 9.3.1. Sea x 1j = 5 y x2j = 3. lograrse mediante el uso de las llamadas variables imaginarias.
9.5.2 Utilizar como referencia el ejercicio 9.3.2. Sea x 1j = 2 y x2j = 20.
Una variable imaginaria es una variable que sólo toma un número fini-
9.S,3 Utilizar como referencia el ejercicio 9.3.3. Sea x 1j = 5 y x 2j = 6.
to de valores (co,no cero o I) para identificar las diferentes categorías
9.5.4 Utilizar como referencia el ejercicio 9.3.4. Sea x 1j = 1 y x 2j = 2.
de una variable cualitativa.
9.5.S Utilizar como referencia el ejercicio 9.3.5. Sea x 1j = 90 y x2j = 80.
9.5.6 Utilizar como referencia el ejercicio 9.3.6. Sea x 1j = 50, x2j =95.0, x 3j =2.00, El término "imaginaria" se utiliza para indicar el hecho de que los valo-
X4¡ = 6.0Q, X5j = 75 y X6j = 70. res numéricos (como O y 1) asumidos por la variable no tienen significado
cuantitativo y sólo se utilizan para identificar las diferentes categorías de la
ii 9.6 VARIABLES CUALITATIVAS INDEPENDIENTES _ _ __ variable cualitativa bajo consideración.
1 En la tabla de la página siguiente se presentan ejemplos de variables
" Todas las variables independientes que se estudian en el análisis anterior cualitativas y variables imaginarias para cuantificarlas.
1, r1 · son de tipo cuantitativo, es decir. proporcionan valores numéricos de conteo Nótese que en estos ejemplos, cuan40 la variable cualitativa tiene k ca-
1 o medición. Por ejemplo, algunas de las variables independientes tjue se uti- tegorías, es necesario definir k - 1 variables imaginarias para codificar ade-
lizarofl en los ejemplos y ejercicios fueron la edad, calificaciones de exáme- cuadamente todas las categorías. Esta regla es aplicable para toda regresión
nes de aptitud y el número de problemas habituales en medicina. Sin embar- múltiple que contenga una constante de intercepción. La variable sexo, con
go, con frecuencia es recomendable utilizar una o más variables cualitativas dos categorías, puede cuantificarse mediante el uso de una variable imagi-
como variables independientes dentro del modelo de regresión. Las varia- naria, mientras que se necesitan tres variables imaginarias para cuantificar
bles cualitativas, como se menciona en el capítulo 1, son variables cuyo la variable grado de tabaquismo, que tiene cuatro categorías.
"valor" son categorías y transmiten el concepto de atributo más que de can- Los siguientes ejemplos ilustran algunos de los usos de las variables
tidad o de número. La variable de estado civil, por ejemplo, es una variable cualitativas en la regresión múltiple. En el primer ejemplo se supone que no
cualitativa cuyas categorías son "soltero", "casado", "viudo" y "divorciado". existe interacción entre las variables independientes. Dado que la suposi-
Otros ejemplos de variables cualitativas incluyen sexo (masculino o femeni- ción de no interacción no corresponde a la realidad en muchos casos, en el
568 Regresión y correlación múltiple Variables cualitativas independientes 569

Variable in1aginaria
Tabla 9.6.1. Datos obtenidos ;1 panir de una muestra aleatoria simple
Variable cuafitatii·a
de 32 nacimientos
Sexo (masculino, felllcnino): 1 por masculino y X, x,
x 1 = { O por femenino Peso al nacer Periodo de gestación Condición de tab.
Caso (gramos) (semanas) de la nradre
Lugar de residencia (urbano, rural, 1 por urbano
xi = { O por rural y suburbano 1 2940 38 Fuma (S)
suburbano)
1 por rural - 2 3130 38 Nofuma(N)
)
x:! = { Opor urbano y suburbano 3 2420 36 s
4 2450 34 N )
Condición de tabaquismo [fumador, ex 1 para fumador 39 s
5 2760
= { O en cualquier otro caso
fumador (no ha fumado en los últimos 5 Xi
6 2440 35 s
años o menos), ex fumador (no ha fuma- 1 para exfumador ($ 5 años) N
7 3226 40
= { O en cualquier otro caso
do en los últimos 5 años o más), nunca ha x:!
8 3301 42 s
fumado] 1 por exfumador (> 5 años) 37 N
9 2729
X3 = { Oen cualquier otro caso N
10 3410 40
11 2715 36 s
segundo ejemplo se ilustra el análisis adecuado para los casos en que existe 12 3095 39 N
interacción entre las variables. 13 3130 39 s )
14 3244 39 N
N )
Ejemplo 9.6.1 En un estudio acerca de los factores asociados con el peso 15 2520 35
16 2928 39 s
de niños recién nacidos. se examinó una muestra aleatoria simple de 32 re- N
17 3523 41
gistros de nacimiento. La labia 9.6.1 muestra parte de los datos extraídos de 42 s
18 3446
cada registro. Se tienen dos variables independientes: tiempo de gestación 2920 38 N
19
en semanas, que es una variable cuantitativa, y el grado de tabaquismo de la 20 2957 39 s
madre, que es una variable cualitativa. Para el análisis de los datos se cuan- 21 3530 42 N
tifica el grado de tabaquismo por medio de una variable imaginaria codifi- 22 2580 38 s
cada con un· 1 si 'la madre es fumador~ y con un O si la madre no es fumado- 23 3040 37 N
ra. Los datos de la tabla 9.6.1 se presentan en el diagrama de dispersión de 24 3500 42 s
la figura 9.6.1. Éste sugiere que, en general, )os periodos más largos de ges- 25 3200 41 s
tación están asociados con mayores pesos al nacer. 26 3322 39 N
27 3459 .40 N
Para obtener mayor información acerca de la naturaleza de esos datoS,
es necesario ingresarlos a una computadora y utilizar un programa conve- 28 3346 42 s
29 2619 35 N
niente para efectuar el análisis. Por ejemplo, se registran las observaciones s
30 3175 41
Y¡ == 2940, xll == 38, x 21 = 1 para el primer caso, y 2 == 3130, x 12 == 38, x22 == O s
31 2740 38
para el segundo caso y así sucesivamente. La figura 9.6.2 muestra la salida 32 2841 36 N
impresa obtenida mediante el uso del programa MINITAB de regresión
múltiple. Para observar el efecto sobre esta ecuación cuando se consideran sólo
En la salida impresa es posible observar que la ecuación de regresión es l~s hijos de madres fumadoras, sea x2j = 1. Entonces la ecuación se con-
vierte en
f} = bo + b¡XJj + b.¡t2j
y1 = - 2390 + l 43xlj - 245x21 (9.6.1)

t. ¡
Regresión y correlación múltiple Variables cualitalívas independientes 571
570
los bebés nacidos de madres que fuman, cuando se toma en cuenta el tiem·
3600
po de gestación. La diferencia total, en promedio, es de 245 gramos. Dichc
3500
• • % de otra forma, se dice que, para esta muestra, los bebés nacidos de madrei
3400 • •
que fuman pesan, en promedio, 245 gramos menos que los bebés nacidos de
3300 • •• madres que no fuman, cuando el tiempo de gestación es tomado en cuenta .
~ 3200 • • •• La figura 9.6.3 muestra el diagrama de dispersión de los datos originales
g 3100 • •• junto con la gráfica de las dos rectas de regresión (ecuaciones 9.6.2 y 9.6.3) .
§ 3000 •
Ejemplo 9.6.2. En este punto surge una pregunta respecto a las inferencias
~ 2900 •• ••
.•
e

áJ
2800

2700

• • • •
que pueden hacerse respecto a la población muestreada con base en los re-
sultados obtenidos en el ejemplo 9.6.1. Antes que nada, se desea saber si la
diferencia muestra! de 245 gramos· es significativa. En otras palabrás, ¿el
l 2600~
• • fumar tiene efectos sobre el peso al nacer? Es posible contestar esta pregun-
2500 • ta mediante el siguiente procedimiento de prueba.de hipótesis.
2400
• • • Soluci6n
2300
], Datos. Los datos son los mismos que en el ejemplo 9.6.1.
2200
2. Suposiciones. Se presume que las suposiciones que fundamentan el análisis de
34 35 36 37 38 39 40 41 42
regresión múltiple se cumplen.
Periodo de gestación (semanas)
Figura 9.6.1. Peso y tiempo de gestación de 32 recién nacidos: The regression equation is
(.&.) madres que fuman y (e) madres que no fuman.
y ; - 2390 + 143 xl + -245 x2

Predictor Coef Stdev t-ratio p


YJ ; - 2390 + I43x 1, - 245( 1¡ constant -2369.b 349.2 -b. 64 0.000
xl 143.100 9.126 15.b6 a.ooo
-2635 + 143x 1j (9.6.2) x2 -24~.54 41. 96 -5.B a.ooo
la cual tiene una ordenada de -2635 y una pendiente de 143. Es importante
notar que la ordenada para la nueva ecuación es igual a (b 0 + b 1) = [-2390 + s ; 115.5 R-sq ; !9.b\ R-sq(adj) ; 66.9%
(-245)]; -2635.
Ahora considérese sólo a los hijos de madres no fumadoras. Cuando lnalysis of Variance
x 2 = O, la ecuación de regresión se reduce a
SOORCE· DF SS !S F p
J¡; -2390 + 143x 11 - 245(0)
Regressioil 2 3346720 1b743b0 125.45 0.000
-2390 + l43x 11 (9.6.3) Error 29 3!7070 J.3347
Total 31 3735769

La pendiente de esta ecuación es la misma que la pendiente de la ecua- SOORCE DF SEQ SS


ción de las madres fumadoras, pero las ordenadas son diferentes. La ordena- x1 l 2695639
da para la ecuación de madres que no fuman es mayor que la ordenada x2 1 452661
correspondiente a las madres que fuman. Los resultados muestran que, para
la muestra, los bebés de madres que no fuman pesan, en promedio, más que Figura 9.6.2. Salida impresa parcial del análisis de regresión múltiple para el
ejemplo 9.6. l.
Variables cualitativas independientes 573
572 Regresión y co"elación múltiple
efectos. La n1ejor estimación puntual de la diferencia promedio de peso al
nacer cuando la duración de la gestación es tomada en cuenta, es de 245
3600
3500 • 1 gramos a fa\'or de los bebés de madre~ que no fun1an. Es posible obtener .,.
una estimación del intervalo para el valor medio de la diferencia utilizando •
3400
la información de la salida impresa por medio de la siguiente expresión:
3300
3200
I 3100
h2 ::!: ls¡,2

Para un intervalo de confianza del 95 por ciento se tiene


s!!! 3000

qj 2900

.
u
~ 2800
-244.54 ± 2.0452(41.98)
g
l ,ooov:.,,,
2700

2500
2400 •
-330.3975. -158.6825

Así, se tiene el 95 por ciento de confianza de que la diferencia se encuentra


entre los 159 y 331 gramos .
El lector puede haber supuesto correctamente que un análisis alternativo
2300
2200

~ 35 ~ 37 38 ~ ~ 41 a
de los datos del ejemplo 9.6.1 consistiría en el ajuste de dos ecuaciones de
regresión, una para la submuestra de madres que fuman y otra para la de las
madres que no fuman. Sin embargo, este enfoque carece de algunas venta-
11 :

Periodo de gestación (semanas) jas de la técnica de variable imaginaria y es menos recomendable cuando el
Figura 9.6.3. Peso y tiempo de gestación de 32 recién nacidos y rectas segundo procedimiento es válido. Si se logra justificar la suposición de que
de regresión ajustadas: (&) madres que fuman y C•) madres que no fuman. las dos rectas de regresión tie11en la misma pendiente, es posible obtener
una mejor estimación de tal pendiente común mediante el uso de variables
3. Hipótesis. H0 : ~ 2 = O~ HA: ~2 ,¡, O. Suponer que a= .05.
4. Estad(stica de prueba. La estadística de prueba es t = (b 2 - 0) I sb 2•
imaginarias. las cuales permiten ponderar los datos de _las dos submuestras. 1'
En el ejemplo 9.6.1 la estimación que utiliza una variable imaginaria se
S. Distribución de la estadística de prueba. Cuando las suposiciones se cumplen Y
basa en un ta1naño total de la muestra de 32 observaciones, mientras que las
H0 es verdadera la estadística de pruel¡a sigue una distribución r de Student con
estimaciones por separado se apoyarían en una muestra de tan s~lo 16
29 grados de libertad.
6. Regla de decisión. Se rechaza H0 si la t calculada es mayor o igual que 2.0452 o
observaciones. El enfoque de la variable imaginaria también proporciona
es menor o igual que -2.0452. inferenci..1s más precisas respecto a otros parámetros· dado que se dispone de
1. Cálculo de la estadística de prueba. El valor calculado de la estadística de prue· . mayor n1í1nero de grados de libertad para -calcular la media de errores al
ba aparece en la figura 9.6.2 como la razón de t para el coeficiente asociado con cuadrado.
la variable que aparece en la columna 3 de la tabl·a 9.6. l. Este coeficiente, por A continuación se considera la situación en la que se supone que existe
supuesto, es b.,. Se aprecia que la t calculada es -5.83. interacción entre las \'ariables. Por ejen1plo, suponer que hay dos variables
8. Decisión estadística. Puesto que -5.83 < -2.0452, se rechaza H0 . independientes: una de ellas es cuantitativa, x 1, y la otra es de tipo cualitati-
9. Conclusión. Se concluye que, en la población muestreada, el hechci de que las vo con tres ni\'eles de re::..puesta que proporcionan dos variables imagina-
madres fumen o no fumen influye sobre el peso al nacer de sus bebés.
rias, X2 y X:,· El modelo, por lo tanto es

Para ésta prueba se tiene p < 2(.005) puesto que -5.83 es menor que _1· = /3o + f31X1j + f32X 2i + /33 X31 + /34,X1.,X21 + /301.,XsJ + e1 (9.6.4)
1
-2.7564.
Dado que se tiene la posibilidad de concluir que en la población mues· donde p X . X.,. y P, .X . X~- se llaman rénninos de interacción y representan
4 1 11
treada el grado de tabaquismo de las madres sí tiene efectos sobre el peso de la interacci6n t!1ntre ·las varfables independientes cuantitativas y cualitativas.
los recién nacidos. se puede preguntar ahora de qué magnitud son tales
Regrerió,i y correlación múltiple variables cualitativas indepe11die11tes 575
574
Es importante observar que no es necesario incluir ténninos que contengan Tabla 9.6.2. Datos p,ira -:: ·-'i.:111plt! 9.6J
X-;,)<3. en el modelo porque siempre serán igual a cero, ya que cuando X2 ::; I, Medida de Método de
0
X = y cuando Xl::; 1, X2 =O.El modelo de la ecuación 0.6.4 abre la posi~ la efectividad Edad tratamiento
biJidad de una pendiente y una ordenada diferentes para cada nivel de la va- 56 21 A
riable cualitativa. 41 23 B
Suponer que se utiliza la codificación de la variable imaginaria para 40 30 B
cuantificar como sigue: 28 19 e
55 ~8 A
1 para el nivel I 25 23 e
X2 = { O en otro caso 46 33 B
71 67 e
JI para el nivel 2 48 42 ~
X3 = lo en otro caso 63 33 A
52 33 A
62 56 e
Las tres ecuaciones de regresión muestra! para los tres niveles de la 45 e
50
variable cualitativa son las siguientes: 45 43 B
Nivel 1 (X2 = 1, x, = 0): 58 38 A
46 37 e
)j = b0 + b1x 11 + b2(]) + b3 (0) + b,x 1,(l) + b,x 1/0) 58 43 B
34 27 e
= ho + b¡X¡j + b2 + b4X¡1 65 43 A
= (b0 + b2 ) + (b 1 + b.1 )x 11 (9.6.5) 55 45 B
57 48 B
59 47 e
Nivel 2 (X1 =O, x, = 1): 64 48 A
61 53 A
62 58 B
+ b1x 1i + b2 (0) + b3 (1) + b.¡X 1,(0) +
j 1 =_b0 b,x 1,(IJ
e
36 29
= b0 + h1x 1j + b3 + h5 xlj 69 53 A
47 29 B
= (bo + b3) + (b¡ + b5)X¡¡ (9.6.6)
73 58 A
64 66 B
Nivel 3 (X 2 =O, x, = O): 60 67 B
62 63 A
j = b0 + b1xlJ + b2 (0) + b,(O) -!- b,x,,(O) + b,x 1,(0) 71 59 e
62 51 e
jj = bo + b¡X¡j (9.6.7)
70 67 A
71 63 e
Estos resultados se ilustran con mayor claridad en el siguiente ejemplo.

Ejemplo 9.6.3 Un grupo de investigadores en salud mental desea comparar


tres métodos (A.By C) para el tratamiento de la depresión aguda. También
577
Regresión y correlación múltiple Variables cualitativas independie11tes
576
Tabla 9.6.3. Datos para e1 eJemplo 9.6.3 codificados para el análisis de computadora
80
x~ A1X1
,...x,
V

76 y x, X,
•• • 1 o 21 o
. ... .

70
56 21
o 28 o

.E 65
j
g
60
55 • •
• • • •
• • ••



55
63
52
28
33
33
o
o
33
33
o
o
o
)

o 38
~
~
50 •
.. . . •..
• 58
65
38
43 o
o
43
48
o
o
)

1• :: • • 64
61
48
53
o
o
53
53
o
o )
ü:i 35 •• 69 53
o 58 o
30
• 73 58
o 63 o
25 • 62 63
o 67 o
67 1 23
70
o o
41 23 o 30
15 20 25 30 35 40 45 50 55 60 65 70 75 80
40 30 o o 33
Edad 33 o 42
Figura 9.6.4. Diagrama de dispersión de los datos del ejercicio 9.6.3.
46
o o
48 42 o 43
(e) tratamiento A;(&) tratamiento B; C•> tratamiento C.
45 43 o o 43
()
58 43 o 45
55 45 o o 48
)

desean estudiar la relación entre la edad y la efectividad del tratamiento, así 57 48 o o 58


como la interacción (si existe) entre edad y tratamiento. A cada individuo 62 58 o o 29
de una muestra aleatoria simple de 36 pacientes, todos los cuales presenta· 47 29 o o 66
ban un diagnóstico y grado de depresión semejantes, se Je asignó uno de los 66 o 67
64
o o
tres _tratamientos. Los resultados se muestran en la tabla 9.6.2. La variable 60 67
o o o
19 o o
dependiente representa la efectividad.del tratamiento, la variable cuantitati- 28
o o o
va independiente X representa la edad del paciente, y la variable indepen· 25 23
o o o
1 71 67 o o o
diente, que se refiere al tipo de tratamiento, es una variable cualitativa que o o
ocurre en tres niveles. Se utiliza el siguiente código de variables imaginarias 62 56
o o o
50 45 o o o
para cuantificar a la variable cualitativa: 37 o o o
46
o o o
34 27
o o o
_ { 1 si es el tratamiento A 59 47 o o o
()
X2 - O en otro caso 36 29 o o o
59 o o o
l si es el tratamiento 8 71
() o o
X3 - { 62 51
o o o
- O en otro caso
71 63 o

El diagrama de dispersión para e:itos datos se muestra en la figura 9.6.4.


La tabla 9.6.3 muestra los datos como fueron alimentados a la computadora
para su análisis, y la figura 9.6.5 contiene la salida impresa de los resultados
del análisis al utilizar el programa de regresión múltiple MINITAB.
Regresión y COllelo.ció11 múltipk Variable:, cualitativas indepe11die11ter 579
578
Solución El examen di.! la salida impresa permite obtener mayor informa- b - ()
ción acerca de la naturaleza de las relaciont:s entre las variables. La ecua- 1=-'-
ción de mínimos cuadrados es
,,.
para probar H0 : ~¡=O. En la t."Cuación 9.6.5 se aprecia que la ordenada de la
j 1 = 6.21 + l.03x 11 + 4l.3x2j + 22.7x:y - .703x 11 x21 - .5I0x 11 x 31 recta de reg"resión para el .rrata111iento A es igual a b0 + b 2 • Dado que la ra-
zón t de 8.12 para probar H0: ~·~=O es mayor que el valor crítico t = 2.0423
(para a= .05), es posible rechazar H 0 : P2 = O Y concluir que la ordenada de
Las ecuaciones de regresión para los tres tratamientos son las siguientes: la recta de regresión de la población para el trJt.imiento A es diferente de la
Tratan1iento A (ecuación 9.6.5): ordenada de la recta de regresión de la población para el tratamiento C,
la cual tiene la misma ordenada que P0 . De forma similar, p'uesto que la
j, = (6.21 + 41.3 + (1.03 - .703)x,, razón t de 4.46 para probar H0 : P1 = O también es mayor que el valor crítico

= 47.51 + .327x 11 The regression equation is


y= b.21 + 1.03 x1 + 41.3 x2 + 22.7 x3 - 0.703 x4
- 0.510 xS
Tratamiento B (ecuación 9.6.6);

jj = (6.21 + 22.7) + ( I.03 - .5 IO)x,, Predictor Coef Stdev t-ratio p


Constant b .211 3.350 1.as 0.074
= 28.91 + .520x,1 1.0333, 0.07233 14.2, 0.000
x1
x2 41.304 5 .085 a.12 0.000
Tratamiento C (ecuación 9.6.7): x3 22.707 s.0,1 4.4b o.aoo
x4 -O. 702, 0.10,0 -b. 45 0.000
y1 = 6.21 + t.03xlj xS -o.son O.1104 -4.b2 0.000

La figura 9.6.6 muestr.1 el diagrama de dispersión de los datos origi- s = 3.,2s R-sq = ,1.4% R-sq(adj) = ,o.Di
nales junto con las ecuaciones de regresión para los tres tratamientos. La
inspección visual" de la figura 9.6.6 sugiere que los tratamientos A y B no Analysis of Variance
difieren mucho con respecto a sus pendientes, aunque sus ordenadas di-
fieren de manera considerable. La gráfica sugiere que el tratamiento A es
mejor que el tratamiento 8 para pacientes jóvenes. aun cuando la diferencia SO URCE DF SS !5 F p
5 4,32.as ,ab.57 b4.04
es menos evidente en pacientes con mayor edad. El tratamiento es clara-
Regression
Error 30 4b2.15 15.40 º·ººº
mente menos aconsejable que los tratanlienros A y B para pacientes Total 35 53,s.oo
jóvenes, aun cuando es casi tan efectivo como el tratamiento B en pacientes
con mayor edad. Estas i111presiones subjetivas son compatibles con la obser- SOORCE DF SEQ 55
vación de que existe interacción entre edad y tra1an1iento. x1 1 3424.43
Sin embargo, Jo que se aprecia en la figura 9.6.6 son los resultados de la x2 1 803.aD
x3 1 1.1,
muestra. ¿Qué se puede concluir acerca de la población a partir de la cual x4 1 375.00
fueron extraídas las muestra-.? xS l 32!.42
Para ofrecer una respuesta es necesario observar la razón ten la salida
impresa de la computadora de la figura 9.6.5. Cada una de ellas e:. la esta- Figura 9.6.S. Salida i!nprcsa del programa tvffNITAB para el análisis de regresión
dística de prueba. múltiple del ejemplo 9.6.3.
Ejercicios 581
580 Regresión y coTTelación múltiple
En la sección 9.4 el lector fue advertido de que existen problemas cola-
80
/ . Tratamiento e terales al hacer inferencias múltiples a partir de los datos de una misma
75
muestra. Las referencias citadas en esa sección presentan prócedimientos a
101-- 1,- Tratamiento A
seguir cuando existen inferencias múltiples. como las estudiadas en esta
0
E
65
-~ 60

.•
/ Tratamiento 8
sección .
Se han estudiado sólo dos situaciones en donde el uso de las variables
i!! 55 imaginarias es conveniente. Los 1nodelos más complejos que involucran el
.>:!
~ 50 uso dé una o más variables independientes cualitativas en presencia de dos
~

/.-----:
~ 45 • o más variables cuantitativas pueden ser adecuadas en ciertas circunstan-
10
~ 40 cias. Estos modelos se estudian en las obras de Mendenhall y McClave,
Kleinbaum et al., 9 Draper y Smith, 11 y en Neter et al. 7

/l
~

j 35
w
30
25
EJERCICIOS~~~~~~~~~~~~~~~~~

9.6.1 Se obtuvieron los siguientes datos acerca de una muestra aleatoria simple de
15 20 25 30 35 40 45 50 55 60 65 70 75 80
Edad 22 sujetos observados en una feria de salud llevada a cabo en un centro co-
Figura 9.6.6. Diagrama de dispersión de los datos del mercial suburbano.
ejemplo 9.6.3 con la ecuación de regresión ajustada.
Condición de salud ( l'J Edad ¿Es hipertenso?
(e) tratamiento A; (A) tratan1ien10 B; (•) tratamiento C.
45.8 37 Sí
tde 2.0423, se puede concluir (en un nivel de significación de .05) que la 60.0 62 Sí
ordenada de la recta de regresión de la población para el tratamiento B tam~ 52.9 49 Sí
bién es diferente de la ordenada de la recta de regresión de la población para 43.9 61 No
el tratamiento C (ver la ordenada de la ecuación 9.6.6). 30.1 32 Sí
A continuación se consideran las pendientes. En la ecuación 9.6.S se 51.8 57 Sí
aprecia que la pendiente de la recta de regresión para el tratamiento A es 46.1 57 No
32.5 38 Sí
igual a b 1 (la pendiente de la recta para el tratamiento C) + b4 • No
16.0 41
Puesto que la razón tes -2.0423, -6.4 para probar H0 : ~ 4 = Oes menor que 36 No
27.0
el valor crítico de t = -2.0423, se puede concluir (para a= .05) que las pendi- No
30.3 46
entes de las rectas de regresión de la población para los tratamientos A y C son 54 No
35.0
diferentes. De fonna similar. dado que la razón t calculada para probar H0: P5 64.1 57 Sí
= O también es menor que -2.0423, se concluye (para ex = .05) que las rectaS 45.3 45 Sí
de regresión de la población para los tratamientos B y C tienen pendientes 48.6 39 Sí
diferentes (ver la pendiente de la ecuación 9.6.6). De esta forma. se concluye 51.0 72 No
que existe interacción entre la edad y el tipo de tratamiento. Esto se refleja por 22.1 35 No
la ausencia de paralelismo entre las rectas de regresión en la figura 9.6.6. 59.9 73 No
Otra pregunta de interés es la siguiente: ¿son diferentes las pendientes de 29.8 48 No
las rectas de regresión de la población para los tratamientos A y B? Para res- 382 32 Sí
ponder a esta pregunta es necesario hacer uso de técnicas de cálculo que se en- 51.8 67 No
29.1 42 No
cuentran fuera del área de estudio de este libro. El lector interesado puede con-
sultar los libros de Neter et. aJ.1 y K.leinbaum et. al.9 para resolver este problema.
Regresión y correlación múltiple Ejercicios 583
582
Un valor mayor de la vuri~lblc dependiente indica una menor calidad de
salud. Utilizar un código de vari.il-ilcs imaginarias para cuantificar a la varia- Número de
¿Biorretro- Calificación de repeticiones
ble cualitativa y utililar la regresión múltiple para obtener la ecuación de a/in1entaciñ11? destreza manual (Y)
míni,nos cuadrados que describa la relación entre el estado de salud y la edad
para el grupo de individuos hipcrtensos y para el grupo con presión san- No 87 !06
guínea normal. ¿Es posible concluir que el estado de la presión sanguínea tie- No 101 91
ne efectos sobre el nivel de salud? Sea a= .05. Encontrar el valor p. Elaborar Si 211 75
intcrvalos·de confianzu del 95 por ciento para la diferencia entre el nivel Sí 136 70
medio de salud de los dos grupos cuando la edad se toma en cuenta. Dibujar No 100 100
un diagrama de dispersión con los datos y elaborar una gráfica de las ecua- Si IOO IOO
ciones de regresión ajustadas.
Utilizar un código de variables imaginarias y las técnicas de regresión para
9.6.2 Un grupo de investigadores desea estudiar los efectos de la biorretroali-
analizar estos datos. Dibujar un diagra1na de dispersión de los datos origi-
mentación y la destreza n1anual sobre la capacidad de los pacientes para
nales y elaborar una gn.ílica de las ecuaciones de regresión ajustadas.
desempeñar con precisión una tarea complicada. Se eligieron veintiocho
9.6.3 Una muestra aleatoria si1nple de l<Js personas que respondieron a un anuncio
pacientes aleatoriamente a partir de aquellos que recibían terapia física.
en un periódico solicitando voluntarios para un proyecto de investigación mé-
Posteriormente, a estos pacientes se les asignó aleatoriamente el recibir o no
dica, fueron sometidos a una prueba para medir su conocimiento acerca de
biorrelroalimentación. La variable dependiente es el número de repeticiones
las prácticas para mantener una buena salud. Las calificaciones en el exa-
consecutivas de la tarea tcnninada antes de cometer un error. Los resultados
se n1uestran en la tabla siguiente. men, junto con la edad y el área de residencia de cada sujeto se encuentran
en la siguiente tabla.
Número de
¿Biorretro- Calificación de repeticiones
aíin1e11tari(i11? destreza manual (Y) Calificación Edad en Área de Calificación Edad en. Área de
(Y) años residencia (Y) años residencia
Si 225 88
Si 88 102 112 65 e 240 37 A
No 162 73 230 30 B 88 56 B
Si 90 105 280 23 A 120 67 A
No 245 51 205 59 A 220 22 B
Sí 150 52 236 48 A 260 30 A
Si 87 106 260 25 B 45 69 B
Si 212 76 176 39 e 210 30 e
Sí 112 IOO 245 20 A 225 40 A
Si 71 112 123 66 A 126 45 B
No 137 89 176 40 B 200 26 e
No 171 52 216 25 B 240 21 B
No 199 49 176 63 A 170 56 A
Sí 137 75 90 75 e 116 58 e
No 149 50 176 69 A 120 50 B
Si 251 75 200 52 A 194 33 B
No 102 75 45 75 B 156 48 e
Si 90 112 110 75 e IOO 75 A
No 180 55 150 62 e 115 71 A
Sí 25 115 148 70 e 65 69 B
240 9" A
No 142 50 265 20 B -º
No 88 87
~

584 Regresión y co"elación múltiple Modelo de corre?ación múltiple 585

Utilizar un códign de \'ariables in,aginarias para cuantificar la variable mal multivariada. Además, es posible calcular medidas muestrales para el
cualitativa y obtener la ecu:it:ión de regresión para cada área de residencia. grado de relación entre las variables y, con la suposición de que el muestreo
¿Qué se puede concluir a partir de los resullados del análisis? ¿Existe inter- se realiza a partir de una distribución normal de variables múltiples, pueden
acción entre la edad y la zona de residencia? Elaborar una gráfica con los )
estimarse los parámetros correspondientes por medio de intervalos de con-
datos originales y las ecuaciones de regresión ajustadas. Si se presenta inter- )
fianza y pueden llevarse a cabo pruebas de hipótesis. Específicamente, es
acción entre las dos variables independientes, ¿cómo se explica este hecho?
posible calcular una estimación de coeficiente de correlación múltiple, que
mide la dependencia entre Y y las X¡. Ésta es una extensión directa del con-
cepto de correlación entre dos variables que se estudia en el capítulo 8. )
9.7 MODELO DE CORRELACIÓN MÚLTIPLE _ _ _ _ __ También es posible calcular los coeficientes de correlación parcial, que mi- )
den la intensidad de la relación entre dos ,·ariables cualesquiera cuando ha
En e1 capítulo anterior se indica que, mientras que el análisis de regresión se sido eliminado el efecto de tocias las demás variables.
refiere a la forma de relación entre las variables, el objetivo del análisis de
correlación es el de adquirir conocimientos acerca de la intensidad de la Coeficiente de correlación múltiple Como primer paso para el análisis de las
relación. Esto ocurre también en el caso de variables múltiples y en esta relaciones entre las variables, se estudia el coeficiente de correlación múltiple.
sección se investigan los métodos para medir la intensidad de la relación El coeficiente de correlación múltiple es la raíz cuadrada del coeficiente
entre varias variables. Sin embargo, deben definirse primero el modelo y las de detenninación y, en consecuencia, el valor de la muestra se calcula al
suposiciones sobre las cuales se basa el análisis. obtener la raíz cuadrada de la ecuación 9.4.5. Es decir,
Puede escribirse el modelo de correlación como

Y1 = /3o + /31x1 1 + f3r 2; + ... + f31tx1g + e¡ (9.7.1) L<i - ;)' )

R,.12 ... 1t = \!íi;.12 ... 1t =


Donde y. es un valor representativo de la población de valores de la variable Le,, ~ ,i•
Y, los vÍJores ~ son los coeficientes de regresión definidos en la sección 9.2 · (9,7.%)
Y los xij son los valores particulares (conocidos) de las variables aleatorias
X¡, Este modelo es semejante al modelo de regresión múltiple, pero existe El numerador del término bajo el radical en la ecuación 9. 7 .2, que es la
una diferencia importante. En el modelo de regresión múltiple dado en la suma de cuadrados explicada, está dado por la ecuación 9.4.3 que, como se
ecuación 9.2.1, las X¡, son variables no aleatorias, pero en el modelo de co- menciona, contiene a b1 y b 2, que son tos coeficientes de regresión parcial
rrelación múltiple, las X¡ son variables aleatorias. En otras palabras, en el de la muestra. Éstos se calculan mediante los métodos de la sección 9.3.
modelo de correlación existe una distribución conjunta de Y y las X¡, cono- Para ilustrar los conceptos y técnicas del análisis de correlación múlti-
cida como distribución ,nultivuriada. En este modelo, las variables ya no se ple, se considera el siguiente ejemplo.
consideran como dependientes o independientes, ya que, lógicamente, son
intercambiables y cualquiera de las X¡ puede desempeñar la función de Y. Ejemplo 9.7.1 Las mediciones que se muestran en la tabla 9.7.1 fueron to-
De manera típica, se extraen muestras aleatorias de unidades de aso- madas en l l varones aparentemente nonnales, con edades entre 14 y 24
ciación a partir de una población de interés y se efectúan mediciones de Y y aflos. EJ investigador que reunió los datos desea conocer la naturaleza e
de las X¡, intensidad de las relaciones entre las tres ,·ariables.
Un plano o hiperplano de mínimos cuadrados se ajusta a los datos de ta
muestra a través de los métodos descritos en la sección 9.3 y pueden ha- Solución Primero~ deben calcularse las diversas sumas, sumas de cuadra-
cerse los mismos usos de la ecuación que resulte. Pueden hacerse inferen- dos y sumas de productos cruzados como sigue:
cias acerca de la población de la cual se extrajo la muestra si es posible su-
poner que la distribución fundamental es normal, es decir, si puede supo-
nerse que la distribución conjunta de Y y las X¡ siguen una distribución nor- LX¡¡ = 630.20 v,, = 1306.00 Vi 1821.50
1
Regresión y correlación múlliple Modelo de correlación múltiple 587
586
¿x,; = 36,209.68 _¿x,J = 155,410.00 vl = 302,723.51 Tabla 9.7.J. Mediciones realizad:1s en 11 varones aparenten1ente nom1ales
con edades entre 14 y 24 años
Colesterol en suero Peso en Presión sanguínea
¿x, x21 = 74,995.80 _¿x,1y1= 104,485.19 _¿x21y1= 216,682.00
1
m?llOOcc
(F)
kilogramos
(.\'¡)
sistólica
(X~)

Cuando se calculan las sun1as de cuadrados y productos cruzados de 162.2 51.0 108
158.0 52.9 1 11
y; = (yj - J) 157.0 56.0 115
x;1 = (x 11 - .i 1 ) y x2; = (x 2 ¡ - X2) 155.0 56.5 116
156.0 58.0 117
se tiene:
154.1 60.I 120
169.1 58.0 124
~ ,2
L_JXJ¡ = 36,209.68 - (630.20) 2 /11 = 104.95 181.0 61.0 127
174.9 .59.4 122
~ ,2 180.2 56.I 121
LJX2¡ 155,410.00 - ( 1306.00) 2 / 11 = 352.18 174.0 61.2 125

»;2 = 302.723.51 - (1821.5¡2111 = 1099.67 Esta ecuación puede utilizarse cOn fines de estimación y predicción, y pue-
de valuarse por medio de los métodos que se describen en la sección 9.4.
Ahora se tienen las cantidades n'ecesarias para calcular el coeficiente de
~ ' ,_ 74,995.8 - (630.20)( 1306.00) / 11 173.87 correlación múltiple. Se calcula primero la suma de cuadrados explicada
,t.¡XljX2¡-
mediante la ecuación 9.4.3:

_¿x;¡Y¡ = 104,485.19 - (630.20)( 1821.50) / 11 = 129.80 SCR = (-4.06)(129.80) + (3.20)(420.27)


= 817.876
_¿x,1yJ = 216,682.00 - ( 1306.00)( 1821.50) / 11 = 420.27
La suma total de cuadrados por medio de la ecuación 9.4.2 es

Las ecuaciones nonnales, por ecuación 9.3.9, son STC = 302,723.51 - (l82l.5)'/ll
= l,099.669
l04.95b, + 173.87b, = 129.80
173.87b, + 352.l8b2 = 420.27 El coeficiente de determinación n1últiple es entonces:

La solución si,nultánea de estas ecuaciones da b 1 = -4.06, b2 = 3.20; b0 se


817.876 = .7437
obtiene al sustituir los valores adecuados en la ecuación 9.3.1 J: R_;.12 = 1099.669
b0 = 165.59 - (-4.06)(57.29) - (3.20)(118.73) = 18.25 y el coeficiente de correlación múltiple es

La ecuación de mínimos cuadrados es entonces R,_ 12 = V.7437 = ,86


R1,_ ¡2 se interpreta con10 una medida de la correlación entre la concen-
_i = 18.25 - 4.06x 1j + 3.20x21 traci6fl de colesterol en suero, el peso y la presión sanguínea sistólica en la
588 Regresión y co"elaci6n mdltiplt Modelo de co"elación múltiple 589
muestra de hombres aparentemente sanos. con edades entre 14 y 24 años. Si bras, son los coeficientes para cualquier par de variables que se obtienen
los datos constituyen una muestra aleatoria de la población de dichas per- mediante los métodos de correlación simple, que se estudian en el capítulo 8.
sonas. es posible utilizar R>: 12 como una estimación de Py. 12, que es el coefi- Suponer que se tienen tres Yariables, Y. X 1, y X 2• El coeficiente de co-
ciente real de correlación múltiple de la población. Rv_ 12 puede interpretarse rrelación parcial mide la correlación entre Y y Xl' mientras X2 se mantiene
Y,
también como el coeficiente de correlación simple eritre y. y que son los como constante y se escribe r ·1.i· En el subíndice, el símbolo a la derecha del
valores observado y calculado, respectivamente, de la variable "dependiente". punto decimal indica la variable que se mantiene constante. mientras que los
La correspondencia perfecta entre los valores observados y calculados de Y dos símbolos a la izquierda del punto decimal indican qué variables están
darán por resultado un coeficiente de correlación de 1, mientras que la ausen-
cia de una relación lineal entre dichos valores da un coeficiente de correlación
correlacionadas. Para el caso de las tres variables, existen otros dos coefi~ r
de O. El coeficiente de. correlación múltiple siempre tiene signo positivo.
cientes de correlación parcial que pueden calcularse. Estos son ry 2.l y r 121 .
El cuadrado del coeficiente de correlación parcial se llama coeficiente f''
Es posible probar la hipótesis nula Py. lZ ... k = O al calcular '
F=
2
R,.12 .•. A
n-k-l
de determinación parcial y proporciona información útil acerca de las rela-
ciones entre las variables. Por ejemplo, considérese r\"1.z· Su cuadrado, 1,1.z•
¡
1
indica qué proporción de la variabilidad restante en· Y es explicada por X1 '
- R;.12 ... ; k (9.7.3) 1
después que X2 hu explicado el má~imo posible de la variabilidad de Y.
El valor numérico que se obtiene a partir de la ecuación 9. 7.3 se compara con Para tres variables. es posible obtener los siguientes coeficientes de co-
el valor tabulado de F con k y n - k - 1 grados de libertad. Nótese que esto es rrelación simple:
idéntico a la pruebaH0: P, - P,; ... ; P,; O, descrita en la sección 9.4.
Para el presente ejemplo se probará la hipótesis nula p\dZ = O contra la 'vi• la correlación simple entre }" y X1.
alternativa Py. 12 ;te O. El cálculo es · 1\,2 , la correlación simple entre Y y X2,
r"1.i, la correlación simple entre .X 1 y X2 •
F = .7437 (11 - 2 - 1) = 11.61 Los cuales se calculan como sigue:
(1 - .7437) 2
Dado que 11.61 es mayor que 11.04. p < .005, es posible rechazar la hipóte-
sis nula al nivel de significación de .005 y concluir que la concentración de
"' . ·/V"' .,. . . .,
ryl = ~X11Y1 ~Xlj k}J (9.7.4)
colesterol en suero mantiene una correlación lineal con el peso y la presión
sanguínea sistólica en la población muestreada.
Pueden encontrarse más co1n~ntarios acerca del significado de los coe-
"' . ·/V"'·''"'·.,
r.~~ = ~X21Y1 v2~ .,t.,.'V1 (9.7.5)
fi,cientes de correlación múltiple en Ezekiel y Fox,4 quienes analizan un tra-
b~jo. sobre el tema escrito por R. A. Fisher 12 y presentan gráficas para conS;- "' .. I "' .,. _. .,
.
f¡2.:::: .t.JX¡JX2j
1
¿_Xtj ,t.¡X2j (9.7.6)
truir intervalos de confianza cuando el número de vari~bles es de ocho o
menos. Kramerl3 presenta tablas para construir límites de confianza cuando Para el eje1nplo ilustrativo pu~den utilizarse las cantidades previamente
el número de variables es mayor que ocho. calculadas para obtener

Correlación parcial Es posible que el investigador de~ee tener una medida de ,." = 129.80 V(l04.95)(1099.67) = .382
la intensidad de la relación lineal entre dos variables cuando se elimina la ,,, = 420.27 V(352. 18)(1099.67) = .675
influencia de las variables restantes. Dicha 1nedida la proporciona el coeficiente
r 12 = 173.87 V(I04.95)(352.18) = .904
de co"elación parcial. Por ejemplo, el coeficiente de correlación parcial, Py.!2'
es una medida de correlación entre Y y X I cuando X2 pennanece constante. Los coeficientes de correlación parcial de la muestra que pueden calcu-
Los coeficientes de correlación parcial pueden calcularse a partir de los larse en el caso de tres \'ariables :,,on los siguientes:
coeficientes de correlacián sin1ple. Estos últimos miden la correlación entre
dos variables cuando no se pretende controlar otras variables. En otras pata~ l. La ._·lirrelación parcia! entre )' y X1 • cuando X2 se mantiene constante:
Ejercicios 591
590 Regresión y correlación múüipte
tiva entre la presión sanguínea sistólica y el peso cuando la concentración de
r,1. 2 = (r11 - r12 r 12 )/\i( 1 --r,~J(J -- i)
r1 (9.7.7) colesterol se mantiene constante. Las pruebas de significación para los otros
2. La correlación parcial entre Y y X2 cuando X 1 se mantiene constante: coeficientes de correlación parcial se dejan como ejercicio para el lector.
Aun cuando el ejemplo de análisis de correlación aquí incluido se limita
al caso de tres variables, los conceptos y técnicas se aplican lógicamente al
r, 2 . 1 = (r, 2 - r 11 r 12 )/\/(I - r1~)(l -_ r 1 i) (9.7.8)
caso de cuatro o más variables. El número y complejidad de los cálculos
aumenta rápidamente a medida que aumenta el número de variables.
3. La correlación parcial entre X 1 y X2 cuando Y se mantiene constante:

r 12 ., = (r12 - r11 r12 )/Y(I -=-;,i)(I - rJ) (9.7.9) EJERCICIOS,~~~~~~~~~~~~~~~~~

Si se emplean los co~ficientes de correlación calculados previamente, 9.7.1 Se obtuvieron los siguientes datos de 12 jóvenes varones entre 12 y 18 años
se obtienen los siguientes coeficientes de correlación parcial para el ejemplo (todas las medidas están dadas en centímetros).
ilustrativo:
Estatura Longitud del radio Longitud del fémur
,, .. , = ¡.382 - (.675)(.904)]/Y<I - .675'><1 - .904 2 ) = -.723 (Y) (X,) (X2)

,,2 . 1 = [.675 - (.382J(.904JJ/Y(I - .3822 )(1 - .904'> = .834 149.0 21.00 42.50
152.0 21.79 43.70
, 1,., = ¡.904 - (.382)(.675¡¡/V(l - .382 2 )(1 - .675 2 ) = .948 44.75
155.7 22.40
159.0 23.00 46.00
163.3 23.70 47.00
Es posible probar, por medio de la prueba t, la hipótesis nula que indica
166.0 24.30 47.90
que el coeficiente de correlación parcial de la población que corresponde a 24.92 48.95
169.0
cualquiera de los coeficientes anteriores es igual a O. Por ejemplo, para pro- 172.0 25.50 49.90
bar H 0 : Pyi. 2... k =0, se calcula 174.5 25.80 50.30
176.1 26.01 50.90
,/n-A-1 176.5 26.15 50.85
'= r,1.2 ... • Vi - 11.2 .. • (9.7.10) 179.0 26.30 51.10

Total 1992.1 290.87 573.85


la cual sigue una distribución t de Studen con n - k - l grados de libertad.
A continuación se ilustra el procedimiento para el presente ejemplo al y 1; = 7087.6731 _}:x2;' = 27541.8575 LJ? = 331851.09
probar H0 : p 12.J = O contra la hipótesis alternativa HA: p 12 _v -::t- O. El valor
calculado de t es · U11X21 = 13970.5835 V11Yj = 48492.886 U2JYi "" 95601.09

, /11 _ 2 - 1 a) Calcular el coeficiente de ¡;orrelación múltiple de la muestra y probar la


, = .948 y· 1 .948' hipótesis nula Pv. l? = O.
b) Calcular cada uÍ1o de los ¡;oefi¡;ientes de correlación parcial y verificar la
= 8.425 significación de cada uno. Sea a= .05 para todas las pruebas.
e) Determinar el valor p para ca<la prueba.
Dado que la t calculada de 8.425 es mayor que la t tabulada de 3.5554 para 8 d) Sacar conclusiones.
grados de libertad y a - .O l para una prueba bilateral, es posible rechazar H0
9.7.2 Los siguientes datos se obtuvh:ron de 15 jóvenes obesas.
al nivel de significación de .OJ y concluir que existe una correlación significa-
592 Regresión y co"t1lación múltiple Elección de variables independientes para la ecuación de regresión 593
1
Peso en Peso del cuerpo Ingesta media de Y :::::
inteligencia )
kilogramos sin grasa calorías por día X1 = apraxia ideomotora
(Y) (X¡) (X2) X2 = apraxia constructiva )

79.2 54.3 2670 X3 = volumen de la lesión (pixels) )


64.0 44.3 820 X4 = severidad de la afasia
67.0 47.8 1210
En la siguiente tabla se muestran los resultados. Calcular el coeficiente de
78.4 53.9 2678
correlación múltiple y verificar su significación. Sea a= .05. Calcular el
66.0 47.5 1205
63.0 43.0 815 valor p.
65.9 47.1 1200
63.1
73.2
44.0
44.1
1180
1850 Sujeto ,. X, x, X:1 X

66.5 48.3 1260
7.4 2296.87 2
1 1
l. 66 7.6
61.9 43.5 1170 2975.82
2. 78 13.2 11.9 8
72.5 43.3 1852 12.1 28'.19.38 11
3. 79 13.0
101.1 66.4 1790 13.3 3136.58 15
4. 84 14.2
66.2 47.5 1250 11.2 2470.50
5. 77 11.4 5
99.9 66.1 1789 13.1 3136.SH g
6. 82 14.4
Total 1087.9 741.1 22739 7. 82 13.3 12.8 2799.5:) 8
8. 75 12.4 I J .9 2!>65.SO 6
Lx1] m 37,439.95 Ú 2J = 39,161,759 ~ = 81,105.63 9. 81 10.7 11.5 2429.19 11
10. 71 7.6 7.8 2369.37 6
Ú-i;:21 = 1,154,225.2 Ú',iYJ = 55,021.31 U°2iYj = 1,707,725.3 11. 77 11.2 111.8 2644.62 7
12. 74 9.7 9.7 2647.45 9
13. 77 10.2 JO.O 2672.92 7
a) Calcular el coeficiente de correlación múltiple y probarlo respecto al nivel
14. 74 10. l 9.7 2640.25 8
de significación.
15. 68 6.1 7.2 1926.60 5
b) Calcular cada uno de los coeficientes de correlación parcial y verificar la
significación de cada uno. Sea a= .05 para todas las pruebas.
e) Determinar el valor p para cada prueba.
. á) Sacar conclusiones. ,1
9.7.3 Utilizar como referencia el ejercicio 9.3.5. Suponer que los datos sé ajustan 9.8 ELECCIÓN DE VARIABLES INDEPENDIENTES :¡,,
al modelo de correlación. PARA LA ECUACIÓN DE REGRÉSIÓN MÚLTIPLE--- 1!

a) Calcular el coeficiente de correlación múltiple y verificar su significación.


b) Calcular cada uno de los coeficientes de correlación parcial y verificar la Uno de los problemas más conflictivos al utilizar el análisis de regresión
significación de cada uno. Sea a= .05 para todas las pruebas. múltiple es el de decidir qué variables independientes deben incluirse en la
e) Determinar el valor p para cada prueba. ecuación. En. la mayoría de los casos, la decisión final es el resultado de
ti) ¿A que conclusiones es posible llegar? consideraciones tanto estadísticas como no estadísticas.
9.7.4 Utilizar como referen<.:ia el ejemplo 9.7 .l. Verificar la significación de r"¡, 2 Y En las etapas iniciales de la detenninación de la ecuación de regresión,
r¡. 2_1 para el nivel de .05. Delcrminar el vaJor p para cada prueba. · el investigador se ha de guiar por su conocimiento de las variables rele-
9.7.5 Se efectuó un proyecto de investigación para el estudio de las relaciones vantes y de aquellas que probablemente son las más útiles con fines de
entre la inteligencia, afasia y apraxia. Los sujetos eran pacientes con daño
predicción y estimación. También tomará en consideración los costos rela-
focal en el hemisferio izquierdo. Se aplicaron pruebas estándar para obtener
tivos y facilidad para obtener mediciones.
calificaciones con respecto a las siguientes variables:
Regresión y co"elación múlliple
594 Pnguntas] ejercicios de repaso 595
En la presente era de las computadoras, el volumen y complejidad de
los cálculos relacionados con un gran número de variables no plantean el más. se estudian los métodos y conceptos del análisis de correlación inclu-
problema que alguna vez originaron. Aun así, por lo general resulta conve- yendo la correlación parcial. Para quienes desean ampliar sus conocimien-
niente (particularmente desde el punto de vista del costo y de la convenien- tos respecto a la regresión múltiple y al análisis de correlación, las referen-
cia para obtener las mediciones; incluir en la ecuación final menos variables cias al final del capítulo proporcionan un buen principio.
independientes que las disponibles. Es en este punto donde el investigador Cuando no se satisfacen las suposiciones en las que se basan los méto-
puede utilizar el análisis estadístico con el fin de llegar a una decisión. dos de regresión y correlación, descritos en este capítulo y en el anterior, el
Existen varios procedimientos que pueden seguirse. El método más comple- investigador debe recurrir a técnicas alternativas. Una alternativa es utilizar
to, pero también el más tedioso y tardado incluso con la ayuda de una com- un procedimiento no paramétrico como el que se discute en Daniet.25,26
putadora, es el de realizar la regresióri de Y sobre cada subconjunto de X¡, es
decir, llevar a cabo la regresión de Y sobre cada X, en seguida sobre cada
PREGUNTAS Y EJERCICIOS DE REPASO _ _ _ _ _ _ __
pareja de X, después sobre Cada grupo de tres X, y así sucesivamente. IJa
mejor de estas ecuaciones de regresión, de acuerdo con algún criterio
1. ¿Cuáles son las suposiciuncs que fun4amentan el análisis de regresión múltiple
estadístico, será la elegida a menos que alguna consideración no estadística,
cuando se desea hacer inferen¡;ias acerca de la población a partir de la cual
como el costo, requiera de un ajuste. Debido a la magnitud de los cálculos, fueron extraídos los datos?
este método no se utiliza con fri;:cuencia. 2. ¿Qué suposiciones funda,nentan al modelo de correlación cuando la inferencia
Un segundo procedimiento, llamado método de ascenso o hacia ade- es el objetivo?
lante, consiste en introducir variables independientes, una a la vez, en la re- 3. Explicar amplian1ente los siguientes términos.
gresión y, en cada etapa. evaluar estadísticamente la "bondad" de la ecua- a) Coeficiente de determinación múltiple
ción. El procedimiento continúa hasta que, de acuerdo con algún criterio b) Coeficiente de correlación múltiple
estadístico, se obtiene una ec:uación satisfactoria. C) Coeficiente de correlación sin1ple
Un tercer método, llamado 1nétodo de descenso o hacia atrás, es el re- d) Coeficiente de correlación parcial
verso del método anterior. Mediante este método, se lleva a cabo la regre- 4. Describir una situación en alguna área de interés particular donde sería útil el
sión de Y sobre todas las X¡ y se eliminan las variables independientes, una análisis de regresión múltiple. Utilizar datos reales o ficticios para efectuar un
a la vez, hasta obtener una ecuación satisfactoria. análisis de regresión C:01npleto.
Para más información acerca de éstos y otros métodos para estimar qué 5. Describir una situación en alguna área de interés particular donde sería útil el
variables independientes deben incluirse en el análisis se pueden consultar análisis de corri.!lación niúltipli:. Utilizar datos reales o ficticios para efectuar
los libros y artículos escritos por Allen, 14 Beale et. al., 15 Draper y Smith, 11 un análisis de correlación completo.
Garside, 16 Gorman y Toman, 17 Hocking y Leslie,1 8 Larson y Bancroft,1 9 r
Lindley, 20 Schultz y Goggans, 21 Smillie, 22 Sprent, 23 y Summerfield y x, x, Volumen de
Capacidad vital Capacidad total de espiraci6nfor:.ada
Lubin.24 (litros) los pulmones (litros) en litros por segundo
2.2 2.5 J.6
9.9 RESUMEN _ _ _ _ _ _ _ _ _ _ _ _ _ _ __ 1.5 3.2 I.0
1.6 5.0 1.4
3.4 4.4 2.6
En este capítulo se estudia la manera en que se aplican los conceptos y téc- 2.0 4.4 1.2
nicas de regresión lineal simple y análisis de correlación al caso de varia- 1.9 3.3 1.5
bles múltiples. El método de n1ínimos cuadrados para obtener la ecuación 2.2 3.2 1.6
de regresión, también- se presenta e ilustra. Asimismo, en este capítulo se 3.3 3.3 2.3
estudia el cálculo de me.dida.s descriptivas, prueba de significación y las 2.4 3.7 2.1
aplicaciones que pueden hacerse de la ecuación de regresión múltiple. Ade- .9 3.6 .7
)
Preguntas y ejercicio.~ de rcp11so 597
Regresión y con-elación múltiple )
596
Excreción
En los siguientes ejercicios efectuar el análisis indicado y probar las hipótesis a los de crealina )
niveles de significación indicados. CalcÚlar el valor p para cada prueba. (mg!día) Peso (kg) Estatura ( cm)
y X, x, )
Niño
6. La tabla anterior muestra los v.i.\ores de cierta función pulmonar observados en )
1 100 9 72
10 pacientes hospitaliz.atlos. 2 115 10 76 )
Calcular el coeficiente de correlación múltiple y probar su significación al ni- 3 52 6 59
68 )
vel de .05. 4 85 8
5 135 10 60
7. La siguiente tabla 111uestra el peso y la concentración total de colesterol y 6 58 5 58
)
triglicéridos en 15 pacientes con hiperlipoproteinemia primaria de tipo 11 justo 7 90 8 70
antes de iniciarse al tratamiento. 8 60 7 65 )

y
x,
Total de colesterol
x,
Tnºglicéridos
(mg/ 100 mi)
9
10
11
45
125
86
4
11
7
54
83
64
J )

Peso (kg) (mg / 100 mi)


12 80 7 66
76 302 139 65 6 61
13
97 336 101 8 66
14 95
83 220 57 25 5 57
15
52 300 56 125 11 81
16
70 382 113 40 5 59
17
67 379 42 95 9 71
18
75 331 84 70 6 62
19
78 332 186 10 75
20 120
70 426 164
99 399 205 9. Se 11evó a cabo un estuJio para examinar aquellas variables que se cree que
75 279 230 están relacionadas con la satisfacción en el trabajo de empleados no profesio-
78 332 186 nales de un hospital. Una 1nueslra aleatoria de 15 empleados dio los resultados
70 410 160 de la tabla siguiente.
77 389 153
76 302 139 Calif. en el
examen de Calificación , Indice
satisfacción codificada de de ajuste
en el trabajo inteligencia personal
Calcular el coeficiente de correlación múltiple y probar su significación al ni· (Y) (X,) (X,)
vel de .05. '8
54 15
8. En un estudio de la rel;1ción entre la excreción de creatinina. estatura y peso, se 37 13
30 15 1
obtuvieron los datos que se 1nuestran en la siguiente tabla a panir de 20 infan~
48 15 7
tes del sexo mascuJino.
37 10 4
a) Calcular la ecuación de rc 6,resión múltiple que describe la relación entre
37 14 2
estas variables.
31 8 3
b) Calcular R2 y efectuar un análisis de variancia.
c) Sea X1 = 10 y X = óü. Cakular el valor pronosticado de Y.
2
49
43
12
1
7
9
¡¡

l
Calif. en el Preguntas y ejercicios de repaso 599
examen de Calificación Índice
satisfacción codificada de de ajuste Calcular el coeficiente de correlación múltiple y probar su significación al
en el trabajo inteligencia personal nivel de .05.
(Y) (X,) (X,) 11, Como parte de un estudio para investigar la relación entre la tensión nerviosa y
otras variables, se reunieron los siguientes datos a partir de una muestra aleato-
12 3 ria simple de quince ejecutivos de una corporación.
30 15
37 14 2
61 14 10 Salario
31 9 Medida del N1imero de años anual
31 4 5
Medición tan1t1ñode en la posición (X 100())
del estrés (Y) la en,presa (.r 11 actual (X2) (X,) Edad (X,)
a) Calcular la ecuación de regresión múltiple que describe la relación que IOI 812 15 $30 38
existe entre estas variables. 60 334 8 20 52
b) Calcular el coeficiente de detenninación múltiple y efectuar un análisis de IO 377 5 20 27
variancia. 27 303 10 54 36
e) Sea X 1 = 10 X2 = 5. Encontrar el valor pronosticado de Y. 89 505 13 52 34
10. Investigadores clínicos obtuvieron el índice de adiposidad y los valores de glucosa 60 401 4 27 45
e insulina basales en 21 personas sanas. Los resultados se muestran en la siguiente 16 177 6 26 50
tabla. Deseaban estudiar la intensidad de la asociación entre estas variables. 184 598 9 52 60
34 412 16 34 44
Índice de Insulina basal Glucosa basal 17 127 2 28 39
adiposidad (µU I n1!) {mg/ IOOml) 78 601 8
r x, X,:
42 41
141 297 11 84 58
90 12 98 11 205 4 31 51
112 10 !03 !04 603 5 38 63
127 14 101 76 484 8 41 30
137 11 102
103 IO 90
140 38 108
!05 9 IOO a) Calcular la ecuación de regresión de mínimos cuadrados para esos datos.
92 6 IOI b) Construir la tabla de análisis de variancia y probar la hipótesis nula de no
92 8 92 relación entre las cinco variables.
96 6 91 e) Probar la hipótesis nula según la cual cada pendiente del modelo de regre·
114 9 95 sión es igual a cero.
108 9 95 d) Calcular el coeficiente de determinación múltiple y el coeficiente de corre·
160 41 117 !ación múltiple. Sea a= .05 y calcular el valor p para cada prueba.
91 ; IOI 12. En la siguiente tabla aparecen las mediciones del gasto cardiaco (Vmin) y con·
115 9 86 sumo de oxígeno (V02) para una muestra de adultos (A) y de niños (C) que
167 40 !06 participaron en un estudio diseñado para investigar las relaciones entre esas
108 9 84 variables. Las mediciones se tomaron en reposo y durante el ejercicio.
156 43 117 Considerar el gasto cardiaco como la variable independiente, utilizar un código
167 17 99 de variables imaginarias, analizar los datos mediante las técnicas de regresión
165 40 104 lineal y explicar los resultados. Elaborar una gráfica con los datos originales y
168 22 85 la ecuación de regresión ajustada.

598
Regresión y co"elación múltiple Preguntas y ejercicios de repaso 601
600 )
-Vasto To tal de potasio Total de agua
en el cuerpo en el cuerpo Sexo
cardiaco (//111i11) \'(}~ (lfMli,;) Grupo de edad )
800 10 F
4.0 .21 A
2100 26 M )
7.5 .91 e 1700 25 F
3.0 .22 e 1260 16 M
8.9 .60 A
1370 18 F
5.1 .SY e 1000 11 F
5.~ .50 A
)
1100 14 M
9.1 .99 A
1500 20 F
3.5 .23 e 1450 19 M
.51 )
7.2 A
1100 14 M
5.1 .48 e 950 12 F
6.0 .74 e 2400 26 M
5.7 .70 e 1600 24 F
14.2 1.60 A
2400 30 M
4.1 .30 e 1695 26 F
4.0 .25 e 1510 21 F
6.1 .22 A
2000 27 F
6.2 .61 e 3200 33 M
4.9 .45 e 1050 14 F
14.0 1.55 A 31 M
2600
12.9 1.11 A
3000 37 M
11.3 1.45 A
1900 25 F
5.7 .50 e 2200 30 F
15.0 1.61 A
i.1 .83 e Sea el total de potasio la variable dependiente. Emplear un código de va-
8.0 • .61 A riables imaginarias para cuantificar la variable cualitativa. Analizar los datos
8.1 .82 A mediante las técnicas de regresión y explicar los resultados. Elaborar una gráfi-
9.0 1.15 e ca con los datos originales y la ecuación de regresión ajustada.
6.1 .39 A 14. los datos que se muestran en la siguiente tabla fueron reunidos como parte de
un estudio en el q'ue los sujetos eran niños prematuros ccin bajo peso, ~acidos
en tres hospitales.
13. Una muestra aleatoria simple de individuos sanos con edades entre 6 y 18 años ~~~~~~~~~~~~~~-

Peso al Tien1po de ges- Hospital de


arrojó los siguientes datos acerca de la concentración total de potasio corporal
nacer (kg) tación (sen1anas) t1acimiento
(mEq) y volumen total de agua corporal (litros).
1.4 30 A
Total de potasio Total de agua .9 27 B
en el cuerpo en el cuerpo Sexo 1.2 33 A

13 1.1 29 e
795 M A
1.3 35
1590 16 F B
.8 27
1250 15 M A
LO 32
1680 21 M A
.7 26
(continúa)
1.2 30 e
(conlinúa)
Preguntas y ejercicios de repaso 603
602 Regresión y co"elación múllipk
---
Peso al
las relaciones entre esas variables proporcionó los siguientes datos sobre e!
Tien1po de ges- Hospital de recambio de proteínas en el cuerpo {Y) y sobre el porcentaje, ideal del peso
nacer(kg) tación (sen1a1u1s J nacimiento dada la estatura (X). El estudio fue realizado en sujetos con cáncer pulmonar y
.8 28 A controles sanos, todos de la misma edad. Seleccionar una muestra alea_toria
1.5 32 B simple de 15 pacientes de cada grupo para efectuar lo siguiente:
1.3 31 A a) Dibujar un diagrama de dispersión de los datos de la muestra. Utilizar sím-
1.4 32 e bolos diferentes para cada uno de los dos grupos.
1.5 33 B b) Utilizar un código de variables imaginarias para analizar esos datos.
1.0 27 A e) Marcar las dos rectas de regresión en el diagrama de dispersión.
1.8 35 B ¿Es posible concluir que las poblaciones muestreadas difieren con respec-
1.4 36 e to al recambio medio de proteínas cuando el porcentaje de peso ideal se toma
1.2 34 A en cuenta?
1.1 28 B ¿Es posible concluir que existe interacción entre el estado de salud y el
1.2 30 B porcentaje del peso corporal ideal?
!.O 29 e Preparar una interpretación vetbal de los resultados del análisis y com-
1.4 33 e parar los propios resultados con los que obtengan otros alumnos.
.9 28 A
!.O 28 e Pacientes con cúncer
1.9 36 B
Individuo X y Individuo X y
1.3 29 B
l. 7 35 e l. 96.2 2.52 2. 85.0 4.28
!.O 30 A 3. 89.5 3.67 4. 98.1 3.33
.9 28 A ,. 89.7 3.34 6. 84.3 3.55
1.0 31 A 7. 90.0 3.38 8. 90.9 2.54
1.6 31 B 9. 86.1 3.01 10. 103.9 1.69
1.6 33 B 11. 91.8 2.83 12. 86.1 2.44
1.7 34 B 13. 93.0 3.37 14. 98.2 2.35
1.6 35 e 15. 93.7 2.05 16. 87.4 3.52
1.2 28 A 17. 88.8 3.28 18. 96.3 2.46
1.5 30 B 19. 89.8 3.12 20. 100.0 2.32
1.8 34 B 21. 94.4 2.99 22. 92.9 2.86
1.5 34 e 23. 88.9 2.48 24. 78.8 3.88
1.2 30 A 25. 82.9 3.66 26. 86.4 3.79
1.2 32 e 27. 78.8 5.07 28. 90. l 3.19
29. 94.8 2.91 30. 93.2 3.24
Utilizar un código de variables imaginarias y las técnicas de regresión 31. 93.7 2.75 32. 88.7 3.40
múltiple para analizar estos datos. ¿Es posible concluir que las tres poblaciones 33. 83.5 3.10 34. 96.9 2.46
35. 85.6 4.05 36. 93.l 3.29
muestreadas en los hospitales difieren respecto al peso medio al nacer cuando
se toma en cuenta el tiempo de gestación? ¿Es posible concluir que existe 37. 98.4 2.44 38. 92.3 3.11
interacción entre el hospital y la etapa de gestación? Elaborar una gráfica con 39. 91.3 3.29 40. 88.5 3.50
los datos originales y la ecuación de regresión ajustada. 41. 90.0 2.28 42. 88.5 3.91
15. La pérdida de peso entre los pacientes enfennos de cáncer es un fenómeno bien 43. 98.8 2.68 44. 92.7 2.94
45. 90.l 3.:12 46. 88.7 3.62
conocido y de interés para los médicos con respecto a su función en el desarro-
llo de anonnalidades metabólicas. Una investigaCión encaminada al estudio de 47. 9-1.0 2.78 48. 84.7 3.08
Individuo X y Jndi\•iduo X y X y Individuo X y
Individuo
49. 99.2 l 7() 50. 96.2 3..~2 83.4 3.66 l3G. 93.8 3.52
135.
51. 86.2 3.50 52. 87.6 2.74 95.5 2.88 1~18. 81.3 3.89
137.
53. 89.4 3.65 54. 92.4 3.23 7X.7 4.4 l 140. 93.6 2.60
139.
55. 96.8 3.34 56. 80.6 3.68 8'.i.9 4.08 l '42. 88.5 2.98
141.
57. 79.0 3.61 58. 83.2 4.17 88.6 2.97 144. 88.0 3.07
143.

1
146. 90.8 3.74 )
59. 89.7 3.35 60. 82.6 4.17 145. 88.7 3.29
61. 91.3 4.00 62. 81.7 3.67 87.2 3.49 148. 89.8 3.33 )
14 7.
63. 90.4 2.80 64. 94.9 3.37 t! l.6 4.40 150. 92.5 3.16
149.
65. 97.9 2.64 66. 88.5 2.97 8~).9 3.52 152. 91.7 2.97
151.
67. 94.1 2.44 68. 3.26 154. 96.3 3.00
90.2 2.90 153. 90.6 \
69. 92.2 3.37 70. 80.6 4.61 98.8 2.14 156. 90.7 2.76
155.
87.4 3.46 )
71.
73.
75.
91.9
96.4
82.1
25)9
2.84
4.56
72.
74.
76.
80.9
86.6
85.6
3.58
3.81
3.56
157.
159.
95.8
88.0
93.0
3.02
4.51
3.26
158.
160.
162.
101.3
89.3
l. 75
3.47
,1 )
161.
77. 92.6 2.35 78. 96.9 3.32 4.17 164. 100.8 1.66
163. 85.0
79. 80.8 3.99 :\.99 166. 90.2 3.00
80. 82.8 3. 71 165. 87.0
2.~l8 IfiH. 95.2 2.98
81. 96.4 2.91 82. 89.0 3.46 167. 93.0
83. 87.5 3.41 84. 94.I 2.95 2.94 170. 91.4 3.47
169. 91.7
85. 94.7 2.06 86. 77.7 1.80 172. 86.4 4.34
4.61 171. 94.4 '. !,
87. 90.7 2.62 88. 174. 89.1 3.38
95.0 3.06 173. 80.7 4.62
89. 95.3 3.20 90. 92.9 2.56 175. 91.3 3.33 176. 106.2 1.06 :1 )

91. 86.2 3.28 178. 87.2 3.14


92. 94.3 2.51 177. 84.6 3.72
93. 180. 86.l 4.19
89.2 3.31 94. 82.4 4.52 179. 85.7 4.06
95. 85.4 4.46 182. 92.9 2.38
96. 92.8 3.36 181. 98.7 2.05
97. 88.0 184. 95.8 2.73
2.33 98. 88.4 3.13 183. 91.7 2.99
99. 186. 91.7 3.09
85.7 4.33 100. 89.3 2.97 "185. 86.5 3.93
101. 188. 96.9 2.59
83.8 3.98 102. 75.9 4.16 187. 94.9 2.78
103. 9 9• 190. 95.3 2.20
85.8 3.58 104. 93.8 3.39 189. 90.0 -·-!:>
105. 192. 88.2 3.20
96.3 3.05 106. 95.0 3.48 191. 93.0 2.74
194. 97.0 2.43
107. 93.9 3.52 108. 91.0 3.22 193. 90.3 3.72
196. 93.5 3.29
109; 84,3 3.63 110. 86.7 3.87 195. 97.2 2.69
198. · 85.2 3.40
111. 94.1 3.44 112. 92.7 2.78 197. 101.6 1.73
200. 95. l 2.80
113. 95.l 3.18 l 14. 86.8 3.67 199. 92.5 3.34
202. 96.1 3.01
115. 81.3 3.29 116. 93.1 2.82 20 l. 86.1 3.44
204. 92.6 3.20
117. 88.0 3.26 118. 100. l 3.04 203. 88.9 3.31
206. 91.7 3.17
119. 95.5 2.5 l 120. 94.7 3.44 205. 85.4 3.66
121. 208. 85.8 4.19
90.7 3.70 122. 97.8 2.83 207. 98.0 2.53
210. 97.l 2.00
123. 92.8 3.27 124. 88.3 3.92 209. 84.2 4.48
125. 212. 92.2 3.24
89.7 3.34 126. 78.3 3.98 211. 91.3 3.76
214. 91.l 2.85
127. 99.4 2.81 128. M6.6 2.77 213. 86.:i 3.61
129. 216. 87.4 3.57
90.6 3.01 130. 9'4.4 2.58 215. 79.5 4.77
131. 218. 97.2 2.67
102.1 1.69 132. 8~1. 7 3.07 217. 9-l.5 2.97
133. 220. 9-t.8 3.08
94.5 3.13 134. 98.4 2.57 219. 90.5 2.82

604 1 605
Individuo X y Individuo X y
Individuo X y Individuo X y
307. 87.6 3.52 308. 102.5 2.03
221. 89.4 3.50 222. 99.0 2.77 310. 96.0 l. 77
309. 85.5 2.76
223. 87.6 2.93 224. 98.3 1.90 1.41 312. 91.0 2.82
311. IO1.9
225. 92.6 2.66 226. 94.1 2.79 314. 3.91
313. 91.l 2.78 85.4
227. 92.1 3.22 228. 92.9 3.29 3.11 316. 92.7 3.03
315. 91.7
229. "96.4 1.92 230. 84.2 4.14 318.
317. 97.0 2.27 92.4 3.02
231. 91.6 3.46 232. 86.5 3.81 320. 93.7
319. 82.0 3.57 3.15
233. 97.2 2.16 234. 79.0 4.41 322. 95.5
321. 93.0 2.72 2.40
235. 90.2 3.25 236. 87.4 3.34 324. 83.0
323. 86.6 3.77 4.17
237. 95.6 2.28 238. 99.5 2.34 326. 99.4 3.02
325. 87.9 2.42
239. 90.7 2.89 240. 83.3 3.83 328. 94.0 2.69
327. 101.3 2.29
241. 85.7 3.47 242. 95.3 2.16 330. 96.0 3.34
329. 96.1 2.50
243. 96.1 2.79 244. 87.4 3.53 332. 89.5 3.08
331. 88.1 3.84
245. 93.8 3.08 246. 81.2 3.79 334. 85.8 3.55
333. 96.2 2.74
247. 92.4 2.68 248. 94.3 2.86 336. 76.4 4.87
335. 79.3 4.12
249. 82.7 3.61 250. 87.4 4.01 338. 100.9 2.75
337. 80.8 4.13
251. 85.0 3.94 252. 93.4 2.29 4.41 340. 96.8 3.29
339. 78.1
253. 81.2 3.84 254. 90.4 2.73 342. 98.7 2.91
341. 81.9 3.16
255. 92.] 2.68 256. 80.4 3.61 344. 99.8 2.08
343. 100.1 3.33
257. 90.5 3.08 258. 83.5 4.39 3.25 346. 77.5 5.19
345. 88.8
259. .94.7 2.49 260. 88.8 2.83 3.85 348. 94.5 3.26
347. 88.5
261. 89.6 3.55 262. 95.2 2.61 2.76 350. 78.2 5.19
349. 97.5
263. 93.9 2.57 264. 95.7 2.80 352. 98.1 2.22
351. 83.1 3.53
265. 94.9 2.69 266. 91.9 3.04 4.01 354. 89.8 3.74
353. 82.0
267. 88.0 3.47 268. 90.3 4.04 356. 97.9 2.30
355. 98.8 3.09
269. 91.6 2.55 270. 102.8 2.52 3.80 358. 86.9 3.37
357. 81.7
271. 96.5 2.93 272. 89.2 3.07 2.25 360. 77.8 3.72
359. 91.2
273. 98.7 2.33 274. 86.8 2.98 3.67 362. 86.2 2.00
361. 90.0
275. 84.2 3.57 276. 87.4 3.66 2.35 364. 80.7 4.25
363. 94.9
277. 87.2 3.24 278. 87.1 3.20 3.42 366. 83.3 3.50
365. 86.9
279. 85.6 3.77 280. 94.3 2.47 2.69 368. 97.6 2.51
367. 95.7
281. 92.5 2.75 282. 103.7 2.30 370. 92.9 2.44
369. 86.9 3.06
283. 91.0 3.71 284. 92.1 2.93 4.48 372. 101.3 2.25
371. 86.1
285. 81.3 3.46 286. 93.2 2.48 2.43
287. 95.0 2.76 288.
373. roo.o 2.90 374. 91.4
84.4 3.27 375. 97.7 3.12 376. 88.7 3.85
289. 95.7 3.26 290. 91.3 2.72 378. 92.5 2.85
377. 91.0 2.49
291. 96.5 2.43 292. 84.0 3.83 380. 92.6 3.19
379. 102.0 2.49
293. 99.2 2.11 294. 93.0 2.65 3.17 382. 93.9 3.50
38 l. 97.7
295. 94.3 2.51 296. 89.8 3.45 384. 82.4 3.86
383. 85.6 3.29
297. 89.0 2.76 298. 88.0 2.81 386. 81.6 4.31
385. 88.5 3.87
299. 89.3 2.73 300. 89.8 2.85 388. 98.2 2.93
387. 83.5 4.55
301. 86.5 3.03 302. 96.4 2.14 390. 98.6 2.31
389. 95.3 2.91
303. 95.2 2.54 304. 92.3 4.09 392. 90.3 2.07
391. 91.4 3.16
305. 86.3 2.69 306. 96.0 2.55

607
606
Individuo X y Individuo X y y
Individuo X Individuo X y
393. 102.4 2.00 394. 86.6 3.53 479. 95.0 2.63 480. 89.6 2.80
395. 86.7 3.94 396. 89.1 2.66 481. 96.3 2.93 482. 87.8 3.67 )
397. 82.7 4.33 398. 85.l 3.22 483. 89.7 3.29 484. 90.1 2.98
399. 100.9 2. 71 400. 107. 7 1.44 485. 86.8 3.52 486. 90.7 3.06 )
401. 87.3 3.63 402. 95.0 2.99 487. 91.0 3.25 488. 100.0 2.33
1.81
)
403. 96.6 3.45 404. 101.4 489. 83.0 3. 71 490. 90.1 3.59
405. 97.9 2.99 406. 90.6 4.09 491. 84.1 3.93 492. 95.4 2.70 )
407. 93.3 3.09 408. 92.5 3.64 493. 93.0 3.38 494. 89.1 3.31
409. 86.5 3.73 410. 96.5 2.12
)
495. 91.3 3.18 496. 94.6 2.82
411. 88.9 3.28 412. 98.2 2.43 497. 92.2 3.03 498. 95.3 2.28 )
413. 92.2 2.67 414. 86.5 3.36 499. 86.2 3.90 500. 91.9 3.27
415. 91.0 4.15 416. 84.1 3.21
)
50 l. 95.1 2.94 502. 87.2 3.48
417. 96.2 2.11 418. 90.7 3.63 503. 90.2 2.97 504. 88.2 3.41 )
419. 90.4 3.03 420. 82.0 3.14 505. 89.8 3.18 506. 91.l 3.61
421. 3.90 )
88.6 3.57 422. 89.6 507. 94.3 2.36 508. 83.3 3.71
1
423. SI.O 3.66 424. 107.7 112 509. 91.l 3.06 510. 95.3 2.51 1 )
425. 102.2 2.29 426. 86.6 3.78 511. 94.6 3.22 512. 84.0 4.15
427. 87.8 4.10 428. 80.8 3.89 •
)
513. 92.1 2.75 514. 87.8 3.52
429. 97.8 2.17 430. 98.2 2.57 515. 86.4 3.70 516. 89.8 3.48 '' )
431. 86.9 2.93 432. 95.9 I.96 517. 91.9 2.92 518. 89.8 3.22 ..
' :1
433. 91.1 2.47 434. 78.2 4.97 )
519. 90.4 2. 71 520. 89.3 3.08 ¡ :1
435. 80.7 4.27 436. 83.8 3.47 X9.4 :l.46 522. 91.4 3.42
521. . '
437. 96.3 4.08 438. 94.8 2.59 523. 90.9 :1.13 524. 95.4 3.00
)
439.
441.
443.
82.7
94.9
100.2
4.31
2.84
1.97
440.
442.
444.
90.2
94.0
97.5
3.82
2.44
2.37
525.
527.
529.
86.3
90.4
83.5
3.81
3.39
:1.89
526.
528.
!J30.
85.1
98.4
83.'.i
:l.86
2.25
:l.27
:1 )

445. 90.1 3.97 446. 88.9 3.08 5'.11. ~12.9 2.76 532. 85.7 3.'.i3
447. 90.6 3.53 448. 88.7 3.52 87.8 3.'.il 534. 88.0 3.74
5'.i'.i.
449. 86.3 3.58 450. 97.3 2.31 2.!l2 S'.ifi. 100.5 2.07

,
535. 90.5 1
451. 88.8 3.62 452. 87.9 3.61 92...1 3.28 :,:18. 82.4 :~.80
5:17.
453. 89.5 3.60 454. 96.3 2.30 92.0 3.17 540. !13.2 3.14 )
539. :1
455. 88.1 3.80 456. 92.7 2.92 91i.7 2.76 542. 8fl.7 :t72 1
5-11. )
457. 90.6 3.29 458. 90.8 3.64 543. !16.6 l.9fi }}44. 95.ti 2.6E1
459. 100.9 2.69 460. 94.2 3.08 92.4 '.tl:iO '.146. ~14.fi 2.97 1 1
:l-t'.J.
461. 95.4 3.64 462. 89.4 3.31 97.fi 2.00 :>-tH. !l'.t2 2.90
.:':i47.
463. 87.2 3.77 464. 86.6 3.24 84.7 :1.8'.1 550. 99.5 2.75
549.
465. 92.5 2.55 466. 93.5 3.43 81).9 '.-L21i :,52. 93A 2.61
5.'.i l.
467. 92. l 3.06 468. 94.2 2.92 8(i.5 3.72 554. 92.fl 3.42
55'.~.
469. 96.7 2.52 470. 90.5 2.79 9'.i.5 3.28 556. 86.3 3.86
."15:í.
471. 90.2 3.72 472. 93.6 2.86 87.0 :i:,8. 9'.i.fi 2.78
5:',7. 3.45
4:i3. 88.8 3.25 474. 90.6 3.20 :i:-,!,. 91.8 2.:17 .::'i60. 91.0 3.59
4i3. 93.9 3.41 476. 92.7 3.47 93.:', 2.7~1 89.9 3.31
;"11:i 1. !11i2.
477. 84.2 3.40 4i8. 94.Y 2.97 85.2 '.i.58
!)ii3. 8·t.O :1.7 J 564.

608 609
h1dividuo X y Individuo X y
y Individuo X y
individuo X
51. l l'l.4 1.36 52. 104.J 2.49
93.I 'l.29 :,!>6. 88.8 3.li:i 54. 99.6
565. 5:1. 111.l 1.86 2.57
567. Hfi.ti :t85 568. 90.I :1.41 1.99 56. 107.7 2.10
55. 105.3
569. 9:t:J 2.90 :)70. 98.:l 2.:{0 2.25 58. 104.5
57. 103.9 2.56
571. 88.2 3.42 572. 89.4 3.18 2.20 60. 104.4 2.01
59. 109.0
57:t 91.--t '.\.45 574. 99.0 2.:18 10:"J.9 2.12 62. 103.6 2.4fi
61.
:'>75. X7.H '.t81 :,76. 79.!, 4.66 103.9 2.13 64. 98.5 2.75
6'.i.
577. 90.[, '.L'.t:J 57X. 85.4 3.98 1.99 66. 108.8 1.67
65. 107.7
579. 102.3 2.0:t 580. 9'.1.li 2.48 107.0 I.95 68. 106.0 2.:!8
fi7.
;)81. 92.0 2.:)'.J 582. 90.9 2.9-1 107.I 1.95 70. 110.8 1.76
69.
583. 84.0 :J.68 58-1. 90.6 2.64 102.1 2.23 72. 10:t2 2.23
7 l.
585. 86.0 :1.90 !186. !l 1.8 :-J.07 2.23 74. 10:t:} 2.87
73. JO'.L3
587. 89.4 '.{.08 588. 86. I 3.06 107.8 1.79 76. 106.8 2.10
7:1.
589. 95.:I 2.49 77. 106.6 l. 74 7H. IOfi.4 2.39
79. 10:1.0 2.31 80. 106.7 1.9!)
Hl. 10:"i.'.{ 2.31 H2. 103.5 2.53
Individuos sa11os 8'.t 109.6 1.29 H4. 107.3 l. 78
y Individuo X y 8:i. 110.8 1.80 86. 104.2 2.4:i
Individuo X
H7. 1011.4 2.64 HH. 105.9 2.4--t
l. 105.5 1.74 2. !IHi.O 2.:u1 90. 110.1 1.7:J
89. 109.0 1.79
'.-\. I o:s.H 2.:JH 4. 10 l. 7 2.:17 92. 106.0 1.62
9 l. 108.5 l.70
r,. 104.0 1.94 ti. 110.!I l. 70 l..l4. 107.2 2.50
9'.J. 104.2 2.31
7. 102..:J 2.18 8. 10:1.:-i 2.2.~, 101).7 l .kfi
!-/;), 109.J 1.H7 90.
9. 100.3 2.35 lll. 104.H 1.9:l 98. I flfi. !I 1.87
!J7. 108.fi 1.71
11. 106.0 2.63 12. 109.9 l. 75 100. 105.5 2.14
99. 106.5 2.18
13. 103.1 2.18 14. IOG.ti 2.28 2.()4 102. 102.1 2.52
101. 105.4
15. 105.0 1.89 16. 107.2 1.41 104. 104.1 2.49
103. 102.2 2.44
17. 104.6 2.10 18. I()l..l.O 1.81 106. 102.3 2.42
105. 100.4 2.91
19. 107.2 I.93 20. 106.9 2.35 108. 110.7 1.53
107. 110.2 2.13
101.8 2.65 22. 107.8 2.39 I I O. 104.3 2.22
2 l. 109. 105.4 1.95
23. 103.4 3.05 24. 10-1.2 2.60 112. 106.7 2.11
111. 106.I I.93
25. 103.5 2.51 26. 107.H I.91 114. 108.5 l. 73
113. 105.5 2.30
27. 106.7 2.03 21t 106.9 1.92. 116. 105.7 2.29
115. 102.4 2.49
29. 107.4 2.28 :10. 11 1.::i 1.81 118. 102.6 2.11
117. 101. I 2.67
1.97 ::i2. 109.:-, l.55 2.47
3 l. 109.6 119. 11 o.o 2.29 120. 104.9
33. 103.5 2.70 34. 106. i 1.91 122. 104.4 2.21
12 I. 108.0 l. 71
35. 110.8 1.62 36. 105.H 2.0ti 124. 104.0 2.02
123. 109.0 2.IH
37. 103.8 2.20 38. IOü.:", 2.69 106.3 I.89
125. 106.I 1.79 126.
39. 105.5 J.96 40. 10-1.'../. 2.24 128. 106.1 1.90
127. 106.H 2.21
41. 104.5 I.99 42. 102.:1 2.21 109.1 2.03
129. 109.0 I.60 130.
43. 104.8 2.41 44. IOH.8 2.21i 109.I l. 78
131. 107.9 l. 72 132.
110.;i i.9H
45.
47.
105.8
103.8
2.63
J.52
4ti.
48. 104."i
.,___,,-, 1'.i3. 107.2 2.15 134. 105.7
105.5
2.18
2.01
1:15. 103.5 2.32 136.
49. 107.3 1.99 5(). IOH.9 2.14

611
610
)
1
lndú·iduo X y Individuo X y Individuo X y Individuo X y

137. 108.6 2.02 138. 102.I 2.37 223. 101. 7 2.48 224. 101.7 2.61
139. 97.3 2.83 140. 107.0 1.90 225. 104.2 2.48 226. 103.2 2.46 )
14 J. 105.2 2.56 142. 106.4 2.00 227. 100.7 2.77 228. 107.5 2.07
143. 105.3 2.46 144. 103.3 2.52 229. 107.3 1.83 230. 109.1 1.36 )
145. 110.2 1.41 146. 103.0 2.05 231. 105.8 2.31 232. 105.9 2.20
)
147. 103.4 2.28 148. 104. I 2.44 233. 107.9 1.84 234. 103.4 2.16
149. 110.5 1.65 150. 110.5 1.55 235. 107.5 2.09 236. 103.4 2.46 )
151. 101.7 2.86 152. 101.3 2.05 237. 108.7 1.91 238. 103.0 2.11
)
153. 104.8 2.05 154. 108.8 2.04 239. 106.1 1.92 240. 103.9 2.40
155. 106.0 2.07 156. 105.2 1.67 241. 104.5 1.90 242. 108.3 1.88
157. 100.0 2.64 158. 109.4 2.09 243. 107.8 2.31 244. 104.5 2.34
)
159. 107.7 1.88 160. 104.5 2.86 245. 107.7 2.04 246. 103.1 2.44
161. 108.0 1.54 162. 104.9 2.02 247. 106.7 1.89 248. 106.7 2.00 )
163. 106.4 1.92 164. 105.0 1.73 249. 98.8 3.02 250. 107.0 1.58
104.2 2.54
1
165. 105.5 2.09 166. 103.5 2.32 251. 106.6 2.07 252.
167. 107. 7 2.20 168. 109.3 2.08 253. 105.8 2.10 254. 109.9 1.82 )
169. !07.7 1.79 170. 109.3 l. 73 255. 110.9 1.36 256. 108.3 1.58
)
171. 105.9 1.92 172. 106.7 1.77 257. 107.5 1.84 258. 100.8 2.45
173. 109.2 2.20 174. 103.5 2.42 259. 110.5 1.66 260. 105.1 2.47 )
175. 102.6 2.31 176. 108.4 1.83 261. 104.7 2.62 262. 103.8 2.50
)
177. 110.7 1.84 178. 107.9 l. 71 263. 103.1 1.98 264. 106. l 2.31
179. 105.~l 2.05 180. 104.5 2.28 265. 104.5 2.53 266. 108.0 1.72
181. 101.7 2.42 182. 108.5 2.10 267. 111.2 1.33 268. 104.0 2.18
183. 113.2 1.07 184. 104.9 2.55 269. 102.7 2.45 270. 109.0 1.76
185. 107.0 2.01 186. 103.3 2.25 271. 106.7 1.87 272. 107.5 1.81
187. 109.9 2.01 • · 188. 109.3 1.98 273. 104.3 2.43 274. 101.4 2.66
1
189. 102.6 2.01 190. 100.4 2.66 275. 107.8 2.02 276. 100.8 2.26
191. 109.8 1.66 192. 106.7 1.98 277. 110.4 1.89 278. 107.0 1.54 )
193. 108.9 1.82 194. 109.0 1.72 279. 104.0 2.11 280. 109.7 l.65
)
195. 106.8 l.92 196. 99.7 2.88 281. 108.8 2.03 282. 114. l 1.49
197. 109.5 1.43 198. 101.4 2.42 283. 108.3 1.93 284. 105.0 2.00 )
199. 110. l l.i6 200. 103.9 2.2i 285. 105.7 2.93 286. 106.3 2.10
201. 102.3 2.41 202. IOi.O 2.0i 287. 106.4 1.52 288. 109.4 2.05
203. 108.5 2.40 204. 102.1 2.il 289. 109.2 1.66 290. 104.3 2.10
205. 103.5 2.23 206. 103.5 2.57 29 l. 104.3 1.96 292. 107.8 2.42
207. 103.2 2.58 208. 104.5 2.13 293. 101.5 2.02 294. 99.7 2.77
209. 108.0 1.82 210. 108.2 1.98 295. 100.4 2.34 296. 105.2 1.76
211. 107.5 2.23 212. 102.4 2.43 297. 107.l 2.58 298. 104.4 2.52
213. 103.4 2.29 214. 104.4 2.43 299. 105.9 2.32 300. 110.9 l.63
215. 106.4 1.84 216. 100.2 9 ••
_.J;J 30 l. 106.8 1.87 302. 105.4 2.07
217. 103.1 2.31 218. 103.6 2.23 303. 109.1 1.44 304. 105.9 1.80
219. 101.9 2.53 2!.!0. 98.4 '.a\.Oi 305. 105.9 1.95 306. 104.6 2.07
221. 103.5 2.77 222. 103.:{ 2.:\5 307. 10-1.1 2.08 308. 105.5 l.83

612 613
y Individuo X y Individuo X y
Individuo X Individuo X y
395. 104.2 2.22 396. 108.3 1.69
309. 102.6 2.37 3!0. !03.0 2.18
397. 107.2 2.04 398. 106.4 1.94
311. 104.7 2.39 312. !09.6 1.44
399. !06.0 1.90 400. 107.8 1.93
313. 109.4 l.65 314. 104.2 1.98
401. !02.3 2.32 402. 106.3 1.97
315. !09.6 1.62 316. !08.3 1.92
403. 105.8 2.27 404. 104.0 2.19
317. 102.7 2.22 318. !09.7 1.71
405. 103.2 2.06 406. 106.7 1.68
319. 101.9 2.32 320. 107.5 2.24
407. 102.3 2.23 408. 105.8 1.81
321. 101.9 2.46 322. !08.4 1.39
409. 103.2 2.14 4!0. 106.3 2.10
323. 107.7 1.71 324. !06.3 1.63
411. I I0.3 1.13 412. !08.8 1.55
325. !04.8 2.35 326. !01.4 2.36
413. 101.6 2.57 414. 110.5 1.48
327. !05.9 2.24 328. !02.0 2.39
415. 107.I 2.03 416. 104.6 2.18
329. !05.2 2.16 330. !03.5 2.29
417. 108. I 1.59 418. 104.l 2.02
331. 105.0 1.96 332. 102.6 2.18
419. !03.7 2.16 420. 106.7 1.91
333. !06.l l. 72 334. 108.0 l. 76
421. 109.9 1.44 422. 107.7 l. 76
335. !05.2 1.76 336. !06.7 2.17
423. 108.8 l. 75 424. 104.7 1.95
337. 105.7 1.55 338. 106.3 I.88
425. 110.0 l.30 426. 109.6 1.62
339. !08.0 1.43 340. !04.4 2.18
427. !03.8 2.45 428. 108.4 l.66
341. !06.1 2.02 342. !07.8 2.00
429. 101.0 2.83 430. 108.1 1.83
343. 104. l 2.48 344. 101.l 2.20
431. !06.3 2.09 432. 107.7 1.83
345. !05.4 2.19 346. !02.5 2.32
433. 105.3 l. 75 43-l. 107.5 2.12
347. 102. l 2.57 348. !06.5 2.37
435. !09.6 l.94 436. 103.8 2.48
349. !09.5 1.49 350. !03.0 2.18
437. 106.l l. 78 438. 103.8 2.17
351. 103.7 2.36 352. 99.3 2.67
439. 104.0 2.12 440. 104.2 2.21
353. 106.2 l.64 354. 105.0 2.39
441. 100.7 2.47 442. 103.6 2. l 9
355. !09.3 1.85 356. 105.8 I.91
443. 10 l. 7 2. 18 444. 109. l 1.87
357. !06.6 1.85 358. 105.5 2.02
445. 104.8 2.36 446. 109.8 l.64
359. 107.6 1.84 360. !04.l 1.87
447. 106.3 1.85 448. 105.4 2.00
361. l 12.6 1.28 362. !09.2 1.43
449. 110.7 1.84 450. 105.8 1.80
363. 105. l 2.07 364. 105.l 1.45 452. 98.9 2.93
451. !05.8 2.32
365. 105.6 2.46 366. ll0.7 1.41 454. 109.2 1.73
453. !09.9 2.02
367. !07.6 2.12 368. 104.9 1.97 456. !02.3 3.08
455. [[ 1.5 1.80
369. !04.7 2.25 370. 103.8 2.IO 458. !05.5 2.00
457. 106.8 1.89
371. !08.9 1.92 372. !04.4 2.41 106.4 2.33
459. 105.9 2.45 460.
373. 108.8 1.93 374. 104.3 2.17 107.8 2.30
461. !09.5 1.40 462.
375. 107.8 1.83 376. l 12.2 1.19 106.7 2.15
463. 101.6 3.02 464.
377. !02.2 2.54 378. 105.7 1.84 466. 111.4 l. 78
465. 106.3 2.47
379. !04.5 2.17 380. !07.3 1.32 468. 106.3 2.16
467. l l 1.0 1.7 l
381. 105.0 1.98 382. ll0.7 1.42 103.9 2.64
469. !OS.O 2.29 470.
383. 97.8 3.06 384. ll0.3 1.59 472. 105.8 1.86
471. 107.8 2.33
385. 105.7 2.02 386. 106.3 1.82 107.2 I.78
473. l l 1.3 1.54 474.
387. 104.9 2.08 388. 103.1 2.45 476. 99.7 3. l l
475. !09.5 1.68
389. 105.8 2.12 390. !02.5 2.40 478. 100.7 2.70
477. 106.l 2.31
391. !04.2 2.06 392. !05.2 2.01 108.5 1.85
479. 100.6 3.04 480.
393. !07.l 1.80 394. 106.4 2.14

614 615
)

Preguntas y ejercicios de repaso 617 )


Individuo X y Individuo X y
)
481. 106.3 1.99 482. 110.0 1.96 Individuo X y Individuo X y
2.'.21
)
483. 107.0 2.10 484. 104.8
567. 111.8 l. 77 568. 104.6 2.00
485. 110.2 1.89 486. 103.7 2.46 )
569. 104.6 2.56 570. 108.5 2.15
487. 108.1 1.97 488. 107.3 2.39
571. 104.3 2.32 572. 105.1 2.32 )
489. 107.7 1.77 490. 109.l 1.76
573. 101.1 2.90 574. 109.4 1.49
491. 104.2 2.32 492. 103.7 2.57 )
575. 111.5 1.62 576. 104. l 2.44
493. 102.l 2.74 494. 103.9 2.47
577. 107.2 2.08 578. 108.1 1.94 )
495. 95.9 3.15 496. 111.8 1.33 2.80
579. 106.8 1.92 580. 99.6
497. 107.0 2.10 498. 107.5 2.09 )
581. 105.9 2.19 582. 109.0 2.15
499. 106.0 1.99 500. 106.9 1.74 2.27
583. 103.5 2.21 584. 104.2 )
501. 103.5 1.98 502. 106.7 1.69 2.17
585. 106.8 2.11 586. 110.0
503. 106.1 2.14 504. 106.3 1.61 2.76 )
587. 99.0 2.62 588. 106.1
505. 104.9 2.30 506. 112.7 1.20 2.35
589. 109.8 2.22 590. 104.3 )
507. 109.6 2. 15 508. 105. 1 2.44 2.07
591. 103.8 2.66 592. i07.7
"509 .. 110.0 2.08 510. 110.8 1.84 2. 13 )
593. 107.2 2.07 594. 108.9
51 l. 11 I .4 1.67 512. 107.2 1.93
595. 110.8 2.05 596. 103.6 2.03 )
513. 103.9 2.25 514. 107.6 1.76
597. 106.9 2.22 598. 111.2 1.59
515. 103.8 2.02 516. 102.9 2.35 )
599. 104.0 2.44 600. 109.9 1.76
517. 107.3 1.69 518. 104.7 2.16
519. 105.I 2.15 520. 108.0 2.14 )
1.81
16. Un grupo de investigadores clínicos realizó un estudio para determinar qué fac-
521. 108.3 1.93 522. 106.1 )
111.5 1.41 tores pueden estar relacionados con enfennedades respiratorias. Los siguientes
523. 103.6 2.61 524.
2.47 datos corresponden a una población de pacientes sujetos a un tratamiento para ,1
525. 104.7 2.20 526. 106.6
107.3 1.78 el alivio de los síntomas de enfennedades respiratorias. La variable dependien-
527. 108.4 2.24 528.
108.4 2.10 te Y es una medida de 1a severidad del padecimiento. A Ínedida que el va1or
529. 105.7 2.29 530.
1.81
crece, el padecimiento es más severo. Las variables independientes son las
531. 106.9 2.15 532. 111.2
533. 110.7 1.64 534. 104.5 2.59 siguientes.
535. 105.9 2.48 536. 108.0 2.19
103.5 2.31 X = educación (máximo grado alcanzado)
537. 102.6 2.76 538. 1
539. 102.7 2.32 540. 105.9 2.14 X = medida de hacinamiento en la v.ivienda
2.53
2
541. 105.2 2.33 542. 101.2
X =. medida de la ca1idad del aire en la zona de residencia
543. 105.3 2.45 544. 105.9 2.34 3
545. 101.7 2.79 546. 105.3 2.11 (entre mayor sea el número, la calidad es menor)
547. 1a9.9 1.96 548. 104.8 2.66
X4 = estado nutriciona1 (entre mayor sea el número,
549. 96.8 3.19 550. 100.4 2.41
551. 107.5 2.07 552. 105.1 2.22 el estado nutricional es mejor)
553. 104.0 2.10 554.
556.
103.9
105.6
1.91
2.11
x, = grado de tabaquismo (O= fumador, 1 = no fumador)
555. 106.6 2.18
557. 105.9 2.48 558. 102.2 2.50 Elegir una muestra aleatoria simple de individuos a partir de esa población y
559. 100.1 2.75 560. 107.3 2.23 llevar a cabo un análisis estadístico que pueda servir al grupo de investiga-
561. 104.6 2.33 562. 106.4 1.93 dores. Preparar un infonne narrativo de los resultados y conclusiones. LTitilizar
563. 107.0 1.90 564. 107.8 1.98 gráficas en donde se considere apropiado. Comparar los resultados con los de
565. 104.4 2.87 566. 102.5 2.49 otros estudiantes. Consultar al maestro respecto a1 tamaño de la muestra que se
debe ex.traer.

616
J11dividuo y X1 X2 X3 X4 x, Individuo Y X1 X2 X3 X4 X5

X1 X2 X3 x, x, Individuo Y X 1 X2 X3 X4 Xs 83. 31 8 21 16 103 o 84. 39 8 21 32 51 O


Individuo Y 11 19 31 80 o 86. 52 12 25 45 156
85. 43
1. 40 7 25 22 94 o 2. 67 7 33 61 18 87. 60 15 28 44 175 88. 60 IO 28 52 44
3. 30 6 19 30 103 o 4. 71 15 29 50 17 89. 43 7 25 31 - 80 o 90. 64 13 25 65 50 1
5. 47 11 21 43 109 o 6. 53 10 24 54 o 91. 60 11 28 46 29 92. 34 9 12 51 27 O
7. 39 8 21 28 33 o 8. 55 14 22 35 21 93. 59 12 23 63 83 94. 46 9 28 47 12140 O
9. 47 10 26 22 76 o 10. 56 9 32 43 97 95. 51 10 27 35 42 96. 52 IO 26 39 104
11. 43 8 22 48 104 o 12. 41 8 19 27 -37 O 97. 49 11 22 47 87 o 98. 57 11 30 43 77
13. 51 9 28 32 87 1 14. 48 8 22 62 131 O 99. 51 8 26 41 44 l IOO. 61 9 32 51 58 1
15. 36 8 19 37 53 o 16. 39 7 16 53 -4 O 101. 45 8 23 37 46 o 102. 26 7 13 39 56 O
17. 55 11 26 52 183 18. 40 7 25 22 II O 103. 37 8 22 19 97 o !04. 56 9 27 33 43
19. 61 11 27 48 19 20. 41 9 22 21 59 O 105. 40 9 18 46 119 o !06. 47 11 23 52 171 O
21. 64 10 28 76 79 22. 62 11 25 79 11 107. 51 8 30 42 88 !08. 44 11 17 60 104 O
23. 37 8 20 29 85 o 24. 58 10 26 50 -48 1 109. 55 92638 5 IIO. 70 15 26 74 85
25. 52 14 22 35 75 26. 57 12 26 54 156 l 111. 54 IO 28 46 81 112. 46 9 23 51 122 O
27. 62 12 28 45 35 28. 48 11 22 36 41 O 113. 48 6 25 46 30 o 114. 82 15 35 70 34
29. 64 12 29 35 28 30. 52 8 29 30 46 115. 67 11 35 27 -17 116. 59 13 25 35 5
31. 51 10 27 33 112 32. 57 10 24 56 56 117. 41 9 25 16 29 o 118. 36 8 21 11 44 O
33. 47 11 24 32 124 o 34. 43 11 22 37 148 O 119. 58 10 31 37 75 120. 38 7 18 50 83 O
35. 48 8 25 44 70 o 36. 32 8 20 13 63 O 121. 38 10 18 39 103 o 122. 50 7 25 56 74 O
37. 48 11 25 38 118 o 38. 34 6 19 35 29 O 123. 62 IO 34 32 117 124. 53 13 23 53 114
39. 48 9 26 50 167 o 40. 52 10 27 56 118 l 125. 50 11 24 48 88 126. 46 8 23 46 63 O
41. 43 7 23 30 13 o 42. 21 4 14 33 50 O 127. 78 13 38 50 57 128. 45 7 24 41 79 O
43. 52 11 21 61 90 44. 46 8 19 55 27 O 129. 78 12 34 61 O 130. 36 8 19 25 88 O
45. 34 5 19 36 48 o 46. 34 !O 18 15 60 O 131. 46 10 23 28 46 o 132. 62 11 33 40 112 l
47. 35 8 18 25 61 o 48. 58 12 24 47 36 133. 45 i 21 54 56 o 134. 43 10 20 44 123 O
49. 54 9 29 49 153 50. 54 12 28 39 102 135. 54 12 28 18 59 136. 40 6 21 26 30 O
51. 27 5 18 16 59 o 52. 45 9 19 44 -10 O 137. 61 10 30 61 98 138. 45 9 20 41 84 O
53. 51 9 26 31 51 54. 47 8 25 39 79 O 139. 53 7 27 61 85 140. 45 IO 21 27 44 O
55. 63 11 34 37 142 56. 39 7 22 31 9 O 141. 38 6 19 33 111 o 142. 29 6 16 29 66 O
57. 62 11 33 39 133 l 58. 64 13 27 70 106 143. Si 83036 6 144. 42 8 15 56 63 O
59. 40 11 26 8 250 o 60. 50 8 25 56 73 145. 59 11 28 58 61 l 146. 51 9 33 17 136
61. 51 9 26 37 42 62. 53 14 26 25 109 147. 41 9 19 42 52 o 148. 50 12 22 45 74 O
63. 57 10 32 37 140 64. 45 10 22 41 137 O 149. 50 92423 36 o 150. 45 8 18 58 77 O
65. 42 9 18 59 64 o 66. 45 9 18 59 89 O 151. 50 10 25 54 123 o 152. 41 8 23 IO 25 O
67. 51 9 26 37 27 l 68. 31 5 22 14 63 O 153. 52 10 26 52 88 154. 44 12 28 19 144 O
69. 57 10 29 50 113 70. 41 11 20 23 85 O 155. 36 9 12 44 5 o 156. 46 10 21 36 42 O
71. 42 7 25 42 150 o 72. 58 9 26 44 10 157. 43 9 21 41 124 o 158. 48 12 19 43 -4 O
73. 28 7 15 20 o o 74. 37 7 23 33 132 O 159. 55 8275385 160. 42 10 20 20 56 O
75. 53 6 31 65 64 76. 47 10 24 21 17 O 161. 52 10 27 28 123 162. 63 10 29 63 88 l
77. 39 8 20 39 122 o 78. 56 12 28 48 115 1
163. 48 10 22 42 105 o 164. 35 !O 14 36 34 O
79. 42 8 21 35 75 o 80. 48 6 27 37 46 O 165. 62 10 35 21 70 166. 44. 7 18 52 58 O
81. 49 10 28 31 86 o 82. 50 IO 23 46 78 16i. 61 11 28 41 37 168. 53 12 25 23 63

618 619
Individuo Y X1 X2 X3 X4 x, Individuo Y X1 X2 X3 X4 Xs Individuo Y X 1 X2 X3 X4 X5 Individuo Y X1 X2 X3 X4 X5 )

10 27 30 88 o 170. 42 13 23 5 115 O 255. 63 12 30 25 -7 256. 48 9 29 23 156 O )


169. 48
7 24 43 159 o 172. 53 12 27 39 113 l 257. 52 10 22 52 36 l 258. 38 8 20 37 116 O
171. 43 )
8 22 31 50 O
173. 48 9 26 35 145 o 174. 35 7 20 37 110 O 259. 46 10 29 4 34 O 260. 38
9 33 13 44 176. 53 10 23 59 65 261. 57 11 26 38 108 262. 62 11 31 35 16 l )
175. 58
11 33 31 -5 178. 53 1! 22 48 28 l 263. 63 13 30 53 106 264. 50 7 30 16 14 O
177. 68 )
180. 67 10 28 78 59 l 265. 60 11 26 63 68 266. 41 10 24 15 91 O
179. 62 10 30 56 98
267. 65 12 32 38 24 268. 64 10 26 72 57 1-
181. 56 7 30 47 44 182. 48 10 24 33 94 O
270. 53 11 25 31 20
183. 41 6 22 29 17 o 184. 51 8 26 38 71 269. 55 8 27 47 38
)
272. 42 8 22 33 95 O
185. 47 10 28 42 179 o 186. 52 9 22 55 128 271. 55 9 32 29 56
2i4. 30 6 18 23 48 O
187. 41 9 18 53 77 o 188. 42 8 22 . 47 150 O 273. 50 11 21 43 94
55 O
)
276. 37 3 26 28
189. 49 10 22 52 75 o 190. 54 10 25 51 36 275. 54 13 23 35 60 l
10 21 34 188 O
191. 59 13 27 42 106 192. 56 11 29 52 171 277. 47 10 23 41 74 O 278. 38
29 O 279. 33 9 15 11 19 O 280. 42 10 18 35 17 O
193. 59 13 24 53 51 194. 37 8 22 5
4 O 281. 50 9 25 18 2 O 282. 42 8 24 35 65 O
195. 57 8294826 196. 50 9 20 49
118 l 283. 57 9 25 53 5 284. 31 7 17 31 26 O
197. 55 11 31 27 83 198. 60 10 30 42
96 O 285. 29 7 19 30 111 O 286. 59 10 28 47 50
199. 59 11 25 65 49 200. 49 9 23 47
288. 45 9 25 25 120 O
201. 49 12 28 22 152 o 202. 47 1! 20 54 82 O 287. 55 9 24 67 53
ll 26 56 2 289. 67 11 29 50 74 290. 51 11 21 42 40
203. 62 9284924 1 204. 63
292. 59 13 24 57 153
205. 38 7 21 36 45 o 206. 55 9 34 26 117 291. 57 12 25 50 O
35 O
207. 42 12 20 20 155 o 208. 44 10 20 24 39 O 293. 51 7 25 66 105 294. 42 10 19 29
209. 45 11 25 30 144 o 210. 63 9 30 50 64 l 295. 44 6 20 58 87 U 296. 44 10 24 25 iü u
211. 57 11 28 53 105 212. 41 10 27 22 124 O 297. 49 11 25 30 88 O 298. 49 7 31 26 130 O

89 1 299. 24 8 17 -1 137 O 300. 38 9 li '.{8 -7 O


213. 56 12 25 31 62 214. 55 11 27 54
302. 61 10 30 46 41 l
215. 44 12 22 22 104 o 216. 55 9 27 52 43 301. 48 9 20 34 -44 O
39
217. 59 10 29 57 100 218. 42 9 23 40 77 O 303. 71 13 34 51 16 304. 50 13 23 25
56 1 305. 51 9 26 60 117 306. 52 13 25 30 106
219. 57 6 33 42 80 220. 62 9 32 33
'.{08. 72 11 31 61 - 11
221. 49 10 24 19 27 o 222. 53 11 24 43 56 l 307. 43 9 22 25 68 O
223. 43 7 25 40 102 o 224. 46 10 19 28 -5 O 309. 62 10 30 56 60 310. _;s 8 .'.'l2 55 163
312. 28 9 14 23 135 O
225. 29 10 16 14 106 o ?.26. 56 9 24 53 26 31 I. 49 7 27 41 79 O
67 1
227. 47 4 25 39 -92 o 228 48 9 21 52 70 O 313. 35 8 17 39 69 O '.lH. 68 14 26 60
59 10 _27 62 89
229. 50 9 27 32 64 o 230. 65 12 32 52 41 315. 56 11 23 54 24 316.·
10 , 19 '.l9 ¡¡ u
231. 70 14 35 49 128 232. 56 9 26 70 106 317. 49 10 23 45 83 O 31 R. 40
320. 53 10 28 34 ;
233. 44 7293999 o 234. 53 10 27 55 155 319. 54 11 27 49 12:{ 1
83
322. 57 10 28 54
235. 37 8 19 32 87 o 236. 43 9 23 26 114 O 321. 47 10 20 5i 143 O
10'.l O
237. 51 238. 40 10 19 51 2 O 323. i:{ 13 31 69 60 :l24. 44 9 28 11
1! 22 51 67 1
$26. 44 12 21 28 88 O
239. 58 11 24 58 47 l 240. 70 13 36 36 124 325. 60 11 28 54 61
:l28. :,6 11 25 50 116 1
241. 36 9 17 27 69 o 242. 50 9 29 18 47 32i. .i2 10 2i 51 59
l'l 20 54 256 O
243. 58 11 28 32 -21 244. 45 9 24 10 -40 O 329. 44 9 23 22 29 O J:'\O. 39
:l:l2. 40 i 28 10 82 U
245. 41 9231139 o 246. 55 10 28 35 95 l 331. iü 12 42 19 81
21 J 15 ll
247. 52 248. 42 10 21 49 115 O. 33:l. 45 9 25 '.Hl 12.i O :,:l4. 49 1-2 25
11 28 22 19 1
249. 69 14 30 48 104 250. 62 11 27 68 55 l :ti5. 30 6 2:i i5 45 1 :tlti. 51 6 24 "'
"'··
-.,
,.
42 1

251. 42 8 23 36 61 o 252. 54 11 ,-
., 43 J 31 l :tli. :,ti 10 31 41 ~17 :,J~. -ti 7 22 6:l ()
'.{40. -1:1 9 22 20 65 O
253. 45 7 24 31 25 o 254. 40 9 21 5 48 O 3~9. 47 10 2J 40 l:,s o

:!"
620 621
1
J,uJividuo y X 1 X2 X3 X4 x, Individuo Y X1 X2 X3 X4 Xs
341. 45 6 26 39 89 o 342. 47 10 17 48 -6 o Individuo y X 1 X2 X3 X4 x, Jndi~·iduo y X 1 X2 x, X4 X5
343. 55 8 28 31 - 10 344. 64 9 33 61 47 78 l
49 132 o 346. 64 9 32 65 65
l
427. 37 7 22 18 60 o 428. 64 8 31 60
345. 39 12 15 l 77 O
7 17 32 20 o 348. 52 9 24 32 60 429. 33 5 25 12 49 o 430. 43 8 24 37
347. 34 432. 57 10 32 34 73
56 9 3:-i 29 88
349. 38 9 !O 78 117 o 350. 69 12 34 42 107 431.
42 9 22 42 84 o 434. ,_
-9 7 30 42 26
351. 43 8 25 41 !00 o 352. 62 8 34· 56 114 433.
54 12 28 17 49 436. 60 13 23 70 24
353. 75 12 36 50 95 354. 55 11 28 23 29 435.
9 24 59 102 438. 59 10 23 62 21
355. 58 9 28 75 72 356. 40 9 21 26 64 O 437. 53
62 114 358. 29 5 19 30 120 O 439. 49 14 21 29 52 o 440. 57 12 27 45 96
357. 56 7 29
45 28 360. 68 11 40 16 76 l 441. 44 9 22 '.{3 94 o 442. 52 12 22 54 101 1
359. 67 11 32 444. 50 11 24 42 54 U
443. 71 10 36 39 -8
361. 56 9 27 41 20 362. 45 9 25 26 38 O 39 9 20 21 64 O
445. 55 8 30 17 49 l 446.
363. 67 !O 29 68 34 l 364. 52 12 24 32 118 57
JO 20 38 13 o 366. 42 7 22 47 102 O 447. 49 12 2'.1 28 104 o 448. 42 8 24 26 O
365. 49 450. 39 7 21 35 33 O
449. 55 13 2·t :18 77 l
367. 35 !O 16 25 97 o 368. 57 11 28 42 58
63 104 o- 452. 57 8 29 46 100
451. 49 11 20
369. 57 12 31 34 126 370. 46 9 22 42 87 O 97 U
49 99 372. 29 9 15 31 8 O 453. 42 9 23 15 65 o 454. 40 7 23 42
371. 64 7 37 456. 40 10 15 52 54 O
455. 53 9 26 58 4--1
373. 25 7 15 3 27 o 374. 46 8 24 43 61 O
38 11-1 458. 40 8 21 31 -28 O
13 28
375. 35 9 20 9 28 o 376. 52 12 24 19 50 457. 56
55 10 29 56 lil 460. 54 11 24 ,_
-" 89
377. 51 8 23 57 76 378. 36 8 20 25 102 O 459.
-12 58 462. 53 8 27 45 83
380. 52 10 29 31 97 461. 55 9 29
379. 51 8 28 42 71 l 46_4. 51 10 24 38 45
60 8 :l2 51 2--1
381. 45 7 24 22 11 o 382. 65 12 32 43 57 l 463.
7 16 :lfi 86 () 466. 59 12 29 41 78
383. 35 5 16 30 -2 o 384. 36 6 16 42 -33 O 465. 29
30 -15 o 468. 41 11 20 32 134 O
37 8 21 19 64 o 386. 46 9 25 33 98 O 467. 49 9 26
385. 27 64 O
469. 42 9 2'.1 40 102 o 410. 41 7 21
387. 26 10 12 22 94 o 388. 77 14 34 61 48 l
4-l 1-1 l 472. 55 15 28 17 157
390. 50 9 29 32 139 O 471. 51 9 24
389. 55 11 24 59 54 () 474. 54 12 23 53 117
473. 47 8 21 -12 -58
391. 66 13 34 25 13 l 392. 64 15 28 42 109 l 6 31 43 76
27 7 12 19 59 o -176. ,i3
393. 38 7 20 45 65 o 394. 50 12 17 65 130 O 475.
9 24 74 8H -178. :io 7 14 48 47 o
50 8 25 44 80 o 396. 54 11 25 40 81 477. 57
395. (l 480. 51 11 27 14 52 l
479. 43 10 20 3H tl6
397. 51 8 24 33 18 398. 33 9 17 36 84 O 10 24 24 15
481. 42 JO 20 -17 141 o 482. 51
399. 49 10 23 44 71 o 400. 42 6 20 45 34 O
50 ,.¡ 11 --18-1. 55 11 22 50 8
39 87 o 40'2. 44 8 24 30 71 O 483. 47 7 26
401. 46 8 25 486. 42 lU 18 58 139 1)
485. 37 7 18 42 2..t ()
403. 37 6 20 43 33 o 404. 55 8 25 58 37
5:~ 97 o -188. 65 14 28 45 123 l
405. 65 10 32 64 51 l 406. 47 9 22 48 60 O 487. 37 6 19
15
407. 45 7 31 25 150 u 408. 40 9 27 5 51 O -189. 53 10 '.UJ 2H
-.,
l·Hi --190. 42 9
9
17
31
50
36 10~
"l
409. 38 8 16 50 76 u 410. 45 10 18 53 45 O -19!. 51 s :rt
··- 11 -192. 5:l
46 11 18 65
-,,
,_ IJ
49:l. 37 6 17 50 2tl> 11 494.
411. 53 13 22 42 23 412. 53 10 24 45 -8 l 8 17 38 5-l IJ
8 19 1!) 3~) 11 496. 31i
413. 53 10 26 51 108 414. 5.J 9 30 29 73 -195. 36
11 498. 30 9 24 41 58 l
497. -18 1-1 2--1 3H 1!12
415. 46 9 21 48 11 () 416. 57 ICJ 30 30 79 3~{
41 i. 58 8 30 38 17 l 418. 40 10 24 2 100 O 499. 55 9 2:i :\6 .¡ l 500. --19 H 2--1 H
"
419. 39 5 27 39 120 () 420. 46 11 22 3:1 65 O
421. 46 10 21 22 17 o 42':L 60 9 27 47 -3 1
423. 61J 11 28 60 99 l 424. 43 4 27 52 43 O
42). 44 <J 2:'> 23 "iM fJ 426. 42 ll 16 29 43 O

622 623
624 Regresión y con-elación múltiple Individuo Y X1 X2 X;. X4 /,u/ividuo }' X X: X:; X4
1
-·--- ---------
17. Suponer que se desea esludiar los factores de riesgo cardiovascular entre hom- 49. 41 129 172 60 118 50. 32 145 239 35 190
51 46 131 217 46 239 52. '.{3 129 245 43 198 )
bres adultos empleados en ocupaciones sedentarias. Para una población de
sujetos con estas características se dispone de los siguientes datos sobre las 53. 36 114 162 54 108 54. 27 141 234 28 159
J
variables que se muestran a continuación 55. 34 118 246 61 205 56. 36 114 183 51 132
57. 35 138 186 28 180 58. 22 119 245 49 110 )
59. 47 116 141 60 163 60. 38 126 207 57 178
Y= consumo de oxígeno J
61. 28 124 153 30 144 62. 26 142 227 23 179
224 42 160 64. 24 129 247 43 175 )
X1 = presión sanguínea sistólica (mm Hg) 63. 28 133
65. 37 147 276 49 223 66. 37 113 199 57 138
)
X2 = concentración total de colesterol (mg/dl) 67. 31 135 254 41 li9 68. 19 127 238 40 92
X3 = colesterol con base en lipoproteínas de alta densidad (mg/dl) 69. 34 108 154 44 170 70. 21 136 262 33 176
71. 32 133 207 36 207 72. 30 120 200 44 149
)
X4 = triglicéridos (mg/dl) 73. 33 133 231 46 213 74. 28 139 257 40 193
75. 38 131 169 40 155 76. 31 145 266 46 197 )
Extraer una muestra aleatoria simple a partir de esta población y efectuar el 165 40 221 78. :15 129 195 :18 181
77. 43 117 )
análisis estadístico apropiado. Preparar un informe narrativo de los hallazgos y 228 61 169 80. '.14 114 181 52 145
79. 31 118
comparar los resultados con los que obtengan los otros alumnos. Consuhar al 260 29 165 li2. 37 128 216 51 180 )
81. 25 155
maestro respecto al tamaño de la muestra. 83. 28 136 212 29 134 H4 30 128 222 42 176
85. 29 124 206 37 156 86. 41 111 19'.l 66 186
JndMduo Y Xi X2 X3 X4 Individuo y x, X2 X3 X4 87. 24 124 256 --1-9 111 88. 26 126 186 32 129 )
128 260 47 137 89. 34 124 195 41 167 90. 35 123 lli5 47 99
l. M 130 199 55 205 2. 22
31 132 254 53 157 91. 27 135 213 :17 123 92. :13 11 !1 J :17 30 1Ofi
3. 25 131 272 42 211 4.
142 236 45 197 93. 35 123 235 60 184 94. :l4 ]35 224 45 171
~ 37 133 212 51 154 6. 39
259 60 168 95. 32 128 IY9 42 154 96. 45 115 155 48 217 '
~ N 127 228 37 172 8. 31 132
98. 33 125 196 51 123 t )
9. 27 127 181 34 128 10. 31 133 208 36 172 97. 40 133 182 41 203
198 45 126 99. 32 134 215 44 14'.l 100. '.18 107 173 5'.1 170 )
IL 36 136 197 43 131 12. 35 133
117 200 37 190 IOL · 29 120 217 44 162 102. 24 146 270 35 165
13. 33 121 179 39 146 14. 29
148 261 41 160 103. 27 143 283 54 155 104. 411 127 217 38 158
15. 28 125 234 45 163 -16. 26
221 48 198 1()5. 42 142 209 48 176 106. 21 139 223 24 160
17. 35 137 240 51 188 18. 40 132
122 210 49 170 107. 40 114 189 55 190 108. 51 117 20fi 81 179
19. 36 134 209 44 209 20. 32 )
240 39 232 109. · 31 121 168 36 1:-\4 110. 30 134 215 42 139
21. 45 126 154 61 115 22. 32 132
111. :18 200 45 169 112. 34 131 284 fH 185 )
23. 36 113 193 46 190 24. 28 123 199 31 189 135
48 162 113. :~o 1:18 212 38 170 114. 37 123 2111 50 181'
25. 19 112 227 37 154 26. 43 136 186
211 38 201 115. 26 130 259 47 158 Jlfi. 34 Jlfi 21Y 62 152
27. 40 136 196 47 159 28. 37 139
240 47 168 117. 41 120 179 51 148 118. :12 143 26Y -15 165 )
29. 36 137 234 48 180 30. 35 141
166 119. 43 126 175 58 164 120. 28 127 264 G-1 t:10
31. 38 116 149 51 111 32. 32 130 240 50 )
173 49 138 121. 29 · 147 252 '.18 213 122. :-\3 1:12 248 -12 177
33. 28 162 296 41 194 34. 38 113
35. 48 l 25 109 44 185 36. 31 135 _,
29• 38 158 123. 27 134 259 45 165 124. 23 125 262 47 160
44 178 125. 24 12:i 225 40 171 126. 41 127 206 .57 172
:{7. 32 135 261 51 182 38. 29 120 211
188 46 146 127. 29 123 227 38 203 128. 28 13-1 225 42 201
39. 44 145 236 55 215 40. 37 131
37 165 129. 26 125 232 55 133 J:-\O. :l2 114 231 55 IY6
41. 24 138 273 37 179 42. 29 147 251
:{2 l'.{4 248 38 133 131. 24 123 232 4:, 141 1:12. :18 130 222 43 222
-13. 125 197 41 lfi8 44. 20
11.~ 170 49 122 13'.l. 16 127 220 2:1 1:t) l:14. '.13 143 204 38 152
45. 22 133 2-13 28 IHS 46. ;15
47. '.{1 l 3fi 23H
-,,
;¡_ 211 48. '.{H 141 2:19 53 17/J

625
fndividub y X1 X2 XJ X4 huiividJ.w y X1 X2 X::i X4 Individuo Y Xi X2 x_l ,Y4 Individuo Y Xi x2 X3 X_,

137 196 31 144 J:{6. 32 108 177 47 149 221. 30 123 158 31 146 222. 44 !03 145 54 195
135. 31
35 146 223 42 178 138. 27 132 263 46 198 223. 40 132 230 48 198 224. 44 130 188 52 183
137.
33 145 212 35 158 140. 34 135 204 44 130 225. 35 117 212 48 183 226. 27 111 222 44 162
139.
25 145 230 29 175 142. 39 119 162 41 164 227. 38 133 196 45 191 228. 36 131 172 31 211
14 J.
143. 43 108 139 54 184 144. 27 138 269 48 147 229. 41 143 243 45 224 230. 30 129 246 50 180
145. 27 123 217 46 166 146. 40 117 145 52 123 231. 32 133 2!0 38 171 232. 36 121 177 42 176
147. 22 137 258 38 149 148. 30 128 2:t! 39 168 233. 37 128 177 49 144 234. '.l6 150 200 30 221
149. 41 133 229 49 226 150. '.{0 107 144 36 137 235. 33 119 151 35 151 236. 30 146 248 30 207
151. 34 111 210 60 165 .152. . 27 117 2'.14 58 1:11 237. 30 123 180 32 178 238. 37 125 225 48 236
153. 34 148 236 31 2!0 154. :{5 129 146 26 134 239. 20 137 212 27 141 240. 34 118 211 54 199
155. 29 120 225 50 154 156. 32 13'.I 211 42 156 241. 21 118 253 48 151 242. 28 124 190 47 97
157. 30 114 228 52 16'.l 158. 25 123 212 25 159 243. 40 122 182 58 157 244. 34 106 213 55 184
159. 41 113 170 47 170 IGO. 21 12!) 24--1 40 138 245. 43 116 159 49 207 246. 33 130 230 43 203
161. 30 150 230 35 166 162. 29 13i 2:11 41 151 247. 49 127 182 61 183 248. 36 127 196 50 181
163. 39 136 228 56 158 164. 40 133 lti7 41 182 249. 33 142 200 32 143 250. 29 149 265 55 132
138 211 41 148 166. 39 157 234 38 209 251. 33 117 97 22 111 252. 37 128 215 48 195
165. 34
168. 32 122 227 49 125 253. 40 129 171 34 188 254. 29 129 191 37 136
167. 33 127 201 47 155
26 127 239 45 160 255. 34 112 225 55 192 256. 27 121 157 22 8-l
169. 30 140 219 34 146 170.
144 250 48 191 257. 31 138 196 28 162 258. 33 129 l!l3 4:{ 142
171. 45 124 173 57 167 172. 37
37 123 205 61 161 259. 35 140 212 48 132 260. 22 137 254 36 177
173. 31 138 229 40 166 174.
119 162 50 163 261. 24 143 271 31 188 262. 33 121.i 194 41 183-
175. 32 134 192 29 185 176. 40
39 133 221 56 155 263. 32 124 207 42 186 264. 29 140 184 23 163
177. 27 133 237 42 159 178.
133 177 45 199 265. 35 132 172 32 121 266. 43 143 216 57 159
179. 30 128 132 29 90 180. 40
117 158 25 159 267. 40 l 2H 230 62 173 26H. '.}5 131 23H 48 195
181. 27 142 287 41 196 182. 28
135 176 30 179 269. 31 155 281 36 236 270. 33 132 239 51 156
183. 38 129 161 31 196 184. 36
131 199 26 163 271. 24 123 180 24 134 272. 31 113 188 46 157
185. 41 117 216 63 177 186. 27
126 150 38 123 273. 34 125 219 60 lfi4 274. 33 127 143 30 l lfi
187. 27 124 233 42 174 188. 35
135 205 50 95 275. 28 120 169 36 136 276. 40 120 178 5'.{ (lj()
189. 31 120 162 39 152 190. 34
121 186 34 125 277. 30 139 230 29 201 278. 30 111 205 50 134
191. 18 133 215 27 96 192. 27
133 214 55 144 279. 32 148 251 3.7 207 280. 31 115 215 54 1~{2
193. 37 138 178 38 165 194. 38
114 175 54 159 281. 27 127 230 50 141 282. 39 127 lfi9 44 l5H
195. 27 124 164 31 112 196. 40
136 199 38 192 283. 37 115 133 35 124 284. 27 135 247 42 149
197. 37 128 188 41 170 198. 35
130 246 49 192 285. 30 130 225 35 221 286. 32 141 224 31 227
199. 32 118 236 63 99 200. 32
121 205 40 114 287. 30 133 232 40 193 288. 38 119 149 47 144
201. 34 142 281 48 217 202. 24
130 184 52 170 289. 38 129 185 39 184 290. 32 143 278 40 213
203. 24 136 288 36 210 204. 42
291. 37 134 181 45 150 292. 34 148 226 39 160
205. 33 123 200 54 103 206. 39 122 212 63 172
120 135 38 126 293. 33 127 211 49 142 294. 34 121 176 43 135
207. 32 124 205 43 174 208. 37
110 202 44 121 295. 33 123 233 62 120 296. 37 131 203 47 160
209. 29 140 207 24 186 210. 25
!09 190 54 133 297. 33 131 204 47 114 298. 41 137 210 51 155
21 l. 23 146 268 34 189 212. 32
146 230 29 173 299. 40 137 212 49 178 300. 26 134 201 31 129
213. 33 134 255 55 167 214. 27
120 18'.I :18 172 30 l. 35 135 217 51 154 302. 22 131 186 26 99
215. 31 117 180 45 124 216. 33
131 220 39 147 303. 17 144 277 27 144 304. 35 138 222 39 169
217. 34 129 205 45 144 218. 28
305. 26 119 195 35 !fil 306. 23 129 232 34 176
219. 37 141 239 55 164 220. 29 105 115 :JI 138

626 627
)
/11dividuo Y X1 X2 X3 X4 Individuo y X1 X2 X3 X4
Jndivid,10 Y X1 X2 X3 X4 /11dh·id,.10 y X1 X2 X3 X4
393. 28 140 22835 144 394. 45 142 250 57 260
307. 36 125 203 45 153 308. 19 129 247 39 lii2
395. 35 128 17331 145 396. 28 132 230 38 205
309. 27 123 248 49 157 310. 18 136 26G 40 118 )
397. 39 131 18241 188 398. 35 135 166 36 133
311. 32 136 210 36 158 312. 18 139 216 :11 72
399. 22 121 19741 130 400. 38 128 214 47 203 )
313. 34 119 211 45 170 314. 41 112 163 50 172
401. 18 129 20530 142 402. 21 121 268 47 194
315. 43 105 104 33 170 316. 33 12~i 222 .u-1 Hi5 )
403. 21 136 26044 165 404. 16 144 232 26 222
317. 35 119 159 52 115 ;\18. 26 113 157 :~o 108
319. 29 134 253 41 233 320. '..!3 149 ,,. -
_:'JI :~ l 1115
405. 26 125 23354 174 406. 18 133 268 48 175
407. 28 150 28947 204 408. 47 149 285 63 220
321. 34 123 198 51 117 322. 27 1:10 192 26 187 127 212 43 114
409. 50 120 15848 169 410. 18
323. 39 121 200 52 178 324. :l l 145 222 .~o 157 122 207 48 158
411. 44 130 19951 159 412. 29
325. 32 127 269 55 14:-S ~126. 36 156 255 46 189 105 151 50 84
413. 44 125 201 57 172 414. 27
327. 40 139 195 51 140 32M. 28 117 25:l :,o 158
416. 39 125 208 57 139
415. 38 131 212 58 151
329. 36 116 158 39 144 33tl. 42 121 212 ti3 '.t!09 136 205 37 142
417. 50 127 162 51 189 418. 31
331. 32 134 233 40 185 332. 34 112 161 '.\5 189 126 242 55 148
419. 21 137 282 37 222 420. 27
333. 29 142 198 24 160 3:1-1. 25 160 21-1 25 117
422. 33 122 176 47 124
421. 43 136 216 46 195
335. 26 135 173 23 102 336. 20 142 247 2:\ 171 134 230 29 157
423. 44 115 181 53 194 424. 13
337. 37 l 12 140 41 161 :~:~8. 45 119 162 49 197
128 249 48 ll8 426. 26 124 193 35 179
425. 24
339. 38 123 216 52 176 3-10. 38 146 257 51 201 128 269 41 197
427. 43 129 174 38 171 428. 15
341. 26 146 263 28 219 342. 31 116 186 46 143 430. 38 120 190 41 195
429. 31 139 196 40 119
343. 31 131 213 43 171 344. 41 114 228 67 209 432. 53 132 172 53 179
431. 44 127 220 55 193
345. 33 132 244 53 199 346. 39 l lG Hl4 56 193 434. 24 131 209 31 184
433. 39 122 141 31 156
347. 43 120 139 50 166 348. 21 120 229 40 129 436. 25 124 200 43 121
435. 48 128 169 45 149
349. 37 138 278 56 223 350. 40 128 160 40 135 438. 38 104 177 58 105
437. 18 114 163 33 125
351. 39 112 201 54 191 352. 27 128 232 42 136 440. 42 ll 3 202 58 209 1
439. 29 119 159 35 101
353. 40 136 222 47 182 354. 34 122 165 36 159 442. 53 113 117 49 127
441. 35 134 192 35 169
355. 38 127 139 30 153 356. 41 131 178 46 15í 444. 18 114 186 33 149
443. 31 117 231 48 181
357. 42 142 190 39 140 358. 34 124 209 50 215 446. 31 151 242 36 170 )
445. 18 134 257 38 179
359. 39 156 243 49 189 360. 28 132 257 51 175 44 115 178 55 ·154
447. 37 130 174 41 159 448.
361. 33 129 201 42 171 362. 31 136 212 37 162 450. 45 123 155 42 126
449. 26 134 206 39 155
363. 27 123 184 29 173 364. 42 134 184 61 99 26 137 221 28 194
45 l. 40 133 149 37 180 452. )
365. 36 116 189 44 181 366. 46 128 171 57 179 22 122 201 27 160
453. 34 127 144 42 126 454.
367. 39 116 121 39 126 %8. 34 122 202 49 154 )
455. 34 139 226 50 154 456. 30 160 252 36 169
369. 43 133 197 57 143 370. 37 117 213 63 169 134 205 39 182
457. 37 143 228 54 157 458. 33
371. 40 125 168 52 150 372. 37 117 186 52 182 25 153 291 32 193
459. 29 118 192 42 159 460.
373. 35 125 201 51 132 374. 31 131 229 43 163 136 205 43 177
461. 30 115 205 41 185 462. 36
375. 36 126 180 48 122 376. 37 124 216 49 JY3 117 131 46 lll
463. 20 128 237 28 160 464. 41
377. 32 132 232 46 160 378. 35 126 154 39 120 143 229 52 136
465. 39 140 223 55 202 466. 36
379. 27 146 229 27 170 380. 29 131 201 :~2 l{ií )
467. 43 148 226 56 172 468. 25 125 221 42 171
381. 30 138 246 45 184 382. 31 127 203 -15 110 144 209 42 166
469. 35 118 182 48 153 470. 36
383. 34 131 151 27 179 384. 33 131 208 -16 163 119 171 63 98
471. 36 118 195 45 180 472. 41
385. 42 109 113 47 108 386. 33 123 237 58 151 26 140 210 34 111
473. 34 135 191 39 184 474.
387. 44 142 199 48 181 388. 28 146 219 32 153 39 121 144 48 108
475. 30 117 245 46 171 476.
389. 35 136 268 52 238 390. 36 119 2(J:' 51 178 27 144 284 46 187
477. ;\9 115 197 64 130 478.
391. 38 133 192 51 174 392. 38 114 IG~ -15 189

629
628
¡
Individuo Y X1 X2 X3 X4 lr,dividuo y X¡ X2 X3 X4
Individuo y X1 Xi, X3 X4 lndiviiÍllo Y X1 X2 X3 X4
479. 26 113 168 41 106 480. 22 150 288 27 240 565. 38 145 249 44 183 566. 31 141 239 45 195
481. 25 141 217 29 168 482. 26 136 177 20 167 567. 29 131 206 45 106 568. 35 127 176 39 102
483. 45 117 210 73 149 484. 26 141 257 26 228 569. 29 133 256 47 154 570. 44 132 168 46 134
485. 38 130 201 49 188 486. 36 135 248 50 183 571. 28 129 201 41 63 572. 39 139 211 49 246
487. 28 137 207 39 165 488. 35 129 I 77 48 111 573. 38 137 238 45 241 574. 41 130 20 l 45 246
489. 27 116 186 49 98 490. 35 132 207 44 189 575. 32 136 247 40 205 576. 35 143 222 37 180
491. 33 135 262 43 203 492. 24 113 175 33 129 577. 37 122 220 56 207 578. 33 124 198 42 222
493. 30 130 238 44 158 494. 30 138 2li 29 165 579. 26 126 225 38 108 580. 34 112 200 60 139
495. 26 127 235 44 158 496. 34 146 244 38 206 581. 36 I 34 264 60 234 582. 34 131 244 54 217
497. 32 112 163 33 135 498. 38 108 125 52 136 583. 33 121 181 40 129 584. 27 107 226 48 164
499. 43 147 218 43 193 500. 42 119 208 60 179 585. 40 130 188 48 211 586. 32 137 242 49 156
501. 25 131 188 20 147 502. 34 127 215 49 156 587. 21 I 45 287 29 188 588. 31 128 183 31 119
503. 32 125 169 48 83 504. 32 135 180 31 166 589. 36 134 189 34 253 590. 34 126 188 51 95
505. 32 125 227 53 121 506. 32 132 208 42 190 591. 40 138 180 41 178 592. 33 131 248 48 180
507. 31 128 270 49 207 508. 36 133 216 50 167 593. 30 128 203 41 100 594. 43 118 159 50 185
509. 33 120 225 54 177 510. 35 127 197 49 130 595. 40 134 214 55 192 596. 36 125 194 51 113
51 l. 37 135 241 40 223 512. 31 124 159 39 96 597. 34 123 198 46 218 598. 31 126 191 43 73
513. 39 128 175 42 176 514. 31 119 242 48 209 599. 29 127 238 55 133 600. 32 126 223 49 121
515. 35 125 227 46 213 516. 29 110 198 45 150 601. 30 126 238 48 145 602. 31 118 203 48 125
517. 31 122 226 47 184 518. 30 124 217 47 144 603. 23 130 203 35 100 604. 24 120 233 44 153
519. 36 117 209 44 181 520: 44 111 121 51 104 605. 29 115 214 44 147 606. 20 120 224 30 164
521. 34 122 231 57 195 522. 32 145 268 35 230 607. 27 110 181 45 138 608. 34 147 194 30 207
523. 35 125 214 49 157 524. 29 126 175 23 152 609. 42 137 215 51 224 610. 39 130 230 .S3 192
525. 34 128 188 42 129 526. 19 136 257 25 153 611. 28 102 176 51 79 612. 41 119 201 58 158
527. 25 133 242 40 149 528. 37 133 181 36 201 613. 32 120 164 29 190 614. 34 121 266 59 289
529. 44 108 134 64 83 530. 34 130 217 41 204 615. 48 128 137 38 205 616. 27 124 206 42 65
531. 37 129 166 31 190 532. 34 108 176 52 144 617. 32 143 252 49 124 618. 39 127 206 53 169
533. 21 151 295 30 220 534. 23 140 286 37 212 619. 42 130 165 50 162 620. 40 112 182 57 201
535. 38 125 203 57 152 536. 26 132 270 54 145 62 l. 37 126 196 55 177 622. 26 148 262 39 178
537. 39 130 210 52 183 538. 39 128 201 50 218 623. 30 119 175 32 168 624. 27 116 230 51 175
539. 41 135 176 44 182 540. 37 121 148 40 178 625. 31 135 251 43 210 626. 31 120 191 45 161
541. 26 122 229 42 158 542. 41 112 166 54 125 627. 36 116 155 56 95 628. 39 114 170 58 115
543. 40 109 160 48 159 544. 31 128 249 54 189 629. 20 138 277 38 172 630. 27 139 273 53 153
545. 31 143 263 51 176 546. 33 137 254 52 158 631. 31 121 186 39 131 632. 37 125 192 49 194
547. 41 135 194 39 179 548. 26 142 261 33 206 633. 32 139 253 48 217 634. 34 136 177 45 89
549. 29 134 269 53 205 550. 30 119 166 41 122 635. 35 135 273 57 234 636. 22 135 278 49 132
551. 43 134 199 51 179 552. 33 117 186 53 146 637. 39 128 176 47 165 638. 45 103 109 58 82
553. 20 134 265 33 149 554. 43 124 222 69 148 639. 30 127 231 51 151 640. 35 132 180 3¡ 135
555. 29 112 198 51 127 556. 38 138 211 ·52 139 641. 34 120 195 55 119 642. 35 128 238 55 194
u~ n 1~ m D 1n = w 123 173 31 111 643. 35 132
145
184
198
35
29
230
270
644.
646.
21
36
139
160
237
243
28
32
134
213
559. 32 124 215 57 63 560. 34 119 201 42 186 645. 36
561. 38 127 175 45 198 562. 31 130 184 33 153 647. 36 122 166 46 121 648. 36 142 225 41 255
563. 41 112 156 50 128 564. 42 106 130 47 208 649. 33 122 173 33 215 650. 31 137 200 38 94

630 631
x1 x2 x_, X4 I,ulividuo y X1 X2 X3 X4 Individuo y X1 X2 X3 X4 Individuo y X1 X2 X3 X4
/11dividu.o Y
119 li8 '..\6 172 652. 40 119 !66 -l'.~ 162 737. 37 125 178 40 205 738. 25 126 240 42 158 )
651. 31
129 272 42 155 654. 35 119 187 43 189 739. 26 135 221 37 162 740. 37 132 197 47 158
653. 27 )
741. 40 124 161 50 90 742. 35 144 203 31 215
655. 35 103 109 38 71 656. 35 123 201 42 208
743. 43 123 205 56 226 744. 31 127 242 51 173 )
657. 37 !43 231 51 190 658. 32 137 215 45 171
745. 27 141 259 46 146 746. 32 115 220 55 174
659. 36 148 224 $1 240 660. 35 140 227 43 182 )
747. 33 128 231 50 153 748. 27 135 239 45 122
661. 30 !08 180 50 130 662. 30 151 191 29 91
33 129 197 41 151 750. 31 108 161 51 74 )
663. 37 112 137 47 114 664. 29 140 218 33 125 749.
22 142 204 30 49 752. 32 123 179 42 164
665. 40 137 206 43 212 666. 29 135 201 43 i8 751. )
37 130 182 43 147 754. 46 121 168 58 155
667. 28 127 206 47 120 668. 22 143 316 46 207 753.
755. 32 115 211 48 204 756. 26 132 203 39 55 )
669. 31 149 217 '.i2 137 670. 30 140 246 _'\6 157
23 129 231 40 130 758. 38 148 229 39 224
671. 39 118 220 72 218 672. 22 146 269 34 192 757.
26 129 276 54 123 760. 48 120 140 57 154
673. 29 114 191 40 119 674. 31 118 196 42 189 759.
31 125 208 45 189 762. 37 128 225 52 207 )
675. 42 144 222 55 146 676. 23 134 286 44 192 761.
763. 44 125 152 41 167 764. 29 133 211 36 88
677. 33 115 194 42 190 678. 37 131 180 37 145
)
35 103 199 54 219 766. 40 129 159 43 !18
679. 20 149 273 '..\5 161 680. 40 121 143 50 68 765.
130 259 57 221 768. 23 134 258 47 76
681. 23 147 284 37 212 682. 34 I 18 190 51 159 767. 35 )
36 122 185 44 142 770. 29 125 182 32 121
683. 27 126 254 46 187 684. 21 132 228 21 161 769.
118 185 45 152 772. 25 132 245 51 123 )
685. 35 110 126 38 92 686. 33 137 192 ~-\3 184 771. 30
29 129 195 27 208 774. 45 142 182 34 265
687. 28 142 246 3,~ 2.~2 688. 30 139 203 29 193 773.
22 152 288 27 238 776. 30 i21 242 55 160
689. 21 119 201 30 90 690. 34 124 224 44 265 775.
777. 36 139 212 47 130 778. 41 125 206 51 244
691. 33 124 210 45 207 692. 36 142 262 51 238
124 181 45 82 780. 27 131 188 35 43
693. 27 120 217 40 101 694. 30 125 204 46 158 779. 30
151 251 40 211 782. 37 128 182 54 49
695. 28 116 250 62 143 696. 35 120 205 47 168 781. 34
130 260 40 154 784. 44 99 116 57 153 )
697. 35 119 200 55 91 698. 36 108 159 41 218 783. 25
33 123 196 46 !12 786. 35 103 168 57 105
699. 26 131 237 43 110 700. 17 122 286 35 161 785.
41 133 195 56 123 788. 19 150 265 23 128
701. 20 109 212 39 115 702. 22 138 249 24 216 787.
789. 36 134 193 40 159 790. 32 123 194 44 163
703. 39 122 173 42 167 704. 25 142 224 27 193
34 133 210 43 126 792. 41 121 114 36 161
705. 43 121 144 44 197 706. 35 128 217 37 216 791. )
20 136 205 29 51 794. 25 138 268 30 232
707. 40 137 255 54 278 708. 31 128 163 26 156 793.
41 108 143 54 135 796. 34 130 213 41 238 )
709. 33 119 202 46 134 710. 29 123 228 46 184 795.
.34 148 277 58 176 798. 25 122 208 34 158
711. 34 135 235 50 207 712. 30 122 198 37 140 797.
35 134 223 52 186 800. 30 130 228 44 183
713. 37 146 239 60 126 714. 25 113 202 41 103 799.
29 135 230 47 90 802. 31 140 223 41 197
715. 32 130 269 53 205 716. 38 111 165 61 57 801.
35 I 29 266 56 284 804. 31 135 204 31 197
717. 39 132 206 55 192 718. 28 151 246 34 137 803.
22 145 274 34 156 806. 30 141 261 46 209
719. 32 136 225 43 175 720. 38 121 144 45 129 805.
130 216 44 145 808. 34 125 212 49 185
721. 25 121 245 48 181 722. 27 127 178 33 133 807. 29
723. 36 42 128 196 52 192 810. 20 136 248 39 113
123 153 35 134 724. 31 122 213 41 227 809.
120 153 41 165 812. 43 122 157 52 17i
725. 34 121 122 28 100 726. 33 130 212 46 157 811. 35
727. 41 28 144 259 48 162 814. 21 142 308 44 180
118 184 55 183 728. 34 135 240 54 120 813.
729. 31 46 125 150 54 171 816. 24 134 196 27 130
145 284 43 249 730. 38 142 193 44 182 815.
32 124 187 45 138 818. 28 136 214 39 14i
73 l. 30 132 282 64 158 732. 34 133 207 48 167 817.
34 137 205 44 164 820. 37 135 228 53 l9í
733. 33 121 202 51 187 734. 36 129 202 45 171 819.
139 205 42 187 822. 24 132 250 44 155
735. 26 123 258 51 186 736. 37 133 184 50 105 821. 40

632 633
y x, X2 X3 X4 Individuo y X1 X2 X3 X4 Jndividuo Y xI x't X:, x.1 lndividiio Y X1 X2 x~ x_.
/ndMduo
40 143 226 50 198 824. 34 121 19'J 42 192 909. 31 134 237 44 163 910. 25 129 248 38 166
823.
26 134 211 34 160 826. 30 122 240 45 196 911. 34 142 238 40 206 912. 27 126 189 37 178
825.
827. 31 129 234 47 187 828. 32 111 187 43 119 913. 36 128 199 44 158 914. 20 149 257 27 168
829. 29 118 211 41 185 830. 39 115 167 56 157 915. 34 132 192 44 144 916. 28 135 229 33 202
831. 28 112 199 44 147 832. 40 130 173 48 161 917. 36 118 187 49 170 918. 28 126 226 45 149
833. 30 133 217 49 109 834. 31 128 202 32 195 919. 28 128 239 40 206 920. 33 115 160 47 165
835. 30 137 279 52 200 836. 34 140 238 40 185 921. 39 121 171 53 152 922. 25 133 195 27 87
837. 37 129 254 57 198 838. 31 91 146 47 146 923. 37 115 205 59 125 924. 16 144 300 33 193
839. 38 136 204 40 187 840. 34 116 180 33 165 925. 32 121 213 43 165 926. 41 133 178 50 115
841. 27 130 250 38 193 842. 32 132 223 46 170 927. 34 139 180 30 150 928. 29 120 191 43 110
843. 46 124 163 56 152 844. 29 121 178 39 129 929. 40 ll l 168 54 155 930. 46 130 160 42 190
845. 32 131 270 50 223 846. 29 130 230 42 199 931. 34 132 188 41 174 932. 34 130 255 51 195
847. 35 · 134 202 39 151 848. 34 132 261 53 184 933. 27 138 241 34 182 934. 28 111 159 36 120
849. 37 139 183 39 134 850. 27 125 206 36 160 935. 16 151 272 34 ll l 936. 31 120 172 38 160
851. 34 125 206 45 209 852. 26 142 247 33 146 937. 33 . 123 243 57 207 938. 26 120 229 47 135
853. 34 124 186 43 139 854. 44 125 170 54 165 939. 35 112 104 28 108 940. 35 136 240 57 182
855. 29 127 212 48 118 856. 43 127 179 49 169 941. 33 127 168 41 107 942. 38 130 173. 44 128
857. 34 116 174 48 128 858. 44 120 181 67 147 943. 18 117 233 32 161 944. 27 127 197 33 161
859. 28 112 213 49 149 860. 25 134 218 29 149 945. 41 122 203 55 180 946. 45 124 148 51 167
861. 22 122 233 40 133 862. 42 128 164 51 162 947. 36 127 237 54 185 948. 36 120 169 56 90
863. 19 142 254 23 177 864. 26 134 244 51 123 949. 29 124 215 41 192 950. 30 127 198 35 198
865. 27 140 267 46 183 866. 41 126 201 56 167 951. 45 122 141 46 194 952. 30 127 235 44 175
867. 23 110 208 43 138 868. 41 132 201 58 136 953. 27 129 216 35 129 954. 28 131 254 44 208
27 141 259 38 158 870. 37 114 165 44 144 955. 30 127 232 44 188 956. 24 149 235 26 133
869.
871. 39 131 244 67 180 872. 30 128 274 49 195 957. 38 119 160 56 127 958. 40 133 212 46 188
873. 42 111 111 43 137 874. 32 131 271 58 203 959. 28 107 165 42 144 960. 38 127 197 52 167
875. 39 130 216 52 214 876. 25 138 272 36 234 961. 34 121 176 37 146 962. 36 127 199 41 166
877. 34 135 185 43 102 878. 42 127 166 43 169 963. 38 110 167 45 196 964. 30 l lO 181 52 100
879. 24 146 261 39 142 880. 24 121 275 53 178 965. 44 ll8 167 53 179 966. 29 136 247 48 159
881. 28 125 225 41 172 882. 39 111 206 64 175 967. 33 137 272 51 193 968. 44 120 193 54 171
883. 28 121 227 50 ll l 884. 38 110 ll8 41 94 969. 15 134 248 33 92 970. 34 159 308 47 230
885. 31 122 246 55 174 886. 21 132 197 26 164 971. 28 114 184 43 143 972. 23 125 211 39 158
887. 20 136 302 46 169 888. 32 137 274 49 219 973. 16 128 192 20 138 974. 41 128 185 51 156
889. 31 125 196 31 186 890. 31 129 183 40 146 975. 32 131 201 42 176 976. 30 142 246 50 161
891. 26 123 · 197 31 183 892. 39 ll6 127 36 137 977. 38 141 214 45 186 978. ,32 137 198 39 173
893. 49 134 203 60 211 894. 37 IIO 183 51 167 979. 33 117 188 45 156 980. 38 118 246 59 224
895. 33 137 255 49 200 896. 46 126 140 44 163 981. 38 132 159 41 132 982. 31 135 219 34 194
897. 38 143 203 41 189 898. 31 143 243 49 170 983. 24 128 235 40 160 984. 42 134 262 77 161
899. 38 124 223 51 236 900. 32 100 147 51 95 985. 35 122 195 48 168 986. 33 133 185 40 lli
901. 35 121 164 42 133 902. 38 117 253 70 201 987. 26 141 224 26 185 988. 35 135 191 39 146
903. 33 121 154 35 157 904. 28 I 18 231 47 166 989. 28 128 155 29 97 990. 24 134 217 37 93
905. 35 127 235 58 188 906. 37 134 224 53 179 . 991. 32 137 237 44 183 · 992. 23 136 213 31 113
907. 33 114 160 41 132 908. 37 120 204 54 142 993. 30 111 225 55 182 99-1. 22 137 201 27 145

635
634
636 Regresión y co"elación múltiple 637
Bibliografía )

16. M. J. GARSIDE, "The Best Sub-Set in Multiple Regression Analysis", Applied )


Individuo y x, x, X, x, Individuo y X¡ x, x, x, Statiscics, 14 (1965), 196-200.
)
995. 26 121 200 01 1:\ 1 !)!Hi 30 155 247 '.)4 17. J. W. GORMAN y R. J. TOMAN, "Selection of Variables far Fitting Equations to
149
997. 38 121 199
-,,
,_ 21H 998. 38 1-16 241) 51 190 Data", Technometrics, 8 (1966), 27-52.
999. '.l6 133 174 39 12!1 1000.
18. R. R. HOCKJNG y R. N. LESLIE, "Selection of the Best Sub-Set in Regression
'.i6 129 237 5·1 217
Analysis", Technonietrics, 9 (1967), 531-540.
19. H. J. LARSON y T. A. BANCROFT, "Sequential Model Building for Prediction in J
BIBLIOGRAFÍA Regression Analysis I", An11afs of Mathe111atical Statistics, 34 ( 1963), 462-479.
20. D. V. LINDLEY, "Toe Choice ofVariables in Multiple Regression", Journal of )
Obras citadas the Royal Statistical Society B, 30 (1968), 31-66. )
21. E. F. ScHuLTZ, JR. y J. F. GOGGANS, "A Systematic Procedure far Determining
)
l. GEORGE w. SNEDECOR y Sraristical Methods, 6.ª edi-
WJLLIAM G. CocHRAN, Potent Independent Variables in Multiple Regression and Discriminant
ción, Toe Iowa State University Press, Ames, 1967. Analysis", Agri. Exp. Sta. Bull. 336, Auburn University, 1961.
2. ROBERT G. D. STEEL y JAMES H. TüRR[E, Principies and Procedures of Statis- 22. K. W. SMJLLIE, An h1troductio11 to Regressio,i and Correfation, Academic
rics, McGraw-Hill, Nueva York, 1960. Press, Nueva York, 1966, )
3. R L. ANDERSON y T. A. BANCROFI, Statistical Theory in Research, McGraw- 23, PETER SPRENT, Models in Regressio11, Methuen, Londres, 1969. )
Hilt, Nueva York, 1952. 24. A. SLIMMERFIELD y A. LUBIN, "A Square Root Method of Selecting a Mínimum
4. MORDECAI EzEKIEL y KARL A. Fox, Methods of Correlation and Regression Set of Variables in Multiple Regression: l, The Method", Psychometrika, 16
Analysis, 3.ªedición, Wiley, Nueva York, 1963. (3): 271 (1951). )
5. M. H. DooLITTLE, "Method Employed in the Solution of Nonnal Equation and 25. WA YNE W. DANIEL, Appfied No11para111etric Statistics, 2.ª edición, PWS-Kent,
the Adjustment of a Triangulation", U.S. Coast and Geodetic Survey Report, Boston, 1989. )
1878. 26. WAYNE W. DANIEL, Nonparan,etric, Dis1ributio11-Free, a11d Robust Procedures
6. DAVID OURAND, "Joint Confidence Region for Multiple Regression Coef· in Regressio11 Analysis: A Selected Bibliography, Vanee Bibliographies, Mon-
ficients", Journal of the An1erican Statistical Association, 49 (1954), 130-146. ticello, lll., junio 1980.
7. JOHN NETER, WJLLIAM WASSERMAN y MICHAEL H. KUTNER, Applined Linear
Regression Models, 2.ª edición, Irwin, Homewood, 111., 1989. Obras complementarias
8. R. C. GEARY y C. E. V. LESER, "Significance Tesis in Muhiple Regression",
l. T. W. ANDERSON, lntroductio11 to Multi\·ariate Statistical Analysis, Wiley,
The American Statistician, 22 (febrero 1968), 20-21.
9. DAVID G. KLEINBAUM, LAWRENCE L. KUPPER y KEITH E. MuLLER, Applied Nueva York, 1958.
2. FRANK ANDREWS, JAMES MoRGAN y JOH!'I SONQL'IST. Mu/ripie Classification
Regression Analysis a11d Other Multivariable Methods, 2.ª edición, PWS-Kent,
Bastan, 1988. Analysis, Survey Research Center, Ann Arbor, Mich .• 1967.
3. WILLIAM D. BERRY y STA!'ILEY FELDMA'.'I, M11ltiple Regressio11 in Practice,
10. WJLLIAM MENDENHALL y JAMES T. McCl.AvE, A Second Course in fJusiness Sta·
Sage, Beverly Hills, Ca\if., 1985.
tistics: Regression Analysis, Dellen Publishing Company, San Francisco, 1981.
11. N. R. DRAPER y H. SMI.TH, Applied Regression Analysis, 2.ª edición, Wiley,
4. CUTHBERT DANIEL y FREO s.Wooo, Fitting Equations to Data, 2.ª edición,
Wiley-Interscience, Nueva York.1979.
Nueva York, i 981.
5. ALAN E. TRELOAR, CorrelationAnafysis, Burgess, Minneapolis.1949.
12. R. A. F1sHER, "Toe General Sampling Distribution of the Multiple Correlation
Coefficient", Proceedings of the Royal Society A, 121 (1928), 654-673.
Revistas y artículos
13. K. H. KRAMER, ''Tables for Constructing Confidence Limits on the Multiple
Correlation Coefficient", Journal of the An1erica,i Statistical Association, 58 l. G. HEITMANN y K. ÜRD. ··An lnterpretation of the Least Squares Regression
( 1963 ), 1082-1085.
Surface", Tlie A,nerican Statistician. 39 t 1985). J 20-123.
14. DAVID M. ALLEN, "Mean Square Error of Predic1ion as a Criterion for 2. R. G. NEWTON y 0. l. SPL'RRELL, "A Development of Multiple Regression for
Selecting Variables'', Technon,etrics, /3 (1971) 469-475. the Analysis of Routine Data''. Applied Statistics. 16 ( 1967). 51-64.
15. E.M. L. BEALE, M. G. KENDALL y D. W. MANN, "The Discarding of Variables 3. POTLURI RAO, .. Sorne No1es on Misspecification in Multiple Regrcssion ... The
in Multivariate Analysis", Bio111etrika. 54 ( 1967), 357-366. A111erica11 Stu1isticia11. 25 (diciembre 1971 ). 37-39.
.; _; ,,.-
638 Regresión y co"elación múltiple

4 . NEIL S. WEISS, "A Graphical Representation of the Relationships Between


Multiple Regression and Multiple Correlation", The American Sratistician, 24
(abril 1970), 25-29.
10
S. E. J. W1LLIAMS, ''The Analysis of Association Among Many Variates", Journal
of the Royal Statistical Society, 29 ( 1967), 199-242.
Distribución ji-cuadrada
y el análisis de frecuencias
Otras publicaciones

1, R. L. BOITENBERY y Y. H. WARD, JR., Applied Mu/tiple Linear Regression,


U.S. Department of Commerce, Office of TechnicaI Services, AD 413128,
1963.
2. WAYNE W. DANIEL, Ridge Regression: A Selected Bibliography, Vanee Bi-
bliographies, Monticello, 111., octubre 1980.
3. WAYNE W. DANIEL, The Use of Dummy Variables in Regression Analysis: A
Se/ected Bibliography With Annotations, Vanee Bibliographies, Monticello,
111., noviembre 1979.
4. WA YNE W. DANIEL, Outliers in Research Data: A Selected Bibliography,
Vanee Bibliographies, Monticello, 111.,julio 1980.
S. JEAN DRAPER, /nterpretation of Mu/tiple Regression Analysis Part l. Problems
of lnterpreting large Samples o/ Data, The University of Arizona, College of
Business and Public Administration, Division of Economics and Business 10.1 INTRODUCCIÓN _ _ _ _ _ _ _ _ _ _ _ __
Research, 1968.

En los capítulos en que se estudia la estimación y prueba de hipótesis se


menciona brevemente la distribución ji-cuadrada para construir interva-
los de confianza y probar hipótesis acerca de la variancia de la población.
Esta distribución, que es una de las más utilizadas en estadística, tiene usos
adicionales. Algunos de los más comunes se presentan en este capítulo jun-
to con un estudio más completo de la distribución. La siguiente sección ini-
cia con este estudio.

10.2 PROPIEDADES MATEMÁTICAS


DE LA DISTRIBUCIÓN JI-CUADRADA------

Ladistribuc iónji-cuadrada puede deducirse a partir de la distribución nor-


mal. Supóngase que a partir de una variable aleatoria Y que sigue una dis-
tribución normal, con mediaµ y variancia o 2 , se eligen muestras aleato-
rias e independientes de tamaño 11 = 1. Cada valor seleccionado puede
transforn1arse en la variable normal estándar za través de la fórmula:

)' - µ.
:: = --·--- (10.2.l)
"
639
640 Distribución ji-cuadrada y el anáüsis de frecuencias Propiedades 11rate1náticas de la distribución ji~cuadrada 641

Cada valor de z puede elevarse al cuadrado para obtener z2 • Cuando se La forma de la distribución ji-cuadrada para varios valores dek se mues-
estudia la distribución muestral de z2, se encuentra que sigue una distribu- tra en la figura 5 .9.1. En esta figura se observa que las formas para k = 1 y
ción ji-cuadrada con 1 grado de libertad. Esto es, k = 2 son muy distintas de la forma general de la distribución para k > 2. En )
x
esta figura se observa también que 2 toma valores entre O e infinito. No

'(y-µ)''
Xo> = -,,- = z
2
puede to1nar valores negativos, ya que es la suma de valores elevados al
cuadrado. Una caracterí~.tica final de la distribución ji-cuadrada que vale )
la pena notar es que la suma de dos o más variables independientes de ji-
)
Ahora supóngase que se eligen muestras aleatorias e independientes cuadrada sigue también una distribución ji-cuadrada.
En este capítulo se hace uso de la distribución_.ii:cuadr-ªQª-.p"ara probar j
de tamaño n = 2 de la población de valores de Y, que sigue una distribución
normal. Dentro de cada muestra, es posible transformar cada valor de y en _hip_~!-~.si~s:uando los datos disponibles para el análisis están en forrriidCfre- )
la variable normal estándar z y elevarla al cuadrado como se hizo anterior- .f},J.en.cias. Estos procedimientos para probar hipótesis se estudian bajo el tí-
mente. Si se suman los valores resultantes de z2 para cada muestra, puede tulo de prueba de bondad de ajuste, prueba de independencia y prueba de
designarse esta suma con ho,nogeneidad. Se pone de manifiesto que, en cierto sentido, todas las prue-
bas de ji-cuadrada que-se utilizan pueden ser consideradas como pruebas de
2 - 1·}'1 -
X(2l - cr
µ)' + ("-"2 u- µ¡2I 2
Z¡ +
,,
Z:!
bondad de ajuste con lasque se pruebaesteconceptoen las frecuencias obser-
vadas con respecto a las frecuencias que se esperarían si los datos se obtu-
vieran bajo alguna hipótesis o teoría particular. Sin embargo, se reserva la )

ya que sigue la distribución ji-cuadrada con dos grados de libertad, que es expresión .. bondad de ajuste" para utilizarla en un sentido más estricto, pues
)
el número de términos independientes elevados al cuadrado que se sumaron. se utiliza para referirse a la comparación de la distribución de una muestra
Puede repetirse el procedimiento para cualquier tamaño de muestran. con alguna distribución teórica que se supone describe a la población de la
En cada caso, la suma de los valores z2 resultantes tendrá una distribución cual se extrajo. La justificación del uso de la distribución en estas situacio-
ji-cuadrada, con n grados de libertad. En general, se tiene que nes se debe a Karl Pearson, 1.quien demostró que la distribución ji-cuadra-
da puede cn1plearse como prueba de la congruencia entre observación e
X!!(11) -= 7.!!
1
+ -:l + ... +
?~ 7.2
II
(I0.2.2) -~ipótesis siempre que los datos estén en forma de frecuencias.
Un tratamiento más extenso de la distribución ji-cuadrada se encuen-
sigue unadistribuciónji-cuadradacon n grados de libertad. La fórmula ma- tra en el libro de Lancaster. 2
temática de la distribución ji-cuadrada es la siguiente: La estadística ji-Cuadrada es más adecuada para utilizarse con..Y.aria-
--~les de clasificación como estado civil, cuyos valores son casado. soltero,
1 1 u11! •>_)- l f'-11,21 viudo y divorciado. Los datos cuantitativos que se utilizan para el cálculo
((")
k
2*:l u> o (10.2.3) de la estadíslica de prueba son frecuencias asociadas con cada una de las
12 - l 1! categorías Je una o n1ás variables incluidas en el análisis. Existen dos tipos
de frecuencias en las que se centra el interés de esta parte del libro,fre-
donde e es el número irracional 2.71828 ... y kes el número de grados de li- cuencias ohserradas y frecuencias esperadas. Las frecuencias observadas
bertad. La variable u se designa por Jo general con la letra griega ji (X) y. son el nún1ero de objetos o individuos en la muestra que caen dentro de
en consecuencia, la distribución se conoce como distribución ji-cuadrada. varias categorías de la variable de interés. Por ejemplo, si se tiene una mues-
En el capítulo 5 se menciona que la distribución ji-cuadrada se encuentra tra de 100 pacientes hospitalizados se puede observar que 50 son casados,
tabulada en la tabla F. En las siguientes secciones se mencionan otros usos 30 son solteros. 15 son viudos y 5 son divorciados. Las frecuencias espe-
de esta tabla conforme se van necesitando. radas son el número de individuos u objetos en la muestra que se esperaría
La media y la ,·ariancia de la distribución ji-cuadrada son, respectiva- observar :-.i alguna hipótesi:-. nula respecto a la variable es verdadera. Por
mente. k y 2k. El valor modal de esta distribución es k- 2 para valores de k ejemplo. la hipótesis nula puede ser que las cuatro categorías de estado ci-
mayores o iguales que 2 y cero para k = J. vil tient: igual rcprc:-.entación dentro de la población de la que se extrajo la
Distribución ji-cuadrada y el análisis de frecuencias Prueba de b"onda.d de ajuste 643
642
muestra. En ese caso se puede esperar que la muestra contenga 25 casados. 10.3 PRUEBA DE BONDAD DE A J U S T E - - - - - - - -
25 solteros, 25 viudos y 25 divorciados.
En este capítulo la estadística de prueba para probar la ji-cuadrada es Como se menciona en párrafos anteriores, una prueba de bondad de ajuste
es conveniente cuando se quiere decidir si existe incompatibilidad entre

X ,=¡<º· ¿ E,,]
2 -
(10.2.4)
las distribuciones de frecuencias observadas y alguna distribución prede·
terminada o hipotética.
Por ejemplo, podría ser necesario determinar si una muestra de valores
,, En la ecuación 10.2 .4, O ¡es la frecuencia observada para la i-ésima ca- . observados para alguna variable aleatoria es incompatible con la hipótesis
tegoría de la variable de interés, y E¡ es la frecuencia esperada (dado que de que dicha muestra se extrajo de una población de valores con distribu-
H 0 _es verdadera) para la i-ésima categoría. ción normal. El procedimiento para llegar a una decisión consiste en colo-
- ·Lacantidad X2 es una medidadel grado con el que los pares de frecuencias car los valores en categorías o intervalos de clase mutuamente excluyentes
observadas y esperadas concuerdan en una situación dada. Como se verá, y observar la frecuencia de ocurrencia de los valores en cada categoría.
la naturaleza de X2 es tal que, cuando hay una congruencia muy estrecha - Puede aplicarse entonces lo que se sabe acerca de las distribuciones nor-
entre la frecuencia observada y la esperada, el valor de X2 es muy pequeño males para determinar las frecuencias que podrían esperarse para cada ca·
y cuando la congruencia es pobre, dicho valor es muy grande. Por c.onsi- tegoría si la muestra hubiera provenido de una distribuGión normal. Si la
guiente, sólo un valor suficientemente grande de X2 causa el rechazo de la discrepancia es de tal magnitud que pudiera deberse al azar, se concluye
hipótesis nula. que la muestra puede haber sido extraída de una población con distribu-
Si hay una congruencia exacta entre las frecuencias observadas y las ción normal. De manera semejante, pueden llevarseacabopruebasdebon-
que esperan, dado que H 0 sea verdadera, el término O¡-E¡en la ecuación dad de ajuste en casos donde la distribución planteada en la hipótesis es la
10.2.4 será igual a cero para cada par de frecuencias, observada y espera- de tipo binomial, de Poisson o cualquier otra distribución. A continuación
da. Tal resultado proporciona un valor de X2 igual a cero, y no es posible se ilustra esto con más detalle mediante algunos ejemplos.
rechazar H0 .
Cuando existe incongruencia entre las frecuencias Observadas y las
esperadas, dado que H 0 es verdadera, al menos uno de los términos de Ejemplo J0.3.1 Distribución normal
O 1- E¡ de la ecuación 10.2.4 será un número diferente de cero. En general,
entre más pobre sea la congruencia entre O¡ y E¡, tales valores diferentes de Un grupo de investigadores, al llevar a cabo un estudio acerca de hospi-
cero serán _mayores, más frecuentes o ambas cosas. Como se menciona en tales en EE:.l)U ., reunió datos sp,bre u_!1a muestra de 250 hospitales. El equipo
líneas anteriores.si la congruencia entre O; y E;es lo suficiente merite pobre calcú,16.paíá cada'hospiÍÍÍJ la _tasa·de:ocupación de los pacientes admitidos,
(lo que dará como resultado un valor suficientemente grande de X2), es posi- una variable que muestra, para un periodo de 12 meses, la tasa del censo
ble rechazar H0 .
Cuando existe incongruencia entre la frecuencia observada y la espe- Tabla 10.3.1. Resultados del estudio descrito
rada, la diferencia puede ser positiva o negativa. Ello depende de cuál de en el ejemplo 10.3.1.
las dos frecuencias es la más grande. Dado que la medida de congruencia, Tasa de ocupación de pacientes Nzimero de hospitales
X2, es la suma de las cantidades que la componen, cuyas magnitudes depen- o.o a 39.9 16
den de la restaO¡-E¡, a la diferencia positiva o negativa debe adjudicársele 40.0 a 49.9 18
el mismo valor. Esto se logra elevando al cuadrado cada una de las dife- 50.0 a 59.9 22
rencias de O 1 - E¡. Al dividir las diferencias al cuadrado entre la frecuen- 60.0 a 69.9 51
70.0 a 79.9 62
cia esperada correspondiente, la cantidad se convierte en un término medi· 80.0 a 89.9 55
do en unidades originales. Lasumade estos términos, ( O¡-E¡) 2!E¡, da como 90.0 a 99.9 22
resultado X2, una estadística resumida que refleja el grado de congruencia 100.0 a 109.Y 4
global entre frecuencias observadas y esperadas. -rotal 250
Prueba de bondad de ajuste 645
644 Distribución ji-cuadrada y el análisis de frecuencias
sis nula es verdadera. La media y la desviación estándar, calculados a partir de
diario pro1nedio respecto del número promedio de camas ocupadas. La mues-
los datos agrupados Je la tabla l 0.3.1 mediante los métodos expuestos en las
tra proporcionó la distribución de las razones (expresadas como porcenta- secciones 1.7 y 1.8. son )
jes), que se muestra en la tabla 10.3.1.
Se desea saber si los datos proporcionan suficiente evidencia p.ara in- )
x- 69.91
dicar que la muestra no proviene de una población que sigue una distribu- s - 19.02 )
ción normal.
Como siguiente paso en el análisis, debe obtenerse. para cada interva-
Solución lo de clase, la frecuencia de ocurrencia de los valores que se esperarían si
1.Datos. Verla tabla 10.3.J. la hipótesis nula fuera verdadera, es decir, si, en efecto, la muestra hubiera
2. Suposiciones. Se supone que la mueslradisponible para el análisis es una mues- sido extraída de una población de valores con distribución nonnaL Para
tra aleatoria sin1ple. ello, primero se determina la frecuencia relativa esperada de ocurrencia de
3. Hipótesis. los valores para cada intervalo de clase y después se multiplican estas fre-
H 0 : en la población de la que se extrajo la muestra. la tasa de ocupación de pa- cuencias relativas esperadas pore1 número total de valores para obtener el
cientes ad1nitidos sigue una distribución normal. número de valores esperado para cada intervalo.
HA: la poblaciún muestreada no sigue una distribución normal. En la sección dedicada al estudio de la distribución normal, se aprendió
4. Estadí.Itica de prueba. La estadística de prueba es
que la frecuencia relativa de ocurrencia de los valores menores o iguales a )
algún valor especificado, porejemplox0 , de la variable aleatoria X con dis-
x' - ¿' [(O, -: E;)'] tribución normal, es igual al área bajo la curva a la izquierda de x0 • que se
1=1 E¡ representa por medio del área sombreada en la figura 10.3.1. El valor numéri- )
co de esta área se obtiene al convertir ax 0 en una variable normal estándar
S. Distribución de la e.ftadí:aica de prueba. Cuando J.i hipótesis nul.ics verdadera,
X2 sigue aproxin1adan1cntc una distribui:iónji-cuadrada con k- r grados de li-
mediante la fórmula .::0 = (x0 - µ)/<J y encontrando el valor correspondien-
ben ad. Para detenninar los grados de libertad, k es igual al número de grupos te en la tabla C. El uso de este procedimiento permite obtener las frecuen-
para los q_ue las frecuencias observadas y esperadas están disponibles. y res el cias relativas esperadas que corresponden a cada uno de los intervalos de 1
i I
número de restricciones Impuestas sobre la comparación dada. Una restricción clase de la tabla 10.3.1. Los valores deµ y <Jestiman con X y s, como se cal-
se in1ponc cuando se forza la suma de frecuent·ias esperadas para que sea igual culan a partir de los datos agrupados de la muestra. El primer paso consiste '
a la su1na de frecuencias observadas Yse agrega una restricción adicional por en obtener los valores de z correspondientes al límite inferiordecadainter- )
cada pará1netro C!itim.ido a partir de la muestra. Para un estudio más completo valo de clase. El área entre dos valores de z sucesivos dará la frecuencia
de lajustificación teórica para restar un grado de libenad por cada parámetro relativa esperada de ocurrencia de los valores para el intervalo de clase
' I'
estimado, ver el libro de Cramer. 3 correspondiente.
li'
6. Regla de deci.üón. La cantidad L[ ( 0 1- E1 )~/E1¡] será pequeña si las frecuencias
Por ejemplo, para obtener Ja frecuencia relativa esperada de ocurren- 11

observadas y las esperadas son 1nuy cercanas, y será 1nuy grande si las diferen-
cia de los valores en el intervalo de 40.0 a 49.9, se procede como sigue:
cias son 1nuy grandes.
El valor calculado de.'\'~ se compara con el valortabu\adodeji-cuadradacon
k- r grados de libertad. La regla de decisión. entonces. es: rechazar H0 si X 2 es
. X 40.0 - 69.91 •
El valor d ezcorrespond1entea = 40.0esz = _ = - 1.:J 7
mayor o igual al valor de ji-cuadrada tabulado para el que se eligió e 1,·alor a. 19 02
Si en este eje1nplo Cl= .05. se encuentra que el valor crítico Je ji-cuadrada . X 50.0 - 69.91 = -J.05
para 6 grados de litierlad es de 12.592. La regla de decisión, entonces. es: re- El valor de z correspondiente a = 50.0 es z = _
19 02
chazar H0 si el valor calculado de X~ es mayor o igual a 12.592.
7. Cálculo de la est<ulística de prueba. Puesto que la media y la variancia de la
distribución hi patética no se es pee i fican. es necesario usar los datos de la mues- En la tabla C se encuentra que el área a la izquierda de -I .05 es de .1469, Y
tra para estimarlas. Estos parámetros, o sus esti1naciones. serán necesarios para
el área a la izquierda de-1.57 es de .0582. El área entre-1.05 y -1.57 es
calcularla frecuencia que se espera pura cada intervalo de clase cuando la hipó te-
Distribución ji-cuadrada y el análisis de frecuencias Prueba de bondad de ajuste 647
646
haría bastante improbable que las frecuencias observadas y esperadas con-
cordaran perfectamente. Surge entonces la preguntade si las discrepancias
entre las frecuencias observadas y las esperadas son lo suficientemente
Figura 10.3.l. Distribución pequeñas como para pensar que pudieran haber ocurrido únicamente por
normal que muestra la fre-
cuencia relativa de la ocu-
azar, si la hipótesis nula es verdadera. Si son de tal magnitud, uno no se
rrencia de valores menores inclina a rechazar la hipótesis nula que indica que la muestra proviene de
o iguales que Xo· El área una población con distribución normal.
sombreada representa la fre- Si las discrepancias son tan grandes que no parece razonable pensar
cuencia relativa de la ocu- que pudieron haberse producido únicamente por azar, cuando la hipótesis
•, X
rrencia de valores menores
nula es verdadera, será recomendable que se rechace la hipótesis nula. El
o iguales que Xo·
criterio contra el cual se juzga si las discrepancias son "grandes" o
"pequeñas" lo proporciona la distribución ji-cuadrada.
Las frecuencias observadas y esperadas junto con cada uno de los valo-
igual .1469 - .0582::; .0887, que es igual a la frecuencia relativa esperada res (O¡-E¡) 2!E¡ se muestran en la tabla l 0.3.3. La primer entrada en la últi-
de ocurrencia de valores de la tasa de ocupación dentro del intervalo de ma columna, por ejemplo, secalculaa partirde ( 16 -14.55)2 / J 4.55 = .145.
40.0 a 49.9. Esto indica que si la hipótesis nula es verdadera, es decir, si los Los otros valores de (0¡-E¡) 2tE,. se calculan en forma similar.
valores de ocupación siguen una distribución normal, debería esperarse En la tabla 10.3.3 se observa que X2 = IC<O;- E;) 2 1 E;]= 25.854. Los
que el 8.9 por ciento de los valores en la muestra están entre 40.0 y 49.9. grados de libertad apropiados son 9 (el número de grupos o intervalos de
Cuando se multiplica el tamaño total de la muestra, 250, por .0887, se clase) -3 (para las tres restricciones: al hacer LE¡::::::: LO; y estimarµ y u a
encuentra que la frecuencia esperada para el intervalo es de 22.18. Cálcu- partir de los datos de la muestra)::::::: 6.
los similares proporcionan las frecuencias esperadas para otros intervalos,
como los que se muestran en la tabla 10.3.2. 8. Decisi611 estadística. Cuando se compara X2 = 25.854 con los Valores de ji-
Ahora, se tiene interés en examinar las magnitudes de las discrepan- cuadrada de la tabla F, se observa que es mayor que ;(~99, = 18.548, de talma-
cias entre las frecuencias observadas y las frecuencias esperadas, ya que nera que puede rechazarse la hipótesis nula que indica que la muestra proviene
se observa que los dos conjuntos de frecuencias no concuerdan. Se sabe de una población con distribución normal al nivel de significación de .005. En
que, aun cuando la muestra se extrajera de una población cuyos valores otras palabras, la probabilidad de obtener un valordeX 2 tan grande como 25.854,
siguen una distribución normal, la variabilidad del muestreo por sf sola

Tabla 10.3.2. Intervalos de clase y frecuencias esperadas para el ejemplo 10.3. l. Tabla 10.3.3. Frecuencias observadas y esperadas y (O;-E¡f I E;
Z = (X¡ -i)/s Frecuencia Frecuencia Frecuencia
En el límite inferior relativa Frecuencia observada esperada
Intervalo de clase esperada Intervalo de clase (O,J (E,J (0, -E;) 2 /E,
del intervalo esperada
<40.0 .0582 14.55" <40.0 16 14.55 .145
40.0 a 49.9 -1.57 .0887 22.18 40.0 a 49.9 18 22.18 .788
50.0 a 59.9 -1.05 .1546 38.65 50.0 .a 59.9 22 38.65 7.173
60.0 a 69.9 -.52 .1985 49.62 60.0 a 69.9 51 49.62 .038
70.0 a 79.9 .00 .2019 50.48 70.0 a 79.9 62 50.48 2.629
80.0 a 89.9 .53 .1535 38.38 80.0 a 89.9 55 38.38 7.197
90.0 a 99.9 1.06 .0875 21.88 90.0 a 99.9 22 21.88 .001
100.fi a 109.9 1.58 .0397 9.92 100.0 a 109.9 4 9.92 3.533
110.0 Y más 2.11 .0174 4.35 110.0 y más o 4.35 4.350
Total 1.0000 250.00 Total 250 250.00 25.854
Distribución ji·cuadrada y el análisis de frecuencias Prueba de bondad de ajuste 649 1
648
cuando la hipótesis nula es verdadera, es menor que 5 en 1000 (p < .005). Se Aunque hay textos que describen el uso de la ji-cuadrada para probar
decide, por lo tanto, que un evento tan poco común no se produce debido sólo la normalidad, ésta noes la más conveniente cuando la distribución plantea-
al azar (cuJndo H 0 es verdadera), por lo que se debe buscar otra explicación. La da en la hipótesis es continua. La prueba de Kolmogorov-Smimov, descri-
otra explicaci6n es que la hipótesis nula es falsa. ta en el capítulo 1l, fue diseñada especialmente para pruebas de bondad de
9. Co11c/11sió11. Se concluye que en la población muestreada las tasas de ocupación ajuste que comprenden distribuciones continuas.
de pacientes adn1itidos no sigue una distribución normal.
)
Eje,nplo 10.3.2 Distribución binomial En un estudio diseñado paradeter-
Algunas veces, los parámetros se especifican en la hipótesis nula. Debe minar la tolerancia de los pacientes a un nuevo analgésico, 100 médicos
tenerse en cuenta que si en el ejemplo 10.3.1 se hubieran especificado la seleccionaron, cada uno, una muestra de 25 pacientes para participar en el
media y la variancia de la población como parte de la hipótesis nula, no se estudio. Cada paciente, después de haber tomado el nuevo analgésico
)
hubieran tenido que estimar a partir de la muestra y los grados de libertad durante un periodo especificado, fue interrogado para saber si prefería éste
hubieran sido 9 - l :::: 8. o el que había tomado regularmente con anterioridad.
Si los parámetros se estiman a partir de datos no agrupados de la mues- Los resultados del estudio se muestran en la tabla 10.3.4.
tra en lugar de estimarlos de datos agrupados como en el ejemplo, es posi- El interés consiste en determinar si estos datos son compatibles con la
ble que ladistribuci6ndeX2 presente diferencias significativas con respec- hipótesis de que se extrajeron de una población que sigue una distribución
to a la distribución ji-cuadrada como para arrojar res u hados satisfactorios. binomial. Una vez más, se utiliza la prueba ji-cuadrada de la bondad de
Este problema se analiza en Dahiya y Gurland 4 y en Watson. 5 - 7 El mismo ajuste.
problema se encuentra cuando los parámetros se estiman independiente-
mente de la muestra, como lo estudia Chase .8 Solución Puesto que el pará1netro binomial, p, no está especificado, éste
debe estimarse a partir de los datos de la muestra. Un total de 500 pacientes
Frecuencias esperadas pequeñas. Muchas veces, al aplicar la pruebaji- de los 2500 que participaron en el estudio dijeron que preferían el nuevo
cuadrada, la frecuencia esperada para una o más categorías es pequeña, aca- analgésico, de modo que la estimación puntual dep es f.,= 500/2500= .20.
so mucho menores que 1. En los libros que tratan este tema se señala, la )
mayoría de las veces, que la aproximación de X2 a ji-cuadrada no es estric-
tamente válida cuando algunas de las frecuencias esperadas son pequeñas.
Sin embargo, existe una controversia entre los autores respecto a qué mag- Tabla 10.3.4. Resultados del estudio descrito en el eiernolo 10.3.2.
nitud de las frecuencias es permisible antes de hacer algún ajuste o aban- Número de pacientes Número total
donar la ji-cuadrada en favor de alguna otra prueba alternativa. Algunos que prefieren Número de médicos de pacientes
autores, especialmente los primeros que abordarón el tema, sugieren lhni- el nuevo que reportan que prefieren
analgésico esta c(fra el nuevo analgésico
tes inferiores de 1O, mientras que otros sugieren que todas las frecuencias
º
esperadas no deben ser menores que 5. Cochran, 9 •1 quien escribió a prin- o 5 o
cipios de la década de 1950, sugiere que, para las pruebas de bondad de ajuste 1 6 6
2 8 16
de distribuciones unimodales (como la normal), la frecuencia mínima espe- 10 30
3
rada puede ser tan pequeña como 1. Si en la práctica se encuentran una o más 4 JO 40
frecuencias esperadas menores que 1, pueden combinarse categorías adya- 5 15 75
6 17 L02
centes para lograr el mínimo requerido. La combinación reduce el número 70
7 10
de categorías y, por Jo tanto, el número de grados de libertad. Parece que las 8 JO 80
sugerencias de Cochran han sido seguidas por casi todos los profesionales 9 9 81
en los últimos años. Investigaciones más recientes acerca del tema de las 10 o más o o
1
frecuencias esperadas pequeñas comprenden las de Roscoe y Byars, 1 Total 100 500
Yarnold, 12 Tate y Hye.r, 13 Slakter1 4 .1s y Lewontin y Felsenstein. 16
Distribución ji-cuadrada y el análisis de frecuencias 1 Prueba de bondad de ajuste 651
650
Tabla 10.3.5. Cálculos para el ejemplo 10.3.2. fabla 10.3.6. Número de admisiones de emergencia en cierto hospital durante
Número un periodo de 90 días
Núniero de médicos Adn1isiones Admisiones Admisiones Adn1isio11es
de pacientes que reportan es.a Frecuencia Frecuencia de emergencia Día
Día de emergencia Día de emerxencia Día de emergencia
que prefieren cifra (frecue11c1a relativa esperada
el nuevo analgésico observada, O¡) esperada E, J. 2 24. 5 47. 4 70. 3
2. 3 25. 3 48. 2 71. 5
o .0038 ·38 } 2.74
1
i} 11 .0236 2.36 3.
4.
4
5
26.
27.
2
4
49.
50.
2
3
72.
73.
4
1
8 .0708 7 .08
2 5. 3 28. 4 51. 4 74. 1
10 .1358 13.58
3 6. 2 29. 3 52. 2 75. 6
10 .1867 18.67
4 7. 3 30. 5 53. 3 76. 3
.1960 19.fiO
5 15
.1633 16.33 8. o 31. 1 54. 1 77. 3
6 17 9. 1 32. 3 55. 2 78. 5
.1109 11.09
7 10
.0623 6.23 10. o 33. 2 56. 3 79. 2
8 10 1 J. 1 34. 4 57. 2 80. 1
.0295 2.95
9 9
1.73 12. o 35. 2 58. 5 81. 7
10 o más o .0173
13. 6 36. 5 59. 2 82. 7
1.0000 100.00 14. 4 37, o 60. 7 83, 1
Total 100 15. 4 38. 6 61. 8 84. 5
16. 4 39. 4 62. 3 85. 1
Pueden obtenerse las frecuencias relativas esperadas al evaluar la función 17. 3 40, 4 63. 1 86. 4
18. 4 4 J. 5 64. 3 87. 4
binomial 19. 3 42. 1 65. 1 88, 9
20. 3 43. 3 66. o 89. 2
_(2s).2",8,,_,
f(x) -
21.
22.
3
4
44.
45.
1
2
67.
68. 231 90. 3
X
23. 3 46. 3 69.

para x = 0, 1, ... , 25. ·Por ejemplo, para calcular la probabilidad de que en


una muestra de 25 pacientes ninguno de ellos prefiere el nuevo analgési-
co, cuando en· la población total la porción área! de los que lo prefieren es Tabla 10.3. 7. Resumen de los datos presentados
de .2, se cal cu! a como en la rabia 10.3.6.
Número de días
Número de
[(O) - (
2;).2º.8 25
-
0 admisiones de emergencia
en un día
en que se presentó
ese número de admisiones
de emergencia
o 5
Esto se puede hacer más fácihnente al consultar la tabla A, donde se obser- 1 14
va que P(X = 0)::: .0038. La frecuencia relativa de ocurrencia de muestras 2 15
3 23
de tamaño 25 en las que ningún paciente prefiere el nuevo analgésico 4 16
es de.0038. Para obtener la frecuencia esperada correspondiente, se mul- 5 9
tiplica .0038 por 100 para obtener .38. Cálculos semejantes proporcionan 6 3
las frecuencias esperadas restantes que,junto con las frecuencias obser- 7 3
8 1
vadas, se muestran en la tabla 10.3.5. En esta tabla se observa que la pri- 9 1
mera frecuenciaesperada es menor que J, de modo que se sigue la sugerencia 10 o más o
de Cochran y se combina este grupo con el segundo. Cuando se hace esto,
Total 90
todas las frecuencias esperadas son mayores a J.
652 Distribución ji-cuadrada y el análisis de frecuencias Prueba de bondad de ajuste 653
A partir de los datos, se calcula la ecuación 3 .4.1 para cada valor de la columna de la izquierda de la tabla
10.3. 7. Por ejemplo. la primera frecuencia relativa esperada se obtiene al
(11 - 2.74) 2
_ (8 - 7.08) 2 ' . . • (O - 1.73) 2
2 47.624 calcular
X - 2.74 + 7.08 + + 1.73
)
e-330
f(O) 1
Los grados de libertad apropiados son 1O (el número de grupos que O!
quedan después de combinar los dos primeros) menos 2 = 8. Se pierde un )
grado de libertad porque el total de las frecuencias esperadas se forza a ser En la tabla B del Apéndice I -se encuentra ésta y todas las demás frecuen- )
igual que las diferencias totales observadas y se sacrifica un grado de li- cias relativas esperadas necesarias. Cada una de las frecuencias relativas
bertad porque se estima p a partir de los datos de la muestra. esperadas se muhiplica por90 para obtener las frecuencias esperadas corres-
Se compaía la X2 calculada con la ji-cuadrada con 8 grados de libertad pondientes. Estos valores. junto con las frecuencias observadas y espe-
y se encuentra que es significativa a un nivel de .005. Se rechaza la hipóte- radas y los componentes de X2 , ( 0 1- E;)2/ E¡, aparecen en la tabla 10.3.8.
sis nula que indica que los datos provinieron de una distribución binomial. En la tabla 10.3.8 se observa que

Ejemplo 10.3.3 Distribución de Poisson El administrador de un hospi- .\2 ~ '-'[(O, - E,)' 1 ~ (5 - 4.50) 2 (2 - 1.08) 2 )
,t.¡ EI J
1 4 ·o + ... + 1.08
3.664
tal desea probar la hipótesis nula de que las admisiones en la sala de urgen- '1: • .)
)
cias siguen una distribución de Poisson con A= 3. Suponer que durante un Ta111bién se observa que las tres últimas frecuencias esperadas son
periodo de 90 días el número de admisiones de urgencia fue como se mues- menores que 1, <le tal manera que deben combinarse para evitar tener fre-
tra en la tabla 10.3.6.
cuencias esperadas menores que 1. Esto significa que se tienen sólo nueve
Los datos de la 10.3.6 se resumen en la tabla 10.3.7.
categorías efectiv_as para calcular los grados de libertad. Dado que se especi-
ficó el par,ln1etro. A, en la hipótesis nula, no se pierde un grado de libertad
Solución Para obtener las frecuencias esperadas, se obtienen primero las
por razones de estimación, de modo que los grados de libertad apropiados
frecuencias relativas esperadas al calcular la función de Poisson dada por
son 9- 1 = 8. Al consultarla tabla F del Apéndice I. se encuentra que el va-
lor crítico de ji-cuadrada para 8 grados de libertad y a= .05 es de 15.507,
de mane.raque no puede rechazarse la hipótesis nula al nivel de signifi-
Tabla 10.3.8. Frecuencias observadas y esperadas y componentes de X2 para el cación de .05 o cualquier otro nivel de significación razonable (p > .1 O). Se
ejemplo 10.3.3.
concluye. por tanto. que las admisiones de urgencia en este hospital pueden
Número Número de días Frecuencia seguir una distribución de Poisson con A= 3. Al menos, los datós observa-
de admisiones en que ocurrió relativa Frecuencia ((>- - E,/
de emergencia ese número, O; esperada esperada E, dos no arrojan duda alguna sobre dicha hipótesis.
o 5 .050 4.50 .056 Eje,nplo 10.3.4 Se piensa que cierto rasgo humano es heredado de acuer-
1 14 .149 13.41 .026
do a la razón de 1:1: l para homócigo dominante, heterócigo y homócigo
2 15 .224 20.16 1.321
3 23 .224 20.16 .400 recesi\'O. El exan1en de una muestra aleatoria simple de 200 individuos pro-
4 16 .168 15.12 .051 porcionó la siguiente distribución del rasgo: dominante, 43: heterócigo.
5 9 .101 9.09 .UOI 125. y re1.·t•si \'O, 31. Se desea saber si los datos proporcionan suficiente e\·i-
6 3 .050 4.50 .500
7 3 .022 1.98 .525 dencia para cancelar dudas sobre la distribución del rasgo.
8 .008 .72}
9
10 o más l} 2
.003
.001
.2i 1.08
.09
.i84 Solución
l. Daros. \'cr el enunciado del ejemplo.
Tolal 90 1.000 90.00 '.~.664 2. Sup11sicio111's. Se supone que los datos cun1plen con los requcri1nien\os para la
apli,:aL·iún J.: l..1 prueba de bondad Je ajusic de ji-cuadrada.
Distribución ji-cuadrada y el análisis de frecuencia:r Ejercicios 655
654
3. Hipótesis. 10.3.2 Se reunieron Jo5 siguientes datos de 300 niñas de ocho años de edad. Pro-
Ho: El rasgo se distribuye de acuerdo a la razón l :2: 1 para homócigo domi- bar, a un nivel de significación de .05. Ia hipótesis nula que indica que los
nante, heterócigo y homócigo recesivo. datos se extrajeron de una población con distribución normal. Utilizar
HA: El rasgo no se distribuye de acuerdo a la razón 1:2: l. los ,nétodos del capítulo I para calcular la media y desviación estándar de
4. Estadística de prueba. La estadística de prueba es la 111ucstra a partir de los datos agrupados.

L[(O ~ EJ
2
Estatura Frecuencia
X2 - ]
en centír11etros observada

114all5.9 5
S. Distribución de fa estadística de prueba. Si H 0 es verdadera, X 2 sigue una dis- JO
116 a 117.9
tribución ji-cuadrada con 2 grados de libertad. 118a119.9 14
6. Regla de decisión. Supóngase que la probabilidad de cometer un error de tipo 120 a 121.9 21
I es de .05. Rechazar H0 si el valor calculado de X2 es mayor o igual que 5.99 J. 122 a 123.9 30
7. Cálculo de la estadística de prueba. Si H 0 es verdadera, la frecuencia espera- 124a 125.9 40
126 a 127.9 45
da para las tres manifestaciones del rasgo es de 50, 100 y 50 para dominante, 128 a 129.9 43
hetcrócigo y recesivo, respectivamente. Consecuentemente 130a 131.9 42
132 a 133.9 30
X'= (43 - 50)'/50 + (125 - 100)2/100 + (32 - 50) 2 /50 - 13.71 134 a 135.9 11
136 a 137.9 5
138a 139.9 4
8. Dec;siá11 estadística. Puesto que 13.71 > 5.991, se recháza H 0.
9. Co11clusió11. Se concluye que el rasgo no se distribuye de acuerdo a la razón 300
1:2: l. Dudo que 13.71 > 10.597, el valor p para la prueba es p < .005.
10.3.3 La carátula de los expedientes de p~cicntcs internados en un departamen-
to de salud contiene 10 datos. Una muestra de 100 expedientes reveló la
EJERCICIOS~~~~~~~~~~~~~~~~- siguiente distribución de datos erróneos.

10.3.1 La siguiente tabla muestra la distribución de las mediciones de ácido úri-


co en 250 pacientes. Probar la bondad de ajuste de estós datos a una dis- N1ill1erode
datos erróneos Nún1ero de expedientes
tribución normal conµ= 5.74y O= 2.01. Sea a= .01.
o 8
1 25
Detertr1inació11 Frecuencia z 32
de ácido 1irico observada 3 24
4 10
<I 5 o más 1
I a 1.99 5
2 a 2.99 15 100
3 a 3.99 24
4 a 4.99 43
5 a 5.99 50
6 a 6.99 45 Prohar la bondad del ajuste de cs1os datos con la distribución binomial con
7 a i.99 30 p = .10. Eni.:ontrar el valor p para esta prueba.
8 a 8.99 22
'· ! 9 a 9.99 10 10.3.4 Durante los últimos IO años. el 1nédico encargado de lac línica de emplea-
10 o más 5 dos Je una gran empresa industrial observó la siguiente distribución de
Total 250 tlCl·itlentcs.
656 Dis_tribución ji..cuadrada y el análisis de frecuencias Prueba de independencia 657

Núniero de accidentes Número de nreses en que ¿Es posible concluir a partir de estos datos que, dentro de la población mues-
en un 1nes ocurrió este núnrero treada, las opiniones no se distribuyen equitativamente en los cuatro nive-
les de concordancia? La probabilidad de cometer el error de tipo I es de .05.
o 2
1
2
10
15
Calcular el valor p.
'
3 30
4 28 10.4 PRUEBA DE INDEPENDENCIA---------
5 15
6 10
7 6 Otro uso, quizá el más frecuente, de la distribución ji-cuadrada es el de pro-
8 2 bar la hipótesis nula que indica que dos criterios de clasificación son inde-
9 pendientes cuando se aplican al mismo conjunto de entidades. Se dice que
IO o más
dos criterios de clasificación son independientes si la distribución de un
!~O criterio es la misma, sin importar cuál sea la distribución del otro. Por ejem-
plo, si el estado socioeconómicó y área de residencia de los habitantes de
¿Son estos datos compatibles con la hipótesis de que los accidentes en esta
cierta ciudad son independientes, se esperaría encontrar la misma propor-
empresa siguen una distribución de Poisson con A= 4 '.'¿_Cuáles el valor de
p para esta prueba?
ción de familias en los grupos socioeconómicos bajo, medio y alto en todas
las áreas de la ciudad.
10.3.5 Los siguientes números representan las cantidades de un organisn10 par- La clasificación de un conjunto de entidades, de acuerdo con dos cri-
ticular encontradas en 100 muestras de agua de un estanque. terios, por ejemplo personas, se representa mediante una tabla en laque los
rrenglones representan los di versos niveles de uno de los criterios de clasi·
Nú1nero de orga11is111os
por nu,estra Frecuencia ficación, y las e columnas representan los di versos niveles del segundocri·
terio. Dicha tabla se conoce generalmente como tabla de contingencia. En
o 15
la tabla l 0.4.1 se muestra la clasificación de una población finita de enti·
1 30
2 2.1 dades de acuerdo con dos criterios.
3 !!{) Se tiene interés en probar la hipótesis nula según la cual, en la pobla-
4 5 ción, los dos criterios de clasificación son independientes. Si se rechaza la
5 4
6 1 hipótesis, se concluye que los dos criterios de clasificación no ~on inde-
7 o pendientes. Se extrae una muestra de tamaño n de la población de entidades '
y la frecuencia de ocurrencia de las entidades en la muestra, que corres·
]()()

Probar !a hipótesis nula que indica que es1os datos fueron extraídos de una Tabla 10.4.1. Clasificación bilateral de una población finita
distribución de Poisson. Determinar el valor de p para esta prueba. Segundo Primer nivel del criterio
nivel de clasificaci6n
10.3.6 Un grupo de investigadores área] izó una encuesta entre indi \'Íduos adul- de criterio
tos con afición por el tabaco. A cada indiYiduo de la muestra. compuesta de clasificación 1 2 3 e Total
por 200 sujetos se le pidió que indicara ha~.ta qué punto estaba de acuerdo N,.
1 N,. N., Nu N"
con el siguiente enunciado: .. :-.1e gustaría dejar de fumar·· 2 N,. N,, N,, N,.
N"
Respuesta: 3 N,. N,, N,, N,. N,.
¡
De acuerdo De acuerdo En dc~acucrdo Desacuer<lo total N,.
T N., N., N., N"
totaln1entc
:,.lúmero N.• N
Total N., N., N.,
de respuestas: 102 :au 60 X
658 Distribución ji-cuadrada y el análisis de frecuencias Prueba de úidependencia
659
Tabla 10.4.l. Clasificación bilateral de una muestra de entidades Solución
Seg11ndo Primer nivel del criterio
nivel de de clasificación 1. Datos. Ver la tabla l 0.4.3.
criterio de
clasificación 1 2 3
2. Suposiciones. Se supone que la muestra disponible para el análisis es una mues-
e Total
--- tra aleatoria simple extraída de la población de interés.
1 n., 3. Hipótesis
2 n:11
n12
n2:1
n1:,i
112:-1
n"
n2,
"•
n2 H0 : El tipo sanguíneo y la severidad de la afección son independientes.
3 1l:,¡ ¡ n:n R3:j ll:1, n, HA: Las dos variables no son independientes.
Seaa=.05.
n,, n,, n.,
' n,:i n,
4. Estadística de prueba. La estadística de prueba es
Total n, n, 11_:,¡ n, n

X' - Í: [(O, -: E,)'¡
ponde a las casillas formadas por la intersección de los renglones y colum-
•=J E,
nas de la tabla 10.4.1 junto con los totales marginales, se muestran en la
tabla 10.4.2. S. Distribución de la estadística de prueba. Cuando f/0 es verdadera.X::! sigue una
Para cada celda se calculan las frecuencias esperadas bajo la hipótesis distrihución aproxin1ada de _ji-cuadrada con (r- 1)( e- 1} = (3 - J )(4 - l) = (2)
nula de que los dos criterios de clasificación son independientes. Se com- (3) = 6 grados de lihertad.
paran las frecuencias esperadas y observadas. Si la discrepancia es sufi- 6. Regla de decij,·ión. Se rechaza H0 si el valor de X2 es mayor o igual que l 2.592.
cientemente "pequeña", puede sostenerse la hipótesis nula. Si la discrepan- 7. Cálculo de la estadlstica de prueba. El primer paso en el análisis es obtener,
para cada celda., la frecuencia que se pudiera esperar si, en efecto, los dos cri-
cia es suficienten1ente "grande". se rechaza la hipótesis nula y se concluye
terios de e lasi ficación fucran independientes. El primer paso es calcular las esti-
que lo:$ dos criterios de clasificación no son independientes. La decisión de
n1aciones de las diversas probabilidades marginales a partir de los totales mar-
si la discrepancia entre las frecuencias observadas y esperadas es suficien- ginales que se muestran en la tabla 10.4.3. La estimación de la probabilidad de
temente "grande" o "pequeña" se toma con base en la magnitud de la canti- que una persona seleccionada al azar de la población de la cual se extrajo la
dad calculada cuando se utiliza la ecuación 10.3.1, donde O¡ y E¡ se refieren muestra no tenga la afección es de J 320/ l 500 = .88; la probabilidad de que el
respectivamente a las frecuencias observadas y esperadas de las celdas de la individuo extraído al azar tenga una afección moderada es de 105/1500 = .07;
tabla 10.4.2. Sería más lógico designar a las frecuencias observadas y espe- y la probabilidad de que una persona seleccionada al azar tenga una forma de
radas en estas celdas como Oij y Er, pero para conservar la sencillez de la afección severa es de 7511500 = .05. De manera similar, las probabilidades
notación y evitar la introducción di
otra fórmula, se utiliza la notación más de que una persona seleccionada al azar de la población bajo estudio tenga san-
sencilla. Resultará útil pensar en las celdas como si estuvieran numeradas gre tipo A, 8, AB y O son de 615/1500= .41, 242/1500= .16, 105/1500= .07 y
desde 1 hasta k, donde I se refiere a la celda 11 y ka la celda re. Es posible 538/ l 500 = .36, respectivamente.
demostrar que laX2definida de esta f arma está distribuida aproximadamente
como una ji-cuadrada con (r- 1) (e- 1) grados de libertad cuando la hipóte-
sis nula es verdadera. Si el valor calculado X2 es mayor que el valor tabula-
Tabla 10.4.3. Mil quinientos individuos clasificados según la severidad de su
do de ji-cuadrada para alguna a., se rechaza la hipótesis nula al nivel de sig- condición y tipo de sangre
nificación a. El procedimiento se ilustra con el ejemplo siguiente.
Severidad
Tipo de sangre
Ejemplo 10.4.1 Un grupo de investigadores, al estudiar la relación entre de la condición A B AB o Total
el tipo sanguíneo y la severidad de una afección en la población, reunió los Ausente 543 211 90 476 1320
datos de 1500 personas, los cuales se presentan en la tabla de contingencia Moderada 44 22 8 31 105
10.4.3. Los investigadores desean saber si estos datos son compatibles con Severa 28 9 7 31 75
la hipótesis de que el grado de la afección y el tipo sanguíneo son inde- Total 615 242 105 538 1500
pendientes.
)
Prueba de independencia. 661
660 Distribución ji-cuadrada y el a11álisis de frecue11cias )
E:-.to conduce al procedin1iento simpl icado para obtener las frecuencias )
En el capítulo 2 (ver la ecuación 2.6.4) se describe que, si dos eventos esperadas de las celdas, dividiendo el producto de los totales marginales
son independientes, la probabilidad de que ocurran conjuntamente es igual correspondiente entre el tamaño total de la muestra. Como otro ejemplo, )
al producto de sus probabilidades individuales. Según la hipótesis nula, nótese que el número esperado de personas que no tienen la afección y tienen )
que indica que el tipo sanguíneo y la severidad de la afección son inde- sangre tipo Bes de (242)( 1320)/ l 500 = 212.96. Las frecuencias observadas
pendientes, se calcularía entonces la probabilidad estimada de que una per- )
y esperadas para el ejemplo ilustrativo se muestran en la tabla 10.4.4, donde
sona seleccionada al azar no tenga. por ejemplo, la afección y tenga sangre las frecuencias esperadas están entre paréntesis. )
tipo A como sigue: A partir de las frecuencias esperadas y observadas es posible calcular í
P(sin la afección n sangre tipo A)= P(sin la afección) P (sangre tipo A) )

1:1:!IJ t>L.',
X' = L[(O, ~. E,) 2
] )
= ooi · 'Gim
= .:HJOH (543 - 541.2) 2 (211 - 212.96) 2 2
+ ... + (31 - 26.90)
La probabilidad calculada es la estimación de la probabilidad de que una 541.2 + 212.96 26.90
persona seleccionada al azar caiga en la primera celda de la tabla 10.4.3 = .005987 + .o 18039 + · · · + .624907
cuando la hipótesis nula es verdadera. La estimación de la probabilidad de = 5.12
qu.e una persona seleccionada al azar no tenga la afección y tenga sangre
1
tipo Bes de
8. Decisión estadística. No se rechaza H 0 porque 5.12 no es:?: 12.592. Cuando se
1.·1~~1 !.'!!.' compara el valor calculado de X 2 = 5.12 con los valores tabulados de ji-cuadra-
l'.\00 • 1,;mi . l-1197:~ da con 6 grados de libertad y a= .05, se aprecia que X2 no es significativo en l

cualquier ni ve\ razonable. Por ejemplo, el valor crítico de ji-cuadrada para a=


.1 O y 6 grados de libertad es 10.645.
Las probabilidades estimadas asociadas con cada u nade las celdas restantes 9. Co11cl11sió11. Se concluye que posiblemente H 0 es verdadera. Estos datos son
se calcula de igual forma. compatibles con la hipótesis de que el grado de la afección y el tipo sanguíneo
Después de calcular las probabilidades estimadas asociadas con cada son independientes. AI menos estos datos, debido a la íntima concordancia entre
celda, las frecuencias esperadas cor.respondientes se obtienen multipli- las frecuencias observadas y esperadas. no proporcionan evidencia suficiente J
cando la probabilidad de cada celda por 1500, que es el tamaño total de la que indi-quc una falta de independenciaentreloscriterios de clasificación, debido
muestra. Por ejemplo, la frecuencia esperada para la primera celda es de aque5.12< 10.645,p>.10. '
(.3608)( 1500) = 541.2 y el número esperado de personas que no tengan la '
afección y tengan sangre tipo Bes de (.141973)( 1500) = 212. 96. Grados de libertad El lector identificará que el número de grados de li-
Al calcular las frecuencias esperadas, puede aplicarse una simplifi- bertad es igual al número de frecuencias de celdas en 1a tabla 10.4.3 que
cación que ahorra bastante tiempo. Es importante observar que la frecuencia pudieran llenarse de.manera arbitraria mientras se mantengan los totales
esperada para la primera celda puede expresarse como marginales observados. Por ejemplo, dado que 1320personas no tienen la
afección y que 543 de éstos tienen sangre tipo A, 211 tienen sangre tipo B
'
)
P(sin afección n sangre tipo A)( 1500) = 1
~i
::
1 1 1
1
• /'.,:;;', • 1SO() y 90 tienen sangre tipo AB, deben tenerse 4 76 con sangre tipo O. Esto pro-
duce 3 grados de libertad. Al aplicar la misma lógica al segundo renglón, '
Uno de los denominadores t500se si1nplifica con el 1500 del numerador, se encuentra que sólo pueden llenarse arbitrariamente tres celdas, lo que
dando como resultado da tres grados de libertad más. Cuando se intenta llenar las celdas del ter-
cer renglón, se encuentra que estas frecuencias están ya determinadas por
(l:t?O)(til5) las frecuencias de los primeros renglones y, por lo tanto, el total de grados
:== ;'111 ~()
J;)OO de libertad es de 6.
Distrib11ción fi-cuadrada y el análisis de frecuencias Prueba de ü,depe11dencia 663
662
Tabla t0.4.4. Frecuencias observadas y esperadas del ejemplo 10.4.1.
Tabla 10.4.S. Estado de nutrición y desempeño
académico de 500 niños de una escuela primaria
Tipo de sangre Estado de nutrición
Severidad de Dese111peño
la condición A B AB o Total académico Malo Bueno Total
Ausente 543(541.2) 211(212.96) 90(92.40) 476(473.44) 1320 Malo 105 15 120
Moderada 44( 43.05) 22(16.94) 8(7.35) 31(37.66) 105 Satisfactorio 80 300 380
Severa 28(30.75) 9(12.10) 7(5.25) 31(26.90) 75
315 500
Total 615 242 105 538 1500 -Total 185

3. Hipótesis.
Frecuenc_ias esperadas pequeñas El problema de las frecuencias espe- H 0: el estado nutricional y el desempeño académico son independientes.
radas pequeñas. que se estudia en la sección anterior, se encuentra cuando HA: las dos variables no son independientes.
se analizan los datos de las tablas de contingencia. Aunque existe una fal-
ta de consenso sobre la forma de manejar este problema, muchos autores Seaa.=.05.
4. Estadística de prueba. La estadístiCa de prueba es
siguen actualmente la regla de Cochran. 10 Éste sugiere que, para tablas de
contingencia con más de un grado de libertad, puede permitirse una espe-
ranza mínima de l si 20 o menos por ciento de las celdas tienen frecuencias X' = Í [(O, -: E,)']
esperadas de menos de 5. Para satisfacer esta regla. pueden combinarse A= 1 E¡
renglones y columnas adyacentes cuando resulte lógico hacerlo a la luz de 5. Distrib11ciónde la estadística de prueba. CuandoH0 es verdadera,X2 sigue una
otras consideraciones. Si X2 está basada en menos de 30 grados de liber- distribución aproximada de ji·cuadradacon (2-1 )(2-1) = (1 )( 1)= l grado de
tad. pueden tolerarse frecuencias esperadas tan pequeñas como 2. En el libertad.
ejemplo 10.4.1 no se experimen1óel problema delas frecuencias esperadas 6. Regla de decisión. Rechazar H0 si el valor calculadodeX2es mayor o igual que
pequeñas, ya que que todas fueron mayores a 5. 3.841.
7. Cálculo de la estadfsticade prueba. El valordeX2 se obtiene al calcular primero
Tabla de contingencia de 2 x 2 A veces, cada uno de los dos criterios de las frecuencias esperadas de las celdas en la forma que se piesenta en párrafos
clasificación puede dividirse en sólo dos categorías o niveles. Cuando los anteriores. Sin embargo.en el caso de la tabladecontingenciade2 X2,X2puede
datos se clasifican cruzados de esta manera, el resultado es una tabla de obtenerse mediante la siguiente fórmula condensada:
contingencia que consta de dos renglones y dos columnas. Esta tabla se
2 (10.4.1)
conoce como tabla de-2 X 2. Cuando se aplica la regla (r- l)(c - 1) para x' = n(ad - bc)
encontrar los grados de libertad, a una tabla de 2 X 2, el resultado es 1 gra- (a + c)(b + d)(a + b)(c + d)
do de libertad. Esto se ilustra con el siguiente ejemplo.
donde a, b, e y d son las frecuencias observadas en las celdas, como se mues·
Ejemplo 10.4.2 Una muestra de 500niñosde una escuela primaria se clasi- traen la tabla 10.4.6. Para este ejemplo, se tiene
ficó en forma cruzada respecto a su estado de nutrición y desempeño
académico. Los resultados se muestran en la tabla 10.4.5. 2 500((105)(300) - (15)(80)] 2
Los investigadores desean saber si es posible concluir que existe una X = (185)(315)(120)(380)
relación entre el estado de nutrición y el desempeño académico. La prue- = 172.746
ba de ji-cuadrada resulta adecuada para tornar una decisión.
8. Decisión e.yradfstica. Dado que 172. 746> 3.841, se rechazaH0. Para esta prue·
Solución ba,p < .005.
l. Datos. Ver la tabla 10.4.5. 9. Co11clusió11. Los investigadores pueden concluir que existe una relación entre
2. Suposiciones. La muestra es una muestra aleatoria simple. las dos características en estudio.
)
Distribución ji-cuadrada y el análisis de frecuencias Ejercicios 665 )
664
Tabla 10.4.6. Tabla de contingencia 2 x 2 _ 500( (105)(300) - (15)(80) 1 - (.5)(500)] 2
1 J
x~orregido - (185)(315)(120)(380)
Primer criterio de clasificación J
Segundo criterio 169.907
2 Total )
de c/Osijicació11
,, Como podría esperarse, con una muestra de este tamaño, ]a diferencia entre )
b a + b
los resultados no es considerable.
)
2 < d '+ d Las características de una prueba de ji-cuadrada de independencia que
la distinguen de otras pruebas de ji-cuadrada son las siguientes: )
'Tolal + (' b+ d
(I

" )
J. En gene-ral, se selecciona una sola muestra de la población de interés y las per-
sonas u objetos se clasifican en forma cruzada con base en dos variables de )
El problema del manejo de frecuencias esperadas pequeñas y de las
muestras con un tamaño total pequeño surge en el análisis de las tablas de interés. )
2. El razonamiento para calcular las frecuencias esperadas de las celdas está
contingencia de 2 x 2. Cochran JO sugiere no utilizar la prueba ji-cuadrada )
basado en la ley de la probabilidad que establece que si dos eventos (en este
si 11 < 20 o si 20 < 11 < 40, y si cualquier frecuencia esperada es menor que caso, los dos criterios de clasificación) son independientes, la probabilidad )
5. Cuando 11 ~ 40. se puede tolerar una frecuencia esperada de la celda tan de que ocurran conjuntamente es igual al producto de sus probabilidades indi-
pequeña como 1. viduales. )
3. Las hipótesis y conclusiones se establecen en términos de independencia (o f al- )
Corrección de '\'ates Las frecuencias observadas en una tabla de contin- ta de ella) de las dos variables.
gencia son discretas, por lo que dan lugar a una estadística discreta, X2, que
es semejante a la distribución ji-cuadrada, la cual es continua. Yates, 17 en )
1934, propuso un procedimiento para corregir esto en el caso de tablas 2 X2. EJERCICIOS~~~~~~~~~~~~~~~~
)
La corrección consiste en restar la mitad del número total de. observaciones
del valor absoluto de la cantidad ad - be antes de elevar al cuadrado. Es En los siguientes ejercicios, llevar a cabo la prueba al nivel de significación indi- J
decir, cado y detennine el valor p.

10.4.1 Se clasificó en forma cruzada una muestra de 250médicos de acuerdo con


2 n( 1 ad - be 1 - .5n) 2 (10.4.2)
su especialidad y con la zona de la comunidad en que trabajaban. Los resul-
xcornegido = (a + c)(b + d)(a + b)(c + d) )
tados fueron los siguientes.
En general, sehaconvenjdoen que no se necesita corrección alguna para
tablas de contingencia más _grandes. Aunque la corrección Yates para las Especialidad
tablas de 2 x 2 se utilizó ampliamente en el pasado, los investigadores actuales. Zona de la
por ejemplo, Grizzle, IB Lancaster, 19 Pearson20 y Plackett21 han cuestiona- comunidad A B e D Total
do su uso. El trabajo de Grizzle, en particular, ha reforzado el caso contra el Norte 20 18 12 17 67
Sur 6 22 15 13 56
uso de esta corrección, basándose en que, con demasiada frecuencia, condu- 35
Este 4 6 14 11
ce a una prueba demasiado conservadora, es decir, el uso de la corrección Oeste 10 19 23 40 92
conduce con demasiada frecuencia al no rechazo de la hipótesis nula. Como
Total 40 65 64 81 250
resultado, algunos profesionales están en contra de su uso. Aparentemente.
ésta es una recomendación que es razonable aceptar.
Como tema de interés, puede aplicarse la corrección de Yates al ejem-
¿Proporcionan estos datos la evidencia suficiente para indicar una falta de
plo en cuestión. Al utilizar la ecuación 10.4.2 y los datos de la tabla l 0.4.5,
independencia entre los dos criterios de clasificación? Sea a= .01.
se calcula lo siguiente:
Distribución ji-cuadrada y tri anáü.ris de frecuencias Ejercicios 667
666
t0.4. 2 Quinientos empleados de una empresa que fabrica cierto producto, sospe- ¿Sugieren estos datos que el estar a dieta depende del sexo? Sea a= .05.
choso de estar asociado con alteraciones respiratorias, se clasificaron en J0.4.5 Una muestra de 500estudiantesde bachillerato participó en un estudio di-
forma cruzada con base en su grado de exposición al producto y si tenían señado con el fin de evaluar el nivel de sus conocimientos respecto a un
o no los síntomas de tales alteraciones respiratorias. Los resultados se mues- cierto grupo de enfermedades comunes. La tabla siguiente presenta laclasi-
tran en la siguiente tabla. ficación de los estudiantes de acuerdo con su principal campo de e~tudio
y el nivel de conocimientos sobre el grupo de enfermedades.
Nivel de exposición
Síntomas presentes Alto Limitado Sin exposición conocida Total Conocimiento de las enfermedades
Área
Sí 185 33 17 235 de estudio Bueno Malo To1a/
No 120 73 72 265
Medicina 31 91 122
Total 305 106 89 500 Otra 19 359 378
Total 50 450 500
¿Proporcionan estos datos la evidencia suficiente para indicar que, i:n un
nivel de significación de 0.1, existe una relación entre el grado de exposi-
ción y la presencia de los síntomas de las alteraciones respiratorias?
10.4.3 Quinientos niños de escuela primaria fueron clasificados en forma cruza- ¡,Sugieren estos datos que existe una relación entre el conocimiento del
da de acuerdo con el grupo socioeconómico al que pertenecen y la presen- grupo de enfermedades y el principal campo de estudio de los estudiantes
cia o ausencia de cierto defecto en el lenguaje. Los resultados fueron los de bachillerato de los cuales se extrajo esta muestra?
siguientes. 10.4.6 La siguiente tabla muestra los resultados de una investigación árealizada
en una muestra de 300 adultos residentes en cierta área metropolitana. A
Grupo socio-económico cada individuo se Je pidió que indicara cuál de tres políticas de fumar en
lugares públicos preferían.
Defecto Medio Medio
del lenguaje Alto alto bajo Bajo Total
Presente 8 24 32 27 91 Política favorecida
Ausente 42 121 138 108 409 Permitir
50 170 135 500 No fumar
Total 145 en áreas Prohibir No
Nivel restringir
educativo el fumar restringidas fumar opinan Total
¿Son compatibles estos datos con la hipótesisde que el defecto en el lengua-
je no está relacionado con el grupo socioeconómico? Estudios 5 44 23 3 75
10.4.4 A un grupo de 350 adultos que participaron en una encuesta de salud, se profesionales
les preguntó si llevaban o no una dieta. Las respuestas (por sexos) son las 100 30 5 150
Segunda 15
siguientes enseñanza

Estuclios 15 40 lO 10 75
básicos
Sexo
Total 35 184 63 18 300
Masculino Femenino Total
A dieta 14 25 39
Sin dieta 159 152 311 ¿Es posible concluir. a partir de estos datos.que en la población muestrea~
da existe una relación entre el nivel de educación y la actitud hacia el fumar
Total 173 177 350 en lugares públicos? Sea ex= .05.
)

668 D1:s1ribució11 ji-cuadrada y el análisis de frecuencias Prueba de homogeneidad 669 J


10.5 PRUEBA DE HOMOGENEIDAD _ _ _ _ _ _._ __ )
Tabla 10.S.1. Grado del uso de drogas entre S 10 estudiantes de educación supe-
rior clasificados de acuerdo eón su grado académico J
Una de las características de los ejemplos y ejercicios de la sección ante- Grado del uso de drogas
rior es que, en cada caso, se supu ~o que la muestra total había sido extraí-
Grado De moderado
da antes de que las entidades se agruparan de acuerdo con los c:titerios de académico Experimental Casual a alto Total
clasificación. Es decir, se determino el número observado de entidades que
Primer año 57 50 43 150 )
caen en cada celda una vez que se extrajo la muestra. Como resultado, lüs 58 20
Segundo año 57 135 )
totales de renglones y columnas son cantidades aleator.iasque no están bajo Tercer año 56 45 24 125
el control del investigador. Se considera que la muestra extraída en estas
condiciones es una sola muestra tomada de una sola población. Sin embar-
Último año
Total
45
215
22
175
33
120
100
510
1 )

go, en ocasiones, los totales de renglones y columnas pueden estar bajo el


control del investigador, es decir, el investigador puede especificar que las
muestras independientes sean extraídas de varias poblaciones. En este caso, )
se dice que un conjunto de totales 1narginales es fijo, mientras que el otro Solución
)
conjunto, que corresponde al criterio de clasificación aplicado a las mues-
tras, es aleatorio. Como se ha visto, el primer procedimiento conduce a una l. Datos. Verla tabla 10.5.1.
prueba de independencia de ji-cuadrada. La segunda situación conduce a 2. Suposiciones. Se supone que se tiene una muestra aleatoria simple de cada una
)
una prueba de ho,nogeneidad de ji-L'uadrada. Las dos situaciones no sólo c!e las cuatro poblaciones de interés.
comprenden procedimientos de muestreo distintos, sino que también con- 3. Hipótesis
H 0: Las cuatro poblaciones (del primer año, del segundo, del tercero y el cuar-
ducen a preguntas e hipótesis nulas distintas. La prueba de independencia
to) son homogéneas con respecto al grado de uso de drogas.
se ocupa de la pregunta: ¿son independientes los criterios de clasificación? HA: las cuatro poblaciones no son homogéneas con respecto al grado de uso de )
La prueba de hon1ogeneidad se ocupa de la pregunta: ¿las muestras extraí- drogas.
das provienen de poblaciones homogéneas con respecto a algún criterio de
clasificación? En el segundo caso, la hipótesis nula establece que las mues- Sea a= .05.
)
tras se extraen de la misma población. A pesar de estas diferencias en con- 4. Estadi'stica de prueba. La estadística de prueba ya es conocida: xi= I[(O. -
)
cepto y procedimiento de muestreo, 13.s dos pruebas son matemáticas idén- E1) 2 /E1J. '

ticas, como se aprecia en el ejemplo siguiente. S. Distribución de la estadística de prueba. Si H0 es verdadera, J(2 presenta una )
distribución semejante a la distribución ji-cuadrada con (4- 1)(3 - l) = (3)(2)
Eje,nplo 10.5.1 Un investigador, al estudiar el grado de uso de drogas entre = 6 grados de libertad.
6. Regla de decisión. Se rechaza H0 si el valor calculado de xi es mayor o.igual
estudiantes de bachillerato que habían declarado ser adictos a ellas, seleccio-
que 12.592.
nó de este grupo una muestra de 150 alumnos del pri1ner año, 135 del segun- 7. Cálculo de la estadística de prueba. En la tabla 10.5.1 se muestran las fre- ¡
do, 125 del tercer año y 100 del último año. Cada estudiante contestó un
cuestionario en el que indicaba el grado de su uso de droga, ya sea como
cuencias esperadas que se necesitan. Si las poblaciones son además homogéneas
o, lo que es equivalente, si todas las muestras se extraen de la misma población
' )

)
experimento, ocasionaln1ente, o bien, desde moderado hasta intenso. Los con respecto al uso de drogas, el mejor cálculo de la proporción en la población
resultados se muestran en la tabla 10.5.1. combinada de quienes han empleado las drogas sólo experimentalmente es de
La manera de seleccionar las muestras. es decir, de seleccionar un 215/51 O= .4216. Por lo mismo, si las cuatro poblaciones son homogéneas, esta
número especificado de cada población, tiene el efecto de fijar los totales probabilidad se interpreta como si fuese aplicable individualmente a cada una
de las poblaciones. Por ejemplo, bajo la hipótesis nula, 215/510 es la mejor
1
de los renglones de la tabla.
estimación de la probabilidad de que un estudiante seleccionado al azar de entre
¿Son compatibles estos datos con la hipótesis de que las cuatro pobla-
}os usuarios de drogas las tome sólo con el fin de experimentar. Se esperaría
ciones no son homogéneas con respecto al grado del uso de drogas? encontrar, entonces, que (215/51 O) x 150=63.24 de los 150 alumnos de primer
Distn·bución ji-cuadrada y el análisis de frecuencias Prueba de /Jo1noge1Jeidad 671
670
t. De antemano, se identifican dos o más poblaciones y, de cada una, se ex:trae
Tabla 10.S.2. Frecuencias observadas y esperadas_del eiemplo 10.5. l.
una muestra independiente.
Grado del uso de drogas 2, Los individuos u objetos de la muestra se colocan en categorías adecuadas de
Grado De nioderado la variable de interés.
académico Experimental Casual a alto Total 3, El cálculo de las f rccuencias esperadas de las celdas se basa en el fundamento
de que si las poblaciones son homogéneas. como se señala en la hipótesis nula,
Primer año 57(63.24) 50(51.47) 43(35.29) 150 la n1ejor estimación de la probabilidad de que un individuo u objeto caiga en
Segundo año 57(56.91) 58( 46.32) 20(31.76) l'.15
Tercer año 56(52.70) 45(42.89) 24(29.41 J _,
19" una categoría particular de la variable de interés se obtiene al ponderar los datos
Último año 45(42.16) 22(34.31 J 33(23.53) 100 de la n1uestra.
4. Las hip6tesis y conclusiones se establecen en términos de homogeneidad ( con
Total 215 175 120 51 O respecto a la variable de interés) de las poblaciones.
año las toman con fines experimentales. De la misma forma.se esperaría encon-
La prueba ji-cuadrada de homogeneidad para el caso de dos muestras
trar que (215/510) x 135 =56.91 alumnos de segundo año, (215/510) x 135 =
· 52. 70 de tercer año y (215/510) x l 00 = 42. l 6 del último año las tomen con el constituye un método alternativo p_ara probar la hipótesis nula de que las
mismo fin. proporciones de las dos poblaciones son iguales. En la sección 6.6 se
Nuevamente se aprecia que el procedimiento simplificado de mu! tiplicar describe el método para probar H0 : p 1=p 2contra la f/A: P¡ ;cp2 por medio
los totales marginales adecuados y dividir entre el gran total proporciona las de la estadística
frecuencias esperadas para las celdas. Las frecuencias esperadas que han sido
calculadas de esta forma.junto con las frecuencias observadas, se muestran en tP, - P,! - !P, - P2lo
la tabla 10.5.2. Las frecuencias esperadas están entre paréntesis. ' = ip(l - Pl P< 1 - Pl
A partir de los datos de la tabla l 0.5.2, se calcula la siguiente estadística de ~ - ' - +~--'-
n2
prueba: "'
(5i - 63.24)' (50 - 51.47) 2 (33 - 23.53)' - 19.4 donde ji se obtiene al ponderar los datos de las dos muestras independientes
x2. =
63.24 + 5I.4i + · ·. + 23.53 disponibles para el análisis.
Suponer, por ejemplo, que en la pruebaH0 : p 1 = p 2 contra HA: p 1 ;t.p2 ,
8, Decisión estadística. Al consultar la tabla F, se encuentra que la probabilidad los datos de la muestra fueron los siguientes: n 1 =100, P1 = .60,n 2 = 120,
de obtener un valor de x:i tan grande como J 9.4 o mayor, cuando la hipótesis f, 2 = .40. Al ponderar los datos de la muestra se tiene
nula es verdadera, es menor que .005. La decisión es, entonces, rechazarla hipó-
tesis nula. '
9. Co11clusió11. Se concluye que las poblaciones no son homogéneas con respec- . .60(!00) + .40(120) 108
to al grado del uso de drogas; dado que 19.4 > I .548, p> .005. p- !00+120
--=
220
.1909

Las reglas para las frecuencias esperadas pequeñas, que se estudian en


y
la sección anterior, se aplican cuando se lleva a cabo una prueba de homo-
.60 - .40
geneidad. 2.95469
e - --,.--------
Cuando la pruebaji-cuadradade homogeneidad se utiliza para probar (.4909)(.5091) (.4909)(.5091)
la hipótesis nula de que dos poblaciones son homogéneas, y cuando sólo -----+-'------
IOO 120
existen dos niveles en el criterio de clasificación, los datos pueden presen-
tarse en una tabla de contingencia de 2 X 2. El análisis es idéntico al análi- que es significativa al nivel de .05 por ciento, ya que es mayor que el valor
sis de las tablas de 2 x 2 que se presenta en la sección 10.4. crítico de 1. 96.
En resumen, la pruebaji-cuadradade homogeneidad tiene las siguien- Si se desea probar la misma hipótesis mediante el n1étodode la ji-cuadra-
tes características. da, la tabla de contingencia es la siguiente.
672 Distribución ji.cuadrada y el análisis de frecuencias Efercicios '73 )
1
Característica presente Expected counts are printed be1ov observed counts )
Muestra Sí No Total Cl C2 C3 Total
l 57 sa 43 150 )
GO -10 100 63.24 n.47 3s.2,
2 -18 72 120 2 57 u 20 ns
56.,l 46.32 31.76 )
Total 108 112 220
3 56 45 24 125 )
52.70 42.a, 2,.41
)
4 45 22 33 100
Mediante la ecuación 10.4. l se calcula J
42.16 34.31 23.53
Tota1 215 ns 120 510 )
x2 = 220[(60)(72) - (40)(48)]' )
(108)( 112)( IU0)(120)
8. 7302 ChiSq = 0.615 + 0.042 + 1.6!2 +
0.000 + 2.,43 + 4.357 + )
0.201 + 0.104 + o.,,6 +
que es significativa al nivel de .05, ya que es mayor que el valor crítico de 0.1,2 + 4.41, + 3.!12 =
1,.36, )
3.841. Por lo tanto, se llega a la misma conclusión al utilizar ambos mé- df = 6 )
todos.
Esto no es sorprendente ya que, como se explicó en la sección 10.2,ji- Figura 10.S.1. Salida i1npresa del análisis por computadora del ejemplo 10.5. I
mediante el programa MINITAB.
cuadrada = :; 1r Es importante notar que 8.7302 = (2.95469) 2 y que 3.841
= (1.96)2.

)
Análisis por computadora La computadora puede emplearse para calcu-
CBISQUlRE Cli-C3
lar el valor de X 1 para pruebas de independencia y homogeneidad. La figu- )
ra 10.5. ·¡ muestra la salida impresa de la computadora para el ejemplo 10.5.1
)
cuando se ulil iza el programa MINITAB para calcular X 2 a partir de la tabla para obtener el análisis e impresión.
de contingencias.
Los datos se registran en las columnas 1, 2 y 3 como sigue )

EJERCICIOS~~~~~~~~~~~~~~~~- )
)
En los siguientes ejercicios, llevar a cabo la prueba con el nivel de significación
ROW O C2 C3 que se indica y determinar el valor p. )
!TB > READ C1-C3 10.5.1 En un estu~io.del estado de salud dental en los niños de seis comunidades
DATA> 57 50 43 con niveles variables de fluoruro en el suministro de agua, se seleccionó )
DlTA> 57 5& 20 una muestra de 125 niños de cada una de las comunidades y se ]es practicó J
DATA> 56 45 24 un examen dental. La tabla de la p:igina siguiente señala el número de niños
DATA> 45 22 33 sin caries de cada muestra. ¿Son compatibles estos datos con la hipótesis J
DATA> END de que las seis poblaciones son homogéneas con respecto a la proporción
de niños sin caries?
10.5.2 En un esludio diseñado para investigar 1a relación entre el estado de nutri-
Después. l'on el comando de edición ción y la capacidad para árealizar ciertas tareas, 400 animales de labora-
Distribución ji-cuadrada y el análisis de frecuencúu
674 1 Ejercicios 675
Número de Número Evaluación del tiempo de hospitalización
niños en la de niños
Comunidad muestra sin caries Duración Duración
Diagnóstico adecuada Duración baja prolongada Total
A 125 38
B 125 8 1 31 6 13 50
e 125 30 11 49 2 4 55
D 125 44 IlI 55 2 3
IV 42 60
E 125 64 9 24 75
F 125 32 V 33 3 9 45
Total 750 216 Total 210 22 53 285

torio, que habían sido entrenados para llevar cabo estas tareas, se divi- 10.5.4 En un estudio acerca de la contaminación atmosféricaárealizado en dos co-
dieron en cuatro grupos. Los cuatro grupos fueron alimentados con dietas munidades, se seleccionó una muestra aleatoria de 200 familias de cada una
distintas que representaban diferentes niveles de deficiencias en la nutri- de dichas comunidades. Se le preguntó a uno de los miembros de cada fami-
ción que iban desde una dieta bien balanceada (condición de tratamiento lia si algún miembro de la misrria se sentía afectado por la contaminación
1) hasta una altamente deficiente en nutrientes indispensables (condición atmosférica. Las respuestas fueron las siguientes.
de tratamiento 4 ). Después de que los animales habían sido sometidos a las
dietas durante cierto tiempo, se probó su capacidad para árealizar tareas ¿Algún miembro de la familia ha sido
de dificultad variable. Algunos animales fueron capaces sólo de árealizar afectado por la contaminación?
las tareas sencillas, algunos pudieron árealizartareas de dificultad mode- Comunidad Sí No Total
rada y otros pudieron efectuar las tareas más difíciles. La siguiente tabla
1 43 157 200
muestra los 400 animales clasificados de acuerdo con la condición de 11 81 119 200
tratamiento y el nivel de dificultad de la tarea llevada a cabo.
Total 124 276 400

Dificultad de la Condición de tratamiento


tarea árealizada l 2 g 4 Total ¿Pueden concluir los investigadores que las dos comunidades difieren con
respecto a la variable de interés? Sea <X= .05.
Simple 3 12 27 49 91 1 10.5.5 En una muestra aleatoria simple de 250 trabajadores industriales con cáncer,
Moderadamente difícil 13 62 36 48 159
Difícil 84 26 37 3 150 los investigadores encontraron que 102 de ellos habían trabajado en puestos
clasificados como "altamente expuestos" a agentes causantes de cáncer.
Total !00 !00 !00 !00 400 Del resto, 84 habían trabajado en puestos "de mediana exposición" y 64
no habían experimentado exposición en sus trabajos. En una muestra aleato-
ria simple independiente de 250 trabajadores industriales de la misma área
¿Deben concluir los investigadores que existe una falta de homogeneidad que no tenían un diagnóstico de cáncer, 31 trabajaban en puestos '·altamen-
entre los cuatro grupos con respecto a la capacidad para efectuar las tareas te expuestos", 60en puestos "medianamente expuestos" y 159 trabajaban
con grados de dificultad diversos? en puestos que no involucraban exposición conocida a agentes causantes
10.5.3 Se seleccionó una muestra de los expedientes de un hospital que corres- de cáncer. ¿Es posible deducir a partir de estos datos que las personas que
pondía a pacientes con uno de cinco diagnósticos. Los registros se evalua- trabajan en puestos que los exponen a agentes causantes de cáncer poseen
ron con respecto a la conveniencia del tiempo de hospitalización. Los resul- un mayor riesgo de contraer dicha enfermedad? Sea a= 05.
tados se muestran en la tabla de la página siguiente. ¿Sugieren estos datos
una falta de homogeneidad entre los grupos de diagnóstico con respecto
a la evaluación de la duración de la estancia? Sea a= .05.
)
676 Distribución ji-cuadrada y el análisis de frecuencias Preguntas y ejercicios de repaso 677
10.6 RESUMEN _ _ _ _ _ _ _ _ _ _ _ _ _ _ __ 11. Un estudio del 90embarazos proporcionó los siguientes datos sobre la relación )
que existe entre la hipertensión de la madre y cierta complicación del em-
En_ este capítulo se estudian algunos usos versátiles de la distribución de barazo.
ji-cuadrada. Se presenta la aplicación de la prueba de ji-cuadrada para bon- )
dad de ajuste en distribuciones normal, binomial y de Poisson. El procedi- CierTa compli- Madre hipertensiva
cación en el )
miento consiste en calcular la estadística embarazo Si No Total
)
Presente 23 55 78
x' = I[(o, ~. E,)'] Ausente 12 100 112
)
)
Total 35 155 190
que mide la discrepancia entre las frecuencias observadas ( O¡) y las espe-
radas (E¡) de los valores en ciertas categorías discretas. Cuando la hipóte- ¿Proporcionan estos datos la evidencia suficiente que indique que las dos
sis nula correspondiente es verdadera, esta cantidad se distribuye aproxi- condiciones no son independientes? Sea a= .01. ¿Cuál es el valor de p?
madamente como ji-cuadrada. CuandoX2 es mayor o igual al valor tabulado 12. Una muestra de 150 portadores crónicos de cierto antígeno y una muestra de
de ji-cuadrada para alguna a, la hipótesis nula se rechaza en el nivel a de 500 no portadores revelaron la siguiente distribución de grupos sanguíneos. )
significación. )
Las pruebas de independencia y de homogeneidad también se estudian Grupo sa'nguineo Portadores No portadores Total
en este capítulo. Ambas son matemáticamente equivalentes pero parten de )
conceptos diferentes. Es decir, en esencia, estas pruebas evalúan la bon- o n 230 302 )
A 54 192 246
dad de ajuste de los datos observados con respecto a unaeii;pectativaexpues- B 16 63 79 )
taen la hipótesis; la primera lo hace con respecto a la independencia de dos AB 8 15 23
criterios de clasificación de datos, y la segunda con respecto a la homo- )
Total 150 .,.:_.500 650
geneidad de proporciones entre dos o más grupos. )

¿Es posible concluir, a partir de estos datos, que las dos poblaciones de las )
PREGUNTAS Y EJERCICIOS D!l REPASO _ _ _ _ _ __
cuales se tomaron las muestras difieren con respecto a la distribución de gru- )
l. Explicar cómo puede deducirse la distribución ji-cuadrada. pos sanguíne.os? Sea a= .05. ¿Cuál es el valor p para esta prueba?
2. ¿ Cuáles son la media y la variancia de la distribución ji-cuadrada? 13. La siguiente tabla representa a 200 hombres clasificados de acuerdo con su
3. Explicar cómo se calculan los grados de libertad para las pruebas de ji-cuadra- clase social y tipo de dolor de cabeza:
da de bondad de ajuste.
4. Enunciar la regla de Cochran para las frecuencias esperadas pequeñas en las
pruebas de bondad de ajuste.
5. ¿Cómo se hace el ajuste en el caso de frecuencias esperadas pequeñas? Clase social l.l
6. ¿Qué es una tabla de contingencia?
Tipo de dolor
de cabeza A B e Total
¡:
7. ¿ Cómo se calculan los grados de libertad cuando se calcula un valor de x·~ a
partir de la tabla de contingencia? Sin dolor de cabeza 6 30 22 58
(en el año anterior)
8. Explicar el razonamiento que fundamenta el método para calcular las fre- Dolor de cabeza simple 11 35 17 63
cuencias esperadas en una prueba de independencia. Dolor unilateral 4 19 14 37
9. Explicar la diferencia entre una prueba de independencia y una prueba de (no migraña)
homogeneidad. Migraña 5 25 12 42
10. Explicar el razonamiento que fundamenta el método para calcular las fre- Total 26 109 65 200
cuencias esperadas en una prueba de homogeneidad.
678 Di~Jribución ji-cuadrada y el análisis de frecuencias Preguntas y ejercicios de repaso 679
¿Propon:ionan estos datos la cvi<lencia suficicnt'! para concluir que el dolor pensó que cada nivel de edades estaba igualmente interesado en obtener infor-
de cabeza y la clase social es1:.ín relacionadas? Sea O:= .05. ¿Cuáles el valor mación acerca de este tipo de enfermedades. Dado que cada grupo de edades
de p para esta prueba'! estaba representado aproximadamente por la misma cantidad de elementos
14. La siguiente tabla mues1ra la distribución de frecuencia de las calificaciones que los demás. supuso que un interés igual se reflejaría en la igual concurren-
ohlenidas en una prueba de aptitud por 175 aspirantes a un programa de adies- cia de los estudiantes por nivel de edades durante la presentación del progra-
tranlicnto en fisioterapia. ma. La clasificación por edades de quienes atendieron el programa fue la si-
guiente.
Clasificación Núrnero de solicitantes
Edad Ntíniero de asistentes
10-14 3
15-19 8 16 26
20-24 13 17 50
25-29 17 18 H
30-34 19 19 40
35-39 25
40-44 28
45-49 20 ¿Son incompatibles estos datos con la suposición de la directora del progra-
50-54 18
55-59 ma de que los estudiantes de los cuatro niveles de edades están igualmente
12
60--64 8 interesados en el programa de información sobre enfermedades venéreas? Sea
65-69 4 a= .05. ¿Cuáles el valor p para esta prueba?
Total 175 17. En una encuesta, los niños menores de 15 años de edad que viven en la zona cen-
tral de una gran ciudad fueron clasificados de acuerdo con el grupo étnico al que
pertenecen y su nivel de hemoglobina. Los resultados fueron los siguientes:
¿Proporcionan estos datos la evidencia suficiente para concluir que la pobla-
ción de calificaciones no sigue una distribución normal? Sea a= .05. ¿Cuál Concentración de hemo11;lobina .(g/100 mi)
es el valor de p para esta prueba? Grupo
étnico !O.O o n1ayor 9.0-9.9 <9.0 Total
15. Varios estudios proporcionan la evidencia suficiente para apoyar la hipóle·
sis de que el manejo o ··amansamiento" de las ratas durante las primeras eta- A 80 100 20 200
pas de su vida produce resultados benéficos. Suponer que en un estudio se B 99 190 96 385
compara una muestra de ratas manipuladas y una muestra de ratas no mani- e 70 30 10 110
puladas. comparadas con respecto al estado general de salud. Los resultados Total 249 320 126 695
son los siguien[es:

Con un nivel de significación de .05, ¿proporcionan estos datos la evidencia


Grupo suficiente para concluir que las dos variables están relacionadas? ¿Cuál es el
Estado de salud Manejadas No n1a11ejadas Total valor de p para esta prueba?
Alto 18. Una muestra de los casos de paperas en niños de edad preescolar mostró la si-
37 23 60
Bajo 13 guiente distribución por edades:
27 40
Total 50 50 100 Edad en alias N1ín1ero de casos

Por debajo de I 6
1 20
¿Apoyan estos datos la hipócesis? Sea a= .05. 2 35
16. Un departamento local de salud patrocinó un programa de información acer- 3 41
ca de enfermedades venéreas para estudiantes de bachillerato del penúltimo 4 48
y últin10 años cuyas edades iban de 16 a 19 años. La directora del programa Total 150
Distribución ji-cuadrada y el análisis de frecuencias Preguntas y ejercicios de repaso 681
680

Probar la hipó1csis de que los casos se presentan con igual frecuencia en las cin- ,:.Es posible concluir a partir de estos datos que hay una relación entre el grupo
co categorías de edades. Sea a= .05, (Cuál es el valor de p para esta prueba? étnico y \a elección de la droga de abuso? Sea a= .05. Calcular el valor p.
19. A cada uno de los varones de una muestra de tamaño 250, extraída de una 25. Se dispone de los siguientes datos extraídos de una población de 1200 adul-
población que se sospechaba sufría de alguna enfermedad de las articulaciones tos. Las variables son las siguientes:
se le preguntó cuál de tres síntomas Jo molestaba mayormente. La misma pre- Sexo (A): l =hombre.O= mujer
gunta se le hizo a una muestra de 300 mujeres que se sospechaba padecían la Grado de tabaquismo (B): O= no fun1ador, l = fumador
niis1na cnfcrn1edad. Los resultados fueron los siguientes: Grado de alcoholismo (C): O= no bebedor, 1 = bebedor moderado,
2 = bebedor cotidiano
Sínton1a Sínton1as de enfermedad respiratoria (D): 1 = presente, O= ausente
111ás n10/esto Ho111bres Mujeres Estado de presión sanguínea alta (E): 1 = presente, O= ausente
Rigidez matutina 111 102 Seleccionar una muestra aleatoria simple de tamaño 100 a partir de esta población y
Dolor por la noche 59 73 efectuar un análisis para ver si es posible concluir que hay una relación entre el fumar
Hinchazón de las articulaciones 80 125 y los síntomas de enfermedad respiratoria. Sea a= .05. Determinar el valor p para la
250 300 prueba. Comparar los resultados con los de otros estudiantes.

¿,Proporcionan estos datos la suficiente evidencia para indicar que las dos Variable Variable
poblaciones no son homogéneas con respecto a los síntomas principales? Sea
Individuo A B e D E Individuo A B e D E
o:= .05. ¿,Cuál es el valor de p para esta prueba? Para cada cada una de las
siguientes situaciones, indicar si es conveniente la hipótesis nula de horno- l. 1 1 1 o o 2. 1 1 1 1 1
geneidad o bien una hipótesis nula de independencia es mejor. 3. 1 o 1 1 o 4. 1 o 1 o 1
20. Un investigador deseaba comparar el estado de tres comunidades con respec- 5. 1 o 1 o 1 6. 1 o o o 1
i. 1 1 2 1 o 8. 1 o o o o
to a la vacunación conlra la poliomielitis en niños de edad preescolar. Se extra-
9. o o 1 o o 10. o o o o o
jo una mueslra de esos niños de cada una de las comunidades. 11. 1 1 1 1 o 12. 1 o 1 1 1
21. En un estudio de la relación que existe entre el fumar y las enfermedades res- 13. o o 2 1 1 14. 1 o 2 o 1
piratorias, se clasificó una muestra aleatoria de adultos con respecto al con- 15. o 1 o 1 1 16. 1 o 2 o o
sun10 de tabaco y el grado de los síntomas respiratorios. 17. 1 o 2 o o 18. 1 o 1 o o
19. 1 o 1 o o 20. o o 1 o o
22. Un médico, que deseaba saber más acerca de la relación entre el fumar y las
21. 1 o 2 1 o 22. o 1 o 1 1
irregularidades al nacer, estudió los expedientes de salud de una muestra de 23. 1 1 o 1 1 24. 1 o 1 o o
madres y sus hijos incluyendo, hasta donde fuera posible, los fetos todavía 9-
-º· 1 1 2 o 1 26. o 1 1 1 1
vivos y los que fueron abortados espontáneamente. 27. 1 o o o o 28. o 1 1 o o
23. Un grupo de médicos investigadores piensa que la incidencia de depresión es 29. 1 1 o 1 o 30. o 1 1 1 1
··-· 1 o 1 1 o
mayor entre las personas con hipoglicemia que entre las personas que no pade- 31.
33.
1
1
1
1
2
1
1
1
1
1
'"
34. 1 o 1 o o
cen esta enfermedad. 35. 1 1 o o 1 36. 1 1 1 1 1
o
24. En una muestra aleatoria simple de 200 pacientes que reciben terapia en un 37. o o o o o 38. o 1 o o
centro de tratamiento contra el abuso de drogas, el 60 por ciento pertenecen 39. o 1 o 1 o 40. 1 o 1 o o
al grupo étnico I y el resto pertenece al grupo étnico 11. De los miembros del 41. o 1 1 1 1 42. 1 o o 1 o
43. o 1 2 1 1 44. 1 o 2 o o
grupo étnico l, 60 fueron tratados por abuso en el consumo de alcohol (A), 25
45. 1 o o J o 46. 1 1 o 1 1
por el abuso en el consumo de marihuana (B ), 20 por abuso en el consumo de 47. 1 o 1 o o 48. 1 o 1 o 1
heroína, metadona ilegal u otro opioide (C). El resto fue tratado por abuso en o o 1 o 1 so. 1 1 o o 1
el consu1node barbitúricos, cocaína, anfetaminas, alucinógenos, u otroopioi-
49.
51. o 1 1 1 1 -,
J- .. 1 o 1 o o
de además de marihuana (D). En el grupo étnico Il. la categoría de consumo 53. o o 2 o o 54. 1 1 2 1 1
55. 1 1 o o 1 56. o 1 2 1 o
inn1oderado de drogas y el número de individuos involucrados es como sigue: o o 1 1 1 1 1
57. o 2 1 58.
Ai28) 8(32) Cill) D(el resto)
1
1

'\'ariable \lariable Variable Variable

Individuo A B e D E Individuo A B e D E Individuo A B e D E b1divid110 A B e D E

59. 1 o 1 1 o 60. 1 1 1 1 1 161. 1 o 1 o 1 162. 1 o 1 o 1


61. o o o 1 o 62. o 1 o 1 1 163. 1 o 2 o o 164. 1 o 1 o 1
63. 1 o o o o 64. o o o o o 165. o 1 o o o 166. 1 o 1 o 1
65. o 1 o 1 1 fi6. 1 o 1 o o 167. 1 o o 1 o 168. 1 1 1 1 1
67. o 1 1 1 1 68. 1 o o o o 169. 1 o 2 o 1 170. 1 o 1 o 1
69. o 1 o o 1 70. o 1 2 o 1 171. o l o o l 172. l l 2 l o
7I. o 1 l 1 o 72. l l o 1 o I 73. o l 2 1 l 174. o 1 l l l
73. 1 o 2 o o 74. 1 o 1 o 1 175. o o 1 l l 176. l o l o o
75. l o o 1 o 76. lJ () () o o 177. 1 1 1 1 o 178. o o 2 o o
77. o o o o o 78. o o o 1 o 179. l o o l o ISO. l 1 2 l o
79. 1 l 2 l 1 80. 1 o 2 o o 181. o o 1 o l 182. o 1 l o o
81. 1 l l o o 82. 1 o 1 o 1 183. o o 1 o o 184. 1 o 1 1 1
83. 1 o 2 o 1 84. 1 o 1 1 o 185. l o o o o 186. 1 l o l l
85. 1 o 2 o o 86. 11 11 o 1 o 187. 1 o l o o 188. l l l o l
87. l o 2 o o 88. o o l o o 189. l o 2 o o 190. o l 2 l l
89. l l o l l 90. l o 2 o l 191. o o o o o 192. o o o o o
91. 1 o o o 1 92. o 1 o 1 1 193. l 1 o 1 1 194. 1 o l l 1
93. l 1 l 1 o 94. 1 o 1 1 o 195. o o 2 o l 196. 1 o l 1 o
95. o 1 1 1 1 96. 1 1 1 1 1 197. 1 o 1 o 1 198. 1 1 o 1 o
97. 1 1 o o 1 98. o o 2 o o 199. o o o o o 200. 1 o 2 o 1
99. 1 1 o 1 1 100. 1 1 o 1 1 20 l. o o 2 o 1 202. 1 o 2 1 o
10 l. 1 o o o o 102. o 1 o 1 1 203. 1 1 o o o 204. 1 o 1 o o
103. o 1 1 1 1 104. 1 1 1 o 1 205. 1 1 o 1 1 206. 1 1 o 1 l
105. l o l o o 106. 1 o 2 o o 207. l 1 o 1 1 208. o 1 2 1 1
107. o o o o o 108. 1 1 o 1 o 209. o 1 1 1 1 210. 1 o 2 o 1
109. o o 1 1 o 11 O. 1 o 2 1 o 21 l. o 1 1 1 l 212. 1 1 1 o o
111. 1 o o o o 112. o o () o o 213. l o 2 1 1 214. o o 1 o o
113. 1 o 1 o l 114. 1 1 2 o 1 215. o 1 1 1 1 216. o o o o o
115. 1 o 1 o o 116. o o 2 o 1 217. o 1 1 1 1 218. 1 o 2 o 1
117. o 1 o 1 o 118. 1 o 1 1 1 219. 1 o 2 o 1 220. 1 o 2 o 1
119. 1 ·-O 2 o o 120. 1 1 1 1 1 221. 1 l 2 o 1 222. 1 o o o o
121. 1 o o o o 122. o o o 1 o 223. 1 o 2 1 1 224. 1 o 1 1 1
123. o 1 2 l 1 124. 1 l o o 1 225. o l 1 l o 226. l o l o 1
125. l 1 2 1 o 126. l 1 o l 1 227. l o o o o 228. l l 2 l l
127. l l l o o 128. o o o o o 229. o l l o l 230. l l l l l
129. o 1 2 l 1 130. o o 1 o o 231. o o 2 o o 232. 1 o 1 o o
131. l o o o o 132. o 1 l 1 1 233. l o o 1 l 234. o 1 o l l
133. l 1 o 1 1 134. 1 o 2 1 o 235. o l o 1 1 236. l o 1 o 1
135. o o o o o 136. o 1 o 1 o 237. 1 1 1 1 o 238. 1 o 1 o o
137. 1 1 1 1 1 138. 1 1 1 o o 239. o 1 2 1 1 240. o o 1 o o
139. o o 2 o o 140. o o o o o 241. 1 o 2 o 1 242. 1 o o 1 o
141. 1 o 2 o o 142. o 1 1 1 1 243. o 1 1 o 1 244. o 1 1 1 1
143. 1 o 1 o 1 144. 1 o o 1 o 245. 1 o 1 o 1 246. o o o o o
145. 1 1 o 1 o 146. 1 1 1 1 1 247. o 1 o o o 248. o o 2 o 1
147. 1 1 o 1 1 148. 1 1 o o o 249. 1 o o o o 250. o 1 1 1 1
149. 1 1 o o o l 50. o o 2 lJ 1 25 l. o 1 o 1 o 252. o o 1 1 1
o o 1 o 253. 1 o 2 1 1 254. o 1 2 1 1
15 l.
153. o o
2
o
1
o
1
o
152.
154.
1
1
1
1 o 1
1)
1) ,--
-.'J.J. 1 1 o 1 o 256 1 o 1 o o
153. 1 1 2 1 1 156 lJ 1) 2 1 11 257. 1 o o o o 258. 1 () o o o
157. o 1) o () o 158. 1 1 () 1 1 259. 1 o 1 o 1 260. o 1 o j o
159. 1 1 2 1 1 160. 1 1 11 1 1 261. o o 2 1 1 262. 1 1 1 o 1

682 683
V1:1riable Variable Variable Variable

Individuo A B e D E Indil·iduo A B e D E Individuo A B e D E Individuo A B e D E

263. 1 1 o o o 264. 1 o 1 o o 365. 1 1 o 1 o 366. o 1 1 1 1


265. 1 1 o 1 o 266. o o o o o 367. 1 o o o o 368. 1 1 1 o 1
267. 1 o o o o 268. o o o o o 369. o o o o o 370. 1 1 2 1 o
269. 1 o o 1 o 270. 1 o 1 o o 371. o o 1 o 1 372. 1 o o 1 o
271. o o 1 1 1 272. 1 o o o 1 373. o 1 1 1 1 374. o 1 o 1 1
273. o o o o o 274. 1 o 1 o 1 375. 1 o 1 1 1 376. o o o o o
275. 1 o o o o 276. 1 o 1 o 1 377. 1 1 2 1 1 378. 1 o 1 o o
277. 1 1 o 1 1 278. 1 o 1 o o 379. 1 o 2 o o 380. 1 o 2 o 1
279. 1 1 o 1 1 280. 1 1 1 1 1 381. o o o 1 o 382. 1 o o o o
281. 1 o 1 1 o 282. o o o 1 o 383. o 1 1 1 1 384. o 1 2 o 1
283. 1 1 o 1 o 284 1 1 o 1 o 385. 1 o 1 o o 386. o o o o o
285. o 1 o o 1 286. 1 o o o o 387. 1 o 1 o 1 388. 1 1 2 o 1
287. o o o o o 288. 1 1 1 1 o 389. o 1 o 1 1 390. 1 o 1 1 1
289. o o 1 o o 290. 1 o 1 o 1 391. o o 2 o 1 392. o o 2 1 1
291. o 1 2 1 o 292. o 1 o 1 o 393. o 1 1 1 1 394. 1 o 1 o 1
293. 1 o 2 o o 294. 1 1 2 o 1 395. o o 1 o o 396. o o 1 o o
295. J 1 o o 1 296. o o 1 1 o 397. 1 1 o 1 1 398. o o 1 o 1
297. o o o 298. 1 o 1 1 1 399. o o o 1 o 400. o o o o o
299.
1
o 1
2
2 1 o 300. 1 o o o o 401. o 1 1 o 1 402. 1 o 2 o o
403. 1 1 1 1 1 404. 1 1 1 1 1
301. o 1 2 1 1 302. 1 1 1 1 1
405. 1 o 1 o o 406. 1 1 2 1 1
303. o 1 2 1 1 304. 1 1 o o o
407. 1 o 1 o o 408. o o o o o
305. '' o o o o 306. 1 1 o 1 1
409. o o 1 1 1 41 o. 1 1 o 1 1
307. 1 1 2 1 o 308. 1 o 1 o 1
o 1 o o 1 412. 1 o 2 1 1
309. 1 o 2 o o 31 o. o 1 1 o o 411.
413. o o 1 o 1 414. 1 o 2 o o
311. 1 o o o o 312. 1 o 2 1 1
415. o 1 o 1 1 416. o o 1 o 1
313. o o o o o 314. o 1 1 1 1
417. 1 o o o o 418. 1 o o o o
315. 1 1 1 1 o 316. 1 o o o o o o o 420. 1 1 1 1 o
317. 1 1 o 1 o 318. o o 2 o o 419. 1
1 o o
1
o o 422. 1 o o o o
319. o 1 2 1 1 320. o o 2 o o 421.
423. o 1 424. 1 o 1 1 o
321. o 1 o 1 o 322. 1 o 1 1 o 425.
1
o
1
1 2
1
o 1 426. 1 1 2 1 o
323. o o o 1 o 324. 1 1 1 o o 427. 1 o 1 o 1 428. 1 1 o 1 o
325. o 1 2 1 1 326. o o o o o 429. o o 2 o 1 430. 1 1 1 1 o
327. 1 1 o 1 o 328. 1 1 2 1 1
431. 1 1 2 1 1 432. 1 o 1 o 1
329. 1 1 o 1 o 330. 1 o o o o 433. o 1 o 1 o 434. o o 1 o ll
331. o 1 o 1 1 332. o 1 1 o o 2 o o 436. o 1 1 1 o
o o o 435 1 1
333. 1 1 o 1 334. 1 1 1
437. o o (1 1 1 438. o o () o o
335. o o 1 1 o 336. o o o o o 439. o o o o o 440. 1 o () u o
337. 1 1 o 1 o 338. 1 o 2 o 1
44 \. l o 2 o 1 442. 1 1 () 1 (1
339. o 1 1 1 o 340. o 1 1 1 1
443. l () 2 l o -14-1. () l 1 1 o
341. 1 o 2 o 1 342. o 1 2 1 1
-1-15. l l 1 o 1 4-16. () l (1 o ()
343. 1 o o o o 344. o l l 1 1
-141. o o o l o 448 l 1 1 l 1)
345. 1 o 1 o 1 346. ! l 1 1 1
449. l 1 o l l 450. l o o 1) ()
347. o 1 o o o 348. l l o o o 1 l 2 l 1 -152. 1 1 2 l l
45 \.
349. o o l 1 1 350. 1 l l 1 1
453. l l 1 () l 454. o 1 1 1 ll
35 l. 1 o o o 1 352. o o 1 o o 455. l l 1 1 1 456. () l 1 l 1
353. 1 o l o l 354. (} l o l o -15i. 1 o l o () 458. l 1 u
355. l l 1 l 1 356. 1 o 2 o 1
459. o (1 2 ll (1 -Hill. 1 \) o 11 o
357. 1 o 1 1 o 358. o o l 1 o 461. l () () o o 46'.!. 1 1 1 11 1
359. l l o o o 360. 1 o 1 o o 46:t 1 1 () l (1 -16-1. (1 1 l 11 1
361. 1 o l o l 362. l l o l 1
465 l 1 l l 1 46(1. 1 () 11 11 11
363. l o o o o 364. l l l 1 l

684 685
Variable Variable
Individuo A B e D E Individuo A B e D E
Variable Variable 569. 1 1 1 1 1 570. o 1 o 1 1
B e D E Individuo A B e D E 571. 1 o 1 o o 572. 1 1 o 1 o
Individuo A o o
573. o o 2 o o 574. 1 o 1
467. 1 o 1 1 o 468. o 1 2 1 1 575. 1 1 1 o 1 576. o o o o o
469. o o o 1 o 470. 1 o 2 o o 577. 1 1 2 o 1 578. 1 o o 1 o
471. o o o o o 472. 1 o o o o 579. 1 o 2 1 o 580. o o o o o
473. o 1 o 1 1 474. o o o 1 o 581. o 1 1 1 o 582. 1 o o o o
475. o o o o 1 476. 1 o 1 o 1 583. 1 o 2 o o 584. 1 1 1 1 1
477. 1 1 o 1 o 478. 1 1 1 1 1 585. 1 o 1 o 1 586. 1 1 o 1 o
479. o 1 1 1 1 480. 1 o 1 o o 587. 1 o 2 1 o 588. o o 2 o o
481. o 1 2 o 1 482. 1 1 2 o o 589. o o 1 o 1 590. o 1 2 1 1
483. 1 1 o 1 o 484. o o 1 o o 591. 1 o 2 o o 592. 1 o o o o
485. 1 o o 1 o 486. 1 o o o o 593. 1 o 2 o o 594. 1 1 o o o
487. o o 1 o o 488. 1 1 2 1 1 595. 1 o 2 1 1 596. 1 1 1 1 1
489. o o 2 o 1 490. 1 1 o 1 1 597. o o o 1 o 598. 1 o 1 o o
491. 1 o 1 o o 492. o 1 1 1 1 599. 1 1 1 1 o 600. 1 o o o o
493. o o 1 1 o 494. 1 1 1 o 1 601. 1 1 1 1 1 602. 1 1 2 1 o
495. 1 o o o o 496. o o o 1 o 603. o o o o 1 604. o 1 2 o 1
497. o o 1 o o 498. 1 o o o o 605. o o 1 o o 606. 1 o 1 o o
499. 1 1 2 1 1 500. o o 1 o o 607. o 1 o 1 1 608. 1 1 2 1 1
501. 1 1 1 1 1 502. o o o o o 609. o 1 1 1 1 610. 1 o 1 o o
503. o o 1 o o 504. 1 1 2 1 1 611. o o 2 1 o 612. 1 o o 1 o
505. 1 o 1 o 1 506. o 1 1 o o 613. 1 o 2 o 1 614. o o o o o
507. o 1 1 1 1 508. 1 1 2 1 o 615. o o 2 o 1 616. 1 o o o o
509. o 1 1 o o 510. 1 1 2 1 1 617. o o o 1 o 618. o o o o o
51 l. 1 o o 1 o 512. 1 1 1 1 1 619. o o 1 o 1 620. 1 1 1 o o
513. o 1 1 1 o 514. o o o 1 o 621. o o o o o 622. 1 o 1 o o
515. 1 o o o o 516. 1 1 2 1 1 623. 1 1 2 1 1 624. 1 1 2 o o
517. 1 1 1 1 1 518. o o o o o 625. o o o 1 o 626. o o 2 o o
519. o 1 1 1 1 520. 1 1 o o 1 627. o o 2 1 1 628. 1 o o o o
521. 1 o o o o 522. 1 o 1 1 o 629. 1 o 2 o o 630. 1 1 2 1 1
523. 1 1 2 1 1 524. o 1 2 o 1 631. 1 o 1 o o 632. o o o o 1
525. 1 1 2 1 1 526. 1 1 1 1 1 633. 1 1 o 1 o 634. o 1 o 1 1
527. 1 o o o o 528. o 1 1 o o 635. 1 o 1 1 o 636. 1 1 1 1 1
529. o 1 1 o o 530. 1 o 2 o 1 637. 1 1 2 1 1 638. o o o o o
531. 1 o 1 o 1 532. 1 o o o o 639. 1 1 o 1 1 640. 1 o 1 o 1
533 1 o 1 o o 534. o 1 1 1 o 641. o 1 o o 1 642. 1 o 1 1 1
535. 1 o o 1 o 536. 1 1 1 1 o 643. 1 1 2 1 1 644. 1 o 2 o o
537. 1 1 o 1 o 538. 1 1 o 1 o 645. o o 2 o 1 646. o o 1 o o
539. 1 1 o 1 o 540. 1 o 2 o o 647. o o 1 o o 648. 1 1 o 1 o
541. 1 o 1 o 1 542. 1 1 1 o 1 649. 1 1 o 1 1 650. 1 1 1 o 1
543. 1 1 1 1 1 544. 1 o 1 o 1 651. 1 o 2 o 1 652. o o 1 o 1
545. o 1 o o o 546. o 1 1 1 1 653. o o o 1 o 654. o o o o o
547. 1 o 1 1 1 548. o o 1 o o 655. o 1 1 o 1 656. 1 1 o 1 o
549. o 1 1 1 1 550. 1 1 1 1 1 657. 1 1 1 1 o 658. o o 1 1 1
551. o o 2 o 1 552. o 1 1 1 o 659. 1 1 1 1 1 660. o 1 1 1 1
553. o o 1 1 o 554. o 1 2 o o 661. 1 1 1 o o 662. 1 o 2 o o
555. o 1 2 1 1 556. 1 o 1 o o 663. o o o o o 664. o o 1 1 o
557. o o 1 o 1 558. o 1 2 o o 665. o o 1 o o 666. 1 1 o 1 o
559. o 1 2 1 1 560. 1 o o o o 667. o o 1 o 1 668. 1 1 o 1 1
561. 1 o 2 o o 562. 1 o 1 o o 669. 1 o o o o 670. 1 o 1 o 1
563. 1 o 2 1 o 564. 1 o 1 o 1 ! 671. 1 o 2 o o 672. o o 1 o 1
565. o o o 1 o 566. 1 1 o 1 1 673. 1 o 1 1 1 674. o 1 2 1 1
567. 1 o o o o 568. o o o o o 675. o o o o o 676. o 1 1 1 1

686 687
Variable Variable
Individuo A B e D E lndi,·iduo A B e D E
Variable Variable
677. l o 1 o l 678. 1 o o o o
679. 1 o 1 1 o 680. () l 1 () 1 Individuo A B e D E lndii·iduo A B e D E
681. o u o 1 o 682. o o o o ()
o l
() () o o 684. o () 1 o 1 785. l l l l l 786. l l 2
683. l
l u 2 o () 686. l () l l () 787. o o l o l 788. l o l l l
685.
687. l l o l l 688. o o l o o 789. l l o l o 790. o o l o o
689. l l () () 1 690. () () () () o 791. l l l l o 792. l o o o l
o l l 1 l fi9~. () o 2 o o 793. l l o l o 794. l l 1 o 1
691.
o () 2 o () 69-1. l l () l 1 795. l l 2 1 l 796. l o o o o
693.
695. o () 2 () o 696. 1 1 1 1 () 797. l o o l o 798. o l 1 1 o
l o l 1 o 698. () () () 1 () 799. 1 o o l o 800. l o 2 o l
697.
699. o () 1 () 1 700. () () 1 () o 801. o o 2 o l 802. l o o o o
701. () () o o o 702. o o 1 1 () 803. o o 1 o l 804. 1 o o 1 o
l 1 o 1 () 704. () l 1 1 l 805. l o o o 1 806. 1 o o o o
703.
705. l () 2 o 1 706. () () 1 o () 807. l o l o l 808. 1 1 1 1 1
707. 1 () 1 o l 108. o o () o () 809. l l l 1 o 810. 1 1 1 o 1
SIL l l l 1 l 812. 1 1 2 1 o
709. 1 o 1 l u 710. () 1 () 1 ()
o o o 1
71 l. () () o o () 112. 1 () o o o 813. 1 o 1 l 814. 1 2
713. 1 l 1 () () 714. o () o () o 815. o o 1 1 l 816. 1 1 o 1 1
715. 1 o 2 () () 716. () o o o o 817. 1 o 2 o o 818. 1 1 1 1 1
717. 1 1 1 () 1 718. 1 1 () 1 1 819. o o o o o 820. o 1 o o l
719. 1 1 2 1 1 7'.!0. o 1 1 1 1 821. l o 2 o o 822. 1 o 1 1 1
o 823. l o 2 l 1 824. 1 o 2 o o
72 l. o () o 1 1 7'.Z~. 1 () 1 11
o o o 1 o o
2 1 7'.!-L () o 2 o 1 825. o l 1 826. 1
723.
-9·
1.:).
1
1
11
() o
()
() o 7'.!6. 11 1 o () () 827. o o 2 o 1 828. o o 1 o o
727. 1 1 () 1 1 l'.!K. () o 1 IJ 1 829. 1 o 2 o o 830. 1 1 2 1 1
,_..,_
-90 IJ 2 o () i'.~U. () () () IJ () 831. o 1 l 1 1 832. 1 1 2 o 1
7'.11. 1
()

1 2 1 () 1:1.2. 1 1 IJ 1 () 833. o 1 1 1 () 834. (1 l o 1 1


o 1 () o 835. o 1 o 1 l 836. o o 1 l l
733.
735.
1
1 1
2
o
1
1 ,,
() 1:\4.
l.'16.
11
()
1
() 1 IJ 1 837. 1 o o
o
o
o
o
o
838. o
o
1 1 1
o
1
731. o () () 1:~H. 1 1 () 1 1 839. l o 840. 1 1 1
739.
1
IJ
11
() 2 () 1 7 40. 1 () 11 1 o 841. o o o 1 o 842. 1 o 2 o o
7 41. 1 1 1 7-t'.!. 1 IJ IJ 1 o 843. .O 1 2 1 1 844. o l 1 1 1
743.
1
IJ ()
IJ
2 IJ 1 74-1. 11 1 1 1 1 845. o o o o (1 846. 1 o o o o
745. 1 () 2 () o 74ti. 1 1 1 1 1 847. 1 1 o 1 1 848. o 1 1 o 1
7-ti. 1 1 1 1 7-lK 1 11 o IJ IJ 849. 1 o 1 o o 850. 1 1 o 1 l
i-1~.
11
1 11 1 7:iO. IJ 1 11 11 11 851. 1 o o o o 852. o o 1 o o
751.
1
o
IJ
1
--,,
I J __ 1 1 1 1 1 853. o l 1 1 1 854. 1 o 1 1 l
7:'13.
1
1
1
1 2
1
1 11 7.14. 1 11 1 11 1 855. o 1 1 1 1 856. o l 1 1 o
755. 11 () 2 11 1 7:ifi. 1 11 1 11 IJ 857. l o 1 o o 858. 1 o o 1 o
757. i:iH 11 1 1 11 859. 1 1 o 1 o 860. 1 o 2 o 1
759
11
11
1
1
,,
1 1
IJ
l
1 ifiU. "11 11 2 1 11 861. 1 1 2 () o 8ó2. o o o
o
o
o
o
o
ifi l. 1 1
,, 1 1 7fi'.!. 11 11 11 11 11 863. o 1 1 1 1 864. 1 o
865. 1 o o o o 866. 1 1 o o 1
163.
765.
1
11
11
1
2
1
11
1
1
1
71i..J
¡¡¡¡-¡
1
11 "1 ,,1 11
1
1
1 867. l
o
l o
2
1
1
1
1
868.
870.
o
1 o
l o
o
1
o o
1
7ói. 11 ¡¡¡:,.; 1 11 1 IJ 1 869. 1
76~1.
1
1
1
11
1
1
IJ
1 1 ilíJ. 1 11 11 11 11 871. l 1 o 1 o 872. o ,l 1 1 o
¡; !. il~. 1 1 11 1 11 873. o o 2 1 o 874. o o l o 1
1 11 11 11 11
1 1 876. 1 o o o o
77::i. 11 IJ ii'·4. 1 1 11 1 11 875. 1 1 1
1 11 IJ
o o o o
715. 1 11 11 IJ IJ liti. 11 1 11 1 1 877. 1 o 2 () 878. 1 1
1 1 liK. 11 2 IJ 1 879. 1 o o o o 880. 1 () 1 o 1
111. 1 11 1 1
o o o o
ii~l. 11 1 11 1 1 l,'i(J. 11 1 11 11 1 88 J. o o 2 1 o 882. 1
it< l. 1 11 11 11 -; .... ~ 1 1 11 1 1 883. 1 o o () o 884. 1 1 2 1 l
"1 o o () 886. 1 () o 1 o

l
11 11 885. 1 l
1.-.:J. 11 1 1 1 iM !.
" " "
688 689
\rariable Variable \'ariable
Variable
A B e D E /11divid110 A 8 e D E Individuo A B e D E Individuo A B e D E
Individuo ,,
o o o o 990. 1 o
1) 1) 1 o 1 Ht'IH. 1
o ,,- o
1)
o
989. 1
o
2
o o
1
o 992. 1
1
o o
887.
889. o 1) 1 1 o 8(10. 1 ,,- 99 l. 1
o 994. 1 o o
1
o
891. o o o o 1 892. 1 1
1
-o 1
1
1
1
993.
995. 1
1
1
1
2 o
1 1
1 996. 1 1) 1
1
1) 1
893. o o 1 o 1 89--L 1
() () 1) 997. 1 1 1 1 1) 9(18. 1 1) 2 11
o 1 2 1) () H!Hi. 1 1)
89!1.
1 H98. o 1 ,,1 1 1 999. 1 o o o o 1000. 1 1 1 1
897. o 1 1 1
o o 1002. 1
899. () o () o () 900. 1 1
1
-1 1
1 o
1 100 l.
1003.
1
1
1
1
1)
o 1 o 1004. 1
1)
1
11
o
1)

1 11
90!. 1 o o 1 o 902. 1
o o o 1006. o o o o
903. 1 o 1 o 1 90-1 1 1 "- 1 1005. 1 1 IJ
]008. o o
2
o
1 1007. 1 IJ 1 1 1 () 11
905. IJ 1 IJ 1 {) 906. 1 1 ,,1 o
1
1010. o IJ 1
907. 1 1 1 1 {) 908. 1 ()
-1 11
1
1
1009.
I O11.
1
1
1
IJ
2
1
1
1
IJ
1 I O12. ll ()
"11 1)
11 11
909. 1 o 2 1 o 9(0. 1 1
IJ 1 IJ 1014. 1 1) 1 ll 1
1 1013. 1
,,-1
1 () IJ
IJ 2 ll ll 912. ll
911. 1 1 () 1015. o IJ 1 o 1 I O!h. 1 1 1 ll 1
91-1. () 1
913. o IJ 1 1) 1)
1 1 1 ll 1 1017. 1 o 1 1 1 1018. () 1 IJ 1 1
915. 1 ll 1 o 1 916.
11 1 () () 1019. () 1 o 1 () 1020. 1 () 1 ll ()
917. 1 {) 1 o 1 ~l!H. !
1 () 1 102 !. () o () o () 1022. 1 () () 11 ()
ll () 1 1 () 920. 1 ()
919. () () 1 11 () 102'.3. 1 1 1 1 1 1024. 11 () 2 11 1
9'2 l. 1 1 o 1 1 92'!.
1 () 1 o 1025. o 1 () 1 1 1026. 1 ll o () 11
1 1 1 1 1 !):!-1. ()
923.
1 () o 'J"..!6. 1 11 1 1 o 1027. 1 1 () 1 o 1028. 1 () 2 11 11
9'2:'i. 1 ()
1 1029. 1 1 1 1 1 1((10. 1 1 1 () 11
927. 1 1 1 {) () 928.
~!'.~O.
1
1
1
1
,,
11 1
1 1 l 031. o 1 () () () 10:12. 11 1 () 1 1
9'29. 1 1 1 1 1
1 () 1 1 (l:12. 1 () ()
,, 1 o 1033. 1 1 () 1 () I o:~4. 11 11 1 1 11
931. 1 o () 1 () I O:{ti. 1 () () () ()
9:13. 1 () o () o 9'.l..f. 1 1 ,, 1
1
1
1
1035.
1037.
1
1 1 1 1 1 1018. 1 () 2 () 1
93:). o 1 o o o 9:l!l. 1 1
() 1) 11 () 1039. IJ 11 1 1) 1) 1040. 11 1) 1) () 11
937. 1 1 2 1 1 9:H!. ()

ll o o o 9-10. () () () o () 104 l. 1 o 1 ll 1 1042. 1 ll 2 () ()


939. 1 () 1 () 1 1043. 1 1 1 IJ 11 104-1. () IJ () 1 ll
941. ll o 2 o () 9--12. ()
o 1 1 1045. 1 o 2 1 1) 1/J4fi. 1 1 1 1 1
o 1 o 9-!4. 1 1
943. 1 ()
9-lli. () o () o o 1047. 1) 1 1 1 1 1048. 1 o 1 () 11
945. 1 o 2 1 1
o 1 1 1049. 1 1) ll o 1) [0.10. 1) o o 11 o
947. 1 o 1 () o 9-18. () 1
o o o 1
1 o 2 o {) 9'.°)0. 1 1 o o o 1():) l. (J 1 1 1 1052. ll IJ
949. () () 1 1 () 1053. 1 1) 2 1 1) JO:í4. 1) 1) ll ll 11
951. o o 1 o 1 952.
1 1 1055. 1 1 2 1) 1 1056. 1 1 1) 1 1
1 1 o 1 9~14. ll 1 1
953. 1
1 1 95!i. 1 1 o 1 o 1057. 1) 1) 2 o 1 1058. 1 o 1 ll ll
955. 1 1 2 11 1 () 1()6(). 1 1) 1 1 1
o 95~. ll 1 1 1 1) 1059. 1 1
957. 1 o 1 ()
IO!i2. 1 1) 1) ll 11
959. o o () o 1) 9ti0. ll 11 1 ll 1 100!. 1 1) 2 1) 1)
,, o
1 o ll ~)ti'.?.. ll 1 ,,
{) ll 1 1063. () o 1 11 1 JIJ/'14. 1 11 ()
961. 1 IJ
9!l--J. 1 o 1 o !Ob5. 1 1 1 1 o J()f)fi. 1 ll 1 ll 1)
963. 1 1 o 1 1
1 1 1 10!:ii. ll ll 11 1 1) J OliH. 1 1 2 1 1
o o 9ll!i. 1) 1
965. o 1 1
!)!iH. 1 1 1 1 1 1069. 11 11 1) 1) 1) 1070. 1 o 1 1) 11
967. o 1 1 1 1 1
969.
971.
1
o
1
o
o
2 o
1 1
o
910.
97'.!.
1
()
()
()
1
1
()
()
{)
1
107 l.
[073.
1)
1
1
ll
1
1
1
11
1
1
1072.
1074.
1
1
1
1
1)
1
,, 11 "1
o 11 1 1 1 ]()75. 1 o 1 1 1) l!Jih. 1 1 1 1)
973. 1 o 1 1 1 914.
o 1 11 () 1077. o o 1 1 11 1078. 1 o ,,
2 11 1
975. 1) 1 () o o 97ti. 1
1 1079. 1 o 2 o 1 J080. 1 1 1 1
1 o 1 o 1 ~)78. 1 () 1 ()
977.
o o 1 1 11 ll o 108 !. 1 o 1 o o !OH'.?. () 1) ll 11 11
979. 1 o o 980.
() o o 1083. () o 11 1 1) JIJH4. 1) () 11 () 11
98 l. 1 o 1 ll 1 98'.!. 1 11
!O,'l5. 1 1 1 1 1 !OHfi. 1 11 11 1) 1)
983. 1 o {) ll 11 9H·I. 1
1
()
1
()
11
1
1 "o 1087. 1) o 1 1) 1 10:-irl. 1 1) 1
,, () 1
985.
987.
1)
1
1
1)
,,1 1
1
ll
ll
()8()
\lHK. 1 11 1 () 1 !089. 1 1 1) 1) 1 !O'.JO. 1 1 1) 1)

691
690
Bibliugraf{a 693
Variable Variable
Individuo A B e D E !11dil·id110 A B e D E Variable Variable
O IO!l':!. 11
,, 1 Jndii•iduo A B C D E b1dii,iduo A B e D E
109 l.
109:t o o 11 1 10()4. 1 o 1
1095. 1 o 1 1 1()(Ji). 11 o 1 1193. o o o o o 1194. o 1 o l
1097. 11 11 o 1 O I O~lH. 1 11 o,, o 1195. o 1 1 1 1 1196. 1 o 2 o l
1099. 1 11 1 11 l I l 00. 11 1 1 1197. 1 1 1 1 O 1198. O o 1 o 1
I ICll. 1 11 n o U 1102. 1 o 1 1199. o I O O 1200. 1 1 o o o
110'.l. 11 1 1 11 1 110--1. 1 11 o 11 o
110:1. n 11 o o O [ l(Hi. 1 o 2 o o
1107. 1 11 n 1 O 1 1(),'l. 1 1 o o 1 26. Ton1ando con10 referencia el ejercicio 25, seleccionar una muestra aleatoria
1109. o 1 1 1 1 1110. 1 1 o 1 u si1nple <le ta1naño I OOa partir de la población paraefectuaruna prueba y deter-
1111. 1 11 o 1 O 111':!. 1 o o 11 o minar si es posible concluir que existe una relación entre el grado de alco-
1113. 1 1 2 1 1 111-L o 11 1 o u holismo y la presión sanguínea alta en la población. Sea a= .05. Calcular el
1115. n o n o O 1116. 1 1 o 1 1
11 [7. o o 1 1 ! ll'l. 1 o 1 o o valor p. Con1parar los resultados con los de otros estudiantes.
1 1
11 1!l. 1 11 o o O 1120. 1 o o o o 27. To1nando con10 referencia el ejercicio 25, seleccionar una muestra aleatoria
1121. 1 o n 1 O 112':!. 1 1 1 1 1 simple de tamaño 100 de entre esa población y efectuar una prueba para
1123. 11 1 o o 1 1124. o 11 2 1 o averiguar si es posible concluir que hay una relación entre el sexo y el grado
1125. 1 11 o o o l l'..!!i. o 1 2 11
de tahaquismo en la población. Sea a= .05, determinar el valor p y comparar
1127. o 1 n
,, 1 O 11'.!H. o 11 o 11 o
1129. 1 1 1 o I l :~u. o 11 o o o los resultados con los de otros estudiantes.
113 l. 11 11 o 11 o 11 :12. 1 11 1) o 1 28. Ton1an<lo como referencia el ejercicio 25, seleccionar una muestra aleatoria
1133. 1 1 n 1 O 11 :~--t. 1 o 2 11 1 simple de tamaño 100 para averiguar si es posible concluir que existe una
1135. 1 1 o 11 1 1 l '.)!i. 11 o 1 1 relaciún entre el sexo y el grado de alcoholismo en la población. Sea a= .05.
1137. 1 11
,,
1 o ! 11 :1H. 1 1 " 1 1
Detcr111inarcl valor de py comparar los resultados con los de otros estudiantes.
1139. o o o J 1140. 1 o 11 11
29. Un grupo de especialistas en genética supone que en cierta población la dis-
1141. 11 1 1 O 1 1 ~ ':!. 11 o o 1 o
1143. 1 1 o 1 O I l ·l--1. 11 1 1 1 1 tribuciün de los grupos sanguíneos M y N es como sigue: MM, 30 por ciento;
1145. 1 11 1 o O l 14(i. 1 11 o 1 o MN. 50 por ciento, y NN 20 por ciento. En una muestra de 200 personas, 60, 96
1147. 1 o 1 o O 1 ¡.,¡¡.¡,_ 11 o o 11 11 y 40 pertenecen al grupo sanguíneo MM, MN y NN, respectivamente. ¿Propor·
1149. 1 1 1 1 O 11 :)0. 1 11 1 11 1
cionan estos datos la suficiente evidencia para descartar la duda de lo que supo-
115 l. n 1 1 1 1 11.~2. 1 1 1) 11 o
1153. 1 11 o o o· 1 i:i.i. 11 11 o 1 11 nen los especialistas? La probabilidad de cometer un error de tipo I es de .05.
1155. 1 o o o () 11:111. 11 11 o 1 o
I Li7. 1 o 1 o O 11:'IX. 1 1 1 11 1
1159. 1 11 1 11 I l ! tiO. 1 1 o 1 11
116 J. 1 1 l 111)2. 11 11 o 11 o
1163. o 1 '2 1
1 I l l!i--1. o 1 1 11
o
1
11
BIBLIOGRAFÍA _ _ _ _ _ _~ - - - - - - - - -
1165. 1 1 1 1 ! ! G!i. 1 1) 1
1167. 1 o 11 () 1 ]{j~ 11 11 1 o 11 Obras citadas
1169. 1 1 2 1 I l l 70. 1 o 1 1 11
1171. 1 1 1 o ! l /':!. 1 11 1 11 1 t. KARL PEARSO~, ··on the Criterion That a Given System bf Deviations from
1173. o o 2 11 o 11 i·t. 1 11 1 11 1
the Pr1ihahlc in the Case ofa Correlated System ofVariables Is Such That It
1175. 1 o 1 O 1 ! i{i. 1 1 o 1 11
Can Be árcasonably Supposed to Have Arisen from Random Sampling", The
1177. 1 o 2 1 l 11 iK. 11 1 o 1 o
1179. 1 o 2 11 I l lHO. 11 11 1 o o London, Edi11b11rgh and Dublin Philosophical ft-faga;:,ine and Journal of
1181. 1 11 o o O 1 ! k':!. 1 1) 1 11 1 Science. 5.ª Serie. 50 ( 1900), 157-175. Reimpreso en Karl Pearson's Early
1183. o 1 o 1 l I L-14. 1 11
,,o 1 o Stati.nica! Papers, Cambridge Uni versity Press, 1948.
1185. o o 1 o I l lH(l 1 1 ,, o 11
2. H. 0. LA:-.:C ASTER. The Chi-Squared Distrib11tio11, Wiley. Nueva York. J 969.
1187. o 1 o 1 1 ! !XX 1 1
,, 1 1
3. HARAI D CRAMER. Mathe111aticli/ 1\.fethods ofStaristics, Prince!on University
1189. o 1 o 1 11qo_ 1 11 11 1
1191. 1 11 1 1 0 ! l!I':! 1 1 11 1 1 Prcss. Princctun, N.J .. 1958.

692
1
Distribució11ji-cuadrada y el análisis de frecuencias Bibliografía 695
694
4. RAM C. DAHI YA y Jo11N GURLAND, "Pearson Chi-Squared Test of Fit with Ran- Revi.'itas y artículos
c.lon1 In1erv.1ls ... Bio111etrika. 59 ( 1972), 147-153.
s. G. S. W ATSoN, ··on Chi-Squarc Goodness-of-Fit Tests forContinuous Distri- l. Pcrr.R ALBRECHT. "On the Correct Use ofthe Chi-Squan: Goodness-of-Fit
butions". Jountal of rhe Royal Statistical Societ_\'. B, 20 ( l 958), 44-72. T cst .. , Sct11uliiu11:ian A e turial Journal, 1980, 149-160.
x~
6. G. S. \VATSON. "Thc Goodness-of-Fit Test f or Normal Distributions", Bio- 2. KEVIN L. ÜEI.UCCHl. "Thc Use and Misuse ofChi-Square: Lewis and Burke
111crrikl1, .¡..¡. ( 1957). 336-348. Rcvisilcd'", P.1·ycholvRical B11!/eti11, 9..J. ( 1983), 166-176.
7. G. S. \V A TSON, .. Sorne Recent Rcsults in Chi-Square Goodncss-of-Fit Tests", 3. CHRJS \V. HoRNI Ky JOHN E. ÜVERALL. "Evaluation ofThree Samp!e Size For-
Bionu:trics. /5 ( l 959). 440-468. n1ulac for 2 X 2 Contingency Tables", Jour11al of Ed11cational Statistics, 5
8. G. R. CHASE. ··on the Chi-Square Test When the Parameters Are Estimated (1980),351-362.
[ndependcnt!y of the Sample", Journal of the An1erica11 Statistical Associa- 4. W. c. 1\-1. KALLENBERG, J. ÜOSTCRHOFF y B. F. SCHR!EVER, "The Number of
tion. 67 ( l 972). 609-611. C!asses in Chi-Sq uared Goodne~s-of- Fi t Tests", Journal ofthe American Sta-
x
9. \V1LLIAM G. CocHRAN, ''The 2 Test of Goodness of Fit", Annals of Mathe- tistical Association. 80 ( 1985 ), 959-968.
111atical Statistics, 23 ( 1952), 315-345. 5. DoN LE\VIS y C. J. BURKE, "The Use and Misuse ofthe Chi-SquareTest", Ps)·-
10. W1LLIAM G. CocHRAN, ··sorne Methods for Strengthening the Common 2 x chvlogic(II B11lleti11, 46 ( 1949), 433-489.
Tests". Biontetrics. 10 ( 1954 ), 417-451. 6. DoN L1-:v.·1s y C. J. BLTRKE. "'Furthcr Discussion ofthe Use and Misuse ofthe
11. JOHNT. Rosco E y JACKSON A. BYARS, "An lnvestigation of the Restraints with Chí-Squarc Test"'. Psychological Bulletin, 47 ( 1950), 347-355.
Respccl to Sarnp[e Síze Commonly lmposedon the Use of the Chi-Square Sta- 7. A. J. VioLLAZ, "On thc Reliability ofthe Chi-Square Test", Metrika. 33 ( 1986 ),
tistic ··, J 011 rnal of the A111erica11 Statistical Association, 66 ( 197 l ), 7 55-759. 135-142.
12. JAMES K. YARNOLD, "'The Mínimum Expection in X 2 Goodness-of-Fit Tests
and the Accuracy of Approximations for the Null Distribution", Jo11r11al of
the A 111e rican Statistical Association, 65 ( 1970 ), 864-886.
13. MERLE W. TATE y LEONA. HYER, "Significance Values for an Exact Multi-
no1nial Test and Accuracy ofthe Chi-Square Approximation". U.S. Depart-
ment of Health, Education and We\fare, Office of Education, Bureau of
Research, agosto, 1969.
14. MALCOM J. SLAKTER, "Comparative Validity ofthe Chi-Square and TwoMo-
dified Chi-Square Goodness-of-Fit Tests for Small but Equa\ Expected Fre-
quencies", Bio111etrika, 53 ( 1966), 619-623.
15. MALCOM J. SLAKTER, "A Comparison ofthe Pearson Chi·Square and Kol-
mogorov Goodness-of-Fit Tests with Respect to Validity", Jour11al ofthe
A111erica11 Statistical Association, 60 ( 1965), 854-858.
16. R. C. LEV.'ONTlN y J. FELSENSTEIN, "The Robustness of Homogeneity Tests in
2 XNTables", Bio111etrics, 21 { 1965), 19-33.
17. F. YATES. "Contingency Tables Involving Smal! Numbers and the 2 Tests", x
Jour11al vf the Royal Statistical Society Supplen1e11t, l 1934 (Serie B), 217-
235.
x
18. J. E. GRIZZLE, "Continuity Correction in the 2 Test far 2 x 2 Tables", The
A111erica11 Statistician. 21 (octubre 196 7), 28-32.
19. H. O. LANCASTER, ··The Con1bination of Probabilities Arising from Data in
Di serete Distributions", Bio111etrika, 36 ( 1949), 370-382.
20. E. S. Pearson. "Thc Choice ofStatistical Test Illustrated on the Interpretation
of Data in a 2 X2 Table", Bio111etrika, 34 (1947). 139-167.
21. R. L. PLACKETT, "The Continuity Correction in 2 X2 Tables", Bio111etrika. 51
(1964).427-338.
11
Estadística no paramétrica
y de libre distribución

11.1 INTRODUCCIÓN _ _ _ _ _ _ _ _ _ _ _ _ __

Los procedimientos de inferencia estadística estudiados hasta este momen-


to, con una excepción, se clasifican como estadísticas paramétricas. La úni-
ca excepción son los usos de ji-cuadrada en la prueba de bondad de ajuste
y en la de independencia. Estos usos de ji-cuadrada se clasifican como
estadísticas no pará,netricas.
La pregunta obvia es: ¿cuál es ladiferencia?Para responder, es necesa-
rio recordar la naturaleza de los procedimientos de inferencia clasificados
como paran1étricos. En cada situación, el objetivo consistía en estimar o
probar una hipótesis acerca de uno o más parámetros de la población.
Además, el elemento fundamental de estos procedimientos fue el cono- :1
cimiento de la forma funcional de la distribución de la población de la cual
se extrajeron las muestras que proporcionaron la base para la inferencia.
Un ejemplo de una prueba estadística pararnétrica es la ampliamente
utilizada prueba t. Los usos más comunes de esta prueba son los de probar
una hipótesis acerca de la media de una sola población o la diferencia entre
las medías de dos poblaciones. Una de las suposiciones que fundamentan
el uso válido de esta prueba es el que la población o poblaciones de donde
proceden las muestras tengan, al menos, una distribución aproximadamente
norrr,_1l.
En este capítulo se estudian procedimientos que no se refieren a paráme-
tros de población ni dependen del conocimiento de la población de la que
se extraen las n1uestras. Estrictamente hablando. sólo aquellos procedí-

697
698 f,,'stad{stica no para111étrit·a y de libre distribución Escalas de 111edicitin 699
mientas que prueba hipótesis que no son afirmaciones acerca de los paráme- En un libro de texto de introducción general, la limitación del espacio
tros de la población, se clasifican como no paramétricos, mientras que aque- impide la presentación de más de una muestra de procedimientos no
llos que no hacen suposición alguna acerca de la población de la cual se paramétricos. Otros procedimientos estudiados a un nivel introductorio o
extraen las n1uestras, se conocen como procedi111ientos de libre distribu- intermedio se encuentran en los textos de Conover6 y Siegel y Castel! an, 5
ción. A pesar de esta diferencia, se acostumbra utilizar los términos no Bardley. 7 Kraft y Van Eeden, 8 Tate y Cielland,9 Gibbons,10 MosteUer y
libre distribución indistintamente, y analizar los diver-
para111érricos y <Íe Rourke, 1l Pierce, 12 Noether, 13 Hollander y Wolfe, 14 Daniel, 15 Marascuil
sos procedi1nientos de ambos tipos bajo el título de estadística no parcunétri- y McSweeney 16 y Lehmann. 17 Otras obras con mayor rigor matemático son
ca. A partir de aquí se seguirá esta convención. Este tema se estudia en º
las de Gibbons, 2 Hajek 18 y Walsh. 19 ·2 Savage realizó una bibliografía de
Kenda[I y Sundruml y en Gibbons. 2 estadísticas no paramétricas.
Lo supuesto anteriormente implica las dos siguientes ventajas de las
estadísticas no paramétricas.
11.2 ESCALAS DE MEDICIÓN _ _ _ _ _ _ _ _ _ __
1. Pennitcn la prueba de hipótesis que no son afirmaciones acerca de los valores
de los parámetros de la población. Algunas pruebas de ji-cuadrada de bondad En la sección anterior se menciona que una de las ventajas de los proce-
de ajuste y de independencia son ejemplos de pruebas que tienen estas ven- dimientos estadísticos no paramétricos es el hecho de que pueden utilizarse
tajas.
con datos basados en una escala de medición débil. Para comprender com-
2. Las pruebas no paramétricas pueden utilizarse cuando se desconoce la dis-
pletamente el significado de esta afirmación, es necesario conocer o enten-
trihución de la población de la cual se extraen las muestras.
der el significado de medición y de las diversas escalas de medición que se
utilizan con más frecuencia. Este tema se estudia con mucho detalle en una
Algunos autores enumeran otras ventajas, co·mo, por ejemplo, Gib-
gran cantidad de obras, específicamente en Stevens.22,23
bons,2 Blum y Fattu, 3 Moses 4 y Siegel y Castellan. 5 Además de las ven-
tajas previamente mencionadas, las siguientes aparecen con mayor fre-
l\rledición Se define como la asignación de números a objetos o eventos
cuencia.
de acuerdo con un conjunto de reglas. Las diversas escalas de medición son
consecuencia del hecho de que la medición puede llevarse a cabo según di-
3. Los procedi1nientos no paramétricos son más fáciles de calcular y, en conse-
cuencia, se aplican con mayor rapidez que los procedimientos paramétricos. ferentes conjuntos de reglas.
Ésta puede ser una característica conveniente en ciertos casos, pero cuando el
tien1po no es un factor importan1e merece poca prioridad como criterio para Escala nominal La escala de medición más baja es la escala nominal.
elegir una prueba no paramétrica. Como su non1bre lo indica, consiste en "nombrar" las observaciones o clasi-
4. Los procedin1ientos no paramétrlcos pueden aplicarse cuando los datos que sir- ficarlas en varias categorías mutuamente excluyentes y colectivamente
ven para el análisis constan simplemente de categorías o clasificaciones. Es exhaustivas. La práctica de utilizar nún1eros para distinguir entre diversos
decir, los datos pueden no estar basados en una escala de medición lo sufi- diagnósticos médicos constituye una medición sobre una escala nominal.
cientcrncntc sólida como para permitir las operaciones aritméticas necesarias Otros ejen1plos incluyen dicotomías como masculino-femenino, sano-
para ! levar a cabo los procedimientos paramétricos. El tema de las escalas de enfermo. de rr1enos de 65 años de edad y de 65 en adelante, 11iño-adulto y
n1edición se analiza con más detalle en la siguiente sección. casado-soltero. Como se aprecia, en ciertas condiciones, la prueba de ji-
cuadrada puede utilizarse para probar hipótesis acerca de la frecuencia de
Aunque las estadísticas no paramétricas tienen ciertas ventajas, tam- ocurrencia de observaciones en varias categorías nominales.
bién deben reconocerse sus desventajas. !vfoses 4 destaca las siguientes.

l. El uso de procedim icntos no paramétricos con datos que pueden manejarse con Escala ordinaria Siempre que las observaciones no sólo difieran de ca-
un procedin1icnto paramétrico produce un desperdicio de información. tegoría a categoría. sino que puedan clasificarse por rango de acuerdo con
2. La aplica-:ión de algunas de las pruebas no paran1étricas puede ser muy labo- algún criterio, se dice que se miden sobre una escala ordinal. Los pacientes
riosa para n1ucstras grandes. conva!escientes pueden clasificarse como no mejorados, mejorados y bas-
700 Estadística nu paramétrica y de libre distribución Prueba del signo 701

tan te mejorados. Las personas pueden clasificarse de acuerdo con su estado dad de las razones, así como la igualdad de los intervalos. Y para esta escala
socioeconómico como pobres, de clase media o ricos. La inteligencia de los es fundan1ental un punto cero verdadero. La medición de rasgos tan fami-
niños puede estar porenci1na del promedio, en el promedio o por debajo de liares como altura, peso y longitud, hacen uso de este tipo de escala. Cuan-
éste. En cada uno de estos ejemplos, todos los miembros de cualquiera de las do se ha logrado la escala de razones para la medición, puede utilizarse
categorías se consideran iguales, pero los miembros de una categoría se con· cualquier procedimiento estadístico siempre que se cumplan las suposi-
sideran inferiores, peores o menores que los de otra categoría que, a su vez, ciones específicas del modelo que se utiliza.
guardan una relación similar con los de otra categoría. Por ejemplo, un Mue hos autores, como Conover6 y Siegel y Castellan, 5 indican que las
paciente bastante 1nejorado está en mejor estado de salud que uno clasifica- distintas pruebas estadísticas requieren diferentes escalas de medición.
do como mejorado, mientras que un paciente que ha mejorado está en n1ejor Aunque al parecer esta idea se sigue en la práctica, Anderson, 24 Gaito,25
condición que uno que no ha mejorado. Por lo general, es imposible inferir Lorct2 6 y Amstrong 27 presentan otros puntos de vista interesantes. Este tema
que la diferencia entre los 1niembros de una de las categorías y la categoría se estudia también en Borgatta y Bohrnstedt. 28
inmediata adyacente sea igual a la diferencia entre los miembros de ésa ca-
tegoría y los miembros de la categoría adyacente a ella. Et grado de mejoría
entre los no mejorados y los mejorados quizá no sea el mismo que el que existe 11.3 PRUEBA DEL SIGNO _ _ _ _ _ _ _ _ _ _ _ __
entre los mejorados y los bastante mejorados. La implicación es que si se
hiciera una división más fina que condujera más categorías, éstas podrían La prueba r. estudiada en los capítulos anteriores no es estrictamente váli-
también ordenarse de manera semejante. La función de los números asigna- da para probar 1) la hipótesis nula de que la media de una población es igual
dos a datos ordinales es la de ordenar (o asignar una categoría según el ran- a algún valor particular, o bien. 2) la hipótesis nula de que la diferencia
go) las observaciones desde las n1ás bajas hasta las más altas, de aquí el tér- entre las medias de dos poblaciones es igual a cero, a menos que se sepa
mino ordinal. Se han desarrollado numerosas pruebas estadísticas no (o el investigador se incline a suponer) que las poblaciones en cuestión
paramétricas para utilizarlas con datos ordinales. siguen unadistribución normal. El caso 2 se reconocerá como una situación
que se analiza n1ediante la prueba de co1nparación por parejas en el capí-
Escala de intervalos La escala de inter\·alos es una escala más especia-
tulo 6. Cuando no es posible hacer suposiciones de normalidad o cuando
lizada que la nominal o la ordinal en el sentido de que, con esta escala, no
los datos disponibles son categorías en lugar de medidas sobre una escala
sólo es posible ordenar las mediciones, sino que se conoce también la dis-
de intervalos o de razones, debe buscarse una prueba alternativa. Aun cuan-
tancia entre dos mediciones cualesquiera. Por ejemplo, se sabe que la dife-
do se sabe que la p1i.iéba r e·s casi insensible a las violaciones de la suposi-
rencia entre una medida de 20 y una medida de 30 es igual a la diferencia entre
ción de norn1alidad. hay casos en que resulta preferible una prueba alter- i
las medidas de 30 y 40. La capacidad para hacer esto implica el uso de una
nativa.
distancia unitaria y un punto cero, los cualeS son arbitrarios. El punto selec-
Una prueba no paramétrica que se utiliza con frecuencia y que no
cionado como cero no es un cero verdadero en el sentido de que no indica una
depende de las suposiciones de la prueba r. o de mediciones que exceden
ausencia total de la cantidad que se está midiendo. Quizá el mejor ejemplo
la escala ordinal. es la prueba del signo. Esta prueba se centra en la media-
de una escala de intervalos es la forma en que generalmente se mide la tem-
na, n1ás que en la inedia. con10 una medida de tendencia central o de loca-
peratura (grados Fahrenheit o Celsius). La unidad de medición es el grado,
lización.
Yel punto de comparación es el que se selecciona arbitrariamente como "cero
La mt>diana y la media serán iguales en distribuciones simétricas.1.a
grados", el cual no implica una ausencia de calor. La escala de intervalos, a
única suposición que fundatnenta la prueba es que la distribución de la
diferencia de las escalas nominal y ordinal, es una escala realmente cuanti-
variable de interés es continua.
tativa. Cuando se logra la escala de intervalos para la medición y se satis-
La prueba del signo toma su nombre del hecho de que los signos más y
facen las suposiciones del modelo. pueden utilizarse los procedimientos
1nenos, y no los valores nun1éricos. proporcionan los datos en que se uti-
usuales de estadísticas paramétricas, como la prueba t y la prueba F
lizan en los c,í.!culo.s. Se ilustrará el uso de esta prueba primero en el caso
Escala de razones El nivel más alto de rr1edición es la escala de razones. de una sola n1ues1ra y. a continuación. 1nediante un ejemplo que i 1npl ique
Esta escala se caracteriza por el hecho de que puede deter1ninarse la igual- ¡nuestra~ por parejas.
702 Estadística no paramétrica y de libre distribución Prueba del signo 703
Tabla 11.3.J. Calificaciones en la prueba
/f,: P(+) > P(-) alternativa unilateral
de apariencia general de 10 niñas con
retraso mental H 11 :P(+) <P(-) aiternativa unilateral

Niña Calificación Niña Calificació11


ll,: P(+) * P(-) alternativa bilateral

Si la hipótesis alternativa es
1 4 6 6
2 5 7 10
3 H,:P(+)>P(-)
8 8 7
4 8 9 6
5 9 10 6 un núrnero suficientemente pequeño de signos me.nos causa el rechazo de H .
0
La estadística de prueba es el número de signos menos. En forma análoga, si la
Ejemplo 11.3.1 Un grupo de investigadores desean saber si al instruir en hipótesis alternativa es
cuidados y aseo personal a un grupo de niñas con retraso mental mejoraría
su apariencia. Se eligieron 10 niñas, aleatoriamente, en una escuela para H,: P(+) < P(-)
niños con retraso mental, para recibir instrucción especial de cuidado y
aseo personal. Dos semanas después de concluir el curso de instrucción, un nún1ero suficientemente pequeño-de signos más causa el rechazo de H . La
0
las niñas fueron entrevistadas por una enfermera y una trabajadora social, estadística de prueba es el número de signos más. Si la hipótesis alternativa es
quienes asignaron a cada niña una calificación basada en su apariencia en
general. Los investigadores creían que, como máximo, las calificaciones HA:P(+) "P(-)
alcanzarían el nivel de una escala ordinal. Creían que aunque una califi-
un número suficientemente pequeño de signos menos o signos más causa el re-
cación, digamos, de 8 representaba una apariencia mejor que una de 6, no
chazo de la hipótesis nula. Se puede tomar corno estadística de prueba al signo
podían decir que la diferencia entre las calificaciones de 6 y 8 era igual a la que ocurra con menor frecuencia.
diferencia entre las calificaciones 8 y I O, o bien, que la diferencia entre las S. Distribución de la estadística de prueba. El primer paso para determinar la na-
calificaciones de 6 y 8 representaba el doble de mejora que la diferencia turaleza de la estadística de prueba es analizar la tabla 11.3.1 para determinar
entre las calificaciones 5 y 6. Las calificaciones se muestran en la tabla cuáles calificaciones caen arriba y cuáles caen abajo de la mediana hipotética
11.3.1. Se desea saber si es posible concluir que la calificación mediana de de 5. Si el signo más se le asigna a las calificaciones que caen arriba de la media-
la población de la que se supone se extrajo la muestra es diferente de 5. na hipotética y el signo menos a las que caen por abajo, se obtienen los resulta-
dos que se muestran en la tabla 11.3.2.
Solución Si la hipótesis nula es verdadera, esto es, si la mediana fuera, en efecto, 5,
se esperaría que el número de calificaciones que caen por arriba y por abajo de
l. Datos. Ver el planteamiento del problema. 5 fuera casi igual. Esta forma de razonamiento sugiere otra manera en la que
2. Suposiciones. Se supone que las mediciones se tomaron para una variable con- podría haberse enunciado la hipótesis nula, a saber, que la probabilidad de un
tinua. signo 1nás es igual a la probabilidad de un signo menos. Estas probabilidades
3. Hipótesis son. cada una, iguales a .5. Simbólicamente, la hipótesis sería
H0 : la mediana de la población es 5.
HA: la mediana de la población es diferente de 5. H 0 : P( +) - P( - ) - .5
Seaa=.05.

4. Estadística de prueba. Laestadísticade prueba para la prueba del signo es el número Tabla 11.3.2. Calificaciones por arriba(+) y por debajo(-) de la 1nediana hipotéti-
observado de signos más o de signos menos. La naturaleza de la hipótesis alter- ca con base en los datos del ejemplo 11.3. l.
nativa determina cuál de estas estadísticas de prueba es conveniente. Niña 2 3 4 5 6 7 8 9 ro
En una prueba dada. cualquiera de las siguientes hipótesis alternativas puede
Calificación relativa o + + + + + + + +
ocurrir. a la mediana hipotética
704 Estadística no paran1étrica y de libre distribución Prueba del signo 705
En otras palabras, se espera casi el mismo número de signos más que de signos 8. Deci.1·1()11 es1ad1\tica. En la Labia A se encuentra
menos en la tabla 11.3.2 cuando H0 es verdadera. La observación de está tabla
revela una preponderancia de signos más; específicamente, se observan ocho P(k :S 119,.5) = .0195
signos más, un signo menos y un cero, el cual se asignó a la calificación que
cayó exactamente en la mediana. El procedimiento habitual de manejarlos ceros Con una prueba bilateral. un número suficientemente pequeño <le signos
es eliminarlos del análisis y reducir igualmente 11. el tamaño de la muestra. Si tnenos o signos n1::is puede causar e! rechazo de la hipótesis nula. Dado que, en
se sigue este procedimiento, el problema se reduce a nueve observaciones, de el cjernplo. se tiene un menor nún1cro de signos menos, la atención se centra
las cuales ocho son signos más y uno es menos. en estos signos n1ás que en los signos más. Al asignar a a el valor .05, se dice
Dado que el número de signos más y menos no es el mismo, uno se pregunta que si el nú1ncro de signos 1ncnos es tan pequeño que la probabilidad de obser-
si la distribución de los signos es lo suficientemente desproporcionada como var t,111 p(l<.."OS o. incluso, n1enos, es menor que .025 (la mitad de a) se rechaza
para arrojor alguna duda sobre la hipótesis. Dicho de otra forma, uno se pre- la hip(ítcsis nul..1, la probabilidad .O l 95 es menor que .025. Por lo tanto, se re-
gunta si este pequeño número de signos menos pudo ser únicamente resultado chaza la hip(ítcsi.\ nula.
del azar cuando la hipótesis nula es verdadera, o bien, si el número es tan pequeño 9. Co11c!11.1"i1J11. Se concluye que la calificación mediana no es 5. El valor p para
que un elemento que no es el azar (es decir, una hipótesis nula falsa) es respon- cs\a prucha es 2(.0195) = .0390.
sable de los resultados.
Con base en lo aprendido en el capítulo 3. parece razonable concluir que Cuando los datos que van a analizarse constan de observaciones en
las observaciones de la tabla 11.3.2 constituyen un conjunto den variables alea- parejas y no se satisfacen las suposiciones que fundamentan la prueba t, o
torias independientes de una población de Bernoulli con parámetro p. Si k = la 1a escala de 1nedición es débil, puede utilizarse la prueba del signo para pro-
estadística de prueba, la distribución muestral de k es la distribución binomial bar la hipótesis nula de que la diferencia entre las medianas es igual a O.
de probabilidad con parámetro p =.5. si la hipótesis nula es verdadera.
Una forn1a alternativa de enunciar la hipótesis nula es la siguiente:
6. Regla de decisión. La regla de decisión depende de la hipótesis alternativa.

Para HA: P(+) > P(-), se rechaza //0 si. cuando H 0 es \"erdadera, la proba-
P(X, > Y,) = P(X, < Y,) = .5
bilidad de ohservar k, o n1enos, signos menos es menor o igual que a.
De 1as calificaciones por parejas, se toma una, por ejemplo Y¡, y se res-
Para HA: P(+) < P(-·), se rechazaH 0 si, cuando H 0 es verdadera, la proba- ta de la otra calificación X,. Si Y¡ es 1nenor que X, el signo de las diferencias
bilidad de observar k o menos signos más es menor o igual a a. es+, y si Y, e:,.. mayor que X;, el signo de la diferencia es-. Si la diferencia
entre las n1edianas es O, se esperaría que una pareja seleccionada al azar
Para HA: P( +) ta P(-), se rechaza H 0 si (dado que H 0 es verdadera) la pro- tenga exactamente la mis1na probabilidad de dar un signo+ o - cuando se
babilidad de obtener un valor de k tanto o má5 extremo como el que se calculó, hace la re,ta. Puede enunciarse la hipótesis nula como sigue:
es menor o igual que a/2.
H,,: P( +) = P( - ) = .5
Para C!>te ejemplo. la regla de decisión es: rechazar H0 si el valor p de la
estadí~tica de prueba es menor o igual que .05.
En una 1nue'.'itraaleatoria formada por parejas, se esperaría que el número
7. Cálculo de la esu1dística de prueba. Es posible determinar que la probabilidad
de:,.. igno:,.. + y - sea casi igual.Si existen más signo!i + o-que los que pueden
de observar x o menos signos menos. dada una muestra de tamaño 11 y parámetro
P, evaluando la siguiente expresión: a tribu irse ún ican1ente al azar. cuando la hipótesis nula es verdadera, se ten·
drán ciertas dudas acerca de la veracidad de la hipótesis nula. Mediante la

P(k ::S xln, p) """ ,.c,p',.~,


'
lt=O q (11.3.l)
prueba dl'I '.'iigno, es posible determinar cuántos signos de uno u otro tipo
son 111á.-. de los que pueden atribuir'.->e únicamente al azar.

Para el cjcn1p!o se calcula Eje,uplo //.3.2 lJn equipo de inve'.'itigación dental quería saber si enseñar
a la grnlt.: a ct.:pi!L.tr'.->e lo'.-> dientes sería benéfico. Se formaron doce parejas
9 C1J (.5) 0 (.5¡'•-n.,.. \JC 1 (.5J 1(.5¡'•- 1
.OOIY5 + .017.18 .O l Y5 de pac Íl'l1Le..., Je una e I ín ica dental clasificándolos por factores con10 edad,
Estadística no paramétrica y de libre distribución Prueba del signo 707
706
se'(O. inteligencia y calificaciones iniciales de higiene bucal. Un miembro 4. Estadística de prueba. La estadística de prueba es k = 2, el número de signos
de cada pareja recibió instrucción acerca de la forma de cepillarse los dientes más.
y otros temas de higiene bucal. Seis meses después, los 24 individuos fueron 5. Distribución de la estadística de prueba. k presenta una distribución binomial
exarninados y se les asignó una calificación de higiene bucal mediante el con parámetros II y .5 si H0 es verdadera.
examen de un especialista de higiene dental, quien ignoraba cuáles per- 6. Regla de decisión. Se rechaza H O si P(k S 21 t I .5) S .05.
sonas habían recibido la instrucción. Una calificación baja indica un alto 7. Cá!ctdo de la estadística de prueba. El procedimiento es idéntico al que se uti-
liza para una sola muesi:ra, una vez que se obtienen las diferencias para cada
nivel de higiene bucal. Los resultados se muestran en la tabla 11.3.3.
par. Al efectuar las restas, se obtienen los resultados que aparecen en la tabla
11.3.4.
Solución La naturaleza de las hipótesis indica una prueba unilateral, por lo que la to-
talidad de ex= .05 está asociada con la región de rechazo, que se compone de todos
l. Datos. Ver al planteamiento del problema. los valores de k (donde kes igual al número de signos+) para los que la probabi-
2. Suposiciones. Se supone que la población de diferencias entre los pares de cali- lidad de obtener una cantidad igual o menor de signos más atribuible al azar cuan-
ficaciones es una variable continua. do H0 es verdadera, es menor o igual que .05. En la tabla 11.3.4 se aprecia que el
3. Hipótesis. Si las instrucciones producen efectos benéficos, este hecho se refle- experimento proporciona un cero, dos signos más y nueve signos menos. Si se
ja en las calificaciones asignadas a los miembros de cada par. Si se toman las =
elimina el cero, el tamaño real de la muestra es n l l con dos signos+ y 9 signos
diferencias entre X¡- Y; es de esperarse que haya más signos-que signos+ si - . En otras palabras, puesto que un número "pequeño" de signos+ causa el re-
la instrucción resulta benéfica. Si, en efecto, la instrucción es benéfica, la media- chazo de la hipótesis nula, el valor de la estadística de prueba esk = 2.
na de la población hipotética de todas las diferencias sería menor que O.es decir, 8. Decisión estadística. Lo que se pretende es conocer la probabilidad de obtener
negativa. En caso contrario, si la capacitación no tiene efectos, la mediana de no más de dos signos más en las once pruebas, cuando la hipótesis nula es ver-
esta población sería cero. Las hipótesis nula y alternativa son, por lo tanto, dadera. La respuesta se obtiene al evaluar la expresión binomial adecuada. Para
este ejen1plo se tiene
H 0 : la mediana de las diferencias es cero [P( +) = P{-)]
HA: la mediana de las diferencias es negativa [P{ +) < P(-)] '
Sea ex= .05. P(k s 21il,.5) = ,~o 11 C, (.5)'(.5) 11 - '

Al consultar la tabla A, se obtiene una probabilidad de .0327. Puesto que 0327


Tabla 11.3.3. Calificaciones de higiene bucal de 12 es menor que .05 es posible rechazar a H0 .
individuos que recibierOn instrucciones de higiene 9. Conclusión. Se concluye que la mediana de lasdiferenciases negativa. Esto es,
bucal (X ) y 12 individuos que no las recibieron(~). se concluye que la capacitación fue benéfica. Para esta pruebap = .0327.
1
Puntuación
Como se ha demostrado, la prueba del signo puede emplearse con una
Recibieron No recibieron
Par (X,) (Y,) sola muestra o con dos de ellas, en las que cada miembro de u nade las mues-
tras se une con uno de los miembros de la otra para formar una muestra por
1 1.5 2.0 parejas. También se ha visto que la hipótesis alternativa puede conducir a
2 2.0 2.0
3 3.5 4.0 una prueba unilateral o a una prueba bilateral. En cualquier caso, la aten-
4 3.0 2.5 Tabla 11.3.4. Signos de diferencias (X. - Y.) en las calificaciones de higiene bucal
5 3.5 4.0 . J J
3.0 de 12 individuos que recibieron instrucción (X-) y 12 sujetos que no recibieron
6 2.5 . . 1
i 2.0 3.5 instrucciones ( Y¡).
8 l.5 3.0 Par
9 1.5 2.5 2 3 4 5 6 i 8 9 10 11 12
10 2.0 2.5
11 3.0 2.5 Signos de las dif. o + +
12 2.0 2.5 en las calificaciones
708 /:,'.<;tad1:<;tica no para1nétrica y de libre distribucián Ejercicios 709

ción se centra en el .signo 1nenos frecuente y se calcula la probabilidad de se utiliza la corrección de continuidad de .5. La estadística de prueba es
obtener un número menor o igual de signos de es1e tipo. entonces
Se utiliza e I signo que .se presenta con menos frecuencia con10 estadís-
tica de prueba debido a que las probabilidades binomiales de la tabla A son (k ± .5) - .5n (!l.3,2)
' = .5Vn
probabilidades de ..menor o igual que". Al u tilizarel signo menos frecuente,
la probabilidad requerida se obtiene directamente de la tabla A sin tener
que hacer resta alguna. Si las probabilidades de la tabla A fueran proba- la cual se compara con el valor de z de la distribución normal estándar que
bilidades "1nayor o igual que", como en las tablas de la distribución bino- corresponde al nivel de significación elegido. En la ecuación J 1.3.2 se uti-
mial, se utilizaría como estadística de prueba el signo más frecuente, para liza k + .5 cuando k < 11/2, y k- .5 se utiliza cuando k > n/2.
obtenerdirecta1nente la probabilidad deseada sin tener que hacer resta algu- Aden1ás de las referencias ya citadas, la prueba del signo se estudia con
na. De hecho, en los eje1nplos puede utilizarse como estadística de prueba detalle en Dixon y Mood.29
el signo 1nás frecuente, pero dado que la tabla A contiene probabilidades
de "menor o igual que", se tendría que hacer una resta para obtener la pro- EJERCICIOS~~~~~~~~~~~-~~~~-
babilidad deseada. Considérese el últimoeje1nplo. Si se utiliza como estadís-
tica de prueba el signo más frecuente, que es el signo-, el valor de la esta- 11.3.1 A una n1uestra aleatoria de 15 estudiantes de enfermería se les hizo una
dística es 9. La probabilidad deseada es por lo tanto la probabilidad de 9 o prueba para medir su nivel de autoritarismo. Se obtuvieron los siguientes
más signos n1enos, cuando 11-:;:: 11 y p-:;:: .5. Es decir, se necesita re"u!tados

P(k ac 9111,.5) Número de estudiante l 2 3 4 5 6 ; 8 9 lll ll 12


Calificación
de autoritarismo i5 90 85 l !O 115 95 132 H 82 104 88 124
Sin en1bargo. dado que la tabla A contiene probabilidades de ··menor o igual
Número de estudiante 13 14 15
que". de be obtenerse esta probabilidad mediante resta. Es decir,
Calificación
de autoritarismo 110 76 98
P(k ac 9111,.5) = 1 - P(k 5 8111,,5)
1 - ,9673
= ,0327 Probar al nivel de significación de .05 Ja hipótesis nula que indica que la
mediana de la calificación para la población de la que se extrae la muestra
que es el resultado obtenido anteriormente. es de I OO. Determinar el valor de p.
11.3.2 A un grupo de 20 pacientes que asistían a una clínica de fisioterapia se les
Tamaño de la muestra En el capítulo 4 se estudia que, cuando el tamaño son1etió a una determinada prueba, diseñada para medir su ni\"el de moti-
vación. antes de que participaran en un programa experimental de remo-
de la muestra es grande y p estácercano a .5, la distribución binomial puede
tivación. Al término del progra1na, los pacientes fueron sometidos a una
ser aproxi1nada por la distribución normal. La regla empírica u!ilizada dice
nueva prueba. Las calificaciones antes y después son las siguientes:
que la aproximación normal es conveniente cuando np y nq son mayores
que 5. Cuando p = .5, como se establece en las hipótesis de los ejemplos Calificación Calificación
estudiados, una muestra de tamaño 12 satisfaría la regla empírica. Siguiendo Pacienre Anres Después Paciente Antes Después
este razonamiento, puede utilizarse la aproximación normal cuando se usa
ro 15 11 16 24
la prueba del signo para probar la hipótesis nula de que la mediana o la dife- 2 8 10 12 10 23
rencia de medianas es Oy n es mayor o igual que 12. Gibbons:.i está de acuer- 3 5 10 13 15 25
do con estas sugerencias, aunque Siegel y Castellan 5 recomiendan que 11 4 14 14 14 5 15
5 15 25 15 24 20

¡
sea. al menos, 25. Dado que el procedimiento implica la aproxi1nación de 6 22 20 16 20 o-
una di.,;tribución continua n1ed iante una distribución discreta, en general. 7 1; 20 17 14

2-t
r.·.\·tadú·tica no para,nétrh·a y de libre distrihu,:i<ín Prueba ll-:ilcoxo11 de calificació,r co11 signo 711
710
menos en una escala de intervalos, la prueba del signo tal vez no sea acon-
Calificación Calificación
sejable porque podría desperdiciarse mucha información contenida en los
Pacienre Antes Después Paciente Antes Después datos. Un proceditniento más adecuado puede ser la prueba Wilcoxon de
8 10 22 18 JO 23 calificación con signo, la cual utiliza las magnitudes de las diferencias entre
9 8 16 19 15 25 las mediciones y un parámetro de ubicación según una hipótesis en lugar
10 20 18 20 14 25 de los signos de Ias diferencias.
La prueba Wilcoxon para ubicación se basa en las siguientes suposi-
Unacalifi.:ación alta indica un nivel alto de motivación. ¿Qué se puedecon-
ciones sobre los datos.
clui r de estos datos? Sea a= .05. Determinar el valor de p.
11.3.3 Una n1uestra de 15 pacientes que padece de asma participó en un experi-
l. La n1uestra es aleatoria.
n1cnco para estudiar los efectos de un nuevo tratamiento sobre la función
2. La variable es continua.
puln1onar. U nade las n1ediciones que se registraron fue la de volumen espi-
3. La población se distribuye simétricamente alrededor de su mediaµ.
rutorio forzado {litros) en I segundo (VEF) antes y después de la aplicación
4. La escala de medición es al menos de intervalos.
del lratamiento. Los resultados son los siguientes.

Las siguientes hipótesis son hipótesis nulas Uunto con las hipótesis
Individuo Antes Después Individuo Antes Después alternativas) que pueden probarse para alguna media de población no cono-
1 1.69 1.69 9 2.58 2.44 cida µ 0.
2 2.77 2.22 10 1.84 4. l 7
3 1.00 3.07 11 1.89 2.42 (a) /-/!l: µ = µ" (b) H 0 : µ :2: µo {e) }fu:µ~ µ 0
4 I.66 3.35 12 I.91 2.94 H 1 : µ -4:. µ 0 H 1: µ < µ0 H1: µ> µº
5 3.00 3.00 13 I.75 3.04
6 .85 2.74 14 2.46 4.62
7 1.42 3.61 15 2.35 4.42 Cuando se utiliza el procedimiento Wilcoxon se llevan a cabo los
8 2.82 5. l-t siguientes cálculos.

l. Restar la media hipotética µ0 de cada observación x¡ para obtener


¿Es posible concluir, con base en estos datos, que el tratamiento incremen-
ta de manera efectiva el nivel del VEF 1? Sea a= .05. Calcular el valor de p.
d, = x, - µu

Si cualquier x, es igual a la media, de modo que d¡= O, entonces se elimina ad,


11.4 PRUEBA WILCOXON DE CALIFICACIÓN CON SIGNO del cáh:u!o y se reduce, por consiguiente, la n.

En algunos casos se desea probar una hipótesis nula con respecto a la media 2. Ordenar las d¡ utilizables de menor a mayor sin considerar el signo de d,. Es
de la población, pero, por alguna razón, ni z ni t resultan adecuadas como 1.
decir, considCrese sólo el valor absoluto de d¡, designado por Id¡ al ordenar
estadísticas de prueba. Si se tiene una muestra pequeña (n < 30) de una estos elcrnentos. Sí dos o más Id¡ 1 son iguales. asignar a cada valor la media
población que a simple vista parece seguir una distribución no normal y el de la posición que oc upa en Jalista.Si, por ejemplo. los tres f d¡ 1 más pequeños
teorema del límite central no es aplicable, la estadística.: es excluida. La son iguales, entonces éstos se ponen en las posiciones l, 2 y 3 dentro del rango.
estadística t no es conveniente porque la distribución de la población de la pero a cada uno se le asigna un rango de ( 1 + 2 + 3 )/3 =2.
3. A cada categoría se le asigna el signo de la d¡ que proporciona dicha categoría.
que se extrae la muestra no se aproxima lo suficiente a la normalidad. Cuan-
4. Encontrar T+. que es [a suma de las categorías con signo positivo, y T_. que es
do se presentan tales situaciones, normalmente se busca un procedimien-
la sun1a de las categorías con signo negativo.
to estadístico no paramétrico. Como se ha visto, la prueba del sigr.o puede
uti !izarse cuando los datos confonnan una muestra simple o cuando se pre- La estadística de prueba \Vilcoxon es T+ o T_, dependiendo de la natu-
sentan en pares. Sin embargo, si los datos para el análisis son medidos al raleza de !a hipótesi'> alternati\"a. Si la hipótesis nu !aes verdadera, es decir.
l:':.tadistica no paramétrica y de libre di.~trihución Ejercicios 713
712

si la n1edia verdadera de la población es igual a la media hipotética, y si las Eje,nplo 11.4.1 El gasto cardiaco (litros/n1inuto) se midió por medio de
suposiciones se cumplen, la probabilidad de observar una diferencia posi- termodilución en una muestra aleatoria simple de 15 pacientes con cirugía
tiva d.= x.- ~1 0 , de una magnitud dada, es igual a la probabilidad de obser- cardiaca en el costado izquierdo. Los resultados fueron los siguientes:
var una' diferencia
' negativa de la misma magnitud. Entonces, al repetir el 4.91. 4.1 o. 6.74, 7 .27, 7.42, 7.50, 6.56, 4.64, 5.98, 3.14, 3.23, 5.80, 6.17,
muestreo, cuando la hipótesis nula es verdadera y las suposiciones se cum- 5.39, 5. 77. Se pretende saber si es posible concluir, con base en estos datos,
plen, el valor esperado de T+ es igual al valor esperado T_. No es de espe- que la media de la población es diferente de 5.05.
rarse que los valores de T+ y T_, calculados a partir de una muestra dada,
sean iguales. Sin embargo, cuando H0 es \'erdadera no se espera una gran Solución
diferencia en sus valores. Consecuentemente, un valor suficientemente
l. Datos. Ver el plantean1ientodel problema.
pequeño de T+ o T_ causa el rechazo de H 0.
2. Suposiciones. Se supone que los requerimientos para la aplicación de la prue·
Cuando la hipótesis alternativa es bilateral(µ':/:. µ 0) un valor suficien· ba de calificación con signo de Wilcoxon se cumplen.
temenle pequeño de T+ o T_ causa el rechazo de H 0 : µ = µ 0 . La estadística 3. Hipótesi.1·
de prueba. entonces. será T+ o T_, cualquiera que sea el más pequeño. Para H 0 : µ = 5.05
si111plificar la notación, el más pequeño de los dos se llamará T. H_,.,.: µ =/:: 5.05
Cuando H 0 : µ '2:: µ 0 es verdadera, se espera que la muestra proporcione Sea a= O.OS
un valor grande de T+. Por lo tanto, cuando la hipótesis alternativa unila·
teral establece que la media verdadera de la población es menor que la media 4. Estadí.1·ríco de prueba. La estadística de prueba será T+ o T_, la que sea tnás
hipotética(µ< µ 0 ), un valor suficientemente pequeño de T+ causa el re· pequeña y se designará como estadística de prueba T.
chazo de H O , y T+ es la estadística de prueba. 5. Distribución de la estadística de prueba. Los valores críticos de la estadística
Cuando H0 : µ 5 µ0 es verdadera, se espera que la muestra proporcione de prueba se encuentran en la tabla J de I apéndice II.
6. Regla de decisió,1. Se rechazará H 0 si el valor calculado de Tes menor o igual
un valor grande de T_. Por lo tanto, para la hipótesis alternati\'a unilateral
que 25. el valor crítico paran= 15, y a/2 =.0240, el valor más cercano a .0250
HA:µ> µ 0 un valor suficientemente pequeño de T_ causa el rechazo de H0,
en la tabla J.
Y T_ es la estadística de prueba. 7. Cálc11!0 de la estadística de prueba. El cálculo de estadística de prueba se mues-
Los \'illores críticos de la estadística de prueba de Wilcoxon se encuen·
tra en la tabla 11.4.1.
tran en la tabla J del apéndice 11. Los niveles exactos de probabilidad (P) 8. Decisión estadística. Puesto que 34 es mayor que 25, no es posible rechazar
se dan con cuatro decimales para todos los totales posibles de rangos (D H,.
que proporcionan un nivel diferente de probabilidad en el cuarto decimal 9. Co11cl11sió11. Se concluye que la media de la población puede ser 5.05. A partir
de 0.0001 hasta 0.5000. Los totales de rango (D se tabulan para todas las de la tabla J se aprecia que el valor pes p =2(.0757) =.1514.
muestras de tamaño n =5 hastan =30. A continuación se enuncian las reglas
de decisión para las tres hipótesis alternativas:
EJERCICIOS,~~~~~~~~~~~~~~~~~
a. HA;µ*- µ 0 . Se rechaza H0 a un nivel de significación a, si el valor calculado de
Tes n1enoro igual al valor T de la tabla J paran y unaa/2 preseleccionada. Alter·
11.4.1 Dieciséis animales de laboratorio fueron alimentados con una dicta espe·
nativamen\e se puede consultar la tabla J con n y el valor de Tpara ver si el va-
cial desde su nacimiento hasta 12 semanas después del mismo. El aumen-
lor P asociado con el valor calculado de Tes menor o igual al nivel de signifi·
to de peso (en gran1os) de cada uno de ellos fue como sigue: 63, 68, 79, 65,
cación establecido. Si es así, es posible rechazar H0 .
64. 63, 65. 64, 76, 74, 76, 66, 66. 67, 73, 69, 76. ¿Es posible concluir a par·
b. HA: µ < ~t 0 . Se rechaza H0 a un nivel de significación a, si T+ es menor o igual
tir de cslos datos que la dieta proporcionó un aumento de peso n1enor de
al valor de Ten la tabla J, para II y una a preseleccionada.
70 gran1os? Sea a= .05. Calculare! valor p.
c. HA:µ> µ 0 . Se rechaza H 0 a un nivel de significación a, si T_ es menor o igual
11.4.2 Lln p;.ÍC(Íiogo seleccionó aleatoriamente una n1uestra de 25 estudiantesdis-
al valor de Ten la tabla J, para 11 y una a presele(.;cionada.
capacitados. Las calificaciones de destreza manual de cada uno de losestu·
diantcs son las siguientes: 33, 53. 22. 40. 24. 56. 36, 28. 38, 42. 35. 52, 52,
E:stadística no para,nétrica y de libre distribución Prueba de la 111ediana 715
714
Tabla It.4.1. C,ikuln de la estadística de prueba para el ejemplo 11.4.J. estudiantes varones se extrajo de una población de estudiantes de secundaria
Gasto Cal1J1cac1011 del úrea rura!; y la segunda muestra aleatoria independiente de 16 estudiantes
cardiaco d, = x, - 5.05 Rango de d¡ con signo de d¡ se extrajo de una población de estudiantes de secundaria del área urbana. Los
resultados se muestran en la tabla 11.5. 1.
4.91 -.14 1 -1
4 10 -.95 7 -7
Para <lcterminar si es posible concluir que hay una diferencia, se lleva a
6.74 + 1.69 10 + 10 cabo una prueba de hipótesis. Suponer que el nivel de significación es de .05.
7.27 +2.22 13 + 1., 2. Supnsicione-I. Las suposiciones que fundamentan la prueba son: a) las muestras
7.42 +2.37 14 + 14 son elegidas independiente y aleatoriamente de sus respectivas poblaciones;
7.50 +2.45 15 + 15 b) las poblaciones son de la misma forma y difieren sólo en cuanto a su loca-
6.56 + l.51 9 +o
4.64 - .41 3 -3 lización, y c) la variable de interés es continua. El nivel de medición debe ser, a!
5.98 +.93 6 +6 menos, ordinal. No es necesario que las dos muestras sean del mismo tamaño.
3.14 - 1.91 12 - 12 3. fíipótesis.
3.23 - l.82 11 - 11
5.80 +.75 5 +5 lío:,\/[' = ¡\lR
6.17 + 1.12 8 +8 11,~: Ale =I= AIR
5.39 +.34 2 +2
5.77 +.72 4 +4
T ... = 86, T _ = 34, T = 34 Mues la calificación mediana de la población de laque se extrae la muestra de-es-
tudiantes del área urbana y M 8 es la calificación mediana de la población de
36, 47, 41. 32, 20, 42, 34, 53, 37, 35, 47, 42. ¿Proporcionan estos datos la estudiantes del área rural de la cual se extrae la muestra. Sea a= .05.
e\·idi.::ncia suíicienle para indicar que la calificación media de la población 4. Estadística de prueba. Como se muestra en. el siguiente análisis, la estadística
es di re rente de 45? Sea a= .05. Calcular el valor p. de prueba es X 2, y se calcula, por ejemplo, mediante la ecuación J 0.4.1 para
11.4.3 Los siguientes datos son las lecturas de la presi6n sanguínea sistólica para una tabla de contingencia de 2 x 2.
una 111ucstra de 20 mujeres de entre 40 y 80 años de edad: 156, 161, 145, 5. Distribución de la estadística de prueba. Cuando lí0 es verdadera y las suposi·
16.1.151, 161.135, 154, 151, 159, 160.147, 157, 131, 141, 141, 131, 126, ciones se curnplen, X 2 sigue una distribución semejante a lade ji-cuadrada con
166. 151. ¿Es posible concluir, con base en estos datos, que la media de la I grado de libertad.
población es menor que 160'? Sea Cl = .05. Calculare! valor p. 6. Regla de decisión. Se rechazaH0 si el cálculo del valor deX 2 es;:: 3.841 (dado
quea=.05).
7. Cálculo de la estadística de pnieba. El primer paso para calcular la estadísti-
ca de prueba es calcular la mediana común de las dos muestras combinadas.
11.5 PRUEBA DE LA M E D I A N A - - - - - - - - - - -
Esto se hace al arreglar las observaciones en orden ascendente y, dado que el
número total de observaciones es par, se obtiene la media de los dos valores
Otro procedimiento no paramétrico que puede emplearse para probar la
centrales. Para este ejemplo, la mediana es (33 + 34)/2 = 33.5.
hipótesis nula de que dos muestras independientes fueron extraídas de
poblaciones con medianas iguales, es la prueba de la mediana. Esta prue- Tabla 11.5.1. Calificaciones de! nivel de salud
ba se atribuye principal mente a Mood 31 y a Westenberg, 32 y se estudia tam- mental de estudiantes dt! secundaria
bién en Bro\vn y r..1ood. 33 y Moses. 4 así como en otras referencias antes Escuela
citadas.
Urbana Rural Urbana Rural
Ejen1plo 11.5.1 ¿Existe una diferencia entre el nivel de salud mental de 35 29 9· 50
los alumnos de secundaria de una área rural y los de una área urbana? 26 50
-"
_,
9- 31

Solució11
-21,
9- --1:1
22
-15
!h
34
31
.,-
-, --12 3$
l. Datos. Se aplicó una prut.':ba para mt.':direl nivel de salud mental a los estudiantes 38 47 20
2]
de secundaria de dos .írcas (rural y urbana). La primer inuestra alea1oria de 12 ,,_:,. -l:!
'.~'.?
-16
41
716 Estadü,tica no para,nétrica yde libre distribución Ejercicios 717

Tabla 1).5.2. Caliticacionc:,; de nivel de salud mental de estudiantes de secundaria


2 x 2 estudiadas en el capítulo 10. De no ser así, se puede utilizar un pro-
cedimiento conocido como prueba exacta de Fisher. 36 Esta prueba se estu.
Urbana Rural Total dia y ejemplifica en Daniel. 15
Número de caliricaciones arriba de la media 6 8 14 La prueba de la mediana se aplica, lógicamente, al caso donde se desea
Número de calificaciones abajo de la n1edia JO 4 14 probar la hipótesis nula de que k;::: 3 muestras provienen de poblaciones
Total 16 12 28 con medianas iguales. Para esta prueba se puede construir una tabla de con·
tingencia de 2 x k utilizando las frecuencias que caen arriba y abajo de la
A continuación se determina para cada grupo el número de observa- mediana calculada a partir de las muestras combinadas. Si las condiciones
ciones que caen por encima y por debajo de la mediana común. Las fre- para el tamaño de la muestra y las frecuencias esperadas se cumplen, X 2
cuencias resultantes se arreglan en una tabla de 2 x 2. La tabla 11.5 mues- puede ser calculada y comparada con el valor crítico de ji-cuadrada con
tra los resultados de esta operación. k - 1 grados de libertad. Senders 34 y Conover6 proporcionan ejemplos
Si, en efecto. las dos muestras provienen de poblaciones con la mis1na numéricos para el caso en el que intervienen más de dos muestras.
mediana, se puede esperar que aproximadamente la mitad de calificaciones
en cada n1uestra esté arriba de la media combinada y la otra mitad por deba·
jo. Si se cumplen las condicion_es relativas al ta1naño de la muestra y las EJERCICIOS~~~~~~~~~~~~~~~~~
frecuencias esperadas para la tabla de contingencia de 2 x 2, como se estu·
dia en el capítulo l O, puede utilizarse la prueba de ji·cuadradacon 1 grado 11.5.1 Se revisaron quince expedientes de pacientes de dos hospitales y se asignó
de libertad para probar la hipótesis nula de igualdad de medianas en las una calificación diseñada para estimar el nivel de atención recibida. Las
poblaciones. Mediante la fórmula 10.4.1, se tiene que: calificaciones fueron las siguientes:
Hospital A: 99,85,73,98,83,88.99,80, 74,91,80,94,94,98,80
28[(6)(4) ~ (8)( 10)]' Hospital B: 78,74,69, 79,57,78, 79,68,59,91,89,55,60,55,79
xz""' 2.33
(16)112)(14)(14)
¿Es posible concluir, a un nivel de significación de .05, que las medianas
8. Decisión esradística. Puesto que 2.33 < 3.84 J, el valor crítico de ji-cuadra- de las dos poblaciones son diferentes? Determinar el valor p.
da con a= .05 y 1 grado de libertad, no es posible rechazar la hipótesis nula con 11.5.2 Se obtuvieron los siguientes valores de albúmina en el suero de 17 persa·
base en estos datos. nas normales y 13 hospitalizadas.
9. Co11cl11sió11. Se concluye que las Óos muestras probablemente se extrajeron
de poblaciones con n1edianas iguales. Puesto que 2.33 < 2.706, se tiene que p > .1 O. Albúmina en suero (g/100 mi)
Individuos nonnales Individuos hospitalizados
A veces, uno o más de los valores observados serán exactamente iguales
a la mediana calculada y, por Jo tanto, no caerán por arriba ni por debajo de 2.4 3.0 1.5 3.1
ella. Es in1portante observar que sin 1 + n 2 es impar, al menos un valor siem- 3.5 3.2 2.0 1.3
3.1 3.5 3.4 1.5
pre será exacta1nente igual a la mediana. Esto lleva al problema de qué ha· l. 7 1.8
4.0 3.8
cer con las observaciones de este tipo. Siegel y Castellan 5 sugieren elimi· 4.2 3.9 2.0 2.0
narlas del análisis si 11 1 + 11 2 es grande y ~e tienen sólo unos cuantos valores 3.4 4.0 3.8 1.5
que caen en la mediana combinada, o bien, dividir las calificaciones en dos 4.5 3.5 3.5
5.0 3.6
grupos: aquel las que son mayores que la n1edianay las que no lo son, en cuyo 2.9
caso, las observaciones que son iguales a la mediana se contarán en la segun·
da categoría. Senders3 4 sugiere procedimientos alternativos. Jo mismo que
Hays y Winkler. ·15 El problen1a se estudia a1npliamente en Bradley .7 ¿Se concluiría, al nivel de significación de .05, que las medianas de las dos
Antes de ut i I izar la prueba de ji·cuadrada, es necesario \'eri ficar que poblaciones de las que se exlrajeron las muestras son distintas? Determi-
se cu n1pl an las condiciones necesarias para una tabla de contingencia de nar el valor p.
Estadística no paramétrica y de libre distribución Prueba de !tlann-Whitney 719
718
U.6 PRUEBA DE MANN- WHITNEY _ _ _ _ _ _ _ __ tabla l 1.6. 1. Se desea saber si es posible concluir que la inhalación pro-
longada de óxido de cadmio disminuye el nivel de hemoglobina.
La prueba de la mediana, que se analiza en la sección anterior, no utiliza
toda la información presente en las dos muestras cuando la variable de Solución
interés se mide por lo menos en una escala ordinal. Reducir el contenido
1. Datos. \' er la tabla l l.6.1.
de información de una observación para concluir si cae o no por arriba o
2. Suposiciones. Se supone que las suposiciones para la prueba de Mano·
por debajo de una mediana común, es desperdiciar información. Si, para Whicney se cumplen.
probar la hipótesis deseada, se cuenta con un procedimiento que utilice una 3. Hipótesis. Las hipótesis nula y alternativa son las siguientes:
mayor cantidad de la información inherente en los datos, dicho procedi-
miento debe utilizarse siempre que ello sea posible. El procedimiento no H 0 : lvfx =::: 1'vfy
paramétrico que puede utilizarse con frecuencia en lugar de la prueba de la H.4.: iVfx < J\rf r
mediana es la prueba de Mann-Whitney. 37 Debido a que esta prueba se basa
en los rangos de las observaciones, utiliza más información que la prueba donde J/xes la mediana de la población de animales expuestos al óxido de cad-
de la mediana. mio y fl,f res la mediana de la población de animales no expuestos a la substan-
Las suposiciones que fundamentan la prueba de Mann-Whitney son las cia. Suponer que a= .05.
siguientes: 4. Estadística de prueba. Para calcular !a estadística de prueba se procede a com-
binar las dos muestras y las observaciones se ordenan de menor a mayor tenien-
do presenten cuál muestra pertenece cada observación. A las observaciones de
l. Las dos muestras, de tamaños n y n1, respectivamente.que se utilizan para el aná-
igual valor numérico se les asigna un rango igual a la media de las posiciones en
lisis han sido extraídas independientemente y en forma aleatoria de sus pobla-
ciones respectivas. las que se encuentran "empatadas". Los resultados de este paso se muestran
en la tabla 11.6.2
2. La escala de medición es por lo menos ordinal.
La esto.dística de prueba es
3. Si las poblaciones son diferentes, difieren sólo en lo que respecta a sus me-
dianas. T ""' 5 _ n(TI + ¡) (11.6.1)
2
Cuando se satisfacen estas suposiciones, puede probarse la hipótesis
Tabla 11.6.1. Con-:enlracione:s de hen1oglobina
nula de que las dos poblaciones tienen medianas iguales contra cualquiera
(gramos) de 25 anitnales de laboratorio
de tres alternativas posibles: 1) las poblaciones no tienen medianas iguales
Anin,ales expuestos Ani111ales 110 expuestos
(prueba bilateral); 2) la mediana de la población 1 es mayor que la media-
(X) (Y)
na de la población 2 (prueba unilateral), o bien, 3) la mediana de la pobla-
ción I es menor que la mediana de la población 2 (prueba unilateral). Si las 14.4 17.4
dos poblaciones son simétricas, de modo que dentro de cada población la 14.2 16.2
13.8 17. 1
media y la mediana son las mismas, las conclusiones a las que se llega 16.5 li.5
respecto a las medias de las dos poblaciones se aplicarán también a las me- 14.1 15.0
dianas de ambas poblaciones. El siguiente ejemplo ilustra el uso de la prue- 16.6 16.0
15.9 16.9
ba de ~1ann-Whitney. 15.6 15.0
14.1 16.3
Ejemplo 11.6.1 En un experimento diseñado para estimar los efectos de 15.3 16.8
15.7
la inhalación prolongada de óxido U.e cadmio, 15 animales de laboratorio 16.7
sirvieron de sujetos para el experimento, mientras que 10 animales simi- 13./
lares sirvieron de controles. La variable de interés fue la concentración de 15.3
1-l.0
hemoglobina después del experimento. Los resultados se muestran en la
720 Estad{stica no paramétrica y de libre distribuci6n Prueba de Ala1111· tt"/1itney 721
Tabla 11.6.2. Datos y rangos originales n. el nú111ero de obse1Tacio11es de X, 111, el 111Í111ero de obser\'llciones de Y; y a
del ejemplo 11.6.1. el nire/ de ,\ignificació11 elegido.
X Rango y Rango
Si se utiliza e I procedimiento Mann-Whitney para probar
13.7 1
13.8 2 fl 0 : /l.1x :5 ,"-fr
14.0 3 contra
14.1 4.5
14. I 4.5 11_1: ,\!_\" > ,\J)
14.2 6
14.4 7 los valores .c,ufi,:iente1nente grandes de T causarán el rechazo, de tal forma que
15.0 8.5 la regla de decisión es:
15.0 8.5
15.3 10.5
15.3 10.5 Reclu1:t1r H0: Mx S ,W ysi el 1·alor calcuhulo de T e.1· 111ayor que u·l -u' donde
15.6 12 \V 1 _< 1 =11111-\Vo:.
15.7 13
15.9 14 Para la situaL·itín de la prueba bilateral con
16.0 15
16.2 16
16.3 !7 fl 0 : ,\f.\. 1\J )"
16.5 18 }-IA: ,\fx f. A1 1-
16.6 19
16.7 20 Los valores calculado" de Tque se.:in suficientemente grandes o suficiente1nente
--- ~ 16.8 21 pequeños causar~ín el rechazo de H¡r La regla de decisión para este caso es:
16.9 22
17.1 23
17.4 24 Reclll1:.ar 11 0: Mx = /11 ysi el cá/c1do de{ 1·afor Tes i11e11()rq11e wu/ 2 o 111ayorq11e
17 .5 25 11· _ a/2• donde 1ru1 es el i·alor e ritico de T para 11, 111 y a.12 dado en la tab!t1 K del
1 2
Total . Í45 apéndice//. _I' 11· 1 _ 0_¡ 2 =11111 - 1ru/~·

donde n es el número de observaciones.de la muestra X y Ses la suma de los ran- Para e.c,te cje1nplo. la regla de decisión es:
gos asignados a las observaciones de la muestra de la población de valores X. Recha;ar H() -.i el el cálculo de Tproporciona una valor 1nenor a 45, el valor críti-
La elección de los valores de la muestra que se marcan con X es arbitraria. co de la cstadbtica de prueha para 11 = 15, 111 = 10 y a= .05, se encuentra en la
5. Distribución de la estadística de prueba. Los valores críticos de la distribución tabla K.
de la es1adística de prueba se encuentran en la tabla K para varios niveles de ex.
6. Regla de decisión. Si la mediana de la población X es, en efecto, n1ás pequeña 7. Cálculo de lu e.1tadíHica de prueba. Para este ejemplo se tiene. tal como se
que la mediana de la población Y, como se especifica en la hipótesis alternati- muestra en la tahla 11 .6.2. S = 145. de manera que
va, es de esperar(para muestras de igual tamaño) que !asuma de los rangos asig-
nados a las observaciones de la población X sea menor que la suma de los ran- T = 145 - 15(15 + 1) 25
gos asignados a las observaciones de la población Y. La estadística de prueba l
está basada en este razonamiento en tal forma que un valor de Tsuficientemente
pequeño causará que se rechace la hipótesis H0: M x;?: M r 8. DecisirJ11 e.1/tul(stica. Al con',ultar la tabla K con 11 = 15, 111 = 1O y a= .05 se
En general, para pruebas unilaterales del tipo que se muestra aquí, la regla encontrú que el ,·a!or crítico de ira es 45. Dada que 25 < 45. se rechaza Hw
de decisión es: 9. Co11cl11.1irín. Se concluye que ,'Wxes n1enorque M y· E',tO lleva a concluir que la
inh¡_¡lac1lín pro lo n_gada de óxido de cadn1io reduce la concentración de hemo-
glohi n.i
Rechazar H0: M X;?: /'.1 ysi el valor calculado de Tes n1enorque tv 0 , donde \V 0 es Puc~lo que 22 < 25 < 30. entonces, .005 > p > .001.

l
el valor crítico de T, el cual se obtiene n1edia11te la rabia K del apéndice JI con
Estadb;tica nu para111étrica y de libre distrihuci1Jn La prueba de bondad de ajuste de Kolmogorov-Smirnov 723
722
Cuandon o 111 es mayor que 20, no es posible utilizar la tabla K del apén- ¿Es posible concluir a partir de estos datos que el peso promedio de los niños
dice para obtener los valores críticos para la prueba de Mann-\Vhitney. del área A es diferente del de los niños del área B? Sea a= .05. Calcular el
cuando éste es el caso, es posible calcular valor p.

T - mn/2 (11.6.2)
' - ºv'n-m"'(,;,,-+-,;;,,;;+;;;,~l-i/~12 11.7 LA PRUEBA DE BONDAD DE AJUSTE
DE KOLMOGOROV-SMIRNOV _ _ _ _ _ _ _ __
y compan.1r el resultado con los valores críticos de la distribución normal
unitaria. Cuando se desea saber qué tan bien se ajusta la distribución de los datos de
Si existe una gran porción de observaciones iguales, puede utilizarse una mues.tra a una distribución teórica, la prueba conocida como prueba
un factor de corrección propuesto por N oether.·' 8 de bondad de ajuste de Kolmogorov-Smirnov es una alternativa para la
prueba de ji-cuadrada de bondad de ajuste, la cual se estudia en el capítu-
lo I O. La prueba debe su nombre a dos matemáticos rusos: A. Kolmogorov
EJERCICIOS,~~~~~~~~~~~~~~~~~
y N. V. S mirnov, quienes presentaron dos pruebas muy parecidas en la déca-
U.6.1 Los siguientes son los valores de respuesta del siste,na de inmunización da de 1930.
J.: pcrsnnas que rccihícrnn una dosis de refuerzo de uno de dos tipos de El trabajo de Kolmogorov 39 se relaciona con el caso de una sola mues-
vacun,1s contra la rahia. tra, como se menciona en este capítulo. El trabajo de Smirnov40 trata el caso
Tipo 1 (X l J.25, 5.?,0, 1.70. 1.00. 8.50. 3.75. 8.10. 2.25. 5.6. 7.85 en el que intervienen dos muestras, y su interés radica en probar la hipóte-
Tipo 2 ( r) .57. 3.90, 8.20. 1.20, 1.70, 1.00, 4.55, 5.20, 2. 16, 1.90, 4.6 sis de igualdad entre las distribuciones de dos poblaciones de origen. La
¿_Es posible concluir. con base en estos datos. que los dos tipos de vacuna prueba para la primera situación se conoce como prueba Kolmogorov-
difier..::n en cuanto a sus efi:ctos? Sea a-= .05. Calcular el valor p. Smirnov para una sola muestra. La prueba para el caso de dos muestras se
11.6.2 Los siguientes valores son los tiempos (en minutos) d..: p..:n11ancnt.:ia en la conoce con10 prueba Kol mogorov~S mirnov para dos muestras y no se estu-
sa!a Je operat.:iones de 20 personas son1ctiJas al n1is1no procediinicnto dia en este texto. Quienes estén interesados en el tema, pueden consultar
quirúrgico. Once de las personas fueron pacientes del hospital A y 9 lo º
las obras de Conover, 6 Gibbons 2 · 1 y Daniel. 15
fueron Je[ hospital B. Al utilizar la prueba de bondad de ajuste de Kolmogorov-Smirnov, se
Hospital A: 35. 30, 33. 39, 41. 29. 30. 36. 45, 40. 3 1 efectúa una comparación entre alguna función teórica de distribución acu-
Hospital B: 45, 38, 42, 50. 48. 51, 32. 37. 46 mulativa, F 1{x), y una función muestra! de distribución acumulativa, F M(x).
Con base en estos d,1tos. ¿,es posible concluir que. para el nlis1no procedí· La muestra se extrae de manera aleatoria de una población con una función
n1iento quirúrgico, los pacientes del hospital B tienden a pennanet.:er 111,is de distribución acumulativa desconocida F(x). Recuérdese (de la sección
tien1po en la sala de operaciones que los pacientes del hospital A? Sea a= 3.2) que una función de distribución acumulativa proporciona la proba-
.O 1. calcular el valor p. bilidad de que X sea menor o igual que un valor en particular, x. Es decir,
11.6.3 Se obtuvieron los siguientes pesos (kg) a partir de un:.1 n1ucstra Je niños por medio de la función muestra! de distribución acumulativa F M(x), es
..:slu<lianles dt: 12 añllsdc edad. en un país en vías de desarrollado. Los niños
posible determinar P(X:::; x ). Si existe un ajuste estrecho entre la distribu--
residl!n en dos áreas geográficas diferentes.
ción acumu!ati va teórica y muestra!, entonces se apoya la hipótesis de que
la muestra fue ex traída de una población cuya función de distribución acu-
Área A Área B Área A Área B
mulativa específica es F 1{x). Sin embargo, si hay una discrepancia entre la
:"'>-1.1 :l!i.'.I ;),'s.~) '.!!i.H función de di stri buci ón acumulativa observada y la teórica. y si dicha dis-
:tl.H :11.-1 .1.-). 7 :! .·1. 1
'.!'.).,"',
crepancia es lo suficientemente grande como para no atribuirla al azar cuan-
:lli.'.! ;) 1.(1 :·).-) .:1
:11.H :-iu.H :!<i.1 do H 0 es verdadera, !a hipótesis se rechaza.
'.1'.?.0
:1:~., JtiA :;,-,.~ La diferencia entre ta función de distribución acumulativa teórica,
SH.!'i :11;.:! F-fx). y la función de distribución acumulativa de la muestra. F,.,(x). se
Estadística nv para1nétric:a y de libre distriburicín La prueba de bondad de ajuste de Kobnogorov-Smirnov 725
724
mide con \a estadística D, la cual es la máxima distancia vertical entre F j\,/(x) 3. Hipútl!SÍS
y Ff..x). Cuando una prueba bilateral es conveniente, esto es. cuando las para toda x desde -oo hasta +oo
F-1 0: F(x) = FT (x)
hipóte.<ds son lf,: F(x) ,la FT(x) para al menos una x

/1 0 : ¡.·(x) = FT (x) para todax desde -oo hasta +oo Sea a== .05.
U,: F(x) " FrM para, al n1enos, una x.
4. Estadfsricu de pr11cfu1. Ver la ecuación 11.7.1.
La estadística de prueba es 5. Dist ri hucirín de la estadística de prueba. Lbs valores críticos de la estadística
de prucha para los valores elegidos de a se encuentran en la tabla L.
D = supll:,(.\) - 1''¡(x)l11 (JI.7.1) 6. Regla de decisió11. Se rechaza H 0 si el valor calculado de D excede .221, que es
X
el valor crítico de!) para 11 == 36 y a== .05.
7. Cálculo de la esradfstica de prueba. El primer paso es calcular los valores de
la cual se lee "Des el mayor de los valores sobre todas lasx, del valor abso-
f,"_,..,,(x), como se 1nuestran en la tabla 11.7 .2.
luto de la diferencia F M(x) meno.s F 7(r)".
Cada uno de los valores de FM(x) se obtiene al dividir la frecuencia acu-
La hipótesis nula se rechaza en un nivel de significación ex, si el valor rnulativa entre el tan1año de la n1uestra. Por ejemplo, el primer valor de F M(x)
calculado de Dexcede el valor que se muestra en la labia L para 1 - ex (bila-
= 2/36 = .0556.
teral) y el ta111año de la muestran. Es posible real izar pruebas en las que la Los valores de F1{x) se ohtienen al convertir cada valor observado de x en
alternativa es unilateral. Gibbons IO y Good1nan 41 proporcionan ejemplos un valor de la variable normal estándar,z. En la tablaCdel apéndice II se encuen-
numéricos. tra e 1área entre-oc y z. Con estos datos es posible calcular los valores de F fx).
Las suposiciones que fundamentan la prueba de Kolrnogorov-Smirnov El proccdin1i~n\o se rcsu1ne en la tabla 11. 7 .3, y es similar al que se utiliza para
son las siguientes obtener las frecuencias relativas esperadas en la prueba de bondad de ajuste de
ji-cua<lraJ¡i.
l. La n1ucstra es aleatoria. La estad h tic a de prueba D puede calcularse algebraicamente, o bien deter-
2. La distrihución hipotética, F¡{x). es continua. m in are,c gráíica1nente al medir la distancia vertical más larga entre las curvas
F M(x) y F. .f.x} en una gráfica. Las gráficas de ambas distribuciones se muestran
1
Noether38 demostró que, cuando los valores de D se basan en una dis- enlatahlall.7.1.
lJn cxainen de las gráficas F_14 (x) y F¡{x) revela que D =.16 = (.72- .56).
tribución teórica discreta, la prueba es moderada. Cuando la prueba se utiliza
A continuación se calcula el valor de Dde manera algebraica. Los valores posi-
con datos discretos, el investigador debe tener en mente que la probabilidad
bles de I F.\l(x)-F 7{x) 1 se n1uestran en la.tabla 11.7.4. Esta tabla muestra que
real de con1eterun error de tipo I es. cuando mucho. igual a ex, que es el nivel
el valor extH.:to de Des .154 7.
de significación establecido. La prueba también es moderada si uno o n1ás 8. Decisiún estadística. Al consultar la tabla L se observa que el valor calculado
parámetros deben ser estimados a partir de los datos de la muestra. de D ==. ! 54 7 no es significativo en ningún nivel razonable. Por lo tanto, no pro·
cede el rechazo de H 0 .
Eje111plo 11.7.1 Se efectuaron mediciones del nivel de glucosa en sangre
de 36 hombres adultos en ayuno, no obesos y aparentemente sanos. Estas me- Tabla 11.7.1. V,1lorcs de glucosa en sangre
diciones se muestran en la tabla 11.7 .1. Se pretende saber si es posible con- (mg/ 100 ml). ohycnidos en ayunas. d<! 36
cluir que tales datos no pertenecen a un a población que sigue una dis- individuos no obesos y aparentemente sanos
tribución 11orn1al, con una media de 80 y una desviación estándar de 6. 75 92 80 80 84 72
84 77 81 77 75 81
Solución 80 92 72 77 78 76
77 86 77 92 80 78
l. Datos. Verla tah!a 11.7.1. 68 78 92 68 80 81
l Suposiciones. La muestra di~ponih!c es un:. n1ui::str;1 :1lcatoria sin1plc qui:: se 87 76 8(1 87 77 86
extrajo de una poh!aci6n que sigue una distrihuci6n conl inua.
f~stadística no parantélrica y de libre distribución La prueba de bondad de ajuste de Kobnogorov-Smir11ov 727
726
Tabla 11.7.3. Pasos para el cálculo
9 . Concfusió11. La rnuestra tal vez proviene de la distribución especificada. Dado
que se tieni.:: una prueba bilateral, y .1547 <. l 7-4, entoncesp > .20. de F¡f..x) para el cjcn1plo J J.7.1
¡ "" (_._-!•HJ¡lfi Fdx)
'
Es necesario tener en cuenta que. al determinar el valor de D, no siem-
6~ - 2.00
pre es suficiente calcular y elegir de. entre los valores posibles de F M(x) I 7'2 - 1.:t{
.0228
.0918
-F7{.r) I . La disra11cia vertical 111ás larga entre F11;1(X) y F .,-{x) posible,nente i.'í -.8'.{ .2033
no ocurra en 1111 valor observado, x, sino en algún otro valor de X. Esta 7!) -.67 .2514
¡7 -.50 .3085
situación se ilustra en la figura 11 .7 .2. Se aprecia que si únicamente se con-
78 -.'.-13 .3707
sideran los valores de J F M(x) - F .,-{x)] de los puntos extremos de las ba- 80 .00 .5000
rras horizontales. entonces puede calcularse incorrectamente la D como 81 .17 .5675
J .2 -.41 = .2. Sin embargo, al examinar la gráfica es posible apreciar que 8·1
86
.67
1.00
.7486
.8413
la distancia vertical más grande entre F M(x) y F ¡{x) se presenta en el pun- 87 l.17 .8790
to extremo a la derecha de la barra horizontal, en el runto correspondien- Y'2 2.00 .9772
te ax= .4, y que el valor correcto paraD es l .5 - . 2 = .3.
Es posible determinar el valor correcto para D de manera algebraica al
calcular. además de las diferencias J FA,1(x) - F¡{x) f, las diferencias ~ 1.00

! FA/x¡_ 1)-F¡{x,) 1 para todos los valores de i = 1, 2, ... , r+ l. donde res ~


§ .ao
.90

igual al número de valores de xdiferentes y F M(x 0)::: O. Por lo tanto, el va-


~ .70 D"' .16........._, ,e~-c,>...:,-
lor correcto de la estadística es ~ .60
~ .50
D = máx.imo ( máximo [ J F M(x,)-F,.(x;) J, J F M(x; _ 1)-F,{x;l J J) ~ .40
Js,~r . •Ue .JO - F (11)
5
(11.7.2)
~
<1l .20 ~-
Las ventajas y desventajas de la prueba de bondad de ajuste propuesta
lJ.. \..\F1
.10L 1
di 1 1 1 1 1 1 1 1 1 1 1 1 , 1 1 1 1 1 ,
por Kolmogorov-Smirnov en comparación con la prueba de ji-cuadrada se
explican en Goodman, 41 Massey, 42 Birnbaum, 43 y en Slakter. 44 Los siguien-
·ea 10 12 74 76 1a ao s2 84 86 90 94 ªª "
tes son algunos puntos importantes de comparación. Figura 11.7.1. F, 1,(.r) y Ff..x) del ejemplo 11.7.1
Tabla 11.7.2. Valores de F:,(x) para el ejemplo l I .7 .1
l. La prueh,1 d..; Koln1ogorov-Smirnov no requiere que las observaciones sean
Frecuencia agrupadas. co1no en el caso de la prueba de ji-cuadrada. La consecuencia de
Frecuencia ac1unulada fs(x)
' esta diferen,:ia es que la prueba de Kolmogorov-Smirnov hace uso de toda la
68 2 2 .0556 inforn1aci()n presente en el conjunto de datos .
72 2 4 . 1111 2. La prucha de Kolinogoruv-Srnirnov puede utilizarse con muestras de cualquier
i5 2 6 .I66i tacnaiiu. Recuérdese que para realizar la prueba de ji-cuadrada es necesario que
76 2 8 .2222 las n1ucstras tengan un tamaño n1ínimo .
¡¡ 6 14 . 3889
3. Co1no ,-e ha vi:-.Lo. la prueba Ko!n1ogorov-Smirnov no es aplicable cuando los
78 3 17 .4722
80 6 23 .6389 parán1ctro:-. tienen que seresti tnados a partir de la muestra. La pruebaji-cuadra-
81 3 26 .7222 da puede utilizarse en estas situaciones para reducir los grados de libertad en
84 2 28 .7778 1 para t:ada parárnctro estin1ado .
86 2 30 .8333 4. El problema de suponer unadistribuciún teórica.continua se ment:ionó con ante-
87 2 32 .8889
92 4 36 I.0000 riorid.1d.
~
A11álisis unilateral de i·ariancia, por rangos, de KruskaJ- lVallis 729
728 f.'.~tadística no para,nétrica y de libre distribución

Tabla 11.7.-1. t'.íkuln de 11-.J.r)- r· 1~x)I para Peso del cerehro (gro1nos)
el ejemplo 11.7.1
859 1073 1041 1166 1117
Fs(x) F ¡-(X) jF5 (x) - f r(x)I 962 1051 1064 1141 1202
' 973 1001 1016 1168 1255
68 .0556 .0228 .0328 904 1012 1002 1146 1233
,_
"'> .1111 .0918 .0193 920 1039 1086 1140 1348
75 .1667 .2033 .0366
76 .2222 .2514 .0292 ¿Es posible concluir, a partir de estos datos, que la población de la cual se
77 .3889 .3085 .0804 extrajo lo muestra no sigue una distribución normal con una media de 1050
78 .4722 .3707 .1015
80 . 1389
y una desviación estándar de 50? Determinar el valor p para esta prueba .
.6389 .5000
81 .7222 .5675 .1547 11. 7.2 El coeficien\e intelectual de una muestra de 30 adolescentes arrestados por
84 .7778 . 7486 .0292 abuso de fármacos es el siguiente .
86 .8333 .8413 .0080
87 .8889 .8790 .0099 IQ
92 1.0000 .9772 .0228
95 100 91 106 109 1 IO
98 104 97 100 107 119
1.0 92 106 103 106 105 112
l OI 91 105 102 10 l 11 O
.9 1OI 95 102 104 107 118

.,
~•
~ .7
E
o - - ¿Proporcionan estos datos la evidencia suficienteparaconcluirque la pobla-
ción muestreada no sigue una distribución normal con una media de 105 y
una desviación estándar de 1O? Calcular el valor p.
11. 7.3 Para una n1uestra de sujetos aparentemente norn1ales que servían de con-
g .6 trol en un experimento, se registraron los siguientes valores de la presión

1 sanguínea sistólica al inició del experimento.
!!l .5
e
·g• .4 ~ Valor
162 177 151 167
o•
130 154 179 146
Valor correcto de
e
u

"-
., D• l.5- .21., .3 1 147
153
157
157
141
134
157
143
14 l 137 151 161
,,,__
.2

.1
- .--Fs(X)
¿Es posible concluir a partir de esos datos que la población de valores de
presión sanguínea de la que se extrajo la muestra no sigue una distribución
norn1al conµ= 150 y a= 12? Calcular el valor p .
.2 .4 .6 .8 1.0

Figura 11.7.2. Gráfica de datos ficticios que 1nuestra el cálculo correcto de!) 11.8 AN ..\LISIS UNILATERAL DE VARIANCIA,
POR RANGOS, DE KRUSKAL-WALLIS - - - - - - -
EJERCICIOS~~~~~~~~~~~~~~~~~
En el capítulo 7 se estudia la fonnaen que el análisis unilateral de variancia
se utiliza para probar la hipótesis nula de que las medias de varias pobla-
11. 7 .1 El peso Je] cerebro durante la autopsia de cada uno de 25 individuos adul-
ciones son iguales. Cuando las suposiciones que fundamentan esta técnica
tos que padecían cierta enfermedad. es el siguiente:
730 E.,tad1:~tica no paran1étrica y de libre distribución Análisis unilateral de varia11cia, por rangos, de Kruskal- »"llllis 731
no se cumplen, es decir, cuando las poblaciones de las cuales se extraen las Ejemplo 11.8.1 Se estudió el efecto de dos medicamentos en el tiempo de
muestras no siguen una distribución normal con variancias iguales o cuan - reacción ante cierto estímulo en tres grupos de animales experimentales.
do los dato:,; para el análisis son únicamente rangos, es posible utilizar una El grupo III sirvió como control, mientras que a los animales del grupo I se
alternativa no paramétrica para el análisis unilateral de variancia y probar les aplicó el medicamento A y a los del grupo 11 se les aplicó el medica-
Iahipótesis de parámetros de localización iguales. Como se indica en la sec- mento B antes de la aplicación del estímulo. La tabla 11.8. 1 muestra el tiem-
ción 11.5. la prueba de la mediana puede ampliarse para incluir la situación po de reacción, en segundos, de los 13 animales.
que involucra más de dos grupos. Sin embargo, unadeficienciade esta prue- ¿Es posible concluir que los tres grupos representados por las tres mues-
ba es el hecho de que sólo utiliza una pequeña cantidad del total de infor- tras, difieren con respecto al tiempo de reacción? Esto es posible si se puede
mación disponible. La prueba utiliza sólo la información que indica si las rechazar la hipótesis nula que indica que las tres poblaciones no difieren
observaciones están o no por arriba o por abajo de un solo número, el cual en sus tiempos de reacción.
es la mediana de las muestras combinadas. La prueba no utiliza directamente Tabla 11.8.1.
mediciones de cantidad conocida. Existen varias pruebas no paramétricas Tiempo de reac-
equivalentes al análisis de variancia, las cuales utilizan más información al ción e¡t segunJos
tomaren cuenta la magnitud de cada observación respecto a la magnitud de de 13 animales
cualquier otra observación. Quizá el procedimiento mejor conocido es el experimentales
análisis unilateral de variancia por rangos. de Kruskal-\.Vallis. 4 5 Grupo
La aplicación de esta prueba implica los siguientes pasos.
11 111
l. Las 11 1.11 1 . ...• nk observaciones de los k grupos se combinan en una sola serie 17 8 2
de tamaño n y se clasifican en orden ascendente. Las observaciones, poste· 20 7 5
riormente, se sustituyen por rangos desde 1. que es el asignado a la observación 40 y 4
menor, hasta 11, que se asigna a la observación mayor. Cuando dos o más obser- 31 8 j
Solución 35
vaciones tienen el mismo valor, a cada una de ellas se le da la media de los ran-
gos en los cuales se encuentra empacada. l. Datos. Verla tabla 11.8.1.
2. Los rangos asignados a las observaciones en cada uno de los k grupos se suman 2. S11posicio11es. Las muestras son aleatorias e independientes, y fueron extraí-
por separado para dar k sumas de rangos. das de sus respectivas poblaciones. La escala de medición a utilizares, al menos,
3. La estadística de prueba se calcula como ordinal. Las distribucíones de los valores en las poblaciones muestreadas son
idénticas, excepto por la posibilidad de que una o más poblaciones estén com-
11
J '>
- ,~ 1 ¡'
11(11+il~,, "k R'
-3(11+!)
( 11.8. ! ) puestas por valores que tienden a ser mayores que los valores de las demás
poblaciones.
3. Hipótesis
En la ecuación l 1.8, 1
H0 : Las distribuciones de las poblaciones son idénticas.
k = núinero de grupos
H.¡_: Al menos una de las poblaciones tiende a mostrar valores mayo-
nj = núrnero de observaciones delj-ésimo grupo
. res que, cuando n1enos, una de las oiras poblaciones.
11 = nú1nero de observaciones en todos los grupos combinados Sea a= .01.
Rj = suma de los rangos en e!j-ésimo grupo
4. Estadística de prueba. Ver la ecua{.:ión 11.8.1.
4. Cuando hay tres grupos y cinco o menos observaciones en cada uno, el nivel de 5. Distribución de la estadística de prueba. Los valores críticos de H para dife-
significación de H puede calcularse al consultar la tab!a rvr del Apéndice JI. rentes tarnaños de muestras y niveles a se encuentran en la rabia 1'1.
Cuando hay n1ás de cinco observaciones en uno o más grupos. H se con1para 6. Regla de decisión. La hipótesis nula se rechaza si el valor calculado de H resul-
con los valores tahulados de ji-cuadrada con k- 1 grados de libertad. La con- ta tan grande que la probabilidad de obtener un valor igual o mayor cuando H
veniencia de la aproximación ji-cuadrada para muestras pequeñas se estudia 0
es verd<.'ra. es nienor o igual que e I nivel de sígn ificación elegido a.
en Gabriel y Lachcnbruch_-ió 7. Cálculo de la estadística de pr11eba. Cuando las tres muestras se combinan en
732 Estadística no paraniétrica y de libre distribuciú11 Análisis 1111i/aleral de ~·anQ11cia, por rangos, de Kruskal- l't"allis 733

una sola serie y los valores se disponen por rangos, entonces es posible elabo- 1nente hay un grupo de este tipo pero, en general, puede haber varios gru-
rar una tabla de rangos como la que se n1uestraen la tabla 11.8.2. pos de valores empatados que dan como resultado varios valores de T. Dado
La hipótesis nula implica que las observaciones en las tres muestras cons- que ex.i~ten sólo dos observaciones en el grupo de valores empatados,
tituyen una sola muestra extraída de una sola población de tamaño 13. Si esto entonce'.'> ·r::: 2·1 - 2 = 6 y la LT== 6, así que la expresión 11.8.2 es
es cierto, puede esperarse que los rangos estén bien distribuidos entre los tres
grupos. En consecuencia, se espera que !asuma tola\ de rangos seadivididaenlre 6
los tres grupos en proporción al tamaño de éstos. Cualquier incumplln1iento de 1 - 77',..::_._
13'1 - 13 ~ .9973
estas condiciones !>e refleja en la magnitud de la estadística de prueba H.
y
A partir de los datos de la tabla 11 .8.2 y la ecuación 11.8.1 se ohtiene H 10.68
10.71
_12_[(55) + (26)
H- 13(13+1) (10)
2 2 2
]
-3(13+1) .,
LT .9973

5 4 + 4
,r - n
10.68
que, natural1nente. es significativa al niYel de .O 1.
S. Decisión estadística. La tabla M n1ueslra que cuando las 11 son 5, 4 y-4, la pro- Con10 es el ca'.'io aquí. el efecto del ajuste para valores iguales es, por
1
babilidad de obtener un valor de H ? 10. 68 es menor que .009. La hipótesis lo general. in'.'iignificante. También es importante apreciar que dicho efec-
nula puede rcchuzarse u un nivel de significación del .01. to incre1nenta a H. así que. si la H ajustada es significativa al nivel dado.
entonces no t'.'i necesario ajustarla.
Tabla 11.8.2. D.ito~ de la tahla En el '.'iigu iente ejen1plo se 1nuestra cómo utilizarel procedimiento cuan-
11.8.1 reen1pla1:ados por rangos
do existen 1n,ís <le tres grupos y, al menos, una de las nj es 1nayor que 5.
Grupo
11 111 Eje111plo I J.8.2 La tabla l l .8.31nuestrael valor neto en libros de los bienes
de capital e1npleados por ca1na en una muestra extraída de cinco tipos de
9 6.5 1 hospitales. Se pretende detern1inar. mediante la prueba de Kruskal-Wallis.
10 5 4
13 8 3 si es posible conL·luir que el valor neto pro1nedio en libros de los bienes de
11 6.~ 2 capital porca1na. difieren en los cinco tipos de hospitales. Los rangos de los
12 41 valores. junto con las su1na de rangos por grupo se encuentran en esa
R 1 = 55 R2 = 26 R 3 = 10 tabla.

Solució11
9. Concl11si611. Se concluye que existe una diferencia en el tiempo promedio de
reacción entre las tres poblaciones. Para esta prueba, p < .009.
1. Da/o\. A p,1nir Je la ~ui'na do..· rangu~ se o..'ak·ula·
Es importante indicar que a los dos valores iguales en la muestra JI se les
asignó un rungo de 6.5. Es posible ajustar el valor de H para este empate al
dividirlo entre // J ! ( .j
1:2
l+IJ
1
l ((-iX )'.!
-1(I- T
(':2-1() ):.>
~
( 12..J ¡:!
+--- +--
~
( l .5~l ):!
7
(26-l):!
+-_-,
l
-:~(-11 + 1)
LT (11.8.2)
:\ti.:\~l
-tl"~-n

donde T::: t 3 - r. La letra t se utiliza para designar el número de observa- Al C1ln~ul1ar !a tabla F. con k - J ::: --+ gr<.1dos de libertad. se encuentra
ciones iguale~ en un grupo de valores empatados. En este ejen1plo, sola- que la pnibahi \iJa<l dt' obtener un ,·alor Je H tan grande o igual que ~6.39

l j
E.~tadística no paran1étrica y de libre distribución Ejercicios 735
734
El siguiente con1anJo produce el análisis junto con la salida impn::sa.
Tabla tl.8.3, \ 1alur nclu en libros del equipo por ca,na según el tipo de hospital
11po ae hospital
KRUSKAL WALLIS FOR DATA IN C1 SUBSCRIPTS IN C2
A B e D E

Sl735íllJ 55260(35) 52790(20) $3-li5(26) S6090(40)


1520(2) --l--1:55(28) 2-lOO( 12) 3115(22) 6000(38)
1-176( 1) 4-l.'~0(29) 2655( 16) 3050(21) 5894(37¡
1688(7¡ "1:125(27) 2500( 13) 3125(23) 5i05(36) LEVEL NOBS MEDIAN AVE. RANK
1702(10) 507S(32) 2755( 19) 3275(24) 6050(39¡ 1 5 11.000 11.0
6.500 b.5
2667( 17)
1575(4)
5225(3-l)
4613(30)
2592( 14)
2601( 15)
3300(25)
2730( 18)
6150(41)
5110(33)
2
3 "" 2.500 2.5
1602(5) 4887(31 ! 1648(6) OVERALL 13 7.0
1530(3} 1700(9) e = 10.6a
1698(8) B{ADJ. FOR TIES) = 10.71
R 1 = 68 R'.!. = 2-lü R:J = 124 R4 : 159 R 3 = 26-l
Figura 11.8.1. Salida i,nprcsa del programa t,..fINITAB para la prueba de Kruskal-
\Vallis de los dalos de 1ien1pos de reacción de la tabla l l .8.1.
debido sólo al azar, cuando no hay diferencia entre los grupos, es menor EJERCICIOS _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ __
que .005. Se concluye. entonces, que sí existe una diferencia entre las cin~
co poblaciones con respecto al valor promedio de la variable de interés.
Para los ejercicios siguientes. efectuar la prueba al nivel de signifi-
cación que se indica y detern1inarel valor p.
Análisis por computadora El paquete de software MINITAB calcula la
estadística de prueba de Kruskal-Wallis y proporciona información adi-
11.8.1 La siguiente tah!a indica lo:,, nÍ\'eles del residuo de plaguicida (ppb) en
cional. La sal ida in1presa de dicho programa que corresponde a los tiem-
n1uc.~1ras lle sangre extraídas lle cuatrü grupos de personas. Utilizar Ja prue-
pos de reacción de la tabla 11.8.1, se muestra en la figura 11.8. 1. ba J..: Kruskal- \Va!lis para probar. a un nivel de significación de .05, la
Los datos de la tabla 11.8.1 se introducen en la columna I y los códi- hipótesis nula J.: que no e xisce difercnci::i entre los grupos con respecto al
gos de los grupos en la columna 2 de la siguiente manera; ni \·el 1ncJio Je residuo Je plaguicida.

MTB > READ REACTION TIME INTO C1, CODE FOR GROUP INTO C2
DATA> 17 1 Población
DATA> 20 1 A B ( D
DATA> 40 1
DATA> 31 1 111 15 ;
DATA> 35 1 Ji " 11
DATA>82
DATA> 7 2
!'.!
::i1
:l~J
:t~
]'.)
111
!'.!
' IU
8
DATA> "I 2 11 :IJ ,; 2
1
DATA> 8 2 ,;
'
],'\
DATA> 2 3
DATA> 5 3
H " 11 9 4

DATA> 4 3
]'.!
L-i
;
'.\'.!
11
,, 5
"li
DATA> 3 3 t'.! 1; IS
DATA> END '.!:\ ., !;') :1
736 E.,·tadísti,·a no para111étril·a y de libre distribución Análisis bilateral de i·aria11cia, por rangos, de Fried1na11 737
11.8.2 Los siguientes valores corresponden a los gastos diarios pron1edio de pa- 11.8.6 Utili1.ar lo.\ d;idos del ejercicio 7 .2.3 y aplicar la prueba de Kruskal-V-/a!lis.
cientes hospitalizados por inLCT\'cnción quirúrgica. Estos gastos se ob- 11.8.7 Utili,.ar lus datos do.:I cjcn:icio 7 .2.4 y aplicar la prueba de Kruskal- \Vallis.
tuvieron en ,nuestras de hospitales localizados en tres diferentes partes 11.8.8 Sc n1idiú la activi<lad hepática del transpéptido y-g\utarnil transpeptidasa
del país. (GGTP ¡ L'n 22 pacientes son1ctidos a biopsia pcrcutánca del hígado. Los
rc,;u lt;1Jus M,n los indicados en la tabla de la parte baja de lapágina anterior.
Área
¡_Es p,,..,1hlc concluir a partir de estos datos que el nivel promedio de GGTP
11 lll de !:t p11hlaciún di fi.cre en los cinco grupos de diagnóstico? Sea a= .05 y
5)8.ti:1 c:tlcular el valor p.
$80.75 S H--1.21
78.15 72.iO 1O!. 76
85..-1:0 64.2() 107.74
7 l.Y4 62.50 115.30 11.9 ANÁLISIS BILATERAL DE VARIANCIA,
82.05 fi3.24 ]26.15
POR RANGOS, DE FRIEDMAN _ _ _ _ _ _ _ _ __

Con un ni\'el de significación de .05, ¿es posible concluir que los grupos Así como en ocasiones se tiene la necesidad de un análisis no paramétrico
di rieren con respecto a los gastos diarios promedio'? análogo al análisis paramétrico unilateral de variancia, en ciertos casos es
11.8.3 Utiliza los Jatos de la tabla 7.2.1 (cjen1p!o 7.2.1 J y aplicar la prueba de necesario ana tizar los datos de una clasificación bilateral mediante méto-
Kruskal-\Vallis. Co1np.1rar los resultados con aquellos que se obtienen dos no parü111étricos análogos al análisis bilateral de variancia. Esta necesi-
r.:uanJo se utiliz..i la prueba F. dad puede surgir debido a que no se satisfacen las suposiciones necesarias
11.8.4 Utilit.ar lo~ Jatos del cjcn:iciu 7.'2.1 y aplicarla prueba de Kruskal-Wallis. para el análisis paran1étriL'.o de variancia, ya que Jaescalade medición que
11.8.5 Uti!izur los datos dc\ ejercicio 7.2.2 y aplicar la prueba de Kruskal-Wallis. se utiliza es ··frúgi!'' o porque es necesario obtener los resultados rápida-
1nente. Una prueba que suele utilizarse en estos casos es el análisis bila-
GGTP hepdticll teral de varianc ia por rangos de Friedrnan. 47 .4 8 Esta prueba es conveniente
lndi1·iduo Diag111ístíco (µ/g de profí'ÍllCI) siempre que los datos se nlidan. al menos, en una escala ordinal y puedan
,¡- -
disponerse significativamente en una clasificación bilateral, corno se hace
1 Hígado nonnal - {. 1

2 Cirrosis biliar primaria 45.9


en el di!>eño de bloques completos a\eatorizados, que se estudia en el capí-
3 Enfermedad del híg:aqo por ak:oholismo l-i:'"J.'.~ tulo 7. El "iguil..!nte ejemplo ilustra este procedimiento.
4 Cirrosis biliar primaria :'i~J.0
5 Hígado normal '.!.".i.,",
Eje,nplo 1J.9. J Un fisioterapeuta condujo un estudio para comparar tres
,6 Hepatitis persistente
Hepatitis crónica activa
.'{9.0
.,¡ 1.:-i modelos diferentes de generadores de ondas de bajo voltaje. A nueve
8 Enfermedad del hígado por alcoho!isn10 fi4.I fisioterapeutas se Je-; pidió que clasificaran en orden de preferencia a esos
41 1
1"
Hepatitis persistente tres genera dore:>. Un rango de I indica la pri1nera preferencia. Los resul-
() Hepatitis persistente '.1:",.i
11 Enfennedad del hígado por alcoholismo 71 .:) tados :,e n1uestran en la tabla 11.9.1. Se pretende saber si es posible con-
12 Cirrosis biliar primaria 40.~/ cluir q uc los n1o<le los no tienen igualdad de preferencia.
13 Hígado normal '.1K.]
14 Cirrosis biliar primaria -,11)..,!
15 Cirrosis biliar primaria '.}.,!. () Solución
16 Enfennedad del hígado por alcoholismo í-l.4
17 Enfermedad del hígado por ak:oht1lis1no ,:-:.'.! l. !Jatn.1. Verlatahla 11.9.1.
18 Hepatitis persi~tentc '.','.!.fi 2. S11pr11icin111·s. La" ohscrvacioncs que aparecen en un bloque dado son inde-
IY Hepatitis crónica acli\a lti.:1 pendiente, Je la~ ohscrvacioncs que ap:.ircccn en cada uno de los demás blo-
:.!() Hígado normal .'l!I.I)
'.!I Hepatitis cróniL·a activa -)_. -I
') que". y l<-1" nicdiciuncs rJcnlr(I de cada hloquc se logran, al n1enos, en una escala
'.!'.! Hcpatiti" crónica activa .-, 7 .:! ordin,i!
J. lli¡J1Í/c.1i1 J:n ~cncral. la" hipf>tc~i.., "ºn
f.:stadístit:a no para,nétrica y de libre di.\1ribucián Análisis bilateral de variancia, por ra11gos, de Fried,nan 739
738
Tabla 11.9.1. Cl.1siriL'ación en orden donde II es el núrnero de renglones (bloques) y k es el número de columnas
de prefcrcn...:ia de tn.:s oJclos de ( tratan1 i e ntos J.
generadores de undas de bajo voltaje 5. Disrrih11ciá11 de la estadística de prueba. Los valores críticos para diverso'.:
valort:s Ue 11 y k ~e cncuentr..1n en ta tabla N.
l\,lodelo 6. Ref{la de decisión. Rechazar H 0 si la probabilidad de obtener un val o~ de x;.
Fisiolerupe11ra A B ( mayor o igual que t'l valor calculado es n1enoro igual que a, cuando H es ver-
0
dadera.
2 3
7. Cúlculn de In esradí.1·ricade prueba. Mediante e[ uso de datos de la tabla 11.9. 1
2 2 3
2 :1 y la c<.:uaciún 1 1.9. J se obtiene
3
4 1 3 .,
12 .
5 '.l 2 xc Y(3)(3 + 1) !(15)'
2
+ (25) + (14)'1 - 3(9)(3 + 1)
6 1 2 '.I
7 2 3 1
8 1 3 2 = 8.222
9 1 3 2
8. Decisúín e.1rudlsrica. Al consultar lá tabla Na del apéndice II. se encuentra que
R¡ 15 25 14 la prohahi lidaJ de oh1cner un valor para x;.
tan grande como 8.222 debido sólo
al azar cu.inUo la hipótesis nula es verdadera, es de .016. Por lo tanto, es posi-
Ha: T11<los los lratarnicnlos tienen efectos idénticos. ble rccha/ar la hip6tesis nula.
11,\: A.\ 1nenos uno <le los tratamientos tiende a propori.:ionar observaciones 9. Co11cl11siú11. Se coiu.:luye que Jo~ tres modelos del generador de ondas de bajo
rnás grandes que. al menos, uno de los tratainientos. voltaje no tienen igual preferencia. Para esta prueba, p = .016.
Para este ej¡.:111plo. las hipótesis se enuncian como sigue:
Cuando los elatos originales .se componen de mediciones en un interva·
H0 : Los tres n1ode[os tienen igual preferencia.
HA: Los tres ino<le\os no tienen igual preferencia. lo o una escala de razones y no de rangos, se asignan rangos a las mediciones
con base en sus 1nagnitudes relativas dentro de los bloques. Si hay valores
Sea a= .05.
iguales, a cada uno de ellos se le asigna la media de los rangos de todos los
4. Estadistica de prueba. Por rncdio de la prueba de Friedman es posible deter- valores iguales.
1ninar si es razonable suponer que las columnas de rangos fueron ex.traídas de
Cuando los valores k.11 o ambos exceden a los que aparecen en la tabla
la 1nisma población. Si la hipótesis nula es verdadera se esperarí.1 que la dis-
N del apéndii::e 11, el valori::rítii::o de X~-· se obtiene al consultar la tabla de
tribución observada de los rangos en cualquiera de tas colun1nas sea el resul-
tado de factores .1leatorios y, por lo tanto, se esperaría que los números 1. 2 y 3 ji·cuadrada (tabla F) con ay k- 1 grados de libertad elegidos.
ocurriesen aproxi1nadan1ente con la 1nisn1a frecuencia en cada columna. Por
Eje,nplo 11.9.2 La tabla 11.9.2 muestra las respuestas, en porcentajes de
otra parte. si la hipótesis nula es falsa (esto es. si los ,nodc!os no tienen igual
disn1inución del flujo salival. de 16 ani1nalt':s de laboratorio después de re-
prefcrcn<.:ia) se esperaría una preferencia de rangos relativamente alta ( o baja)
en, al n1cnos. una colu1nna. Esta condición se refleja en la suma de los rangos. cibir diferente ..., dosis Je atropina. Los rangos (entre paréntesis) y la suma
La prucha de Fried,nan dir,\ si las sun1as de rangos ohscrvad.:is son tan distin- de éstos se n1uestran en la misma tabla. Se pretende saber si es posible con-
tas que no sea probable que se deban sólo al azar cuando H 0 es verdadera. cluir que las diferentes dosis produi::en respuestas distintas. Es decir, se
Dado que los datos fueron clasificados en bloques (renglones), el primer desea probar la hipótesis nula según la cual no hay diferencia en las respues-
paso es sun1ar los rangos dentro de cada co!un1na (tratamiento). Estas sun1as tas a las cuatro dosis.
son los R. que se muestran en la tabla 11.9. l. Una estadística de prueba. deno-
tada por ~riedn1an con10 X~-· se calcula con10 .sigue: Solución A partir de los datos, se calcula que
12

,, 1')
• (11.9.1)
x'f = 1<..:,, ., , . , ¡ i(20¡'.! + ('.'H).;)/2 + (ltJ 2 + (;)!1.::i) 2 : - :~( lf))(-4 + 1)

x: nk (11 + 1)
L'.
¡= l
(R )' - 3,,¡¡
I
+ 11 = :11J.'.{2
740 E.~tadística no para111étrica y de libre distribución Ejercicios 741

Tabla J1.9.2. Porcentajes de disminución del flujo salival de ani1nales de laborato- l\1ateria
rio Jc:-pués de recibir diferentes dosis de atropina Estudiante Fundan1e11tos Fisiología A11aron1ía
N1in1ero Diferentes dosis
1 98 95 77
a11iff1al A H e ll 2 95 71 79
3 76 80 91
29(10) 48('.!) 7S( '.1) IOll(--1-l 4 95 81 84
2 72(2) '.{O( 1) 100('.'L:l) 100(:t:i) 5 83 77 80
3 70( l) 100(4) Hfi('.2) !lfi( :\) 6 99 70 93
4 :l.,1(2) :r1( 1) 90( :-1) \1\l(-l) 7 82 80 87
5 S( 1) 4:{('.{) '.-12(2) ~ l(--l) 8 75 72 81
6 17(1) -10(2) 7!'1(:-\) ~1(-.1) 9 88 81 83
7 i--l( l) 100¡:-1) l 00($) ! ()()(:-\ l
H 6( 1) :-1-1(2) (iO(J) 81(-l)
!l 16( 1) '.-19(2) i:\(:-1) 19(--1) 11.9.2 A quince estudiantes de fisioterapia seleccionados al azar se les dieron las
JO .12(2) :\4( 1) 8H(:-\) 9!'1t-ll siguientes instrucciones: "supongan que se van a casar con una persona
11 Hi 11 -12(:-\¡ '.-\1(2) 7!1(--1) que tiene alguna de la siguientes incapacidades (se clasificaron las inca-
12 29( 1) -17(2) 72('.-\J 9()(--1) pacidadcs de la A a la J}. Ordenar estas incapacidades de 1 a 10, de acuer-
13 7l( Jl 100('.-\.:i) 97(2) 100(.'-l.:i)
do con su pri1ncra. segunda, tercera (y así sucesivamente) elección de la
14 7( [) ;t-\(2) :íl<o('.-\) i~l( -t)
15 68( 1) 9()(-1) 84(2) 11:-1¡:q incapacidad que aceptarían en su conyuge". Los resultados se muestran en
16 70(2) '.-\O( 1) !l!l(:t:J) q(J(:-l.:"'1) la siguiente tabla.

R, 20 :-11).3 41 ;,q_;l
Nll111ero Incapacidad
estudiante A B e D E F e H 1 l
1 1 3 5 9 8 2 4 6 7 10
Al consultar la tabla F, ésta indica que. con k- 1 = 3 grados de libertad, 2 1 4 5 7 8 2 3 6 9 10
la probabilidad de obtener un valor de x7. tan grande como 30.32 debido 3 2 3 7 8 9 1 4 6 5 10
4 7 8 9 2 3 6 5 10
sólo al azar, es 1nenorque .005. Se rechaza la hipótesis nula y se concluye 4 1
9
5 1 4 7 8 10 2 3 6 5
que las diferentes dosis producen respuestas distintas. 7 9 8 1 4 5 6 10
6 2 3
2 4 6 9 8 1 3 7 5 10
7
8 1 5 7 9 10 2 3 4 6 8
1 4 5 7 8 2 3 6 9 10
9
10 2 3 6 8 9 1 4 7 5 10
EJERCICIOS:_-'------------------ 2 4 5 8 9 1 3 7 6 10
11
12 2 3 6 8 10 1 4 5 7 9
3 2 6 9 8 1 4 7 5 10
13
Para los siguientes cjcn:Jcios. lle"ur a caho la prueba al nivel de significación indi- 14 2 5 7 8 9 1 3 4 6 10
cado y calcular el valor p. 15 2 3 6 7 8 1 5 4 9 10

11.9.1 La siguiente tabla indica las calificaciones obtenidas por nue\'e estudianles
de enfern1ería seleccionadas al azar en los exámenes finules de tres n1ate- Prohar la hipótesis nula de que no existe preferencia respecto a las inca-
rias distintas. Probar la hipótesis nu lu según lacua l losestudiantes de enfer-
pacidades r.:nntra la hipótesis alternativa de que algunas incapacidades se
mería que constituyen la pohlación de la cual se extrajo la n1ucstra tienen
prefieren sobre otras. Sea a= .05.
un aprovechanliento igual en las Lres n1atcrias. C(1ntra la hipótesis alterna-
11.9.3 Util i,.ar e! p!anteanliento del ejemplo 7 .3.1 y resol verlo mediante la prue-
tiva de que su apro\·echan\lcnto es 111cjor por l0111cnos en una de las mate-
ba de Friedn1an. Con1parar los resultados con los que se obtienen cuando
rias. Sea a= .05.
se uti I i 1.'.l el análisis bi laten1l pan11nétrico de variancia.

1
J,,'stadística no para111étrica y de libre distribuchín Coejtcie11te de correfacit)n, por rangos, de Spearn1a11 743
742
11.9.4 Utilizar los <latos del ejercicio 7.3.J y resolver el problen1a n1ediante la a. H0 : )( y Y son n1utuan1ente independientes.
prueba Fricú1nan. HA: X y Y no son n1utua1ncnte independientes.
11.9.5 l\,1c<liantc la prueba de Fricdinan. resolver e! ejercicio 7.3.2. b. // 0 : X y Y son 1nutua1nente independientes.
IJ.9.6 l\,lcJiantc la prueba de fricdrnan, resolver el cjcn:icio 7 .3.3. HA: Existo.: una tendencia a formar parejas entre los valores grandes de X y
J 1.9.7 tvlcJi ante la prueba de Fried1nan. resolver el ejcn:icio 7 .3.4. los va!nrcs grandes de Y.
11.9.8 Di..:1. i1HJi \·iduns con asma inducida por ejercicio participaron en un experi- c. H 0 : X y Y son 1nutuan1en1e independientes.
1ncnLo para comparar el efecto protector de un mcdicamcnto administrado HA: Ex i stc una tendencia <le 4uc los valores grandes de X formen parejas con
en cuatru Josis. Se utilizó una solueión salina como control. La variable de los va!{ires pequeños <lL' Y.
interés f uc el volumen espiratorio fnrtadodcspués de la administración de!
1ncdica111cntD o la solución salina. Los resultados íueron los siguientes: Las hipótesis especificadas en el inciso a conducen a una prueba bila-
teral y se uti I izan cuando se desea descubrir cualquier desviación de la inde-
Dosis del n1cdicamcnto (mg/ml) pendencia. Las pruebas unilaterales indicadas en los incisos by e se uti-
Solución lizan, respectivamente, cuando el investigador desea saber si es posible
Individuo salina 2 JO 20 40
concluir que las variables están directa o inversamente relacionadas.
1 -.68 -.32 -.14 -.21 -.32 El procedi,niento para probar ias hipótesis comprende los siguientes
2 - l.55 -.56 -.31 -.2! - .16 paso"'·
3 - 1.41 -.28 -.11 -.08 -.83
4 -.76 -.56 -.24 -.41 -.08
5 -.48 -.25 -.17 -.04 -.18 l. Se asocia una categoría a los valores de X desde !.hasta 11 (el número de pare-
6 -3.12 - 1.99 - 1.22 -.55 -.75 jas de valores de X y Y en la n1uestra). Se asocia una categoría a los valores de
7 - 1.16 -.88 -.87 -.54 -.84 Y desde J hasta 11.
8 - 1.15 -.31 -.18 -.07 -.09
9 -.78 -.24 -.39
2. Se cah.:ula d¡ par.1 cada pareja de observaciones. restando el rango de Y¡del ran-
11 -.51
10 -2.12 -.35 go de X,..
-.28 +. l l -.41
3. Se eleva al cuadrado cada di y se calcula Ldl, la surna de los valores al cua
dradu.
¿Es posible concluir, de acuerdo con estos datos que las diferentes dosis 4. Se calcula
tienen erectos distintos? Sea a= .05. Calcular el valor p.
6Ld: (11.10.1)
r = 1 -
n(n• - 1)
11.10 COEFICIENTE DE CORRELACIÓN,
5. Si II esc,i entre 4 y 30. se con1para et valor calculado de r5 con los valores críti-
POR RANGOS, DE SPEARMAN _ _ _ _ _ _ _ __
cos. r_;'. de la tabla O. Para la prueba bilateral, se reChaza H 0 al nivel de sig-
ni ficac irin a si r, es 1nayor ar; o n1enor que -r;, donde r_: está en la intersec-
El investigador cuenta con varias medidas no paramétricas de correlación. ción dc l.1 L'Olunina encabezada por a/2 y el renglón que corresponde an. Para
Para un análisis detallado de los diferentes métodos. consultar las refe- la prucha unilateral con HA que especifica una correlación directa, se rechaza
º
rencias Kendali. 49 Kruskal 5 y Hotelling y Pabst. 51 H 0 al ni \'C! de significación a si rs es tnayorque r; para a y 11. La hipótesis nula
Un procedimiento que se utiliza con frecuencia y que resulta interesante se rechaza a! ni\·c! de ~ignificación a en la otra prueba unilateral si r.1 es menor
por la sencillez de los cálculos que implica, se debe a Spearman. 52 Las medi- que-rt pora a y 11.
das de correlación que se calculan mediante este método se conocen como 6. Si II es n1;1yorqu<:: 30. puede calcularse
coeficientes de correlación por rangos de Spearman y se designa por r • Este
5 ::=r,~l (11.10.2)
procedi111iento utiliza los dos conjuntos de rangos que pueden asignarse a los
valores de las ,nuestras de Xy Y, que son las variables independiente y con- y utilizar la tabla C para obtener los valores críticos.
tinua, respecti van1ente, de una distribución en dos variables. Las hipótesis 7. Las obsCr\·acinnes de igual vainr nurnérico plantean un problema. Glasscr y
1
nulas y alternativas que se prueban con 1nayor frecuencia son: \\'in ter·' .~ciia!an que e! uso Je !u tabla O es estrictamente \·á[ido sólo cuan<lo
744 t.:stadística no paran1étrica y de libre distribu,·ión Coeficie11te de correlación, por rangos, de Spearman 745
en los datos no h,1y dos valores iguales (a menos que se emplee algún procedi- con edades entre 20 y 60 años. La tabla 11.10.1 muestra las edades y un va-
miento aleatorio para ron1pcr los que sean iguales). Sin embargo, en la prácti- · lar de rendin1iento del EEG particular para cada una de esas 20 personas.
ca, con frecuencia se utiliza la tabla después de que se ha utilizado algún otro
método para in anejar los valores numéricamente iguales. Si el número devalo- Solucióu
res numérica1ncntc iguales es grande, puede utilizarse la corrección por va-
lores iguales dada por S iegcl y Castcllan. 5 El factor de corrección, para los valo- l. Datos.Verla1ablall.lO.l.
res iguales es el siguiente:
Tabla 11.10.1. Edad y resultado del EEG
t?, - t (11.10.3) de 20 individuos
T
12 Resultado
Individuo Edad (X) del EEG IY!
donde tes el nú1ncro de observaciones de igual valor numérico para algún rango
particular. Cuando se utiliza esle factor de corrección, r5 se calcula a partir de
1 20 98
2 21 75
3 22 95
(11.10.4)
¿x' + ¿/ - ¿d; 4
5
24
27
100
99
r, 6 30 65
2y¿x ¿y2 2 7
8
31
33
64
70
9 33 85
en lugar de l::i ecu::ición 1 1.10.1 10 38 74
En la ecuación 11.10.4 se tiene 11 40 68
12 42 66
13 44 71
,¡,., n3 -n ,¡, 14 46 62
¿,x· - -12- - ¿,T, 15 48 69
16 51 54
17 33 63
¿-
t2 =---
3
n - n ¿T 18 33 52
12 ' 19 58 67
20 60 55
T,. = la suma de los valores de Tpara los diversos 2. Suposiciones. Se supone que ]amuestra disponible para el análisis es una mues-
rangos de valor numérico igual en X, y tra aleatoria sin1plc y que X y Y son medidas en, al menos. una escala ordinal.
T1. =la suma de los valores de Tpara los diversos 3. Hipótesis
rangos de igual valor numérico en Y
H0 : El rendin1icn to de I EEG y la edad son muluamente independientes.
Gibbons,:Z al igual que Siegel y Castellan, 5 señalan que a menos que sea exce- HA: Existe una tcnJenciu para este rendí,niento del EEG de disminuir con la edad.
sivo el número de cantidades con igual valor numérico, la corrección produce
una diferencia n1uy pequeña en el valor de r J'" Cuando el número de valores Suponer que a::: .05
iguales es pequeño. puede seguirse el procedimiento habitual de asignar a las
observaciones de igual valor numérico la media de los rangos que intervienen 4. Estadística de prueba. \-'er la ecu::ición 11.10. l.
Y proceder con los pasos anteriores del 2 al 6. Edgington 54 analiza con cierto 5. Disrrih11cirí11 de la estadística de prueba. Los valores críticos de la estadística
detalle este problema. de prucha se encuentran en la tabla O.
6. Regla de lÍ('('isúí11. Para esta prueba se rechazaH 0 si el valor calculado de r, es
Eje1nplo 11.IO.J En un estudio de la relación entre la edad y los resulta- 1nenor 4uc -.3789.
dos del electroencefalograma (EEG) se recopilaron datos en 20 personas 7, Cáfcu{" de lo e.11"dí.11ica de prucha. Cuando los valores de X y }' son arreglados
Estadística no paraniétrica y de libre di.\·tribu,:üJn Coeficiente de correln.ción, por rangos, de Spearma,r 747
746
por rangos se tienen lo:; resultados que se n1ucstran en la tabla l l .10.2. Los d¡, mutuamente independientes contra la hipótesis alternativa bilateral de que
d1 y Ld 2 se rnuestran en la misrna tabla. no son mutuarnente independientes.
' Lu 'sustitución de los datos de la tabla 11.10.2 en la ecuación 1 1. 10.1 pro-
porcion..i
Solución A partir de los datos en la tabla 11.10.4, el cálculo es
6(2340)
-.76 6(1788.5¡
,, - 1 - 20' (201' - 1 l =
,-,
l - 35¡35:! - lj .75

8. Decisirín esutdi'srica. Dado que el valor calculado de rs ==-.76 es 1nenorque el


valorcrílii.:o de r;. se rechaza la hipótesis nula. Para probar la significación de rs se calcula
9. C 011cl 11silJ11. S t:! con el uye que las dos variables se encuentran in vcrsame n te re 1a-
cionadas. Puesto que-.76 < .06586, se tiene que para esta pruebap < .001. z = .i5V35 - 1 = 4.37
Tabla 11.10.2. Datos del ejen,plo 11.1 O. 1 clasificados por rangos
Dado que 4.37 es mayor que z =3.89,p < 2(.0001) =.0002, por lo que
Individuo Rango ( X) Rango (Y.J d, d~ se rechaza H 0 y se concluye que las dos variables en estudio no son mutua-
18 - li 289 mente independientes.
2 2 IS - 13 169 Con fines con1parativos, a continuación se realiza la corrección para
3 3 17 - 14 196 \'alores iguales mediante la ecuación 11. I 0.3 y después se calcula rs me-
4 4 20 -lfi 256
diante la ecuación 11. l 0.4.
5 5 19 -14 196
6 6 7 -1 1
7 7 6 1 1
8 8 12 --4 16
9 9 16 -7 4~)
l() !O 14 -4 16 Tabla 11.10.3. E<la<l y concentraciones dt: cierto mineral (ppm) en tejido
11 11 10 1 1 de 35 individuo~
12 l2 s 4 16
13 13 13 [) [)
Edad Conce11traciú11 Edad Concentració11
14 14 4 IIJ roo del n1i11eral ( Y)
IS 11 4 16 !ndi1·id110 (X) lndh·iduo (X! del n1ineral ( Y)
"
16
17
lfi
17 s
2 14
12
196
l+t 82 169.62 19 50 4.48
18 18 1 17 289 2 85 48.94 20 71 46.93
9 10 100 3 83 41.16 21 54 30.9[
19 19 6, 22
20 20 3 17 21'l9 "s 82
63.95
21.0~l 2:\
62
n
3-1.27
..¡ 1.44
~ d f = 2340 fi
;
53 3.-10 2-1 f-ifi 109.88
26 6.3:1 2:) ~\..¡ 2.78
47 26
El siguiente ejeinplo muestra e 1procedimiento para una muestra con 10
'
9 37
,9
4.2fi
3.62
4.82
,,-
-,
28
46
27
4.17
6.57
ti 1.7:\
n > 30 y algunas observaciones iguales. 11
12
ti5
40
108.22
10.20
29
:111
'"-,,,_ 47.:i9

Ejemplo I l. I 0.2 En la tabla 11.10.3 se muestran las edades y las concen-


[:'\ 32
50
2.69 31 "':15 IIJ..f6
:ton
traciones (ppn1) de cierto n1ineral en la piel de 35 individuos a quienes se
les practicó la autopsiacon10 parte de un proyecto amplio de investigación.
'"
15
16
62
33
6.16
23.Hi
2.70
32
:l:l
3,
75
:)()
ih
49.57
S.5:)
50.2.'~
¡;
c,;
En la tabla 11.10.4 se ,nuestran los rangos de d¡, 2 y L<l(. Se pretende
IS
36
s:1
3. !5
60.:i(l
:t) 2H (i .•~ ¡

probar, a un nivel de significación de .05. la hipótesis nula de que X y Y son


Ejercicios 749
748 "'ci
~!~~~~~~~~~~~~~~~~~
X
~

~~ ~O~~>t'l~O~~~·~T~
En los rangos de X, se tuvieron seis grupos de valores iguales que se
~ -T ~~~
- T ~
-
O
s:,-
dividieron asignándoles los valores 13.5, 17, 19.5, 21.5, 23.5 y 32.5. En
cinco de los grupos, dos observaciones son iguales en valor numérico y, en
H
un grupo, tres. Por lo tanto, se calculan cinco valores de
'-'"l tf') tf') \(';
~1~~ -~~~~ll"l~~~~~~tf')~~
23 - 2 6
T = _1_2_ = 12 = ·5
'
y un valor de
o 33 - 3 24
T =---=-=2
"§;;: ~tf')-~TT~~tf')-~XTX~~~
~~~~~ -~~- ~-~- ' 12 12
o: -
A partir de estos cálculos, se tiene que LTx= 5(.5) + 2 = 4.5, de tal for-
ma que
§; ..., ll"l tf') ll"l

J8
~~~~~~o~~~~-~o~-~
-~~~-~ - ~~- ~-~ ¿' 2 = 35' - 35 3565.5
12 - 4.5

o Dado que no se tienen valores iguales en los rangos de Y, se tiene que


~
·~1~=-~~~>l'lQ~X~O-~~Tll"l
~ -~~~~~~~~~~~~~~~~
IT,;Qyque
¿ 3
'I:' 2 35 - 35
L,Y = '" - O= 3570.0

,._¡ ~~~~~~~~~~~~~~~~~~
o•-~~~~=:.>l'l:.~:.o~:.~o A partir de la tabla 11.10.4 se tiene LdJ = 1788.5. A partir de estos datos,
=••x~=m
- - - ••• -- - puede calcularse ahora, mediante la ecuación 11.10.4,

"' ~ ~~ tf') ~ ll"l r,


3565.5 + 3570.0 - 1788.5
2'V(3565.5) (3570)
.75
~X-~~X~tf')~>l'l~~~·~~~O
2 1 -1- - 1 -
~
E Se observa en este caso que la corrección para los valores iguales no
o
-~ produce diferencia alguna en el valor de rs.

~1~ tf')~~~~-•x==~~-~=~ll"l=
~ 5· ;;::- mNwm--- -m- -• m
~ o: -
'o EJERCICIOS~----------------
o
~

i,I ~
::: ~ R
tf')

~"'•"'~~-~m~==•~~~x~
~~~~~- -~- -~
tf')tf') tf')

-
tf') tf')

-
Para los siguientes ejercicios, llevar acabo la prueba al nivel de significación indi·
cado y detenninar el valor de p.

.
o:
;
-
11.10.1 La siguiente tabla muestra 15 regiones geográficas seleccionadasal azar,
con rangos asignados respecto a \a densidad de población y tasa de mor·
"' 11-~~~tf')=~x~=-~~~tf')=~x
lalidad ajustada por edades. ¿,Es posible concluir, a un nivel de signifi·
---------
~
~
• 1·

¿
750 f.'stadística no para,nétrh·a y de libre distribución Análisis 110 para,nétrico de regre.'>üi1J 751
cación de .05, que la densidad de poblaci6n y la tasa de mortalidad ajus- 11.10.3 Con h>s datos del ejcn1plo 8.7 .1. calcular r.1 y probar la hipólesis nula de
tada por edades no son mutuamente independientes? que lo~ n1étodos son mutuamente independientes. Con1parar los resulta-
dos con !os que se obtuvieron al utilizar los métodos del capítulo 8.
Rangos respecto a ri
11.10.4 Calcular para los datos del ejercicio 8.7.3 y probarla hipótesis nula de que
las do~ v:iri,iblcs son n1utuamente independientes. Comparar los resultados
Densidad Tasa de ,norta!idad
Área de población (X) ajustada por edades ( Y) con los que se obtu\·ieron al utilizar los métodos del capítulo 8.
11.10.5 Ca!cula1· r, para los datos del ejercicio 8.7.4 ¿Proporcionan estos datos
8 10
suficicn!L' evidencia que indique que la concentración de CO aumenta
2 2 14
3 12 4 confnnnc au1ncnta la congestión del tráfico?
4 4 13 11.10.6 Cal cu lar r, para !os datos del ejercicio 8.7 .5 y probar la hipótesis nul ade
5 9 11 que las dos \'ariables son mutuamente independientes.
6 3 1 11.10.7 Dici:isietc pacientes con una historia clínica de insuficiencia cardiaca
7 JO 12
congesti vu participó en un estudio para estimar el efecto de ejercicio sobre
8 5 7
9 6 8 varias funciones corporales. Durante un período de ejercicio, se reco-
10 14 5 lectaron [os siguientes datos Con relación al porcentaje de cambio en la
11 7 6 norcpincfrina en plasn1a (Y) y el can1bio porcentual en el consumo de
12 1 2 oxígcno (,'( ).
1'.l 13 9
10 15 3 lndiriduo r
15 11 13
'
;)()I) ·,¡-
o_:,
~ -41:i 130
11.10.2 La siguiente tabla 1nucstra I O comunidades con rangos asignados n::spec- :i '.1()() :~'.!:)
to a los diente~ con .:aries, faltantc:; y obturados (CFO) por cada 100 '.~'.!:l 190
niños y a la cnnccntrai:i6n de fluoruro, en ppm, en el sunlinistro públi- :1'.!S 90
"
co de agu.i.
"7
X
'.!();l
'.!00
/:)
'.!!l.)
!,~()
74
Rangos respecto a 11 '.!:10 420
111 ;iO bO
Dientes CFO 11 11.i 10)
porcada ('011centració11 !'.! 1:~()
Conuinidad 14K
100 núios defluoruro 1:l ¡¡¡ 75
8 1 ¡; 200 250
2 9 3 l'.'i li'.J 102
3 7 4 [li '.!O] [:)!
17 J 'l - ! :10
4 3 9 -·'
5 2 8
6 4 ;
; i.Con !,ase cn estos datos. es posible concluir que existe una asociación
1 111
8 5 6 entn: las dllS variati!cs? Sea a= .05.
9 6 5
10 1{)
"
11.11 A!';..\LISIS NO PARAMÉTRICO DE REGRESIÓN _ __
;. Proporc i unan cs!t is datos e\ idencia su f1cie nlt: para indicar que el número
Je Ji<..'nte~ CFO porcada ! 00 niño.~ tiende a decrecer a n1edi<laq uc aumen- Cuando la:-. .\uposicilltll'S que funda1nentan e! análisis de regrt:'sión lineal
L.1 la conccntraci6n de fluorurrJ".' Sc.i u.= .05.
sin1ple que:-..: estuUia en e I capítulo 8 no se cutn plen. es posible uti Iizar pro-
Estadística no paramétrica y de libre distribución Análisis no para111étrico de regresión 753
752
Tabla 11.11.2. Valores
cedimientos no paramétricos. En esta sección se presentan estimadores de
ordenados de \j para el
la pendiente y la ordenada al origen que son alternativas fáciles de calcu-
ejemplo 11.11. \
lar para los estimadores de mínimos cuadrados, descritos en el capítulo 8.
-.6618 .5037
Estimador de la pendiente de Theil Theii 55
propone un método para .1445 .5263
.1838 .5297
obtener la esti1nación de un punto del coeficiente pde la pendiente. Se su- .2532 .5348
pone que los datos constituyen el ,nodelo clásico de regresión .2614 .5637
.321 (i .5!:-!27
.32.'í .6HO]
y, = a + l3x + e,,
1
I l , · · ' , 11
.3472 .8'.133
.3714 .8R24
donde las x¡ son constantes conocidas, a y p son parámetros conocidos, y .3846 .~836
.4118 1.0000
Y; es un valor observado de la variable aleatoria continua Y en x¡. Para cada .4264 1.0078
valor de x¡, se supone una subpoblación de Y valores, y las e¡ son mutua- .4315 1.0227
mente independientes. Lasx¡ son todas distintas ( no existen valores iguales). .4719 1.0294
ysetienequex 1 <x 1 < ... <x.
-
Los datos se componen den " pares de observaciones de la muestra, (x ,
1 Si se designa a i:::: 1 y j == 2 como los indicadores del primero y segun-
y 1), (x 2, y~) ....• (x 11 , Y,), donde el i~ésimo par representa las mediciones do valor de Y y X de la tabla J J .11.1, es posible calcular S 12 como sigue:
tomadas de la i-ési111a unidad de asociación.
Para obtener el estin1ador de Theil para p, prin1ero se forman todas las 512 = ( 175 -230)/ (278-421) =-.3846
pendientes posibles de la tnuestra S;¡:::: ()J-Y¡)l(xj-xi), donde i <j.~Habrá
N == 11 C2 v:.1 lores de Sij" El estiinador de~. e 1cual está designado por ~' es la Cuando todas las pendientes se calculan en forma similar y se clasifi-
mediana de los valores S--. Esto es can como en la tabla 11 .11.2,-.3846 acaba como e\ décimo valoren el arre-
')
glo ordenado.
~=mediana (S,J} (ll.11.1) s.
La mediana de los valores es .4878. En consecuencia, la estimación
del coeficiente de la pendiente Je la población es p:::: .4878.
El siguiente ejen1plo ilustra el cáleulo de ~-
Un estimador del coeficiente de la orden3dá al origen Dietz56 recomien-
da dos estimadores de la ordenada al origen. El primero, designado á. 1 M'
Eje,nplo 11. 11.l En la tabla 11.11.1 se muestran los niveles de testosterona es la mediana de los H término:-. Y¡- Px¡en donde~ es el estimador de Theil.
(mg/ml) y los niYeles de ácido cítrico seminal (mg/ml) en una muestra de Este se recomienda cuando el investigador no se inclina a suponer que los
ocho hon1bre.'> adultos. Se pretende calcular la e~timación del coeficiente términos de error se distribuyen en forma simétrica alrededor de O. Si se
de la pendiente Je regresión con el método de Theil. inclina a suponer c1ue existe una distribución simétrica de los términos de
error, Dietz reco1nienda el estimador 0'. 1 A1 , el cual es la mediana de los
Solución Los:V:::: ~C,:::: .28 \'Jlores ordenados de S ~e muestran en la tabla promedios por pares 11(11 + 1)/2 de los térmTños )'¡- ~X¡· El ejemplo siguiente
l " ~ lj
1.11.2. ilustra el cálculo de cada uno de los estimadores.

Eje,nplo 11./ /.2 Con los datos del ejemplo I J .11.1, calcular &.l.M y &2,M.
Tabla 11.1 I .1. C (ln-:cnlrac iun<::~ úc 1c~tostcrona y ácidu ,: ítrico ~c1ni nal en adulto:-.
\ arone~ Solución Los términos ordenados v. - .4878.t- son 13.5396, 24.6362,
. ' '
Testosterona '..!'.~() 175 '.11.:'J 290 '..!75 I S{J 360 4 <r 39.3916, 48.1730. 54.8804. 59.1500, 91.7100, 98.7810. La mediana.
Ácido cítrico 411 2715 (iJH --lH2 465 10:l 550
-·'
750 51.5267, es el estin1ador al..H·
l~s.tad ís tic a no para,nétrica y de libre distrihuci<Ín Preguntas y ejercici(Js de repaso 755
754
ll.12 RESUMEN---------~------
L os prornedios por pares ordenados. 8(8 + 1)/2 = 36. de los .r.-.4878.r
' '
son:
En este capítulo ~e estudian las pruebas estadísticas no paramétricas. Estas
13.:J'.\96 4\J.'.!708 i.:J ...t:{ pruebas ;'>C pueden utilizar cuando las suposiciones que fundamentan la~ pn.ie-
1~l.0879 5 !.5267 i!i.tl30i bas paramétricas no se cun1plen o cuando los datos que se han de analizar
'.t!.6'.16'.2 :J'.2.62--1-H i.S.!lf,:',) son n1edicion~:- ;-,obre una escala n1uy J¿bi! para los procedi,niento:; arit-
'.?fi.-t6.'"16 :l:tfili l:i 111. i l
:ui.s:,6:i :'i-l.HKO-t 11.·1.'.!--l-:"i:l méticos necl'sarios que requieren las pruebas paramétricas.
:l'.!.01'.)9 :"i!i.lhO'.l ~lK.7Hl Se definen y describen las cuatro escalas de medición: nominal. ordi-
34.21 :,1.01:,2 nal. de inter\·alo y de razones.
'.Jh.'.)-l4H :'18.173 l
:"19. l:'1
Final n1cn te. se describen e ilustran siete pruebas no paramétricas. Con
3ti.·HJ-t6
39.:\~)16 fil .70Hó excepción de la prueba e.le bondad de ajuste de Kol gon1orov-S mirnov. cada
:1~l.7583 !i:"1.:l:'.108 pruebaconstituye una alternativa no paran1écrica para [as pruebas paramétri -
-t l.893 l fi9.0Hli'.{
cas. Existen otras pruebas no para.métricas, muchas de las cuales se des-
-l'.1.7823 f¡~,.~1-t ¡ :,
-li.136 73.2952 criben e ilustran en las referencias citad:ts a! fina! de este capítulo.
-tH.17:1 7:·t--177

La mediana de estos promedios, 5 3 .1432, es el estimador CX~_;1r· La ecuación PREGUNTAS Y EJERCICIOS DE REPASO _ _ _ _ _ _ __
de esti1nación. entonces. es Y;= 53.1432 + .4878.r1 si se cree que la dlstri·
bución de los ténninos de error es simétrica respecto a O. Si no exi!-ite la l. Definir las e.~tadístieas no panunéLricas.
sospecha de siinecría. la ecuación de esti1nación es y¡= S 1 .5267 + .4878.t;. 2. ¿Qué significa el ténnino dc rrueba cstaJís1ica de lihre distribución'!
Para un esludio más extenso respecto al análisis de regresión no para- 3. ¿ Cuúlcs son la'> ventajas de las rruchas estadística'> no paramétricas?
4. ¿_Cu:ilcs son algun,1s de las d('svcntaja.~ dc las pruebas no paramétricas '!
métrico. con~últese e! libro de Danie 115 de estadística no panln1étrica.
5. De/'1nirel Lérrnino mc<lición.
6. Describir las cuatro escala'> de n1cdición y on.!enarlas según su grado de difi-
cult,id.
EJERCICIOS~~~~~~~~~~·~~~~~~~ 7. Descrihir una situaci¡)n en un :írea particular de in tenis, donde sea posible uti-
fizarcada una de las siguientes pruebas. Urilízardatos reales o ficticios y pro-
11.11.1 Los siguientes datos corresponden al ritmo cardiaco (RC: latidos por nii" har una hipóle'>i" adecuada rnediantc cada prueba.
nuto) y a los valores del consu,nodc oxígeno (YO'>· c,1J/li.g/24 hJ Je nueve
niños con cnfcrn1cda<l congestiva crónica del co~·a·,_()n. (J) La pruebadc '>igno.
1,_
- ,, 167 ¡¡;5 ! :·):I 15:) h) La prueha de 1.1111cdiana.
HR(X¡, 163 164 156 151
vo, (l°)c 53.9 57.4 41.0 40.0 42.0 G--l.--l :,~J. 1 -l\l.~I --13.'.!. e) La prucha de !\lann- \Vhitncy.
d¡ La pru('ha de hondad dc ajustc dc Kolmngorov-Smirnov.
Calcular e. U!.iHY CJ.l.Af·
11.11.2 Los siguientes datos corresponden al peso corporal (g:ran1osl y el :irca

jj
El anül1:-.i,:, unilateral de variancia por rangos de Kruskal-Vv'allts.
El análi'>i'> hilaleral de variancia por rangos de Friedman.
total {cni~) de nueve aniina]cs de laboratorio: K! El coeficiente de corn:lacifln ror rangos de Spe:::irman.
h) Análi<.i<. dc rcgrcsiún no paramétrico
Peso corporal (X): 660.2 706.0 92-1-.0 936.0 992. l 888.9 999.-1- 8Ll0.3 8-1- 1 1
Áreadela 781.7 888.7 !038.1 10-1-ü.O 1120.ü 1071.5 8. La siguit'nle L,th!a indica lo'> rangos de ed:1dc~ f X) de 20 pacientes de cirugía
superficie (Y): l 13-1-.5 925.0 965.3 925.0 y la dosis (V¡ de un analgC~icu n~'..:e~Jrio para bloyuear un segn1ento de !a
co!urnna \ertcbrul.
Calcular el estin1ador de la pcn<licnte y !os cstirnadores de 1,1 orJcnada al tirigcn.
Preguntas y ejercicios de repaso 757
Estadística no paran1étrica y de libre distribución
756
11. Diez per~onas con asina bronquial participaron en un experimento para esti-
Rango Rango de Rango
Rango de de dosis
mar la eficacia reh1tiva de tres n1edicamentos. La siguiente tabla muestra el
edades de dosis edades
en años (X) (Y) cambio en el VEF 1(volumen espiratorio forzado en 1 segundo), en litros, dos
enaños(X) (Y)
horas después de la ad1ninistración del medicamento.
1 1 11 ICl
2 7 12 5 Medicamento
3 2 13 11
4 4 14 16 Individuo A B e
5 6 15 20
16 18 .00 . 13 .26
6 8 .17 .23
17 19 2 .04
7 3 .21
18 17 3 .02 .20
8 15 .27 .19
19 10 4 .02
9 9 .36
20 14 5 .04 .11
!O 12 . 18 .25
6 .03
7 .05 .21 .32
8 .02 .23 .38
Calcular r. . y efectuar la prueba bilateral de significación. Sea a= .05. Deter- .24 .30
1 9 .00
minar el valor p para esta prueba. !O .12 .08 .30
9. Se reunieron los siguientes datos acerca del f uncionatnientopulmonaren niños
con distrofia 1nuscular, antes y después de un período de terapia respiratoria.
Los resultados se expresan como porcentajes de los valores normales pronos- ¿Son suficientes estos datos para indicar que existe una diferencia en la efi-
ticados por estatura. peso y 1nedida de la superficie corporal. cacia del mcdican1en10? Sea a= .05. ¿Cuál esel valor p para esta prueba?
12. Se estudiaron los sueros de dos grupos de personas, después de sufrirunainfec-
Capacidad puln1011ar forzada f litros) ción por estreptococos, para observar la acción neutralizante de los anticuer-
pos ante la cstrcptolisina O (AEO). Los resultados son los siguientes:
Antes 74 65 84 89 84 65 78 86 83 82
Después 79 78 100 92 104 70 81 84 85 90 AEO (medida en unidades Tood)
Grupo A Grupo B
Utilizar la prueba del signo para detenninar si la terapia es efectiva. Sea a= 324 558
.05. ¿Cuál es el valor p? 275 108
349 291
10. Se compararon tres 111étodos para reducir. con el baño, la flora bacteriana de 604 863
566 303
la piel. Se cfectuó un conteo de bacterias en el pie derecho de las personas antes 810 640
y después del tratan1iento. La variable de interés fue el porcen1aje de disn1i- 340 358
nución de las bacterias. Veintisiete estudiantes deenfermería participaron vo- 295 503
lun1arian1en1c en el cxperi1ncnto. Los tres métodos de baño de I pie fueron cen- 357 646
trifugación del agua, aspersión y ren1ojo. Los resultados son los siguientes: 580 689
344 250
655 540
Centrifugación Aspersión Ren1ojo 380 630
18 16 6 10 503 190
91 80
22 15 6 l~ 314
87 92
88 81 20 26 8 5
84 93 29 19 9 9 ¿Proporcionan estos datos la evidencia suficiente para indicar unadiferenciaen
86 25 !3 las medianas de las poblaciones'! Sea a= .05. ¿Cuál es el valor p para esta prue-
ba? Utilizar la prueba de la media y la prueba de Mann-Whitney y comparar los
¿Es posible concluir, con hase en estos datos. 4uc lu~ tres 1né1üdü~ no son 1gu;1l- resultados oblcnidos.
mente efectivos? Sea a= .05. ¿Cu;íl es e! valor p parJ. esta prueha"!
~

f,'stadística no para111étrica y de libre distribución Bibliografla 759


758
13. Los siguientes son los v:1lorcs de PaC0 2 (en ,nm Hg)de 16 pui:ientes con enfer- Probar la hiplítcsis nula de que las dos variables son mutuarnente indepen-
medad hroncopul1nonar: dientes, c1intra l..1 hip61esis alternativaúe que están directamente relacionadas.
La probabilidad de co1nctcr un error del tipo I es de .05. ¿Cuál es el valor p?
)9.40.45.43,49.56.60, 75.42.48,32,37,32.33.33.36
16. Los siguk·ntcs datos corresponden a los promedios de puntuación de 12 estu-
Utilizar la prui::ba de Kolrnogorov-Sinirnov para probar la hipótesis nula de diantes que recibieron el grado de B.S. en enfermería y sus calificaciones
que l\lS vahircs de PaC0 2 de la población muestreada siguen una distribución obienidas en el c.xan1en estatal.
nonnal conµ=-+-+ y O'= 12.
Promediosdcpuntuaci6n:2.5 2.2 3.0 2.8 2.8 2.5 2.3 3.1 3.7 2.9 2.7 2.4
14. La siguiente tahla n1ucstra los consumos de calorías {cal/día/kg) y de oxígeno,
Calificucióncnc!cxan1cn:84 85 91 83 87 89 86 95 93 79 90 85
V0 2 r1n!/n1in/kgl d,: 10 infantes.
¿Es posih!c concluir. a un nivc! de significación de .05, que las dos variables
Cons11n10 no son n1utua1ncnte independientes'? ¡,Cuál es el valor p para esta prueba?
de caforías (X¡ \"01 (Y)

50 7.0
70 8.0 BIBLIOGRAFÍA _ _ _ _~ ~ - - - - - - - - - - -
90 10.5
120 l l.0
40 9.0 1. M. G. KENDALL y R.M. SL'NDRUM, ''Distribution-free Methods and Order Pro-
100 10.8 pertics", Rt' ¡·ic11· ofrhc /11 te rnatio11al Sratistical lnstitute, 21: 3 ( 1953 ), 124-134.
150 12.0 2. JEAN D1c1<1:-.soN GtBAONS, No11para111etric Statisrical lnference, Marce!
110 !O.O Dekkcr, Nueva York, 1985.
75 9.5
160 11.9 3. J. R. 81.c~, y N.A. FATTU, "Nonpara1netric Methods". Revie,r ofEducational
Researcfi. 24 ( 1954), 467-487.
4. L. E. !v1os1:::s, ··Nunparainctric Statistics for Psychological Res·earch", Psy-
Probar la hipótesis nula de que las dos variables son mutuamente indepen- chologica! 811!lcti11. 49 (1952). 122-143.
dientes. contra la hipótesis alternativa, según la cual están directamente rela- 5. SIDNEY SIF·.Gl:L y N. JOHN CASTELLAN, Nonpara111etric Statisticsforthe Beha-
cionadas. Sea a= .05. ¿Cuál es el valor p para esta prueba? viorial Sciences. 2. 0 edición. McGraw-HilI, Nueva York, 1988.
15. Los siguientes datos corresponden a los niveles de estriol (mg/muestra de ori- 6. \V. J. CONO\ ER. Prt1ctica! No11para111etric Staristics, 2." edición, Wiley, Nue-
na en 24 hr) de 16 mujeres embarazadas y el peso (en gran1os) de los bebés va York. 1980.
recién nacidos. 7. ]Al\1ES V. 8RADLEY. Distrih11tio11-free Statistics, Prentice-Hall, Englewood
Concentraciones Peso
de estriol
Cliffs, N.J., 1968.
al nacer
8. CHARLES H. KRAFT y CONSTANCE VAN EEDEN,A Nonpara111etric /ntroduction
15 31 to Statistics, !vf acn1i l!an, Nueva York, 1968.
1; 31 9. MERl.f. \\/. TA TE y RICHARD c. CLELLAND, Nonparametric and Shortcut Sta-
¡; 32
tisrics in t//e Social, Biological, and í'vledical Sciences, lnterstate Printers and
18 31
20 32 Publishcrs, Dan vi lle, Jl! .. 1957.
22 31 10. JEAN Ü!CKt.'iSO.-. G!BBONS, No11para111etric 1\1ethods for Quantitative Analy-
.,.
_, 32 sis. Hoh, Rinehart and Winston, Nueva York, l 976.
16 33 l l. FREDERICK r-.loSTEJ.LER y ROBERT E. K. RouRKE, Study Statistics: Nonpara-
17 3.¡
¡; 111etric a11d Order Sturistics, Addison-Wesley, Reading, Mass., 1973.
29
¡; 28 12. ALBERT PrERCl::. ¡.-11nda111e11tals of No11parametric Statistics, Dickensen. Bel-
15 28 n1ont. Calif.. 1970.
JO 213 13. G. E. NoETHER. l11trod11ctio11 to S/(ltistics: A Fresh Approach. Houghton Mif-
26 33 flin. Bostnn. 197 ! .
.,.
2$ 35
_, 39
14. rvJYL.ES HoI.LA\;DfR y ÜOL"GLAS A. \VOL FE, Nonpara111etric Statistical Merhods,
Wi!ey. Nuc\·a Yllrk. 1973.
760 l:,'stadú,tica no paramétrica y de libre distribución Bibliografía 761
15. W A YNE W. DANIEL, Applied l\1011paran1etric Sratistics. 2." edición, PWS-Kent, 35. WLL!AM L. HAYS y RoBERT L. WJNKLER, Statistics: Probability, /11fere11ce,
Boston, 1989. and Decisio11, Holt. Rinehart and Winston. Nueva York, 1971.
16. LEONARD A. MARASCUILO y MARYELLEN McSWEENEY, Nonparan1etric and 36. RONALD A. FtSHER, Stati.stical Methods far Research Workers, 13.ª edición.
Distribution-Free Methodsfor the Social Sciences, Brooks/Cole, Monterey, Hafner, Nueva York, 1958.
Calif., 1977. 37. H. B. MANN y D. R. WtttTNEY, "On a Test of Whether One ofTwo Random
17. E. L. LEHMANN. No11paran1etrics, Staristical ft,fethods Based 011 Ranks, Hol- Variables Is Stochastically Larger Than the Other", Annals of Marhematical
den-Day. San Francisco, 1975. Statistics, J8 ( 1947), 50-60.
18. JAROSLAV HAJEK. A Course i,¡ No11para111etric Statistics, Ho\den-Day, San 38. GOTTFRlED E. NoETHER, E/e111e11ts of Nonpara111etric Statistics, Wiley, Nue-
Francisco. 1969. va York, 1967.
19, JOHN Eow ARO WALSH, Handbook ofNonpara111etric Statistics, Van Nostrand, 39. A. N. KoLMOGOROV, "Sulla Determinazione Empirical di una Leggedi Dis-
Princeton. N.J., 1962. tribuzione", Giornale del!' lstitute lralia110 degliA!tuari, 4 (1933). 83-91.
20. JOHN E. WALSH, Handbook of No11para111etric Statistics, 11, Van Nostrand, 40. N. V. SMlRNOV, "Estirnate ofDeviation Between Empirical DistributionFunc-
Princeton, N.J., 1965. tions in Two lndependent Samples" (en ruso), Bul/etin Moscan· University, 2
21, l. R. SAVAGE. Bibliography of No11paran1etric Statistics, Harvard University (1939), 3-16.
Press, Can1bridge, Mass .. 1962. 41. L. A. GoooMAN, ··Koln1ogorov-Smirnov Tests for Psychological Research",
22. S. S. STE\'ENS, .. On the Theory of Scales ofMeasurement",Scie11ce, 103 (1946), Psychological Bulletin, 51 ( 1954 ). 160-168.
677-680. 42. F. J. MASSEY, .. The Kolmogorov-SmirnovTest for Goodness of Fit'',Journal
23. S. S. STEVE¡,.¡s ... Mathematics, Measurement and Psychophysics'", en S. S. uf the A111e rican Sratistical Association, 46 ( 195 l ). 68- 78.
Stevens (editor), Handbook ofExperin1ental Psychology, Wiley, Nueva York, 43. Z. W. BJRNBAUM, "Nu1nerical Tabulation of the Distribution of Kolmogorov' s
1951. Statistic far Finite San1ple Size", Journal of the An1erican Statistical Asso-
24. N. H. ANDERSON, "Scales and Statistics: Parametric andNonpararnetric", Psy- ciation, 47 ( 1952), 425-441.
chological Bulleti11, SS ( 1961 ). 305-316. 44. M. J. SLAKTER, "A Co1nparison of thc Pearson Chi-Square and Kolmogorov
25. J. GAlTO, "Nonparametric 1'-1ethods in Psychological Research", Psycholo- Goodness-of-Fit Tests ....-ith Respect to Validity", Journal ofthe American
gical Reports, 5 ( 1959), l J 5-125. Statistical Associatio11, 60 ( 1965), 854-858.
26. F.· M. LORD, ''On the Statistical Treatment of Football Numbers", An1erican 45. w. H. KRUSKAL y w. A. WALLIS. "Use of Ranks in One-Criterion Analysis of
Psychologist, 8 ( 1953), 750- 751. Variance", Jo11r11al of the A111erican Statistical Associatio11, 47 ( 1952), 583-
27. GoRDON D. ARMSTRONG, "Parametric Statistics and Ordinal Data: A Perva- 621; errata, ibid., 48 ( 1953 ), 907-911.
sive Misconception", Nurying Resea-rch, 30( 1981 ), 60-62. 46. K. R. GABRIEL y P. A. LACHENBRUCH. "Nonparametric ANOV A in Small Sam-
28. EDGARF. BüRGATTAyGEORGEW. BOHRNSTEDT, "Level ofMeasurernentOnce ples: A Monte Cario Study of the Adequacy of the Asymptotic Approxima-
Over Again", Sociological Methods & Research, 9(1980), 147-160. tion", Bion,etrics, 25 ( 1969}, 593-596.
29. W. J. DrxoN y A.M. Mooo, "The Statistical Sign Test",Journal oftheAn1er- 47. M. FRIEDJ\1AN, "The Use of Ranks to Avoid the Assumption ofNormality
ica11 Statistical As sociation, 41 ( 1946 ), 557-566. I1nplicit in the Analysis ofVariance" ,Jo11r11al ofthe An1erica11 Statistical Asso-
30. FRANK WtLCOXON, "Individual Comparisons by Ranking Methods'', Bion1e- ciation. 32 ( 1937), 675-701.
trics, 1 ( 1945 ), 80-83. 48. M. FRIEDMAN, .. A Comparison of Alternative Tests of Significance fer the
31. A. M. Mooo, lntroduction to the Theory of Staristics, McGraw-Hill, Nueva Problern of 111 Rankings '', A1111als ofMathe1natica} Statistics, /!( 1940), 86-92.
York, 1950. 49. M. G. KENOALL. Rank Correlatiun Methods, 2." edición, Hafner. Nueva York,
32. J. WESTENBERG, "Slgnificance Test fer Median and Interquartile Range in 1955.
Samples from Continuous Populations of Any Form", Proceedings Konin- 50. W. H. KRUSKAL, .. Ordinal Measures of Association", 1011 rnal of the A111eri-
klijke Nederlandse Akadenzie Van Wetenschappen, 51 ( l 948), 252-26 l. ca11 Statistical Associatio11, 53 ( 1958), 814-861.
33. G. W. BRO\VN y A.M. Moon, ··on MedianTestsforLinearHypotheses'', Pro- 51. HAROLD HoTELL!NG y MARGARET R. PABST, "Rank Correlation and Tests of
ceedings of the Second Berkeley Syn1posiun1 on Methen1atical Statistics and Significance lnvo\\'ing No Assumption ofNormality", A1111als of Marhen1ati-
Probability. University of California Press, Berkeley, I 95 l, págs. 159-166. cal Statistics, 7 ( 1936). 29-43.
34. V. L. SENDERS. Meas11ren1ent and Statistics, Oxford University Press, Nueva 52. C. SPEARMAN. "The Proff and !v1easurernent of Association Between Two
York, 1958. Things ... A1nerica11 Journal uf Psychology, 15 ( 1904). 72-101.
f..'stadísth·a no para111étrh·a y de libre di.~tribucirin
762
53. G. J. GLASSER y R. F. WINTER, "Critica] Values of the CocfficierH of Rank Cor-
relation forTesting the Hypolhesis of ln<lependence .. , Bio111errika . .J8 ( 1961 ),
444-448.
12
54. EUGENE S. El)GI NGTON, Sratistical lnference: The Distribution-Free Approach,
McGrav.'-Hil!. Nueva York, 1969. Estadísticas vitales
SS. H. THEIL. '·A Rank-Invariant l\llethod of Linear and Polynomial Regression
Analysis. 111". Koninklijke Neder!andse Akadenlie Van Wete11schappe11. Pro-
ceedi11g.t, Series A. 53(1950).1397-14[2.
56. E. JACQlJELJN Ü!ETZ. "Teaching Regression in a Nonparametril: Siatistic
Course ... The A111erica11 Sta1istician, 43 ( 1989), 35-40.

Otras referencias: artículos

l. W AYNE V.I. DANIEL, 011 Nonpara111etric and Robust Tests for Oispersion: A
Selecred Bibliography, Vanee Bibliographies, l\.-1onticello, 111., diciembre
1979.
2. WAYNE W. DANIEL, Goodness-of-fit: A Selected Bibliographyfor the Statis-
tician a11d the Researcher, Vanee Bibliographies, tvfonticello, 111., tnayo 1980.
3. WAYNE W. DANIEL y CAROL E. COOGLER, "Sorne Quick and Easy Statislica!
Procedures for the Physical Therapist'', Physical Therapy, 54 ( 1974 j, 135- 12.1 INTRODUCCIÓN _ _ _ _ _ _ _ _ _ _ _ _ __
140.
4. WAYNE W. DANIEL YBEAUFORT B. LoNGEST, "Sorne Practical Statistical Pro- El médico particular llega a un diagnóstico y a un plan de tratamiento para
ceduresº'. Jo11r11al of N11rsi11g Adnlinistration, 5 ( 1975), 23-27. un solo paciente por medio de una historia clínica, un examen físico y varias
S. ÜLIVE JEAN ÜUNN, "Multiple Comparisons Using Rank Sums'', Technon1e- pruebas de laboratorio. Puede considerarse a la comunidad pública como
trics, 6 ( 1964 ). 241-252. un complejo organismo viviente, para el cual el grupo de salud pública es
6. B. J. McDONALD y w. A. THOMPSON, "Rank Sum t,,..1ultiple Comparisons in
el médico. Para desempeñar satisfactoriamente esta función, el grupo de
One- anc.1 Two-Way Classifications··. Bio111etrika. 54 ( 1967), 487-498.
salud pública debe utilizar también herramientas y técnicas adecuadas para
evaluare! estado de salud de la comunidad. Tradicionalmente, estos medios
consisten en los datos den1ográficos de la comunidad, que incluyen el núme-
ro de nacimientos, n1uertes, enfermedades y diversas tasas y razones que
pueden calcularse a partir de ellos.
En las siguientes secciones, se presentan algunas de las tasas y razones
más útiles y a1nplia1nente utilizadas. Sin embargo, antes de proceder. es
necesario distinguir entre los términos tasa y razón, definiendo cada uno
como sigue:

l. Tasa. Aun ~·uan<lo hay algunas excepciones. este término se utiliza por lo gene-
ral para re fer irse a aquel los cálculos que iinplican la probabilidad de ocurren-
cia de algún C\'Cnto. Una tasa se expresa en la forma

donúc e: J (12.1.1)

763
764 Estadísticas vitales Tasas y razones de 111ortalidad 765
a= la frecuencia con la cual se ha presentado un evento parar las tasas brutas de n1ortalidad de dos comunidades es riesgoso, a menos
duranlc algún período especificado. que se sepa que las comunidades son comparables con respecto a muchas ca-
a+ b = el número de personas expuestas al riesgo del evento racterísticas. distintas de las condiciones de salud, que afectan ala tasa de mor-
durante e! nlisn10 período. talidad. Las variables que entran en juego comprenden la edad, grupo racial,
k = algún nú1nero co1no I O, 100, 1 000, 1O000 o 100 000 sexo y condición sociocconómica. Cuando dos poblaciones deben compararse
con base en la tasa <le n1ortalidad, deben hacerse ajustes para conciliar las dife-
Como se indica en la expresión 12.1.1, el numerador de una tasa es una parte rencias entre las poblaciones con respecto a estas variables. Deben tenerse las
componente del denominador. El propósito del multiplicador, k, llamado mismas precauciones al con1purar las tasas de mortalidad anual para la misma
base, es evitar resultados que co1nprendan números muy pequeños que pue- comunidad en dos uños distinlos.
dan surgir en el cálculo de las tasas, y facilitar la comprensión de estas últi-
mas. El valor elegido para k depende de la magnitud del numerador y del 2. Tasas específicas de ,uorralidad anual. En general, es más importante e ilus-
denominador. trativo observar las tasas de mortalidad de subgrupos pequeños y bien definidos
de la población tola\. Las tasas de este tipo se conocen con10 rasas especificas de
2. Razón. Una razón es una fracción de la forma
n1orralidady se definen co1no

número de muertes en un sub grupo específico durante un año. k


f,d..c)k (12.1.2) población total en el subgrupo específico a julio 1

donde k es alguna base. con10 ya se ha definido, y tanto e como d se refieren a donde. por lo genera!, k es igual a 1 000. Los subgrupos para los que pueden
la frecuencia de ocurrencia de algún evento o artículo. En el caso de una razón, ca\cu larsc las tas.1s c.s.pccíficas de mortalidad comprenden aquellos grupos que
el contrario de la tasa, el numerador no es una parte componente del denomi- pueden distinguirse con base en el sexo, grupo racial y edad. Pueden calcularse
nador. Por ejen1plo. puede hablarse de la razón de personas-doctores o de la simultánca111cntc las tasas específicas para dos o más características. Porejem-
razón de personas-camas en el hospital de cierta área geográfica. Los valores p\o, puede cah:ularsc la tas:.'l de 1nortalidad para los \'aronesde raza blanca, ob1e-
de k que se utilizan con mayor frecuencia en las razones son 1 y l OO. niendo así una tasa específica de raza-sexo. Pueden calcularse también las tasas
específicas de 1nortalidad por causas específicas incluyendo en el nun1erador
sólo aquellas n1uertes debidas a una causa particular, por ejemplo, cáncer, pade-
cimientos cardiacos o accidentes. Debido a la pequeña fracción que resulta, la
12.2 TASAS Y RAZONES DE MORTALIDAD _ _ _ _ _ __
base k, para una tasa de causa específica es por Jo general de 100 000 o l 000 000.

La tasas y razones que se estudian en esta sección se refieren a la ocurren- 3. Tasas de 111ortafith1d llj11sradas o esra11dari:.adas. Ya se indicó que la utilidad
cia de muerte. Las tasas de mortalidad expresan la frecuencia relativa de de la tasa bruta de n1ortalidad se rcstnnge por el hecho de que no refleja la com-
ocurrencia de muerte en algún intervalo específico en una población en posición de la población con respecto a ciertas características por las cuales es
panicular. El denominador de una tasa de mortalidad se conoce como pobla- afectada. Se ha\ ist<i que por n1cdindc las lasas específicas de n1ortalidad. pueden
ción en riesgo. El numerador representa sólo aquellas muertes que ocu- estudiarse individualincnte varios sectores de población. Sin embargo, si se
rrieron en la población, especificada por el denominador. intenta ob!cncr una in1presión global de la salud de una población al obserYar
las tasas c::.pccífi.:as dc n1ortalidad indi\·idual. pronto se queda uno abrumado
l. Tasa brura de 111orra/idad anual. La tasa bruta de mortalidad anual se define por su gran nún1cro.
como
Lo que se desea es un solo yaJor que mida la intensidad de la mortali-
dad en una población, 1nientras se mantienen constantes uno o más de los
número total de muertes durante un año ( 1 de enero a 31 de diciembre) k
factores de ajuste, co1no la edad, grupo racial o sexo. Se cuenta con este
población total al 1 de julio ·
valor, conocido con10 rasa ajustada de ,norra!idad. Se obtiene por lo gene-
donde, por lo general. ,;e elige 1 000 como valor de k. Esta es la tasa que se utili- ral mediante !o que se conoce con10111érndo directo de ajuste. Este método
za con mayor frecuencia para estimar la salud glohal de una comunidad. Com- consiste esen.:ialrnentt' en aplicar. a una población estándar. las tasasespecí-
Estadb:ticas vitales Tasas y ra:uues de 111ortalidad 767
766
ficas observadas en la población de interés. A partir de los números espe- Tabla 12.2.l Cálculo de la ta~a de n1ortalidad ajustada por edades para el estado
rados que resulten, puede calcularse una tasa global que indique cuál sería de Georgia. 1970, n1cJ.iantc e! 1nétoúo directo.
la tasa para la población de interés, si esa población tuviera la misma com- 2 3 4 5 6
posición que la población estándar. Este método no se restringe únicamente Poblnción
estándar Número
al cálculo de las tasas ajustadas de mortalidad, sino que puede utilizarse
basada en de muertes
para obtener otras tasas ajustadas. como, por ejemplo. una tasa de natali- Tasa de mortalidad la población esperadas en
dad ajustada. Si se ajustan de esa 1ni.l.nera dos o más poblaciones. entonces, segá11 !a rdad de EE.UU. la población
pueden con1pararse directamente con base en los f:1ctores de ajuste. Las Edadlai!os! Pob!aciJn" ~laerrea· 1 (por 100000) /970b estándar
opiniones difieren con respecto a qué población debe utilizarse como están- fJ [O 4 424.600 2.483 584.8 84,-116 -HJ4
dar. Con frecuencia se utiliza para este fin la población de los Estados ."I to 14 955,00fJ 449 47.0 200,508 g;
15 to 24 863,000 1,369 158.6 I i4,406 27i
U nidos, de acuerdo con el último censo decena!. Para los cálculos de ajuste, 223.6
25 to 34 608,Iüü J,360 122.569 274
se utiliza generalmente una población de 1 000000 que refleje la corn- 35 l() -14 s 1s.-100 2,296 4-!2.9 113,614 503
posición de la población estándar, conocida con10 1nilló11 está11dar. En el 45 to 34 486,400 4,632 952.3 114,265 1,088
siguiente ejemplo se ilustra el método directo de ajuste para obtener una 55 to 64 384.400 i.792 2.027.1 9 l.480 1.854
65 to i'·I 235,900 9.363 3,969.l 61, 195 2.429
tasa de mortalidad ajustada por edades. 15 and over I'.12,900 12.0-12 9.060.9 3i,547 g,402

Eje,nplo 12 .2.1 La ta.'ia bruta para Georgia en 1970 fue de 9.1 muertes ·r·ocal 4,608,700 41.786' 1,000,000 10.415
por cada 1 000 habitantes. Obtener una tasa de mortalidad ajustada por ª Georgia Viral and fl.torbidiry Sraristics l 970, Georgia Department of Public
edades para Georgia mediante el uso de la población estándar en el cen- I-fealth. Atlanta, Georgia.
so de 1970 para los Estados LTnidos. En otras palabras. se desea una tasa b /970 Census of Popularion, PC( l )-B l. Tabla 49.
de mortalidad que pudiera haberse esperado en Georgia, si la composi- e Excluye a 44 muertes a edad desconocida.
ción por edades de la población de Georgia hubiera siúo la misn1a que I.:i
de los Estado:- Cnidos en 1970. 7. La tasa de ,nortalidad ajustad,1 por edades se calcula de la misma manera que
una tasa bruta de mortalidad .Es decir, la tasad e mortalidad ajustada·poredades
Solución Los datos necesarios para los cálculos se muestran en la tabla es iguala
12.2.1. número total de muertes esperadas
El procedirniento para calcular una tasa de n1ortalidad ajustada por población estándar total · l OOO
edades comprende !0_1; siguientes pasos.
En el eje1nplo. se tiene una tasa de mortalidad ajustada por edades de
1. La pohla,:i6n de i ntcrés se !ista ( columna 2) de acuerdo con el grupo de cdaJes
(co!un1na J 1_ 10.-115
2. Las n1uertc~ en la poh!ación se listan (columna 3¡ según las edades. 1.000.000 . 1000 - ltJ.4
3. Se calculan la:-. ta"as de n1or1alidad por edades (columna 4J para cada grupo.
dividiendo L1 cnlurnna 3 entre !a colun1na 2 y n1u!tiplicando por 100000. Se observa entonces que la tasa bruta de mortalidad se ha incrementa-
4. La poblac ilín C'ot:indar se l 1\ta (columna 5 J por grupo de edades. do de un 9.1 por 1 000 a un 10.4 por 1 000 ajustando la población de Geor-
5. Se cak·u!,1 el nún1en1 c~perado de muertes en la pohlación eslánJar para cada gia en 1970 a la distribución de edades de la población estándar. Este incre-
grupo f C(l]urnna 61. n1 ultiplicando la co!un1 na 4 por la co!urnna 5 y dividiendo tnento en la tasa de n1ortalidad, después de! ajuste. refleja el hecho de que.
entre 100 llOO. L1i:- \·al ore" de !a columna 6 son !as muertes que .,;e esperarían en en 1970. la población de Georgia era un poco más joven que la población
la pnblacitin e-.túndar si la.\ personas de esta pohlacirín se hubieran expuc:-to al
de los Estados Unidos en general. Por ejernplo. sólo el 8 por ciento de la
mis1110 rie"f!º de n1 uene experirnentado por la pob!acirín que se está aJu~tand<,
población de Georgia tenía 65 ailo~ de ~dad o más. n1ientras que el I O por
6. Se :-.ur11an Ju.-.\ :dures; de l;.1 colurnnn 6 para obtener el núnicru tot;:i! de n1ucrtcs
espcnHL.1~ .:n la ruhlaci(ín e~L.índar ciento de la población de los Estados U nidos estaba en ese grupo de edades.
Estadísticas vitales Tasas y razones de 111orta/idad 769
768
4. Tasa de 111ortalidad 111arer11a. Esta tasa se define como embargo, en pcrio<los de cambios rápidos deben hacerse algunos ajustes. Una
manera de hacer un ajuste es asignar las muertes infantiles al año civil en el
muertes por causas puerperales durante un año . k que nacieron los niños antes de calcular la tasa.
total de nacimientos vivos durante el año 6. Tasa de 111ortalidad 11eo11caal. En un esíuerzo por comprender mejor la natu-
raleza de tas rnucrtcs infantilc:,;. suelen calcularse tasas de mortalidad para
donde k toma el valor de l 000 o 100 000. El denominador preferido para niños menores de un año. De éstas, la que se calcula con m.ayor frecuencia es
esta tasa es el nún1ero de mujeres embarazadas durante el año. Sin embar- la tasa de 1nortalidaJ 11eo11atal, que se define como
go, es imposible detenninar este denominador.
U na muerte debida a una causa puerperal es aquella que puede atribuirse número de muertes de niños de 28 días de edad durante un año . k
a alguna fase del parto. Debido a la disminución de la tasa de mortalidad número total de nacimientos de niños vivos durante el año
materna en los Estados Unidos, resulta más conveniente utilizark = 100 000.
donde k = 1 000.
Sin embargo, en algunos paises, k = 1 000 conduce a una tasa más conve-
niente. La disminución de la tasa de mortalidad materna en Estados Unidos 7. Tasa de 111orralidadfetal. Esta tasa se define como
ha tenido también el efecto de reducir su utilidad como discriminador entre
las comunidades con cualidades variables en atención médica e instala- nú1nero total de muertes fetales durante un año . k
ciones sanitarias. número total de alu1nbramientos durante el año
Entre los aspectos que 1imitan la tasa de mortalidad materna se incluyen
las siguientes: donde k ton1a, por lo general, el valor de l 000. La muerte fetal se define como
un producto de la concepción que no muestra signos de vida al concluir el
a. Las n1ucrtes fetales no se incluyen en el denominador. Esto conduce a una tasa nacimiento. Existen varios problemas asociados con el uso e interpretación
inflada, ya que una madre puede morir de caus¡1 puerperal sin producir un de esta tasa. Hay variaciones entre las diferentes regiones que informan con
naciniicnto vi\'O. respecto a la <luraci6n de la gestación. Algunas regiones dan a conocer todas
b. La muerte de la 1nadre sólo puede contarse una vez, aunque puede haber ocu- las muertes fetales sin importar la duración de la gestación, en tanto que otras
rrido un nacirnicnto de ge1nelos o un nacimiento múltiple mayor. Estos casos tienen un periodo de gestación mínimo que debe alcanzarse antes de que se
hacen que el denon1inador sea demasiado grande y, en consecuencia, se tiene requiera hacer el informe. Otra objeción a la tasa de mortalidad feta! es que no
una tasa Jctnasiado pequeña. to1naen cuenta el grado al cual una comunidad pretende reproducirse. La razón
c. Alguno:; naciinicntos vivos no se reg"istraron, lo cual conduce a un denomi- que se considera a continuación se ha propuesto para superar las objeciones.
nador den1asiado pequeño y hace que la tasa sea demasiado grande.
d. La muerte de la in adre puede ocurrir en un año posterior al cual ocurrió el 8. Razón de 111ortalidadfl'lal. Esta razcín se define como
naci1nienlo. Aunque h.1y excepciones, en la mayoría de los casos la transfe-
número total de muertes fetales durante un año
rencia de 1nucncs 1naternas se balanceará en un determinado año.
número total de nacimientos de niños vivos durante el año · k
5. Tasa de n1orrnlidod infantil. Esta tasa se define como
donde k ,oc toma C(>mo 100 o 1 000.
número de 111uertes de niños menores de l año durante un año . k Algunos expertos sugieren que en el denominador se incluyan tanto el
11ú1nero total de nacimientos vivos durante el año número de muertes fetales como los nacimientos de niños vivos en un inten-
to por incluir toda preñez en el cálculo de la razón. Una objeción a esta su-
donde k se ton1a generahnente como 1 000. El uso y la interpretación de esta gerencia se apoya en lo incompleto de los datos acerca de las muertes fetales.
tasa tiene que baccr;,c a la luz de sus limitaciones. que son semejantes a las que
caracterizan a la tasa de n1onalidad n1aterna. t1uchos de los infantes que mueren 9. Ta.l"a de 111ortalidud peri natal. Debido a que las muertes fetales que ocurren
durante un año <lado nacieron el año anterior. De la misma forma, muchos al final del cmhara,.o y las muertes ncotalcs con f recucncia tienen las mismas
niño':> nacido-:, en un aiío dado n1orirán durante el siguiente año. En las pobla- causas f undan1cnlalcs, se ha sugerido que se combinen ambas para obtener lo
ciones con una n,11aliJ:1d c-:,tahlc. esto no c<instiluye un problema serlo. Sin que se conoce conH, ta.1a de 111ortalidad peri natal. Esla lasa se calcula co1no
Estadísticas vitales Ejercicios 771
770
(número de muertes fetales de 28 semanas o más)
Número
+ (número de muertes infantiles de menos de 1 semana)
Total Blancos No blancos
(número de muertes fetales de 28 semanas o más) ·k
+ (número de nacimientos de niños vivos) Población estimada al l.º de julio 597,500 361,700 235,800
To tal de nacimientos vi vos 12,437 6,400 6,037
Nacimientos inmaduros l,243
donde k = 1000
Muertes fetales: 592
440
365 __ ,
803
99-

Total
355 269 H6
10. Razón de ca11.\"l1S de defunción. Esta razón se define como Con menos de 20semanas de gestación
103 42 61
De 20 a 27 semanas de gesiación 123 49 74
número de muertes debidas a una enfermedad específica durante un año. k Muertes' 11 5 6
T01al en todas las edades 6,219 3,636
número total de muertes debidas a todas las causas durante un año Menos de un año
2,5H3 -
Menos de 28 días 267 97 170
donde k = 100. E.ste índice se utiliza para estimar la importancia relativa de Muertes por inmadurez 210 7Y 131
una causa determinada de defunción. Debe utilizarse con precaución al com- Muerte de madres 16 12 4
parar una comunidad con otra. Una razón de causa de defunción mayaren una Causa de muertes 2
948
- 2
comunidad que en otra puede deberse a que la primera comunidad tiene Neoplasmas malignos 626 322
una baja mortalidad debida a otras causas. Corazón isquémico
1,697 1,138 :,59
Fuente: Georgia. Vital and Morbidity Statistics /970, Georgia Department of Pu-
11. Razón de 111ortafidadproporcio11al. Se ha sugerido este índice como una medi- blic Hea[th, At[anta, pág. 47.
da única para con,parar las condiciones sanitarias globales de diferentes comu-
nidades. Se define como 12.2;2 La siguiente tabla n1ucstra las muertes y la población estimada por edades
en el cstaJo de Georgia en 197 J. Utilizar estos datos para calcular la tasa
número de muertes de personas de 50 años de edad y mayores . k de mortal!JaJ ajustada por edades para Georgia, en 1971. Utilizar la niis-
número total de muertes ma poblaci6n cst.inJar que se utiliza en el ejemplo 12.2.1.

donde k = 100. La clase especificada es por lo general un grupo de edades, por


ejemplo 50 años y más. o bien, una categoría de causas de muerte, como acci- Edad ( ario!>'} Población estin1ada Muertes
dentes. Lindcr y Grove 1 han destacado que este índice tiene ciertas desven- Oa 4 423,700 2,311
tajas. 5 a 14 947,900 480
15 a 24 891,300 1,390
25 a 34 623,700 1,307
35 a 44 520.000 2, (37
45 a 54 494,200 4,fi40
55 a 64 388,600 7,429
EJERCICIOS~~~~~~~~~~~~~~~~~ 65 a 74 243,000 9,:i89
75 y más 136,000 12,411
12.2.1 Se obtuvieron los siguientes datos anuales de cierta región geográfica. A
·rotal 4,668,400 41.49--t"
partir de estos dacas. calcular las siguientes tasas y razones: a) tasa bruta
de mortalidad. b) tasas específicas de mortalidad por grupos raciales para Fuente: Statistics Sections, Office of Evaluation and Research,
blancos y no blancos. e) tasa de mortalidad materna. d) lasa de mortalidad Georgia Depanment of Human Resource~. At!anta.
infantil, e) tasa de 1nortalidad neonatal,.f) razón de mortalidad fetal y ª Excluidas 42 muertes de edad desconocida.
g) razones de causa de defunción por neoplasmas n1alignos y enferniedad
isquénlica del corazón.
~

772 Estadísticas vita/et OU"}C>.'";o!")U")


]~ >.noiO INOO

- -~
::r. r--, :<"; (O o..,.
MEDIDAS DE FERTILIDAD _ _ _ _ _ _ _ _ _ __ S; ="
§~ -.r~qe<""~<f'°él.':.
12.3 ,<::! <..> .., -<NCNC\ICN

~
o
,-.
El términoferti!it!ad, como lo utilizan los dernógrafos de Estados Unidos,
se refiere al acto real de dar a luz. contrario a la capacidad de concebir. fenó- "'•
meno para el cual se utiliza el término fecundidad. Conocer la "tasa" de
alumbramientos en una comunidad es importante para quienes se dedican
"En
o
u ~"' CNt--, ~ r--, r--, - e- -8 +
~

ou
.
e o 00 O - \.O C\I C\I
-~~ ~
a la salud pública, ya que de esa forma pueden planificar los servicios e
·-=~~'
- ' t--, c:"J O', CN O
:z,;"6:ér..:.,-;...: "'.
i! ; ¡
.....,, •
'O
instalaciones para las madres, bebés y niños. Los siguientes puntos son las o -!<") -

'O ·.e :..:::: .., 'O


seis medidas básicas de la fertilidad. 5,. {l
u •u o
e•
'¡) e-
= t
l. Tasa bruta de natalidad. Esta tasa es la medida de fertilidad que se utiliza más •:a u B
••
~.~-~5
-'O
o o e
ampliamente. Se obtiene a partir de la relación ~ u- E
Q,

-g ,::: 'C:, •
e'-,1 C<"') .,,.. ..,. U") C\I
:.c eo o ¡o
i:---1..-,r--,,:;o0')-
<N <.O g -> ••
e"
u
~
o
.;¿
número total de nacimientos de niños vivos durante un año. k ~ ,§ .,..7 ~ ó o-," ._¿ "1
c:r---st<--lt'J g uE
u e ~

población total a julio I ·-2 -ü~'.i:i¡,¡jo


~-:§ ~t...JS:
- - - --Csl q u·-
u-
u
e
• É
" .
·~•• = •
"• 'O
u
~ ~~..s{s-.
<t') o
Q,
""g_ o-
"u.
e

.E=
u
donde k = l 000. Para ilustrar el cálculo de ésta y de otras cinco tasas, ver la 'O ou
tabla 12.3.1. .§
'O e

.=: ü ~u
""
e<.
="
~
:) ·.;¡
~ g_ c.
2. Tasa general de fertilidad. Esta tasa se define como
~
~
"
,.

1 -·..
Ul 'O
:,: u
~:i:
o o
~
E
~ i:;~{l
"' :;;;
=' o::-.-lt'J:.CO
oi<.OO<.Or--:~ o u = E ~ E::
número de nacimientos de niños vivos durante un año . k
'O
u {;${:;::!:::
<::! <..>"" c:,C
e: r--, :<"; :.e :N .,
'5
-
Q.·-

So·§" .g ~ §¡f
~ "'
o u~

número total de mujeres en edad fértil


E ..,
~E'.::~g_g__
~ ....... g .....
e: ., -:;:i .,-¡·-o
<':
o :ao
"
·¡¡ :E ]E~i:., oº "e
"'-
,. u u.u.,-¡'- Cl u
"' "' u • o •e
donde k = 1 000 y, por lo general, la edad fértil se define como las edades entre
15 y 44 años, o bien, de 15 a 49. La característica de interés de esta tasa, cuan-
"

,;
u
;; "
~
o
~..._,:t<UO.u
."":"'1::;57i;
~ 11 11 Eo
u
O.N 00 i:: O V ,-.t.:
u,-.,-..,:!O t.>Xt.>
~;:::-¡:¡
8o ·co.::
O
o
O
"...
oo "'
u
do se compara con la tasa bruta de natalidad, es el hecho de que el denominador
es una aproxiinación del número de personas que, en realidad, están expuestas
u
E -~~ ..s ~s
11 ""ºº u ... ., '"'
i::ºº 0 - - 0 0 c..
u;::;=~&,]:!.;
o
-
¡::
~--
"Cl
u~

,.• e:, ::: .., "'!:;:;.. 0-U"):.CC:-.r ""


i3 8
al riesgo de dar a luz un niño. Q,
:;;; "ü ~ ';::; 0')1..'";e<":-.r:<1..,. 2
o
el;:::::;::::
i::8º
i:: "'
u,8-ov;-2
G,I + <': :;
ó ¡'.¡o
se °"' .§ ;g :::-~~ r---.c.-.~r-:q
:2:{: [E~
-r--.CN:::;-.,-;- g Ur;-,,~<':o,<':.._,-¡;
·-oo .-o u;,.......-
Xl
....., °'ó

·-
:N~CN
u E 0 ori¡;;: .... ~~ n 'O~
3. Tasa de fertif ida d. específica por edades. Dado que la tasa de alumbramientos
E "G-q~ C-.§"_.g~ vr-:-o o"
no es uniforme en toda la edad fértil. resulta conveniente una tasa que permita g ::t _; u ::i "'---o "'.a oe "o
el análisis Je las tasas de fertilidad para intervalos de edad materna más cor-
'O
u
u
i:.,-.:!'-.11
-ooo-.:::l"o,
u+.ui::.-
5 u..-.;e::
ll'>Xl UN-O<i"l_ :;:it:
-~-~
]ori~E ~ "=~ 11 - ; ~ .=! ·-:: -
tos. La tasa utilizada es la tasa de fertilidad específica por edades que se define
como "
Q,
u
'O
e ~
~
·e
..s
gggggg
-L'";---.rr--,
ó : :;-,'" ó :,; ,r-~ _; ~
•• OO'lo,u
;¡¡"¡¡--g_:=
;j -<Uui:.,
5 ,,,:g.t;~-o
-~~ ~~o.:::+.::t¡-§
~~~
~i'É
:su o '~
u o CN :=, r;-. ::<") :<1 <.C
cO
~
•.,,.::: o,--:;iu 11.-.:=>;:l
.cg 2,8!:-o~E,,, ..::
o·-U
<.> -e p.¿
número de naci1nienros en mujeres de una edad dada durante un año ~ ==' ~ CNCN- - - :N
;·e :::~o-tj::;,B.go,i
º~-=
..:::: Q

"'~.., .
número total de mujeres de la edad específica
·k g,. E E ..S
,::,, ,:;:
;.ü ~~";::o~~]
= ~ é]]
.:'.:~ o~{:'5~..g~~ .g__:: &
donde k == 1 000. Las tasas específicas por edades pueden calcularse para una
-
..;
~.g ~:; ~~+::
E.:3 ti"Efi:'.:v;-5.ati
8.i u. o
u - '-
V'l ~ ._
sola edad o para cualquier intervalo de edades. Las que se calculan con más fre-
cuencia son las tasas para grupos de edades de cinco años. Pueden calcularse
también las tasas específicas de fertilidad para otros sub grupos de la pobla-
-•
Ñ

¡;; ""<::l
'
-~
-
=-
<::, "
e:,
O\S::-0\-.:::tO\O'I
-NNl""ll""l-.:::1"
c':I c':I ~ ~ .:,:! ~
02
"t:I ..e
!::«i
:,"'
,.,o:
§°;~!::::=::';!:§
Oll"t:1 -
"'"'"""'t-"':,"'
.s O; -o :=
.,.,,f..:1..0.,E.,
o:o:1.::o:1-.uuo:1
O() -~·~,g
". o
·="e"
<:: i::
u
o::I ...

• C:l-,,:::
;¡¡ ~ ~ inO<f)0V)0
-~ ~~o~-~o,i~
ü= ¡::¡;:;;;;-~:o
cñt.,u
'"
-NN!""l!""l-.:::1"
" ' e
Estadísticas vitales Medidas de morbilidad 775
774
ción. coino los definidos por grupo racial, ni ve! socioeconómico y diversas ca- A partir de los datos anteriores, calcular las siguientes tasas:
racterísticas dctnográficas. 'a) Tasas de fertilidad específicas por edades para cada grupo de edades.
b) Tasa total de fertilidad.
4. Tasa defertilidad total. Si se suman las tasas específicas de fertilidad por edades e) Tasa acumulada de fertilidad para cada grupo de edades.
para todas las edades, y se multiplican por el intervalo en el cual se agruparon d) Tasa general estandarizada de fertilidad por edades.
esta últimas, el resultado se conoce cotno tasa de fertilidad total. El valor resul-
tantees una cstin1ación del número de niños que tendría un grupo de 1 000 Utilizar la población estándar de la tabla 12.3. l.
mujeres si, durante sus años fértiles. se reprodujera según las tasas represen-
tadas por las tasas de edades específicas de fertilidad a partir de laque se cal- 12.3.2 Hubo un total de 95 546 nacimientos de niños vivos en Georgia en 1971.
cula la taza tola\ de fertilidad. La población total estimada a julio I de 1971 fue de 4 668 400 y el número
de mujeres entre las edades de 15 y 49 años fue de 1 161 400. Utilizar estos
S. Tasa ac1111111lada de fertilidad. La tasa acumulada de fertilidad se calcula de la datos para calcular:
misma forma que la tasa total de fertilidad, excepto que el proceso de sumar
puede tern1inarse al final de cualquier grupo de edades deseado. Los números a) La tasa bruta de natalidad.
que se dan en la columna 7 de la tabla 12.3. l con las tasas acumuladas de fer- b) La tasa general de fertilidad.
tilidad que comprenden las edades indicadas en la columna 1. El valor final de
la colun1na de la tasa acumulada de fertilidad es la tasa total de fertilidad.
12.4 MEDIDAS DE MORBILIDAD _ _ _ _ _ _ _ _ __
6. Tasa estandarizada de fertilidad. Así como la tasa bruta de mortalidad puede
estandarizarse o ajustarse, también se estandariza la tasa general de fertilidad. Otra área que le interesa al profesionista dedicado a la salud pública que
El procedimiento es idéntico al que se analiza en la sección 12.2 para ajustar la analiza las condiciones de salud de una comunidad es la morbilidad. La
tasa bruta de mortalidad. Los cálculos necesarios para obtener la tasa palabra morbilidad se refiere al estudio de una comunidad con respecto a
estandarizada de fertilidad por edades se muestran en la tabla 12.3. l.
la enfermedad. Como regla general, los datos para el estudio de la morbi~
lidad de una comunidad no son tan completos ni se encuentran con tanta
facilidad como los que se refieren a la natalidad y mortalidad, debido a lo
EJERCICIOS~~~~~~~~~~~~~~~~~
incompleto de los informes y a las diferencias entre los estados en relación
con las leyes que requiere el informe de las enfermedades .. Las dos tasas
12.3.1 Los datos de la tabla pertenecen al estado de Georgi,a, para el año de 1971.
que se utilizan con mayor frecuencia en el estudio de las enfermedades en
una comunidad son la tasa de incidencia y la tasa de prevalencia.
N1ímero de
N1ín1ero de nacinlientos l. Tasa de incidencia. Esta tasa se define como
Edad de n1ujeres en en nzujeres según
la niuier(años) la población la edad específica
número total de nuevos casos de una enfermedad específica durante un año. k
15 a 19 225,200 21,834 población total a julio l
20a 24 217,600 35,997
25 a 29 173,400 21,670 donde el valor de k depende de la magnitud del numerador. Se utiliza una base
30 a 34 143,300 8,935
134,100 3,464 de 1 000 cuando resulta conveniente, pero puede utilizarse 100 para las enfer·
35 a 39
40 a49 267,800 925d medades más comunes, y 100000 100 000 para aquellas que son menos comunes
o más raras. Esta tasa, que mide el grado con el cual ocurren nuevos casos en
la comunidad, es útil po.ra determinar la necesidad de medidas preventivas. Es
Fuente: Statistics Sect1on. Office of Evaluation and Research. Georgia Dcpartment una medida muy importante tanto para tas enfermedades crónicas como para
of Human Resources, Atlanta.
las agudas.
ª Puede incluir algunos nacimientos en mujeres de más de 49 años de edad.
776 Estadísticas vitales Bibliografía 777

2. Tasa de prevalencia. Aunque se menciona como tasa, la tasa de prevalencia es 12.S RESUMEN _ _ _ _ _ _ _ _ _ _ _ _ _ _ __
en realidad una i-azón, ya que se calcula a partir de la relación:.
Este capítulo se refiere al cálculo e interpretación de varios tipos de tasas
número total de casos, nuevos o viejos, que existen en un instante k y razones que son útiles para analizar la condición de la salud de una comu-
población total en ese instante · nidad. De manera más específica, se estudian las tasas y razones más impor-
tantes relacionadas con nacimientos, muertes y morbilidad. Quienes deseen
donde el valor de k se elige mediante los mismos criterios que para la tasa de
saber más acerca del tema pueden consultar la bibliografía que se anota a
incidencia. Esta tasa es esencialmente útil en el estudio de las enfermedades
continuación.
crónicas, pero puede calcularse también para las enfermedades agudas.

3. Razón de niuertes-casos. Esta razón es útil para determinar qué tanto éxito está
teniendo un programa de tratamiento para cierta enfermedad. Se define como
BIBLIOGRAFÍA _ _ _ _ _ _ _ _ _ _ _ _ _ _ __

número total de muertes debidas a una enfermedad . k Obras citadas


número total de casos debidos a la enfermedad
l. FoREST E. LJNDER y ROBERT D. GROVE, Vital Statistics Rates in the United
donde k = 1OO. El período abarcado es arbitrario, depende de la naturaleza de States, 1900-1940, United States Government Printing Office, Washington,
la enfermedad y puede abarcar varios años para una enfermedad endémica. Es D.C.. 1947.
importan le observar que esta razón puede interpretarse como la probabilidad
de morir al contraer la enfermedad en cuestión y, como tal, revela la gravedad Otras publicaciones
de la enfermedad.
l. DoNALD J. BOGUE, Principles of Deniography, Wiley, Nueva York, 1969.
4. Razón de in1nadurez. Esta raz6n se define como 2. JoHN P. Fox, CARRIE E. HALL y LILA R. EL VEBACK, Epideniiology, Macmillan,
Nueva York, 1970, capítulo 7.
número de nacimientos de niños vivos 3. BERNARD G. GREENBERG, "Biostatistics", en Hugh Rodman Leavell y E. Gur-
con un peso inferior a los 2 500 gramos durante un año . ney Clark, Prevenrive Medicine, 3/ edición, McGraw-Hill, Nueva York, 1965.
número total de nacimientos de niños vivos durante un año k 4. MoRTIMER SPIEGELMAN, Introduction to Deniography, edición revisada, Har-
vard University Press, Ca1nbridge, Massachusetts, 1968.
donde k = 1OO.

5. Tasa de ataque secundario. Ésta m_ide la ocurrencia de una enfermedad conta-


giosa entre personas susCeptibles que se han expuesto a un caso primario, y se_
define como

número de casos adicionales entre personas expuestas


a un caso primario dentro del periodo máximo de incubación . k
número total de personas susceptibles

donde k = 1OO. Esta tasa se utiliza para estimar la propagación de la infección


Y se aplica por lo general a grupos cerrados como casas habitación o salones de
clase, donde puede suponerse razonablemente que, de hecho, todos los miem-
bros estuvieron expuestos.
Apéndice I
Algunos comandos básicos para el manejo
de datos en el programa MINITAB

Este apéndice presenta algunos comandos básicos para el manejo de datos en el pro·
grama MINITAB, su uso y algunos ejemplos. Nos e intenta presentar en esta parte
un manual completo de uso para el paquete. El propósito es proporcionar al usuario
un texto de referencia rápida de los comandos que se utilizan con mayor frecuen-
cia. A aquellos lectores que no utilizan el programa MINITAB, este apéndice les
servirá como una muestra de la forma en que los paquetes de software procesan los
datos. El usuario formal que utiliza el sistema de análisis de datos MINITAB debe
tener el M!NITAB Statistical Sofnrare Reference Manual correspondiente a la ver-
sión más actualizada del programa y lu última edición del M//11'/TAB Handbook
(manual de bolsillo de MINITAB) editado por Barbara F. Ryan, Brian L. Joiner, y
Thomas A. Rayan, Jr., publicado por Publishing Company ofBoston.
Los siguientes comandos para el tratamiento de datos permiten que el usuario
prepare los datos para todos los análisis por computadora que se incluyen en el tex: 4

to. Los comandos para efectuar los análisis se presentan e ilustran en la parte corres 4

pondiente del texto.

READ El comando READ permite que el usuario ingrese dos o más columnas de
datos por renglón. Porejemplo, supóngase que se tiene una columna de datos (colum 4

na 1) formada por las observaciones 24, 34, 44, 15, 24 y una segunda columna de
datos (columna 2)con las observaciones 33, 16, 27,22, 32. El comando READ sirve
para registrar esos datos de la siguiente forma;

!!ITB> READ C1 C2
DATA> 24 33
DATA> 34 11:.
DATA> 44 27
DATA> 15 22
DATA> 24 32
DATA> E!fD
5 ROWS READ

779
Algunos comandos básicos en el programa MINITAB 781
780 Apéndice 1

Los datos se almacenan en una matriz dedos columnas con cinco renglones. El
comando END indica que terminó la entrada de datos.
PRIHT Cl, C2
ROW C1 C2

SET Cuando se utiliza el comando READ, los datos se registran por renglón y cuan- 1 20 33
do se utiliza el comando SET, los datos entran por columna. El siguiente ejemplo 2 30 lb
3 lb 27
muestra como utilizar el comando SET con las columnas del ejemplo anterior. 22
o "" 32
5 15
b 20 20

!!TB> SET C1
DATA> 24 34 44 15 24
DATA> SET C2 DELETE El comando DELETE se utiliza para borrar las observaciones del con-
DATA> 33 1b 27 22 32
DATA> END junto de datos. Como parte del comando, se especifica el renglón y columna de la
observación que se ha de borrar. Por ejemplo, supóngase que se quiere borrar las
dos observaciones previamente insertadas; la observación 16 se encuentra en el
renglón 3 de la columna 3 y la observación 20 se encuentra en el renglón 6 de la
PRINT El comando PRINT permite revisar los datos ingresados. Por ejemplo, columna 2. Los comandos son como sigue:
cuando se registra el comando PRINT C l, C2 la computadora muestra las colum-
nas ingresadas previamente, como se aprecia en la siguiente figura:
DELETE 3 CJ.
DELETE 6 C2
PRINT C1, C2
ROW C1 C2
LET Cuando se quiere cambiar una observación, se utiliza el comando LET. Al
1 20 33 utilizar este comando es necesario indicar el renglón y la columna en los que se
2 30 lb
3 27 encuentra la observación que se quiere cambiar. Por ejemplo, supóngase que después
o ""
15 22 de ingresar los datos se descubre que la obs~rvación 34 registrada en el renglón 2 y
5 20 32 columna 1 está incorrecta y que debe ser 35. A continuación se ilustra cómo se debe
utilizar este comando para efectuar el cambio.

INSERT Este comando se utiliza para agregar observaciones al conjunto dé datos


en diferentes sitios de la matriz. Supóngase por ejemplo que, si se quiere agregar la LET C1(2) 35
observación 16 entre los renglones 2 y 3 de la columna l y la observación 20después
del renglón 5 en la columna 2. Los comandos son como sigue:

NAME En algunas circunstancias se desea dar a la columna de datos un nombre


!TB> INSERT 2 3 Clo descriptivo. Por ejemplo, si las observaciones en la columna 1 corresponden a la
DATA> 1b estatura de personas, se podría nombrar a la columna con el nombre ESTATURA.
DATA> INSERT C2 En el análisis de regresión las columnas podrían ser nombradas Y. XI, X2 y así
DATA> 20 sucesivamente. El comando NAME permite llevar a cabo esta operación. Cuando
se utiliza el comandoNA~1E, el nombre que se va a asignar debe ir entre comillas.
Por eje1'nplo, supóngase que se desea non1brar a las columnas de datos previamente
Después, se puede utilizar el comando PRINT para desplegar los datos como capturadas con10 X y Y, respectivamente. El comando NA!\1E es como sigue:
sigue:
Apéndice l Algunos comandos básicos et1 el programa MINITAB 783
782
Si no se desea hacer corresponder otras columnas, renglón por renglón, con la
[ NAHE C1 = 'X', C2 = •y• columna que se desea clasificar, únicamente se registra el comando SORT para
dicha columna. Por ejemplo, para clasificar la columna l y registrar los datos en la
misma columna, se registra el comando:

_El comando PRINT permite revisar los datos y sus nuevos nombres como sigue:
SORT Cl, C1

PRI!fT Cl C2
ROi X y
Con el comando PRINT es posible visualizar el despliegue de las dos colum-
24 33 nas como sigue:
1
2 35 1b
44 27 ---
3
4 15 22 PRIHT C1 C2
5 24 32 ROW X y

1 14 33
2 15 1b
3 24 27
SORT El comando SORT permite e lasificar una columna de observaciones hac ien- 4 35 22
do corresponder las observaciones de otras columnas, renglón por renglón, y alma- 5 44 32
cenando tanto la columna clasificada como las que se hacen corresponder con la
misma en nuevas columnas. Por ejemplo, supóngase que se quiere clasificar las
observaciones de la columna 1 haciendo que las observaciones de la columna 2 co- RANK El comando RANK ordena las observaciones de una columna específica
rrespondan con la misma. También se desea almacenar ambas columnas, la clasi- según sus respectivos rangos y las observaciones así ordenadas en nuevas colum-
ficada y la correspondiente, en las columnas 3 y 4. El comando se puede lograr esto. nas. Para ordenar las observaciones de la columna 1 (previamente clasificada) y de
la columna 2 según sus respectivos rangos y almacenarlas en las columnas 3 y 4, se
registra el siguiente comando:
SORT C1, CARRY ALONG C2, POT INTO C3-C4

RAHK C1 C3
RAHK C2 C4
Por medio del comando PRINT se puede verificar que el procedimiento de
clasificación se llevó a cabo correctamente:
Por medio del comando PRINT se puede ver las columnas que contienen, los
rangos, como sigue:

PRIHT C3 C4 PRINT C3 Cl.f


ROW C3 C4 ROW C3 C4

22 1 1.0 2
1
2
3
"24
24
33
32
2
3
2.5
2.5
5
4
4 35 1b 4 4.0 1
5 44 27 5 s •o 3
AQéndice 11
Tablas estadísticas

Lista de tablas

A. Distribución de probabilidad binomial acumulada


B. Distribución de Poisson acumulada
C. Área de la curva normal
D. Números aleatorios
E. Percentiles de la distribución t
F. Perccntiles de la distribución ji-cuadrada
G. Percentiles de la distribución F
H. Puntos porcentuales de los rangos corregido por Student
l. Transformación de r a z
J. Niveles de probabilidad para la prueba de califica1:ión con signo de Wilcoxon
K. Cuantiles de la estadística de prueba de Mann-Whitnney
L. Cuantiles de la estadística de prueba de Kolmogorov
M. Valores críticos de la estadística de prueba de Kruskal-Wallis
N. Distribución exacta de x;
a. Para tablas de 2 a 9 conjuntos de tres rangos
b. Para tablas de 2 a 4 conjuntos de cuatro rangos
O. Valores críticos de la estadística de prueba de Spearman

¡
785
Tahla A ( co,u in 1u1cirí11)
Tabla A Distribución de prnhahi lidaú hinoniial acurnulaúa

P(X s .r)n,p) = t (~) p·'q"-"


n::::: 5 ( co11ri1111ació11)

~
X•O
41 42 .4J
"'
.44 .45 46 .47 .4X .49 50

u .07 !5 .0656 .0602 .0551 .0503 .0459 041X 03110 .OJ45 03!2
1 3199 .JO.'-~ .2871 .27!4 .2562 1415 .2271 2! J5 .2002 .1875
2 .665 ! .6475 .6195 .6114 .5931 .5747 .556! .5J75 .5187 _j()()()
9051 .X96 7 8879 8i86 S6S~ 8585 8478 .8365 X24i .XI 15
4 : 9884 9869 .9H5_\ 9835 9815 9794 9771 .974-:' 97¡¡.¡ 96SS

5 11.()()()0 r.<KK}() 1.0000 1.(MJI)() ¡ ü(Jl)ll 1.0000 1.()()()0 1.00()() 1 ()()()() 1.1)()()1)

j/ e= ó
012345
P(X<, (315, .40) z .9130 ~¡ "'
1: ·,,
(12 ()J
º' .05 .Oh 07 .OX .09
'"
11 "' 5 i, 9415 .HX58 .X330 7821'., .735: 6899 .6470 .6Uó4 5679 5314
1 99¡.¡5 994."l .9875 9784 .9672 .9541 9392 .9227 .404X .!1857

~
1.00()() .9998 9995 .9988 _9978 9962 9942 9415 9882 _9841
.01 .02 .03 .04 .05 .06 .07
º' f1'I .10 J
4
1.01)()()
1.00(}0
1 ()()()()
1.0000
l.0000
J_{)(){)()
!.()()()()
1.0000
.~999
1.0000
.999~
U)()O(¡
9997
I l)()OO
.9945
I .O(XXI
.9992
1.U<)(JO
.9987
9999
o .9510 .9039 .8587 .8154 .7738 .7J39 .6957 .659! .6240 .5905
1 .9990 .9962 .9915 .9852 .9774 .9681 9575 ,9456 .9326 .9185 1.0000 1 (){)(JI) 1.01)()() l.0001.! 1.f)(J(JO l.(){)()() l.()(}(JI) f.()()(J(J l_l)()(JU !.()()()()
2 1.0()()() .9999 .9997 .9994 .9988 .9980 .9969 .9955 .9937 .9914
J
4
1.0()()()
1.0000
1.0()()()
1.0()()()
1.0000
1.0()()()
1.0000
1.0000
1.0000
1.0000
.9999
1.0000
.9999
1.0000
.9998
1.0000
.9997
1.0000
.9995
1-0000 ~I 11 .12 1J .14 .15 16 17 .1, 19 21J

~
~
4970 .4b44 .4J.,6 .4046 3771 .35!3 .3269 ..,o4o .1H24 - 26.21 -
.11 .12 .13 .14 .15 .16 .17 1, .19 .20
I .1!655 8444 .8214 7997 776) .7528 71Xi .7044 .6799 6554
1 1 9744 .9739 9676 .9605 .952~ .944() .9J45 _9241 .9!30 90!!
o .5584 .5277 .4984 .4704 .4437 .4182 .J939 .3707 .3487 .3277 3 r 9982 .9975 9966 9\l55 .9941 9925 .9'JIJó .9HH4 .91-i59 9830
1 .9035 .8875 .8708 .8533 .8352 8165 .7973 .7776 .7576 .7373 4 , 9999 9999 .999X 9997 9996 9995 '.199_1 9990 99H7 .998'1
2 .9888 .9857 .9821 .9780 .9734 .9682 .9625 .9563 .9495 .9421
3 .9993 .9991 .9987 .9983 .9978 .9971 .9964 .9955 .9945 .9933 I.OIJUO 1 ()IJ()(I 1 ()l)l)(J !_()()()() 1.()()()() J.l)l)()(I l .(JOl)IJ l.tll)()I) ¡_¡••)(¡() .99'.19
4 1.0000 1.0()()() 1.0()()() .9999 .9999 .9999 .9999 .9998 9998 .9997 6 1.()()1){) I.Ol)I)() IJXX>O 1.0()()() IJXJIJII !_{)()(JO 1.1)()1)1) 1 _(){)()() 1.()()1)() l.0000

,,i ,-
5 1.0000 1.0()()() 1.0()()() 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 "- !' ~1
" . .:':.'l 24 .25 .26 _,
1: ' " ' ·-
" .29 .JO

~
-~--r
.21 .22 .23 .24 .25 .26 .27 .28 .29 J-0 () 1 2>1-.~ 1 .225.:': 21lX4 1927 .1780 1642 151 .1 .1 J9J .l 2X! 1 !76
1 1 ó 1()¡¡ (¡l)t,J .5820 5578 .5339 .5104 4872 4644 4420 4202
I
o xXxs
1
.3077
.7167
.2887
.6959
..2707
.6749
.2536
.6539
.2373
.6328
.2219
.6117
.2073
.5907
.1935
.5697
.1804
.5489
1681
.5282 '
--!
979S
9,¡:-¡¡¡
X75U
.9761
9,¡~,
.86()9
9720
.8461
.9674
.8306
.9624
Jil44
9569
7977
950.~
.7804
.9--l-•D
.7626
9.172
7443
9295
2 .9341 .9256 .9164 .9067 8965 .8857 .8743 .8624 .8499 .8369 l)l)(l') 9962 9954 ')')44 'IYJJ 99.:':I 9907 lJS9'1
3 .9919 .9903 .9886 .9866 .9844 .9819 9792 .9762 .9728 .9692
4 .9996 .9995 .9994 .9992 .9990 .9988 .9986 .998) .9979 .9976 999'.I .9'J'l9 .999'1 999/i .999!\ 9997 .'.l'J96 .9995 .9'.l'.14 .999)
6 I .UH)(J I lllJIJ(I I IJU!Xl 1 (){)()() 1.()()1)1) !.IX)l!O J .{)()(M) J.()()()() 1.()()1)() 1 lll}O!J
j 1.0000 1.11000 1.0000 1.0000 1.0()()() 1.0000 1.0000 1.00'.JO 1.00'.JO 1.0000
,~:
p '
.31 32 .33 .14 .35 36 . J7 .JX .J9 ...
~ .31 .32 .33 .34 .35 .36 .J7 .38 39 .40
o 1' 11)79 IJ',IX'.I IJ91J5 0827 075-1- .1!687 0625 .056X 0515 0467
o .1564 .1454 .1350 .1252 .1 !60 .!074 .1>992 .0916 .0845 .0778 1 .J98X J7:-S() J57H JJXJ 3191 3006 2X28 2657 2492 2JJ3
1 .5077 .4875 .4675 .4478 .4284 .4-094 .3907 J724 J545 .3370 2 7256 7064 6X70 6672 6471 .6268 .6063 5857 .5650 5443
1
2 .8234 .8095 .7950 .7801 .7648 .749! .7330 7165 .6997 .6826 3 1 9213 .9! 25 .9031 l:t9JJ .8826 .8714 .8596 847J .!S343 t.<208
3 .9653 .9610 .9564 .9514 .9460 .9402 .9J40 9274 .9204 .9! 30 ~ 9873
.9X52 .9830 9805 .97i7 .9746 .9712 9675 9635 .9.\90


1
4 .9971 .9966 9961 .9955 9947 .994() .99]1 .9921 .9910 .9898
9991 99l:t9 9<J87 9985 99~2 997X .9974 997() .9965 9959
j 1.11000 f, 1 !)()()() 1 {)1)()1) 1 _{)()(){) 1.()()1)1) l .()(M)O !_()()()() ¡_()()()() ! OOCO l JXJIJO
1.0000 1.000ü 1.0000 1.0000 1.00l)(l 1.000<J 11)(1()() 1.0000 1.0000 I .OOIJO

,., 787
788 Apé11dice 11 Tablas estadísticas 789
Tabla A (continuación}
--
--
Tabla A (continuación)
1
n = 6 (continuación) 11 = 7 (continuación)

'
p
.41 .42 .43 .44 .45 .46 .47 .48 .49 .50
';'< .31 .32 .33 .34 .35 .36 .37 .38 .39 .40

o .0422 .0381 .0343 .0308 .0277 .0248 .0222 .0198 .0176 .0156 o .0745 .0672 .Oó06 .0546 .0490 .0440 .0394 .0352 .0314 .0280
1 .2181 2035 .1895 .1762 .1636 .1515 .1401 .1193 .! ¡ 9-0 .1094
.2887 .2172
1 .3086 .2696 .2513 .2338 .2013 .1863 .1721 .1586
2 .5236 .5029 .4823 .4618 .4415 .42!4 .4015 .38.20 .3627 3437 .6243 .6013 .5783 5553 .5323 .5094 .4866 .4641 .4419
3
4
.8067
.9542
.7920
.9490
.7768
.9434
.7610
.9373
.7447
.9308
.7280
.9238
.7107
.9163
.6930
.9083
.6748
.8997
6562
.8906
'3 .8606 .8466 .8318 .8163 .8002 .7833 .7659 .7479 .7293
.4199
.7102
4 9668 .9620 .9566 .9508 .9444 .9375 .9299 .9218 .9131 .9037

5 .9952 .9945 .9937 .9927 .9917 .9905 .9892 .9878 .9862 .9844
5 .9954 .9945 .9935 .9923 .9910 .9895 .9877 .9858 .9836 .9812
6 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 J.0000 1.0000 6 .9997 .9997 .9996 .9995 .9994 .9992 .9991 .9989 .9986 .9984
7 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000
u == 7

}z .01 .02 .03 .04 .05 .06 .07 .08 .09 .10 }z .41 .42 - .43 .44 .45 .46 .47 .48 .49 .50

o n7,tQ rn,, fll(.l~ íll ~, n, 17 M"


o .9321 .8681 .8080 .7514 .6983 .6485
.9382
.6017
.9187
.5578
.8974
.5168
.8745
.4783
8503
1 1 .1459 .1340 .1228
0171
.1123 .1024
íll 14
.0932 .0847
fllíll
.0767 """"
.0693 .0625
1 .9980 .9921 .9829 .9706 .9556 2 .398) .3771 .3564 .3362 .3164 .2973 .2787 .2607 .2433 .2266
2 1.0000 .9997 .9991 .9980 .9962 .9937 .9903 .9860 .9807 .9743
3 .6906 .6706 .6502 .6294 .6083 .5869 .5654 .5437 .5219 .5000
3 1.0000 1.0000 1.0000 .9999 .9998 .9996 .9993 .9988 .9982 .9973 .8471 .8337 .8197 .7734
4 8937 .8831 .8718 .8598 .8049 .7895
4 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 .9999 .9999 .9998
5 .9784 .9754 .9721 .9684 .9643 .9598 .9549 .9496 .9438 .9375
5 1.0000 1.0000 1.0000 1.0000 1.0000 1 0000 1.0000 1.0000 1.0000 1.0000 .9977 .9973 .9968 .9963 .9956 .9949 .9941 .9932 .9922
ó .9981
1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000

'>< o
.11

.4423
.12

.4087
.13

.3773
.14

.3479
.15

.3206
.16

.2951
.17

.2714
18

.249)
19

.2288
.l-0

.2097
11 = 8

1
2
.8250
.9669
.7988
.9584
.7719
.9487
.7444
.9380
.7166
.9262
.6885
.9134
.6604
.8995
.6323
.8846
.6044
.8687
.5767
.8520
}z .01 .02 .03 .04 .05 .06 .07 .08 .09 .10

3 .9961 .9946 .9928 .9906 .9879 .9847 .9811 .9769 .9721 .9667
4 .9997 .9994 .9991 .9988 .9983 .9978 .9971 .9963 .9953
o .9227 .8508 .7837 .7214 .6634 .6096 :S596 .5132 .4703 .4305
.9996 1 .9973 .9897 .9777 .9619 .9428 .9208 .8965 .8702 .8423 .8131
2 .9999 .9996 .9987 .9969 .9942 .9904 .9853 .9789 .9711 .9619
5 l.0000 1.0000 1.0000 1.0000 .9999 .9999 .999Q .9998 .9997 .9996 .9950
3 1.0000 1.0000 .9999 .9998 .99% .9993 .9987 .9978 .9966
6 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 J.000)' 1.0000 1.0000 1.0000 .9997 .9996
4 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 .9999 .9999

~ .21 .22 .23 .24 .25 .26 .27 .28 .29 .30 5 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000

o
1
2
3
.1920
.5494
.8343
.9606
.1757
.5125
.8159
.9539
.1605
.4960
.7967
.9464
.1465
.4702
.7769
.9383
.1335
.4449
.7564
.9294
1215
4204
.7354
.9198
.1105
.3965
.7139
.9095
.1003
.3734
.6919
.8984
.0910
.3510
.6696
.8866
.0824
.3294
.6471
.8740
><o
1
.11

.39.17
.7829
.12

.3596
.7520
.13

.3282
.7206
14

1992
6889
.15

.2725
6572
.16

.2479
.6256
.17

1152
5943
.18

.2044
.5634
.19

.1853
.5330
.20

.1678
.5033
4 .9942 .9928 .9912 .9893 .9871 .9847 .9819 .9787 .9752 .9712
.9513 .9392 .9257 .9109 .8948 .8774 .8588 .8392 .8185 .7969
5 .9995 .9994 .9992 .9989 .9987 .9983 .9979 .9974 .9969 .9962 '
3
4
.9929
.9993
.9903
.9990
.9871
.9985
.9832
.9979
.9786
.9971
.9733
.9962
.9672
.9950
.9603
.9935
.9524
.9917
.9437
.9896
6 l.0000 1.0000 1.0000 1.0000 .9999 .9999 .9999 .9999 .9998 .9998
7 l.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000
5 1.0000 .9999 .9999 .9998 .9998 .9997 .9995 .9993 .9991 .9988
1.0000 1.0000 1.0000 .9999 .9999
'7 1.0000
1.0000 1.0000
1.0000
1.0000
1.0000
1.0000
1.0000
1.0000 1.0000 1.0000
1.0000
1.0000 1.0000 1.0000
Apéndice 11 Tablas estadúticas 791
790
Tabla A (co11tinaació11) Tabla A (L"o11tinuació11)

n =9 {con(inuación)
11 =8 (continuación)

~ .21 .22 .23 .24 .25 .26 .27 .28 .29 JO ~ .11 .12 .13 .14 .15 .16 .17 .18 .19 .20

.0899 .0722 .0646 .0576


o .)504 .3165 .2855 .2573 .23[6 .2082 .1869 .1676 .1501 .1342
o .1517 .1370 .1236 1113 .1001 .0806
.2553
1 .740[ 11)49 .6696 .6343 .5995 .5652 .5315 .4988 .4670 .4362
1 .474J .4462 .418'1 .3925 .3671 .3427 .3193 .2969 .2756 l .9327 .9167 .8991 8798 .8)7l
.8591 8! 39 .7895 .764) 7382
l .7745 .75!4 .7276 .7033 .6785 .6535 .6282 .6027 .5772 .55!8
J 9842 .9791 .97)1
.9883 .9661 .9580 .9488 .9385 .9270 .9144
J .9341 .9235 .9120 .8996 .8862 .8719 .8567 .8406 .8237 .8059 4 .9979
.9986 .9970 .9959 .9944 .9925 .9902 .9875 .9842 .9804
4 .9871 .9842 .9809 .9770 .9727 .9678 .9623 .9562 .9495 .9420
5 .9999 .9998 .9997 .9996 .9994 .9991 .9987 .9983 .9977 .9969
5 .9984 .9979 9973 .9966 .9958 .9948 .9936 .9922 .9906 .9887

'
1
.9999
1.0000
.9998
1.0000
.9998
1.0000
.9997
1.0000
.9996
1.0000
.9995
1.0000
.9994
1.0000
.9992
1.0000
.9990
.9999
.9987
.9999
'
1
1.0000
1.0000
1.0000
1.0000
LOOOO
1.0000
1.0000
LOO()()
LOOOO
1.0000
.9999
1.0000
.9999
1.0000
.9998
1.0000
.9998
1.0000
.9997
LOOOO
1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000

~
8 1.0000
.21 .22 .23 .24 :25 .26 .27 .28 .29 .30
p .31 .33 .34 .35 .36 .37 .38 .39 .40
Jl
X o .1 !99 1069 .0952 .0846 0751 .0665 .0589 .0520 .0458 .0404
1 .4066 .3782 .3509 .3250 .3003 .2770 .2548 .2340 .2144 .1960
o .05!4
·º'.21 2 .7115 .6842 .6566 .6287 .6007 .5727 .5448 .517[ .4898 .4628
1 .2360 ) .9006 .8856 .8696 .8525 .8)43 .8151 .7950 .7740 .7522 .7297
l .5264 .5( 4 .9760 9709 .9650 .9584 .9511 .9429 .9338 .9238 .9130 .9012
) .7874 .1<
4 .9339 _9; 5 .9960 .9949 .9935 .99!9 .9900 .9878 .9851 .9821 .9787 .9747
6 .9996 9994 .9992 9990 .9987 9983 .9978 .9972 .9965 .9957
5 .9866 .91 7 1.0000 1.0000 .9999 .9999 .9999 .9999 .9998 .9997 .9997 .9996
'1 i. .9984 .9980 .9976 .9970 .9964 .9957 .9949 9939 .9928 .9915 8 1.0000 ¡ .00()() 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 LOOOO
.9999 .9999 .9999 .9998 .9998 .9997 .9996 .9996 .9995 .9993
1.0000 1.0000 1.0000 1.0000 LOOOO 1.0000 1.0000 1.0000

~
8 1.0000 1.0000
.31 .32 .33 .34 .35 .36 .31 .38 .39 .40
p
'
.41 .42 .4J .44 .45 .46 .47 .48 .49 .50
X o .0355 .OJ! 1 .0272 .0238 0207 .0180 .0156 .0135 .0117 .0101
1 .1788 .1628 .1478 .1339 .121 ! .1092 .0983 .0882 .0790 .0705
o .0147 .0128 .0111 .0091 .0084 .0072 .0062 .0053 .0046 .0039 l .4364 .4106 .3854 .3610 .3373 .3144 .2924 .2713 .2511 .2318
1 .0963 .0870 .0784 .0705 .0632 .0565 .0504 .0448 .0398 .0352 3 .7065 .6827 .6585 .6338 .6089 .5837 .5584 .5331 .5078 .4826
2 .2948 .2750 .2560 .2376 .2201 .2034 .1875 .1724 .1581 .1445 4 .8885 .8748 .8602 .8447 .828) .8110 .7928 .7738 .7540 .7334
3 .5708 .547J .523~ .5004 .4770 .4537 .4306 .4078 .3854 .3633
4 .8105 7938 .7765 .7584 .7396 .7202 .7001 .6795 .6584 .6367
5 .9702 .9652 .9596 .9533 .9464 .9388 9304 .9213 .9114 .9006

5
6
.9437
.9900
.9366
.9883
.9289
.9864
.9206
.9843
.9! 15
.9819
.9018
.9792
.8914
.9761
.8802
.9728
.8682
.9690
.8555
9648
'1 .9947
.9994
.9936
.9993
.9922
999!
.9906
.9989
.9888
.9986
.9867
.9983
.9843
.9979
.9816
.9974
.9785
.9969
.9750
.9962
8 1.0000 1.0000 1.0000 .9999 .9999 .9999 .9999 .9998 9998 .9997
1 .9992 .9990 .9988 .9986 .9983 .9980 .9976 .9972 .9967 .996! 9 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000
8 1.0000 LOOJO 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000

n"" 9
~ .41 .42 .43 .44 .45 .46 .41 .48 .49 .so
p .01 02 .03 .04 .05 .06 .01 .08 .09 .10 o .0087 .0074 .0064 .0054 0046 .0039 .0033 .0028 .0023 .0020
X 1 .0628 .0558 .0495 .0437 .0385 .0338 .0296 .0259 .0225 .0195
2 .2134 .1961 .! 796 .1641 .1495 1358 .1231 .1111 .1001 .0898
o .9135 .8337 .7602 .6925 .6302 .5730 .5204 .4722 .4279 .3874
3 .4576 .4330 .4087 .3848 .3614 .3386 .3164 .2948 .2740 .2539
1 .9966 .9869 .9718 .9522 .9288 .9022 .8729 .8417 .8088 .7748
4 .7122 .6903 .6678 .6449 .6214 .5976 .5735 .5491 .5246 5000
2 .9999 .9994 .9980 .9955 .9916 .9862 .9791 .9702 .9595 .9470
) LOOOO LOOOO .9999 .9997 .9994 .9987 .9977 .9963 .9943 .9917
5 .8891 .8767 .8634 .8492 .8342 .8183 .8015 .7839 7654 .7461
4 1.0000 1.0000 LOOOO 1.0000 1.0000 .9999 .9998 .9997 .9995 .999l

5 1.0000 1.0000 LOOOO 1.0000 LOO()() 1.0000 LOO()() 1.0000 1.0000 .9999
'7 .9710
.9954
.9666
.9945
.96! 7
.9935
.9563
.9923
.9502
9909
9436
9893
.9363
.9875
.9283
.9855
.9196
.9831
9,¡¡;4
.9102
.9805
8 .9997 .9996 .9995 9994 .9992 .9991 ,9989 .9986 .9980
6 1.0000 LOOOO 1.0000 1.0000 1.0000 LOOOO 1.0000 1.0000 LOO()() 1.0000 9 1.0000 1.()()()0 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 I.OCOO 1.0000
1 ao1a A l co11111111ac1on)

Tabla A (continuación)
n =10 (continuación)

~
11 = lO .41 .42 43 .44 45 .46 .47 48 .49 .50

,,
~.0. 1 .02 .03 .04 .05 06 .07 .08 .09 .JO
o
1
.0051
.0406
.0043
.0355
.0036
.0309
.0030
.0269
.0025
.0233
.0021
.0201
.0017
.0173
.0014
.0148
.0012
.0126
.0010
.0107
O .9044 .8171 .7374 .6648 .5987 .5386 .4840 .4344 .3894 .3487 2 .1517 .1372 .1236 .1111 .0996 .0889 .0791 .0702 .0621 .0547
1 .9957 .9838 .9655 .9418 .9139 .8824 .8483 .8121 .7746 .7361 3 .3575 .3335 .3102 .2877 .2660 .2453 .2255 .2067 .] 888 .1719
2 .9999 .9991 .9972 .9938 .9885 .9812 .9717 .9599 .9460 .9298 4 .6078 .5822 .5564 .5304 .5044 .4784 .4526 .4270 .4018 .3770
3 J.0000 LOOOO .9999 .9996 .9990 .9980 .9964 .9942 .9912 .9872
LOOOO LOOOO LOOOO .9999 .9998 .9997 .9994 .9990 .9984 5 .8166 .7984 .7793 .7593 .7384 .7168 .6943 .6712 .6474 .6230
4 1 L])(]()(] 8859 .8729 .6590 .8440 .8281
6 9374 .9288 .9194 .9092 8980
LOOOO LOOOO 1.0000 1.0000 l .0000 1.0000 1.0000 .9999 .9999 7 .9854 .9828 .9798 .9764 .9726 .9683 .9634 .9580 .9520 .9453
LOOOO L])(]()(] 1.0000 1.0000 1.0000 1.0000 1.0000 !.OCOO 1.0000 8 .9979 .9975 .9969 .9963 .9955 .9946 .9935 .9923 .9909 .9893
9 .9999 .9998 .9998 .9997 .9997 .9996 .9995 .9994 .9992 .9990

~ .11 .12 .13 .14 .15 .16 .17 .18 .19 .20
10 LOOOO 1.0000 LOOOO 1.0000 LOOOO 1.0000 ].])(]()(] LOOOO LOOOO LOOOO

o .3118 .2785 .1484 .2213 .1969 .1749 .1552 .1374 .1216 .1074 n=ll
1 .6972 .6583 .6196 .5816 .5443 .5080 .4730 .4392 .4068 .3758
2
3
4
.9116
.9822
.9975
.8913
.9761
.9963
.8692
.9687
.9947
.8455
.9600
.9927
.8202
.9500
.9901
.7936
.9386
.9870
.7659
.9259
.9832
.7372
.9117
.9787
.7078
.8961
.9734
.6778
.8791
.9672
>( .01 .02 .03 .04 .05 .06 .07 .08 .119 .10

o .8953 .8007 .7153 .6382 .5688 .5063 .4501 .3996 .3544 .3138
5 .9997 .9996 .9994 .9990 .9986 .9980 .9973 .9963 .9951 .9936 1 .9948 .9805 .9587 .9308 .8981 .8618 .8228 .7819 .7399 .6974
6 LOOOO LOOOO .9999 .9999 .9999 .9998 .9997 .9996 .9994 .9991 2 .9998 .9988 .9963 .9917 .9848 .9752 .9630 .9481 .9305 .9104
7 LOOOO LOOOO L])(]()(] LOOOO LOOOO LOOOO LOOOO LOOOO .9999 .9999 J 1.0000 ].(]()(]() .9998 .9993 .9984 .9970 .9947 .9915 .9871 .9815
8 LOOOO LOOOO L])(]()(] 1.0000 1.0000 1.0000 LOOOO LOOOO LOOOO LOOOO 4 ].(]()(]() LOOOO LOOOO 1.0000 .9999 .9997 .9995 .9990 .9983 .9972

~
5 LOOOO 1.0000 LOOOO LOOOO ].])()()(] LOOOO LOOOO .9999 .9998 .9997
21 .22 .23 .24 .25 .26 .27 .28 .29 .30 LOOOO LOOOO LOOOO ].(]()(]() LOOOO 1.0000 LOOOO LOOOO LOOOO
' LOOOO

~
o .0947 .0834 .0733 .0643 .0563 .0492 .0430 .0374 0326 .0282
JI 12 .13 .14 .15 .16 .17 .18 .19 .20
1 .3464 .3185 .2921 .2673 .2440 .2222 .2019 .1830 .1655 .1493
2 .6474 .6169 .5863 .5558 .5256 .4958 .4665' .4378 .409<J .3828
3 .8609 .8413 .8Z06 .7988 .7759 .7521 .7274 .7021 .6761 .6496 o .2775 .2451 .2161 .1903 .1673 .1469 .1288 .1 !27 .0985 .0859
4 .9601 .9521 .9431 .9330 .9219 .9096 .8963 .8819 .8663 .8497 1 .6548 .6127 .5714 .5311 .4922 .4547 .4189 .3849 .3526 .3221
2 .8880 .8634 .8368 .8085 .7788 .7479 .7161 .6836 .6506 .6174
5 .9918 .9896 .9870 .9839 .9803- .9761 .9713 .9658 .9596 .9527 3 .9744 .9659 .9558 .9440 .9306 .9154 .8987 .8803 .8603 .8389
6 .9988 .9984 .9979 .9973 .9965 .9955 .9944 .9930 .9913 .9894 4 .9958 .9939 .9913 .9881 .9841 .9793 .9734 .9666 .9587 .9496
7 .9999 .9998 .9998 .9997 .9996 .9994 .9993 .9990 .9988 .9984
8 LOOOO LOOOO LOOOO L])(]()(] LOOOO LOOOO .9999 .9999 .9999 .9999 5 .9995 .9992 .9988 .9982 .9973 .9963 .9949 .9932 .9910 .9883
9 LOOOO LOOOO L])(]()(] LOOOO LOOOO LOOOO LOOOO LOOOO !.0000 LOOOO 6 LOOOO .9999 .9999 .9998 .9997 .9995 .9993 .9990 .9986 .9980
7 ].(]()(]() 1.0000 1.0000 LOOOO ].(]()(]() 1.0000 .9999 .9999 .9998 .9998

~
8 LOOOO 1.0000 LOOOO. LOOOO ].(]()(]() LOOOO ].])(]()(] LOOOO LOOOO LOOOO
.31 .32 .33 .34 .35 .36 .37 .38 .39 .40

o
1
.0245
.1344
.0211
.1206
.0182
1080
.0157
.0965
.0135
.0860
.0115
.0764
.0098
.0677
.0084
.0598
.0071
.0527
.0060
.0464
~ .21 .22 .23 .24 .25 .26 .27 .28 .29 JO

2 J566 .3313 .3070 .2838 .2616 .2405 .2206 .2017 .1840 .1673 o .0748 .0650 .0564 .0489 .0422 .0364 .0314 .0270 .0231 .0198
3 .b228 5956 .5684 .5411 .5138 .4868 .4600 .4336 .4077 .3823 1 .2935 .2667 .2418 .2186 .1971 .1773 .!590 .1423 .1270 .J 130
4 .8321 .8133 .7936 .7730 .7515 .7292 .7061 .6823 .6580 .6331 2 .5842 .5512 .5186 .4866 .4552 .4247 .3951 .3665 .3390 .3127
3 .8160 .7919 .7667 .7404 .7133 .6854 .6570 .6281 .5989 .5696
5 .9449 .9363 .9268 .9164 .9051 .8928 .8795 .8652 .8500 .8338 4 .9393 .9277 .9149 .9008 .8854 .8687 .8507 .8315 .8112 .7897
6 .9871 .9845 .9815 .9780 .9740 .9695 .9644 .9587 .9523 .9452
7 .9980 .9975 .9968 .9961 .9952 .9941 .9929 .9914 .9897 .9877 5 .9852 .9814 .9769 .9717 .9657 .9588 .9510 .9423 .9326 .9218
8 .9998 .9997 .9997 .9996 .9995 .9993 .9991 .9989 .9986 .9983 6 .9973 .9965 .9954 .9941 .9924 .9905 .9881 .9854 .9821 .9784
9 1.0,)()Q LOOOO LOOOO LOOOO LOOOO LOOOO LOOOO .9999 .9999 .9999 7 .9997 .9995 .9993 .9991 .9988 .9984 .9979 .9973 .9966 .9957
8 ].(]()(]() LOOOO .9999 .9999 .9999 9998 .9998 .9997 .9996 .9994
10 LOOOO LOOOO LOOOO LOOOO LOOOO LOOOO LOOOO LOOOO LOOOO LOOOO 9 LOOOO 1.0000 1.0000 LOOOO LOOOO LOOOO 1.0000 LOOOO LOOOO LOOOO

792 I 793
794 Apé11dice JI Tablas estad{sticas
195
Tabla A (co11ti1111ac ió11) Tabla A (co11ti1111ació11)

n::::: 11 (continuación) n = 12 (continuación)

~ .JI .32 .33 .34 .35


.
.36 37 .38 .39 .40
>( .!! .12 .!l .!4 .! ; .!6 .!7 .!8 .!9 .20

o .0169 .0144 .0!22 0104 .0088 .0074 .0062 .0052 0044 .0036 o .2470 .2[57 .1880 .1637 .1422 .1234 .1069 .0924
¡ .1003 .0888 .0784 .0690 .0606 .0530 .0463 040] .0350 .0302 ¡ .6133 .0798 .0687
.5686 .5252 .4834 .4435 .4055 .3696
.2201 .3359 .J04J .2749
2
]
.2877
.5402
.2639
.5110
.2413
.4821 .4536
.2001
.4256
.1814
.398!
.1640
.3714
.1478
.3455
.1328
.3204
.1189
.2963 'J .8623
.9649
.8333
.9536
.8023
.9403
.7697
.9250
.7358
.9078
.7010
.8886
.6656
.8676
.6298
.8448
.5940
.8205
.5583
.7946
4 7672 .7437 .7193 6941 .6683 .6419 .6150 .5878 .5603 .5328 4 9935 .9905 .9867 .98!9 .9761 .9690 .9607 .951 t .9400 .9274
; .9099 .8969 .8829 .8676 .8513 .8339 .8! 53 .7957 .7751 .7535 5 .9991 .9986 .9978 .9967 .9954 .9935 .9912 .9884 .9849 .9806
6 .9740 .969! .9634 .9570 .9499 .9419 .9330 .9232 .9124 .9006 6 .9999 .9998 .9997 .9996 .9993 .9990 .9985 .9979 .9971 .996!
7 .9946 .9933 .99!8 .9899 .9878 .9852 .9823 .9790 .9751 .9707 7 LOOOO LOOOO LOUOO 1.0000 .9999 .9999 .9998 .9997 .9996 .9994
LOOOO
8
9
.9992
.9999
.9990
.9999
.9987
.9999
.9984
.9998
.9980
.9998
.9974
.9997
.9968
.9996
.996]
.9995
.9952
.9994
.9941
.9993 '9 LOOOO
1.0000
1.0000
LOOOO LOOOO
LOOOO LOOOO
LOOOO
1,0000
LOOOO
1.0000
1.0000
1.0000
LOOOO
LOOOO
LOOOO
LOOOO
.9999
LOOOO

~
LOOOO LOOOO LOOOO LOOOO LOOOO !.0000 1.0000 LOOOO LOOOO !.0000
'º .21 ..21 .23 .14 .25 .26 .27 .28 .29 .30

~ 4¡ .42 .4] .44 .45 .46 .47 .48 .49 .50


o
¡
.0591
.2476
.050i
.1114
.0434
.1991
.0371
.1778
.0317
.1584
.0.270
.1406
.0129
.1245
.0194
.1100
.0164 .()1 38
.0968 0850
o .0030 .0025 0021 .0017 .0014 .0011 .0009 .0008 .0006 .0005 2 .52J2 .4886 .4550 .4222 .J907 .3603 .3JIJ .3037 .2775 .2)28
¡ .026! .0224 .0192 .0164 .0139 .O! 18 .0100 0084 .0070 .0059 ] .7674 .7390 .7096 6795 .6488 .6176 .5863 .5548 .5235 .4925
.0572 .0436 .0378 .0327 4 .9134
'
)
.1062
.2731
.0945
.2510
.OS38
.2300
.0740
.2100
.0652
.1911 .1734
.0501
.1567 .14! 2 .1267 .1133
.8979 .8808 .8623 .8424 .82!0 .7984 .7746 .7496
-
.7237
4 .5052 .4777 .4505 .4236 )971 .3712 .3459 .3213 .2974 .2744 5 .9755 .9696 .96.26 .9547 .9456 .9354 .9140 .91 lJ .8974 .8&.2.2
6 .9948 .993.2 .9911 .9887 .9857 .9822 .9781 .9733 .9678 .9614
5 .73!0 .7076 .68)4 .6586 .6331 .6071 .5807 .5540 .5271 .5000 7 .9992 .9989 .9984 .9979 .9972 .9964 .9953 .9940 .9924 • 9905
6 .8879 .8740 8592 .8432 .8262 .8081 .7890 .7688 .7477 .7256 8 .9999 .9999 .9998 .9997 .9996 .9995 .9993 .9990 .9987 .9983
7
8
.9657
.9928
.9601
.9913
9539
.9896
.9468
.9875
.9390
.9852
.9304
.9825
.9209
.9794
.9105
.9759
.8991
.9718
.8867
.967J ' LOOOO LOOOO LOOOO 1.0000 1.0000 .9999 .9999 .9999 .9998 .9998
.9973 .9941 !O 1.0000
' .9991 .9988 .9986 .9982 .9978 .9967 .9960 .9951 1.0000 1.0000 1.0000 LOOOO 1.0000 LOOOO 1.0000 1.0000 LOOOO

~
!O .9999 .9999 .9999 .9999 .9998 .9998 .9998 .9997 .9996 9995
¡¡ JI ..11 .33 .34 .J5 ..16
! .00()() LOOOO 1.0000 LOOOO 1.0()()() LOOOO LOOOO 1.0000 LOOOO LOOOO .J7 .JS .J9 .40
'
-

s
n = 12 o .O! 16 .0098 .0082 .0068 .!)057 0047 .0039 .OOJ2 .0027 .0021
¡ .0744 .0650 .0565 .049! .0424 .0366 .OJl5 .0270 .0230 .0196
2 .2296 .2078 .1876 .1687 .[513 .1352
JJ2 ()J 04 .05 .06 .07 .08 .()9 .10 ) .4619
.1.205 .1069 .0946 .0834
.4319 .4027 .3742 .3467 .320! .2947 .2704 .2472
O! .2253
4 .6968 .6692 .6410 .6!24 .5833 .5541 .5149 .4957 .4668 .4382
O .8864 78-P .6938 .ól 27 .5404 .4759 .4186 .3677 .3225 .2824
¡ .99.18 .9769 .9514 .9191 .8816 .8405 .7967 .75!3 .7052 .6590 ; .8657 .8479 .8289 8087 .7873 .7648 .741.2 .711':7 .6913 .665.2
.9804 .9684 .9532 9348 .9134 .8891 6 .9542
'
)
.9998
1.0000
.9985
9999
.9952
9997
.9893
.9990 .9978 .9957 .9925 .9880 9820 .9744 7 .9882
9460
.9856
.9368
.9824
.9266
.9787
9154
.9745
.9030
.9696
.8894
.9641
.87..;7
.9)78
8589
.9507
.84 ,'S
.94'.:'7
4 l.0000 1.()()()0 l.0000 .9999 .9998 .9996 .999! .9984 9973 9957
'' .9978
.9997
.997.2
.9996
.9964
.9995
.9955
.9993
.9944
.9992
9930
.9989
.9915
.9986
.9896
.9982
.9873
.9978
9847
9972
5

1.0000
t.0000 ºººº
1!.(XJO()
1.0000
1.0000
LOOOO
1.()()0()
LOOOO LOOOO .9999
l.O(XlO LOOOO LOOOO
.9998
LOOOO
.9997
l.0000
.9995
.9999 !O
¡¡
LOOOO LOOOO LOOOO .9999 9999 .9999 .9999 .9998 .9998 9997
7 1.1)()()() 1.0000 LOOOO 1.0000 LOOOO LOOOO LOOOO LOOOO LOOOO LOOOO LOOOO 1.0000 l.0000 LOOOO 1.0000 1.0000 LOOOO !.0000 1.0()00 1.()()()()
Tabla A (continuación)
796 Apéndice 11

Tabla A (continuación) n= 13(continuación)

p .41 .42 .43


,i =- 12 (continuación)

.44 .45 .46 .47 .48 .49 .50


x
o
.21

.0467
.22

.0396
.23

.0334
.1633
24

.0282
.1441
.25

.0238
.!267
.26

.0200
.1111
.27

.0167
.0971
.28

.0140
.0846
.29

.0117
.0735
JO

.0097
.0637
1 .2080 .1846
X
.3961 .3636 .3326 .3032 .2755 .2495 .2251 .2025
2 4653 .4301 .4206
.6511 .6178 .5843 .5507 .5174 4845 .4522
.7161 .6839
o .0018 .0014 .0012 .0010 .0008 .0006 .0005 .0004 .0003 .0002 3
4 .8827 .8629 .8415 .8184 .7Q40 .768l .7411 .7130 .6840 .6543
1 .0166 J)l 40 .0118 .0099 .0083 .0069 .0057 .0047 .0039 .0032
2 .0733 .0642 .0560 .0487 .0421 .0363 .0312 .0267 .0227 .0193 .9325 .9198 .9056 .8901 .8730 .8545 .8346
5 .9625 .9538 .9438 .9376
3 .2047 .1853 .1671 .1502 .1345 .1199 .1066 .0943 .0832 .0730 .9805 .9757 .9701 .9635 .9560 .9473
6 .9907 .9880 .9846
4 .4101 .3825 .3557 .3296 .3044 .2802 .2570 .2348 .2138 .1938 9957 .9944 .9927 .9907 9882 .9853 .98!8
7 .9983 .9976 .9968
.9993 .9990 .9987 .9982 .9976 .9969 .9960
.6384 .6111 8 .9998 .9996 .9995
5 .5833 .5552 .5269 .4986 .4703 .4423 .4145 .3872 .9999 .9999 .9998 .9997 .9996 .9995 .9993
9 1.0000 1.0000 .9999
6 .8235 .8041 .7836 .7620 .7393 .1157 .6911 .6657 .6396 .6128 J
7 .9338 .9240 .9131 .9012 .8883 .8742 .8589 .8425 .8249 .8062 1.0000 1.0000 1.0000 1.0000 9999 .9999
IO 1.0000 1.0000 1.0000 1.0000
8 .9817 .9782 .9742 .9696 .%44 .9585 .9519 .9445 .9362 .9270 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000
11 1.0000 1.0000 1.0000
' .9965 .9957 .9947 .9935 .9921 .9905 .9886 .9863 .9837 .9807

~ .35 .36 .37 .38 .39 .40


10 .9996 .9995 .9993 .9991 .9989 .9986 .9983 .9979 .9974 .9968 .31 .32 .JJ .34
11 1.0000 1.0000 10000 .9999 .9999 .9999 .9999 .9999 .9998 .9998
12 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 .0037 .0030 .0025 .0020 .0016 .0013
o .0080 .0066 .0055 .0045
.0347 .0296 .0251 .0213 .0179 0151 0126
1 .0550 .0473 .0406 .0579
13 1443 .1280 1132 0997 .0875 .0765 .0667
2 .1815 .\621 .1877 .1686
.3043 .2783 .2536 .2302 .2083

~
3 .3899 .3602 .33!7
.4101 .3812 3530
.01 .02 .03 .04 .05 .06 .07 .08 .o, .10 4 .6240 .5933 .5624 .5314 .5005 .4699 .4397

.7! 59 .6889 .6612 .6327 .6038 .5744


8133 .7907 .7669 .7419
o .8775 .7690 .6730 .5882 .5!33 .4474 .3893 .3383 .2935 .2542 5
.9267 .9146 .9012 .8865 .8705 .8532 .8346 .8147 .7935 .7712
1 .9928 .9730 .9436 .9068 .8646 .8186 .7702 .7206 .6707 .6213 6 .9162 .9149 9023
.9777 .9729 .9674 .9610 .9538 .9456 .9365
2 .9997 .9980 .9938 .9865 .9755 .9608 .9422 .9201 .8946 .8661 7 .9775 .9730 .9679
.9948 .9935 .9918 .9898 .9874 .9846 .9813
3 1.0000 .9999 .9995 .9986 .9969 .9940 .9897 9837 .9758 .9658 8 .9949 .9937 .9922
.9991 .9988 .9985 .9980 .9975 .9968 .9960
4 1.0000 1.0QOO 1.0000 .9999 .9997 .9993 .9987 .9976 .9959 .9935 9
.9997 .9995 .9994 .9992 .9990 .9987
IO .9999 .9999 .9998 .9997
5 1.0000 1.0000 1.0000 1.0000 1.0000 .9999 .9999 .9997 .9995 .9991 1.0000 .9999 .9999 .9ll99 .9999
11 1.0000 1.0000 1.0000 1.0000 1.0000
6 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 .9999 .9999 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000
7 12 1.0000 1.0000 1.0000 1.0000
1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000

~
o
.11

.2198
.ll

.1898
.13

.1636
.14

.14-08
.15

.1209
.16

.1037
.17

.0887
.18

.0758
.19

.0646
.20

.0550
x o
.41

.0010
.42

.0008
.43

.0007
.0072
.44

.0005
0060
.45

.0004
.0049
.46

.0003
.0040
.47

0003
.0033
.48

0002
0026
.49

.0002
0011
.50

.0001
0017
1 1 .0105 .0088 .0135 .0112
.5730 .5262 .4814 .4386 .3983 .3604 .3249 .2920 .2616 .2336 .0370 .0316 .0269 .0.228 .0192 .0162
2 2 .0501 .043! .0461
.8349 .8015 .7663 .7296 .6920 .6537 .6152 .5769 .5389 .5017 .1055 .0929 .0815 .0712 .0619 .0536
3 3 .1508 .1344 .1193 .D34
.9536 .9391 .9224 .9033 .8820 .8586 .8333 .8061 .7774 .7473 .2507 .2.279 .2065 .1863 .1674 1498
4 4 J258 .2997 .2746
.9903 .9861 .9807 .9740 .9658 .9562 .9449 .9319 .9173 .9009
.4559 .4268 .3981 .3701 .3427 .3161 ..2905
.5448 .5151 .4854
5
6
.9985
.9998
.9976
.9997
.9964
.9995
.9947
.9992
.9925
.9987
.9896
.9981
.9861
.9973
.9817
.9962
.9763
.9948
.9700
.9930
'6 .7476
.8886
.7230
.8736
.6975
.8574
.6710
.8400
.6437
.8212
.6158
.8012
.5873
.7800
.5585
.7576
5293
.7341
.5000
7095
7 1.0000 7 .9082 .8955 .8817 .8666
1.0000 .9999 .9999 .9998 .9997 .9996 .9994 .9991 .9988 .9621 .9554 .9480 .9395 .9302 .9!97
8
9
1.0000
1.0000
1.0000
1.0000
1.0000
1.0000
1.0000
1.0000
1.0000
1.0000
1.0000
1.0000
1.0000
1.0000
.9999
1.0000
.9999
1.0000
.9998
1.0000
'9 .9904 .9883 .9859 .9830 .9797 .9758 .9713 .9b62 .9604 9539

.9959 .9949 .9937 .9913 .9907 .9888


IO .9983 .9979 .9973 .9967
.9995 .9993 .9991 .9989 9986 .9983
11 .9998 .9998 .9997 .9996 9999
1.0000 1.0000 1.0000 .9999 9999 .9999
12 1.0000 1.0000 1.0000
13 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 ]_0000
-
!.0000

797
Apéndice JI Tablas estadísticas 799
798
Tabla A (co11ti1111aciú11) Tabla A (continuación)

n = 14 11= 14(continuación)

~
p
.01 .02 .03 .04 .05 .06 .07 .08 .09 .IO .JI .32 .]J J4 .J5 .36 .37 .38 .39 .40
X

o .8687 .7536 .6528 .5647 .4877 .4205 .3620 .JI 12 .2670 .2288 o .0055 .0045 .0037 .0030 .0024 .0019 .0016 .0012 .0010 .0008
1 .9916 .9690 .9355 .894! .8470 .7963 7436 .6900 .6368 .5846 1 .0404 .0343 .0290 .0244 .0205 .Ol 72 .Ol4J .0119 .0098 .0081
2 .9997 .9975 .9923 .9833 .9699 .9522 .9302 9042 .8745 .8416 2 .1423 .1254 .1101 .0963 .0839 .0729 .0630 .0543 .0466 .0398
3 1.0000 .9999 .9994 .998! .9958 .9920 .9864 .9786 .9685 .9559 J 3253 2968 .2699 .2444 .2205 .!982 .1774 .1582 .1405 .1243
4 1.0000 1.0000 1.0000 .9998 .9996 .9990 .9980 .9965 .9941 .9908 4 1 .5514 5187 .4862 .4542 .4227 3920 .3622 .3334 .3057 .2793

5 1.0000 ].0000 1.0000 l.0000 1.0000 .9999 .9998 .9996 .9992 9985 .7546 .7276 .6994 .6703 .6405 .6101 .5792 .5481 .5169 .4859
6 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 ! .()()00 .9999 .9998 6 .8916 .8750 .8569 .8374 .8!64 .7941 .7704 .7455 .7195 .6925
7 1.0000 1.0000 1.0000 l.0000 l.0000 1.0000 1.0000 1.0000 1.0000 1.0000 7 .9619 .9542 .9455 .9357 .9247 .9124 .8988 .8838 .8675 .8499
8 .9895 .9869 .9837 .9800 .9757 .9706 .9647 .9580 .9503 .9417
1

~
9 .9978 .9971 .996J .9952 •. 9940 .9924 .9905 .9883 .9856 .9825
.11 .12 1l .14 .15 16 .17 .18 .19 .20
.
10 .9997 9995 .9994 .9992 .9989 9986 9981 .9976 .9969 .9961
o .1956 .1670 .1423 .\211 .!028 .087! 0736 062! .0523 .0440 11 1.0000 .9999 .9999 .9999 .9999 9998 9997 .9997 .9995 .999-l-
1 .5342 .4859 .4401 .3969 .3567 .3193 .284:S .2531 .2242 .1979 12 1.()()()11 1.0000 J.()(){)() 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 .9999
2 .8061 .7685 .7292 .6889 .6479 .6068 .5659 .5256 4862 448] 1) 1.0000 LOOOJ 1.0000 l.ll00(1 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000
3 .9406 .9226 .9021 .8790 .8535 .8258 .7962 .7649 .7321 .6982
4 .9863 .98QJ .9731 .9641 .9533 .9406 .9259 .9093 .8907 .8702 p
., .41 .42 .4) .44 45 46 .47 .48 .49 .50
.9885 .9843 .9791 .972~ 9651 .9561
'
6
7
.9976
9997
1.0000
.9962
9':l94
99'i9
.9943
9991
.9999
,9918
.9985
.999!i
.9978
.9997
9968
.9995
9954
9992
.9936
.998X
9913
.9983
.9884
.9976
o
1
.0006
.0066
.0005
.0054
.()()()4
.0044
.OOOJ
.0036
.0002
.0029
.0002
.0023
.0001
.0019
.0001
.0015
.0001
.0012
0001
.0009
.0281 .0242 O! 70 .014: .0117 .0097 0()79 .()()65
8
9
I .OOOl.1
1.0000
1.()()()0
1 000]
1.0000
1.00()()
1.0000
1.0000
1.0000
1.0000
.9999
I.0()()1)
.9999
l J)(J(JO
.9998
1.0000
.9997
]_{)()()()
.9996
1.0000 '
)
.lH39
.1095 0961 0839
.0203
.0730 06J! .0545 .0468 .0399 .0339 .0287
4 .2541 .2303 .2078 .1868 .1672 .1490 .1322 .1167 .1026 .0898
,, '
~ .21 .:!2 -' .24 .25 .:!6 .27 .28 .29 )O
5
6
.4550
.6645
.4246
.6.157
.3948
.6063
.J656
.5764
.J373
.5461
3!00
.5 l 57
.2837
.4852
.2585
.4549
.2346
.4:!49
.2 ! 20
.3953
o .0369 .0309 .0258 .0214 .0178 .0148 .0122 .010] .OUl!J (JIJ6H 7 .8308 .8104 .7887 .7656 .74!4 .7160 .6895 .6620 .6337 .6047
1 .1741 1527 .1335 .1163 .1010 .0874 .0754 .0648 0556 0475 8 .9320 92! 1 .9090 .8957 .88! I .8652 .8480 .8293 .8094 .7880
2 .41 J J .3761 .3426 .3109 .281 ! .2533 .2273 .2033 .18! 2 .1608 9 .9788 .9745 .9696 9639 .9574 .9500 .9417 .9323 .9218 .9102
J .6634 .6281 .5924 .5568 .5213 .4864 452! 4187 .386.1 .3552
4 .8477 8235 7977 .7703 .7415 .71 !6 6807 649{) .6168 5842 10 .9951 .9939 .9924 .9907 .9886 .9861 .9832 .9798 9759 .971 J
11 .9992 9990 9987 998.1 .997::S .9973 9966 9958 9947 .9935
7~05 .999:,: .9997 .9991
5
6
7
9457
.9848
.9967
.9338
.9804
9955
.9203
.9752
9940
.9051
.9690
.992!
.88il3
.9617
.989~
8699
9533
.98:68
.8498
9437
.9833
.8282
9327
979:
8051
.9204
.9743
9067
9685
"
1)
14
.9999
1.IXJOO
l _()Q(){}
.9999
1.0000
1.()()()0
.9999
1.0000
1.0000
] ,(){X)()
1.0000
.9997
1.0000
1.000<1
J.000()
1.0000
.9996
1.0000
1.0000
.9994
1.0000
1.0000
.999-'
!.0000
1.0000
.9999
1.0000
8 .9994 .9992 .9989 .9984 .9978 .9971 .9962 .9950 9935 9917
9 .9999 .9999 .9998 .9998 .9997 9995 .9993 .999] 9988 9983 11 = 15

10 1.0000 l.0000 !.OOXJ 1.0000 1.0000 .9999 .9999 9999 9998 999~ I' .07 .o:-:
11 1.0000 1.0001) 1.()(1()0 !.00()0 1.00f)O l.0000 1.00()0 1 ()0()(1 1.0000 1 1)()00
'
1
1
.01
º' .03 .04
º' °' .09 .llJ

(l .86111 .7J86 .6JJJ .5421 .46.1-' .J95.1 J.167 .286.' 24.'0 2059
1 .9904 .9647 .9270 8809 .!1290 77_1!< .7168 6597 60)5 5490
.9970 94~9 .9171 8870 853! .X! 5'1
'
)
.9996
I.0000
!.0(1()0
.9998
!.000(.l
.9906
.999~
999'1
.979 7
.9976
.9',19H
.9638
.9945
9',19-1
.9::N6
99~6
9825
997~
_,
9,~~
9950
9601
991~
9444
987:
4

5 !.0000 1 0000 10000 1.0000 Q99',l 9999 .999' 999; 998~ 997~
6 1.0014.l ! JI()(){) l.0000 1 0000 1.0000 LIXXlO 1.0000 9g99 999~ 999~
7 l.0()()(1 1.0000 1 0000 1.000() !.0000 1 0000 !.0000 ! .0000 !.0000 l.0()00
800 Apéndice 11 Tablas estadísticas 801
Tabla A (co11tinuació11) Tabla A (continuación)

11 =15 (continuación) n = 15 (continuación)

xio
.11

.1741
.ll

.1470
1J

.1238
.14

.1041
.15

.0874
.16

.0731
.17

.0611
.18

.0510
.19

.0424
.20

.0352 o
p
.41
---
.01104
.42

.0003
.43

.0002
.44

.11002
45

11001
.46

.111101
.47

.111101
.48

.0001
.49

.0000
.50

.11000
1 .4969 .4476 .4013 .3583 .3186 .2821 .2489 .2187 .1915 .1671 1 0042 .0034 .0027 .0021 .00!7 .0013 .0010 .01108 .0006 .11005
l .7762 7346 .6916 .6480 .6042 .5608 .5181 .4766 .4365 3980
3 .9258 .9041 8796 8524 .8227
.9383
.7908
.9222
.7571
.9039
.7218
.8833
.6854
.8606
.6482
.8358
'3 0227
.0785
.0189
.0678
.0157
.0583
.0130
.0498
.0107
.0424
11087
.0359
.0071
.0303
.0057
.0254
.11046
0212
.0037
.0176
4 .9813 .9735 .9639 .9522 4 .\948 1739 .1546 .1367 .1204 .1055 .0920 .0799 .0690 .0592

5 .9963 .9943 .9916 .9879 .9832 9773 .9700 .9613 .9510 .9389 5 .3726 .3430 .3144 .2869 2608 .2359 .2125 .1905 .1699 .1509
6 .9994 .9990 .9985 .9976 .9964 .9948 .9926 .9898 .9863 .9819 6 .5786 .5470 .5153 .4836 .4522 .42; 1 .3905 .3606 .3316 .3036
7 .9999 .9999 .9998 .9996 .9994 .9990 .9986 .9979 .9970 .9958 7 .7626 .7370 .7102 .6824 .6535 .6238 .5935 .5626 .5314 .5000
8 1.0000 1.0000 1.0000 1.0000 .9999 .9999 .9998 .9997 .9995 .9992 8 8905 .8746 .8573 .8385 .8182 .7966 .7735 .7490 .7233 .6964
9 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 .9999 .9999 9 .9596 .9521 .9435 .9339 .9231 .9110 .8976 .8829 .8667 .8491

10 1.0000 1.0000 1.0000 1.0000 1.11000 1.0000 1.0000 1.0000 1.0000 1.11000 10 .9884 .9857 .9826 .9789 .9745 9695 9637 .9570 .9494 .9408
11 .9975 .9968 .9960 .9949 .9937 .9921 .9903 .9881 .9855 .9824

~ .21 .22 .23 .24 25 .26 l7 .28 .29 JO 12 .9996 .9995 .9993 .9991 .9989 .9986 .9982 .9977 .9971 .9963
1J 1.0000 1.0000 .9999 .9999 9999 .9998 .9998 .9997 .9996 .9995
14 1.0000 1.11000 1.11000 1.11000 1.0000 1.0000 1.11000 1.0000 1.11000 1.11000
o .029! .0241 .0198 .0163 .0134 .0109 .0089 .0072 .0059 .11047
1 .1453 1259 .1087 .0935 .0802 .0685 0583 0495 0419 .0353 n = 16
.1645 .1447 .1268
'3 .36l 5 .3269 .2945 .2642 .2361 .2101 .1863

4
.6105
.8090
.5726
.7805
5350
.7505
.4978
.7190
.4613
.6865
.4258
.6531
.3914
.6190
.3584
.5846
.3268
.5500
.2969
.5155 >( 01 .02 .03 .04 .05 06 .07 .08 .09 .10

5 .9251 .8728 .8516 .8287 .8042 .7780 .7505 7216


.9095 .892!
.9537 .9434 .9183 .9035 .8870 .8689
o .8515 .7238 .6143 .5204 4401 .3716 .3131 .2634 .2211 .1853
6 9766 .9702 .9626 .9316 1 9891 .960[ .9182 .8673 .8108 .751 l .6902 .6299 .5711 .5147
7 9942 9922 .9896 .9865 .9827 .9781 .9726 .9662 .9587 .9500 9g37 .9758 9571 9327 .9031 .8306 .7892
2 .9995 .9963 .8688
8 9989 9984 .9977 .9969 .9958 .9944 .9927 .9906 .9879 .9848 ) .9779 .9316
1.0000 9998 .9989 .9968 9930 .9868 .9658 .9504
9 .9998 .9997 .9996 .9994 .9992 .9989 .9985 .9979 .9972 .9963 4 .9830
1.0000 1.11000 .9999 .9997 .9)91 .9981 .9962 .9932 9889

10 1.0000 1.0000 .9999 .9999 .9999 .9998 .9998 .9997 .9995 .9993 5 1.0000 1.0000 1.11000 1.11000 .9999 .9998 .9995 .9990 .9981 .9967
11 1.0000 1.0000 1.0000 1.11000 1.11000 1.11000 1.0000 1.0000 .9999 .9999
6 1.11000 1.0000 1.01100 1.11000 1.0000 1.0000 .9999 .9999 .9997 .9995
12 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 I.OCX){) 1.0000 1.11000 7 1.01100 111000 1.0000 1.0000 .9999
1.11000 1.11000 1.11000 1.0000 1.11000
8 1.0000 1.11000 1.0000 1.11000 1.0000 1.0000 1.11000 1.0000 1.110110 1.11000

~ .3 ¡ J2 .33 .34 .35 36 .37 .38 .39 .40

o
1
.0038
.0296
.0031
.0248
.0025
.0206
.0020
.0171
.00!6
.0142
.0012
0117
.0010
.11096
.0008
.0078
.0006
.0064
.0005
.0052
~ 11 12 .13 .14 15
" 17 .18 .19 .20

o .1550 .1293 !077 .0895 .0743 0614 .0507 .04111 .0343 .0281
'
3
4
1107
.2686
.4813
.0962
.2420
.4477
.0833
.217!
.4!48
.07!9
.1940
3k29
.0617
1727
.3519
.0528
.!531
.3222
0450
.1351
2938
0382
.1187
.2668
.0322
.1039
.2413
0271
.0905
.2173
1
1
.4614
7455
4! 15
.7001
.3653
.6539
.3227
.6074
2839
.56!4
2487
.5162
.2170
.4723
1885
.4302
.1632
.3899
.1407
.3518
] .9093 .8838 .8552 .11237 .7899 .7540 .7!64 .6777 .6381 .5981
4 .9752 9652 .9529 .9382 .9209 .9012 _8789 .8542 8273 .7982
5 .6916 .6607 .6291 .5968 .5643 .5316 .4989 .4665 .4346 .4032

'7 .8491
.9401
.8278
.9289
.8049
.9163
.7806
9023
.7548
.8868
.7278
.8698
.6997
.8513
.6705
.8313
.6405
.8098
.6098
.7869
5
6
9947
.999!
9918
.9985
.9880
.9976
9829
9962
.9765
.9944
9685
9920
.9588
.9g88
.9473
9847
.9338
.9796
.9183
.9733
8 .9810 .9764 .9711 .9649 .9578 .9496 .9403 .9298 .9180 .9050 7 .9999 .999!! .9996 9993 9989 9984 .9976 .9964 .9949 .9930
9 .9952 .9938 .9921 .990! .9876 .9846 .9810 .9i68 .9719 .9662
, , 1.ºººº 1.0000 .9999 .9999 .9998 9997 .9996 .9993 .9990 .9985
9 1 1.()0()() l.0000 1.0000 1.0000 1.0000 J_{K)()() .9999 9999 .9998 .9998
10 9991 9988 .9984 .9978 .9972 .9963 9953 .9941 9925 .9907
11
12
.9999
1 0000
9998
1.0000
9997
1.0000
.9996
1.0000
.9995
9999
.9994
.9999
.9991
.9999
.9989
.9998
.9985
.9998
_99g¡
9997
l fJ l 1 ()()()() 1.0000 ! .0000 l .(KIOO I.OflOO !.0000 l.{1000 !.0000 !.0000 LOOOú
13 j !.OOXl 1.0000 !.0000 l.0000 J.txlOO 1.0000 1.0000 l.0000 1.0000 1.0000
802 Apéndice 11 Tablas estadísticas
803
Tabla A (conri11uació11) Tabla A (continuación)

n= l6(continuación) n = 16 (continuación)

~ .21 .22 .23 .24 .25 .26 .27 .28 .29 .JO r 41 .42 .43
x' .44 .45 .46 .47 .48 .49 .50
-
o .0230 .0188 .0153 .0124 .0100 .0081 .00ó5 .0052 .0042 .0033 o .0002 0002 .0001 .0001 .0001 .0001
1 .1209 .1035 .0883 .0750 .0635 .0535 .0450 .0377 .0314 .0261 1 .0026 .0021 .0016
-0000 .OOlO .0000 .0000
.0013 .0010 .0008 .O()()ó
2 .3161 .2827 .2517 .2232 .l971 .1733 .1518 .1323 .1149 .0994 2 .0151 .0124 .0005 .0003 .000]
.0101 .0082 .0066 .0053
.4417 .3041 .2459 J .0556 -0042 .0034 .0027 .0021
3 .5582 .5186 .4797 .4050 .3697 .3360 .2740 .0473 .0400 .0336 0281 .0234 .0194
.7348 .7009 .5575 .5212 4 1471 .0160 0131 0106
4 . 7673 .6659 .6302 .5940 .4853 .4499 .1293 .[ 131 .0985 .0853 .0735 .06)0 .0537 .0456 0384
5 .9008 .8812 .8595 .8359 .8103 .7831 .7542 .7239 .6923 .6598 5 .2997 .2720 .2457 .2208 .1976 .! 759
6 .1559 .1374 .1205 .1051
6 .9658 .9568 .9464 .9342 .9204 .9049 .8875 .8683 .8474 .8247 .4942 .461 J .4289 .3971 .3660 .3359
J .3068 .2790 .2524 .2272
7 .9905 .9873 .9834 .9786 .9729 .9660 .9580 .9486 .9379 .9256 .6!172 .6572 .6264 5949 .5629 .5306 .4981 .4657 .4)35
8 .9979 .9970 .9959 .9944 .9925 .9902 .9873 .9837 .9794 .9743 8 .8381 .8168 .7940 .7698 .4018
.7441 .7171 .6889 .6596
9 .9996 .9994 .9992 .9988 .9984 .9977 .9969 .9959 .9945 .9929 9 .9J1J .9195 .9064 .6293 .5982
.8919 .$759 .8584 .8393 .8186 .7964 .7728
JO .9999 .9999 .9999 .9998 .9997 .9996 .9994 .9992 .9989 .9984 JO .9766 .9716 .9658 .9591 .9514 .9426 .9326 .9214 .9089
11 1.00)0 1.0000 1.0000 1.0000 1.0000 .9999 .9999 .9999 .9998 .9997 11 .9938 .9922 .9902 .9879 .8949
.985! .9817 .9778 .9732 .9678
12 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.00lO 1.00lO I' .9988 .9984 .9979 .9616
.9973 .9965 .9956 .9945 .9931
13 .9998 .9998 .99[4 .9894
.9997 .9996 .9994 .9993 .9990 .9987 .9984 .9979

'><
14 1.000() 1.0000 1.0000 1.0000 .9999
.31 .32 .33 .34 .35 .36 .37 .38 .39 .40 .9999 .9999 .9999 .9998 .9997
15 1.0000 10000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000
o .0026 .0021 .()()16 .0013 .OCHO .0008 .0006 .0005 .0004 .0003 1.0000
1 .0216 .0178 .0146 .0120 .0098 .0079 .0064 .0052 .0041 .0033 11 - 17
2 .0856 .0734 .0626 .0533 .0451 .0380 .0319 .0266 .0222 .018.l

5
6
3
4
.2196
.4154

.6264
.8003
.1953
.3819

.592ó
.774]
.1730
.3496

.5584
.7469
.1525
.3!87

.5241
.7181
.1339
.2892

.4900
.6881
.1170
.2613

.4562
.6572
.1018
.2351

.42JO
.6254
.0881
.2105

.3906
.5930
.0759
.1877

.3592
.5602
.0651
.1666

.3288
.5272
>< (J
1
OJ

8429
9877
.02

7093
.9554
.03

.5958
.9091
04

.4996
05

.4181
.06

.J49J
.07

.2912
.08

.2423
.09

.2012
.10

.1661\
8535 .7922 .7283 .6638 .6005 .5396 .4818
7
8
.9119
.9683
.8965
.9612
.8795
.9530
.8609
.9436
.8406
.9329
.8187
.9209
.7952
.9074
.7702
.8924
.7438
.8758
.716!
.8577 '
3
4
.9994
1.0000
1.0000
.9956
.9997
.9866
.9986
.9714
9960
.9497
.9912
.92!8
.9836
.8882
.9727
.8497
.9581
.8073
.9397
.7618
.9174
9 .9908 .9883 .9852 .9815 .9771 .9720 .9659 .9589 .9509 .94!7 1.0000 .9999 .9996 .9988 .9974 9949 .9911 .9855 .9779
10 .9979 .9972 .9963 .9952 .9938 .9921 .9900 .9875 .9845 .9809 5 1.0000 1.0000 J.OOlO 1.0000 .9999 .9997 .9993 .9985 .9973 .9953
11 .9996 .9995 .9993 .9990 .9987 .9983 .9977 .9970 .9962 .9951 6 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 .9999 .9998 .9996 .9992
12 1.0000 .9999 .9999 .9999 .9998 .9997 .9996 .9995 .9993 .9991 J 1.0000 1.0000 I.OOlO I.OOlO 1.00)0 1.00)0 1.0000 1.0000 1.0000 .9999
13 1.00)0 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 .9999 .9999 .9999 8 1.0000 1.0000 10000 1.0000 1.00)0 1.00()() 1.0000 1.0000 I.OOlO 10000
14 1.00)0 1.0000 1.0000 1.0000 1.0000 10000 1.0000 1.0000 1.0000 !.0000

~ .11 .12 13 .14 .15 16 .17 .18 .19 20

o .1379 .1138 .0937 .0770 .0631 .0516 .0421 .0343 .0278 .0225
1 .4277 .J777 .3318 2901 .2525 .2187 .1887 .162L .l 387 .1 !82
' )
.7!42
.891]
6655
.8617
.6164
8290
5676
.7935
.5198
7556
.4734
. 7159
.4289
.6749
.3867
.6J31
.3468
.5909
3096
.5489
4 9679 9554 .9402 .9222 9013 .8776 .85 IJ .8225 .791 J .7582
5 .9925 .9886 9834 .9766 .9681 .9577 .9452 .9305
6 .9! 36 8943
.9986 .9977 .9963 9944 .9917 .9882 .9837 9780 .9709 .96.?J
's .9998
I OO(XJ
9996
9999
9993
9999
9989
9998
.9983
9997
.9973
.9995
.9961
.9992
.9943
99gg
.9920 .9891
9 I.OOJO 9982 9974
1.0000 10000 1.0000 1 0000 9999 9999 9998 9997 .9995
líl 1 [)(>)() l.0000 1.0000 l.0000 1 0000 1.0000 l.0000 1.0000 1.0000 .9999
11 1 (~)()() l(mJ I JJ()í)(J 1.oono r.()(}()() 1.000) 1.0000 10000 10000 1.0000
/

Tabla A (continuación)
Apéndice 11
804
n = 17 (cont1nuación}
Tabla A (conrinuación)
p .50
.41 .42 .43 .44 .45 .46 .47 .48 .49
X
11 = 17 (continuación)
o .0001 .0001 .0001 .0001 .0000 .0000 .0000 .0000 .0000 .0000
.0008 .0006 .0004 .0003 .0002 .0002 .0001

~
JO 1 .0016 .0013 .0010
.22 .23 .24 .25 .26 .27 .28 .29 .0025 .0020 .0012
.21 2 .0100 .0080 .0065 .0052 .0041 .0032 .0015
3 .0390 .0326 .0271 .0224 .0184 .0151 .0123 .0099 .0080 .0064
.0094 .0075 .0060 .0047 .0038 .0030 .0023 4 .1096 .0949 .0817 .0699 .0596 .0505 .0425 .0356 .0296 .0245
o .0182 .0146 .0118
.0600 .0501 .0417 .0346 .0286 .0235 .0193
1 .1004 .0849 .0715
.1877 .1637 .1422 .1229 .1058 .0907 .0774 5 .2372 .2121 .1887 .1670 .1471 .1288 .J 122 .0972 .0838 .0717
2 .2751 .2433 .2141
.3186 .2863 .2560 .2279 .2019 6 .4144 .3818 .3501 .3195 .2902 .2623 .2359 .2110 .1878 .1662
3 .5073 .4667 .4272 .3893 .3530
.5739 .5357 .4977 .4604 .4240 .3887 7 .6080 .5750 .5415 .5079 .4743 .4410 .4082 .3761 .3448 .3145
4 .7234 .6872 .6500 .6121
8 .7762 .7498 .7220 .6928 .6626 .6313 .5992 .5665 .5333 .5000
.8230 .7951 .7653 .7339 .7011 .6671 .6323 .5968 9 .8930 .8764 .8581 .8382 .8166 .7934 .7686 .7423 .7145 .6855
5 .8727 .8490
.9402 .9264 .9106 .8929 .8732 .8515 .8279 .8024 .7752
6 .9521 .8954 .8538 .8338
.9749 .9680 .9598 .9501 .9389 .9261 .9116 10 .9580 .9497 .9403 .9295 .9174 .9038 .8888 .8721
1 .9853 .9806 .9283
.9906 .9876 .9839 .9794 .9739 .9674 .9597 11 .9867 .9835 .9797 .9752 .9699 .9637 .9566 .9483 .9389
8 .9963 .9949 .9930
.9984 .9978 .9969 .9958 .9943 .9925 .9902 .9873 12 .9967 .9958 .9946 .9931 .9914 .9892 .9866 .9835 .9798 .9755
9 .9993 .9989 .9936
13 .9994 .9992 .9989 .9986 .9981 .9976 .9969 .9960 .9950
.9994 .9991 .9987 .9982 .9976 .9968 14 .9999 .9999 .9998 .9998 .9997 .9996 .9995 .9993 .9991 .9988
10 .9999 .9998 .9997 .9996
.9999 .9999 .9998 .9998 .9997 .9995 .9993
11 1.0000 1.0000 1.0000
1.0000 1.0000 1.0000 1.0000 .9999 .9999 15 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 .9999 .9999 .9999 .9999
12 1.0000 1.0000 1.0000 1.0000
1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 16 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000
13 1.0000 1.0000 1.0000 1.0000

n = 18
">( .31 .32 .33 .34 .35 .36 .37 .38 .39 .40

~ .01 .02 .03 .04 .05 .06 .07 .08 .09 .10
.0004 .0003 .0002 .0002
o .0018 .0014 .0011 .0009 .0007 .0005
.0054 .0043 .0034 .0027 .0011
1 0157 .0128 .0104 .0083 .0067
.0392 .0327 .0272 .0225 .0185 .0151 .0123 o .8345 .6951 .5780 .4796 .3972 .3283 .2708 .2229 .1831 .1501
2 .0657 .0556 .0468
.1188 .1028 .0885 .0759 .0648 .0550 .0464 .9862 .9505 .8997 .8393 .7735 .7055 .6378 .5719 .5091 .4503
3 .J 781 1563 .1366 1
.2348 .2094 .1858 .1640 .1441 .1260 .9993 .9948 .9843 .9667 .9419 .9102 .8725 .8298 .7832 .7338
4 3547 .3222 .2913 .2622 2
1.0000 .9996 .9982 .9950 .9891 .9799 .96(,7 .9494 .9277 .9018
3
.4542 .4197 .3861 .3535 .3222 .2923 .2639 1.0000 .9998 .9994 .9985 .9966 .9933 .9884 .9814 .9718
5 .5610 .5251 .4895 4 1.0000
.6521 .6188 .5848 .5505 .5161 .4818 .4478
6 .7464 .7162 6847
.7872' .7605 .7324 .7029 6722 .6405 1.0000 .9999 .9998 .9995 .9990 .9979 .9962 .9936
7 .8773 .8574 .8358 .8123 5 1.0000 1.0000
.9006 .8841 .8659 .8459 .8243 .8011 1.0000 1.0000 1.0000 1.0000 1.0000 .9999 .9997 .9994 .9988
8 .9508 9405 .9288 .9155 6 1.0000
.9686 .9617 .9536 .9443 .9336 .9216 .908! 7 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 .9999 . .9998
9 .9838 .9796 .9746
8 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000
.9926 .9905 .9880 .9849 .9811 .9766 .9714 .9652
10 .9957 .9943

~
.9977 .9970 .9960 .9949 .9934 9916 .9894
11 .9991 .9987 .9983 .12 .13 .14 .15 .16 .17 .18 .19 .20
.9994 .9992 .9989 .9985 .9981 9975 .11
12 .9998 .9998 .9997 .9996
l] 1.0000 .9999 .9999 .9999 .9998 .9998 .9997 .9995
1.0000 1.0000
1.0000 1.0000 1.0000 1.0000 1.0000 .9999 o .1227 .1002 .0815 .0662 .0536 .0434 .0349 .0281 .0225 .0180
14 1.0000 1.0000 1.0000 1.0000
1 .3958 .3460 .3008 .2602 .2241 .1920 .1638 .1391 .1176 .0991
15 \ 1.0000 J.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 l.0000 .6827 .63!0 .5794 .5287 .4797 .4327 .3881 .3462 .3073 .2713
2
3 .8718 .8382 .8014 .7618 .7202 .6771 .6331 .5888 .5446 .5010
4 .9595 .9442 .9257 .9041 .8794 .8518 .8213 .7884 .7533 .7164

.9778 .9690 .9581 .9449 .9292 .9111 .8903 .8671


5 .9898 .9846
.9979 .9966 .9946 .9919 .9882 .9833 .9771 .9694 .9600 .9487
6
7 .9997 .9994 .9989 .9983 .9973 .9959 .9940 .9914 .98i0 .9837
1.0000 .9999 .9998 .9997 .9995 .9992 .9987 .9980 .9971 .9957
8
1.0000 1.0010 1.0000 1.0010 .9999 .9999 .9998 .9996 .9994 .9991
9

1.0000 1.0000 1.0000 1.000<] 1.0000 1.0000 1.0000 .9999 9999 .9998
10
11 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000

805
¡

Tabla A (continuación)

Apéndice JI
806 n = 18 (continuación)
Tabla A (continuación) p
.41 .42 .4J .44 .45 .46 .47 .48 .49 .50
'
n = 18 (continuación) o .0001 .0001 .0000 .0000 .0000 .0000 .0000 .0000 .0000 .0000
1 .0010 .0008 .0006 .0004 .OOOJ .0002 .0002 .0001 .0001 .0001

~
2 .0066 .0052 .0041 .0032 .0025 .0019 .0015 .0011 .0009 .0007
.21 .22 .23 .24 .25 .26 .27 .28 .29 .JO .0077 .0048 .0038
J .027! .0223 .0182 .0148 .0120 .0096 .0061
4 .0807 .0687 .0582 .0490 .041 l .0342 .0283 .0233 .0190 .0154
o .0144 .0114 .0091 .0072 .0056 .0044 .0035 .0027 .0021 .0016
1 .0831 .0694 .0577 .0478 .0395 .0324 .0265 .0216 .0176 .0142 5 .1849 .1628 .1427 .1143 .1077 .0928 .0795 .0676 .0572 0481
2 .2384 .2084 .181) .1570 .] 353 .1161 .0991 .0842 .07[2 .0600 6 .3418 .3105 .2807 .2524 .2258 .2009 .l 778 .1564 .1368 .1189
3 .4586 .4175 .378~ .3409 .3057 .2728 .2422 .2[40 .1881 .1646 7 .5287 .4938 .4592 .4250 .3915 .3588 .3272 .2968 .2678 2403
4 .6780 .6387 .5988 .5586 .5187 .4792 .4406 .4032 .367[ .3327 8 .7072 .6764 .6444 .6115 .5778 .5438 .5094 .4751 .4409 .4073
9 .845! .8232 .7996 .7742 .7473 .7188 .6890 .6579 .6258 .5927
5 .84!4 .8134 .7832 .7512 .7174 .6824 .6462 .609J .5719 .5344
6 .9355 .9201 .9026 .8829 .8610 .8370 .8109 .7829 .753! .7217 10 .93[4 .9189 .9049 .8893 .8720 .8530 .8323 .8098 .7856 .7597
7 .9783 .9717 .9637 .9542 .943[ .9301 .9153 .8986 .8800 .8593 11 .9750 .9693 .9628 .9551 .9463 .9362 .9247 .9117 .8972 .8811
8 .9940 .9917 .9888 .9852 .9807 .9751 .9684 .9605 .9512 .9404 12 .9926 .9906 .9882 .9853 .98! 7 .9775 .9125 .9666 .9598 .9519
9 .9986 .9980 .9972 .9961 .9946 .9927 .9903 .9873 .9836 .9790 1] .9983 .9978 .9971 .9962 • .9951 .9937 .992[ .9900 .9875 .9846
14 .9997 .9996 .9994 .9993 .9990 .9987 .9983 .9977 .9971 .9962
10 .9997 .9996 .9994 .999[ .9988 .9982 .9975 .9966 .9954 .9939
11 I.0000 .9999 .9999 .9998 .9998 .9997 .9995 .9993 .9990 .9986 15 1.0000 .9999 .9999 .9999 .9999 .9998 .9997 .9996 .9995 .9993
12 1.0000 1.0000 1.0000 1.0000 1.0000 .9999 .9999 .9999 .9998 .9997 16 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 I.0000 .9999 9999
13 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 17 1.0000 I.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000

~ .35 .40 n = 19
.JI .32 .33 .34 .36 .37 .38 .39

o
1
.0013
.0114
.0010
.0092
.0007
.0073
.0006
.0058
.0004
.0046
.OOOJ
.0036
.0002
.0028
.0002
.0022
.0001
.00!7
.0001
JJOIJ ~ .01 .02 .OJ .04 .05 .06 .07 .08 .09 10

2 .0502 .0419 .0348 .0287 .0236 .0193 .0157 .0127 .0103 .0082 o .8262 .6812 .5606 .4604 3774 .3086 .2519 .205! .1666 .1351
] .1432 .1241 .1069 .0917 .0783 .0665 .0561 .0472 .0394 .0328 1 .9847 .9454 8900 .8249 .7547 .6829 .6121 .5440 .4798 .4203
4 .2999 .2691 .2402 .2134 .1886 .1659 .1451 .1263 .1003 .0942 2 .9991 .9939 .9817 .9616 .9335 .8979 .8561 .8092 .7585 .7054
J 1.0000 .9995 .9978 .9939 .9868 .9757 .9602 .9398 .9147 .8850
5 .4971 .4602 .4241 .3889 .3550 .3224 .2914 .2621 .2345 .2088 4 1.0000 1.0000 .9998 .9993 .9980 .9956 .9915 .9853 .9765 .9648
6 .6889 .6550 .6202 .5849 .5491 .5133 .4776 .4424 .4079 .3743
7 .8367 .8122 .7859 .7579 .7283 .6973 .6651 .6319 .5979 .5634 5 1.0000 I.0000 1.0000 .9999 .9998 .9994 .9986 .9971 .9949 .99!4
8 .9280 .9139 .898[ .8804 .8609 .8396 .8165 .7916 .7650 .7368 6 1.0000 1.0000 1.0000 1.0000 1.0000 .9999 .9998 .9996 .9991 .9983
9 .9736 .9671 .9595 .9506 .9403 .9286 .9153 .9001 .8837 .8653 7 1.0000 1.0000 1.0000 1.0000, 1.0000 1.0000 I.0000 .9999 .9999 .9997
8 1.0000 I.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000
10 .9920 .9896 .9867 .983[ .9788 .9736 .9675 .9603 .9520 .9424

~
11 .9980 .9973 .9964 .9953 .9938 .9920 .9898 .9870 .9837 .9797
.11 .12 .13 .14 15 .16 .17 .18 .19 .20
12 .9996 .9995 .9992 .9989 .9986 .9981 .9974 .9966 .9956 .9942
IJ .9999 .9999 .9999 .9998 .9997 .9996 .9995 .9993 .9990 .9987
14 1.0000 1.0000 1.0000 1.0000 1.0000 .9999 .9999 .9999 .9998 .9998 o .1092 .0881 .0709 .0569 .0456 .0364 .0290 .0230 .0182 .0144
.0829
1 .3658 .3165 .2723 .2331 .1985 .1682 .1419 .119! .0996
15 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 2 .6512 .5968 .5432 .4911 .4413 .3941 .3500 .3090 .2713 .2369
J .85!0 .8133 .7725 .7292 .6841 .6380 .5915 .5451 .4995 .4551
4 .9498 .9315 9096 .8842 .8556 .8238 .7893 .7524 .7136 .6733

5 .9865 .9798 .9710 .9599 .9463 .9300 .9109 .889-0 .8643 .8369
6 9970 .9952 .9924 .9887 .9837 .9772 .9690 .9589 .9468 .9324
7 .9995 .9991 .9984 .9974 .9959 .9939 .9911 .9874 .9827 .9767
8 .9999 .9998 .9997' .9995 .9992 .9986 .9979 .9968 .9953 .9933
9 1.0000 1.0000 1.0000 .9999 .9999 .9998 .9996 .9993 .9990 .9984

10 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 .9999 .9999 .9998 .9997
11 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000

807
808 Apéndice// Tablas estadísticas 809
Tabla A (continuación) Tabla A (continuación)

11 = 19 (continuación) 11 = 19 (continuación)

x o
.21

.0113
.22

.0089
.23

.0070
.24

.0054
25

.0042
.26

.0033
.27

.0025
.28

.0019
.29

.0015
.JO

.0011
~
O
.41
.0000
.42

.0000
.43

.0000
.44

.0000
.45

.0000
.46

.0000
.47

.0000
.48

.0000
.49

.0000
.50

.0000
1 .0687 .0566 .0465 .0381 .0310 .025! .0203 .0163 .0131 .0104 1 .0006 .0005 .0004 .0003 .0002 .0001 .0001 .0001 .0001 0000
2 .2058 .1778 .1529 .1308 .1113 .0943 .0795 .0667 .0557 .0462 2 .0043 .0033 .0026 .0020 JJ015 .0012 .0009 .0007 .0005 .0004
J .4123 .3715 .3329 .2968 .2631 .2320 .2035 .1776 .1542 .1332 3 .0187 .0151 .0122 .0097 0077 .0061 .0048 .0037 .0029 .0022
4 .6319 .5900 .5480 .5064 .4654 .4256 .3871 .3502 .3152 .2822 4 0587 .0492 .04!0 .0340 .0280 .0229 .0186 .0150 .0121 .0096

5 .8071 .7749 .7408 .7050 .6677 .6295 .5907 .5516 .5125 .4739 5 .[421 .1233 .1063 .0912 .0777 .0658 .0554 .0463 .0385 .0318
6 .9157 .8966 .8751 .8513 .8251 .7968 .7664 .7343 .7005 .6655 6 .2774 .2485 .2213 .1961 .! 727 .1512 1316 .1138 .0978 .0835
7 .9693 .9604 .9497 .9371 .9225 .9059 .8871 .8662 .8432 .8180 7 .4520 .4168 .3824 J491 .3169 .2862 .2570 .2294 .2036 .l 796
.6340 .5997 .5647 .5294 .4940 .4587 .4238 .3895 .3561 .3238
'
9
.9907
.9977
.9873
.9966
.9831
.9953
.9778
.9934
.9713
.9911
.9634
.9881
.9541
.9844
.9432
.9798
.9306
.9742
.9161
.9674
8
9 .7886 .7615 .7328 .7026 .6710 .6383 .6046 .5701 .5J52 5000

10 .9995 .9993 .9989 .9984 .9977 .9968 .9956 .9940 .9920 .9895 JO .8960 8787 .8596 .8387 .8159 7913 .7649 .7369 7073 .6762
11 .9999 .9999 .9998 .9997 .9995 .9993 .9990 .9985 .9980 .9972 11 .9571 .9482 .9379 .9262 .9129 .8979 .8l:ilJ .8628 .8425 8204
12 1.0000 1.0000 1.0000 .9999 .9999 .9999 .9998 .9997 .9996 .9994 12 .9854 .9817 .9773 9720 .9658 .9585 .9500 .9403 .9291 .9165
13 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 .9999 .9999 1) .9960 .9948 .9933 .9914 .9891 .9863 .9829 .9788 .9739 9682
.9988 .9984 .9979 .9972 .9964 .9954 .9940 .9924 .9904
14 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000
" 1 9991
15 .9999 .9998 .9997 9996 .9995 .9993 .9990 .9987 .9983 .9978

"><
o
JI

.0009
.32

.0007
.JJ

.0005
.34

.0004
.35

.0003
.36

.0002
.37

.0002
.38

.0001
39

.0001
.40

.0001
16
17 j
1.0000
1.0000
1.0000
1.0000
1.0000
1.0000
9999
10000
_9,;;g
1.0000
.9999
1.0000
.9999
1.0000
.9998
1.0000
.9997
1.0000
.9996
1.0000

1 .0083 .0065 .0051 .0040 .0031 .0024 .0019 .0014 .0011 .0008 11"' 20
2 .0382 .0314 .0257 .0209 .0170 .0137 .0110 .0087 .0069 .0055
3 .!144 .0978 .0831 .0703 .0591 .0495 .0412 .0341 .0281 .0230 p
.01 02 .03 .04 .05 .06 .07 .08 .09 .JO
4 .2514 .2227 .1963 .1720 .1500 .1301 .1122 .0962 .0821 .0696 X

5 .4359 .3990 .3634 .3293 .2968 .2661 .2373 .2105 .1857 .1629 o .8179 .6676 .5438 .4420 .3585 .2901 .2342 .1887 .1516 .1216
6 .6294 .5927 .5555 .5182 .4811 .4446 .4087 .3739 .3403 .3081 1 .9831 .9401 .8802 .8!03 .7358 .6605 .5869 .5169 .4516 JYJ7
.9990 .9929 .9790 .9561 9245 .7879 .6769
7 .7909 .7619 .7312 .6990 .6656 .6310 .5957 .5599 .5238 .4878
'
3 1.0000 .999-l .9973 .9926 .9841
.8850
.9710
.8390
9529 .9294
.7334
.9007 .8670
9' .8997
.9595
.8814
.9501
.8611
.9392
.8388
.9267
.8145
.9125
.7884
.8965
.7605
.8787
.7309
.8590
.6998
.8374
.6675
.8139 4 1.0000 1.0000 .9997 9990 .9974 .9944 .9893 .9817 .9710 .9568

10 .9863 .9824 .9777 .9720 .9653 .9574 .9482 .9375 9253 .9115 5 1.0000 1.0000 1.0000 9999 .9997 9991 .998! .9962 .9932 .9887
11 .9962 .9949 .9932 .9911 .9886 .9854 .9815 .9769 .9713 .9648 6 1.0000 1.0000 1.0000 1.0000 1.0000 .9999 .9997 .9994 .9987 .9976
12 .9991 .9988 .9983 .9977 .9969 .9959 .9946 .9930 .9909 .9884 7 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 .9999 .9998 9996
13 .9998 .9998 .9997 .9995 .9993 .9991 .9987 .9983 .9977 .9969 8 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 .9999
14 1.0000 1.0000 .9999 .9999 .9999 .9998 .9998 .9997 .9995 .9994 9 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000

15 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 .9999 9999
16 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000
Apé11dice 11 Tablas estadísticas 811
810
Tabla A (contin11ación) Tabla A (contin11ació11)

n = 20 (continuación) n = 20 (continuación)

x o
.11

.0912
.12

.0776
.13

.0617
.14

.0490
.15

.0388
.16

.0306
.17

.0241
.18

.0189
.19

.0148
.0841
.20

.0115
.0692
~
o
.JI

.0006
.31

.0004
.33

.0003
.34

.0002
.35

.0002
.36

.0001
.37

.0001
.38

.0001
.39

.0001
.40

.0000
1 .3376 .2891 .2461 .2084 .1756 .1471 .1227 .1018 1 .0060 .0047 .0036 .0028 .0021 .0016 .0012 .0009 .0007 .0005
2 .6198 .5631 .5080 .4550 .4049 .3580 .3146 .2748 .2386 .2061 2 .0289 .0235 .0189 .0152 .0121 .0096 .0076 .0060 .0047 .0036
} .8290 .7873 .7427 .6959 .6477 .5990 .5504 .5026 .456[ .4114 } .0908 .0765 .0642 .0535 .0444 0366 .0300 .0245 .0198 .0160
4 .9390 .9! 73 .8917 .8625 .8298 .7941 .7557 .7151 .6729 .6296 4 .2089 .1827 .1589 .1374 .1182 .lOJJ .0859 .0726 .0610 .0510

5 .9825 .9740 .9630 .9493 .9327 .9130 .8902 .8644 .8357 .8042 5 .J787 .3426 .3082 .2758 .2454 .2171 .1910 .1671 .1453 .1256
6 .9959 .9933 .9897 .9847 .9781 .9696 .9591 .946) .9311 .9133 6 .5695 .5307 .4921 .4540 .4166 .3803 .3453 .3118 .2800 .2500
7 .9992 .9986 .9976 .9962 .9941 .9912 .9873- .9823 .9759 .9679 7 . 74-09 .7078 .6732 .6376 hOIO j639 .5265 .4892 .4522 .4159
8 .9999 .9998 .9995 .9992 .9987 .9979 .9967 .9951 .9929 .9900 8 .8660 .8432 .8182 .7913 • 7624 .7317 .6995 .6659 .6312 .5956
9 1.0000 1.0000 .9999 .9999 .9998 .9996 .9993 .9989 .9983 .9974 9 .9409 .9281 .9134 .8968 .8782 .8576 .8350 .8103 .7837 .7553

JO 1.0000 1.0000 1.0000 1.0000 1.0000 .9999 .9999 .9998 .9996 .9994 JO .9780 .9721 .9650 .9566 .9468 .9355 .9225 .9077 .8910 .8725
11 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.llllOO l.llllOO .9999 .9999 11 .9931 .9909 .9881 .9846 .9804 .9753 .9692 .9619 .9534 .9435
12 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.llllOO 1.0000 1.0000 1.0000 12 .9982 .9975 .9966 .9955 .9940 .9921 .9898 .9868 .9833 .9790
13 .9996 .9994 .9992 .9989 .9985 .9979 .9972 .9963 .9951 .9935

~ .24 .25 .26 .27 .28 .29 .JO 14 .9999 .9999 .9999 .9998 .9997 .9996 .9994 .999[ .9988 .9984
.21 .22 .23
15 1.0000 1.0000 1.0000 1.0000 1.0000 9999 .9999 .9998 .9998 .9997
o .0090 .0069 .0054 .0041 .0032 .0024 .0018 .0014 .0011 .0008 16 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000
1 .0566 .04ól .0374 .0302 .0243 .0195 .0155 .0123 .0097 .0076
.0763 .0635 .0526 .0433 .0355
2
J
4
.1770
.3690
.5858
.1512
.3289
.5420
.1284
.2915
.4986
.1085"
.2569
.4561
.0913
.2252
.4148
.1962
.3752
.1700
.3375
.1466
.3019
.1256
.2685
.1071
.2375 '>zo
41

.llllOO
.42

.0000
.4]

.0000
.44

.0000
.45

.0000
.46

0000
.47

.0000
.48

.llllOO
.49

.0000
.50

.0000
.7703 .7343 .6965 .6573 .6[ 72 .5765 .5357 .4952 .455) .4164 1 .0004 .000] .0002 .0002 .0001 .0001 .0001 .0000 .0000 .0000
5
6 .8929 .8699 .8442 .8162 .7858 .7533 .7190 .6831 .6460 .6080 2 .0028 .0021 .CXH6 .CXH2 .0009 .0007 .0005 .0004 .0003 .0002
7 .9581 .9464 .9325 .9165 .8982 .8775 .8545 .8293 .8018 .7723 } .0128 .0102 .0080 .0063 .0049 .0038 .0029 .0023 .0017 .0013
8 .9862 .9814 .9754 .9680 .9591 .9485 .9360 .9216 .9052 8867 4 .0423 .0349 .0286 .023J .0189 .0152 .0121 .0096 .0076 .0059
9 .9962 .9946 .9925 .9897 .986[ .9817 .9762 .9695 .9615 .9520
5 .1079 .0922 .0783 .0660 .0553 .0461 .0381 .0313 .0255 .0207
10 .9991 .9987 .9981 .9972 .9961 .9945 .9926 .9900 .9868 .9829 6 .2220 .1959 .1719 .1499 .1299 .1119 .0958 .0814 .0688 .0577
11 .9998 .9997 .9996 .9994 .9991 .9986 .9981 .9973 .9962 .9949 7 .3804 .3461 .3132 .2817 .2520 .2241 .1980 .1739 .1518 .1 316
12 1.0000 1.0000 .9999 .9999 .9998 .9997 .9996 .9994 .999[ .9987 8 5594 .5229 .4864 .4501 .4143 3793 .3454 .3127 .2814 .25! 7
]] 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 .9999 .9999 .9998 .9997 9 .7252 .6936 .6606 .6264 .5914 .5557 .5196 .4834 .4474 .4119
14 1.0000 1.0000 1.0000 1.0000 1.0000 10000 1.0000 1.0000 1.0000 1.0000
JO .8520 .8295 .8051 .7788 .7507 .7209 .6896 .6568 .6229 .588!
11 .932! .9190 .9042 .8877 .869::!. .8489 ,8266 .8024 .7762 .7483
12 9738 .9676 960.1 .9518 .9420 9306 .9177 .9031 .8867 .8684
13 .9916 .9893 9864 .9828 9786 .9735 .9674 .9603 .9520 .9423
14 .99i8 .99il .9962 .9950 .9936 9917 9895 .9867 .9834 .9793

15 .9996 .9994 .9992 .9989 .9985 .9980 .9973 .9965 .9954 994!
16 .9999 .9999 .9999 9998 .9997 9996 .9995 .9993 .9990 .9987
]) 1.0000 1.0000 1.0000 1.0000 1.0000 9999 .9999 .9999 .9999 .9998
1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000
"
Apéndice 11 Tablas estadísticas 813
812
Tabla A (continuación)
Tabla A (continuación)

n = 25 (continuación)
n = 25

~ .21 .22 .23 .24 .25 .26 .27 .28 .29 .JO

~ .OI .02 .03 .04 .05 .06 .07 .08 .09 .10
o .0028 .0020 .0015 .0010 .0008 .0005 .0004 .0003 .0002 .0001
o .7778 .6035 .4670 .3604 .2774 .2129 .1630 .1244 .0946 .0718 1 .0211 .0162 .0123 .0093 .0070 .0053 .0039 .0029 .0021 .0016
1 .9742 .9114 .8280 .7358 .6424 .5527 .4696 .3947 .3286 .2712 2 .0796 .0640 .0512 .0407 .0321 .0252 .0!96 .0152 .0117 .0090
2 .9980 .9868 .9620 .9235 .8729 .8129 .7466 .6768 .6063 .5371 3 !987 .1676 .1403 .] 166 .0962 .0789 .0642 .0519 .0417 .0332
3 .9999. .9986 .9938 .9835 .9659 .9402 .9064 .8649 .8169 .7636 4 .3730 .3282 .2866 .2484 .2137 .1826 .1548 .1304 .1090 .0905
4 1.0000 .9999 .9992 .9972 .9928 .9850 .9726 .9549 .9314 .9020
5 .5675 .5184 .4701 .4233 .3783 .3]56 .2956 .2585 .2245 .1935
5 1.0000 1.0000 .9999 .9996 .9988 .9969 .9935 .9877 .9790 .9666 .7399 .6973 .6529 .6073 .5611 .5149 .4692 .4247 .3817 .3407
6
6 1.0000 1.0000 1.0000 1.0000 .9998 .9995 .9987 .9972 .9946 .9905 7 .8642 .8342 .8011 .7651 .7265 .6858 .6435 .6001 .5560 .5118
1 1.0000 1.0000 1.0000 1.0000 1.0000 .9999 .9998 .9995 .9989 .9977 .9386 .9212 .9007 .8772 .8506 .8210 .7885 .7535 .7162 .6769
8
8 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 .9999 .9998 .9995 9 .9760 .9675 .9569 .9440 .9287 .9107 .8899 .8662 .8398 .8106
9 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 .9999
10 9918 .9883 .9837 .9778 .9703 .9611 .9498 .9364 .9205 .9022
10 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 11 9976 .9964 .9947 .9924 .9893 .9852 9801 .9736 .9655 .9558
12 .9994 .9990 .9985 .9977 .9966 .9951 .9931 .9904 .9870 .98:5

~
13 .9999 .9998 .9996 .9994 .9991 .9986 .9979 .9970 .9957 .9940
.11 .12 .ll .14 .15 .16 .17 .18 .19 .20
.9997 9995 .9992 .9988 9982
14 1.0000 1.0000 .9999 .9999 .9998

o .0543 .0409 .0308 .0230 .0172 .0128 .0095 .0070 .0052 .0038 15 1.0000 1.0000 1.0000 !.0000 1.0000 9999 .9999 .9998 .9997 .9995
1 .2221 .1805 .1457 .1168 .0931 .0737 .0580 .0454 .0354 .0274 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 .9999 .9999
16
2 .4709 .4088 .3517 .3000 .2537 .2130 .1774 .1467 .1204 .0982 17 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000
J .7066 .6475 .5877 .5286 .4711 .4163 .3648 .3171 .2734 .2340

~
4 .8669 .8266 .7817 .7332 .6821 .6293 .5759 .5228 .4708 .4207 .37 .38 .39 .40
JI 32 .33 .34 .35 36
5 .9501 .9291 .9035 .8732 .8385 .7998 .7575 .7125 .6653 .6167
6 .9844 .9757 .9641 .9491 .9305 .9080 .8815 .8512 .8173 .7800 o .0001 .0001 .0000 0000 .0000 0000 0000 .0000 .0000 0000
7 .9959 .9930 .9887 .9827 .9745 .9639 .9505 .9339 .9141 .8909 .0011 .0008 .0006 .0004 .0003 .OJ02 .0002 .0001 .0001 .0001
1
8 .9991 .9983 9970 .9950 9920 .9879 .9822 .9748 .9652 .9532 .0068 .0051 .0039 .0029 .0021 .00!6 .0011 .0008 .0006 .0004
9 .9998 .9996 .9993 .9987 .9979 .9965 .9945 .9917 .9878 .9827 '
) .0263 .0207 .0162 .0126 .0097
0320
.0074
0255
.0056
0201
.0043
.Ol 58
.0032
.0123
.0024
.0095
4 .0746 .0610 .0496 0400
10 1.0000 .9999 .9999 .9997 .9995 .9991 .9985 .9976 .9963 .9944
11 1.0000 1.0000 1.0000 1.0000 .9999 .9998 .9997 .9994 .9990 .9985 .1407 .1187 .0994 .0826 .0682 0559 .0454 .0367 .0294
5 .!656
.9999 .9999 .9998 .9996 .2657 .2013 .1734 1483 t:5K .1060 .0886 .0736
12 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 6 .30!9 .2J2!
13 i 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 .9999 7 46~1 .4253 3837 J439 .3061
4668
270~
.4252
2374
.3848
.2068
.3458
.1789
.3086
.1536
2735
14 1.0000 I.0000 l.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 J.0000 8 636! 5943 .5518 ..5092
9 .7787 .7445 .7061 .6700 .6303 .5896 5483 .5067 4653 .4:46

IO .8812 .8576 .8314 .80:'.5 .7712 7375 70!9 .6645 .6257 .5858
11 .9440 .9302 9141 .8956 .8746 .8510 !C49 7964 7654 .7323
.9770 9701 .9617 .9515 9396 .9255 .9093 8907 .8697 846:
"
1) .9917 9888 .9851 9804
9931
.9745
9907
.9674
9876
9588
98.>7
.9485
.9788
.9363
.9729
_92::
.9656
14 .9974 .9964 .9950

9993 .9990 .9985 9979 .997 J .9959 .9944 .9925 .9900 .9868
15 995¡
16 9998 .9998 .9996 .9995 .9992 9989 .9984 9977 .9968
1.0000 1.0000 9999 9999 .9998 9997 9996 .9994 .9992 9988
17
1.0000 1.0000 1.0000 1.0000 9999 .9999 .9999 .9998 999'1
IS 1.0000
1.0000. l.0000 1.0000 1.0000 1.0000 1 0000 1.0000 1.0000 9999
19 1.0000
1.0000 1.0000 1.0000 1 0000 1.0000 1 0000 1.0000 1.0000 l.0(00
20 1 0000
814 Apéndice JI Tablas estadísticas 815

Tabla A (co11ri11 uación) Tabla B Distribución acumulada de Poisson P(X::;XIA.). 1000 veces la probabilidad
de X o n1enos ocurrencia de un evento que tiene un número promedio de ocurren-
n = 25 (continuación) cia igual a A.

p .41 .43
.42 .44 .45 .46 .47 .48 .49 .50
X

o .0000 .0000 .0000 .0000 .0000 .0000 .0000 .0000 .0000 .0000
1 .0000 .0000 .0000 .0000 .0000 .0000 .0000 .0000 .0000 .0000
2 .000) .0002 .0002 .0001 .0001 .0000 .0000 .0000 .0000 .0000
J .0017 .0013 .13009 .0007 .0005 .000) .0002 .0002 .0001 .0001
4 .0073 .0055 .0042 .0031 .0023 .0017 .0012 .0009 .0006 .0005

5 .0233 .0184 .0144 .0112 .0086 .0066 .0050 .0037 .0028 .0020
6 .0606 .0495 .0401 .0323 .0258 .0204 .0160 .0124 .0096 .0073
7 .1308 .l 106 .0929 .0773 .0639 .0523 .0425 .0342 .0273 .0216
8 .2407 .2103 .1823 .1569 .1340 .1135 .0954 0795 .0657 .0539
9 .3849 .3465 .3098 .2750 .2424 .2120 .1840 .1585 .1354 .1148 O 1 2. 3 4 5 6
P(X .o:;2 IA= 1.00)= .920
10 .5452 .5044 .4637 .4235 .3843 .3462 .3098 .2751 .2426 .2122
11 .6971 .6603 .6220 .5826 .5426 .5022 .4618 .4220

~
.3829 .3450
12 .8203 .7920 .7613 .7285 .6937 .6571 .6192 .580! .5402 .5000 .02 .04 .06 .08 .10 .15 .20 .25
13 .9059 .8873 .8664 .8431 .8173 .7891 .7587 .7260 .6914 .6550
14 .9569 .9465 .9344 .9203 .9040 .8855 .8647 .8415 .8159 .7878 '
15 .9829 .9780 .9720 .9647 .9560 .9457 .9337 .9197 .9036 .8852
o 980 961 942 923 905 861 819 779
16 .9942 .9922 .9897 1 1000 999 998 997 995 990 982 974
9866 .9826 .9778 .9719 .9648 .9562 .9461
17 .9983 .9977 .9968 .9956 .9942 .9923 .9898 .9868 .9830 .9784 2 1000 1000 1000 1000 999 999 998
18 .9996 .9994 .9992 .9988 .9984 .9977 .9969 .9959 .9945 .9927 3 1000 1000 1000
19 .9999 .9999 9998 .9997 .9996 .9995 .9992 .9989 .9985 .9980

20
21
"
1.0000
1.0000
1.0000
1.0000
1.0000
1.0000
1.0000
1.0000
1.0000
1.0000
1.0000
1.0000
.9999
1.0000
1.0000
.9999
1.0000
1.0000
.99']8
1.0000
1.0000
.9998
1.0000
1.0000
.9997
.9999
1.0000
.9995
.9999
1.0000
~
'
.30 .35 .40 .45 .50 .55 .60 .65

o 741 705 670 638 607 577 549 522


1 963 951 938 925 910 894 878 861
2 996 994 992 989 986 982 977 972
3 1000 1000 999 999 998 998 997 996
4 1000 1000 1000 1000 1000 999
5 1()()()

~
'
.70 .75 .80 .85 .90 .95 LO 1.1

o 497 472 449 427 407 387 368 333


1 844 827 809 791 772 754 736 699
2 966 959 95) 945 937 929 920 900
3 994 993 991 989 987 984 981 974
4 999 999 999 998 998 997 996 995
5 1000 1000 1000 1000 1000 1000 999 999
6 1000 1000
Tabla B (continuación) Tablas estadísticas 817
Tabla B (co11ti11uació11)

X o
1.2

301
1.3

273
1.4

247
1.5

223
1.6

202
1.7

183
1.8

165
1.9

150 ~ . 5.2 5.4 5.6 5.8 6.0 6.2 6.4 6.6

1 663 627 592 558 525 493 463 434 o 006 005 004 003 002 002 002 001
2 879 857 833 809 783 757 731 704 1 034 029 024 021 017 015 012 010
3 966 957 946 934 921 907 891 875 2 109 095 082 072 062 054 046 040
4 992 989 986 981 976 970 964 956 3 238 213 191 170 151 134 119 105
5 998 998 997 996 994 992 990 987 4 406 373 342 313 285 259 235 213
6 1000 1000 999 999 999 998 997 997 5 581 546 512 478 446 414 384 355
7 1000 1000 1000 1000 999 999 6 732 702 670 638 606 574 542 511
8 1000 1000 7 845 822 797 771 744 716 687 658
8 918 903 886 867 847 826 803 780

X
.

o
2.0

135
2.2

111
2.4

091
2.6

074
2.8

061
3.0

050
3.2

041
3.4

033
9
10
11
12
960
982
993
997
951
977
990
996
941
972
988
995
929
965
984
993
916
957
980
991
902
949
975
989
886
939
969
986
869
927
963
982
1 406 355 308 267 231 199 171 147 13 999 999 998 997 996 995 994 992
2 677 623 570 518 469 423 380 340 14 1000 999 999 999 999 998 997 997
3 857 819 779 736 692 647 603 558 15 1000 1000 1000 999 999 999 999
4 947 928 904 877 848 815 781 744 16 1000 1000 1000 999
5 983 975 964 951 935 916 895 871 17 1000
6 995 993 988 983 976 966 955 942

~
7 999 998 997 995 992 988 983 977
999 999 998 997 994 992 6.8 7.0 7.2 7.4 7.6 7.8 8.0 8.5
8 1000 1000
9 1000 1000 999 999 998 997
10 1000 1000 1000 999 o 001 001 001 001 001 000 000 000
11 1000 1 009 007 006 005 004 004 003 002
2 034 030 025 022 019 016 014 009

~ 4.6 4.8 5.0 3 093 082 072 063 055 048 042 030
3.6 3.8 4.0 4.2 4.4
X 4 192 173 156 140 125 112 100 074
5 327 301 276 253 231 210 191 150
o 027 022 018 015 012 010 008 007 6 480 450 420 392 365 338 313 256
1 126 107 092 078 066 056 048 040 7 628 599 569 539 510 481 453 386
2 303 269 238 210 185 163 143 125 8 755 729 703 676 648 620 593 523
3 515 473 433 395 359 326 294 265 9 850 830 810 788 765 741 717 653
4 706 668 629 590 551 513 476 440 10 915 901 887 871 854 835 816 763
5 844 816 785 753 720 686 651 616 11 955 947 937 926 915 902 888 849
6 927 909 889 867 844 818 791 762 12 978 973 967 961 954 945 936 909
7 969 960 949 936 921 905 887 867 13 990 987 984 980 976 971 966 949
8 988 984 979 972 964 955 944 932 14 996 994 993 991 989 986 983 973
9 996 994 992 989 985 980 975 968 15 998 998 997 996 995 993 992 986
10 999 998 997 996 994 992 990 986 16 999 999 999 998 998 997 996 993
11 1000 999 999 999 998 997 996 995 17 1000 1000 999 999 999 999 998 997
12 1000 1000 1000 999 999 999 998 18 1000 1000 1000 1000 999 999
13 1000 1000 1000 999 19 1000 999
14 1000 20 1000

816
Apéndice JI , Tablas estadl'.-iticas 819
818
Tabla B ( confin uac ión)
Tabla 8 {co11ti1111aéión) --

X

9.0 9.5 10.0 10.5 11.0 11.5 12.0 12.5 v1 X
13.0 13.5 14.0 14.5 15 16 17 18

1 001 001 000 000 000 000 000 000 3 001 001 000 000 000 000 000 000
2 006 004 003 002 001 001 001 000 4 004 003 002 001 001 000 000 000
3 021 015 010 007 005 003 002 002 5 011 008 006 004 003 001 001 000
4 055 040 029 021 015 011 008 005 6 026 019 014 010 008 004 002 001
5 116 089 067 050 038 028 020 015 7 054 041 032 024 018 010 005 003
6 207 165 130 102 079 060 046 035 8 100 079 062 048 037 022 013 007
7 324 269 220 179 143 114 090 070 9 166 135 109 088 070 043 026 015
8 456 392 333 279 232 191 155 125 10 252 211 176 145 118 077 049 OJO
9 587 522 458 397 341 289 242 201 11 3;3 304 260 220 185 127 085 055
10 706 645 583 521 460 402 347 297 12 463 409 358 311 268 193 135 092
752 697 639 579 520 462 406 13 573 518 464 413 363 275 201 143
11 803
12 876 836 792 742 689 633 576 519 14 675 623 570 518 466 368 281 208
926 898 864 825 781 733 682 628 15 764 718 669 619 568 467 371 287
13
14 959 940 917 888 854 815 772 725 16 835 798 756 711 664 566 468 375
15 978 967 951 932 907 878 844 806 17 890 861 827 790 749 659 564 469
989 982 973 960 944 924 899 869 18 930 908 883 853 819 742 655 562
16
995 991 986 978 968 954 937 916 19 957 942 923 901 875 812 736 651
17
18 998 996 993 988 982 974 963 948 20 975 965 952 936 917 868 805 731
999 998 997 994 991 986 979 969 21 986 980 971 960 947 911 861 799
19
20 1000 999 998 997 995 992 988 983 22 992 989 983 976 967 942 905 855
1000 999 999 998 996 994 991 23 996 994 991 986 981 963 937 899
21
22 1000 999 999 998 997 995 24 998 997 995 992 989 978 959 932
23 1000 1000 999 999 998 25 999 998 997 996 994 987 975 955
1000 999 999 26 1000 999 999 998 997 993 985 972
24
25 1000 999 27 1000 999 999 998 996 991 983
26 1000 28 1 1000 999 999 998 995 990
29 1 1000 1000 999 997 994
30 999 999 997
31 1000 999 998
32 1000 999
33 1000
Apéndice 11
Tabla C Áreas de la curva normal P(::. :5 z0 ). Los válores en el cuerpo de la tabla
son áreas entre oo y z 1
1
820
Tabla B (conrinuación)
1
- j

, 19 20 21 22 23 24 25
X

6
7
001
002
000
001
000
000
000
000
000
000
000
000
000
000
000
-0.09 -0.08 -0.07 -0.06 -0.05
o

-0.04
·~
-0.03 -0.02 -0.01 0.00
002 001 001 000 000
8 004 000 000
005 003 002 001 - 3.80 .0001 .0001 .0001 .0001 .0001 .0001 .0001 .0001 .0001 .0001 - 3.80
9 009 001 001 -3.70 .0001 .0001 .0001 .0001 .0001 .0001 .0001 .0001 .0001 .0001 - 3.70
011 006 004 002
10 018 003 001 -3.60 .0001 .0001 .0001 .0001 .0001 .0001 .0001 .0001 .0002 .0002 - 3.60
035 021 013 008 004
11 009 005 003
061 039 025 015 - 3.50 .0002 .0002 .0002 .0002 .0002 .0002 .0002 .0002 .0002 .0002 - 3.50
12 017 011 006 .0003 .0003
098 066 043 028 - 3.40 .0002 .000.l .0003 .0003 .0003 .0003 .0003 .0003 - 3.40
13 031 020 012 - 3.30 .0003 .0004 .0004 .0004 .0004 .0004 .0004 .0005 .0005 .0005 - 3.30
150 105 072 048
14 052 034 022 - 3.20 .0005 .0005 .0005 .0006 .0006 .0006 .0006 .0006 .0007 .0007 - 3.20
215 157 111 077 .0007 .0008 .0008 .0008
15 082 056 038 -3.10 .0007 .0008 .0009 .IX109 .IX109 .OCHO -3.10
292 221 163 117
16 123 087 060
378 297 227 169 -3.00 .0010 0010 .OOIJ .00! ! .0011 .0012 .CXH2 .0013 .00!3 .OOIJ - 3.00
17 175 128 092 -2.90 .0014 .0014 .0015 .00!5 11016 .0016 .0017
469 381 302 232 .0018 .0018 .0019 - 2.90
18 238 180 134 -2.80 .0019 .0020 .0021 .0021 .0022 .0023 .0023 .0024 .0025 .0026 _- 2.80
19 561 470 384 306 -2.70 .0026 .0027 .0028 .0029 .0030 .0031
387 310 243 185 .0032 .0033 .0034 .0035 - 2.70
20 647 559 471 -2.60 .0036 .0037 .0038 .0039 .0040 .0041 .0043 .0044 .0045 .0047 -2.60
472 389 314 247
21 725 644 558
556 472 392 318 - 2.50 .0048 .0049 .0051 .0052 .0054 .0055 .0057 .0059 .0060 .0062 - 2.50
22 793 721 640
637 555 473 394 - 2.40 .0064 .11066 .11068 .0069 .0071 .0073 .0075 .0078 .0080 .0082 - 2.40
23 849 787 716
712 635 554 473 - 2.30 .0084 .0087 .0089 .0091 .0094 .0096 .0099 .0102 .0104 .0107 -2.30
24 893 843 782 - 2.20 ..0110 .0113 .0116 .01 !9 .0122 .OJ2j .0129 .0132 .0136 .0139 -2.20
777 708 632 553
25 927 888 838 -2.JO .0143 .0146 .C150 .0154 .0158 .0162 .0166 .0170 .0174 .0179 -2.10
832 772 704 629
26 951 9z¡ 883
877 827 768 700 -2.00 0183 .0188 .0192 .0197 .0202 .0207 .0212 .0217 .0222 .0228 -2.00
27 969 948 917
91l 873 823 763 - 1.90 .0233 .0239 .0244 .0250 .0256 .0262 .0268 .0274 .0281 .0287 - 1.90
28 980 966 944 - 1.80 .0294 .0301 .0307
940 908 868 818 .0314 .0322 .0329 .0336 .0344 .0351 .0359 -1.80
29 988 978 963. - 1.70 .0367 .0375 .0384 .0392 .0401 .0409 .0418 .0436 .0446 - 1.10
30 993 987 976 959
973
936
956
904
932
863
900
- J.60 .0455 .11465 .0475 .0485 .0495 .0505 .0516 ~¡ .0537 .0548 - l.6Q
31 996 992 985
983 971 953 929 -1.50 .0559 .0571 .0582 .0594 .0606 .0618 .0630 .0643 .0655 .0668 -1.50
32 998 995 991
989 981 969 950 - L40 .0681 .0694 .0708 .0721 .0735 .0749 .0764 .0778 .0793 .OSOS -1.40
33 999 997 994 -1.30 0823 .0838 .0853 .0869 .0885 .0901 .0918 .0934 .0951 .0968 - l.30
997 994 988 979 966
34 999 999 978 -1.20 .0985 .1003 .1020 .1038 .1056 .1075 .1093 • . IJ 12 .1131 .115! -1.20
998 996 993 987 - 1.10 .1170 .1190 .1210 .1230 .1251 .1271 .1292 .1314
35 1000 999 985
.1335 .1351 - 1.10
999 998 996 992
36 1000 991
999 999 997 995 -1.00 .1379 .140! .!423 .1446 .1469 .1492 .1515 /539 .1562 .1587 - LOO
37 999 997 994 -0.90 .161 l .1635 .16ó0 .1685 .1711 .1736 .1762 .1788 .1814 .1841 -0.90
1000 999 -0.80 .1867 .1894 .1922 .1949 .1977 .2005 .2033
38 999 998 997 .2061 .2090 .2119 -0.80
39 1000 -0.70 .2148 .2177 .2206 .2236 .2266 .2296 .2327 .2358 .2389 .2420 - 0.70
1000 999 998 -0.60 .2451 .2483 .251.4 .2546 .2578 .2611 .2643 .2676 .2709 .2743 - 0.60
40 999 999
41 1000 999 -0.50 .2776 .2810 .2843 .2877 .2912 .2946 .2981 .3015 .3050 .3085 - o.so
42 1000 --0.40 .3121 .3156 .3192 .3228 .3264 .3300 .3336 .3372 .3409 .3446 -0.40
43 -0.30 3483 .3520 .3557 .3594 .3632 .3669 .3707 .3745 .3783 .3821 - 0.30
- 0.20 .J859 .3897 .3936 .3974 .4013 .4052 .4090 .4129 .4168 .420.7 - 0.20
-O.JO .4247 .4286 .4325 .4364 .4404 .4443 .4483 .4522 .4562 .4602 -0.10

0.00 4641 .4681 .4721 .4761 .4801 .4840 .4880 .4920 .4960 .50110 0.00

821
Tabla D Números aleatorios
822 Apéndice JI
Tl1hla C ( co11ti11uació11) 1 ººººº
1234.":i
OIJOOI
67890
11111
12345
11112
67890
22222
12345
22223
67890
33333
12345
33334
678YO
4-l+-t4
12'.145
444-t:i
li7H'.JO
1
01 85Y6i i:11;;2 14:il I 8:i285 36009 95892 36962 6itt!:i 63'.\!-t :,0102
02 074il3 514.'",:t ][l'H9 8634~ 764:l l 8!594 95848 36i:18 250[ ~ 15·160
000 0.01 0.02 0.0.l 0.04 0.05 0.06 n:1 9628'.l 0189H 61414
0.07 0.08 0.09 " 83525 042'.H 13604 75339 11730 8542:1 tirni98
04 49174 12074 9855[ 37895 93547 24769 09404 76548 05'.193 96710
O.DO .5000 .504-0 .5080 .5120 .5160 .5199 .5239 5279
i 05 Y73ó6 3994! 21225 93629 1957-t 1:tl5!
.5319 .5359 O.DO 1 71565 3341'.l 56087 4087:i
0.10 .5J98 .5438 .5478 .5517 .5557 .5596
0.20 .S79J .58J2 .5X7J .5910 .5948 .5987
.5636 .5675 .5714 .5753 0.10 '
1
Oli 90474 41469 16812 8!542 8!ti.'i2 45554 UO"cVi:1
.6026 .6064 .6lOJ .6141 0.20 2793 ! 93994 22:170
O.JO .6! 79 .6217 .6255 .6293 .6JJI .6J68
1
07 2il5'J9 6410Y 09497 i62'.Ei 4 !38:l 31555 29.'i6:I
.6406 .6443 .6480 .6517 O.JO 12639 00619 22909
0.10 6554 .659! .662X .6664 .6700 .67J6 25254 16210 89il7 65997 82667 i4624

0.50 .6915 .6950 .6985 .7019 .7054 .7088


.6772

.712J
.6808 .6844 .6879 0.40
1 "'
OY
10
28785
84725
02i60
86576
243.i'J
86944
994!0
Y32Y6
773!9
10081
73408
82454
36348
58993
768[0
44018
61098
52973
6-fi32
04'.l93
9'.\589
48245
15457
.7157 .7190 .7224 0.50 10324
0.60 .T257 .7291 .7324 .7357 .7389 .7422 .7454 .7486 .7517 .7549 0.60
0.70 .7580 .7611 .7642 .767J .7704 .7734 11 41059 66456 47679 66810 1594 l 84602 14493 655!5 19251 41642
.7764 .7794 .782J
o.so .7881 .7910 .7939 .7967 .7995 .8023 .8051 .8078 .8106
.7852 0.70
12 67434 41045 82830 47617 36932 46728 7 Jl83 36345 41404 8 I ! 10
0.90 .8! J3 0.80
.8159 .8186 .8212 .82J8 .8264 .8289 .8315 13 72766 68816 37643 19959 57550 49620 98480 25640 67257 18117 l
.8340 .8365 .8389 0.90
14 92079 46784 66!25 949.~2 6445! 29275 57669 66658 30818 58.153
!.()() .8413 .8438 .8461 .8485 15 29187 403.'iO 62.533 73603 34075 [6451 42885 03448 37390
.8508 .8531 .8554 .8577 8599 .8621 !.()() 96328
1.fo .8643 .8665 .8686 .8708 .8729 .8749 .8770 .8790
1.20 .8810 .8830 1.10
."8849 .8869 .8888 .8907 .8925 .8944 16 74220 17612 65.522 80607 19184 64164 66962 82:l 10 18163 63495
.8962 .8980 .8997 .9015 1.20
1.30 .9032 .9049 .9066 .9082 .9099 .9115 17 03786 02407 06098 92917 • 40434 60602 82175 04470 78754 90775
.9 IJI .9!47 9162 .9177 1.30
1.40 .9192 .9207 .9122 .9236 .925! .9265 18 75085 55558 l.">520 270'.-18 2547! 76107 90832 !OXl9 56797 33751
.9279 .9292 .9306 .9319 1.40 19 09161 3301:i 19155 117 l.'i 0055! 24909 31894 37¡¡4 37953 78837
1.50 .9332 .9345 .9J57 .9370 .9382 .9394 20 75707 48992 64998 871JHO 393'.\3 00767 45637 125:HI 67439 94914
.9406 .9418 .9429 .9441 !.50
1.60 .9452 .9463 .9474 .9484 .9495 .9505 .95!5 .9525 .9535 .9545 1.60
1.70
1.80
.9554
.9641
.9564
.9649
.9573
.9656
9582
.9664
.9591
.9671
.9599
.9678
.9608
.9686
.9616
969J
.9625
.9699
.96JJ
.9706
1.70
1.80
"
22
21333
65626
48660
50061
31288
42539
00086
148]2
79889
48895
75532
11196
28704
34335
62844
60492
92'.l37
70650
99695
51108
I.90 .9713 .9719 .9726 .9732 23 84380 07389 87891 7625.'i 89604 41372 10837 66992 9318'.l 56920
.9738 .9744 .9750 .9756 .9761 .9767 1.90 24 46479 32072 80083 63868 70930 89654 05359 47196 12452 38234
2.00 .9772 .9778 .9783 .9788 .9793 .9798 25 59847 97197 551'17 76639 76971 55928 36441 95141 42333 6748:3
.980J .9808 .9812 .9817 2.00
2.10 .9821 .9826 .9830 .9834 .9838 .9842 .9846 .9850 .9854 .9857 2.10 2fi 31416 11231 27904 57383 3!852 69137 96667 14:ll5 01007 31929
2.20 .9861 .9864 .9868 .9871 .9875 .9878 .9881 .9884 .9887 .9890 2.20 27 ii2066 83436 67914 21465 99605 83114 97885 74440 99622 87912
2.30 .9893 .9896 .9898 .990[ .9904 .9906 .9909 .991 ! .9913 .9916 1.30 28 01850 4271l2 39202 !8.'i82 46214 99228 79541 78298 7540-t 63648
2.40 .9918 .9920 .9922 .9925 .9927 .9929 .9931 .9932 .9934 .9936 2.40 29 32315 89276 89582 87138 16165 15984 21466 63830 30475 74729
2.50 .9938 .9940 .9941 .9943 30 59388 42703 55198 803:-:10 67067 97155 34160 85019 03527 78140
.9945 .9946 .9948 .9949 .9951 .9952 2.50
2.60 .9953 .9955 .9956 .9957 .9959 .9960 .9961 .9962 .9963 .9964 2.60 31 58089 27632 50987 91'.\73 07736 20436 96130 73483 85332 24384
2.70 .9965 .9966 .9967 .9968 .9969 .9970 .9971 .9972 .9973 .9974 2.70 32 61705 57285 30392 23660 7584! 21931 04295 00875 0911.t 3210!
2.80 .9974 .9975 .9976 .9977 .9977 .9978 .9979 .9979 .9980 .9981 2.80 33 189!4 98982 60199 99275 41967 35208 30357 76772 92656 62318
2.90 .9981 .9982 .9982 .9983 .9984 .9984 .9985 .9985 .9986 .9986 2.90 34 1 !965 94089 34803 48941 69709 16784 44642 89i6! 66864 62803
3.00 35 85251 4811 l 80936 81781 93248 67877 16498 3 !924 513!5 79921
.9987 .9987 .9987 .9988 .9988 .9989 .9989 .9989 .9990 .9990 J.00
3.10 .9990 .9991 .9991 .9991 .9992 .9992 .9992 .9992 .9993 .9993 3.10 36 66121 96986 84844 9387'.I 46352 92183 51152 858i8 30490 15974
3.20 .9993 .9993 .9994 .9994 .9994 .9994 .9994 .9995 .9995 .9995 3.20 37 53972 96642 24199 58080 35450 03482 66953 49521 63719 57615
3.30 .9995 .9995 .9995 .9996 .9996 .9996 .9996 .9996 .9996 .9997 3.30 38 14509 16594 78883 43222 23093 58645 60257 89250 63266 90858
3.40 .9997 .9997 .9997 .9997 .9997 .9997 .9997 .9997 .9997 .9998 J.40 39 37700 07688 6!i53'.-I 72126 236! 1 93993 01848 03910 38552 !7472
40 85466 59392 72722 !5473 7329:i 49759 56157 60477 83284 56:167
3.50 .9998 .9998 .9998 .9998 .9998 .9998 .9998 .9998 .9998 .9998 3.50
J.60 .9998 .9998 .9999 .9999 .9999 .'i2969 558fi'.1 67842 05673 82738 36563 79540 61935
9999 .9999 .9999 .9999 .9999 360 41 42312 91878
3.70 .9999 .9999 .9999 .9999 .9999 57894 8!434 62041
.9999 .9999 .9999 .9999 .9999 3.70 42 42744 6831.'J 17514 02878 9729! 74851 42725
J.80 .9999 .9999 .9999 .9999 .9999 .9999 .9999 .9999 .9999 .9999 3.80 41 26140 13336 67726 61876 29971 99294 96664 52817 90039 532 l I
1 iBJ95 32280 79357 04224
44 95589 56319 14563 24071 069t6 59555
4.'i 39113 132 !7 59999 49952 83021 47709 53105 19295 88318 41626

46 41392 !7622 18994 9828:1 Oi249 52289 24209 91139 30715 06604
47 5468·1 53645 79246 701X3 8773 ! 19185 08541 33519 07223 974 ¡3
48 '!94-12 6!00! :166.'",8 5;.¡4-.¡ 9538)'. 36682 38052 46i 19 09428 94012
49 :167.":il 16778 5488l'. 15:l:i7 6800:1 43564 90976 58904 40512 07725
50 98159 020,64 21416 749.14 53049 88749 02865 2.'ii72 89853 88714

823
Tabla E Perccntiles de la distribución ~ Tablas estadísticas
825
,
\
Tabla F Percentiles de la distribución ji-cuadrada
o 2.2281 ,,, --
P(t10 < 2.2281) ...975
d. r. ,... ,.,. ,.175 t.1111 f.1195

1 3.078 6.3138 12.706 31.821 63.657


2 1.886 2.9200 4.3027 6.965 9.9248 o 31.410 ,\,,
J' 1.638 2.3534 3.1825 4.541 S.8409 P(x~ < 31.410)•.95
4 1.533 2.1318 2.7764 3.747 4.6041
s l.476 2.0150 2.5706 3.365 4.0321 d. f. X~oos X~o2s x\s x~,o X~o¿ X~e,s X~ee X~911s
6 1.440 1.9432 2.4469 3.143 3.7074 7.879
.00393 2.706 3.841 5.024 6.635
7 1.415 1.8946 2.3646 2.998 3.4995 1 .0000393 .000982
4.605 5.991 7.378 9.210 10.597
8 1.397 1.8595 2.3060 2.896 3.3554 2 .0100 .0506 .103
6.251 7.815 9.348 I 1.345 12.838
] .0717 .216 J52
9 1.383 1.8331 2.2622 2.821 3.2498
'7.779 9.488 11.143 l3.277 14.860
4 .207 .484 .711
10 1.372 1.8125 2.2281 2.764 3.1693 9.236 11.070 12.832 ]5.086 16.750
11 1.363 1.7959 2.2010 2.718 3.1058 s .412 .831 1.145
1.635 J0.645 12.592 14.449 ]6.812 18.548
6 .676 1.237
12 1.356 J.7823 2.1788 2.681 3.0545 12.017 14.067 16.013 18.475 20.278
7 .989 J.690 2.167
13 1.350 1.7709 2.1604 2.650 3.0123 13.362 15.507 17.535 20.090 21.955
8 l.344 2.180 2.733
14 1.345 1.7613 2.624 2.9768 14.684 16.919 i9.023 21.666 23.589
2.1448 9 1.735 2.700 3.325
15.987 18.307 20.483 23.209 25.188
IS 1.341 1.7530 2.1315 2.602 2.9467 10 2.156 3.247 3.940
17 .275 19.675 21.920 24.725 26.751
16 1.337 1.7459 2.1199 2.583 2.9208 11 2.603 3.816 4.575
18.549 21.026 23.336 26.217 28.300
17 l.333 1.7396 2.1098 2.567 2.8982 12 3.074 4.404 5.226
19.812 22.362 24.736 27.688 29.819
18 1.330 1.7341 2.1009 2.SS2 2.8784 13 3.565 l.009 5.892
21.064 23.685 26.119 29.141 31.319
14 4.075 5.629 6,571
19 1.328 1.7291 2.0930 2.539 2.8609 27.488 30.578 32.801
4.601 6.262 7.261 22.307 24.996
20 1.325 l.7247 2.0860 2.528 2.8453 15 28.845 32.000 34.267
5.142 6.908 7.962 23.542 26.296
21 1.323 1.7207 2.0796 2.518 2.8314 16 30.191 33.409 35.718
7.564 8.672 24.769 27.587
17 5.697 34.805 37. J56
22 1.321 1.7171 2.0739 2.508 2.8188 8.231 9.390 25.989 28.869 31.526
18 6.265 36.191 38.582
23 1.319 1.7139 2.0687 2.500 2.8073 JO.l 17 27.204 30.144 32.852
8.907
24 1.318 1.7109 2.0639 2.492 2.7969 ! 19 6.844
7.434 9.591 !0.851 28.412 31.410 34.170 37.566 39.997
20 35.479 38.931 41.401
25 1.316 J.7081 2.0595 2.485 2.7874 8.034 10.283 11.591 29.615 32.671
21 36.781 40.289 42.796
26 J .315 1.7056 2.0lll 2.479 2.7787 10.982 12.338 30.813 33.924
22 8.643 41.638 44.181
J 3.091 32Jl07 35.172 38.076
27 l.314 1.7033 2.0518 2.473 2.7707 23 9.260 11.688 45.558
33.196 36.415 39.364 42.980
28 1.313 J.7011 2.0484 2.467 2.7633 24 9.886 12.401 13.848
34.382 37.652 40.646 44.314 46.928
2.7564 25 J0.520 13.120 J4.611
29 1.311 1.6991 2.0452 2.462 38.885 4] .923 45.642 48.290
26 11.160 13.844 !5.379 35.563
30 1.310 1.6973 2.0423 2.457 2.7500 36.741 40.113 43.194 46.963 49.645
27 11.808 14.573 16.151
35 1.3062 1.6896 2.0301 2.438 2.7239 37.916 41.337 44.461 48.278 50.993
28 ]2.461 15.308 l 6.928
40 1.3031 1.6839 2.0211 2.423 2.7045 }7.708 39.087 42.557 45.722 49.588 52.336
29 13.121 16.047
45 1.3007 1.6794 2.0141 2.412 2.6896 40.256 43.773 46.979 50.892 53.672
30 13.787 16.791 J8.493
so I.2987 1.6759 2.0086 2.403 2.6778
60.275
60 1.2959 l.6707 2.0003 2.390 2.6603 22.465 46.059 49.802 53.203 57.342
35 ]7.]92 20.569 66.766
51.805 55.758 59.342 63.691
70 1.2938 1.6669 J.9945 2.381 2.6480 40 20.707 24.433 26.509
57.505 61.656 65.410 69.957 73.166
80 1.2922 1.6641 J.9901 2.374 2.6388 45 24.311 28.366 30.612
63.167 67.505 71.420 76.154 79.490
90 1.2910 1.6620 l.9867 2.368 2.6316 50 27.991 32.357 34.764
74.397 79.082 83.298 88.379 9J .952
100 ].2901 J.6602 1.9840 2.364 2.6260 60 35.535 40.482 43.188
85.527 90.531 95.023 100.425 ]04.215
70 43.275 48.758 51.739
120 1.2887 1.6577 1.9799 2.358 2.6175 101.879 106.629 112.329 116.321
80 51.172 57.153 60.391 96.578
140 1.2876 1.6558 1.9771 2.353 2.6114 107.565 113.145 J 18.136 124.! 16 128.299
90 59.196 65.647 69.126
160 1.2869 J.6545 1.9749 2.350 2.6070 124.342 129.561 135.807 ]40.169
J{)() 67.328 74.222 77.929 l 18.498
180 1.2863 1.6534 1.9733 2.347 2.6035
200 1.2858 1.6525 1.9719 2.345 2.6006
ro 1.282 1.645 1.96 2.326 2.576
Apéndice 11 Tabla.~ estadísticas 827
826
Tabla G Percentites de la distribución F Tabla G (continuación)
--
1 ---
Gr(ldos
de /iberwd Crudos de libertad del mouerador
de/Je11011ii1wd<1r 10

1 24224
"
24426
"
24630
20

24836
24

24940
30

25044
40

25148
60

25253
120

25359
"'
25465
2 199.4 199.4 199.of 199.4 199.5 199.5 199.5 199.5 199.S !99.5
J 43.69 43.39 43.08 42.78 42.62 42.47 42.31 42.15 41.99 41.83
4 20.97 20.70 20.44 20.17 20.03 19.89 19.75 19.61 19.47 19.32
o 4.04 Fg.19
l 13.62 13.38 13.15 12.90 12.78 12.66 12.53 12.40 12.27 12.14
P (F9. 19 < 4.04J • .995 F99s 10.25 10.03 9.81 9.59 9.47 9.36 9.24 8.88
'7 8.38
7.2!
8.18
7.01
7.97
6.8l
7.75
6.61
7.65
6.50
7.53
6.40
7.42
6.29
9.12
7.31
6.18
9.00
7.19
6.06
7.08
S.9S
8
Grad"s 9 6.42 6.23 6.03 5.83 5.73 5.62 5.52 5.41 5.30 5.19
de libertad Grado.~ de !ibertúd del numerador
del de1w111ilwd11r I 2 3 4 l 6 7 8 9 S.85 5.66 5.47 S.27 5.17 S.07 4.97 4.86 4.75 4.64
10
11 5.42 5.24 5.0S 4.86 4.76 4.65 4.55 4.44 4.34 4.23
l 1621 l 20000 21615 22500 23056 23437 23715 23925 2409! 4'3 4.43 4.33 4.23 4.12
5.09 4.91 4.72 4.01 3.90
2
3
198.5
SS.SS
199.0
49.80
199.2
47.47
]99.2
46.19
199.3
45.39
199.3
44.84
199.4
44.43
199.4
44.13
199.4
43.88 "
[]
14
4.82
4.60
4.64
4.43
4.46
4.25
4.27
4.06
4.17
3.96
4.07
3.86
3.97
3.76
3.87
3.66
3.76
3.55
3.65
3.44
4 31.33 26.28 24.26 23.15 22.46 21.97 21.62 21.35 21 14
4.42 4.25 4.07 3.88 3.79 3.69 3.58 3.48 3.37 3.26
l
6
7
22.78
18.63
16.24
18.31
14.54
12.40
16.53
12.92
10.88
15.56
12.03
JO.OS
14.94
l t .46
9.52
14.51
11.07
9.16
14.20
10.79
8.89
13.96
10.57
8.68
13.77
10.39
8.51
"
16
17
4.27
4 14
4.10
3.97
3.92
3.79
3.73
3.61
3.64
3.51
3.54
3.41
3.44
3.31
3.33
3.21
3.22
3.10
3.11
2.98
18 4.03 3.86 3.68 3.50 3.40 3.30 3.20 3.10 2.99 2.87
8 14.69 11.04 9.60 8.81 8.30 7.95 7.69 7.50 7.34 3.59 3.40 3.31 3.21 3.11 3.00 2.89 2.78
19 3.93 3.76
9 13.61 10.11 8.72 1.96 7.47 7.13 6.88 6.69 6.54
20 3.85 3.68 3.50 3.32 3.22 3.12 3.02 2.92 2.81 2.69
10 12.83 9.43 8.08 7J4 6.87 654 6.30 6.12 5.97 .l.77 3.60 3.43 3.24 3.15 3.05 2;95 2.84 2.73 2.61
11
12
12.23
11. 75
8.91
8.51
7.60
7.23
6.88
6.52
6.42
6.07
6.10
5.76
5.86
S.52
5.68
S.35
5.54
5.20
"
22 J.70
3.64
3.54
3.47
3.36
3.30
3.18
3.12
3.08
3.02
2.98
2.92
2.88
2.82
2.77
2.7!
2.66
2.60
2.55
2.48
13 11.37 8.19 6.93 6.23 5.79 5.48 5.25 5.08 23
4.94 3.59 J.42 3.25 3.06 2.97 2.87 2.77 2.66 2.55 2.43
14 11.06 7.92 6.68 6.00 5.56 5.26 5.03 4.86 4.72
24
2l 3.54 3.37 3.20 3.01 2.92 2.82 2.72 2.61 2.50 2.38
ll 10.80 7.70 6.48 5.80 5.37 5.07 4.85 4.67 4.54 2.97 2.87 2.77 2.67 2.56 2.45 2.33
26 3.49 3.33 3.15
16 10.58 7.51 6.30 5.64 5.21 4.91 4.69 4.52 4.38 2.93 2.83 2.73 2.63 2.52 2.41 2.29
27 J.45 3.28 3.11
17 10.38 7.35 6.16 5.50 5.07 4.78 4.56 4.39 4.25 2.89 2.79 2.69 2.59 2.48 2.37 2.25
28 J.41 3.25 3.07
18 10.22 7.21 6.03 5.)7 4.96 4.66 4.44 4.28 4.14 2.76 2.66 2.56 2.45 2.33 2.21
29 ) .38 3.21 3.04 2.86
19 10.07 7.09 5.92 5.27 4.85 4.56 4.34 4.18 4.04
30 3.34 3.18 3.0l 2.82 2.73 2.63 2.52 2.42 2.30 2.18
20 9.94 6.99 S.82 5.17 4.76 4.47 4.26 4.09 3.96 2.50 2.40 2.30 2.18 2.06 1.93
40 3.12 2.95 2.78 2.60
9.83
"
22
23
9.73
9.63
6.89
6.81
6.73
5.73
S.65
5.58
5.09
5.02
4.95
4.68
4.6!
4.54
4.39
4.32
4.26
4.18
4.11
4.05
4.01
3.94
3.88
J.88
J.81
3.75
60
120
00
2.90
2.71
2.52
2.74
2.54
2.36
2.57
2.37
2.19
2.39
2.19
2.00
2.29
2.09
1.90
2.19
1.98
1.79
2.08
\.87
l.67
1.96
1.15
1.53
1.83
1.6'
l.36
1.69
1.43
J.00
24 9.55 6.66 S.52 4.89 4.49 4.20 3.99 3.8) 3.69
2l 9.48 6.60 5.46 4.84 4.43 4.15 3.94 3.78 3.64
26 9.41 6.54 5.41 4.79 4.38 4.JO 3.89 3.73 3.60
27 9.34 6.49 5.36 4.74 4.34 4.06 3.85 3.69 3.56
28 9.28 6.44 5.32 4.70 4.30 4.02 3.81 3.65 3.52
29 9.23 6.40 5.28 4.66 4.26 3.98 3.77 3.61 3.48
30 9.18 6.35 5.24 4.62 4.23 3.95 3.74 3.58 3.45
40 8.83 6.07 4.98 4.37 3.99 3.71 3.S I 3.35 3.22
60 8.49 5.79 4.7) 4.14 3.76 3.49 3.29 3.13 3.01
120 8.18 S.54 4.SO 3.92 3.55 3.28 3.09 2.9) 2.81
00 7.88 5.30 4.28 3.72 3.35 J.09 2.90 2.74 2.62
828 Apéndice JI Tablas estadísticas 829
Tabla G (continuación) Tabla G (conrinuación)

F.,,
Grados
Grado1 de libertad Grados de libertad del numerad:ir
Je/de,wmirwdor 10 24
de !iberwd
de/denominador 1 2 J
Grados de liberiad del 1111merador
4
12
" 20 JO
'º 60 120
"'
1 4052 4999.5 540) S62S 5764
' ' 7 8 9
1
2 '°"
99.40
6106
99.42
6157
99.4)
6209
99.45
62)5
99.46
6261
99.41
6287
99.47
631)
99.48
6)3'} 6366
99.49 99.50
5859 5928 5981 6022 26.60 26.50 26.)2 26.22 26.13
'
J
4
98.SO
34.12
21.20
99.00
30.82
18.00
99.17
29.46
!6.69
99.25
28.7 J
99.)0
28.24
99.))
27.91
99.36
27.67
99.)7
27.49
99.39
2i.35
J

27.23
14.55
27.05
14.37
26.87
14.20
26.69
14.02 ll.93 Jl.84
26.41
13.7'.5 13.6'.5 13.S6 13.46
15.98 l'.5.52 15.2! 14.98 14.80 14.66
JO.OS 9.89 9.12 9.'.55 9.47 9.38 9.29 9.20 9.11 9.02

'
6
16.26 1).27 12.06 l ! .39 10.97 10.67 10.46 !0.29 10.16
''7 7.87
6.62
7.72
6.47
7.56
6.)1
7.40
6.16
7.31
6.07
7.23
S.99
7.14
5.91
7.06
5.82
6.97
'.5.74
6.88
S.65
1J.75 10.92 9.78 9.1 S 8.75 8.47 8.26 8.10 7.98
7 12.2~ 9.55 8.45 7.85 8 S.81 5.61 S.'.52 '.5.)6 5.28 '.5.20 S.12 5.03 4.9'.5 4.86
7.46 7.19 6.99 6.84 6.72
8 J 1.26 8.65 7.59 7.01 9 5.26 5.11 4.96 4.81 4.73 4.65 4.57 4.48 4.40 4.31
6.63 6.37 6.18 6.03 5.91
9 10.56 8.02 6.99 6.42 6.06 '.5.80 5.61 5.47 5.3'.5
10 4.85 4.71 4.56 4.41 4.)3 4.25 4.17 4.08 4.00 3.91
10 10.04 7.56 6.'.55 11 4.54 4.40 4.2'.5 4.\0 4.02 ).94 3.86 3.78 3.69 3.60
'.5.99 5.64 5.39 5.20 5.06 4.94
11 9.65 7.21 6.22 12 4.30 4.16 4.01 3.86 3.78 3.70 3.62 ).54 3.4'.5 3.36
5.6i 5.32 '.5.07 4.89 4.74 4.63
12 9.JJ 6.93 13 4.10 3.96 3.82 3.66 3.59 3.SI 3.43 3.34 3.25 ).17
5.95 5.41 5.06 4.82 4.64 4.50 4.39 ).00
13 9.07 6.70 '.5.74 14 3.94 3.BO 3.66 3.51 3.43 3.35 3.27 3.18 3.09
5.21 4.86 4.62 4.44 4.30 4.19
14 8.86 6.SI 5.56 5.04 4.69 4.46 4.28 4.14 4.03 3.67 3.52 3.37 3.29 3.21 3.13 3.0S 2.96 2.87
3.80

"
l6
8.68
8.53
6.36
6.23
5.42
5.29
4.89
4.77
4.56
4.44
4.32
4.20
4.14
4.0)
4.00
3.89
3.89 "17
16 3.69
3.59
3.55
3.46
3.41
3.3 !
3.26
3.16
3.18
.l.08
3.10
3.00
3.02
2.92
2.93
2.83
2.84
2.75
1.15
2.65
3.78 l.08 3.00 2.92 2.84 2.75 2.66 2.57
17 8.40 6.11 S.l8 467 4.34 4.10 3.93 3.79 18 3.51 3.37 3.23
3.68 2.92 2.84 2.76 2.67 2.58 2.49
18 8.29 6.01 5.09 4.'.58 4.25 4.0l 3.84 19 3.43 3.30 3.15 3.00
3.71 3.60
19 8.18 S.93 '.5.01 4.50 4.17 3.94 3.77 3.6} 3.52 3.09 2.94 2.86 2.78 2.69 2.61 2.52 2.42
20 3.37 3.23
2ú B. 10 21 J.31 3.17 3.03 2.88 2.80 2.72 2.64 2.'.55 2.46 2.36
S.85 4.94 4.43 4-10 3.87 3.70 3.56 !.46
21 8.02 S.78 22 3.26 3.12 2.98 2.8) 2.15 2.67 2.S8 2.SO 2.40 2.31
4.87 4.37 4.04 3.81 3.64 3.51 3.40 2.26
3.07 2.93 2.78 2.70 2.62 2.54 2.4S 2.3'.5
"
23
24
7.95
7.88
7.82
5.72
5.66
S.61
4.82
4.76
4.72
4.J 1
4.26
4.22
3.99
3.94
3.90
3.76
3.71
3.67
J.59
3.54
3.50
3.45
3.4!
3.36
3-35
3.30
3.26
23

"
J.21
3.17 J.03 2.89 2.74 2.66 2.58 2.49 2.40 2.31

2.27
2.21

2.17
2.99 2.85 2.70 2.62 2.54 2.45 2.36
" 3.13
2.96 2.81 2.66 2.58 2.50 2.42 2.33 2.23 2.13

""
7.77 5.Si 4.68 4.l8 3.85 3.63 3.46 3.)2 26 3.09
3.22 2.78 2.63 2.55 2.47 2.38 2.29 2.20 2.10
7.i2 5.53 4.64 4.14 3.82 3.59 ).42 3.29 27 3.06 2.93
3.18 2.75 2.60 2.52 2.44 2.35 2.26 2.17 2.06
3.03 2.90
27
28
29
7.68
7.64
7.60
5.49
S.45
5.42
4.60
4.57
4"
4.1 i
4.07
4.04
J.78
3.75
3.73
3.'.56
3.53
3.50
3.39
3.)6
3.33
3.26
3.23
3.20
J.15
3.12
3.09
"29 ).00 2.87 2.73 2.57 2.49 2.41 2.33 2.23

2.11
2.14

2.11
2.0)

2.01
JO 2.98 2.84 2.70 2.55 2.47 2.39 2.30
JO 40 2.80 2.66 2.52 2.37 2.29 2.20 2.1 l 2.02 J.92 1.80
7.56 5.39 4.51 4.02 3.70 3.47 3.30 3.l 7 3 07
2.63 2.50 2.35 2.20 2.12 2.03 1.94 1.84 1.73 1.60
'º60 7 JI
7.08
5.)8
4.98
4.31
4.13
J 83
3.65
3.51
3.34
J 29
3.12
J.12
2.95
2.99
2.82
2.89
2.72
60
120 2.47 2.34 2.19 2.03
1.88
J.95
l.79
1.86
J.70
1.76
1.S9
1.66
1.47
1.5)
1.32
1.38
100

z
6.85
6.63
4.79
4.6!
3.95
3.78
J.48
3.32
3.17
J 02
2.96
2.80
2.79
2.64
2.66
2.51
2.S6
2.41
"' 2.32 2. !8 2.04

)
Apéndice 11 Tablas estadísticas 831
830
Tabla G (continuación) Tabla G (continuación)

f'.915 (;,-¡¡¡/,,s
dc· lih,·rwd Grados de libert,id del ,wmert1dor
r/1'1 de1wmi11,1do1 10 ro
Gr,idoI
deiiberwd
de! de110111im1dr,r J 2
Grados de libertad del 11u111erad,1r
968.6
12

976.7
"
984.9
20
993.1
24

997.2 1001
JO
'º 60 120

1018

1 647.8 199.S
3

864.2
4

899.6
'
921.8
6

937.1 948.2
7 8

956.7
9

963.3
1
2
3
39.40
14.42
)9.41
14.34
39.43
14.25
39.45
14.17
39.46
14.12
39.46
14.08
1006
39.47
14.04
1010
39.48
IJ.99
1014
)9.49 39.SO
13.95 1).90
2 38.S! 39.00 39.17 39.25 39.30 39.JJ 39.36 39.37 39.39 4 8.84 8.15 8.66 8.56 8.51 8.46 8.41 8.36 8.31 8.26
3 17.44 16.04 I S.44 I S.10 14.88 14.73 14.62 14.54 14.47
12.22 10.65 6.52 6.43 6.33 6.28 6.23
4 9.98 9.60 9.36 9.20 9.07 8.98 8.90
'7
6
6.62
5.46 5.37 5.27 5.17 5.12 5.07
6.18
5.01
6.12
'-"
6.07
4.90
6.02
4.85

''
7
JO.O!
8.81
8.07
8.43
7.26
6.54
7.76
6.60
5.89
7.39
6.23
5.'.52
7.15
5.99
5.29
6.98
5.82
5.12
6.85
5.70
4.99
6.76
'.5.60
4.90
6.68
5.52 8
9
4.76
4.30
3.96
4.67
4.20
3.87
4.57
4.10
J.77
4.47
4.00
3.67
4.42
3.9'.5
3.61
4.36
3.89
3.56
4.31
3.84
3.51
4.25
3.78
3.45
4.20
3.73
3.39
4.14
3.67
3.33
4.82
8 7.57 6.06 '.5.42 5.05 4.82 4.65 4.53 4.43 4.36
9 7.21 5.71 5.08 4.72 4.48 4.32 4.20 4.10 4.0J 10 3.72 3.62 3.52 3.42 3.37 3.31 3.26 3.20 3.14 3.08
11 3.53 3.43 3.33 3.23 3.17 3.12 3.06 3.00 2.94 2.88
IO 6.94 5.46 4.83 4.47 4.24 4.07 3.95 3.85 3.78 12 3.37 3.28 3.18 J.07 • 3.02 2.96 2.91 2.85 2.19 2.72
11 6.72 5.26 4.63 4.28 4.04 3.88 3.76 3.66 3.'.59 ll 3.25 3.1'.5 3.0S 2.95 2.89 2.84 2.78 2.72 2.66 2.60
12 6.55 5.10 4.47 4.12 3.89 3.73 3.61 3.51 3.44 1, 3.15 3.05 2.95 2.84 2.79 2.73 2.67 2.61 2.55 2.49
l3 6.4! 4.97 4.35 4.00 3.77 3.60 3.48 3.39 3.31
14 6.30 4.86 4.24 3.89 3.66 3.50 3.38 3.29 3.21 15 3.06 2.96 2.86 2.76 2.70 2.64 2.59 2.52 2.46 2.40
16 2.99 2.89 2.79 2.68 2.63 2.57 2.51 2.45 2.38 2.32
2.44 2.38 2.32 2.25

""
6.20 4.77 4.1 S 3.80 3.58 J.41 3.29 ).20 3.12 17 2.92 2.82 2.72 2.62 2.56 2.SO
6.12 4.69 4.08 3.73 3.50 3.)4 3.22 3.12 3.05 18 2.87 2.77 2.67 2.56 2.SO 2.44 2.38 2.32 2.26 2.\9
17 6.04 4.62 4.01 3.66 3.44 3.28 3.16 3.06 2.98 19 2.82 2.72 2.62 2.51 2.45 2.39 2.33 2.27 2.20 2.13
18 5.98 4.56 3.95 J.61 3.38 3.22 3.10 J.Ol 2.93
19 5.92 4.51 3.90 3.56 3.33 3.17 3 o, 2.96 2.88 20 2.77 2.68 2.57 2.46 2.41 2.35 2.29 2.22 2.16 2.09
21 2.73 2.64 2.53 2.42 2.37 2.31 2.25 2.18 2.11 2.04
20 5.87 4.46 3.86 3.51 3.29 J.13 3.01 2.9[ 2.84 22 2.70 2.60 2.50 2.39 2.33 2.27 2.21 2.14 2.08 2.00
21 S.83 4.42 3.82 3.48 J.25 3.09 2.97 2.87 2.80 23 2.67 2.57 2.47 2.36 2.30 2.24 2.18 2.11 2.04 1.97
2.08 2.01 1.94
"
23
24
519

"'
5.72
4.38
4.35
4.32
3.78
3.75
3.72
3.44
3.41
3.38
3.22
3.18
3.15
3.05
3.02
2.99
2.93
2.90
2.87
2.84
2.81
2.78
2.76
2.73
2.70
24
2S
2.64

2.61
2.'.54

2.SI
2.44

2.41
2.33

2.30
2.27

2.24
2.21

2.18
2.15

2.12 2.05 1.98 1.9[


26 2.59 2.49 2.39 2.28 2.22 2.16 2.09 2.03 1.95 1.88
2.07 2.00 1.93 J.85
"
26
27
5.69
5.66
5.63
4.29
4.27
4.24
3.69
3.67
3.65
3.35
3.33
3.31
3.13
3.10
3.08
2.97
2.94
2.92
2.85
2.82
2.80
2.75
2.73
2.71
2.68
2.65
2.63
27
28
29
2.57
2.55
2.53
2.47
2.45
2.43
2.36
2_34
2.32
2.25
2.23
2.21
2.19
2.17
2.15
2.13
2.11
2.09
2.05
2.03
].98
1.96
1.91
1.89
1.83
1.81

"29
5.61
5.59
4.22
4.20
3.63
3.61
3.29
3.17
).06
3.04
2.90
2.88
2.78
2.76
2.69
2.67
2.61
2.59 30
40
2.51
2.39
2.41
2.29
2.31
2.18
2.20
2.07
2.14
2.01
2.07
1.94
2.0l
1.88
1.94
1.80
1.87
1.72
J.79
1.64
30 5.57 4.18 3.59 3.25 3.03 2.87 2.75 2.65 2.57 60 2.27 2.17 2.06 1.94 1.88 1.82 1.74 \.67 1.58 1.48
40 S.41 4.05 J.46 3.13 2.90 2.74 2.62 2.53 2.45 120 2.16 2.05 1.94 1.82 1.76 1.69 1.61 1.53 t.43 1.31
60 5.29 3.93 3.34 3.01 2.79 2.63 2.51 2.4! 2.33 00 2.05 1.94 l.83 l. 71 1.64 1.57 \.48 J.39 1.27 1.00
120 5.15 J.80 J.23 2.89 2.67 2.52 2.39 2.30 2.22
5.02 3.69 3.12 2.79 2.57
" 2.41 2.29 2. 19 2.11
Apéndice JI Tablas estadísticas 833
832
Tabla G (continuación) Tabla G (continuación)

Grados
F.9s de liber111d Grados de libertad del numerador
del de110111inadm 10
Grad,is
de iiberrad
Grados de liberwd del numerador
1
1
1
12
" 20 24 )O 40 60 120
"'
del denominador I 2 ) 4
' • 7 8
' 1
2
1 241.9
19.40
243.9
19.41
Zt.5.9
19.43
248.0
19.45
249.1
19.45
250.1
19.46
251 .1
19.47
252.2
19.48
25).3 254.3
19.49 19.SO
1
2
)
161.4
18.SI
10.13
199.S
19.00
9.SS
215.7
19.16
9.28
224.6
19.25
9.12
230.2
19.30
9.01
234.0
19.)J
8.94
236.8
19.35
8.89
238.9
]9.37
8.85
240.S
19.38
8.81
i'
)
4
8.79
S.96
8.74
5.91
8.70
5.86
8.66
5.80
8.64
S.77
8.62
S.15
8.59
5.72
8.57
5.69 ,_,.
8.55 8.53
S.63

'' 4.SO

''
7.71 6.94 6.59 6.39 6.26 6.16 6.09 6.04 6.00 4.74 4.68 4.62 4.56 4.53 4.46 4.43 4.40 4.36
4
4.06 4.00 3.94 3.87 3.84 3.81 3.77 3.74 3.70 3.67
1 7 3.64 3.57 3.51 3.44 3.41 3.38 3.34 3.30 3.27 3.23
5.19 S.41 5.19 5.0S 4.95 4.88 4.82 4.77
•'7
6.61
S.99 S.14 4.76 4.SJ 4.39 4.28 4.21 4.IS 4.10 i 8 ].35 3.28 3.22 3.15 3.12 3.08 3.04 3.01 2.97 2.93
2.71
8
5.S9
S.32
4.74
4.46
4.35
4.07
4.12
3.84
3.97
3.69
3.87
J.SS
l.79
3.SO
3.73
].44
3.68
3.39 ' 3.14 J.07 3.01 2.94 2.90 2.86 2.83 2.79 2.75

• 5.12 4.26 3.86 3.63 3.48 3.)7 J.29

3.14
).2)

3.07
J.18

3.02
1
1
'
10
11
12
2.98
2.85
2.75
2.91
2.79
2.69
2.8S
2.72
2.62
2.77
2.65
2.54
2.74
2.61
2.SI
2.70
2.57
2.47
2.66
2.53
2.43
2.62
2.49
2.38
2.58
2.45
2.34
2.54
2.40
2.30
10 4.96 4.10 3.71 3.48 3.33 3.22 i
4.84 3.98 3.59 3.36 3.20 3.09 3.01 2.95 2.90 1 1) 2.67 2.60 2.Sl 2.46 2.42 2.38 2.)4 2.30 2.25 2.21
11
4.7S 3.89 3.49 3.26 3.11 ).00 2.91 2.85 2.80 '' 14 2.60 2.5) 2.46 2.39 2.35 2.31 2.27 2.22 2.18 2.1 J
12
13 4.67 3.81 3.41 3.18 ].03 2.92 2.83 2.77 2.71
2.54 2.48 2.33 2.29 2.25 2.20 2.16 2.11 2.07
14 4.60

4.54
3.74

3.68
3.34

3.29
3.11
3.06
2.96

2.90
2.8S

2.79
2.76

2.71
2.70

2.64
2.65

2.S9
"
16
17
2.49
2"
2.42
2.38
2.40
2.35
2.31
2.28
2.23
2.24
2.19
2.19
2.15
2.15
2.10
2.11
2.06
2.06
2.01
2.01
1.96
"
16 4.49 3.6] 3.24 J.01 2.85 2.74 2.66 2.59 2.54 18 2.41 2.34 2.27 2.19
2.16
2.15
2.11
2.11
2.07
2.06
2.03
2.02
1.98
1.97
1.93
1.92
1.88
17
18
4.45
4.41
3.59
3.SS
3.52
3.20
3.16
3.13
2.96
2.93
2.90
2.8\
2.77
2.74
2.70
2.66
2.63
2.61
2.58
2.S4
2.SS
2.S l
2.48
2.49
2.46
2.42
"
20
2.38

2.35
2.31

2.28
2.23

2.20 2.12 2.08 2.04 1.99 l.9S 1.90 1.84


"
20
4.38

4.35 3.49 3.10 2.87 2.71 2.60 2.SI 2.45 2J9


21
l2
2.32
2.30
2.2S
2.2]
2.18
2.1 S
2.JO
2.07
2.05
2.03
2.01
1.98
1.96
J.94
1.92
1.89
1.87
1.84
1.81
1.78
21 4.)2 ).47 3.07 2.84 2.68 2.51 2.49 2.42 2.37 2) 227 2.20 2.13 2.0S 2.01 1.96 1.91 1.86 1.81 l. 76
i 1.79 l. 73
22 4.30 ).44 3.05 2.82 2.66 2.55 2.46 2.40 2.34 ' 24 2.25 2.18 2.11 2.03 1.98 1.94 1.89 1.84
3.42 3.03 2.80 2.64 2.53 2.44 2.37 2.32
"'
2)
2.24 2.16 2.09 2.01 1.96 1.92 1.87 1.77 1.71
24 4.26

4.24
3.40

3.39
3.0l

2.99
2.78

2.76
2.62

2.60
2.SI

2.49
2.42

2.40
2.36

2.34
2.30

2.28
"
26
27
2.22
2.20
2.15
2.:1
2.07
2.06
1.99
1.97
1.95
1.93
1.90
1.88
1.85
1.84
1.82
1.80
1.79
1.75
1.73
J.69
1.67
"
26
27
4.23
4.21
3.37
3.JS
2.98
2.96
2.74
2.7)
2.59
2.S7
2.47
2.46
2.39
2.37
2.32
2.31
2.27
2.2S
28
29
2.19
2.18
2.12
2.10
2.04
2.03
1.96
1.94
1.91
1.90
1.87
J.85
1.82
1.81
1.77
1.75
1.71
\.70
1.65
1.64
28 4.20 3.34 2.95 2.71 • 2.56 2.45 2.36 2.29 2.24
29 4.18 ).33 2.93 2.70 2.SS 2.43 2.35 2.28 2.22 1 )0 2.16 2.09 2.01 1.93 1.89 1.84 1.79 1.74 1.68 f.62
40 2.08 2.00 1.92 1.84 1.79 1.74 1.69 1.64 1.58 1.S I
)O 4. 17 3.32 2.92 2.69 2.53 2.42 2.3) 2.27 2.21 1 60 1.99 1.92 1.84 t.75 1.70 1.65 1.59 1.53 1.47 1.39
40 4.08 3.23 2.84 2.61 2.45 2 )4 2.25 2.18 2.12 '
1 120 l. 91 1" 1.75 1.66 1.61 1.55 1.50 1.43 1.35 1.25
60 4.00 3.15 2.76 2.5) 2.37 2.25 2.17 2.10 2.04 '- 1.83 1.75 1.6 7 1.57 J.52 1.46 1.39 1.32 1.22 1.00
2.68 2.45 2.29 2.17 2.09 2.02 1.96 '

"'
3.92
3.84
3.07
)00 2.60 2.37 2.21 2.10 2.01 1.94 1.88
834
ApéJJdice JI Tablas estadísticas 835
Tabla G ( continuación) Tabla G (continuación)

,~ Grados
de libertad Grudus de libert,1d del numer11dor
del denomi11ad11r 1o 12 15
Grados
de libertad Grados de libertad del numerador
20 24 30 40 60 120
"'
Je/ denomimulor 1 2 3 4 5 6 7 8 9 1 60 19 60 71 61 22 61 74 62 00 62 26 62 53 62 79 6306 63 33
2 939 941 9 42 944 9 45 946 9" 947 948 949
1 39 86 49 50 53 59 55 83 57 24 58 20 5891 59 44 59 86 3 523 5 22 520 518 518 517 516 515 514 513
2 853 9 00 916 9 24 929 933 935 937 9 38 4 392 390 387 384 383 382 380 3 79 378 3 76
3 554 5 46 5 39 5 34 5 31 528 5 27 525 524 5 3 30 327 324 3 21 3 19 317 316 3" 312 310
4 4 54 4 32 419 '11 4 05 4 01 3 98 3 95 3" 6 2" 290 287 28' 282 280 2 78 276 274 272
5 4 06 3 78 3 62 352 345 340 337 3" 332 7 270 2 67 2 63 259 2 58 256 2 54 2 51 2 49 2 47 .
6 3 01 8 254 250 2'6 2'2 2 38 2 36
7
3
3
78
59
346
326
3 29
3 07
3 18
2 96
3 11
2 88
3 05
283 2 78
298
275
2 96
272 9 2" 2 38 2" 2 30 "º
228 225 2 23
234
2 21
2 32
218
2 29
216
8 3 46 3 11 292 2 81 2 73 267 262 2 59 2 56 10 2 32 2 28 224 220 218 216 213 2 11 208 206
9 3 36 3 01 281 2 69 2 61 255 2 51 2'7 2 44 11 2 25 2 21 217 212 210 2 08 205 203 200 197
10 3 29 292 273 26• 252 2 46 24' 2 38 235 12 2" 215 210 2 06 204 2 01 199 196 193 190
11 323 286 266 2 54 245 239 234 230 2 27 13 2" 210 2 05 2 01 198 196 193 190 188 185
12 22, 210 2 05 2 01
13
318
3 "
2 81
276
2 6'
256
2 48
2 43
2 39
235
233
228
2 28
223
2 24
220 216 "
15 2 06 2 02 , 97
196
192
'"
190
' 91
'87
189
185
1 86
'82
183
1 79
180
176
3 ,o 2 52 23, 224
"15 273 2 39 219 215 212 194
'"
16
3 07
3 05
270
2 67
2 49
2'6
236
233
227
224 "'
218
21,
2 1:.l
212
2 09
2 09
206
"
17
18
2 03
2 00
198
199
196
1 93
1"
189
189
186
184
'87
'"
181
' 81
1 78
1 81
178
175
178
'75
172
175
1 72
169
1 72
1 69
166
17 3 03 264 2'4 2 31 2 22 2 15 210 2 06 2 03 19 196 1 91 186 181 1 79 176 173 170 1 67 163
18
19
3 01
2 99
2 62
2 6•
2" 229
227
220 213 2 08
2 06
'04 l 00
20 1" 189 1" 1 79 177 1" 171 168 1 64 1 61

20 2 97 2 59

238 225
2 18
2 16
2"
2 09 2 04
2 02
2 00
198
196
21
22
192
190
1 87
1 86
183
1 81
178
176
175
173
172
170
1 69
167
1 66
1 64
162
1 60
1 59
157
21 296 257 236 2 23 214 2 08 2 02 198 195 23 189 1" 1 80 1 74 l 7~ 169 166 1 62 1 59 155
22 295 2 56 235 222 213 2 06 2 01 1 97 193 1 88 183 1 78 173 170 , 67 1 64 161 157 153
23 2"
2 93
255
254
2"
233
2 21 2 11
210
205
2 04
199
1 98
195 192
191
"
25 1 87 182 1 77 172 169 166 163 1 59 156 152
"
25 292 253 2 32
219
2 18 2 09 2 02 197
1"
193 1 89
26
27
1 86
185
1 81
180
176
175
171
170
1 68
167
• 65
1"
1 61
160
158
157
1 54
153
150
1 49
26
27
2 91
290
2 52
2 51
2 31
230
2 17
2 17
2 08
2 07
2
2 00
º' 196
195
192
191
1 88
187
28
29
184
183
1 79
1 78
174
173
1 69
1 68
1 66
1 65
163
1 62
1 59
1 58
156
155
1 52
151
148
1 47
28 2 89 250 2 29 216 2 06 2 00 194 190 187
30 182 177 172 167 164 1 61 157 154 1 50 146
29 2 89 250 228 215 2 06 199 193 1 89 186
40 176 1 66 1 38
171 1 61 157 154 151 147 142
30 2 88 2 49 228 205 1 98 193 1 88 135 60 171 1 66 1 60 154 1 51 148 144 140 1 35 129
2 "
40 284 244 223 2 09 2 00 1 93 1 87 183 '79 120 165 160 155 148 145 141 137 1 32 126 119
60 279 239 218 2 04 195 1 87 '82 177 1 74 1 60 155 149 142 138 134 130 1 24 117 1 00
120 275
2 71
235
230
213
2 08
199
19< "º
185
182
177
' 77
172
172
1 67
'68
'63
"'
"'
Apéndice JI Tablas estadísticas 837
836
Tabla H Puntos porcentuales de los rangos corregidos por Student <le 2 a 20 Tabla H (continuación)
tratamientos, puntos del 5% superior
Error
R
df 11 12 13 14 IS 16 17 18
•• 20
E.rrur
df 2 3 4 s • 7 8
• 10
16
17
5.26
5.21
5.35
5.31
5.44
5.39
5.52
5.41
5.59
5.54
5.66
5.61
5.73
5.67
5.79
5.73
5.84
5.79
5.90
5.84

'-
e l 17.97 26.98 32.82 37.08 40.41 43.12 45.40 47.36 49.07
J8 5.17 S.27 S.35 5.43 S.50 5.57 5.63 5.69 5.74 5.79
2 6.08 8.33 9.80 10.88 11.74 12.44 13.03 13.54 13.99 19 5.14 5.23 5.31 5.39 5.46 5.53 5.59 S.65 5.70 S.75
3 4.50 5.91 6.82 7.50 8.04 8.48 8.85 9.18 9.46 ,o 5.11 S.20 5.28 5.36 5.43 5.49 5.55 S.61 5.66 5.71
4 3.93 5.04 5.76 6.29 6.71 7.05 7.35 7.60 7.83
3.64 4.60 5.22 5.67 6.03 6.33 6.58 6.80 6.99 24 S.01 5.10 5.18 5.25 5.32 5.38 5.44 5.49 S.55 5.59
5
JO 4.92 5.00 5.08 5.15 5.21 5.27 5.33 5.38 5.43 5.47
6 3.46 4.34 4.90 5.30 5.63 5.90 6.12 6.32 6.49
40 4.82 4.90 4.98 5.04 5.11 5.16 5.22 5.27 5.31 5.36
7 3.34 4.16 4.68 5.06 5.36 5.61 5.82 6.00 6.\6 60 4.73 4.81 4.88 4.94 5.00 5.06 5.11 5.15 5.20 5.24
8 3.26 4.04 4.SJ 4.89 5.17 5.40 5.60 5.77 5.92 120 4.64 4.71 4.78 4.84 4.90 4.95 5.00 5.04 5.09 5.13
9 3.20 3.95 4.41 4.76 5.02 5.24 5.43 5.59 5.74 4.55 4.62 4.68 4.74 4.80 4.85 4.89 4.93 4.97 5.01
lO 3.15 3.88 4.33 4.65 4.91 5.12 5.30 5.46 5.60 "
11 3.11 3.82 4.26 4.57 4.82 5.03 5.20 5.35 5.49
12 3.0!! 3.77 4.20 4.51 4.75 4.95 5.12 5.27 5.39
13 3.06 3.73 4.15 4.45 4.69 4.88 5.05 5.19 5.32
14 3.03 3.70 4.11 4.41 4.64 4.83 4.99 5. 13 5.25
15 3.01 3.67 4.08 4.37 4.59 4.78 4.94 5.08 5.20
Puntos del 1% superior
16 J.00 3.65 4 05 4.33 4.56 4.74 4.90 5.03 5.15
17 2.98 3.63 4.02 4.30 4.52 4.70 4.86 4.99 5.11 Error
J8
19
2.97
2.96
3.61
3.59
4.00
3.98
4.28
4.25
4.49
4.47
4.67
4.65
4.82
4.79
4.96
4.92
5.07
5.04
df 2 3 4 5 • 7 8
• 10

,o 2.95 3.58 3.96 4.23 4.45 4.62 4.77 4.90 5.01 135.0 164.3 185.6 202.2 215.8 227.2 237.0 245.6
1 90.03
4.81 4.92 2 14.04 19.02 22.29 24.72 26.63 28.20 29.53 30.68 31.69
24 2.92 3.53 3.90 4.17 4.37 4.54 4.68
4.72 4.82 J 8.26 10.62 12.17 13.33 14.24 15.00 15.64 16.20 16.69
30 2.89 3.49 3.85 4.10 4.30 4.46 4.60
4.63 4.73 4 6.51 8.12 9.17 9.96 10.58 11.10 11.55 11.93 12.27
40 2.86 3.44 3.79 4.04 4.23 4.39 4.52
4.65 5 5.70 6.98 7.80 8.42 8.91 9.32 9.67 9.97 10.24
60 1.83 3.40 3.74 3.98 4.16 4.31 4A4 4.55
110 2.80 3.36 3.68 3.91 4.10 4.24 4.36 4.47 4.56 8.61 8.87 9.10
6 5.24 6.33 7.03 7.56 7.97 8.32
X 2.77 3.31 3.63 3.86 4.03 4.17 4.29 4.39 4.47 7.68 7.94 8.17 8.37
7 4.95 5.92 6.54 7.01 7.37
7.86

,. 8 4.75 5.64 6.20 6.62 6.96 7.24 7.47 7.68


Error 9 4.60 5.43 5.96 6.35 6.66 6.91 7.13 7.33 7.49
df ll 12 13 14 15 16 17 18 20 JO 4.48 5.27 5.77 6.14 6.43 6.67 6.87 7.05 7.21

11 4.39 5.15 5.62 5.91 6.25 6.48 6.67 6.84 6.99


1 50.59 51.96 53.20 54.33 55.36 56.32 57.22 58.04 58.83 59.56
12 4.32 5.05 5.50 5.84 6.10 6.32 6.51 6.67 6.81
1 14.39 14.75 15.08 15 38 15.65 15.91 16.14 16.37 16.57 16.77
13 4.26 4.96 5.40 5.73 5.98 6.19 6.37 6.53 6.67
J 9.72 9.95 10.15 10.35 10.52 !0.69 !0.84 10.98 11.11 11.24
14 4.21 4.89 5.32 5.63 5.88 6.08 6.26 6.41 6.54
4 8.03 8.21 8.37 8.52 8.66 8.79 8.91 9 03 9.13 9 23
15 4.17 4.84 5.25 5.56 5.80 5.99 6.16 6.31 6.44
5 7.17 7.32 7.47 7.60 7.72 7.83 7.93 8.03 8.12 8.21
16 4.13 4.79 5.19 5.49 5.72 5.92 6.08 6.22 6.35
6 6.65 6.79 6.92 7.03 714 7 24 7.34 7.43 7 51 7.59
J7 4.10 4.74 5.14 5.43 5.66 5.85 6.01 6.15 6.27
7 6.30 6.43 6.55 6.66 6.76 6.85 6.94 7.02 7.10 7.17
J8 4.07 4.70 5.09 5.38 5.60 5.79 5.94 6.08 6.20
8 6.05 6.18 6.29 6.39 6.48 6.57 6.65 6.73 6.80 6.87
6.14

IO
• 5.87
5.72
5.98
5.83
6.09
5.93
6.19
6.03
6.28
6.11
6.36
6.19
6.44
6.27
6.51
6.34
6.58
6.40
6.64
6.47
19
20
4.05
4.02
4.67
4.64
5.05
5.02
5.33
5.29
5.55
5.51
5.73
5.69
5.89
5.84
6.02
5.97 6.09

24 3.96 4.55 4.91 5.17 5.37 5.54 5.69 5.81 5.92


11 5.61 5.71 5.81 5.90 5.98 6.06 6.13 6.20 6.27 6.33
30 3.89 4.45 4.80 5.05 5.24 5.40 5.54 5.65 5.76
12 5.51 5.61 5.71 5.80 5.88 5.95 6.02 6.09 6.15 6.21
40 3.82 4.37 4.70 4.93 5.11 5.26 5.39 5.50 5.60
i3 5.43 5.53 5.63 5 71 5.79 5.86 5.93 5.99 6.05 6.1 l
60 3.76 4.28 4.59 4.82 4.99 5.13 5.25 5.36 5.45
14 5.36 5.46 5 55 5.t,4 5.71 5.79 5.85 5.91 5.97 6.03
120 3.70 4.20 4.50 4.71 4.87 5.01 5.12 5.21 5.30
15 5.3\ 5.40 5.49 5.57 5.65 5.72 ~.78 5.85 5.90 5.96
oc 3.64 4.12 4.40 4.60 4.76 4.88 4.99 5.08 5.16
, · , · 2 -, 5"·_ ;:'.. -~ !.!.~ 839
838 ApendJce 11 Tablas estadisticas -- -;--.. \ ,'

Tabla H (continuación) Tabla I Transformación de ra;: -! 1s


En el cuerpo de la tabla se presentan valores de z =.5 [In( 1 + r)] = tanh r para O,
- valores correspondientes de r, el coeficiente de correlación
t:rror
df
I
11 12 JJ 14 15 16 17 18 19 20
--------------------------- , .00 .01 .02 .03 .04 .05 .06 .07 .os .09
253.2 260.0 266.2 271.8 277.0 28!.8 286.3 290.4 294.3 298.0
2 32.59 33.40 34.JJ 34.81 35.43 36.00 36.53 37.03 37.50 37.95 o 00000 01000 02000 .03001 .04002 .05004 .06007 .07012 .08017 .09024
3 17.13 17.53 17.89 18.22 18.52 18.81 19.07 19.32 19.55 19.77 ·.] :10014 :11045 ·.12058 .13074 .14093 .15114 .16139 .17167 .18198 .19234
4 12.57 12.84 13.09 ]3.32 13.53 1173 13.91 14.08 14.24 14.40 2 20273 .21317 .22366 .23419 .24477 .25541 .26611 .27686 .28768 .29857
5 10.48 10.70 10.89 11.08 11.24 11.40 11.55 11.68 11.8! 11.93 .3 .30952 .32055 .33165 .34283 .35409 .36544 .37689 .38842 .40006 .41180
6 9.30 9.48 9.65 9.81 9.95 10.08 10.21 10.32 10.43 10.54 :4 :42365 .43561 .44769 .45990 .47223 .48470 .49731 .51007 .52298 .53606
7 8.55 8.71 8.86 9.00 9.12 9.24 9.35 9.46 9.55 9.65 5 54931 56273 .57634 .59014 .60415 .61838 .63283 .64752 .66246 .67767
8 8.03 8.18 8.31 8.44 8.55 8.66 8.76 8.85 8.94 ~.03 .6 .69315 :70892 .72500 .74142 .75817 .77530 .79281 .81074 .82911 .S.4795
9 7.65 7.78 7.9[ 8.03 8.13 8.23 8.33 8.41 8.49 8.57 .7 .86730 .88718 .90764 .92873 .95048 .97295 .99621 1.02033 1.04537 1.07143
10 7.36 7.49 7.60 1.11 1.81 7.91 7.99 8.08 s.15 8.23 · · 112703 1. 15682 1. 1881 3 1.22111 1.25615 J.29334 1.33308 1.31511 1.42192
8 1 09861
!! 7.13 7.25 7.36 7.46 7.56 7.65 7.73 7.81 7.88 7.95 :9 1:41222 1:s2152 1.58902 1.65839 I.]3805 1.83178 J.94591 2.09229 2.29756 2.64665
12 6.94 7.06 7.17 7.26 7.36 7.44 7.52 7.59 7.66 7.73
13 6.79 6.90 7.0[ 7.10 7.19 7.27 7.35 7.42 7.48 7.55
14 6.66 6.77 6.87 6.96 7.05 7.13 7.20 7.27 7.33 7.39
15 6.55 6.66 6.76 6.84 6.93 7.00 7.07 7.14 7.20 7.26
16 6.46 6.56 6.66 6.74 6.82 6.90 6.97 7.03 7.09 7.15
17 6.38 6.48 6.57 6.66 6.73 6.81 6.87 6.94 7.00 7.05
18 6.31 6.41 6.50 6.58 6.65 6.73 6.79 6.85 6.91 6.97
19 6.25 6.34 6.43 6.51 6.58 6.65 6. 72 6. 78 6.84 6.89
20 6.19 6.28 6.37 6.45 6.52 6.59 665 6.71 6.77 6.82
24 6.02 6.1[ 6.19 6.26 6.33 6.39 6.45 6.51 6.56 6.61
30 5.85 5.93 6.01 6.08 6.14 6.20 6.26 6.31 6.36 6.41
40 5.69 5.76 5.83 5.90 5.96 6.02 6.07 6.12 6.16 6.21
60 5.53 5.60 5.67 5.73 5.78 5.84 5.89 5.93 5.97 6.01
120
z =
5.37 5.44
~
5.50
=
5.56
5~
5.61
~~~=U!
5.66 5.7[ 5.75 5.79 5.83
=
Tabla J Niveles de probabilidad para la prueba de calificación con signo
de \Vilcoxon
n = 5 n = R n = 10 n = 11 n = 12 n = 13
Tabla J (continuación)
T P T p T P T T p T p

*O .0313 O .0039 O .0010 O .0005 O .0002 O .0001 n = 7 n = 9 n = 12 n = 13


1 .0625 1 .0078 l .0020 .0010 .0005 .0002 T p T P T p T P
2 .0938 2 .0117 2 .0029 2 .0015 2 .0007 2 .0004 13 .4688 16 .2480 36 .4250 36 .2709
3 .1563 3 .0195 3 .0049 3 .0024 3 .0012 3 .0006 14 .5313 17 .2852 37 .4548 37 .2939
18 .3262 38 .4849 38 .3177
4 .2188 4 .0273 4 .0068 4 .0034 4 .0017 4 .0009
5 .3125 *5 .0391 5 .0098 5 .0049 5 .0024 5 .0012 19 .3672 39 .5151 39 .3424
6 .4063 6 .0547 6 .0137 6 .0068 6 .0034 6 .0017 20 .4102 40 .3677
7 .5000 7 .0742 7 .0186 7 .0093 7 .0046 7 .0023 21 .4551 41 .3934
8 .0977 8 .0244 8 .0122 8 .0061 8 .0031 22 .5000 42 .4197
43 .4463
n = 6 9 .1250 9 .0322 9 .0161 9 .0081 9 .0040
o .ul56 10 .1563 *10 .0420 10 .0210 10 .0105 10 .0052 44 .4730
.0313 11 .1914 11 .0527 11 .0269 11 .0134 11 .0067 45 .5000
'2 .0469 12 .2305 12 .0654 12 .0337 12 .0171 12 .0085
n = 14 n = 14 n = 15 n = 16 n "" 17 n = 17
3 .0781 13 .2734 13 .0801 *13 .0415 13 .0212 13 .0107
T p T p T p T p T P T p
4 .1094 14 .3203 14 .0967 14 .0508 14 .0261 14 .0133 o .0001 50 .4516 47 .2444 39 .0719 25 .0064 74 .4633
5 .1563 15 .3 711 15 .1162 15 .0615 15 .0320 15 .0164 2 .0002 51 .4758 48 .2622 40 .0795 26 .0075 75 .4816
6 .2188 16 .4219 16 .1377 16 .0737 16 .0386 16 .0199 3 .0003 52 .5000 49 .2807 41 .0877 27 .0087 76 .5000
7 .2813 17 .4727 17 .1611 17 .0874 *17 .0461 17 .0239 4 .0004 50 .2997 42 .0964 28 .0101
8 .3438 18 .52i3 18 .1875 18 .1030 18 .0549 18 .0287
5 .0006 n = 15 51 .3193 43 .1057 29 .0116 n"' 18
9 .4219 n = 9 19 .2158 19 .1201 19 .0647 19 .0341 6 .0009 1 .0001 52 .3394 44 .1156 30 .0133 6 .0001
10 .5000 O .0020 20 .2461 20 .1392 20 .0757 20 .0402 7 .0012 3 .0002 53 .3599 45 .1261 31 .0153 10 .0002
.0039 21 .2783 21 .1602 21 .0881 *21 .0471 8 .0015 5 .0003 54 .3808 46 .1372 32 .0174 12 .0003
n = 7 2 .0059 22 .3125 22 .1826 22 .1018 22 .0549 9 .0020 6 .0004 55 .4020 47 .1489 33 .0198 14 .0004
a·:ooi8 3 .0098 23 .3477 23 .2065 23 .1167 23 .0636
10 .0026 7 .0006 56 .4235 48 .1613 34 .0224 15 .0005
.0156 4 .0137 24 .3848 24 .2324 24 .1331 24 .0732 11 .0034 8 .0008 57 .4452 49 .1742 35 .0253 16 .0006
2 .0234 5 .0195 25 .4229 25 .2598 25 .1506 25 .0839 12 .0043 9 .0010 58 .4670 50 .1877 36 .0284 17 .0008
*3 .0391 6 .0273 26 .4609 26 .2886 26 .1697 26 .0955 13 .0054 10 .0013 59 .4890 51 .2019 37 .0319 18 .0010
4 .0547 7 .0371 27 .5000 27 .3188 27 .1902 27 .1082 14 .0067 11 .0017 60 .5110 52 .2166 38 .0357 19 .0012
5 .0781 *8 .0488 28 .350 l 28 .2119 28 .1219
15 .0083 12 .0021 n = 16 53 .2319 39 .0398 20 .0014
6 .1094 9 .0645 29 .3823 29 .2349 29 .1367 16 .0101 13 .0027 3 .0001 54 .2477 40 .0443 21 .0017
7 .1484 10 .0820 30 .4155 30 .2593 30 .1527 17 .0123 14 .0034 5 .0002 55 .2641 *4 l .0492 22 .0020
8 .1875 11 .1 O16 31 .4492 31 .2847 '.ll .1698 18 .0148 15 .0042 7 .0003 56 .2809 42 .0544 23 .0024
9 .2344 12 .1250 32 .4829 32 .3110 32 .1879 19 .0176 16 .0051 8 .0004 57 .2983 43 .0601 24 .0028
10 .2891 13 .1504 33 .5171 33 .3386 33 .2072
20 .0209 17 .0062 9 .0005 58 .3161 44 .0662 25 .0033
11 .3438 14 .1797 34 .3667 34 .2274 21 .0247 18 .0075 10 .0007 59 .3343 45 .0727 26 .0038
12 .4063 15 .2129 35 .3955 35 .2487 22 .0290 19 .0090 11 .0008 60 .3529 46 .0797 27 .0045
* Para unan dada, el total menor de los rangos para el cual el nivel de probabili- 23 .0338 20 .0108 12 .0011 61 .3718 47 .0871 28 .0052
dad es igual o menor que 0.0500 24 .0392 21 .0128 13 .0013 62 .3910 48 .0950 29 .0060

840 841
Tahla J (continuación)

n = 14 n = 15 n = 16 n = 16 n = 17 n = 18 Tabla J (continuación)
T p T P T p T p T p T p n = 21 n = 21
n = 18 n = 19 n = 19 n = 20
*25 .0453 22 .0151 14 .0017 63 .4104 49 .1034 30 .0069
23 .0177
T p T p T p T p T p T P
26 .0520 15 .0021 64 .430 l 50 .1123 31 .0080
67 .2211 42 .0162 91 .4453 *60 .0487 22 .0003 73 .0735
27 .0594 24 .0206 16 .0026 65 .4500 51 .1218 32 .0091
68 .2341 43 .0180 92 .4609 61 .0527 24 .0004 74 .0786
28 .0676 25 .0240 17 .0031 66 .4699 52 .1317 33 .0104
29 .0765 26 .0277 18 .0038 67 .4900 53 .1421 34 .0118 69 .2475 44 .0201 93 .4765 62 .0570 26 .0005 75 .0839
70 .2613 45 .0223 94 .4922 63 .0615 27 .0006 76 .0895
30 .0863 27 .0319 19 .0046 68 .5100 54 .1530 35 .0134
71 .2754 46 .0247 95 .5078 64 .0664 28 .0007 77 .0953
31 .0969 28 .0365 20 .0055 55 .1645 36 .0152
32 .1083 72 .2899 47 .0273 65 .0715 29 .0008 78 .1015
29 .0416 21 .0065 n = 17 56 .1764 37 .0171
73 .3047 48 .0301 n = 20 66 .0768 30 .0009 79 .1078
33 .1206 *30 .0473 22 .0078 4 .0001 57 .1889 38 .0192
34 .1338 31 .0535 23 .0091 8 .0002 58 .2019 39 .0216 49 .0331 11 .0001 67 .0825 31 .0011 80 .1145
74 .3198
75 .3353 50 .0364 16 .0002 68 .0884 32 .0012 81 .1214
35 .1479 32 .0603 24 .0107 9 .0003 59 .2153 40 .0241
76 .3509 51 .0399 19 .0003 69 .0947 33 .0014 82 .1286
36 .1629 33 .0677 25 .0125 11 .0004 60 .2293 41 .0269
77 .3669 52 .0437 20 .OQ04 70 .1012 34 .0016 83 .1361
37 .1788 34 .0757 26 .0145 12 .0005 61 .2437 42 .0300
38 .1955 35 .0844 78 .3830 *53 .0478 22 .0005 71 .1081 35 .0019 84 .1439
27 .0168 13 .0007 62 .2585 43 .0333
39 .2131 36 .0938 28 .0193 14 .0008 63 .2738 44 .0368 23 .0006 72 .1153 36 .0021 85 .1519
79 .3994 54 .0521
80 .4159 55 .0567 24 .0007 73 .1227 37 .0024 86 .1602
40 .2316 37 .1039 29 .0222 15 .0010 64 .2895 45 .0407
81 .4325 56 .0616 25 .0008 74 .1305 38 .0028 87 .1688
41 .2508 38 .1147 30 .253 16 .0013 65 .3056 46 .0449
82 .4493 57 .0668 26 .0010 75 .1387 39 .0031 88 .1777
42 .2708 39 .1262 31 .0288 17 .0016 66 .3221 *47 .0494
83 .4661 58 .0723 27 .0012 76 .1471 40 .0036 89 .1869
43 .2915 40 .1384 32 .0327 18 .0019 67 .3389 48 .0542
44 .3129 41 .1514 33 .0370 19 .0023 68 .3559 49 .0594 84 .4831 59 .0782 28 .0014 77 .1559 41 .0040 90 .1963
45 .3349 42 .1651 85 .5000 60 .0844 29 .0016 78 .1650 42 .0045 ..91 .2060
34 .0416 20 .0028 69 .3733 50 .0649
46 .3574 61 .0909 30 .0018 79 .1744 43 .0051 92 .2160
43 .1796 *35 .0467 21 .0033 70 .3910 51 .0708
47 .3804 n = 19 62 .0978 31 .0021 80 .1841 44 .0057 93 .2262
44 .1947 36 .0523 22 .0040 70 .4088 52 .0770
48 .4039 45 .2106 37 .0583 23 .0047 72 .4268 53 .0837 9 .0001 63 .1051 32 .0024 81 .1942 45 .0063 94 .2367
49 .4276 46 .2271 38 .0649 24 .0055 73 .4450 54 .0907
13 .0002 64 .1127 33 .0028 82 .2045 46 .0071 95 .2474
n = 18 n = 19 n = 19 n = 20 n = 20 n = 21 65 .1206 34 .0032 83 .2152 47 .0079 96 .2584
15 .0003
T P T ·p T p T p T P T p 17 .0004 66 .1290 35 .0036 84 .2262 48 .0088 97 .2696
55 .0982 30 .0036 79 .2706 48 .0164 97 .3921 61 .0298 18 .0005 67 .1377 36 .0042 85 .2375 49 .0097 98 .2810
56 .1061 31 .0041 80 .2839 49 .0181 98 .4062 62 .0323 19 .0006 68 .1467 37 .0047 86 .2490 50 .0108 99 .2927
57 .1144 32 .00{7 81 .2974 50 .0200 99 .4204 63 .0351
58 .1231 33 .005-l 82 .3113 20 .0007 69 .1562 38 .0053 87 .2608 51 .0119 100 .3046
51 .0220 100 .43"17 64 .0380
21 .0008 70 .1660 39 .0060 88 .2729 52 .0132 101 .3166
59 .1323 34 .0062 83 .3254 52 .0242 101 .4492 65 .0411 22 .0010 71 .1762 40 .0068 89 .2853 53 .0145 102 .3289
60 .1419 35 .0070 84 .3397 53 .0266 102 .4636 66 .0444 23 .0012 72 .1868 41 .0077 90 .2979 54 .0160 103 .3414
61 .1519 36 .0080 85 .3543 54 .0291 103 .4782 *67 .0479 24 .0014 73 .1977 42 .0086 91 .3108 55 .0175 104 .3540
62 .1624 37 .0090 86 .3690 55 .0319 104 .4927 68 .0516
63 .1733 38 .0102 87 .3840 5.6 .0348 25 .0017 74 .2090 43 .0096 92 .3238 56 .0192 105 .3667
105 .5073 69 .0555
26 .0020 75 .2207 44 .0107 93 .3371 57 .0210 106 .3796
64 .1846 39 .O! 15 88 .3991 57 .0379 n = 21 70 .OS97 .2327 45 .0120 94 .3506 58 .0230 107 .3927
27 .0023 76
65 .1964 40 .0129 89 .4144 58 .0413 14 .000 l 71 .0640 28 .0027 77 .2450 46 .0133 95 .3643 59 .0251 108 .405R
66 .2086 41 .01-15 90 .4298 59 .0-448 21J .0002 72 .0686 29 .0031 78 .2576 47 .0148 96 .3781 60 .0273 109 .4191

842 843
Tabla J (continuación)
n 22 n = 22 n 23 n ""23 n = 24 n = 24
Tabla J (continuación)
T p T p T ¡, T p T P T P
n = 23 n = 24
n=22 n=22 n = 23 55 .0095 104 .2413 56 .0056 105 .1647 50 .0016 99 .0758
n = 21 T p T p
56 .0104 105 .2514 57 .0061 106 .1723 51 .0018 100 .0800
T P T P T P
T p 68 .0163 117 .2700 62 .0053
67 .0271 116 .3751 63 .0058 57 .o 115 106 .2618 58 .0068 107 .1802 52 .0020 101 .0844
llO .4324 69 .0177 118 .2800
68 .0293 117 .3873 64 .0063 58 .0126 107 .2723 59 .0074 108 .1883 53 .0022 102 .0890
ll 1 .4459 70 .0192 119 .2902
69 .0317 ll8 .3995 65 .0069 59 .0138 108 .2830 60 .0082 109 .1965 54 .0024 103 .0938
ll2 .4593 71 .0208 120 .3005
70 fü42 119 .4119 60 .0151 109 .2940 61 .0089 110 .2050 55 .0027 104 .0987
ll3 .4729
.0224 121 .3110 66 .0075 61 .0164 110 .3051 62 .0098 111 .2137 56 .0029 105 .1038
114 .4864 71 .0369 120 .4243 72 .0242 122 .3217 67 .0082
]15 .5000 72 .0397 121 .4368 73 .0261 123 .3325 68 .0089 62 .0179 111 .3164 63 .0107 112 .2226 57 .0033 106 .1091
n .0427 122 .4494 74
.0281 124 .3434 69 .0097 63 .0195 112 .3278 64 .0117 . 113 .2317 58 .0036 107 .1146
74 .0459 123 .4620 75 .0303 125 .3545 70 .0106 64 .0212 113 .3394 65 .0127 114 .2410 59 .0040 108 .1203
n = 22 •75 .0492 124 .4746 76 65 .0231 ll4 .3512 66 .0138 115 .2505 60 .0044 109 .1261
.0325 126 .3657 71 .0115 .0250 115 .3631 67 .0150 116 .2601 61 .0048 110 .1322
77 66
.0001 76 .0527 125 .4873 72 .0124
18 78 .0349 127 .3770
.0002 77 .0564 126 .5000 73 .0135 n = 24 n = 25 n = 25 n = 25 n = 26 n = 26
23 79 .0374 128 .3884 T - -P T--p T--p
.0603 74 .0146 T p T--P T r
26 .0003 78 .0401 129 .3999
0644 n = 23 80 .1384 50 .0008 99 .0452 148 .3556 81 .0076 130 .1289
29 .0004 79 111
30 .0005 80 .0687 21 .0001 81 .0429 130 .4115 75 .0157 112 .1448 51 .0009 *100 .0479 149 .3655 82 .0082 131 .1344
.0002 82 .0459 131 .4231 76 .0170 113 .1515 52 .0010 101 .0507 150 .3755 83 .0088 132 .1399
32 .0006 81 .0733 28 .0003 '83 .0490 132 .4348 77 .0183 114 .1583 53 .0011 102 .0537 151 .3856 84 .0095 133 .1457
33 .0007 82 .0780 31 .0004 84 .0523 133 .4466 78 .0197
.0008 83 .0829 33 115 .1653 54 .0013 103 .0567 152 .3957 85 .0102 134 .1516
34 .0005 85 .0557 134 .4584 79 .0212
.0010 84 .0881 35 116 .1724 55 .0014 104 .0600 153 .4060 86 .0110 135 .1576
35 .0006 86 .0593 135 .4703 80 .0228
.0011 85 .0935 36 117 .1798 56 .0015 105 .0633 154 .4163 87 .01 !'8 136 .1638
36
81 .0245 118 .1874 57 .0017 106 .0668 155 .4266 88 .0127 137 .1702
.0013 86 .0991 38 .0007 87 .0631 136 .4822 82 .0263 119 . l 951 58 .0019 107 .0705 156 .43i0 89 .0136 138 .1767
37 .0014 87 .1050 39 .0008 88 .0671 137 .4941
38 83 .0282
.0016 88 .1111 40 :0009 89 .0712 138 .5060 84 .0302 120 .2031 59 .0021 108 .0742 157 .4474 90 .0146 139 .1833
39 91 .0156 140 .1901
40 .0018 89 .ll74 41 .0011 90 .0755 85 .0323 121 .2112 60 .0023 109 .0782 158 .4579
n = 24
41 .0021 90 .1240 42 .0012 91 .0801 122 .2195 61 .0025 110 .0822 159 .4684 92 .0167 141 . l 970
.0848 25 .oo1i1 86
~
.0346
123 .2279 62 .0028 111 .0865 160 .4789 93 .0179 142 .2041
.0023 91 .1308 43 .0014 92
42 .0897 32 .0002 87 .0369
124 .2366 63 .0031 112 .0909 161 .4895 94 .0191 143 .2114
.0026 92 .1378 44 .0015 93
43 .0948 36 .0003 88 .0394
.0030 93 .1451 45 .0017 94
44
45 .0033 94 .1527 46 .0019 95 .1001 38 .0004 89 .0420 125 .2454 64 .0034 I 13 .0954 162 .5000 95 .0204 144 .2187
46 .0037 95 .1604 47 .0022 96 .1056 40 .0005 90 .0447 126 .2544 65 .0037 ¡.¡4 .1001 96 .0217 145 .2262
127 .2635 66 .0040 115 .1050 n = 26 97 .0232 146 .2339
42 .0006 *91 .0475
.0024 97 .1113 128 .2728 67 .0044 116 .1100 34 .0001 98 .0247 147 .2417
47 .0042 96 .1685 48 43 .0007 92 .0505
.0027 98 .1172 129 .2823 68 .0048 117 .1152 42 .0002 99 .0263 148 .2496
48 .0046 97 .1767 49 44 .0008 93 .0537
.0030 99 .1234
49 .0052 98 .1853 50 45 .0009 94 .0570 149 .2577
.0034 100 .1297 130 .2919 69 .0053 118 .1205 46 .0003 100 .0279
50 .0057 99 .1940 51 46 .0010 95 .0604 .0004 101 .0297 150 .2658
.0037 101 .1363 131 .3017 70 .0057 119 .1261 49
51 .0064 100 .2030 52 151 .2741
132 .3115 71 .0062 120 .1317 51 .0005 102 .0315
.0041 102 .1431 47 .0011 96 .0640 133 .3216 72 .0068 121 .1376 53 .0006 l 03 .0334 152 .2826
52 .0070 101 .2122 53 .0046 103 .1501 48 .0013 97 .0678 134 .3317 73 .0074 122 .1436 55 .0007 104 .0'.~55 153 .2911
53 .0078 102 .2217 54 .0051 104 .1573 49 .0014 98 .0717
54 .0086 103 .2314 55
845
844
Tabla J (continuación)

n = 24 n = 25 n = 25 n = 26 n - 2fi n = 26 Tabla J (continuación)


T p T p T e T p T p T p
74 .0080 123 .1498 n = 27 n = 27 n = 27 n = 28 n = 28 n = 28
135 .3420 56 .0008 105 .0376 154 .2998
136 .3524 75 .0087 124 .1562 57 .0009 106 .0398 155 .3085 T P T P T p T P T p T P
137 .3629 76 .0094 125 .1627 58 .0010 107 .0421 156 .3174 68 .0014 117 .0430 166 .2972 86 .0033 135 .0628 184 .3391
138 .3735 77 .0101 126 .1694 59 .0011 108 .0455 157 .3264 69 .0015 118 .0453 167 .3055 87 .0035 136 .0657 185 .3474
139 .3841 78 .0110 127 .1763 60 .0012 109 .0470 158 .3355
70 .0016 *119 .0477 168 .3138 88 .0038 137 .0688 186 .3557
140 .3949 79 .0118 128 .1833 61 .0013 *110 .0497 159 .3447 71 .0018 120 .0502 169 .3223 89 .0041 138 .0719 187 .3641
141 .4058 80 .0128 129 .1905 62 .0015 111 .0524 160 .3539 72 .0019 121 .0528 170 .3308 90 .0044 139 .0751 188 .3725
142 .4167 81 .0137 130 .1979 63 .0016 112 .0553 161 .3633 73 .0021 122 .0555 171 .3395 91 .0048 140 .0785 189 .3811
143 .4277 82 .0148 131 .2054 64 .0018 113 .0582 162 .372i 74 .0023 123 .0583 172 .3482 92 .0051 141 .0819 190 .3896
144 .4387 83 .0159 132 .2131 65 .0020 114 .0613 163 .3822
¡5 .0025 124 .0613 173 .3570 93 .0055 142 .0855 191 .3983
145 .4498 84 .0171 133 .2209 66 .0021 115 .0646 164 .3918 76 .0027 125 .0643 174 .3659 94 .0059 143 .0891 192 .4070
146 .4609 85 .0183 134 .2289 67 .0023 116 .0679 165 .4014 77 .0030 126 .0674 175 .3748 95 .0064 144 .0929 193 .4157
147 .4721 86 .0197 135 .2371 68 .0026 117 .0714 166 .4111 i8 .0032 127 .Oi07 176 .3838 96 .0068 145 .0968 194 .4245
148 .4832 87 .0211 136 .2454 69 .0028 118 .075(1 167 .4208 79 .0035 128 .0741 177 .3929 97 .0073 146 .1008 195 .4333
149 .4944 88 .0226 137 .2539 70 .0031 119 .0787 168 .4306
80 .0038 129 .0776 178 .4020 98 .0078 147 .1049 196 .4421
150 .5056 89 .0241 130 .2625 71 .0033 120 .0825 169 .4405 81 .0041 130 .0812 179 .4112 99 .0084 148 .1091 197 .4510
90 .0258 139 .2712 72 .0036 121 .0865 170 .4503 82 .0044 131 .0849 180 .4204 100 .0089 149 .1135 198 .4598
n ; 25 91 .0275 140 .2801 73 .0040 122 .0907 171 .4602 83 .0048 132 .0888 181 .4297 101 .0096 150 .1180 199 .4687
29 .0001 92 .0294 141 .2891 74 .0043 123 .0950 172 .4702 84 .0052 133 .0927 182 .4390 102 .0102 151 .1225 200 .4777
37 .0002 93 .0313 142 .2983 75 .0047 l 24 .0994 173 .4801
85 .0056 134 .0968 183 .4483 103 .0109 152 .1273 201 .4866
41 .0003 94 .0334 143 .3075 76 .005[ 125 .1039 174 .4900 86 .0060 135 .1010 184 .4577 104 .0116 153 .1321 202 .4955
43 .0004 95 .0355 144 .3169 77 .0055 126 .1086 175 .5000 87 .0065 136 .1054 185 .4670 105 .0124 154 .1370 203 .5045
45 .0005 96 .0377 145 .3264 78 .0060 127 .1135 88 .0070 137 .1099 186 .4764 106 .0132 155 .1421
47 .0006 97 .0401 146 .3360 79 .0065 128 .1185 89 .0075 138 .1145 187 .4859 107 .0140 156 .1473 n = 29
48 .0007 98 .0426 147 .3458 80 .0070 129 .!236
90 .0081 139 .1193 188 .4953 108 .0149 157 .1526 50 .0001
n; 27 n = 27 n = 27 n = 28 n = 28 n = 28 189 .5047 109 .0159 158 .1580 59 .0002
T --p T---P 91 .0087 140 .1242
T p T p T p T p 110 .0168 159 .1636 65 .0003
92 .0093 141 .1292
39 .0001 105 .0218 154 .2066 74 .0012 123 .0349 172 .2466 111 .Oli9 160 .1693 68 .0004
93 .0100 142 .1343 n = 28
47 .0002 106 .02'.31 155 .2\'.35 75 .00 t:) 124 .03fi8 173 .25:J:-i 112 .0190 161 .1751 71 .0005
52 .0003 107 .0246 L)fi .2205 76 .0015 _,
1,, - .0387 174 .2fil 1
94 .0107 143 .1396 44 .0001
55 .0004 108 .0260 157 .22ii n .no I ti 126 .u.io7 175 .2h8;) 95 .Ol l5 144 .1450 53 .0002 113 .0201 162 .1810 73 .0006
96 .0123 145 .1506 58 .0003 114 .0213 163 .1870 75 .0007
57 .0005 109 .0276 158 .2'.14\l ;, .0017 127 .0428 l7fi .275\J 76 .0008
9; .0131 146 .1563 61 .0004 115 .0226 164 .1932
59 .0006 110 .0292 159 .242:3 79 .OO!!J 128 .04.')() 177 .28:1:i
98 .0140 147 .1621 64 .0005 116 .0239 165 .1995 78 .0009
61 .OOOi 111 .0309 160 .24\JH 811 .0020 129 .047:1 178 .2912
99 .0150 148 .1681 66 .0006 117 .0252 166 .2059 79 .0010
62 .000,'\ 112 .0:127 lfi 1 .2.'J 74 Hl .0022 *J:,S(J .fJ4\Hi 179 .2\flf)
100 .0159 149 .1742 68 .0007 118 .0267 167 .2124 80 .0011
64 .0009 1! 3 .0:'146 162 .2ó;"i2 H2 .0024 1:11 .0:i2 ! L'iO .'.)flti,'i
101 .0170 150 .1804 69 .0008 119 .0282 168 .2190 81 .0012
65 .OfJJ(J 114 .O:'ll)ti l!i:I .2i'.11l H'.I .1HJ2ti l'.12 .0.-¡-1tl !K! .'.'1[4:-i 102 .0181 151 .1868 70 .0009 120 .0298 169 .2257 82 .0013
66 .001 l I !5 .OJHt) ¡¡¡.¡ .21'1] O x.¡ llll2:-i L'l:l .07 i:\ l H2 .:122,'i 10:1 .0193 ,_
1-' .1932 72 .0010 121 .0314 170 .2326 83 .0014
67 JJ012 11 fi U4Ui lf-i.'j .2~~1() X.) .(HJ:IIJ [.14 OliíHI J,'i:) .:1:\1)!! 104 .0205 153 .1999 i'.a\ .0011 122 .0331 171 .2395 84 .0015

8~6 8~7
Tabla J (continuación) Tablas estadísticas 849
n = 29 n = 29 n = 29 n = 30 n = 30 n = 30
p p p
Tabla J (continuación)
T p T p T p T T T
85 .0016 134 .0362 183 .2340 90 .0013 139 .0275 188 .1854 n = 29 n = 29 n = 30 n = 30 n = 30
86 .0018 135 .0380 184 .2406 91 .0014 140 .0288 189 .1909 T p T p T p T p T p
87 .0019 136 .0399 185 .2473 92 .0015 141 .0303 190 .1965 121 .0183 170 .1572 n = 30 126 .0139 175 .1225 224 .4356
88 .0021 137 .0418 186 .2541 93 .0016 142 .0318 191 .2022
122 .0193 171 .1625 55 .0001 127 .0147 176 .1267 225 .4436
123 .0204 172 .1679 66 .0002 128 .0155 177 .1311 226 .4516
89 .0022 138 .0439 187 .2611 94 .0017 143 .0333 192 .2081
90 .0024 139 .0460 188 .2681 95 .0019 144 .0349 193 .2140
124 .0216 173 .1733 71 .0003 129 .0164 178 .1355 227 .4596
91 .0026 *140 .0482 189 .2752 96 .0020 145 .0366 194 .2200
125 .0228 174 .1789 75 .0004 130 .0173 179 .1400 228 .4677
92 .0028 141 .0504 190 .2824 97 .0022 146 .0384 195 .2261
126 .0240 175 .1846 78 .0005 131 .0182 180 .1447 229 .4758
93 .0030 142 .0528 191 .2896 98 .0023 147 .0402 196 .2323 127 .0253 176 .1904 80 .0006 132 .0192 181 .1494 230 .4838
128 .0267 177 .1963 82 .0007 133 .0202 182 .1543 231 .4919
94 .0032 143 .0552 192 .2970 99 .0025 148 .0420 197 .2386
95 .0035 144 .0577 193 .3044 100 .0027 149 .0440 198 .2449 129 .0281 178 .2023 84 .0008 134 .5000
.0213 183 .1592 232
96 .0037 145 .0603 194 .3120 101 .0029 150 .0460 199 .2514 130 .0296 .2085
179 85 .0009 135 .0225 184 .1642
97 .0040 146 .0630 195 .3196 102 .0031 *151 .0481 200 .2579 131 .0311 180 .214 7 87 .0010 136 .0236 185 .1694
98 .0043 147 .0658 196 .3272 103 .0033 152 .0502 201 .2646 132 .0328 181 .2210 88 .0011 137 .0249 186 .1746
133 .0344 182 .2274 89 .0012 138 .0261 187 .1799
99 .0046 148 .0687 197 .3350 104 .0036 153 .0524 202 .2713
100 .0049 149 .0716 198 .3428 105 .0038 154 .0547 203 .2781
101 .0053 150 .0747 199 .3507 I(J6 .0041 155 .0571 204 .2849
102 .0057 151 .0778 200 .358fi 107 .0044 156 .0595 205 .2919
103 .0061 1O-
-9 .0811 201 .3666 108 .0047 157 .0621 206 .2989

100 .0065 153 .0844 202 .3747 109 .0050 158 .064 7 207 .3060
105 .0069 154 .0879 203 .3828 110 .0053 159 .0674 208 .3132
106 .0074 155 .0914 204 .3909 111 .0057 160 .0701 209 .3204
IOi .00i9 156 .09.51 205 .3991 112 .0060 161 .0730 210 .3277
108 .0084 15 7 .0988 206 .4074 113 .0064 162 .0759 211 .3351

109 .0089 158 .1027 207 .--1157 110 .0068 163 .0790 212 .3425
110 .0095 159 .1066 208 .4240 1 !5 .0013 164 .082 l 213 .3500
111 .0101 160 .1107 209 .4324 116 .0077 165 .()853 214 .3576
112 .0108 161 .1149 210 .4408 11 i .0082 166 .0886 215 .3652
113 .Ol 15 162 .1191 211 .4492 118 .0087 167 .0920 216 .3728

114 .1)122 16'.'I .1235 212 .4576 119 .0093 168 .OY5.':i 217 .380.?
115 .0129 16"1" .1280 213 .4661 120 .0098 169 .0990 218 .3H83
116 .() 137 !65 .1326 214 .4 745 121 .(Jl04 170 .1027 219 .3961
117 .0145 166 .1 :'173 215 .48'.')() 122 .O l l O 171 . ! 063 220 .4039
118 _() !.'54 [(i7 .1421 216 A915 123 .01 l i 172 .1103 221 .4118

119 .016:'I IOH .14 i l 217 .5000 124 .1)]2cl 113 .1143 222 .41<,;!7
120 .0173 1<¡ - .01'.',J 174 .1183 223 ..-1276
169 .l.'")21 -·'
848
Tabla K Cuantiles de la estadística de prueba de Mann-Whitney

• p m=2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
.001 o o o o o o o o o o o o o o o o o o o
.005 o o o o o o o o o o o o o o o o o 1 l
2 .01 o o o o o o o o o o o l 1 1 1 1 1 2 2
.025 o o o o o o 1 1 1 1 2 2 2 2 2 3 3 3 3
.05 o o o 1 1 1 2 2 2 2 3 3 4 4 4 4 5 5 5
.10 o 1 1 2 2 2 3 3 4 4 5 5 5 6 6 7 7 8 8
.001 o o o o o o o o o o o o o o o 1 1 1 1
.005 o o o o o o o 1 l 1 2 2 2 3 3 3 3 4 4
3 .01 o o o o o 1 1 2 2 2 3 3 3 4 4 5 5 5 6
00 .025 o o o 1 2 2 3 3 4 4 5 5 6 6 7 7 8 8 9
"'o .05 o 1 1 2 3 3 4 5 5 6 6 7 8 8 9 10 10 11 12
.IO 1 2 2 3 4 5 6 6 7 8 9 10 11 11 12 13 14 15 16
.001 o o o o o o o o 1 1 1 2 2 2 3 3 4 4 4
.005 o o o o 1 1 2 2 3 3 4 4 5 6 6 7 7 8 9
4 .01 o o o 1 2 2 3 4 4 5 6 6 7 9 8 9 10 10 11
.025 o o 1 2 3 4 5 5 6 7 8 9 10 11 12 12 13 14 15
.05 o 1 2 3 4 5 6 7 8 9 10 11 12 13 15 16 17 18 19
.10 1 2 4 5 6 7 8 10 11 12 13 14 16 17 18 19 21 22 23
.001 o o o o o o 1 2 2 3 3 4 4 5 6 6 7 8 8
.005 o o o 1 2 2 3 4 5 6 7 8 8 9 10 11 12 13 14
5 .01 o o 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17
.025 o 1 2 3 4 6 7 8 9 10 12 13 14 15 16 18 19 20 21
.05 1 2 3 5 6 7 9 10 12 13 14 16 17 19 20 21 23 24 26
.10 2 3 5 6 8 9 11 13 14 16 18 19 21 23 24 26 28 29 31

Tabla K (conri1111nción)

s ,. ~
• p m=2 3 4 6 7 8 9 to 11 12 13 14 IS 16 17 18 19 ¡¡-

.001 o o o o o o 2 J 4 5 5 6 7 8 9 10 11 ~
12 13
.005 o o 1 2 J 4 5 6 7 8 10 11 12 13 14 16 17 18 19 [
6 .01 o o 2 J 4 5 7 8 9 10 12 13 14 16 17 19 20 21 23 º'o
:,_
.025 o 2 3 4 6 7 9
••
11 12 14 15 17 18 20 22 23 25 26 28
.os 1 J 4 6 8 9 11 13 15 17 18 20 22 24 26 27 29 JI 33
.10 2 4 6 8 10 12 14 16 18 20 22 24 26 28 30 32 35 37 39
.001 o o o o 1 2 3 4 6 7 8 9 10 11 12 14 15 16 17
.005 o o 1 2 4 5 7 8 10 11 13 14 16 . 17 19 20 22 23 25
7 .01 o 1 2 4 5 7 8 10 12 13 15 17 18 20 22 24 25 27 29
.025 o 2 4 6 7 9 11 13 15 17 19 21 23 25 27 29 31 33 35
.05 1 3 5 7 9 12 14 16 18 20 22 25 27 29 JI 34 36 38 40
.10 2 5 7 9 12 14 17 19 22 24 27 29 32 34· 37 39 42 44 47
.001 o o o 1 2 J 5 6 7 9 10 12 13 15 16 18 19 21 22
.005 o o 2 3 5 7 8 10 12 14 16 18 19 21 23 25 27 29 31
8 .01 o 1 J 5 7 8 10 12 14 16 18 21 23 25 27 29 31 33 35
.025 1 J 5 7 9 11 14 16 18 20 23 25 27 JO 32 35 37 39 42
.05 2 4 6 9 11 14 16 19 21 24 27 29 32 34 37 40 42 45 48
.10 J 6 8 11 14 17 20 23 25 28 JI 34 37 40 43 46 49 52 55
.001 o o o 2 J 4 6 8 9 11 13 15 16 18 20 22 24 26 27
.005 o 1 2 4 6 8 10 12 14 17 19 21 23 25 28 JO 32 34 37
9 .01 o 2 4 6 8 10 12 15 17 19 22 24 27 29 32 34 37 39 41
.025 1 J 16
.05
.10
2
3
5
6
'7 8
10
11
13
13
16 19
18
22
21
25
24
28
27
JI
29
34
32
37
35
40
38
43
40
46
43
49
46
52
49
55
10 13 16 19 23 26 29 32 36 39 42 46 49 53 56 59 63
.001 o o 1 2 4 6 7 9 11 13 15 18 20 22 24 26 28 30 33
.005 o 1 3 5 7 10 12 14 17 19 22 25 27 30 32 35 )8 40 43
10 .01 o 2 4 7 9 12 14 17 20 23 25 28 JI 34 37 39 42 45 48
.025 1 4 6 9 12 15 18 21 24 27 JO 34 37 40 43 46 49 53 56
.05 2
.10 4 7 ' 8
11
12
14
15
18
18
22
21
25
25
29
28
33
32
37
35
40
38
44
42
48
45
52
49
55
52
59
56
63
59
67
63
71
00

"'
~
Tabla K (continuación) 00

m=2 3 4 5 6 7 8 • 10 11 12 13 14 .. 16 17 18 19 20
"'
N

• p
s 7 9 11 13 16 18 21 23 25 28 JO 33
43
35
46
38
49
.001 o o 1 3
11 14 17 19 22 25 28 31 34 37 40
48 SI 54
o l 3 6 8 32 35 38 42 45
.005 13 16 19 23 26 29 56 59 63
o 2 5 8 10 34 38 41 45 48 52
11 .01 14 17 20 24 27 31 58 62 66 70
1 4 7 ID 39 43 47 51 55
.025 17 20 24 28 32 35 62 66 70 74 79
.05 2 6 9 13 41 45 49 53 58
16 20 24 28 32 37 43
.IO 4 8 12 29 32 35 38 41
13 15 18 21 24 26 52 SS
o 1 J 5 8 10 38 42 45 48
.001 o 7 IO 13 16 19 22 25 28 32 35
47 50 54 57 61
.005 o 2 4 25 29. 32 36 39 43 70
9 12 15 18 22 54 58 62 66
12 .01 o J 6
15 19 23 27 JO 34 38 42 46 50
61 65 69 73 78
.025 2 5 8 12 39 43 48 52 56 87
14 18 22 27 31 35 68 73 78 82
.05 J 6 10 40 45 50 54 59 64
13 18 22 27 31 36 46 49
.10 5 9 30 33 36 39 43
12 15 18 21 24 27 54 58 61
o o 2 4 6 9 35 39 43 46 50
.001 11 14 ·18 21 25 28 32 52 56 60 64 68
.005 o 2 4 8 32 36 40 44 48
3 6 10 13 17 21 24 28
SI 55 60 64 68 73 77
13 .01 1 25 29 34 38 42 46
76 81 85
2 5 9 13 17 21 52 57 62 66 71
.025
20 25 29 34 38 43 48 80 85 90 95
.05 J 7 11 16 49 54 59 64 69 75
19 24 29 34 39 44 55
.10 5 10 14 37 40 44 47 51
20 23 26 JO 33 68
o 4 7 10 13 16 47 51 55 59 64
.001 o 2
16 19 23 27 JI 35 39 43
66 70 74
.005 o 2 s 8 12
23 27 31 35 39 44 48 52 57 61
75 79 84
1 J 7 11 14 18 51 56 60 65 70
14 .01 18 23 27 32 37 41 46 78 83 88 93
.025 2 6 10 14 47 52 57 62 67 72 103
17 22 27 32 37 42 81 86 92 98
.05 4 8 12 48 53 59 64 70 75

...,.~-
16 21 26 32 37 42 56 60
.10 5 11 37 41 44 48 52
15 18 22 25 29 33 70 74
o 5 8 11 56 61 65
.001 o 2
13 17 21 25 30 34 38 43 47 52
67 71 76 81
o J 6 9 48 52 57 62
.005 25 29 34 38 43 81 86 91

.
20
IS .01 1
2 6
4 8
11
12
IS
16
20 25 JO 35 40 45 50 55
62
60
67
65
73
71
78
76
84 89 95 101 "'~-•
.025 24 29 34 40 45 51 56 87 93 99 105 111 ~

.05 4 8 13 19 58 69 75 81 ~

23 28 34 40 46 52
.ID 6 11 17

Tabla K (co11ti11uació11)
~
["'
• p m=l 3 4 5 6 7 8 • 10 11 12 13 14 15 16 17 18 19 20
~
s
.001 o o 3 6 9 12 16 20 24 28 32 36 40 44 49 53 57 61 66

16
.005
.01
o
1
3
4
6
8
10
13
14
17
19
22
23
27
28
32
32
37
37
42
42
47
46
52
51
57
56
62
61
67
66
72
71
77
75
83
80
88
"'"'R'·
.025 2 7 12 16 22 27 32 38 43 48 54 60 65 71
78
76
84
82 87
96
93
102
99
ID8
••
.05 4 9 15 20 26 31 37 43 49 55 61 66 72 90
.10 6 12 18 24 30 37 43 49 55 62 68 75 81 87 94 100 107 113 120
.001 o 1 3 6 10 14 18 22 26 30 35 39 44 48 53 58 62 67 71
.005 o 3 7 11 16 20 25 30 35 40 45 50 55 61 66 71 76 82 87
17 .01 1 5 9 14 19 24 29 34 39 45 50 56 61 67 72 78 83 89 94
.025 3 7 12 18 23 29 35 40 46 52 58 64 70 76 82 88 94 100 106
.05 4 10 16 21 27 34 40 46 52 58 65 71 78 84 90 97 103 110 116
.10 7 13 19 26 32 39 46 53 59 66 73 80 86 93 100 ID7 114 121 128
00
.001 o 1 4 7 11 15 19 24 28 33 38 43 47 52 57 62 67 72 77
,.,."' 18
.005
.01
o
1
3
5
7
ID
12
15
17
20
22
25
27
31
32
37
38
42
43
48
48
54
54
60
59
66
65
71 77
71 76
83
82
89
88
95
93
101
.025 3 8 13 19 25 31 37 43 49 56 62 68 75 81 87 94 100 107 113
.05 10 17 23 29 36 42 49 56 62 69 76 83 89 96 103 110 117 124
.10 '7 14 21 28 35 42 49 56 63 70 78 85 92 99 I07 114 121 129 136
.001 o 1 4 8 12 16 21 26 30 35 41 46 SI 56 61 67 72 78 83
.005 1 4 8 13 18 23 29 34 40 46 52 58 64 70 75 82 88 94 100
19 .01 2 s 10 16 21 27 33 39 45 51 57 64 70 76 83 89 95 102 108
.025 ·3 8 14 20 26 33 39 46 53 59 66 73 79 86 93 100 107 114 120
.05 5 11 18 24 31 38 45 52 59 66 73 81 88 95 ID2 110 117 124 131
.ID 8 15 22 29 37 44 52 59 67 74 82 90 98 ID5 113 121 129 136 144
.001 o l 4 8 13 17 22 27 33 38 43 49 55 60 66 71 77 83 89
.005 1 4 9 14 19 25 31 37 43 49 55 61 68 74 80 87 93 100 106
20 .01 2 6 11 17 23 29 35 41 48 54 61 68 74 81 88 94 IOl 108 115
.025 3 9 15 21 28 35 42 49 56 63 70 77 84 91 99 106 113 120 128
.05 s 12 19 26 33 40 48 55 63 70 78 85 93 101 108 116 124 131 139 00
.10 8 16 23 31 39 47 55 63 71 79 87 95 IOJ 111 120 128 136 144 152
"',.,.
Tabla L Cuantiles de la estadística de prueba de Kolmogorov

Pnteb"a unilareral Tablas estadfsticas 855


p = .90 .95 .975 .99 .995
Prueba bilateral Tabla 1\-1 Valores críticos para la estadística de prueba de KruskaJ-Wallis
p = .80 .90 .95 .98 .99

n= l .900 .950 .975 .990 .995 Tamañude lt1 muestra


2 .684 .776 .842 .900 .929 Valor
3 .565 .636 .708 .785 .829 n, n, n, critico a
4 .493 .565 .624 .689 .734
5 .447 .509 .563 .627 .669 2 1 1 2.7000 .500
2 2 1 3.6000 .200
6 .410 .468 .519 .577 .617 2 2 2 4.5714 .067
7 .381 .436 .483 .538 .576 3.7143 .200
8 .358 .410 .454 .507 .542 3 1 1 3.2000 .300
9 .339 .387 .430 .480 .513 3 2 1 4.2857 .100
10 .323 .369 .409 .457 .489 3.8571 .133
11 .308 .352 .391 .437 .468 3 2 2 5.3572 .029
12 .296 .338 .375 .419 .449 4.7143 .048
13 .285 .325 .361 .404 .432 4.5000 .067
14 .275 .314 .349 .390 .418 4.4643 .105
15 .266 .304 .338 .377 .404 3 3 1 5.1429 .043
4.5714 .100
16 .258 .295 .327 .366 .392 4.0000 .129
17 .250 .286 .318 .355 .381 3 3 2 6.2500 .011
18 .244 .279 .309 .346 .371 5.3611 .032
19 .237 .271 .301 .337 .361 5.1389 .061
20 .232 .265 .294 .329 .352 4.5556 .100
.287 4.2500 .121
21 .226 .259 .321 .344
.281 .314 .337 3 3 3 7.2000 .004
22 .221 .253
.330 6.4889 .011
23 .216 .247 .275 .307
.323 5.6889 .029
24 .212 .242 .269 .301
25 .208 .238 .264 .295 .317 5.6000 .050
5.0667 .086
26 .204 .233 .259 .290 .JII 4.6222 .100
27 .200 .229 .254 .284 .305 4 1 1 3.5714 .200
28 .197 .225 .250 .279 .300 4 2 1 4.8214 .057
29 .193 .221 .246 .275 .295 4.5000 .076
30 .190 .218 .242 .270 .290 4.0179 .114
4 2 2 6.0000 .014
31 .187 .214 .238 .266 .285
5.3333 .033
32 .184 .211 .234 .262 .281
5.1250 .052
33 .182 .208 .231 .258 .277
4.4583 .100
34 .179 .205 .227 .254 .273
4.1667 .105
35 .177 .202 .224 .251 .269
4 3 1 5.8333 .021
36 .174 .199 .221 .247 .265 5.2083 .050
37 .172 .196 .218 .244 .262 5.0000 .057
38 .170 .194 .215 .241 .258 4.0556 .093
39 .168 .191 .213 .238 .255 3.8889 .129
40 .165 .189 .210 .235 .252
Aproximación para
1.22 1.63
n > 40
1.07
- -I.36 -1.52 -
.Jñ .Jñ .Jñ .Jñ .Jñ
Apéndice 11 Tablas estadísticas 857
856
Tabla M (co11ti11uación) Tabla M (continuación)

-
Tamaño de la muestra
Tamaño de fo mues ira
Valor
Valor
n, n, n, crític11

n, n, n, ('rÍtico

5 2 2 6.5333 .008
4 3 2 6.4444 .008
6.1333 .013
6.3000 .011
5.1600 .034
5.4444 .046
.051 5.0400 .056
5.4000
4.3733 .090
4.5111 .098
4.2933 .122
4.4444 .102
5 3 1 6.4000 .012
4 3 3 6.7455 .010
4.9600 .048
6.7091 .013
4.8711 .052
5.7909 .046
4.0178 .095
5.7273 .050
.092 3.8400 .123
4.7091
.101
5 3 2 6.9091 .009
4.7000
6.8218 .010
4 4 1 6.6667 .010
.022 5.2509 .049
6.1667
4.9667 .048 5.1055 .052
.054 4.6509 .091
4.8667
4.4945 .101
4.1667 .082
.102
5 3 3 7.0788 .009
4.0667
.006 6.9818 .011
4 4 2 7.0364
5.6485 .049
6.8727 .011
5.5152 .051
5.4545 .046
.052 4.5333 .097
5.2364 4.4121
4.5545 .098 .109
5 4 l 6.9545 .008
4:4455 .103
7.1439 .010 6.8400 .011
4 4 3 4.9855 .044
7.1364 .011
4.8600 .056
5.5985 .049
3.9873 .098
5.5758 .051
3.9600 .102
4.5455 .099
.102
5 4 2 7.2045 .009
4.4773
7.1182 .010
4 4 4 7.6538 .008
5.2727 .049
7.5385 .011
.049 5.2682 .050
5.6923 4.5409
.054 .098
5.6538
4.5182 .101
4.6539 .097
5 4 3 7.4449 .010
4.5001 .104
.143 7.3949 .011
5 l l 3.8571
5.6564 .049
5 2 l 5.2500 .036
.048 5.6308 .050
5.0000
4.4500 .071
4.2000 .095
4.0500 .119
Tabla Na Distribución exacta de x:; para tablas que contienen de 2 a 9 conjuntos
de tres rangos (k= 3; 11 = 2, 3, 4, 5, 6, 7, 8, 9)
Pis es la probabilidad de obtener un valor de x:2 igual O mayor que el valor corres-
Apéndice 11 '
858 pendiente de ' x;
Tabla M (continuación)
n=2 n=3 n=4 n=5
Tamaña de la muestra
x,' p x,' p x,' p X,' p
Valor
n, n, n, crít1co
.o
" o 1.000 .000 1.000
0.667 .944 .5
1.000
.931
.o 1.000
1 .833 .4 .954
4.5487 .099
3 .500 2.000 .528 1.5 .653 1.2 .691
4.5231 .103 2.0 .431
4 .167 2.667 .361 1.6 .522
5 4 4 7.7604 .009 .273
4.667 1.94 3.5 2.8 .367
7.7440 .011 4.5 .125
6.000 .02a 3.6 .182
5.6571 .049 6.0 .069 4.8 .124
5.6176 .050 6.5 .042 5.2 .093
4.6187 .100 8.0 .0046 6.4 .039
4.5527 .102 7.6 .024
5 5 1 7.3091 .009 8.4 .0085
6.8364 .011 10.0 .00077
5.1273 .046
4.9091 .053 n=1 n=8 n=9
n=6
4.1091 .086
4.0364 .105 .00 1.000 .000 1.000
.00 1.000 .000 1.000
5 5 2 7.3385 .010 .286 .964 .25 .967 .222 .971
0.33 .956
7.2692 .010 .857 .768 .75 .794 .667 .814
1.00 .740
5.3385 .047 1.143 .620 1.00 .654 .889 .865
1.33 .570
5.2462 .051 2.000 .486 l. 75 .531 1.556 .569
2.33 .430
4.6231 .097 2.571 .305 2.25 .355 2.000 .398
3.00 .252
4.5077 .100 3.429 .237 3.00 .285 2.667 .328
4.00 .184
5 5 3 7.5780 .010 3.714 .192 3.25 .236 2.889 .278
4.33 .142
7.5429 .010 4.571 .112 4.00 .149 3.556 .187
5.33 .072
5.7055 .046 5.429 .085 4.75 .120 4.222 .154
6.33 .052
5.6264 .051 6.000 .052 5.25 .079 4.667 .107
7.00 .029
4.5451 .100 7.143 .027 6.25 .047 5.556 .069
8.33 .012
4.5363 .102 7.714 .021 6.75 .038 6.000 .057
9.00 .0081
5 5 4 7.8229 .010 9.33 .0055 8.000 .016 7.00 .030 6.222 .048
7.7914 .010 8.857 .0084 7.75 .018 6.889 .031
10.33 .0017
5.6657 .049 9.00 .0099 8.000 .019
12.00 .00013 10.286 .0036
5.6429 .050 8.222 .016
10.571 .0027 9.25 .0080
4.5229 .099 11.143 .0012 9.75 .0048 8.667 .010
4.5200 .101 10.75 .002'4 9.556 .0060
12.286 .00032
5 5 5 8.0000 .009 14.000 .000021 12.00 .0011 10.667 .0035
7.9800 .010 12.25 .00086 10.889 .0029
5.7800 .049 11.556 .0013
13.00 .00026
5.6600 .051 14.25 .000061 12.667 .00066
4.5600 .100 16.00 .0000036 13.556 .00035
4.5000 .102 14.000 .00020
14.222 .000097
14.889 .000054
16.222 .000011
18.000 .0000006
Apéndice JI Tablas estadísticas
860 861
Tabla Nb Distribución exacta de x; para tablas que contienen de 2 a 9 conjuntos
Tabla O Valores críticos de la estadística de prueba de Spearman. Valores críti·
de tres rangos (k = 4; n = 2, 3, 4, 5, 6, 7, 8, 9)
pes ]a probabilidad de obtener un valor de x;
igual o mayor que el valor corres-
cos aproximados de r: del extremo superior de la curva, donde P(r> r;) :5 ex,
n = 4( 1)30 nivel de significación, a
pondiente de x;
n .001 .005 .OJO .025 .050 .100
n=2 n=3 n=4

x. 2 p x.2 p x.' p x.2 p 4 - - - - .8000 .8000


5 - - .9000 .9000 .8000 .7000
.o 1.000 .2 1.000 .o 1.000 5.7 .141 6 - .9429 .8857 .8286 .7714 .6000
.6 .958 .6 .958 .3 .992 6.0 .105 7 .9643 .8929 .8571 .7450 .6786 .5357
1.2 .834 1.0 .910 .6 .928 6.3 .094 8 .9286 .8571 .8095 .7143 .6190 .5000
1.8 .792 1.8 .727 .9 .900 6.6 .077 9 .9000 .8167 .7667 .6833 .5833 .4667
2.4 .625 2.2 .608 1.2 .800 6.9 .068 !O .8667 .7818 .7333 .6364 .5515 .4424
3.0 .542 2.6 .524 1.5 .754 7.2 .054 .4182
11 .8364 .7545 .7000 .6091 .5273
3.6 .458 3.4 .446 1.8 .677 7.5 .052 .3986
12 .8182 .7273 .6713 .5804 .4965
4.2 .375 3.8 .342 2.1 .649 7.8 .036
13 .7912 .6978 .6429 .5549 .4780 .3791
4.8 .208 4.2 .300 2.4 .524 8.1 .033 .3626
14 .7670 .6747 .6220 .5341 .4593
5.4 .167 5.0 .207 2.7 .508 8.4 .019
15 .7464 .6536 .6000 .5179 .4429 .3500
6.0 .042 5.4 .175 3.0 .432 8.7 .014
5.8 .148 3.3 .389 9.3 .012 16 .7265 .6324 .5824 .5000 .4265 .3382
6.6 .075 3.6 .355 9.6 .0069 17 .7083 .6152 .5637 .4853 .4118 .3260
7.0 .054 3.9 .324 9.9 .0062 18 .6904 .5975 .5480 .4716 .3994 .3148
7.4 .033 4.5 .242 10.2 .0027 19 .6737 .5825 .5333 .4579 .3895 .3070
8.2 .017 4.8 .200 10.8 .0016 20 .6586 .5684 .5203 .4451 .3789 .2977
9.0 .0017 5.1 .190 11.1 .00094
21 .6455 .5545 .5078 .4351 .3688 .2909
5.4 .158 12.0 .000072 .2829
22 .6318 .5426 .4963 .4241 .3597
23 .6186 .5306 .4852 .4150 .3518 .2767
24 .6070 .5200 .4748 .4061 .3435 .2704
25 .5962 .5100 .4654 .3977 .3362 .2646
26 .5856 .5002 .4564 .3894 .3299 .2588
27 .5757 .4915 .4481 .3822 .3236 .2540
28 .5660 .4828 .4401 .3749 .3175 .2490
29 .5567 .4744 .4320 .3685 .3113 .2443
JO .5479 .4665 .4251 .3620 .3059 .2400

Nota: el \'alar crítico del extre1no inferior de la cun·¡i correspondiente a ,, es -r:.


862 Apéndice JI

CRÉDITOS DE TABLAS

D. IJ.: .-1. J.fillirm Random Digits wirh /0(), 00() Normal Deviates b}· The Raud Corpor~tion, th« Frec-
Respuestas
F,,
Pres~. Gkocn,:, t!l.. 1~55. R<\Ímprc.~o con autorización.
Reproduddo el~ Documenu, Ge1r;y, Scient1fic 1 ables. 7." ed, !970. cone~ia de í'JHA-Gcigy
~,imí•ed, Bas,;J. Sw1tzcr!anJ.
!)e A. Hald '! S. A. Sír.'<baek. ·• A Table 'lf Percent<1.ge PoinL.~ of\h,: Jé- íli.stril>lluon'·. Sk,tndmavi.ik
a los ejercicios
. ,, .
F.

G.
Aktuc.rie:idskriji. _.;3 ( 19'i0}, 168-175. l'1iliz;1Jo con aulornaciór..
De Ri,•metrik<t T ahleJJOr Stat1stu;i,ms, ~ .' ed. Vol. J, Benlfey Ho~s<'-. ! ondres, J Q70. k,,Jmpn.,·"
conautcrizadón
con numerac1on impar
H. D.:. Bimnetrika Tahfr.1 for Stati.1·rinan.i. 3. ·.:-<l .. Vol. 1, Ee,1tky Hou1e. Lon.Jre,. 1970. l_!tiliiado
,on autorización.
J. De F1ankWilcoxon, S. K. K,1tti y Rob<c"rtaA. W1Jcox, "Critical Va\uetandProbabili1y Leve Is for
the 'Nilcvxon Rank Sum Test and 1:-ie Wilcoxon Signed Rani:. Test". Preparada y distrihuldaorigi-
oalme11te por Lederle Laboratories Division, Arnerican Cyanamid C,1mpauy. Pearl River, Nue-
va Y,1rk, en <'O!ahoración con thc.' Dcpartntent vf Stat1sti..:s, Toe Florida S!ate tiniver.sity, Talh-
!ta.1see, Aorida. Revisadaenoctubre de 1968. Coprright i963 by¡J"" American C}·:.namid Compa;i;
1aa the Florida Sta!<: Univtrsity. R"producida con autorización de S K. Kani.
K A<l,1ptada d" L. R. Verd,1or~o. '·Extended Tahle.s of Critica! Value.~ for \\'ilco;,;on'; Test St,1.!i.~-
tir··, Biom,uriJ.:.,1. 50 (1<;'153), 177-1 R6. Ucil i.t.tila (Oll autoriza<'ión dt>l amor 'J E. S. P,•ar$OD a n,•m- Capítulo J
bre d,• Biom<::trika Tr11sues. Adaptación de W. J. Conover, r,.:rth-a/ I'f,mparam,•tric- S1ar1s110·.
Wiley. Nueva Y ~,rk. 1¡;7¡, 384-388.
1.5.1. Intervalos de clase sugeridos: 55-59. 60-64 .... 80-8+.
L. De L. H. ~,,filler. "Table of Percentag-J Points of Kolmogorov .Slaii.<li<:s"', lm1r11,,{ of tht.' American 1.5.3. Intervalos dt: clase sugeridos: 80-89. lJ0-99, ..• 140-149.
'>ratinical A.,svciatiot1, 51 (1956), 1 l ! ~ J 21. Rtimpreso con at1lon1..adón .le lht' An«:ric,1.n Sra· 1.5.5. Intervalos de clase sugcrii.los: O-~. 3-5, 6-8. 9- l 1. 12-14, 15-17.
:i:itical A.~soc1a1ion. Estatabla~ÍfU<' el formato que se enc11,·:1Lra en\\'. J C<.>uova. }',·a('tf.c,1{ ,\',m- 1.5.7.
pc.ra11wrric StC1'ÍJIÍC.>', © 1971. by John \Viley & Sons. !ne.
M. De W. H. Krusk.tl y\\'. A. \.Vallis. ''llse uf Rauks ln One-Cril·~ricn Analy,1is ofV:;vianci:", fnur-
,ia! ofthe A111t.'nr<111 StafÍ.l!Ír,~IAss.oc;a,ion, 47(1952}, 58~-621: <'rn,ta,ibid .. 48 (1953). 907-') 11.
/nrerra/n · Frec11encia
Rdmpre~o Cü:\ ;,uton.'.aciu:i o.le th,· A1?1eri..:¡i_n Statístical As~oc;,1ti•ln de clase Frecuencia refarira
N. o~ J\.-1. FticJman. "íhe lfu ,1fR.an ks to A void thi! Ass?Jmpti:,n cfNc,rmali:y !rJ,¡iJi.:j¡ 10 the A;,a]y · 110-139 8 .0516
,¡, ofVarÍJnce ', luur1<1l o{IÍ!I' ·\ ,,1,•rican S1a1is1ica! t\.s.wciati,>n, }! ( 19:r/\. 67 'j 70 L R~imt,.-e-
so co;i au!t>riLa.:ión 140-169 16 .1032
<.>. D~ Oeraid J. Gh.sser y Rc,bt'rt F. Wrnter. ··c~iri<:al Valu~s of the C'ct"fí:icienl of Ranb: CC'rr.:Jation 170-199 46 .2968
forT.:sting the Hypothcsh of lnd.:pcn<.tenc~··. 8iometrika48 (1961) 444-4'~8- l"tiln:adacon autu- 200-229 49 .3161
riz.ición. L.i ubla re1mrre~a 11.<¡ul tiene i:vrrei:cioner Jada~ er, W. 1. C'1111,)·:er. Prarri,11! No11- 230-259 26 .1677
par.imet11c Stat1$1,cs, !fJ ! 971, by J,•hc: Wi[ey & Sons. lnc. 260-289 9 .0581
290-319 1 .0065
-
155
- -
1.0000

1.5.9.

Hospital A: Hospital B:
Taflo Hojas Tallo Hojas
17 1 12 5
18 4 13 5
19 15 14 35
20 11259 15 02445
21 233447 16 5678
22 2259 17 38
23 389 18 466
24 589 19 0059
20 3
21 24

863
Respuestas a los ejercicios con numeración impar Respuestas a los ejercicios con numeración impar 865
864
Capítulo3
1.6.1. (a) 65.l (b) 65 (e) 65.
3.3.1. (a) .1484 (b) .8915 (e) .1085 (d) .2012.
1.6.3. (a) 9.4 (b) 1 J.
3.3.3. (a) .9729 (b) .9095 (e) .7827 (d) .0271.
t.6.5. Pollo
1.7.1. (a) 16 (b) 19.66 (e) 4.4. 3.3.5. (a) .001 (b) .027 (e) .972 (d) .271 (e) .972 (f) .729.
1.7.3. (a) 12 (b) 17.83 (e) 4.2 (d) 44.68. 3.4.1. (a) .176 (b) .384 (e) .440 (d) .427.
1.7.5. (a) 45.1667 (b) 54.5 (e) 47 (d) 39U879 (e) 19.7936. 3.4.3. (a) .105 (b) .032 (e) .007 (d) .440.
J.9.1. (a) 66.9 (b) 66.6 (e) 65-69 (d) 46.45 (e) 6.8. 3.4.5. (a) .086 (b) .946 (e) .463 (d) .664 (e) .026.
1.9.3. (a) 117.33 (b) 116.46 (e) 110-119 (d) 217.26 (e) 14.7. 3.6.1 . .4236.
J.9.5. (a) 6.53 (b) 5.85 (e) 15.1182 (d) 3.89. 3.6.3. . 2912.
).9.7. X = 203.8548, Mediana= 204.0918. s1 = 1368.4 ! 26, s =36.9921. 3.6.5. . 0099.
3.6.7•. 95.
Ejercicios de repaso 3.6.9. . 901.
s2 = 54.92 s = 7.4. 3.6.11. -2.54.
21. X = 23.07 Mediana= 22 s = 1.7.
s2 = 2.90 3.6.13. 1.77.
23. X = 9.42 Mediana = 9.45 s = 12.96 .
.12 = 168.0360 3.6.15. 1.32.
25, X = 35.23 Mediana = 35.64 s = 1.470433.
s2 = 2.162173 3.6.17. (a) .1151 (b) .2119 (e) .6730 (d) .1012 (e) 1.151.
27. X = 5.062 Mediana = 5.205
3.6.19. (a) .7486 (b) .0228 (e) .4772 (d) .0228.
29. 3.6.21. (a) .6826 (b) .2743 (e) .2743 (d) .3446 (e) .8833.
Tallo I Hojas
Ejercicios de repaso
1 2333466677
2 112233345678889 15. . 1719.
3 00123458 17. (a) .0916 (b) .0905 (e) .9095 (d) .1845 (e) .2502.
4 222368 19. (a) .762 (b) .238 (e) .065.
5 133457 21. (a) .0668 (b) .6247 (e) .6826.
6 113 23. (a) .0013 (b) .0668 (e) .8931.
25. 57.10.
27. (a) 64.75 (b) 118.45 (e) 130.15 (d) 131.8.
Capítulo 2 29. 14.90.
2.4.1. (a) 160 (b) 26 (e) 688 (d) 308 (e) 1025 (f) 263. 31. 10.6.
2.5.1. (a) 30 (b) 210 (e) 30.240 (d) 15 (e) 35 (f) 252 (g) 56 (h) 126 (i) 10.
2.5.3. 120. . Capítulo 4
2.5.5. 6. 4.4.!. (a) .9772 (b) .9544 (e) .0082 (d) .0082 (e) 11.51% (f) 94.520.
2.5.7. 4. 4.4.3. (a) .1814 (b) .8016 (e) .0643.
2.5.9. 560. 4.4.5. (a) .5 (b) .7333 (e) .9772.
2.5.11. 5040. 4.4.7. J17 = 5; (T'i;'t = 3.
2.6.1. (a) .16 (hl .03 (e} .67 (d) .30 (e) .995 (f) .26. 4.4.9. (a) .0853 (b) .0104 (e) .7973.
2.6.3. (a) .45 (b) .41 (e) .10 (d) .04. 4.5.1. .1379.
2.6.5 . . 95. 4.5.3. .0038.
2.6.7 . . 301. 4.5.5 . . o139.
4.6.1. (a) .0808 (b) .8384 (e) .2005.
Ejercicios de repaso 4.6.3 . . 0823.
11. (a} 30 (b) 54 (e) 33 (d) 85 (e) 100 (Í) 77 (g) 7 (h) 80. 4.6.5. (a) .1539 (b) .3409 (e) .5230.
13 •. 64. 4.7.!. .008.
15 • .49. 4.7.3 . . 0520.
17 . . 75.
19. . 21.
866 Respuestas a los ejercicios con numeración impar Respuestas a los ejercicios con numeración impar 867
Ejercicios de repaso Capítulo 6
13. . 8664. 6.2.1. Sí,z=3 p=.0013.
15. .001 !. 6.2.3. Sí. z =2.67 p =.0038.
17. . 0082. 6.2.5. Sí,z=-5.73 p<0.~001.
19. . 8882. 6.2.7. No, t = -1.5 .05 < p < .10
21 . . 0019. 6.2.9. Sí.z=3.08 p=.0010.
23. Distribución normal.
6.2.11. z = 4,p < .OOÚl
25- .0166. 6.2.13. t = .1271,p>.20.
27. 25. 1.4. 6.2.15. z: = -4.18. Se rechaza H 0 • r < .0001.
6.2.17. , = 1.67. p = 2(.0475) = .0950.
Cap{tulo5
6.2.19. z = -4. p < 0.0001.
5.2.1. (a) 88. 92 (b) 87, 93 (e) 86, 94. 6.3.1. Sí,z=-11.91 p<.0001.
5.2.3. (a) 7.63, 8.87 (b) 7.51, 8.99 (e) 7.28, 9.22. 6.3.3. sJ, = 29.30, t =-3.62. Se rechaza H 0 . p < 2{.005) = .01.
5.2.5. 1576.125, 1919.125. 6.3.5. NoserechazaH 0 z=l.40 p=2(.0808)=.1616.
5.3.1. 5.76. 8.24; 5.46, 8.54; 4.76, 9.24. 6.3.7. s¡,=5421.25 t=-6.66 SerechazaH0 p<2(.005)=.0l0.
5.3.3. 69.58, 76.42; 68.87, 77.13; 67.41. 78.59. 6.3.9. z = 3.39 Se rechaza H 0 p = 2(1 - .9997) = .0006.
5.3.5. .009(H .. 02160. 6.3.11. t = -3.3567 p < .01.
5.4.1. (a) -2.0. 13.0 (b) -3.5, 14.5 (e) -6.3, 17.3. 6.4.1. Sí,I= 16.63 p<.005.
5.4.3. (a) 4, 10 (b) 3.5, 10.5 (e) 2.3, 11.7. 6.4.3. SerechazaH0 t=3.46;.f,.5 p<2(.005)=.010.
5.4.5. -4.33, 7.33; -5.50, 8.50; -7.86, 10.86. Use 40 df. 6.4.5, 1=7.801.p<.01.
5.4.7. 2.1, 4.5; 1.8. 4.8; l.3. 4.8. 6.5.1. SerechazaH0 z=3.26 p<.0010.
5.4.9. 24.7, 33.2. 6.5.3. Sí, z = -8.94 p < .0002.
5.5.1. .04, .12; .03, .13; .01, .15. 6.5.5. , = -2.64. p = .0041.
5.5.3. . 14, .34; .12, .36; .08, .40. 6.6.1. f5 = .66 z=2.45 SerechazaH0 .
5.6.1. -.02, .10; -.03 .. 11; -.06 .. 14. p = .0142.
5.6.3. -.07, .19; -.09, .21; -.14, .26. 6.6.3. p = .27 z=2.90 SerechazaH0.
5.7.1. 27, 16. p = .0038.
5.7.3. 19. 6.7.1. Yes, x2 = 54 p < .005.
5.8.1. 683, 1068. 6.7.3. x2 = 6.75 NoserechazaH0 p>.05(pruebabilateral).
5.8.3. 385, 289. 6.7.5. x2 = 28.8 NoserechazaH0 p>.10.
5.9.1. 8.40 < a 2 < 18.54; 2.90 <a <4.31. 6.7.7. x2 = 22.036. . 10 > p > .os.
5.9.3. 630,307.86 <112 < 1,878,027.08; 793.92 <a< l,370.41. ~-8:J.· No V.R. : : : , 2.08 p > .10.
5.9.5. 1.37 < a 2 < 4.35; 1.17 < a < 2.09. 6.8.3. No V.R. = l.83 p > .10.
5.9.7. 170.98503 < u 2 < 630.65006. 6.8.5. Se_rechazaH0 V.R.=4 .01 <p<.025.
s.10.1. 1.48 < (o-~a7) < 9.76. 6.8.7. Y.R. = 2.1417. p > .10.
5.10.3 •. 49 < (u~lai) < 2.95.
5.10.5 . . 90 < (ailai) < 3.52. Ejercicios de repaso
5.10.7. 5.1263398 < (aVa~-) < 60.298059.
19. d. = .40 s! = .2871 5J = .54 t = 2.869 .005 < p < .01.
Ejercicios de repaso 21. z = l.095 .1379 > p > .1357.
23. t = 3.873 p < .005.
13. X = 79.87 s2 = 28.1238 s = 5.30 76.93, 82.81. 25. "el = 11.49 s! = 256.6790 5d = 16.02 t = 2.485 .025 > p > .01.
15. f, = .30 .19, .41. 31. t = .94. p > .10.
17. ¡,, = .20 ¡,, = .54 .26, .42. 33. t = 1.247. p > 2(.10) = .20.
19. f, = .90 .87, .93.
21. X = 19.23 s2 = 20.2268 16.0l, 22.45.
23. -12.219. -7.215.
Respuestas a los ejercicios con numeración impar Respuestas a los ejercicios con numeración impar 869
868
Capitulo 7 8.5.1. (a) 15.23 ± (2.2010)(1.3558)(.2774)
(b) 15.23 ± (2.2010)(1.3558)(1.0377).
7.2.l. Yes V.R. = 6.03 p < .005. 8.5.3. (a) .96 ± (2.2622)(.0341)(.3162)
7.%.3. Yes V.R. = 67.80 p < .005. (b) .96 ± (2.2622)(.0341)(1.0488).
7.2.5. No V.R. = 4.70 .025 > p > .01. 8.5.5. (a) 98.97 ± (2.3060)(2.6004)(.3210)
7.'l..7. l'"A -.fe y X8 -Xcson significativos. (b) 98.97 ± (2.3060)(2.6004)(1.0503).
7.2,9. X0 -X EY XA -X E son significativos. 8.5.7. (a) y= 30.79 + .7116 (90) = 94.834 (b) 67.755, 121.913.
=
7.2.11. V.R. 11.5808 p < .005. XA -Xe significativa; x 8 -Xc significativa; x 8 -Xv 8.7.1. (b) .90 (e) 1 = 7.44 (p < .01) .719, .966.
significativa. ·· (Se utilizó interpolación lineal.)
7.3.J. SíY.R.= 13.17 p<.005. 8.7.3. (b) .93 (e),= 7.16 (p < .01) .725, .983.
7.3.3. SíV.R.=30.22 p<.005. (Se utilizó interpolación lineal.)
7.3.5. V.R. = 276.64 p < .005. 8.7.5. (b) .54 (e),= 3.08 (P < .01) .184, .771.
7.4.1. (a) V.R. (A) = 38.78. V.R. (B) = 21.57. V.R. (AB) = 2.24 (Se utilizó interpolación lineal.)
(b) a< .03 p(A) < .005 p(B) < .005 .10 > p(AB) > .05.
7.4.3. V.R. (A) = 5.84, V.R. (B) = 44.34, V.R. (AB) = 30.09 .025 > p(A) > .01 Ejercicios de repaso
p(B) < .005 p(AB) < .005.
7.4.5, Puesto que 83.02 > 2.81, se rechaza a H 0 que indica efectos iguales con los 17. T = -.74 t = -4.67
tratamientos. p < .005. 19. j = 19.41 + .9895x r' = .9994 1 = 144.89.
Puesto que 7 :60 > 2.42 se rechaza a H 0 que indica efectos iguales en los
programas de fisioterapia. Fuente se G.L. CM R.V.
p < .005. Puesto que 5.88 > 1.89, se rechaza a H 0 que indica
Regresión 1364.4880 1 1364.4880 20,992.123
no interacción. .8453 13 .0650
Residual
p < .005. Los valores críticos de F se obtienen por interpolación lineal.
Total 1365.3333 14
Ejercicios de repaso
3. V.R.=8.042 SerechazaH0 p<.005.
21. j = 1.2714 + .8533x r' = .6878 1 = 5.35.
5. V.R.=.825 NoserechazaH0 p>.10.
7. V.R. (A)= 6.325 .005 < p(A) < .01 p(B) < .005 .01 > p(AB) > .005; V.R.
Fuente se G.L. CM R.V.
(B) = 38.856; V.R. (AB) = 4.970. Regresión 1.6498 1 1.6498 28.64
9. V.R. = 14.4364, p < .005. Residual .7489 13 .0576
ll. V.R. = 6.32049, .01 > p > .005. Total 2.3987 14
13. V.R. = 3.1187, 05 > p > .025. No existen diferencias significativas entre
pares individuales de medias.
15. V.R. (A)= 29.4021.p < .005; 23. j = 61.8819 + .509687x; V.R. = 4.285;. !O> p > .05;, = 2.07; .10 > p > .05;
V.R."(B) = 31.4898, p < .005; V.R. (AB) = 7.11596, p < .005. Intervalo de confianza del 95o/o para p: -.03, .79; 110.3022; 87.7773;
17. 499.5, 9. 166.5, 61.1667, 2.8889, 57.6346. < .005. 132.8271.
19. (a) Completamente aleatorizado (b) 3 (e) 30 (d) No. porque 1.0438 < 3.35. 25. j = 37.4559 + .0798579x; V.R. = 73.957; p < .005; 1 = 8.6013; p < .01;
Intervalo de confianza del 959'0 para p: .80, .99; 40.6150, 42.2826.
Cap{tulo8
8.3.1. j = 7.05 + 4.09x. Cap(tulo9
8.3.3. j = 1.36 - .008x. 9.3.}. j = 4639.56 - 244.43x 1 - 422.93x 2 •
8.3.5. j = 106.67 - l.54x. 9.3.3. j = 13.45 + 4.02x 1 + 2.8lx2 •
8.4.1. (a) .90 (b) V.R. = 103.41 (P < .005) (e) 1 = 10.17 (P < .01) (f} 3.21. 4.97. 9.3.5. j = -422.00 + ll.17x 1 - .63x2 •
8.4.3. (a) .94 (b) V.R. = 152.42 (P < .005) (e),= -12.29 IP < .01) (f} -.009, 9.4.1, (a) .93.
-.007.
8.4.5. (a) .78 (b) V.R. = 28.91 (p < .005) le) t = -5.38 IP < .01) (f) -2.2. -.88.
870 Respuestas a los ejercicios con numeración impar Rtspuestas a los ejercicios con numeración impar 871
(b) 9.6.I. j = -ll.6 + .920x 1 + 17.3x2 ;t 1 = 9.96;t':l = 7.51.
2
R = .864. Para individuos hipertensos: Y= 5.7 + .920x .
1
Fuente SS G.L. CM R.V. p Para individuos normales: Y= -11.6 ~ .920x •
1
Regresión 8,247,389.5 2 4,123,694.80 49.57 <.005 Dado que t = 7 .51 > 2.0930, rechazar H 0 según la cual p =O.Dado que
2
Residual 582,308.5 7 83,186.93 7.51 > 2.8609, p < 2(.005)"" .01. 17 .334 ± 2.0930(2.309); 12.50, 22.17.
9.6.3. j = 257 - 2.0lx 1 = 75.9x2 + 73.5x3 - .754x4 - 2.02x •
5
Total 8,829,698.0 9 11 = -5.lBl'I. = 2.80(:1 = 2.82t 4 = -l.5615 = -4.12
2
R = .907.
(e) t(b¡) = -3.45, t(b 2 ) = -3.22 (.01 < p < .02 para ambas pruebas). Para el área A:}'= 332.9- 2.764x 1
9.4.3. (a) .67. Para el área B: Y= 330.5 -4.03x 1
(b)
ParaeláreaC: Y=257-2.0lx,
H 0 ; ¡3':l = Ü;. ,- = 2.80 > 2.7239, p < .01. Rechazar H
0
H 0 : ¡3 3 = O: t = 2.82 > 2.7239,p < .01. RechazarH11
Fuente SS G.L. CM R.V. p f1 0 : P4 =O: l =-1.56. No se rechazaH0dado que-.156 >-1.6896.
Regresión 452.56 2 226.28 7.05 .01 <p < .025 p > .10.
Residual 224.70 7 32.10 H0: P5 = O: t = -4.12. Rechazar H 0 dado que-4.12 <-2.7239.p < .01.
9.7.1. (a) b0 = 36.5323, h 1 = 6.4758, b2 = -.5749, R~_ 12 = .9976,
Total 677.26 9 F=933(p<.005) .
(b) T~l.':i. = .505, l = l.755 (.20 > .10)
(c)t(b,) = 3.75; (p < .01); t(b,) = 2.04, (.05 < p < .10) r, 2 . 1 = - .084, t = - .253 <P > .20¡
9.4.5. (a) .31. T12 .• = .902, t = 6.268 <P < .01 J.
(b) 9.7.3. (a)b 0 = -422.00,b 1 = ll.17,h 2 = -.63,R,. 12 = .5548
F ~ 4.89 (.01 < p < .025) .
Fuente se G.L. CM R.V. (b) r,1. 2 = .546, l = 3.056 (p < .01)
p
r, 2 . 1 = -.142, t = -.673 (p > .20)
Regresión 17,023.01 2 8,511.505 4.89 .01 < p < .025 í12,. = .078, t = .367 (p > .20).
Residual 38,276.99 22 1,739.86 9.7.5. j ~ 13.500946 - 7.I312752x 1 + 9.0677309x2 + .017812535x3
Total 55,300.00 24 - .35758245x3 R 2 = .967005; R == .9834.

(e) t(b,J = 3.05, <P < .01¡; t(b,J = -.67, <P > .20). Ejercicios de repaso
9.5.1. (a) 2148.62 ± (2.3646)(288.42)
7. R = .3496 F = .83 IP > .10).
X
¡\; +
(.060319)(.8)' + (.207378)(-.7)'
9. (a) j == 11.43 + l.26x 1 + 3.llx2
+ 2(-.086740)(.8)(-.7). (b) R' = .92.
(b) Arlidir 1 bajo el radical. (e)
9.5.3, (a) 50.41 ± (2.3646)(5.67)
¡t + (.035757)(-1.99)2 + (.059206)(.44)2
Fuente se
X G.L. CM R.V. p
+ 2(.022857)( - 1.99)(.44).
(b) Añadir l bajo el radical. Regresión 1827 .004659 2 913.50 69.048 <.005
Residual 158.728641 12 13.23
9.5.5. (a) 532.90 ± 2.0739(41.71)

Xv2~ + (.007678)(-.52) 2+ ·(.000506)(-2.12)2 1985.7333 14

+ 2(.000002)( - .52)( -2.12)


(b) Añadir 1 bajo el radical. (d)j = 11.43 + 1.26(10) + 3.11(5) = 39.56.
11. j = - 126.487 + .176285x 1 - l.56304x 2 + l.5745x:1 + l.62902x 4
872 Respuestas a los ejercicios con numeración impar Respuestas a los ejercicios con numeración impar
873
(b) 11.4.l. T + = 48.5 . .1613 <p < .174.
11.4.3. T • = 70. p = .1660.
Fue11te se G.l. CM R. v. p 11.5.1. X' = 16.13 p < .005.
11.6.1. T = 71 p > .20.
Regresión 30873.80 4 7718.440 13.655 <.005
5774.92 577.492 11.6.3. T = 151 - 11(12)/2 = 85. W. 025 = 27, W_ 975 = 11(10) - 27 = 83.
Residual 10
Rechazar H0, dado que 83 < 85 < 87, .05 > p> .02.
36648.72 14 11.7.1. D = .3241 p < .01.
11.7.3. D = .1319p > .20.
= 4.3967; t2 = -.77684; t3 = 3.53284; t 4 = 2.59102
(e) t 1 11.8.1. H = 19.55 p < .005.
(d) R;_ 1254 = .8424255; Ry_ 1234 = .911784. 11.8.3. H = 23.0375 p < .005.
13. j = -11 l.6 + 80.387x 1 + 159.40~ 11.8.5. H = 13.86 p < .005.
11.8.7. H = 14.75 .01 > p > .005.
Coeficiente
11.9.1. x;
= 8.67 p = .01.
11.9.3. X~ = 13.74 p < .005.
-111.6 -.97 11.9.5. x; = 11.1 p = .00094.
80.387 15.53 11.9.7. x;
= 7.28 p - .054.
159.40 2.12 11.10.]. rs = -0.07 p > .20.
R2 = .918 11.10.3. r 5 (corregido para valores iguales)= .95. p< .002.
11.10.5. ,, = .99 p < .001.
Para varones, 5, =42.8 + 80.387x 1 Jl,}0,7, Ts = .6979.
Para mujeres, 5' =-111.6 + 80.387x 1 .002 < p < .010.
=
Para 1 2.12, .05 > p > .02. 11.11.1. ~ = 1.429
Ó.l.M = - l 76.685
Cap(tulo 10 0,,M = -176.63.
10.3.1 X' = 2.072 p > .005.
Ejercicios de repaso
10.3.3. X' = 3.417 p > .10.
10.3.5. X'= 2.21 p > .10. 9. P(X ,a 1 1 10, .5) = 1 -.9893 = .0107 p = .09127.
10.4.1. X' = 27.272 p < .005. 11. X~ = 16.2 p < .005.
10.4.3. X' = .765 p > .JO. 13. D = .1587 p > .20.
10.4.5. X' = 42.579 p < .005. 15. rs = .6397. p < .005.
10.5.1. X' = 65.855 p < .005.
10.5.3. x2 = 32. 754 p < .oos. Capitulo 12
10.5.5. X2 = 82.373 con 2 g.l. Rechazar H0. p < .005.
1%.2.1. (a) 10.4 (b) 10.1, 11.0 (e) 16.1 (d) 21.5 (e) 16.9 (f) 47.6 (g) 15.2, 27.3.
Ejercicios de repaso 12.3.1. (a) 97.0, 165.4, 125.0, 62.4, 5.8, 3.5
(b) 2413 (e) 485; 1312; 1937; 2249; 2378; 2413.
11. X' = 10.7827 p < .005. (d) 76.5
13. X' = 3.4505 p > .10.
15. }(' = 8.1667 p < .005.
11. x' 67.8015 p < .005.
=
19. }(' = 7.2577 .05 > p > .025.
21. Independencia.
23. Homogeneidad.
29. X' = .4267. p > .10.
Cap~t"-lo 11
\1.3.!. P = .3036 p = .3036.
1\.3.3. P(x. s 2 1 13, .5) = .0112. Dado que .0112 < .05, rechazar H0. p = .01 l 2.
\__,

e
e
e
e
e ,
\...,
Indice
v
v
u
v
V
v
J
J
J A y análisis de regresión lineal simple, 489-491
.._¡ Amplitud, 45
Conjumos, 73
complemento, 74
Análisis de variancia, 345-451 unidos. 74
e )
unilateral, 348 disjuntos, 74
bilateral. 375 vacíos. 73
V Análisis exploratorio de datos. 58 iguales, 73
Arreglo ordenado, 22-24 intersección de, 74
J nulo. 73
B subconjun10. 74
.._¡ unión, 74

v Banda de confianza. 487


Bioestadística, 17
unitario, 73
universal. 73

v e
Corrección de población finita, 150
Corrección de Yates, 664-665
Corrección para continuidad, 162
v Calidad de insesgado. 173 Correlación parcial, 585-587

v Coeficiente de confiabilidad, 177


Coeficiente de confianza. 177
Coeficiente de correlación múltiple, 585-588
Cuartiles, 53-55

D
s.) Coeficiente de correlación por rangos de

v Spearrrum. 742-749
Coeficiente de detenninación, 470-477
Coeficiente de determinación múltiple, 553-556
Datos faltantes, 398
Despliegue de 1allo y hojas, 31-35
Desviación estándar, 47
V Coeficiente de ~·ariación, 47-52 calculada a partir de datos agrupados. 60
Coeficientes de regresión parcial, 541 Diagrama de árbol, 80
V Combinación, 81-85 Diagrama de dispersión, 459
Comparaciones múltiples, 365-369 Diae:rama de Venn, 74
l.) Comparaciones por pares, 280-284 Dis;ño completamente aleatorizado, 347-373
Computadoras Diseño de bloques incompletos. 400
V y análisis de variancia, 347, 365 Diseño de cuadrado grecolatino, 400
y anállsis bioestadístico, 20-22 Diseño de parcelas divididas, 40!
y ji-cuadrada. 672 Diseño del cuadrado latino, 400

""'v y prueba de hipótesis, 263-265


y análisis de regresión múltiple. 564-566
y números aleatorios. 143
Diseño en bloques completamente aleatorizados.
373-381
tabla ANOVA. 379-380
V
~

l.,,
Indice Índice
877 V
876
suposiciones, 377 Estadística de prueba, 246 paraµ, .. 1. .. k. 562-563 aleatoria simple, 140 v
Distribuciones de probabilidad. IQ].J38
para variables continuas, 119-121
para variables discretas, 1QI. J05
Estadística descriptiva. 17
Estadística inferencia!, J 7, 171
Estadística no paramétrica, 697-762
para la media de la población. 175- 183
para poblaciones con distribución no normal.
179-180
tamaiio de la. para es1imar la media,
202-205
tamaño de la. para estimar proporciones,
....
acumulativa. 103-104 ventajas, 697 para i>roporciones de población, 197-199 205-207 l.,,
Muestreo aleatorio simple, 139-144
propiedades. 103 desventajas. 698 interpretación práctica, 179
Distribucióp binomial. !05-1 ! 2 Estadísticas vitales, 763-777 interpretación probabilística, 179 sin reemplazo. 140 l.,,
DistribuCJon conju111a.. 492
Distribución de Bemoulli. 105
Distribución de frecuencia, 24-35
Estimación, 171-244
Estimación por intervalos, 172
Estimación puntual. 172
para la razón de dos variancias, 213-217
para p, 501
para la variancia, 208-213
con reemplazo, 140
Muestreo de probabilidades, 139
Mues1reo no probabilístico, 139
....
Distribución de ji-cuadrada. 210. 639 Estimador, 172 Intervalo de predicción. regresión múltiple.
Multiplicadores de Gauss, 557 \,,,
propiedades matemáticas. 639-642 Eventos 563-564
su utilización en fas pruebas de bondad de independientes, 91-92 regresión lineal simple, 485-486 N \,,,
ajuste, 643-657 mutuamente excluyentes. 72
para frecuencias esperadas pequeñas. 648 Experimento fac1orial, 383-394 L
Nivel de significación. 249 l.,,
Nueva prueba de amplitud múltiple de Duncan.
su milización en pruebas de homogeneidad, tabla ANOVA. 393
367

""""
568-675 supuestos (restricciones), 388 La z de Fisher, 500
su utilización en pruebas de independencia, Extrapolación, 507
p
657-668 M
tabla de 2 x 2, 662-664 F

"""'
Parámetro. 39
Distribución de Poisson, 114-117 Media, 39-41
Parámetros de !ocaliiación. 53
Distribución/, 214 Factorial, 78 calculada a partir de datos agrupados. 51-52
Fecundidad, 772 Pendiente. 460
Distribución muestra]. 139-170 propiedades. 42
Fertilidad, 772 PercentiL 53
construcción de, 144 Mediaarreglada.49, 181
definición. 144
de la diferencia entre las medias de dos
muestras, 155-159
poblaciones con distribución no normal,
medidas de, 772-774
Frecuencias acumuladas, 28
Frecuencias relativas, 28
Frecuencias relativas acumuladas, 28
Mediana. 40-41
calculada a panir de datos agrupados, 52
propiedades. 41
Mediciones, 699
Permutadón. 79-81
de objetos que no son todos diferentes, 83-85
Población. 20
finita. 20
"'...
148-150
de la diferencia entre las proporciones de dos
muestras. 164-166
Función de densidad, 121

G
Medidas de dispersión. 44-50
Medidas de tendencia central. 39-50
calculadas a panir de datos agrupados, 50-62
infinita. 20
muestreada. !73
obje1b·o. 17":- "
\.
""'"'
Poli~ono de frecuencia. 31
de la media muestra!. 144-153 ?.1étodo de mínimos cuadrados. 460
Grados de libertad. 46, 661 Mínima diferencia sifnificati\'a. ":,67 Prohabilidad. 69-100
de la proporción muestra\, 160-163
/l /l/1.ll(rÍ/ll'Í. 70
Distribución mu\tivariada. 58-l Gráfica de caja con valores extremos (Box and MINITAB:
Distribución normal. 122· I 28 Whisker), 56-58 y la :,1:ática de caja con valores extremos. 56 ,i priori. 70

d:isica. 70
\..
estándnr, 123-128 y la ji-cuadrada. 671
condicional. 87-88
Distribución normal bivariada. 492
·" )' los Intervalos de confianza para una media.

"'"'""
conjunta. 89
Distribución normal estándar, !23-128 180-181. 186
comandos pa.rn el manejo de da.tos. 779-784 marginal. 89-90
Distribución normal multivariada, 584 Hipótesis. 245
y las medidas descripti,·as. -19-50 objeth·a. 70-72
Distribución r. 183-186 alternativa, 247
nula, 246 y las ,•ariabks imaginarias. 571 pe~sonalista. 71
Yla diferencia emre las medias, l 91 propiedades. 7:!
variancias de población desiguales. 192 de investigación, 246 y los histogramas. ":, l

"'
frecuencia rel::itiva. 71
propiedades. 184 es1adfstica. 246 y las pruebas de hipótesis. 263-26-1
Histograma, 28-31 Y !a prueba Kruska!-Wallis. 734-7~5 si.:bje1i1·a. 71
Distribución t de Studen1. 183 [ 86
)' la regresión múltiple. 564-565. 576
Procedimiento de distribución libre. 698
Proces\l de Poisson. 115-117
f...
E y ANOVA unilateral. ":-65-366

"'"'"'
Prueba de bondad de ajuste. 6-13-657. 723-728
)' regresión lineal simple. 489--190
lnferenda estadística, l 71 y despliegue de tallo y hojas . .?.3-:0-1
Prueba de F. 361-362
Ecuaciones normales. 460
Eficiencia, 399 lnteracción, 383-385 Pruet,a de Friedrnan. 737-740
Moda. 42
Prueba de KohnogorO\'·SmirnO\'. 72":--729
Error de tipo J. 244 ln1ervalo de clase. 24 calculada a panir de datos agrupados. :'i3
lntervalo de confianza Prudia de Kruskal-\\'allis. 729-735
Error de tipo II, 244 1'-1odelo de correlación múltiple. 584-591
para ~. 483-484 Prudm de la mediana. 724
Error estándar de la media. 49, 1<'.8 Modelo de correlación. muestra lineal. -191--192

"'"'
para la diferencia entre las medias de dos Prucha de la rel::ación de variancias. 296
Escala de la razones, 700 Modelo de efectos fijos.;,::; l
poblaciones. 189-194 Morbilidad. 77:'i . Prn~ha Je Mann- \Vhimey. 718-722
Escala del intervalos, 700
para poblaciones con distribución no normal, Prm:ha Je signo. 70 l- 709
Escala nominal. 699 niedidas. 775-776
Prudia Je Tukcy de DVS. ;,67-.',69
Escala ordinal, 699 190 Muestra, 20

"
para la diferencia entre las proporciones de do~ noaleatoria.17-l-175 Prucha Je \~'ilcoxon. 7 lO- 71.'1
Escalas de medición, 699-701
poblaciones, 197-199 Prucha., Je hipútcs1s. 2-15-J-l.J
Es1adística (disciplina), 17 probabilidad de !a. 1-!0
Estadística {medida), 39 para la media de Y. dada X, 486-489 aleatoria. !72-17_1;
por medio dd intenalo de confi:wza. 2:'-6 (.

•'
~
..
~ Índice
878
~ T
diferencia entre dos me_diU.S, 2~~-276
~ para poblaciones con d1s1nbucmn no nornul,
Tabla ANOVA. 362
275-276
~ para poblaciones con vari:mcias conocidas, Tabla de contingencias, 657

.,.,
~
269-271
para poblaciones con variancias desconocidas,
271-274
Tabla de números aleatorios, 823
uso, 141-142
Tasa. 763

.,,,
por medio de intervalo de confianza. 256 Tasa bruta de natalidad original, 772
paca la media de una sola población, Tasa de ataque secundario. 776
252-269 Tasa de fertilidad
para una población con distribución no normal, es~cffica por edades, 772

.,.,
262-265 acumulad.i. 774
para una población con variancia conocida, general, 772
252-257 est.indarizad.i, 774
para una población con variancia desconocida, total, 774
252-255 Tas.i de incidencia. 775

.,., para la propordón de una sola población, 287-288


para la variancia de una sola población, 293-295
pasos de. 246-249
para las proporciones de cJos poblaciones,
Tasa de mortalidad
brurn. 764
fetal, 769

.,...,
específic.i. 765
290-293 e.5t.im:huizru:la, 765
para las variancias de dos poblaciones, Tas.i de mort.ilid.id
296-300 infantil, 768
b:;ateral, 257 m.itema, 768

,,,, R

Razón, 764
neonatal, 769
pcrinatal, 769
T.isa de prevalencia, 776
Tasas y razones de moctalidad, 764-77 J

,,,, Razón de cau~as de defunción. 770


Razón de inmadurez. 776
Razón de monalida<l propon:ional. 770
Razón de muertes-casos. 776
Teorern:i del límite central, 148
Teoría de conjuntos, 73-77
Transformaciones, 399

,,,,
Recta de mínimos cuadrados. 460 u
Región crítica, 254
Región de aceptación. 249 U ni dad de asociación, 491
Región de rechazo, 249

,,
Regla de decisión. 249 V
Regla de la adición. 89
Regla de multiplicación. 90-92 V.ilor critico. 254

.., Regla de Sturges. 25


Regresión
m1iltiple, 539-638
suposiciones. 540
Valores p, 255-256
Variable, 17
.ilcatoíia continua, 18
dependieme, 455

..,..,"'\ ecuación. 542-548


modelo, 540-541
no paramétrka. 75!-7.'i4
línea simple. 454-464
aleatoria discreta. l 8
imaginaria. 18
imJcpendiente. 455
predicción. 543

..,.., suposiciones. 455·456


ecuación. 456-464
modelo. 455-456
Relación de variancias. 296
cua!it.itiva. J 8. 566-58 l
cuanlitativa. l 8
· aleatoria. J 8
Variable imaginaria, 567

..,.., s
Sesgos. 181
Variables cu.ilititativas. 566-584
Variancia. 46-47
caku!ada a partir de datos agrupados. 58-61
e~llrnación por intervalos. 208-2 JO
Supuestos (rc~lricd¡,w~'>). 349. 352 e,11 madón punmal. 208

1,,tPRl:SO É~ PROGRAMAS foUCATIVOS, $.A. OE C.V.• 315246 000 06 97 517


-oOo---
f.> i ' ( !',' ¡¡, '---
.,i e
()

e,.-

i \___)
' v
(.__,
i
j
V
V
1 Obras atines: u
(.__,
METODOLOGÍA DE LA INVES"i'IGACIÓN
1 Manual para el desarrollo del personal l,
1 de salud (.__,
1 Canales
(.__,
1 Este manual concibe la investlgaclón como
1 l,
una estrategia de trabajo en las labores de
salud y un instrurner:ito de ·?poyo par? la l.,
{' capacitación del personal. L,
!
V
METODOLOGÍA DE LA INVESTIGACIÓN l,,.,
Namakforosh
l,
Guía para desarrollar un:l investigación
paso a paso. Esta obra menc¡Ona las dife-
V
rentes etapas del proceso de la investiga- l.,
ción, su razón y su importancia. Proporcio- V
na ejemplos que permiten poner en prácti·
ca los conocimientos adquiridos. v
V
u
u
V
'v
v
\,;

¡ ' ...,
L
~
: ""'
....,

Vous aimerez peut-être aussi