Vous êtes sur la page 1sur 640
BIOESTADISTICA: PRINCIPIOS Y PROCEDIMIENTOS segunda edicion (primera en espafiol) Robert G. D. Steel Profesor de Estadistica North Carolina State University James H. Torrie Profesor Emérito de Agronomia University of Wisconsin Traducci6n Ricardo Martinez B. Profesor Asociado Universidad Nacional de Colombia Revision desis Maria Castafio Profesor de Matematicas http://arveja.awardspace.com McGRAW-HILL Bogota, Buenos Aires, Guatemala, Lisboa, Madrid, México, Nueva York, Panama, San Juan, Santiago, Sao Paulo Auckland, Hamburgo, Johanesburgo, Londres, Montreal, Nueva elhi, Parts, San Francisco, San Luis, Sidnev, Singapur, Tokio, Torortto RESERVADOS TODOS LOS DERECHOS (D.R.) Copyright © 1985, por EDITORIAL McGRAW-HILL LATINOAMERICANA, S. A. Apartado 81078 Bogota - Colombia Ni este libro ni parte de él pueden ser reproducidos o transmitidos de alguna forma o por algiin medio electronico o mecénico, incluyendo fotocopia 0 gtabacién o por cualquier otro sistema de memoria oe archivo, sin el permiso escrito del editor. Traducido de la segunda edicion de PRINCIPLES AND PROCEDURES OF STATISTICS A Biometrial Approach Copyright © 1980 por McGraw-Hill Inc. ISBN 0-07-060926-8 0987654321 8976432105 ISBN 968-451-495-6 Impreso en Colombia Printed in Colombia Esta obra se termina en septiembre de 1985 en Editorial Presencia Ltda - Calle 23 No. 24-20 ‘osonqunseid epeu efinbues) euosied eun A aquatoed A osoystuse Josayoid un any ‘eyagJeo eARaNpold A eBI8] Eun.Oany Wp "UOSIPE Us UISUODSI AA OP PEPISISAlUs) Ef 3p BIUouOIsY ap oILeUrY JOszjorg s2oualUS BIg ‘pnyes eLeosid ap je Bled uolany ‘97.61 ap odew ep O¢ [2 ‘aWeTW Ns E sazorJaque saye sop SOT ‘ugtaips Epundges jse ap UO ooEpal e| ua Jedioiped opnd ou uamb ‘enso] “p] selueyr ep eOWeW zy] ¥ t CONTENIDO Capituto 1 12 13 La Capitulo 2 21 2.2 23 24 25 26 27 28 29 2.10 241 212 2.13 2.14 21S 2.16 Prefacio Simbolos escogidos Introduccion Definicion de la estadistica Breve historia de la estadistica La estadistica y el método cientifico El estudio de la estad{stica Observaciones Introduccion Variables Distribuciones Poblaciones y muestras Muestras aleatorias: Recoleccién de datos Presentacin, resumen y caracterizacién de la informacion Medidas de tendencia central Medidas de dispersion Desviacién estandar de las medias Coeficiente de variabilidad o de variacian Ejemplo Modelo lineal aditivo Ejemplo Eluso de codificacién en el célculo de estadtgrafos La tabla de frecuencia Ejemplo wane viii CONTENIDO Capitulo 3 3 3.2 33 34 3.5 3.6 3.7 3.8 3.9 3.40 3.1 342 Capitulo 4 4a 42 43 44 45 46 AT 48 49 4.10 an Capitulo § SL 5.2 53 54 5.5 5.6 3.7 5.8 5.9 5.10 Calculo de la media y la desviacién estandar con una tabla de frecuencia PresentaciGn grafica de la tabla de frecuencia Digitos significativos Probahilidad Introduccion Algunos elementos de probabilidad La distribucion binomial Funciones de probabilidad para variables continuas La distribucion normal . Probabilidades de una distribucion normal. Uso de una tabla de probabilidades La distribucibn normal con media yy varianza o? Distribucibn de medias Distribucion 2° Distribucion ¢ de Student Estimacién e inferencia Predicci6n de resultados de muestras Muestreo de una poblacion normal Introduecién Una poblacién con distribucién normal Muestras aleatorias de una distribucion normal Distribucion de medias muestrales Distribucion de varianzas y mucstrales y desviaciones estandar Insesgamiento de 5? Desviacion estandar de la media o etror estindar La distribuci6n f de Student ) enunciado de confianza Muestreo de diferencias Resumen sobre muestreo ‘Comparaciones entre dos medias muestrales Introduccién Pruebas de significancia Prueba de hipétesis de que una media poblacional es un valor dado Pmebas de dos o més medias Comparacibn de dos medias muestrales, muestras independientes ¥ Varianzas iguales Modelo lineal aditivo Compasacibn de medias muestrales; obsesvaciones pareadas de importancia . El modelo lineal aditivo para comparaciones pareadas Muestras independientes y varianzas desiguales La media y 1a varianza de una funcién lineal 34 35 35 37 37 a7 40 46 48 33 35 56 58 59 63 65 65 65 68 68 a 72 72 B Bs 76 80 83 83 88 91 93 97 98 101 102 103 SL 5.42, 313 Capitulo 6 6.1 6.2 63 6.4 6.5 6.6 6.7 6.8 69 6.10 6AL 6.12 6.13 Capitulo 7 a1 7.2 13 14 1S 16 Wd 78 79 7.10 Capitulo .8 81 8,2 33 8.4 8.5 8.6 CONTENIDO ix Prueba de hipdtesis de igualdad de varianzas Poder, tamajio de la muestra y determinaci6n de diferencias Muestras bietapicas de Stein Principios de disefo experimental Introduccion Qué es un experimento? Objetivos de un experimento Unidad experimental y tratamiento Error experimental Repeticiones y sus funciones Factores que afectan el ntimero de repeticiones Precision relativa de disefios con pocos tratamientos Control del error Eleccidn de los tratamientos Refinamiento de la técnica Aleatorizacion . Inferencia estadistica - Anilisis de la varianza I: Clasificacion de una via Introduccion E] disefio completamente aleatorio Datos con un solo criterio de clasificacion: El andlisis de la varianza para cualquier nimero de grupos con igual nimero de repeticiones Datos con un solo criterio de clasificacién: El anilisis de la varianza para cualquier némero de grupos con nétmero desigual de repeticiones El modelo lineal aditivo Anilisis de la varianza con submuestras: Numero igual de submuestras Modelo lineal para submuestreo Analisis de la varianza con submuestras: Desigual namero de submuestras Componentes de la varianza en experimentos planeados con submuestras Supuestos en que se fundamenta el andlisis de ta varianza ” Comparaciones miltiples Introduccion La diferencia minima significante Comparaciones Prueba de efectos sugeridos por los datos Prueba de Scheffé Procedimiento w de Tukey 108 109 116 ns Irs 8 ne 120 12 122 123 125 25 128 128 129 130. 132 132 132 134 140 144 148 154 156 139 162 166 166 167 173 175. 177 mad x CONTENIDO 8.7 88. 89 8.10 8.1L Capitulo 9 oA 92 93 94 9.5 9.6 9.7 28 ~~ 99 9.10 9.11 9.12 9.13 944 918 9.16 * Capitulo 19 . 10.1 10.2 10.3 10.4 10.5 10.6 10.7 10.8 10.9 10,10 10,11 10.12 10.13 Capitulo 11 Vl 1b.2 13 Prucba de Student-Newman-Keuls o S-N-K Nueva prueba de amplitud miltiple de Duncan, Comparacién de todas las medias con un contro] Prueba de r de raz6n & bayesiana de Waller-Duncan Pruebas de medias con namero desigual de repeticiones Andlisis de la varianza I: clasificaciones multiples Introduccion El diseito de bioque completo al azar Andlisis de la varianza para cualquier numero de tratamientos; diselio de bloque completo al azar La naturaleza del término de error Particion det error experimental Datos faltantes Estimacion de la ganancia en eficiencia El disefio de bloques completos al azar: mas de una observacion por tratamiento por bloque Modelos lineales y el andlisis de 1a varianza Agrupamiento doble: cuadrados latinos Anilisis de la varianza del cuadrado latino Parcelas faltantes en el cuadrado latino EstimaciOn de la ganancia en eficiencia #1 modelo lineal para el cuadrado latino El tamaito de un experimento ‘Transformaciones Regresién lineal Introduccién La regresin lineal de Y con respecto a El modelo y 1a ecuacin de regresion lineal Fuentes de variacion en Ja linea de regresion lineal Valores de regresion y valores ajustados Desviaciones estandar, intervalos de confianza y pruebas de hipdtesis Control de ia variacion por observaciones concomitantes . Diferencia entre dos regresiones independiente Una prediccién y su varianza Prediccion de X, modelo I Distribuciones bivariantes, modelo II Regresién a través del origen Anilisis de regresibn ponderada Correlacién lineal Introduccién La correlacion y el coeficiente de correlacion Correlacién y regresién 180 181 4182 134 185 188, 188 188 190 19S 198 202 207 208 2u1 213 215 219 221 223 224 226 232 231 21 236 240 242 244 248 250 253 256 256 258 261 263 263 263 268 114 15 11.6 Capitulo 12 121 12.2 12.3 124 \ Capitulo 13 13.1 13.2 13.3 13.4 13.5 13.6 \, Capitulo 14 14,1 14.2 14.3 144 14.5 14.6 14.7 14.8 14.9 Capitulo 15 15.4 1s. 15. 15.4 15.5 15.6 15.7 15.8 CONTENIDO xi Distribuciones muestrales, intervalos de confianza y pruebas de hipétesis Homogeneidad de los coeficientes de correlacién Correlacién intraclases Notaci6n matricial Introduccion Matrices Operaciones con matrices Inversas, dependencia lineal, y rango Regresidn lineal en notacién matricial Introduccion E] modelo y la estimacion de minimos cuadrados El andlisis de la varianza Desviaciones estandar, intervalos de confianza y pruebas, de hipotesis Estimacion y prediccion Variables indicadoras o binarias Regresion y correlaci6n miltiple y parcial Introduceién La ecuaci6n lineal y su interpretacién en mas de dos dimensiones Regresi6n tineal parcial, total y mdltiple La ecuacin muestral de regresi6n lineal multiple Regresion fineal multiple; dos variables independientes Correlacin parcial y miltiple Regresién lineal miltiple; resultados impresos para k variables independientes Miscelénea Coeficientes de regresion parcial estindar Andlisis de la varianza If: experimentos factoriales Introduccion Experimentos factoriales ” El experimento factorial 2 x 2: un ejemplo Factorial 3 x 3 x 2 6 3? x 2: unejemplo Modelos lineales para experimentos factoriales Clasificaciones de n vias y experimentos factoriales; superficies * de respuesta Grados de libertad individuales; tratamientos igualmente espaciados Un solo grado de libertad para no aditividad 269 21 273 276 276 277 278 283 288 288 292 294 296 298 303 303 304 306 308 309 316 320 324 325 328 328 328 334 340 346 352 354 363 xii CONTENIDO. Capitulo 16 —_Anilisis de la varianza IV: disefio y anfilisis de parcelas divididas “ 368 16.1 Introduccion 368 16.2 Diseiios de parcelas divididas 368 16.3. Un ejemplo de parcelas divididas 374 16.4 Datos faltantes en disefios de parcelas divididas 379 16.5 DiseAo de bloques divididos 381 16.6 Modelos de parcelas y de bloques divididos 384 16.7 Parcelas divididas en espacio y tiempo 384 16.8 Series de experimentos semejantes 386 Capitulo 17 Andlisis de la covarianza_ 392 17.1 Introduccion 392 17.2 Usos del anilisis de la covarianza 392 17.3 El modelo y lus supuestos para la covarianza 396 17.4 Prueba de medias de tratamientos ajustadas 398 17.5 Lacovarianza en el disefio de bloques completos al azar 401 17.6 Ajuste de las medias de tratamiento 406 17.7 Aumento de precision debido a la covarianza 408 17.8 Particion'de la covarianza 409 17.9 Homogeneidad de coeficientes de zegresion 412 17.40 Lavarianza cuando se particiona la suma de cuadrados de tratamiento 413 17.11 Estimacién de observaciones faitantes mediante la covarianza 417 17.12 Covarianza con dos variables independientes 418 17,13 Ciloulas de alta velocidad y salidas de computador 424 Capitulo 18 Anilisis de la varianza V: ndimero desigual de subclases 428 {8.1 Introducciéa 428 18.2 Observaciones multiples dentro de subciases 428 18.3 Andlisis de un n&imero proporcionado de subclases 429 18.4 Andlisis de un némero no proporcionado de subclases 432 18.5 Otras técnicas analiticas 440 Capitulo 19 Ajuste de curvas 442 19.1 Introduccién 442 19.2 Regresibn no lineal 442 19.3 Curvas logaritmicas 9 exponenciales 444 19.4 El polinomio de seguado grado 450 19.5 Polinomios ortogonales 451 Capitulo 20 Algunos usos del Ji-cuadrado . 458 20.1 Introduccion 458 20.2 Intervalos de confianza para 0? 458 20.3 204 20.5 Capitulo 21 2a 21.2 213 214 aus 216 27 Capitulo 22 224 22.2 22.3 22.4 22.5 22.6 22.7 22.8 22.9 22.10 22.11 22.32 Capitulo 23 23.1 23.2 23.3 23.4 23.5 23.6 23.7 Capitulo 24 24.1 24.2 24.3 24.4 24.5 24.6 CONTENIDO xiii Homogeneidad de la varianza . Bondad de ajuste para distribuciones continuas Combinaciones de probabilidades de pruebas de significancia Datos enumerativos [: clasificaciones de una via Introduccion 1 El criterio de prueba X Tablas de dos celdas, limites de confianza para una proporcion © porcentaje Tablas de dos celdas, pruebas de hipétesis Pruebas de hipétesis para un conjunto limitado de alternativas Tamaiio de la muestra Tablas de una via con n celdas Datos enumerativos II: tablas de contingencia Introduccién: El modelo de muestreo aleatorio El modelo de muestreo aleatorio estratificado Tabla cuddruple o de 2 x 2 “Prueba exacta’’de Fisher Muestras no independientes en tablas 2 « 2 Homogencidad de muestras de dos celdas Aditividad de x* > Mas sobre la aditividad de x Regresi6n lineal, tablas r x 2 Tamafio de la muestra en tablas 2 x 2 Clasificacion de n vias Algunas distribuciones discretas Introduccion La distribucién hipergeométrica ‘La distribucién binomial Ajuste de una distribucién binomial Transformacién para la distribucion binomial La distribucién de Poisson Otras pruebas con distribuciones de Poisson Estadistica no paramétrica Introduccion Prucba x? de bondad de ajuste Prueba de Kolmogoroy-Smimov con una muestra Laprueba de signos Prueba de rangos signados de Wilcoxon Prueba de Kolmogotov-Smimoy de dos muestras 460 461 464° 466 466 466 467 47h 474 478 480 482 482 482 486 489 491 493 495, 497 498 sol $03 504 508 508 508 $10 510 514 515 517 520 $20 521 522 $24 526 527 erg 6S5 6SS ess ass Lbs ors evs irs Tes Irs oes Les oes ves ves zEes zEes ogs oes ats aarpuy seqey aolpupdy SOpesawopaucd Jod o osdejannur oamsanyy eunjdg ugyoeusisy OpesyNENss oasany {Tus OLIOJEITE cansan oousipngeqoid oaysanyy OTpNysa [ap UOTAEZTURSIC ugmonpongy S¥}IUY SaUOISE]God ap oasony, Uglsergay ered UgIseZO}aTe ep EQontg AayN]-peISWO op ajuBIpPENds jap ugIoeIOOSE ap Bqantg uewvedg ap soBues ap UO!sEpeLI0D Sp ayUaTotya0y Aayshaay ep PEprendiseg SEJA SOP ap UCIOBoIy se] ve] ved wueIpaUl e] ap Eqanid eu, SETA SOP ap UOTOROIISeyD e] ETed URUIpelZy ap EgonIg SEI:SONW ¥ bred EUeIpow eB] op eqenig sexySonus y WOO SITE M-[PYSTIY ap eqonig euelpour ef op eqanig SeiysaTiUs SOp UoDd APUITYM-CURPY-UOXOITT ap Egon L'S% ost Sst rst est ust st St omnasdey OL bt SV ee Plz Eee EV ot IN'e2 OVez Sve Bye “re OOINDLNOD aX PREFACIO Esta segunda edicién de Bicestadistica (Principles and Procedures of Statistics: A Biome- trical Approach) reconoce el hecho de que la estadistica es necesaria, y ya ¢s usada por un creciente numero de disciplinas. Los principios estadisticos son independientes de la ma- teria en la cual se aplican, y los procedimientos aplicados en la agricultura y las ciencias biolégicas pueden llevarse 2 otras éreas como la industria, el gobierno, la ingenieria, la me- dicina, y dar alli tan buenos resultados como en aquellas; podréa decirse, a cualquier area donde se adelante la investigacion. Las universidades y colegios superiores aceptan gene- ralmente este hecho y exigen uno o varios cursos de estadistica como requisito para otor- gar titulos superiores. E] rapido crecimiento de la enseflanza de estadistica en los cursos de pregrado también estd asociado con los requisitos exigidos en este nivel. Este extraordi- nario crecimiento en el uso de la estadistica es paralelo en cierta medida con un rapido de- sarrollo de los procedimientos estadisticos, algunos de los cuales se cubren en este libro. Otros escapan a su nivel docente. Tendencias como la expansion en el uso de la estadistica y el crecimiento de los métodos explican por qué después de una vida vigorosa y de éxito en estos 20 afios, la edicion original Bioestadrstica (Principles and Procedures of Statistics: A Biometrical Approach) ha debido ceder el paso a esta nueva edicién actualizada, reor- ganizada y ampliada, Los supuestos basicos de ambas ediciones siguen siendo iguales: un enfoque esencial- mente no matemético porque los desarrollos algebraicos parecen crear temores en algunos estudiantes; presentacion y andlisis tempranos del disefio experimental de modo que los estudiantes y los profesionales en centros de investigacién puedan aplicar los métodos es- tadisticos aunque todavia se hallen en el proceso de aprenderlos, ¢ incorporacién de sufi- cientes técnicas que satisfagan las necesidades de la mayoria de investigadores. Esta edicién tiene unas 200 paginas mds que la primera. Obviamente se cubre més ma- terial. Entre otras cosas, tiene en cuenta los comentarios y las sugerencias que durante estos afios se han hecho a la primera edicién. Una de ellas y muy frecuente se referia al nivel de la lengua, argumentando que era muy dificil debido a su concisi6n. El autor ha w xvi PREFACIO x revisado el libro palabra por palabra y parrafo por pérrafo en un esfuerzo por ampliar las explicaciones y, por consiguiente, simpliticar el contenido. Se han incivido muchas técnicas auevas, algunas de las cuales se estudian brevemente y otras, con mayor detenimiento, Entre los miltiples y nuevos procedimientos de compa- racién se incluyen la dms protegida de Fisher, le prueba de Scheffé y la prueba f para la razon k bayesiana de Waller-Duncan, las itiles variables de indicadores se tratan breve, pero apropiadamente; el procedimiento de Satterthwaite para calcular pruebas cuasi razones F se explica cuidadosamente en una parte y se demuestra en otras; fos polinomios ortogo- pales se usan para producit ecuaciones de superticies de respuesta en experimentos facto- riales, y el capitulo 24, sobre estadistica no paramétrica, incluye ahora las pruebas de una y dos muestras para fa bondad de ajuste de Kolmogorov-Smimoy. No se ha deseuidado la modernizaci6n de las téonicas estindar. Los disefios de parce- las divididas en el tiempo se consideran como ejemplos de disefio de bloques divididos. El capitulo 14, sobre regresién mUltiple, se presenta en notacién matricial, el enfoque mo- derno que necesita de Ia interpretacion de resultados impresos que resultan de la tecnoto- gia de la computacién. La notacién matricial se ha presentado en los dos capitulos anteriores: el capitulo 12, sobre definiciones y procedimientos de operacién, pretende estimular al usuario de los paquetes de cilculos estadisticos a que adquiera un mayor dominio de los resultados impresos del computador, que los acomparian; el capitulo 13, sobre regresién lineal en presentacién de matricial, presenta en un desarrollo paralelo ef enfoque usual, tal como se desarroilé en el capitulo anterior. Este capitulo ayuda al lector a hacer la transicién a fa notacién matricial; y el anélisis de datos numérico de subclases desproporcionadas se relaciona con la regresién multiple y con los resultados impresos det computador. Hay una mejora en la organizacion del material respecto de la primera edicion. Por ejemplo, el andlisis de Ja distribucién binomial aparece ya desde el capitulo 2, en donde es muy itil para la presentacién de la distribucién normal; la discusin de una funcién lineal, su media y su varianza se han adelantado, de suerte que pueda relacionarse con la comparacién de dos medias, sea de muestras dependientes o independientes; los temas sobre contrastes y comparaciones miiltiples se han reunido en un nuevo capitulo 8, en donde las tasas de error se han definido cuidadosamente y se presentan guias y adverten- cias sobre la confusién que puede generar un exceso de pruebas; el capitulo 9 se beneficia de una discusién mejorada dei método para determinar el tamafio de un experimento; y el capitulo 24 ofrece una presentacién mas ordenada de la estadistica no paramétrica. Se ha prestado atencién a presentaciones alternativas, por ejemplo, un tratamiento més adecuado del uso de los componentes de la varianza en el planeamiento de experi- mentos con atenci6n a los costos involucrados; un manejo mas apropiado de correlaciones entre clases; un mejor enfoque —olvidado en la primera edicién— de las tablas de contin- gencia, usando modelos. Por ltimo, en atencibn a muchas solicitudes y sugerencias, la seleccién de ejercicios se ha aumentado considerablemente para incluir datos tomados de una gama mas amplia dentro de las ciencias biolégicas. Ademés, se han incluido datos obtenidos de las ciencias sociales, Para un conjunto de datos de pre-prueba y post-prueba, los andlisis propuestos incluyen tratamientos de dos conjuntos de datos, come problema de regresion y como disefio de bloques divididos. PREFACIO xvii Los autores quedan muy reconocidos con el profesor Sir Ronald A. Fisher, Cambrid- ge, con el doctor Frank Yates, Rothamsted, y con Oliver and Boyd, Ltd., Edimburgo, por haber autorizado 1a reproduccién de la tabla If de su libro Svaristical Tables for Bio- logical, Agricultural and Medical Research. Los autores tambiém expresan sus agradecimientos a Fred Gruenberger y al Numerical Analysis Laboratory de la Universidad de Wisconsin por su preparacion de la tabla A.Isa E. S, Pearson y H. O. Hartley, editores de Biometrika Tables for Statisticians, Vol\,y a Biometrika por su permiso para reproducir las tablas A.2, A.6, AS y A.1S:a CM. Thompson y a Biometrika por su permiso para reproducir la tabla A.S;a D. B. Duncan y al editor de Biometrika por su permiso para reproducir la tabla A.7; aC. W. Dunnett y al editor del Journal of the American Statistical Association por su permiso para reprodu- cir la tabla A.9; aC. I. Bliss por su permiso para reproducir la tabla A. 10 y a E. N. David y Biometrika por su permiso para reproducir la tabla A.11; a L. M. Milne-Thomson y L. J. Comrie, autores de Standard Four-figure Mathematical Tables y a MacMillan Co. Ltd., Londres, por su permiso para reproducir la tabla A.12: a G. W. Snedecor, autor de Statistical Methods, 4a. ed. y ala lowa State College Press por su permiso para reproducir la tabla A.13,a D. Mainland, L. Herrera y M, [. Sutcliffe por su permiso para reproducjr ja tabla A.14; a F, Mosteller y J, W. Tukey, editor del Journal of the American Statistical Association, y a Codex Book Company Inc., por su permiso para reproducir la tabla A.16; a Prasert Na Nagara, por su permiso para reproducir la tabla A.17; a Frank Wilcoxon y a la American Cyanamid Company por su permiso para reproducir Ja tabla A.18; a Colin White y al editor de Biometrics por su permiso para reproducir la tabla A.19; a P. S. Olmstead, J. W. Tukey, Bell Telephone Laboratories y al editor de Annals of Mathemati- cal Statistics por su permiso para reproducir la tabla A.20;a D. B. Duncan por su permiso para reproducir fa tabla A.21;a L. H. Miller y al editor de Journal of the American Statis- tical Association por su permiso para reproducir la tabla A.22; a Z. W. Birnbaum, R. A. Hall y al editor de Annals of Mathematical Statistics por su permiso para reproducir la tabla A.23; En particular, deseo agradecer a Wyman Nyquist por su valiosa critica de la primera edicién y del manuscrito de la revision. Ademds, tengo deuda de gratitud con muchos de mis colegas por sus sugerencias acerca de varios temas, con otros por sus generosos permisos para usar datos, y con aque- llas personas que me ayudaron en la preparacién de] manuscrito. Me hubiera extraviado sin las destrezas de Dorothy Green, quien mecanografié, corté y pegé el manuscrito final. Por ultimo deseo agradecer a mi esposa, Jennie, por su lectura cuidadosa de las pruebas y ayuda editorial. Robert G. D. Steel SIMBOLOS ESCOGIDOS MUWAW VE = no es igual a; por ejemplo, 3 # 4 mayor que; por ejemplo, 5 > 2 mayor que 0 igual a menor que; por ejemplo, 3 <7 menor que 0 igual a valor absoluto; por ejemplo] —7| = 7 suma de indica un conjunto de cantidades faltantes; por ejemplo 1, 2,..., 10 n(n — 1)... 1 llamado 7 factorial; por ejemplo, 3! = 3(2)1 = 6 se usa para indicar el promedio aritmético de una media sombrero; se usa para indicar una estimacién, no tanto un valor verdadero; por lo general aparece sobre letras griegas. con pocas excepciones se refieren a pardmetros de una poblacién media poblacional varianza poblacional y desviacion estandar componentes de las medias poblacionales; se usan comdnmente junto con modelos lineales error experimental verdadero error verdadero en la muestra; diferencia real coeficiente de regresién de la poblacién, efecto de bloque + coeficiente de correlacién de la poblacién Xxx SIMBOLOS ESCOGIDOS NY, S? estas letras latinas se usan como simbolos que indican poblaciones finitas, en especial en el cap. 25. Las anteriores letras griegas se wsan también con subindices para mayor claridad, Por ejemplo: uy media poblacional de las ¥ Brxz — regresion de ¥ sobre X con Z fijo 1 contribucién de la media poblacional que recibe el i-ésimo tratamiento Algunas excepeiones en el uso de letras griegas para indicar pardmetros son: x probabilidad de un error de Tipo I ira coeficiente de confianza B —_probabilidad de un error de Tipo I 1-8 poder de una pmeba estadistica x? ctiterio comin de prueba Letras latinas se usan como simbolos generales, incluyendo los de estadistica muestra) variable observaciones individuales totales de observaciones diferencia entre observaciones pareadas, ¥,; — Ya, total de tamafio de la muestra nimero de observaciones en i, j-ésima celda medias muestrales, total o parte de una muestra media de las medias muestrales varianzas muestrales, estimaciones no sesgadas de 0%, a#, y 0}, 559,59 desviaciones esténdar de la muestra Shx.5P1-- varianzas muestrales ajustadas por regresion CL, CI limites de confianza, o intervalos hls puntos extremos de los limites de confianza b —_coeficiente de regresion de la muestra byiae Coeficiente de regresion parcial de la muestra b’ —_coeficiente de regresion estandar r total de la muestra o coeficiente de correlacién simple Tiasax coeficiente de correlacién parcial de la muestra en X, y X Riz. Coeficiente de correlaci6n miltiple entre X, y otras variables §xx SOGID00Sa SOTOEWIS oyuyur SEAIEUIA}2 Sp OUN{UOS ayuatuyensn ‘eAlEWayE sisajodny Bnu sisazodny JeIwourg uIoNd}sIp eun ua sepepipiqeqosd Peprqeqoid SOTPUIGNS OWIOD ESN as ‘OpediyiyEs7s9 oarsonw ap eizeund peplun BUULy UO!DEIGOd Jod woD9aI109 O = 9 CA R10) oyuaruREN un opnuawese 'y ‘ajueysuoa so '9 yend eB] ua UgIRIEdWOD @]URISUOD sa '9 ‘SaUOIOBAIASgO Ep [BAU] UQIaUN Bun 001( /S) PEpMaEueA ap aquatsy209 BATIE[AI BIUATONS SyUBOITUBISs EUMUTU BIUaZayIp ayURoLTuats ou axl] ‘o[dwafe 1od ‘ajueoyusis ayuaureye af 7 ‘ojdwale 10d ‘ayreoyiugis (ug}eLea ap saruenj $2390 Jeorpur ered SBJ]9[ SE1}O UBSN as) EZUBTEADD B] Ud SOJINpOId so] ap 10a Jap seus SEPIPIATp sejaosed ap Ouastp un Ua JouJa [ap SeIpaus st] ap soptupend opaw opespeno soptipeno ap ewins* (4 — 4) % Ug}odBLIOS ap OUND) ‘UOToda1I09 ap .JO[EA ‘UOIIDALIOD ap 1O}EJ pewaqy ap sopesd CAPITULO. UNO INTRODUCCION 11 Definicion de la estadistica La estad stica moderna proporciona conocimientos a los investigadores. Es un tema nuevo y estimulante, producto del siglo XX, Para el cientifico, particularmente para el cientifico en Biologia, la estadistica comenz6 aproximadamente en 1925 cuando aparecié el libro de Fisher, Statistical Methods for Research Workers. La estadistica es un tema de répide crecimiento con mucho material original que todavia no se encuentra en textos; crece a medida que los estadisticos encuentran respues- tas a mas y mas problemas propuestos por los investigadores. Algunos de los primeros in- vestigadores que contribuyeron al desarrollo inicial de la estadistica todavia laboran acti- vamente, y los nuevos encuentran diversas oportunidades para sus talentos investigativos. En la aplicacién de Ja estadistica, los principios son generales aun cuando las técnicas puedan diferir, y la necesidad de formacidn estadistica crece a medida que se incrementa la aplicacién a las ciencias biotogicas y sociales, la ingenieria y la industria, Este tema nuevo y vigoroso afecta a todos los aspectos de la vida modema. Por ejem- plo, el planeamiento estadistico y la evatuacién de la investigacién contribuyen a los avan- ces tecnoldgices en el cultivo y procesamiento de alimentos; el control estadistico de calidad de los productos manufacturados hace confiables los equipos automotores y eléc- tricos. La estadistica ayuda a los encuestadores a recolectar datos para determinar las pre- ferencias de esparcimiento del piblico; proporciona informacién pata los estudios de impacto ambiental y ayuda en la evaluacion de las exigencias gubernamentales para que la industria farmacéutica demuestre que un producto es benéfico y no s6lo inofensivo. Cada vez son mas los grupos de investigacién en los cuales se encuentra un estadistico. La extensién de la estadistica hace dificil su definicin, Su desarrollo obedecié a la necesidad de tratar problemas en tos cuales, para observaciones individuales, las leyes de causa y efecto no aparecen claramente al observador y donde es necesario un enfoque objetivo. En tales problemas siempre existe un cierto grado de incertidumbre en toda infe- rencia basada en un niimero limitado de observaciones. Por lo tanto, para nuestro props- 2 BIOFSTADISTICA: PRINCIPIOS ¥ PROCEDIMUENTOS, sito, una definicién razonable y satisfactoria seria: La estadistica es la ciencia, pura y aplicada, que crea, desarrolia y aplica téenicas de modo que pueda evaluarse la incerti- dumbre de inferenctas inductivas. Para la mayoria de ics cientificos, a estadistica es [6gica o sentido comin con un fuerte ingrediente de procedimientos aritméticos. La légica proporciona el metodo me- diante el cual se deben recolectar los datos y determinar cudnto deben abarcar; la aritmé- tiea, junto con ciertas tablas auméricas, produce el material sobre el cual se basa ia infe- rencia y se mide la incertidumbze. La parte aritmética es 2 menudo rutinaria, y el estudiante necesita de formacién matemética especial, No vamos a ocuparnos directamente con las matemiticas, ya que es dificil encontrar ur campo de esta materia que no haya dado al estad istico alguna teoria util. : 1.2 Breve historia de la estadistica La historia de la estad fstica aclara en gran medida la naturaleza de la misma en el siglo XX. La perspectiva historica también es importante para ver las necesidades y las presiones que la crearon. Ei término estadistica no es nuevo, La estadistica debié comenzar como una aritmé- tica estatal para asistir al gobernante que necesitaba conocer la riqueza y el ntimero de sus stibditos con el objeto de recaudar impuestos o presupvestar la guerra, Es de presumir que todas las culturas que intencionalmente registraron su historia también registraron sus estadisticas. Sabemos que César Augusto decretd que todos los sibditos tenfan que tribu- tar y por lo tanto exigio a todas las personas que se presentaran al estadistico més cercano, que entonces era el cecaudador de impuestos. Debido a lo anterior, Jesis nacié en Belén, no en Nazareth, Guillermo el Conquistador ordené un censo de las tierras de Inglaterra para fines de tribut: ny de servi militar. Este se llamé “Domesday Book”, Tales es- tad isticas son historia. Varios siglos después del “Domesday Book”, encontramos una aplicacion de la pro- babilidad empirica ai seguro de embarque, del cual parece haber dispuesto la navegaci6n flamenca de! siglo XIV. Esto pudo haber sido poco ms que pura especulacién o juego de azar, pero legé a set la forma muy tespetable de la estadistica llamada seguros. El juego, en forma de juegos al azar, originé Ia teoria de las probabilidades, desarro- Hada por Pascal y Fermat, a mediados del siglo XVII, debido a su interés en las experien- cias de juego del Caballero de Meré. Para el estadistico y el cientifico experimental, tal teoria tiene mucho uso practico en la informatica. ‘La curva normal o la curva normal de errores ha sido muy importante en el desarro- llo de Ja estadistica. La ecuacisn de esta curva fue originalmente publicada en 1733 por de Moivre, quien no supo cémo aplicar sus resultados a observaciones experimentales y Su escrito permanecié desconocido hasta que Karl Pearson lo encontré en una biblioteca en 1924, Sin embargo, al mismo resultado legaron Iuego dos astronomos mateméticos, Laplace, 1749-1827, y Gauss, 1777-1855, independientemente el uno del otro. Un razonamiento esencialmente estadistico fue aplicado en el siglo XIX por Charles Lyell a un problema geolégico. En ¢l periodo comprendido entre 1830 y 1833 aparecie- ton tres volimenes de Principles of Geology de Lyell, quien establecié el orden de tas rocas terciarias y les asigné nombres. Con M. Deshayes, un conquilidlogo francés, identifi- 66 y enumeré especies fosiles que se presentaban en uno o mas estratos, y también logra- INTRODUCCION 3 ton dar las proporciones de las que atin vivian en ciertas partes de los mares. Basados en estas proporciones asignaron los nombres de: Pleistoceno (novisimo), Pliocene (mas reciente), Mioceno (menos reciente) y Eoceno (reciente), El razonamiento de Lyell fue esencialmente estadistico. Una vez establecidos y aceptados los nombres, el métado fue casi inmediatamente olvidado. No habéa gedlogos evolucionistas que se preguntaran si se trataba de etapas discretas, como lo implican los nombres, 0 bien si era un proceso con- tinuo y se podia utilizar para hacer predicciones. Otros descubrimientos cientificos del siglo XX también se hicieron sobre una base estadistica sin que se advirtiera apenas la naturaleza estadistica de la técnica, y desafortu- nadamente el método cayé pronto en el olvido. Esta afirmacién es valida para las ciencias biol6gicas y las fisicas Charles Darwin, 1809-1882, bidlogo, recibié en el Beagle el segundo volumen del libro de Lyell, Posteriormente Darwin formuld sus teorias y bien pudo haber influido en él la lectura de ese libro. La obra de Darwin fue, en gran parte, la naturaleza biométrica estadistica, y ciertamente renové el entusiasmo pot la Biologia. Mendel, con sus estudios sobre hrbridos vegetales publicados en 1866, también tuvo un problema biométrico 0 estadistico. “ En el siglo XIX, la necesidad de una base més sdlida para la estadistica se hizo mani- fiesta. Karl Pearson, 1857-1936, inicialmente fisico matematico aplicé sus matematicas a la evolucién, como resultado del entusiasmo que generé Darwin en 1a Biologia. Pearson dedicé casi medio siglo a la investigacién estadistica rigurosa, Ademds, fund6 Ia revista Biometrika y una escuela de estad istica; con ello tomé impulso el estudio de la estadistica. Si bien Pearson se ocupaba de muestras grandes, la teoria correspondiente resultaba inadecuada para los experimentadores que trabajan con muestras necesariamente peque- las, Entre estos estaba W,S.Gosset, 1876-1937, quien estudiaba con Karl Pearson y era técnico de la firma de cerveceros Guinness. Parece que !a matemdtica de Gosset era insufi- ciente para encontrar distribuciones exactas de Ia desviaciGn estindar de la muestra, la elacién entre la media de la muestra y la desviacidn estindar de la muestra, del coeficien- te de correlacién, estadigrafo al que dedicé especial interés. Por lo tanto, recurrié a sacar cartas calculando y compilando distribuciones de frecuencia empirica. Sus escritos sobre os resultados aparecieron en Biometrika en 1908 bajo el nombre de Student, seudénimo de Gosset mientras trabajaba con Guinness. Hoy, la t de Student es instrumento funda- - mental para estadisticos y experimentadores, y “estudentizar” es expresin corriente en estadistica. Ahora que el uso de fa distribucién ¢ de Student estd tan generalizado, es inte- resante anotar que el astrénomo alemédn, Helmert, ya la habia obtenido mateméticamente en 18752 R. A, Fisher, 1890-1962, recibié influencias de Karl Pearson y de Student, ¢ hizo numerosas ¢ importantes contribuciones a la estadistica. El y sus estudiantes dieron consi- derable impulso al uso de los procedimientos estadisticos en muchos campos, particular- mente en agricultura, biologia y genética. J, Neyman, 1894, y E. S, Pearson, 1895, presentaron una teoria sobre la verificaci6n @ prueba de hipotesis estadisticas en 1936 y 1938. La teoria fomenté en forma considera- ble la investigacion y muchos de los resultados son de uso practico. En esta breve historia, mencionaremos sélo otro estadistico. Abraham Wald, 1902- 1950. Sus dos libros, Sequential Analysis y Statistical Decision Functions, se ocupan de 4 BIOESTADISTICA: PRINCIPIOS Y PROCEDIMIENTOS grandes conquistas estadisticas no tratadas en este texto, no obstante, una aplicacida, la solucion minima de un problema de genética, se ilustra en el capitulo 21. En este siglo entonces se han desarzollado la mayoria de los métodos que actual- mente se utilizan. La estadistica de este texto es parte de esos métodos, 13 La estadistica y el métedo cientifico Se dice que los cientificos usan el método cientifico. Seria dificil definir la expresion metodo cientifico, dado que los cientificos usan cuantos métodos o medios puedan con- cebir. Sin embargo, la mayoria de estos métodos tienen puntos esenciales en comin. Sin intentar promover una controversia, consideramos que éstos son: 1, Una revisién de hechos, teorias y propuestas. Formulaci6n de una hipétesis légica sujeta a prueba mediante métodos experimen- tales. 3, Evaluacién objetiva de las hipdtesis con base en los resultados experimentales. Mucho podria escribirse respecto a estos puntos esenciales: ;Como se lega a una hipstesis? ;Cémo se disefla un experimento? ¢Cémo se evalia objetivamente una hipé- tesis? La ciencia es un estudio que se ocupa dé la observacién y clasificacién de los hechos. Los cientificos deben, entonces, ser capaces de observar un suceso 0 conjunto de eventos => como resultado de un plan o disefla, Esto es el experimento, la sustancia de! método cien- tifico. El disefio experimental es un campo de la estadistica, La evaluacion objetiva de una hipstesis presenta problemas, puesto que no es posible observar todos los eventos concebibles, y como las leyes exactas de causafecto generalmen- te se desconocen, existird variacion entre los que son observados. El cientifico debe enton- ces razonar partiendo de casos particulares a casos més generales, Este proceso es de infe- >, tencia incierta, Es un proceso que fos capacita para desaprobar hipétesis incorrectas, pero no nos permite aprobar hipdtesis correctas, Lo nico que podemos dar como demostracién es una comprobacién fuera de duda razonable. Los procedimientos estadisticos son méto- dos que nos conducen a esta suerte de pruebas. Una parte de Ja informacién posible, necesariamente conduce sélo a inferencia in- Gierta. El azar entra en juego en la obtencién de informacién:y es la causa de la incerti- dumbre, Al aplicar las leyes del azar, el estadstico de hoy puede realizar una medicién objetiva y precisa de la incertidumbre de las inferencias. Ciertamente, esto se hace para la totalidad de tas inferencias y no para cada inferencia individual. O sea que se sigue un pro- cedimiento que asegure que 9 de 10 inferencias seran correctas, 0 99 de 100, 0 algo por el estilo. ;Por qué no estar siempre en Jo correcto o muy cerca a lo correcto? El inconve- niente es el costo. El costo puede subir debido al incremento del tamafio de la muestra, a consecuencia de una decision incorrecta, o a la vaguedad de Ja inferencia necesaria para incluir la respuesta correcta. El método cientifico no es una sucesién dispersa de secuencias de hipstesis experi- mento-inferencia que se ajusten perfectamente en compartimientos. Mas bien, si un cientifi- co no logra demostrar la falsedad de una hipétesis, quizé 'a teoria abarque hechos fueradel alcance de la inferencia del experimento 0 acaso modificdndola, pueda abarcar tales hechos. E| ciclo se repite entonces. Por otra parte todos los supuestos que entran en la hipéte:

Vous aimerez peut-être aussi