Vous êtes sur la page 1sur 322

Estadstica para las Ciencias Agropecuarias

Cuarta Edicin

Di Rienzo, Julio Alejandro Casanoves, Fernando Gonzalez, Laura Alicia Tablada, Elena Margot Daz, Mara del Pilar Robledo, Carlos Walter Balzarini, Mnica Graciela

CUARTA EDICIN Primera Impresin

EDICIN ELECTRNICA Fernando Casanoves Julio Di Rienzo

by

Di Rienzo, Julio Alejandro; Casanoves, Fernando; Gonzalez, Laura Alicia; Tablada, Elena Margot; Daz, Mara del Pilar; Robledo, Carlos Walter; Balzarini, Mnica Graciela.

ISBN: 987-9449-51-7 Queda hecho el depsito que prev la ley 11.723

Queda prohibida la reproduccin total o parcial de este libro en forma idntica o modificada por cualquier medio mecnico o electrnico, incluyendo fotocopia, grabacin o cualquier sistema de almacenamiento y recuperacin de informacin no autorizada por los editores.

Prlogo
La estadstica aplicada ha tenido un gran florecimiento en los ltimos 20 aos y hoy es parte del lenguaje cientfico cotidiano. Aunque el tratamiento estadstico de los resultados experimentales no es un seguro contra los hallazgos casuales, es un gran avance en ese sentido y representa una formidable herramienta para la interpretacin de datos, no solo poniendo restricciones a la percepcin caprichosa de la informacin, sino guiando metodolgicamente su indagacin. La enseanza de la estadstica en las ciencias agropecuarias no es un tributo a la modernidad sino una larga tradicin que se origina en los trabajos de Fisher que, a comienzos del siglo XX, sentaron las bases de la estadstica aplicada a la experimentacin agrcola. La cuarta edicin es el resultado de un trabajo de reorganizacin de contenidos, seleccin y actualizacin de ejemplos y reformulacin de problemas de las ediciones anteriores. Es el resultado de la experiencia docente y de la interaccin con sus principales destinatarios, los alumnos. Esta edicin tambin se ha enriquecido con las sugerencias de distintos colegas que, en distintas universidades argentinas, han utilizado las ediciones anteriores como soporte de sus cursos de grado.

Crdoba, Argentina, 2001

ndice de Contenidos
1 ESTADSTICA DESCRIPTIVA ................................................................................ 1 INTRODUCCIN .............................................................................................................. 1 POBLACIN .................................................................................................................... 2 MUESTRA ....................................................................................................................... 2 VARIABLES ..................................................................................................................... 3
Tipos de variables ...................................................................................................................5

MUESTREO ALEATORIO SIMPLE ..................................................................................... 6 RESUMEN DE LA INFORMACIN MUESTRAL ................................................................... 8


Tablas de distribucin de frecuencias y grficos para variables discretas.............................8 Tablas de distribucin de frecuencias y grficos para variables continuas .........................12

MEDIDAS RESUMEN DE LA INFORMACIN MUESTRAL ................................................. 16


Medidas de posicin..............................................................................................................16 Medidas de dispersin...........................................................................................................17

OTROS TIPOS DE MUESTREOS ....................................................................................... 19


Muestreo Estratificado..........................................................................................................19 Muestreo por Conglomerados...............................................................................................20 Muestreo por Captura y Recaptura.......................................................................................21

REPRESENTACIONES GRFICAS .................................................................................... 21


Grfico de Barras .................................................................................................................23 Diagramas de Torta ..............................................................................................................25 Diagramas de Caja (Box Plot) ...........................................................................................26 Diagrama de puntos (Dot-Plot)..........................................................................................28 Histogramas y Polgonos ......................................................................................................30 Diagramas de Tallo y Hojas .................................................................................................30 Diagramas de Dispersin......................................................................................................31 Diagramas de Lneas ............................................................................................................32 Q-Q Plots............................................................................................................................33

EJERCICIOS ................................................................................................................... 35 2 VARIABLES ALEATORIAS................................................................................... 43 INTRODUCCIN ............................................................................................................ 43 ESPACIO MUESTRAL - EVENTOS .................................................................................. 43 PROBABILIDAD ............................................................................................................. 45
Probabilidad segn Kolmogorov ..........................................................................................45
I

ndice de contenidos

Probabilidad: Concepto Frecuencial....................................................................................47 Probabilidad: Concepto Clsico...........................................................................................48

EVENTO ALEATORIO .................................................................................................... 48 CONCEPTO DE VARIABLE ALEATORIA ......................................................................... 48 DISTRIBUCIN DE UNA VARIABLE ALEATORIA ........................................................... 51
Funcin de Distribucin Acumulada ....................................................................................51 Funcin de Densidad ............................................................................................................53
Funcin de densidad de una variable aleatoria discreta ...................................................................53 Funcin de densidad de una variable aleatoria continua..................................................................54

MEDIDAS RESUMEN DE LA DISTRIBUCIN DE UNA VARIABLE ALEATORIA................ 55


Esperanza de una variable aleatoria ....................................................................................56 Propiedades de la esperanza.................................................................................................58 Varianza de una variable aleatoria.......................................................................................59 Cuantiles de una variable aleatoria ......................................................................................62

EJERCICIOS ................................................................................................................... 63 3 MODELOS ESTADSTICOS: DISTRIBUCIN NORMAL Y OTRAS DISTRIBUCIONES ................................................................................................... 67 INTRODUCCIN ............................................................................................................ 67 DISTRIBUCIN NORMAL .............................................................................................. 69
La Funcin de Densidad Normal ..........................................................................................69 Estandarizacin.....................................................................................................................72 Funcin de Distribucin Acumulada Normal .......................................................................74

OTRAS DISTRIBUCIONES ............................................................................................... 77 FUNCIONES DE DENSIDAD DE VARIABLES ALEATORIAS DISCRETAS ............................ 77


Distribucin Uniforme Discreta...........................................................................................77 Distribucin Bernoulli...........................................................................................................78 Distribucin Binomial ...........................................................................................................80 Distribucin Binomial Negativa............................................................................................82 Distribucin Geomtrica.......................................................................................................85 Distribucin Hipergeomtrica ..............................................................................................86 Distribucin Poisson .............................................................................................................89 Distribucin Multinomial......................................................................................................90

FUNCIONES DE DENSIDAD DE VARIABLES ALEATORIAS CONTINUAS ........................... 91


Distribucin Uniforme ..........................................................................................................91 Distribucin Gamma .............................................................................................................92 Distribucin Exponencial......................................................................................................93
II

ndice de contenidos

Distribucin Chi-Cuadrado .................................................................................................94

EJERCICIOS ................................................................................................................... 95 4 DISTRIBUCIN DE ESTADSTICOS MUESTRALES .................................... 103 INTRODUCCIN .......................................................................................................... 103 DISTRIBUCIN DEL ESTADSTICO MEDIA MUESTRAL ................................................. 103
Teorema Central del Lmite ................................................................................................109 Distribucin T de Student ...............................................................................................110 Distribucin de la diferencia de dos medias muestrales .....................................................112

DISTRIBUCIN ASOCIADA AL ESTADSTICO VARIANZA MUESTRAL ........................... 116 EJERCICIOS ................................................................................................................. 120 5 ESTIMACIN DE PARMETROS ..................................................................... 125 INTRODUCCIN .......................................................................................................... 125 CONCEPTO DE ESTIMACIN ....................................................................................... 125 ESTIMACIN PUNTUAL............................................................................................... 125
Propiedades clsicas de los buenos estimadores............................................................126
Insesgamiento................................................................................................................................126 Consistencia ..................................................................................................................................127 Eficiencia.......................................................................................................................................128

ESTIMACIN POR INTERVALO DE CONFIANZA ........................................................... 128


Procedimiento general para encontrar un intervalo de confianza para un parmetro. .....129 Estimacin de la esperanza de una variable aleatoria normal...........................................130
Caso 1: Se conoce la varianza .................................................................................................130
2 2

Caso 2: No se conoce la varianza ............................................................................................131

CLCULO DEL TAMAO MUESTRAL PARA OBTENER UN INTERVALO DE CONFIANZA PARA CON UNA AMPLITUD DETERMINADA .......................................... 132 EJERCICIOS ................................................................................................................. 134 6 CONTRASTE DE HIPTESIS.............................................................................. 137 INTRODUCCIN .......................................................................................................... 137 PROCEDIMIENTO DE LA PRUEBA DE HIPTESIS ......................................................... 139 ERRORES .................................................................................................................... 145 CLCULO DE LA PROBABILIDAD DE COMETER ERROR DE TIPO II ()........................ 146 EFECTOS DE LAS VARIACIONES DE LA REGIN DE RECHAZO SOBRE ....................... 149 EFECTO DE LAS VARIACIONES DEL TAMAO DE LA MUESTRA SOBRE .................... 149 POTENCIA DE UNA PRUEBA DE HIPTESIS .................................................................. 150 CURVA DE POTENCIA ................................................................................................. 150
III

ndice de contenidos

RELACIN ENTRE ESTIMACIN POR INTERVALO DE CONFIANZA Y PRUEBA DE HIPTESIS ................................................................................................................... 151 EJERCICIOS ................................................................................................................. 152 7 INFERENCIA SOBRE LA ESPERANZA Y LA VARIANZA DE VARIABLES ALEATORIAS DISTRIBUIDAS NORMALMENTE ................. 155 INTRODUCCIN .......................................................................................................... 155 PRUEBA DE HIPTESIS ACERCA DE UNA ESPERANZA ................................................. 155
Caso 1: Se conoce la varianza 2 .......................................................................................155 Caso 2: No se conoce la varianza 2..................................................................................158

PRUEBA DE HIPTESIS ACERCA UNA VARIANZA ........................................................ 159 ESTIMACIN POR INTERVALO DE UNA VARIANZA ..................................................... 160 PRUEBA DE HIPTESIS PARA DOS VARIANZAS ........................................................... 161 PRUEBA DE HIPTESIS Y ESTIMACIN POR INTERVALO DE CONFIANZA PARA LA DIFERENCIA DE DOS ESPERANZAS .............................................................................. 163
Caso 1: Las varianzas son conocidas .................................................................................163 Caso 2: Las varianzas son desconocidas ............................................................................164 Caso 2-a: Las varianzas son desconocidas e iguales..........................................................164 Caso 2-b: Las varianzas son desconocidas y diferentes .....................................................166 Caso 3: Dos muestras no independientes............................................................................166
Prueba T para observaciones apareadas.........................................................................................168

EJERCICIOS ................................................................................................................. 170 8 ANLISIS DE LA VARIANZA ............................................................................. 177 INTRODUCCIN .......................................................................................................... 177 DEFINICIONES PRELIMINARES .................................................................................... 177 EL ANLISIS DE LA VARIANZA DE EFECTOS FIJOS A UN FACTOR DE CLASIFICACIN ........................................................................................................... 180
Fundamentos del anlisis de la varianza de efectos fijos....................................................181 Cuadrados medios y prueba de hiptesis............................................................................181 La particin de la suma de cuadrados y la tabla del ANAVA .............................................183

PRUEBAS "A POSTERIORI" .......................................................................................... 186


El test de Tukey ...................................................................................................................187 Prueba de Fisher.................................................................................................................188

VERIFICACIN DE SUPUESTOS DEL ANLISIS DE LA VARIANZA ................................. 189 EJERCICIOS ................................................................................................................. 192 9 ANLISIS DE REGRESIN LINEAL ................................................................. 197
IV

ndice de contenidos

INTRODUCCIN .......................................................................................................... 197 ANLISIS DE REGRESIN LINEAL ............................................................................... 200 ESTIMACIN DE LA RECTA DE REGRESIN. MTODO DE LOS MNIMOS CUADRADOS ............................................................................................................... 204 ESTIMACIONES Y PREDICCIONES ................................................................................ 207 INTERVALO DE CONFIANZA PARA LA ESPERANZA CONDICIONAL DE Y ..................... 208 INTERVALO DE CONFIANZA PARA LAS PREDICCIONES DE Y DADO X ........................ 209 INTERVALO DE CONFIANZA PARA LA ORDENADA AL ORIGEN .................................... 210 INTERVALO DE CONFIANZA PARA LA PENDIENTE ...................................................... 211 PRUEBAS DE HIPTESIS EN REGRESIN ...................................................................... 211 LOS SUPUESTOS DEL ANLISIS DE REGRESIN ........................................................... 214 VALOR PREDICTIVO DEL MODELO DE REGRESIN ..................................................... 215 ANLISIS DE CORRELACIN LINEAL ......................................................................... 216 PRUEBA DE HIPTESIS SOBRE .................................................................................. 219 EJERCICIOS ................................................................................................................. 221 10 DISEO DE EXPERIMENTOS ............................................................................ 227 INTRODUCCIN .......................................................................................................... 227 ELEMENTOS DEL DISEO DE EXPERIMENTOS ............................................................ 227
Experimento ........................................................................................................................227 Unidad experimental ...........................................................................................................227 Factores y Tratamientos......................................................................................................228 Modelo para las observaciones...........................................................................................228 Fuentes de Error .................................................................................................................229
Aleatorizacin ...............................................................................................................................229 Repeticin .....................................................................................................................................230

Precisin .............................................................................................................................231 Estructura de parcelas ........................................................................................................231 Algunos diseos clsicos.....................................................................................................232


Completamente aleatorizado .........................................................................................................232 Bloques completos aleatorizados...................................................................................................233 Cuadrado latino .............................................................................................................................236

Estructura de tratamientos..................................................................................................238
Experimentos Factoriales ..............................................................................................................239

EJERCICIOS ................................................................................................................. 247 11 ANLISIS DE DATOS CATEGRICOS............................................................. 251 INTRODUCCIN .......................................................................................................... 251
V

ndice de contenidos

ANLISIS DE TABLAS DE CONTINGENCIA ................................................................... 255


Tablas de contingencia a un criterio de clasificacin.........................................................256 Tablas de contingencia a 2 criterios de clasificacin (marginales libres)..........................258 Tablas de Contingencia a 2 criterios de clasificacin (marginales fijos) ...........................260

EJERCICIOS ................................................................................................................. 265 12 BIBLIOGRAFA...................................................................................................... 269 13 TABLAS ESTADSTICAS ..................................................................................... 273 14 RESPUESTAS A ALGUNOS EJERCICIOS IMPARES .................................... 297

VI

ndice de Definiciones
Definicin 1.1: Poblacin .......................................................................................... 2 Definicin 1.2: Tamao poblacional ......................................................................... 2 Definicin 1.3: Muestra ............................................................................................. 3 Definicin 1.4: Unidad muestral ............................................................................... 3 Definicin 1.5: Tamao muestral .............................................................................. 3 Definicin 1.6: Variable ............................................................................................ 4 Definicin 1.7: Muestreo aleatorio simple ................................................................ 6 Definicin 1.8: Frecuencia absoluta ......................................................................... 8 Definicin 1.9: Media muestral o promedio ............................................................ 16 Definicin 1.10: Cuantil muestral ........................................................................... 16 Definicin 1.11: Mediana muestral ......................................................................... 17 Definicin 1.12: Moda muestral .............................................................................. 17 Definicin 1.13: Rango muestral ............................................................................. 17 Definicin 1.14: Varianza muestral......................................................................... 18 Definicin 1.15: Desviacin Estndar muestral...................................................... 18 Definicin 1.16: Coeficiente de variacin muestral ................................................ 18 Definicin 1.17: Promedio ponderado .................................................................... 19 Definicin 2.1: Espacio muestral............................................................................. 43 Definicin 2.2: Punto muestral o evento elemental ................................................. 44 Definicin 2.3: Evento ............................................................................................. 44 Definicin 2.4: Eventos mutuamente excluyentes .................................................... 44 Definicin 2.5: Medida de Probabilidad (Kolmogorov, 1937)................................ 45 Definicin 2.6: Probabilidad condicional ............................................................... 46 Definicin 2.7: Independencia de Eventos............................................................... 46 Definicin 2.8: Probabilidad: concepto frecuencial................................................ 47 Definicin 2.9: Probabilidad: concepto clsico ...................................................... 48 Definicin 2.10: Evento aleatorio............................................................................ 48 Definicin 2.11: Variable aleatoria......................................................................... 49 Definicin 2.12: Funcin de distribucin acumulada ............................................. 51 Definicin 2.13: Funcin de densidad de una v.a. discreta .................................... 53 Definicin 2.14: Funcin de densidad de una v.a. continua.................................... 54 Definicin 2.15: Esperanza de una v.a. discreta ..................................................... 57 Definicin 2.16: Esperanza de una v.a. continua .................................................... 57 Definicin 2.17: Varianza de una v.a. discreta ....................................................... 60
VII

Definiciones

Definicin 2.18: Varianza de una v.a. continua ..................................................... 60 Definicin 2.19: Coeficiente de variacin. .............................................................. 61 Definicin 2.20: Cuantil .......................................................................................... 62 Definicin 3.1: Variable aleatoria normal .............................................................. 69 Definicin 3.2: Estandarizacin .............................................................................. 72 Definicin 3.3: Funcin de densidad normal estndar............................................ 72 Definicin 3.4: Distribucin Uniforme Discreta. .................................................... 77 Definicin 3.5: Distribucin Bernoulli .................................................................... 79 Definicin 3.6: Distribucin Binomial..................................................................... 81 Definicin 3.7: Distribucin Binomial Negativa (para k entero). ........................... 83 Definicin 3.8: Distribucin Geomtrica. ............................................................... 85 Definicin 3.9: Distribucin Hipergeomtrica. ....................................................... 87 Definicin 3.10: Distribucin Poisson..................................................................... 89 Definicin 3.11: Distribucin Multinomial............................................................. 91 Definicin 3.12: Distribucin Uniforme .................................................................. 91 Definicin 3.13: Distribucin Gamma..................................................................... 92 Definicin 3.14: Distribucin Exponencial. ............................................................ 93 Definicin 3.15: Distribucin Chi-Cuadrado .......................................................... 94 Definicin 4.1: Error Estndar.............................................................................. 107 Definicin 5.1:Estimacin y estimador puntual.................................................... 126 Definicin 5.2: Insesgamiento ............................................................................... 126 Definicin 5.3: Consistencia.................................................................................. 127 Definicin 5.4: Eficiencia ...................................................................................... 128 Definicin 5.5:Amplitud del intervalo de confianza. ............................................. 132 Definicin 6.1: Nivel de significacin.................................................................... 141 Definicin 6.2:Regin o zona de rechazo .............................................................. 141 Definicin 6.3:Regin o zona de no rechazo ........................................................ 141 Definicin 6.4:Puntos crticos ............................................................................... 142 Definicin 6.5: Potencia de una prueba ................................................................ 150 Definicin 7.1: Distribucin F............................................................................... 161 Definicin 8.1: Unidad experimental..................................................................... 177 Definicin 8.2: Tratamiento................................................................................... 178 Definicin 8.3: Variable aleatoria observada o respuesta .................................... 178 Definicin 8.4: Repeticin ..................................................................................... 178 Definicin 8.5: Modelo lineal ................................................................................ 179 Definicin 8.6: Cuadrado Medio Dentro o del Error............................................ 181 Definicin 8.7: Cuadrado Medio Entre o Cuadrado Medio de Tratamiento. ....... 182
VIII

Definiciones

Definicin 8.8: Residuo.......................................................................................... 190 Definicin 9.1: Modelo de regresin lineal simple................................................ 201 Definicin 9.2: Coeficientes de regresin muestral............................................... 205 Definicin 9.3: Coeficiente de determinacin muestral ........................................ 216 Definicin 9.4: Coeficiente de correlacin lineal.................................................. 218 Definicin 9.5: Coeficiente de correlacin lineal muestral de Pearson................ 218 Definicin 10.1: Experimento ................................................................................ 227 Definicin 10.2: Diseo de la estructura de parcelas ........................................... 232 Definicin 10.3: Estructura de Tratamientos ........................................................ 239 Definicin 11.1: Variable categrica .................................................................... 251

IX

1
1 Estadstica Descriptiva
Introduccin
El registro de observaciones es una prctica comn en el marco de la investigacin. Estas observaciones surgen como resultado de un proceso de observacin bajo condiciones dadas o de un proceso experimental. Si, por ejemplo, se registraran las temperaturas mnimas diarias ocurridas en la dcada del 80, suponiendo un total de 3650 das, podramos pensar que existi un proceso natural cuya realizacin defini la temperatura efectivamente registrada en cada uno de los 3650 das. Situaciones como sta conducen a los conocidos estudios observacionales. En otras circunstancias, las observaciones son el resultado de la provocacin de un fenmeno, o experimento, bajo condiciones controladas. A modo de ejemplo, se podra considerar la aplicacin de distintos insecticidas en bandejas con 100 insectos, en cada una de las cuales se registra el nmero de insectos muertos. Situaciones como stas son conocidas como estudios experimentales. Generalmente la informacin registrada en un proceso de observacin es tratada, en un primer momento, con el objetivo de describir y resumir sus caractersticas ms sobresalientes. Esto se conoce como estadstica descriptiva y generalmente se basa en el uso de tablas y grficos, y en la obtencin de medidas resumen. El objetivo de este captulo es reconocer la poblacin y las variables relevantes en un proceso de observacin o de experimentacin, caracterizar y describir muestras de las poblaciones mediante medidas resumen, tablas de frecuencias y representaciones grficas y conocer algunas metodologas de extraccin de muestras. Antes de abordar el problema de describir un conjunto de observaciones se vern algunos conceptos bsicos que permiten la introduccin de los procedimientos estadsticos.

Estadstica Descriptiva

Poblacin
Definicin 1.1: Poblacin
Una poblacin es un conjunto de elementos acotados en un tiempo y en un espacio determinados, con alguna caracterstica comn observable o medible.

Desde el punto de vista agronmico: 1. A qu elementos hace referencia la definicin? Los elementos considerados podran ser das, animales, semillas, plantas, personas o localidades de una cierta regin. 2. Por qu acotar en tiempo y espacio? Dependiendo de los intereses en juego, suele ser necesario recortar el problema, o especificar claramente los alcances o fronteras del problema en estudio, ya que dentro de estos mrgenes todo lo que se diga o afirme tendr validez, y fuera de ellos no. Por ejemplo, consideremos el hecho de la estacionalidad de las precipitaciones dentro del ao, y la existente entre aos. Se conoce acabadamente que existen grupos de aos secos y grupos de aos hmedos. Ms an, que su alternancia tiene cierta frecuencia de ocurrencia. Por ello cuando estudiemos las precipitaciones acumuladas durante el mes de diciembre, ser necesario especificar a qu grupo de aos estamos refirindonos, para que lo que se analice pueda ser correctamente interpretado. El trmino espacio, por otro lado, puede tener en la prctica distintas connotaciones, cuestin que con el tiempo (desde el punto de vista cronolgico) no ocurre. As el espacio puede denotar una regin, un volumen determinado, un lote, etc. Definicin 1.2: Tamao poblacional
Si la poblacin es finita, diremos que el tamao poblacional es el nmero de elementos de la misma y lo denotaremos con N.

Muestra
Generalmente es imposible o impracticable examinar alguna caracterstica en la poblacin entera, por lo que se examina una parte de ella y en base a la informacin relevada en esa porcin se hacen inferencias sobre toda la poblacin.

Estadstica Descriptiva

Definicin 1.3: Muestra


Se entiende por muestra a todo subconjunto de elementos de la poblacin.

Definicin 1.4: Unidad muestral


Una unidad muestral es el elemento o entidad de la muestra.

Definicin 1.5: Tamao muestral


Tamao muestral es el nmero de elementos de la poblacin que conforman la muestra y se denota con n.

El problema es cmo debe ser seleccionada esa parte de la poblacin que proveer la informacin acerca de la o de las caractersticas buscadas de manera tal que puedan obtenerse conclusiones. Vale la pena hacer una reflexin acerca del comentario, que respecto del tamao muestral, hace uno de los ms conocidos estudiosos del muestreo.
Es clsico (y cmico) el personaje que despus de pasar 10 das en un pas extranjero est en condiciones de criticar la industria, reformar su sistema poltico, etc. Pero en realidad la diferencia que existe entre este personaje y el estudioso de ciencias polticas, que vive 20 aos en ese pas dedicado a estudiarlo, es que el primero basa sus conclusiones en una muestra mucho ms pequea y es menos consciente de su ignorancia (Cochran, 1981).

En este captulo se presentan algunas tcnicas para la obtencin de muestras de una poblacin y las formas principales de resumir la informacin que stas proveen. En los captulos siguientes se ver cmo, a partir de los resmenes muestrales, se puede estimar o inferir acerca de los parmetros distribucionales (estadstica inferencial).

Variables
Las observaciones o mediciones sobre los elementos de una poblacin constituyen la materia prima con la cual se trabaja en Estadstica. Para que dichas observaciones puedan ser tratadas estadsticamente deben estar expresadas o poder ser reexpresadas en trminos numricos. Aunque sea obvio, se destaca que la caracterstica de inters a observar o medir en cada elemento de la poblacin debe ser la misma, en tanto que se espera que no asuma el mismo valor en cada uno de los elementos que la conforman.
3

Estadstica Descriptiva

Aquellas caractersticas que van cambiando en su estado o expresin entre los elementos de la poblacin se denominan "variables", mientras que aquellas que no cumplen esta condicin son llamadas "constantes". Definicin 1.6: Variable
Una variable es una caracterstica, propiedad o atributo, con respecto a la cual los elementos de una poblacin difieren de alguna forma.

Para denotar a una cierta variable se utilizan letras maysculas, y con la misma letra en minscula se hace referencia a un valor en particular observable en un elemento de la poblacin, y al que se suele llamar dato. As, por ejemplo, si X denota el nmero de semillas germinadas en un conjunto de bandejas de germinacin, x denotar el nmero de semillas germinadas observadas en una de aquellas bandejas, siendo utilizado un subndice para hacer referencia a un valor en particular. As, x20 representa el nmero de semillas germinadas observadas en la bandeja nmero 20. Esta notacin se suele generalizar, utilizando como subndices letras minsculas desde la i en adelante y luego indicando el rango de posibles valores que puede adoptar el subndice para establecer cuntos datos se consideran en el problema. A modo ilustrativo se presentan algunos ejemplos de notacin con subndices: a) b) c) xi, i=1,...,6 hace referencia taxativamente a los valores observados x1, x2, x3, x4, x5, y x6, no interesando otros si existieran. xi, i=1,... en este caso i puede valer a partir de 1 en adelante y hasta infinito. xi, i=0,1,... en este caso i puede valer desde cero hasta infinito.
Nota: En la prctica el trmino infinito, simbolizado por , significar valores inconmensurables (negativos o positivos), sea para el subndice (como en los casos b y c) como para los datos propiamente dichos (por ejemplo - < xi < ).

A fines ilustrativos, suponga que en la dcada de 1980 se registraron las temperaturas mnimas de los 3650 das. Siguiendo con la notacin introducida, X hace referencia a las temperaturas mnimas en la dcada 80 y xi , i=1,...,3650 a las efectivamente registradas. En particular, x112 denotar el valor de temperatura mnima registrado en el da 112 del perodo considerado; as, si en dicho da la temperatura mnima fue de -3.2 grados centgrados, escribiremos x112 = -3.2, y de esta forma se indica la temperatura de cualquier da en particular. De una manera general se suele denotar a un conjunto de n observaciones por {x1, x2,...,xn}, donde xn hace referencia al ltimo trmino de la serie de datos. En el ejemplo anterior, n es 3650.
4

Estadstica Descriptiva

Tipos de variables
Se llamar variable continua a aquella caracterstica cuyas observaciones pueden asumir cualquier valor dentro de un intervalo. En estos casos el conjunto de posibles valores es no numerable1. En otras palabras, existe una cantidad infinita de posibles valores para los resultados de la variable. Se puede describir el conjunto de posibles valores de una variable continua de distintas formas. Se suele seguir la siguiente convencin: a) Un intervalo es cerrado si sus extremos pertenecen al mismo, lo que se denotar con corchetes, por ejemplo, [a, b] denota al conjunto de todos los x tal que a x b. Un intervalo es abierto si sus extremos no pertenecen al mismo, lo que se denotar con parntesis, por ejemplo, (a, b) denota al conjunto de todos los x tal que a < x < b. Un intervalo es semi-cerrado (o semi-abierto) si uno de sus extremos no pertenece al mismo, lo que se denotar con el corchete y el parntesis que corresponda. Por ejemplo, (a, b] denota al conjunto de todos los x tal que a<x b, en tanto [a, b) = {x : a x < b}.

b)

c)

Es necesario no confundir el tamao (cardinalidad) del conjunto observado, con el del conjunto de posibles valores a observar. El primero puede ser finito (es decir, es posible establecer cuntos elementos lo conforman) en tanto el segundo puede ser infinito. En el caso de las temperaturas mnimas que se present, el rango de posibles valores podra ser -5C x -1C, un intervalo continuo, y por lo tanto con infinitos valores posibles de ser observados, en tanto que el tamao de la poblacin considerada es de 3650 das. En la prctica ocurre que los instrumentos de medicin producen un redondeo del verdadero valor que presenta el elemento a medir, segn la precisin que acrediten. Pero no por ello se deber decir que el rango de posibles valores es finito. Si el termmetro con que se realizan las mediciones de las temperaturas mnimas mide en C con 2 decimales de precisin, entre 1C x 5C existiran (500-100) + 1 = 401 datos posibles, no obstante esta variable es de tipo continua. Se llaman variables discretas, en contraposicin a las variables continuas, a aquellas caractersticas que asumen un nmero finito o infinito numerable de valores posibles. As, las variables discretas surgen de conteos, como por ejemplo el nmero de das

Se dice que un conjunto es infinito numerable si cada uno de sus elementos se asocia biunvocamente con un nmero natural, en caso contrario se dice que el conjunto es no numerable.

Estadstica Descriptiva

hasta la germinacin del 50% de las semillas de una bandeja, nmero de colonias de microorganismos sobre plantas enfermas, el nmero de frutos de un rbol, el nmero de mazorcas en plantas de maz, etc. Se llaman variables categricas, en contraposicin a las variables cuantitativas, a aquellas cuya escala de medida es un conjunto de categoras. Entre ellas podemos distinguir al menos: a) Categricas nominales, como la orientacin de los vientos, que se podran considerar como Norte, Sur, Este, Oeste; el color del tegumento de las semillas, el sexo, etc. Categricas ordinales, como el grado de ataque de una virosis vegetal que puede ser "severo", "moderado" o "leve".

b)

Es importante sealar que las variables continuas se pueden discretizar (por ejemplo tomando intervalos) y as ser tratadas como discretas o, cuando una variable discreta asume una gran variedad de valores, como podra ser el caso de contar el nmero de pulgones en hojas de trigo, sta puede ser tratada como una variable continua.

Muestreo aleatorio simple


Definicin 1.7: Muestreo aleatorio simple
El muestreo aleatorio simple es el mtodo de seleccin de n unidades de una poblacin de tamao N de tal modo que cada una de las muestras posibles tenga la misma oportunidad de ser elegida (Cochran,1981).

Para obtener una muestra aleatoria simple se enumeran las unidades de la poblacin de 1 a N y posteriormente se extrae una serie de n nmeros aleatorios entre 1 y N (tarea que se puede realizar usando una tabla de nmeros aleatorios o mediante un programa de computacin que produce una tabla semejante). Las unidades cuya numeracin coincide con la serie de nmeros seleccionados conformarn la muestra aleatoria. En este esquema muestral si una unidad muestral fue previamente seleccionada, entonces no puede ser seleccionada nuevamente. En cada extraccin el proceso debe garantizar la misma oportunidad de seleccin a todos y cada uno de los elementos que no hayan sido seleccionados an. Por este mtodo existen CnN n ! formas posibles de obtener n elementos de entre N. No obstante, slo existen CnN muestras (conjuntos diferentes) todas con igual oportunidad de ser extradas. La probabilidad de cada muestra es
6

Estadstica Descriptiva

entonces igual a

1 . El mtodo recibe tambin el nombre de muestreo sin CnN

restitucin porque en la muestra no puede aparecer el mismo elemento repetido, es decir, que una vez que un elemento ha sido extrado no es restituido y por lo tanto no est disponible para la eleccin del prximo elemento de la muestra. Por ejemplo, se tiene una poblacin de seis elementos identificados como: a, b, c, d, e, f y se desea saber cuntas muestras posibles de tamao 3 se pueden tomar de la misma utilizando un esquema de muestreo sin restitucin. Si el tamao poblacional es N = 6 y el de la muestra es n = 3, entonces el nmero de muestra posibles sin restitucin es:

C36 =

6! 720 120 = = = 20 (6 - 3)! 3! 36 6

La muestras posibles son las siguientes: a, b, c a ,b, f a ,c, f a, e, f b, c, f b, e, f c, e, f a, b, d a, c, d a, d, e b, c, d b, d, e c, d, e d, e, f a, b, e a, c, e a, d, f b, c, e b, d, f c, d, f

En los puntos que siguen, cuando se haga referencia a muestra, se considerar solamente a la obtenida a partir de un muestreo aleatorio simple con restitucin. En este tipo de muestreo la cantidad de formas posibles de extraer n elementos desde una poblacin de tamao N es igual a Nn. Por ejemplo, si una poblacin tiene 2 elementos identificados con a y b y se quiere saber cuantas formas se tiene de extraer tres elementos, estas son 23=8 y estn dadas por: {aaa, aab, aba, baa, bba, bab, abb, bbb}. Ntese que aab, aba, y baa contienen los mismos elementos, por lo cual stas constituyen la misma muestra (dos conjuntos con iguales elementos son indistinguibles) luego el total de muestras posibles es menor que Nn pero en este caso las muestras no son todas igualmente probables (ver Capitulo 2).

Estadstica Descriptiva

Resumen de la informacin muestral


Al registrar los resultados de un estudio observacional o experimental, se obtiene un nmero de observaciones que puede ser muy grande y su simple listado es de poca relevancia en el sentido interpretativo. Aunque a partir de dichos registros se puede encontrar la respuesta buscada, no estn ordenados de manera tal que adquieran significado para el investigador. Es por esto deseable presentar las observaciones en forma resumida. A los fines de ordenar, resumir y presentar la informacin, se utilizan tablas y grficos apropiados para cada tipo de variable (variables numricas, continuas o discretas, o bien, variables no numricas o de naturaleza categrica), por lo que trataremos las distintas situaciones por separado.

Tablas de distribucin de frecuencias y grficos para variables discretas


Una tabla de distribucin de frecuencias posee una columna que contiene los diferentes valores que toma la variable en estudio y otra columna que indica la frecuencia absoluta. Definicin 1.8: Frecuencia absoluta
Se denomina frecuencia absoluta al nmero de veces que el valor de la variable se repite en el conjunto de datos.

Simbolizando con xi, i = 1,2,3....m, a los distintos valores observados para la variable X y por ni a la frecuencia absoluta del valor xi, podemos agrupar los datos en una tabla de frecuencias de la siguiente manera : xi x1 x2
. . .

ni

n1 n2
. . .

xm con n = n1 + n2 + n3 +...+ nm=

nm n

n
i=1

, representando el nmero total de

Estadstica Descriptiva

observaciones. Generalmente en una tabla de distribucin de frecuencias no slo se muestran las frecuencias absolutas, sino que tambin se incluyen las frecuencias relativas y las frecuencias acumuladas (absolutas y relativas), como es descripto en el ejemplo a continuacin: Ejemplo 1.1 Un experimento consisti en contar el nmero de flores por planta de una muestra n = 50 plantas. Los valores resultantes del conteo fueron los siguientes:
10 8 4 6 5 8 10 3 7 3 6 7 2 8 2 3 9 7 8 1 9 10 5 6 4 7 6 5 7 3 5 8 4 7 6 4 6 3 9 8 6 3 7 8 7 9 2 6 6 0

Los datos as presentados son de difcil interpretacin, por lo que conviene resumirlos como en la siguiente tabla: Tabla 1.1: Tabla de distribucin de frecuencias para la variable nmero de flores por planta. fi Fi i xi ni Ni 1 0 1 1 0.02 0.02 2 1 1 2 0.02 0.04 3 2 3 5 0.06 0.10 4 3 6 11 0.12 0.22 5 4 4 15 0.08 0.30 6 5 4 19 0.08 0.38 7 6 9 28 0.18 0.56 8 7 8 36 0.16 0.72 9 8 7 43 0.14 0.86 10 9 4 47 0.08 0.94 11 10 3 50 0.06 1.00 En esta tabla se puede ver que el nmero total de datos es 50, que las plantas con menos de 3 flores y con ms de 9 son poco frecuentes y que plantas que tienen entre 6 y 8 flores son las ms frecuentes. Esta tabla de frecuencias se construye de la siguiente forma:
9

Estadstica Descriptiva

a) b) c) d)

En la primera columna se colocan los valores de i = 1,...,m, donde m es el nmero de diferentes valores que asume la variable X. En la segunda columna se colocan los valores observados xi, diferentes entre s, de la variable X que representa el nmero de flores por planta. En la tercera columna el nmero de veces que aparece cada valor, o sea, la frecuencia absoluta (ni). En la cuarta columna se observan las frecuencias absolutas acumuladas, denotadas por Ni. stas se definen como el valor que surge de la acumulacin por fila de las correspondientes frecuencias absolutas, o sea: N1 = n1; N2= n1 + n2; N3 = n1 + n2 + n3 ; y as sucesivamente.

En general, se expresan las frecuencias absolutas acumuladas de la siguiente forma: Nk = n1 + n2 +.......+ nk =

n,
i =1 i

con k m

e) En la quinta columna se calculan las frecuencias relativas, denotadas por fi, esto ni es: fi = n , i = 1,...,m. O sea, la frecuencia relativa es el cociente entre cada frecuencia absoluta y el total de observaciones; en el ejemplo, f5 = 4 = 0.08. Cada una de estas 50 frecuencias multiplicadas por 100, indica el porcentaje con que cada valor de la variable est representado en la muestra. As se consigue una mejor apreciacin del peso que tiene cada valor de la variable en su distribucin de frecuencias. Por ejemplo f5 = 0.08, entonces f5 .100 = 8%; es decir que el 8% de las plantas en la muestra tienen 4 flores. La frecuencia relativa asociada con un valor dado, puede ser considerada como una estimacin de la probabilidad de ocurrencia de dicho valor. Una propiedad que cumplen las frecuencias relativas es que su suma es igual a 1. f) En la sexta columna se calculan las frecuencias relativas acumuladas, sumando las frecuencias relativas de la misma manera que se sumaron las frecuencias absolutas para obtener las absolutas acumuladas. Las frecuencias relativas acumuladas sern denotadas con Fi y calculadas como:
Fi =
10

Ni , i = 1,...,m n

Estadstica Descriptiva

donde Fi es la frecuencia relativa acumulada para el i-simo valor de X. Qu informacin se obtiene de la tabla de frecuencias as construida? Los valores 6, 7 y 8 de la variable nmero de flores por planta, fueron los que se observaron con mayor frecuencia, 9 plantas (18%) presentaron 6 flores, 8 plantas (16%) tuvieron 7 flores, 7 plantas tuvieron 8 flores; pocas fueron las plantas sin flores (2%); el 10% de las plantas tuvieron 2 o menos flores; el nmero mximo de flores por planta en esta experiencia fue de 10 y slo en el 6% de la muestra se registr este valor mximo. Estas afirmaciones, como algunas otras, pueden obtenerse de la lectura de una tabla de frecuencias, y no son fciles de formular a partir de los datos sin procesar, sobre todo cuando n es grande. La informacin de una tabla de frecuencias tambin puede ser presentada grficamente. Si en el eje de las ordenas se disponen las frecuencias absolutas o relativas y en el eje de las abscisas los distintos valores que toma la variable, se obtiene un grfico de barras de frecuencias absolutas o relativas, respectivamente, como se muestra en la Figura 1.1.

9 8

a) Frecuencias relativas (f)

0.20 0.18 0.16 0.14 0.12 0.10 0.08 0.06 0.04 0.02 0.00

b)

Frecuencias absolutas (n)

7 6 5 4 3 2 1 0 0 1 2 3 4 5 6 7 8 9 10

0 1 2 3 4 5 6 7 8 9 10

Figura 1.1: Grfico de barras de: a) frecuencias absolutas b) frecuencias relativas.

Cuando en el eje de ordenadas se representan las frecuencias acumuladas, ya sean absolutas o relativas (Ni o Fi), el grfico que se obtiene se muestra en la Figura 1.2.

11

Estadstica Descriptiva

50 Frecuencias absolutas acumuladas (N) Frecuencias relativas acumuladas (F) 45 40 35 30 25 20 15 10 5 0 0 1 2 3 4 5 6 7 8 9 10

1.00

a)

0.90 0.80 0.70 0.60 0.50 0.40 0.30 0.20 0.10 0.00

b)

0 1 2 3 4 5 6 7 8 9 10

Figura 1.2: Grfico de: a) frecuencias absolutas acumuladas b) frecuencias relativas acumuladas. La informacin que presentan las figuras anteriores es equivalente a la presentada en la tabla de frecuencias y la utilizacin de una u otra es un problema de eleccin que se debe resolver segn un criterio de oportunidad. No obstante, si el objetivo es visualizar la forma en la que se distribuyen los datos para seleccionar un modelo probabilstico para la variable, la representacin grfica es, seguramente, la mejor opcin. Cabe mencionar que el tratamiento de las variables categricas es similar al de las variables numricas discretas. Una tabla de frecuencias para una variable categrica se construye de la misma forma que en el caso de las variables discretas. Para representar grficamente datos categricos, en general, se utilizan los grficos de barras o los diagramas en torta. Ejemplos de este tipo de representacin pueden consultarse en el apartado correspondiente a Representaciones Grficas, al final de este captulo.

Tablas de distribucin de frecuencias y grficos para variables continuas


Para describir la distribucin de frecuencia correspondiente a una variable continua, es indispensable agrupar los valores registrados mediante un conjunto de intervalos. La determinacin de la cantidad y amplitud de los intervalos es arbitraria. La distribucin de frecuencia debera tener entre 5 y 15 intervalos puesto que, si no hay suficientes intervalos habr demasiada concentracin de datos, y si hay demasiados puede suceder que algunos no contengan observaciones.
12

Estadstica Descriptiva

Una forma no arbitraria de obtener el nmero de intervalos es calcularlo como log2(n+1); (log2 se puede obtener como log2 (x)=loga(x)/loga(2)). Una regla prctica para definir la amplitud de los intervalos consiste en: a) b) Calcular el recorrido o rango de la variable tomando la diferencia entre el mayor y el menor valor. Dividir el recorrido por la cantidad de intervalos que se quiere tomar. El resultado de ese cociente es la amplitud que tendr cada intervalo.

La frecuencia absoluta correspondiente a cada intervalo es la cantidad de valores de la variable que pertenecen al intervalo definido. Ejemplo 1.2 Se toma una muestra de 100 espigas de trigo y en cada una de ellas se registra la longitud en cm. En este caso la variable X es longitud de espiga. Los resultados son los que se presentan a continuacin: 10.3 7.3 11.6 9.7 8.7 6.9 10.6 9.9 12.3 8.6 12.8 8.1 8.7 12.8 8.5 7.5 11.8 6.7 12.6 7.0 8.3 6.4 7.9 13.1 9.3 15.0 10.5 7.8 9.5 6.8 6.9 16.0 8.6 6.3 10.6 9.3 10.7 10.9 6.3 11.4 10.2 12.9 8.9 8.4 11.4 10.0 10.6 10.6 8.7 13.2 11.1 8.6 6.8 8.9 13.7 10.6 14.9 11.3 10.5 6.9 11.9 10.6 7.9 10.6 8.5 11.3 13.2 9.8 14.0 7.9 8.7 9.3 11.6 11.3 9.7 11.4 10.9 9.6 13.6 10.3 9.5 14.1 10.3 7.8 10.1 9.9 10.6 15.0 10.1 10.9 6.9 12.8 11.8 14.6 10.8 7.8 11.1 11.0 6.9 11.3

Aplicando la regla para calcular el nmero de intervalos se tiene que log2(100+1) 7. Para el clculo de la amplitud de los intervalos en este ejemplo se tiene: a) b) El recorrido es 16 - 6.3 = 9.7 Como el nmero de intervalos a tomar es 7, la amplitud resultante es 9.7/7 = 1.39.

Para facilitar la construccin de la tabla se redondea de 1.39 a 1.4. Por lo tanto, los conjuntos de valores de 6.3 a 7.7 cm, 7.7 a 9.1, ..., 14.7 a 16.1 cm,
13

Estadstica Descriptiva

constituyen los 7 intervalos para agrupar los valores observados de la variable longitud de espiga. El lmite inferior del intervalo se simbolizar como LI y el lmite superior como LS. El valor promedio entre los lmites del intervalo se llama punto medio del intervalo o marca de clase y se denota por mi. Para construir la tabla de frecuencias de una variable continua se procede de igual forma que para una variable discreta, es decir, se tabulan las frecuencias absolutas, las frecuencias absolutas acumuladas, las frecuencias relativas y las frecuencias relativas acumuladas en cada intervalo. Para los datos del Ejemplo 1.2 se obtiene la Tabla 1.2. Tabla 1.2:Tabla de distribucin de frecuencias correspondiente al Ejemplo 1.2.
LI, LS [6.3,7.7] ( 7.7, 9.1] ( 9.1, 10.5] ( 10.5, 11.9] ( 11.9, 13.3] ( 13.3, 14.7] ( 14.7, 16.1] ni 14 20 18 29 10 5 4 100 mi 7.0 8.4 9.8 11.2 12.6 14.0 15.4 Ni 14 34 52 81 91 96 100 fi 0.14 0.20 0.18 0.29 0.10 0.05 0.04 Fi 0.14 0.34 0.52 0.81 0.91 0.96 1.00

Qu significa ni, i, en esta tabla? Por ejemplo, para el intervalo (9.1,10.5] ni es igual a 18, pues 18 de los valores que se observaron en la muestra estn en dicho intervalo. Se dejan para el lector otras interpretaciones de esta tabla. Cuando se grafican en el eje de las ordenadas las frecuencias absolutas o relativas y en el eje de las abscisas los intervalos en los que se encuentran valores de la variable, el grfico obtenido se denomina histograma de frecuencias absolutas o relativas, respectivamente. Como dentro de cada intervalo existen varios valores de la variable, se construir una barra de altura igual a la frecuencia de dicho intervalo y ancho igual a la amplitud del mismo. Otro grfico que puede utilizarse es el polgono de frecuencias. Este es un grfico construido al unir los puntos medios de los extremos superiores de las barras de un histograma por segmentos de recta, como puede observarse en la Figura 1.3.

14

Estadstica Descriptiva

0.30 0.25 0.20 0.15 0.10 0.05 0.00 5.6

Frecuencias relativas

7.0

8.4

9.8

11.2 12.6 14.0 15.4 16.8

longitud

Figura 1.3: Histograma y polgono de frecuencias relativas. Para las frecuencias absolutas acumuladas (o relativas acumuladas), los grficos que se usan son histogramas y/o polgonos de frecuencias absolutas acumuladas (o relativas acumuladas). Estos grficos se confeccionan poniendo en el eje de las ordenadas las frecuencias absolutas (o relativas) acumuladas y en el eje de las abscisas los intervalos. Para construir el polgono se unen los puntos de la derecha del extremo superior de cada barra, como se muestra en la siguiente figura.
Frecuencias relativas acumuladas
1.08 0.90 0.72 0.54 0.36 0.18 0.00 5.6

7.0

8.4

9.8

11.2 12.6 14.0 15.4 16.8

longitud

Figura 1.4: Histograma y polgono de frecuencias acumuladas relativas. Ms adelante se ver que el polgono de frecuencias permite aproximar la funcin de densidad de una variable aleatoria, mientras que el polgono de frecuencias relativas acumuladas da una aproximacin de su funcin de distribucin.

15

Estadstica Descriptiva

Medidas resumen de la informacin muestral


Los aspectos relevantes de una muestra son generalmente descriptos usando medidas de posicin y de dispersin. Estas medidas, como se ver luego, sirven para aproximar los parmetros de posicin y de dispersin de una variable.

Medidas de posicin
Las medidas de posicin son funciones de los datos de una muestra que miden, segn diferentes criterios, el centro de la distribucin de frecuencias en la muestra; tambin son llamadas medidas de tendencia central. Las ms usadas para este fin son: la media muestral ( x ), los cuantiles (xp), la mediana muestral (me) y el modo muestral (mo). Definicin 1.9: Media muestral o promedio
Si x1, x2,....., xn constituyen una muestra aleatoria de tamao n, luego la media muestral o promedio en la muestra se define como:

x =
i =1

xi . n

Definicin 1.10: Cuantil muestral


Si x1, x2,....., xn constituyen una muestra aleatoria de tamao n entonces el cuantil p de su distribucin de frecuencias muestral es el valor que en la muestra ordenada en forma ascendente ocupa la posicin [p x n] con p tal que 0<p<1. Nota: en la definicin anterior [.] indica tomar la parte entera de la expresin incluida.

En otras palabras, el cuantil p es aquel valor observado de la variable, en la muestra, tal que el nmero de valores menores o iguales a l constituyen la proporcin p del nmero total de observaciones en la muestra. Esta definicin est basada en una forma de obtener los cuantiles y permite calcularlos adecuadamente para tamaos muestrales medianos o grandes.
Nota: Es frecuente referirse a percentiles como sinnimo de cuantiles. Su diferencia est en que en el primero se especifica el porcentaje y en el segundo la proporcin.

16

Estadstica Descriptiva

Definicin 1.11: Mediana muestral


Si x1, x2,....., xn constituyen una muestra aleatoria de tamao n entonces la mediana muestral es el cuantil 0.50 de su distribucin de frecuencias muestral.

La mediana, al igual que otros cuantiles, puede ser obtenida a partir del polgono de distribucin de frecuencias relativas acumuladas o, como regla prctica, ordenando los valores de la variable de menor a mayor y tomando el valor central en el caso en que n es impar o el promedio de los dos valores centrales cuando n es par. La mediana es una medida de tendencia central que no es afectada por valores extremos o atpicos como lo es la media. A esta propiedad se la conoce como robustez. Definicin 1.12: Moda muestral
Si x1, x2,....., xn conforman una muestra aleatoria, la moda muestral es el valor de la variable que ocurre con mayor frecuencia.

Para el caso de variables continuas la moda es la marca de clase que posee mayor frecuencia. Pueden existir uno o ms valores modales. Para distribuciones simtricas unimodales, la media, la mediana y la moda corresponden al mismo valor. Para los datos presentados en el Ejemplo 1.2 se tiene que: x =10.176; mediana=10.3; moda=11.005.

Medidas de dispersin
Para describir la dispersin de los elementos de una muestra, las medidas que se encuentran con mayor frecuencia en la literatura tcnica (Steel y Torrie, 1985; Berenson et al., 1983) son el rango muestral, el rango intercuartlico, la varianza, el desvo estndar o desviacin estndar muestral y el coeficiente de variacin muestral. Se ver en captulos posteriores cmo se utilizan estas medidas para inferir acerca de los parmetros correspondientes de la distribucin. Definicin 1.13: Rango muestral
Dada una muestra aleatoria x1, x2,....., xn, el rango muestral se define como r = x(n) - x(1) , donde x(n) y x(1) corresponden a los valores mximo y mnimo en la muestra respectivamente. 17

Estadstica Descriptiva

Definicin 1.14: Varianza muestral


Si x1, x2,....., xn conforman una muestra aleatoria, la varianza muestral es una funcin de los desvos de cada xi respecto a la media muestral

que tiene la siguiente expresin:

S2 =

1 n 2 ( xi x ) . n 1 i =1

Definicin 1.15: Desviacin Estndar muestral


Dada una muestra aleatoria x1, x2,....., xn con varianza muestral S2, la desviacin estndar muestral se define como

S = S2 .

Tanto la varianza como la desviacin estndar muestrales miden la dispersin de los valores observados con respecto a la media de la muestra. La diferencia entre ellas es que mientras la primera est dada en unidades al cuadrado (si la variable se mide en cm la varianza se mide en cm2), la segunda tiene la misma unidad de medida que la media. En este sentido para la presentacin de resultados suele preferirse a esta ltima medida. Cuando se desea hacer referencia a la relacin entre el tamao de la media y la variabilidad de las observaciones, se usa el coeficiente de variacin muestral. Definicin 1.16: Coeficiente de variacin muestral
Dada una muestra aleatoria x1, x2,....., xn con media de variacin muestral se define como:

y desviacin estndar S, el coeficiente

CV =

S 100. x

Esta medida es adimensional y permite en consecuencia comparar la variabilidad de caractersticas medidas en diferentes escalas. Por ejemplo, si se comparan dos ndices para medir nivel de ataque de pulgones y ambos estn basados en tcnicas completamente diferentes, que dan puntajes cuyas unidades de medida son distintas, se dir que el ndice que tenga menor coeficiente de variacin es el menos variable. Para los datos presentados en el Ejemplo 1.2 se tiene que: S2=5.063; S=2.25; CV=22.11%.

18

Estadstica Descriptiva

Otros tipos de muestreos


Existen situaciones en las que el muestreo aleatorio simple suele no ser ptimo. A continuacin se presentan, brevemente, algunas tcnicas alternativas para la obtencin de muestras. En la prctica profesional del muestreo en ocasiones es necesaria la combinacin de dos o ms de estas tcnicas para obtener la mayor informacin al menor costo.

Muestreo Estratificado
Se usa cuando la caracterstica en estudio no presenta una distribucin aleatoria sobre las unidades muestrales. Los estratos (subconjuntos de unidades muestrales) deben tomarse de manera tal que los valores de la variable sean ms homogneos dentro de los mismos que entre ellos. Al existir un patrn de estratificacin de las unidades respecto a la variable en estudio, se obtiene una caracterizacin ms precisa de dicha variable, con muestreo estratificado que aplicando un m.a.s. El muestreo estratificado consiste en extraer una muestra aleatoria dentro de cada estrato y luego combinar la informacin proveniente de los distintos estratos, ponderada por el tamao de los mismos. Por ejemplo, para obtener la media muestral de un muestreo estratificado es necesario combinar las medias por estrato, ponderndolas por el tamao de los mismos. La medida resultante se denomina promedio ponderado. Esta medida no es de uso exclusivo en el contexto del muestreo por estratos sino de uso general y su finalidad es combinar otras medidas teniendo en cuenta ponderadores. Definicin 1.17: Promedio ponderado
Si wi es el peso o ponderacin asociada con el valor mustral xi y x1, x2,....xn es una muestra aleatoria de tamao n, el promedio ponderado muestral

x ponderada

es:

x ponderada =

i =1 n

x i wi
.
i =1

wi

Aplicando la definicin anterior al muestreo estratificado, la media obtenida por esta tcnica est dada por:

19

Estadstica Descriptiva
k

x ponderada = i =1k

x i ni
i =1

ni

Donde X i es la media del i-simo estrato y ni es el tamao del i-simo estrato, para todo i. La varianza, en este esquema de muestreo, se obtiene de manera semejante a la media ponderada, sustituyendo en la expresin dada anteriormente las x i por S2 y los i ni por (ni-1).

Muestreo por Conglomerados


Se aconseja su uso cuando por razones de costos, de practicidad u otras consideraciones no es conveniente enumerar y acceder a cada unidad de muestreo, y stas se pueden agrupar en subconjuntos, denominados conglomerados, de forma tal que haya heterogeneidad entre las unidades de un mismo conglomerado y homogeneidad entre conglomerados. El concepto de homogeneidad entre conglomerados se refiere a que las medidas que se pueden calcular para cada conglomerado difieren poco de conglomerado en conglomerado. Al existir un patrn de conglomerados de las unidades muestrales, se obtiene una estimacin ms precisa si se muestrean aleatoriamente un nmero determinado de conglomerados y se censan todas las unidades muestrales que los constituyen que si se realizara un m.a.s. Al igual que en el muestreo por estratos, la informacin de los distintos conglomerados incluidos en la muestra debe combinarse para obtener la informacin deseada; una forma es promediando la informacin de cada uno de ellos. Por ejemplo, si se desea estimar la produccin de un cultivo en un departamento de la Provincia de Crdoba, es necesario visitar una gran cantidad de campos. En este caso, hacer un m.a.s. es muy costoso ya que se deben recorrer muchos kilmetros para recaudar la informacin. Dividiendo el departamento en reas o conglomerados y seleccionando aleatoriamente algunos de ellos, y luego censndolos (es decir, se visita a todos los productores), se obtendr la misma informacin con menor costo operativo. Esta prctica permite revisar ms unidades muestrales con el mismo esfuerzo o costo que con un m.a.s., ya que al pertenecer todos los campos a un rea determinada, las distancias a recorrer son cortas. Otro ejemplo de muestreo por conglomerados, algo distante de las ciencias agropecuarias, es el que aparece en el anlisis textual cuando se quiere conocer la
20

Estadstica Descriptiva

frecuencia de distintos vocablos en la obra de un escritor. Carecera de sentido tratar de identificar y numerar todas las palabras de una obra literaria para luego hacer un muestreo aleatorio simple. Sera mucho ms prctico, tomar pginas al azar y revisar todas las palabras de esa pgina. Debe quedar claro que este mtodo presupone que la informacin dentro de cada conglomerado es ms variable que entre conglomerados, de lo contrario no es aconsejado.

Muestreo por Captura y Recaptura


Esta es una tcnica especializada de muestreo que se aconseja cuando el objetivo es conocer el tamao de una poblacin cuyos elementos, por alguna razn, no estn fijos en el espacio. Un ejemplo tpico es la estimacin de tamao de poblaciones de animales silvestres. Esta tcnica se basa en la igualdad de proporciones: A/B = C/D, donde D es el tamao de la poblacin a determinar. Se extrae una muestra de tamao C, se marcan de alguna forma los elementos que la conforman y luego se devuelven o reintegran a la poblacin. En una segunda instancia y suponiendo que los elementos de la muestra de tamao C se han mezclado uniformemente en la poblacin, se toma una nueva muestra de tamao B y se registra como A al nmero de elementos que se encuentran marcados. Luego D = B*C/A. Este procedimiento se repite un nmero suficiente de veces y se promedian los resultados a fin de obtener una mejor estimacin del tamao de la poblacin, D . Supongamos por ejemplo que se desea saber la cantidad de peces de una especie en una laguna. Para ello, se extrae una muestra de peces de tamao C = 300, se los marca, y luego se los reintegra a la laguna. Posteriormente, se toma una segunda muestra de tamao B=200 y se cuenta la cantidad de peces marcados, A = 10. Aplicando la igualdad de proporciones, se tiene que D=200 (300/10) = 6000.

Representaciones grficas
Aunque las medidas descriptivas como la media, varianza, moda, mediana, rango, cuantiles, etc. sirven para describir de manera cuantitativa distintos aspectos de la muestra, los recursos grficos adquieren especial importancia a la hora de presentar resultados con fines de divulgacin o para explorar dicho conjunto de datos. Ms all de cualquier otro objetivo, se debe tener presente que desde la perspectiva estadstica
21

Estadstica Descriptiva

las representaciones grficas auxilian en la visualizacin de la informacin. Aunque el hombre es un ser predominantemente visual, acostumbrado a tomar decisiones en funcin de la informacin que recibe por esa va, no est especialmente preparado para manejar representaciones grficas a travs de las cuales se intenta proveer informacin cuantitativa precisa. Muchos estudios se han realizado para comprender el proceso de percepcin visual y sobre las mejores estrategias de comunicacin asociadas (Cleveland, 1984, 1985; Bahrd, 1970; Shepard, 1978; Kosslyn 1980). Las recomendaciones indican que los grficos deben ser simples, con pocos elementos iconogrficos, con escalas perfectamente identificadas y preferentemente bidimensionales. Estas recomendaciones contrastan con lo que habitualmente se ve en revistas de divulgacin y en la propaganda televisiva, pero se debe tener presente el carcter no cuantitativo de la informacin que estas presentaciones tratan de transmitir. Usando criterios psicomtricos, Cleveland (1985) propuso una escala (Figura 1.5) para los elementos grficos segn su calidad para transmitir con exactitud las diferencias de las magnitudes que representa. La moraleja es cuanto ms simple mejor. En esta seccin se presentan distintas formas de representacin grfica para las cuales se discuten sus propsitos, casos tpicos de aplicacin y eventualmente algunas variaciones del esquema bsico. De ninguna manera se pretende hacer un tratamiento exhaustivo de los mtodos grficos ya que est fuera de los objetivos de este material pero s se pretende que haya un conocimiento y manejo bsico de los recursos grficos para la representacin de datos en Estadstica.

22

Estadstica Descriptiva

MEJOR posicin a lo largo de una escala comn posicin en escalas idnticas no alineadas longitudes ngulos-pendientes reas volmenes

colores, tramas, densidades PEOR Figura 1.5: Escala de calidad de los elementos grficos para representar magnitudes comparativamente.

Grfico de Barras
Una aplicacin muy usada de estos grficos es la representacin de frecuencias absolutas o relativas de distintas categoras en las que se pueden clasificar las unidades de observacin. El ejemplo que sigue muestra la frecuencia absoluta de pulgones en distintos estadios de desarrollo. La Figura 1.6 informa que el estadio ninfa 1 es el ms frecuente con 300 casos, le sigue el estadio ninfa 2 con cerca de 200 casos, el estadio ninfa 3 con menos de 100 y los adultos con menos de 30. La Figura 1.7 es una variante del grfico anterior donde la lectura de la frecuencia es inequvoca y se podra haber suprimido por completo la escala vertical que indica la frecuencia a cambio de indicar en la leyenda el modo de leer la figura como se hace en la Figura 1.8. Si en vez de representar frecuencias absolutas se representan frecuencias relativas, las figuras no cambian excepto que la escala en el eje de ordenadas tendr un mximo menor o igual a 1.

23

Estadstica Descriptiva

400

400

300

300 frecuencia absoluta

300

f recuencia absoluta

210 200

200

100

100

70 10

0 Ninfa 1 Ninfa 2 Ninfa 3 Adulto Estado

0 Ninfa 1 Ninfa 2 Ninfa 3 Adulto Estado

Figura 1.6: Distribucin de frecuencias absolutas de pulgones segn su estadio de desarrollo.


300

Figura 1.7: Distribucin de frecuencias absolutas de pulgones segn su estadio de desarrollo.

210

70 10 Ninfa 1 Ninfa 2 Ninfa 3 Adulto

Figura 1.8: Distribucin de frecuencias absolutas de pulgones segn su estadio de desarrollo.

Estado

Una aplicacin frecuente del grfico de barras es la representacin de los valores medios de una variable. Cada barra tendr una altura, en la escala del eje de ordenadas, igual a la media que se quiere representar. Tomando el ejemplo anterior se puede mostrar para cada estadio de desarrollo, el peso promedio de los individuos. Adems, en estos casos, es una buena prctica agregar a estas representaciones una medida de la variabilidad muestral de la media, mediante un segmento de recta colocado en la parte superior de cada barra y cuya longitud es igual al error estndar de la media, EE =
2

, y ser definida en el Captulo 4. Una aplicacin como esta

dara como resultado un grfico como el que muestra la Figura 1.9.

24

Estadstica Descriptiva
11.00

8.80

6.60

peso

Figura 1.9: Peso promedio y error estndar de los distintos estadios de desarrollo de pulgones.

4.40

2.20

0.00 Ninfa1 Ninfa2 Ninfa3 Adulto Estado

Diagramas de Torta
Una alternativa para la representacin de frecuencias relativas de un conjunto de categoras es la utilizacin de diagramas en torta. En este caso la porcin de torta que le corresponde a cada categora representa la frecuencia relativa. La Figura 1.10 muestra la representacin en diagrama de torta del ejemplo presentado en la Figura 1.7 utilizando las frecuencias relativas. Una limitante para este tipo de representaciones es el nmero de categoras, ya que cuando stas son muchas, la lectura del grfico no es simple. Hay varias variantes al esquema bsico, las ms frecuentes incluyen profundidad (3D o 3 dimensiones), perspectiva y la posibilidad de distinguir alguna categora mediante la reubicacin de su porcin de torta en una posicin ms alejada del resto. Asimismo, se pueden agregar los porcentajes que cada porcin de la torta representa para facilitar as su lectura.

25

Estadstica Descriptiva

Ttulo

Ttulo

Ninfa III

Adulto

Ninfa III (12% )

Adulto (1% )

Ninfa I Ninfa II

Ninfa II (36% ) Ninfa I (51% )

Figura 1.10:Distribucin de individuos segn el estadio de desarrollo sin identificacin de las magnitudes que representan cada una de las porciones de la torta (a) y con la aclaracin correspondiente (b).

Diagramas de Caja (Box Plot)


Estos grficos tienen por objeto presentar sintticamente los aspectos ms importantes de una distribucin de frecuencias. Ejemplo 1.3 Se toman muestras aleatorias de tamao n = 100 de cada uno de tres estadios larvales de una especie de polilla forestal. Cada individuo es pesado y los resultados se presentan en la Tabla 1.3.

26

Estadstica Descriptiva

Tabla 1.3:Peso (mg) de 100 larvas de cada estadio de una polilla forestal.
Estadio 1
0.47 0.05 0.25 1.43 0.49 4.52 2.92 0.14 1.76 0.18 0.69 0.00 0.20 0.75 3.02 0.29 1.68 0.37 0.06 0.72 0.09 0.10 0.69 0.00 0.77 0.10 0.14 0.90 0.00 1.25 2.50 2.05 1.82 1.76 2.87 0.24 0.00 0.00 0.28 0.39 1.06 0.11 1.00 0.01 0.37 0.56 1.20 0.40 3.77 0.28 0.46 0.31 0.84 0.91 0.23 0.06 0.27 1.87 1.26 0.82 0.00 0.00 1.57 0.04 0.36 0.01 0.20 0.00 0.06 0.63 0.86 0.00 0.04 0.00 0.47 0.12 0.07 2.94 0.92 0.03 0.01 0.05 0.76 0.39 1.06 0.84 0.12 0.51 1.87 0.75 0.03 1.80 0.56 0.85 0.05 0.05 0.53 0.02 0.01 0.04 2.40 3.48 3.69 5.35 3.01 1.98 1.88 12.47 11.24 5.43 7.29 3.88 4.19 3.34 11.69 2.98 1.36 2.97 1.93 3.84 2.33 3.02 5.02 6.25 9.29 2.83 6.31 1.61 5.89 6.49 8.35 4.22 2.95 2.61

Estadio 2
4.85 4.46 10.67 1.75 0.92 1.46 4.51 2.35 5.47 4.07 14.67 1.40 5.07 3.43 9.01 6.09 5.31 9.54 7.55 8.33 2.89 4.64 9.59 7.13 3.29 7.16 0.35 2.81 9.33 3.01 6.65 6.44 5.94 5.43 3.09 9.22 5.28 2.25 2.19 3.97 4.15 2.81 3.75 0.73 2.59 3.83 2.92 6.40 5.50 7.22 5.60 4.29 4.68 2.32 3.93 5.11 3.03 3.46 2.05 1.67 4.45 3.47 5.76 1.75 1.97 9.41

Estadio 3
22.74 3.63 8.17 9.82 7.59 8.33 12.49 7.74 23.73 6.79 8.28 6.46 11.99 14.52 18.25 13.62 8.74 8.53 9.61 2.83 13.69 10.83 8.10 9.49 3.16 10.64 5.13 10.18 4.18 6.04 17.87 5.97 5.18 10.19 7.96 11.19 15.34 5.14 11.01 7.48 10.19 10.95 12.87 13.67 7.56 9.12 10.93 22.87 4.57 11.30 8.56 3.93 23.12 5.44 14.41 2.63 6.52 17.35 10.24 12.34 6.81 4.17 8.38 4.87 5.46 10.45 17.90 3.44 10.03 4.54 10.88 4.68 5.32 14.40 10.83 5.54 9.75 6.51 9.93 9.10 11.80 15.05 12.49 5.48 6.68 10.45 11.35 9.58 5.56 8.52 7.73 7.02 5.56 16.14 10.95 5.22 11.05 20.70 10.24 7.97

Obviamente la visualizacin de estos resultados no permiten percibir las similitudes o diferencias entre las distribuciones muestreadas. Una forma de presentar estos resultados es el que se hace en la Figura 1.11. En ella se observan 3 cajas cuyo cuerpo est atravesado por una lnea horizontal y de los extremos superior e inferior emergen sendos segmentos de recta que son continuados, en algunos casos, por cruces y crculos. La Figura 1.12 presenta esquemticamente la interpretacin de este grfico.

27

Estadstica Descriptiva

25.00 20.00 15.00 10.00 5.00 * 0.00 1.00 * * *

* * * *

valores muy extrem * valores extremos * * cuantil 0.95 cuantil 0.75 mediana cuantil 0.05 cuantil 0.25

2.00 3.00 estados larvarios

Figura 1.11: Diagramas de caja describiendo la distribucin de pesos en tres estadios larvales.

Figura 1.12: Diagrama explicativo de los objetos que aparecen en los diagramas de caja.

Qu se puede decir del peso de las larvas de los distintos estadios? En primera instancia las distribuciones estn posicionadas de manera diferente, siendo las larvas de estadio 3 las ms pesadas, luego las de estadio 2 y finalmente las de estadio 1. Otro hecho que puede observarse es que la variacin, al menos en trminos absolutos, va incrementndose a medida que aumenta el peso promedio de las larvas. Un tercer hecho es que la distribucin es asimtrica con valores extremos o muy extremos slo a la derecha de la media. Por otra parte, la asimetra tiende a disminuir con el aumento del peso, esto indica que la distribucin es ms asimtrica en las larvas de estadio 1 que en las de estadio 2 3. Esto se puede visualizar por la cantidad de valores muy extremos.

Diagrama de puntos (Dot-Plot)


Aunque el box-plot es una representacin apropiada para la distribucin de frecuencias muestrales, a veces el tamao de la muestra es pequeo y los cuantiles muestrales que de ella se obtienen no son confiables desde el punto de vista estadstico y en consecuencia la construccin del box-plot, que requiere de estas medidas, puede no ser buena. En otras circunstancias no slo se quiere tener una imagen de los aspectos generales de la distribucin sino, tambin, una visualizacin de los valores
28

Estadstica Descriptiva

efectivamente observados. En estos casos el dot-plot, puede ser la representacin ms satisfactoria. El procedimiento de construccin es simple y consiste en dibujar un punto por cada uno de los valores observados en la muestra, ubicados segn una escala (la recta real) que se pone como referencia. Cuando hay ms de una observacin con el mismo valor, sta se representa con otro punto ubicado en posicin contigua al anterior y as sucesivamente con el resto de las observaciones repetidas. Ejemplo 1.4 La siguiente tabla presenta los resultados observados del nmero de plntulas de malezas por m2 en una muestra de tamao n=20. La Figura 1.13, presenta el dot-plot para estos datos. Tabla 1.4: Nmero de plntulas de maleza por m2. 5 3 4 7 5 9 5 4 8 1 7 4 4 5 7 5 3 4 8 5

mmero de malezas por metro cuadrado

10 9 8 7 6 5 4 3 2 1 0

Figura 1.13: Diagrama de puntos para el nmero de malezas por m2.

29

Estadstica Descriptiva

Histogramas y Polgonos
Otra forma alternativa de presentar los resultados de la Tabla 1.3 es mediante el clsico histograma. La Figura 1.14 presenta el histograma de frecuencias relativas y el polgono correspondiente al peso de las larvas del estadio 1. Lo ms destacable que puede observarse es la marcada asimetra de la distribucin; en comparacin con la representacin en box-plot es ms difcil identificar los percentiles, los valores extremos y muy extremos.
0.65 0.57

Frecuencias relativas

0.49 0.41 0.33 0.24 0.16 0.08 0.00 0.32 0.97 1.61 2.26 2.91 3.55 4.20

Figura 1.14: Histograma y polgono de frecuencias relativas del peso de larvas del estadio 1 de una especie de polilla forestal.

Peso (mg)

Diagramas de Tallo y Hojas


Otra forma de graficar la distribucin de una variable es a travs del diagrama de tallos y hojas. En la Figura 1.15 se muestra una representacin del peso de las larvas de estadio 1 segn un grfico de tallos y hojas.

0 0 0 0 0 1 1 1 1 1 2 2 3 4

00000000000000000000000000000111111 M 222222222333333 444445555 66677777 H 88888999 000 222 45 677 8888 0 *** Valores atpicos *** 5899 07 5

Figura 1.15: Diagrama de Tallos y Hojas para la variable peso de larvas de estadio 1 de una polilla forestal.

30

Estadstica Descriptiva

En esta figura el peso 0.47 (la primer larva de la Tabla 1.3), est representado en la tercer fila del grfico mediante un nmero 4. Como hay cinco cuatros esto indica que hay cinco observaciones con cero como parte entera y cuatro como primer decimal. Para completar el ejemplo, y de acuerdo a la figura, el valor mximo tiene como entero al 4 y como primer decimal al 5. La fila marcada con M contiene al valor de la mediana y la marcada con H al punto a partir del cual los valores mayores (o menores si est por encima de la marca de la mediana) son extremos. La figura anterior muestra de manera muy clara el carcter asimtrico de la distribucin de la variable estudiada y permite identificar con facilidad los valores atpicos.

Diagramas de Dispersin
Cuando se estudia la asociacin entre 2 variables (por ejemplo X e Y) es muy til hacer un diagrama de dispersin. Este es un grfico en el que cada observacin est representada en el plano XY por un punto cuyas coordenadas estn dadas por los valores registrados en ambas variables. Por ejemplo, si se hace un experimento en man en el que a distintas parcelas se agregan nmeros crecientes de aplicaciones de un fungicida y se registra el rendimiento final, se podran obtener los resultados mostrados en el Tabla 1.5. La Figura 1.16 presenta un diagrama de dispersin, donde se puede visualizar la existencia de una asociacin positiva entre el rendimiento y el nmero de aplicaciones del fungicida. La Figura 1.17 sugiere una relacin funcional no lineal que liga al nmero de aplicaciones con el rendimiento obtenido. Tabla 1.5: Rendimiento de man para distinto nmero de aplicaciones de fungicida.
Aplicaciones Rend. Aplicaciones Rend. Aplicaciones Rend. Aplicaciones Rend.

0 1 2 3 4 5 0 1 2

3.15 3.54 3.37 4.69 4.56 4.78 3.28 3.54 4.04

0 1 2 3 4 5 0 1 2

2.20 2.65 4.03 4.82 3.81 4.55 2.96 3.01 3.56

5 4 3 2 1 0 5 4 3

4.65 4.54 3.96 4.80 4.18 3.88 5.35 4.50 4.93

5 4 3 2 1 0 5 4 3

5.31 4.74 5.10 4.46 5.01 2.67 4.20 4.34 5.14

31

Estadstica Descriptiva

Aplicaciones

Rend.

Aplicaciones

Rend.

Aplicaciones

Rend.

Aplicaciones

Rend.

3 4 5

5.2 4.91 5.03

3 4 5

3.98 5.21 5.44

2 1 0

3.54 3.35 2.73

2 1 0

5.17 4.99 4.08

Figura 1.16: Diagrama de dispersin entre nmero de dosis de fungicida y rendimiento de man.

Figura 1.17: Diagrama de dispersin entre nmero de dosis de fungicida y rendimiento de man con una curva de ajuste que aproxima la relacin entre estas variables.

Diagramas de Lneas
En algunos casos un diagrama de dispersin puede ser modificado incluyendo segmentos de recta que unen los puntos del plano segn un orden dado por el eje de abscisas. Como ejemplo, supngase que se evala el nmero de callos obtenidos en
32

Estadstica Descriptiva

cultivos de 200 anteras sometidas a un nmero creciente de das de fro (Tabla 1.6.). La Figura 1.18 muestra estos resultados mediante un diagrama de lneas. Este permite visualizar con claridad la tendencia decreciente del nmero de callos formados en funcin del nmero de das de fro y la forma en que esto ocurre. As, se observa una fuerte cada inicial para luego llegar a una situacin de estabilidad con una leve tendencia decreciente. Tabla 1.6: Das de fro y nmero de callos obtenidos a partir de 200 anteras cultivadas.
Das # Callos
157

0 150

1 50

2 45

3 40

4 38

5 27

6 15

Nmero de callos

120

83

45

8 0 1 2 3 4 5 6

Das

Figura 1.18: Diagrama de lneas que muestra la relacin entre das de fro y nmero de callos formados sobre 200 anteras cultivadas.

Q-Q Plots
Este grfico permite la comparacin de la distribucin de frecuencias de una variable con una distribucin terica. Una de estas distribuciones, que se estudiar ms adelante, es la distribucin normal. En ese caso se habla de Q-Q plot normal. El nombre proviene del hecho de representar en l los cuantiles muestrales versus los cuantiles tericos (quantil to quantil plot). As, si se presupone que la distribucin de la variable altura de hipoctilo de una especie de Prosopis es una variable normal, se
33

Estadstica Descriptiva

podra verificar esto grficamente mediante un Q-Q plot. Este grfico no es ms que un diagrama de dispersin donde los valores de los ejes X e Y se obtienen segn el siguiente algoritmo. a) Ordenar la muestra de menor a mayor y designar al valor con la posicin i-sima como x[i]. Sean x y S, la media y la desviacin estndar muestrales correspondientes, Para cada observacin ordenada obtener las coordenadas (X,Y) para construir el grfico Q-Q plot siendo: Xi= x[i] (el primer elemento de X es el dato ms pequeo de la muestra, x[1], y el ltimo elemento es el mayor valor observado, x[n]). Yi = -1((i-0.5)/n) S + x , donde -1 es la funcin inversa de la funcin de distribucin normal estndar. Los resultados de esta funcin se obtienen de una tabla de distribucin normal (Tabla Normal del Apndice) buscando el argumento en la columna que dice P(Zz) y como resultado el valor de z correspondiente. Por ejemplo, la siguiente tabla muestra los valores observados de longitud del fololo en 30 hojas de garbanzo. Tabla 1.7: Longitud del fololo en plantas de garbanzo.
3.0 3.1 2.8 2.7 2.3 2.8 2.9 2.9 3.1 3.2 3.1 2.5 3.0 3.4 3.1 3.5 2.9 2.8 3.4 3.3 2.8 2.8 3.0 3.1 3.3 2.7 2.5 2.9 3.1 3.2

b)

Ordenando los datos, los correspondientes valores de X e Y del Q-Q plot se muestran a continuacin:
X 2.3 2.5 2.5 2.7 2.7 2.8 2.8 2.8 2.8 2.8 (i-0.5/n) 0.017 0.050 0.083 0.117 0.150 0.183 0.217 0.250 0.283 0.317 Y 2.39 2.52 2.59 2.65 2.69 2.73 2.76 2.79 2.82 2.84 X 2.9 2.9 2.9 2.9 3.0 3.0 3.0 3.1 3.1 3.1 (i-0.5/n) 0.350 0.383 0.417 0.450 0.483 0.517 0.550 0.583 0.617 0.650 Y 2.87 2.89 2.92 2.94 2.96 2.99 3.01 3.03 3.06 3.08 X 3.1 3.1 3.1 3.2 3.2 3.3 3.3 3.4 3.4 3.5 (i-0.5/n) 0.683 0.717 0.750 0.783 0.817 0.850 0.883 0.917 0.950 0.983 Y 3.11 3.13 3.16 3.19 3.22 3.26 3.30 3.36 3.43 3.56

El grfico resultante se muestra en la Figura 1.19. Cuando la distribucin de la


34

Estadstica Descriptiva

variable coincide con la del modelo propuesto, entonces los puntos X,Y se alinean en una recta a 45 (pendiente 1), como en el caso presentado. Una variante del Q-Q plot es el P-P plot que grafica percentiles vs. percentiles.

3.62

3.30

2.98

2.65

2.33 2.30 2.60 2.90 3.20 3.50

Figura 1.19: Q-Q plot normal para los datos presentados en la Tabla 1.7.

Ejercicios
Ejercicio 1.1 A partir de las situaciones que se describen a continuacin, identificar la poblacin en estudio y una o ms variables que sean de utilidad para el anlisis del problema en cuestin. Situacin A: En una zona del departamento de Ro Primero, en la Provincia de Crdoba, donde se cultiva zapallo para obtencin de semillas, se observ que las cosechas de semillas del ltimo trienio disminuyeron considerablemente con respecto a perodos anteriores, an cuando el rea cultivada se mantena sin cambios. Entrevistas con tcnicos de la zona revelaron que varias podran ser las causas de tal disminucin en los rendimientos. Entre ellas se consideraban especialmente: 1) Una infestacin varietal producida por el cruzamiento de las poblaciones para cosecha, con las poblaciones de zapallito amargo, que enmalezan los cultivos de maz de la zona. Se conoce por investigaciones previas que cuando se produce
35

Estadstica Descriptiva

este tipo de hibridacin los zapallos cultivados dan flores con distinto nmero de ptalos y disminuyen la produccin de semillas. 2) Un aborto de vulos, generadores de semillas, por influencia de las pulverizaciones que se han introducido en los ltimos tres aos. El efecto visible de las pulverizaciones es el amarilleo y la disminucin del dimetro de los ovarios. Situacin B: En una experiencia de laboratorio se ha inoculado un complejo virsico a trescientas macetas que contienen plntulas de tabaco. Se cree que dicho complejo puede provocar diversos grados de clorosis en el follaje o bien no producir clorosis, pero disminuir considerablemente la altura de plntulas. Ejercicio 1.2 Basndose en una situacin problemtica que sea de inters, plantear un experimento y un estudio observacional. Definir para cada uno la/s variable/s respuesta/s. Ejercicio 1.3 Clasificar las siguientes variables en continuas o discretas: a) b) c) d) e) f) g) Nmero de semillas de alfalfa por metro de surco sembrado. Temperaturas registradas cada media hora en un laboratorio, durante una semana. Perodo de tiempo desde el almacenamiento y hasta que se produce el deterioro del 50% de los frutos almacenados. Milmetros de precipitacin de una localidad durante un ao. Nmero de semillas en dormicin en cajas de 50 semillas. Nmero de materias aprobadas con 4 puntos por estudiantes de la Facultad de Agronoma durante el perodo 1994-1997. Cociente entre el largo y el ancho de los entrenudos de plantas de maz.

Ejercicio 1.4 (Para hacer en el aula) MUESTRAS ALEATORIAS VERSUS MUESTRAS APLICANDO SU JUICIO Cul es mejor? Supngase que una persona est interesada en conocer cul es la superficie promedio de los lotes de una regin. Para ello debe seleccionar entre los siguientes mtodos:
36

Estadstica Descriptiva

Mtodo 1: extraer una muestra de lotes que considere representativa o buena a su juicio, y calcular el promedio de la misma. Mtodo 2: extraer una muestra aleatoria y calcular el promedio de la muestra. Para analizar las consecuencias de la seleccin de uno u otro mtodo y del tamao de la muestra, realizar el siguiente experimento: Mtodo 1: muestra aplicando su juicio a) Mirar durante 10 segundos la hoja con la figura adjunta a este ejercicio y arriesgar una cifra para el promedio del rea de los rectngulos en la pgina. La unidad de medida es el cuadrado unitario; por ejemplo un rectngulo de 3 filas por 4 columnas de cuadraditos tiene un rea de 12. Tal esquema podra representar un lote de 12 hectreas. Anotar el resultado de la inspeccin visual. b) Obtener las muestras: 1) Primera muestra: seleccionar 5 rectngulos o lotes, que a su juicio, sean representativos de los rectngulos en la pgina. Anotar el nmero de cada uno de los 5 lotes, el cual se encuentra al pie de cada uno de ellos. Anotar las reas de cada uno de estos lotes, despus calcular el promedio de las 5 reas. 2) Segunda muestra: repetir la parte 1) pero seleccionando 15 rectngulos. Registrar el promedio de las 15 reas. Recoger todos los valores obtenidos en la clase de la partes a), y b). Hacer un grfico para cada uno de los tres conjuntos de valores a los fines de observar alguna tendencia. Mtodo 2: muestra aleatoria a) Usando los nmeros de los rectngulos y la tabla de nmeros aleatorios, seleccionar 5 rectngulos aleatoriamente. Escribir los nmeros y sus correspondientes reas, y luego calcular el promedio de estas. Repetir lo realizado en el punto anterior para un conjunto de 15 rectngulos. Calcular el promedio de las 20 reas de los tem a) y b).

b) c)

Hacer los grficos con los promedios obtenidos por cada uno de los alumnos en los tem a), b) y c) y compararlos con los obtenidos en el mtodo 1. Teniendo en cuenta que la media poblacional de este conjunto de lotes es 7.5 hectreas, responder las siguientes preguntas: a) b) Muestra aleatoria versus muestra aplicando su juicio. Cul produce menor sesgo? Dadas las estimaciones con n = 5, n = 15 y n = 20, Cul es ms precisa?

37

Estadstica Descriptiva

38

Estadstica Descriptiva

Ejercicio 1.5 La siguiente tabla muestra la distribucin de frecuencias de la variable salarios mensuales (en pesos) obtenida en un muestreo aleatorio de 65 empleados de una firma agropecuaria: Salario N de Empleados (500 - 600] 8 (600 - 700] 10 (700 - 800] 16 (800 - 900] 14 (900 - 1000] 10 (1000 - 1100] 5 (1100 - 1200) 2 a) b) c) d) Representar grficamente la distribucin de frecuencias de la variable. Qu porcentaje de empleados tiene salario inferior o igual a 800 pesos? Es ste el cuantil 0.80? Qu porcentaje de empleados tiene salario mayor a 800 pesos? Calcular los cuantiles 0.50 y 0.30 de la distribucin.

Ejercicio 1.6 A partir de la observacin de los siguientes grficos, qu diagrama se asocia con cada una de las siguientes descripciones?. a) b) Distribucin de la poblacin argentina en 1990 segn la edad (en aos). El rango es de 0 a 90, el tamao de la clase o amplitud del intervalo es 10. Distribucin del nmero de plantas muertas con relacin a la severidad de una enfermedad. La severidad se mide de acuerdo a una escala categrica de 0 a 5 en orden creciente de ataque. Distribucin de altura de plantas en un cultivo de trigo (en cm.). Rango de 0 a 50, tamao de clase 5. Distribucin de personas segn la distancia (en Km.) que transitan desde su hogar al trabajo. El rango va de 0 a 50, el tamao de clase es 5.

c) d)

39

Estadstica Descriptiva

Ejercicio 1.7 Dentro de las actividades agrcolas del Departamento Tulumba de la Provincia de Crdoba, durante el perodo 88-89, predomin el cultivo de maz con 60000 tn. producidas, mientras que de soja se obtuvieron 3000 tn. y de sorgo 2000 tn. Representar grficamente el comportamiento de la variable produccin para cada cultivo. Ejercicio 1.8 Los siguientes datos corresponden a la ganancia de peso por da (expresada en gramos), de novillos sometidos a una dieta experimental. 704 801 660 825 890 720 780 809 986 807 615 758 806 960 895 705 798 858 969 800 995 606 880 910 876 798 700 896 705 708 697 708 706 893 804 690 915 906 918 830

Obtener medidas descriptivas, graficar e interpretar la informacin contenida en esta muestra.


40

Estadstica Descriptiva

Ejercicio 1.9 Los siguientes datos se refieren al nmero de dientes por hoja en bulbos de ajo:
4 3 4 2 3 2 2 2 3 3 1 3 3 2 1 2 2 3 2 3 2 2 4 2 2

a) b) c)

Construir la tabla de distribucin de frecuencias y representarla grficamente. Cul es la proporcin o probabilidad aproximada de encontrar hojas con menos de 2 dientes? Cul es la proporcin o probabilidad aproximada de encontrar hojas con ms de 2 dientes?

Ejercicio 1.10 En un estudio en un monte del Chaco rido se midieron los permetros basales de troncos de plantas de quebracho blanco (en centmetros) y se obtuvo la siguiente informacin.
138 140 163 140 145 164 147 119 135 128 150 136 154 161 132 148 165 145 144 152 146 135 125 144 173 161 149 168 142 145 157 126 147 142 146 138 135 150 158 176 153 156

a) b)

Construir la tabla de distribucin de frecuencias y representarla grficamente. Obtener las siguientes medidas: media, mediana, modo, X0.25, X0.75, rango, desviacin estndar y coeficiente de variacin.

Ejercicio 1.11 Una compaa dedicada a la comercializacin de semillas decidi poner a prueba el rendimiento de dos hbridos de sorgo granfero bajo riego. Se estudiaron dos muestras, una del hbrido "Nueva GR80" y otra del hbrido "Overa". Los resultados, en qq/ha fueron:
Nueva GR80:
110 112 135 140 128 132 123 125 140 142 151 113 142 123 118 143 138 135 140 135

41

Estadstica Descriptiva

112 128 152 136 152 139 142 129 150 135 119 128 123 142 138 145 136 147 141 137

Overa:
115 158 139 143 151 152 148 139 153 125 136 129 146 136 140 150 140 139 128 129 125 130 140 149 150 139 142 138 129 126 137 148 146 150 158 153 119 139 154 139 151 154 139 132

a) b)

En base a las medidas muestrales, cul de los dos hbridos recomendara?. Representar grficamente ambas muestras.

42

2
2 Variables Aleatorias
Introduccin
En este captulo se darn las definiciones de espacio muestral, punto muestral, evento, y evento aleatorio, necesarias para introducir el concepto de variable aleatoria. Se darn adems tres definiciones de probabilidad, la de Kolmogorov, la frecuencial y la clsica. Tambin se presentar una definicin de funcin de densidad y distribucin, que abarca tanto el caso de variables aleatorias continuas como discretas. Finalmente se introducir el concepto de parmetros para la caracterizacin de distribuciones de variables aleatorias.

Espacio Muestral - Eventos


Ejemplo 2.1 Considrese un experimento que consta de la observacin de 3 semillas en un cierto orden, cada una de las cuales puede estar sana (situacin que se representar con el signo +) o bien enferma (situacin que se representar con el signo -). Hay 8 resultados posibles en el experimento, los que conforman un conjunto que se denomina espacio muestral y que a continuacin se representa: = {+ + + , + - - , + + - , - - + , + - + , - + - , - + + , - - -} Definicin 2.1: Espacio muestral
Se llama espacio muestral al conjunto de todos los resultados posibles de un proceso

experimental u observacional. Ser denotado con la letra griega omega ().

43

Variables Aleatorias

Definicin 2.2: Punto muestral o evento elemental


Se llama punto muestral o evento elemental a cada uno de los elementos del conjunto y ser denotado genricamente como .

Siguiendo con el ejemplo, un punto muestral es el resultado posible tres semillas sanas (representado por = (+ + +)), otro punto muestral es la primera semilla sana y las otras dos no ( = (+ - -)). Definicin 2.3: Evento
Dado un espacio muestral , se llama evento a cualquier subconjunto de .

Se utilizarn letras A, B, C,.... para denotar los eventos, salvo en el caso del mismo (llamado evento cierto) y del subconjunto que no contiene ningn resultado posible (conjunto vaco), denotado por . Un evento de , puede ser observar una semilla cualquiera sana y las otras no. Este evento esta constituido por los siguientes puntos muestrales:
A = {+ - - , - + - , - - +}.

Definicin 2.4: Eventos mutuamente excluyentes


Se dice que dos eventos A y B de un espacio muestral son mutuamente excluyentes si no contienen elementos en comn, o sea si la interseccin de A y B es el conjunto vaco (AB=).

Ejemplo 2.2 Dados A = {+ - - , - + - , - - +} y B = {+ + - , - + + , + - +}, entonces puede observarse claramente que A y B son eventos mutuamente excluyentes. Por la teora de conjuntos se tiene: Si A y B son dos eventos de , la unin de estos eventos conforma un nuevo conjunto, que contiene a los puntos muestrales de A y de B. La unin de A y B se denota por AB. Si A y B son dos eventos de , la interseccin de estos eventos conforma un nuevo conjunto, que contiene a los puntos muestrales que pertenecen a A y a B simultneamente. Se denota la interseccin de A y B por A B.

44

Variables Aleatorias

Ejemplo 2.3 Sean: A = {+ - - , - + - , - - +} y B = {+ + - , + - + , - + +}. Entonces, A B = {+ - - , - + - , - - + , + + - , + - + , - + +} Ejemplo 2.4 Sean A el evento observar exactamente una semilla sana y el evento B observar que la segunda semilla est sana (B={- + -, + + +, + + -, - + +}), luego A B ={- + -}. Ejemplo 2.5 Sean los eventos A ={+ + +} y B ={- - -}, luego, puede verse fcilmente que A B resulta ser el conjunto vaco.

Probabilidad
Se analizar primero la definicin de probabilidad dada por Kolmogorov y luego las definiciones frecuencial y clsica.

Probabilidad segn Kolmogorov


Esta definicin es la ms amplia y la menos intuitiva, pero sienta las bases para el desarrollo de la teora de probabilidades, en tanto las otras dos definiciones brindan criterios de clculo de la probabilidad de un evento. Definicin 2.5: Medida de Probabilidad (Kolmogorov, 1937)
Sea un espacio muestral. La funcin P(.) que asigna a cada evento de un nmero real en el intervalo [0,1], se llama medida de probabilidad si satisface los siguientes axiomas: i. P() =1

ii. P(A) 0, donde A representa un evento cualquiera de iii. Si A1, A2, ... es una secuencia de eventos mutuamente excluyentes entonces:

P U i Ai =

) P(A ) .
i i

De esta definicin se deduce que dados los eventos A y B, la probabilidad de que ocurra A B es dada por P(AB) = P(A) + P(B) - P(AB), donde P(AB) denota la probabilidad de que ocurran A y B simultneamente.
45

Variables Aleatorias

Si A y B son mutuamente excluyentes, AB = P(AB) = P() = 0. En otro caso, 0<P(AB) 1. Definicin 2.6: Probabilidad condicional
Para dos eventos A y B que pertenecen al mismo espacio muestral la probabilidad condicional se define como: P(A|B) = P(AB)/P(B), donde P(A|B) denota la probabilidad condicional de ocurrencia del evento A dado que ha ocurrido B.

Por ejemplo, si B es el evento da nublado y A el evento llueve en el da, luego P(A|B) denotar la probabilidad de lluvia dado que el da est nublado. Definicin 2.7: Independencia de Eventos
Dados A y B eventos que pertenecen al mismo espacio muestral, se dice que son independientes si P(AB) = P(A).P(B).

Luego, si A y B son eventos independientes se tiene que P(A|B).P(B) = P(A).P(B). Ejemplo 2.6 Considrese un experimento en el que se analizan 3 pariciones de una vaca (n=3), registrndose el sexo del ternero nacido. Como los resultados posibles de cada paricin son dos (N=2), los resultados posibles del experimento son Nn=23=8. Estos son: HHH, HHM, HMH, MHH, HMM, MHM, MMH y MMM donde M representa una cra macho y H una cra hembra y se asume que estos resultados son igualmente probables. Defina los eventos A como "una cra hembra nace en cada uno de los dos primeros partos"; B como "un macho nace en el tercer parto" y C como "exactamente 2 machos ocurren en los tres partos". Mostrar que A y B son dos eventos independientes, mientras que B y C no lo son: A = {HHH , HHM} B = {HHM , HMM , MHM , MMM} C = {HMM , MHM , MMH} A y B son independientes P(AB) = P(A) . P(B)
46

Variables Aleatorias

Como AB = {HHM} P(AB) = P(A).P(B) =

2 4 1 = . Luego, P(AB)= P(A) .P(B), por consiguiente A y B son 8 8 8


4 y 8

1 2 4 . Por otra parte, P(A) = y P(B) = y 8 8 8

independientes. Si B y C son independientes P(BC) = P(B) . P(C). En este ejemplo, P(B) = P(C) =

3 4 3 3 . . As, P(B) . P(C) = = . Por otro lado, B C = {HMM , MHM} 8 8 8 16 2 P(B) . P(C). Luego B y C no son independientes. P(B C ) = 8
Probabilidad: Concepto Frecuencial
Definicin 2.8: Probabilidad: concepto frecuencial
Si A es un evento y nA es el nmero de veces que A ocurre en N repeticiones independientes del experimento, la probabilidad del evento A, denotada por P(A), se define como:

lim

nA . N

Observacin 1: Un estudio o ensayo es independiente de otro, si los resultados de uno no influyen sobre los resultados del otro. Cuando el resultado de un ensayo brinda informacin sobre la probabilidad de obtener un resultado determinado en otro ensayo se dice que ambos ensayos no son independientes. Observacin 2: La nocin de lmite para N debe ser interpretada para N suficientemente grande.

Ejemplo 2.7 Considrese que la observacin de una semilla es un ensayo. Suponga que con A se representa el evento encontrar la semilla germinada. Si se observan 1000 semillas (se repite 1000 veces el ensayo, N = 1000), en condiciones tales que cada observacin sea independiente una de otra2 y si 600 semillas germinan (nA = 600), se dice que la
2

Los ensayos deberan planificarse de manera tal que el hecho de que una semilla germine o no, no determine o afecte la probabilidad de germinacin de las otras semillas.

47

Variables Aleatorias

probabilidad estimada de observar una semilla germinada, est dada por: P(A) = P(observar una semilla germinada) =

nA = 600 / 1000 = 0.6 N

Observacin 3: En este caso se habla de probabilidad estimada o aproximada por una cierta proporcin ya que se us la nocin de lmite para calcular P(A).

Probabilidad: Concepto Clsico


Cuando es finito (el nmero de puntos muestrales es finito) se puede dar otra definicin de probabilidad, que es la que se desarroll originariamente estudiando los juegos de azar. Definicin 2.9: Probabilidad: concepto clsico
Dado el evento A en ,

P(A) =

Nmero de puntos muestrales favorables Nmero total de puntos muestrales

Ejemplo 2.8 Supongamos que el experimento consiste en arrojar un dado una nica vez. El espacio muestral asociado es = {1, 2, 3, 4, 5, 6 }. Si se asigna a cada punto muestral la misma probabilidad de ocurrencia, es decir P() = 1/6 para todo ; y si el evento de inters (A) es que salga un nmero par, el cual consta de los puntos muestrales {2, 4, 6}, entonces, se tiene que P(A) = 3/6 = 0.5.

Evento Aleatorio
Definicin 2.10: Evento aleatorio
Un evento A al cual atribuimos una probabilidad ser llamado evento aleatorio.

Concepto de Variable Aleatoria


Una variable aleatoria es una funcin que asocia a cada elemento del espacio muestral
48

Variables Aleatorias

un nmero real. En el esquema que se presenta a continuacin (Figura 2.1), se observa un espacio muestral , conformado por N puntos muestrales {i: i=1,...,N} y un evento aleatorio A conformado por dos puntos muestrales, {1, N}. Un ejemplo de variable aleatoria, X, puede ser la funcin que toma a 1 (lo que se denota por X(1)) y le asocia el nmero 154, y a N le asigna el 111, esto es X(N) = 111.
X(1) 1 A 3 N i X(N) 2

111 154

Figura 2.1 Representacin del espacio muestral, eventos elementales, eventos y variable aleatoria Para introducir el concepto de variable aleatoria es necesario presentar algunos eventos particulares, como son: [X a] ={ : X() a} [X = a] = { : X() = a} donde es el espacio muestral que los contiene. Obsrvese que para un valor arbitrario a dado, se puede identificar un conjunto de tal que X() a. Definicin 2.11: Variable aleatoria
Dado un espacio muestral con un probabilidad asociada, una variable aleatoria X es una funcin real definida en tal que [Xx] es un evento aleatorio x . O sea X: B es una variable aleatoria si para cualquier x , [Xx] es un evento aleatorio.

49

Variables Aleatorias

Si el conjunto B, contenido en es no numerable, la variable aleatoria ser llamada variable aleatoria continua. Si B es un conjunto numerable la variable ser llamada variable aleatoria discreta. Ejemplo 2.9 Supngase que el experimento consiste en arrojar una vez una moneda y observar si sali cara o cruz. En este caso, = {cara, cruz}. Si se asigna la misma probabilidad a cada punto muestral y se define la variable X como el nmero de caras, se tiene que X(cara) =1 y X(cruz) = 0, o sea X es una variable aleatoria discreta. Los eventos que se pueden definir en este espacio muestral son: {cara}, {cruz}, , . Obsrvese que X satisface la definicin de variable aleatoria: Si x < 0, el conjunto {:X() x} = . Si 0 x < 1, el conjunto {:X() x} = {cruz}. Si x 1, el conjunto {:X() x} =. Luego, los eventos [X x] para cualquier x, tienen asociado una probabilidad, se puede decir entonces que X es una variable aleatoria. Ejemplo 2.10 Considrese el experimento dado en el Ejemplo 2.1. Recordemos que el experimento consista en la observacin de 3 semillas en un cierto orden, cada una de las cuales puede estar sana (situacin que se represent con el signo + ) o bien enferma (con el signo - ). El espacio muestral de este experimento es: = {+ + + , + + - , + - + , - + + , + - - , - - + , - + - , - - -} Definamos ahora la variable aleatoria X como el nmero de semillas sanas; luego, asumiendo igual probabilidad para cada punto muestral, tenemos que:
X (+ + +) = 3 y P (X = 3) = 1/8 X (- - -) = 0 y P (X = 0) = 1/8 X (+ - - ) = X (- + - ) = X ( - - +) = 1 y P(X = 1) = 3/8

Esto ltimo se deduce del axioma iii de la definicin de probabilidad y por ser estos eventos excluyentes. La Figura 2.2 representa esquemticamente la variable aleatoria en cuestin.

50

Variables Aleatorias

Figura 2.2: Representacin de la variable aleatoria nmero de semillas sanas aplicada al espacio generado por el experimento del Ejemplo 2.10.

Distribucin de una Variable Aleatoria


Como se present en las secciones anteriores, una variable aleatoria es un descriptor de eventos aleatorios y su funcin de distribucin asigna probabilidades a esos eventos.

Funcin de Distribucin Acumulada


A continuacin se da una definicin de funcin de distribucin acumulada que abarca tanto el caso de variables aleatorias continuas como discretas. Definicin 2.12: Funcin de distribucin acumulada
La funcin de distribucin acumulada, o simplemente funcin de distribucin, de una variable aleatoria X, denotada por F(.), es una funcin F:[0,1] tal que: F(x) = P([X x]) x .

Cmo debe leerse F(x) = P([X x]) x ? Como se recordar, A = [X x] describe un evento en particular, esto es, aquel conjunto de puntos muestrales a los que la variable aleatoria les asocia un valor menor o igual que x. Luego P([X x]) denota la probabilidad del evento A=[X x]; F(x) = P(A) indica que se asigna a F(x) el valor de probabilidad del evento [X x] ya que esto se cumple para todo x que pertenece al conjunto de nmeros reales. En otras palabras, la definicin dice que la funcin F evaluada en el punto x es la
51

Variables Aleatorias

probabilidad de que la variable aleatoria X tome un valor menor o igual al punto x, para todo x que pertenece a los reales. Ejemplo 2.11 Siguiendo con el Ejemplo 2.1 y segn con lo planteado en el Ejemplo 2.10, cul es la funcin de distribucin acumulada de la variable nmero de semillas sanas? Para contestar esta pregunta se puede realizar una tabla de dos columnas. En la primera de ellas, se detallan los posibles valores de la variable X y en la segunda F(x). x 0 1 2 3 As, se tiene que: a) b) c) d) e) F(x) = 0 para valores de x < 0 F(x) = 1/8 para 0 x < 1 F(x) = 1/2 para 1 x < 2 F(x) = 7/8 para 2 x < 3 F(x) = 1 para x 3 F(x) F(0) = P(0) = 1/8 F(1) = P(0) + P(1) = 1/8 + 3/8 = 4/8 F(2) = P(0) + P(1) + P(2) = 1/8 + 3/8 + 3/8 = 7/8 F(3) = P(0) + P(1) + P(2) + P(3) = 8/8 = 1

El grfico de esta funcin de distribucin acumulada ser:


F(x) 1 7/8 1/2

1/8 - 0 1 2 3

Figura 2.3: Grfico de la funcin de distribucin de la variable aleatoria nmero de semillas sanas en un experimento en el que se observan 3 semillas y donde todos los puntos muestrales son equiprobables. Acerca del grfico hay que destacar los siguientes aspectos:
52

Variables Aleatorias

a) b) c)

Aunque la variable sea discreta, la F(x) esta definida para todo x en los reales, por eso se representa desde - hasta . En los valores de x que coinciden con los valores que puede asumir la variable aleatoria se produce un salto que es igual a P(x). El crculo que delimita el extremo de los segmentos, denota que en ese punto F(x) salta.

Funcin de Densidad
Se ha visto que la funcin de distribucin acumulada de la variable aleatoria X asocia a cada nmero real x la probabilidad de [X x]. Pero tambin se puede preguntar cul es la probabilidad de que X = x? Para responder a esta pregunta se distinguen dos casos: el de las variables aleatorias discretas y el de las variables aleatorias continuas. La respuesta se deriva a partir de una funcin llamada funcin de densidad o simplemente densidad de la variable aleatoria. En el caso de las variables aleatorias continuas la respuesta es siempre la misma P(X = x) = 0, en cambio, para las variables discretas, P(X = x) 0. Funcin de densidad de una variable aleatoria discreta Definicin 2.13: Funcin de densidad de una v.a. discreta
La funcin de densidad de una variable aleatoria discreta, denotada por f(.), es una funcin f:[0,1] tal que:

P( X = x)si x C f ( x) = 0 en caso contrario


donde C = { x1, x2, x3, ... } es el conjunto de valores que puede tomar la variable aleatoria discreta.

Retomando el concepto de funcin de distribucin acumulada, notemos que cuando X es una variable aleatoria discreta, F(.) puede ser definida a partir de la funcin de densidad discreta de la siguiente manera:

F(X ) =

xi x xi C

P ( X = xi ) =

xi x xi C

f ( xi )

53

Variables Aleatorias

Ejemplo 2.12 Siguiendo con el Ejemplo 2.1, cmo podra ahora calcularse la funcin de distribucin acumulada de la variable aleatoria nmero de semillas germinadas usando la funcin de densidad? x
0 1 2 3

F(x)
F(0) = f(0) = P(0) = 1/8 F(1) = f(0) + f(1) = P(0) + P(1) = 1/8 + 3/8 = 4/8 F(2) = f(0) + f(1) + f(2) = P(0) + P(1) + P(2) = 1/8 + 3/8 + 3/8 = 7/8 F(3) = f(0) + f(1) + f(2) + f(3) =P(0) + P(1) + P(2) + P(3) = 1

Funcin de densidad de una variable aleatoria continua Definicin 2.14: Funcin de densidad de una v.a. continua
La funcin de densidad de una variable aleatoria continua es una funcin f(.) 0 tal que:
x2

P( [ x1 X x2 ]) =

x1

f ( y )dy , x1 , x2 .

Nota: Si X es una variable aleatoria continua, se dir que la probabilidad de un valor cualquiera es cero, es decir, P[X = x] = 0 x, ya que segn la definicin anterior, sta correspondera al rea asociada a un punto, la que geomtricamente es nula.

De la definicin de funcin de densidad de una variable aleatoria continua se deduce que la funcin de distribucin acumulada F(.) de esta variable puede ser obtenida mediante la siguiente expresin:

FX ( x) = f(y)d(y)
-

para cualquier nmero real x

Es decir, para un x dado, P([X x]) = F(x) es el valor del rea bajo la curva que representa a la funcin de densidad comprendida entre - y x. Como consecuencia de lo expuesto, la probabilidad de que X tome un valor dentro de un intervalo determinado [x1, x2] (ver Figura 2.4), puede obtenerse a partir de la funcin de distribucin acumulada, mediante la siguiente relacin:

54

Variables Aleatorias

P(A) = P([ x1 X x2 ]) = F (x2) - F(x1) y dado que

F ( x2 ) =
Se tiene que

x2

f ( y)dy
x2

y F ( x1 ) =

x1

f ( y )dy

F ( x2 ) F ( x1 ) =

f ( y )dy f ( y ) dy =
-

x1

x2

x1

f ( y)dy

Figura 2.4: Grfico de la funcin densidad f(x). Notemos que f ( y )dy = 1, ya que, el intervalo (-,) contiene todos los posibles

valores de la variable aleatoria, y la probabilidad de es, por el axioma i de la definicin de Kolmogorov, igual a 1. Las propiedades de la funcin de distribucin acumulada son las siguientes: a) b) c) es no decreciente es continua por derecha para x - y x + los lmites de F(x) son respectivamente 0 y 1.

Medidas Resumen de la Distribucin de una Variable Aleatoria


Se ha visto que a cada variable aleatoria se le asocia una funcin de distribucin. El estudio del comportamiento de una variable se puede realizar a partir de la descripcin de su distribucin. Para ello se utilizan ciertos valores o parmetros que la caracterizan. Por ejemplo, en la Figura 2.5, se muestran los grficos de dos
55

Variables Aleatorias

distribuciones cuyas diferencias radican en que, a pesar de poseer formas similares, una curva esta desplazada con respecto a la otra. Por ello es necesario contar con un parmetro que indique la posicin de la curva sobre la recta real.
Distribucin 1 Distribucin 2

Figura 2.5: Grfico de dos distribuciones con distintos parmetros de posicin. En otras distribuciones los valores ms frecuentes, o con mayor densidad, pueden estar posicionados en el mismo intervalo y, sin embargo, las distribuciones ser distintas como muestra la Figura 2.6. Se observa en este caso, que bajo la distribucin 2 los valores alejados del centro tienen mayor frecuencia que bajo la distribucin 1.
f 1(x)

f2(x)

Figura 2.6: Grfico de dos distribuciones con distinta variabilidad. Como en los casos anteriores se pueden utilizar los grficos de las funciones de densidad para la descripcin del comportamiento de las variables aleatorias; en la prctica se usan medidas que resumen y cuantifican la informacin que se visualiza en los mismos. Las medidas de resumen ms frecuentemente usadas son las llamadas medidas de posicin y de dispersin.

Esperanza de una variable aleatoria


La esperanza matemtica de una variable aleatoria es, desde un punto de vista intuitivo, un promedio de los valores asumidos por la variable, donde cada valor es ponderado por su probabilidad de ocurrencia.

56

Variables Aleatorias

Definicin 2.15: Esperanza de una v.a. discreta


La esperanza de una variable aleatoria discreta X, con funcin de densidad f(.),es:

E( X ) = =

xi C

x f (x )
i i

donde C = { x1, x2, x3, ... } es el conjunto de valores que puede tomar la variable aleatoria.

Definicin 2.16: Esperanza de una v.a. continua


La esperanza de una variable aleatoria continua X, con funcin de densidad f(.), es:

E( X ) = =

x f ( x) dx

Esta integral no siempre existe y en ese caso, se dir que la variable no tiene esperanza. Ejemplo 2.13 Siguiendo con el Ejemplo 2.1, si x1 = 0, x2 = 1, x3 = 2 y x4 = 3, representan los posibles valores de la variable aleatoria X = nmero de semillas sanas, la E(X) se calcula como sigue: E(X) = x1 f(x1) + x2 f(x2) + x3 f(x3) + x4 f(x4) 12 .1 .3 .3 .1 = 0 8 + 1 8 + 2 8 + 3 8 = 8 = 1.5 Para una distribucin dada, la esperanza es un valor constante que identifica al centro de gravedad de la funcin de densidad. Por ello, la esperanza puede ser vista como una medida que indica la posicin de la distribucin. Volviendo a la Figura 2.5, se dice que la variable aleatoria cuya grfica de la funcin de densidad es la curva 2 tiene una esperanza mayor que la asociada a la curva 1, lo cual se visualiza con el desplazamiento hacia la derecha del grfico de la funcin de densidad.

57

Variables Aleatorias

Propiedades de la esperanza
Sean X1 y X2 v.a. con esperanzas definidas, a y b constantes; entonces se cumplen las siguientes propiedades: a) b) E(aX1 ) = a E(X1) E(aX1 + bX2) = a E(X1) + b E(X2)

Ejemplo 2.14 Siguiendo con el Ejemplo 2.13, qu sucede con E(X) si se multiplica por 3 a X? Por la propiedad a) se tiene que E(3X) = 3E(X) = 3 (1.5). En efecto, por definicin: E(3X) = 3x1 f(x1) + 3x2 f(x2) +3x3f(x3) + 3x4 f(x4) 1 3 3 1 12 = 3(0 . 8 + 1 . 8 + 2 . 8 + 3 . 8 ) = 3. 8 = 3(1.5) = 4.5 Suponga que se est estudiando el nmero de cabritos por paricin de dos razas de cabras y se asume que el nmero mximo de cras en una paricin es de tres. Llamemos X1 a la variable aleatoria nmero de cabritos por paricin de la raza 1 y X2 al nmero de cabritos por paricin de la raza 2. Luego, X1 + X2 denota a la variable aleatoria suma de los nmeros de cras en una paricin en ambas razas. El conjunto de resultados posibles esta representado en la siguiente tabla:
X2 = 0 (0,0) = 0 (1,0) = 1 (2,0) = 2 (3,0) = 3 X2 = 1 (0,1) = 1 (1,1) = 2 (2,1) = 3 (3,1) = 4 X2 = 2 (0,2) = 2 (1,2) = 3 (2,2) = 4 (3,2) = 5 X2 = 3 (0,3) = 3 (1,3) = 4 (2,3) = 5 (3,3) = 6

X1 = 0 X1 = 1 X1 = 2 X1 = 3

En cada celda el primer elemento del par ordenado es un valor posible para X1 y el segundo es un valor posible para X2. Como X1 es independiente de X2 entonces P (X1 = x1, X2 = x2) = P(X1 = x1) P(X 2= x2). Luego, sigue que: E(X1 + X2) = 0 P(0) P(0) + 1 P(1) P(0) + 2 P(2) P(0) + 3 P(3) P(0) + + 1 P(0) P(1) + 2 P(1) P(1) + 3 P(2) P(1) + 4 P(3) P(1) + + 2 P(0) P(2) + 3 P(1) P(2) + 4 P(2) P(2) + 5 P(3) P(2) + + 3 P(0) P(3) + 4 P(1) P(3) + 5 P(2) P(3) + 6 P(3) P(3)
58

Variables Aleatorias

= 0 (1/16) + 1 (1/16) + 2 (1/16) + 3 (1/16) + + 1 (1/16) + 2 (1/16) + 3 (1/16) + 4 (1/16) + + 2 (1/16) + 3 (1/16) + 4 (1/16) + 5 (1/16) + + 3 (1/16) + 4 (1/16) + 5 (1/16) + 6 (1/16) = = 0(1/16) + 1(2/16) + 2(3/16) + 3(4/16) + 4(3/16) + 5(2/16) + 6(1/16) =3 = 1.5 + 1.5 = E(X1) + E(X2) que es el resultado previsto por la propiedad b de la esperanza.

Varianza de una variable aleatoria


La esperanza de una variable aleatoria slo proporciona informacin parcial acerca de su distribucin, ya que explicita dnde est posicionada, pero, como se observa en la Figura 2.6, dos o ms distribuciones pueden tener la misma medida de posicin y sin embargo ser distintas. Existe la necesidad de una medida que indique cuan dismiles son los valores de la variable aleatoria. Antes de presentar la definicin de varianza, considrese el siguiente ejemplo. Ejemplo 2.15 Los dos conjuntos de datos, A1, A2, corresponden a todos los valores posibles e igualmente probables de dos variables aleatorias discretas X1 y X2 respectivamente. Ambas distribuciones tienen igual esperanza pero ntese la diferencia en su variacin: A1 ={ 8; 8; 9; 10; 11; 12; 12} y A2 ={1; 2; 5; 10; 15; 18; 19} Si bien para las dos variables aleatorias, la esperanza es 10, para X1 los posibles valores estn ms cerca de la esperanza que los de X2. Por otro lado, X1 tiene rango de variacin igual a 4 y menor que el rango de X2, que es igual a 18. Es el rango suficiente para resumir la variabilidad de la variable aleatoria? Si se observan los conjuntos A3 y A4 de valores posibles de las v.a. X3 y X4, se tiene: A3 = { 8; 10; 10; 10; 10; 10; 12} y A4 = {1; 10; 10; 10, 10; 10; 19} Se nota que tambin sus rangos son 4 y 18 y que la esperanza de ambas tambin es 10. Es decir, que la esperanza y el rango no hacen una caracterizacin satisfactoria de una
59

Variables Aleatorias

variable aleatoria ya que se ve que distribuciones con igual rango y con igual esperanza, son realmente distintas. Las primeras distribuciones que se analizaron (distribucin de X1 y de X2) presentan ms dispersin de los datos que las ltimas (distribucin de X3 y de X4). Es deseable entonces, encontrar otra medida de dispersin distinta del rango. Esta medida debera tiner un valor pequeo cuando la mayora de las observaciones se encuentran cerca de la esperanza y un valor grande cuando estn muy alejadas. Se define a continuacin la varianza para una variable aleatoria discreta y para una variable aleatoria continua, tal cual se hizo para el caso de la esperanza. Definicin 2.17: Varianza de una v.a. discreta
La varianza de una variable aleatoria discreta X se define como:

Var ( X ) = 2 =

xi C

(x )
i

f ( xi )

donde = E(X), f(.) la funcin de densidad y C = {x1,x2,...} el conjunto de valores posibles.

Definicin 2.18: Varianza de una v.a. continua


La varianza de una variable aleatoria continua X, denotada por V(X) 2, es:
=

V (X ) = 2

(x-)

f ( x)d ( x) ,

donde = E(X) ) y f(.) la funcin de densidad.

Cabe sealar que esta integral no siempre existe, en este caso se dir que la v.a. no tiene varianza. Propiedades de la Varianza Sean X1 y X2 variables aleatorias, a y b constantes. Entonces, se cumple que: a) b) c) d) Si X1 = a, entonces V(X) = 0 V(aX) = a2V(X) Var (X1 + a) = Var (X1) Var (aX1 bX2) = a2Var (X1) + b2Var(X2) ab 2Cov(X1, X2)

Qu representa el valor de la varianza de una variable aleatoria? La varianza es un


60

Variables Aleatorias

promedio ponderado de los cuadrados de los desvos respecto de la esperanza. Volviendo a la Figura 2.6, se dice ahora que la variable aleatoria cuyo grfico de la funcin de densidad es la curva 2 tiene una varianza mayor que la asociada a la curva 1. Debido a que la varianza se expresa en funcin de desvos al cuadrado, el valor de la varianza no est en la escala original en que estn expresadas las observaciones de la variable aleatoria. Es decir que si X se mide en cm, entonces la V(X) se expresa en cm2 . Un parmetro de dispersin en la escala original se obtiene tomando la raz cuadrada de la varianza y se conoce como desvo estndar o desviacin estndar o desviacin tpica. = 2 Otra medida de dispersin usada para referirse a la distribucin de una variable aleatoria es el coeficiente de variacin. Este tiene la ventaja de independizarse de la escala original de los datos expresando la variabilidad en forma relativa a la magnitud de la esperanza. Definicin 2.19: Coeficiente de variacin.
El coeficiente de variacin de una variable aleatoria con esperanza y desvo estndar es:

CV =

100

El coeficiente de variacin expresa la desviacin estndar como porcentaje respecto de la esperanza. Es til para comparar la variabilidad de dos o ms variables aleatorias, expresadas en diferentes unidades de medida. De este modo, con los valores de esperanza y varianza se puede resumir aspectos relevantes del grfico de la funcin densidad, por ende de la funcin de distribucin de la variable aleatoria. Sin embargo, dos distribuciones pueden tener igual esperanza y varianza y ser an diferentes. Otras medidas de resumen, tales como la asimetra y la kurtosis son usadas para describir la forma de las distribuciones. Para una variable aleatoria continua se dice que una distribucin es simtrica, respecto a un eje que pasa por la esperanza, si el rea bajo la curva de la funcin de densidad a la derecha es una imagen especular del rea a la izquierda, en caso contrario diremos que es asimtrica. La asimetra podr ser derecha o izquierda como se ilustra en la
61

Variables Aleatorias

Figura 2.7.
Simtrica

Asimtrica Derecha

Asimtrica Izquierda

Figura 2.7: Grficas de funciones densidad con asimetra de naturaleza distinta.

Cuantiles de una variable aleatoria


Un concepto muy usado para el estudio de variables aleatorias y sus distribuciones es el de cuantil. Este se encuentra estrechamente ligado a la funcin de distribucin acumulada. A continuacin se presenta la definicin de cuantil para variables aleatorias continuas (Conover, 1980). Definicin 2.20: Cuantil Si X es una variable aleatoria continua, el cuantil xp se define como el valor x tal que:

P[ X xp ] = p
Por ejemplo, si P[X x] = 0.10 entonces x es el cuantil 0.10 de la variable X. Ejemplo 2.16 Si se desea conocer el tanto por ciento de espigas de trigo que tienen una longitud menor o igual a 12 cm, es equivalente a querer conocer a qu cuantil corresponde el valor 12 de la variable longitud de espigas de trigo. Es comn encontrar el uso de la nocin de cuantil expresada como porcentaje, as el cuantil x0.10 pasa a denominarse el percentil 10, el cuantil x0.75 el percentil 75, etc. Los cuantiles o los percentiles son generalmente usados para fijar lmites de tolerancia para los valores de algunas variables. En medicina, los lmites normales de talla o de peso para un nio de dos aos, no son ms que los cuantiles 0.05 y 0.95 de la talla o del peso en la poblacin de nios normales de esa edad.

62

Variables Aleatorias

Ejercicios
Ejercicio 2.1 El espacio muestral para un experimento aleatorio en el cual se estudia la paricin simultnea de dos conejas, cada una de las cuales puede tener como mximo 6 cras y siempre tiene al menos una cra, es el siguiente: ={ (x,y) / x = 1,2,....,6; y = 1,2,...,6} a) Describir este espacio que est constituido por los 36 elementos o puntos muestrales, cada uno representado por el par (x,y), donde x = nmero de cras de la coneja 1 e y = nmero de cras de la coneja 2. El espacio es finito o infinito?. Se puede decir que el total de cras es una variable aleatoria?. De qu tipo?.
Nota: Algunas veces, el conjunto de resultados posibles de un experimento no es tan fcil de definir. Por ejemplo, esto ocurre al seleccionar al azar un habitante de la ciudad de Crdoba y medir su altura en metros. En este caso, cules son los resultados posibles del experimento?, Son los nmeros reales entre 0 y ......?. Suponiendo que no existe una altura mxima, tal vez sea razonable elegir =(0; ), no obstante se sabe que este conjunto contiene resultados imposibles, como 1.000.000 de metros. Otros conjuntos candidatos para podran ser los siguientes: (0 ; 3), (1/10 ; 3). Estos dos intervalos contienen aparentemente todos los resultados posibles.

b) c)

Ejercicio 2.2 Describir el espacio muestral asociado al experimento: "registrar la paricin de una conejera hasta que un conejo con malformacin fsica nazca". Si en una paricin no sucede lo esperado se representa la misma con la letra N (normal) y si la malformacin ocurre se usa la letra M (malformado). a) b) Contiene este espacio un nmero finito o infinito numerable de elementos? Qu variable aleatoria se puede definir sobre el mismo?. Caracterizarla.

Ejercicio 2.3 Con referencia al espacio muestral del Ejercicio 2.1, describir el evento A: "que al menos una coneja sea mellicera" y el evento B: "el nmero total de cras no supera 5".
63

Variables Aleatorias

Ejercicio 2.4 Un investigador que estudia mtodos de aplicacin de nutrientes foliares necesita indagar sobre la localizacin de las gotas de nutrientes sobre la hoja cuando el fertilizante se aplica con un mtodo de aspersin. Para ubicar las gotas supngase que la hoja es un plano y que se puede definir precisamente las coordenadas del punto sobre el que cae la gota. Describir el espacio muestral de este experimento. Ejercicio 2.5 Supngase que se conduce una investigacin para determinar la distancia que podra recorrer un tractor sobre un camino, con 5 litros de gas-oil en ciertas condiciones de avance. La distancia es una variable aleatoria que puede ser medida con el grado de precisin deseada. a) b) Describir el espacio muestral de este experimento. Identificar el tipo de variable en estudio.

Ejercicio 2.6 Construir el espacio muestral asociado al tiempo (t) de vida til de un componente electrnico (medida en aos), y sealar el subconjunto que representa al siguiente evento: que el componente falle antes del final del sexto ao. Ejercicio 2.7 El siguiente rectngulo representa un espacio muestral y los eventos son representados por regiones (crculos) dentro del rectngulo. a)
A B

Son estos eventos mutuamente excluyentes? Graficar una situacin donde ambos eventos pueden ocurrir simultneamente. Bajo la situacin dada en b), cul es la probabilidad de que suceda A B?

b) c)

Ejercicio 2.8 Un productor tambero desea aumentar el nmero de vacas lecheras de su tambo en un perodo de dos aos. Para esto necesita conocer: a) cul es la probabilidad de tener al
64

Variables Aleatorias

menos una cra hembra por vaca en las dos pariciones considerando una produccin de 1 ternero por vaca por ao y que la proporcin de sexos es 1:1?. b) Cul es la probabilidad de que teniendo 20 vacas no nazca ninguna hembra? Ejercicio 2.9 Para cada una de las siguientes situaciones, explicar por qu ellas no son formas permisibles de asignar probabilidades a los 4 eventos posibles y mutuamente excluyentes A, B, C y D de un experimento aleatorio. Situacin A: P(A) = 0.12 P(B) = 0.63 P(C) = 0.45 P(D) = -0.20 Situacin B: P(A) = Ejercicio 2.10 Con el siguiente espacio muestral = {HM, HH, MH, MM}, construir: a) b) c) Dos eventos que no sean excluyentes ni independientes. Dos eventos mutuamente excluyentes. Dos eventos independientes.

9 120

P(B) =

45 120

P(C) =

27 120

P(D) =

46 120

Ejercicio 2.11 En un experimento para control de calidad de tractores, se le da arranque a las unidades en 4 oportunidades. En cada caso pueden arrancar (xito) o no (fracaso). a) b) c) d) Construir el espacio muestral. Asumiendo que todos los eventos elementales poseen la misma probabilidad, cul sera ese valor? Listar los posibles valores de la variable aleatoria X definida como el nmero total de arranques exitosos. Cul es la P(X = 3)?. Cul es la P(X 2)?.

Ejercicio 2.12 La funcin de densidad de la variable aleatoria definida como el nmero de rboles bien implantados, tiene la siguiente forma:

65

Variables Aleatorias

a)
0.40 0.35 0.30 0.25 0.20 0.15 0.10 0.05 0.00 0 1 2 3 4

Construir la funcin de distribucin acumulada correspondiente. Qu significa F(2)?. Calcular la media y la varianza poblacionales.

b) c)

f(x)

N m ero d e rb ole s b ie n im pla n ta d o s

Ejercicio 2.13 Se conoce que el cuantil 0.10 de la distribucin de la variable X = longitud de races de plntulas de tomate al momento del transplante es 3 cm, y se sabe que slo las plntulas con races mayores de 3 cm tienen probabilidad de sobrevivir al transplante: Cuntas plntulas se deberan adquirir para lograr un lote de 2000 plntulas implantadas? Ejercicio 2.14 Dibujar, a mano alzada, densidades de variables aleatorias continuas, que sean: a) b) c) d) Una simtrica y una asimtrica. Con alta densidad de valores concentrados en torno de la esperanza. Dos distribuciones, una con mayor varianza que la otra. Una distribucin con concentracin de valores en dos puntos.

66

3
3 Modelos Estadsticos: Distribucin Normal y Otras Distribuciones
Introduccin
El concepto de variable aleatoria est ntimamente ligado al de funcin de densidad y funcin de distribucin. Por lo general la forma o expresin matemtica de la funcin que describe a la variable aleatoria no se conoce, por lo que los tcnicos e investigadores suelen proceder a recolectar datos mediante estudios observacionales o experimentales, y a partir de ellos buscar cul es la funcin que mejor describe la o las variables aleatorias en estudio. No cualquier funcin matemtica es til para caracterizar una variable aleatoria, por el contrario, las funciones de densidad y de distribucin acumulada deben reunir una serie de propiedades para que sea posible asignar probabilidades a los eventos de inters a partir de las mismas. Desde el punto de vista terico se han estudiado con suficiente detalle un conjunto de funciones matemticas que verifican las propiedades de las funciones de distribucin acumulada y de las funciones de densidad tanto para variables discretas como para continuas. Luego, el tcnico o investigador que no conoce la funcin exacta que caracteriza a la variable aleatoria que est estudiando puede, por conocimiento emprico, proponer alguna de las funciones, del conjunto de funciones antes indicado, para describir el comportamiento de su variable. De la habilidad para escoger una distribucin adecuada, depende la calidad de los modelos y las predicciones que se construyan. Si la seleccin de la funcin se realiza a partir de la distribucin emprica de la variable (distribucin de los valores muestrales), cuanto mayor sea el conjunto de datos recolectados, se podr realizar una mejor identificacin de la funcin. Suele ocurrir que, aunque los datos hayan sido bien tomados, el conjunto seleccionado no sea bien descripto por alguna de las funciones conocidas por lo que las conclusiones del estudio siempre dependern del grado de aproximacin logrado. Un modelo se define como una representacin simplificada de la realidad. En el
67

Modelos Estadsticos: Distribucin Normal y Otras Distribuciones

estudio de una variable aleatoria se utiliza el trmino modelo para hacer referencia a la funcin de distribucin seleccionada aunque sta no sea la que caracteriza exactamente el comportamiento de la variable aleatoria. Al proceso de seleccin del modelo distribucional se lo conoce como modelacin. Sin embargo, el concepto de modelo tambin tiene un significado ms amplio tanto en la misma estadstica como en matemtica y otras ciencias. La modelacin es la base de la inferencia estadstica, es decir, el procedimiento inductivo mediante el cual, a partir de las observaciones realizadas, se describen las caractersticas de la distribucin bajo estudio. En general, varios modelos con diferentes niveles de complejidad pueden ser propuestos para el mismo problema y la adopcin de uno u otro depende no slo del grado de conocimiento que se tiene sobre la caracterstica que se est investigando sino tambin de los objetivos que se persiguen. La modelacin tambin es usada para estudiar cules son y qu magnitud relativa presentan las distintas fuentes de variacin de una variable aleatoria. Es decir, qu factor hace que la variable en estudio cambie o vare, lo cual es explicitado a travs de un modelo matemtico. En este Captulo estudiaremos la funcin de densidad normal o modelo de Gauss, que permite aproximar el comportamiento estadstico de muchas variables continuas e incluso de algunas variables discretas. La distribucin normal es un modelo de probabilidad y una vez adoptado el modelo es posible responder a las siguientes preguntas: -Cul es la probabilidad de que la variable en estudio tome valores menores a un valor determinado?. Por ejemplo, si la variable es el rendimiento de un cultivar, el responder a esta pregunta podra indicar la posibilidad de obtener rendimientos que no justifiquen el costo de produccin. -Cul es la probabilidad de que la variable en estudio tome valores mayores a un valor determinado?. Si la variable aleatoria en estudio es la cantidad de semillas de maleza en el suelo antes de la siembra, el responder a esta pregunta podra indicar si se necesitar o no aplicar herbicida (este podra ser el caso de modelacin de una variable aleatoria discreta como si se tratara de una continua). -Cul es la probabilidad de que la variable en estudio tome valores entre 2 valores determinados?. Se podran mencionar un gran nmero de ejemplos, tanto de la prctica como de la
68

Modelos Estadsticos: Distribucin Normal y Otras Distribuciones

investigacin agronmica en los que responder a esta pregunta podra ser de inters. Suponer una distribucin determinada para una variable aleatoria servir adems, como se ver ms adelante, para realizar pruebas que permitan rechazar o mantener hiptesis postuladas en el marco de la investigacin. La base para el establecimiento de esas conclusiones sern los modelos probabilsticos, en relacin a los cuales se especifican las cuestiones de inters. A continuacin se presenta y discute en detalle la distribucin normal. Posteriormente se presentan otras distribuciones para variables continuas y discretas.

Distribucin Normal
La Funcin de Densidad Normal
Esta funcin, tambin conocida como campana de Gauss, desempea un papel central en la teora y la prctica de la estadstica. Muchos fenmenos agronmicos, biolgicos, qumicos, fsicos, antropolgicos, etc., son estudiados a partir de datos distribuidos de manera normal. Variables continuas tales como peso, longitud, altura, temperatura, absorbancia ptica, resistencia a la traccin, etc. presentan grficas de distribuciones de frecuencias que se pueden aproximar muy bien por esta funcin de densidad. Definicin 3.1: Variable aleatoria normal
Una variable aleatoria X se define como normalmente distribuida si su funcin de densidad est dada por:

f ( x) =

e 2

1 x

donde: los parmetros y satisfacen - y >0 e = base de los logaritmos naturales (aprox: 2.7182818), = constante matemtica aproximada por 3.14159 y x (-, ).

La representacin grfica de la funcin de densidad normal es una curva simtrica que tiene forma de campana (Figura 3.1). La localizacin del centro de la campana est dado por el parmetro (la esperanza) y la mayor o menor amplitud de la campana viene dada por 2 (la varianza).
69

Modelos Estadsticos: Distribucin Normal y Otras Distribuciones Nota: Como la funcin es simtrica respecto de , sta divide a la grfica en partes iguales. Est definida para todo y para valores en la abscisa que tienden a infinito y menos infinito, se aproxima al eje horizontal sin tocarlo (curva asinttica). Como toda funcin de densidad, el rea comprendida entre el eje de las abscisas y la curva es igual a la unidad.

Si se fijan dos puntos cualesquiera, por ejemplo x1 y x2, sobre el eje que representa los valores de la variable (abscisas), la porcin del rea por debajo de la curva que queda comprendida entre esos dos puntos corresponde a la probabilidad de que la variable aleatoria se realice entre x1 y x2.

A x1 x2

Figura 3.1: En las abscisas, posibles valores que puede tomar la variable aleatoria X y en las ordenadas valores de la funcin de densidad normal; A representa la probabilidad asociada con valores de X comprendidos entre x1 y x2 Si se llama A a esta rea, se puede representar simblicamente lo expuesto anteriormente como: A = P (x1 X x2) Existen infinitas distribuciones normales. Cada una de ellas queda especificada por los parmetros y 2. Es por ello que cuando se quiere indicar que una variable X tiene distribucin normal caracterizada por (esperanza) y 2 (varianza) se escribe: X N (,2) La Figura 3.2 presenta dos densidades normales con distinta varianza.

70

Modelos Estadsticos: Distribucin Normal y Otras Distribuciones

f1(x) f2(x)

Figura 3.2: Dos densidades normales con igual media pero diferente varianza 2. Observar que 1 = 2 y 1 2 < 2 2 La mayor densidad se encuentra para valores x cercanos a y los puntos de inflexin estn en - y + . La Figura 3.3 presenta algunos ejemplos de densidades normales variando la esperanza.

Figura 3.3: Tres densidades normales con igual desviacin estndar pero diferentes medias Por las propiedades de las funciones de densidad de variables continuas, si se quiere conocer la probabilidad de que una variable distribuida normalmente se realice entre x1 y x2 (es decir, conocer la magnitud del rea A citada anteriormente) se deber integrar entre x1 y x2 la funcin de densidad normal, de la siguiente manera:
x2

P( x1 X x2 ) =

x1

1 e 2 2

1 x

dx

con y conocidas. Esta integral no tiene una expresin analtica y por lo tanto se debe resolver numricamente.

71

Modelos Estadsticos: Distribucin Normal y Otras Distribuciones

Estandarizacin
Para entender este concepto se plantea la siguiente situacin: supngase que la longitud de las alas de la mosca de los frutos tiene funcin de densidad normal y que la longitud de las alas de gallinas tambin. Esto no quiere decir que la funcin de densidad de la variable longitud de las alas de las moscas de los frutos sea igual a la de la longitud de las alas de gallinas ya que, obviamente, los parmetros de ambas funciones de densidad son distintos. Es de esperar que el promedio de longitudes de las alas de moscas sea menor al promedio de longitudes de alas de gallinas. Luego, a pesar de que muchas variables puedan presentar funciones de densidad aproximadamente normales, cada problema se asocia con una funcin de densidad normal diferente por lo que, en cada caso, si se desea conocer la probabilidad de que la variable tome ciertos valores, se debera integrar una funcin de densidad diferente (entindase una funcin normal con diferentes parmetros). Este trabajo se simplifica usando una transformacin que hace que variables aleatorias con funciones de densidad normal diferentes, se distribuyan de la misma manera bajo la transformacin, facilitando as los clculos de probabilidades con cualquier combinacin de parmetros y 2.

Definicin 3.2: Estandarizacin


Se llamar estandarizacin a la siguiente transformacin:

Z=

X
2

donde : Z: es la variable aleatoria obtenida de la transformacin X: la variable aleatoria original y 2 son respectivamente, la esperanza y la varianza de la distribucin de X.

Definicin 3.3: Funcin de densidad normal estndar


Se llamar funcin de densidad normal estndar y se simbolizar como N (0,1) a:
1

1 2Z f ( z) = e 2

72

Modelos Estadsticos: Distribucin Normal y Otras Distribuciones

Si X se distribuye normal con media y varianza 2, luego la variable Z (la estandarizacin de X ), se distribuye normal con media 0 y varianza 1, esto es: X ~ N(,2) ==> Z =

~ N (0,1)

Se ha reducido el problema de tener muchas distribuciones, a tener una sola. Pero para hallar la probabilidad de que X tome un valor entre dos valores determinados se deber an integrar la funcin de densidad N (0,1). Ejemplo 3.1 Si X ~ N (,2) con = 10 y 2 = 4 y se desea conocer la P [ 8 X 9 ] se procede de la siguiente manera: a) b) Se estandariza de modo que queda: z1 =

8-10 9-10 = -1 y z2 = = - 0.5 2 2

Luego: A = P [ 8 X 9 ] = P [ -1 Z -0.5 ] = B, ilustrado en la siguiente figura:

A
8 9 10 X


-1 - 0.5 0

Figura 3.4: La transformacin de estandarizacin

c)

Calcular B = P [ -1 Z -0.5 ] como se explica a continuacin.

Para hallar la solucin a este problema, es decir, para encontrar el valor del rea sombreada en el grfico anterior, deberamos resolver la siguiente integral:
z2

z1

1 z2 1 dz = e 2 2

z2

1 z1 z2 1 dz- e 2 2

1 z2 1 dz e 2 2

Afortunadamente, las integrales de la forma:

1 z2 1 e 2 dz 2

estn
73

Modelos Estadsticos: Distribucin Normal y Otras Distribuciones

calculadas, para un conjunto grande y usualmente suficiente de valores de z entre -3.5 y +3.5 que se pueden encontrar en la tabla de cuantiles de la Distribucin Normal Estndar (Apndice). En la actualidad, es muy simple generar estas tablas a partir de funciones estadsticas de las planillas de clculo.

Funcin de Distribucin Acumulada Normal


La funcin de distribucin acumulada de una variable aleatoria normal, evaluada en el punto x (F(x)), describe la probabilidad de que la variable tome valores menores o iguales a x. Esto es, en el caso normal: P ( - X x ) = F(x) Luego, utilizando propiedades de integrales, la P[ x1 X x2 ], puede ser resuelta como: F(x2) - F(x1), como se ilustra en la Figura 3.5.

F(x 2)

F(x1)
x X

x1

F(x2) - F(x1)

x1

x2

Figura 3.5: Representacin grfica de la P[x1 X x2 ] vista como diferencia entre F(x2) y F(x1).

Para conocer cunto vale F(x2) y F(x1), se procede de la siguiente manera: 1. Estandarizar el valor x1 y el valor x2, haciendo: z1 =

x1

z2 =

x2

2. Como se vio, P [ x1 X x2 ] = P [ z1 Z z2 ], y en trminos de la funcin de distribucin es equivalente a F(z2) - F(z1). Luego, usando la tabla correspondiente a la funcin de distribucin normal acumulada se hallan F(z1)
74

Modelos Estadsticos: Distribucin Normal y Otras Distribuciones

y F(z2) Resumiendo, P ( x1 X x2 ) = P ( z1 Z z2 ) = F ( z2 ) F ( z1 )
x2 2

Ya que P ( x1 X x2 ) =

x1

1 e 2

1 x 2

dz

con y conocidos, e y constantes. Si X ~ N (,2) z =


z2

~ N (0,1); con lo cual:

P(z1 Z z2 ) =
z2

z1

1 z2 1 dz e 2 2

1 z2 1 dz e 2 2

z1

1 z2 1 dz e 2 2

Lo que es igual a: F ( z2 ) F ( z1 ) Ejemplo 3.2 Sea X ~ N ( = 10, 2 = 4). Calcular P [ 8 X 9 ] 1) z1 =

8 10 9 10 = -1 y z2 = = - 0.5 2 2

2) P[ 8 X 9 ] = P [ -1 Z -0.5 ], en la Tabla Normal entrando por la columna que presenta los valores de z y buscando el valor -0.5, en la columna vecina se leer el valor correspondiente a F(z2) que para el ejemplo es F(-0.5) = 0.3085. De la misma manera se halla la F(z1); en este ejemplo F(-1) = 0.1587. Calculando F(-0.5) - F(-1) = 0.3085 - 0.1587 = 0.1498 Se concluye que para la variable aleatoria X que se distribuye normalmente con = 10 y 2 = 4, la probabilidad de que X se realice entre 8 y 9 es de 0.1498. Es decir que el rea por debajo la curva de la funcin de densidad normal, caracterizada por los mencionados parmetros, y que se extiende por encima del segmento delimitado por los valores 8 y 9, corresponde al 14.98 % del rea total bajo la curva.

75

Modelos Estadsticos: Distribucin Normal y Otras Distribuciones

Ejemplo 3.3 Supngase que la variable en estudio tiene distribucin normal, con = 5 y 2 = 4 y se quiere conocer la probabilidad de que la variable tome valores mayores a 7.78. Conociendo que P [ X 7.78 ] puede reescribirse como 1-P[ X 7.78 ], equivalente a 1 - F (7.78), entonces: 1) Se calcula el valor z para x = 7.78

z=

7.78 5 = 1.39 4

2) Se busca en la Tabla Normal la probabilidad para z = 1.40 (por aproximacin a 1.39), es decir F(1.40). Para z = 1.40 el valor de probabilidad presentado en la tabla es 0.9192. Luego, P( X > 7.78 )=P(Z > 1.4) = 1 - 0.9192 = 0.0808, cuya representacin grfica es:

0.0808

1.40

Figura 3.6: Representacin del rea bajo la curva normal por encima del valor 1.4 La variable Z puede ser vista como una desviacin de X en torno a la media medida en unidades de desviacin estndar. Es decir P [-1 < Z < 1] debe entenderse como la probabilidad de que X tome valores que se alejan de la media en menos o ms una desviacin estndar, es decir, P [ - 1 < X < + 1]. En una distribucin normal terica, esta probabilidad es igual a 0.6827, lo que equivale a decir que en la distribucin normal el 68.27% de las observaciones estn comprendidas entre la esperanza menos un desvo estndar y la esperanza ms un desvo estndar: [ 1 ] incluye al 68.27% de las observaciones De igual manera se deduce que: [ 2 ] incluye al 95.45% de las observaciones
76

Modelos Estadsticos: Distribucin Normal y Otras Distribuciones

[ 3 ] incluye al 99.74% de las observaciones Existen pruebas formales para verificar el supuesto de normalidad que se pueden aplicar a una distribucin emprica. Estas tcnicas no sern desarrolladas en el marco de esta obra.

Otras distribuciones

Funciones de densidad de variables aleatorias discretas


En la presentacin de cada funcin se seguir el siguiente estilo y secuencia: a) situaciones en las que se puede seleccionar la funcin como modelo, b) definicin de la funcin, c) propiedades, i.e. los parmetros que la caracterizan y d) ejemplos. Se presentar una secuencia en complejidad e integracin de conceptos crecientes, iniciando la misma, con funciones muy sencillas, pero necesarias para comprender las siguientes.

Distribucin Uniforme Discreta


Se denotar a los posibles valores que pueda tomar una variable aleatoria discreta como x1, x2, ..., xk. En aquellos casos en que la variable aleatoria en estudio puede tomar slo k valores con igual probabilidad cada uno de ellos, se dice que la variable aleatoria tiene distribucin uniforme discreta. Con ello se quiere decir que la funcin de densidad de la variable aleatoria considerada es uniforme (constante). Definicin 3.4: Distribucin Uniforme Discreta.
Una variable aleatoria X tiene distribucin Uniforme Discreta si y slo si su funcin de densidad es:

1 para x = x1 , x2 , ..., xk f ( x) = k 0 en caso contrario


donde xi xj para i j.

Las variables aleatorias uniformes discretas se indican con la siguiente notacin: X ~ Ud(x1,xk)
77

Modelos Estadsticos: Distribucin Normal y Otras Distribuciones

La esperanza E(X) y la varianza V(X) cuando X tiene distribucin uniforme discreta se calcula como:

= E ( X ) = ik=1 xi f ( xi ) = ik=1 xi

1 1 k 1 = i =1 xi = ( x1 + x2 + ... + xk ) k k k
1 1 k = i =1 ( xi ) 2 = k k

2 = V ( X ) = ik=1 ( xi ) 2 f ( xi ) = ik=1 ( xi ) 2
1 = (( x1 ) 2 + ( x2 ) 2 + ... + ( xk ) 2 ) k
Ejemplo 3.4

Esta distribucin aparece asociada a muchos juegos de azar, en los que los resultados tienen idntica chance de ocurrir. Este es el caso de la ruleta, la quiniela, etc. Esta distribucin se usa, en el contexto del diseo de experimentos, para la asignacin, con idntica probabilidad, de las unidades experimentales a los tratamientos que se quieren comparar. En el contexto del muestreo, para seleccionar, con idntica probabilidad, las unidades muestrales que conforman una muestra.

Distribucin Bernoulli
En ciertos experimentos suele ocurrir que existen slo dos resultados posibles: xito o fracaso, presencia o ausencia, s o no, etc. En estos casos, se puede asociar a cada uno de los resultados posibles el nmero 0 o el nmero 1, segn convenga. Por ejemplo, si el resultado de inters es el xito, se podra tomar x = 1 y si es fracaso hacer x = 0. Si el resultado de inters fuera el fracaso, luego se debera asignar al revs. Por otro lado, como el resultado del experimento es aleatorio, ser natural pensar que cada uno de los resultados posibles tendr cierta probabilidad de ocurrencia. En ciertas circunstancias ambos resultados pueden tener la misma probabilidad, pero obviamente no siempre es as. Si se llama a la probabilidad de uno de los dos resultados, luego la probabilidad del otro ser 1-.

78

Modelos Estadsticos: Distribucin Normal y Otras Distribuciones

Definicin 3.5: Distribucin Bernoulli


Una variable aleatoria X tiene distribucin Bernoulli si y slo si su funcin de densidad es:

x (1- )1-x si x = 0 ,1 f ( x; ) = 0 en caso contrario


donde 01.

Se denota a las variables Bernoulli con parmetro como X ~ Ber().


Nota: cuando se escribe f(x;) se denota que x es el argumento de la funcin y que lo que sigue a continuacin del punto y coma es una constante previamente especificada, necesaria para poder hacer clculos con la funcin. As, si = 0.3, luego x 1-x la funcin de densidad Bernoulli ser f(x ; 0.3)=0.3 (1-0.3) .

La E(X) y la V(X) cuando X tiene distribucin Bernoulli se calculan como:

= E ( X ) = x =0;1 x f ( x) = x =0;1 x ( x (1 )1 x ) = 0 ( 0 (1 )10 ) + 1( 1 (1 )11 ) =


= 1( 1 (1 )11 ) =

2 = V ( X ) = x =0;1 ( x ) 2 f ( x) = x =0;1 ( x ) 2 ( x (1 )1 x
Como = , reemplazando, sigue que:

= (0 ) 2 ( 0 (1 )10 + (1 ) 2 ( 1 (1 )11
Desarrollando los cuadrados y los exponentes, sigue:

= 2 (1 ) + (12 2 + 2 ) = 2 3 + 2 2 + 3 = 2 = (1 )
Nota: Obsrvese que caracteriza completamente a la funcin de densidad Bernoulli, es decir que tanto su esperanza como su varianza son expresiones que slo dependen de . En este sentido se dice que es el nico parmetro de esta funcin de distribucin discreta.

Ejemplo 3.5 Presencia o ausencia de enfermedades en una planta, clasificacin de semillas en anormales y normales, son ejemplos de variables aleatorias que se pueden modelar con una distribucin Bernoulli. Ensayos o experimentos en los que interesa el estudio de una o ms variables aleatorias Bernoulli, son llamados Ensayos o Experimentos Bernoulli.

79

Modelos Estadsticos: Distribucin Normal y Otras Distribuciones

Distribucin Binomial
Esta distribucin tiene origen cuando ocurren las siguientes tres condiciones en forma simultnea: a) b) c) Se realizan o repiten n ensayos Bernoulli. El parmetro se mantiene constante entre ensayos. Los ensayos son todos independientes entre s.

Estas condiciones experimentales son muy frecuentes, y en general el problema de inters radica en el nmero de xitos en n casos estudiados, o el nmero de respuestas no en n consultas, o el nmero de veces que ocurre un cierto fenmeno atmosfrico en n observaciones realizadas. Cuando se registra la ocurrencia de un fenmeno atmosfrico en n observaciones suele utilizarse la distribucin binomial para modelar el nmero total de ocurrencias. Sin embargo, en este caso es importante destacar que se debe verificar que las observaciones sean independientes y que la probabilidad de ocurrencia del fenmeno atmosfrico () se mantenga constante entre observaciones. En caso contrario el modelo binomial no ser apropiado. La falta de independencia entre observaciones en la agronoma es frecuente, y deber tenerse en cuenta al momento de realizar un ensayo. La clave para modelar fenmenos en los que la independencia no puede asegurarse, est en reconocerla y luego incorporar esta informacin en la modelacin. Si hay independencia entre las observaciones, entonces podemos seleccionar la distribucin binomial. Ms adelante se presentar una distribucin que puede ser usada en algunos casos donde no hay independencia. Para ilustrar el concepto de independencia veamos por ejemplo en qu casos se puede presentar la falta de independencia en ensayos de germinacin. Si se observa la germinacin de semillas aisladas la respuesta de cada una de ellas no depender de lo que ocurri en las otras. En este caso se registrarn n datos independientes. En cambio, si se realiza un ensayo de germinacin en el que las semillas se encuentra en grupos (cajas de Petri) puede ocurrir que la no germinacin de una semilla est asociada a la presencia de hongos. Estos mismos pueden haber contaminado a las semillas vecinas y por lo tanto la respuesta de stas no es independiente. Se da a continuacin una definicin formal de distribucin binomial.

80

Modelos Estadsticos: Distribucin Normal y Otras Distribuciones

Definicin 3.6: Distribucin Binomial.


Una variable aleatoria X tiene distribucin Binomial si y slo si su funcin de densidad es:

n x 1- x (1- ) si x = 0 ,1,..., n f ( x; n, ) = x 0 en caso contrario


donde 01.

Las variables binomiales con parmetros n y se denotan como: X~ Bin(n,)


Nota: De forma anloga que en la distribucin Bernoulli, f(x; n, ) se caracteriza por dos parmetros: n y . Adems,

()
n x

representa el nmero de combinaciones

posibles de armar en base a n elementos en grupos de x, siendo y n! = 12...n.

( ) = x !(nn-!x)!
n x

La E(X) cuando X tiene distribucin Binomial se puede obtener a partir del siguiente desarrollo: Como los posibles valores de x son 0, 1, 2, ..., n, es posible escribir la esperanza como sigue:

= E ( X ) = n=0 x f ( x) = n=0 x ( n ) x (1 ) n x = n=0 x x x x x

n! x (1 ) n x x !(n - x)!

Ntese que el primer valor de x es cero, y que si se reescribe x!=x (x-1)! se puede simplificar la expresin anterior y quedar as:

= n=1 x x

n! x (1 ) n x ( x 1)!( n - x)!

Luego, usando la misma tcnica para n!=n(n-1)! y observando que x = .x - 1, es posible sacar factor comn n, y reescribir la expresin anterior de la siguiente forma:
1 = n n=1 ( n1 ) x 1 (1 ) n x x x

Si se hace el siguiente cambio de notacin: y = x -1 y m = n -1, se tiene:

= n m=0 ( m ) y (1 ) m y = n y y
ya que, m=0 y

( )
m y

(1 ) m y = 1 debido a que es la suma sobre todos los valores

81

Modelos Estadsticos: Distribucin Normal y Otras Distribuciones

posibles de una funcin de probabilidad Bin(m,)=

( )
m y

(1 ) m y

Si se calcula la varianza V(X) y siguiendo las ideas presentadas para el clculo de la E(X), cuando X ~ Bin(n, ) se ver que:

2 = V ( X ) = n (1 )
Ejemplo 3.6 Supngase que se toman 10 semillas de Panicum maximum Jacq. y se registra el evento germin o no germin despus de 5 das desde su implantacin. En este experimento las semillas estn suficientemente aisladas como para asegurar respuestas independientes. Si la probabilidad de germinacin es (para todas las semillas) igual a 0.25 calculemos: a) b) c) d) e) Probabilidad que germinen 7 de las 10 semillas, Probabilidad que germinen al menos 3 de las 10 semillas, Probabilidad que germinen a lo sumo 5 semillas. La esperanza de esta variable aleatoria. La varianza.

Si X~ Bin(7; 10, 0.25), luego: a) P(X = 7) =


7

(10 ) 0.25 (1 0.25) 7


b) c) d) e)

(10 ) 7

0.257 (1-0.25)(10 -7) =


10 7

10! 0.0185 0.257 0.753 = = 0.0031 7!(10 - 7)! 6

P(X 3) = P(X = 3) + P(X = 4) + ... + P(X = 10) = = 1 - (P(X = 0) + P(X = 1) + P(X = 2)) = = 1 - (0.0563 + 0.1877 + 0.2816) = 0.4744 P(X 5) = P(X = 0) + P(X = 1) + ... + P(X = 5) = = 0.0563 + 0.1877 + 0.2816 + 0.2503 + 0.1460 + 0.0584 = 0.9803 E(X) = 10 (0.25) = 2.5 V(X) = 10 (0.25) (1 - 0.25) = 1.875

Distribucin Binomial Negativa


En conexin con la repeticin de ensayos Bernoulli, ciertos problemas de inters centran su atencin en el nmero de ensayos necesarios hasta que ocurren k xitos.
82

Modelos Estadsticos: Distribucin Normal y Otras Distribuciones

Esta distribucin tambin se la conoce como distribucin binomial para los tiempos de espera o distribucin Pascal. Prstese atencin a la siguiente secuencia: a) b) c) Sea la probabilidad de xito. Se llama A al evento el k-simo xito ocurre en el ensayo nmero x. Si el k-simo xito ocurre en el ensayo x-simo, luego ya ocurrieron k-1 xitos en los x-1 ensayos anteriores. As, la probabilidad del evento B:ocurren k -1 xitos en x -1 ensayos puede calcularse por la distribucin binomial Bin(k-1; x-1, ). Si la probabilidad es constante entre los ensayos y C es el evento xito en el ensayo nmero x, luego P(C)=. Entonces, P(A)=P(BC). Como los eventos B y C son independientes, se tiene: P(A)= P(BC)=P(B)*P(C)=

d) e)

( )
x 1 k 1

k -1

(1 - )x - k ) =

( )
x 1 k 1

(1 - )x - k )

Se da a continuacin una definicin formal de esta distribucin. Definicin 3.7: Distribucin Binomial Negativa (para k entero).
Una variable aleatoria X tiene distribucin Binomial Negativa si y slo si su funcin de densidad es:

x-1 k x-k si x = k ,k + 1,k + 2... (1- ) f ( x; k , ) = k-1 0 en caso contrario


donde 01.

A las variables binomiales negativas con parmetros k y se las denotar como X~ BinNeg(k,).
Nota: De forma anloga a las otras distribuciones, f(x;k,) queda determinada por k y . Por otro lado, los valores de x son valores mayores o iguales que k. Obviamente no puede ocurrir k xitos en un nmero X de ensayos menor que k.

Si se calcula la E(X), cuando X~BinNeg(k,) se ver que: = E ( X ) = Si se calcula la varianza V(X) tendremos que: 2 = V ( X ) =

k 1 1
83

Modelos Estadsticos: Distribucin Normal y Otras Distribuciones

Desde el punto de vista del clculo de probabilidades, en problemas especficos, no es necesario acudir a una tabla de probabilidades de binomial negativa, si se dispone de una tabla binomial. La relacin entre una y otra distribucin es la siguiente: BinNeg(x; k, ) =

k . Bin(k; x, ) x

Ejemplo 3.7 Un acopiador de granos recibe camiones cargados con maz. La carga puede venir con o sin semillas de chamico. La probabilidad de que el camin venga limpio es 0.90. Si el silo se llena con 20 camiones y se desea que sean solo con cargas limpias. a) b) c) Cul es la probabilidad de que los llene con los primeros 20 camiones?. Cul es la probabilidad de que los llene con los primeros 30 camiones? Cul es el nmero de camiones necesarios para llenar el silo con carga limpia con probabilidad 0.95.

a) Tomando x = 20, k = 20 y = 0.90, se tiene: BinNeg(20;20;0.9) =

k 20 . Bin(20; 20, 0.9)=0.1216 Bin(k; x,) = x 20

b) Tomando x = 30, k = 20 y = 0.90, se tiene: BinNeg(30;20;0.9) =

k 20 Bin(30; 20, 0.9)= 0.00024 . Bin(k; x, ) = x 30

c) Para contestar esta pregunta, se debe calcular la probabilidad de que los 20 camiones limpios se hayan conseguido con X camiones o menos. Obviamente X no puede ser menor que 20. Luego, cuando la probabilidad de que se hayan conseguido los 20 camiones limpios con X camiones o menos, alcance (o est cerca de) 0.95, se tendr la solucin. La siguiente tabla muestra para distintos nmeros totales de camiones (X), la probabilidad de que se alcancen 20 xitos en el X-simo (llamando A a este evento y P(A) a su probabilidad) y tambin la probabilidad de que estos xitos se alcancen en el X-simo camin o en alguno anterior (evento B).

84

Modelos Estadsticos: Distribucin Normal y Otras Distribuciones

Camiones 20 21 22 23 24 25 26 27 28 29 30

P(A) 0.1216 0.2432 0.2553 0.1872 0.1077 0.0517 0.0215 0.0080 0.0027 0.0008 0.0002

P(B) 0.1216 0.3647 0.6200 0.8073 0.9149 0.9666 0.9881 0.9961 0.9988 0.9997 0.9999

Teniendo en cuenta la informacin anterior, se puede concluir que con 25 camiones, es altamente probable (P=0.9666) que se complete el silo con carga limpia. Existen muchas aplicaciones de la distribucin binomial negativa cuando k=1. Por esto recibe el nombre especial de distribucin geomtrica, cuya definicin se da a continuacin.

Distribucin Geomtrica
Definicin 3.8: Distribucin Geomtrica.
Una variable aleatoria X tiene distribucin Geomtrica si y slo si su funcin de densidad es:

(1- ) x 1 si x = 1,2,3... f ( x, ) = 0 en caso contrario


donde 01.

Esta distribucin tiene especial aplicacin cuando el problema de inters es modelar la distribucin del nmero de ensayos necesarios para encontrar el primer xito. Ejemplo 3.8 El mismo acopiador del ejemplo anterior tiene problemas financieros, por eso decide vender a razn de un camin de grano por da. Sabiendo que la probabilidad diaria de que un productor reclame la venta de un
85

Modelos Estadsticos: Distribucin Normal y Otras Distribuciones

camin es de 0.2 y esa probabilidad se mantiene constante durante el prximo mes, cul es la probabilidad de vender un silo sin que le reclamen ninguna venta? Esta situacin implica que lo que pretende el acopiador es vender todo un silo (20 camiones) sin que durante ese perodo tenga que desembolsar un pago. Lo que este acopiador desea calcular es la probabilidad de que el primer reclamo ocurra en el da 21 o posteriormente. Esta probabilidad debera calcularse como P(X=21) + P(X=22)+....=1- (P(X=20) + P(X=19) +...+ P(X=1)) donde X~Geom(x,0.2). Luego, utilizando la definicin y las propiedades de las funciones de distribucin tenemos: 1-(P(X=20) + P(X=19) +...+ P(X=1)) = =1-[0.2(1-0.2)(20-1) + 0.2(1-0.2)(19-1) +...+ 0.2(1-0.2)(1-1)] = 0.0115 En consecuencia, es muy poco probable que el acopiador pueda vender un silo a razn de un camin diario sin que ningn productor le pida una venta durante ese perodo.

Distribucin Hipergeomtrica
Esta distribucin est ligada a situaciones de muestreo sin reposicin, es decir situaciones en que al azar se elige un elemento de una poblacin y as sucesivamente hasta completar la muestra, sin restituir los elementos extrados. Para inducir la frmula de esta distribucin, anloga a la binomial, considrese como poblacin a un conjunto de N elementos de los cuales k poseen uno de dos estados posibles (xito) y N-k que presentan el otro (fracaso). Al igual que en la binomial, el problema de inters es hallar la probabilidad de obtener X xitos, pero en este caso, cuando se seleccionan sin reposicin n elementos de un conjunto de N . Como se recordar, el concepto frecuencial de probabilidad est asociado al cociente:

nmero de casos favorables nmero de casos posibles


En este problema el nmero de casos totales viene dado por el nmero de combinaciones posibles que se puede obtener a partir de N elementos tomados de a grupos de n. Esto es: Nmero de casos totales =
86

( )
N n

Modelos Estadsticos: Distribucin Normal y Otras Distribuciones

El nmero de casos favorables vendr dado por el nmero de formas posibles de elegir x xitos y n-x fracasos del conjunto de N elementos en los que hay k xitos y N-k fracasos, por lo que este nmero ser el siguiente producto: Nmero de casos favorables = donde

( )( )
k x N k n x N k n x

( )
k x

indica el numero de formas posibles en las que se pueden escoger x

xitos de un conjunto de k xitos y anlogamente

( ) indica el nmero de formas


( ) formas de
N k n x

posibles en las que se pueden escoger n-x fracasos de un total de N-k fracasos. Luego para cada forma de elegir un conjunto de x xitos existen obtener n-x fracasos y de all el producto. Se da a continuacin una definicin formal de esta distribucin. Definicin 3.9: Distribucin Hipergeomtrica.
Una variable aleatoria X tiene distribucin Hipergeomtrica si y slo si su funcin de densidad es:

k N - k x n - x si x = 0 ,1,..., n; x k ; n - x N - k f ( x; n, N , k ) = N n 0 en caso contrario.


Nota: De forma anloga que en las otras distribuciones, esta funcin de densidad posee tres parmetros: n, N, k. Se denotar a las variables hipergeomtricas con parmetros n, N, k con la siguiente expresin: X~Hiper(n,N,k)

Si se calcula la E(X) cuando X tiene distribucin hipergeomtrica, se ver que:

E(X) =
Si se calcula la varianza V(X) se ver que:

nk N

2 = V (X ) =

n k ( N - k ) ( N - n) N 2 ( N -1)

87

Modelos Estadsticos: Distribucin Normal y Otras Distribuciones

Ejemplo 3.9 Cuando la semilla de maz viene contaminada con chamico, el precio de esta semilla es inferior. Para determinar el precio que debe pagar por un determinado lote, un Ingeniero Agrnomo decide examinar 20 de 500 bolsas de semillas de maz. Si el 10% de las bolsas (50) contienen semillas de chamico, Cul es la probabilidad de que ninguna de ellas est incluida en la muestra? Tomando x=0, n=20, N=500 y k=50 en la funcin hipergeomtrica, se tiene: Hiper(0;20,500,50)=

( 50 )( 450 ) 0 20 ( 500 ) 20

= 0.1164

Vale decir que de cada 100 veces que el ingeniero realiza esta prueba, que consiste en tomar una muestra de 20 bolsas de un total de 500 donde al menos 50 estn contaminadas, en el 88% de las veces (al menos) encontrar bolsas con chamico. En oportunidad de presentar la distribucin binomial haba quedado planteado el hecho de que cuando N es grande, el considerar si el muestreo es con o sin reposicin puede ser insignificante. Considrese el siguiente ejemplo: Ejemplo 3.10 Entre 120 cmaras de germinacin, 80 estn bien calibradas. Si se toma una muestra aleatoria de 5 cmaras, hallar la probabilidad de que solamente 2 de las 5 estn bien calibradas en base a: a) La distribucin hipergeomtrica Tomando x=2, n=5, N=120 y k=80, se tiene:

80 40 2 3 0.164 Hiper(2; 5, 120, 80) = 120 5


b) La distribucin binomial. Tomando x=2, n=5, =

80 2 = en la frmula de la binomial: 120 3

88

Modelos Estadsticos: Distribucin Normal y Otras Distribuciones

Bin(2;5,2/3) = 5 (2/3)2 (1-2/3)3 0.165

(2)

Distribucin Poisson
La distribucin de Poisson da un modelo para variables de tipo conteo, donde los conteos se refieren al registro del nmero de un evento de inters en una unidad de tiempo o espacio dados (horas, minutos, m2, m3, etc.). Ejemplos de variables que se pueden modelar como Poisson son: a) Nmero de huevos de un insecto en una oviposicin. b) Nmero de bacterias en una muestra de agua. c) Nmero de semillas defectuosas observadas en una cinta transportadora por minuto. d) Nmero de nemtodos por unidad de volumen del suelo. e) Nmero de pulgones por planta. f) Nmero de pulgones por m2 . Se da ahora la siguiente definicin formal para esta distribucin. Definicin 3.10: Distribucin Poisson.
Una variable aleatoria X tiene distribucin Poisson si y slo si su funcin de densidad es:

x e- si x = 0,1, 2,... f ( x, ) = x ! 0 en caso contrario


Nota: Se indica que X tiene distribucin de Poisson con parmetro , con la siguiente notacin: X~Poisson().

Si se calcula la E(X) y la V(X), cuando X~ Poisson(), se obtiene: =E(X) = 2= V(X) = En esta distribucin la varianza es igual a la esperanza y por lo tanto la variabilidad de los conteos aumenta con el nivel medio de los mismos. Este es un caso tpico de asociacin entre esperanza y varianza.

89

Modelos Estadsticos: Distribucin Normal y Otras Distribuciones

Ejemplo 3.11 Si el nmero promedio de picaduras de gorgojo por semilla es 0.2 (es decir, por ejemplo que, en promedio, cada 100 semillas se cuentan 20 picaduras), cuntas de 100 semillas no tendrn picaduras?, cuntas 1 picadura? y cuntas 2 o ms? Para responder a este problema se calcula la probabilidad de que una semilla tomada al azar tenga una picadura o ninguna picadura, suponiendo distribucin Poisson para esta variable. Luego: P(X=0)= P(X=1)=

0.20 e 0.2 = 0.819 0! 0.21 e 0.2 = 0.164 1!

y P(X>1)= 1-[P(X=0)+P(X=1)]=1-0.982= 0.018 En consecuencia, si la probabilidad de que una semilla tomada al azar no tenga picaduras es 0.819, deberamos esperar que, en un grupo de 100, aproximadamente 82 no estn picadas, y si la probabilidad de que tengan solo una picadura es de 0.164, entonces solo 16 semillas cumplirn esta condicin y finalmente, aproximadamente 2 de cada 100 semillas tendrn 2 o ms picaduras.
Nota: Existe una relacin entre la distribucin de Poisson y la Binomial que permite aproximar las probabilidades de variables binomiales cuando n es grande y pequeo. En estos casos se puede tomar = n y calcular las probabilidades de xito bajo esta distribucin.

Distribucin Multinomial
Esta distribucin puede ser vista como una generalizacin de la distribucin binomial, donde el inters es calcular la probabilidad de obtener n1, n2, ..., nk en k categoras en una muestra de tamao N=n1+n2+...+nk conociendo que la probabilidad de ocurrencia de cada categora en la poblacin 1, 2,...., k. Se dice entonces que una variable tiene distribucin multinomial y se denota como Multi(N,1, 2,...., k-1), cuando su funcin de densidad est dada por:

90

Modelos Estadsticos: Distribucin Normal y Otras Distribuciones

Definicin 3.11: Distribucin Multinomial.


Si X1, X2,..., Xk representan las ocurrencias de las K categoras en la poblacin entonces decimos que (X1, X2,..., Xk ) tiene distribucin Multinomial si su densidad es la siguiente:

N! x x x 11 22 ... kk f ( x1 , x2 ,..., xk ;1 , 2 ,..., k ) = x1 !.x2 !....xk ! 0 en caso contrario


donde N=x1+x2+...+xk ; xi[0,1,..N]; 0i1, i=1,...,k; 1+2+...+k=1.

Ejemplo 3.12 En un cultivo el ataque de una enfermedad puede ser calificado como severo, moderado o sin ataque. Supngase que la probabilidad de ataque severo es de 0.05 y de moderado de 0.20. Cul es la probabilidad de encontrar sobre un total de 10 plantas observadas, 2 con ataque severo, 2 con ataque moderado y 6 sanas? Solucin: P(X1=2, X2=2, X3=6) =

10! 0.05 2 0.20 2 0.75 6 = 0.0224 2!2!6!

Funciones de densidad de variables aleatorias continuas


A continuacin se presentan algunas funciones de distribucin continuas que aparecen frecuentemente en las aplicaciones prcticas.

Distribucin Uniforme
As como en la seccin anterior se defini la distribucin uniforme para variables aleatorias discretas, ahora se presenta una distribucin anloga para el caso continuo. Su definicin es la siguiente: Definicin 3.12: Distribucin Uniforme
Una variable aleatoria X tiene distribucin Uniforme si y slo si su funcin de densidad es:

1 si < x < f(x) = 0 en caso contrario

91

Modelos Estadsticos: Distribucin Normal y Otras Distribuciones Nota: Cuando una variable aleatoria tiene distribucin uniforme con parmetros y , se indica como X~U(,).

La E(X) y la V(X) cuando X tiene densidad uniforme son: E(X) = ( + ) / 2 V(X) = ( - )2 / 12 Una de las principales aplicaciones de esta distribucin es en estudios de simulacin Montecarlo, ya que a partir de esta funcin es posible generar nmeros pseudoaleatorios de otras distribuciones. En todos los lenguajes de programacin o incluso en las planillas de clculo existen declaraciones (a modo de funciones o procedimientos) para generar nmeros con distribucin uniforme. Los nmeros generados por computadoras se dicen que son pseudoaleatorios, y no aleatorios, ya que el mecanismo que los genera es determinstico. Ocurre que el algoritmo que se elige para generar un nmero uniforme simula o aparenta ofrecer nmeros tomados al azar. Mientras mejor simule la produccin de nmeros aleatorios tanto mejor el algoritmo. En la mayora de las nuevas revisiones de los lenguajes de programacin se ofrecen buenos generadores de nmeros uniformes pseudoaleatorios.

Distribucin Gamma
La funcin de distribucin Gamma es importante en estadstica ya que hay otras distribuciones de uso frecuente (exponencial y chi-cuadrado) que son casos particulares de ella, y que juegan un rol fundamental en variados campos de las aplicaciones y la teora estadstica. Asimismo, en el campo de las Ciencias Agropecuarias, esta distribucin cobra importancia en la modelacin de algunos fenmenos meteorolgicos como las precipitaciones. A continuacin se da una definicin de esta distribucin. Definicin 3.13: Distribucin Gamma.
Una variable aleatoria X tiene distribucin Gamma si y solo si su funcin de densidad es:

f(x) =

x a -1 e- x / b si 0 x f ( x) = ( ) 0 en caso contrario

con >0, >0 y

donde: () =

y
0

1 y

e dy

es conocida en matemticas como funcin gamma.

92

Modelos Estadsticos: Distribucin Normal y Otras Distribuciones Nota: Se indica que una variable aleatoria X tiene una distribucin Gamma X~G(,). con:

La funcin de densidad de una distribucin gamma es una funcin asimtrica, que tiende a la simetra para ciertos valores de sus dos parmetros. A modo de ejemplo se presenta en la siguiente grfica formas diferentes de la densidad Gamma.
1 .2 5 1 .0 0 0 .7 5 0 .5 0 0 .2 5 0 .0 0

= 1 /2 , = 1 = 2 , = 1 /2

=11,

Figura 3.7: Forma de la densidad Gamma, para distintos valores de sus parmetros El mximo (si existe) en esta funcin de densidad viene dado por x = ( 1) Por ltimo, es posible mostrar que: E(X) = ; V(X) = 2

Distribucin Exponencial
Esta densidad es un caso especial de la funcin de densidad G(,), tomando =1 y =, quedando as definida: Definicin 3.14: Distribucin Exponencial.
Una variable aleatoria X tiene distribucin Exponencial si y slo si su funcin de densidad es:

e x / si 0 x f(x) = 0 en caso contrario


donde > 0. Nota: En la prctica denotaremos que una variable aleatoria tiene distribucin exponencial con parmetro con la siguiente notacin: X ~ Exp().

Es posible mostrar que: E(X) = ; V(X) = 2 La distribucin exponencial tambin es conocida como la distribucin de los tiempos de espera y es utilizada para calcular la probabilidad de que un instrumento
93

Modelos Estadsticos: Distribucin Normal y Otras Distribuciones

electrnico falle, pasado un cierto tiempo, o el tiempo necesario para que ocurra un accidente de transito en una ruta con probabilidad 0.90, etc.

Distribucin Chi-Cuadrado
La distribucin chi-cuadrado aparece con mucha frecuencia en la estadstica aplicada ya que los llamados test del cociente de mxima verosimilitud que se utilizan en la prueba de hiptesis estadsticas tienen todos distribucin asinttica chi-cuadrado. Cuando se construye un testcon las tcnicas de la mxima verosimilitud, se usa esta distribucin, al menos para muestras grandes. A modo de ejemplo, las tcnicas de bondad de ajuste que se usan en gentica para establecer si una frecuencia fenotpica se ajusta a un modelo de herencia mendeliana, utilizan un estadstico cuya distribucin (asinttica) es chi-cuadrado y de all su nombre (test de chi-cuadrado). Esta distribucin tambin aparece relacionada a la distribucin de la varianza muestral, que estudiaremos ms adelante. Por ahora slo daremos su definicin formal. Definicin 3.15: Distribucin Chi-Cuadrado
Una variable aleatoria X tiene distribucin Chi-Cuadrado si y slo si su funcin de densidad es:

x ( 2) / 2 e x / 2 si 0 x f ( x) = 2 / 2 ( / 2) 0 en caso contrario
donde es un entero positivo conocido como grados de libertad de la distribucin. Nota: Se denotar a las variables chi-cuadrado con grados de libertad como: X~ ,
2

siendo el nico parmetro de esta distribucin.

Es posible mostrar que: E(X) = ; V(X) = 2 Obsrvese que la esperanza es igual a los grados de libertad de la distribucin y que la varianza es tambin una funcin lineal de este parmetro. Una forma alternativa de definir variables aleatorias chi-cuadrado es a partir de variables aleatorias normales estndar, como de muestra a continuacin:

94

Modelos Estadsticos: Distribucin Normal y Otras Distribuciones

Sean X1, X2,....,X variables aleatorias normales independientes con esperanza = 0 y varianza 2 = 1. Luego si

Y = i =1 X2 , i

Entonces Y tiene distribucin 2 con grados de libertad.

Esta distribucin esta involucrada en la definicin de la distribuciones T de Student y F que se presentarn en el Captulo 4.

Ejercicios
Ejercicio 3.1: Uso de la tabla de cuantiles de la Distribucin Normal Estndar Esta tabla presenta 2 columnas: La primera columna se refiere a la distancia desde un valor a la media medida en nmero de desviaciones tpicas (valores de la variable Z). Por ejemplo el valor 1 en esta columna indica una desviacin estndar por encima de la media y -1.7 corresponde a 1.7 desviaciones estndar por debajo de la media. La segunda columna contiene el rea bajo la curva normal entre - y el valor correspondiente a la primer columna, es decir el valor de la funcin de distribucin normal estndar acumulada. Por ejemplo para el valor 1 de z, el rea asociada es 0.8413. As se puede concluir que la probabilidad de que una variable distribuida normalmente con = 0 y 2 = 1 tome valores iguales o menores que 1, es igual a 0.8413 (1 es por lo tanto el cuantil 0.8413 de la distribucin normal estndar), lo que se ilustra en la siguiente figura:

0.8413

95

Modelos Estadsticos: Distribucin Normal y Otras Distribuciones

Usando la tabla de cuantiles de la Distribucin Normal Estndar obtener las siguientes probabilidades: a) P (Z 1.3) d) P (-1 Z 1) Ejercicio 3.2 Por medio de un tamiz de malla de 8 mm de dimetro se zarandean 8000 granos de maz. El dimetro del grano de maz sigue una distribucin normal con esperanza igual a 9 mm y una desviacin estndar de 1.2 mm. a) b) c) Qu proporcin de granos sern retenidos por el tamiz?. Qu proporcin de granos no retenidos, sern retenidos por un tamiz de dimetro de malla igual a 7.5 mm?. Qu proporcin de granos pasar a travs de los dos tamices?. b) P (Z 4) e) P (0.5 Z 1) c) P (Z 1.3) f) P (Z = 1)

Ejercicio 3.3 Si X es una variable aleatoria distribuida normalmente con = 10 y 2 = 4. a) b) Cul es la probabilidad de que X tome valores menores que 9?. Cul es la probabilidad de que X tome valores entre 9 y 11?.

Ejercicio 3.4 La variable altura de plntulas para una poblacin dada se distribuye normalmente con media = 170 mm y = 5 mm. Encontrar la probabilidad de los siguientes eventos: a) b) Plantas con alturas de al menos 160 mm. Plantas con alturas entre 165 y 175 mm.

Ejercicio 3.5 Si la variable espesor de un sedimento en un sustrato de suelo, se distribuye normalmente con media = 15 micrones y desviacin estndar = 3 micrones. a) b) Cul es el cuantil 0.75 de la distribucin de la variable?. Cmo se interpreta este valor?.

96

Modelos Estadsticos: Distribucin Normal y Otras Distribuciones

Ejercicio 3.6 La altura de plantas de soja de la variedad Hood se distribuye aproximadamente normal con media 55 cm y desviacin estndar de 5.8 cm. Por otro lado, la altura de plantas de yuyo colorado (Amaranthus sp.) invasora de este cultivo, tambin se distribuye en forma normal con media 62 cm y desviacin estndar de 3 cm. Si se decide aplicar un herbicida usando un equipo a sogas: a) b) A qu altura debe disponerse la soga para eliminar el 90% de la maleza en este cultivo?. Suponiendo que el herbicida no es selectivo, es decir mata por igual a toda planta que toma contacto con la soga, qu porcentaje de plantas de soja se perder a la altura de soga encontrada en el punto anterior?.

Ejercicio 3.7 El caudal de un canal de riego medido en m3/seg es una variable aleatoria con distribucin aproximadamente normal con media 3 m3/seg. y desviacin estndar 0.8 m3/seg. A partir de estas referencias calcular la probabilidad de los siguientes eventos: a) b) Evento A: que el caudal en un instante dado sea a lo sumo de 2.4 m3/seg. Evento B: que el caudal en un instante dado est entre 2.8 y 3.4 m3/seg.

Ejercicio 3.8 Una empresa exportadora de manzanas necesita encargar 10000 cajones para el embalaje de la fruta. Sin embargo, no todos los cajones son iguales ya que sus especificaciones dependen de la calidad del producto envasado. As, de acuerdo al dimetro de la manzana se identifican 3 categoras de calidad. Categora I: manzanas cuyo dimetro es menor de 5 cm Categora II: manzanas cuyo dimetro est comprendido entre 5 y 7 cm Categora III: manzanas cuyo dimetro es mayor que 7 cm Las frutas de mayor calidad son las correspondientes a la categora II por su tamao y homogeneidad. Si la distribucin del dimetro de las manzanas puede modelarse bien mediante una distribucin normal con media = 6.3 y varianza 2 = 2, responder: Cuntos cajones se necesitarn para cada categora de manzanas?

97

Modelos Estadsticos: Distribucin Normal y Otras Distribuciones

Ejercicio 3.9 Siguiendo con el ejercicio anterior y conociendo el comportamiento cclico de la demanda de cada categora de manzanas, se sabe que en la presente campaa va a tener ms demanda la manzana de la categora II (manzanas con dimetro entre 5 y 7 cm), con lo cual las ganancias para el exportador se maximizaran en caso de aumentar el volumen de la cosecha para esta categora. Una forma de regular el tamao final de esta fruta es mediante la eliminacin temprana de los frutos en formacin (raleo). Si se eliminan muchos frutos el tamao final de las manzanas ser mayor que si se eliminan pocos o ninguno. La experiencia ha permitido establecer las caractersticas distribucionales del dimetro final de las manzanas bajo dos estrategias de manejo: A: no eliminar ningn fruto B: eliminar 1 de cada 3 manzanas La estrategia A produce frutos con dimetros distribuidos N (6.3, 2.0) y la estrategia B produce frutos con dimetros distribuidos N (6.8, 0.9). Cul de las dos estrategias produce mayor proporcin de frutos de Categora II? Ejercicio 3.10 El espesor de la cscara del huevo determina la probabilidad de ruptura desde que la gallina lo pone hasta que llega al consumidor. El espesor, medido en centsimas de milmetro, se distribuye normal y se sabe que: a) b) c) se rompen el 50 % de los huevos con espesor de cscara menor a 10 centsimas de mm (cmm). se rompen el 10 % de los huevos cuyo espesor de cscara est comprendido entre 10 y 30 cmm. no se rompen los huevos con espesor de cscara mayor de 30 cmm.

Si en un establecimiento avcola la media del espesor de cscara es de 20 cmm y la desviacin estndar de 4 cmm: Cuntos, de los 5000 huevos que se producen diariamente, llegan sanos al consumidor? Ejercicio 3.11 El da de floracin de una hortaliza (en escala juliana:1-365 das) se puede modelar
98

Modelos Estadsticos: Distribucin Normal y Otras Distribuciones

con una distribucin normal centrada en el 18 de agosto (da 230) y con desviacin estndar de 10 das. Si desde la fecha de la floracin hasta la cosecha hay un lapso de 25 das: a) b) c) Qu proporcin de la cosecha se habr realizado para el 16 de septiembre (da 259)?. Si se considera primicia a los frutos obtenidos antes del 1 de septiembre (da 244): qu proporcin de la cosecha se espera que sea primicia?. Si la ganancia es de 2 pesos por cajn y se espera una produccin total de 1500 cajones, cul es la ganancia esperada con los cajones primicia, son un 30% ms caros?. La aplicacin de un regulador del crecimiento permite adelantar 3 das la fecha de floracin y reduce la desviacin estndar de 10 a 6 das. Si la ganancia por cajn se reduce en 5 centavos debido al costo del regulador: produce su aplicacin un aumento del porcentaje de frutos primicia?

d)

Ejercicio 3.12 Un fitomejorador desea controlar la variabilidad de los brotes comerciales de esprrago, ya que las normas de embalaje establecen una longitud mxima de cajas de 23.5 cm. Suponiendo que la longitud de los brotes de este cultivo se distribuye normalmente, con una esperanza igual a 21 cm. Cul debera ser el valor de la desviacin estndar del carcter longitud del brote, para que la probabilidad de que existan esprragos que no puedan ser embalados, no sea mayor a 0.05?. Ejercicio 3.13 Un Ingeniero Agrnomo del Servicio de Alerta contra Fitftora de una regin viatera afirma que 2 de cada 10 lotes afectados por la enfermedad se deben al mal manejo de los mismos. Cul es la probabilidad que: a) b) de 100 lotes, a lo sumo 10, sean afectados por la enfermedad, por problemas de mal manejo? de 100 lotes, ninguno presente la enfermedad por problemas de mal manejo?

99

Modelos Estadsticos: Distribucin Normal y Otras Distribuciones

Ejercicio 3.14 Un Ingeniero especialista en control de calidad de semillas de trigo, afirma que la empresa para la cual trabaja, produce un 95% de las bolsas de semilla de trigo con una pureza del 99%. Si fuera cierta su afirmacin, cul sera la probabilidad que: a) b) de 20 bolsas tomadas al azar, todas satisfagan que no poseen ms del 1% de cuerpos extraos? de 20 bolsas tomadas al azar, a menos 2 posean ms del 1% de cuerpos extraos.

Ejercicio 3.15 Si la probabilidad de que un productor adopte una tcnica, divulgada por un Instituto de Investigacin Agropecuaria, es de 0.75, hallar la probabilidad que: a) b) el dcimo productor en tener acceso a la documentacin de divulgacin sea el primero en adoptarla. el dcimo productor en tener acceso a la documentacin de divulgacin sea el quinto en adoptarla.

Ejercicio 3.16 Se quiere encontrar plantas de trigo con propiedades resistentes a los pulgones. Un sntoma de resistencia es la ausencia de pulgones en la planta. Se calcula que la frecuencia de plantas sin pulgones en un cultivo es de alrededor de 1/200 pero solo 1 de cada 10 de estas plantas presentan genes de resistencia. cuntas plantas de trigo debern revisarse para tener una probabilidad de al menos 0.95 de encontrar una con los genes de resistencia? Ejercicio 3.17 Un tcnico en semillas desea inspeccionar el funcionamiento de 20 cmaras de cra. Para esto toma dos cmaras al azar y registra la temperatura de las mismas. Si estas dos cmaras funcionan correctamente, el grupo de 20 ser aceptado. Cules son las probabilidades que tal grupo de 20 cmaras sea aceptado si contiene: a) 4 cmaras con registros de temperaturas no adecuadas; b) 8 cmaras con registros de temperatura no adecuadas; c) 12 cmaras con registros de temperaturas no adecuadas.

100

Modelos Estadsticos: Distribucin Normal y Otras Distribuciones

Ejercicio 3.18 En una red de computadores asociados a estaciones agroclimatolgicas y dedicadas a transmitir la informacin registrada a un computador central (servidor) va telefnica, el 1.4% de los llamados desde los computadores al servidor dan ocupado. Determinar las probabilidades de que de 150 intentos de comunicaciones (llamados) slo en 2 casos de ocupado el servidor. Ejercicio 3.19 En un experimento, el error cometido en determinar la densidad de una substancia es una variable aleatoria con distribucin uniforme, con = -0.015 y = 0.015. Hallar las probabilidades que: a) El error est entre 0.01 y 0.02; b) El error exceda 0.005. Ejercicio 3.20 Un Investigador ha establecido como hiptesis de trabajo, en base a experiencias previas bajo condiciones controladas, que la produccin de oxgeno durante la fotosntesis de la alfalfa sigue una distribucin Gamma(3,2).Cul ser la produccin promedio y la varianza con estos parmetros?

101

4
4 Distribucin de Estadsticos Muestrales
Introduccin
El objetivo del muestreo es inferir propiedades de una poblacin a partir de una fraccin de ella, conocida como muestra. Desde el punto de vista estadstico, lo que se pretende conocer son los parmetros de la distribucin de la variable de inters. El muestreo tiene por objeto proveer informacin esa distribucin. Luego, los estadsticos muestrales sirven como aproximacin (estimacin) de los parmetros que caracterizan a la distribucin. Por otra parte, los estadsticos son variables aleatorias y como tales, tienen una distribucin asociada. Los objetivos de este captulo son: comprender la naturaleza aleatoria de los estadsticos muestrales, estudiar las propiedades estadsticas de la media y varianza muestrales y adquirir destrezas en el clculo de probabilidades asociadas a estos estadsticos.

Distribucin del estadstico media muestral


Dado que la media muestral es una variable aleatoria (note que su valor vara de muestra a nuestra), nos interesa conocer su distribucin. Cuando se estudian las distribuciones de los estadsticos muestrales se hace desde un punto de vista terico, suponiendo poblaciones de tamao infinito. Si se quieren observar estas propiedades partiendo de poblaciones finitas, a travs de simulacin, se recurre a la tcnica de 3 muestreo con reposicin porque de esa forma se emula una poblacin de tamao infinito. Ejemplo 4.1 Considrese por ejemplo la distribucin de una variable aleatoria definida sobre un espacio muestral y la distribucin de la media muestral obtenida por muestreo
3 Se entiende por muestreo aleatorio con reposicin a aquel donde las unidades seleccionadas pueden

repetirse dentro de la muestra y entre muestras.

103

Distribucin de los Estadsticos Muestrales

aleatorio simple con reposicin para muestras de tamao 2. Para ello suponga una poblacin (finita) de cuatro plantas de zapallos (N = 4) donde la caracterstica de inters es el nmero de zapallos por planta. Luego si se toma una planta al azar y se observa el nmero de frutos, se puede homologar el resultado de este experimento a una variable aleatoria discreta (X). Los valores de la variable X en la poblacin y su funcin de densidad se presentan en la Tabla 4.1; mientras que la Figura 4.1 representa grficamente la funcin de densidad. Tabla 4.1: Funcin de densidad del nmero de frutos en una poblacin de 4 plantas de zapallo Planta P1 P2 P3 P4
0.50

X = No de Frutos 3 2 1 4

f(xi) 1/4 1/4 1/4 1/4

f(x)

0.25

0.00 1 2 3 4

Nmero de frutos

Figura 4.1: Funcin de densidad de X = nmero de frutos


Nota: Este tipo de funcin con idntica densidad para todos los valores de x, se conoce como densidad uniforme.

De acuerdo a las definiciones de esperanza y varianza para variables discretas, dadas


104

Distribucin de los Estadsticos Muestrales

en el Captulo 2, se tendr: =

x f (x )
i i i

1 1 1 1+2+3+4 1 =14 +24 +34 +44 = = 2.5 4 2 =

(
i

xi

) f (x )
2 i

21 21 21 21 2 = (1-2.5) 4 + (2-2.5) 4 + (3-2.5) 4 + (4-2.5) 4 = 1.25

Tomando muestras de dos plantas con reposicin, hay N muestras posibles para 2 extraer, esto es 4 =16 muestras. Este es un espacio muestral finito que tiene 16 resultados posibles, todos con igual probabilidad. Si a cada resultado posible del muestreo se le asocia un valor correspondiente al promedio del nmero de frutos de las plantas obtenidas en la muestra, se obtiene una variable aleatoria llamada media muestral basada en muestras de tamao n = 2. La tabla 4.2 presenta todos los posibles resultados del proceso y el valor de la variable aleatoria media muestral, basada en muestras de tamao n = 2. Si bien todos los resultados posibles tienen igual probabilidad, en trminos de la variable aleatoria media muestral, varios de estos producen el mismo resultado. Por lo tanto un valor de media muestral rene varios resultados elementales en un nico evento. Por ejemplo X = 3, corresponde al evento A={P1P1, P2P4 ,P4P2}, luego aplicando los 1 axiomas de probabilidad: P( X = 3) = P(A) = P(P1P1) + P(P2P4) + P(P4P2) = 3 16

105

Distribucin de los Estadsticos Muestrales

Tabla 4.2: Espacio muestral generado por muestreo aleatorio con muestras de tamao n = 2 con reposicin, de una poblacin de cuatro plantas de zapallo presentada en Tabla 4.1
Muestra 1 2 3 4 5 6 7 8 Plantas P1P1 P1P2 P1P3 P1P4 P2 P1 P2 P2 P2 P3 P2 P4 Nro.de frutos 3; 3 3; 2 3; 1 3; 4 2; 3 2; 2 2; 1 2; 4 Media muestral 3.0 2.5 2.0 3.5 2.5 2.0 1.5 3.0 Muestra 9 10 11 12 13 14 15 16 Plantas P3P1 P3P2 P3P3 P3P4 P4P1 P4P2 P4P3 P4P4 Nro.de frutos 1; 3 1; 2 1; 1 1; 4 4; 3 4; 2 4; 1 4; 4 Media muestral 2.0 1.5 1.0 2.5 3.5 3.0 2.5 4.0

Considrese ahora la tabla de frecuencias para la variable media muestral (Tabla 4.3). Obsrvese que la densidad no es uniforme (Figura 4.2) y que el valor ms probable es 2.5, el cual corresponde a la esperanza de la distribucin original de la variable nmero de frutos.

Tabla 4.3: Valores que asume la variable aleatoria media muestral del nmero de frutosen muestras de tamao n=2 y sus densidades Media Muestral 1 1.5 2 2.5 3 3.5 4 1. 2. 3. 4. 3. 2. 1.
1 16 1

P( X = x ) = 0.0625 = 0.125 = 0.1875 = 0.25 = 0.1875 = 0.125 = 0.0625

16 1 16 1

16 1 16 1 16 1 16

106

Distribucin de los Estadsticos Muestrales

Graficando la funcin de densidad de la media muestral para este ejemplo:


0.25

0.20

f(x)

0.15

0.10

0.05 1.0 1.5 2.0 2.5 3.0 3.5 4.0

Me dias m ues trales

Figura 4.2: Funcin de densidad de la variable aleatoria media muestral del nmero de frutos obtenida por muestreo con reposicin de tamao n = 2 de una poblacin de cuatro plantas de zapallo, presentada en tabla 4.1 Obsrvese que la esperanza de la distribucin de las medias muestrales del ejemplo es igual a la esperanza de la distribucin de la variable aleatoria original (nmero de frutos)

X = 2.5 =

Adems la varianza de la distribucin de las medias muestrales es igual a la varianza de la distribucin de la variable estudiada, dividida por el tamao muestral usado (en este caso n = 2).

2 = X

2 = 1.25 n 2

= 0.625

Se usar la notacin X y 2 para representar a la esperanza y a la varianza de X , X respectivamente. Definicin 4.1: Error Estndar
La desviacin estndar de las medias de muestras de tamao n, recibe el nombre de Error Estndar y es definida como:

EE = 2 = 2 n X

107

Distribucin de los Estadsticos Muestrales

Como se podr observar, la varianza (y por ende el error estndar) de la variable media muestral depende del tamao de la muestra sobre la cual se calcula la media. Cmo se pueden justificar los resultados anteriores? En el ejemplo anterior, con una muestra de tamao 2, se tienen dos variables aleatorias que se pueden designar con X1 (nmero de frutos de la primer planta de la muestra) y X2 (correspondiente de la segunda planta). Asumiendo que E(X1) = E(X2) = y que V(X1) = V(X2) = 2 y recordando que la esperanza y la varianza de combinaciones de variables aleatorias pueden expresarse como: E(aX1 + bX2) = aE(X1) + bE(X2) Var(aX1 +bX2) = a2 Var(X1) + b2 Var(X2) Si a y b son constantes y X1, X2 variables aleatorias independientes: _ 1 1 Dado que X = 2 X1 + 2 X2 entonces, usando las propiedades anteriores: _ 1 1 1 1 1 1 E(X) = E(2 X1 + 2 X2) = 2 E(X1) + 2 E(X2) = 2 + 2 =
2 2 _ 1 1 1 1 Var(X) = Var (2 X1 + 2 X2) = Var(X1) + Var(X2) =

1 1 1 1 = 4 2 + 4 2 = 4 (2+2) = 4 (22) = 2/2 Se debe destacar el hecho de que la varianza de las medias muestrales es inversamente proporcional al tamao de la muestra. Esto tiene un importante resultado prctico y es que a travs del tamao muestral se puede controlar la variabilidad de la media resultante. Consecuentemente, si la muestra es grande es menos probable que se obtenga una media muestral muy alejada de la esperanza de la distribucin que se est muestreando, como puede observarse en la siguiente figura:

n= 1 0 0

n= 1 0

n= 1

108

Distribucin de los Estadsticos Muestrales

Figura 4.3:Funciones de densidad de la variable aleatoria media muestral basada en muestras de tamao n = 1, n = 10 y n = 100 obtenidas de una poblacin infinita

Un aspecto interesante de destacar en el Ejemplo 4.1 es la diferencia de la forma de la funcin de densidad de X presentada en la Figura 4.2, comparada con aquella de la variable original mostrada en la Figura 4.1. La Figura 4.2 muestra una densidad simtrica, centrada en , con forma triangular. Esta se asemeja ms a la densidad normal que la densidad de la variable numero de frutos presentada en la Figura 4.1. Si se hubieran utilizado muestras de mayor tamao, se vera que la funcin de densidad se aproxima ms an a la grfica de una densidad normal con idntica esperanza y varianza inversamente proporcional al tamao muestral. Este comportamiento no es casual sino la consecuencia de un importantsimo resultado que se resume en el siguiente teorema:

Teorema Central del Lmite


Sea X una variable aleatoria con esperanza y varianza finita 2. Sea

la media muestral de

una muestra aleatoria de tamao n y Z la variable aleatoria definida como:

X Z = n
entonces, la distribucin de Z se aproxima a la distribucin normal estndar cuando n se aproxima a infinito.

Note que el teorema no hace referencia a la distribucin de X. Aunque X no se distribuya como una variable aleatoria normal, si tiene varianza finita, entonces para

X n suficientemente grande, la distribucin de Z= converge en distribucin4 n

Cuando se dice que una variable con distribucin Fn(.) converge en distribucin a una distribucin G(.), cuando n tiende a infinito, se quiere indicar que

>0

n0 tal que |Fn (x) - G(x)| <

x si n>n0

109

Distribucin de los Estadsticos Muestrales

a una N(0,1). Se dice entonces que Z posee una distribucin asintticamente normal. El teorema central del lmite provee un resultado muy importante ya que justifica la utilizacin de los mtodos estadsticos que suponen normalidad en muchsimas situaciones prcticas.

X Nota: Si la variable X se distribuye normal entonces Z = n


exacta N(0,1) para cualquier tamao muestral n.

tiene distribucin

Se ha visto que, dada una variable X con media y varianza 2, se puede derivar de manera aproximada o exacta la distribucin de X haciendo uso del teorema central del lmite. Luego, se puede calcular P( X < x ) o P( x1 < X < x2 ) como se mostr en el Captulo 3 para variables aleatorias normales. Si X ~ N ( ,2 ) entonces para muestras de tamao n:

X x x < P( X < x ) = P = PZ < donde Z ~ N(0,1) n n n Distribucin T de Student


La mayor dificultad en aplicar el resultado anterior es que, en la prctica, 2 es desconocida. Luego se podra estimar su valor a partir de una muestra, lo cual se logra sustituyendo en la frmula anterior por el desvo estndar muestral. El problema es que la sustitucin de por S, modifica la variable aleatoria Z a la que hace referencia el teorema central del lmite y por tanto ya no se tiene una distribucin X normal para esta estandarizacin. La variable a aleatoria T = tiene una S n distribucin conocida como T de Student con n-1 grados de libertad. Esta distribucin es caracterizada por un nico parmetro conocido como grados de libertad y que
110

Distribucin de los Estadsticos Muestrales

corresponde al nmero de observaciones que se utilizaron para calcular la desviacin estndar muestral menos 1:

Luego, T= X ~ T con (n-1) grados de libertad. S n


En consecuencia para calcular probabilidades del tipo P( X < x ) o P( x1 < X < x2 ), cuando no se conoce , se utiliza la Tabla de Cuantiles de la Distribucin T (Tabla T), con los grados de libertad apropiados. Cuando los grados de libertad de una distribucin T son mayores que 30, la forma de la distribucin, se aproxima a la de la distribucin normal estndar. Es decir, ambas distribuciones estn suficientemente cerca y por lo tanto utilizar en esos casos la Tabla T o la Tabla de cuantiles de la distribucin normal estndar, produce resultados similares desde un punto de vista prctico. De hecho para grados de libertad infinitos la distribucin T converge a la distribucin normal. Ejemplo 4.2 Considrese la variable peso de 100 semillas de una variedad de maz. Para esta variable desconocemos la varianza aunque se puede suponer normalidad. El problema ahora es saber, para muestras de 5 paquetes de 100 semillas cul es la probabilidad de que la media muestral de los 5 paquetes sea menor de 38gr. si se supone que la esperanza de la distribucin es 39gr.? (este ejemplo podra corresponder a la inquietud de un ente fiscalizador que desea saber cul es el riesgo de que un lote bueno sea mal clasificado si se utiliza como criterio el peso promedio de 5 paquetes de 100 semillas). Lo primero es tener una aproximacin de 2, a travs de la varianza muestral. Para eso se podran tomar, por ejemplo, 12 bolsas de 100 semillas y pesarlas obteniendo los siguientes resultados: 37.4 39.1 38.2 38.0 38.5 39.4 40.2 41.0 39.9 37.9 37.7 40.1

En base a estos datos se obtiene S (el desvo estndar muestral) = 1.359 = 1.1658
111

Distribucin de los Estadsticos Muestrales

T < 38 39 = P(T < -1.92) 0.05 Luego: P( X < 38 gr.) = P 1.1658 5 donde T ~ T de Student con (12 - 1) grados de libertad. Los grados de libertad de la T se corresponden con el tamao de la muestra con la que se calcul S.
Nota: Suponga que se quiere calcular P[T 4.3] donde T ~ T de Student con 2 grados de libertad. Tomando la fila de la Tabla de distribucin T-Student (ver tabla en anexo), que corresponde a 2 grados de libertad se encuentra el valor 4.303 que corresponde a la columna encabezada por t0.975. Esto indica que 4.3 es el cuantil 0.975 de la distribucin T-Student de con 2 grados de libertad y en consecuencia P[T 4.3] = 0.975. Si por el contrario la probabilidad requerida hubiera sido P[T -4.3] entonces se busca igualmente para t = 4.3 pero la lectura del cuantil se har al pie de la columna debido al signo negativo del valor de la variable T. Luego, P[T - 4.3] = 0.025.

Distribucin de la diferencia de dos medias muestrales


Tmense dos variables aleatorias X1 y X2 independientes que tienen distribucin normal, tal que:
2 X1 ~ N(1, 1 ) y X2 ~ N(2, 2 ) 2

Si el inters se centra en saber, por ejemplo, si las esperanzas de ambas distribuciones son idnticas, se podra definir una nueva variable aleatoria, como la diferencia entre X1 y X2 y estudiar el comportamiento de esta nueva variable a la que llamaremos diferencia de dos variables aleatorias independientes y se denota, en este ejemplo, por (X1 X2). Se puede justificar que: E(X1 X2) = E(X1) - E(X2) = X X 1 2 Var(X1 X2) = Var(X1) + Var(X2) =
2

X1

X2

Si X1 y X2 son variables normales entonces la variable aleatoria diferencia (X1 - X2) se 2 2 distribuye tambin normalmente con esperanza y varianza X + X . En
X1 X2

consecuencia para estandarizar la variable diferencia de dos variables aleatorias normales se tiene:

112

Distribucin de los Estadsticos Muestrales

Z=

( X 1 X 2) (1 2)
2 1 + 2 2

con Z ~ N(0,1).

Supngase ahora, que se extraen muestras aleatorias de ambas distribuciones y, para cada una, se calcula la variable media muestral. Las distribuciones de estas medias muestrales son respectivamente: _ X1 N (1, 2 /n1) 1 y _ X2 N (2, 2 /n2) 2

Luego la variable aleatoria diferencia de medias muestrales independientes se distribuir normalmente con: _ _ _ _ E(X1-X2)= E(X1) - E(X2)= 1 - 2 _ _ _ _ V (X1-X2) = V(X1)+V(X2) = 2 /n1+2 /n2 1 2 As la distribucin de la diferencia de dos medias muestrales ser: _ _ 2 2 (X1-X2) N 1 2 , 1 + 2

n1

n2

donde

12
n1

2 2

n2

corresponde a la varianza de la diferencia de dos medias muestrales

provenientes de dos distribuciones normales independientes. Luego, si se estandariza la diferencia de medias muestrales se tiene: ( X 1 X 2 ) ( 1 2 ) con Z ~ N(0,1) Z=
2 12 2 + n1 n2

Si las distribuciones originales a partir de las cuales se obtuvieron X 1 y X 2 no son normales, se puede aplicar a esta diferencia las mismas propiedades que se deducen del teorema central del lmite cuando n1 y n2 son ambas suficientemente grandes.
2 12 2 + n2 n1

Nota:

es la desviacin estndar de la variable diferencia de medias

muestrales basadas en muestras de tamao n1 y n2 Tambin conocido como Error Estndar de la diferencia de dos medias muestrales.

113

Distribucin de los Estadsticos Muestrales

Cuando no se conocen las varianzas distribucionales y se utilizan como sus aproximaciones a las varianzas muestrales, se deben reconocer dos situaciones: a) las varianzas no se conocen, pero se saben iguales, en cuyo caso la desviacin estndar de la diferencia de medias muestrales se calcula como:

1 1 (n 1 1) S 1 + (n 2 1) S 2 2 S x1 x 2 = S + n n , donde S p = n1 + n 2 2 2 1
2 2

2 p

Nota: La expresin:

Sp
2

n1

n2

puede

escribirse

como:

Sp

n1

n2

2 n1 + n2 S p. n1 .n2
b) las varianzas no se conocen pero se saben diferentes, en cuyo caso la desviacin estndar de la diferencia de medias muestrales se calcula como: S12 n1
2 S2

S x1 x 2 =

n2

La estandarizacin que se obtiene utilizando una o otra expresin para el error estndar de la diferencia de medias, segn sea el caso, es: T=

(X

X 2 ( 1 2 )

S X 1 X 2

Esta expresin tiene distribucin T-Student con (n1 + n2 - 2) grados de libertad en el

caso a y distribucin T-Student con =

S1 + S 2 n1 n2
2 2

2 S1

n1 n1 + 1

) +(
2

2 S2

n2 n2 + 1

2 grados de

libertad en el caso b.

114

Distribucin de los Estadsticos Muestrales

Ejemplo 4.3 Se tienen dos lotes de girasol y se toma de cada uno una muestra aleatoria simple de 10 paquetes de 100 semillas cada uno y luego se pesan. Los datos de peso de las bolsas de ambos lotes podran ser las siguientes:

Lote 1 43.3 55.6 46.8 56.3 45.7 46.7 42.8 47.9 43.7 34.6

Lote 2 54.9 42.8 47.7 50.8 45.6 52.2 50.0 52.0 59.2 71.2

Lote 1 2

n 10 10

Media 46.3 52.6

Varianza 39.4 63.8

La diferencia de medias de la poblacin 1 respecto a la 2 es 6.3 gramos. Luego se podra preguntar cul es la probabilidad de que la diferencia de medias, basadas en muestras de tamao 10 sea, por ejemplo, igual o mayor que la diferencia observada, si las esperanzas de las distribuciones de la variable peso de 100 semillas en ambos lotes fuera la misma (es decir 1-2 = 0). En trminos de probabilidad, lo que se quiere averiguar es: P X 1 X 2 x1 x 2 , La expresin anterior puede escribirse como: P ( X1 X2 ) x1 x 2 + P ( X1 X2 ) x1 x 2 Suponiendo que 1 = 2, entonces: P ( X1 X2 ) x1 x 2 =
115

Distribucin de los Estadsticos Muestrales

( ) x1 x 2 X X2 P 1 S S x 2 x1 x 2 x1

+ P (X1 X 2 ) x1 x 2 S S x1 x 2 x1 x 2

Asumiendo que las varianzas en ambas poblaciones son iguales, las probabilidades anteriores pueden reescribirse como:
x1 x 2 x1 x 2 + P T n + n 2 P T n + n 2 1 1 2 2 1 1 1 1 + + Sp Sp n1 n 2 n1 n 2

Haciendo los clculos se tiene que la probabilidad buscada es aproximadamente 0.07. Esto quiere decir que la probabilidad de obtener una diferencia al menos tan grande como la observada es 0.07.

Distribucin asociada al estadstico varianza muestral


Retomando el Ejemplo 4.1 que trataba con una poblacin de 4 plantas de zapallos, donde la variable en estudio es la cantidad de zapallos en cada planta se vio que la varianza de la variable era 2 = 1.25. Considrense, nuevamente, todas las muestras posibles de tamao 2 obtenidas con reposicin pero ahora en vez de calcular la media muestral, se calcula la varianza muestral para cada una de ellas. Los resultados se presentan en la siguiente tabla:

116

Distribucin de los Estadsticos Muestrales

Tabla 4.4: Espacio muestral generado por muestreo aleatorio con muestras de tamao 2 con reposicin a partir de una poblacin de cuatro plantas de zapallo, presentada en Tabla 4.1
Muestra Plantas N de frutos Varianza Muestra Plantas N de frutos Varianza

1 2 3 4 5 6 7 8

P1 P1 P1 P2 P1 P3 P1 P4 P2 P1 P2 P2 P2 P3 P2 P4

3-3 3-2 3-1 3-4 2-3 2-2 2-1 2-4

0.0 0.5 2.0 0.5 0.5 0.0 0.5 2.0

9 10 11 12 13 14 15 16

P3 P 1 P3 P 2 P3 P 3 P3 P 4 P4 P 1 P4 P 2 P4 P 3 P4 P 4

1-3 1-2 1-1 1-4 4-3 4-2 4-1 4-4

2.0 0.5 0.0 4.5 0.5 2.0 4.5 0.0

En la siguiente tabla se presenta la distribucin de la variable aleatoria varianza muestral del nmero de frutos. Tabla 4.5: Valores que asume la variable aleatoria varianza muestral del nmero de frutos y sus densidades Varianza muestral 0 0.5 2 4.5 Luego, la grfica de la funcin de densidad es: P(S2 = s2) 4. 6. 4.

1 = 0.25 16

1 = 0.375 16

1 = 0.25 16 1 = 0.125 2. 16

117

Distribucin de los Estadsticos Muestrales

0.40

0.30

F(s2)

0.20

0.10

0.00 0.00 1.50 3.00 4.50

Figura 4.4: Distribucin de frecuencias relativas de la variable aleatoria varianza muestral generada por muestreo con reposicin de muestras de tamao n=2 de una poblacin de cuatro plantas de zapallo; presentada en Tabla 4.1

S2
En la Tabla 4.4 se puede apreciar que la varianza muestral vara de muestra a muestra y en consecuencia la varianza muestral, es una variable aleatoria y como tal tiene una distribucin asociada. En la Figura 4.4 se ve que la distribucin es asimtrica, con mayor concentracin de valores a la izquierda de la media. Para calcular probabilidades asociadas a varianzas muestrales se utiliza la distribucin de la variable: S 2 (n - 1) 2 ya que se conoce que cuando S es la varianza obtenida a partir de una muestra S 2 (n - 1) aleatoria de una distribucin normal, la variable , tiene distribucin Chi2 cuadrado con (n-1) grados de libertad. As, aplicando la propiedad de la esperanza de una variable aleatoria por una constante, E(cX) = cE(X), se tiene que: E(S2) = E
2

2 S 2 ( n -1) S 2 ( n -1) = E c 2 2 ( n -1)

118

Distribucin de los Estadsticos Muestrales

donde c =

2 . (n-1)

S 2 (n - 1) se distribuye como 2 con n 1 grados de libertad, y la Luego, como 2 esperanza de una variable aleatoria 2 es igual a sus grados de libertad,

E(S2) = E(c2 n 1)=c(n-1) =

2 ( n -1) = 2 ( n -1)

Obsrvese que la esperanza de la varianza muestral es igual a la varianza de la 2 variable original. En el ejemplo: E(S2) = 1.25 = . Luego, S2 es un estimador insesgado de 2. Ejemplo 4.4 Supngase que la varianza mxima admisible para el peso de 100 semillas es 23 gr.2 y que se obtiene desde una muestra de 10 paquetes de 100 semillas cada uno, una varianza muestral de 28gr2. Es este resultado compatible con la especificacin de la varianza mxima de 23gr2?. Dicho desde un punto de vista estadstico se podra preguntar si la varianza muestral obtenida es un hecho frecuente o no, cuando la varianza de la distribucin del peso de 100 semillas en la poblacin que se est muestreando es a lo sumo 23gr2. Luego se puede calcular, P(S2 28) = P(S2 (n - 1) / 2 28 (n - 1) / 2) = = 1 - P(S2 (n - 1) / 2 28 (n - 1) / 2) = = 1 - P(2 28 (9) / 23)) = 1 - P(2 10.96) Buscando en la Tabla de Cuantiles de la Distribucin Chi-cuadrado con 9 grados de libertad se encuentra que la probabilidad buscada es aproximadamente 0.75. As 1-0.75 = 0.25 Luego, una de cada cuatro muestras de este tamao tendrn varianzas iguales o mayores que 28, lo que para una poblacin con varianza 23 es un resultado frecuente.

119

Distribucin de los Estadsticos Muestrales

Ejercicios
Ejercicio 4.1 Al tirar un par de dados se obtienen realizaciones de dos variables aleatorias discretas independientes con valores posibles{1,2,3,4,5,6}, cada uno de los cuales tiene probabilidad de 1/6. a) Cul es la distribucin de probabilidades de la variable media del nmero de puntos en un par de dados?. Para responder, defina primero el conjunto de los resultados posibles de este experimento. Graficar la distribucin de la variable X = nmero de puntos en un dado y la distribucin de la variable Y = media del nmero de puntos en un par de dados. Comparar la forma de la variable media muestral con la forma de la distribucin de la variable original.

b) c)

Ejercicio 4.2 Si se especifica que la esperanza de la variable cantidad de kilmetros recorridos por litros de un vehculo es 12 y tiene una desviacin estndar de 2. Cul es la probabilidad de que la media de una muestra de 10 recorridos sea menor o igual que 10 Km/lts si el vehculo funciona de acuerdo a las especificaciones?. Ejercicio 4.3 Si la distribucin de la variable aleatoria produccin de leche de un establecimiento lcteo (en cientos de litros) se aproxima a una distribucin normal con media 70.35 y desvo estndar 8. a) b) Cul es la probabilidad de que la media de una muestra de tamao 5 exceda el valor 75?. Cul es la produccin promedio slo superada por un 5 % de las producciones promedio?.

Ejercicio 4.4 Uso de la tabla de la Distribucin T de Student La tabla de la distribucin T de Student del anexo contiene los cuantiles tp, para algunos valores de p, con p [0.55, 0.995] (encabezamiento de la tabla) y grados de libertad , con = 1, 2,...,50.
120

Distribucin de los Estadsticos Muestrales

Suponga que se quiere calcular la P(T 4.3) donde T es una variable aleatoria que tiene distribucin T de Student con 2 grados de libertad. Se busca en el cuerpo de la tabla el valor 4.3 dentro de la fila que corresponde a = 2, y en el encabezamiento de la columna se lee 0.975 que es la probabilidad buscada. El valor 4.3 es el cuantil 0.975 de la distribucin T de Student con 2 grados de libertad. Si por el contrario la probabilidad requerida hubiera sido P(T -4.3) entonces se procede de igual manera que en el prrafo anterior, pero la lectura de la probabilidad se hace en el pie de la columna. Luego P(T -4.3) = 0.025. Obtener las siguientes probabilidades: a) b) c) d) e) n = 50, P (T 2) n = 50, P(T > 2) n = 5, P(T -1.5) Cul es el valor del cuantil 0.975 para una distribucin T de Student con 5 grados de libertad?. Qu significa este valor?. Cul es el cuantil 0.30 para una distribucin T de Student con 42 grados de libertad?. Qu significa este valor?.

Ejercicio 4.5 Siguiendo con la situacin planteada en el Ejercicio 4.3, responder las mismas preguntas planteadas cuando no se conoce el valor de la desviacin estndar de la distribucin en estudio, y se dispone de la siguiente muestra para estimarla: Muestra: a) b) 67.9 69.3 70.0 74.8 75.3 69.6 67.3 65.8 70.5 Cul es la probabilidad de que la media de una muestra de tamao 5 exceda el valor 75?. Cul es la produccin promedio slo superada por un 5 % de las producciones promedio?.

Ejercicio 4.6 Conocida la distribucin de la media del nmero de puntos en un dado (Ejercicio 4.1), calcular la varianza muestral en cada uno de los pares de resultados posibles del experimento consistente en tirar un par de dados y registrar sus valores. a) b) Construir la tabla de frecuencia para la variable varianza muestral y graficar su distribucin. Cmo es la media de la distribucin de varianzas muestrales respecto a la
121

Distribucin de los Estadsticos Muestrales

varianza de la variable original? Ejercicio 4.7 Uso De la tabla de la Distribucin Chi-cuadrado En la tabla de distribucin chi-cuadrado acumulada se pueden encontrar algunos cuantiles de la distribucin para diferentes grados de libertad. Para calcular la probabilidad de que una variable distribuida como una chi-cuadrado con grados de libertad sea menor o igual a un cierto valor se procede de la siguiente forma: Se busca en la tabla la fila que corresponde a los grados de libertad de la distribucin y dentro de esa fila se localiza (de manera exacta o aproximada) el valor x. Luego se lee la probabilidad buscada mirando el encabezamiento de la columna correspondiente. Por ejemplo, si X se distribuye como una 2 con 5 grados de libertad entonces: P ( X 3.99) = F (3.99) = 0.45 Como ejercicio de uso de la tabla encontrar: a) b) P ( X 11) si X se distribuye como una 2 con 15 grados de libertad. P (S2(n-1) /2 4) si S2 fue obtenido a partir de una muestra de tamao 10.

Ejercicio 4.8 En un criadero de semillas se est probando una nueva variedad de maz que saldr a la venta si en una muestra de 50 parcelas experimentales el desvo estndar de su rendimiento no supera los 23 Kg/ha. a) b) Cul es la probabilidad de que esto ocurra si la verdadera desviacin estndar es 20? Cul es el valor por debajo del cual est el 99% de los valores posibles de desviaciones estndar muestrales basadas en muestras de tamao 30 si la verdadera desviacin estndar es 20?

Ejercicio 4.9 La variable aleatoria peso de latas de tomate sigue una distribucin normal. La desviacin estndar de los pesos de latas de tomates en un lote de 10000 es igual a 1.4 grs. Encontrar la probabilidad de que una muestra de 4 latas, tenga una desviacin estndar que exceda 2.0 grs.
122

Distribucin de los Estadsticos Muestrales

Ejercicio 4.10 Se sabe que la longitud del fruto de dos variedades (A y B) de tomate perita, sigue, en ambos casos, una distribucin normal. Para la variedad A la media es = 7.3 cm y la desviacin estndar = 0.4 y para la especie B la media es de 6.0 cm y la desviacin estndar 0.5 cm. a) b) c) Cul es la distribucin de la diferencia de medias muestrales de la longitud de frutos tomando nA = nB = 5? Cul es la probabilidad de que la diferencia entre los promedios muestrales sea mayor o igual a 1.5 cm si nA = nB = 10? Qu proporcin de la distribucin de los promedios muestrales de la variedad B podra esperarse que estn comprendidos entre 5.5 y 6.5 cm con muestras de tamao n=15?

123

5
5 Estimacin de Parmetros
Introduccin
Cuando se introdujo el concepto de Inferencia Estadstica se indic que una muestra de una poblacin era til para hacer inferencias acerca de la misma. Dos importantes ramas de la Inferencia Estadstica son la estimacin de parmetros y la prueba de hiptesis. En este captulo ser tratado el problema de estimacin y en el siguiente la prueba de hiptesis. Los objetivos en este captulo son: caracterizar las distribuciones de variables aleatorias a travs de los parmetros media y varianza, estudiar el caso particular de la distribucin normal, desarrollar la nocin de estimacin, presentar algunas propiedades de estimadores de parmetros y procedimientos para estimar parmetros.

Concepto de Estimacin
En algunos casos se trata de estimar (aproximar numricamente) la funcin de distribucin de una variable aleatoria. Este es un objetivo ambicioso y puede requerir un esfuerzo muestral grande para lograr una buena estimacin. En otros casos, se requiere que el investigador suponga la distribucin de su variable y una vez establecida sta, el problema es encontrar valores razonables para los parmetros que la caracterizan. Por ejemplo si la distribucin supuesta es normal, los parmetros de inters podran ser la esperanza y la varianza, ya que para especificar completamente la distribucin es necesario conocer estos dos valores. En el proceso de estimacin de un parmetro hay dos enfoques que responden a diferentes necesidades: la estimacin puntual y la estimacin por intervalo de confianza.

Estimacin Puntual
Cuando se aproxima un parmetro de una distribucin a travs de un valor decimos
125

Estimacin de Parmetros

que se est haciendo es una estimacin puntual. Supongamos que tenemos una muestra aleatoria (x1, x2, . . .,xn) desde una distribucin f(x;) y que deseamos usar esos valores para estimar el parmetro , el cual es desconocido. Luego, una funcin de x1, x2, . . .,xn ser usada para estimar . Definicin 5.1:Estimacin y estimador puntual
Sea x1, x2, . . .,xn una muestra aleatoria desde la distribucin f(x; ), la funcin (x1, x2, . . .,xn) es una estimacin de . La funcin correspondiente de las variables aleatorias X1, X2, . . .,Xn, la cual es si misma una variable aleatoria, es un estimador puntual del parmetro .

As, por ejemplo, la media muestral X = 1/ n aleatorias donde n es el tamao de la muestra.

X
i =1

es una funcin de n variables

La calidad de la estimacin obtenida depende de la adecuada eleccin del estimador puntual. Debido a que existe una gran variedad de estimadores posibles en cada situacin particular es que necesitamos de criterios de seleccin. Para seleccionar un buen estimador entre un conjunto de posibles estimadores, los estadsticos propuestos son estudiados teniendo en cuenta ciertas propiedades deseables.

Propiedades clsicas de los buenos estimadores


La eleccin de un estimador se realiza teniendo en cuenta, entre otros, los siguientes criterios: a. Insesgamiento Insesgamiento Definicin 5.2: Insesgamiento
Un estimador

b. Consistencia

c. Eficiencia

es un estimador insesgado para el parmetro

si, para cualquier tamao

muestral, su esperanza es igual al parmetro que estima. Esto es, E( ) =


de

, para todo valor

. El sesgo del estimador es definido como: Sesgo( )=E( - ).

126

Estimacin de Parmetros

Dicho de otra forma, si en promedio = (la distribucin de esta centrada en o


no existe una tendencia persistente a subestimar o sobreestimar ), diremos que es un estimador insesgado.
Esto se puede probar para la media muestral, de la siguiente manera: si se considera a la muestra de n observaciones como una coleccin de n variables aleatorias, todas idnticamente distribuidas con E(Xi ) = i luego, E( X ) = E

1 n

i =1

1 Xi = n

i =1

E ( X i ) = 1 n =
n

Es importante observar que la esperanza de la media muestral no depende de la distribucin que se est muestreando, slo se pide que la distribucin tenga esperanza. Si se considera la varianza muestral se puede ver que este tambin es un estimador 2 2 2 2 insesgado. Para X ~ N (,2 ), E(S ) = ya que el estadstico ((n-1) S / ) ~ 2 con (n-1) grados de libertad y en consecuencia se tiene que:: E (S 2 ) = E
2 2 S 2 ( n -1) S 2 ( n -1) 2 E = = ( n 1) 2 ( n 1) 2

A diferencia de lo que ocurre con la media muestral, donde no se necesita suponer ninguna distribucin para encontrar la esperanza, en el caso de la varianza muestral, se 2 2 debe suponer normalidad para asegurar que ((n-1) S / ) se distribuye como una variable Chi-cuadrado y desde all obtener la esperanza como se mostr arriba. La observacin anterior es importante porque si se aplica la frmula de varianza muestral para estimar la varianza de una distribucin no normal, entonces no se puede asegurar que el estimador sea insesgado. Consistencia Definicin 5.3: Consistencia

, si la P(| - |>) tiende a 0, para >0, cuando el tamao de la muestra tiende a , se dice que es un estimador consistente del parmetro .
Sea un estimador del parmetro

En otras palabras, esto significa que a medida que aumenta el tamao de muestra
127

Estimacin de Parmetros

aumenta la proximidad de respecto . Un ejemplo clsico de estimador consistente es la media muestral X.


La consistencia es una caracterstica esencial para cualquier estimador ya que implica que la calidad del resultado obtenido por la estimacin refleja el esfuerzo muestral. Eficiencia Definicin 5.4: Eficiencia
Sea

un estimador insesgado de

, se dice que es eficiente si tiene la mnima varianza

posible .

Para comparar dos estimadores es til el concepto de eficiencia relativa, que se obtiene desde la comparacin de sus varianzas. Por ejemplo, si X es una variable aleatoria con distribucin normal, entonces la media y la mediana muestral son estimadores insesgados del parmetro (la esperanza de la distribucin), y adems ambos estimadores son consistentes. Sin embargo, se puede comprobar que la varianza de la media muestral es menor que la varianza de la mediana por lo tanto la media es ms eficiente que la mediana. Ms an, la media es el estimador eficiente en el sentido de que no existe ningn otro (bajo normalidad), que tenga menor varianza. Sin embargo, cuando el supuesto de normalidad no se cumple, el estimador eficiente de la esperanza puede ser la mediana. Esto ocurre en distribuciones asimtricas o en distribuciones contaminadas (mezcla de distribuciones).

Estimacin por Intervalo de confianza


Los estimadores puntuales son tambin variables aleatorias y, por lo tanto, no se puede esperar que en una realizacin cualesquiera den un valor idntico al parmetro que estiman. Por ello, se desea que una estimacin puntual est acompaada de alguna medida del posible error de esa estimacin. Esto puede hacerse indicando el error estndar del estimador o dando un intervalo que incluya al verdadero valor del parmetro con un cierto nivel de confianza. Ejemplo 5.1 Si se quiere reportar el rendimiento de un cultivo, en vez de decir que la media del
128

Estimacin de Parmetros

rendimiento se estima en 25 qq/ha se podra decir que, con una confianza del 95%, el rendimiento promedio para ese cultivo est comprendido entre 23.5 y 26.5 qq/ha. El procedimiento que permite calcular los lmites inferior y superior del intervalo antedicho se conoce como: Estimacin por Intervalo y el intervalo obtenido: Intervalo de Confianza.

Procedimiento general para encontrar un intervalo de confianza para un parmetro.


El objetivo del procedimiento de estimacin por intervalo es encontrar el intervalo cerrado [LI, LS] donde LI = Lmite Inferior y LS = Lmite Superior, tal que si el parmetro a estimar se simboliza por , entonces: P(LI LS) = 1- Esta expresin se lee: el intervalo de lmites aleatorios LI y LS tiene probabilidad (1-) de contener al parmetro , donde (1-) denota la confianza de la estimacin y se denomina coeficiente de confianza. Aunque la confianza se define como una cantidad que est entre 0 y 1, es frecuente expresarla como porcentaje, esto es: (1-).100. La especificacin del coeficiente de confianza como (1-) se hace por razones de consistencia con notacin y conceptos que se introducirn posteriormente y en los que tiene un significado particular.
. Nota: Decir que un intervalo tiene confianza (1 - ) 100 significa que: si se utiliza el mismo procedimiento de construccin del intervalo para m muestras aleatorias independientes de idntico tamao n, entonces m (1-) intervalos contendrn al verdadero valor del parmetro.

Ejemplo 5.2 Si de una poblacin con = 28, se toman 200 muestras independientes (m = 200) de tamao n y se construyen para cada una un intervalo de confianza con coeficiente 0.90 (o del 90%), entonces se debe esperar que 180 de los 200 intervalos incluyan al valor 28. Valores usuales de confianza son 0.95, 0.99 o 0.999. Estos niveles de confianza, aunque ampliamente aceptados, no constituyen una norma y pueden utilizarse otros. Para poder construir estos intervalos se necesita: a)

Una funcin continua g(.,.) que relacione el parmetro y su estimador . Esto


129

Estimacin de Parmetros

es g( , ). b)
Que g( , ) tenga una funcin de distribucin F(.)5 cuya especificacin no dependa del parmetro . Luego si g( , ) es la funcin que relaciona el parmetro y su estimador y F(.) su

funcin de distribucin, entonces: P(q1 g ( , ) q2) = 1- implica que q1 es el cuantil ( / 2) y q2 el cuantil (1 - / 2) de la distribucin F(.). Una vez que se han establecido q1 y q2, los lmites LI y LS surgen despejando a partir de g( , ). A modo de ejemplo considrese este algoritmo aplicado a la estimacin por intervalo de la esperanza y la varianza de una distribucin normal.

Estimacin de la esperanza de una variable aleatoria normal


Se deben distinguir dos casos dependiendo de si 2 es o no conocida. Caso 1: Se conoce la varianza
2

Siguiendo los pasos descriptos en el procedimiento general se tiene: La funcin g (,X) para relacionar y su estimador X podra ser la siguiente: g ( , X) = (X - ) / 2 n donde 2 es la varianza de la distribucin y n el tamao de la muestra a partir de la cual se hace la estimacin. F (.) es, en este caso, N (0,1) ya que como se recordar (Captulo 4): (X - ) / 2 n ~ N (0,1) Esta funcin es independiente del valor de , siempre y cuando sea la esperanza de la distribucin. Si se trabaja con una confianza del 95%, entonces = 0.05; /2 = 0.025;

No confundir esta funcin F(.) que indica una funcin de distribucin genrica con la funcin F de Snedecor

130

Estimacin de Parmetros

1 - /2 = 0.975. Luego: q1 = Z (0.025) = -1.96 y q2 = Z (0.975) = 1.96 que corresponden a los cuantiles 0.025 y 0.975 de una N (0,1). Por lo tanto: P( -1.96 (X-) / 2 n 1.96 ) = 0.95, de donde: P( -1.96 2 n (X-) 1.96 2 n ) = 0.95 _ Luego, restando X: P( -X - 1.96 2 n - - X + 1.96 2 n ) = 0.95 Multiplicando la expresin anterior por -1: P( X + 1.96 2 n X - 1.96 2 n ) = 0.95 Reordenando: P( X - 1.96 2 n X + 1.96 2 n ) = 0.95 As: LI = X - 1.96 2 n y LS = X + 1.96 2 n Genricamente se tiene:
P(X - Z 1-/2

2 n X + Z 1-/2
2

2 n ) = (1 - )

Caso 2: No se conoce la varianza

En el punto anterior se vio como encontrar el intervalo de confianza para cuando 2 era conocida. Sin embargo esta es una situacin de inters solamente terica ya que en general la varianza de la distribucin es desconocida. Cmo cambia el intervalo de confianza si se desconoce 2 ?. La funcin g(,X) que se utiliz en el punto anterior sufre una modificacin que consiste en sustituir 2 por su estimador S2, luego g ( ,X) = (X - )/ S 2 / n . Recurdese (Captulo 4) que esta sustitucin del parmetro por su estimador produce cambios en la distribucin dando como resultado que: (X - ) / S 2 / n no se
131

Estimacin de Parmetros

distribuye N(0,1) sino como una T(n-1), donde (n-1) son los grados de libertad que caracterizan a esta distribucin. Si se establece una confianza de (1 - 0.05).100 = 95% y un tamao muestral de por ejemplo n = 20, entonces, los cuantiles inferior y superior de una distribucin T con (20 - 1) grados de libertad (g.l.) son: q1 = T /2 = - 2.09 y q2 = T1-/2 = 2.09, respectivamente. Por lo tanto: P( - 2.09 S 2 / n (X- ) 2.09 S 2 / n ) = 0.95 _ Luego, restando X: 2 2 P( - X - 2.09 S / n - - X + 2.09 S / n ) = 0.95 Multiplicando por -1: 2 2 P( X + 2.09 S / n X - 2.09 S / n ) = 0.95 Reordenando:
P( X - 2.09 As:

S 2 / n X + 2.09 S 2 / n ) = 0.95
y LS = X + 2.09 S 2 / n

LI = X - 2.09 S 2 / n

Clculo del tamao muestral para obtener un intervalo de confianza para con una amplitud determinada
El problema que tratamos de resolver a continuacin es establecer el tamao de muestra necesario para obtener un intervalo de confianza para la esperanza de una distribucin cuya amplitud sea menor o igual a una amplitud especificada por el investigador. En otras palabras, lo que se quiere es un mtodo para obtener el tamao muestral necesario para tener una estimacin de la esperanza con la amplitud deseada. Definicin 5.5:Amplitud del intervalo de confianza.
Sean LI y LS los lmites inferior y superior del intervalo de confianza para un parmetro . Luego la amplitud (A) del intervalo de confianza es A = LS - LI. Nota: Los lmites de un intervalo de confianza son aleatorios ya que se construyen en base a estadsticos muestrales.

132

Estimacin de Parmetros

Ejemplo 5.3 Si de una muestra aleatoria de tamao 25 se obtiene: X = 12 y S = 10 con el fin de calcular la amplitud, el intervalo de confianza (1 - ) para est dado por: _ _ LS = X + T (n-1 ) ; (1-/2) S 2 / n y LI = X - T (n-1 ) ; (1-/2). S 2 / n Entonces la amplitud es: _ A = LS - LI = X + T (n-1) ; (1-/2) _ S / n - X + T (n-1 ) ; (1-/2)
2

S2 / n

y trabajando algebraicamente esta expresin y reemplazando con los valores propuestos queda: A = 2 . T(24) ; (0.975) .

S 2 / n = 2 . 2.064 S 2 / n = 8.256

En este ejemplo, la amplitud es 8.256 unidades y se obtuvo con una muestra de tamao 25. Cul debera ser el tamao muestral para que la amplitud no supere las c unidades?, es decir, LS - LI c?. Este clculo se realiza de manera sencilla haciendo: A = 2 . T (n-1),(1-/2) .

S 2 / n c y despejando de all n
( n -1);(1- / 2)

2.T As, n

.S

Luego, para el Ejemplo 5.3, si c = 2 el tamao muestral necesario ser:

2 . 2.064 . 10 n 425 2
Nota: como el tamao muestral fue calculado en base a una muestra preliminar y el coeficiente T (n-1),(1-) depende de n, es recomendable hacer los clculos con n = 425 (corrigiendo T (n-1),(1-)) y luego recalculando n. As se tiene que T (424,0.95) corresponde al valor 1.96 y rehaciendo los clculos se obtiene n = 384, ligeramente menor que el anteriormente calculado.

Si la amplitud quiere expresarse como una fraccin f del valor medio, la expresin dada anteriormente se escribe como sigue:

133

Estimacin de Parmetros

2 . T ( n-1);(1- / 2) . S n X.f

Nota: Los resultados presentados son aplicables para la construccin de intervalos de confianza aproximados para la esperanza de la distribucin de variables aleatorias no normales siempre que sus distribuciones cumplan con los supuestos del teorema central del lmite y n sea suficientemente grande.

Ejercicios
Ejercicio 5.1 Considerar la variable rendimiento de maz, cuya distribucin es normal con media y desviacin estndar . Para estimar el rendimiento promedio del maz bajo el efecto de un herbicida, se toma una muestra de tamao 40 y se obtiene un promedio de 60 qq/ha. Se sabe por experiencias anteriores que la varianza poblacional 2 es 25 (qq/ha)2. a) b) c) Construir los intervalos de confianza del 95% y 99% para . Cmo cambia el intervalo anterior (95%) si el tamao de la muestra fuese 100 y se obtiene el mismo promedio? Cmo se modifica el intervalo del 95% calculado en a) si la desviacin estndar fuese de 7 qq/ha.?

Ejercicio 5.2 Una empresa dedicada a la comercializacin de semillas desea estimar la altura promedio de un sorgo forrajero que ha desarrollado. Para ello toma una muestra de 50 plantas y se calcula la media de la altura, la que resulta ser 130 cm. Se sabe por experiencias anteriores que la desviacin estndar es 22 cm. Construir los intervalos de confianza para con una confianza del 95 % y 99 % respectivamente. Comparar ambos intervalos y concluir. Ejercicio 5.3 Se quiere disear el tamao de una muestra para estimar en una poblacin normal con desviacin estndar igual a 13.
134

Estimacin de Parmetros

a) b)

Cul debera ser el tamao mnimo de la muestra para asegurar una amplitud de 9 unidades para el intervalo de confianza al 95%? Qu sucede si la confianza cambia al 99%?

Ejercicio 5.4 Se desea establecer el contenido vitamnico de un alimento balanceado para pollos. Se toma una muestra de 49 bolsas y se encuentra que el contenido promedio de vitaminas por cada 100 grs. es de 12 mg. y que la desviacin estndar es de 2 mg. Encontrar el intervalo de confianza del 95% para el verdadero promedio del contenido de vitaminas. Ejercicio 5.5 La distribucin del rendimiento por ha. de una variedad de trigo en la zona de Leones tiene una media = 24.5 qq/ha. y una desviacin estndar de 5 qq/ha. Se extraen 5 muestras de tamao 100 cada uno, obteniendo las siguientes medias: _ X1 = 24.1 a) b) c) _ _ X2 = 25.5 X3 = 23.0 _ _ X4 = 24.0 y X5 = 25.9

Construir los intervalos de confianza del 95% para la media poblacional para cada uno de estos valores. Considerar las cinco muestras como una nica (de tamao 500) y recalcular la media de esta muestra mayor ( X ) y el intervalo de confianza correspondiente. Se observa alguna diferencia entre la amplitud de los intervalos de las muestras individuales respecto de la amplitud del intervalo construido con la muestra mayor?

Ejercicio 5.6 El esprrago es una planta perenne cuyo cultivo comercial puede tener una duracin de 15 aos y su implantacin es costosa. Dada la extensin del sistema radicular, la profundidad del suelo es fundamental, considerndose indispensable contar con un promedio mnimo de 80 cm de sustrato permeable. Se realizan 14 determinaciones de la profundidad del sustrato permeable (en cm) en puntos tomados al azar en dos campos (A y B). Los resultados fueron los siguientes:
A: 72 78 86 78 90 104 76 70 83 75 90 81 85 72
135

Estimacin de Parmetros

A: B:

72 78

78 82

86 68

78 68

90 74

104 81

76 85

70 73

83 75

75

90

81

85 82

72 75

89 100 91

A partir de los intervalos de confianza al 95% determinar si estos campos son aptos para el cultivo. Ejercicio 5.7 Para estimar el rendimiento promedio del trigo en un departamento del sur cordobs se relevan los campos de distintos productores mediante un esquema de muestreo aleatorio simple. Se conoce por experiencias anteriores que es igual a 0.7 qq/ha y que el promedio histrico es 26 qq/ha. a) Qu nmero de campos se deben evaluar para estimar la media de rendimiento con una confianza del 95% si la amplitud del intervalo no debe ser mayor que el 2.5% del promedio histrico? Si la varianza de la distribucin aumenta (proponga = 1.4), aumenta o disminuye el tamao muestral necesario para mantener la misma amplitud? Justificar la respuesta.

b)

136

6
6 Contraste de Hiptesis
Introduccin
El hombre reconoce cotidianamente situaciones que le afectan, como la prdida de cosechas, las enfermedades, las contingencias climticas, etc. Tomar acciones para evitar o prevenir estos problemas requiere comprender cmo funciona el sistema que los origina. En el proceso de comprensin existe una etapa de idealizacin que se llama tcnicamente modelacin, que tiene por objeto identificar los elementos que son relevantes y plantear sus relaciones. Si el modelo es correcto, en el sentido que representa bien el sistema bajo estudio, se tendr una herramienta valiosa para planificar acciones en el mundo real. Qu relacin existe entre la construccin de estos modelos y la inferencia estadstica?. Para que un modelo sea incorporado al patrimonio de la ciencia tiene antes que ser validado, es decir mostrar que las predicciones que se deducen de l son aceptables. Lo usual es realizar un experimento u observar el comportamiento del sistema y comparar los resultados obtenidos en estos estudios con los que se deducen del modelo. Si no hay diferencias significativas entre lo observado y lo esperado, entonces se dir que el modelo es correcto para esa situacin (o desde un punto de vista ms estricto: que el modelo es provisoriamente aceptable). El problema es definir qu se entiende por diferencia significativa. No es simple establecer un criterio para decir si la discrepancia entre lo que se observa y lo que se espera es grande o pequea. Por ejemplo, si un modelo de precipitaciones predice que en los primeros 10 das del mes de enero llover 60 mm en una localidad de la Provincia de Crdoba y en cambio se registran 40 mm, para un detractor del modelo la diferencia ser significativa mientras que para otros no lo ser. Cmo ser imparcial en este juicio?. En primer lugar se deber discutir si es razonable aceptar que el milimetraje de lluvia cada en los 10 primeros das de enero se puede tratar como una variable aleatoria. Si
137

Contraste de Hiptesis

se concluyera afirmativamente, entonces, basndose en el modelo propuesto para las precipitaciones, se podra derivar su distribucin y a partir de ella asignar una probabilidad al evento: obtener un milimetraje de ms de 20 milmetros por debajo o por encima de la esperanza de la distribucin de lluvias (el milimetraje predicho por el modelo, en este caso, es de 60 mm). Con esta medida de probabilidad se podr tomar una decisin que es reproducible por cualquier investigador. Para el caso, considrese un ejemplo extremo: suponga que al calcular esta probabilidad se obtiene que el evento tiene una chance de ocurrir 1 de cada 1.000.000 de veces (uno en un milln). Esto quiere decir que de cada un milln de perodos que van del 1 al 10 de enero en la localidad citada, slo uno tendr un milimetraje que discrepa en 20 o ms milmetros de lo esperado bajo el modelo. Luego, con la evidencia observada se pueden sacar dos conclusiones: 1) que se tuvo muy mala suerte (justo se observ el perodo que ocurre una vez cada milln de aos), o 2) que el modelo es incorrecto. Lo usual, en estos casos, es aceptar la segunda alternativa. Otro hubiera sido el caso si la probabilidad del evento mencionado fuera 0.40, esto es 40 de cada 100 aos ocurren discrepancias iguales o mayores que la observada. Aqu, la evidencia muestral no tiene peso suficiente para que se rechace el modelo ya que el evento observado es un evento frecuente. La idea es entonces: dado un modelo no validado - que se llama hiptesis cientfica se debe seguir algn procedimiento para deducir alguna consecuencia, cuya verificacin o falta de verificacin, sirva para establecer la veracidad de la hiptesis cientfica. Si la/s consecuencia/s de la hiptesis cientfica se pueden visualizar como propiedades estadsticas de una variable aleatoria, ser factible utilizar herramientas estadsticas para tomar una decisin sobre la veracidad del modelo. Para ello se debe expresar la hiptesis cientfica como una hiptesis estadstica. Estas hiptesis consisten en una afirmacin sobre uno o ms parmetros de la distribucin de la variable aleatoria en cuestin, como sera por ejemplo, para la variable milimetraje de lluvia indicar que la esperanza de la distribucin = 60 mm. Es obvio que la hiptesis estadstica debe ser equivalente a la hiptesis cientfica postulada, de lo contrario, aceptar o rechazar la hiptesis estadstica no implicar necesariamente lo propio para la hiptesis cientfica. Conceptualmente la prueba estadstica o prueba de hiptesis es sencilla: se examina un conjunto de datos muestrales y a partir de ellos se calcula un estadstico cuya distribucin depende de la hiptesis planteada. Sobre la base de la distribucin especificada para el estadstico y de su valor observado en la muestra, se decide el rechazo o no de la hiptesis estadstica y en consecuencia de la hiptesis cientfica.
138

Contraste de Hiptesis

Aunque las hiptesis cientficas pueden dar lugar a hiptesis estadsticas que involucran a ms de un parmetro de la distribucin de una o ms variables aleatorias, la discusin que sigue se limitar, por razones de simplicidad, al caso de pruebas de hiptesis acerca de un parmetro de la distribucin de una variable aleatoria normal. Los objetivos de este captulo son establecer relaciones entre el Contraste de Hiptesis y el Mtodo Cientfico, analizar las etapas fundamentales de la Prueba Estadstica de Hiptesis, conceptualizar los distintos tipos de errores, y establecer relaciones con la Estimacin de Parmetros.

Procedimiento de la Prueba de Hiptesis


A fin de dar una idea general de la metodologa de la prueba estadstica de hiptesis, y aunque se incluyen conceptos que se definen posteriormente, a continuacin se enumeran los pasos a seguir en la prueba de una hiptesis estadstica: a) b) c) d) e) f) g) Plantear las hiptesis nula y alternativa. Planificar el experimento o el esquema muestral conducente a obtener datos que permitan la validacin o no de la hiptesis sometida a prueba. Seleccionar (o construir) un estadstico cuya distribucin quede completamente especificada bajo la hiptesis nula6. Establecer el nivel de significacin de la prueba. Establecer los eventos que conducen al rechazo y no rechazo de la hiptesis nula mediante la definicin de regiones de rechazo y de no rechazo (aceptacin). Realizar el ensayo o muestreo "ad hoc", definido en el punto b para obtener las observaciones con las que se realizar la prueba. Calcular el valor del estadstico postulado y determinar si est dentro o fuera de la regin de rechazo. En el primer caso se dice que se rechaza la hiptesis nula y en el segundo que no.

El orden en que se presentan los pasos anteriores es una secuencia formal que no siempre se respeta en la prctica de la investigacin. Usualmente se tiene una hiptesis cientfica y se planifica una experiencia para probarla y una vez obtenidos los datos se trata de formalizar una hiptesis estadstica. Debe advertirse que aunque en la prctica es usual este proceder, decididamente no es recomendable ya que la eleccin del

Con la expresin bajo hiptesis nula se indica suponiendo que lo que especifica la hiptesis nula es cierto

139

Contraste de Hiptesis

estadstico y su distribucin dependen de la forma en que se planifica el experimento (o el muestreo) y de la naturaleza de la hiptesis estadstica formulada. Si esto no se ha tenido en cuenta a la hora de planificar la experiencia, puede ocurrir (y de hecho ocurre con mucha frecuencia) que los datos obtenidos sean de escaso o nulo valor para realizar una prueba estadstica. A continuacin se definen y discuten cada uno los pasos presentados.

Plantear las hiptesis nula y alternativa


Para poder construir una prueba estadstica se debe especificar una hiptesis que se supone, provisoriamente como verdadera, llamada hiptesis nula y es simbolizada con H0. Esta hiptesis especifica los valores de uno o varios parmetros de la distribucin de la variable aleatoria observada en el experimento. Cuando la hiptesis nula se somete a prueba, el resultado es su aceptacin o rechazo. En este ltimo caso se aceptar una hiptesis especificada de antemano que se llama hiptesis alternativa, que se simboliza por H1 y que propone como posibles valores del o los parmetros en cuestin al conjunto de valores complementarios al postulado bajo H0.

Planificar el experimento o el esquema muestral


La forma en que se recolectan los datos o se disea el experimento es motivo de tratamiento particular por las tcnicas de muestreo y el diseo de experimentos. A modo de introduccin se puede decir que el objetivo de este paso es definir la forma en que los datos sern obtenidos, incluyendo el nmero total de observaciones en la muestra (o el nmero de repeticiones del experimento).

Seleccin de un estadstico para la prueba e identificacin de su distribucin bajo H0


El estadstico de la prueba es una funcin de la muestra. Se necesita una funcin W de la muestra cuya distribucin sea conocida y quede completamente especificada bajo H0, es decir que se puede calcular P(W w). La funcin W, a travs de su distribucin, servir para asignar probabilidades a los eventos que conducen a aceptar o rechazar la hiptesis nula postulada. El evento que induce al rechazo se conoce como regin o zona de rechazo de H0, en tanto que el evento que conduce al no rechazo se llama regin o zona de aceptacin de H0.

140

Contraste de Hiptesis Nota: entre todos los estadsticos posibles para una prueba de hiptesis se recomienda elegir aquel que maximiza la potencia de la prueba (ver definicin de potencia ms adelante).

Establecer el nivel de significacin de la prueba


Definicin 6.1: Nivel de significacin
El nivel de significacin se define como la mxima probabilidad de rechazar H0 cuando sta es verdadera. Ser denotado por la letra griega .

El nivel de significacin representa la mxima probabilidad de equivocarse en el sentido de concluir que H0 es falsa cuando en realidad no lo es. Este error, llamado Error de Tipo I, ser considerado detenidamente en la prxima seccin. Una vez que se han establecido H0 y H1 debe fijarse el nivel de significacin. En general se fija en 0.05 (5%) o en 0.01 (1%), que son niveles usualmente aceptados, aunque no hay razn alguna para no seleccionar algn otro. Es importante indicar que la probabilidad de cometer el error de tipo I se establece antes de la realizacin de la prueba estadstica. Esta observacin tiene el objetivo de que el investigador evale cul es la tasa de error de tipo I que est dispuesto a tolerar en base a criterios independientes de los resultados muestrales o experimentales.

Establecer los eventos que conducen al rechazo y no rechazo de la Hiptesis Nula


Una vez fijados el estadstico de la prueba, su distribucin y el nivel de significacin, el prximo paso consiste en establecer las regiones de no rechazo y de rechazo de H0. Definicin 6.2:Regin o zona de rechazo
La regin de rechazo de H0 es uno o ms intervalos de la recta real que describen al evento que conduce al rechazo de H0 y cuya probabilidad, cuando H0 es verdadera, es .

Definicin 6.3:Regin o zona de no rechazo


La regin de no rechazo de H0 es un intervalo de la recta real que describe al evento que conduce al no rechazo de H0 con probabilidad 1- ,cuando H0 es cierta.

141

Contraste de Hiptesis

La zona de rechazo puede estar a la izquierda o a la derecha de la distribucin del estadstico bajo H0, y en estos casos se dice que la prueba es unilateral izquierda o derecha respectivamente. Cuando la zona de rechazo est repartida a izquierda y derecha se dice que la prueba es bilateral. La condicin bilateral o unilateral de la prueba de hiptesis depende de la hiptesis alternativa. El tamao de la regin de rechazo esta determinado por el nivel de significacin de la prueba. As, si la hiptesis nula es = 0 y su alternativa es de la forma 0 se est en presencia de una prueba bilateral y la zona de rechazo estar ubicada en las dos colas (izquierda y derecha) de la distribucin del estadstico de la prueba. Si el nivel de significacin fuera del 5% ( = 0.05), las porciones derecha e izquierda de la zona de rechazo tendrn asociadas una probabilidad de 0.025 cada una7. En contraposicin, si la hiptesis alternativa es > 0 o < 0 la prueba es unilateral derecha o izquierda respectivamente, y la zona de rechazo de H0 estar ubicada en la cola derecha o izquierda de la distribucin del estadstico de la prueba y la probabilidad asociada a la regin ser en lugar de /2 como en las pruebas bilaterales. Ejemplos de hiptesis: Bilateral H0: = 20 qq/ha H1: 20qq/ha Definicin 6.4:Puntos crticos
Los valores de la recta real que separan la zona de no rechazo de la de rechazo se denominan puntos crticos.

Unilateral derecha H0: 20 qq/ha H1: > 20 qq/ha

Unilateral izquierda H0: 20 qq/ha H1: < 20 qq/ha

Las Figuras 6.1-6.3 ejemplifican los distintos casos de pruebas de hiptesis, donde se sealan las zonas de no rechazo y rechazo, los puntos crticos y las probabilidades asociadas al rechazo de H0. Como se observa, el estadstico utilizado en estos casos tiene esperanza 0 (cero) y una distribucin simtrica (como podra ser la distribucin normal o la T de Student).

7 La divisin de la zona de rechazo en dos zonas de idntico tamao en trminos de probabilidad puede

parecer arbitraria, pero es la que garantiza la mxima potencia.

142

Contraste de Hiptesis

1 /2 /2 X

Zona Rechazo 1 Punto Crtico 1

o
Zona Aceptacin Ho

Zona Rechazo 2 Punto Crtico 2

Figura 6.1: Representacin de la distribucin del estadstico bajo H0 en una prueba bilateral

1
Zona Rechazo Punt o Crtico

o
Zona Aceptacin Ho

Figura 6.2: Representacin de la distribucin del estadstico bajo H0 en una prueba unilateral derecha

1 X

Zona Rechazo Punto Crtico

o
Zona Aceptacin Ho

Figura 6.3: Representacin de la distribucin del estadstico bajo H0 en una prueba unilateral izquierda

Realizar un ensayo o muestreo ad Hoc


Esta etapa tiene por objeto obtener datos experimentales que permitan evaluar el estadstico propuesto para la prueba, de acuerdo a la planificacin realizada previamente.
143

Contraste de Hiptesis

Calcular el valor del estadstico y determinar si est dentro o fuera de la regin de rechazo
Con los datos obtenidos en el paso anterior se calcular W, cuya distribucin bajo la hiptesis nula es conocida y para la cual se han fijado las regiones de no rechazo y rechazo. Si el valor calculado de W pertenece a la regin de rechazo se concluye que la hiptesis nula debe desecharse. En caso contrario se concluye que no hay evidencia suficiente (o como se ver ms adelante, quizs suficiente potencia), para rechazarla. Ejemplo 6.1 Se desea probar si una nueva variedad de soja lograda por un proceso de mejoramiento gentico supera la base de 20 qq/ha. De acuerdo a los pasos enunciados anteriormente se tiene: Paso 1: Planteo de la hiptesis estadstica H0: 0 (20 qq/ha) H1: > 0 (20 qq/ha). Paso 2: Para probar la hiptesis se planifica una experiencia que consiste en repetir el cultivo de la nueva variedad de soja en 30 parcelas de de hectrea cada una, y registrar sus rendimientos a cosecha. Paso 3: Eleccin de la funcin de la muestra W Se tomar W(X1,...,Xn) =

F=fyyy()=fy ()() F ( x d x 2 1
-

x 2

x 1

Este estadstico, cuando = 0 y bajo el supuesto de normalidad para la variable en estudio, se distribuye como una T de Student con n-1 grados de libertad. Paso 4: Se fija el nivel de significacin , por ejemplo, en 0.05. Paso 5: Para el establecimiento de las zonas de aceptacin y de rechazo, es necesario establecer el punto crtico (PC). El PC para W, que en este ejemplo es una variable T de Student, es el cuantil 0.95 de la distribucin T con (n-1) grados de libertad y se
144

Contraste de Hiptesis

denota como T(n-1);0.95. Si de acuerdo a la planificacin del experimento hay 30 repeticiones, en la tabla t de Student se obtiene PC = 1.699, por lo tanto la zona de aceptacin de H0 (ZA) y la de rechazo de la H0 (ZR) sern: ZA = (- , 1.699) y ZR = [1.699, ) Paso 6: De acuerdo a la planificacin del experimento, referida en el Paso 2, al cabo _ de la cosecha se obtienen los siguientes resultados: X = 25 qq/ha y S = 4 qq/ha. Paso 7: Se calcula W y se observa a cul de los intervalos definidos en el Paso 5 pertenece. En funcin de ello se acepta o no la hiptesis, as: W(x1 ....xn) = 25 - 20 6.847 4 30 Como WZR se concluye que se rechaza la hiptesis nula, por lo tanto la nueva variedad supera en promedio el rendimiento de 20 qq/ha. Es importante observar que si se construye un intervalo de confianza del (1-).100 unilateral izquierdo para , el lmite inferior sera mayor que 20 qq/ha, lo cual es consistente con lo encontrado en la prueba de hiptesis. De hecho, toda prueba tiene asociada un intervalo de confianza y viceversa.

Errores
En la prueba de una hiptesis estadstica pueden ocurrir dos errores: el error de tipo I y el error de tipo II. La posible ocurrencia de uno u otro error depende de la condicin de verdadera o falsa de la hiptesis nula y de la decisin, basada en la muestra, de aceptarla o rechazarla. Si se rechaza H0, el Error de Tipo I se comete cuando H0 es verdadera. Si por el contrario se acepta H0 siendo sta falsa, entonces se cometer el Error de Tipo II. Es importante advertir que estos errores constituyen eventos de espacios muestrales diferentes definidos por la condicin de verdadera o falsa de H0. En consecuencia, si se asignan a ellos probabilidades de ocurrencia y para el error tipo I y II respectivamente, ser incorrecto decir que la probabilidad de error total en una prueba de hiptesis es la suma + .

145

Contraste de Hiptesis

Con la finalidad de dar una interpretacin de , considrese el siguiente ejemplo. Ejemplo 6.2 Una muestra de 25 observaciones procede de una distribucin normal con media =50 y desviacin estndar = 10, por lo tanto la distribucin muestral de X es normal con media = 50 y desviacin estndar / n = 10/5 = 2. Si el inters se centra en probar la hiptesis nula = 50 vs. 50, luego, se toma como estadstico de la prueba a W(X1,...,Xn ) =

( X ) 2 n

cuya distribucin es

N(0,1) cuando H0 es cierta. Para encontrar los valores de W que conducen al rechazo de H0, se obtienen los puntos crticos de la tabla de distribucin normal teniendo en cuenta que la hiptesis alternativa implica una prueba bilateral y tomando un nivel de significacin del 5%. Luego: PC1 = Z(/2) = -1.960 y PC2 = Z(1-/2) =1.960 As, la regla de decisin es: se rechaza = 50 si W es menor que -1.960 o si W es mayor que 1.960 y no se rechaza = 50 si W est entre -1.960 y 1.960. Ntese que la tabla de los cuantiles de la distribucin normal estndar muestra que el 2,5% del rea por debajo de la curva se corresponde con valores menores de -1.960 y otro porcentaje similar con valores mayores que 1.960. En sntesis: Cuando H0 es cierta el 5% de las muestras tendrn un valor de W menor que -1.960 o mayor que 1.960, y para estas muestras la anterior regla de decisin conducir al error de rechazar que es 50. Por otra parte, el 95% de las muestras presentarn valores de W entre -1.960 y 1.960 y en estos casos se decidir correctamente que = 50.

Clculo de la probabilidad de cometer Error de Tipo II ()


Prosiguiendo con el ejemplo, supngase que la hiptesis nula no es verdadera y que = 52. Lo que interesara saber, en este caso, es cul es la probabilidad de aceptar H0 cuando es falsa. Para conocer esta probabilidad se debe encontrar la probabilidad de la
146

Contraste de Hiptesis

regin de aceptacin cuando = 52. En el ejemplo, P(-1.960 W 1.960 | = 52). Para hallar esta probabilidad se debe conocer la distribucin de W cuando = 52. De

0 , 1 donde 0 es la esperanza bajo H0 y la verdadera manera general W ~ N 2 n


esperanza de la distribucin. Luego, utilizando la expresin anterior se tiene que W ~ N (1,1) cuando = 52. En consecuencia , la probabilidad de Error de Tipo II, que corresponde a la probabilidad de la regin de aceptacin bajo la hiptesis alternativa, est dada en este caso por: = P (-1.960 W 1.960 | = 52) = P ((-1.960 - 1) / 1 Z (1.960 - 1) / 1)) donde Z ~ N (0,1) Por lo tanto, si la hiptesis nula no es verdadera y = 52, entonces = 0.83. Si se toman sucesivas muestra de tamao 25 de una poblacin con = 52 (en lugar de 50) y =10, la regla de decisin que se ha usado con = 0.05 conducir a aceptar incorrectamente la hiptesis nula 83 de cada 100 veces; esto se ilustra en la Figura 6.4. Para la prueba de hiptesis acerca de la esperanza de una distribucin normal y para un nivel de significacin dado, se calcula segn las siguientes expresiones:

0 si la prueba es unilateral derecha y = P Z Z1 2 n Z Z 0 si la prueba es unilateral izquierda. =P 2 n


Si la prueba es bilateral entonces:

147

Contraste de Hiptesis

Z / 2 0 Z Z 1 / 2 0 donde Z ~ N (0,1) =P 2 2 n n

1 /2 /2 T(.)

Zona Rechazo 1 Punto Crtico 1

o
Zona Aceptacin Ho

Zona Rechazo 2 Punto Crtico 2

0 2 /n

T(.)

Figura 6.4: reas asociadas a los errores Por lo general el investigador no determina la probabilidad de cometer el error de tipo II, aunque el ejemplo anterior debe advertir sobre la importancia de tenerla en cuenta. Usualmente se prueba H0 fijando solamente pero, como se ver ms adelante, el manejo del tamao muestral o el nmero de repeticiones de un experimento, es el elemento a modificar para controlar . La importancia relativa de los errores depende de los costos inherentes a cada tipo de error y estos costos deberan servir como pautas para fijar las probabilidades de cometerlos. Las posibles decisiones y sus errores, concernientes a la prueba de hiptesis, se resumen en la siguiente tabla:

148

Contraste de Hiptesis

Tabla 6.1: Probabilidades asociadas a las distintas decisiones en la prueba de hiptesis. Decisin Si H0 Cierta y: Se rechaza H0 No se rechaza H0 Si H0 Falsa y: Se rechaza H0 No se rechaza H0 Nulo Tipo II 1- Tipo I Nulo 1- Error Probabilidad

Efectos de las variaciones de la regin de rechazo sobre


La afirmacin que aumenta segn disminuye es verdadera para n fijo. El investigador que hace el experimento quizs desee variar el nivel de significacin de la prueba para obtener la correspondiente variacin en . Un valor chico de es deseable, pero tomarlo demasiado pequeo puede hacer tan grande que se tenga muy poca chance de reconocer si la hiptesis nula es falsa.

Efecto de las variaciones del tamao de la muestra sobre


Manteniendo constante el nivel de significacin, la regin de aceptacin es ms pequea para tamaos de muestras mayores con la consiguiente disminucin de . En la Tabla 6.2 se dan los valores de para la alternativa = 52, con hiptesis nula =50, mostrando numricamente el efecto de cambiar y n sobre la probabilidad del Error de Tipo II.

149

Contraste de Hiptesis

Tabla 6.2: Valores de para n y dados. n


1 3 5 10 25 50 100 400 1000

= 0.05
0.945 0.936 0.927 0.903 0.830 0.707 0.484 0.021 0.00001

= 0.01
0.988 0.985 0.980 0.973 0.942 0.877 0.717 0.077 0.0001

Potencia de una prueba de hiptesis


Definicin 6.5: Potencia de una prueba
Se define como potencia a la probabilidad de rechazar la Hiptesis Nula cuando sta es falsa. La potencia se denota como .

Esta probabilidad representa la chance de concluir que H0 es falsa cuando efectivamente lo es. La potencia se calcula como = 1 - , donde es la probabilidad de cometer el Error de Tipo II. Cuanto mayor es la potencia mejor es la prueba. La potencia es funcin de varios factores: a) el nivel de significacin elegido, b) la varianza de la variable aleatoria y c) el tamao de la muestra. Cuando el nivel de significacin se ha fijado y la varianza de la variable aleatoria es conocida (o se ha estimado) es posible controlar la potencia de la prueba manejando el tamao muestral (o, en el caso de los diseos experimentales, manejando el nmero de repeticiones).

Curva de potencia
Hasta aqu se ha considerado solo la alternativa = 52. Otras alternativas tendrn diferentes valores de . Suponga de nuevo que se est contrastando la hiptesis = 50 vs. 50 con = 10 y = 0.05, con una muestra de tamao 25. Ahora, si bajo la
150

Contraste de Hiptesis

hiptesis alternativa es 53, se obtiene = 0.674. El valor de es ms pequeo cuando las observaciones proceden de una poblacin con = 53 que cuando proceden de una poblacin con = 52. Para cualquier n y fijos, se puede calcular para una serie de valores de y graficar la llamada curva de potencia donde la potencia se define, como ya se indicara, = 1- . La Figura 6.5 ilustra la funcin potencia () para una prueba bilateral.

o
Figura 6.5: Curva de la funcin de potencia para una prueba bilateral.

Relacin entre estimacin por intervalo de confianza y prueba de hiptesis


En este captulo y el anterior se han presentado dos procedimientos importantes en el marco de Inferencia Estadstica: la Estimacin por Intervalos de Confianza y la Prueba de Hiptesis. Los Intervalos de Confianza se plantearon para estimar parmetros, mientras que las Pruebas de Hiptesis para tomar decisiones en relacin a los valores postulados para ellos. En muchos casos los Intervalos de Confianza y las Pruebas de Hiptesis se pueden utilizar alternativamente. Por ejemplo, en el caso de que se desee determinar si el rendimiento de una nueva variedad de soja es de 20 qq/ha, se plantean las siguientes hiptesis: H0: = 20 H1: 20
151

Contraste de Hiptesis

Realizando la prueba correspondiente, se llegar a no rechazar o a rechazar H0. Este problema tambin se podra haber resuelto al obtener una estimacin de por Intervalo de Confianza. Si el valor hipottico de (20 qq/ha) hubiera quedado comprendido dentro del intervalo no se habra rechazado la H0 y en caso contrario se habra rechazado. Finalmente, en el caso que se rechace H0, se puede aplicar la estimacin por intervalo para saber cal es el valor del parmetro con una determinada confianza.

Ejercicios
Ejercicio 6.1 Una variable aleatoria sigue una distribucin N(, 144) con desconocido. a) b) c) d) e) Se descartara la hiptesis = 15 en favor de la alternativa 15, para = 0.05, si una muestra aleatoria de n = 64 observaciones arroja una media igual a 20? Construir un intervalo de confianza del 95% para . Considerando la misma hiptesis del punto a), qu sucedera con un nivel de significacin del 1%?. Construir un intervalo de confianza del 99% para . Probar H0: = 15 versus H1: > 15 para = 0.05 y = 0.01. Comparar con los resultados obtenidos en los puntos a) y c).

Ejercicio 6.2 Un proceso de fabricacin produce 12.3 unidades por hora. Esta produccin tiene una varianza igual a 4. Se sugiere un nuevo proceso que es costoso de instalar, pero se piensa que puede incrementar la produccin. Para decidir si se hace el cambio o no, se prueban 10 mquinas nuevas y se observa que stas producen en promedio 13.3 unidades. a) Calcular la probabilidad del error de tipo II en la prueba para = 12.3 vs >12.3 cuando la verdadera esperanza del nuevo proceso es = 14. Trabajar con = 0.01.

Ejercicio 6.3 Al contrastar la hiptesis = 50 vs > 50, en una distribucin normal con = 2,
152

Contraste de Hiptesis

b) c)

Con qu frecuencia sera aceptada esta hiptesis si la media verdadera fuese 51?. Trabajar con = 0.10 y n = 10. Si se desea mantener la probabilidad de Error Tipo I del punto anterior, cmo se podra disminuir la frecuencia de aceptacin de la hiptesis nula falsa?.

Ejercicio 6.4 Un genetista afirma que el rendimiento de sus hbridos es distinto al de los progenitores, el cual es de 30 qq/ha. Si la desviacin estndar es de 2 qq/ha y trabaja con una muestra de 10 hbridos: Cul es la probabilidad de que concluya que el rendimiento de los hbridos es igual al de los progenitores, si el rinde promedio es verdaderamente de 29 qq/ha?. Trabajar con = 0.05. Ejercicio 6.5 Se acepta que despus de 3 aos de almacenamiento el vigor de un arbusto forrajero medido como peso seco alcanzado a los 20 das de la germinacin es de 45 mg promedio. Un nuevo mtodo de almacenamiento se propone para aumentar el vigor. Se evalan para ello 20 lotes de 10 semillas cada uno y al cabo de 3 aos se las hace germinar, obtenindose los siguientes resultados de peso seco promedio a los 20 das: 49 60 a) b) c) 43 65 56 53 57 57 59 67 65 56 52 53 51 37 50 45 55 42

Plantear las hiptesis nula y alternativa asociadas al problema. Realizar una prueba de hiptesis con un nivel de significacin = 0.01. De acuerdo a la conclusin que se obtuvo en el punto anterior, se justifica realizar un clculo de potencia?; por qu?

Ayuda: si tuviera que calcular la potencia con la que se realiz la prueba, acepte la varianza muestral calculada como si se tratara de la varianza poblacional y tome a la media muestral como estimador de la verdadera media poblacional.

Ejercicio 6.6 Un tipo de ratn de laboratorio muestra una ganancia media de peso de 65 gr. durante los primeros tres meses de vida. Doce ratones fueron alimentados con una nueva dieta desde su nacimiento hasta los primeros tres meses de vida, observndose las siguientes
153

Contraste de Hiptesis

ganancias de peso en gr.: 65 a) b) 62 64 68 65 64 60 62 69 67 62 71 Hay razn para creer que la dieta produce una variacin significativa en la cantidad de peso ganado?. Trabajar con = 0.05. Calcular para la prueba planteada, las potencias para diferentes valores de 1 variando en el intervalo [62 gr., 70 gr.] y dibujar la curva de potencia.

154

7
7 Inferencia Sobre la Esperanza y la Varianza de Variables Aleatorias Distribuidas Normalmente
Introduccin
Como se recordar de los Captulos 5 y 6, los intervalos de confianza se plantearon para dar una medida de confianza a la estimacin de parmetros, mientras que las pruebas de hiptesis para tomar decisiones con relacin a los valores postulados para los mismos. En este captulo se abordar esta temtica, relacionada con las pruebas de hiptesis y la construccin de intervalos de confianza para la esperanza y varianza de una y dos distribuciones normales y se analizarn situaciones en donde se pueden aplicar estas metodologas.

Prueba de hiptesis acerca de una esperanza


Caso 1: Se conoce la varianza 2
Ejemplo 7.1 La produccin media de trigo por hectrea en una regin es de 2200 kg. con una desviacin estndar () de 450 kg. Se desea establecer si la aplicacin de fertilizantes modifica el rendimiento medio del trigo. De acuerdo con el algoritmo presentado en el captulo anterior se tiene: a) Se establecen las hiptesis: H0: 2200 kg y H1: > 2200 kg. b) El ensayo consiste en elegir 20 has. (una en cada chacra de la regin) en forma
155

Inferencia Sobre la Esperanza y Varianza de Una y Dos Distribuciones Normales

aleatoria y fertilizarlas, evaluando su rendimiento a cosecha.

X 0 donde Z ~ N (0,1) bajo H0 y c) Usando el estadstico Z = n


d) Eligiendo = 0.05 e) Se determinan los lmites de la regin de aceptacin: en este caso se trata de una prueba unilateral derecha cuyo nico punto crtico es Z1- = 1.645, el cual se obtiene de la Tabla de Distribucin Normal Estndar. f) Segn el experimento planificado en el paso b), la produccin media obtenida fue de 2650 kg. g) Calculando el estadstico: h) Z = 2650 - 2200 450 / 20 = 4.47

Como puede verse, Z = 4.47 > 1.645 por lo que se rechaza H0 y se concluye que la produccin media de trigo por ha. con fertilizacin, en la regin, es significativamente mayor que 2200 kg. La Figura 7.1 muestra las zonas de aceptacin y rechazo de H0 en una prueba unilateral derecha.

1 X

0 Zona Aceptacin Ho z 1

Zona Rechazo

Figura 7.1: Regin crtica para un contraste unilateral derecho, cuyo estadstico tiene distribucin normal estndar bajo H0 . Para este problema el intervalo de confianza apropiado es un intervalo unilateral izquierdo, ya que lo que importa es dar un lmite inferior para el rendimiento cuando se usa fertilizacin. Este lmite esta basado en:

156

Inferencia Sobre la Esperanza y Varianza de Una y Dos Distribuciones Normales

P(X - Z 1- . 2 n ) = (1 - )

En este caso el lmite inferior resultante es 2650-1.645 4502 20 =2484, por lo que se espera que el rendimiento del trigo fertilizado no ser menor que 2484, con una confianza del 95%. Ejemplo 7.2 Considrese ahora que se desea probar si una nueva tcnica siembra en vivero produce un aumento de la longitud, en plantines de algarrobo, al cabo de tres meses de realizada la siembra. Bajo la tcnica tradicional, los plantines alcanzan una altura promedio de 15 cm y por experiencias previas se espera que la nueva tcnica produzca un incremento de la longitud. Para evaluar el nuevo procedimiento se proponen las siguientes hiptesis estadsticas: H0: = 15 cm. vs H1: > 15 cm. El ensayo consiste en evaluar la altura de 16 plantines de algarrobo al cabo de 3 meses desde la siembra. El estadstico propuesto fue Z~N(0,1) ya que se conoce la varianza de la distribucin (9cm2) y la variable altura de plantines se supone normal. El nivel de significacin elegido fue = 0.05 y la regin de aceptacin resultante fue (- , 1.645). Esta es una prueba unilateral derecha y el valor obtenido del estadstico fue 1.333, con lo cual no se rechaz H0. La pregunta que puede derivarse de este resultado es qu chance de rechazar H0 se tena en la prueba anterior, si la verdadera esperanza de la distribucin de alturas era efectivamente 17 cm?. Para responder a esta pregunta lo que se debe hacer es calcular el valor de la funcin potencia de la prueba para ese valor de 17 cm. Esta evaluacin requiere el clculo de la probabilidad de Error de Tipo II ya que la potencia se define como 1-P(Error Tipo II). Como se indic en el captulo anterior, probabilidad de Error de Tipo II, para una prueba unilateral derecha, est dada por la siguiente expresin:

0 = P Z Z 1 2 n
donde Z representa al estadstico estandarizado de la prueba, que se distribuye N (0,1).
157

Inferencia Sobre la Esperanza y Varianza de Una y Dos Distribuciones Normales

Luego, para el problema planteado: = P ( Z 1.645 - 8/3 ) = P ( Z - 1.022 ) = 0.15339 Este resultado indica que la probabilidad de aceptar H0 siendo falsa es 0.15, lo cual da una potencia (1 - ) de 0.85. En consecuencia, el no rechazo de H0 en vista de la alta potencia la prueba, es confiable.

Caso 2: No se conoce la varianza 2


Ejemplo 7.3 Se piensa que la produccin promedio de un nuevo cultivar de trigo es superior al rendimiento promedio del trigo que se siembra usualmente, que es de 2000 kg./ha. Para establecer si esto es cierto se procede a realizar una prueba de hiptesis. De acuerdo al algoritmo presentado en el captulo anterior se tiene: a) Sea la esperanza de la distribucin de rendimientos en la regin con el nuevo cultivar, el problema consiste en decidir entre: H0: 2000 kg./ha y H1: > 2000 kg./ha b) Para probar esta hiptesis se seleccionan aleatoriamente, dentro de la regin de inters, 12 campos de 5 has. cada uno en los que se sembrar el nuevo cultivar, registrndose su rendimiento a cosecha. Se supone que el rendimiento promedio es una variable aleatoria normal ya que a travs del teorema central del lmite puede justificarse que la variable rendimiento, por ser en este ejemplo acumulacin de miles de rendimientos individuales, tiene esta distribucin . X 0 Se propone el estadstico T = que bajo H0 se distribuye como una T de S n Student con n-1 grados de libertad. Recurdese que esto se debe a que se desconoce la varianza de la distribucin y se la estima por S2. d) e) Se fija un nivel de significacin = 0.05 Como se espera que el nuevo cultivar tenga un rendimiento promedio ms alto, cuanto mayor resulte la media muestral, ms se alejar (hacia la derecha) el estadstico T de su valor esperado bajo la hiptesis nula que es 0. Luego, se est

c)

158

Inferencia Sobre la Esperanza y Varianza de Una y Dos Distribuciones Normales

en presencia de un contraste unilateral derecho cuya regin de rechazo queda definida por el intervalo (T(n-1); 1- , ). La probabilidad de esta regin bajo H0 es, obviamente, . Luego el punto crtico es T (12-1) ; 0.95 = 1.796, el cual se obtiene de la Tabla T de Student. f) g) El rendimiento promedio del nuevo cultivar calculado a partir de las 12 parcelas es X = 2020 y la desviacin estndar estimada S = 100. Luego el valor del estadstico es: T= 2020 - 2000 100 / 12 = 0.692

Dado que T = 0.692 < T (12-1) ; 0.95 = 1.796 no se rechaza H0. Se concluye que no hay evidencia de que el nuevo cultivar tenga un rendimiento promedio mayor a 2000 kg./ha. La construccin de un intervalo de confianza bilateral para sera til para dar un informe ms completo. Dicho intervalo est dado por la siguiente expresin:
P(X - T 1-/2 . S2 n X + T 1-/2 . S2 n ) = (1 - )

Prueba de hiptesis acerca una varianza


Ejemplo 7.4 Una firma agroindustrial desea incorporar un nuevo mecanismo en las mquinas enfardadoras que fabrica. El ingeniero a cargo del proyecto sospecha que esta innovacin puede producir un aumento de la varianza del peso de los fardos. La desviacin estndar que se obtiene con la maquinaria sin modificar es de 1.5 kg. Para evaluar el nuevo mecanismo, se realiz un ensayo tomando 10 fardos al azar de un lote de alfalfa. Los pesos de dichos fardos fueron: 28.3; 27.8; 29.3; 30.1; 32.5; 27.2; 25.3; 32.2; 33.6; 30.7, con varianza muestral = 6.87. 3. Con esta evidencia se desea probar la siguiente hiptesis: H0:2 =2.25 vs. H1:2 > 2.25 4. El estadstico a utilizar es

(n 1) S 2

que se distribuye como 2(n - 1).


159

Inferencia Sobre la Esperanza y Varianza de Una y Dos Distribuciones Normales

5. Se fija = 0.10. 6. Luego, se obtiene el cuantil 0.90 de la distribucin 2(10-1) en la Tabla Chi-cuadrado, que es 2(9; 0.90) = 14.68, delimitando as las regiones de no rechazo y rechazo de H0. 7. Se evala el estadstico (n - 1) S / 2 = 27.48 0 8. Dado que 27.48 est dentro de la regin de rechazo, se rechaza H0. Esto implica que el nuevo mecanismo provoca un aumento de la varianza del peso de los fardos.
2

Nota: en el caso que se desee contrastar una alternativa bilateral:


2 H0: 2= 0 y H1: 2 2 0 2 se usar igualmente el estadstico 2= (n - 1) S / 0 para probar la hiptesis nula y se
2

determinar la regin crtica, que estar delimitada por los cuantiles /2 y 1-/2 de la distribucin chi-cuadrado.

Estimacin por Intervalo de una varianza


Si S2 es el estimador de 2 para muestras de tamao n, entonces se puede proponer como funcin para construir el intervalo a la siguiente expresin: g (2,S2) = (n-1) S2 / 2 Se sabe que (n-1) S2/2 ~ 2n-1 Siendo los cuantiles q1 = 2 (n - 1) ; ( / 2) y q2 = 2 (n - 1) ;(1 - / 2), se tiene: P (q1 S2 (n-1) / 2 q2) = 1 - Luego, despejando 2: P (S2 (n -1) / q1 2 S2 (n -1 ) / q2) =1- Reordenando se tiene: P (S2 (n -1 ) / q2 2 S2 (n -1 ) / q1) = 1- Luego: LI = S2 (n -1 ) / q2 y LS = S2 (n -1 ) / q1 son los lmites inferior y superior, respectivamente, del intervalo de confianza 1- para 2.
160

Inferencia Sobre la Esperanza y Varianza de Una y Dos Distribuciones Normales

Ejemplo 7.5 Retomando el ejemplo anterior, si se quiere estimar por intervalo de confianza al 90% la varianza del peso de los fardos se tendr: LI= 6.87 (9)/ 16.92 = 3.25 y LS= 6.87 (9)/ 3.32 =22.9

Prueba de hiptesis para dos varianzas


A veces se quiere comparar las varianzas de dos variables aleatorias con distribucin normal. Para ello usualmente se cuenta con muestras independientes, una de cada distribucin, de tamaos n1 y n2 respectivamente. Si las varianzas de las poblaciones que se estn muestreando son iguales, entonces el 2 2 cociente S1/S2 se distribuye como una distribucin F con (n1-1) y (n2-1) grados de libertad. Definicin 7.1: Distribucin F
Sean X1 y X2 variables aleatorias (independientes) con distribucin 2 con 1 y 2 grados de libertad respectivamente y sea F la variable aleatoria construida a partir de las primeras mediante la siguiente expresin:

X1 n F= 1 X2 n2
luego F se distribuye como una F de Snedecor con 1 y 2 grados de libertad. Denotaremos a una distribucin F con 1 y 2 grados de libertad como F v
1 2
;v .

Esta distribucin, atribuida a Snedecor, est definida para valores no negativos y se caracteriza por los grados de libertad del numerador y del denominador de la expresin anterior. La distribucin es asimtrica y el grado de asimetra depende los grados de libertad. Un resultado importante es que si se toman dos muestras aleatorias e independientes 2 de tamaos n1 y n2 de una distribucin normal con varianza y a partir de ellas se
2 2 calculan las varianzas muestrales S1 y S 2 se tiene que S1 (n1-1) / 2
2

con (n1-1)

grados de libertad y S 2 (n2-1) / 2

con (n2-1) grados de libertad y usando la

Definicin 7.1, se puede justificar que:


161

Inferencia Sobre la Esperanza y Varianza de Una y Dos Distribuciones Normales

S12 (n1 -1) / 2 S12 (n1 -1) = 2 2 S2 (n2 -1) / 2 S2 ( n2 -1)

F(n1-1),(n2-1)

La Tabla de Cuantiles de la Distribucin F del Anexo presenta algunos cuantiles correspondientes a la distribucin F de Snedecor acumulada, para varias combinaciones de grados de libertad del numerador y del denominador del cociente dado en la definicin. Por ejemplo, si F F3,10 entonces P[F4.83] = 0.975. Ejemplo 7.6 Retomando el ejemplo 4.3, del Captulo 4; cuyos estadsticos muestrales se reproducen en la siguiente tabla:

Lote 1 2

n 10 10

Media Varianza 46.3 52.6 39.4 63.8

las varianzas muestrales de ambos lotes parecen diferentes. Pero es sta diferencia significativa?. Desde el punto de vista estadstico se puede presentar esta cuestin en trminos de probabilidad. Si las varianzas de estas poblaciones fueran iguales entonces el cociente de las varianzas muestrales se distribuye segn una F con 9 y 9 grados de libertad. Por lo tanto el 95% de todos los valores muestrales de los cocientes de pares de varianzas obtenidos con tamaos muestrales de 10 estarn comprendidos entre los percentiles 0.025 y 0.975 de esa distribucin. En este caso estos cuantiles asumen los valores 0.2484 y 4.0260 respectivamente. Luego como el cociente 63.8 / 39.4 = 1.62 est entre 0.2484 y 4.0260, se puede decir que el cociente observado es compatible con la suposicin de que las varianzas son iguales y en consecuencia no hay evidencia para rechazar la hiptesis de igualdad de varianzas.

162

Inferencia Sobre la Esperanza y Varianza de Una y Dos Distribuciones Normales

Prueba de hiptesis y estimacin por intervalo de confianza para la diferencia de dos esperanzas
Caso 1: Las varianzas son conocidas
Sean 1 y 2 las esperanzas de las distribuciones 1 y 2 respectivamente y X1 y X2 dos estimadores independientes de las respectivas esperanzas. Como las medias muestrales X1 y X2 tienen distribucin normal con parmetros 2 (1, 12 /n1) y (2, 2 /n2) respectivamente, y como la diferencia de variables aleatorias normales e independientes es tambin una variable aleatoria normal con esperanza igual a la diferencia de las esperanzas y varianza igual a la suma de las varianzas, se tiene: 2 (X1 - X2) ~ N ((1-2), (2/ n1 + 2 / n2)) 1 de lo que se deduce que : Z =

_ _ ( X 1 - X 2 ) - ( 1 2 )
2 12 2 + n1 n2

~ N (0,1)

2 donde 1 y 2 corresponden a las varianzas de las distribuciones y n1 y n2 a los 2

tamaos de las muestras a partir de las cuales se calcularon X1 y X2. Esta es la expresin del estadstico Z que se usa para probar hiptesis referidas a la diferencia entre las medias, siguiendo el procedimiento general presentado en el Captulo 6. El intervalo de confianza para (1 - 2) con una confianza (1 - ), se construye en forma similar al de la esperanza de una distribucin con q1= Z(/2) y q2= Z(1-/2). Luego:

_ _ ( X 1 - X 2 ) - ( 1 2 ) Z P (Z(/2) (1-/2)) = 1- 2 12 2 + n1 n2
despejando (1 - 2) y teniendo en cuenta que Z(1-/2) = - Z(/2) se tiene:

163

Inferencia Sobre la Esperanza y Varianza de Una y Dos Distribuciones Normales

P ( (X1-X2) -Z(1-/2) .

2 1 + 2 - (X -X ) + Z 2 . 1 2 1 2 (1-/2) n1 n 2

2 1 + 2 ) = 1- 2 n1 n 2

As: LI = (X1-X2) - Z(1-/2)

2 1 + 2 2 n1 n 2

y LS = (X1-X2) + Z(1-/2)

2 1 + 2 son 2 n1 n 2

los lmites inferior y superior, respectivamente, del intervalo de confianza 1- para 12.

Caso 2: Las varianzas son desconocidas


Para hacer inferencia sobre las esperanzas de dos distribuciones normales cuando no se conocen las varianzas, es necesario establecer previamente si dichas varianzas son o no iguales ya que de ello depende el estadstico a usar en la prueba de hiptesis como, as tambin, la funcin con la que se construye el intervalo de confianza. Por lo tanto, antes de probar la diferencia entre dos medias, se prueba si las varianzas poblacionales son iguales.

Caso 2-a: Las varianzas son desconocidas e iguales


Ejemplo 7.7 Suponga que se quieren comparar dos variedades de man, en cuanto al contenido de aceite de las semillas. Las hiptesis de esta prueba son H0: 1= 2 vs H1: 1 2. Para probar las hiptesis anteriores se disea un ensayo en el que para cada variedad se obtienen los contenidos de aceite de 10 bolsas de 1kg de semillas de man cada una extradas aleatoriamente de un semillero. Los resultados del ensayo son los siguientes: Tabla 7.1: Resultados de un ensayo comparativo de contenido de aceite en la semilla de man de dos variedades Variedad 1 2 n 10 10
X

S2 65.3 67.9

160.4 165.6

La prueba de esta hiptesis se realiza con un estadstico que depende de la igualdad de varianzas. Luego, para elegir el estadstico de la prueba se debe probar la hiptesis
164

Inferencia Sobre la Esperanza y Varianza de Una y Dos Distribuciones Normales


2 S1 S2 2

2 2 H0: 1 = 2 vs H1: 1 2 . Para ello se utiliza el estadstico F= 2 2

que bajo H0

se distribuye como F con 9 y 9 grados de libertad. Por lo tanto la regin de aceptacin para un nivel de significacin del 5% est delimitada por los valores 0.248 y 4.03, correspondientes a los cuantiles /2 y (1 - /2), respectivamente. Calculando el estadstico propuesto se obtiene F=0.962 que est dentro de la regin de aceptacin. Luego, no se rechaza la igualdad de varianzas y en consecuencia el estadstico apropiado para la prueba de hiptesis de igualdad de medias es el siguiente:

T=

( X 1 X 2)
2 (n1 1) S12 + (n 2 1) S 2 1 1 + n1 + n 2 2 n1 n 2

que se distribuye segn una T de Student con (n1 + n2 2) grados de libertad. Fijando =0.01 se tiene que los puntos crticos que delimitan la regin de aceptacin son -2.878 y 2.878. Utilizando los valores muestrales de las medias y varianzas se obtiene T = -1.43. Como este valor est dentro de la regin de aceptacin, se concluye que no hay evidencia para rechazar H0. Los argumentos propuestos para la construccin del intervalo de confianza son similares a los ya sealados. Luego, para encontrar por ejemplo el intervalo de confianza al 90% con tamaos muestrales n1 = 10 y n2 = 10 se necesitan los cuantiles q1 = T 18; (0.05) = -1.734 y q2 = t 18; (0.95) = 1.734 y, siguiendo la metodologa general propuesta, se tiene:

2 n1 + n 2 n + n2 P((X1 - X2 ) -1.730 S 2 . 1 p 1 - 2 (X1 - X2) + 1.734 S p. )=0.90 n1.n 2 n1.n 2


por lo cual: LI = (X1-X2) - 1.734 .

2 n1 + n 2 . S p. . y LS = (X1-X2) + 1.734 n1 n 2

2 n1 + n 2 S p. . son n1 n 2

los limites de confianza para este ejemplo.

165

Inferencia Sobre la Esperanza y Varianza de Una y Dos Distribuciones Normales

Caso 2-b: Las varianzas son desconocidas y diferentes


Recurdese que segn lo estudiado en el Captulo 4, la desviacin estndar de la
diferencia de medias muestrales, SX1-X2, se calcula como:

Sx1 x 2 =

S12 n1

S22 n2

La estandarizacin que se obtiene utilizando las estimaciones de las varianzas muestrales es la siguiente:

( ) (1 2 ) T = X1 X 2 S x1 x 2

que tiene distribucin T de Student con los grados de libertad que se especifican a continuacin:

(S

n1) ( S 2 n 2 ) + n1 + 1 n2 + 1
2 1 2 2

S1

n1

+ S2

n2

Luego, la prueba de hiptesis utiliza el estadstico T y el proceso de construccin del intervalo de confianza tiene la expresin final que se presenta a continuacin. P ( (X1 - X2 ) - T ( ; 1-/2). SX1-X2 1 - 2 (X1 - X2) + T ( ; 1-/2) . SX1-X2= 1 -

Caso 3: Dos muestras no independientes


Se analizar ahora la diferencia entre las esperanzas de dos grupos cuando los datos se obtienen de muestras que estn relacionadas; es decir, los resultados del primer grupo no son independientes de los del segundo. Por ejemplo, esto ocurre cuando se mide la presin arterial en cada uno de los individuos de un grupo experimental antes y despus de la administracin de una droga. El objetivo es comprobar si la droga produce efectos en la presin sangunea. Los pares de observaciones (antes y despus) obtenidas en cada individuo no son independientes ya que la presin arterial posterior a la administracin de la droga depende de la presin arterial inicial. Una situacin equivalente ocurre cuando, por ejemplo, se desea probar si hay
166

Inferencia Sobre la Esperanza y Varianza de Una y Dos Distribuciones Normales

diferencias en el tamao y calidad de las semillas recolectadas de flores de la parte apical y basal en plantas de alfalfa. En este caso se puede sealar que la vinculacin o dependencia entre las observaciones, sobre flores de la parte apical y basal, est relacionada con la calidad de la planta madre. As, se encontrarn plantas que producen semillas de alta calidad y otras con semillas de baja calidad, independientemente de las variaciones entre las partes alta y baja de la planta. Otro ejemplo: supngase que en un ensayo para comparar rendimientos con dos fertilizantes A y B se siembran diez parcelas de trigo tratadas con el fertilizante A en 10 zonas experimentales y otras 10 parcelas de trigo tratadas con el fertilizante B en otras 10 zonas experimentales. Si el promedio de las parcelas tratadas con el fertilizante A se compara con el obtenido para el fertilizante B, parte o gran parte de la diferencia observada (si la hay) puede deberse a los diversos tipos de terreno o a las distintas condiciones climticas de las zonas experimentales, estas fuentes de variacin pueden enmascarar o confundir el efecto diferencial de los fertilizantes que se comparan. Un arreglo diferente de este experimento, que permite disminuir las fuentes de variacin indeseables, consiste en obtener observaciones apareadas. Este diseo de experimento alternativo podra ser el siguiente: se eligen al azar 10 zonas experimentales y en cada una de ellas se siembran dos parcelas contiguas (para asegurar que las condiciones locales sean las mismas) y cada una es tratada con el fertilizante A o B respectivamente. En este caso, tambin se obtienen 20 observaciones pero stas estn apareadas de a dos. Con el trmino observaciones apareadas se hace referencia al diseo de experimentos que produce observaciones de a pares de las dos distribuciones que se comparan. En este tipo de diseo la variable de inters es la diferencia entre los valores de cada uno de los pares observados. El objetivo es reducir la variabilidad debida a factores que introducen efectos extraos a aquel que se desea medir. Sea Xi1 el primer miembro del par i-simo y Xi2 el segundo miembro, para n pares de observaciones se tendr: (X11,X12) , (X21,X22) , (X31,X32) , ... , (Xn1,Xn2). Si se toman las diferencias di = Xi1- Xi2, se tendr un conjunto de n observaciones, cada una de las cuales es una diferencia entre dos observaciones originales. El uso de este diseo es recomendable cuando se desea eliminar una fuente de variacin que tiene un efecto aditivo sobre ambos miembros del par. Es decir, se supone que el efecto es esencialmente el de aumentar o disminuir, mediante alguna constante, cada una de las esperanzas de modo que al tomar la diferencia entre los miembros del par se elimine dicho efecto. El uso arbitrario de este diseo, cuando el apareamiento no implica una disminucin
167

Inferencia Sobre la Esperanza y Varianza de Una y Dos Distribuciones Normales

de las fuentes de variacin no deseadas, produce una perdida de potencia. Prueba T para observaciones apareadas Esta prueba se basa en la distribucin de la variable diferencia entre los pares de observaciones. Si Xi1 y Xi2 tienen distribucin normal, entonces, las di= Xi1-Xi2 tendrn distribucin normal con esperanza d= 1-2 y varianza 2 . El estimador de d

1 1-2 es d = d i y el estimador de d es S d = n i =1
n

i =1

( di d )
n

n 1

Nota: Por la falta de independencia entre los elementos de los pares de observaciones, la varianza de la diferencia es menor que la suma de las varianzas de las variables originales, de all la ventaja de este diseo.

Si la hiptesis nula que se quiere probar es 1-2= 0, esto implica d= 0, luego para probar esta hiptesis el estadstico apropiado es:

T=

d Sd n

(n-1)

donde el n es el nmero de pares de observaciones en la muestra.


Nota: Esta prueba no requiere el supuesto usual de homogeneidad de las varianzas 2 2 1 y 2 ya que se basa en la varianza de las diferencias que se estima independientemente de stas.

Para la construccin del intervalo de confianza correspondiente, se sigue el procedimiento conocido y el intervalo se basa en la siguiente expresin: P ( d - T (n -1 ; 1-/2) .

Sd n

1 - 2 d + T (n -1 ; 1 - / 2) .

Sd n

)=1-

Ejemplo 7.8 Se quiere comparar el efecto de dos virus sobre plantas de tabaco. Para esto se realiz el siguiente experimento: Se seleccionaron al azar 8 plantas y en cada una de ellas se tomaron 2 hojas apicales.
168

Inferencia Sobre la Esperanza y Varianza de Una y Dos Distribuciones Normales

Sobre cada una de ellas se aplicaron los preparados conteniendo los virus cuyos efectos se queran evaluar. La variable de respuesta fue la superficie en mm2 de las lesiones locales que aparecan como pequeas manchas oscuras en las hojas. Los resultados fueron: Preparado 1 31 20 18 17 9 8 10 7
X 1= 15

Preparado 2 18 17 14 11 10 7 5 6
X 2 = 11

di 13 3 4 6 -1 1 5 1 d= 4

Como el objetivo del ensayo fue comparar si existan diferencias entre los efectos de los dos virus se plante la siguiente hiptesis: H0: 1 = 2 vs H1: 1 2 usando como estadstico:

T=

d Sd n

que se distribuye como una T de Student con (8-1=7) grados de libertad. Fijando = 0.05 se determina la regin de aceptacin como el intervalo (t /2= -2.365 , t 1-/2 = 2.365). Luego, evaluando el estadstico se obtiene: t= 4 = 2.63 > 2.365 por lo que se rechaza H0. 4.30/ 8

De acuerdo al resultado anterior, se concluye que las diferencias observadas entre las reas daadas por uno u otro virus son estadsticamente significativas.
Nota: Como siempre, se pueden derivar alternativas unilaterales para esta prueba.

169

Inferencia Sobre la Esperanza y Varianza de Una y Dos Distribuciones Normales

Ejercicios
Ejercicio 7.1 Se considera que la fibra de un tipo de algodn es de buena calidad si su longitud media es mayor a 210 mm, con una desviacin estndar de 50 mm. Para saber si un lote cumple con las especificaciones se toman 50 bolsas y de cada una de ellas se extraen 100 fibras y se calcula la longitud promedio por bolsa. a) b) Se trata de una prueba bilateral, unilateral derecha, o unilateral izquierda?. Cul es el promedio de 50 bolsas ms pequeo para que un lote sea aceptado si se trabaja con un nivel de significacin del 5%?

Ejercicio 7.2 Cuando la cantidad de semillas de soja que quedan en el suelo luego de pasar la cosechadora es igual o mayor a 80 semillas/m2, la prdida de produccin, en qq/ha, es grande. Un productor decide probar el funcionamiento de su mquina y para ello luego de cosechar una parcela cuenta en 10 unidades de 1 m2 cuntas semillas quedan en el suelo. Los resultados fueron, en semillas/m2: 77 a) 73 82 82 79 81 78 76 76 75 Se puede concluir, trabajando con un nivel de significacin del 10%, que la cosechadora est funcionando bien?, es decir, est la perdida dentro de los lmites admisibles?. Construir un intervalo de confianza para apropiado para el problema.

b)

Ejercicio 7.3 Referido al problema anterior: a) Si las normas tcnicas indican que la desviacin estndar del nmero de semillas cadas por m2 no debera ser superior a 5, qu se debera concluir sobre la mquina trabajando con un nivel de significacin = 0.10? Construir un intervalo de confianza para 2.

b)

Ejercicio 7.4 Un experimentador avcola considera que al suministrar una racin especial a pollitos de la raza Cornich, ha de lograr un peso medio superior a 700 gr. por animal luego de
170

Inferencia Sobre la Esperanza y Varianza de Una y Dos Distribuciones Normales

cuatro semanas de alimentacin. Para verificarlo alimenta con la racin a un lote de 50 pollitos y a los 28 das obtiene un peso promedio de 730 gr. con una desviacin estndar de 40.21 gr. a) b) c) Establecer las hiptesis nula y alternativa. Realizar la prueba correspondiente utilizando = 0.05. Construir un intervalo de confianza para .

Ejercicio 7.5 Para evaluar la homogeneidad de la fertilidad de un suelo se tomaron alcuotas de 20 extracciones de suelo y se midi su contenido de nitrgeno. Los resultados, en ppm, fueron: 0.50 0.49 0.48 0.47 0.39 0.44 0.41 0.45 0.43 0.40 0.49 0.38 0.54 0.50 0.48 0.51 0.52 0.52 0.51 0.45

Se acepta que un suelo es homogneo en fertilidad, si el contenido de nitrgeno presenta una varianza de a lo sumo 0.005. Con los datos de la muestra, construir un intervalo de confianza apropiado (unilateral o bilateral) al 90 % y evaluar a partir de l si el suelo es homogneo o no en su fertilidad. Ejercicio 7.6 Los siguientes datos corresponden a los residuos de Parathion (en ppm.) en plantas de un lote de apio. Los resultados obtenidos fueron: 0.26 0.52 0.52 0.50 0.45 1.08 0.34 0.33 0.25 0.29 0.18 0.42 0.15 1.05 0.95 0.92 0.52 0.41 0.77 0.44 0.29 0.44 0.64 0.36 0.50 0.60 0.92 0.58 0.46 0.52 0.24 0.53 0.39 0.40 0.54 0.47 0.43 0.32 0.38 0.31 0.25 0.60 0.84 0.55 0.26 0.51 0.50 0.75 0.54 0.60 0.71 0.56 0.52 0.49 0.50 0.43 0.59 0.26 0.24 0.66 0.66 0.56 0.66 0.92 0.67 0.52 0.36 0.50 0.52 0.45 0.92 0.51 0.40 0.60 0.85 0.53 0.44 0.30 Un ente fiscalizador establece que si el residuo de insecticida es mayor que 0.50 ppm, se debe rechazar el lote de plantas de apio para consumo humano. Qu decisin se
171

Inferencia Sobre la Esperanza y Varianza de Una y Dos Distribuciones Normales

tomara, a partir de esta informacin, trabajando con = 0.01? Ejercicio 7.7 Uso de la tabla de la Distribucin F de Snedecor. La tabla que se presenta en el Anexo muestra algunos cuantiles correspondientes a la distribucin F acumulada para varias combinaciones de grados de libertad del numerador y del denominador. Como ejemplo del uso de la tabla, supngase que se quiere encontrar la probabilidad de que una variable cuya distribucin es F con 3 y 10 grados de libertad tome valores menores o iguales a 4.83. Esto es P (F3,10 4.83 ). Para hallar esta probabilidad se busca en la hoja de la tabla (notar que la misma ha sido fraccionada en varias hojas) en cuyo vrtice superior izquierdo aparece un 3 (grados de libertad del numerador). Luego, sobre el margen izquierdo se localiza la fila que comienza con el nmero 10 y que corresponde a los grados de libertad del denominador de la distribucin F. En la fila seleccionada, se busca 4.83. El valor que encabeza la columna donde se encuentra 4.83 es 0.975, luego P (F3,10 4.83) = 0.975; es decir 4.83 es el cuantil 0.975 de una distribucin F de Snedecor con 3 y 10 grados de libertad. Como ejercicio sobre el uso de esta tabla, encuntrese: a) b) c) P ( F 1.8376 ) si F se distribuye con distribucin F20,11. El cuantil 0.10 de una distribucin F15,12. El valor de una variable distribuida como una F1,5 que acumula el 95% de los valores de la distribucin.

Ejercicio 7.8 Un grupo de conejos fue sometido a una serie de situaciones de tensin que producan una respuesta de temor. Despus de un perodo de tiempo bajo estas condiciones, los conejos fueron comparados con los de un grupo control, que no haba sido sometido a tensin. La variable de respuesta fue el peso (en mg) de la glndula suprarrenal. Los resultados fueron: Grupo Experimental: 3.8 6.8 8.0 3.6 3.9 5.9 6.0 5.7 5.6 4.5 3.9 4.5 Grupo Control: a)
172

4.2 4.8 4.8 2.3 6.5 4.9 3.6 2.4 3.2 4.9

Comparar el peso de la glndula suprarrenal entre el grupo control y el

Inferencia Sobre la Esperanza y Varianza de Una y Dos Distribuciones Normales

experimental con un nivel de significacin del 5%. b) c) Construir un intervalo de confianza para la diferencia de medias poblacionales. Qu supuestos se necesitan para que los procedimientos utilizados en a) y b) sean estadsticamente vlidos?.

Ejercicio 7.9 Se est experimentando con un herbicida en maz, y para ponerlo a prueba se evalan los rendimientos de 12 parcelas experimentales. En 6 de ellas se utiliz el nuevo herbicida y en las restantes un herbicida tradicional como control. Los resultados del ensayo, expresados en quintales por hectrea, son los siguientes:

Nuevo herbicida: Viejo herbicida: a) b) c)

68.1 64.7

74.6 62.5

64.4 66.8

69.2 69.2

61.8 53.9

57.9 58.5

Qu se puede decir del desempeo del nuevo herbicida en relacin al control, trabajando con un nivel de significacin = 0.10? Qu supuestos se necesitan para que el procedimiento usado sea vlido? Construir un intervalo de confianza para la diferencia de medias poblacionales.

Ejercicio 7.10 Para probar el efecto de distintas pasturas en el aumento de peso de novillos Aberdeen Angus, se seleccionaron 70 animales. 35 de ellos fueron elegidos al azar y se los aliment durante 140 das con Triticale. Los otros 35 se alimentaron por igual perodo con Mijo. El promedio de aumento diario de peso en kg. fue de 0.65 con una desviacin estndar de 0.08 kg. para el primer grupo y de 0.80 kg. con una desviacin de 0.10 kg. para el segundo. Existen diferencias significativas en el aumento de peso producido por estas dietas, trabajando con un nivel de significacin del 1%? Ejercicio 7.11 Para probar la eficacia de un tratamiento de poda en un bosque de Raul, un investigador decide comparar el incremento del dimetro de los fustes de los rboles podados, con el incremento en rboles sin poda. Para ello se localizan 20 lotes de los
173

Inferencia Sobre la Esperanza y Varianza de Una y Dos Distribuciones Normales

cuales a 10 se los poda y al resto no. Al cabo de 3 aos se obtienen los incrementos promedio para cada lote siendo los resultados los siguientes (en cm):
Stand con poda: 0.29 Stand sin poda: 0.30 0.305 0.303 0.28 0.27 0.32 0.30 0.35 0.32 0.297 0.31 0.30 0.28 0.298 0.302 0.315 0.298 0.324 0.301

Cul es el efecto de la poda? Trabaje con un nivel de significacin del 5%. Ejercicio 7.12 A los fines de determinar los efectos de la restriccin alimentaria en la qumica sangunea de vacunos se midieron los metabolitos Calcio (Ca) y Fsforo (P) en sangre. El experimento se realiz tomando un lote de novillos de 180 kg. de peso promedio. De ellos, se eligieron aleatoriamente 10 para constituir el lote control (no restringidos) que eran alimentados con centeno a voluntad. El otro lote (restringidos) se conform por los 10 animales restantes. La restriccin consisti de dejar los novillos en pastoreo por 3 horas/da y luego pasarlos a corral pelado. Se obtuvieron los siguientes resultados: CALCIO Restringidos 6.93 8.42 8.55 8.69 8.82 8.82 8.95 8.95 9.61 9.10 a) b) c)
174

FOSFORO Restringidos 7.24 7.46 7.59 7.73 7.86 8.26 8.39 8.39 8.53 8.53 No Restringidos 8.69 6.13 6.79 6.79 6.93 7.59 7.86 9.06 9.59 9.73 5.99 8.82 8.82 8.82 8.95 8.95 9.05 9.34 9.34 10.66

No restringidos

Cul es la prueba apropiada para evaluar el efecto de la restriccin en cada metabolito? Probar los supuestos necesarios para la prueba anterior Altera la restriccin alimentaria los parmetros sanguneos?. Utilizar = 0.05.

Inferencia Sobre la Esperanza y Varianza de Una y Dos Distribuciones Normales

Ejercicio 7.13 La siguiente tabla presenta los resultados de una experiencia conducida para probar la hiptesis de que una dieta rica en lecitina favorece la produccin de leche, en vacas de la raza Holando-Argentino. En este experimento se seleccionaron 18 tambos homogneos en cuanto al manejo, de los cuales 9 fueron asignados aleatoriamente para recibir un suplemento de lecitina y los restantes actuaron como control. Debido a fallas en el seguimiento de uno de los tambos que no reciba el suplemento de lecitina, sus datos fueron descartados. Los resultados, expresados en lts/da promedio por vaca son los siguientes: Sin Lecitina Con Lecitina 13.0 17.0 14.5 16.5 16.0 18.0 15.0 17.3 14.5 18.1 15.2 16.7 14.1 19.0 13.3 18.3 18.5

Sean SL la media de produccin diaria de leche para animales de la raza Holando Argentino alimentados normalmente y CL la media de produccin de los animales alimentados con una dieta rica en lecitina. En base a los datos experimentales verificar la hiptesis: H0: CL = SL vs. H1: CL SL (utilice = 0.05) Cmo se informa el resultado de este ensayo?. Ejercicio 7.14 Un investigador supone que el estrs que se produce en vacas fistuladas puede disminuir los niveles de fsforo en sangre. Para probar su hiptesis selecciona 8 vacas y a cada una de ellas le extrae una muestra de sangre antes de la fistulacin y otra muestra despus. Los resultados son: Vaca 1 2 3 4 5 6 7 8

Antes de la fistulacin. 8.69 7.13 7.79 7.93 7.59 7.86 9.06 9.59 Despus de la fistulacin 7.24 7.10 7.80 7.95 7.50 7.79 9.00 9.48 Qu conclusin se puede extraer acerca de la fistulacin? Utilizar = 0.01.

175

Inferencia Sobre la Esperanza y Varianza de Una y Dos Distribuciones Normales

Ejercicio 7.15 Un criadero de semillas interesado en evaluar el comportamiento bajo riego de 2 hbridos de maz realiz el siguiente ensayo: se tomaron 2 surcos de 50 m. y se delimitaron 10 sectores de 5 m. cada uno. Se sabe que el perfil de infiltracin del agua es distinto a lo largo del surco de riego. Para evitar que este factor afecte la evaluacin del rendimiento de los hbridos, en cada uno de los sectores de 5 metros de surco se asignaron aleatoriamente cada uno de ellos. Los datos obtenidos en qq/ha fueron: Sector Hbrido 1 Hbrido 2 1 123 127 2 121 130 3 119 118 4 115 117 5 111 114 6 105 110 7 106 115 8 114 120 9 120 125 10 127 133

Concluir acerca del comportamiento de los hbridos bajo riego. Utilizar = 0.05.

176

8
8 Anlisis de la Varianza
Introduccin
El Anlisis de la Varianza -ANAVA- es, probablemente, la herramienta de inferencia estadstica ms utilizada en las investigaciones cientfico-tcnicas en el campo de las ciencias biolgicas en general y en las agropecuarias en particular. El ANAVA es un mtodo estadstico cuya finalidad es probar hiptesis referidas a los parmetros de posicin de dos o ms poblaciones en estudio.

Definiciones preliminares
A continuacin se dan un conjunto de definiciones necesarias para el tratamiento del tema. Definicin 8.1: Unidad experimental
Se llama unidad o parcela experimental a la mnima porcin del material experimental sobre el cual un tratamiento puede ser realizado.

Por ejemplo, en un ensayo comparativo de rendimientos de trigo donde se desean evaluar 3 variedades se puede disponer de 30 parcelas de 1 m2 cada una (unidades experimentales). Al final de la experiencia las plantas de cada parcela se cosecharn y en base a ello se realizar una medicin del rendimiento en cada unidad. Es importante conducir las experiencias de forma tal que las unidades experimentales generen informacin independiente. As por ejemplo, para que el rendimiento de cada parcela sea independiente del rendimiento en las parcelas vecinas, se recurre a la aleatorizacin de las variedades a las parcelas. Adems, es comn en la investigacin agropecuaria dejar espacio suficiente entre una parcela y otra para evitar dependencias
177

Anlisis de la Varianza

o no dejar espacios libres, con el fin de simular mejor las condiciones reales de cultivo, y luego evaluar slo el sector central de cada parcela. Esta tcnica se conoce con el nombre de "bordura". Definicin 8.2: Tratamiento
Se denomina tratamiento al conjunto de acciones que se aplican a las unidades experimentales con la finalidad de observar como responden a stas.

En la definicin dada de tratamiento se dice que son acciones que "se aplican" a las unidades experimentales.... pero, de qu forma se establece cul unidad experimental va a recibir tal o cul tratamiento? El procedimiento usual es asignar aleatoriamente los tratamientos a las unidades experimentales. Definicin 8.3: Variable aleatoria observada o respuesta
Se llama variable aleatoria observada o respuesta a la medida u observacin que se obtiene de cada una de las unidades experimentales.

Retomando el ejemplo anterior, los tratamientos consisten en sembrar tres variedades de trigo en las parcelas experimentales y observar la respuesta: rendimiento de la parcela. Se dice en este caso que el factor tratamiento (variedad) tiene 3 niveles. Las observaciones reales bajo cada tratamiento se asocian tericamente a una distribucin subyacente, as, si hay a tratamientos en estudio se tendrn a distribuciones. El conjunto de unidades experimentales que reciben un mismo tratamiento se asimila a una muestra aleatoria simple (m.a.s.) desde la distribucin subyacente, ya que la variable aleatoria observada en cada unidad experimental es tericamente independiente de la registrada en las otras. Definicin 8.4: Repeticin
Se llama repeticin a cada realizacin de un tratamiento

Prosiguiendo con el ejemplo, si se asignan 10 parcelas a cada cultivar, se tendrn 10 repeticiones para cada tratamiento. Si adems del factor cultivar se quisiera probar como afecta al rendimiento la aplicacin de tres dosis de un mismo fertilizante, se estar en presencia de otro factor con tres niveles. Multiplicando el nmero de niveles del factor cultivar por el nmero de niveles del factor dosis del fertilizante se tienen
178

Anlisis de la Varianza

un total de nueve tratamientos. Estos experimentos, donde los tratamientos son definidos a partir de la combinacin de factores, se conocen como experimentos factoriales, en este caso bifactorial. Experiencias similares con ms de dos factores se denominan experiencias multifactoriales y no son objeto de estudio en este libro. La tcnica de anlisis de la varianza presupone un modelo para la variable respuesta. Este modelo recibe el nombre genrico de modelo lineal. A continuacin se presenta su definicin y se explican cada uno de los trminos y sus propiedades estadsticas. Definicin 8.5: Modelo lineal
Se denomina modelo lineal de ANAVA (a una va de clasificacin) para la observacin Yij a: Yij = + i + ij , donde: Yij es la j-sima observacin del i-simo tratamiento es la media general de las observaciones con i=1,...,a y j=1,..,n

i es el efecto del i-simo tratamiento ij es una variable aleatoria normal independientemente distribuida con esperanza 0 y varianza 2 i,j.

En la Figura 8.1 se esquematizan a=3 distribuciones centradas en sus esperanzas, denotadas por i, y se representan parmetros del modelo lineal.

Figura 8.1: Representacin de 3 funciones de densidad, mostrando el punto de equilibrio de todas ellas (), las esperanzas de cada una de ellas (i) y los corrimientos de las esperanzas respecto del punto de equilibrio representando o efectos de tratamiento (i). La media general () es el centro de equilibrio de todas las distribuciones y se trata de un parmetro fijo. El efecto del tratamiento (i) se presenta como un corrimiento respecto de la media general y en el modelo conocido como de ANAVA de efectos
179

Anlisis de la Varianza

fijos se asume constante. El efecto del tratamiento 1 (1) es la diferencia que hay entre la media del tratamiento 1 y la media general. La hiptesis nula del ANAVA postula la igualdad de medias de todos los tratamientos comparados. Si la hiptesis nula del ANAVA fuera verdadera las a distribuciones estaran centradas sobre la misma esperanza, es decir, en . Los valores de la variable aleatoria ij representan las diferencias entre observaciones individuales y las esperanzas de la distribucin de la cual proviene la observacin. El modelo lineal presentado corresponde a un diseo completamente aleatorizado a un criterio de clasificacin. En el Captulo 10 se presentarn otros modelos que incluyen ms parmetros para denotar la mayor complejidad estructural del diseo experimental. Esto implica que no existe un nico modelo lineal y la seleccin de un modelo para cada problema forma parte del arte del anlisis de datos experimentales. Si el modelo propuesto no es adecuado se parte de una muy mala base para probar las hiptesis planteadas. Existen dos tipos bsicos de modelos lineales de ANOVA a un criterio de clasificacin: de efectos fijos y aleatorios, dependiendo de la naturaleza aleatoria o no de los efectos de tratamiento. En esta obra slo se consideran los modelos de efectos fijos.

El anlisis de la varianza de efectos fijos a un factor de clasificacin


El objetivo del ANAVA de efectos fijos es contrastar la hiptesis de que los efectos de tratamientos son nulos versus que al menos uno no lo es. En trminos estadsticos: H0: 1=...=a= 0 vs. H1: Al menos un tratamiento tiene efecto no nulo. Otra forma de enunciar estas hiptesis es que las medias de los tratamientos que se comparan son idnticas vs. que no lo son. La tcnica de ANAVA es sensible a las propiedades estadsticas de los errores del modelo lineal y supone que los datos observados son independientes unos de otros y que las observaciones bajo cada tratamiento tienen distribucin normal centrada en su esperanza (+i) y varianza 2, idntica para toda observacin (homogeneidad de varianzas). El no cumplimiento de estas propiedades, conocidas como supuestos, pueden invalidar la inferencia que se pueda realizar a partir de esta tcnica.

180

Anlisis de la Varianza

Fundamentos del anlisis de la varianza de efectos fijos


Si se toma una muestra aleatoria simple de cada una de a distribuciones con idntica varianza, entonces las a varianzas muestrales estiman al mismo parmetro y el promedio ponderado de estas varianzas es un buen estimador de 2. Por otra parte, si adems de idnticas varianzas se pide idnticas esperanzas (hiptesis nula en el ANAVA), las a medias muestrales son estimaciones de la misma media poblacional y
2 tienen varianza X =

2 . Bajo estas condiciones, a partir de la varianza de las n

medias muestrales se puede obtener otra estimacin de 2. En consecuencia, si el supuesto de idntica varianza y la hiptesis de igualdad de medias son ciertos, se tienen, a partir de una muestra, dos estimadores independientes de la varianza poblacional. Si por el contrario, la hiptesis de igualdad de medias no es cierta, entonces la varianza estimada a partir de las medias incluir una fuente de variacin debida a la diferencia de los parmetros de posicin de las distribuciones muestreadas. Luego, la comparacin del promedio ponderado de las varianzas muestrales con el estimador obtenido a partir de la varianza de las medias muestrales es la clave del mtodo de anlisis de la varianza y de all su nombre. Cuando la hiptesis de igualdad de medias falla, el estimador obtenido a partir de la varianza de las medias muestrales es ms grande que lo esperado y en consecuencia sirve para detectar la desigualdad de las esperanzas de las distribuciones que se comparan.

Cuadrados medios y prueba de hiptesis


Definicin 8.6: Cuadrado Medio Dentro o del Error
Si Xi1, Xi2, ....Xin es muestra obtenida bajo el tratamiento i-simo y se tienen muestras para a tratamientos, entonces, si 2 representa la varianza de la distribucin bajo cualquier tratamiento, se llamar Cuadrado Medio Dentro (CMD) al promedio ponderado de las a varianzas estimadas en cada tratamiento

CMD =

2 (n1 -1) S12 + ... + (na -1) S a (n1 -1) + ... + (na -1)

Se puede probar que el Cuadrado Medio Dentro es un estimador insesgado de 2, es decir E(CMD) = 2.

181

Anlisis de la Varianza Nota: El nombre Cuadrado Medio Dentro proviene del hecho que es un promedio de magnitudes cuadrticas. Este ofrece una medida de la variabilidad promedio que hay dentro de cada tratamiento y mide la variabilidad de unidades experimentales tratadas de la misma forma (error experimental), por ello tambin se suele llamar cuadrado medio del error.

Definicin 8.7: Cuadrado Medio Entre o Cuadrado Medio de Tratamiento.


Si Xi1, Xi2, ....Xin es una muestra obtenida bajo el tratamiento i-simo y se tienen muestras para cada uno de a tratamientos, es posible obtener la varianza de las medias muestrales
2

SX

ya

partir de sta, encontrar un estimador de que se denomina Cuadrado Medio Entre o Cuadrado Medio de Tratamiento (CME)

CME = S 2 n . X
A diferencia del CMD que es un estimador incondicional de 2, el CME estima a 2 slo si las esperanza de los tratamientos que se comparan son iguales (H0 verdadera) de lo contrario estima a 2 + c 2 , con c una constante mayor que 0. i
i =1 a

Luego, CME es un estimador insesgado de 2 slo si H0 es verdadera, de lo contrario estima a 2 ms una cantidad que representa una medida de la magnitud de los efectos de tratamiento. Si H0 es verdadera todo i=0 y por lo tanto la componente aadida por los efectos de tratamiento se anula y la esperanza del CME es 2. Luego el CMD y el CME son estimadores independientes de 2 bajo H08. Cmo establecer si la hiptesis nula de igualdad de efectos de tratamientos es verdadera o falsa?. La respuesta est al alcance del lector si piensa sobre el estadstico F utilizado en la prueba de hiptesis de igualdad de dos varianzas.
2 2 Sean E y D las varianzas estimadas por el CME y el CMD respectivamente, luego 2 2 bajo la hiptesis de igualdad de medias de tratamiento, E = D de lo contrario 2 2 E > D por lo tanto las hiptesis de una prueba estadstica son las siguientes: 2 2 H0 : E = D 2 2 vs H1 : E > D

2 2 La prueba consiste en calcular el estadstico F utilizando los estimadores de E y D

de la siguiente forma:
8 La demostracin de que estas estimaciones son independientes est fuera del perfil de este libro.

182

Anlisis de la Varianza

F=

CME CMD
a i =1

Este estadstico tiene, bajo H0, una distribucin F(a-1),(N-a)) con N = ni . Luego, para un nivel de significacin , si F es mayor que el cuantil (1-) de la distribucin F(a-1),(N-a) se rechaza H0, implicando que H1 es verdadera. El rechazo de H0 implica que i2 es
i =1 a

distinto de 0 y por lo tanto, que algn i 0; luego se concluye que no todas las medias de tratamiento son iguales o que al menos un tratamiento tiene efecto distinto de 0. En sntesis, el ANAVA se basa en dos estimadores independientes de la varianza de las observaciones: uno basado en la variabilidad dentro de los tratamientos, y otro basado en la variabilidad entre los tratamientos. Si no hay diferencias entre las medias de los tratamientos, estos dos estimadores estiman al mismo parmetro, de lo contrario el segundo tiende a ser mayor cuanto mayor es la diferencia entre los tratamientos. Luego, a pesar de que la hiptesis de inters del ANAVA se refiera a la igualdad de las esperanzas de dos o ms distribuciones, la tcnica del ANAVA se basa en la comparacin de varianzas para inferir acerca de la igualdad de las esperanzas.

La particin de la suma de cuadrados y la tabla del ANAVA


A fin de presentar el procedimiento para el anlisis de la varianza se introduce la notacin que describe los datos. Supngase que se tienen a tratamientos, que la variable de respuesta se representa con la letra Y, que se dispone de n repeticiones para cada tratamiento, y que la asignacin de los mismos a las unidades experimentales se realiza bajo un diseo completamente aleatorizado. Bajo estas condiciones los datos pueden representarse segn la Tabla 8.1. Tabla 8.1: Estructura tpica de una tabla de datos de un experimento unifactorial con diseo completamente aleatorizado. Tratamientos 1 2 : a y11 y21 : ya1 y12 y22 : ... ... ::: y1n y2n : yan Media
y1

y2

ya2 ...

yn

183

Anlisis de la Varianza

Cada dato est representado por yij, y hace referencia a la observacin j-sima tomada bajo el tratamiento i-simo. Por ejemplo, el dato y12 representa a una observacin realizada sobre la unidad experimental nmero 2 del tratamiento designado como 1; con yan a la observacin de la unidad experimental n-sima del tratamiento a-simo en general. El anlisis de la varianza se presenta en una Tabla conocida como Tabla de Anlisis de la Varianza en la que se resumen los estadsticos y clculos bsicos para obtener el CME y el CMD, estadsticos claves para la prueba de hiptesis. En la Tabla 8.2, N = ni .y la notacin yi indica sumar sobre el ndice reemplazado por el punto, esto
i =1 a

es: yi= yij .


j =1

ni

Tabla 8.2: Frmulas de trabajo para el anlisis de la varianza de un experimento unifactorial con diseo completamente aleatorizado. Fuente de Variacin Entre Tratamientos Suma de Cuadrados SCE=
i=1 a

Grados de Libertad gle= a -1

Cuadrado Medio SCE CME= gle SCD CMD= gld

F Obs.
CME CMD

(yi)2 (y)2 ni - N

Dentro (Error Experimental) Total

SCD=SCT-SCE
a ni (y)2 SCT= yij2- N i=1 j=1

gld= N - a glt= N - 1

En la columna titulada "Fuentes de Variacin" se destacan tres celdas con sus correspondientes ttulos. En ellas se indican los contenidos de las celdas dentro de la fila respectiva. En la fila titulada "Entre Tratamientos" existen cuatro celdas, en las que se calculan las siguientes cantidades: Suma de Cuadrados Entre Tratamientos (SCE), Grados de Libertad de la suma de cuadrados entre tratamientos (gle), Cuadrados Medios Entre Tratamientos (CME) y el estadstico F correspondiente al cociente del CME/CMD. La fila titulada "Dentro (Error Experimental)" se completa con las siguientes cantidades: Suma de Cuadrados Dentro de Tratamientos (SCD), Grados de Libertad de la suma de cuadrados dentro de tratamientos (gld) y Cuadrado Medio Dentro de Tratamientos(CMD). En la titulada "Total" se completa con la Suma
184

Anlisis de la Varianza

de Cuadrados Total (SCT) y Grados de Libertad Totales (glt). Ejemplo 8.1 El porcentaje de humedad relativa (HR) es determinante para el ataque de hongos en semillas. Para evaluar la susceptibilidad de las semillas man al ataque de un hongo se realiz un ensayo en cmaras de cra con tres porcentajes de HR: 70%, 80% y 90%. Cinco observaciones fueron tomadas para cada porcentaje de HR, registrndose el nmero de semillas atacadas en un grupo de 100 semillas (unidad experimental). Las observaciones se presentan en la Tabla 8.3. Tabla 8.3: Datos obtenidos de un ensayo sobre el efecto de hongos en la semilla de man. Porcentaje de HR 70 80 90 7 12 14 Observaciones (Nmero de semillas atacadas) 6 15 16 9 17 18 5 18 21 9 20 15 Totales de Tratamiento yi 36 82 84 y = 202

Los clculos preliminares del ANAVA son:


2 SCTotal = 72 + 62 + 92 + ... + 212 + 152 - 202 = 375.73 15 2+ 2+ 2 2 SCEntre = 36 82 84 - 202 5 15

= 294.93

SCDentro = 375.73 - 294.93 = 80.8 As, la tabla de ANAVA correspondiente es: Tabla 8.4: Anlisis de Varianza para un ensayo sobre el efecto de hongos en la semilla de man segn tratamientos de humedad relativa. Fuente de Variacin Suma de Cuadrados Grados de Libertad Cuadrados Medios F

185

Anlisis de la Varianza

Fuente de Variacin Entre Tratamientos Dentro (Error Experimental) Total

Suma de Cuadrados 294.93 80.8 375.73

Grados de Libertad 2 12 14

Cuadrados Medios 147.46 6.73

F 21.91

Si = 0.05, luego el punto crtico que delimita la zona de aceptacin y rechazo de H0 es F(2,12; 0.95) = 3.88. Como F= 21.91> Fcrtica se concluye, con un nivel de significacin del 5%, que se rechaza la hiptesis nula de igualdad de medias de nmero de semillas atacadas para los 3 porcentajes de HR, por lo tanto al menos una de las HR produce un grado de ataque de hongos diferente de los restantes.

Pruebas "a posteriori"


Si se rechaza la hiptesis nula del ANAVA, la pregunta que sigue es cul o cules de las medias poblacionales en estudio son las diferentes? Si el nmero de tratamientos es suficientemente grande, es probable que la diferencia entre la media mayor y la menor sea declarada como significativa por una prueba T an cuando la H0 no fue rechazada en el ANAVA. As, realizando comparaciones de a pares usando la prueba T, cada una con un nivel , la probabilidad de rechazar incorrectamente H0, al menos una vez, incrementara con el nmero de tratamientos. Luego, teniendo como objetivo controlar , varios procedimientos de comparaciones mltiples 'a posteriori' han sido propuestos en la literatura desde la dcada del '50. Existe una gama muy amplia de alternativas para llevar adelante este tipo de pruebas, entre las que se destacan la de Tukey (Tukey, 1949), la de Scheff (Scheff, 1953), la de Duncan (Duncan, 1955), la de Dunnet (Dunnet, 1964), y la de Fisher (Fisher, 1966), entre otras. Se darn a continuacin las pruebas de Tukey y de Fisher. Estas pruebas no agotan las mltiples posibilidades de eleccin de mtodos de comparaciones, pero representan un mtodo conservador, es decir que controla la tasa de error tipo I (Tukey), y uno que no lo es tanto (Fisher).

186

Anlisis de la Varianza

El test de Tukey
El test de Tukey examina con un mismo estadstico todas las diferencias de medias a a! muestrales en estudio. Si hay a medias, luego habr = (a-2)! 2! diferencias de 2 medias posibles. El estadstico de Tukey es el siguiente: DMSt = qa,gld; (1-) CMD n

donde qa,gld; (1-) es el cuantil (1-) que se obtiene de la distribucin de Rangos Studentizados (ver Anexo) para a tratamientos y los grados de libertad dentro; es el nivel de significacin en base al cual se rechaz la H0 del ANAVA y n es el nmero de repeticiones en base a las que se calculan las medias muestrales. Si el tamao de muestra no fuera el mismo para cada tratamiento, deber reemplazarse n por la media armnica de los {ni}, esto es : n0 = a 1 i =1 ni
a

Si el valor absoluto de la diferencia entre un par de medias supera a DMSt, se dice que esta diferencia es estadsticamente significativa. Se concluir en consecuencia que las esperanzas asociadas a esa diferencia son distintas con un nivel de significacin . Cabe destacar que cuando los tamaos muestrales son muy diferentes, el test de Tukey puede dejar de ser confiable, caso en el cual podra utilizarse algn procedimiento de contraste mltiple que considere tal situacin, como el de Scheff (1953). Retomando el Ejemplo 8.1 recurdese que se haba concluido que los diferentes porcentajes HR producan un diferente grado de ataque del hongo sobre la semilla de man. La pregunta que sigue es cul o cules de ellos producen ataques diferentes?. Para dar respuesta a ello se utilizar el test de Tukey. Aunque no es necesario, se puede construir una matriz de valores absolutos de las diferencias entre medias como la que se muestra a continuacin.

187

Anlisis de la Varianza

Tabla 8.5: Matriz de diferencias de medias del Ejemplo 8.1. _ x1 _ x1 _ x2 _ x3 El segundo paso consiste en calcular el estadstico de Tukey. Para el ejemplo, a = 3, gld=12 y =0.05 (el mismo usado en el ANAVA), q a,gld;(1-) = 3.77; CMD = 6.73 (Tabla 8.4) y n = 5 (nmero de repeticiones). As se tiene: DMSt = 3.77 6.73 5 = 4.37 _ x2 9.2 _ x3 9.6 0.4

Para terminar con esta prueba basta controlar qu diferencias entre medias muestrales son mayores que 4.37 para concluir que las esperanzas que estiman difieren entre s con un nivel de significacin del 5%. Revisando la matriz de diferencias de medias se puede verificar que : _ _ 1 2 por cuanto |x1 - x2| = 9.2 > 4.37; _ _ 1 3 por cuanto |x1 - x3| = 9.6 > 4.37; _ _ 2 = 3 por cuanto |x1 - x3| = 0.4 < 4.37; Luego, el grado de ataque que se produce con un 80% de HR no difiere del que se produce con 90% de HR, mientras que con 70% de HR se produce un ataque significativamente menor que con 80 y 90%. Sintetizando se podra afirmar con un 95% de confianza que el menor grado de ataque se produce con 70% de HR.

Prueba de Fisher
La prueba de Fisher es similar en su procedimiento a la prueba de Tukey, pero el estadstico de la prueba es diferente. En vez de usar los cuantiles de la distribucin de rangos estudentizados utiliza los cuantiles de una t con los grados de libertad del cuadrado medio dentro de tratamientos y es particular para cada comparacin de
188

Anlisis de la Varianza

medias ya que depende del nmero de repeticiones por tratamiento. Luego, la diferencia mnima significativa entre el tratamiento i-simo y el tratamiento j-simo est dada por:

DMSfij =tgld ;(1- ) CMD

ni + n j ni n j

Para el Ejemplo 8.1 t12;(0.95)=1.782, CMD=6.73 y ni=nj=5 ij, luego la diferencia mnima significativa por Fisher es para todas las comparaciones

DMSfij = 1.782 6.73

5+5 =2.92 5.5

Es interesante mostrar que mientras para Fisher la diferencia mnima significativa es 2.92, para Tukey es 4.37. Esto implica que con Fisher es ms fcil rechazar la hiptesis de igualdad de medias que con Tukey, por esta razn se dice que este ltimo es ms conservador (menor error tipo I) y el primero ms potente (menor error tipo II).

Verificacin de supuestos del anlisis de la varianza


Como se recordar, los supuestos del anlisis de la varianza se refieren a las propiedades estadsticas de los errores. Usualmente se suponen normales con esperanza cero, varianza comn e independientes. La verificacin de estas propiedades garantiza que las conclusiones del ANAVA estn acotadas en sus Errores Tipo I y Tipo II. Existen distintas tcnicas de validacin de supuestos, pero las que se presentan aqu se basan en los predictores de los errores, es decir los residuos. Una vez calculados los predictores se puede verificar el cumplimiento de los supuestos de normalidad, independencia y homogeneidad de varianzas de los ij, mediante pruebas de hiptesis e interpretaciones grficas. A continuacin se da una definicin de residuo para el modelo de anlisis de la varianza.

189

Anlisis de la Varianza

Definicin 8.8: Residuo


Se llamar residuo de la observacin j-sima del tratamiento i-simo al predictor de ij, que se denota por eij , y se obtiene como la diferencia entre el valor observado y el valor predicho por el modelo. En el modelo presentado:

eij = yij - yi

Una vez calculados los residuos del experimento se pueden verificar los supuestos y evaluar si el modelo lineal es el correcto. Si no es este el caso, es decir, si se detecta falta de independencia o de normalidad o de homogeneidad de varianzas, el modelo elegido no es adecuado para el anlisis. A continuacin se considera cada uno de los supuestos, y cmo evaluarlos mediante interpretacin grfica. Normalidad: tomando los residuos como datos, una de las tcnicas ms usadas es construir un Q-Q plot normal. Mediante esta tcnica (ver Captulo 1) se obtiene un diagrama de dispersin en el que, si los residuos son normales y no hay otros defectos del modelo, entonces se alinean sobre una recta a 45 como se muestra en la siguiente figura. La presencia de ligeras violaciones de este supuesto no es muy grave, no afectndose de forma importante la probabilidad de cometer Error de Tipo I, pero en algunos casos puede elevarse demasiado la probabilidad de cometer error Tipo II. La Figura 8.2 ilustra un Q-Q plot de residuos obtenidos a partir de un modelo con errores normales homocedsticos .

3.60 3.40

Figura 8.2: Q-Q plot (normal)

3.20 3.00 2.80 2.60 2.40 2.20 2.2 2.4 2.6 2.8 3.0 3.2 3.4 3.6

Independencia: Una ayuda valiosa para estudiar la falta de independencia entre los errores es realizar un grfico de los residuos segn la secuencia en el tiempo o espacio fsico en que han sido colectados los datos. Si los residuos aparecen en secuencias de varios valores positivos seguidos de varios valores negativos puede ser un indicio claro de la falta de independencia. Otro posible patrn indicativo de falta de
190

Anlisis de la Varianza

independencia es una sucesin alternante de residuos positivos y negativos. Siempre que se detecte cualquier patrn en este grfico se debe sospechar del incumplimiento del supuesto de independencia. Un ejemplo de un grfico en el que no se observan patrones sospechosos en la distribucin de residuos es el siguiente.
6 5 4 3 2 1 0 -1 0 -2 -3 -4

10

15

20

25

Figura 8.3: Dispersin de los residuos en funcin de la secuencia de observacin.

Secuencia de Observacin

La falta de independencia es un problema potencialmente peligroso y difcil de corregir, por lo que es importante prevenirlo. La aleatorizacin en la asignacin de los tratamientos a las unidades experimentales, en la secuencia de medicin de los resultados del ensayo, o en cualquier otra etapa experimental que pueda introducir una fuente sustancial de error, es uno de los mtodos ms eficaces de controlar la falta de independencia. Homogeneidad de varianzas: haciendo un grfico de dispersin de residuos vs. predichos se debe observar una nube de puntos sin patrn alguno para comprobar que las varianzas son homogneas. Un patrn tpico que indica falta de homogeneidad en las varianzas, se muestra en la Figura 8.4, ya que a medida que crecen los valores predichos por el modelo, aumenta la dispersin de los residuos.

Figura 8.4 Grfico de Residuos en residuos funcin de Predichos en un ejemplo con falta de homogeneidad de 0 varianzas

predichos

191

Anlisis de la Varianza Nota: Se debe ser cuidadoso en la interpretacin de estos grficos ya que el patrn mostrado por la Figura 8.4 se puede presentar cuando los tamaos de muestras son distintos en cada tratamiento, no indicando necesariamente heterogeneidad de las varianzas.

Ejercicios
Ejercicio 8.1 Se desea conocer el efecto de las cepas de inoculantes sobre el contenido de nitrgeno de plantas de trbol rojo. Para ello se dispone de 30 macetas de trbol rojo en un invernadero. Se asignan al azar 5 macetas para cada una de las cepas y se procede a inocularlas. Los resultados son los siguientes (en mg. de nitrgeno):

Cepa I 19.4 27.0 32.1 32.6 33.0

Cepa II 17.7 24.3 24.8 25.2 27.9

Cepa III 09.1 11.9 15.8 17.0 19.4

Cepa IV 18.6 18.8 20.5 20.7 21.0

Cepa V 11.6 11.8 14.2 14.3 14.4

Cepa VI 16.9 17.3 19.1 19.4 20.8

a) b) c)

Plantear H0 y H1 Realizar el Anlisis de la Varianza ( = 0.05) Si corresponde, realizar la prueba de Tukey

Ejercicio 8.2 En un estudio sobre el efecto de la adicin de azcares sobre dimetro de secciones de poroto criados en un medio de cultivo, se obtuvieron los siguientes datos: Control Glucosa Fructosa: Gluc. + Fruc. Sacarosa 75 57 58 58 62 67 58 61 59 66 70 60 56 58 65 75 59 58 61 63 65 62 57 57 64 71 60 56 56 62 67 60 61 58 65 67 57 60 57 65 76 59 57 57 62 68 61 58 59 67

Qu se puede decir sobre el efecto de los distintos medios de cultivo?. Concluir


192

Anlisis de la Varianza

trabajando con un nivel de significacin de 0.01. Ejercicio 8.3 Se desea estudiar el efecto de la carga animal sobre la produccin de materia seca en una pastura implantada. Para ello se divide un lote en 28 potreros y se asignan aleatoriamente 7 potreros a cada una de las 4 cargas animales en estudio (2 nov./ha., 4 nov./ha, 6 nov./ha. y 8 nov./ha.) Los resultados fueron los siguientes expresados en toneladas de materia seca por hectrea. Media carga 2 carga 4 carga 6 carga 8 a) b) c) 2.6 3.3 3.1 2.5 1.9 3.6 2.0 2.3 3.1 3.0 2.5 2.8 2.8 3.5 3.1 1.8 2.2 3.2 2.3 2.7 2.0 3.9 3.0 2.6 2.7 3.4 2.2 2.0 2.47 3.41 2.60 2.39

Plantear un modelo lineal que permita recomendar alguna carga en especial. Qu supuestos se requieren para el anlisis de este ensayo? Realice el anlisis y concluya.

Ejercicio 8.4 Se supone que buena parte de la diferencias varietales entre la variedades A y B de una especie vegetal, se deben no a causas genticas sino al efecto del medio ambiente donde se desarrollan. Para probar (parcialmente) esta hiptesis se realiz un experimento en el cual 10 lotes de cada variedad se hicieron crecer en un mismo ambiente. La altura de planta fue la variable que se registr y los datos son los siguientes:

x ix2 i
i i

nj 10 10
193

Variedad A Variedad B

15 12

12 9

8 13

14 10

16 8

16 12

9 13

15 14

11 9

14 10

130 110

1764 1248

Anlisis de la Varianza

a) b) c)

Identificar las H0 y H1 y el modelo a adoptar. Realizar un prueba T y un anlisis de varianza, usando un nivel de significacin del 5%. Comprobar que el valor de T2 reproduce el valor del estadstico F. Qu se concluye sobre las diferencias varietales?

Ejercicio 8.5 Una empresa agrcola necesita establecer si le conviene fertilizar sus cultivos de soja y si es as, seleccionar uno de ellos. Para este propsito se realiz un ensayo en un lote de 5 has., dividido en parcelas de 1/4 ha. cada una, asignando los tratamientos en forma aleatoria. Los rendimientos obtenidos (qq/ha) fueron:

Control (sin fertilizar) 23 20 22 20 21 a) b) c)

Fert. A 30 32 29 35 33

Fert. B 28 36 31 32 34

Fert. C 27 25 24 28 26

Hacer una representacin grfica comparativa de los rendimientos Se recomendara la fertilizacin? De ser as, cul de los fertilizantes se recomendara?

Ejercicio 8.6 En un experimento para evaluar suplementos en las dietas de ovejas se escogieron 16 ovejas al azar, de un rebao, separndolas aleatoriamente, en grupos de 4 animales. Las 4 primeras (primer grupo) se suplementaron con el producto A, otras 4 con el producto B, otras 4 con el producto C y las restantes se dejaron como testigo, sin suplemento. Las medias de aumento de peso por animal al cabo de 100 das, fueron (en libras): A = 55 B = 57 C = 63 Testigo = 52 Se realiz un ANAVA para este experimento con los siguientes resultados:
194

Anlisis de la Varianza

SCT = 646; gle=3 Completar la siguiente Tabla del ANAVA: Fuente de Variacin Entre Dentro Total Ayuda: Revea la definicin 8.7 para calcular el cuadrado medio de tratamientos. a) b) Si se justifica, realizar una prueba a posteriori trabajando con = 0.05. Informar los resultados del ensayo utilizando grficos adecuados. Suma de Cuadrados Grados de Libertad Cuadrados Medios F Observada F Tabla

Ejercicio 8.7 En una experiencia realizada para determinar si los pesos (mg) de las hembras adultas de Drosophila permisilis, criadas a 24C, resultan afectados por la densidad a la que se cran las larvas, se pesaron 10 ejemplares adultos de cada medio, obtenindose los siguientes resultados:

Densidad larval 1 3 5 6 10 20

Peso medio 1.356 1.356 1.284 1.252 0.989 0.664

Varianza de los pesos 0.032 0.018 0.017 0.011 0.017 0.020

ni 10 10 10 10 10 10

Realizar un anlisis de la varianza para saber si existen diferencia estadsticamente significativas entre los pesos atribuibles a las distintas densidades larvales. Trabajar con = 0.05.
195

9
9 Anlisis de Regresin Lineal
Introduccin
El objetivo de este captulo es introducir el anlisis simultneo de dos variables y adquirir criterios para el uso de las tcnicas de regresin y correlacin. Hasta el captulo anterior se han introducido mtodos estadsticos que se pueden utilizar cuando el inters es analizar el comportamiento de una sola variable, eventualmente, bajo distintas condiciones. Por ejemplo, el rendimiento o la altura de las plantas de un cultivo con o sin riego. Pero frecuentemente se presentan situaciones donde se observan dos o ms variables sobre cada unidad experimental y el inters se centra en la forma en que estas variables se relacionan. Algunos ejemplos de relaciones funcionales que pueden ser de inters en agronoma son: la relacin entre el rendimiento de un cultivo y la densidad de siembra, la relacin entre la cantidad de suplemento dado y el aumento de peso que ste produce en un lote de animales, las dosis de un insecticida y la mortalidad de los insectos tratados, etc. En cada uno de estos casos se pueden plantear los siguientes interrogantes: Existe alguna relacin entre las variables? Si se conoce el comportamiento de una de ellas, se puede predecir el comportamiento de la otra? La estadstica aplicada ofrece dos herramientas que permiten dar respuesta a dichas cuestiones: el Anlisis de Regresin y el Anlisis de Correlacin. El Anlisis de Regresin estudia la relacin funcional que existe entre dos o ms variables. Identifica el modelo o funcin que liga a las variables, estima sus parmetros y, eventualmente, prueba hiptesis acerca de ellos. Una vez estimado el modelo es posible predecir el valor de la variable denominada variable dependiente en funcin de la o las otras variable/s independiente/s y dar una medida de la precisin con que esa estimacin se ha hecho. Dependiendo del objetivo del estudio, los valores o niveles de la/s variable/s independiente/s pueden ser arbitrariamente modificados por el experimentador, es
197

Anlisis de Regresin

decir el investigador puede fijar los niveles de la variable independiente para los cuales desea estudiar la respuesta de la variable dependiente. El modelo hallado puede ser usado para predecir el comportamiento de la variable dependiente para otros niveles de la variable independiente, que pertenezcan al dominio del estudio. El Anlisis de Correlacin lineal estudia el grado y sentido de la asociacin lineal que hay entre un conjunto de variables y, a diferencia del anlisis de regresin, no se identifica ni se estima explcitamente un modelo funcional para las variables, este siempre se supone lineal. El inters principal es medir la asociacin entre dos variables aleatorias cualesquiera, sin necesidad de distinguir variables dependientes e independientes. Por ejemplo, puede quererse evaluar la intensidad de la asociacin entre la cantidad de espiguillas por espiga de trigo y la longitud de las espigas. Se ha establecido que cuanto mayor es la longitud de las espigas mayor es el nmero de espiguillas por espiga. Obsrvese que, en el ejemplo, no se habla de relacin funcional, ni tampoco se insina que la longitud de la espiga aumenta porque aumenta el nmero de espiguillas o viceversa, slo se enfatiza la forma en que se comporta una variable en relacin a la otra y el inters est centrado en medir la intensidad de esta asociacin. En el anlisis de correlacin, ninguna de las variables puede ser fijada por el experimentador, ya que ste podra seleccionar niveles de las variables que no son frecuentes y esto podra conducir a una estimacin errada del grado de correlacin. Los grficos de dispersin son tiles en la etapa exploratoria, tanto en el anlisis de regresin como en el de correlacin. La representacin grfica de los datos es frecuentemente el punto de partida de cualquier anlisis que involucra ms de una variable. En los grficos de dispersin lo que se ve es una nube de puntos, donde cada punto representa una observacin. La Figura 9.1 muestra los grficos de dispersin usados en estudios de asociacin entre dos variables donde adems se ha dibujado sobre la nube de puntos, la posible funcin de ajuste de esos datos, es decir, se ha identificado el modelo funcional de la relacin.

198

Anlisis de Regresin

Figura 9.1: Grficos de dispersin para diferentes modelos de relacin entre dos variables.

199

Anlisis de Regresin

Anlisis de regresin lineal


El trmino regresin surgi de estudios de la herencia biolgica realizados por Galton durante el siglo pasado. En su conocida experiencia, Galton not que los padres altos tenan hijos cuya altura era mayor a la altura promedio, pero no eran ms altos que sus padres. Tambin, padres bajos tenan hijos con altura menor a la altura promedio pero eran ms altos que sus padres. Esta tendencia de las caractersticas de los grupos de moverse, en la siguiente generacin, hacia el promedio de la poblacin o de regresin hacia la media fue descubierta por Galton. El trmino no tiene hoy el mismo significado que le dio Galton, pero se usa extensamente para referirse al estudio de relaciones funcionales entre variables cuando hay una componente aleatoria involucrada. Al estudiar la relacin entre dos o ms variables surge la idea de encontrar una expresin matemtica que la describa. Para el caso de dos variables, si se denota como Y a la variable que se supone dependiente y como X a la variable que se postula como independiente, resulta familiar utilizar el concepto de funcin y decir Y es funcin de X, para indicar que de acuerdo a los valores asignados a X se pueden predecir los valores que tomar Y. Dicho de otra manera, se puede conocer el comportamiento de Y a travs de un modelo que relaciona la variacin en Y con la variacin de X. El anlisis de regresin tiene por objetivo identificar un modelo funcional que describa cmo vara la esperanza de la variable dependiente, E(Y), frente a cambios en X. Al igual que en el anlisis de varianza el modelo para Y tambin presenta constantes desconocidas que se llaman parmetros, por lo que otro objetivo del anlisis es la estimacin de los parmetros a partir de una muestra aleatoria de observaciones en Y y en X. El anlisis de regresin se ocupa tambin de la validacin del modelo propuesto y de las pruebas de hiptesis sobre los parmetros del modelo; por ltimo, la modelacin por regresin tambin tiene como objetivo la prediccin, es decir el uso del modelo para dar el valor esperado de Y cuando X toma un valor particular. La complejidad matemtica del modelo de regresin y la adecuacin de ste depender de cunto se conoce acerca del proceso o fenmeno que se est estudiando. En la prctica es posible adoptar modelos de regresin que se pueden agrupar o clasificar en lineales y no lineales. Los primeros hacen referencia a aquellos modelos en que la funcin adopta la forma de una suma de trminos, cada uno conformado por el producto de un parmetro y una variables independiente. Los modelos no
200

Anlisis de Regresin

lineales son aquellos donde los parmetros no se encuentran multiplicando a las variables independientes como en el modelo lineal de tal forma que no pueden ser estimados resolviendo un sistema de ecuaciones lineales. Por ejemplo, los parmetros pueden encontrarse como exponentes de las variables independientes. La estimacin de los parmetros en modelos no lineales se realiza usando herramientas diferentes a las presentadas en este captulo. Aqu se abordan solamente los modelos lineales, no slo por ser ms simples, sino porque permiten dar respuesta a un gran nmero de problemas en las Ciencias Agropecuarias. Adems, algunos de los modelos no lineales pueden, mediante adecuadas transformaciones, ser expresados de la forma lineal (en estos casos los modelos se dicen intrnsecamente lineales). El modelo de regresin lineal ms sencillo es el que se presenta en la siguiente definicin: Definicin 9.1: Modelo de regresin lineal simple
Se llama modelo de regresin lineal simple a:

Yij = + X i + ij
donde: Yij= observacin de la variable dependiente bajo el i-simo nivel de X, i = 1,...,K en la j-sima unidad experimental, j = 1,...,m Xi= = = ij = i-simo valor de la variable independiente, i = 1,...,K parmetro que representa la ordenada al origen de la recta (indica valor esperado de Y cuando X=0) parmetro que representa la pendiente de la recta (tasa de cambio en Y frente al cambio unitario en X). variacin aleatoria (o no explicada por el modelo) asociada a la j-sima observacin de Y bajo el nivel Xi.

Los ij se suponen normales e independientemente distribuidos con esperanza 0 y varianza constante 2 para todo X en un intervalo donde el modelo se supone verdadero. Esto es 2 ij ~ N I D ( 0, ).

El modelo anterior incluye solamente una variable independiente y establece que la esperanza de la variable dependiente cambia con tasa constante, segn crece o decrece el valor de la variable independiente. Qu se puede decir de la esperanza de Y?, es decir cul es el valor esperado de Y para un determinado valor de X?. Tomando esperanza de Yij se tiene, por propiedades
201

Anlisis de Regresin

de la funcin esperanza que: E( YijX = xi) = y|x = + xi donde: y|X=x representa la E(Yij) dado un valor de Xi, es decir la esperanza de la distribucin de Y correspondiente a un valor particular de X. y representan los parmetros del modelo y debe observarse que, dados y la esperanza de Y depende solo de X. Cuando el investigador trata con problemas de dos variables que estn ligadas por una relacin funcional lineal, difcilmente los pares de observaciones (X,Y) coincidan exactamente con una recta. La presencia de errores aleatorios en las observaciones hace imposible que en la prctica se encuentre una relacin funcional perfecta entre las variables. Por ello, los modelos determinsticos son de limitado valor en la descripcin de fenmenos biolgicos. El modelo estadstico, a diferencia del modelo determinstico, considera una componente aleatoria con la cual se tiene en cuenta la variacin de los valores de Y observados para un mismo nivel de X. Es importante notar que de la Definicin 9.1 se desprende que la E(Y) se relaciona funcionalmente con X a travs de una recta, luego, an cuando las observaciones experimentales no puedan alinearse sobre la recta, si la relacin funcional entre las variables existe, se espera que sta se visualice con mayor claridad sobre los promedios. Ejemplo 9.1 Suponga que se quiere estudiar la distribucin de los pesos de una poblacin de plantas en relacin a sus alturas. Para cualquier altura elegida, por ejemplo X=50 cm, existe una distribucin de pesos, es decir, la distribucin de los pesos de todas las plantas de la especie que poseen esa altura. Esa distribucin, llamada distribucin condicional de Y dada X (Y|X=50), tiene como esperanza a Y|X=x = peso medio de todas las plantas que tienen altura 50 cm y una varianza 2 Y|X=x = varianza de los pesos de todas las plantas que tienen dicha altura. As, se dice que la regresin del peso sobre la altura representa la esperanza de la distribucin de los pesos segn la altura. Obsrvese la siguiente figura.

202

Anlisis de Regresin

Figura 9.2: Esperanza de Y condicionada a X en relacin a X. Cmo se interpretan los parmetros del modelo de regresin lineal simple? La ecuacin de cualquier recta puede ser escrita como y = a + bx, donde a es la ordenada al origen e indica el valor de y para x = 0 y b es la pendiente e indica cunto cambia y por cada incremento unitario en x. Cuando b es un nmero positivo significa que hay un crecimiento de b unidades en y por cada incremento de una unidad en x; si b es un nmero negativo, y disminuir b unidades con cada incremento unitario de x. Luego, la pendiente y la ordenada al origen determinan la posicin de la recta. En la Figura 9.3 se observa una recta con b>0.
y= a + bx

b unidades

Figura 9.3: Representacin grfica de la ecuacin de la recta y = a + bx que puede describir razonablemente bien la nube de puntos presentada.

Volviendo al modelo estadstico de regresin lineal simple:


203

Anlisis de Regresin

a) b)

el parmetro , u ordenada al origen de la recta de regresin de Y sobre X, es la esperanza de Y para X = 0; y el parmetro , o pendiente de la regresin de Y sobre X, es la diferencia entre Y|X = x1 y Y|X = x 2 cuando x2-x1 = 1.

Estimacin de la recta de regresin. Mtodo de los mnimos cuadrados


Ejemplo 9.2 En un ensayo sobre trigo que se lleva a cabo en la zona de Marcos Jurez se desea cuantificar la relacin que hay entre la disponibilidad de Nitrgeno en el suelo y la cantidad de Nitrgeno en la planta (que se supone lineal). Se obtuvieron datos para 12 parcelas, en las que se registr el contenido de nitrgeno en el suelo (X) y los valores promedios de nitrgeno por planta (Y). Los resultados se presentan en la Tabla 9.1. Tabla 9.1: Cada fila representa los valores observados sobre una unidad experimental, conformada por una parcela de 50 cm. x 50 cm., en la que se midi el Nitrgeno en el suelo y por planta calculado como promedio sobre todas las plantas de la parcela X: Nitrgeno en Suelo (ppm) 0.42 0.45 0.50 0.55 0.68 0.69 0.70 0.73 0.80 0.90 0.92 0.94 Y: Nitrgeno en planta (ppm) 0.13 0.15 0.16 0.17 0.18 0.18 0.19 0.20 0.20 0.21 0.22 0.23

El diagrama de dispersin para los datos de esta experiencia se presenta en la siguiente figura.
204

Anlisis de Regresin

contenido promedio de nitrgeno por planta

0.24 0.22 0.20 0.18 0.16 0.14 0.12 0.10 0.3 0.5 0.7 0.9 contenido de nitrgeno en el suelo

Figura 9.4: Diagrama de dispersin de los datos del Ejemplo 9.2.

El diagrama indica que hay una relacin positiva entre la cantidad de nitrgeno en la planta y la cantidad de nitrgeno disponible en el suelo. En este ejemplo se puede postular una relacin lineal. La ecuacin de la recta de regresin es: Y|X=x = +x A partir de los datos experimentales se estiman los coeficientes y de la recta de regresin. Definicin 9.2: Coeficientes de regresin muestral
Se llaman coeficientes de regresin muestral a las estimaciones de y , las que se denotan como a y b respectivamente.

Si no hubiese errores aleatorios en los Yi y el modelo lineal fuera correcto, cualquier par de puntos (Xi,Yi) podra usarse para encontrar los valores de y y todas las estimaciones seran idnticas independientemente del par utilizado. Pero la presencia de los errores aleatorios descalifica este procedimiento y muestra la necesidad de disponer de un mtodo que combine toda la informacin disponible en la muestra para dar una solucin razonable al problema de estimacin. Uno de estos mtodos es el conocido como Mtodo de Mnimos Cuadrados. El mtodo de Mnimos Cuadrados define la recta de mejor ajuste como aquella que hace que la suma de los cuadrados de las distancias de los valores observados respecto
205

Anlisis de Regresin

a la recta, medidas sobre el eje de las ordenadas, sea lo ms pequea posible. Esto es:

min ( y i y ) = ( y i a b.x i ) = e i2
2 2 a ,b i =1 i =1 i =1

donde:

y = a + bx ,

es el valor predicho por el modelo lineal y ei es el residuo definido como ei = ( y i y ) .

Figura 9.5: Representacin de los residuos, E(Y|X=x), recta de regresin e interpretacin geomtrica de la ordenada al origen () y de la pendiente () de la recta

El mtodo de estimacin por mnimos cuadrados produce las siguientes expresiones para los estimadores b y a de y respectivamente:
n

b=

i =1

X iYi 2 Xi n

i =1

X i . Yi
i =1

( X i )2
i =1

n n

a = y x

i =1

206

Anlisis de Regresin

En el ejemplo:

b =

1.5888 -

8.28 . 2.22 12 = 0.159 8.282 6.0728 12

a = 0.185 - 0.159 . 0.69 = 0.076 por tanto la regresin estimada de Y sobre X puede expresarse como: Y | X=xi = 0.076 + 0.159 xi y su grfica se presenta en la Figura 9.6.

contenido promedio de nitrogeno por planta

0.24 0.22 0.20 0.18 0.16 0.14 0.12 0.10 0.3 0.5 0.7 0.9 1.1 contenido de nitrgeno en el suelo

Figura 9.6: Representacin grfica conjunta del diagrama de dispersin del Ejemplo 9.2 y la recta de regresin estimadas Y = 0.076 + 0.159 X.

Estimaciones y predicciones
La ecuacin de regresin puede ser usada para obtener estimaciones de la esperanza de Y o predicciones de Y para valores elegidos de X. Debe tenerse en cuenta, sin embargo, que los valores de X propuestos deben pertenecer al dominio de las X utilizado para la estimacin de la recta. No es conveniente usar la ecuacin de la recta para extrapolar, es decir para estimar la esperanza de Y para valores de X fuera del rango estudiado ya que no se conoce nada sobre el comportamiento de la relacin de
207

Anlisis de Regresin

X e Y fuera del dominio en la que se estudi esta relacin. Por supuesto, an dentro del dominio estudiado de X, la validez de las estimaciones depende de la bondad de ajuste del modelo, es decir su grado de aproximacin respecto de la verdadera relacin funcional entre las variables. Cada valor calculado a partir de la recta de regresin, es la estimacin de la esperanza

de la distribucin de Y condicionada a un valor de X Y | X = x , o una prediccin del


valor de Y para una observacin futura de X ( y ).
En el ejemplo, las predicciones de Y para x = 0.93 y x = 0.46 son, respectivamente:

y = 0.076 + 0.159 (0.93) = 0.22 y = 0.076 + 0.159 (0.46) = 0.15

Intervalo de confianza para la esperanza condicional de Y


Utilizando las propiedades de la varianza de la suma de variables aleatorias, aplicada a la expresin de la esperanza condicional de Y dado X se tiene:
2 1 (x x ) Var ( E (Y | X = x ) ) = + 2 n x i2 ( x i ) n 2

De la expresin anterior pueden deducirse tres propiedades: a) b) La varianza de la esperanza de Y no es igual para todo valor Xi, de hecho es mnima cuando Xi coincide con la media muestral de X. La varianza de la esperanza de Y es ms pequea cuanto mayor es la suma de cuadrados de X x i2 ( x i ) n , lo que implica que cuanto ms dismiles
2

sean los valores de X a los cuales se observan los valores de Y, tanto mejor sern las estimaciones de las esperanzas condicionales de Y. c) Para n que tiende a infinito la varianza de la esperanza condicional de Y tiende a cero.

Adems, bajo los supuestos clsicos del anlisis de regresin, el intervalo de confianza al 95%, de Y para X=x0 est dado por:

208

Anlisis de Regresin
2 1 ( x0 x ) y0 1.96 + 2 n x i2 ( x i ) n 2

Si 2 no se conoce y se estima, entonces, el intervalo anterior se modifica reemplazando el valor 1.96 por el cuantil correspondiente de una T con n-2 grados de libertad y sustituyendo 2 por su estimador. Cuando los intervalos de confianza se grafican para todos los valores de x en un recorrido dado se obtienen bandas de confianza. La Figura 9.7, muestra las bandas de confianza al 95% para una regresin lineal simple en la que se evalu el contenido de nitrgeno en plantas de trigo en funcin del contenido de nitrgeno del suelo.
0.25
Nitrgeno en planta (ppm)

0.20

Figura 9.7: Recta de mnimos cuadrados y bandas de confianza al


0.15

95% para la esperanza condicional de Y dado X=x.

0.10 0.4

0.5 0.6 0.7 0.8 0.9 Nitrgeno en Suelo (ppm)

1.0

Intervalo de confianza para las predicciones de Y dado X


Al igual que en el punto anterior, aplicando el operador varianza al predictor de Y dado X=x se tiene la siguiente expresin.
2 1 (x x ) Var (Ypred | X = x ) = 1 + + 2 n x i2 ( x i ) n 2

Idnticas observaciones a las realizadas para la varianza de la esperanza condicional de Y, se pueden hacer para la expresin anterior, pero debe agregarse que en este caso
209

Anlisis de Regresin

la varianza es 2 unidades mayor y que para n que tiende a infinito la varianza del predictor tiende a 2. Cuando se grafican todos los intervalos de prediccin para una regin dada de x, se obtienen las bandas de prediccin, que son similares a las de confianza, excepto que son ms amplias. El intervalo de prediccin al 95% de Y dado X=x0 tiene la siguiente expresin:
2 1 ( x0 x ) y0 1.96 1 + + 2 n x i2 ( x i ) n 2

En el caso en que se estime 2, el intervalo se obtiene reemplazando 1.96 por el cuantil correspondiente de una T con n-2 grados de libertad y sustituyendo 2 por su estimador. La diferencia entre intervalo de confianza y prediccin esta dada en que el primero delimita una regin que con probabilidad 1- contiene a la verdadera esperanza de Y dado X, mientras que el segundo delimita un regin cuya probabilidad de ocurrencia para muestras aleatorias de Y dado X es 1-.

Intervalo de confianza para la ordenada al origen


Para dar un intervalo de confianza para la ordenada al origen del modelo de regresin lineal simple se necesita conocer la varianza del estimador a de . La siguiente expresin de la varianza de a se obtiene aplicando las reglas del operador varianza al estimador de :
2 1 (x ) Var (a ) = + 2 , n x i2 ( x i )2 n

donde 2 es la varianza del error. Dado que bajo los supuestos usuales de regresin a se distribuye como una normal con esperanza y varianza segn la expresin anterior, el intervalo de confianza al 95% para esta dado por:
2 1 (x ) a 1.96 + 2 n x i2 ( x i )2 n

210

Anlisis de Regresin

Si no se conoce 2 y se estima, como se ver ms adelante, entonces el intervalo se obtiene utilizando el cuantil correspondiente de una T con n-2 grados de libertad en reemplazo de 1.96 y sustituyendo 2 por su estimador.

Intervalo de confianza para la pendiente


Al igual que para la ordenada al origen, la obtencin de un intervalo de confianza para se basa en la distribucin de su estimador b y la varianza del mismo. Bajo los supuestos que se tienen para el anlisis de regresin, b se distribuye normal con esperanza y varianza dada por la siguiente expresin:

2 Var (b) = x i2 ( x i )2 n
donde 2 es la varianza del error. Luego, el intervalo de confianza al 95% para esta dado por:

2 b 1.96 x i2 ( x i )2 n
Si no se conoce 2 y se estima, entonces el intervalo se obtiene sustituyendo 1.96 por el cuantil correspondiente de una T con n-2 grados de libertad y 2 por su estimador.

Pruebas de hiptesis en regresin


En los puntos anteriores se ha estudiado como estimar los parmetros de un modelo de regresin lineal simple: estos son la ordenada al origen () y la pendiente (). En esta seccin se aborda la problemtica de la prueba de hiptesis sobre estos parmetros. La aproximacin ms simple para probar = 0 y/o = 0 es mediante un test T. Los estadsticos de las pruebas T, que se presentan a continuacin, son simples y bajo los supuestos, que se discutirn ms adelante, se distribuyen como una T con n-2 grados de libertad.

211

Anlisis de Regresin

Para pruebas de hiptesis sobre

Para pruebas de hiptesis sobre

T=

a 0
2 1 2 (x ) + n x i2 ( x i )2 n

T=

b0 2 x i2 ( x i )2 n

! En las expresiones dadas aparece la estimacin de la varianza del error ( 2 ). No se ha


mostrado, hasta ahora, una expresin para este estimador, sin embargo, sta no es desconocida ya que se present en el contexto del anlisis de la varianza. La tcnica de estimacin nos conduce a la particin de la Suma de Cuadrados Total (SCT) de Y en una Suma de Cuadrados Explicada por (SC), una Suma de Cuadrados Explicada por (SC) y una Suma de Cuadrados Residual (SCR). As, se tiene: SCT = SC + SC + SCR Las sumas de cuadrados dadas tienen grados de libertad asociados. Las SC y SC tienen ambas 1 grado de libertad cada una, la SCT tiene n y SCR n-2. Luego, ! ! 2 =SCR/(n-2). La descomposicin de la suma de cuadrados permite estimar 2 y construir la siguiente tabla de ANOVA para el modelo de regresin: Fuentes de Variacin CMR Total Suma de Cuadrados SC SC SCR SCT 1 1 n-2 n Grados de libertad Cuadrados Medios CM CM CMR F CM /CMR CM/CMR

Las pruebas F de las dos primeras filas de la tabla sirven para probar las hiptesis: H0:=0 vs H1: 0 y H0:=0 vs H1:0 respectivamente. Es usual que la prueba H0:=0 sea irrelevante o carente de sentido en el contexto del problema y la presencia de en el modelo cumple slo con el propsito de no poner restricciones al ajuste lineal. Por lo tanto, virtualmente todo el software estadstico omite la prueba H0: = 0 y en el caso de proveer el clculo de la SCT, lo que muestran es una SCT corregida que es igual SCT-SC con n-1 grados de libertad. Debido a que la correccin de la SCT es la prctica usual, excepto que se indique lo contrario, siempre se hace referencia a ella. De esta forma SCT (corregida) = SC + SCR y la tabla de ANAVA es la siguiente:
212

Anlisis de Regresin

Tabla 9.2: Cuadro de Anlisis de la Varianza para la hiptesis usual del modelo de regresin simple. H0: = 0 , siendo el coeficiente Fuentes. de variacin Debida a (explicada) Suma de Cuadrados
n n X i Yi n X iYi i =1 i =1 n i =1 2 n Xi n 2 X i i=1 n i =1

Grados de libertad

Cuadrados Medios SC 1

F observada CM CMR

Residual (no explicada) Total (corregida)

SC Total-SC

n-2 n-1

SCR n2

Y
i =1

( Yi ) 2
i =1

Observacin: Como podr observarse, la suma de cuadrados total (corregida) es idntica a la que se encontr en el anlisis de la varianza mientras que el Cuadrado 2 Medio Residual es el estimador de la varianza del error ( ) al igual que en el anlisis de la varianza lo era la suma de cuadrados del error. La SC es tambin conocida como Suma de Cuadrados de Regresin.

Ejemplo 9.2: (continuacin) volviendo a la relacin entre el contenido de Nitrgeno en planta y en suelo presentada anteriormente y despus de obtener las estimaciones de y , se puede proceder con la prueba de hiptesis para establecer el rechazo o no de la hiptesis = 0.

213

Anlisis de Regresin

Los clculos para el ejemplo son:


2 SCTotal = 0.4202 - 2.22 = 0.0095 12

8.28 2.22 1.5888 12 = 0.057 2 = 0.0090 SC = 2 0.3596 8.28 6.0728 12


SCR = SCT - SC = 0.0095 - 0.0090 = 0.0005

Tabla 9.3: Tabla del Anlisis de Regresin del Ejemplo 9.2 Fuentes de variacin Debida a (explicada) Residual (no explicada) Total (corregido) Suma de Cuadrados 0.0090 0.0005 0.0095 GL 1 10 11 Cuadrados Medios 0.0090 0.00005 F Observada 180

Como la F observada es mayor que el cuantil (1-) de una F1,10 se rechaza H0 y se concluye que un modelo lineal para la relacin entre nitrgeno en la planta y nitrgeno en el suelo explica una parte de la variacin del contenido de Nitrgeno en la planta que resulta estadsticamente significativa. Si la hiptesis nula se acepta, no puede asegurarse que la pendiente de la recta de regresin estimada sea diferente de cero. Luego, si la recta tiene pendiente nula, los valores de Y son indiferentes a los valores de X y por lo tanto la relacin lineal propuesta no explica las variaciones de Y en funcin de X.

Los supuestos del anlisis de regresin


Tanto los mtodos de estimacin de los parmetros del modelo de regresin, as como los intervalos de confianza hallados y las pruebas de hiptesis estudiadas son vlidas si se cumplen las siguientes propiedades estadsticas para los errores del modelo.
214

Anlisis de Regresin

La esperanza de la distribucin de los errores es 0: E (i) = 0 Los i son variables aleatorias normales e independientes.

La varianza de la distribucin de los errores es constante: V (i) = 2 i

Estas tres propiedades se resumen indicando que i ~ NIID (0, 2) y que se lee: los errores son variables aleatorias normales independientes e idnticamente distribuidas con esperanza 0 y varianza 2. Adems, de los supuestos sobre los errores, tambin se supone vlido el modelo lineal para la esperanza condicional de Y. Es decir, se supone cierto que E(Y|X = x) = + x. El anlisis de regresin est estrechamente ligado al anlisis de la varianza y los supuestos son los mismos para ambas tcnicas. En ambos casos los supuestos soportan las propiedades estadsticas que hacen vlida la inferencia. Si los supuestos no se cumplen, el mtodo de estimacin por mnimos cuadrados no es necesariamente el ms eficiente, los intervalos de confianza hallados, el nivel de significacin y potencia nominales de las pruebas estadsticas de hiptesis no coinciden con sus verdaderos valores. Es por esta razn til preguntarse sobre la razonabilidad de los supuestos en cada problema real y en caso necesario validarlos a travs de pruebas grficas o formales. Si alguno de los supuestos no se cumple usualmente se transforman los datos originales llevndolos a una escala en la que los supuestos se cumplen. Otra alternativa es usar mtodos estadsticos que no exigen el cumplimiento de estos supuestos.

Valor predictivo del modelo de regresin


Se ha indicado que la variacin total en Y puede ser vista como la variacin explicada por la regresin ms la variacin no explicada o residual. Si la variacin no explicada es substancialmente mayor que la variacin explicada, se tendr un indicio de que modelo no es bueno para fines predictivos, es decir, el modelo est explicando poco de la variacin en Y. No se debe, sin embargo, confundir la medida de cuanto explica un modelo con su pertinencia, ya que se recordar una vez ms, que el modelo es para las esperanzas de Y. Una medida muestral de la capacidad predictiva del modelo es el 2 coeficiente de determinacin , denotado por R .

215

Anlisis de Regresin

Definicin 9.3: Coeficiente de determinacin muestral


Llamaremos coeficiente de determinacin muestral a:

R2 =

Suma de Cuadrados de Regresin Suma de Cuadrados Total

Este coeficiente se interpreta como la proporcin de la variabilidad total en Y explicable por la variacin de la variable independiente o como tambin es usual decir: la proporcin de la variabilidad total explicada por el modelo. Por ser una proporcin, el coeficiente de determinacin vara entre 0 y 1. Cuanto ms prximo est a 1, mayor valor predictivo tendr el modelo en el sentido que los valores observables estarn muy prximos a la esperanza estimada por la regresin. Siguiendo con el ejemplo de la relacin entre Nitrgeno en planta y Nitrgeno en 2 suelo, el coeficiente de determinacin obtenido es R = 0.951, es decir el 95% de la suma de cuadrados totales de la variable dependiente (Nitrgeno en planta) es "explicada", a travs de una relacin lineal, por la variacin observada en la variable independiente. Es frecuente ver al coeficiente de determinacin usado como una medida de la adecuacin del modelo, entendiendo por adecuacin que la relacin funcional y los supuestos sobre los errores son correctos. Esta interpretacin es absolutamente 2 incorrecta y se pueden dar ejemplos en los que R es muy alto y el modelo 2 completamente inapropiado. Luego, R es vlido como medida de ajuste o de valor predictivo si el modelo es correcto tanto en su parte determinstica como en su parte aleatoria. La evaluacin de la adecuacin del modelo es un tema amplio que excede el objetivo de este libro pero es una de las reas a las que se ha prestado mucha atencin en los ltimos aos y existe una amplia bibliografa sobre el tema (Rawlings, 1988, Myers,1990; Draper y Smith, 1998)

Anlisis de Correlacin Lineal


En el anlisis de regresin, la variable X es usualmente fija, mientras que la variable dependiente Y es aleatoria. Si X e Y son ambas variables aleatorias observables sobre una misma unidad o elemento de la poblacin, podra ser de inters medir el grado en que estas variables covarian ya sea positiva o negativamente. Por ejemplo, si un
216

Anlisis de Regresin

fitomejorador sabe cmo controlar la altura del tallo de maz y se puede establecer que existe un alto grado de asociacin entre la altura del tallo y el rendimiento de la cosecha se podr, probablemente, tambin controlar el rinde. La simple observacin de que dos variables parecen estar relacionadas, no revela gran cosa. Dos importantes preguntas se pueden formular al respecto: a) b) Qu tan estrechamente relacionadas se encuentran las variables? o cul es el grado de asociacin que existe entre ambas? Es real la asociacin observada o podra haber ocurrido solo por azar?

Para responder a la primer pregunta se necesita una medida del grado de asociacin entre las dos variables. Esta medida es el coeficiente de correlacin, que se denota con la letra griega (rho). Para la segunda, se precisa una prueba estadstica de hiptesis para . El anlisis de correlacin clsico supone que los pares (Xi, Yi) son pares de variables aleatorias idnticamente distribuidos con distribucin normal bidimensional, o normal bivariada. Geomtricamente, la funcin de densidad de esta distribucin es una superficie de forma acampanada. La distribucin normal bivariada es aquella en la que la distribucin condicional de Y para cualquier X, es normal, y la distribucin condicional de X para cualquier Y, es tambin normal. Esta distribucin incluye a como uno de sus parmetros. Las siguientes figuras muestran una normal bivariada con = 0 y una normal bivariada con = 0.8.

Figura 9.8:Densidad normal bivariada: =0.

Figura 9.9:Densidad normal bivariada: =0.8.

Observacin: Aunque en el anlisis de correlacin no se explicita la forma de la asociacin entre variables cuya intensidad y sentido se quiere medir, el coeficiente de correlacin clsico o de Pearson cuantifica el grado de asociacin lineal entre ellas. Por lo tanto si dos variables siguen una estrecha asociacin no lineal, el coeficiente de correlacin no la cuantificar correctamente.

217

Anlisis de Regresin

Definicin 9.4: Coeficiente de correlacin lineal.


El coeficiente de correlacin lineal entre las variables aleatorias X e Y se define como :

cov( X , Y ) Var ( X )Var (Y )

donde Var(X) y Var(Y) denotan las varianzas de X e Y respectivamente y Cov(X,Y) denota la covarianza entre X e Y que se define como Cov(X,Y)= E (XY) - E(X) E(Y).

Es importante observar que de la definicin surge que el coeficiente de correlacin es independiente de las unidades de medida de las variables. Tambin debe notarse que el coeficiente de correlacin lineal vive en el intervalo [-1,1]. Este coeficiente es un indicador de la densidad alrededor de la recta de regresin para la distribucin condicional de Y dado X y viceversa. Cuando X e Y estn no correlacionadas, es igual a cero. En este caso el conocimiento de una de las variables no ayuda a describir el comportamiento de la otra. Por otra parte, cuando X e Y estn altamente correlacionadas en forma lineal, est muy prximo a 1 -1. Por definicin de la normal bivariada, es un parmetro que la caracteriza, y como todo otro parmetro, se estima a partir de observaciones muestrales.

Definicin 9.5: Coeficiente de correlacin lineal muestral de Pearson


Si (X1, Y1),..., (Xn, Yn) es una muestra aleatoria bivariada de tamao n, el coeficiente de correlacin lineal muestral (estimador de ), se denota con r y se define por:
n

r=

i =1 n

( X i X )(Yi Y )
2 n

.
2

i =1

( X i X ) (Yi Y )
i =1

La frmula de clculo es:

218

Anlisis de Regresin
n n

r=

i =1

X iYi i =1

X i Yi
i =1

n Xi n X i2 i =1 n i =1

( )

n Y i n Y i2 i =1 n i =1

( )
2

Este estimador provee una medida muestral de la correlacin entre X e Y, y posee la propiedad de ser un estimador insesgado de cuando = 0. Cuando est en la proximidad de 1 o -1 los pares (x,y) se alinean sobre una recta con pendiente positiva o negativa segn el signo del coeficiente. Cuando = 0, los pares (X,Y) estn dispersos alrededor del punto X , Y sin ninguna direccin predominante.

nota: 0 implica solamente que hay asociacin entre X e Y pero no implica relaciones de causalidad. Bajo el supuesto de distribucin normal bivariada = 0 implica que X e Y son estadsticamente independientes.

Prueba de hiptesis sobre


Si se satisfacen las suposiciones de normalidad bivariada y se tiene una muestra aleatoria de n pares de valores (X,Y), es posible utilizar el coeficiente de correlacin muestral r, para probar la independencia entre X e Y probando la hiptesis H0: = 0. Para probar la hiptesis H0: = 0 vs. H1: 0, el estadstico utilizado es:

T=

r 1 r2 n2

que se distribuye como una distribucin T de Student con n-2 grados de libertad, donde n es el nmero de pares (X,Y). Luego se procede como en cualquier prueba de hiptesis para la aceptacin o rechazo de Ho. Ejemplo 9.3 Los datos de la Tabla 9.4 se refieren al contenido de protena bruta (PB) y casena
219

Anlisis de Regresin

(CA) en leche en una muestra de 23 tambos de la cuenca lechera del centro del pas. Tabla 9.4: Contenido de protena bruta (PB) y casena (CA) en leche de 23 tambos de la cuenca lechera de la regin central Argentina.
PB
2.74 3.19 2.96 2.91 3.23 3.04 3.08 3.23 3.11 3.11 3.1 3.25

CA
1.87 2.26 2.07 2.09 2.28 2.04 2.18 2.3 2.17 2.15 2.16 2.33

PB
2.95 3.08 3.14 3.22 3.14 3.15 3.2 2.95 3.19 3.12 2.99

CA
2.04 2.16 2.16 2.22 2.22 2.24 2.22 2.07 2.25 2.23 2.16

El coeficiente de correlacin lineal muestral entre PB y CA es: r = 0.9327. Es esta alta correlacin estadsticamente significativa? Para contestar a esta pregunta se debe realizar una prueba de hiptesis: Las hiptesis en este caso son: H0: = 0 vs H1: 0. Fijando =0.05 y utilizando el estadstico T =

r 1- r 2 n-2

, que se distribuye bajo H0 como una T de Student con n-2

grados de libertad, se determina la regin de aceptacin como el intervalo delimitado por los cuantiles 0.025 y 0.975 de una t (n-2) como se muestra en la siguiente figura.

0.95
0.025 0.025

t 21, 0.025 = -2.079

t 21,0.975 = 2.079

220

Anlisis de Regresin

= 11.85, que est fuera de la 1 0.9327 2 23 2 regin de aceptacin y por lo tanto se rechaza H0. Se concluye luego que, con un nivel de significacin del 5%, se rechaza la hiptesis de correlacin nula. En consecuencia se puede decir que hay una correlacin lineal estadsticamente significativa entre los porcentajes de protena bruta y casena en la leche. Calculando el estadstico se tiene T =

0.9327

Ejercicios
Ejercicio 9.1 Los siguientes datos corresponden a los porcentajes de mortalidad obtenidos a dosis crecientes de un insecticida. Se desea estudiar si existe una componente lineal entre la mortalidad y la dosis, expresada como el logaritmo de las concentraciones utilizadas. El experimento consisti en someter a grupos de 1000 insectos a cada una de las dosis ensayadas. Los resultados fueron los siguientes: Ln(dosis) 0 1 5 10 15 20 25 30 a) b) c) d) e) Mortalidad (%) 5 7 10 16 17 25 26 30

Construir un diagrama de dispersin Mortalidad vs. Ln(dosis). De acuerdo al grfico obtenido, es razonable proponer un ajuste lineal? Escribir el modelo lineal que, se supone, relaciona la mortalidad con la dosis. Estimar los parmetros del modelo. Construir el cuadro de anlisis de la varianza y obtener conclusiones.
221

Anlisis de Regresin

Ejercicio 9.2 Considrese nuevamente un ensayo para evaluar el efecto comparativo de dos insecticidas (A y B) sobre la mortalidad de insectos. Con los resultados que se presenta a continuacin: Mortalidad (%) Ln(dosis) 0 1 5 10 15 20 25 30 a) b) c) d) e) f) Insecticida A 5 7 10 16 19 27 28 34 Insecticida B 6 5 8 8 13 17 22 23

Verificar si para los insecticidas A y B es razonable un modelo lineal de la forma Y= + x + para modelar la mortalidad en relacin a la dosis. Estimar los parmetros de ambos modelos. Construir los cuadros de anlisis de la varianza. Comparar las pendientes y ordenadas al origen de ambos insecticidas. Si el ensayo ha sido bien planificado, qu se espera de la diferencia de las ordenadas al origen? Qu se recomienda teniendo en cuenta las pendientes?

Ejercicio 9.3 Para estudiar el efecto de la temperatura sobre el vigor durante la germinacin, se dispusieron semillas de alfalfa en germinadores a distintas temperaturas. A los 6 das se midi la longitud de las plntulas, obtenindose los siguientes datos:

222

Anlisis de Regresin

T (oC) 10 15 20 25 a) b) c) d) 13 20 22 24 18 24 27 25

Longitud de Plantas (mm) 15 15 31 28 19 17 21 23 26 11 17

Qu diferencia hay en los datos de este ejercicio con respecto a los anteriores? Construir el diagrama de dispersin entre longitud de plntula y temperatura y verificar si existe una tendencia lineal. Realizar un anlisis de regresin lineal trabajando con = 0.05. Qu temperatura permite obtener mayor vigor?.

Ejercicio 9.4 Si los rendimientos del ajo dependen linealmente, en un cierto rango, del porcentaje de materia orgnica (MO) del suelo con pendiente 4000kg/ha/MO(%), cul es la diferencia promedio de rendimiento entre campos que poseen una diferencia en el contenido de materia orgnica del suelo del 1.3%? (Se supone que estos campos tienen contenidos de materia orgnica en el rango de validez del modelo y que el modelo es vlido en ambos campos). Ejercicio 9.5 En un experimento para evaluar la efectividad de un insecticida sobre la sobrevida de dos especies de insectos (A y B) se obtiene que, en ambos casos, es posible ajustar un modelo lineal para la sobrevida (Y) versus la concentracin (en ppm) del insecticida utilizado (X), siendo los modelos ajustados los siguientes: Especie A: Y = 80 - 15 X; De acuerdo a estos resultados: a) b) c) d) Es el insecticida igualmente efectivo en ambas especies? Qu interpretacin se puede hacer de cada una de estas ecuaciones? Cmo se modifica la sobrevida por cada incremento unitario en la concentracin del insecticida agregado? Si se quisiera que ambas especies tengan una sobrevida menor que 20, cuntas ppm. se debera agregar del insecticida?
223

Especie B: Y = 60 - 15 X.

Anlisis de Regresin

Ejercicio 9.6 Se desea probar la efectividad de un nuevo fungicida para el control de roya en trigo. Se probaron distintas dosis en gramos de principio activo por ha (gr.p.a./ha) en 10 parcelas de 100 plantas cada una. A los 15 das de la aplicacin se realiz un recuento del nmero de plantas enfermas. Los datos son los siguientes:

Dosis(X) Enfermas(Y)

100 50

125 48

200 39

250 35

275 30

300 25

325 20

350 12

375 10

400 5

A continuacin se presentan los estadsticos bsicos necesarios para el anlisis de regresin lineal. xj 2700 a) b) yj 274 xj
2

yj

xj.yj 59750

2 Y|X=X

822500

9744

8.838

Predecir el nmero de plantas enfermas que se hallarn si se aplican 260 gr.p.a./ha Construir los intervalos de prediccin y de confianza para 260 gr.p.a./ha

Ejercicio 9.7 En un ensayo de resistencia a la sequa, dos especies de leguminosas (A y B) fueron comparadas. El experimento consisti en registrar el peso seco total de 10 plantas al cabo de 30 das desde la siembra. Las condiciones comparadas fueron las siguientes: medio de cultivo estndar (MCE), MCE+10 g/l de ClNa, MCE+20 g/l de ClNa, MCE+30 g/l de ClNa, MCE+40 g/l de ClNa. Los siguientes tres grficos muestran tres resultados posibles para esta experiencia. Los grficos representan las rectas que modelan la esperanza del peso seco en relacin al agregado de ClNa en cada caso.

224

Anlisis de Regresin

peso seco Caso I A B

peso seco Caso II A B

10 20 30 ClNa agregado al MCE

40

10 20 30 ClNa agregado al MCE

40

peso seco A B Caso III

10 20 30 ClNa agregado al MCE

40

a)

Qu conclusin se obtendra, en cada una de estas situaciones acerca de la resistencia a la sequa de ambas especies, asumiendo que si la especie soporta mayor contenido de ClNa ser ms resistente? Qu significan (o que interpretacin tienen) la diferencia y la similitud de las ordenadas al origen de las rectas ajustadas en los casos I, II, y III? Qu significan (o que interpretacin tienen) la diferencia y la similitud de las pendientes de las rectas ajustadas en los casos I, II, y III?

b) c)

Ejercicio 9.8 En un estudio se hicieron mediciones de permetro y peso de cabezas de ajo. Los datos que se obtuvieron fueron los siguientes: Permetro (cm) 12.39 12.39 12.71 9.8 12.3 10.12 11.81 11.41 Peso (grs.) a) b) Cmo se espera que sea la asociacin entre peso y permetro? Calcular coeficiente correlacin entre peso y permetro
225

9.4 11.49

32.27 29.39 30.8 15.6 29.8 16.87 28.11 23.29 14.11 25.37

Anlisis de Regresin

c) d)

Es significativo el coeficiente encontrado? Elaborar conclusiones.

226

10
10 Diseo de Experimentos
Introduccin
El objetivo de este captulo es dar un panorama de los principios y tcnicas del diseo de experimentos. No pretende dar respuesta a la amplia variedad de situaciones experimentales ni hacer un recuento de las tcnicas disponibles para abordar estas situaciones. Por el contrario en este material se presenta una seleccin de tpicos que permite al lector comprender los fundamentos del diseo y abordar la lectura de textos mas avanzados y completos.

Elementos del Diseo de Experimentos


Para abordar el tratamiento de los tpicos del diseo de experimentos, se presentarn a continuacin las definiciones necesarias para el desarrollo y discusiones posteriores.

Experimento
Definicin 10.1: Experimento
Se define a un experimento como la accin de aplicar uno o ms tratamientos a un conjunto de unidades experimentales para valorar sus respuestas.

Bajo el modelo experimental, las alteraciones en las respuestas se atribuyen solamente a la accin de los tratamientos excepto por variaciones aleatorias (usualmente pequeas) debidas a errores experimentales y/o falta de homogeneidad de las unidades experimentales.

Unidad experimental
La definicin de parcela o unidad experimental se dio en el Captulo 8, por lo que solo
227

Diseo de Experimentos

se recuerda que se trata de una alcuota de material, una parcela de terreno, un animal o grupo de animales, etc. al cual se le aplica un tratamiento y sobre el que, posteriormente, se observan una o ms respuestas para evaluar el efecto del tratamiento.

Factores y Tratamientos
Los tratamientos que reciben las unidades experimentales pueden corresponder a distintas dosis de una droga, a diferentes intensidades de luz, a cantidades variables de agua o a distintos tipos de insecticidas. En cada uno de estos casos, se dice que el experimento es unifactorial ya que los tratamientos consisten en aplicar distintos niveles de un mismos factor. Un ejemplo de estos experimentos es aquel en que se ensayan distintas densidades de siembra para evaluar los rendimientos agrcolas. En este ejemplo la densidad de siembra es el factor y las distintas densidades sus niveles. Si en cambio un tratamiento consiste en la combinacin de niveles de 2 o ms factores, entonces se dice que el experimento es un experimento factorial. A modo de ejemplo, suponga que en un ensayo comparativo de rendimientos se siembran parcelas experimentales con tres variedades de una especie en dos fechas de siembra. En este ensayo, se tienen dos factores: variedad y fecha de siembra y un total de seis tratamientos, el factor variedad se encuentra a tres niveles y el factor fecha a dos.

Modelo para las observaciones


A los fines del tratamiento estadstico de los resultados de un experimento, se propone un modelo para la variable de respuesta que tiene en cuenta las fuentes conocidas de variacin como los tratamientos y, en algunos casos, las caractersticas de las unidades experimentales. La estimacin de la magnitud de la contribucin de estas fuentes de variacin es un objetivo principal del anlisis estadstico. Un modelo simple para un experimento con a tratamientos, repetidos n veces sobre unidades experimentales homogneas es el siguiente: Yij = + i + ij; con i=1,,a; j=1,,ni

En este modelo Yij es la respuesta observada en la unidad experimental j-sima del


228

Diseo de Experimentos

tratamiento i-simo, es una media general, i es el efecto del i-simo tratamiento, +i es la respuesta esperada para el tratamiento i-simo y ij es la discrepancia entre lo efectivamente observado en la unidad experimental j-sima del tratamiento i-simo y la respuesta esperada para ese tratamiento. Estas discrepancias, conocidas como errores, se consideran aleatorias con esperanza cero, varianza 2 y estadsticamente independientes y en los modelos clsicos se suponen adems normalmente distribuidas. La evaluacin de , i y 2 (los llamados parmetros del modelo) es una parte central del anlisis estadstico y es lo que se conoce como estimacin del modelo. Una vez que los parmetros se han estimado, el problema estadstico consiste en establecer si las hiptesis formuladas sobre ellos son consistente con los resultados experimentales. La hiptesis usual es que los i son iguales y equivale a la hiptesis de igualdad de los efectos de tratamientos.

Fuentes de Error
Las discrepancias entre los observado y lo esperado para un tratamiento surgen de dos fuentes principales de variacin cuya magnitud relativa depende del experimento que se est considerando. La primera es el error que se introduce cuando se quiere reproducir (repetir) el experimento sobre cada una de las unidades experimentales; la otra es la respuesta diferencial de cada unidad experimental al tratamiento que recibe y que depende de propiedades inherentes a la unidad experimental. A la primer fuente de error se la conoce como error de tratamiento y a la segunda como error de muestreo. Una vez realizado un experimento, ambas fuentes de error son indistinguibles y conforman un nico error que se designa genricamente como error experimental. Existen dos recursos bsicos para reducir el efecto no deseado de la presencia de los errores. Estos recursos son la aleatorizacin y la repeticin. Aleatorizacin La aleatorizacin consisten en la asignacin aleatoria de las unidades experimentales a los distintos tratamientos. Esta tcnica tiene por objeto evitar que unidades experimentales que responden de manera particular a los tratamientos (poca respuesta, respuesta exagerada) no sean asignadas a un mismo tratamiento sino distribuidas lo mas equitativamente posible entre ellos. Lo paradjico es que la distribucin equitativa, es decir, aquella que hace que las respuestas exageradas se compensen con
229

Diseo de Experimentos

las respuestas pobres, no es posible ya que las respuestas diferenciales no se conocen a priori y tampoco es posible saber a posteriori qu es efecto puro de tratamiento y qu es la respuesta diferencial de la unidad experimental. Sin embargo, al asignar al azar las unidades experimentales a los tratamientos, lo que se obtiene es un procedimiento que en promedio logra una distribucin equitativa. Repeticin El objetivo principal de esta tcnica es lograr que la recreacin del tratamiento para cada unidad experimental evite la introduccin de un error sistemtico en todos las unidades experimentales de un mismo tratamiento. Este concepto es muy importante y existe una gran confusin sobre el mismo. Por ejemplo, si un tratamiento consiste en la elaboracin una sustancia para posteriormente aplicarla a un lote de semillas, muchos investigadores piensan que repetir este experimento es volver a aplicar la sustancia elaborada a otro conjunto de semillas. Sin embargo, una genuina repeticin es aquella que comienza con la elaboracin de la sustancia desde sus componentes bsicos repitiendo todas las etapas de sntesis. En muchos casos esto puede ser exagerado y para evitar trabajo innecesario el investigador debera establecer donde comienza el experimento. Para responder a esta cuestin, lo que se debe identificar es cul es la etapa de la implementacin del experimento en la que se introduce mayor variabilidad. Si esta etapa es identificada, entonces, los tratamientos deben repetirse a partir de ella. Las repeticiones, asimismo, hacen viable el concepto de aleatorizacin ya que si no existen repeticiones, los efectos de tratamientos quedan confundidos con los efectos de parcela o unidad experimental. En algunas reas de conocimiento es frecuente confundir error experimental con error de medicin. Frecuentemente el error de medicin queda confundido con el error experimental, excepto cuando alcuotas o partes de una misma (o a veces nica) unidad experimental son tomadas como repeticiones. En este caso se tienen pseudorepeticiones y el error que se incluye en el modelo solo da cuenta del error de medicin que puede ser mucho menor que el error experimental y conducir a la peligrosa creencia de que el experimento analizado es muy preciso. Ms an, cuando las pseudo-repeticiones provienen de una nica unidad experimental se tendr un experimento que puede suponerse extremadamente preciso y que, adems, conduce a una estimacin sesgada de los efectos de tratamiento por confusin con error de muestreo.

230

Diseo de Experimentos

Precisin
Cuando un experimento es infinitamente preciso es capaz de detectar cualquier diferencia entre medias de tratamientos. Este caso ideal se obtiene cuando la varianza del error es cero, pero esta situacin no ocurre en la naturaleza. Por el contrario, todos los experimentos tienen un umbral por debajo del cual no son capaces de distinguir entre tratamientos diferentes. Cuanto ms preciso es el experimento ms bajo es el umbral y viceversa. Por lo tanto, un objetivo principal del diseo es aumentar la precisin de un experimento. Los recursos para lograr un aumento de precisin son el incremento del nmero de repeticiones, el reconocimiento de fuentes sistemticas de variacin entre parcelas y, en algunos casos, el uso de experimentos factoriales.

Estructura de parcelas
Anteriormente se estableci que la aleatorizacin era un mtodo de distribucin equitativa de parcelas sobre y sub respondedoras a los tratamientos y que el mtodo se justificaba en el hecho de que no era posible anticipar estas respuestas. A estos diseos en los que la aleatorizacin no est restringida, se los llama completamente aleatorizados. En algunos casos, sin embargo, es posible establecer que algunas parcelas o unidades experimentales respondern de una manera y otras de otra. Un ejemplo simple se observa en los ensayos de rendimiento cuando el terreno donde se realiza el experimento tiene una pendiente marcada. En estos casos las parcelas de la parte elevada suelen tener rendimientos menores que las de la parte baja y usar aleatorizacin (no restringida) como criterio de distribucin de las parcelas no es la mejor decisin a la hora de planificar el experimento. Por el contrario, si a cada tratamiento se le asigna una repeticin dentro de conjuntos de parcelas ubicados por ejemplo en la parte superior, media e inferior del lote experimental y se aplica aleatorizacin dentro de cada conjunto de esas parcelas, se habr reconocido desde el punto de vista del diseo, una fuente sistemtica de variacin debida a la pendiente del terreno. Para ser consistentes con el diseo, el modelo del experimento deber incorporar los parmetros necesarios para dar cuenta de la estructura de parcelas. El resultado de esta accin no es solo tener un modelo con mas parmetros sino un experimento mas preciso.

231

Diseo de Experimentos

Definicin 10.2: Diseo de la estructura de parcelas


El diseo de la estructura de parcelas consiste en el agrupamiento de unidades experimentales homogneas en grupos o bloques.

El reconocimiento de la estructura de parcelas y su incorporacin al modelo de anlisis de la varianza tiene como consecuencia inmediata el aumento de precisin del diseo. Esto es as siempre y cuando la estructura de parcela obedezca al reconocimiento de variaciones reales entre las unidades experimentales ya que la imposicin de una estructura de parcela arbitraria e innecesaria lejos de aumentar la precisin la disminuir. Un comentario final es que, si el investigador cuenta con unidades experimentales que responden homogneamente a cada tratamiento, en cantidad suficiente para montar el experimento completo, el diseo completamente aleatorizado es preferible ya que su aplicacin no requiere restricciones a la aleatorizacin y por lo tanto no es necesaria la estimacin de parmetros adicionales. Adems, en los diseos con estructura de parcela, sta no debe interactuar con los tratamientos, i.e. sus efectos deben ser aditivos. En el caso del diseo completamente aleatorizado, al no existir una estructura no es necesario validar este supuesto. Finalmente, la prdida de parcelas por diversos motivos extrnsecos a los tratamientos en los diseos completamente aleatorizados, no conduce a la aplicacin de correcciones de compromiso sobre los resultados experimentales o la perdida completa de una o ms repeticiones de todos los tratamientos como puede ocurrir en algunas estructuras de parcela.

Algunos diseos clsicos


A continuacin se presentan tres diseos (estructura de parcelas) clsicos en la literatura de diseo de experimentos. El segundo de ellos es uno de los ms simples arreglos de unidades experimentales no homogneas y posiblemente el ms popular entre los experimentadores agrcolas. Completamente aleatorizado Cuando las parcelas experimentales son homogneas o no se es capaz de anticipar respuestas diferenciales de cada una de ellas, la mejor opcin desde el punto de vista del diseo de experimentos es asignar los tratamientos, de manera completamente al
232

Diseo de Experimentos

azar. El modelo para este diseo y el anlisis de la varianza discutidos en el Captulo 8 corresponden al anlisis de un experimento unifactorial sin estructura de parcelas. Bloques completos aleatorizados Aunque la asignacin aleatoria de tratamientos es una forma natural de distribuir imparcialmente las pequeas (o grandes) diferencias en las respuestas de las unidades experimentales, esta asignacin no siempre es la ms conveniente. Cuando las diferencias de respuestas de las unidades experimentales pueden ser anticipadas, lo conveniente es agrupar aquellas unidades similares en bloques y asignar aleatoriamente los tratamientos dentro de esos bloques. De esta manera, cada bloque representa una repeticin completa de todos los tratamientos. Este arreglo experimental se denomina diseo en bloques completos aleatorizados. Se dice que son completos porque en cada bloque aparecen todos los tratamientos, y aleatorizados porque dentro de cada bloque los tratamientos son distribuidos aleatoriamente. Un caso particular de diseo en bloques es el que aparece relacionado con la prueba T para muestras apareadas, aunque el nmero de tratamientos es slo dos. Ejemplo 10.1 Se realiz un ensayo para evaluar el rendimiento en kg de materia seca por hectrea de una forrajera megatrmica con distintos aportes de N2 en forma de urea. Las dosis de urea probadas fueron 0 (control), 75, 150, 225 y 300 kg/ha. El ensayo se realiz en distintas zonas, en las que por razones edficas y climticas se podan prever rendimientos diferentes. Las zonas en este caso actuaron como bloques. El diseo a campo se ilustra en la siguiente figura y a continuacin se presentan los resultados obtenidos ordenados por tratamiento y por bloque.

Bloque I Bloque II Bloque III Bloque IV

225

300

75

150

300

150

75

225

Figura 10.1: Asignacin de tratamientos en un diseo en bloques completos aleatorizados.

75

300

225

150

225

150

75

300

233

Diseo de Experimentos

Tabla 10.1: Rendimiento de materia seca (Kg/Ha) de una forrajera megatrmica con distintos niveles de aportes de nitrgeno en forma de urea. Urea (Kg/Ha) 0 (control) 75 150 225 300 Bloque I 2010 2915 3049 3199 3381 Bloque II 1832 2175 2908 3235 3270 Bloque III 2170 2610 2964 3003 3129 Bloque IV 1879 2294 2971 2937 3171

Los datos de la tabla anterior se pueden representar genricamente de la siguiente manera: Tabla 10.2: Estructura tpica de una tabla de datos para un ensayo unifactorial con diseo en bloques completos aleatorizados. Tratamientos 1 2 : a Total bloque 1 y11 y21 : ya1 y1 bloque 2 y12 y22 : ya2 y2 ... ... ... ::: ... bloque b y1b y2b : yab y b y a y Total y1 y2

Cada entrada a la tabla representa una observacin en el i-simo tratamiento (i=1,...,a) del j-simo bloque (j=1,...,b). El modelo lineal para un anlisis de la varianza con un factor (en este caso fertilizante) en un diseo en bloques completos, es el siguiente. Yij = + i + j + ij , con i=1,...,a; j=1,...,b

donde corresponde a la media general, i el efecto del i-simo tratamiento, j el efecto del j-simo bloque y ij representan, como siempre, errores normales e independientes con esperanza cero y varianza comn 2.
234

Diseo de Experimentos

Respecto del modelo lineal original slo se ha agregado el trmino j. Este trmino puede modelar un efecto fijo o aleatorio y este ltimo caso supone con distribucin 2 normal independiente, esperanza cero y varianza e independiente del trmino de error. Este trmino modela la variacin introducida por los bloques y tiene por objeto reducir el error experimental. Cmo cambia la tabla de anlisis de la varianza para este diseo?. A continuacin se muestra la Tabla de ANAVA modificada para incluir el efecto de los bloques. Calculando las cantidades para el Ejemplo 10.1, se obtienen los resultados de la Tabla 10.4. Tabla 10.3: Frmulas de trabajo de anlisis de la varianza de un experimento unifactorial con diseo en bloques completos aleatorizados. Fuente de Variacin Bloques Suma de Cuadrados
a (y )2 (y )2 j SCB= a - ab j=1 b (y )2 (y )2 i SCE= b - ab i=1 SCD=SCT-SCE-SCB a b (y)2 SCT= yij 2- ab i=1 j=1

Grados de Libertad
glb=b-1

Cuadrado Medio

Entre Tratamientos Dentro (Error Experimental) Total

gle=a-1

SCE CME= gle SCD CMD= gld

CME CMD

gld=(a-1)(b-1) glt=ab-1

Tabla 10.4: Tabla de anlisis de la varianza para el rendimiento de materia seca (Kg/Ha) de una forrajera megatrmica con distintos aportes de N2 en forma de urea. Fuente de Variacin Bloques Entre Tratamientos Dentro Total Suma de Cuadrados 203319.0 4291440.0 309716.5 4804475.5 Grados de Libertad 3 4 12 19
235

Cuadrado Medio 67773.0 1072860.0 25809.7

41.57

Diseo de Experimentos

El procedimiento del test de hiptesis es similar al realizado para un diseo completamente aleatorizado. Dado que F, 41.57, es mayor que el cuantil (1-) de una distribucin F4,12 se rechaza la hiptesis de igualdad de tratamientos. La aplicacin del test a posteriori es directa y el nmero de bloques (b) sustituye el nmero de repeticiones en el clculo del error estndar de la comparacin. Cuadrado latino Una extensin directa del concepto de bloques completos aleatorizado es la del cuadrado latino, en el que se incorporan al diseo, el reconocimiento de dos fuentes sistemticas de variacin entre parcelas. Este diseo no es tan popular como el anterior ya que impone un nmero fijo de repeticiones y cuando el nmero de tratamientos es grande, el experimento completo puede ser inmanejable. De hecho, el nmero total de parcelas experimentales es igual al cuadrado del nmero de tratamientos. No obstante estas dificultades, el cuadrado latino es un diseo base de otros diseos como los llamados experimentos cross-over, populares en la experimentacin con animales. El diseo en cuadrado latino clsico de la experimentacin agrcola, en el que ensayan a tratamientos, se obtiene ordenando a2 parcelas experimentales en un cuadrado de a.a parcelas y asignando a parcelas a cada uno de los tratamientos de tal manera que en cada fila y en cada columna haya slo una repeticin de cada tratamiento como muestra la Figura 10.2.

Figura 10.2: Diseo en cuadrado latino para un experimento en el que se ensayan tres tratamientos (A,B y C).

El modelo lineal de un experimento en diseo cuadrado latino es el siguiente:


236

Diseo de Experimentos

Yijk = + i + j + k + ijk con i=1,,a; j=1,,a; k =1,,a donde Yijk es la observacin de la respuesta del i-simo tratamiento en la columna j-sima y fila k-sima. ijk es el trmino de error correspondiente a la observacin del i-simo tratamiento en la columna j-sima y fila k-sima. En este modelo los parmetros j y k modelan los efectos de las columnas y las filas respectivamente. El cuadro de Anlisis de la Varianza para este diseo se calcula segn las expresiones provistas en la Tabla 10.5. Tabla 10.5:Frmulas de trabajo de anlisis de la varianza de un experimento unifactorial con diseo en Cuadrado Latino. Fuente de Variacin Filas Suma de Cuadrados
a (y )2 (y )2 ik SCF= a - a.a k=1 a (y )2 (y )2 ij SCC= a - a.a j=1 a (y )2 (y )2 i SCE= a - a.a i=1 SCD=SCT-SCF-SCC-SCE a a (y)2 SCT= yijk 2- a.a i=1 j;k=1

Grados de Libertad
a-1

Cuadrado Medio

Columnas

a-1

Entre Tratamientos Dentro (Error Experimental) Total

gle=a-1

SCE CME= gle SCD CMD= gld

CME CMD

gld=(a-1)(a-2) glt=a2-1

Ejemplo 10.2 La siguiente tabla muestra los rendimientos de remolacha azucarera en toneladas por hectrea bajo tres tipos de labores culturales.

237

Diseo de Experimentos

Tabla 10.6: Rendimiento de remolacha azucarera en toneladas por hectrea bajo tres tipos de labores culturales obtenidos de un experimento en cuadrado latino. Col I Fila I Fila II Fila III 130 (A) 100 (C) 133 (B) Col II 90 (C) 120 (B) 125 (A) Col III 140 (B) 147 (A) 115 (C)

La Tabla 10.7 presenta el cuadro de anlisis de la varianza correspondiente que muestra un efecto significativo de los distintos mtodos culturales aplicados. Es importante notar que la suma de cuadrados debida a las columnas es muy importante y si no hubiera sido removida de la suma de cuadrados del error la interpretacin de estos resultados hubiera sido diferente. Tabla 10.7: Anlisis de la varianza para el experimento de rendimiento de remolacha azucarera. Cuadrado F Fuente de Variacin Suma de Grados de Medio Cuadrados Libertad Filas Columnas Entre Tratamientos Dentro (Error Experimental) Total 28.2 754.9 1914.9 5.5 2703.5 2 2 2 2 8 957.4 2.8 344.7

Estructura de tratamientos
En un punto anterior se present a los tratamientos como los distintos niveles de un nico factor o como combinacin de niveles de varios factores. En este ltimo caso, el experimentador se pregunta si es posible identificar los efectos de cada uno de los factores, estimarlos y eventualmente probar hiptesis sobre ellos. Aunque la respuesta es afirmativa an persiste una duda fundamental para qu disear experimentos en los que hay que usar herramientas analticas especiales para separar los efectos de los distintos factores si se pueden planificar experimentos ms sencillos para cada factor evitando complicaciones?. La respuesta a este problema est relacionada con el concepto de eficiencia y que en trminos prcticos se relaciona con la cantidad de
238

Diseo de Experimentos

repeticiones que son necesarias en un experimento para tener una precisin dada. Por ejemplo si para evaluar los efectos de los factores A y B con tres niveles cada uno se requieren tres repeticiones para cada nivel, se necesitarn 9 unidades experimentales para el ensayo del factor A y otras 9 para el ensayo del factor B, haciendo un total de 18 unidades experimentales. Si en vez de utilizar dos experimentos separados se planifica un experimento conjunto con 9 tratamientos (3 niveles de A x 3 niveles de B) y solo se repite una vez cada tratamiento, solo se necesitarn 9 unidades experimentales para acomodar todo el experimento y an se tendrn tres unidades tratadas con cada uno de los niveles de cada uno de los factores. Es decir que, aunque no se cuentan con repeticiones para las combinaciones de niveles de factores, si las hay (tres) para cada uno de los niveles de los factores individuales. En consecuencia, con la mitad de las unidades experimentales necesarias para acomodar los experimentos separados, se puede montar un experimento conjunto que provee la misma precisin para la evaluacin de cada factor individual. Si an se quisieran invertir las 18 unidades experimentales de los dos experimentos originales, se podra hacer una repeticin completa de todo el experimento y se tendra el doble de unidades experimentales para cada nivel de cada uno de los factores y en este sentido, los experimentos factoriales son ms eficientes para evaluar los efectos de los factores individuales. Pero los experimentos factoriales, cuando estn repetidos, permiten adems, probar la existencia y estimar la magnitud de respuestas diferenciales a la combinacin de los factores individuales, fenmeno que se conoce como interaccin. Dado que la interaccin es comn en los sistemas biolgicos, los experimentos que son capaces de detectarla y estimarla son siempre preferibles. Definicin 10.3: Estructura de Tratamientos
La estructura de tratamientos de un diseo de experimentos consiste en el conjunto de tratamientos o poblaciones que el experimentador ha seleccionado para estudiar y/o comparar.

Experimentos Factoriales En los modelos de los experimentos factoriales los parmetros i que hacen referencia a los efectos de tratamientos se descompone en un conjunto de parmetros que dan cuenta de cada uno de los factores intervinientes y se agrega segn sea necesario, conveniente y posible, los trminos correspondientes a las interacciones.

239

Diseo de Experimentos

Modelos aditivos

Los modelos factoriales aditivos son aquellos en los que los trminos que modelan la interaccin estn ausentes. Para ejemplificar este caso se presenta un experimento factorial 2x2 (dos factores con dos niveles cada uno) en el que la interaccin se supone ausente y montado en un diseo completamente aleatorizado. Los Factores se han designado como A y B y sus niveles como A1,A2 y B1,B2. Como existen 4 tratamientos (A1B1, A1B2, A2B1, A2B2) y estos no estn repetidos, se necesitan slo cuatro parcelas experimentales. Dado que el diseo es completamente aleatorizado la asignacin de las parcelas a cada uno de los tratamientos es al azar. Un arreglo posible se presenta en la siguiente figura.

A2B1

A1B2

Figura 10.3:Experimento bifactorial sin repeticiones montado en un diseo completamente aleatorizado.

A1B1

A2B2

El modelo para este experimento es el siguiente: Yij=+i+j+ij con i=1,2; j=1,2 En este modelo Yij representa la respuesta al i-simo nivel del factor A y j-simo nivel de factor B, representa una media general, i el efecto que produce el i-simo nivel del factor A, j corresponde al j-simo nivel del factor B y ij es el error asociado a la observacin ij-sima que como siempre se suponen normales, independientes, con esperanza cero y varianza comn 2. El cuadro de Anlisis de la Varianza para este diseo se calcula segn las expresiones provistas en la Tabla 10.8.

240

Diseo de Experimentos

Tabla 10.8:Expresiones para el clculo del cuadro de anlisis de la varianza de un experimento bifactorial con diseo completamente aleatorizado. Fuente de Variacin Factor A Suma de Cuadrados
a (y )2 (y )2 i SCF= b - a.b i=1 b (y )2 (y )2 j SCC= a - a.b j=1 SCD=SCT-SCA-SCB a b (y)2 SCT= yij2- a.b i=1 j=1

Grados de Libertad
gla=a-1

Cuadrado Medio
SCA CMA= gla SCB CMB= glb SCD CMD= gld

F
CMA CMD CMB CMD

Factor B

glb=b-1

Dentro (Error Experimental) Total

gld=(a-1)(b-1) glt=a.b-1

Ejemplo 10.3 En un ensayo comparativo del efecto del estrs hdrico y salino sobre la germinacin de Atriplex cordobensis, se sometieron lotes de semillas a cuatro niveles de potencial agua: 0, -0.5, -1.0 y 1.5 Mpa obtenidos mediante la aplicacin al medio de dos osmolitos: polietilenglicol (PEG) o cloruro de sodio (ClNa). El experimento se mont en un diseo completamente aleatorizado sin repeticiones cuyos resultados se presentan en la siguiente tabla. Tabla 10.9: Resultados de un ensayo comparativo del efecto de distintos potenciales agua del substrato obtenido con dos osmolitos: polietilenglicol(PEG) y cloruro de sodio (ClNa) sobre el porcentaje de germinacin en A. cordobensis.
Mpa ClNa PEG 0 85 83 -0.5 78 76 -1.0 54 43 -1.5 14 9

Cuando los experimentos factoriales no tienen repeticiones, el analista debe suponer que los factores no interactan para poder estimar la varianza del error experimental. Si este supuesto no se cumple entonces el experimento est deficientemente diseado y las conclusiones del anlisis pueden ser completamente errneas. Existen algunas
241

Diseo de Experimentos

pruebas para verificar este supuesto como la prueba de aditividad de Tukey (1949). La tabla de anlisis de la varianza para este experimento, suponiendo un modelo aditivo, se muestra en la siguiente tabla. Tabla 10.10: Cuadro de anlisis de la varianza para de un experimento bifactorial para evaluar el efecto de distintos potenciales agua del substrato obtenidos por el agregado al medio de dos osmolitos: polietilenglicol(PEG) o cloruro de sodio (ClNa) sobre el porcentaje de germinacin en A. cordobensis. Fuente de Variacin Osmolito Potencial Agua Dentro Total Suma de Cuadrados 50.0 6118.5 27.0 6195.5 Grados de Libertad 1 3 3 7 Cuadrado Medio 50.0 2172.8 9.0 F 5.6 241.4

Consultando los valores crticos de una F con 1 y 3 grados de libertad para el factor osmolito y con 3 y 3 grados de libertad para potencial agua, se puede apreciar que ambos factores afectan significativamente el porcentaje de germinacin.
Modelos con interaccin

Si el experimentador supone o sospecha que la respuesta a dos o ms factores no se puede explicar como la suma de sus efectos individuales entonces el modelo para el experimento factorial deber incluir trminos de interaccin que den cuenta de este hecho. La inclusin de trminos de interaccin en el modelo conlleva la necesidad de tener repeticiones para cada tratamiento porque de otra forma no es posible estimar los parmetros adicionales. Aunque no se profundizar ms en este tema, cuando el experimento tiene dos factores, existen solo interacciones de primer orden, cuando tiene tres factores, existen interacciones de primer y de segundo orden y as sucesivamente para factoriales de mayor orden. A continuacin se examinar con algn nivel de detalle un experimento bifactorial con interaccin y se presentar un ejemplo. El modelo para un experimento bifactorial con interacciones es una ampliacin del modelo para el experimento bifactorial descripto anteriormente, excepto que incluye un conjunto adicional de parmetros, conocidos como de interaccin.
242

Diseo de Experimentos

Yijk=+i+j+ij+ijk con i=1,2; j=1,2; k=1,..,nij En este modelo Yijk representa la respuesta de la k-sima repeticin en el i-simo nivel del factor A y j-simo nivel de factor B, representa una media general, i el efecto que produce el i-simo nivel del factor A, j corresponde al efecto del j-simo nivel del factor B, ij los efectos adicionales (interacciones) para cada combinacin de los niveles de los factores y ijk es el error asociado a la observacin ijk-sima que como siempre se supone normal e independiente con esperanza cero y varianza comn 2. Debe notarse que el subndice k se mueve entre 1 y nij, es decir, el nmero de repeticiones para el tratamiento puede ser distinto. El cuadro de Anlisis de la Varianza para este diseo se calcula segn las expresiones provistas en la Tabla 10.11. Tabla 10.11:Expresiones para el clculo del cuadro de anlisis de la varianza de un experimento bifactorial con interaccin en un diseo completamente aleatorizado. Fuente de Variacin Factor A Suma de Cuadrados
a (y )2 (y )2 i SCF= ni n i=1 b (y )2 (y )2 j SCC= nj n j=1 a b (y )2 (y )2 ij SCAB n n ij i=1 j=1 SCD=SCT-SCA-SCB-SCAB a b nij (y)2 SCT= yijk2n i=1 j=1 k=1

Grados de Libertad
gla=a-1

Cuadrado Medio
SCA CMA= gla SCB CMB= glb
SCAB CMAB= glab

F
CMA CMD CMB CMD CMAB CMD

Factor B

glb=b-1

Interaccin AB Dentro (Error Experimental) Total

glab(a-1)(b1) gld=glt-glaglb-glab glt= n-1

SCD CMD= gld

Ejemplo 10.4 En un estudio sobre la potencialidad forrajera de Atriplex cordobensis, un arbusto que crece en depresiones del chaco rido argentino, se evalu la concentracin de protenas en hojas cosechadas en invierno y verano sobre plantas masculinas y femeninas. Para cada combinacin de sexo y estacin, se obtuvieron tres
243

Diseo de Experimentos

determinaciones del contenido proteico medido como porcentaje del peso seco. Los resultados se presentan en la siguiente tabla. Tabla 10.12:Concentracin proteica (% del peso seco) en hojas de Atriplex cordobensis cosechadas en invierno y verano de plantas masculinas y femeninas.
Femeninas Invierno 24 28 26 Verano 17 18 16 Masculinas Invierno 17 18 16 Verano 24 25 23

La tabla que presenta los resultados del anlisis de la varianza se muestra a continuacin. Como puede observarse, ninguno de los factores ensayados muestra por si mismo un efecto significativo sobre la concentracin de protenas pero el trmino de interaccin es altamente significativo, indicando que los factores estudiados efectivamente intervienen en la expresin final de la concentracin de protenas pero que sus efectos no son independientes del nivel del otro factor. La Figura 10.4 presenta una representacin grfica de los valores medios en los cuatro tratamientos que permite interpretar fcilmente el resultado mostrado en el cuadro de anlisis de la varianza. Tabla 10.13:Cuadro de anlisis de la varianza para el efecto del sexo y la poca de cosecha sobre la concentracin de protenas en hojas de Atriplex cordobensis. F Fuente de Variacin Suma de Grados de Cuadrado Cuadrados Libertad Medio Factor Sexo Factor Epoca de cosecha Interaccin Epoca-Sexo Dentro Total 3 3 192 14 212 1 1 1 8 11 3.00 3.00 192.00 1.75 1.71 1.71 109.71

244

Diseo de Experimentos

30 masculinas contenido de protenas femeninas

25

20

Figura 10.4: Media error estndar de la concentracin de protenas en hojas de Atriplex cordobensis por efecto del sexo y la poca de cosecha.
femeninas masculinas Invierno

15

Verano

Los modelos con interaccin no siempre muestran comportamientos tan extremos como el del ejemplo anterior. De hecho, en muchas situaciones los perfiles de respuesta no se cruzan y aunque an es evidente la interaccin, los efectos de los factores individuales son evidentes. Un ejemplo se puede apreciar en la Figura 10.5 que tambin corresponde al trabajo sobre potencialidad forrajera de A. cordobensis, pero en este caso la variable estudiada es la proporcin de fibras insolubles. Las plantas masculinas siempre presentaron mayor contenido de fibras insolubles que las femeninas (efecto principal del factor sexo) pero la diferencia entre femeninas y masculinas fue mayor en el invierno que en el verano (interaccin). De igual modo se puede interpretar el efecto de la poca de cosecha, diciendo que en verano el contenido de fibras insolubles fue siempre mayor que en invierno (efecto principal del factor poca de cosecha) pero que esta diferencia es ms marcada en las plantas femeninas.

245

Diseo de Experimentos

60 55 Fibras Insolubles 50 45 40 35 30 25 Verano Invierno femeninas masculinas

Figura 10.5: Media error estndar de la concentracin de fibras insolubles en hojas de Atriplex cordobensis por efecto del sexo y la poca de cosecha.

Aunque en los ejemplos anteriores se han presentado experimentos con estructura factorial de tratamientos slo en diseos completos al azar, la combinacin de estructuras factoriales y estructuras de parcela da lugar a una amplia variedad de arreglos experimentales. As, un experimento como aquel en que se evaluaba el efecto de dos osmolitos y cuatros potenciales agua sobre la germinacin se podra haber diseado con repeticiones. Por diversas razones, quizs no puedan asegurarse las mismas condiciones experimentales de repeticin a repeticin, porque, por ejemplo, no siempre las cmaras de cultivo regulan de manera similar la temperatura del ensayo, y por lo tanto se tiene una fuente potencial de variacin conocida que no es de inters por si misma pero que s debe incorporarse al diseo y al modelo para eliminarla del error experimental. De este modo, cada repeticin podra considerarse un bloque y el experimento completo sera un experimento con estructura bifactorial de tratamiento y estructura de parcelas en bloques completos al azar. Como se anticip al comienzo del captulo, los temas de diseo experimental no se agotan en esta presentacin. Queda una importante variedad de tpicos relativos a jerarquas en la estructura de parcelas y en la estructura de tratamientos, mtodos de particin de sumas de cuadrados, anlisis de la interaccin en los modelos no aditivos, anlisis de la covarianza, modelos con factores de efectos aleatorios, modelos con mezcla de factores con efectos aleatorios y fijos, diseo del nmero de repeticiones para alcanzar una potencia deseada, etc, etc, que el lector interesado deber consultar en una obra ms completa de Diseo de Experimentos (Montgomery, 1991; Milliken
246

Diseo de Experimentos

and Johnson, 1995; Steel y Torrie, 1985).

Ejercicios
Ejercicio 10.1 El siguiente conjunto de datos corresponde a protena bruta en leche obtenida con dos suplementos (A y B) en dos dosis (1 y 2). Cada observacin corresponde al contenido de protena bruta en leche de una muestra obtenida de una muestra amalgamada por tambo. Tambo I II III IV V VI a) b) c) d) Control 3.19 3.16 3.25 3.48 3.25 3.10 A1 3.03 3.07 3.23 3.30 3.25 3.05 A2 3.06 3.08 3.24 3.33 3.24 2.93 B1 3.22 3.28 3.45 3.44 3.35 3.28 B2 3.33 3.20 3.45 3.39 3.54 3.35

Calcular la estadstica descriptiva bsica. Identificar el modelo lineal para los datos anteriores. Calcular la tabla de anlisis de la varianza y, si corresponde, utilizar alguna tcnica de comparaciones mltiples. Qu suplementacin se recomendara si el objetivo es maximizar la concentracin de protena bruta en la leche?

Ejercicio 10.2 En un experimento sobre la incidencia de una virosis sobre el permetro de las cabezas de ajo blanco, se compar el permetro medio de las cabezas obtenidas de plantas libre de virus y de plantas enfermas, bajo dos frecuencias de riego: cada 15 das y cada 30 das. El experimento se realiz siguiendo un diseo completamente aleatorizado con tres repeticiones donde la unidad experimental era una parcela de 3 surcos de 5 metros cada uno y de los cuales slo se tom el surco central para evitar efectos de bordura. Los resultados obtenidos fueron los siguientes:
247

Diseo de Experimentos

Plantas Sanas Riego c/15d 45.5 43.0 41.3 a) b) c) Riego c/30d 40.1 37.3 38.1

Plantas Enfermas Riego c/15d 41.5 37.0 36.3 Riego c/30d 35.8 31.4 33.8

Identificar el modelo lineal. Construir la tabla de anlisis de la varianza para este modelo. Concluir sobre el efecto de la virosis, el riego y su eventual interaccin.

Ejercicio 10.3 En la siguiente tabla se muestran los resultados de un experimento montado segn un diseo completamente aleatorizado con cuatro repeticiones, en el que nemtodos de gnero Pratylenchus fueron criados en cuatro condiciones de temperatura y discriminados segn sexo para evaluar el efecto del sexo y la temperatura sobre la expresin fenotpica de diversos caracteres morfomtricos. Los resultados presentados corresponden al largo promedio de la cola en unidades experimentales conformadas por 5 individuos.

Hembras Temp. (C) Rep 1 16 21 25 28 29.2 30.1 31.6 29.6 Rep 2 32.5 30.4 30.2 28.4 Rep 3 34.6 31.4 29.5 28.4 Rep 4 32.6 35.8 30.0 28.1 Rep 1 27.2 26.7 26.2 24.8

Machos Rep 2 24.7 26.5 26.3 25.4 Rep 3 27.3 27.2 28.2 25.6 Rep 4 26.2 27.2 26.2 26.2

a) b) c)
248

Identificar el modelo lineal para este experimento. Representar grficamente los valores medios segn sexo y temperatura. Construir la tabla de anlisis de la varianza correspondiente.

Diseo de Experimentos

d)

Concluir sobre el efecto de la temperatura y el sexo sobre la expresin del largo de la cola y relacione sus conclusiones con la representacin grfica obtenida en b.

Ejercicio 10.4 Considere el Ejercicio 10.3 y suponga que debido al tamao del experimento las repeticiones se realizaron en laboratorios diferentes. Considere que las repeticiones como bloques. a) b) c) Identificar el modelo lineal para las observaciones de este experimento. Construir una tabla de anlisis de la varianza. Concluir sobre la accin del sexo, la temperatura y su eventual interaccin.

249

11
11 Anlisis de Datos Categricos
Introduccin
En cualquier rea del conocimiento, tal como la Agronoma, Veterinaria, Economa, Medicina, Psicologa, etc. es muy comn encontrar situaciones donde los datos recogidos son observaciones de variables categricas cuyos niveles o categoras son empleadas en la discriminacin o identificacin de las unidades muestrales en estudio. En este Captulo se pretende introducir parcialmente el anlisis de datos categricos, el cual slo se restringir a la presentacin del anlisis de tablas de contingencia. Definicin 11.1: Variable categrica
Una variable categrica es una caracterstica para la cual la escala de medida consiste de un conjunto de categoras.

En esta situacin, los datos se presentan como frecuencias de observaciones que ocurren en la misma categora. Dentro de la escala categrica se distinguen tres tipos principales de variables: Nominales: son aquellas cuyos niveles no estn naturalmente ordenados, por ejemplo color del tegumento de semillas de man, variedad de un cultivo, raza de animales, etc. Ordinales: son aquellas cuyas distintas categoras tienen un orden natural, por ejemplo grado de ataque de una plaga (sin ataque, controlable, no controlable), diagnstico de una enfermedad (seguro, probable, improbable), etc. De intervalo: son aquellas variables de tipo numrico que tienen una distancia entre dos niveles, por ejemplo edad de los individuos (entre 15-20, 21-25 y 26-30 aos), dimetro de los rboles (10-20, 21-30, 31-40 y 41-50 cm), etc. Ordenando en forma decreciente los tipos de variables enunciados en funcin de la cantidad de informacin que proveen, se tiene: 1o de intervalo, 2o ordinal, 3o nominal. Los mtodos diseados para un tipo de variable pueden ser usados para una de nivel
251

Anlisis de Datos Categricos

superior. As, una tcnica para variables ordinales puede ser usada para una "de intervalo" pero no para una nominal. En este Captulo no se enfatizarn los tipos diferentes de anlisis ya que se necesitara de una introduccin a otros tpicos de modelacin propiamente dichos, lo cual escapa a los objetivos de este libro. Una variable puede ser nominal, ordinal o de intervalo, segn lo que se mida o cmo se lo mida. Por ejemplo, la variable educacin es nominal, si se refiere al tipo de educacin: pblica o privada; ordinal si mide el nivel de educacin: preescolar, primario, secundario, terciario o universitario, mientras que es de intervalo si se cuantifica la cantidad de aos de educacin formal: 0, 1, 2, ..., etc. (Agresti, 1990). Cuando los individuos extrados de una poblacin son clasificados de acuerdo a, por lo menos, dos caractersticas observadas en ellos, se dice que los mismos estn estudindose en forma bivariada, esto es, por medio de dos variables aleatorias. Para analizar esa informacin se puede construir, entre otras cosas, una tabla de contingencia. Una tabla de contingencia se obtiene cuando el conjunto de individuos o entidades, como pueden ser semillas, personas, hojas, potreros, novillos, rboles, etc., son clasificados de acuerdo a uno o ms criterios. Por ejemplo, las hojas de una hortaliza pueden ser clasificadas segn tengan o no sntomas de enfermedad virsica y al mismo tiempo segn provengan de la parte baja, media o alta de la planta. Para el anlisis de tablas de contingencia es necesario indagar primeramente en la clasificacin de las variables que la definen. Ellas pueden ser: variables de respuesta o variables de clasificacin. Las primeras, esto es las variables de respuesta o dependientes, son aleatorias y describen lo que fue observado en las unidades muestrales. Las segundas, las variables de clasificacin o independientes o factores, son fijas por condicionamiento y las combinaciones de sus niveles definen estratos, poblaciones o subpoblaciones a las cuales las unidades muestrales pertenecen. De acuerdo con esta clasificacin se definen dos tipos bsicos de tablas de contingencia: Tablas donde todas las variables son de respuesta; Tablas donde algunas variables son de respuesta y otras de clasificacin. En el primer caso lo que interesa, usualmente, es verificar si existe asociacin entre las variables, y cuando existe, construir algn coeficiente para medir ese grado de asociacin. En el segundo caso, generalmente, el objetivo es estudiar los efectos de las variables de clasificacin sobre la distribucin conjunta de las variables de respuesta o sobre alguna caracterstica especfica de esa distribucin. Un caso particular de gran importancia es aquel en que se considera slo una variable de respuesta y las restantes como de clasificacin. En este caso, como en el ANAVA, el objetivo es estudiar la
252

Anlisis de Datos Categricos

influencia aislada o combinada de los factores en la distribucin de la variable de respuesta. Como ejemplos, obsrvese la Tabla 11.1 correspondiente a un ensayo cuyo objetivo era estudiar la influencia del estado del tegumento y la textura de la semilla en el xito de la germinacin de semillas de soja de la variedad Hood. O tambin los datos analizados por Grizzle et al. (1969), con la finalidad de indagar en la posible asociacin entre severidad del ataque de una plaga y las prcticas culturales, como se muestra en Tabla 11.2. Considrense los datos de la Tabla 11.3, presentada por Birtlett (Daz y De Luna, 1991), construida con el objetivo de estudiar el crecimiento de plantas sometidas a diferentes tratamientos. Las combinaciones de niveles de pocas de plantacin con los niveles de las alturas de corte definen 4 subpoblaciones donde fue observada la distribucin de la variable sobrevida. La Tabla 11.4, correspondiente a los resultados de un estudio sobre infecciones de querato-conjuntivitis en vacunos, donde el inters estuvo centrado en la verificacin de interaccin entre tratamientos y tipos de diagnstico en relacin a la proporcin de curados. Se puede observar que el proceso de obtencin de los datos combinados con los objetivos de la investigacin permiten asociar a las observaciones 6 subpoblaciones (por condicionamiento) y dos categoras de respuesta, "curado" y "no curado". Tabla 11.1: Clasificacin de las observaciones realizadas en semillas de soja de la variedad Hood. Tegumento daado Germin si no sano si no total Textura lisa rugosa lisa rugosa lisa rugosa lisa rugosa Total 23 34 109 78 189 242 56 69 800

253

Anlisis de Datos Categricos

Tabla 11.2: Nmero de plantas de man segn el grado de severidad de una plaga y prctica cultural del lote. Prcticas Culturales Baja Con rotacin Buena preparacin de la cama de siembra Uso de agroqumicos Total 235 169 452 856 Severidad Moderada 124 84 67 275 Alta 38 18 27 83 397 271 546 1214 Total

Tabla 11.3: Nmero de plantas en funcin a la altura de corte y poca de plantacin. Altura de corte Largo poca de plantacin Otras estaciones En primavera Corto Otras estaciones En primavera Sobrevive 156 84 107 31 No Sobrevive 84 156 133 209 Total 240 240 240 240

Tabla 11.4: Nmero de animales segn el tratamiento y el tipo de diagnstico. Tipo de Diagnstico Tratamiento A Complicado B C A Simple B C Curado 78 101 68 40 54 34 No curado 20 11 46 5 5 6

254

Anlisis de Datos Categricos

Anlisis de tablas de contingencia


Suponga que se lleva a cabo un estudio a campo, con plantas de soja, con el objetivo de evaluar el estado del cultivo en relacin a la infestacin de hongos y el tamao de las plantas. La Tabla 11.5 contiene las observaciones recogidas en tal ensayo: Tabla 11.5: Frecuencia de plantas en funcin de su sintomatologa con respecto a la presencia de hongos. Sntoma Tamao de la Planta Alta Enfermas Sanas Total n11 n21 n.1 Media n12 n22 n.2 Baja n13 n23 n.3 Total n.1. n.2 n..

La presentacin de la informacin en forma de tablas distingue bsicamente la designacin de filas (sntomas) y columnas (tamao de la planta); el cuerpo de la tabla est constituido por: a) b)
celdas que contienen las frecuencias observadas nij totales marginales de filas y columnas (ni y nj respectivamente), y total general (n)

Una tabla que tiene R filas y C columnas se dice que es de dimensin R x C. En la Tabla 11.5 las variables categricas, X = sntomas e Y = tamao, con dos y tres niveles, respectivamente, conforman una tabla 2x3, esto es de seis celdas o combinaciones. Si el anlisis de tablas de contingencia tiene propsitos inferenciales es necesario considerar modelos probabilsticos para los datos. En este material no se profundizar en esta cuestin, simplemente se mencionan los principales modelos discretos, ya que la conformacin de una tabla es a travs de las frecuencias observadas. Entre los modelos ms frecuentes se pueden mencionar: distribucin Poisson (cuando el muestreo es aleatorio y no hay condicionamientos ni nmero total de observaciones fijado de antemano), distribucin Multinomal (o Binomial para dos dimensiones), distribucin Hipergeomtrica, distribucin Binomial Negativa y sus respectivos productos (cuando existe condicionamiento, esto es una de las variables es de clasificacin y otra de respuesta).
255

Anlisis de Datos Categricos

En trminos generales y de acuerdo con el tipo y nmero de variables involucradas en una tabla de contingencia se distinguen los tres casos principales que se presentan a continuacin. Si bien las hiptesis que se desean probar en estos tres casos son diferentes el estadstico a usar es el mismo.

Tablas de contingencia a un criterio de clasificacin


Si se extrae una muestra aleatoria simple de 100 semillas de un lote y se las clasifica segn un criterio de calidad (como podra ser uno basado en la conductividad) en alta, media y baja, se obtiene una tabla con un nico criterio de clasificacin con tres niveles: Calidad Alta 80 Media 15 Baja 5 Total 100

En el caso de que se dispusiera de alguna hiptesis sobre la distribucin de la variable categrica calidad de semilla, estos resultados podran utilizarse para someterla a prueba. Por ejemplo, si las especificaciones del lote de semillas, del cual se extrajo la muestra, dicen que las proporciones para las categoras de calidad son las siguientes: Calidad Alta 0.95 Media 0.03 Baja 0.02

podra ser de inters probar si las frecuencias observadas son consistentes con las establecidas por las especificaciones, o no. Este tipo de anlisis se conoce como prueba de bondad de ajuste. Este enfoque tambin es utilizado en la siguiente situacin. Algunas veces la variable en estudio es intrnsecamente continua o discreta, aunque por el mtodo de observacin seleccionado (o disponible) se la agrupa en clases convirtindola en una de intervalo. Ejemplos tpicos ofrecen las variables como el dimetro de rboles, aumento de peso, etc. Si se desea verificar la hiptesis de que la muestra proviene de una distribucin continua o discreta determinada (Normal, Poisson, etc.), las pruebas de bondad de ajuste se implementan de la misma manera que para las variables naturalmente categricas. La prueba de bondad de ajuste radica en la comparacin de las frecuencias
256

Anlisis de Datos Categricos

observadas con aquellas esperadas (por un modelo) mediante un estadstico conveniente. Cuando se realiza una prueba de bondad de ajuste, se establece como hiptesis nula que las frecuencias observadas (q1 , q2 ,...., qk) son consistentes con las frecuencias esperadas (q10, q20,...,qk0). Para la construccin del estadstico se estiman las frecuencias esperadas cuando la Hiptesis Nula es cierta (q10, q20,...,qk0) y se calcula el estadstico:

2=

(q i - q i0 ) 2
i =1

q i0

donde qi es la i-sima frecuencia observada, qi0 la i-sima frecuencia esperada y k el nmero de celdas en la tabla. Bajo H0 2 se distribuye como una variable chicuadrado con grados de libertad. Si 2 calculado es mayor que el cuantil (1-) de la distribucin chi-cuadrado con grados de libertad, entonces se rechaza H0. La clave para realizar las pruebas apropiadas en cada caso, reside en calcular correctamente las frecuencias esperadas bajo H0 y los grados de libertad. Considrese nuevamente el ejemplo de la calidad de semillas. Las frecuencias esperadas y observadas se muestran a continuacin :

Frecuencias Observadas Esperadas

Alta 80 95

Media 15 3

Baja 5 2

Total 100 100

Los grados de libertad del estadstico 2 estn dados por la diferencia entre el nmero de frecuencias esperadas necesarias para completar la tabla y el nmero de parmetros que deben estimarse para calcular dichas frecuencias (suponiendo cierta H0). En este ejemplo, la primera cantidad es 2 ya que, si el tamao de la muestra est dado, conociendo las proporciones o frecuencias de 2 celdas la tercera es complementaria. Esto es, si en una muestra de tamao 100 se conoce el nmero de semillas de alta y media calidad, el nmero de semillas de baja calidad queda
257

Anlisis de Datos Categricos

inequvocamente establecido y de all su proporcin. La segunda cantidad, o sea el nmero de parmetros a estimar para completar la tabla cuando la hiptesis nula es cierta es, en este caso, 0. Esto se debe a que bajo H0 todas las frecuencias estn especificadas y no hace falta estimar ningn parmetro para calcularlas. As, en este caso, los grados de libertad son 2-0=2. Esta metodologa analtica para la verificacin de H0 est sustentada en un teorema que establece la distribucin asinttica del estadstico 2. El hecho de que la prueba se base en la distribucin asinttica de un estadstico significa que tanto el nivel () como la potencia (1-) sern aproximadamente los nominales (los que el investigador ha fijado o calculado) cuando n (el nmero total de observaciones) es grande (en el caso de igualdad de proporciones cada ni debe ser grande). Por esta razn, la prueba 2 para tablas de contingencia debe ser usada con precaucin cuando el/los tamao/s de la/s muestra/s es/son pequeo/s. As mismo, cuando ms del 20% de las frecuencias esperadas son menores que 5, el estadstico 2 no ajusta a la distribucin terica y en consecuencia tanto el nivel como la potencia de la prueba se desconocen. En estos casos hay que recurrir a mtodos exactos para calcular las probabilidades bajo H0 como lo realiza la prueba de Irwin-Fisher para tablas de contingencia 2x2. Una discusin sobre estos mtodos est fuera de los objetivos de esta presentacin.

Tablas de contingencia a 2 criterios de clasificacin (marginales libres)


Siguiendo el ejemplo anterior, una situacin diferente se podra encontrar si se distinguieran, adems, semillas claras y oscuras. Supngase que las frecuencias obtenidas al clasificar 100 semillas, de un lote, por color y calidad fueron las siguientes: Color Alta Claras Oscuras Total 16 64 80 Calidad Media 3 12 15 Baja 1 4 5 Total 20 80 100

En este caso, como en el anterior, la tabla es en s misma una herramienta descriptiva de la distribucin de frecuencias y permite visualizar comportamientos que pueden ser
258

Anlisis de Datos Categricos

de inters. Obsrvese que en la categora semillas claras las frecuencias correspondientes a las calidades "media" y "baja" son relativamente menores (en trminos absolutos) que las frecuencias correspondientes a dichas calidades en la categora de semillas oscuras. El anlisis correcto de esas tendencias implicar, obviamente, involucrar los marginales libres y por lo tanto otro modelo probabilstico para las observaciones. Al igual que en el ejemplo anterior, el investigador podra contar con una distribucin terica para las categoras de calidad en cada una de las clases de color y el caso resultara equivalente a un problema de bondad de ajuste (con 6 celdas). Sin embargo, lo usual, es que no se disponga de una distribucin de frecuencias terica en dos vas, por lo que se establece la hiptesis de independencia. Esta hiptesis establece que "la distribucin de frecuencias para las calidades de semilla es la misma en ambas coloraciones" y viceversa; esto es, "la distribucin de coloracin es la misma independientemente de la calidad de semillas". Si la hiptesis de independencia no fuera cierta, entonces, se concluira que la calidad de las semillas est asociada a la coloracin. El anlisis de esta hiptesis se conoce como prueba Chi-cuadrado para la hiptesis de independencia, ya que el estadstico de la prueba tiene distribucin asinttica Chi-cuadrado. Si la hiptesis nula se refiere a la independencia entre las dos variables de respuesta que conforman la tabla, esto implica que la distribucin conjunta de las mismas puede obtenerse a partir del producto de las distribuciones marginales (es decir, la tendencia por fila - o por columna - es la misma en cada columna - o fila -). Pero, a diferencia del primer caso, las proporciones bajo H0 no son conocidas y deben estimarse. Entonces, si H0 es verdadera las proporciones para cada celda, por ejemplo la celda (ij)-sima, est dada por el producto de las proporciones marginales. Para el ejemplo, 80 20 la proporcin esperada para semillas claras de alta calidad ser 100 . 100 y la frecuencia esperada ser entonces 80 20 .100. As se procede con las otras 100 100 frecuencias esperadas para todas las celdas de la tabla. En cuanto a los grados de libertad para el estadstico 2 ya definido, estn dados por la diferencia entre el nmero de proporciones o frecuencias esperadas a especificar para completar la tabla y el nmero de parmetros a estimar bajo H0. El primero de ellos, conocido el tamao de la muestra (100), es 5, ya que una vez especificadas 5 proporciones, la restante queda establecida inequvocamente al construir la tabla. El segundo depende del nmero de filas y columnas de la tabla ya que, como se seal en el clculo de las frecuencias esperadas, slo hacen falta conocer las frecuencias
259

Anlisis de Datos Categricos

marginales. As, si la tabla tiene 3 columnas, slo hace falta conocer los totales de 2 de ellas, y si tiene 2 filas, slo hace falta conocer el total de una de ellas. En total se necesitan conocer 3 frecuencias o proporciones (parmetros), por lo que los grados de libertad adecuados para la prueba son 5-3 = 2.

Tablas de Contingencia a 2 criterios de clasificacin (marginales fijos)


Suponga que se muestrean, siguiendo el ejemplo anterior, 50 semillas claras y 50 semillas oscuras. Este esquema de muestreo difiere del caso anterior ya que ahora existe un factor de condicionamiento, la coloracin. Antes se tomaba una muestra de 100 semillas sin tener en cuenta ninguna de sus caractersticas, generando una tabla con marginales libres. Ahora el muestreo para cada coloracin de semilla genera una tabla con marginales fijos para las filas, como se muestra a continuacin: Color Alta Claras Oscuras Total 15 35 50 Calidad Media 25 10 35 Baja 10 5 15 Total 50 50 100 marginales fijos

marginales libres Obsrvese que las filas resumen las distribuciones condicionales muestrales de la calidad de las semillas para cada coloracin. El inters es el mismo que en caso anterior, esto es establecer si la calidad de las semillas est o no asociada a la coloracin. Reconociendo la generacin de la tabla, es decir, cmo es recogida esa informacin, la hiptesis que se puede verificar es que "las proporciones de cada clase de calidad son las mismas para cualquiera de las coloraciones". La prueba para contrastar esta hiptesis se conoce como prueba Chi-cuadrado para la homogeneidad de proporciones. La hiptesis nula establece para este caso que las distribuciones condicionales de la variable utilizada como criterio columna respecto de aquella utilizada como criterio fila (en este caso la variable con marginales fijos) son iguales. Esta hiptesis suele enunciarse como de igualdad de proporciones. Esto es, si se tiene una variable fila con k niveles y se toman muestras de tamao n1, n2,...., nk respectivamente, y si (q110, q120
260

Anlisis de Datos Categricos

,...., q1p0), (q210, q220,...., q2p0 ) ,....., (qk10, qk20, ...., qkp0 ) representan las proporciones verdaderas para los componentes columnas de cada una de las k filas, entonces estas k p-uplas son iguales bajo H0. As, retomando el ejemplo anterior, como la hiptesis nula establece la igualdad de proporciones para la calidad de semillas, es necesario estimar las proporciones esperadas a partir de los datos como se procedi en el segundo caso. Recurdese que antes el total de semillas era fijo siendo necesarias las frecuencias marginales de filas y columnas (distribuciones marginales) para estimar las frecuencias bajo H0. En este tercer caso, los marginales fila son fijos y el estimador natural para la proporcin de cada celda es la proporcin basada en totales por columna (distribucin incondicional) correspondiente. Luego, para la tabla presentada, la proporcin esperada para semillas 50 15 de alta calidad ser 100 , y para semillas de baja calidad 100 sin importar la coloracin 50 15 de las semillas. Por lo tanto sus frecuencias esperadas son 100 . 50 y 100 . 50 respectivamente. As, la tabla de frecuencias esperadas ser:

Alta Claras Oscuras Total 25 25 50

Media 17.5 17.5 35

Baja 7.5 7.5 15

Total 50 50 100

Para el clculo de los grados de libertad, el nmero de proporciones a especificar para construir la tabla, dado que los marginales fila son fijos, es 4 (2 para cada coloracin ya que la tercer celda de cada fila queda inequvocamente determinada). Por otro lado, el nmero de proporciones (parmetros) a especificar para construir la tabla bajo H0 depende solamente de los marginales libres, y de los tres que presenta la tabla, slo 2 son necesarios, por lo que los grados de libertad en esta tabla son 4 - 2 = 2.
Nota: Para las tablas a dos vas con r filas y c columnas (ya sea para el caso 2 o el caso 3), una regla prctica para calcular la frecuencia esperada para la celda-ij (fila i y columna j) es hacer el producto de los totales de la fila i y de la columna j (ni. y n.j) y dividirlo por el total general n.. y para calcular los grados de libertad hacer el producto = (r-1) * (c-1).

A continuacin se dan algunos ejemplos de aplicacin:

261

Anlisis de Datos Categricos

Ejemplo 11.1(prueba de bondad de ajuste) Un genetista realiza un cruzamiento de arvejas lisas y amarillas con arvejas rugosas y verdes, obteniendo los siguientes resultados: Semillas lisas y amarillas lisas y verdes Xi 1080 210 200 110 1600

rugosas y amarillas
rugosas y verdes Total

Para saber si estas caractersticas siguen una de las leyes clsicas de la herencia mendeliana se trata de establecer si la frecuencia relativa de cada una de las clases en la poblacin es: 9/16, 3/16, 3/16 y 1/16 respectivamente. Esta misma hiptesis se expresa como "la proporcin es 9:3:3:1" (observar que 9 + 3 + 3 + 1 = 16, por lo que ambas formas son equivalentes). As H0: la frecuencia es 9:3:3:1 versus H1: la frecuencia no es 9:3:3:1 Los valores esperados, si la hiptesis nula es cierta, surgen de multiplicar cada una de las frecuencias relativas (o proporciones) por el total de individuos observados en la muestra. Por lo tanto la tabla de frecuencias esperadas es:

Tipo lisas y amarillas lisas y verdes rugosas y amarillas rugosas y verdes Total

Esperadas 9/16*1600 = 900 3/16*1600 = 300 3/16*1600 = 300 1/16*1600 = 100 1600

El estadstico descripto como 2 tiene una distribucin aproximada 2con (r-1-k) grados de libertad, (r es la cantidad de categoras y k la cantidad de parmetros estimados). En el ejemplo, r = 4, k = 0, luego 2~ 2 . El estadstico evaluado en este 3 caso es:

262

Anlisis de Datos Categricos

(1080 -900)2 (210-300)2 (200-300)2 (110 - 100)2 + + + = 97.33 900 300 300 100

La regin de rechazo para este contraste est siempre a la derecha, o sea, para valores grandes de 2. El cuantil (1-) de la distribucin 2 con 3 grados de libertad es 7.81 para = 0.05. Como 97.3 es mayor que 7.81, se rechaza H0; las frecuencias no siguen una distribucin 9:3:3:1. Ejemplo 11.2: (prueba de independencia) Una forma intuitiva de considerar la falta de independencia entre dos variables es pensar que si se conoce la modalidad de una de ellas, entonces se conoce la probabilidad de ocurrencia de distintas modalidades de la otra variable en la misma observacin. En este caso no hay independencia o sea, ambas variables estn estadsticamente asociadas. Una muestra aleatoria de 1260 semillas fue extrada para estudiar su textura (lisa, intermedia, rugosa) y su velocidad de germinacin (alta, media, baja, nula). Se construye con esa informacin la siguiente tabla de contingencia: Textura Germinacin Alta Media Baja Nula Total Lisa 122 226 306 131 785 Intermedia 30 51 115 59 225 Rugosa 20 66 96 38 220 Total 172 343 517 228 1260

la hiptesis nula que interesa probar es si la variable textura es independiente de la variable velocidad de germinacin, por lo tanto se tiene: H0: Hay independencia entre las variables germinacin y textura, versus H1: No hay independencia entre las variables germinacin y textura
263

Anlisis de Datos Categricos

Si la hiptesis nula es cierta, las frecuencias esperadas se calculan segn se describi anteriormente y la tabla es: Textura Germinacin Alta Media Baja Nula Total Lisa 107.16 213.69 322.10 142.05 785 Intermedia 34.81 69.42 104.63 46.14 225 Rugosa 30.03 59.88 90.27 39.81 220 Total 172 343 517 228 1260

luego, evaluando el estadstico se tiene: 2 =

(38 - 39.81) 2 (122 - 107.16) 2 +..... + = 18.24 107.16 39.81

Como 2 = 18.24 es mayor que 12.6, que es el cuantil 1 - de la distribucin 2 con 6 ([4-1]x[3-1]) grados de libertad y = 0.05, se rechaza H0, o sea, no hay independencia entre las variables. Ejemplo 11.3: (homogeneidad de proporciones) Se desea conocer si la proporcin de pulgones muertos despus de ser tratados con distintas dosis de un insecticida es la misma o no. Para ello se toman 3 muestras aleatorias de 100 pulgones cada una y se las asigna al azar a los tratamientos consistentes en aplicaciones del insecticida en dosis de 20 ppm., 40 ppm. y 80 ppm. Los resultados fueron: Dosis Condicin Muertos Vivos Total 20 ppm. 32 68 100 40 ppm. 59 41 100 80 ppm. 92 8 100 Total 183 117 300

264

Anlisis de Datos Categricos

La hiptesis nula expresa que las proporciones de insectos muertos con 20, 40 y 80 ppm. son iguales. Si esta hiptesis es cierta, se debera esperar que la cantidad de insectos muertos en los tres tratamientos sea proporcional a la cantidad de individuos en cada tratamiento (marginales fijos de columnas). La tabla de frecuencias esperadas es: Dosis Condicin Muertos Vivos Total 20 ppm 61 39 100 40 ppm 61 39 100 80 ppm 61 39 100 Total 183 117 300

Cuando la hiptesis nula es verdadera y cada nij es suficientemente grande, el estadstico 2 tiene una distribucin aproximada 2 con (r-1)(c-1) grados de libertad. As, el estadstico evaluado es: 2 = (32 - 61)2 (59 - 61)2 (92 - 61)2 (68 - 39)2 (41 - 39)2 (8 - 39)2 + + + + + 39 = 75.914 61 61 61 39 39

Como 2~ 2, la regin de rechazo para = 0.05 est dada por aquellos valores de 2 2 > 22; 0.95 es decir, los valores de 2 > 5.99. En este caso 2 > 5.99, y por lo tanto se rechaza H0, por lo que no todas las dosis tienen el mismo efecto sobre la mortalidad de los pulgones. En otras palabras lo que este test dice es que lo observado no es atribuido al azar sino al efecto de un tratamiento (Dosis) y de all el sentido de su aplicacin.

Ejercicios
Ejercicio 11.1 Un estudio diagnstico fue llevado a cabo a los fines de indagar sobre la existencia de asociacin entre el tipo de prdidas de un cultivo y dos mtodos de aplicacin de un fungicida. Los resultados siguientes resumen la informacin de 22071 lotes de cultivos en la regin pampeana del pas.

265

Anlisis de Datos Categricos

Tipo de Prdida Mtodo Tradicional No tradicional a) b) total 18 5 moderada 171 99 sin prdidas 10845 10933

Cul es la hiptesis estadstica a evaluar? Realizar el anlisis para la verificacin de dicha hiptesis y concluir.

Ejercicio 11.2 Se observaron 80 nacimientos obtenidos del cruzamiento de 10 chanchas con el mismo padrillo, de los cuales 42 fueron rojizos, 12 negros y 26 blancos. El modelo gentico supuesto en este cruzamiento prev una distribucin de colores con frecuencias 9:3:4. Son los datos consistentes con el modelo terico propuesto al nivel de significacin del 0.01? Ejercicio 11.3 Una fbrica de implementos agrcolas desea determinar si las causas de ausentismo se relacionan con la edad. Se tom una muestra de 200 empleados al azar y se clasificaron segn edad y causa de ausentismo: Edad Enfermedad Otras Menos de 30 40 20 30 a 50 28 36 Ms de 50 52 24

Qu contraste se puede realizar? Trabajar con un = 0.01 Ejercicio 11.4 Se dispone de 300 animales de laboratorio y se decide tratar a 200 con una vacuna experimental y dejar a 100 como controles. Despus de tratar al primer lote se expone a los 300 al contagio de la enfermedad en estudio. El recuento final, despus de un perodo experimental adecuado, fue:
266

Anlisis de Datos Categricos

Enfermos Tratados No Tratados Total 56 71 127

Sanos 144 29 173

Total 200 100 300

Qu tipo de contraste se puede realizar?

Ejercicio 11.5 En un cruzamiento de hbridos de tomate se obtuvieron los siguientes valores:

Fenotipos Alto, sin brotes Alto, con brotes Bajo, sin brotes Bajo, con brotes

Frecuencias Observadas 926 288 293 104

Corroboran estos datos la proporcin 9:3:3:1, con = 0.05?. Ejercicio 11.6 Un eclogo deseaba estudiar si haba relacin entre la textura de la hoja de una especie rara y el tipo de suelo donde creca. Para ello tom una superficie de 400 km2, y seleccion una muestra al azar de 100 rboles obteniendo los siguientes resultados: Textura Tipo de Suelo Suelo calcreo Suelo no calcreo a) Qu hiptesis estadstica se puede probar?
267

Con Pelusa 12 16

Lisa 22 50

Anlisis de Datos Categricos

b) c)

Realizar la prueba correspondiente con nivel de significacin = 0.05 Qu conclusiones se pueden extraer?

268

12 Bibliografa
1. 2. 3. AGRESTI, A (1990). Categorical Data Analysis. John Wiley & Sons. 558 p. BAHRD, J. C. (1970). Psichophysical Analysis of Visual Space. Pergamon Press, New York. BERENSON, M.L.; LEVINE, D.M. and M. GOLDSTEIN. (1983). Intermediate Statistical Methods and Applications. A Computer Package Approach. PrenticeHall, Inc., Englewood Cliffs, New Jersey. 568 p. BIANCO, A. (1994). Introduccin al Anlisis de Datos Categricos. Coloquio Unin Matemtica Argentina (UMA). La Falda 55pp. CASANOVES F., DI RIENZO J.A., ROBLEDO C.W. (1998). Bases para estadstica experimental. Editorial Screen, Crdoba, Agentina. 189 p. CLEVELAND, W. S. (1984). Graphs in scientific publications. The American Statistician, 38: 261-269. CLEVELAND, W. S. (1985). The elements of graphing data. Wadsworth Advanced Books. Monterrey, CA. COHRAN, W.G. (1981). Tcnicas de Muestreo. Compaa Editorial Continental S. A. Mxico. 513 p. CONOVER, W.J. (1980). Practical Nonparametric Statistics 2ed . John Wiley & Sons. New York. Pp 485.

4. 5. 6. 7. 8. 9.

10. CHING CHUN LI. (1977). Introduccin a la Estadstica Experimental. Ediciones Omega, S.A. Barcelona. 496 p. 11. DIAZ, M.P. y De LUNA, J.G. (1991). Anlise de dados categorizados em tabelas de contingencia LxC. Seminario Curso de Post-Grado. Escuela Superior de Agricultura Luis de Queiroz. Universidad de Sao Paulo. Piracicaba, SP. Brasil. 87p. 12. DIXON, W. and F.J. MASSEY. (1970). Introduccin al Anlisis Estadstico. McGraw-Hill, Inc. Mxico. 489 p. 13. DRAPER N.R, SMITH H. (1998). Applied Regression Analysis (Third Edition). John Wiley & Sons, New York 706 p. 14. DUNCAN, D.B. (1955). Multiple and multiple F-test. Biometrics, 11:1-42. 15. DUNNETT, C.W. (1964). New tables for multiple comparisons with the control.
269

Bibliografa

Biometrics, 20:482-491. 16. FISHER, R.A. (1966). The design of experiments. 8th Edition. Hafner Publishing Co. New York. 17. FREUND, J.E. and R.E. WALPOLE. (1980). Mathematical Statistics. Third edition. Prentice-Hall, Inc., Englewood Cliffs, New Jersey. 450 p. 18. GILBERT, N. (1980). Estadstica. Nueva Editorial Interamericana. S. A. de C. V. 346 p. 19. GRIZZLE, J.E., C.F. STARMER, and G.G. KOCH. (1969). Analisys of categorical data by linear models. Biometrics, 25: 489-504. 20. HINKLEY, D. V. (1992). Cox, Dr. Theoritical Statistics, Chapema of Hall, London. 511 p. 21. JAMES, B. (1981). Probabilidade: Un curso en nivel intermediario. CNPq, Brasilia 293 p. 22. KOLMOGOROFF, A. N. (1937). Citeral in Kolmogoroff, A. N. and Fowin, S. V. (1961). Measure, Lekesgure Integrals, and Hilbert Space. Academic Press, New York. 23. KOSSLYN, S. M. (1980). Image and Mind. Cambridge, M.A.: Hardvard University Press. 24. MILLIKEN G.A. and JOHNSON, D.E. (1995) Analysis of Messy Data. Volume I: Designed Experiments. Van Nostrand Reinhold, NewYork. 25. MONTGOMERY, D.C. (1991). Diseo y Anlisis de Experimentos. Grupo Editorial Iberoamrica. 589 p. 26. MOOD, A.; GRAYBILL, F.; BOES, D. C. (1974) Introduction to the theory of Statistics. Mc Graw-Hill, Inc. 3th. 564 p. 27. MOSTELLER, F. and J. W. TUKEY. (1977). Data Analysis and Regression. Addison-Westley Publishing Company. 588 p. 28. MYERS, R.H. (1990). Classical and modern Regression with Applications. P. W. S.-Kent Publishing Company. 488 p. 29. PIMENTEL GOMES, F. (1978). Curso de Estadstica Experimental. Editorial Hemisferio Sur S.A. 323 p. 30. RAWLINGS, J.O. (1988). Applied Regression Analisys: a Research Tool. Wadsworth & Brooks/ Cole Advance Books & Software. 552 p.
270

Bibliografa

31. SCHEFFE, H. (1953). A method for judging all contrasts in the analysis of variance. Biometrika, 40:87-104. 32. SHEPARD, R. N. (1978). The mental image. American Psychologist, 33: 125127. 33. SOKAL, R. and J. ROHLF. (1981). Biometry: the Principles and Practices of statistics in Biological Research. W. H. Sreeman and Company. 587 p. 34. STEEL, R.G.D. y J.H. TORRIE. (1985). Bioestadstica: Principios y Procedimientos. Mc Graw-Hill. 622 p. 35. SYSTAT. (1977). The System for Statistics. Systat Inc. 415 p. 36. TUKEY, J.W. (1949). Comparing individual means in the analysis of variance. Biometrics, 5:99-114.

271

13 Tablas Estadsticas

273

Tabla de Nmeros Aleatorios


81 82 73 76 4 18 34 53 79 66 99 50 76 93 7 72 7 19 40 99 2 80 53 73 32 67 95 45 82 97 46 76 44 20 34 13 35 81 19 63 53 15 85 5 49 83 58 29 87 95 4 34 33 56 43 4 24 34 27 48 10 100 46 25 10 84 28 55 35 17 38 5 34 72 37 16 7 20 88 13 51 52 67 63 50 37 22 94 65 14 80 98 33 26 36 44 63 13 83 19 76 24 45 4 4 44 78 23 14 77 37 34 62 21 54 75 36 39 52 24 99 33 77 75 21 80 58 58 65 83 91 47 35 60 59 56 3 22 70 13 31 34 14 87 3 93 76 39 69 77 47 14 32 68 61 63 35 5 54 25 99 11 22 92 74 23 34 51 30 8 64 14 11 36 92 91 52 53 28 49 72 68 54 99 34 60 41 44 42 78 9 87 41 7 19 68 79 84 43 89 61 30 20 65 14 62 64 99 8 29 26 54 17 61 62 80 64 97 52 77 59 71 22 62 86 40 79 61 53 19 41 84 13 48 100 69 42 20 49 31 88 67 18 74 14 52 98 55 59 83 62 33 72 77 68 53 2 88 72 9 82 93 4 51 69 32 45 94 45 86 20 83 13 25 84 51 62 38 52 7 44 51 33 64 74 88 40 39 100 15 22 70 91 40 43 6 64 26 2 50 98 43 27 37 27 89 45 5 46 56 61 7 46 64 94 41 89 4 95 26 66 36 51 75 89 29 68 28 15 66 32 74 24 44 43 2 49 12 29 100 9 21 64 98 59 19 2 95 10 86 26 96 47 31 89 83 17 32 61 23 98 32 19 73 33 95 1 73 9 59 77 55 46 7 39 42 69 56 31 90 89 5 2 60 49 71 66 28 30 52 66 35 8 57 85 33 5 43 48 83 17 16 72 68 58 5 49 6 32 18 41 72 44 58 55 57 43 19 38 33 63 88 62 28 3 18 27 40 37 58 55 36 13 68 88 21 56 91 46 38 89 32 45 84 86 24 93 70 84 39 24 49 58 27 10 65 23 16 88 30 58 84 1 85 41 16 50 80 99 88 60 76 61 74 67 35 19 41 14 16 59 46 95 42 4 85 41 55 92 21 44 53 85 29 72 37 26 44 6 63 45 97 28 26 5 99 92 64 12 67 68 35 37 14 67 44 42 55 40 63 43 58 34 31 57 70 7 47 18 14 52 9 93 75 100 65 27 10 38 42 15 92 79 96 66 33 34 67 5 84 66 75 25 44 84 58 28 2 56 39 96 21 31 94 99 66 60 46 11 21 97 87 6 21 35 50 31 57 33 67 24 45 18 73 9 80 39 49 57 89 31 67 33 57 22 72 85 39 51 33 85 32 49 54 86 28 20 68 60 74 44 4 7 11 39 98 31 78 27 4 84 45 57 84 2 90 33 74 42 49 27 27 10 69 8 76 12 21 62 38 83 44 53 35 93 86 38 30 99 11 78 16 18 76 32 77 14 41 91 77 38 47 74 31 72 73 78 87 15 58 18 2 56 84 26 83 35 93 22 54 90 15 62 68 67 94 92 37 10 58 44 61 41 25 58 84 39 48 25 93 41 38 98 58 99 27 59 62 20 6 25 90 81 58 9 49 68 68 31 91 79 2 58 69 8 89 62 95 43 88 97 60 31 91 27 28 28 56 35 72 48 46 30 79 76 57 24 96 18 95 61 38 40 90 97 39 26 3 74 2 51 99 58 41 59 26 31 74 19 4 59 86 26 39 29 66 34 7 52 49 44 53 49 32 33 86 43 97 55 46 12 58 23 51 31 66 31 5 32 56 86 29 17 24 32 25 40 17 49 4 78 94 53 53 53 25 99 9 28 82 40 57 94 88 26 49 92 64 4 96 95 58 59 42 34 93 13 57 18 27 8 62 2 44 11 78 64 51 58 66 6 69 65 50 62 62 20 45 68 14 76 42 40 23 69 77 24 17 42 17 82 12 59 80 3 50 47 28 15 69 33 81 44 18 73 25 40 2 20 41 12 96 2 19 80 55 69 96 79 32 67 42 78 87 79 20 72 59 56 15 83 24 63 27 54 20 60 83 83 90 24 82 86 67 13 71 58 36 69 67 25 82 49 29 38 77 19 79 33 5 49 9 68 12 77 17 69 64 13 63 74 7 81 85 43 45 49 15 5 22 43 67 27 48 76 26 45 5 64 34 13 15 12 71 97 65 86 63 1 76 38 19 46 88 41 47 84 82 86 65 42 9 94 59 60 80 48 48 99 70 92 85 56 77 73 93 58 6 84 10 5 74 19 10 14 23 27 99 78 56 59 65 6 51 65 73 10 53 30 40 79 63 93 68 5 13 51 45 84 44 77 31 25 36 31

274

Tabla de Cuantiles de la una Distribucin Normal Estndar


z -3.25 -3.20 -3.15 -3.10 -3.05 -3.00 -2.95 -2.90 -2.85 -2.80 -2.75 -2.70 -2.65 -2.60 -2.55 -2.50 -2.45 -2.40 -2.35 -2.30 -2.25 -2.20 -2.15 -2.10 -2.05 -2.00 -1.95 -1.90 -1.85 -1.80 -1.75 -1.70 -1.65 -1.60 -1.55 -1.50 -1.45 -1.40 -1.35 -1.30 -1.25 -1.20 -1.15 -1.10 -1.05 P(Z z) 0.00058 0.00069 0.00082 0.00097 0.00114 0.00135 0.00159 0.00187 0.00219 0.00256 0.00298 0.00347 0.00402 0.00466 0.00539 0.00621 0.00714 0.00820 0.00939 0.01072 0.01222 0.01390 0.01578 0.01786 0.02018 0.02275 0.02559 0.02872 0.03216 0.03593 0.04006 0.04457 0.04947 0.05480 0.06057 0.06681 0.07353 0.08076 0.08851 0.09680 0.10565 0.11507 0.12507 0.13567 0.14686 z -1.00 -0.95 -0.90 -0.85 -0.80 -0.75 -0.70 -0.65 -0.60 -0.55 -0.50 -0.45 -0.40 -0.35 -0.30 -0.25 -0.20 -0.15 -0.10 -0.05 0.00 0.05 0.10 0.15 0.20 0.25 0.30 0.35 0.40 0.45 0.50 0.55 0.60 0.65 0.70 0.75 0.80 0.85 0.90 0.95 1.00 1.05 1.10 1.15 1.20 P(Z z) 0.15866 0.17106 0.18406 0.19766 0.21186 0.22663 0.24196 0.25785 0.27425 0.29116 0.30854 0.32636 0.34458 0.36317 0.38209 0.40129 0.42074 0.44038 0.46017 0.48006 0.50000 0.51994 0.53983 0.55962 0.57926 0.59871 0.61791 0.63683 0.65542 0.67364 0.69146 0.70884 0.72575 0.74215 0.75804 0.77337 0.78814 0.80234 0.81594 0.82894 0.84134 0.85314 0.86433 0.87493 0.88493 z 1.25 1.30 1.35 1.40 1.45 1.50 1.55 1.60 1.65 1.70 1.75 1.80 1.85 1.90 1.95 2.00 2.05 2.10 2.15 2.20 2.25 2.30 2.35 2.40 2.45 2.50 2.55 2.60 2.65 2.70 2.75 2.80 2.85 2.90 2.95 3.00 3.05 3.10 3.15 3.20 3.25 3.30 3.35 3.40 3.45 P(Z z) 0.89435 0.90320 0.91149 0.91924 0.92647 0.93319 0.93943 0.94520 0.95053 0.95543 0.95994 0.96407 0.96784 0.97128 0.97441 0.97725 0.97982 0.98214 0.98422 0.98610 0.98778 0.98928 0.99061 0.99180 0.99286 0.99379 0.99461 0.99534 0.99598 0.99653 0.99702 0.99744 0.99781 0.99813 0.99841 0.99865 0.99886 0.99903 0.99918 0.99931 0.99942 0.99952 0.99960 0.99966 0.99972 quantil 0.00001 0.0001 0.001 0.00 0.01 0.02 0.025 0.03 0.04 0.05 0.06 0.07 0.08 0.09 0.10 0.15 0.20 0.25 0.30 0.35 0.40 0.45 0.50 0.55 0.60 0.65 0.70 0.75 0.80 0.85 0.90 0.91 0.92 0.93 0.94 0.95 0.96 0.97 0.975 0.98 0.99 0.995 0.999 0.9999 0.99999 z -4.265 -3.719 -3.090 -2.576 -2.326 -2.054 -1.960 -1.881 -1.751 -1.645 -1.555 -1.476 -1.405 -1.341 -1.282 -1.036 -0.842 -0.674 -0.524 -0.385 -0.253 -0.126 0.000 0.126 0.253 0.385 0.524 0.674 0.842 1.036 1.282 1.341 1.405 1.476 1.555 1.645 1.751 1.881 1.960 2.054 2.326 2.576 3.090 3.719 4.265

275

Tabla de Cuantiles de la Distribucin T de Student


En el margen superior se leen los cuatiles y en el margen izquierdo los grados de libertad (). Esta tabla tabula valores P(Tt) para t>0. Si se buscan valores de t<0 los cuantiles se leen en el margen inferior.
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 0.700 0.725 0.750 0.775 0.800 0.825 0.850 0.875 0.900 0.925 0.950 0.975 0.990 0.995 0.727 0.617 0.584 0.569 0.559 0.553 0.549 0.546 0.543 0.542 0.540 0.539 0.538 0.537 0.536 0.535 0.534 0.534 0.533 0.533 0.532 0.532 0.532 0.531 0.531 0.531 0.531 0.530 0.530 0.530 0.530 0.530 0.530 0.529 0.529 0.529 0.529 0.529 0.529 0.529 0.529 0.528 0.528 0.528 0.528 0.528 0.528 0.528 0.528 0.528 0.3 0.854 0.713 0.671 0.652 0.641 0.633 0.628 0.624 0.621 0.619 0.617 0.615 0.614 0.613 0.612 0.611 0.610 0.609 0.609 0.608 0.608 0.607 0.607 0.606 0.606 0.606 0.605 0.605 0.605 0.605 0.604 0.604 0.604 0.604 0.604 0.603 0.603 0.603 0.603 0.603 0.603 0.603 0.603 0.602 0.602 0.602 0.602 0.602 0.602 0.602 0.275 1.000 0.816 0.765 0.741 0.727 0.718 0.711 0.706 0.703 0.700 0.697 0.695 0.694 0.692 0.691 0.690 0.689 0.688 0.688 0.687 0.686 0.686 0.685 0.685 0.684 0.684 0.684 0.683 0.683 0.683 0.682 0.682 0.682 0.682 0.682 0.681 0.681 0.681 0.681 0.681 0.681 0.680 0.680 0.680 0.680 0.680 0.680 0.680 0.680 0.679 0.25 1.171 0.931 0.866 0.836 0.819 0.808 0.800 0.794 0.790 0.786 0.783 0.781 0.779 0.777 0.776 0.774 0.773 0.772 0.771 0.771 0.770 0.769 0.769 0.768 0.767 0.767 0.767 0.766 0.766 0.765 0.765 0.765 0.765 0.764 0.764 0.764 0.764 0.763 0.763 0.763 0.763 0.763 0.762 0.762 0.762 0.762 0.762 0.762 0.762 0.761 0.225 1.376 1.061 0.978 0.941 0.920 0.906 0.896 0.889 0.883 0.879 0.876 0.873 0.870 0.868 0.866 0.865 0.863 0.862 0.861 0.860 0.859 0.858 0.858 0.857 0.856 0.856 0.855 0.855 0.854 0.854 0.853 0.853 0.853 0.852 0.852 0.852 0.851 0.851 0.851 0.851 0.850 0.850 0.850 0.850 0.850 0.850 0.849 0.849 0.849 0.849 0.2 1.632 1.210 1.105 1.057 1.031 1.013 1.001 0.993 0.986 0.980 0.976 0.972 0.969 0.967 0.965 0.963 0.961 0.960 0.958 0.957 0.956 0.955 0.954 0.953 0.952 0.952 0.951 0.950 0.950 0.949 0.949 0.948 0.948 0.948 0.947 0.947 0.947 0.946 0.946 0.946 0.945 0.945 0.945 0.945 0.944 0.944 0.944 0.944 0.944 0.943 0.175 1.963 1.386 1.250 1.190 1.156 1.134 1.119 1.108 1.100 1.093 1.088 1.083 1.079 1.076 1.074 1.071 1.069 1.067 1.066 1.064 1.063 1.061 1.060 1.059 1.058 1.058 1.057 1.056 1.055 1.055 1.054 1.054 1.053 1.052 1.052 1.052 1.051 1.051 1.050 1.050 1.050 1.049 1.049 1.049 1.049 1.048 1.048 1.048 1.048 1.047 0.15 2.414 1.604 1.423 1.344 1.301 1.273 1.254 1.240 1.230 1.221 1.214 1.209 1.204 1.200 1.197 1.194 1.191 1.189 1.187 1.185 1.183 1.182 1.180 1.179 1.178 1.177 1.176 1.175 1.174 1.173 1.172 1.172 1.171 1.170 1.170 1.169 1.169 1.168 1.168 1.167 1.167 1.166 1.166 1.166 1.165 1.165 1.165 1.164 1.164 1.164 0.125 3.078 1.886 1.638 1.533 1.476 1.440 1.415 1.397 1.383 1.372 1.363 1.356 1.350 1.345 1.341 1.337 1.333 1.330 1.328 1.325 1.323 1.321 1.319 1.318 1.316 1.315 1.314 1.313 1.311 1.310 1.309 1.309 1.308 1.307 1.306 1.306 1.305 1.304 1.304 1.303 1.303 1.302 1.302 1.301 1.301 1.300 1.300 1.299 1.299 1.299 0.1 4.165 2.282 1.924 1.778 1.699 1.650 1.617 1.592 1.574 1.559 1.548 1.538 1.530 1.523 1.517 1.512 1.508 1.504 1.500 1.497 1.494 1.492 1.489 1.487 1.485 1.483 1.482 1.480 1.479 1.477 1.476 1.475 1.474 1.473 1.472 1.471 1.470 1.469 1.468 1.468 1.467 1.466 1.466 1.465 1.465 1.464 1.463 1.463 1.462 1.462 0.075 6.314 2.920 2.353 2.132 2.015 1.943 1.895 1.860 1.833 1.812 1.796 1.782 1.771 1.761 1.753 1.746 1.740 1.734 1.729 1.725 1.721 1.717 1.714 1.711 1.708 1.706 1.703 1.701 1.699 1.697 1.696 1.694 1.692 1.691 1.690 1.688 1.687 1.686 1.685 1.684 1.683 1.682 1.681 1.680 1.679 1.679 1.678 1.677 1.677 1.676 0.05 12.71 4.303 3.182 2.776 2.571 2.447 2.365 2.306 2.262 2.228 2.201 2.179 2.160 2.145 2.131 2.120 2.110 2.101 2.093 2.086 2.080 2.074 2.069 2.064 2.060 2.056 2.052 2.048 2.045 2.042 2.040 2.037 2.035 2.032 2.030 2.028 2.026 2.024 2.023 2.021 2.020 2.018 2.017 2.015 2.014 2.013 2.012 2.011 2.010 2.009 0.025 31.82 6.965 4.541 3.747 3.365 3.143 2.998 2.896 2.821 2.764 2.718 2.681 2.650 2.624 2.602 2.583 2.567 2.552 2.539 2.528 2.518 2.508 2.500 2.492 2.485 2.479 2.473 2.467 2.462 2.457 2.453 2.449 2.445 2.441 2.438 2.434 2.431 2.429 2.426 2.423 2.421 2.418 2.416 2.414 2.412 2.410 2.408 2.407 2.405 2.403 0.01 63.66 9.925 5.841 4.604 4.032 3.707 3.499 3.355 3.250 3.169 3.106 3.055 3.012 2.977 2.947 2.921 2.898 2.878 2.861 2.845 2.831 2.819 2.807 2.797 2.787 2.779 2.771 2.763 2.756 2.750 2.744 2.738 2.733 2.728 2.724 2.719 2.715 2.712 2.708 2.704 2.701 2.698 2.695 2.692 2.690 2.687 2.685 2.682 2.680 2.678 0.005

276

Tabla de Cuantiles de la Distribucin Chi-Cuadrado


En el margen superior se lee P(2 x) para los valores de x que figuran en el cuerpo de la tabla y en el margen izquierdo los grados de libertad ().
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 0.010 0.0002 0.0201 0.1148 0.2971 0.5543 0.8721 1.2390 1.6465 2.0879 2.5582 3.0535 3.5706 4.1069 4.6604 5.2294 5.8122 6.4078 7.0149 7.6327 8.2604 8.8972 9.5425 10.1957 10.8564 11.5240 12.1981 12.8785 13.5647 14.2564 14.9534 15.6555 16.3622 17.0735 17.7891 18.5089 19.2327 19.9603 20.6914 21.4262 22.1643 22.9056 23.6501 24.3976 25.1480 25.9012 26.6572 27.4158 28.1770 28.9407 0.025 0.0010 0.0506 0.2158 0.4844 0.8312 1.2373 1.6899 2.1797 2.7004 3.2470 3.8157 4.4038 5.0088 5.6287 6.2621 6.9076 7.5642 8.2307 8.9065 9.5908 10.2829 10.9823 11.6885 12.4011 13.1197 13.8439 14.5734 15.3079 16.0471 16.7908 17.5387 18.2907 19.0466 19.8062 20.5694 21.3359 22.1056 22.8785 23.6544 24.4330 25.2145 25.9987 26.7853 27.5746 28.3661 29.1601 29.9562 30.7545 31.5549 0.05 0.0039 0.1026 0.3518 0.7107 1.1455 1.6354 2.1674 2.7326 3.3251 3.9403 4.5748 5.2260 5.8919 6.5706 7.2610 7.9616 8.6718 9.3905 10.1170 10.8508 11.5913 12.3380 13.0905 13.8484 14.6114 15.3792 16.1514 16.9279 17.7084 18.4926 19.2806 20.0719 20.8665 21.6643 22.4650 23.2686 24.0749 24.8839 25.6954 26.5093 27.3256 28.1441 28.9647 29.7875 30.6122 31.4390 32.2676 33.0981 33.9303 0.10 0.0158 0.2107 0.5844 1.0636 1.6103 2.2041 2.8331 3.4895 4.1682 4.8652 5.5778 6.3038 7.0415 7.7895 8.5468 9.3122 10.0852 10.8649 11.6509 12.4426 13.2396 14.0415 14.8480 15.6587 16.4734 17.2919 18.1139 18.9392 19.7677 20.5992 21.4336 22.2706 23.1102 23.9523 24.7966 25.6433 26.4921 27.3429 28.1958 29.0505 29.9071 30.7654 31.6255 32.4871 33.3504 34.2152 35.0814 35.9491 36.8182 0.15 0.0358 0.3250 0.7978 1.3665 1.9938 2.6613 3.3583 4.0782 4.8165 5.5701 6.3364 7.1138 7.9008 8.6963 9.4993 10.3090 11.1249 11.9462 12.7727 13.6039 14.4393 15.2788 16.1219 16.9686 17.8184 18.6714 19.5272 20.3857 21.2468 22.1103 22.9762 23.8442 24.7143 25.5864 26.4604 27.3362 28.2138 29.0931 29.9739 30.8563 31.7402 32.6255 33.5122 34.4002 35.2896 36.1801 37.0718 37.9648 38.8588 0.20 0.0642 0.4463 1.0052 1.6488 2.3425 3.0701 3.8223 4.5936 5.3801 6.1791 6.9887 7.8073 8.6339 9.4673 10.3070 11.1521 12.0023 12.8570 13.7158 14.5784 15.4446 16.3140 17.1865 18.0618 18.9398 19.8202 20.7030 21.5880 22.4751 23.3641 24.2551 25.1478 26.0422 26.9383 27.8359 28.7350 29.6355 30.5373 31.4405 32.3450 33.2506 34.1574 35.0653 35.9744 36.8844 37.7955 38.7075 39.6205 40.5344 0.25 0.1015 0.5754 1.2125 1.9226 2.6746 3.4546 4.2549 5.0706 5.8988 6.7372 7.5841 8.4384 9.2991 10.1653 11.0365 11.9122 12.7919 13.6753 14.5620 15.4518 16.3444 17.2396 18.1373 19.0373 19.9393 20.8434 21.7494 22.6572 23.5666 24.4776 25.3901 26.3041 27.2194 28.1361 29.0540 29.9730 30.8933 31.8146 32.7369 33.6603 34.5846 35.5099 36.4361 37.3631 38.2910 39.2197 40.1492 41.0794 42.0104 0.30 0.1485 0.7133 1.4237 2.1947 2.9999 3.8276 4.6713 5.5274 6.3933 7.2672 8.1479 9.0343 9.9257 10.8215 11.7212 12.6244 13.5307 14.4399 15.3517 16.2659 17.1823 18.1007 19.0211 19.9432 20.8670 21.7924 22.7192 23.6475 24.5770 25.5078 26.4397 27.3728 28.3069 29.2421 30.1782 31.1152 32.0532 32.9919 33.9316 34.8719 35.8131 36.7550 37.6975 38.6408 39.5847 40.5292 41.4744 42.4201 43.3664 0.35 0.2059 0.8616 1.6416 2.4701 3.3251 4.1973 5.0816 5.9753 6.8763 7.7832 8.6952 9.6115 10.5315 11.4548 12.3809 13.3096 14.2406 15.1738 16.1089 17.0458 17.9843 18.9243 19.8657 20.8084 21.7524 22.6975 23.6437 24.5909 25.5391 26.4881 27.4381 28.3889 29.3405 30.2928 31.2458 32.1995 33.1539 34.1089 35.0645 36.0207 36.9774 37.9347 38.8924 39.8507 40.8095 41.7687 42.7284 43.6885 44.6491 0.40 0.2750 1.0217 1.8692 2.7528 3.6555 4.5702 5.4932 6.4226 7.3570 8.2955 9.2373 10.1820 11.1291 12.0785 13.0297 13.9827 14.9373 15.8932 16.8504 17.8088 18.7683 19.7288 20.6902 21.6525 22.6156 23.5794 24.5440 25.5093 26.4751 27.4416 28.4087 29.3763 30.3444 31.3130 32.2821 33.2517 34.2216 35.1920 36.1628 37.1340 38.1055 39.0774 40.0496 41.0222 41.9950 42.9682 43.9417 44.9154 45.8895 0.45 0.3573 1.1957 2.1095 3.0469 3.9959 4.9519 5.9125 6.8766 7.8434 8.8123 9.7831 10.7553 11.7288 12.7034 13.6790 14.6555 15.6328 16.6108 17.5894 18.5687 19.5485 20.5288 21.5095 22.4908 23.4724 24.4544 25.4367 26.4195 27.4025 28.3858 29.3694 30.3533 31.3375 32.3219 33.3065 34.2913 35.2764 36.2617 37.2472 38.2328 39.2187 40.2047 41.1909 42.1773 43.1638 44.1505 45.1373 46.1243 47.1114 0.50 0.4549 1.3863 2.3660 3.3567 4.3515 5.3481 6.3458 7.3441 8.3428 9.3418 10.3410 11.3403 12.3398 13.3393 14.3389 15.3385 16.3382 17.3379 18.3377 19.3374 20.3372 21.3370 22.3369 23.3367 24.3366 25.3365 26.3363 27.3362 28.3361 29.3360 30.3359 31.3359 32.3358 33.3357 34.3356 35.3356 36.3355 37.3354 38.3354 39.3353 40.3353 41.3352 42.3352 43.3352 44.3351 45.3351 46.3350 47.3350 48.3350

277

Tabla de Cuantiles de la Distribucin Chi-Cuadrado


En el margen superior se lee P(2 x) para los valores de x que figuran en el cuerpo de la tabla y en el margen izquierdo los grados de libertad ().
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 0.55 0.5707 1.5970 2.6430 3.6871 4.7278 5.7652 6.8000 7.8325 8.8632 9.8922 10.9199 11.9463 12.9717 13.9961 15.0197 16.0425 17.0646 18.0860 19.1069 20.1272 21.1470 22.1663 23.1852 24.2037 25.2218 26.2395 27.2569 28.2740 29.2908 30.3073 31.3235 32.3394 33.3551 34.3706 35.3858 36.4008 37.4156 38.4302 39.4446 40.4589 41.4729 42.4868 43.5005 44.5141 45.5274 46.5407 47.5538 48.5668 49.5796 0.60 0.7083 1.8326 2.9462 4.0446 5.1319 6.2108 7.2832 8.3505 9.4136 10.4732 11.5298 12.5838 13.6356 14.6853 15.7332 16.7795 17.8244 18.8679 19.9102 20.9514 21.9915 23.0307 24.0689 25.1063 26.1430 27.1789 28.2141 29.2486 30.2825 31.3159 32.3486 33.3809 34.4126 35.4438 36.4746 37.5049 38.5349 39.5643 40.5935 41.6222 42.6506 43.6786 44.7063 45.7336 46.7607 47.7874 48.8139 49.8401 50.8659 0.65 0.8735 2.0996 3.2831 4.4377 5.5731 6.6948 7.8061 8.9094 10.0060 11.0971 12.1836 13.2661 14.3451 15.4209 16.4940 17.5646 18.6330 19.6993 20.7638 21.8265 22.8876 23.9473 25.0055 26.0625 27.1183 28.1730 29.2266 30.2791 31.3308 32.3815 33.4314 34.4804 35.5287 36.5763 37.6231 38.6693 39.7148 40.7597 41.8040 42.8477 43.8909 44.9335 45.9757 47.0173 48.0584 49.0991 50.1394 51.1792 52.2186 0.70 1.0742 2.4079 3.6649 4.8784 6.0644 7.2311 8.3834 9.5245 10.6564 11.7807 12.8987 14.0111 15.1187 16.2221 17.3217 18.4179 19.5110 20.6014 21.6891 22.7745 23.8578 24.9390 26.0184 27.0960 28.1719 29.2463 30.3193 31.3909 32.4612 33.5302 34.5981 35.6649 36.7307 37.7954 38.8591 39.9220 40.9839 42.0450 43.1054 44.1649 45.2236 46.2817 47.3390 48.3957 49.4517 50.5071 51.5619 52.6161 53.6697 0.75 1.3233 2.7726 4.1083 5.3853 6.6257 7.8408 9.0371 10.2189 11.3887 12.5489 13.7007 14.8454 15.9839 17.1169 18.2451 19.3689 20.4887 21.6049 22.7178 23.8277 24.9348 26.0393 27.1413 28.2412 29.3388 30.4346 31.5284 32.6205 33.7109 34.7997 35.8871 36.9730 38.0575 39.1408 40.2228 41.3036 42.3833 43.4619 44.5395 45.6160 46.6916 47.7662 48.8400 49.9129 50.9849 52.0562 53.1267 54.1964 55.2653 0.80 1.6424 3.2189 4.6416 5.9886 7.2893 8.5581 9.8033 11.0301 12.2421 13.4420 14.6314 15.8120 16.9848 18.1508 19.3107 20.4651 21.6146 22.7595 23.9004 25.0375 26.1711 27.3014 28.4288 29.5533 30.6752 31.7946 32.9117 34.0266 35.1394 36.2502 37.3591 38.4663 39.5718 40.6757 41.7780 42.8788 43.9782 45.0763 46.1730 47.2685 48.3628 49.4560 50.5480 51.6389 52.7288 53.8177 54.9056 55.9926 57.0786 0.85 2.0723 3.7942 5.3171 6.7449 8.1152 9.4461 10.7479 12.0271 13.2880 14.5339 15.7671 16.9893 18.2020 19.4062 20.6030 21.7931 22.9770 24.1555 25.3288 26.4976 27.6620 28.8225 29.9792 31.1325 32.2825 33.4295 34.5736 35.7150 36.8538 37.9902 39.1244 40.2563 41.3861 42.5140 43.6399 44.7641 45.8864 47.0072 48.1263 49.2439 50.3599 51.4746 52.5879 53.6998 54.8105 55.9199 57.0281 58.1352 59.2411 0.90 2.7055 4.6052 6.2514 7.7794 9.2364 10.6446 12.0170 13.3616 14.6837 15.9872 17.2750 18.5493 19.8119 21.0642 22.3071 23.5418 24.7690 25.9894 27.2036 28.4120 29.6151 30.8133 32.0069 33.1962 34.3816 35.5632 36.7412 37.9159 39.0875 40.2560 41.4217 42.5848 43.7452 44.9032 46.0588 47.2122 48.3634 49.5126 50.6598 51.8051 52.9485 54.0902 55.2302 56.3686 57.5053 58.6405 59.7743 60.9066 62.0375 0.95 3.8415 5.9915 7.8147 9.4877 11.0705 12.5916 14.0672 15.5073 16.9190 18.3070 19.6751 21.0261 22.3620 23.6848 24.9958 26.2962 27.5871 28.8693 30.1435 31.4105 32.6706 33.9244 35.1725 36.4150 37.6525 38.8851 40.1133 41.3371 42.5570 43.7730 44.9854 46.1943 47.3999 48.6024 49.8018 50.9985 52.1923 53.3836 54.5722 55.7585 56.9424 58.1241 59.3035 60.4809 61.6562 62.8296 64.0011 65.1708 66.3386 0.975 5.0239 7.3777 9.3484 11.1433 12.8325 14.4494 16.0128 17.5345 19.0228 20.4832 21.9201 23.3367 24.7356 26.1189 27.4884 28.8454 30.1910 31.5264 32.8523 34.1696 35.4789 36.7807 38.0757 39.3641 40.6465 41.9232 43.1945 44.4608 45.7223 46.9793 48.2319 49.4804 50.7251 51.9660 53.2034 54.4373 55.6680 56.8955 58.1201 59.3417 60.5606 61.7768 62.9904 64.2014 65.4101 66.6165 67.8207 69.0226 70.2224 0.99 6.6349 9.2103 11.3448 13.2767 15.0863 16.8118 18.4753 20.0902 21.6661 23.2093 24.7250 26.2170 27.6882 29.1412 30.5779 32.0000 33.4086 34.8053 36.1909 37.5662 38.9322 40.2893 41.6384 42.9798 44.3141 45.6418 46.9630 48.2783 49.5880 50.8921 52.1913 53.4859 54.7754 56.0610 57.3421 58.6192 59.8925 61.1620 62.4280 63.6908 64.9501 66.2063 67.4595 68.7095 69.9569 71.2014 72.4432 73.6827 74.9194 0.999 10.8278 13.8150 16.2667 18.4670 20.5147 22.4577 24.3215 26.1248 27.8768 29.5881 31.2645 32.9094 34.5288 36.1237 37.6976 39.2529 40.7896 42.3123 43.8211 45.3147 46.7966 48.2681 49.7280 51.1785 52.6197 54.0516 55.4766 56.8922 58.3008 59.7024 61.0983 62.4871 63.8701 65.2461 66.6198 67.9842 69.3463 70.7037 72.0541 73.4022 74.7456 76.0844 77.4185 78.7503 80.0774 81.3999 82.7201 84.0379 85.3511

278

Tabla de Cuantiles de la Distribucin F


Grados de libertad del numerador en extremo superior izquierdo, grados de libertad del denominador en margen izquierdo de cada fila. En el margen superior se lee P(F x) para los valores de x en el cuerpo de la tabla.
1 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 0.001 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.025 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.050 0.0062 0.0050 0.0046 0.0045 0.0043 0.0043 0.0042 0.0042 0.0042 0.0041 0.0041 0.0041 0.0041 0.0041 0.0041 0.0041 0.0040 0.0040 0.0040 0.0040 0.0040 0.0040 0.0040 0.0040 0.0040 0.0040 0.0040 0.0040 0.0040 0.0040 0.0040 0.0040 0.0040 0.0040 0.0040 0.0040 0.0040 0.0040 0.0040 0.0040 0.0040 0.0040 0.0040 0.0040 0.0040 0.0040 0.0040 0.0040 0.0040 0.0040 0.075 0.0140 0.0113 0.0105 0.0100 0.0098 0.0096 0.0095 0.0094 0.0094 0.0093 0.0093 0.0092 0.0092 0.0092 0.0092 0.0091 0.0091 0.0091 0.0091 0.0091 0.0091 0.0091 0.0091 0.0091 0.0090 0.0090 0.0090 0.0090 0.0090 0.0090 0.0090 0.0090 0.0090 0.0090 0.0090 0.0090 0.0090 0.0090 0.0090 0.0090 0.0090 0.0090 0.0090 0.0090 0.0090 0.0090 0.0090 0.0090 0.0090 0.0090 0.100 0.0251 0.0202 0.0187 0.0179 0.0175 0.0172 0.0170 0.0168 0.0167 0.0166 0.0165 0.0165 0.0164 0.0164 0.0163 0.0163 0.0163 0.0162 0.0162 0.0162 0.0162 0.0162 0.0161 0.0161 0.0161 0.0161 0.0161 0.0161 0.0161 0.0161 0.0161 0.0160 0.0160 0.0160 0.0160 0.0160 0.0160 0.0160 0.0160 0.0160 0.0160 0.0160 0.0160 0.0160 0.0160 0.0160 0.0160 0.0160 0.0160 0.0160 0.125 0.0396 0.0317 0.0293 0.0281 0.0274 0.0269 0.0266 0.0264 0.0262 0.0260 0.0259 0.0258 0.0257 0.0257 0.0256 0.0256 0.0255 0.0255 0.0254 0.0254 0.0254 0.0253 0.0253 0.0253 0.0253 0.0252 0.0252 0.0252 0.0252 0.0252 0.0252 0.0251 0.0251 0.0251 0.0251 0.0251 0.0251 0.0251 0.0251 0.0251 0.0251 0.0251 0.0250 0.0250 0.0250 0.0250 0.0250 0.0250 0.0250 0.0250 0.825 0.0576 0.0460 0.0424 0.0407 0.0397 0.0390 0.0385 0.0382 0.0379 0.0377 0.0375 0.0373 0.0372 0.0371 0.0370 0.0369 0.0369 0.0368 0.0368 0.0367 0.0367 0.0366 0.0366 0.0365 0.0365 0.0365 0.0365 0.0364 0.0364 0.0364 0.0364 0.0363 0.0363 0.0363 0.0363 0.0363 0.0363 0.0363 0.0362 0.0362 0.0362 0.0362 0.0362 0.0362 0.0362 0.0362 0.0362 0.0362 0.0361 0.0361 0.850 17.349 5.2072 3.7030 3.1620 2.8878 2.7231 2.6134 2.5352 2.4766 2.4312 2.3949 2.3653 2.3407 2.3198 2.3020 2.2865 2.2730 2.2611 2.2506 2.2411 2.2326 2.2249 2.2179 2.2116 2.2057 2.2004 2.1954 2.1908 2.1866 2.1826 2.1789 2.1755 2.1722 2.1692 2.1663 2.1636 2.1611 2.1587 2.1564 2.1542 2.1521 2.1502 2.1483 2.1466 2.1449 2.1432 2.1417 2.1402 2.1388 2.1374 0.875 25.274 6.5333 4.4651 3.7468 3.3890 3.1761 3.0354 2.9356 2.8611 2.8035 2.7576 2.7202 2.6891 2.6628 2.6404 2.6210 2.6040 2.5891 2.5758 2.5640 2.5533 2.5437 2.5350 2.5270 2.5197 2.5130 2.5068 2.5011 2.4958 2.4908 2.4862 2.4819 2.4778 2.4741 2.4705 2.4671 2.4639 2.4609 2.4581 2.4554 2.4528 2.4504 2.4481 2.4459 2.4437 2.4417 2.4398 2.4380 2.4362 2.4345 0.900 39.863 8.5263 5.5383 4.5448 4.0604 3.7760 3.5894 3.4579 3.3603 3.2850 3.2252 3.1766 3.1362 3.1022 3.0732 3.0481 3.0262 3.0070 2.9899 2.9747 2.9610 2.9486 2.9374 2.9271 2.9177 2.9091 2.9012 2.8938 2.8870 2.8807 2.8748 2.8693 2.8641 2.8592 2.8547 2.8503 2.8463 2.8424 2.8388 2.8353 2.8321 2.8290 2.8260 2.8232 2.8205 2.8179 2.8154 2.8131 2.8108 2.8087 0.925 71.384 11.852 7.1865 5.7219 5.0278 4.6269 4.3670 4.1852 4.0510 3.9480 3.8665 3.8004 3.7457 3.6997 3.6605 3.6267 3.5972 3.5714 3.5484 3.5280 3.5096 3.4930 3.4780 3.4643 3.4518 3.4403 3.4297 3.4199 3.4108 3.4023 3.3944 3.3871 3.3802 3.3737 3.3676 3.3619 3.3565 3.3514 3.3465 3.3419 3.3376 3.3334 3.3295 3.3258 3.3222 3.3187 3.3155 3.3124 3.3094 3.3065 0.950 161.44 18.512 10.128 7.7086 6.6079 5.9874 5.5915 5.3176 5.1174 4.9646 4.8443 4.7472 4.6672 4.6001 4.5431 4.4940 4.4513 4.4139 4.3808 4.3513 4.3248 4.3009 4.2793 4.2597 4.2417 4.2252 4.2100 4.1960 4.1830 4.1709 4.1596 4.1491 4.1393 4.1300 4.1213 4.1132 4.1055 4.0982 4.0913 4.0847 4.0785 4.0727 4.0670 4.0617 4.0566 4.0517 4.0471 4.0426 4.0384 4.0343 0.975 647.79 38.506 17.443 12.217 10.006 8.8131 8.0727 7.5709 7.2093 6.9367 6.7241 6.5538 6.4143 6.2979 6.1995 6.1151 6.0420 5.9781 5.9216 5.8715 5.8266 5.7863 5.7498 5.7166 5.6864 5.6586 5.6331 5.6096 5.5878 5.5675 5.5487 5.5311 5.5147 5.4993 5.4848 5.4712 5.4584 5.4463 5.4348 5.4239 5.4137 5.4039 5.3946 5.3857 5.3773 5.3692 5.3615 5.3541 5.3471 5.3403 0.990 4052.1 98.501 34.116 21.197 16.258 13.745 12.246 11.258 10.561 10.044 9.6461 9.3303 9.0738 8.8617 8.6832 8.5309 8.3998 8.2855 8.1850 8.0960 8.0166 7.9453 7.8811 7.8229 7.7698 7.7213 7.6767 7.6357 7.5977 7.5624 7.5297 7.4992 7.4708 7.4441 7.4191 7.3956 7.3735 7.3526 7.3328 7.3142 7.2964 7.2796 7.2636 7.2483 7.2339 7.2200 7.2068 7.1942 7.1822 7.1706

279

Tabla de Cuantiles de la Distribucin F


Grados de libertad del numerador en extremo superior izquierdo, grados de libertad del denominador en margen izquierdo de cada fila. En el margen superior se lee P(F x) para los valores de x en el cuerpo de la tabla.
2 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 0.001 0.0010 0.0010 0.0010 0.0010 0.0010 0.0010 0.0010 0.0010 0.0010 0.0010 0.0010 0.0010 0.0010 0.0010 0.0010 0.0010 0.0010 0.0010 0.0010 0.0010 0.0010 0.0010 0.0010 0.0010 0.0010 0.0010 0.0010 0.0010 0.0010 0.0010 0.0010 0.0010 0.0010 0.0010 0.0010 0.0010 0.0010 0.0010 0.0010 0.0010 0.0010 0.0010 0.0010 0.0010 0.0010 0.0010 0.0010 0.0010 0.0010 0.0010 0.025 0.0260 0.0256 0.0255 0.0255 0.0254 0.0254 0.0254 0.0254 0.0254 0.0254 0.0254 0.0254 0.0254 0.0254 0.0254 0.0254 0.0254 0.0254 0.0254 0.0253 0.0253 0.0253 0.0253 0.0253 0.0253 0.0253 0.0253 0.0253 0.0253 0.0253 0.0253 0.0253 0.0253 0.0253 0.0253 0.0253 0.0253 0.0253 0.0253 0.0253 0.0253 0.0253 0.0253 0.0253 0.0253 0.0253 0.0253 0.0253 0.0253 0.0253 0.050 0.0540 0.0526 0.0522 0.0520 0.0518 0.0517 0.0517 0.0516 0.0516 0.0516 0.0515 0.0515 0.0515 0.0515 0.0515 0.0515 0.0514 0.0514 0.0514 0.0514 0.0514 0.0514 0.0514 0.0514 0.0514 0.0514 0.0514 0.0514 0.0514 0.0514 0.0514 0.0514 0.0514 0.0514 0.0514 0.0514 0.0514 0.0514 0.0514 0.0514 0.0514 0.0514 0.0514 0.0514 0.0514 0.0514 0.0513 0.0513 0.0513 0.0513 0.075 0.0844 0.0811 0.0800 0.0795 0.0792 0.0790 0.0788 0.0787 0.0786 0.0786 0.0785 0.0785 0.0784 0.0784 0.0784 0.0783 0.0783 0.0783 0.0783 0.0783 0.0783 0.0782 0.0782 0.0782 0.0782 0.0782 0.0782 0.0782 0.0782 0.0782 0.0782 0.0782 0.0781 0.0781 0.0781 0.0781 0.0781 0.0781 0.0781 0.0781 0.0781 0.0781 0.0781 0.0781 0.0781 0.0781 0.0781 0.0781 0.0781 0.0781 0.100 0.1173 0.1111 0.1091 0.1082 0.1076 0.1072 0.1070 0.1068 0.1066 0.1065 0.1064 0.1063 0.1062 0.1062 0.1061 0.1061 0.1060 0.1060 0.1059 0.1059 0.1059 0.1059 0.1058 0.1058 0.1058 0.1058 0.1058 0.1058 0.1057 0.1057 0.1057 0.1057 0.1057 0.1057 0.1057 0.1057 0.1057 0.1057 0.1056 0.1056 0.1056 0.1056 0.1056 0.1056 0.1056 0.1056 0.1056 0.1056 0.1056 0.1056 0.125 0.1531 0.1429 0.1397 0.1381 0.1372 0.1365 0.1361 0.1358 0.1355 0.1353 0.1352 0.1350 0.1349 0.1348 0.1347 0.1347 0.1346 0.1345 0.1345 0.1344 0.1344 0.1343 0.1343 0.1343 0.1342 0.1342 0.1342 0.1342 0.1341 0.1341 0.1341 0.1341 0.1341 0.1341 0.1340 0.1340 0.1340 0.1340 0.1340 0.1340 0.1340 0.1340 0.1339 0.1339 0.1339 0.1339 0.1339 0.1339 0.1339 0.1339 0.825 15.826 4.7143 3.2944 2.7809 2.5202 2.3634 2.2589 2.1844 2.1287 2.0854 2.0508 2.0225 1.9990 1.9792 1.9621 1.9474 1.9345 1.9232 1.9131 1.9041 1.8960 1.8887 1.8820 1.8759 1.8703 1.8652 1.8605 1.8561 1.8521 1.8483 1.8447 1.8414 1.8384 1.8355 1.8327 1.8301 1.8277 1.8254 1.8232 1.8212 1.8192 1.8173 1.8156 1.8139 1.8123 1.8107 1.8092 1.8078 1.8065 1.8052 0.850 21.722 5.6667 3.8133 3.1640 2.8395 2.6462 2.5183 2.4274 2.3597 2.3072 2.2654 2.2313 2.2030 2.1791 2.1586 2.1410 2.1255 2.1119 2.0998 2.0890 2.0793 2.0705 2.0626 2.0553 2.0487 2.0425 2.0369 2.0317 2.0268 2.0223 2.0181 2.0142 2.0105 2.0070 2.0038 2.0007 1.9978 1.9951 1.9925 1.9900 1.9877 1.9855 1.9833 1.9813 1.9794 1.9776 1.9758 1.9741 1.9725 1.9710 0.875 31.499 7.0000 4.5000 3.6569 3.2435 3.0000 2.8401 2.7272 2.6433 2.5786 2.5271 2.4853 2.4506 2.4213 2.3963 2.3747 2.3559 2.3393 2.3246 2.3114 2.2996 2.2890 2.2793 2.2705 2.2624 2.2550 2.2481 2.2418 2.2359 2.2305 2.2254 2.2206 2.2162 2.2120 2.2080 2.2043 2.2008 2.1975 2.1944 2.1914 2.1886 2.1859 2.1833 2.1809 2.1786 2.1763 2.1742 2.1722 2.1702 2.1684 0.900 49.500 9.0000 5.4624 4.3246 3.7797 3.4633 3.2574 3.1131 3.0064 2.9245 2.8595 2.8068 2.7632 2.7265 2.6952 2.6682 2.6446 2.6239 2.6056 2.5893 2.5746 2.5613 2.5493 2.5383 2.5283 2.5191 2.5106 2.5028 2.4955 2.4887 2.4824 2.4765 2.4710 2.4658 2.4609 2.4563 2.4520 2.4479 2.4440 2.4404 2.4369 2.4336 2.4304 2.4274 2.4245 2.4218 2.4192 2.4167 2.4143 2.4120 0.925 88.388 12.333 6.9343 5.3030 4.5456 4.1138 3.8363 3.6435 3.5020 3.3938 3.3084 3.2393 3.1824 3.1345 3.0938 3.0588 3.0283 3.0015 2.9778 2.9567 2.9377 2.9207 2.9052 2.8911 2.8782 2.8664 2.8555 2.8454 2.8360 2.8274 2.8193 2.8117 2.8047 2.7980 2.7918 2.7859 2.7804 2.7751 2.7702 2.7655 2.7610 2.7568 2.7528 2.7489 2.7453 2.7418 2.7384 2.7352 2.7322 2.7292 0.950 199.49 19.000 9.5521 6.9443 5.7861 5.1432 4.7374 4.4590 4.2565 4.1028 3.9823 3.8853 3.8056 3.7389 3.6823 3.6337 3.5915 3.5546 3.5219 3.4928 3.4668 3.4434 3.4221 3.4028 3.3852 3.3690 3.3541 3.3404 3.3277 3.3158 3.3048 3.2945 3.2849 3.2759 3.2674 3.2594 3.2519 3.2448 3.2381 3.2317 3.2257 3.2199 3.2145 3.2093 3.2043 3.1996 3.1951 3.1907 3.1866 3.1826 0.975 799.48 39.000 16.044 10.649 8.4336 7.2599 6.5415 6.0595 5.7147 5.4564 5.2559 5.0959 4.9653 4.8567 4.7650 4.6867 4.6189 4.5597 4.5075 4.4612 4.4199 4.3828 4.3492 4.3187 4.2909 4.2655 4.2421 4.2205 4.2006 4.1821 4.1648 4.1488 4.1338 4.1197 4.1065 4.0941 4.0824 4.0713 4.0609 4.0510 4.0416 4.0327 4.0242 4.0162 4.0085 4.0012 3.9942 3.9875 3.9811 3.9749 0.990 4999.3 99.000 30.816 17.999 13.274 10.924 9.5465 8.6491 8.0215 7.5595 7.2057 6.9266 6.7009 6.5149 6.3588 6.2263 6.1121 6.0129 5.9259 5.8490 5.7804 5.7190 5.6637 5.6136 5.5680 5.5263 5.4881 5.4529 5.4205 5.3903 5.3624 5.3363 5.3120 5.2893 5.2679 5.2479 5.2290 5.2112 5.1944 5.1785 5.1634 5.1491 5.1356 5.1226 5.1103 5.0986 5.0874 5.0767 5.0665 5.0566

280

Tabla de Cuantiles de la Distribucin F


Grados de libertad del numerador en extremo superior izquierdo, grados de libertad del denominador en margen izquierdo de cada fila. En el margen superior se lee P(F x) para los valores de x en el cuerpo de la tabla.
3 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 0.001 0.0060 0.0067 0.0071 0.0073 0.0074 0.0075 0.0076 0.0077 0.0077 0.0077 0.0078 0.0078 0.0078 0.0078 0.0079 0.0079 0.0079 0.0079 0.0079 0.0079 0.0079 0.0079 0.0079 0.0079 0.0079 0.0080 0.0080 0.0080 0.0080 0.0080 0.0080 0.0080 0.0080 0.0080 0.0080 0.0080 0.0080 0.0080 0.0080 0.0080 0.0080 0.0080 0.0080 0.0080 0.0080 0.0080 0.0080 0.0080 0.0080 0.0080 0.025 0.0573 0.0623 0.0648 0.0662 0.0672 0.0679 0.0684 0.0688 0.0691 0.0694 0.0696 0.0698 0.0699 0.0700 0.0702 0.0703 0.0704 0.0704 0.0705 0.0706 0.0706 0.0707 0.0708 0.0708 0.0708 0.0709 0.0709 0.0710 0.0710 0.0710 0.0710 0.0711 0.0711 0.0711 0.0711 0.0712 0.0712 0.0712 0.0712 0.0712 0.0713 0.0713 0.0713 0.0713 0.0713 0.0713 0.0713 0.0714 0.0714 0.0714 0.050 0.0987 0.1047 0.1078 0.1097 0.1109 0.1118 0.1125 0.1131 0.1135 0.1138 0.1141 0.1144 0.1146 0.1147 0.1149 0.1150 0.1152 0.1153 0.1154 0.1155 0.1156 0.1156 0.1157 0.1158 0.1158 0.1159 0.1159 0.1160 0.1160 0.1161 0.1161 0.1161 0.1162 0.1162 0.1162 0.1163 0.1163 0.1163 0.1163 0.1164 0.1164 0.1164 0.1164 0.1164 0.1165 0.1165 0.1165 0.1165 0.1165 0.1165 0.075 0.1391 0.1442 0.1473 0.1492 0.1505 0.1515 0.1522 0.1528 0.1532 0.1536 0.1539 0.1542 0.1544 0.1546 0.1547 0.1549 0.1550 0.1552 0.1553 0.1554 0.1554 0.1555 0.1556 0.1557 0.1557 0.1558 0.1559 0.1559 0.1559 0.1560 0.1560 0.1561 0.1561 0.1561 0.1562 0.1562 0.1562 0.1563 0.1563 0.1563 0.1563 0.1564 0.1564 0.1564 0.1564 0.1564 0.1565 0.1565 0.1565 0.1565 0.100 0.1806 0.1831 0.1855 0.1872 0.1884 0.1892 0.1899 0.1904 0.1908 0.1912 0.1915 0.1917 0.1919 0.1921 0.1923 0.1924 0.1926 0.1927 0.1928 0.1929 0.1930 0.1930 0.1931 0.1932 0.1932 0.1933 0.1934 0.1934 0.1935 0.1935 0.1935 0.1936 0.1936 0.1936 0.1937 0.1937 0.1937 0.1938 0.1938 0.1938 0.1938 0.1939 0.1939 0.1939 0.1939 0.1939 0.1940 0.1940 0.1940 0.1940 0.125 0.2240 0.2222 0.2235 0.2246 0.2255 0.2261 0.2267 0.2271 0.2274 0.2277 0.2280 0.2282 0.2283 0.2285 0.2286 0.2288 0.2289 0.2290 0.2291 0.2291 0.2292 0.2293 0.2293 0.2294 0.2294 0.2295 0.2295 0.2296 0.2296 0.2297 0.2297 0.2297 0.2298 0.2298 0.2298 0.2298 0.2299 0.2299 0.2299 0.2299 0.2299 0.2300 0.2300 0.2300 0.2300 0.2300 0.2301 0.2301 0.2301 0.2301 0.150 0.2701 0.2622 0.2617 0.2620 0.2624 0.2628 0.2631 0.2633 0.2635 0.2637 0.2639 0.2640 0.2642 0.2643 0.2644 0.2644 0.2645 0.2646 0.2646 0.2647 0.2648 0.2648 0.2649 0.2649 0.2649 0.2650 0.2650 0.2650 0.2651 0.2651 0.2651 0.2651 0.2652 0.2652 0.2652 0.2652 0.2652 0.2653 0.2653 0.2653 0.2653 0.2653 0.2653 0.2653 0.2654 0.2654 0.2654 0.2654 0.2654 0.2654 0.850 23.5718 5.8258 3.8209 3.1236 2.7764 2.5699 2.4334 2.3366 2.2644 2.2086 2.1640 2.1278 2.0976 2.0722 2.0504 2.0316 2.0152 2.0007 1.9878 1.9764 1.9660 1.9567 1.9482 1.9405 1.9334 1.9269 1.9209 1.9154 1.9102 1.9054 1.9010 1.8968 1.8929 1.8892 1.8857 1.8825 1.8794 1.8765 1.8737 1.8711 1.8686 1.8662 1.8640 1.8619 1.8598 1.8579 1.8560 1.8542 1.8525 1.8508 0.875 34.1395 7.1605 4.4750 3.5773 3.1392 2.8817 2.7129 2.5939 2.5056 2.4374 2.3833 2.3393 2.3028 2.2720 2.2457 2.2230 2.2032 2.1858 2.1704 2.1566 2.1442 2.1330 2.1228 2.1136 2.1051 2.0973 2.0901 2.0835 2.0773 2.0716 2.0662 2.0612 2.0565 2.0521 2.0480 2.0441 2.0404 2.0370 2.0337 2.0306 2.0276 2.0248 2.0221 2.0195 2.0171 2.0148 2.0125 2.0104 2.0084 2.0064 0.900 53.5933 9.1618 5.3908 4.1909 3.6195 3.2888 3.0741 2.9238 2.8129 2.7277 2.6602 2.6055 2.5603 2.5222 2.4898 2.4618 2.4374 2.4160 2.3970 2.3801 2.3649 2.3512 2.3387 2.3274 2.3170 2.3075 2.2987 2.2906 2.2831 2.2761 2.2695 2.2635 2.2577 2.2524 2.2474 2.2426 2.2381 2.2339 2.2299 2.2261 2.2225 2.2191 2.2158 2.2127 2.2097 2.2069 2.2042 2.2016 2.1991 2.1967 0.925 95.6225 12.4963 6.7901 5.0883 4.3037 3.8584 3.5731 3.3752 3.2302 3.1195 3.0322 2.9617 2.9035 2.8547 2.8132 2.7775 2.7464 2.7192 2.6950 2.6736 2.6543 2.6369 2.6211 2.6068 2.5937 2.5817 2.5706 2.5604 2.5509 2.5421 2.5338 2.5262 2.5190 2.5123 2.5059 2.5000 2.4943 2.4890 2.4840 2.4792 2.4747 2.4704 2.4663 2.4624 2.4587 2.4551 2.4517 2.4485 2.4454 2.4424 0.950 215.707 19.1642 9.2766 6.5914 5.4094 4.7571 4.3468 4.0662 3.8625 3.7083 3.5874 3.4903 3.4105 3.3439 3.2874 3.2389 3.1968 3.1599 3.1274 3.0984 3.0725 3.0491 3.0280 3.0088 2.9912 2.9752 2.9603 2.9467 2.9340 2.9223 2.9113 2.9011 2.8916 2.8826 2.8742 2.8663 2.8588 2.8517 2.8451 2.8387 2.8327 2.8271 2.8216 2.8165 2.8115 2.8068 2.8024 2.7981 2.7940 2.7900 0.975 864.151 39.1656 15.4391 9.9792 7.7636 6.5988 5.8898 5.4160 5.0781 4.8256 4.6300 4.4742 4.3472 4.2417 4.1528 4.0768 4.0112 3.9539 3.9034 3.8587 3.8188 3.7829 3.7505 3.7211 3.6943 3.6697 3.6472 3.6264 3.6072 3.5893 3.5728 3.5573 3.5429 3.5293 3.5166 3.5047 3.4934 3.4828 3.4728 3.4633 3.4542 3.4457 3.4375 3.4298 3.4224 3.4154 3.4087 3.4022 3.3961 3.3902 0.990 5403.53 99.1640 29.4567 16.6942 12.0599 9.7796 8.4513 7.5910 6.9920 6.5523 6.2167 5.9525 5.7394 5.5639 5.4170 5.2922 5.1850 5.0919 5.0103 4.9382 4.8740 4.8166 4.7648 4.7181 4.6755 4.6365 4.6009 4.5681 4.5378 4.5097 4.4837 4.4594 4.4368 4.4156 4.3958 4.3771 4.3595 4.3430 4.3274 4.3126 4.2986 4.2853 4.2726 4.2606 4.2492 4.2383 4.2279 4.2180 4.2085 4.1994

281

Tabla de Cuantiles de la Distribucin F


Grados de libertad del numerador en extremo superior izquierdo, grados de libertad del denominador en margen izquierdo de cada fila. En el margen superior se lee P(F x) para los valores de x en el cuerpo de la tabla.
4 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 0.001 0.0135 0.0163 0.0178 0.0187 0.0193 0.0198 0.0201 0.0204 0.0206 0.0208 0.0210 0.0211 0.0212 0.0213 0.0214 0.0215 0.0215 0.0216 0.0216 0.0217 0.0217 0.0218 0.0218 0.0218 0.0219 0.0219 0.0219 0.0220 0.0220 0.0220 0.0220 0.0221 0.0221 0.0221 0.0221 0.0221 0.0221 0.0222 0.0222 0.0222 0.0222 0.0222 0.0222 0.0222 0.0222 0.0222 0.0223 0.0223 0.0223 0.0223 0.025 0.0818 0.0939 0.1002 0.1041 0.1068 0.1087 0.1102 0.1114 0.1123 0.1131 0.1137 0.1143 0.1147 0.1152 0.1155 0.1158 0.1161 0.1164 0.1166 0.1168 0.1170 0.1172 0.1173 0.1175 0.1176 0.1178 0.1179 0.1180 0.1181 0.1182 0.1183 0.1184 0.1184 0.1185 0.1186 0.1187 0.1187 0.1188 0.1188 0.1189 0.1189 0.1190 0.1190 0.1191 0.1191 0.1192 0.1192 0.1192 0.1193 0.1193 0.050 0.1297 0.1440 0.1517 0.1565 0.1598 0.1623 0.1641 0.1655 0.1667 0.1677 0.1685 0.1692 0.1697 0.1703 0.1707 0.1711 0.1715 0.1718 0.1721 0.1723 0.1726 0.1728 0.1730 0.1732 0.1733 0.1735 0.1737 0.1738 0.1739 0.1740 0.1742 0.1743 0.1744 0.1744 0.1745 0.1746 0.1747 0.1748 0.1748 0.1749 0.1750 0.1750 0.1751 0.1752 0.1752 0.1753 0.1753 0.1754 0.1754 0.1755 0.075 0.1748 0.1886 0.1965 0.2016 0.2051 0.2077 0.2096 0.2112 0.2124 0.2134 0.2143 0.2151 0.2157 0.2162 0.2167 0.2172 0.2175 0.2179 0.2182 0.2185 0.2187 0.2190 0.2192 0.2194 0.2196 0.2197 0.2199 0.2200 0.2202 0.2203 0.2204 0.2205 0.2206 0.2207 0.2208 0.2209 0.2210 0.2211 0.2212 0.2213 0.2213 0.2214 0.2215 0.2215 0.2216 0.2216 0.2217 0.2217 0.2218 0.2218 0.100 0.2200 0.2312 0.2386 0.2435 0.2469 0.2494 0.2513 0.2528 0.2541 0.2551 0.2560 0.2567 0.2573 0.2579 0.2584 0.2588 0.2592 0.2595 0.2598 0.2601 0.2604 0.2606 0.2608 0.2610 0.2612 0.2614 0.2615 0.2617 0.2618 0.2620 0.2621 0.2622 0.2623 0.2624 0.2625 0.2626 0.2627 0.2628 0.2628 0.2629 0.2630 0.2630 0.2631 0.2632 0.2632 0.2633 0.2633 0.2634 0.2634 0.2635 0.125 0.2669 0.2735 0.2795 0.2838 0.2869 0.2892 0.2909 0.2924 0.2935 0.2945 0.2953 0.2960 0.2966 0.2971 0.2975 0.2979 0.2983 0.2986 0.2989 0.2992 0.2994 0.2997 0.2999 0.3000 0.3002 0.3004 0.3005 0.3007 0.3008 0.3009 0.3010 0.3012 0.3013 0.3013 0.3014 0.3015 0.3016 0.3017 0.3018 0.3018 0.3019 0.3020 0.3020 0.3021 0.3021 0.3022 0.3022 0.3023 0.3023 0.3024 0.150 0.850 0.3163 24.5825 0.3161 5.9065 0.3201 3.8166 0.3235 3.0916 0.3260 2.7309 0.3279 2.5164 0.3294 2.3746 0.3306 2.2740 0.3316 2.1989 0.3325 2.1408 0.3332 2.0945 0.3338 2.0568 0.3343 2.0254 0.3348 1.9989 0.3352 1.9763 0.3355 1.9567 0.3359 1.9396 0.3362 1.9245 0.3364 1.9111 0.3367 1.8991 0.3369 1.8884 0.3371 1.8787 0.3373 1.8698 0.3374 1.8618 0.3376 1.8544 0.3377 1.8476 0.3379 1.8414 0.3380 1.8356 0.3381 1.8302 0.3382 1.8252 0.3383 1.8205 0.3384 1.8162 0.3385 1.8121 0.3386 1.8082 0.3387 1.8046 0.3388 1.8012 0.3388 1.7980 0.3389 1.7950 0.3390 1.7921 0.3390 1.7894 0.3391 1.7868 0.3391 1.7843 0.3392 1.7820 0.3393 1.7797 0.3393 1.7776 0.3394 1.7756 0.3394 1.7736 0.3394 1.7717 0.3395 1.7699 0.3395 1.7682 0.875 35.5826 7.2417 4.4526 3.5236 3.0708 2.8048 2.6305 2.5076 2.4163 2.3459 2.2900 2.2445 2.2068 2.1750 2.1478 2.1244 2.1039 2.0859 2.0699 2.0556 2.0428 2.0312 2.0207 2.0111 2.0023 1.9943 1.9868 1.9800 1.9736 1.9677 1.9621 1.9569 1.9521 1.9475 1.9433 1.9392 1.9354 1.9318 1.9284 1.9252 1.9221 1.9192 1.9164 1.9138 1.9112 1.9088 1.9065 1.9043 1.9022 1.9002 0.900 0.925 55.8330 99.5824 9.2434 12.5784 5.3427 6.7021 4.1072 4.9604 3.5202 4.1598 3.1808 3.7061 2.9605 3.4157 2.8064 3.2145 2.6927 3.0671 2.6053 2.9546 2.5362 2.8659 2.4801 2.7943 2.4337 2.7352 2.3947 2.6857 2.3614 2.6436 2.3327 2.6073 2.3077 2.5757 2.2858 2.5480 2.2663 2.5236 2.2489 2.5017 2.2333 2.4822 2.2193 2.4645 2.2065 2.4485 2.1949 2.4340 2.1842 2.4207 2.1745 2.4085 2.1655 2.3972 2.1571 2.3868 2.1494 2.3772 2.1422 2.3682 2.1355 2.3599 2.1293 2.3521 2.1234 2.3448 2.1179 2.3380 2.1128 2.3316 2.1079 2.3255 2.1033 2.3198 2.0990 2.3144 2.0948 2.3093 2.0909 2.3044 2.0872 2.2998 2.0837 2.2955 2.0804 2.2913 2.0772 2.2874 2.0742 2.2836 2.0712 2.2800 2.0685 2.2766 2.0658 2.2733 2.0633 2.2701 2.0608 2.2671 0.950 0.975 0.990 224.583 899.599 5624.26 19.2467 39.2483 99.2513 9.1172 15.1010 28.7100 6.3882 9.6045 15.9771 5.1922 7.3879 11.3919 4.5337 6.2271 9.1484 4.1203 5.5226 7.8467 3.8379 5.0526 7.0061 3.6331 4.7181 6.4221 3.4780 4.4683 5.9944 3.3567 4.2751 5.6683 3.2592 4.1212 5.4119 3.1791 3.9959 5.2053 3.1122 3.8919 5.0354 3.0556 3.8043 4.8932 3.0069 3.7294 4.7726 2.9647 3.6648 4.6689 2.9277 3.6083 4.5790 2.8951 3.5587 4.5002 2.8661 3.5147 4.4307 2.8401 3.4754 4.3688 2.8167 3.4401 4.3134 2.7955 3.4083 4.2635 2.7763 3.3794 4.2185 2.7587 3.3530 4.1774 2.7426 3.3289 4.1400 2.7278 3.3067 4.1056 2.7141 3.2863 4.0740 2.7014 3.2674 4.0449 2.6896 3.2499 4.0179 2.6787 3.2336 3.9928 2.6684 3.2185 3.9695 2.6589 3.2043 3.9477 2.6499 3.1910 3.9273 2.6415 3.1785 3.9082 2.6335 3.1668 3.8903 2.6261 3.1557 3.8734 2.6190 3.1453 3.8575 2.6123 3.1354 3.8425 2.6060 3.1261 3.8283 2.6000 3.1173 3.8148 2.5943 3.1089 3.8021 2.5888 3.1009 3.7899 2.5837 3.0933 3.7784 2.5787 3.0860 3.7674 2.5740 3.0791 3.7570 2.5695 3.0725 3.7469 2.5652 3.0662 3.7374 2.5611 3.0602 3.7283 2.5572 3.0544 3.7195

282

Tabla de Cuantiles de la Distribucin F


Grados de libertad del numerador en extremo superior izquierdo, grados de libertad del denominador en margen izquierdo de cada fila. En el margen superior se lee P(F x) para los valores de x en el cuerpo de la tabla.
5 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 0.001 0.0212 0.0269 0.0301 0.0322 0.0336 0.0347 0.0355 0.0362 0.0367 0.0372 0.0375 0.0379 0.0381 0.0384 0.0386 0.0388 0.0390 0.0391 0.0393 0.0394 0.0395 0.0396 0.0397 0.0398 0.0399 0.0399 0.0400 0.0401 0.0402 0.0402 0.0403 0.0403 0.0404 0.0404 0.0405 0.0405 0.0405 0.0406 0.0406 0.0406 0.0407 0.0407 0.0407 0.0408 0.0408 0.0408 0.0408 0.0409 0.0409 0.0409 0.025 0.0999 0.1186 0.1288 0.1354 0.1399 0.1433 0.1459 0.1480 0.1497 0.1511 0.1523 0.1533 0.1541 0.1549 0.1556 0.1562 0.1567 0.1572 0.1576 0.1580 0.1584 0.1587 0.1590 0.1593 0.1595 0.1598 0.1600 0.1602 0.1604 0.1606 0.1608 0.1609 0.1611 0.1612 0.1614 0.1615 0.1616 0.1617 0.1618 0.1619 0.1620 0.1621 0.1622 0.1623 0.1624 0.1625 0.1626 0.1626 0.1627 0.1628 0.050 0.1513 0.1728 0.1849 0.1926 0.1980 0.2020 0.2051 0.2075 0.2095 0.2112 0.2126 0.2138 0.2148 0.2157 0.2165 0.2172 0.2178 0.2184 0.2189 0.2194 0.2198 0.2202 0.2206 0.2209 0.2212 0.2215 0.2217 0.2220 0.2222 0.2224 0.2226 0.2228 0.2230 0.2232 0.2233 0.2235 0.2236 0.2238 0.2239 0.2240 0.2241 0.2243 0.2244 0.2245 0.2246 0.2247 0.2248 0.2248 0.2249 0.2250 0.075 0.1989 0.2200 0.2324 0.2404 0.2461 0.2502 0.2535 0.2560 0.2581 0.2599 0.2614 0.2626 0.2637 0.2646 0.2655 0.2662 0.2669 0.2675 0.2680 0.2685 0.2690 0.2694 0.2697 0.2701 0.2704 0.2707 0.2710 0.2713 0.2715 0.2717 0.2719 0.2721 0.2723 0.2725 0.2727 0.2728 0.2730 0.2731 0.2733 0.2734 0.2735 0.2736 0.2738 0.2739 0.2740 0.2741 0.2742 0.2743 0.2743 0.2744 0.100 0.2463 0.2646 0.2763 0.2841 0.2896 0.2937 0.2969 0.2995 0.3015 0.3033 0.3047 0.3060 0.3071 0.3080 0.3088 0.3096 0.3102 0.3108 0.3114 0.3119 0.3123 0.3127 0.3131 0.3134 0.3137 0.3140 0.3143 0.3146 0.3148 0.3151 0.3153 0.3155 0.3157 0.3158 0.3160 0.3162 0.3163 0.3165 0.3166 0.3167 0.3168 0.3170 0.3171 0.3172 0.3173 0.3174 0.3175 0.3176 0.3177 0.3178 0.125 0.2951 0.3083 0.3186 0.3257 0.3308 0.3346 0.3376 0.3400 0.3420 0.3436 0.3450 0.3462 0.3472 0.3481 0.3489 0.3496 0.3503 0.3508 0.3514 0.3518 0.3523 0.3526 0.3530 0.3533 0.3536 0.3539 0.3542 0.3544 0.3547 0.3549 0.3551 0.3553 0.3555 0.3556 0.3558 0.3560 0.3561 0.3562 0.3564 0.3565 0.3566 0.3567 0.3568 0.3569 0.3570 0.3571 0.3572 0.3573 0.3574 0.3575 0.150 0.850 0.875 0.900 0.3463 25.2171 36.4894 57.2400 0.3522 5.9553 7.2907 9.2926 0.3602 3.8109 4.4354 5.3091 0.3662 3.0678 3.4859 4.0506 0.3706 2.6980 3.0232 3.4530 0.3741 2.4780 2.7514 3.1075 0.3768 2.3324 2.5732 2.8833 0.3789 2.2291 2.4474 2.7264 0.3807 2.1520 2.3540 2.6106 0.3822 2.0922 2.2820 2.5216 0.3834 2.0446 2.2247 2.4512 0.3845 2.0058 2.1781 2.3940 0.3855 1.9735 2.1394 2.3467 0.3863 1.9462 2.1068 2.3069 0.3870 1.9228 2.0790 2.2730 0.3877 1.9027 2.0549 2.2438 0.3883 1.8850 2.0339 2.2183 0.3888 1.8695 2.0154 2.1958 0.3893 1.8556 1.9990 2.1760 0.3897 1.8433 1.9844 2.1582 0.3901 1.8322 1.9712 2.1423 0.3904 1.8222 1.9593 2.1279 0.3908 1.8131 1.9485 2.1149 0.3911 1.8047 1.9387 2.1030 0.3914 1.7971 1.9296 2.0922 0.3916 1.7901 1.9214 2.0822 0.3919 1.7836 1.9137 2.0730 0.3921 1.7777 1.9067 2.0645 0.3923 1.7721 1.9001 2.0566 0.3925 1.7669 1.8940 2.0492 0.3927 1.7621 1.8883 2.0424 0.3929 1.7576 1.8830 2.0360 0.3930 1.7534 1.8780 2.0300 0.3932 1.7494 1.8733 2.0244 0.3934 1.7457 1.8689 2.0191 0.3935 1.7422 1.8648 2.0141 0.3936 1.7388 1.8608 2.0095 0.3938 1.7357 1.8571 2.0050 0.3939 1.7327 1.8536 2.0008 0.3940 1.7299 1.8503 1.9968 0.3941 1.7272 1.8472 1.9930 0.3942 1.7247 1.8442 1.9894 0.3943 1.7222 1.8413 1.9860 0.3944 1.7199 1.8386 1.9828 0.3945 1.7177 1.8360 1.9796 0.3946 1.7156 1.8335 1.9767 0.3947 1.7136 1.8311 1.9738 0.3948 1.7116 1.8288 1.9711 0.3948 1.7098 1.8267 1.9685 0.3949 1.7080 1.8246 1.9660 0.925 0.950 0.975 0.990 102.071 230.160 921.835 5763.96 12.6279 19.2963 39.2984 99.3023 6.6435 9.0134 14.8848 28.2371 4.8756 6.2561 9.3645 15.5219 4.0642 5.0503 7.1464 10.9671 3.6047 4.3874 5.9875 8.7459 3.3107 3.9715 5.2852 7.4604 3.1070 3.6875 4.8173 6.6318 2.9578 3.4817 4.4844 6.0569 2.8438 3.3258 4.2361 5.6364 2.7540 3.2039 4.0440 5.3160 2.6815 3.1059 3.8911 5.0644 2.6216 3.0254 3.7667 4.8616 2.5714 2.9582 3.6634 4.6950 2.5287 2.9013 3.5764 4.5556 2.4920 2.8524 3.5021 4.4374 2.4600 2.8100 3.4379 4.3360 2.4319 2.7729 3.3820 4.2479 2.4071 2.7401 3.3327 4.1708 2.3850 2.7109 3.2891 4.1027 2.3652 2.6848 3.2501 4.0421 2.3473 2.6613 3.2151 3.9880 2.3311 2.6400 3.1835 3.9392 2.3163 2.6207 3.1548 3.8951 2.3028 2.6030 3.1287 3.8550 2.2904 2.5868 3.1048 3.8183 2.2790 2.5719 3.0828 3.7847 2.2685 2.5581 3.0626 3.7539 2.2587 2.5454 3.0438 3.7254 2.2496 2.5336 3.0265 3.6990 2.2412 2.5225 3.0103 3.6745 2.2333 2.5123 2.9953 3.6517 2.2259 2.5026 2.9812 3.6305 2.2189 2.4936 2.9680 3.6106 2.2124 2.4851 2.9557 3.5919 2.2062 2.4772 2.9440 3.5744 2.2004 2.4696 2.9331 3.5579 2.1950 2.4625 2.9227 3.5424 2.1898 2.4558 2.9130 3.5277 2.1849 2.4495 2.9037 3.5138 2.1802 2.4434 2.8950 3.5007 2.1758 2.4377 2.8866 3.4883 2.1716 2.4322 2.8787 3.4764 2.1675 2.4270 2.8712 3.4651 2.1637 2.4221 2.8640 3.4544 2.1601 2.4174 2.8572 3.4442 2.1566 2.4128 2.8506 3.4345 2.1532 2.4085 2.8444 3.4251 2.1500 2.4044 2.8384 3.4162 2.1469 2.4004 2.8326 3.4077

283

Tabla de Cuantiles de la Distribucin F


Grados de libertad del numerador en extremo superior izquierdo, grados de libertad del denominador en margen izquierdo de cada fila. En el margen superior se lee P(F x) para los valores de x en el cuerpo de la tabla.
6 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 0.001 0.0282 0.0370 0.0422 0.0456 0.0481 0.0499 0.0514 0.0526 0.0535 0.0543 0.0550 0.0556 0.0561 0.0566 0.0570 0.0573 0.0576 0.0579 0.0582 0.0584 0.0586 0.0588 0.0590 0.0592 0.0593 0.0595 0.0596 0.0597 0.0599 0.0600 0.0601 0.0602 0.0603 0.0604 0.0605 0.0605 0.0606 0.0607 0.0608 0.0608 0.0609 0.0609 0.0610 0.0610 0.0611 0.0611 0.0612 0.0612 0.0613 0.0613 0.025 0.1135 0.1377 0.1515 0.1606 0.1670 0.1718 0.1756 0.1786 0.1810 0.1831 0.1849 0.1864 0.1877 0.1888 0.1898 0.1907 0.1915 0.1922 0.1929 0.1935 0.1940 0.1945 0.1950 0.1954 0.1958 0.1962 0.1965 0.1968 0.1971 0.1974 0.1977 0.1979 0.1982 0.1984 0.1986 0.1988 0.1990 0.1992 0.1993 0.1995 0.1997 0.1998 0.1999 0.2001 0.2002 0.2003 0.2005 0.2006 0.2007 0.2008 0.050 0.1670 0.1944 0.2102 0.2206 0.2279 0.2334 0.2377 0.2411 0.2440 0.2463 0.2483 0.2500 0.2515 0.2528 0.2539 0.2550 0.2559 0.2567 0.2574 0.2581 0.2587 0.2593 0.2598 0.2603 0.2608 0.2612 0.2616 0.2619 0.2623 0.2626 0.2629 0.2632 0.2634 0.2637 0.2639 0.2642 0.2644 0.2646 0.2648 0.2650 0.2651 0.2653 0.2655 0.2656 0.2658 0.2659 0.2660 0.2662 0.2663 0.2664 0.075 0.2161 0.2431 0.2592 0.2698 0.2774 0.2831 0.2875 0.2911 0.2940 0.2964 0.2985 0.3002 0.3018 0.3031 0.3043 0.3054 0.3063 0.3072 0.3079 0.3086 0.3093 0.3099 0.3104 0.3109 0.3114 0.3118 0.3122 0.3126 0.3129 0.3133 0.3136 0.3139 0.3141 0.3144 0.3147 0.3149 0.3151 0.3153 0.3155 0.3157 0.3159 0.3161 0.3162 0.3164 0.3165 0.3167 0.3168 0.3170 0.3171 0.3172 0.100 0.2648 0.2887 0.3041 0.3144 0.3218 0.3274 0.3317 0.3352 0.3381 0.3405 0.3425 0.3443 0.3458 0.3471 0.3483 0.3493 0.3503 0.3511 0.3519 0.3526 0.3532 0.3538 0.3543 0.3548 0.3553 0.3557 0.3561 0.3565 0.3568 0.3571 0.3575 0.3577 0.3580 0.3583 0.3585 0.3587 0.3590 0.3592 0.3594 0.3596 0.3597 0.3599 0.3601 0.3602 0.3604 0.3605 0.3607 0.3608 0.3609 0.3611 0.125 0.3148 0.3333 0.3470 0.3565 0.3634 0.3687 0.3728 0.3761 0.3788 0.3811 0.3831 0.3847 0.3862 0.3874 0.3886 0.3896 0.3905 0.3913 0.3920 0.3927 0.3933 0.3938 0.3943 0.3948 0.3953 0.3957 0.3960 0.3964 0.3967 0.3970 0.3973 0.3976 0.3979 0.3981 0.3984 0.3986 0.3988 0.3990 0.3992 0.3994 0.3995 0.3997 0.3999 0.4000 0.4002 0.4003 0.4004 0.4006 0.4007 0.4008 0.150 0.3672 0.3779 0.3891 0.3974 0.4036 0.4083 0.4120 0.4151 0.4175 0.4196 0.4214 0.4230 0.4243 0.4255 0.4265 0.4274 0.4283 0.4290 0.4297 0.4303 0.4309 0.4314 0.4319 0.4323 0.4327 0.4331 0.4335 0.4338 0.4341 0.4344 0.4347 0.4349 0.4352 0.4354 0.4356 0.4358 0.4360 0.4362 0.4364 0.4365 0.4367 0.4369 0.4370 0.4372 0.4373 0.4374 0.4375 0.4377 0.4378 0.4379 0.850 25.6518 5.9880 3.8058 3.0497 2.6733 2.4493 2.3009 2.1955 2.1167 2.0557 2.0071 1.9673 1.9343 1.9064 1.8825 1.8618 1.8437 1.8278 1.8136 1.8010 1.7896 1.7793 1.7699 1.7614 1.7536 1.7464 1.7397 1.7336 1.7279 1.7226 1.7176 1.7130 1.7086 1.7046 1.7007 1.6971 1.6937 1.6904 1.6874 1.6845 1.6817 1.6791 1.6766 1.6742 1.6719 1.6698 1.6677 1.6657 1.6638 1.6620 0.875 37.1106 7.3235 4.4223 3.4582 2.9884 2.7122 2.5310 2.4031 2.3081 2.2347 2.1764 2.1289 2.0894 2.0562 2.0278 2.0032 1.9818 1.9629 1.9461 1.9311 1.9177 1.9055 1.8945 1.8844 1.8752 1.8667 1.8589 1.8517 1.8449 1.8387 1.8329 1.8274 1.8223 1.8175 1.8130 1.8088 1.8048 1.8010 1.7974 1.7940 1.7907 1.7877 1.7847 1.7819 1.7793 1.7767 1.7743 1.7720 1.7697 1.7676 0.900 58.2045 9.3255 5.2847 4.0097 3.4045 3.0546 2.8274 2.6683 2.5509 2.4606 2.3891 2.3310 2.2830 2.2426 2.2081 2.1783 2.1524 2.1296 2.1094 2.0913 2.0751 2.0605 2.0472 2.0351 2.0241 2.0139 2.0045 1.9959 1.9878 1.9803 1.9734 1.9668 1.9607 1.9550 1.9496 1.9445 1.9398 1.9352 1.9309 1.9269 1.9230 1.9194 1.9159 1.9125 1.9093 1.9063 1.9034 1.9006 1.8980 1.8954 0.925 103.777 12.6608 6.6017 4.8154 3.9961 3.5323 3.2354 3.0297 2.8790 2.7639 2.6731 2.5998 2.5393 2.4885 2.4453 2.4082 2.3758 2.3474 2.3223 2.2999 2.2798 2.2617 2.2452 2.2303 2.2166 2.2041 2.1925 2.1818 2.1719 2.1627 2.1541 2.1461 2.1386 2.1316 2.1250 2.1187 2.1129 2.1073 2.1020 2.0971 2.0923 2.0878 2.0836 2.0795 2.0756 2.0719 2.0683 2.0649 2.0617 2.0586 0.950 233.988 19.3295 8.9407 6.1631 4.9503 4.2839 3.8660 3.5806 3.3738 3.2172 3.0946 2.9961 2.9153 2.8477 2.7905 2.7413 2.6987 2.6613 2.6283 2.5990 2.5727 2.5491 2.5277 2.5082 2.4904 2.4741 2.4591 2.4453 2.4324 2.4205 2.4094 2.3991 2.3894 2.3803 2.3718 2.3637 2.3562 2.3490 2.3423 2.3359 2.3298 2.3240 2.3185 2.3133 2.3083 2.3035 2.2990 2.2946 2.2904 2.2864 0.975 937.114 39.3311 14.7347 9.1973 6.9777 5.8197 5.1186 4.6517 4.3197 4.0721 3.8806 3.7283 3.6043 3.5014 3.4147 3.3406 3.2767 3.2209 3.1718 3.1283 3.0895 3.0546 3.0232 2.9946 2.9685 2.9447 2.9228 2.9027 2.8840 2.8667 2.8506 2.8356 2.8216 2.8085 2.7961 2.7845 2.7736 2.7633 2.7536 2.7444 2.7356 2.7273 2.7195 2.7120 2.7048 2.6980 2.6915 2.6852 2.6793 2.6736 0.990 5858.95 99.3314 27.9106 15.2068 10.6722 8.4660 7.1914 6.3707 5.8018 5.3858 5.0692 4.8205 4.6203 4.4558 4.3183 4.2016 4.1015 4.0146 3.9386 3.8714 3.8117 3.7583 3.7102 3.6667 3.6272 3.5911 3.5580 3.5276 3.4995 3.4735 3.4493 3.4269 3.4059 3.3863 3.3679 3.3507 3.3344 3.3191 3.3047 3.2910 3.2781 3.2658 3.2541 3.2430 3.2325 3.2224 3.2128 3.2036 3.1948 3.1864

284

Tabla de Cuantiles de la Distribucin F


Grados de libertad del numerador en extremo superior izquierdo, grados de libertad del denominador en margen izquierdo de cada fila. En el margen superior se lee P(F x) para los valores de x en el cuerpo de la tabla.
7 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 0.001 0.0342 0.0461 0.0533 0.0582 0.0617 0.0644 0.0666 0.0683 0.0698 0.0710 0.0720 0.0730 0.0737 0.0744 0.0750 0.0756 0.0761 0.0766 0.0770 0.0773 0.0777 0.0780 0.0783 0.0785 0.0788 0.0790 0.0792 0.0794 0.0796 0.0798 0.0800 0.0801 0.0803 0.0804 0.0806 0.0807 0.0808 0.0809 0.0810 0.0811 0.0812 0.0813 0.0814 0.0815 0.0816 0.0817 0.0817 0.0818 0.0819 0.0820 0.025 0.1239 0.1529 0.1698 0.1811 0.1892 0.1954 0.2002 0.2041 0.2073 0.2100 0.2123 0.2143 0.2161 0.2176 0.2189 0.2201 0.2212 0.2222 0.2231 0.2239 0.2246 0.2253 0.2259 0.2265 0.2270 0.2275 0.2280 0.2284 0.2288 0.2292 0.2296 0.2299 0.2303 0.2306 0.2308 0.2311 0.2314 0.2316 0.2319 0.2321 0.2323 0.2325 0.2327 0.2329 0.2331 0.2332 0.2334 0.2335 0.2337 0.2338 0.050 0.1788 0.2111 0.2301 0.2427 0.2518 0.2587 0.2641 0.2684 0.2720 0.2750 0.2775 0.2797 0.2817 0.2833 0.2848 0.2862 0.2874 0.2884 0.2894 0.2903 0.2911 0.2919 0.2926 0.2932 0.2938 0.2944 0.2949 0.2954 0.2958 0.2962 0.2966 0.2970 0.2974 0.2977 0.2980 0.2983 0.2986 0.2989 0.2991 0.2994 0.2996 0.2998 0.3000 0.3002 0.3004 0.3006 0.3008 0.3010 0.3011 0.3013 0.075 0.2290 0.2607 0.2799 0.2928 0.3020 0.3091 0.3146 0.3190 0.3227 0.3258 0.3284 0.3306 0.3326 0.3343 0.3358 0.3372 0.3384 0.3395 0.3405 0.3414 0.3422 0.3430 0.3437 0.3444 0.3450 0.3455 0.3461 0.3466 0.3470 0.3474 0.3478 0.3482 0.3486 0.3489 0.3493 0.3496 0.3499 0.3501 0.3504 0.3506 0.3509 0.3511 0.3513 0.3515 0.3517 0.3519 0.3521 0.3523 0.3525 0.3526 0.100 0.2786 0.3070 0.3253 0.3378 0.3468 0.3537 0.3591 0.3634 0.3670 0.3700 0.3726 0.3748 0.3767 0.3784 0.3799 0.3812 0.3824 0.3835 0.3845 0.3854 0.3862 0.3870 0.3877 0.3883 0.3889 0.3894 0.3900 0.3904 0.3909 0.3913 0.3917 0.3921 0.3924 0.3928 0.3931 0.3934 0.3937 0.3940 0.3942 0.3945 0.3947 0.3949 0.3951 0.3953 0.3955 0.3957 0.3959 0.3961 0.3963 0.3964 0.125 0.3294 0.3521 0.3686 0.3802 0.3886 0.3951 0.4002 0.4043 0.4077 0.4106 0.4130 0.4151 0.4170 0.4186 0.4200 0.4213 0.4224 0.4235 0.4244 0.4253 0.4260 0.4268 0.4274 0.4280 0.4286 0.4291 0.4296 0.4301 0.4305 0.4309 0.4313 0.4317 0.4320 0.4323 0.4326 0.4329 0.4332 0.4334 0.4337 0.4339 0.4341 0.4344 0.4346 0.4348 0.4350 0.4351 0.4353 0.4355 0.4356 0.4358 0.150 0.3826 0.3971 0.4109 0.4211 0.4287 0.4346 0.4393 0.4431 0.4462 0.4489 0.4511 0.4531 0.4548 0.4563 0.4576 0.4588 0.4598 0.4608 0.4617 0.4625 0.4632 0.4639 0.4645 0.4650 0.4656 0.4661 0.4665 0.4670 0.4674 0.4677 0.4681 0.4684 0.4688 0.4690 0.4693 0.4696 0.4699 0.4701 0.4703 0.4706 0.4708 0.4710 0.4712 0.4713 0.4715 0.4717 0.4718 0.4720 0.4722 0.4723 0.850 25.9679 6.0114 3.8013 3.0357 2.6543 2.4270 2.2764 2.1694 2.0894 2.0273 1.9778 1.9374 1.9037 1.8752 1.8509 1.8298 1.8113 1.7951 1.7806 1.7677 1.7560 1.7455 1.7360 1.7272 1.7192 1.7119 1.7051 1.6988 1.6929 1.6875 1.6824 1.6777 1.6732 1.6691 1.6651 1.6614 1.6579 1.6546 1.6515 1.6485 1.6457 1.6430 1.6404 1.6380 1.6357 1.6334 1.6313 1.6293 1.6273 1.6254 0.875 37.5621 7.3469 4.4120 3.4371 2.9618 2.6823 2.4988 2.3692 2.2728 2.1983 2.1391 2.0908 2.0508 2.0170 1.9881 1.9631 1.9413 1.9220 1.9050 1.8897 1.8760 1.8636 1.8524 1.8421 1.8327 1.8240 1.8161 1.8087 1.8018 1.7955 1.7895 1.7840 1.7787 1.7739 1.7692 1.7649 1.7608 1.7569 1.7533 1.7498 1.7465 1.7433 1.7403 1.7375 1.7348 1.7322 1.7297 1.7273 1.7250 1.7228 0.900 58.9062 9.3491 5.2662 3.9790 3.3679 3.0145 2.7849 2.6241 2.5053 2.4140 2.3416 2.2828 2.2341 2.1931 2.1582 2.1280 2.1017 2.0785 2.0580 2.0397 2.0233 2.0084 1.9949 1.9826 1.9714 1.9610 1.9515 1.9427 1.9345 1.9269 1.9198 1.9132 1.9070 1.9012 1.8957 1.8905 1.8856 1.8810 1.8767 1.8725 1.8686 1.8649 1.8613 1.8579 1.8547 1.8516 1.8486 1.8458 1.8431 1.8405 0.925 105.019 12.6845 6.5705 4.7704 3.9451 3.4779 3.1788 2.9714 2.8194 2.7033 2.6118 2.5377 2.4766 2.4254 2.3818 2.3442 2.3115 2.2828 2.2574 2.2347 2.2144 2.1961 2.1795 2.1643 2.1505 2.1378 2.1261 2.1153 2.1052 2.0959 2.0872 2.0791 2.0715 2.0644 2.0577 2.0514 2.0454 2.0398 2.0344 2.0294 2.0246 2.0200 2.0157 2.0116 2.0076 2.0039 2.0003 1.9968 1.9935 1.9904 0.950 236.767 19.3531 8.8867 6.0942 4.8759 4.2067 3.7871 3.5005 3.2927 3.1355 3.0123 2.9134 2.8321 2.7642 2.7066 2.6572 2.6143 2.5767 2.5435 2.5140 2.4876 2.4638 2.4422 2.4226 2.4047 2.3883 2.3732 2.3593 2.3463 2.3343 2.3232 2.3127 2.3030 2.2938 2.2852 2.2771 2.2695 2.2623 2.2555 2.2490 2.2429 2.2371 2.2315 2.2263 2.2212 2.2164 2.2118 2.2074 2.2032 2.1992 0.975 948.203 39.3557 14.6244 9.0741 6.8530 5.6955 4.9949 4.5285 4.1970 3.9498 3.7586 3.6065 3.4827 3.3799 3.2934 3.2194 3.1556 3.0999 3.0509 3.0074 2.9686 2.9338 2.9023 2.8738 2.8478 2.8240 2.8021 2.7820 2.7633 2.7460 2.7299 2.7150 2.7009 2.6878 2.6755 2.6639 2.6530 2.6427 2.6330 2.6238 2.6150 2.6068 2.5989 2.5914 2.5842 2.5774 2.5709 2.5646 2.5587 2.5530 0.990 5928.33 99.3568 27.6714 14.9757 10.4556 8.2600 6.9929 6.1776 5.6128 5.2001 4.8860 4.6395 4.4410 4.2779 4.1416 4.0259 3.9267 3.8406 3.7653 3.6987 3.6396 3.5866 3.5390 3.4959 3.4568 3.4210 3.3882 3.3581 3.3303 3.3045 3.2806 3.2583 3.2376 3.2182 3.1999 3.1829 3.1668 3.1516 3.1373 3.1238 3.1109 3.0988 3.0872 3.0762 3.0658 3.0558 3.0463 3.0372 3.0285 3.0202

285

Tabla de Cuantiles de la Distribucin F


Grados de libertad del numerador en extremo superior izquierdo, grados de libertad del denominador en margen izquierdo de cada fila. En el margen superior se lee P(F x) para los valores de x en el cuerpo de la tabla.
8 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 0.001 0.0393 0.0541 0.0632 0.0695 0.0742 0.0778 0.0807 0.0830 0.0850 0.0867 0.0881 0.0893 0.0904 0.0914 0.0922 0.0930 0.0937 0.0943 0.0949 0.0954 0.0959 0.0963 0.0967 0.0971 0.0975 0.0978 0.0981 0.0984 0.0987 0.0989 0.0992 0.0994 0.0996 0.0998 0.1000 0.1002 0.1003 0.1005 0.1007 0.1008 0.1010 0.1011 0.1012 0.1014 0.1015 0.1016 0.1017 0.1018 0.1019 0.1020 0.025 0.1321 0.1650 0.1846 0.1979 0.2076 0.2150 0.2208 0.2256 0.2295 0.2328 0.2357 0.2381 0.2403 0.2421 0.2438 0.2453 0.2467 0.2479 0.2490 0.2500 0.2510 0.2518 0.2526 0.2533 0.2540 0.2547 0.2552 0.2558 0.2563 0.2568 0.2573 0.2577 0.2581 0.2585 0.2589 0.2592 0.2595 0.2598 0.2601 0.2604 0.2607 0.2610 0.2612 0.2615 0.2617 0.2619 0.2621 0.2623 0.2625 0.2627 0.050 0.1881 0.2243 0.2459 0.2606 0.2712 0.2793 0.2857 0.2909 0.2951 0.2988 0.3018 0.3045 0.3068 0.3089 0.3107 0.3123 0.3138 0.3151 0.3163 0.3174 0.3184 0.3194 0.3202 0.3210 0.3217 0.3224 0.3231 0.3237 0.3242 0.3247 0.3252 0.3257 0.3261 0.3266 0.3269 0.3273 0.3277 0.3280 0.3283 0.3286 0.3289 0.3292 0.3295 0.3297 0.3300 0.3302 0.3305 0.3307 0.3309 0.3311 0.075 0.2389 0.2745 0.2963 0.3111 0.3219 0.3301 0.3365 0.3418 0.3461 0.3498 0.3529 0.3556 0.3580 0.3600 0.3619 0.3635 0.3650 0.3663 0.3676 0.3687 0.3697 0.3706 0.3715 0.3723 0.3730 0.3737 0.3743 0.3749 0.3755 0.3760 0.3765 0.3770 0.3774 0.3779 0.3783 0.3786 0.3790 0.3793 0.3797 0.3800 0.3803 0.3806 0.3808 0.3811 0.3813 0.3816 0.3818 0.3820 0.3822 0.3824 0.100 0.2892 0.3212 0.3420 0.3563 0.3668 0.3748 0.3811 0.3862 0.3904 0.3940 0.3971 0.3997 0.4020 0.4040 0.4058 0.4074 0.4089 0.4102 0.4114 0.4124 0.4134 0.4143 0.4152 0.4160 0.4167 0.4174 0.4180 0.4186 0.4191 0.4196 0.4201 0.4206 0.4210 0.4214 0.4218 0.4222 0.4225 0.4229 0.4232 0.4235 0.4238 0.4240 0.4243 0.4246 0.4248 0.4250 0.4253 0.4255 0.4257 0.4259 0.125 0.3407 0.3667 0.3855 0.3988 0.4086 0.4161 0.4221 0.4269 0.4310 0.4344 0.4372 0.4398 0.4419 0.4439 0.4456 0.4471 0.4485 0.4497 0.4509 0.4519 0.4528 0.4537 0.4545 0.4553 0.4559 0.4566 0.4572 0.4577 0.4583 0.4588 0.4592 0.4597 0.4601 0.4605 0.4608 0.4612 0.4615 0.4618 0.4621 0.4624 0.4627 0.4630 0.4632 0.4635 0.4637 0.4639 0.4641 0.4643 0.4645 0.4647 0.150 0.3945 0.4120 0.4280 0.4398 0.4486 0.4555 0.4610 0.4654 0.4691 0.4723 0.4750 0.4773 0.4793 0.4811 0.4827 0.4841 0.4854 0.4866 0.4876 0.4886 0.4895 0.4903 0.4910 0.4917 0.4924 0.4930 0.4935 0.4940 0.4945 0.4950 0.4954 0.4958 0.4962 0.4966 0.4969 0.4973 0.4976 0.4979 0.4982 0.4984 0.4987 0.4989 0.4992 0.4994 0.4996 0.4998 0.5000 0.5002 0.5004 0.5006 0.850 26.2082 6.0290 3.7976 3.0245 2.6391 2.4093 2.2570 2.1486 2.0675 2.0046 1.9543 1.9133 1.8791 1.8502 1.8254 1.8040 1.7852 1.7686 1.7539 1.7408 1.7289 1.7182 1.7084 1.6995 1.6914 1.6839 1.6770 1.6705 1.6646 1.6590 1.6539 1.6490 1.6445 1.6402 1.6362 1.6324 1.6288 1.6254 1.6222 1.6192 1.6163 1.6136 1.6109 1.6084 1.6061 1.6038 1.6016 1.5995 1.5975 1.5956 0.875 37.9055 7.3646 4.4038 3.4205 2.9408 2.6587 2.4733 2.3423 2.2448 2.1694 2.1094 2.0605 2.0199 1.9857 1.9563 1.9310 1.9088 1.8893 1.8720 1.8565 1.8425 1.8299 1.8185 1.8081 1.7985 1.7897 1.7816 1.7741 1.7671 1.7606 1.7545 1.7489 1.7436 1.7386 1.7339 1.7295 1.7253 1.7213 1.7176 1.7141 1.7107 1.7075 1.7044 1.7015 1.6987 1.6961 1.6936 1.6911 1.6888 1.6866 0.900 59.4391 9.3668 5.2517 3.9549 3.3393 2.9830 2.7516 2.5893 2.4694 2.3771 2.3040 2.2446 2.1953 2.1539 2.1185 2.0880 2.0613 2.0379 2.0171 1.9985 1.9819 1.9668 1.9531 1.9407 1.9292 1.9188 1.9091 1.9001 1.8918 1.8841 1.8769 1.8702 1.8639 1.8580 1.8524 1.8471 1.8422 1.8375 1.8331 1.8289 1.8249 1.8211 1.8175 1.8140 1.8107 1.8076 1.8046 1.8017 1.7989 1.7963 0.925 105.961 12.7022 6.5463 4.7356 3.9055 3.4354 3.1345 2.9258 2.7728 2.6558 2.5635 2.4889 2.4273 2.3756 2.3316 2.2936 2.2606 2.2316 2.2060 2.1831 2.1625 2.1440 2.1272 2.1119 2.0979 2.0851 2.0732 2.0623 2.0522 2.0427 2.0339 2.0257 2.0180 2.0108 2.0040 1.9976 1.9916 1.9859 1.9805 1.9754 1.9705 1.9659 1.9615 1.9573 1.9533 1.9495 1.9459 1.9424 1.9390 1.9358 0.950 238.884 19.3709 8.8452 6.0410 4.8183 4.1468 3.7257 3.4381 3.2296 3.0717 2.9480 2.8486 2.7669 2.6987 2.6408 2.5911 2.5480 2.5102 2.4768 2.4471 2.4205 2.3965 2.3748 2.3551 2.3371 2.3205 2.3053 2.2913 2.2782 2.2662 2.2549 2.2444 2.2346 2.2253 2.2167 2.2085 2.2008 2.1936 2.1867 2.1802 2.1740 2.1681 2.1625 2.1572 2.1521 2.1473 2.1427 2.1382 2.1340 2.1299 0.975 956.643 39.3729 14.5399 8.9796 6.7572 5.5996 4.8993 4.4333 4.1020 3.8549 3.6638 3.5118 3.3880 3.2853 3.1987 3.1248 3.0610 3.0053 2.9563 2.9128 2.8740 2.8392 2.8077 2.7791 2.7531 2.7293 2.7074 2.6872 2.6686 2.6513 2.6352 2.6202 2.6061 2.5930 2.5807 2.5691 2.5581 2.5478 2.5381 2.5289 2.5201 2.5118 2.5039 2.4964 2.4892 2.4824 2.4759 2.4696 2.4637 2.4579 0.990 5980.95 99.3750 27.4895 14.7988 10.2893 8.1017 6.8401 6.0288 5.4671 5.0567 4.7445 4.4994 4.3021 4.1400 4.0044 3.8896 3.7909 3.7054 3.6305 3.5644 3.5056 3.4530 3.4057 3.3629 3.3239 3.2884 3.2558 3.2259 3.1982 3.1726 3.1489 3.1267 3.1061 3.0868 3.0687 3.0517 3.0357 3.0207 3.0064 2.9930 2.9802 2.9681 2.9567 2.9457 2.9353 2.9254 2.9160 2.9069 2.8983 2.8900

286

Tabla de Cuantiles de la Distribucin F


Grados de libertad del numerador en extremo superior izquierdo, grados de libertad del denominador en margen izquierdo de cada fila. En el margen superior se lee P(F x) para los valores de x en el cuerpo de la tabla.
9 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 0.001 0.0437 0.0610 0.0719 0.0796 0.0854 0.0899 0.0935 0.0964 0.0990 0.1011 0.1029 0.1045 0.1059 0.1071 0.1082 0.1092 0.1101 0.1110 0.1117 0.1124 0.1130 0.1136 0.1141 0.1146 0.1151 0.1155 0.1159 0.1163 0.1167 0.1170 0.1173 0.1176 0.1179 0.1181 0.1184 0.1186 0.1189 0.1191 0.1193 0.1195 0.1197 0.1199 0.1200 0.1202 0.1204 0.1205 0.1207 0.1208 0.1209 0.1211 0.025 0.1387 0.1750 0.1969 0.2120 0.2230 0.2315 0.2383 0.2438 0.2484 0.2523 0.2556 0.2585 0.2611 0.2633 0.2653 0.2671 0.2687 0.2702 0.2715 0.2727 0.2738 0.2749 0.2758 0.2767 0.2775 0.2783 0.2790 0.2797 0.2803 0.2809 0.2814 0.2819 0.2824 0.2829 0.2834 0.2838 0.2842 0.2846 0.2849 0.2853 0.2856 0.2859 0.2862 0.2865 0.2868 0.2871 0.2873 0.2876 0.2878 0.2880 0.050 0.1954 0.2349 0.2589 0.2752 0.2872 0.2964 0.3037 0.3096 0.3146 0.3187 0.3223 0.3254 0.3281 0.3305 0.3327 0.3346 0.3363 0.3378 0.3393 0.3405 0.3417 0.3428 0.3438 0.3448 0.3456 0.3464 0.3472 0.3479 0.3486 0.3492 0.3498 0.3503 0.3509 0.3514 0.3518 0.3523 0.3527 0.3531 0.3535 0.3539 0.3542 0.3546 0.3549 0.3552 0.3555 0.3558 0.3560 0.3563 0.3565 0.3568 0.075 0.2469 0.2856 0.3096 0.3260 0.3381 0.3473 0.3547 0.3607 0.3656 0.3698 0.3734 0.3765 0.3792 0.3816 0.3838 0.3857 0.3874 0.3890 0.3904 0.3917 0.3929 0.3939 0.3950 0.3959 0.3968 0.3976 0.3983 0.3990 0.3997 0.4003 0.4009 0.4015 0.4020 0.4025 0.4030 0.4034 0.4038 0.4042 0.4046 0.4050 0.4053 0.4057 0.4060 0.4063 0.4066 0.4069 0.4071 0.4074 0.4076 0.4079 0.100 0.2976 0.3326 0.3555 0.3714 0.3831 0.3920 0.3992 0.4050 0.4098 0.4139 0.4173 0.4204 0.4230 0.4253 0.4274 0.4293 0.4309 0.4325 0.4338 0.4351 0.4363 0.4373 0.4383 0.4392 0.4401 0.4408 0.4416 0.4423 0.4429 0.4435 0.4441 0.4446 0.4451 0.4456 0.4461 0.4465 0.4469 0.4473 0.4477 0.4480 0.4484 0.4487 0.4490 0.4493 0.4496 0.4499 0.4501 0.4504 0.4506 0.4509 0.125 0.3495 0.3783 0.3991 0.4139 0.4248 0.4333 0.4400 0.4455 0.4500 0.4539 0.4572 0.4601 0.4626 0.4648 0.4668 0.4686 0.4702 0.4716 0.4729 0.4741 0.4752 0.4762 0.4771 0.4780 0.4788 0.4796 0.4803 0.4809 0.4815 0.4821 0.4826 0.4832 0.4836 0.4841 0.4845 0.4849 0.4853 0.4857 0.4861 0.4864 0.4867 0.4870 0.4873 0.4876 0.4879 0.4882 0.4884 0.4886 0.4889 0.4891 0.150 0.4038 0.4238 0.4416 0.4548 0.4647 0.4724 0.4786 0.4837 0.4879 0.4915 0.4945 0.4972 0.4995 0.5016 0.5034 0.5051 0.5066 0.5079 0.5091 0.5102 0.5113 0.5122 0.5131 0.5139 0.5146 0.5153 0.5160 0.5166 0.5172 0.5177 0.5182 0.5187 0.5192 0.5196 0.5200 0.5204 0.5207 0.5211 0.5214 0.5217 0.5220 0.5223 0.5226 0.5229 0.5231 0.5234 0.5236 0.5238 0.5240 0.5242 0.850 26.3967 6.0427 3.7945 3.0153 2.6268 2.3949 2.2411 2.1316 2.0496 1.9860 1.9351 1.8935 1.8589 1.8296 1.8044 1.7827 1.7636 1.7468 1.7319 1.7185 1.7064 1.6956 1.6856 1.6766 1.6683 1.6607 1.6536 1.6471 1.6410 1.6354 1.6301 1.6252 1.6205 1.6162 1.6121 1.6083 1.6046 1.6012 1.5979 1.5948 1.5918 1.5890 1.5864 1.5838 1.5814 1.5791 1.5769 1.5747 1.5727 1.5707 0.875 38.1751 7.3783 4.3971 3.4070 2.9239 2.6396 2.4526 2.3204 2.2220 2.1459 2.0852 2.0358 1.9947 1.9600 1.9303 1.9046 1.8822 1.8624 1.8448 1.8291 1.8150 1.8022 1.7906 1.7800 1.7703 1.7614 1.7531 1.7455 1.7384 1.7318 1.7256 1.7199 1.7145 1.7094 1.7047 1.7002 1.6959 1.6919 1.6881 1.6845 1.6810 1.6778 1.6747 1.6717 1.6689 1.6662 1.6636 1.6611 1.6588 1.6565 0.900 59.8575 9.3805 5.2400 3.9357 3.3163 2.9577 2.7247 2.5612 2.4403 2.3473 2.2735 2.2135 2.1638 2.1220 2.0862 2.0553 2.0284 2.0047 1.9836 1.9649 1.9480 1.9327 1.9189 1.9063 1.8947 1.8841 1.8743 1.8652 1.8568 1.8490 1.8417 1.8348 1.8284 1.8224 1.8168 1.8115 1.8064 1.8017 1.7972 1.7929 1.7888 1.7850 1.7813 1.7778 1.7745 1.7713 1.7682 1.7653 1.7625 1.7598 0.925 106.701 12.7161 6.5269 4.7077 3.8738 3.4015 3.0989 2.8891 2.7351 2.6174 2.5245 2.4494 2.3873 2.3352 2.2908 2.2526 2.2193 2.1900 2.1641 2.1410 2.1203 2.1016 2.0846 2.0692 2.0550 2.0421 2.0301 2.0190 2.0088 1.9992 1.9903 1.9820 1.9743 1.9670 1.9601 1.9536 1.9475 1.9417 1.9363 1.9311 1.9262 1.9215 1.9171 1.9128 1.9088 1.9049 1.9012 1.8977 1.8943 1.8911 0.950 240.543 19.3847 8.8123 5.9988 4.7725 4.0990 3.6767 3.3881 3.1789 3.0204 2.8962 2.7964 2.7144 2.6458 2.5876 2.5377 2.4943 2.4563 2.4227 2.3928 2.3661 2.3419 2.3201 2.3002 2.2821 2.2655 2.2501 2.2360 2.2229 2.2107 2.1994 2.1888 2.1789 2.1696 2.1608 2.1526 2.1449 2.1375 2.1306 2.1240 2.1178 2.1119 2.1062 2.1009 2.0958 2.0909 2.0862 2.0817 2.0774 2.0733 0.975 963.279 39.3866 14.4730 8.9046 6.6810 5.5234 4.8232 4.3572 4.0260 3.7790 3.5879 3.4358 3.3120 3.2093 3.1227 3.0488 2.9849 2.9291 2.8801 2.8365 2.7977 2.7628 2.7313 2.7027 2.6766 2.6528 2.6309 2.6106 2.5919 2.5746 2.5585 2.5434 2.5294 2.5162 2.5039 2.4922 2.4813 2.4710 2.4612 2.4519 2.4432 2.4348 2.4269 2.4194 2.4122 2.4054 2.3988 2.3925 2.3866 2.3808 0.990 6022.40 99.3896 27.3449 14.6592 10.1577 7.9760 6.7188 5.9106 5.3511 4.9424 4.6315 4.3875 4.1911 4.0297 3.8948 3.7804 3.6823 3.5971 3.5225 3.4567 3.3982 3.3458 3.2986 3.2560 3.2172 3.1818 3.1494 3.1195 3.0920 3.0665 3.0429 3.0208 3.0003 2.9810 2.9630 2.9461 2.9302 2.9152 2.9010 2.8876 2.8749 2.8628 2.8514 2.8405 2.8301 2.8203 2.8108 2.8018 2.7932 2.7850

287

Tabla de Cuantiles de la Distribucin F


Grados de libertad del numerador en extremo superior izquierdo, grados de libertad del denominador en margen izquierdo de cada fila. En el margen superior se lee P(F x) para los valores de x en el cuerpo de la tabla.
10 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 0.001 0.0475 0.0671 0.0797 0.0886 0.0954 0.1008 0.1051 0.1086 0.1117 0.1142 0.1165 0.1184 0.1201 0.1217 0.1230 0.1242 0.1254 0.1264 0.1273 0.1281 0.1289 0.1296 0.1303 0.1309 0.1315 0.1320 0.1326 0.1330 0.1335 0.1339 0.1343 0.1347 0.1350 0.1353 0.1357 0.1360 0.1363 0.1365 0.1368 0.1370 0.1373 0.1375 0.1377 0.1379 0.1381 0.1383 0.1385 0.1387 0.1389 0.1390 0.025 0.1442 0.1833 0.2072 0.2238 0.2361 0.2456 0.2532 0.2594 0.2646 0.2690 0.2729 0.2762 0.2791 0.2817 0.2840 0.2860 0.2879 0.2896 0.2911 0.2925 0.2938 0.2950 0.2961 0.2971 0.2981 0.2990 0.2998 0.3006 0.3013 0.3020 0.3027 0.3033 0.3039 0.3044 0.3049 0.3054 0.3059 0.3063 0.3068 0.3072 0.3076 0.3079 0.3083 0.3086 0.3090 0.3093 0.3096 0.3099 0.3102 0.3104 0.050 0.2014 0.2437 0.2697 0.2875 0.3007 0.3108 0.3189 0.3256 0.3311 0.3358 0.3398 0.3433 0.3464 0.3491 0.3515 0.3537 0.3556 0.3574 0.3590 0.3605 0.3618 0.3631 0.3643 0.3653 0.3663 0.3673 0.3681 0.3689 0.3697 0.3704 0.3711 0.3718 0.3724 0.3729 0.3735 0.3740 0.3745 0.3749 0.3754 0.3758 0.3762 0.3766 0.3770 0.3773 0.3777 0.3780 0.3783 0.3786 0.3789 0.3792 0.075 0.2533 0.2947 0.3206 0.3385 0.3516 0.3618 0.3699 0.3765 0.3821 0.3867 0.3907 0.3942 0.3973 0.4000 0.4024 0.4046 0.4065 0.4083 0.4099 0.4114 0.4127 0.4139 0.4151 0.4162 0.4172 0.4181 0.4189 0.4198 0.4205 0.4212 0.4219 0.4225 0.4231 0.4237 0.4242 0.4248 0.4252 0.4257 0.4261 0.4266 0.4270 0.4274 0.4277 0.4281 0.4284 0.4287 0.4291 0.4294 0.4296 0.4299 0.100 0.3044 0.3419 0.3666 0.3838 0.3966 0.4064 0.4143 0.4207 0.4260 0.4306 0.4344 0.4378 0.4408 0.4434 0.4457 0.4478 0.4497 0.4514 0.4530 0.4544 0.4557 0.4569 0.4580 0.4590 0.4600 0.4609 0.4617 0.4625 0.4633 0.4639 0.4646 0.4652 0.4658 0.4663 0.4669 0.4674 0.4678 0.4683 0.4687 0.4691 0.4695 0.4699 0.4702 0.4706 0.4709 0.4712 0.4715 0.4718 0.4721 0.4724 0.125 0.3567 0.3878 0.4103 0.4263 0.4382 0.4475 0.4549 0.4610 0.4660 0.4703 0.4740 0.4772 0.4800 0.4825 0.4847 0.4867 0.4885 0.4901 0.4916 0.4929 0.4942 0.4953 0.4964 0.4973 0.4982 0.4991 0.4999 0.5006 0.5013 0.5020 0.5026 0.5032 0.5037 0.5043 0.5048 0.5052 0.5057 0.5061 0.5065 0.5069 0.5073 0.5076 0.5079 0.5083 0.5086 0.5089 0.5092 0.5094 0.5097 0.5100 0.150 0.4113 0.4334 0.4528 0.4671 0.4780 0.4864 0.4933 0.4989 0.5035 0.5075 0.5109 0.5139 0.5165 0.5188 0.5209 0.5227 0.5244 0.5259 0.5273 0.5285 0.5297 0.5308 0.5317 0.5327 0.5335 0.5343 0.5350 0.5357 0.5364 0.5370 0.5376 0.5381 0.5386 0.5391 0.5396 0.5400 0.5404 0.5408 0.5412 0.5416 0.5419 0.5422 0.5426 0.5429 0.5431 0.5434 0.5437 0.5440 0.5442 0.5444 0.850 26.5488 6.0537 3.7918 3.0077 2.6165 2.3830 2.2279 2.1174 2.0347 1.9704 1.9190 1.8770 1.8419 1.8123 1.7868 1.7648 1.7455 1.7285 1.7133 1.6997 1.6875 1.6765 1.6664 1.6572 1.6488 1.6411 1.6339 1.6273 1.6211 1.6154 1.6100 1.6050 1.6003 1.5959 1.5917 1.5878 1.5841 1.5806 1.5773 1.5741 1.5711 1.5683 1.5655 1.5629 1.5605 1.5581 1.5558 1.5537 1.5516 1.5496 0.875 38.3925 7.3893 4.3916 3.3959 2.9100 2.6238 2.4355 2.3023 2.2031 2.1263 2.0651 2.0152 1.9737 1.9386 1.9086 1.8826 1.8599 1.8399 1.8221 1.8062 1.7919 1.7789 1.7672 1.7564 1.7466 1.7375 1.7292 1.7214 1.7142 1.7076 1.7013 1.6955 1.6900 1.6848 1.6800 1.6754 1.6711 1.6670 1.6632 1.6595 1.6560 1.6527 1.6496 1.6466 1.6437 1.6409 1.6383 1.6358 1.6334 1.6311 0.900 60.1949 9.3916 5.2304 3.9199 3.2974 2.9369 2.7025 2.5380 2.4163 2.3226 2.2482 2.1878 2.1376 2.0954 2.0593 2.0281 2.0009 1.9770 1.9557 1.9367 1.9197 1.9043 1.8903 1.8775 1.8658 1.8550 1.8451 1.8359 1.8274 1.8195 1.8121 1.8052 1.7987 1.7926 1.7869 1.7815 1.7764 1.7716 1.7670 1.7627 1.7586 1.7547 1.7509 1.7474 1.7440 1.7408 1.7377 1.7347 1.7319 1.7291 0.925 107.298 12.7271 6.5112 4.6850 3.8478 3.3736 3.0697 2.8589 2.7041 2.5858 2.4923 2.4167 2.3542 2.3017 2.2570 2.2185 2.1850 2.1555 2.1293 2.1061 2.0851 2.0663 2.0492 2.0336 2.0193 2.0062 1.9941 1.9829 1.9726 1.9629 1.9539 1.9455 1.9377 1.9303 1.9234 1.9168 1.9107 1.9048 1.8993 1.8941 1.8891 1.8844 1.8799 1.8756 1.8715 1.8676 1.8638 1.8603 1.8568 1.8536 0.950 241.882 19.3959 8.7855 5.9644 4.7351 4.0600 3.6365 3.3472 3.1373 2.9782 2.8536 2.7534 2.6710 2.6022 2.5437 2.4935 2.4499 2.4117 2.3779 2.3479 2.3210 2.2967 2.2747 2.2547 2.2365 2.2197 2.2043 2.1900 2.1768 2.1646 2.1532 2.1425 2.1325 2.1231 2.1143 2.1061 2.0982 2.0909 2.0839 2.0773 2.0710 2.0650 2.0593 2.0539 2.0487 2.0438 2.0391 2.0346 2.0303 2.0261 0.975 968.634 39.3984 14.4189 8.8439 6.6192 5.4613 4.7611 4.2951 3.9639 3.7168 3.5257 3.3735 3.2497 3.1469 3.0602 2.9862 2.9222 2.8664 2.8172 2.7737 2.7348 2.6998 2.6682 2.6396 2.6135 2.5896 2.5676 2.5473 2.5286 2.5112 2.4950 2.4799 2.4659 2.4526 2.4402 2.4286 2.4176 2.4072 2.3974 2.3882 2.3794 2.3710 2.3631 2.3555 2.3483 2.3414 2.3348 2.3286 2.3226 2.3168 0.990 6055.93 99.3969 27.2285 14.5460 10.0511 7.8742 6.6201 5.8143 5.2565 4.8491 4.5393 4.2961 4.1003 3.9394 3.8049 3.6909 3.5931 3.5081 3.4338 3.3682 3.3098 3.2576 3.2106 3.1681 3.1294 3.0941 3.0618 3.0320 3.0045 2.9791 2.9555 2.9335 2.9130 2.8938 2.8758 2.8589 2.8431 2.8281 2.8139 2.8005 2.7879 2.7758 2.7644 2.7536 2.7432 2.7334 2.7240 2.7150 2.7064 2.6981

288

Tabla de Cuantiles de la Distribucin F


Grados de libertad del numerador en extremo superior izquierdo, grados de libertad del denominador en margen izquierdo de cada fila. En el margen superior se lee P(F x) para los valores de x en el cuerpo de la tabla.
12 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 0.001 0.0536 0.0771 0.0926 0.1038 0.1125 0.1193 0.1250 0.1297 0.1337 0.1371 0.1401 0.1428 0.1451 0.1472 0.1490 0.1507 0.1523 0.1537 0.1550 0.1561 0.1572 0.1582 0.1592 0.1600 0.1608 0.1616 0.1623 0.1630 0.1636 0.1642 0.1648 0.1653 0.1658 0.1663 0.1667 0.1672 0.1676 0.1680 0.1683 0.1687 0.1690 0.1694 0.1697 0.1700 0.1703 0.1705 0.1708 0.1711 0.1713 0.1716 0.025 0.1526 0.1962 0.2235 0.2426 0.2570 0.2682 0.2773 0.2848 0.2910 0.2964 0.3011 0.3051 0.3087 0.3119 0.3147 0.3173 0.3196 0.3217 0.3237 0.3254 0.3271 0.3286 0.3300 0.3313 0.3325 0.3336 0.3347 0.3357 0.3366 0.3375 0.3383 0.3391 0.3398 0.3405 0.3412 0.3418 0.3424 0.3430 0.3436 0.3441 0.3446 0.3451 0.3455 0.3460 0.3464 0.3468 0.3472 0.3476 0.3479 0.3483 0.050 0.2106 0.2574 0.2865 0.3068 0.3220 0.3338 0.3432 0.3511 0.3576 0.3632 0.3680 0.3722 0.3759 0.3792 0.3821 0.3848 0.3872 0.3893 0.3913 0.3931 0.3948 0.3964 0.3978 0.3991 0.4004 0.4015 0.4026 0.4036 0.4046 0.4055 0.4063 0.4071 0.4079 0.4086 0.4093 0.4099 0.4105 0.4111 0.4117 0.4122 0.4127 0.4132 0.4137 0.4141 0.4146 0.4150 0.4154 0.4158 0.4161 0.4165 0.075 0.2631 0.3087 0.3376 0.3579 0.3729 0.3846 0.3941 0.4018 0.4083 0.4138 0.4186 0.4227 0.4264 0.4296 0.4325 0.4351 0.4374 0.4396 0.4415 0.4433 0.4450 0.4465 0.4479 0.4492 0.4504 0.4515 0.4526 0.4536 0.4545 0.4554 0.4563 0.4570 0.4578 0.4585 0.4592 0.4598 0.4604 0.4610 0.4615 0.4620 0.4625 0.4630 0.4635 0.4639 0.4643 0.4647 0.4651 0.4655 0.4659 0.4662 0.100 0.3148 0.3563 0.3838 0.4032 0.4177 0.4290 0.4381 0.4455 0.4518 0.4571 0.4617 0.4657 0.4692 0.4723 0.4751 0.4776 0.4799 0.4819 0.4838 0.4855 0.4871 0.4886 0.4899 0.4912 0.4923 0.4934 0.4944 0.4954 0.4963 0.4971 0.4979 0.4987 0.4994 0.5001 0.5007 0.5013 0.5019 0.5025 0.5030 0.5035 0.5040 0.5044 0.5049 0.5053 0.5057 0.5061 0.5065 0.5068 0.5072 0.5075 0.125 0.3676 0.4024 0.4275 0.4455 0.4591 0.4697 0.4783 0.4853 0.4912 0.4962 0.5006 0.5043 0.5077 0.5106 0.5133 0.5156 0.5178 0.5197 0.5215 0.5231 0.5246 0.5260 0.5273 0.5285 0.5296 0.5306 0.5316 0.5325 0.5333 0.5341 0.5349 0.5356 0.5363 0.5369 0.5375 0.5381 0.5386 0.5391 0.5396 0.5401 0.5406 0.5410 0.5414 0.5418 0.5422 0.5426 0.5429 0.5433 0.5436 0.5439 0.150 0.4228 0.4482 0.4700 0.4862 0.4986 0.5083 0.5162 0.5227 0.5281 0.5328 0.5368 0.5403 0.5434 0.5461 0.5486 0.5508 0.5528 0.5546 0.5562 0.5577 0.5591 0.5604 0.5616 0.5627 0.5637 0.5647 0.5656 0.5665 0.5672 0.5680 0.5687 0.5694 0.5700 0.5706 0.5711 0.5717 0.5722 0.5727 0.5731 0.5736 0.5740 0.5744 0.5748 0.5752 0.5755 0.5759 0.5762 0.5765 0.5768 0.5771 0.850 26.7785 6.0702 3.7874 2.9959 2.6006 2.3643 2.2072 2.0952 2.0112 1.9459 1.8936 1.8508 1.8151 1.7849 1.7589 1.7364 1.7167 1.6993 1.6838 1.6699 1.6574 1.6460 1.6357 1.6263 1.6177 1.6097 1.6023 1.5955 1.5892 1.5833 1.5778 1.5726 1.5678 1.5633 1.5590 1.5549 1.5511 1.5475 1.5441 1.5408 1.5377 1.5348 1.5320 1.5293 1.5268 1.5243 1.5220 1.5197 1.5176 1.5155 0.875 38.7208 7.4058 4.3829 3.3788 2.8883 2.5992 2.4089 2.2740 2.1735 2.0956 2.0335 1.9828 1.9406 1.9049 1.8743 1.8479 1.8247 1.8043 1.7861 1.7699 1.7552 1.7420 1.7300 1.7190 1.7089 1.6996 1.6911 1.6831 1.6758 1.6689 1.6625 1.6565 1.6509 1.6456 1.6406 1.6359 1.6315 1.6273 1.6233 1.6196 1.6160 1.6126 1.6093 1.6062 1.6033 1.6005 1.5978 1.5952 1.5927 1.5903 0.900 60.7051 9.4082 5.2156 3.8955 3.2682 2.9047 2.6681 2.5020 2.3789 2.2841 2.2087 2.1474 2.0966 2.0537 2.0171 1.9854 1.9577 1.9333 1.9117 1.8924 1.8750 1.8593 1.8450 1.8319 1.8200 1.8090 1.7989 1.7895 1.7808 1.7727 1.7651 1.7581 1.7514 1.7452 1.7394 1.7338 1.7286 1.7237 1.7190 1.7146 1.7103 1.7063 1.7025 1.6989 1.6954 1.6921 1.6889 1.6859 1.6830 1.6802 0.925 108.202 12.7437 6.4870 4.6501 3.8079 3.3306 3.0246 2.8121 2.6560 2.5366 2.4422 2.3657 2.3026 2.2495 2.2042 2.1652 2.1312 2.1013 2.0747 2.0511 2.0299 2.0107 1.9933 1.9774 1.9629 1.9496 1.9373 1.9259 1.9154 1.9056 1.8964 1.8879 1.8798 1.8723 1.8652 1.8586 1.8523 1.8463 1.8407 1.8353 1.8303 1.8254 1.8209 1.8165 1.8123 1.8083 1.8045 1.8008 1.7973 1.7940 0.950 243.905 19.4125 8.7447 5.9117 4.6777 3.9999 3.5747 3.2839 3.0729 2.9130 2.7876 2.6866 2.6037 2.5342 2.4753 2.4247 2.3807 2.3421 2.3080 2.2776 2.2504 2.2258 2.2036 2.1834 2.1649 2.1479 2.1323 2.1179 2.1045 2.0921 2.0805 2.0697 2.0595 2.0500 2.0411 2.0327 2.0248 2.0173 2.0102 2.0035 1.9971 1.9910 1.9852 1.9797 1.9745 1.9695 1.9647 1.9601 1.9557 1.9515 0.975 976.725 39.4148 14.3366 8.7512 6.5245 5.3662 4.6658 4.1997 3.8682 3.6210 3.4296 3.2773 3.1532 3.0502 2.9633 2.8891 2.8249 2.7689 2.7196 2.6758 2.6368 2.6017 2.5699 2.5411 2.5149 2.4909 2.4688 2.4484 2.4295 2.4120 2.3958 2.3806 2.3664 2.3531 2.3406 2.3289 2.3178 2.3074 2.2975 2.2882 2.2793 2.2709 2.2629 2.2552 2.2480 2.2410 2.2344 2.2281 2.2220 2.2162 0.990 6106.68 99.4187 27.0520 14.3737 9.8883 7.7183 6.4691 5.6667 5.1115 4.7058 4.3974 4.1553 3.9603 3.8002 3.6662 3.5527 3.4552 3.3706 3.2965 3.2311 3.1729 3.1209 3.0740 3.0316 2.9931 2.9578 2.9256 2.8959 2.8685 2.8431 2.8195 2.7976 2.7771 2.7580 2.7400 2.7232 2.7073 2.6923 2.6782 2.6648 2.6522 2.6401 2.6288 2.6179 2.6076 2.5977 2.5883 2.5793 2.5707 2.5625

289

Tabla de Cuantiles de la Distribucin F


Grados de libertad del numerador en extremo superior izquierdo, grados de libertad del denominador en margen izquierdo de cada fila. En el margen superior se lee P(F x) para los valores de x en el cuerpo de la tabla.
15 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 0.001 0.0603 0.0882 0.1071 0.1212 0.1321 0.1410 0.1483 0.1545 0.1598 0.1644 0.1685 0.1721 0.1752 0.1781 0.1807 0.1830 0.1851 0.1871 0.1889 0.1905 0.1921 0.1935 0.1948 0.1961 0.1972 0.1983 0.1993 0.2003 0.2012 0.2020 0.2028 0.2036 0.2043 0.2050 0.2057 0.2063 0.2069 0.2075 0.2080 0.2085 0.2090 0.2095 0.2100 0.2104 0.2108 0.2112 0.2116 0.2120 0.2123 0.2127 0.025 0.1613 0.2099 0.2408 0.2629 0.2796 0.2929 0.3036 0.3126 0.3202 0.3268 0.3325 0.3375 0.3419 0.3458 0.3494 0.3526 0.3555 0.3582 0.3606 0.3629 0.3649 0.3668 0.3686 0.3703 0.3718 0.3733 0.3746 0.3759 0.3771 0.3783 0.3793 0.3803 0.3813 0.3822 0.3831 0.3839 0.3847 0.3854 0.3862 0.3868 0.3875 0.3881 0.3887 0.3893 0.3899 0.3904 0.3909 0.3914 0.3919 0.3923 0.050 0.2201 0.2716 0.3042 0.3273 0.3447 0.3584 0.3695 0.3787 0.3865 0.3931 0.3989 0.4040 0.4085 0.4125 0.4161 0.4193 0.4222 0.4249 0.4274 0.4296 0.4317 0.4336 0.4354 0.4371 0.4386 0.4401 0.4415 0.4427 0.4439 0.4451 0.4462 0.4472 0.4481 0.4490 0.4499 0.4507 0.4515 0.4523 0.4530 0.4537 0.4543 0.4549 0.4555 0.4561 0.4567 0.4572 0.4577 0.4582 0.4587 0.4591 0.075 0.2732 0.3232 0.3555 0.3783 0.3955 0.4089 0.4199 0.4289 0.4365 0.4431 0.4487 0.4537 0.4581 0.4620 0.4655 0.4686 0.4715 0.4741 0.4765 0.4787 0.4807 0.4826 0.4843 0.4859 0.4874 0.4888 0.4901 0.4914 0.4926 0.4937 0.4947 0.4957 0.4966 0.4975 0.4983 0.4991 0.4999 0.5006 0.5013 0.5020 0.5026 0.5032 0.5038 0.5043 0.5049 0.5054 0.5059 0.5064 0.5068 0.5073 0.100 0.3254 0.3710 0.4016 0.4235 0.4399 0.4529 0.4634 0.4720 0.4793 0.4856 0.4910 0.4958 0.5000 0.5037 0.5070 0.5101 0.5128 0.5153 0.5176 0.5197 0.5216 0.5234 0.5250 0.5266 0.5280 0.5294 0.5306 0.5318 0.5329 0.5340 0.5350 0.5359 0.5368 0.5376 0.5384 0.5392 0.5399 0.5406 0.5413 0.5419 0.5425 0.5431 0.5436 0.5442 0.5447 0.5452 0.5456 0.5461 0.5465 0.5469 0.125 0.3787 0.4173 0.4453 0.4656 0.4810 0.4932 0.5030 0.5112 0.5180 0.5239 0.5291 0.5335 0.5375 0.5410 0.5441 0.5470 0.5496 0.5519 0.5541 0.5560 0.5579 0.5595 0.5611 0.5626 0.5639 0.5652 0.5664 0.5675 0.5685 0.5695 0.5704 0.5713 0.5722 0.5729 0.5737 0.5744 0.5751 0.5758 0.5764 0.5770 0.5775 0.5781 0.5786 0.5791 0.5796 0.5800 0.5805 0.5809 0.5813 0.5817 0.150 0.4344 0.4633 0.4877 0.5060 0.5201 0.5312 0.5403 0.5478 0.5542 0.5596 0.5644 0.5685 0.5722 0.5755 0.5784 0.5810 0.5834 0.5856 0.5876 0.5894 0.5911 0.5927 0.5941 0.5955 0.5967 0.5979 0.5990 0.6001 0.6010 0.6020 0.6028 0.6036 0.6044 0.6052 0.6059 0.6065 0.6072 0.6078 0.6083 0.6089 0.6094 0.6099 0.6104 0.6109 0.6113 0.6117 0.6122 0.6126 0.6129 0.6133 0.850 27.0106 6.0867 3.7828 2.9835 2.5838 2.3446 2.1854 2.0717 1.9863 1.9198 1.8666 1.8229 1.7864 1.7555 1.7289 1.7059 1.6856 1.6678 1.6518 1.6376 1.6247 1.6130 1.6024 1.5927 1.5838 1.5756 1.5680 1.5610 1.5544 1.5483 1.5426 1.5373 1.5323 1.5276 1.5231 1.5189 1.5150 1.5112 1.5077 1.5043 1.5011 1.4980 1.4951 1.4923 1.4897 1.4872 1.4847 1.4824 1.4802 1.4780 0.875 39.0526 7.4224 4.3738 3.3610 2.8658 2.5736 2.3809 2.2443 2.1423 2.0632 2.0000 1.9483 1.9053 1.8689 1.8377 1.8107 1.7870 1.7661 1.7475 1.7308 1.7158 1.7022 1.6898 1.6785 1.6682 1.6586 1.6498 1.6416 1.6341 1.6270 1.6204 1.6142 1.6084 1.6029 1.5978 1.5929 1.5884 1.5840 1.5799 1.5760 1.5723 1.5688 1.5654 1.5622 1.5591 1.5562 1.5534 1.5507 1.5482 1.5457 0.900 61.2204 9.4247 5.2003 3.8704 3.2380 2.8712 2.6322 2.4642 2.3396 2.2435 2.1671 2.1049 2.0532 2.0095 1.9722 1.9399 1.9117 1.8868 1.8647 1.8449 1.8271 1.8111 1.7964 1.7831 1.7708 1.7596 1.7492 1.7395 1.7306 1.7223 1.7145 1.7072 1.7004 1.6940 1.6880 1.6823 1.6769 1.6718 1.6670 1.6624 1.6581 1.6539 1.6500 1.6462 1.6426 1.6392 1.6359 1.6328 1.6298 1.6269 0.925 109.113 12.7603 6.4622 4.6142 3.7667 3.2861 2.9777 2.7634 2.6058 2.4851 2.3896 2.3122 2.2482 2.1943 2.1484 2.1087 2.0742 2.0438 2.0168 1.9927 1.9710 1.9515 1.9337 1.9176 1.9027 1.8891 1.8765 1.8649 1.8541 1.8441 1.8347 1.8259 1.8177 1.8100 1.8028 1.7959 1.7895 1.7834 1.7776 1.7721 1.7669 1.7619 1.7572 1.7527 1.7484 1.7443 1.7404 1.7366 1.7330 1.7296 0.950 245.949 19.4291 8.7028 5.8578 4.6188 3.9381 3.5107 3.2184 3.0061 2.8450 2.7186 2.6169 2.5331 2.4630 2.4034 2.3522 2.3077 2.2686 2.2341 2.2033 2.1757 2.1508 2.1282 2.1077 2.0889 2.0716 2.0558 2.0411 2.0275 2.0148 2.0030 1.9920 1.9817 1.9720 1.9629 1.9543 1.9462 1.9386 1.9313 1.9245 1.9179 1.9118 1.9059 1.9002 1.8949 1.8898 1.8849 1.8802 1.8757 1.8714 0.975 984.874 39.4311 14.2527 8.6566 6.4277 5.2686 4.5678 4.1012 3.7693 3.5217 3.3299 3.1772 3.0527 2.9493 2.8621 2.7875 2.7230 2.6667 2.6171 2.5731 2.5338 2.4984 2.4665 2.4374 2.4110 2.3867 2.3644 2.3438 2.3248 2.3072 2.2907 2.2754 2.2610 2.2476 2.2350 2.2231 2.2119 2.2014 2.1914 2.1819 2.1729 2.1644 2.1563 2.1486 2.1412 2.1342 2.1275 2.1210 2.1149 2.1090 0.990 6156.97 99.4332 26.8719 14.1981 9.7223 7.5590 6.3144 5.5152 4.9621 4.5582 4.2509 4.0096 3.8154 3.6557 3.5222 3.4090 3.3117 3.2273 3.1533 3.0880 3.0300 2.9779 2.9311 2.8887 2.8502 2.8150 2.7827 2.7530 2.7256 2.7002 2.6766 2.6546 2.6341 2.6150 2.5970 2.5801 2.5642 2.5492 2.5350 2.5216 2.5089 2.4969 2.4854 2.4746 2.4642 2.4543 2.4449 2.4359 2.4272 2.4190

290

Tabla de Cuantiles de la Distribucin F


Grados de libertad del numerador en extremo superior izquierdo, grados de libertad del denominador en margen izquierdo de cada fila. En el margen superior se lee P(F x) para los valores de x en el cuerpo de la tabla.
20 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 0.001 0.0675 0.1005 0.1235 0.1409 0.1548 0.1662 0.1757 0.1838 0.1909 0.1970 0.2025 0.2073 0.2117 0.2156 0.2192 0.2225 0.2255 0.2282 0.2308 0.2331 0.2353 0.2373 0.2392 0.2410 0.2427 0.2442 0.2457 0.2471 0.2484 0.2497 0.2509 0.2520 0.2531 0.2541 0.2551 0.2560 0.2569 0.2577 0.2585 0.2593 0.2601 0.2608 0.2615 0.2621 0.2628 0.2634 0.2640 0.2645 0.2651 0.2656 0.025 0.1703 0.2242 0.2592 0.2845 0.3040 0.3197 0.3325 0.3433 0.3525 0.3605 0.3675 0.3737 0.3792 0.3842 0.3886 0.3927 0.3964 0.3998 0.4029 0.4058 0.4084 0.4109 0.4132 0.4154 0.4174 0.4193 0.4210 0.4227 0.4243 0.4258 0.4272 0.4285 0.4298 0.4310 0.4322 0.4333 0.4343 0.4353 0.4363 0.4372 0.4381 0.4389 0.4397 0.4405 0.4412 0.4420 0.4427 0.4433 0.4440 0.4446 0.050 0.2298 0.2863 0.3227 0.3489 0.3689 0.3848 0.3978 0.4087 0.4179 0.4259 0.4329 0.4391 0.4445 0.4494 0.4539 0.4579 0.4615 0.4649 0.4679 0.4708 0.4734 0.4758 0.4781 0.4802 0.4822 0.4840 0.4858 0.4874 0.4890 0.4904 0.4918 0.4931 0.4943 0.4955 0.4967 0.4977 0.4987 0.4997 0.5007 0.5015 0.5024 0.5032 0.5040 0.5048 0.5055 0.5062 0.5069 0.5075 0.5081 0.5087 0.075 0.2834 0.3382 0.3740 0.3997 0.4193 0.4348 0.4475 0.4581 0.4671 0.4748 0.4816 0.4875 0.4928 0.4976 0.5018 0.5057 0.5092 0.5124 0.5154 0.5181 0.5206 0.5230 0.5251 0.5272 0.5290 0.5308 0.5325 0.5341 0.5355 0.5369 0.5383 0.5395 0.5407 0.5418 0.5429 0.5439 0.5449 0.5458 0.5467 0.5476 0.5484 0.5492 0.5499 0.5507 0.5513 0.5520 0.5527 0.5533 0.5539 0.5544 0.100 0.3362 0.3862 0.4202 0.4447 0.4633 0.4782 0.4903 0.5004 0.5089 0.5163 0.5228 0.5284 0.5335 0.5380 0.5420 0.5457 0.5490 0.5521 0.5549 0.5575 0.5598 0.5621 0.5641 0.5660 0.5678 0.5695 0.5711 0.5726 0.5740 0.5753 0.5766 0.5777 0.5789 0.5799 0.5809 0.5819 0.5828 0.5837 0.5846 0.5854 0.5861 0.5869 0.5876 0.5883 0.5889 0.5896 0.5902 0.5907 0.5913 0.5919 0.125 0.3900 0.4326 0.4637 0.4865 0.5039 0.5178 0.5292 0.5387 0.5467 0.5536 0.5597 0.5650 0.5697 0.5740 0.5778 0.5812 0.5843 0.5872 0.5898 0.5922 0.5945 0.5966 0.5985 0.6003 0.6020 0.6035 0.6050 0.6064 0.6077 0.6090 0.6101 0.6112 0.6123 0.6133 0.6143 0.6152 0.6160 0.6168 0.6176 0.6184 0.6191 0.6198 0.6205 0.6211 0.6217 0.6223 0.6229 0.6234 0.6240 0.6245 0.150 0.4462 0.4787 0.5060 0.5266 0.5425 0.5553 0.5657 0.5745 0.5819 0.5883 0.5939 0.5988 0.6032 0.6071 0.6107 0.6139 0.6168 0.6194 0.6218 0.6241 0.6262 0.6281 0.6299 0.6315 0.6331 0.6346 0.6359 0.6372 0.6384 0.6396 0.6407 0.6417 0.6427 0.6436 0.6445 0.6453 0.6461 0.6469 0.6476 0.6483 0.6490 0.6496 0.6503 0.6509 0.6514 0.6520 0.6525 0.6530 0.6535 0.6540 0.850 27.2448 6.1033 3.7778 2.9704 2.5662 2.3239 2.1623 2.0468 1.9598 1.8920 1.8376 1.7929 1.7556 1.7238 1.6965 1.6728 1.6520 1.6335 1.6171 1.6023 1.5890 1.5769 1.5659 1.5559 1.5466 1.5381 1.5302 1.5228 1.5160 1.5097 1.5037 1.4982 1.4929 1.4880 1.4834 1.4790 1.4748 1.4709 1.4672 1.4637 1.4603 1.4571 1.4540 1.4511 1.4483 1.4457 1.4431 1.4407 1.4383 1.4361 0.875 39.3875 7.4390 4.3643 3.3424 2.8423 2.5467 2.3516 2.2129 2.1093 2.0288 1.9644 1.9116 1.8677 1.8304 1.7984 1.7707 1.7463 1.7248 1.7057 1.6885 1.6730 1.6590 1.6462 1.6345 1.6238 1.6139 1.6047 1.5962 1.5884 1.5810 1.5741 1.5677 1.5617 1.5560 1.5506 1.5456 1.5408 1.5363 1.5320 1.5279 1.5240 1.5203 1.5168 1.5134 1.5102 1.5072 1.5042 1.5014 1.4987 1.4961 0.900 61.7401 9.4413 5.1845 3.8443 3.2067 2.8363 2.5947 2.4246 2.2983 2.2007 2.1230 2.0597 2.0070 1.9625 1.9243 1.8913 1.8624 1.8368 1.8142 1.7938 1.7756 1.7590 1.7439 1.7302 1.7175 1.7059 1.6951 1.6852 1.6759 1.6673 1.6593 1.6517 1.6446 1.6380 1.6317 1.6258 1.6202 1.6149 1.6099 1.6052 1.6006 1.5963 1.5922 1.5883 1.5846 1.5810 1.5776 1.5743 1.5711 1.5681 0.925 110.032 12.7769 6.4367 4.5772 3.7242 3.2400 2.9290 2.7125 2.5532 2.4310 2.3343 2.2557 2.1907 2.1359 2.0891 2.0487 2.0134 1.9824 1.9548 1.9301 1.9080 1.8879 1.8697 1.8531 1.8379 1.8238 1.8109 1.7989 1.7878 1.7775 1.7678 1.7588 1.7503 1.7423 1.7348 1.7278 1.7211 1.7147 1.7088 1.7031 1.6977 1.6925 1.6876 1.6830 1.6785 1.6742 1.6702 1.6663 1.6625 1.6589 0.950 248.016 19.4457 8.6602 5.8025 4.5581 3.8742 3.4445 3.1503 2.9365 2.7740 2.6464 2.5436 2.4589 2.3879 2.3275 2.2756 2.2304 2.1906 2.1555 2.1242 2.0960 2.0707 2.0476 2.0267 2.0075 1.9898 1.9736 1.9586 1.9446 1.9317 1.9196 1.9083 1.8977 1.8877 1.8784 1.8696 1.8612 1.8534 1.8459 1.8389 1.8321 1.8258 1.8197 1.8139 1.8084 1.8031 1.7980 1.7932 1.7886 1.7841 0.975 993.081 39.4475 14.1674 8.5599 6.3285 5.1684 4.4668 3.9994 3.6669 3.4185 3.2261 3.0728 2.9477 2.8437 2.7559 2.6808 2.6158 2.5590 2.5089 2.4645 2.4247 2.3890 2.3566 2.3273 2.3005 2.2759 2.2533 2.2324 2.2131 2.1952 2.1785 2.1629 2.1483 2.1346 2.1218 2.1097 2.0983 2.0875 2.0774 2.0677 2.0586 2.0499 2.0416 2.0337 2.0262 2.0190 2.0122 2.0056 1.9993 1.9933 0.990 6208.66 99.4478 26.6900 14.0194 9.5527 7.3958 6.1555 5.3591 4.8080 4.4054 4.0990 3.8584 3.6646 3.5052 3.3719 3.2587 3.1615 3.0771 3.0031 2.9377 2.8795 2.8274 2.7805 2.7380 2.6993 2.6640 2.6316 2.6018 2.5742 2.5487 2.5249 2.5028 2.4822 2.4629 2.4448 2.4278 2.4118 2.3967 2.3824 2.3689 2.3561 2.3439 2.3324 2.3214 2.3109 2.3009 2.2914 2.2823 2.2736 2.2652

291

Tabla de Cuantiles de la Distribucin F


Grados de libertad del numerador en extremo superior izquierdo, grados de libertad del denominador en margen izquierdo de cada fila. En el margen superior se lee P(F x) para los valores de x en el cuerpo de la tabla.
25 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 0.001 0.0721 0.1084 0.1342 0.1540 0.1699 0.1831 0.1942 0.2038 0.2122 0.2195 0.2261 0.2319 0.2372 0.2420 0.2464 0.2504 0.2541 0.2575 0.2606 0.2636 0.2663 0.2688 0.2712 0.2734 0.2755 0.2775 0.2794 0.2812 0.2829 0.2844 0.2860 0.2874 0.2888 0.2901 0.2913 0.2925 0.2937 0.2948 0.2958 0.2968 0.2978 0.2987 0.2996 0.3004 0.3013 0.3021 0.3028 0.3036 0.3043 0.3050 0.025 0.1759 0.2330 0.2707 0.2982 0.3196 0.3369 0.3511 0.3632 0.3736 0.3826 0.3906 0.3976 0.4039 0.4096 0.4148 0.4195 0.4238 0.4277 0.4313 0.4347 0.4378 0.4407 0.4434 0.4460 0.4484 0.4506 0.4527 0.4547 0.4566 0.4584 0.4601 0.4617 0.4632 0.4646 0.4660 0.4674 0.4686 0.4698 0.4710 0.4721 0.4731 0.4742 0.4751 0.4761 0.4770 0.4779 0.4787 0.4795 0.4803 0.4811 0.050 0.2358 0.2954 0.3343 0.3625 0.3842 0.4015 0.4158 0.4279 0.4382 0.4471 0.4550 0.4619 0.4681 0.4737 0.4787 0.4833 0.4875 0.4913 0.4949 0.4981 0.5012 0.5040 0.5066 0.5091 0.5114 0.5136 0.5156 0.5175 0.5193 0.5211 0.5227 0.5242 0.5257 0.5271 0.5284 0.5297 0.5309 0.5321 0.5332 0.5342 0.5353 0.5362 0.5372 0.5381 0.5390 0.5398 0.5406 0.5414 0.5421 0.5429 0.075 0.2897 0.3474 0.3855 0.4131 0.4343 0.4511 0.4650 0.4767 0.4866 0.4952 0.5028 0.5094 0.5154 0.5207 0.5256 0.5299 0.5339 0.5376 0.5410 0.5441 0.5470 0.5497 0.5522 0.5545 0.5567 0.5588 0.5607 0.5626 0.5643 0.5659 0.5675 0.5689 0.5703 0.5717 0.5729 0.5741 0.5753 0.5764 0.5774 0.5784 0.5794 0.5803 0.5812 0.5821 0.5829 0.5837 0.5845 0.5852 0.5859 0.5866 0.100 0.3427 0.3955 0.4316 0.4578 0.4780 0.4941 0.5073 0.5183 0.5278 0.5360 0.5431 0.5494 0.5551 0.5601 0.5647 0.5689 0.5726 0.5761 0.5793 0.5822 0.5850 0.5875 0.5899 0.5921 0.5941 0.5961 0.5979 0.5996 0.6013 0.6028 0.6042 0.6056 0.6069 0.6082 0.6094 0.6105 0.6116 0.6126 0.6136 0.6146 0.6155 0.6163 0.6172 0.6180 0.6188 0.6195 0.6202 0.6209 0.6216 0.6222 0.125 0.3969 0.4420 0.4750 0.4994 0.5182 0.5333 0.5456 0.5560 0.5649 0.5725 0.5792 0.5852 0.5904 0.5952 0.5995 0.6033 0.6069 0.6101 0.6131 0.6159 0.6184 0.6208 0.6230 0.6251 0.6270 0.6288 0.6305 0.6321 0.6336 0.6351 0.6364 0.6377 0.6389 0.6401 0.6412 0.6423 0.6433 0.6442 0.6452 0.6460 0.6469 0.6477 0.6485 0.6492 0.6500 0.6507 0.6513 0.6520 0.6526 0.6532 0.150 0.4534 0.4881 0.5172 0.5393 0.5564 0.5703 0.5817 0.5912 0.5994 0.6065 0.6127 0.6182 0.6231 0.6274 0.6314 0.6350 0.6383 0.6413 0.6440 0.6466 0.6489 0.6511 0.6532 0.6551 0.6569 0.6586 0.6601 0.6616 0.6630 0.6644 0.6656 0.6668 0.6679 0.6690 0.6700 0.6710 0.6720 0.6729 0.6737 0.6745 0.6753 0.6761 0.6768 0.6775 0.6781 0.6788 0.6794 0.6800 0.6806 0.6811 0.850 27.3862 6.1132 3.7746 2.9623 2.5552 2.3110 2.1479 2.0310 1.9431 1.8744 1.8192 1.7738 1.7358 1.7036 1.6757 1.6515 1.6303 1.6114 1.5946 1.5795 1.5659 1.5535 1.5422 1.5319 1.5223 1.5136 1.5054 1.4979 1.4909 1.4843 1.4782 1.4724 1.4670 1.4620 1.4572 1.4526 1.4483 1.4443 1.4404 1.4368 1.4333 1.4300 1.4268 1.4238 1.4209 1.4181 1.4154 1.4129 1.4105 1.4081 0.875 39.5896 7.4489 4.3583 3.3309 2.8277 2.5300 2.3332 2.1933 2.0885 2.0071 1.9418 1.8884 1.8437 1.8059 1.7733 1.7451 1.7203 1.6983 1.6788 1.6612 1.6454 1.6310 1.6179 1.6059 1.5949 1.5848 1.5754 1.5667 1.5586 1.5510 1.5439 1.5373 1.5311 1.5252 1.5197 1.5145 1.5095 1.5049 1.5004 1.4962 1.4922 1.4884 1.4848 1.4813 1.4780 1.4748 1.4717 1.4688 1.4660 1.4633 0.900 62.0548 9.4513 5.1747 3.8283 3.1873 2.8147 2.5714 2.3999 2.2725 2.1739 2.0953 2.0312 1.9778 1.9326 1.8939 1.8603 1.8309 1.8049 1.7818 1.7611 1.7424 1.7255 1.7101 1.6960 1.6831 1.6712 1.6602 1.6500 1.6405 1.6316 1.6234 1.6156 1.6083 1.6015 1.5950 1.5890 1.5832 1.5778 1.5726 1.5677 1.5630 1.5586 1.5543 1.5503 1.5464 1.5427 1.5392 1.5358 1.5325 1.5294 0.925 110.589 12.7869 6.4211 4.5545 3.6980 3.2115 2.8987 2.6809 2.5204 2.3972 2.2995 2.2202 2.1544 2.0990 2.0516 2.0106 1.9748 1.9433 1.9153 1.8902 1.8676 1.8472 1.8287 1.8117 1.7962 1.7819 1.7687 1.7564 1.7451 1.7345 1.7246 1.7153 1.7066 1.6984 1.6908 1.6835 1.6766 1.6701 1.6640 1.6581 1.6526 1.6473 1.6423 1.6375 1.6329 1.6285 1.6243 1.6203 1.6164 1.6127 0.950 249.260 19.4557 8.6341 5.7687 4.5209 3.8348 3.4036 3.1081 2.8932 2.7298 2.6014 2.4977 2.4123 2.3407 2.2797 2.2272 2.1815 2.1413 2.1057 2.0739 2.0454 2.0196 1.9963 1.9750 1.9554 1.9375 1.9210 1.9057 1.8915 1.8782 1.8659 1.8544 1.8436 1.8334 1.8239 1.8149 1.8064 1.7983 1.7907 1.7835 1.7766 1.7701 1.7638 1.7579 1.7522 1.7468 1.7416 1.7367 1.7319 1.7273 0.975 998.087 39.4575 14.1154 8.5010 6.2678 5.1069 4.4045 3.9367 3.6035 3.3546 3.1616 3.0077 2.8821 2.7777 2.6894 2.6138 2.5484 2.4912 2.4408 2.3959 2.3558 2.3198 2.2871 2.2574 2.2303 2.2054 2.1826 2.1614 2.1419 2.1237 2.1068 2.0910 2.0762 2.0623 2.0493 2.0370 2.0254 2.0145 2.0042 1.9943 1.9850 1.9762 1.9678 1.9597 1.9521 1.9448 1.9378 1.9311 1.9247 1.9186 0.990 6239.86 99.4587 26.5791 13.9107 9.4492 7.2960 6.0579 5.2631 4.7130 4.3111 4.0051 3.7647 3.5710 3.4116 3.2782 3.1650 3.0676 2.9831 2.9089 2.8434 2.7850 2.7328 2.6857 2.6430 2.6041 2.5686 2.5360 2.5060 2.4783 2.4526 2.4287 2.4065 2.3857 2.3662 2.3480 2.3308 2.3147 2.2994 2.2850 2.2714 2.2585 2.2462 2.2345 2.2234 2.2129 2.2028 2.1931 2.1839 2.1751 2.1667

292

Tabla de Cuantiles de la Distribucin F


Grados de libertad del numerador en extremo superior izquierdo, grados de libertad del denominador en margen izquierdo de cada fila. En el margen superior se lee P(F x) para los valores de x en el cuerpo de la tabla.
30 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 0.001 0.0752 0.1140 0.1418 0.1633 0.1807 0.1952 0.2076 0.2183 0.2276 0.2359 0.2433 0.2500 0.2560 0.2615 0.2665 0.2711 0.2753 0.2792 0.2829 0.2863 0.2895 0.2925 0.2952 0.2979 0.3003 0.3027 0.3049 0.3070 0.3090 0.3108 0.3126 0.3143 0.3160 0.3175 0.3190 0.3204 0.3218 0.3231 0.3243 0.3256 0.3267 0.3278 0.3289 0.3299 0.3309 0.3319 0.3328 0.3337 0.3346 0.3354 0.025 0.1796 0.2391 0.2786 0.3077 0.3304 0.3488 0.3642 0.3772 0.3884 0.3982 0.4069 0.4146 0.4215 0.4278 0.4334 0.4386 0.4434 0.4477 0.4518 0.4555 0.4590 0.4623 0.4653 0.4682 0.4709 0.4734 0.4758 0.4780 0.4802 0.4822 0.4841 0.4859 0.4876 0.4893 0.4909 0.4924 0.4938 0.4952 0.4965 0.4978 0.4990 0.5002 0.5013 0.5024 0.5034 0.5044 0.5054 0.5063 0.5072 0.5081 0.050 0.2398 0.3016 0.3422 0.3718 0.3947 0.4131 0.4284 0.4413 0.4523 0.4620 0.4705 0.4780 0.4847 0.4908 0.4963 0.5013 0.5059 0.5102 0.5141 0.5177 0.5210 0.5242 0.5271 0.5298 0.5324 0.5348 0.5371 0.5393 0.5413 0.5432 0.5451 0.5468 0.5484 0.5500 0.5515 0.5530 0.5543 0.5556 0.5569 0.5581 0.5593 0.5604 0.5614 0.5625 0.5635 0.5644 0.5653 0.5662 0.5671 0.5679 0.075 0.2939 0.3537 0.3934 0.4223 0.4445 0.4624 0.4771 0.4895 0.5002 0.5094 0.5176 0.5248 0.5312 0.5370 0.5423 0.5471 0.5514 0.5555 0.5592 0.5626 0.5658 0.5688 0.5715 0.5741 0.5765 0.5788 0.5810 0.5830 0.5849 0.5868 0.5885 0.5901 0.5917 0.5932 0.5946 0.5960 0.5973 0.5985 0.5997 0.6008 0.6019 0.6029 0.6039 0.6049 0.6058 0.6067 0.6076 0.6084 0.6093 0.6100 0.100 0.3471 0.4018 0.4394 0.4668 0.4880 0.5050 0.5190 0.5308 0.5408 0.5496 0.5573 0.5641 0.5702 0.5757 0.5806 0.5851 0.5893 0.5930 0.5965 0.5998 0.6028 0.6056 0.6082 0.6106 0.6129 0.6150 0.6171 0.6190 0.6208 0.6225 0.6241 0.6256 0.6271 0.6285 0.6298 0.6311 0.6323 0.6335 0.6346 0.6356 0.6367 0.6376 0.6386 0.6395 0.6404 0.6412 0.6420 0.6428 0.6435 0.6443 0.125 0.4015 0.4483 0.4827 0.5082 0.5280 0.5439 0.5570 0.5680 0.5774 0.5856 0.5928 0.5992 0.6049 0.6100 0.6146 0.6188 0.6227 0.6262 0.6295 0.6325 0.6353 0.6379 0.6403 0.6426 0.6447 0.6467 0.6486 0.6504 0.6521 0.6537 0.6552 0.6566 0.6580 0.6593 0.6605 0.6617 0.6628 0.6639 0.6649 0.6659 0.6669 0.6678 0.6687 0.6695 0.6703 0.6711 0.6719 0.6726 0.6733 0.6740 0.150 0.4582 0.4945 0.5248 0.5479 0.5659 0.5805 0.5926 0.6028 0.6115 0.6191 0.6257 0.6316 0.6369 0.6416 0.6459 0.6498 0.6533 0.6566 0.6596 0.6624 0.6650 0.6674 0.6696 0.6717 0.6737 0.6756 0.6773 0.6789 0.6805 0.6820 0.6834 0.6847 0.6860 0.6872 0.6883 0.6894 0.6904 0.6914 0.6924 0.6933 0.6942 0.6950 0.6958 0.6966 0.6973 0.6981 0.6988 0.6994 0.7001 0.7007 0.850 27.4811 6.1198 3.7724 2.9567 2.5477 2.3021 2.1379 2.0202 1.9316 1.8622 1.8065 1.7606 1.7221 1.6894 1.6613 1.6367 1.6151 1.5960 1.5789 1.5635 1.5496 1.5370 1.5255 1.5149 1.5052 1.4962 1.4879 1.4802 1.4730 1.4663 1.4601 1.4542 1.4486 1.4434 1.4385 1.4338 1.4294 1.4253 1.4213 1.4175 1.4139 1.4105 1.4073 1.4042 1.4012 1.3983 1.3956 1.3930 1.3905 1.3880 0.875 39.7251 7.4556 4.3543 3.3231 2.8177 2.5186 2.3207 2.1798 2.0742 1.9921 1.9263 1.8723 1.8272 1.7889 1.7559 1.7273 1.7021 1.6798 1.6600 1.6421 1.6260 1.6114 1.5981 1.5859 1.5746 1.5643 1.5547 1.5458 1.5375 1.5298 1.5226 1.5158 1.5094 1.5034 1.4977 1.4924 1.4873 1.4825 1.4780 1.4737 1.4695 1.4656 1.4619 1.4583 1.4549 1.4516 1.4485 1.4455 1.4426 1.4398 0.900 62.2649 9.4579 5.1681 3.8174 3.1741 2.8000 2.5555 2.3830 2.2547 2.1554 2.0762 2.0115 1.9576 1.9119 1.8728 1.8388 1.8090 1.7827 1.7592 1.7382 1.7193 1.7021 1.6864 1.6721 1.6589 1.6468 1.6356 1.6252 1.6155 1.6065 1.5980 1.5901 1.5827 1.5757 1.5691 1.5629 1.5570 1.5514 1.5461 1.5411 1.5363 1.5317 1.5274 1.5232 1.5193 1.5155 1.5118 1.5084 1.5050 1.5018 0.925 110.962 12.7935 6.4105 4.5392 3.6802 3.1921 2.8782 2.6593 2.4980 2.3740 2.2757 2.1958 2.1295 2.0735 2.0257 1.9843 1.9481 1.9162 1.8878 1.8624 1.8396 1.8189 1.8000 1.7828 1.7670 1.7525 1.7391 1.7266 1.7150 1.7042 1.6942 1.6847 1.6759 1.6675 1.6597 1.6523 1.6453 1.6386 1.6323 1.6264 1.6207 1.6153 1.6101 1.6052 1.6005 1.5960 1.5917 1.5876 1.5836 1.5798 0.950 250.096 19.4625 8.6166 5.7459 4.4957 3.8082 3.3758 3.0794 2.8637 2.6996 2.5705 2.4663 2.3803 2.3082 2.2468 2.1938 2.1477 2.1071 2.0712 2.0391 2.0102 1.9842 1.9605 1.9390 1.9192 1.9010 1.8842 1.8687 1.8543 1.8409 1.8283 1.8166 1.8056 1.7953 1.7856 1.7764 1.7678 1.7596 1.7518 1.7444 1.7374 1.7308 1.7244 1.7184 1.7126 1.7070 1.7017 1.6967 1.6918 1.6872 0.975 1001.40 39.4648 14.0806 8.4613 6.2269 5.0652 4.3624 3.8940 3.5604 3.3110 3.1176 2.9633 2.8373 2.7324 2.6437 2.5678 2.5020 2.4445 2.3937 2.3486 2.3082 2.2718 2.2389 2.2090 2.1816 2.1565 2.1334 2.1121 2.0923 2.0739 2.0568 2.0408 2.0259 2.0118 1.9986 1.9862 1.9745 1.9634 1.9529 1.9429 1.9335 1.9245 1.9159 1.9078 1.9000 1.8926 1.8855 1.8787 1.8722 1.8659 0.990 6260.35 99.4660 26.5045 13.8375 9.3794 7.2286 5.9920 5.1981 4.6486 4.2469 3.9411 3.7008 3.5070 3.3476 3.2141 3.1007 3.0032 2.9185 2.8442 2.7785 2.7200 2.6675 2.6202 2.5773 2.5383 2.5026 2.4699 2.4397 2.4118 2.3860 2.3619 2.3395 2.3186 2.2990 2.2806 2.2633 2.2470 2.2317 2.2171 2.2034 2.1903 2.1780 2.1662 2.1550 2.1443 2.1341 2.1244 2.1150 2.1061 2.0976

293

Tabla de Cuantiles de la Distribucin F


Grados de libertad del numerador en extremo superior izquierdo, grados de libertad del denominador en margen izquierdo de cada fila. En el margen superior se lee P(F x) para los valores de x en el cuerpo de la tabla.
40 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 0.001 0.0793 0.1212 0.1516 0.1755 0.1950 0.2114 0.2255 0.2377 0.2485 0.2581 0.2667 0.2745 0.2816 0.2881 0.2941 0.2996 0.3047 0.3094 0.3138 0.3180 0.3218 0.3255 0.3289 0.3321 0.3351 0.3380 0.3408 0.3434 0.3458 0.3482 0.3504 0.3526 0.3546 0.3566 0.3584 0.3602 0.3620 0.3636 0.3652 0.3667 0.3682 0.3696 0.3710 0.3723 0.3736 0.3748 0.3760 0.3772 0.3783 0.3794 0.025 0.1844 0.2469 0.2887 0.3199 0.3444 0.3644 0.3811 0.3954 0.4078 0.4187 0.4284 0.4370 0.4448 0.4519 0.4583 0.4642 0.4696 0.4747 0.4793 0.4836 0.4877 0.4914 0.4950 0.4983 0.5014 0.5044 0.5072 0.5098 0.5123 0.5147 0.5170 0.5191 0.5212 0.5231 0.5250 0.5268 0.5285 0.5302 0.5318 0.5333 0.5347 0.5361 0.5375 0.5388 0.5401 0.5413 0.5424 0.5436 0.5447 0.5457 0.050 0.2448 0.3094 0.3523 0.3837 0.4083 0.4281 0.4446 0.4587 0.4708 0.4814 0.4908 0.4991 0.5066 0.5134 0.5196 0.5253 0.5305 0.5353 0.5397 0.5438 0.5477 0.5512 0.5546 0.5577 0.5607 0.5635 0.5661 0.5686 0.5710 0.5733 0.5754 0.5774 0.5794 0.5812 0.5830 0.5847 0.5863 0.5878 0.5893 0.5907 0.5921 0.5934 0.5947 0.5959 0.5971 0.5982 0.5993 0.6004 0.6014 0.6024 0.075 0.2992 0.3616 0.4034 0.4339 0.4577 0.4769 0.4928 0.5062 0.5178 0.5280 0.5369 0.5449 0.5520 0.5584 0.5643 0.5697 0.5746 0.5791 0.5833 0.5872 0.5908 0.5942 0.5973 0.6003 0.6031 0.6057 0.6082 0.6105 0.6128 0.6149 0.6169 0.6188 0.6206 0.6223 0.6240 0.6256 0.6271 0.6285 0.6299 0.6312 0.6325 0.6338 0.6349 0.6361 0.6372 0.6382 0.6393 0.6403 0.6412 0.6421 0.100 0.3527 0.4098 0.4492 0.4783 0.5008 0.5190 0.5340 0.5468 0.5578 0.5673 0.5757 0.5832 0.5900 0.5960 0.6015 0.6066 0.6112 0.6154 0.6194 0.6230 0.6264 0.6295 0.6325 0.6353 0.6379 0.6403 0.6427 0.6449 0.6469 0.6489 0.6508 0.6525 0.6542 0.6559 0.6574 0.6589 0.6603 0.6616 0.6629 0.6642 0.6654 0.6665 0.6676 0.6687 0.6697 0.6707 0.6717 0.6726 0.6735 0.6743 0.125 0.4073 0.4563 0.4925 0.5194 0.5404 0.5574 0.5715 0.5834 0.5937 0.6026 0.6105 0.6174 0.6237 0.6294 0.6345 0.6392 0.6435 0.6475 0.6511 0.6545 0.6577 0.6606 0.6633 0.6659 0.6683 0.6706 0.6728 0.6748 0.6768 0.6786 0.6803 0.6820 0.6835 0.6850 0.6865 0.6878 0.6892 0.6904 0.6916 0.6928 0.6939 0.6949 0.6960 0.6969 0.6979 0.6988 0.6997 0.7006 0.7014 0.7022 0.150 0.4642 0.5025 0.5344 0.5589 0.5781 0.5937 0.6066 0.6176 0.6270 0.6353 0.6425 0.6490 0.6548 0.6600 0.6648 0.6691 0.6731 0.6767 0.6801 0.6832 0.6861 0.6888 0.6914 0.6938 0.6960 0.6981 0.7001 0.7020 0.7038 0.7055 0.7071 0.7086 0.7100 0.7114 0.7127 0.7140 0.7152 0.7164 0.7175 0.7185 0.7196 0.7205 0.7215 0.7224 0.7233 0.7241 0.7249 0.7257 0.7265 0.7272 0.850 27.6000 6.1282 3.7695 2.9496 2.5381 2.2907 2.1252 2.0063 1.9167 1.8465 1.7900 1.7434 1.7043 1.6710 1.6423 1.6173 1.5952 1.5757 1.5582 1.5424 1.5282 1.5152 1.5034 1.4925 1.4825 1.4733 1.4647 1.4568 1.4493 1.4424 1.4359 1.4298 1.4240 1.4186 1.4135 1.4087 1.4041 1.3998 1.3957 1.3917 1.3880 1.3844 1.3810 1.3778 1.3747 1.3717 1.3688 1.3661 1.3634 1.3609 0.875 39.8950 7.4639 4.3492 3.3131 2.8050 2.5040 2.3046 2.1625 2.0559 1.9728 1.9062 1.8515 1.8057 1.7667 1.7332 1.7040 1.6784 1.6556 1.6353 1.6171 1.6006 1.5856 1.5719 1.5594 1.5479 1.5372 1.5274 1.5182 1.5096 1.5017 1.4942 1.4872 1.4806 1.4744 1.4685 1.4630 1.4577 1.4527 1.4480 1.4435 1.4392 1.4351 1.4312 1.4275 1.4239 1.4205 1.4173 1.4141 1.4111 1.4082 0.900 62.5291 9.4662 5.1597 3.8036 3.1573 2.7812 2.5351 2.3614 2.2320 2.1317 2.0516 1.9861 1.9315 1.8852 1.8454 1.8108 1.7805 1.7537 1.7298 1.7083 1.6890 1.6714 1.6554 1.6407 1.6272 1.6147 1.6032 1.5925 1.5825 1.5732 1.5645 1.5564 1.5487 1.5415 1.5346 1.5282 1.5221 1.5163 1.5108 1.5056 1.5007 1.4959 1.4914 1.4871 1.4830 1.4790 1.4752 1.4716 1.4681 1.4648 0.925 111.429 12.8018 6.3972 4.5197 3.6577 3.1675 2.8519 2.6317 2.4693 2.3443 2.2451 2.1643 2.0973 2.0406 1.9922 1.9502 1.9134 1.8809 1.8521 1.8262 1.8029 1.7818 1.7625 1.7450 1.7288 1.7139 1.7002 1.6874 1.6755 1.6644 1.6541 1.6444 1.6352 1.6267 1.6186 1.6109 1.6037 1.5969 1.5904 1.5842 1.5783 1.5727 1.5674 1.5623 1.5574 1.5527 1.5483 1.5440 1.5399 1.5359 0.950 251.144 19.4707 8.5944 5.7170 4.4638 3.7743 3.3404 3.0428 2.8259 2.6609 2.5309 2.4259 2.3392 2.2663 2.2043 2.1507 2.1040 2.0629 2.0264 1.9938 1.9645 1.9380 1.9139 1.8920 1.8718 1.8533 1.8361 1.8203 1.8055 1.7918 1.7790 1.7670 1.7557 1.7451 1.7351 1.7257 1.7168 1.7084 1.7004 1.6928 1.6856 1.6787 1.6722 1.6659 1.6599 1.6542 1.6488 1.6435 1.6385 1.6337 0.975 1005.59 39.4730 14.0365 8.4111 6.1751 5.0125 4.3089 3.8398 3.5055 3.2554 3.0613 2.9063 2.7797 2.6742 2.5850 2.5085 2.4422 2.3842 2.3329 2.2873 2.2465 2.2097 2.1763 2.1460 2.1183 2.0928 2.0693 2.0477 2.0276 2.0089 1.9914 1.9752 1.9599 1.9456 1.9321 1.9194 1.9074 1.8961 1.8854 1.8752 1.8655 1.8563 1.8476 1.8392 1.8313 1.8236 1.8164 1.8094 1.8027 1.7963 0.990 6286.43 99.4769 26.4108 13.7452 9.2912 7.1432 5.9084 5.1156 4.5667 4.1653 3.8596 3.6192 3.4253 3.2657 3.1319 3.0182 2.9204 2.8354 2.7608 2.6947 2.6359 2.5831 2.5355 2.4923 2.4530 2.4170 2.3840 2.3535 2.3253 2.2992 2.2749 2.2522 2.2311 2.2112 2.1926 2.1751 2.1585 2.1430 2.1282 2.1142 2.1010 2.0884 2.0764 2.0650 2.0542 2.0438 2.0339 2.0244 2.0153 2.0066

294

Tabla de Cuantiles de la Distribucin F


Grados de libertad del numerador en extremo superior izquierdo, grados de libertad del denominador en margen izquierdo de cada fila. En el margen superior se lee P(F x) para los valores de x en el cuerpo de la tabla.
50 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 0.001 0.0818 0.1257 0.1578 0.1832 0.2040 0.2216 0.2368 0.2501 0.2619 0.2724 0.2819 0.2905 0.2983 0.3055 0.3122 0.3183 0.3240 0.3293 0.3343 0.3389 0.3433 0.3474 0.3513 0.3549 0.3584 0.3617 0.3648 0.3678 0.3706 0.3733 0.3759 0.3784 0.3807 0.3830 0.3852 0.3872 0.3892 0.3912 0.3930 0.3948 0.3965 0.3982 0.3998 0.4013 0.4028 0.4043 0.4057 0.4070 0.4083 0.4096 0.025 0.1873 0.2516 0.2950 0.3274 0.3530 0.3740 0.3917 0.4068 0.4200 0.4316 0.4420 0.4512 0.4596 0.4672 0.4742 0.4805 0.4864 0.4919 0.4970 0.5017 0.5061 0.5102 0.5141 0.5178 0.5212 0.5245 0.5276 0.5305 0.5333 0.5359 0.5384 0.5408 0.5431 0.5453 0.5474 0.5494 0.5514 0.5532 0.5550 0.5567 0.5584 0.5599 0.5615 0.5629 0.5644 0.5657 0.5671 0.5683 0.5696 0.5708 0.050 0.2479 0.3142 0.3584 0.3911 0.4166 0.4374 0.4547 0.4695 0.4823 0.4935 0.5035 0.5124 0.5204 0.5277 0.5344 0.5404 0.5461 0.5512 0.5560 0.5605 0.5647 0.5686 0.5722 0.5757 0.5789 0.5820 0.5849 0.5876 0.5902 0.5927 0.5951 0.5973 0.5995 0.6015 0.6035 0.6053 0.6071 0.6089 0.6105 0.6121 0.6136 0.6151 0.6165 0.6179 0.6192 0.6205 0.6217 0.6229 0.6241 0.6252 0.075 0.3024 0.3664 0.4094 0.4411 0.4658 0.4858 0.5024 0.5166 0.5288 0.5395 0.5490 0.5574 0.5650 0.5719 0.5782 0.5839 0.5892 0.5941 0.5986 0.6028 0.6067 0.6104 0.6138 0.6170 0.6201 0.6230 0.6257 0.6282 0.6307 0.6330 0.6352 0.6373 0.6393 0.6412 0.6430 0.6448 0.6464 0.6480 0.6496 0.6511 0.6525 0.6539 0.6552 0.6565 0.6577 0.6589 0.6600 0.6611 0.6622 0.6632 0.100 0.3560 0.4146 0.4552 0.4852 0.5086 0.5276 0.5433 0.5567 0.5682 0.5783 0.5872 0.5952 0.6023 0.6088 0.6147 0.6200 0.6250 0.6296 0.6338 0.6377 0.6414 0.6448 0.6480 0.6510 0.6538 0.6565 0.6591 0.6614 0.6637 0.6659 0.6679 0.6699 0.6717 0.6735 0.6752 0.6768 0.6784 0.6799 0.6813 0.6827 0.6840 0.6853 0.6865 0.6877 0.6888 0.6899 0.6910 0.6920 0.6930 0.6940 0.125 0.4108 0.4612 0.4984 0.5263 0.5481 0.5657 0.5804 0.5929 0.6037 0.6131 0.6214 0.6288 0.6355 0.6415 0.6470 0.6520 0.6566 0.6608 0.6647 0.6684 0.6718 0.6750 0.6779 0.6807 0.6834 0.6859 0.6882 0.6904 0.6925 0.6945 0.6964 0.6982 0.7000 0.7016 0.7032 0.7047 0.7061 0.7075 0.7088 0.7101 0.7113 0.7125 0.7137 0.7147 0.7158 0.7168 0.7178 0.7188 0.7197 0.7206 0.150 0.4679 0.5074 0.5403 0.5655 0.5855 0.6017 0.6152 0.6267 0.6366 0.6453 0.6530 0.6598 0.6660 0.6715 0.6766 0.6812 0.6854 0.6894 0.6930 0.6963 0.6995 0.7024 0.7052 0.7077 0.7102 0.7125 0.7146 0.7167 0.7186 0.7204 0.7222 0.7239 0.7255 0.7270 0.7284 0.7298 0.7311 0.7324 0.7336 0.7348 0.7359 0.7370 0.7381 0.7391 0.7400 0.7410 0.7419 0.7428 0.7436 0.7444 0.850 27.6716 6.1331 3.7678 2.9453 2.5322 2.2837 2.1173 1.9978 1.9075 1.8368 1.7797 1.7327 1.6932 1.6596 1.6305 1.6051 1.5828 1.5629 1.5451 1.5291 1.5147 1.5015 1.4894 1.4783 1.4681 1.4587 1.4500 1.4418 1.4342 1.4271 1.4205 1.4142 1.4083 1.4028 1.3975 1.3926 1.3879 1.3834 1.3792 1.3751 1.3713 1.3676 1.3641 1.3607 1.3575 1.3544 1.3515 1.3487 1.3459 1.3433 0.875 39.9973 7.4689 4.3460 3.3070 2.7973 2.4950 2.2947 2.1518 2.0446 1.9609 1.8938 1.8385 1.7923 1.7530 1.7191 1.6895 1.6636 1.6405 1.6199 1.6014 1.5846 1.5694 1.5555 1.5427 1.5309 1.5201 1.5100 1.5007 1.4919 1.4838 1.4761 1.4689 1.4622 1.4558 1.4498 1.4441 1.4387 1.4336 1.4288 1.4241 1.4197 1.4155 1.4115 1.4077 1.4040 1.4005 1.3971 1.3939 1.3908 1.3878 0.900 62.6878 9.4713 5.1546 3.7952 3.1471 2.7697 2.5226 2.3481 2.2180 2.1171 2.0364 1.9704 1.9153 1.8686 1.8284 1.7934 1.7628 1.7356 1.7114 1.6896 1.6700 1.6521 1.6358 1.6209 1.6072 1.5945 1.5827 1.5718 1.5617 1.5522 1.5433 1.5349 1.5271 1.5197 1.5127 1.5061 1.4999 1.4939 1.4883 1.4830 1.4779 1.4730 1.4684 1.4639 1.4597 1.4556 1.4517 1.4480 1.4444 1.4409 0.925 111.710 12.8068 6.3891 4.5079 3.6439 3.1524 2.8359 2.6149 2.4516 2.3260 2.2262 2.1449 2.0774 2.0203 1.9714 1.9289 1.8918 1.8590 1.8298 1.8036 1.7800 1.7586 1.7390 1.7212 1.7048 1.6896 1.6756 1.6627 1.6506 1.6393 1.6287 1.6188 1.6095 1.6007 1.5925 1.5847 1.5773 1.5703 1.5636 1.5573 1.5513 1.5455 1.5400 1.5348 1.5298 1.5250 1.5204 1.5160 1.5118 1.5078 0.950 251.774 19.4757 8.5810 5.6995 4.4444 3.7537 3.3189 3.0204 2.8028 2.6371 2.5066 2.4010 2.3138 2.2405 2.1780 2.1240 2.0769 2.0354 1.9986 1.9656 1.9360 1.9092 1.8848 1.8625 1.8421 1.8233 1.8059 1.7898 1.7748 1.7609 1.7478 1.7356 1.7241 1.7134 1.7032 1.6936 1.6845 1.6759 1.6678 1.6600 1.6526 1.6456 1.6389 1.6325 1.6264 1.6206 1.6150 1.6096 1.6044 1.5995 0.975 1008.09 39.4775 14.0099 8.3808 6.1436 4.9804 4.2763 3.8067 3.4719 3.2214 3.0268 2.8714 2.7443 2.6384 2.5488 2.4719 2.4053 2.3468 2.2952 2.2493 2.2081 2.1710 2.1374 2.1067 2.0787 2.0530 2.0293 2.0073 1.9870 1.9681 1.9504 1.9339 1.9184 1.9039 1.8902 1.8773 1.8652 1.8536 1.8427 1.8324 1.8225 1.8132 1.8043 1.7958 1.7876 1.7799 1.7724 1.7653 1.7585 1.7520 0.990 6302.26 99.4769 26.3544 13.6897 9.2377 7.0914 5.8577 5.0654 4.5167 4.1155 3.8097 3.5692 3.3752 3.2153 3.0814 2.9675 2.8694 2.7841 2.7092 2.6430 2.5838 2.5308 2.4829 2.4395 2.3999 2.3637 2.3304 2.2997 2.2713 2.2450 2.2205 2.1976 2.1763 2.1562 2.1374 2.1197 2.1030 2.0872 2.0723 2.0581 2.0447 2.0319 2.0198 2.0083 1.9972 1.9867 1.9766 1.9670 1.9578 1.9490

295

Tabla de Cuantiles de Rangos Estudentizados


Nmero de medias encabezando las columnas, grados de libertad del error encabezando filas (=0.05)
2 3 4 5 6 7 8 9 10 11 12 13 14 15 1 17.970 26.980 32.820 37.080 40.410 43.120 45.400 47.360 49.070 50.590 51.960 53.200 54.330 55.360 2 6.095 8.331 9.798 10.880 11.740 12.440 13.030 13.540 13.990 14.390 14.750 15.080 15.380 15.650 3 4.501 5.910 6.825 7.502 3.037 8.478 8.853 9.177 9.462 9.717 9.946 10.150 10.350 10.530 4 3.927 5.040 5.757 6.297 6.707 7.053 7.347 7.602 7.926 8.027 8.208 8.373 8.525 8.664 5 3.635 4.602 5.219 5.673 6.033 6.330 6.582 6.802 6.995 7.168 7.324 7.466 7.596 7.717 6 3.461 4.339 4.896 5.305 5.628 5.895 6.122 6.319 6.493 6.649 6.789 6.917 7.034 7.143 7 3.344 4.165 4.681 5.060 5.359 5.606 5.815 5.998 6.158 6.302 6.431 6.550 6.658 6.759 8 3.261 4.041 4.529 4.886 5.167 5.399 5.597 5.767 5.918 6.054 6.175 6.287 6.389 6.483 9 3.199 3.949 4.415 4.756 5.024 5.244 5.432 5.595 5.739 5.867 5.983 6.089 6.186 6.276 10 3.151 3.877 4.327 4.654 4.912 5.124 5.305 5.461 5.599 5.722 5.833 5.935 6.028 6.114 11 3.113 3.820 4.756 4.574 4.823 5.028 5.202 5.353 5.487 5.605 5.713 5.811 5.901 5.984 12 3.082 3.773 4.199 4.508 4.751 4.950 5.119 5.265 5.395 5.511 5.615 5.710 5.798 5.878 13 3.055 3.735 4.151 4.453 4.690 4.885 5.049 5.192 5.318 5.431 5.533 5.625 5.711 5.789 14 3.033 3.702 4.111 4.407 4.639 4.829 4.990 5.131 5.254 5.364 5.463 5.554 5.537 5.714 15 3.014 3.674 4.076 4.367 4.595 4.782 4.940 5.077 5.198 5.306 5.404 5.493 5.574 5.649 16 2.998 3.649 4.046 4.333 4.557 4.741 4.897 5.031 5.150 5.256 5.352 5.439 5.520 5.593 17 2.984 3.628 4.020 4.303 4.524 4.705 4.858 4.991 5.108 5.212 5.307 5.392 5.471 5.544 18 2.971 3.609 3.997 4.277 4.495 4.673 4.824 4.956 5.071 5.174 5.267 5.352 5.429 5.501 19 2.960 3.593 3.977 4.253 4.469 4.645 4.794 4.924 5.038 5.140 5.231 5.315 5.391 5.462 20 2.950 3.578 3.958 4.232 4.445 4.622 4.768 4.896 5.008 5.108 5.199 5.282 5.357 5.427 24 2.919 3.532 3.901 4.166 4.373 4.541 4.684 4.807 4.915 5.012 5.099 5.179 5.251 5.319 30 2.888 3.486 3.345 4.102 4.302 4.464 4.602 4.720 4.824 4.917 5.001 5.077 5.147 5.211 40 2.858 3.442 3.791 4.039 4.232 4.389 4.521 4.635 4.735 4.824 4.904 4.977 5.044 5.106 60 2.829 3.399 3.737 3.977 4.163 4.314 4.441 4.550 4.645 4.732 4.808 4.878 4.942 5.001 120 2.800 3.356 3.685 3.917 4.096 4.241 4.363 4.468 4.560 4.641 4.714 4.781 4.842 4.898 inf 2.772 3.314 3.633 3.858 4.030 4.170 4.286 4.387 4.474 4.552 4.622 4.685 4.743 4.796

16 17 18 19 20 22 24 26 28 30 1 56.320 57.220 58.040 58.430 59.560 60.910 62.120 63.220 64.230 65.150 2 15.910 16.140 16.370 16.570 16.770 17.130 17.450 17.750 18.020 18.270 3 10.690 10.840 10.980 11.110 11.240 11.470 11.680 11.870 12.050 12.210 4 8.794 8.914 9.028 9.134 9.233 9.418 9.584 9.736 9.875 10.000 5 7.828 7.932 8.030 8.122 8.708 8.368 8.512 8.643 8.764 8.875 6 7.244 7.338 7.426 7.508 7.587 7.730 7.861 7.979 8.088 8.189 7 6.852 6.939 7.020 7.097 7.170 7.303 7.423 7.533 7.634 7.728 8 6.571 6.653 6.729 6.802 6.870 6.995 7.109 7.212 7.307 7.395 9 6.359 6.437 6.510 6.579 6.644 6.763 6.871 6.970 7.061 7.145 10 6.194 6.269 6.339 6.405 6.467 6.582 6.686 6.781 6.868 6.948 11 6.062 6.134 6.202 6.265 6.326 6.436 6.536 6.628 6.712 6.790 12 5.953 6.023 6.089 6.151 6.209 6.317 6.414 6.503 6.585 6.560 13 5.862 5.931 5.995 6.055 6.112 6.217 6.312 6.398 6.478 6.551 14 5.786 5.852 5.915 5.974 6.029 6.132 6.224 6.309 6.387 6.459 15 5.720 5.785 5.846 5.904 5.958 6.059 6.149 6.233 6.309 6.379 16 5.662 5.727 5.786 5.843 5.897 5.995 6.084 6.166 6.241 6.310 17 5.612 5.675 5.734 5.790 5.842 5.940 6.027 6.107 6.181 6.249 18 5.563 5.630 5.688 5.743 5.794 5.890 5.977 6.055 6.128 6.195 19 5.528 5.589 5.647 5.701 5.752 5.846 5.932 6.009 6.081 6.147 20 5.493 5.553 5.610 5.663 5.714 5.807 5.891 5.968 6.039 6.104 24 5.381 5.439 5.494 5.545 5.594 5.683 5.764 5.838 5.906 5.968 30 5.271 5.327 5.379 5.429 5.475 5.561 5.638 5.709 5.774 5.833 40 5.163 5.216 5.266 5.313 5.358 5.439 5.513 5.581 5.642 5.700 60 5.056 5.107 5.154 5.199 5.241 5.319 5.389 5.453 5.512 5.566 120 4.950 4.998 5.044 5.086 5.126 5.200 5.266 5.327 5.382 5.434 inf 4.845 4.891 4.934 4.974 5.012 5.081 5.144 5.201 5.253 5.301

32 66.010 18.500 12.360 10.120 8.979 8.283 7.814 7.477 7.222 7.023 6.863 6.731 6.620 6.526 6.445 6.374 6.313 6.258 6.209 6.155 6.027 5.889 5.753 5.617 5.481 5.346

34 66.810 18.720 12.500 10.230 9.075 8.370 7.895 7.554 7.295 7.093 6.930 6.796 6.684 6.588 6.506 6.434 6.372 6.316 6.267 6.222 6.081 5.941 5.803 5.664 5.525 5.388

36 67.560 18.920 12.630 10.340 9.165 8.452 7.972 7.625 7.363 7.159 6.994 6.358 6.744 6.647 6.554 6.491 6.427 6.371 6.321 6.275 6.132 5.990 5.849 5.708 5.568 5.427

296

14 Respuestas a algunos ejercicios impares


Captulo 1

1.1:

Situacin A: 1) variables: nmero de ptalos de las flores de plantas de zapallo y produccin de semillas por planta de zapallo; 2) variables: amarilleo de las hojas de plantas de zapallo y dimetro de los ovarios. Situacin B: variables: clorosis del follaje y altura de plntulas de tabaco. Variables discretas: casos a, e y f; variables continuas casos: b, c, d y g. a)
17 15

1.3: 1.5:

N de em pl.

12 10 8 6 3 1 550 650 750 850 950 1050 1150

Salario

b) El 52.31%. No es el cuantil 0.80; c) El 47.69%; d) X0.50 $750; X0.30 $700. 1.7:


60000

Rend.
1000 Maz Soja Sorgo

Cultivo

297

Respuesta a algunos ejercicios impares

1.9:

a) Tabla de Distribucion de Frecuencias Variable Nm.dientes Nm.dientes Nm.dientes Nm.dientes 1 2 3 4 FA 2 12 8 3 FR 0.08 0.48 0.32 0.12 FAA 2 14 22 25 FRA 0.08 0.56 0.88 1.00

12

Frec.

1 1 2 3 4

Nm .dientes

b) El 8%; c) El 44%. 1.11: a) Se recomendara el hbrido Overa.


Estadstica Descriptiva
Hbridos GR80 Overa Variable Rend. Rend. n 40 44 Media 133.90 140.52 D.E. 11.44 10.54 Var 130.81 111.19 CV 8.54 7.50 Mn 110.00 115.00 Mx 152.00 158.00 Mediana 136.00 139.50

b)

12.00

14

9.75

11

Rend.

Rend.
113.5 120.5 127.5 134.5 141.5 148.5

7.50

5.25

3.00

1 118.6 125.7 132.9 140.1 147.3 154.4

GR80

Overa

298

Respuesta a algunos ejercicios impares

Captulo 2

2.1: a) = { (x,y) / x = 1, 2, . . ., 6; y = 1, 2, . . .,6 } ={(1,1);(1,2);(1,3);(1,4);(1,5);(1,6); (2,1);(2,2);(2,3);(2,4);(2,5);(2,6); (3,1) ; . . .; (3,6);(4,1); . . .;(4,6);(5,1); . . .;(5,6);(6,1); . . .;(6,6)} b) Es finito ya que # = 36 c) Si. Es una variable aleatoria discreta. 2.3: 2.5: 2.7: 2.9: A= { (x,y) : x = 2 y = 2 } B = { (x,y) : (x + y) 5 } a) = R+ b) Variable aleatoria continua. a) S, ya que A B = ; c) P(A B) = P(A) + P(B) - P(A B) Situacin A: P(A) 0 para todo evento A Situacin B: Si A, B, C y D son eventos mutuamente excluyentes y posibles en , luego: P(A) + P(B) + P(C) + P(D) = 1 pero en este caso no lo es ya que: P(A) + P(B) + P(C) + P(D) = 2.11:

9 45 27 46 >1 + + + 120 120 120 120

a) Denotando 1 al xito y 0 al fracaso del arranque se tiene que: = { (0,0,0,0); (0,0,0,1); (0,0,1,0); (0,1,0,0); (1,0,0,0); (0,0,1,1); (0,1,1,0); (1,1,0,0); (0,1,0,1); (1,0,1,0); (1,0,0,1); (0,1,1,1); (1,1,1,0); (1,0,1,1); (1,1,0,1); (1,1,1,1) } b) P({w}) = 1 16 4 1 = 16 4 1 4 6 11 + + = 16 16 16 16

c) X: A R donde A = { 0, 1, 2, 3, 4 } d) P(X = 3) =

P( X 2) = P(X = 0) + P(X = 1) + P( X = 2) =

299

Respuesta a algunos ejercicios impares

2.13:

P(A) =

2000 2000 2000 0.90 = N= = 2222 N N 0.90

Se debern adquirir 2222 plntulas.


Captulo 3

3.1: 3.3: 3.5: 3.7: 3.9: 3.11:

a) 0.9032 ; b) 1 ; c) 0.0968 ; d) 0.68268 ; e) 0.14988, f) 0 a) 0.3085 ; b) 0.383 a) x = 17.022 micrones ; b) el 75% de la distribucin de la variable dimetro de un sedimento, comprende valores menores o iguales a 17 micrones. a) 0.2266 ; b) 0.2902 La estrategia A produce un 52% de los frutos de la Categora II y la B un 55%. Se elige la estrategia B. a) 0.6554 ; b) 0.1357 ; c) 204 cajones con una ganancia de $530; d) 145 cajones con una ganancia de $370. No es beneficiosa su aplicacin.

Captulo 4

4.1:

a) = {11, 12, 13, 14, 15, 16, 21, 22, 23, 24, 25, 26, 31, 32, 33, 34, 35, 36, 41, 42, 43, 44, 45, 46, 51, 52, 53, 54, 55, 56, 61, 62, 63, 64, 65, 66}

V.A.: X 1 1.5 2 2.5 1. 2. 3. 4.

P( X =x)
1 36

V.A.: X 3 3.5 4 4.5 5. 6. 5. 4.

P( X =x)
1 36

V.A.: X 5 5.5 6 3. 2. 1.

P( X =x)
1 36

= 0.027 = 0.055 = 0.083 = 0.111

= 0.138 = 0.166 = 0.138 = 0.111

= 0.083 = 0.055 = 0.027

1 36
1 36

1 36
1 36

1 36
1 36

1 36

1 36

b)
300

Respuesta a algunos ejercicios impares

Grfico 4.1-a
0.063 0.17

Grfico 4.1-b

0.063

0.13

f(x)

0.063

f(x)
1 2 3 4 5 6

0.10

0.063

0.06

0.063

0.03 1 2 3 4 5 6

En el grfico 4.1-a, puede verse la distribucin de la variable x = nmero de puntos al arrojar un dado y en el grfico 4.1-b, la distribucin de la variable y= media del nmero de puntos al arrojar un par de dados. 4.3: 4.5: 4.7: 4.9: a) 0.0968 ; b) 7624 lts. a) 0.005 ; b) 7300 lts. a) 0.25 ; b) 0.05 0.15

Captulo 5

5.1: 5.3: 5.5:

a) [58.45 ; 61.55] si = 0.05; [57.96 ; 62.04] si = 0.01; b) [59.02 ; 60.98] amplitud = 1.96 ; c) [57.83 ; 62.17] amplitud = 4.34 a) n 32 ; b) n 55 a) si x = 24.1 el intervalo ser: [23.12 ; 25.08] amplitud = 1.96; si x = 25.5 el intervalo ser: [24.52 ; 26.48] amplitud = 1.96; si x = 23 el intervalo ser: [22.02 ; 23.98] amplitud = 1.96; si x = 24 el intervalo ser: [23.02 ; 24.98] amplitud = 1.96; si x = 25.9 el intervalo ser: [24.92 ; 26.88] amplitud = 1.96 b) si x = 24.5 el intervalo ser: [24.06 ; 24.96] amplitud = 0.88 c) La amplitud de las muestras individuales es mayor que la amplitud del intervalo de la muestra mayor.

5.7:

a) n 18; b) n 71

Captulo 6

6.1:

a) Descartar H0, Z=3.33; b) LI=17.06; LS=22.94; c) Se rechaza H0;


301

Respuesta a algunos ejercicios impares

d) LI=16.14,S=23.86; e) Se rechaza H0. La media es mayor que 15. 6.3: 6.5: a) Se aceptar incorrectamente la hiptesis nula 38 de cada 100 veces. b) Aumentando el tamao de la muestra. a) H0: = 45 H1: >45. b) T= 4.86. t19,0.99=2.539. Se rechaza H0. c) No se justifica realizar un clculo de potencia ya que se rechaz H0.
Captulo 7

7.1: 7.3:

a) Unilateral derecha. b) X = 221.63 a) Para la prueba H0: 2 25 vs. H1: 2 < 25, con = 0.10, el valor del estadstico calculado es 3.4, el punto crtico es 4.1682 por lo que se rechaza la hiptesis nula, lo que implica que la maquina cumple con esta especificacin. b) El intervalo unilateral derecho, para 1- = 0.90, tiene LS = 20.35. a) Al construir un intervalo unilateral derecho se obtiene LS = 0.0036, por lo que el suelo se considera homogneo. a) P=0.85 b) 0.4958 c) 6.6079

7.5: 7.7:

7.9:

a) Para la prueba H0: Nuevo Control vs. H1: Nuevo >Control, con = 0.10, el valor del estadstico calculado es 1.02. No se rechaza la hiptesis nula. b) Muestras independientes provenientes de distribuciones normales con varianzas homogneas. c) El intervalo bilateral para Nuevo -Control, con 1- = 0.90, tiene LI= -2.64 y LS= 9.44.

7.11:

Para la prueba H0: con poda = sin poda vs. H1: con poda sin poda, con =0.05, T=1.23. No hay evidencias suficientes para rechazar H0, por lo tanto no hay efecto de la poda en el dimetro de los fustes. El valor del estadstico es T=7.25. Se rechaza la hiptesis nula. Para la prueba H0: H1 = H2 vs. H1: H1 H2, con = 0.05, T= -4.98. Se

7.13: 7.15:
302

Respuesta a algunos ejercicios impares

rechaza H0.
Captulo 8

8.1:

a) H0: 1 = 2 = ...= 6 = 0 versus H1: al menos un tratamiento tiene efecto no nulo b) Cuadro de Anlisis de la Varianza
F.V. Modelo Cepas Error Total Cepas 5.00 3.00 6.00 4.00 2.00 1.00 SC 847.05 847.05 282.93 1129.97 Medias 13.26 14.64 18.70 19.92 23.98 28.82 gl 5 5 24 29 N 5 5 5 5 5 5 CM 169.41 169.41 11.79 F 14.37 14.37 p 0.00 0.00

c) Test : Tukey (DMS = 6.71)


A A A A

B B B

C C

Letras distintas indican diferencias significativas(p<=0.05)

8.3:

a) Yij = + i + ij donde: Yij = es la j-sima observacin de materia seca bajo la i-sima carga animal. = media general de materia seca. i = efecto de la i-sima carga animal. ij = variable aleatoria normal, independientemente distribuida con esperanza cero y varianza 2 i j. b) ij estn normal e independientemente distribuidos con esperanza cero y varianza 2 c)Cuadro de Anlisis de la Varianza
F.V. Modelo Cargas Error Total SC 4.69 4.69 3.81 8.50 gl 3 3 24 27 303 CM 1.56 1.56 0.16 F 9.84 9.84 p 0.00 0.00

Respuesta a algunos ejercicios impares

Test : Tukey (DMS = 0.58) Cargas 8.00 2.00 6.00 4.00 Medias 2.39 2.47 2.60 3.41 n 7 7 7 7 A A A B

Letras distintas indican diferencias significativas(p<=0.05)

Se recomienda la carga animal de 4 novillos/ha. 8.5: b) Cuadro de Anlisis de la Varianza


F.V. Modelo Fertil Error Total Fertil Control C A B SC 410.80 410.80 76.40 487.20 Medias 21.20 26.00 31.80 32.20 gl 3 3 16 19 n 5 5 5 5 A B C C CM 136.93 136.93 4.78 F 28.68 28.68 p 0.00 0.00

Test: Tukey (DMS = 3.96)

Letras distintas indican diferencias significativas(p<=0.05)

Se recomienda fertilizar. c) Los tratamientos A y B son los que producen mayores rindes y no difieren estadsticamente. Luego se recomienda cualquiera de los dos. 8.7:
2 (n1 1)S12 + ... + (na 1)Sa = 9 ( 0.032 ) +...+9 ( 0.020 ) =0.019 CMDentro= 54 (n1 1) + ... + (na 1)

2 CMEntre = S x .n = 0.075x10 = 0.75; Captulo 9

Fobs.= 39.5.

9.1: 9.3:

a = 6.05; b = 0.83; Fobs: 271.13 a = 8.69; b = 0.722; Fobs: 25.409

Captulo 10

10.1: a)
304

Estadstica Descriptiva

Respuesta a algunos ejercicios impares

Supl A1 A2 B1 B2 C

Variable prot prot prot prot prot

n 6 6 6 6 6

Media 3.16 3.15 3.34 3.38 3.24

D.E. 0.12 0.15 0.09 0.12 0.13

Var 0.01 0.02 0.01 0.01 0.02

b)

Anlisis de la Varianza Variable N R^2 prot 30 0.86 Cuadro de Anlisis F.V. SC gl Modelo 0.55 9 bl 0.29 5 supl 0.26 4 Error 0.09 20 Total 0.64 29 Test : Tukey Supl Medias A2 3.15 A1 3.16 C 3.24 B1 3.34 B2 3.38 n 6 6 6 6 6 de la CM 0.06 0.06 0.07 0.00

R^2ajust 0.80 Varianza F p 13.76 0.00 13.00 0.00 14.72 0.00

A A A

B B

C C

Letras distintas indican diferencias significativas(p<=0.05)

10.3: b)
35.00 33.33 31.67 30.00 28.33 26.67 25.00 16.00

Machos

Media-largo

Hembras

19.00

22.00

25.00

28.00

Temperatura

c)

Anlisis de la Varianza
Variable Largo N 32 R^2 0.80 R^2ajust 0.74

Cuadro de Anlisis de la Varianza


305

Respuesta a algunos ejercicios impares F.V. Modelo Temp Sexo Temp*Sexo Error Total SC 192.98 27.99 155.32 9.66 48.37 241.34 gl 7 3 1 3 24 31 CM 27.57 9.33 155.32 3.22 2.02 F 13.68 4.63 77.07 1.60 p 0.00 0.01 0.00 0.22

Test : Tukey
Temp 28.00 25.00 16.00 21.00 Medias 27.06 28.53 29.29 29.41 n 8 8 8 8 A A B B B

Letras distintas indican diferencias significativas(p<=0.05)

Captulo 11

11.1: 11.3: 11.5:

2=26.90; =2 2=10.39; =2 2=1.467; =3

306

Esta obra termin de imprimir en el mes de marzo de 2001 en Editorial Triunfar S.A. La Rioja 33 5to Piso Of. 7 Crdoba, Argentina