Vous êtes sur la page 1sur 281

Estadstica y diseo de experimentos

I
Universidad Nacional de Ingeniera
Editorial Universitaria
Cecilia Ros Varillas
Estadstica y diseo
de experimentos
Cecilia Ros Varillas
II
Rector Dr. Ing. Aurelio Padilla Ros
Primer Vicerrector Geol. Jos S. Martnez Talledo
Segundo Vicerrector Msc. Ing. Walter Zaldvar lvarez
Primera edicin, setembre de 2012
Estadstca y diseo de experimentos
Impreso en el Per / Printed in Peru
Cecilia Ros Varillas
Derechos reservados
Derechos de edicin
Universidad Nacional de Ingeniera
Editorial Universitaria
Av. Tpac Amaru 210, Rmac Lima
Pabelln Central / Stano
Telfs. 4814196 / 4811070 anexo 215
Correo-e: eduni@uni.edu.pe
Jefe EDUNI: Prof. lvaro Montao Freire
Coordinador Editorial: Nilton Zelada Minaya
Impreso en la Imprenta de la Editorial Universitaria de la
Universidad Nacional de Ingeniera
ISBN ....
Hecho el Depsito Legal en la Biblioteca Nacional del Per
N 2011-13203
Prohibida la reproduccin de este libro por cualquier medio,
total o parcialmente, sin permiso expreso del autor.
Estadstica y diseo de experimentos
III
Palabras liminares
Me complace felicitar a los docentes de nuestra Universidad ganadores del II
Concurso para la Publicacin de Libros de Texto convocado por el Rectorado
y realizado en cada una de las Facultades. Una de las polticas medulares del
Rectorado es la permanente mejora en la calidad acadmica, y en ese sentido nos
interesa que cada docente tenga la oportunidad de convertir su labor cotidiana
de enseanza en textos para uso de los estudiantes universitarios de todo el pas.
Los autores han hecho un meritorio esfuerzo para organizar los temas de sus
exposiciones, realizando investigaciones y consultando fuentes peruanas y ex-
tranjeras, as como recogiendo el fruto del dilogo con sus colegas y los propios
estudiantes. Asimismo, se han esmerado en presentar sus cursos de manera que
facilita el acceso por parte de los interesados.
La publicacin de textos acadmicos es una de las obligaciones de toda universi-
dad y uno de los ndices que se toma en cuenta para la evaluacin de la calidad
acadmica. Por ende, seguiremos apoyando la publicacin de libros y revistas a
travs de nuestra Editorial Universitaria, cuya meta es formar parte del liderazgo
peruano en la industria editorial dedicada a ingeniera, ciencia y arquitectura.
Es responsabilidad de la Universidad Nacional de Ingeniera aportar al Per un
liderazgo de base tecnolgica que trabaje en estrecha asociacin con las autorida-
des gubernamentales, los dirigentes empresariales y la sociedad civil en su con-
junto, lo cual requiere de una poltica editorial y de publicaciones que estamos
impulsando.
Dr. Ing. Aurelio Padilla Ros
Rector
Cecilia Ros Varillas
IV
Estadstica y diseo de experimentos
V
Agradecimientos
Quisiera comenzar agradeciendo a mi esposo Luis y a mis hijas
Ana Cecilia, Claudia y Vanessa, por su apoyo incondicional
para hacer este libro una realidad.
A mi madre Anita, hermanos y a la memoria de mi padre La-
dislao Rios, quien me dej, el mejor de los legados: la docencia.
Un agradecimiento muy especial al Mg. Jorge Chue Gallardo,
mi primer profesor de Estadstica, quien forj en m la vocacin
a esta carrera maravillosa y adems por su aporte incondicional
en la presentacin de este texto.
A la seorita Claudia Oscanoa Ros, Bachiller en Ingeniera
Estadstica, por su colaboracin en la edicin y la revisin final
del libro.
A todos mis alumnos, por sus deseos de superacin que moti-
van e inspiran mi labor docente.
Cecilia Ros Varillas
VI
Estadstica y diseo de experimentos
VII
ndice
Presentacin ...............................................................................................................XIII
Introduccin ................................................................................................................XV
Captulo 1
Conceptos bsicos en estadstica ............................................................................... 1
1.1. Definicin y divisin de la estadstica ................................................................ 1
1.1.1. Estadstica ........................................................................................................... 1
1.1.2. Divisin de la Estadstica ................................................................................... 1
1.2. Conceptos fundamentales en estadstica ............................................................ 2
1.2.1. Poblacin .............................................................................................................. 2
1.2.2. Muestra ................................................................................................................. 2
1.2.3. Parmetro ............................................................................................................. 3
1.2.4. Estadgrafo ........................................................................................................... 3
1.2.5. Dato ....................................................................................................................... 3
1.2.6. Unidad Elemental ............................................................................................... 3
1.3. Variable .................................................................................................................... 3
1.3.1. Variable Cualitativa ............................................................................................ 3
1.3.2. Variable Cuantitativa .......................................................................................... 4
1.4. Ejercicios desarrollados ......................................................................................... 5
1.5. Ejercicios propuestos ............................................................................................. 7
Captulo 2
Estadstica descriptiva ................................................................................................. 9
2.1 Organizacin y presentacin de los datos ........................................................... 9
2.2 Tabla de frecuencias cuando la variable es cualitativa ...................................... 9
2.3 Tabla de frecuencias cuando la variable es cuantitativa .................................. 11
2.3.1 Tabla de Frecuencias cuando la variable es cuantitativa discreta ............... 12
Cecilia Ros Varillas
VIII
2.3.2 Tabla de Frecuencias cuando la variable es cuantitativa continua ............. 13
2.4 Medidas descriptivas ............................................................................................ 17
2.4.1 Medidas de Tendencia Central ......................................................................... 17
2.4.2 Medidas de Dispersin...................................................................................... 26
2.5 Aplicacin usando el paquete estadstico minitab ........................................... 31
2.6 Ejercicios desarrollados ........................................................................................ 37
2.7 Ejercicios propuestos ............................................................................................ 48
Captulo 3
Probabilidades ............................................................................................................ 51
3.1 Definiciones bsicas .............................................................................................. 51
3.1.1 Experimento ........................................................................................................ 51
3.1.2 Espacio muestral ........................................................................................... 52
3.1.3 Evento o suceso .................................................................................................. 52
3.2 Tcnicas de conteo ................................................................................................. 54
3.2.1 Principio de adicin ........................................................................................... 54
3.2.2 Principio de multiplicacin .............................................................................. 55
3.2.3 Permutacin ........................................................................................................ 55
3.2.4 Permutacin Circular ......................................................................................... 56
3.2.5 Combinacin ....................................................................................................... 57
3.2.6 Ejercicios de Conteo ........................................................................................... 57
3.3 Probabilidad ........................................................................................................... 59
3.3.1 Enfoque Clsico (Probabilidad de un Evento) ............................................... 59
3.3.2 Enfoque Emprico .............................................................................................. 60
3.4 Axiomas de probabilidad ..................................................................................... 60
3.5 Propiedades de probabilidad .............................................................................. 60
3.6 Probabilidad condicional ..................................................................................... 62
3.6.1 Definicin de probabilidad condicional ......................................................... 62
3.6.2 Propiedades de probabilidad condicional...................................................... 63
3.6.3 Tipos de muestreo .............................................................................................. 65
3.6.4 Teorema de multiplicacin de probabilidades (probabilidad conjunta).... 66
3.7 Eventos independientes ....................................................................................... 67
3.8 Particin del espacio muestral ............................................................................ 68
3.9 Ecuacin de la probabilidad total ....................................................................... 69
3.10 Teorema de Bayes ................................................................................................ 71
3.11 Ejercicios desarrollados ...................................................................................... 72
3.12 Ejercicios propuestos .......................................................................................... 83
Estadstica y diseo de experimentos
IX
Captulo 4
Variable aleatoria ....................................................................................................... 89
4.1 Definicin ............................................................................................................... 89
4.2 Variable aleatoria discreta .................................................................................... 90
4.2.1 Funcin de probabilidad (Distribucin de probabilidades) de la
variable aleatoria discreta ................................................................................. 90
4.2.2 Funcin de distribucin (acumulada) de la variable aleatoria discreta ..... 91
4.3 Variable aleatoria continua .................................................................................. 93
4.3.1 Funcin de probabilidad de la variable aleatoria continua ......................... 93
4.3.2 Funcin de distribucin (acumulada) de la variable aleatoria continua ... 94
4.4 Valor esperado y varianza de la variable aleatoria .......................................... 96
4.4.1 Valor esperado de la variable aleatoria ........................................................... 96
4.4.2 Varianza de la variable aleatoria ...................................................................... 98
4.5 Ejercicios desarrollados ...................................................................................... 100
4.6 Ejercicios propuestos .......................................................................................... 109
Captulo 5
Distribucin de probabilidades ............................................................................ 113
5.1 Distribuciones discretas notables ..................................................................... 113
5.1.1 Distribucin Binomial ..................................................................................... 113
5.1.2 Distribucin de Poisson ................................................................................... 116
5.1.3 Distribucin Hipergeomtrica ....................................................................... 119
5.2 Distribuciones continuas notables .................................................................... 120
5.2.1 Distribucin Uniforme .................................................................................... 120
5.2.2 Distribucin exponencial ................................................................................ 121
5.2.3 Distribucin Normal o Gaussiana ................................................................. 123
5.2.4 Distribuciones relacionadas con la normal, distribuciones para
muestras pequeas .......................................................................................... 129
5.3 Ejercicios desarrollados ...................................................................................... 133
5.4 Ejercicios propuestos .......................................................................................... 140
Captulo 6
Muestreo aleatorio y distribuciones en el muestreo ......................................... 143
6.1 Definiciones bsicas ............................................................................................ 143
6.1.1 Distribucin muestral ...................................................................................... 143
6.1.2 Muestra aleatoria.............................................................................................. 143
6.1.3 Error en el muestreo ........................................................................................ 144
6.2 Distribucin de la media muestral ................................................................... 144
Cecilia Ros Varillas
X
6.2.1 Teorema 1. La media y la varianza de las medias muestrales ................... 144
6.2.2 Teorema 2. Distribucin de la media muestral cuando la poblacin
es normal ........................................................................................................... 145
6.2.3 Teorema 3. Teorema del lmite central .......................................................... 145
6.3 Distribuciones muestrales de los estimadores ............................................... 146
6.3.1 Distribucin de la media muestral cuando la varianza poblacional
X
es conocida ........................................................................................................ 146
6.3.2 Distribucin de la media muestral cuando la varianza poblacional
x

no es conocida .................................................................................................. 147
6.3.3 Distribucin de la varianza muestral S
2
........................................................ 148
6.3.4 Distribucin de la diferencia de medias muestrales si
1
y
2

son
conocidas ........................................................................................................... 149
6.3.5 Distribucin de la diferencia de medias muestrales si
1
y
2


no son
conocidas ........................................................................................................... 149
6.4 Ejercicios desarrollados ...................................................................................... 150
6.5 Ejercicios propuestos .......................................................................................... 156
Captulo 7
Inferencia estadstica ............................................................................................... 159
7.1 Definicin de la estadstica inferencial ............................................................ 159
7.2 Objetivos de la inferencia estadstica ............................................................... 160
7.3 Estimacin de parmetros ................................................................................. 160
7.3.1 Estimacin puntual .......................................................................................... 161
7.3.2 Estimacin por intervalos (Lmites de Confianza) ...................................... 162
7.4 Prueba o contraste de hiptesis......................................................................... 170
7.4.1 Tipos de errores ................................................................................................ 171
7.4.2 Tipos de prueba ................................................................................................ 171
7.4.3 Pasos necesarios para realizar una prueba de hiptesis a un parmetro .... 172
7.4.4 Prueba de hiptesis para los parmetros ...................................................... 173
7.5 Ejercicios desarrollados ...................................................................................... 179
7.6 Ejercicios propuestos ......................................................................................... 192
Captulo 8
Diseos experimentales .......................................................................................... 195
8.1 Definicin e importancia del diseo experimental ........................................ 195
8.2 Pasos a seguir en el diseo de experimentos ................................................. 196
8.3 Definiciones bsicas ............................................................................................ 196
8.4 Principios bsicos del diseo experimental .................................................... 198
8.5 Anlisis de varianza (anva) ................................................................................ 199
2
2
2 2
2 2
Estadstica y diseo de experimentos
XI
8.6 Modelo matemtico ............................................................................................ 200
8.7 Tipos de modelos estadsticos ........................................................................... 200
8.8 Diseos bsicos .................................................................................................... 201
8.9 Diseo completamente aleatorio o al azar (DCA) .......................................... 201
8.9.1 Caractersticas del diseo completamente al azar ...................................... 202
8.9.2 Modelo aditivo lineal en el diseo completamente aleatorio .................... 202
8.9.3 Representacin simblica de los datos en el diseo completamente
aleatorio ............................................................................................................. 202
8.9.5 Prueba de Homogeneidad de varianzas ....................................................... 207
8.10 Diseo bloque completamente al azar (DBCA) ............................................ 209
8.10.1 Caractersticas del diseo bloque completamente al azar ....................... 210
8.10.2 Modelo aditivo lineal en el diseo bloque completamente aleatorio ..... 210
8.10.3 Representacin simblica de los datos en el diseo bloque
completamente aleatorio .............................................................................. 211
8.10.4 Anlisis de varianza en el diseo bloque completamente aleatorio ....... 211
8.11 Diseo cuadrado latino (DCL) ........................................................................ 215
8.11.1 Caractersticas del diseo cuadrado latino................................................. 215
8.11.2 Modelo aditivo lineal en el diseo cuadrado latino .................................. 216
8.11.3 Anlisis de varianza en el diseo cuadrado latino .................................... 216
8.12 Diseos estadsticos usando Minitab ............................................................. 220
8.13 Ejercicios desarrollados .................................................................................... 226
8.14 Ejercicios propuestos ........................................................................................ 241
Glosario ...................................................................................................................... 247
Bibliografa ................................................................................................................ 249
Anexos ........................................................................................................................ 251
Anexo 1. Tabla funcin de distribucin acumulativa distribucin
t-student F(t)=P(Tt) ................................................................................................. 251
Anexo 2. Tabla de la funcin de distribucin acumulativa normal
estndar P(Zz)=F(z) ................................................................................................ 253
Anexo 3. Tabla de la funcin de distribucin acumulativa distribucin
ji-cuadrado ................................................................................................................. 255
Anexo 4. Tabla de valores de la distribucin F para una probabilidad
acumulada de 0,99 ................................................................................................. 258
Anexo 5. Tabla de valores de la distribucin F para una probabilidad
acumulada de 0,95 ................................................................................................... 261
Cecilia Ros Varillas
XII
ndice de Figuras
Figura 2.1. Diagrama de Barras ................................................................................. 10
Figura 2.2. Diagrama por sectores circulares .......................................................... 11
Figura 2.3. Histograma de Frecuencias .................................................................... 16
Figura 3.1. Particin del espacio muestral ............................................................... 68
Figura 3.2. Probabilidad Total ................................................................................... 69
Figura 3.3. Diagrama de rbol .................................................................................. 70
Figura 4.1. Dominio y rango de la variable aleatoria ............................................. 89
Figura 4.2. Funcin de Densidad f ............................................................................ 93
Figura 5.1. Distribucin Binomial ........................................................................... 114
Figura 5.2. Distribucin Uniforme .......................................................................... 121
Figura 5.3. Distribucin Exponencial ..................................................................... 122
Figura 5.4. Grfica de la funcin de probabilidad de Distribucin Normal .... 124
Figura 5.5. Grficos de la normal, con probabilidades notables ........................ 125
Figura 5.6. Distribucin Normal Estndar ............................................................ 126
Figura 5.7. Distribucin Chi-Cuadrado ................................................................. 131
Figura 5.8. Distribucin T ........................................................................................ 132
Figura 5.9. Distribucin F ......................................................................................... 133
Figura 7.1. Intervalo de confianza .......................................................................... 163
Figura 7.2. Regiones crticas de una media
X
con varianza conocida .............. 174
Figura 7.3. Regiones crticas de una media
X
con varianza desconocida ........ 175
Figura 7.4. Prueba de Hiptesis para la varianza poblacional
X
...................... 178
Figura 7.5. Regiones crticas en la prueba de homogeneidad de varianzas ..... 179
Figura 8.1. Regiones crticas en el diseo completamente aleatorio .................. 205
Figura 8.2. Regiones crticas en el diseo bloque completamente aleatorio .... 212
ndice de cuadros y tablas
Cuadro 2.1. Tabla de Frecuencias por intervalos de clase ..................................... 15
Cuadro 5.1. Cuadro de Conversiones .................................................................... 128
Cuadro 7.1. Tipos de Errores ................................................................................... 171
Cuadro 8.1. Agrupacin de resultados del experimento en el diseo
completamente aleatorio .................................................................... 203
Tabla 1. ANVA Diseo Completo Aleatorio (Igual nmero de u.e. por
tratamiento) ................................................................................... 204
Tabla 2. ANVA Diseo Completo Aleatorio (diferente nmero de u.e. por
tratamiento) ................................................................................... 204
Cuadro 8.2 . Representacin simblica de los datos en el diseo bloque
completamente aleatorio ................................................................... 211
Tabla 3 Anlisis de varianza para un diseo bloque completo al azar ............. 212
Tabla 4 Anlisis de varianza en el diseo cuadrado latino ................................. 217
Estadstica y diseo de experimentos
XIII
Presentacin
El presente libro nace como producto de la dedicacin y experiencia docente en
el dictado del curso de Estadstica. Esta primera edicin presenta aspectos fun-
damentales de los temas tratados en el nivel pregrado en la Universidad Nacio-
nal de Ingeniera, donde a travs de los aos adquir la conviccin de que era
necesario presentar en palabras simples los temas estadsticos que toda persona
debe conocer y con mayor razn nuestros alumnos, quienes son el motor de todo
docente que tiene la vocacin de ensear y trasmitir conocimientos.
En este libro se presentan temas muy importantes que va a permitir darle luego
al estudiante una visin de lo que puede hacer cuando tenga que realizar alguna
investigacin, sobre todo cuando tenga que planificar y elegir el diseo ms acor-
de al estudio que desee realizar.
Esta edicin ha sido diseada de manera tal que sea til para diferentes finalidades,
como un libro de consulta, que imparte teora y prctica de la Estadstica Bsica.
Algo muy importante que quiero resaltar, es que la mayora de ejercicios desa-
rrollados y propuestos en este texto son ejercicios aplicados a la qumica y a la
manufactura textil, ya que soy docente de la Facultad de Ingeniera Qumica y
Textil de la UNI por ms de 20 aos; sin embargo, alumnos de nivel de pregrado
de cualquier especialidad tambin podrn buscar asesora en este libro sin nin-
guna dificultad.
Hoy en da con el avance de la tecnologa, la Estadstica tambin se ha moderni-
zado. Actualmente se conocen muchos paquetes estadsticos que ayudan a sim-
plificar procedimientos extensos, lo cual permite ahorrar tiempo. En el presente
texto muestra el uso del Minitab que permitir al alumno resolver situaciones
en Estadstica Descriptiva y en Diseos de Experimentos. Las interpretaciones y
deducciones debern ser realizadas por el alumno.
Finalmente, espero que este texto cumpla con el objetivo personal que me trac,
de compartir conocimientos y experiencias que vayna ms all de las aulas y que
permita al lector entender la estadstica como base para el anlisis de sus futuras
investigaciones.
Cecilia Ros Varillas
XIV
Estadstica y diseo de experimentos
XV
Introduccin
En un intento de captar que la Estadstica puede ser un campo interesante y es-
timulante que toca muchsimos aspectos de gran importancia en nuestra vida
diaria y en toda rama del saber humano, como son las ciencias e ingeniera, es
necesario presentar un libro que adems de contener los conceptos tericos, sea
instructivo y legible con nfasis en datos qumicos y textiles. Por esta razn el
presente texto incluye definiciones bsicas y un gran nmero de ejemplos y ejer-
cicios, para demostrar que la estadstica no es slo presentar frmulas abstractas
que tienen muy escasa relacin con la aplicacin prctica.
En todo trabajo que involucre recopilacin de datos, la informacin recolectada
debe ordenarse para lograr una correcta presentacin del informe, para ello con-
tamos con las tablas de frecuencias y los grficos estadsticos. Es as que se ha
dado un lugar importante a la Estadstica Descriptiva, a pesar de que no se pre-
tenda que las tcnicas de la Estadstica Descriptiva representen algo que sobre-
pase los fundamentos del anlisis estadstico, es necesario dominar stas tcnicas
para la comprensin y la aplicacin de los conceptos y procedimientos relaciona-
dos con la Inferencia Estadstica.
En muchos problemas de tipo prctico es imposible probar u observar la tota-
lidad de los elementos que intervienen y por consiguiente es necesario recurrir
al muestreo, as se miden o consideran las propiedades de una muestra con el
objeto de estimar las caractersticas de la poblacin de donde se extrajo la mues-
tra. No slo es conveniente tomar la muestra representativa de la poblacin, sino
tambin de que la conclusin a la que lleguemos es slo probablemente correcta,
no se puede tener una certeza total con base en el muestreo.
De lo anterior se deduce que el estudio de la estadstica y probabilidades estn
fundamentalmente relacionados entre s. En tanto que la Estadstica se interesa
en gran medida en deducir conclusiones a partir de muestras alteradas por va-
riaciones aleatorias o incertidumbres, mediante la teora de probabilidades se
pueden definir cmo controlar tales incertidumbres en los resultados.
Cecilia Ros Varillas
XVI
Es muy importante que todo ingeniero, cuando pretenda realizar una investiga-
cin, planifique adecuadamente sus procedimientos y pasos a seguir, esto quiere
decir que disee un buen plan de accin. En este texto, se presenta tambin
de manera simple y muy prctica los diseos bsicos que ms se aplican en las
investigaciones.
Este libro incluye en su mayora los apuntes de las clases que he elaborado y pre-
sentado a los alumnos de la Facultad de Ingeniera Qumica y Textil de la UNI,
en ms de 20 aos de labor docente. Por tal motivo, sirve como una gua tan-
to terica como prctica para todo alumno que necesite de la estadstica bsica.
Asimismo los ejercicios desarrollados y propuestos representan en su mayora a
aquellos evaluados en prcticas calificadas y exmenes.
Estadstica y diseo de experimentos
1
El trmino alemn statistik, que fue primeramente introducido por Gottfried
Achenwall (1749), designaba originalmente el anlisis de datos del Estado, es
decir, la "ciencia del Estado". Por lo que la Estadstica estuvo asociada en un prin-
cipio a los Estados, para ser utilizados por el gobierno y cuerpos administrativos
(a menudo centralizados). En la actualidad, la coleccin de datos acerca de esta-
dos y localidades contina ampliamente a travs de los servicios de estadsticas
nacionales e internacionales. En particular, los censos suministran informacin
de toda la poblacin. Esto fue base para la estadstica moderna, que rene la
estadstica matemtica y el anlisis de datos, con el fin de resolver y obtener con-
clusiones vlidas y objetivas a partir de los resultados de una muestra.
En este primer captulo iniciaremos con definiciones bsicas en estadstica, necesa-
rias para una correcta comprensin de los temas a tratar en los siguientes captulos,
siendo una definicin muy importante lo que corresponde a variable, ya que sta
representa la caracterstica que se desea estudiar o analizar, sobre todo de aquellas
variables que se usan con ms frecuencias en los anlisis qumicos y textiles.
Es importante enfatizar la diferencia entre una poblacin de variables cuantitati-
vas y una poblacin de variables categricas.
1.1. DEFINICIN Y DIVISIN DE LA ESTADSTICA
1.1.1. Estadstica
Es una ciencia aplicada a cualquier rama del saber humano y se encarga de los
mtodos y procedimientos para recopilar, ordenar, clasificar y presentar una
informacin llamada muestra, con el fin de inferir acerca del comportamiento de
la poblacin respectiva.
1.1.2. Divisin de la Estadstica
Estadstica Descriptiva. Es la parte de la estadstica que se encarga de recopilar,
ordenar, clasificar y presentar una informacin llamada muestra.
Los resultados de un anlisis no pretenden ir ms all del conjunto de datos.
Conceptos bsicos en estadstica
CAPTULO 1
Cecilia Ros Varillas
2
Estadstica Inferencial. Es la parte de la estadstica que se encarga de inferir (es-
timar, predecir) el comportamiento de la poblacin a partir de una muestra, con-
siderando un margen de error o incertidumbre que es cuantificado por la teora
de probabilidades.
1.2. CONCEPTOS FUNDAMENTALES EN ESTADSTICA
1.2.1. Poblacin
Es un conjunto de observaciones que tienen una caracterstica en comn, la cual
se desea estudiar, la poblacin representa la totalidad de elementos de un deter-
minado estudio. La poblacin puede ser finita (cuando se conoce la totalidad de
elementos y se representa por N) o infinita (cuando no se puede determinar la
cantidad de elementos que conforma la poblacin).
Una poblacin estadstica es entonces un conjunto de observaciones medidas o
descritas, para cada una de sus unidades elementales.
Ejemplos:
La poblacin de un pas, de granos cristalizados en una roca, de bienes manu-
facturados por una fbrica en particular durante un periodo dado, nmero de
bacterias en 1 cm
3
de agua. Tambin podra ser un proceso observado en varios
instantes y los datos recogidos de esta manera constituyen una serie de tiempo.
Una poblacin si es infinita no se puede estudiar en forma completa, si es finita es
muy engorroso, ya que involucra prdida de tiempo, dinero, etc. por esta razn
nos basaremos en la muestra.
1.2.2. Muestra
Es un subconjunto de la poblacin, la muestra debe ser representativa o no ses-
gada (sin manipulacin, ni adulteracin) de la poblacin respectiva. Si la muestra
es representativa de la poblacin, inferencias y conclusiones hechas en la muestra
pueden ser extendidas a la poblacin completa.
Existen diversos mtodos para tomar la muestra (muestreo), como por ejemplo
un muestreo puede ser sistemtico, estratificado, por conglomerado, aleatorio,
etc., el muestreo que ms se aplica en ingeniera es el muestreo aleatorio (llamado
tambin probabilstico). Un muestreo es aleatorio cuando cada elemento de la
poblacin tiene la misma posibilidad de ser seleccionado en la muestra.
La muestra se representa por la letra minscula n (tamao de la muestra o nme-
ro total de observaciones en la muestra).
Ejemplos:
Las mediciones de la humedad relativa (en porcentajes por da) en el lugar de
almacenamiento de una muestra de materias primas en 12 das
Estadstica y diseo de experimentos
3
En trabajos qumicos, se toman muestras de un material, se analiza y luego se
hacen inferencias (predicciones) para la totalidad de dicho material, a partir de
los resultados obtenidos.
1.2.3. Parmetro
Es cualquier caracterstica de la poblacin que sea medible, por eso representa a
la poblacin. Este valor para ser calculado requiere de la informacin de toda la
poblacin lo cual muchas veces es difcil, por eso generalmente los parmetros
son estimados a partir de valores calculados en la muestra (este procedimiento se
desarrollar en Inferencia Estadstica).
Ejemplos:

X
: Media poblacional

X
: Varianza poblacional
1.2.4. Estadgrafo
Representan a las medidas descriptivas que se obtienen de un conjunto de ob-
servaciones, se les llama tambin estadstico. Es un nmero o constante que re-
presenta a la muestra y que puede ser calculado teniendo la informacin de la
muestra, con calculadoras o paquetes estadsticos.
1.2.5. Dato
Es la recopilacin, registro o anotacin de una caracterstica o un valor en parti-
cular que toma la variable en estudio.
1.2.6. Unidad Elemental
Es el individuo u objeto del cual se toma la informacin de la caracterstica a
estudiar. El resultado de observar una unidad elemental se llama observacin.
Puesto que, en una investigacin, se hace una observacin de cada unidad ele-
mental escogida.
1.3. VARIABLE
Es la caracterstica que presenta las unidades o datos que compone una pobla-
cin y es lo que se desea estudiar, se representa en forma simblica mediante
smbolos o letras. Segn los datos recopilados, las variables se clasifican en:
1.3.1. Variable Cualitativa
Representa datos que indican cualidades atributos, caractersticas, propiedades,
etc. Es llamada tambin variable categrica. No toman valores numricos, si los
2
Cecilia Ros Varillas
4
toma representan cdigos. Con esta variable no se pueden realizar operaciones
aritmticas.
La variable cualitativa, siendo no medible, puede presentar cierto orden cuan-
do se desea clasificar en una tabla de frecuencias; por lo tanto la variable cualita-
tiva puede ser:
Variable cualitativa nominal. Cuando no existe ninguna jerarqua u orden
entre ellas, en la clasificacin cualquiera puede ir primero.
Ejemplos:
- Tipos de tela
- Marcas de microscopios
- Profesiones
- Color de una sustancia qumica
Variable cualitativa ordinal. Estas variables no son medibles, sin embargo, ex-
presan cierto orden o jerarqua.
Ejemplos:
- Control de calidad de un producto (malo, regular, bueno, muy bueno)
- Intensidad del dolor (poco, regular, mucho)
1.3.2. Variable Cuantitativa
Representa a datos numricos, son medibles, con estas variables se pueden hacer
operaciones aritmticas.
La variable cuantitativa puede ser:
Variable cuantitativa discreta. Representa a datos numricos que surgen de un
proceso de conteo. Estos no se fraccionan, asumen valores enteros.
Ejemplos:
- Nmero de microscopios por laboratorio
- Nmero de alumnos por aula
- El nmero de bacterias de una muestra de agua
Variable cuantitativa continua. Representa a datos numricos que surgen de un
proceso de medicin, ya que pueden tomar valores sobre un intervalo o una co-
leccin de intervalos.
La variable continua es la que ms se emplea en ingeniera, dado que la mayora
de datos que se usan se obtienen de mediciones. Adems se debe indicar la uni-
dad de medida.
Estadstica y diseo de experimentos
5
Ejemplos:
- Tiempo (aos)
- Volumen (cm3)
- Temperatura (C)
- Longitud (m)
1.4. EJERCICIOS DESARROLLADOS
Ejercicio 1
En cada caso, indique cul es la poblacin, la muestra, unidad elemental, cul es
la variable que se quiere estudiar y especifique la clase de variable:
a) Tiempo (en minutos) que demoran 30 alumnos de la Facultad de Ingeniera
Qumica y Textil en el semestre 2010-1, en terminar el examen final de
Estadstica y Diseos de Experimentos.
b) Estado Civil de 80 personas del distrito de San Miguel
c) Nmero de pipetas en cada uno de los laboratorios de la facultad
d) Control de calidad de 50 productos fabricados en un da
Solucin
a) Tiempo (en minutos) que demoran 30 alumnos de la Facultad de Ingeniera
Qumica y Textil en el semestre 2010-1, en terminar el examen final de
Estadstica y Diseos de Experimentos.
Poblacin: total de alumnos de la Facultad de Ingeniera Qumica y
Textil en el semestre 2010-1
Muestra: 50 alumnos de la Facultad de Ingeniera Qumica y Textil
en el semestre 2010-1
Unidad elemental: un alumno de la Facultad de Ingeniera Qumica y Textil
Variable: Tiempo (en minutos) que demoran en terminar el examen
final de Estadstica y Diseos de Experimentos.
Clase de variable: variable cuantitativa continua
b) Estado Civil de 80 personas del distrito de San Miguel
Poblacin: total de personas del distrito de San Miguel
Muestra: 80 personas del distrito de San Miguel
Unidad elemental: una persona del distrito de San Miguel
Variable: estado civil
Clase de variable: variable cualitativa nominal
Cecilia Ros Varillas
6
c) Nmero de pipetas en cada uno de los laboratorios de la facultad
Poblacin: total de laboratorios de la facultad
Muestra: un grupo de laboratorios de la facultad
Unidad elemental: un laboratorio de la facultad
Variable: nmero de pipetas
Clase de variable: variable cuantitativa discreta
d) Control de calidad de 50 productos fabricados en un da
Poblacin: total de productos fabricados en el da
Muestra: 50 productos fabricados en el da
Unidad elemental: un producto fabricado en el da
Variable: control de calidad
Clase de variable: variable cualitativa ordinal
Ejercicio 2
En agosto del 2006, una empresa de gaseosas decidi hacer una encuesta para
conocer el grado de aceptacin que haba tenido su producto agua de man-
zana (un nuevo producto que ha lanzado al mercado), entre los habitantes de
Lima Metropolitana. Para ello se entrevistaron a 50 amas de casa, utilizando un
cuestionario que inclua preguntas para determinar: si en la casa han probado
el producto, quines han consumido el producto, la edad de los que consumen
el producto, si el producto qu tanto les ha gustado o aceptado (poco, regular,
mucho), si seguirn consumiendo el producto, etc.
De acuerdo a lo anterior:
- Cul es la poblacin de estudio? Es finita o infinita?
- Cul es la muestra?
- Cul es la unidad estadstica elemental?
- Cules son las variables que se presentan en esta entrevista? y Qu tipo de
variable es cada una de las sealadas en este caso?
Solucin
Poblacin: total de amas de casa de Lima Metropolitana
Muestra: 50 amas de casa de Lima Metropolitana
Unidad elemental: un ama de casa de Lima Metropolitana
Variables:
- Conocimiento del producto (variable cualitativa nominal)
- Edad de los consumidores (variable cuantitativa continua)
- Aceptacin del producto (variable cualitativa ordinal)
Estadstica y diseo de experimentos
7
Ejercicio 3
Indique la clase de variable que corresponde en cada caso:
a) Nivel de instruccin (primaria, secundaria, superior)
b) Aos de estudios completados
c) Punto de fusin
d) El peso en kilogramos
e) Solubilidad (baja, media o alta)
f) La temperatura en grados Celsius
Solucin
a) Variable cualitativa ordinal
b) Variable cuantitativa discreta
c) Variable cuantitativa continua
d) Variable cuantitativa continua
e) Variable cualitativa ordinal
f) Variable cuantitativa continua
1.5. EJERCICIOS PROPUESTOS
Ejercicio 1
Los alumnos del curso de Estadstica de la FIQT realizaron una investigacin
con el objetivo de establecer el perfil de los estudiantes de Postgrado de la UNI.
Como el total de alumnos que estudian posgrado es de 300, despus de debatir
arduamente, los alumnos de Estadstica seleccionaron a 10 alumnos del curso
para tomar datos a 40 estudiantes del posgrado. A tales estudiantes se les aplic
un cuestionario de donde se obtuvieron datos como:
Nota promedio ponderado, nivel econmico, sexo, estado civil, nmero de hijos,
nmero de horas de clase por semana, ciclo de estudios, ingresos mensuales,
minutos de viaje a casa.
a) Identifique la poblacin
b) Identifique la muestra
c) Segn el prrafo con letra cursiva, indique las variables y sus tipos
Ejercicio 2
En un programa de mejoramiento que se ha implementado en una empresa, se ha
diseado un plan para mejorar el proceso de fabricacin de un horno de microon-
das de alta fidelidad. Desde la lnea de despacho, donde los productos egresan
Cecilia Ros Varillas
8
uno a uno, se seleccionan 10 equipos los cuales son enviados a distintas reas
donde son clasificados entre otras caractersticas, el estado de las bisagras de las
puertas, las dimensiones del dimetro del plato interior del horno, el voltaje de
salida, la temperatura interior del equipo despus de dos minutos de trabajo, la
radiacin emitida y el color del horno
a) Identifique la poblacin, la muestra y la unidad elemental
b) Indique y clasifique las variables involucradas.
Ejercicio 3
En cada caso indique la poblacin, la unidad elemental y cul la variable que se
quiere estudiar. Especifique el tipo de variable:
a) Temperatura mxima diaria (en grados centgrados) de las ciudades, capitales
de provincia de La Libertad.
b) Deportes que practican los alumnos matriculados en la UNI en el semestre
2007-1.
c) Nmero de celulares que hay en cada aula de la UNI en un da en particular.
Ejercicio 4
En los siguientes casos indicar: la poblacin, unidad elemental, la variable y el
tipo de variable.
- Cdigo Postal de los distritos de Lima
- Categora de los profesores de Estadstica de la UNI
- Nmero de nios por escuela fiscal en el distrito del Rmac
- Tiempo que demoran los alumnos en terminar el examen de Estadstica
Ejercicio 5
Una fbrica industrial actualmente cuenta con 400 empleados y desea ofrecer a
los mismos un servicio de salud, el cual posiblemente se instale a 1kilmetro de
distancia de la fbrica. Suponga que usted lo encargan de realizar un estudio de
las necesidades de salud que los empleados tienen al respecto.
- Defina la unidad elemental y la poblacin delimitndolas claramente.
- Defina tres objetivos especficos de la investigacin.
- Trabajara usted con una muestra o la poblacin total.
- Cite cuatro variables pertinentes de investigar y la clasificacin de cada una de
ellas.
Estadstica y diseo de experimentos
9
No fue hasta el siglo XIX cuando el trmino estadstica adquiri el significado
de recolectar y clasificar datos. Este concepto fue introducido por el ingls John
Sinclair.
La mayor parte de los experimentos que se realizan en el laboratorio requiere de
mediciones y como son numricas (cuantitativas), se necesita encontrar medidas
que representen a estos datos, para luego hacer juicios sobre el experimento que
se est realizando.
En este captulo, se muestra de una manera simple y prctica, la forma de orga-
nizar y tabular los valores recopilados (mediciones realizadas en el laboratorio)
mediante la construccin de tablas de frecuencias, como tambin la presentacin
de grficos estadsticos.
2.1 ORGANIZACIN Y PRESENTACIN DE LOS DATOS
Luego de recopilar los datos, tienen que ser revisados, corregidos, ordenados y
clasificados para una correcta presentacin,
La presentacin puede ser mediante Tablas de Frecuencias y/o Grficos.
La Tabla de Frecuencias tiene como objetivo resumir los datos sin perder ningu-
no de ellos. Indica la distribucin de las frecuencias de los valores de la variable
dentro de varias clases. El trmino distribucin de frecuencias se abrevia nor-
malmente como distribucin: por ejemplo, se dice distribucin de empleados de
una empresa por niveles de ingreso, distribucin de las mediciones del volumen
(cm
3
), etc.
Segn el tipo de variable tenemos los siguientes casos:
2.2 TABLA DE FRECUENCIAS CUANDO LA VARIABLE ES CUALITATIVA
En este caso de manera inmediata se construye la tabla de frecuencias, segn las
diferentes opciones que se obtenga como respuesta.
Estadstica descriptiva
CAPTULO 2
Cecilia Ros Varillas
10
Ejemplo:
En el laboratorio de Textiles de la FIQT se desea clasificar 50 retazos de tela segn su
tipo para luego realizar una investigacin sobre la calidad de ellas, los tipos de tela
que corresponden a los 50 retazos analizados se presentan en el siguiente cuadro:
Tipo de tela Nmero de retazos %
Brocado 5 10%
Chenille 10 20%
Cretona 20 40%
Gasa 10 20%
Organza 5 10%
Existen diversos grficos que se pueden presentar cuando la variable es cualitati-
va, algunos de ellos son: Diagrama de barras, Diagrama de Pareto, Pictogramas,
Grficos por Sectores Circulares, etc.; los ms comunes son los Diagramas de
barras y por Sectores Circulares.
El Diagrama de Barras. Se utiliza para representar los caracteres cualitativos
(tambin los cuantitativos discretos). En el eje horizontal, o eje de abscisas, se
representan los datos de la variable analizada; en el eje vertical o de ordenadas,
se representan las frecuencias de cada dato.
Diagrama por Sectores Circulares. Se utiliza cuando queremos representar frecuen-
cias de la variable cualitativa. Los datos se representan en un crculo. Cada sector
indica la parte proporcional a la frecuencia y, por tanto, un valor de la variable, El
ngulo de cada sector circular es proporcional a la frecuencia de cada dato.
Estos grficos y otros pueden ser realizados por cualquier software estadstico.
Del ejemplo anterior se presentan estos grficos usando Excel.
Figura 2.1. Diagrama de Barras.
Estadstica y diseo de experimentos
11
2.3 TABLA DE FRECUENCIAS CUANDO LA VARIABLE ES CUANTITATIVA
Primero debemos tener presente las siguientes definiciones:
Frecuencia Absoluta. (f
i
): nmero de observaciones por cada clase o intervalo,
donde se verifica:
1
0
m
i i
i
f n f n
=
=

n : tamao de la muestra
m: nmero de clases o intervalos de clase
Frecuencia Absoluta Acumulada. (F
i
), nmero de observaciones acumuladas
desde la primera clase hasta la clase i.
1
m
i j
j
F f
=
=

Frecuencia Relativa. (h
i
): relacin entre la frecuencia absoluta y el nmero total
de observaciones.
1
0 1 1
m
i
i i i
i
f
h h h
n
=
= =

Generalmente la frecuencia relativa se expresa en porcentaje: % 100%


i i
h h =
Figura 2.2. Diagrama por sectores circulares
i
Cecilia Ros Varillas
12
Frecuencia Relativa Acumulada. (H
i
) Representa a las frecuencias relativas acu-
muladas desde la primera clase hasta la clase i.
1
m
i j
j
H h
=
=

tambin
i
i
F
H
n
=
Generalmente esta frecuencia tambin se expresa en porcentaje: H
i
% = H
i
x 100%
2.3.1 Tabla de Frecuencias cuando la variable es cuantitativa discreta
En este caso generalmente se agrupa por clase, considerando de manera directa
los valores de los datos en forma ordenada, adems generalmente la muestra es
pequea (usualmente n<30) y los datos se repiten con mucha frecuencia ya que
no debe haber muchas clases.
Ejemplo:
Los siguientes datos corresponden al nmero de imperfecciones observadas en
30 rollos de tela:
2 0 4 4 1 4 0 3
1 1 0 1 2 4 1 1
5 3 4 0 4 0 0 0
2 1 2 0 3 1
En este caso, la tabla de frecuencias se agrupa por clase, ya que los datos discretos
se repiten con frecuencia. En la tabla de frecuencias se presenta cada uno de estos
valores ordenados y se cuenta la cantidad de veces que se repite cada dato.
N de Imperfecciones N de rollos de tela ( f
i
) F
i
h
i
% H
i
%
0 8 8 26,67 26,67
1 8 16 26,67 53,33
2 4 20 13,33 66,67
3 3 23 10,00 76,67
4 6 29 20,00 96,67
5 1 30 3,33 100
Se observa que slo 1 rollo de tela presenta 5 imperfecciones, este valor repre-
senta el 3,33% del total, mientras que 16 rollos de tela presentan a lo mucho una
imperfeccin,es decir el 53,33% del total.
i
Estadstica y diseo de experimentos
13
2.3.2 Tabla de Frecuencias cuando la variable es cuantitativa continua
Cuando la variable es cuantitativa continua (generalmente las mediciones realiza-
das en laboratorio son de este tipo), los datos se agrupan por intervalos de clase.
El nmero de intervalos depende del nmero de datos y de su dispersin. Si el
nmero de intervalos es demasiado pequeo pueden estarse ocultando carac-
tersticas importantes de los datos en esta agrupacin, si se tienen demasiados
intervalos se pueden presentar muchos intervalos de clase vacos que resten sig-
nificado a la distribucin. Entonces, el nmero de intervalos de clase ser deter-
minado por el nmero de datos considerando tambin que tan uniformes sean
los datos. Una muestra pequea requiere en general pocos intervalos de clase,
inclusive en algunos casos no es necesaria agruparla.
A continuacin se presenta un procedimiento para construir este tipo de Tabla
de Frecuencias.
2.3.2.1 Procedimiento para construir una Tabla de Frecuencias por Intervalos
de Clases:
Primer paso
Clculo del nmero de intervalos de Clase (m).
Para calcular el nmero de intervalos, se tiene dos criterios:
- Por criterio personal (segn la experiencia del investigador), se fija el valor de m.
- La regla de Sturges: m = 1 + 3,3 log n (redondear a entero)
Segundo paso
Clculo del rango de la muestra (R).
De todos los datos recopilados se consideran los extremos, el valor mayor y el
valor menor.
R= Valor Mx. Valor Mn.
Tercer paso
Clculo de la amplitud o ancho del Intervalo (c).
Para calcular la amplitud del intervalo, nos basamos en la siguiente expresin:
R
c
m
=
Observaciones:
- Con este procedimiento la amplitud del intervalo que se calcula es constante
para todos los intervalos y es preferible que tenga la misma cantidad de
decimales que presentan los datos, por lo tanto debe ser redondeado y este
redondeo debe ser por exceso, para no perder ningn dato.
- Para determinar los lmites de clase, se deber considerar los siguientes puntos:
Cecilia Ros Varillas
14
a. Los lmites de clase deben ser mutuamente excluyentes, no debe haber duda
en cuanto a la clase a que pertenece una observacin determinada.
b. La eleccin de los lmites de clase depende en gran parte si los datos son
continuos o discretos.
Los lmites pueden ser:
- Lmites Traslapantes
Ejemplo: 4,18 4,28
4,28 4,38

- Lmites No Traslapantes
Ejemplo: 4,18 4,27
4,28 4,37
Ambos tipos pueden usarse para datos continuos o para datos tratados
como continuos.
Al tratar datos discretos se puede usar los lmites no traslapantes.
c) Los intervalos ms comunes, corresponde a lmites traslapantes, estos
intervalos son semiabiertos de la forma [ X

i-1
X

i
, a excepcin del ltimo
que puede ser cerrado.
Cuarto paso
Tabulacin, mediante el conteo adecuado a considerar.
Quinto paso
Calcular las marcas de clase X
i
(punto medio de cada intervalo), se calcula me-
diante el promedio de los lmites del intervalo respectivo. Sirve para representar
a los datos de cada intervalo:

' '
1
2
i i
i
x x
x

+
=
'
1 i
x

: Lmite inferior del intervalo



'
i
x : Lmite superior del intervalo
Estadstica y diseo de experimentos
15
2.3.2.2 Representacin de la tabla de frecuencias por intervalos de clase
Cuadro 2.1. Tabla de Frecuencias por intervalos de clase
' '
1 i i
x x

i
x
i
f
i
F %
i
h %
i
H
' '
0 1
x x


1
x
1
f
1
F
1
% h
1
% H
' '
1 2
x x


2
x
2
f
2
F
2
% h
2
% H
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
' '
1 m m
x x

m
x
m
f
m
F n = %
m
h % 100%
m
H =
Ejemplo:
Los siguientes datos corresponden a 30 mediciones del punto de ebullicin de un
compuesto de silicio (en grados Celsius):
166 178 136 170 162 155 146 183 157 148 138 160 153 175 157 156
165 160 159 168 170 150 148 179 167 165 162 158 173 164.
Solucin
Realizamos el procedimiento para construir la tabla de frecuencias.
1
er.
Paso. Calculamos en nmero de intervalos con la Regla de Sturges:
m = 1+ (3,3)log30 = 5,8745 6
2
do.
Paso. Rango de la muestra: R = 183 136 = 47
3
er.
Paso. Clculo de la amplitud del intervalo:
c =
47
= 7,83 8

6
Se redondea al entero ya que los datos no tienen decimales.
Cecilia Ros Varillas
16
4
to.
Paso. Tabulacin
Punto de ebullicin (C) x
i
f
i
F
i
h
i
% H
i
%
136 144 140 2 2 6,7 6,7
144 152 148 4 6 13,3 20,0
152 160 156 7 13 23,3 43,3
160 168 164 9 22 30,0 73,3
168 176 172 5 27 16,7 90,0
176 184 180 3 30 10,0 100
Se puede observar que son 9 las mediciones cuyo punto de ebullicin son de por
lo menos 160 C pero menos de 168 C y stas representan el 30% del total de las
mediciones. Tambin vemos que el 43,3% de las mediciones presentan un punto
de ebullicin menor que 160 C, las cuales corresponden a 13 de las mediciones.
Los grficos en este caso son:
Histograma de frecuencias
Para realizar un histograma se marcan una serie de intervalos sobre un eje horizon-
tal, y sobre cada intervalo se coloca un rectngulo de altura proporcional al nmero
de observaciones (frecuencia absoluta) que caen dentro de dicho intervalo. De esta
manera el histograma de frecuencias resulta muy til para representar grficamen-
te la distribucin de frecuencias. Tambin se puede usar la frecuencia relativa en
lugar de la frecuencia absoluta y el histograma es proporcional al anterior.
Polgono de frecuencias
Para construir el polgono de frecuencias se toma la marca de clase que coincide
con el punto medio de cada rectngulo de un histograma y la altura respectiva es
la frecuencia absoluta (tambin puede ser la frecuencia relativa). Este grfico se
presenta en la seccin 2.5.
Figura 2.3. Histograma de Frecuencias
Estadstica y diseo de experimentos
17
Ojivas (usando frecuencias acumuladas)
Es un grfico que se basa en frecuencias acumuladas, se le conoce tambin como
diagrama menor que, ya que la frecuencia que se representa en cada frontera
de clase son el nmero de observaciones menores que la frontera sealada.
2.4 MEDIDAS DESCRIPTIVAS
En esta seccin, se presenta algunas medidas descriptivas ms frecuentemente
empleadas, sobre todo cuando en el laboratorio se realizan mediciones, se nece-
sita encontrar aquellas medidas que representen a estas mediciones y tambin
que midan la variabilidad de ellas. Estas medidas descriptivas se usan cuando
los datos son cuantitativos.
A las medidas descriptivas tambin se les conoce como estadgrafos o estadsti-
cos, y se clasifican en:
- Medidas de Tendencia Central
- Medidas de Dispersin
2.4.1 Medidas de Tendencia Central
Llamados de tendencia central, porque tienden a ubicar el centro de las observa-
ciones, adems el valor central es el ms representativo de un conjunto de datos,
por eso cuando se realizan mediciones o se recopilan datos es necesario calcular
una medida de tendencia central para que represente a este conjunto de datos.
Estas medidas se expresan en las mismas unidades de medicin que los datos;
esto es, si la observacin es en gramos, el valor de tendencia central tambin re-
sulta en gramos.
Algunas medidas de tendencia central son: media aritmtica, mediana, moda,
media geomtrica, media armnica etc. y las que ms se usan son: la media arit-
mtica, mediana y moda, son las que se presentan a continuacin:
2.4.1.1 Media Aritmtica
Tambin se le conoce como promedio aritmtico o simplemente promedio; es la
medida de tendencia central que ms se usa en estadstica, es simple y fcil de
calcular. Se denota X M(x).
Clculo de la media aritmtica
Se calcula teniendo en cuenta los siguientes casos:
1er. Caso: Datos no agrupados en tablas de frecuencias
Sean x
1 ,
x
2
, x
3
,
.
..., x
n
un conjunto de n observaciones que representan a los datos
o mediciones de una muestra, la media aritmtica se calcula :
Cecilia Ros Varillas
18
1
n
i
i
x
X
n
=
=

2do. Caso: Datos agrupados en tabla de frecuencias


Cuando los datos estn clasificados en tablas de frecuencias, entonces la media
aritmtica se calcula mediante la siguiente frmula:
1
m
i i
i
x f
X
n
=
=

Donde:
x
i
= marca de clase o valor numrico de la variable
m = nmero de intervalos de clase
f
i
= frecuencia absoluta
Ejemplo:
Supngase que se determin que a 22C una pipeta de 5,000 mililitros, despus
de pesar por seis ocasiones su volumen vertido, gener los siguientes pesos apa-
rentes de agua en gramos:
4,995; 4,993; 4,994; 4,996; 4,998; 4,992. Calcular el peso promedio.
Solucin
La media aritmtica para esta muestra pequea (datos no agrupados en tabla de
frecuencias) se calcula:
1
4, 995+ 4, 993 +4, 994 +4, 996+ 4, 998 +4, 992
4, 9947
6
n
i
i
x
X
n
=
= = =

Esto significa que la pipeta escurre a una temperatura de 22C, en promedio


4,9947 gramos de agua.
Ejemplo:
De la siguiente tabla de frecuencias construida en un ejemplo anterior, calcular la
media aritmtica para datos agrupados.
Estadstica y diseo de experimentos
19
Punto de ebullicin (C) x
i
f
i
F
i
h
i
% H
i
%
136 144 140 2 2 6,7 6,7
144 152 148 4 6 13,3 20,0
152 160 156 7 13 23,3 43,3
160 168 164 9 22 30,0 73,3
168 176 172 5 27 16,7 90,0
176 184 180 3 30 10,0 100
Solucin
La media aritmtica para datos agrupados en tabla de frecuencias es:
X = 161,333C
Es decir el punto de ebullicin promedio es de 161,333C.
Propiedades de la media aritmtica
Propiedad 1
Si todos los datos son iguales a una constante k, entonces la media es igual a dicha
constante: k = k
Demostracin:
Sea
1
n
i
i
x
X
n
=
=

Si
1
n
i
i
k
n k
x k k k
n n
=
= = = =

(140)(2) + (148)(4) + (156)(7) + (164)(9) + (172)(5) + (180)(3)


30
4840
30
=
m
x
i
f
i
i=1
n
= X =

Cecilia Ros Varillas


20
Propiedad 2
Si a cada dato se le suma o resta una constante k, a la media tambin se le suma
o resta, dicha constante:
x + k = x + k
Demostracin:
( )
1 1 1
n n n
i i
i i i
x k x k
x k
n n
= = =
+ +
+ = = =

1 1
n n
i
i i
x k
n k
x x k
n n n
= =
= + = + = +

Propiedad 3
Si a cada dato se le multiplica o divide por una constante k, a la media tambin se
le multiplica o divide dicha constante:
x k x k =
Demostracin:
( )
1 1 1
n n n
i i i
i i i
x k k x x
x k k x k
n n n
= = =
= = = =

Propiedad 4
La suma de las desviaciones con respecto a la media es igual a cero:
( )
1
0
n
i
i
x x
=
=

Demostracin:

( )
1 1 1 1
n n n n
i i i
i i i i
x x x x x n x
= = = =
= = =

1
1 1 1
0
n
i n n n
i
i i i
i i i
x
x n x x
n
=
= = =
= = =


Nota. Todas las propiedades cumplen para datos agrupados y no agrupados.

Estadstica y diseo de experimentos


21
Media ponderada X
w

Si cada observacin x
i
tiene un peso o ponderacin W
i
, esto es, cuando las ob-
servaciones no tienen la misma importancia dentro de una muestra, entonces
tenemos la media ponderada que se calcula de la siguiente manera:

Ejemplo:
Las notas de un alumno de ingeniera qumica al finalizar el semestre 2010-1
fueron:
Curso Nota Crditos
Estadstica y diseos de experimentos 11 4
Fsica III 09 5
Introduccin al diseo mecnico 12 3
El promedio ponderado del alumno en el semestre 2010-1 es:
11(4) 09(5) 12(3)
10, 4
12
w
X
+ +
= =
2.4.1.2 Mediana
Es el estadgrafo de posicin que divide en dos partes iguales al conjunto de ob-
servaciones, es decir, la mediana representa el valor central de una distribucin
de datos ordenados en forma creciente o decreciente, y es aquel que divide a la
distribucin de los datos de tal forma que 50% de los valores son menores o igua-
les que l, y 50% de los valores son mayores o iguales que l.
Clculo de la mediana
1er. Caso: Datos no agrupados en tabla de frecuencias
Primero se ordena los datos en forma creciente o decreciente y luego se tiene en
cuenta s:
n es impar.- La mediana es el valor central.
m
e
= X
n+1
(Posicin del valor central)

2
1
1
.
m
i i
i
w m
i
i
x w
X
w
=
=
=

Cecilia Ros Varillas


22
Ejemplo:
Los siguientes datos corresponden al contenido de slidos en el agua en partes
por milln (ppm) : 4520 4570 4520 4490 4570 4500 4520 4590 4540 4500 4520.
Calcule la mediana.
Solucin
Primero se ordenan: 4490 4500 4500 4520 4520 4520 4520 4540 4570 4570 4590
Como n=11 (impar) el valor central es: me = 4520 ppm (representa la 6ta. posicin)
entonces, el valor que tiene 50% de los valores por encima y 50% por debajo de
l es 4520 ppm.

n es par.- La mediana es igual al promedio de los 2 valores centrales:
1
2 2
2
n n
e
x x
m
+
+
=
Ejemplo:
Del ejemplo anterior de la media aritmtica para datos no agrupados, despus de
pesar su volumen vertido por seis ocasiones, gener los siguientes pesos aparen-
tes de agua en gramos: 4,995 4,993 4,994 4,996 4,998 4,992. Calcule la media-
na.
Solucin
Se ordena: 4,992 4,993 4,994 4,995 4,996 4,998
Como n = 6 (par), entonces la mediana resulta:
4, 994 4, 995
4, 9945
2
e
m g
+
= =
Se observa que el valor de la mediana es muy similar a la media aritmtica calcu-
lada anteriormente.
2do.Caso: Datos agrupados en tabla de frecuencias
En este caso la mediana se calcula mediante la siguiente frmula:

1
'
1
2

me
e me me
me
n
F
m x c
f

| |

|
= +
|
|
\ .
Estadstica y diseo de experimentos
23
Donde:
X
me1
= lmite inferior de la clase mediana
C
me
= tamao del intervalo de la clase mediana
F
me1
= frecuencia absoluta acumulada anterior a la clase mediana
f
me
= frecuencia absoluta de la clase mediana
Clase mediana
Es aqul intervalo que contiene al valor que ocupa la posicin media, es decir,
contiene a la mediana.
Donde se cumple:
F
me-1

n
< F
me
F
me
= frecuencia absoluta acumulada de la clase mediana

2
Ejemplo:
De la tabla de frecuencias anterior,
Punto de ebullicin (C) x
i
f
i
F
i
h
i
% H
i
%
136 144 140 2 2 6,7 6,7
144 152 148 4 6 13,3 20,0
152 160 156 7 13 23,3 43,3
160 168 164 9 22 30,0 73,3
168 176 172 5 27 16,7 90,0
176 184 180 3 30 10,0 100
Calcule la mediana.
Solucin
Como n=30 entonces:

15 13 15 22
2
n
= < <

por lo tanto el intervalo que contiene a la posicin 15 es el cuarto, es la clase me-
diana, y adems:
'
1 1
160 8 15 13 9
2
me me me me
n
x c F f

= = = = =
Reemplazando en la frmula de la mediana:
15 13
160 8 161, 7778
9
e
m C

| |
= + =
|
\ .
Cecilia Ros Varillas
24
El clculo anterior de la media aritmtica para datos agrupados en tablas de fre-
cuencias result:
X = 161,333C
Lo cual es muy cercano al valor calculado de la mediana, ambas son medidas de
tendencia central y cualquiera de ellos puede representar al conjunto de datos.
2.4.1.3 Moda
Representa al valor que ms se repite en un conjunto de observaciones. Esta me-
dida no es muy til, porque puede ocurrir que una distribucin tenga dos ms
valores que se repitan con la misma frecuencia, en tal caso se tienen dos o ms
modas.
Entonces:
- Si la distribucin de frecuencias tiene un slo valor que ms se repite:
UNIMODAL.
- Si la distribucin presenta dos o ms valores que se repitan: POLIMODAL.
- Si no hay algn valor que se repita con ms frecuencia: DISTRIBUCIN
UNIFORME.
Clculo de la moda
1er.Caso: Datos no agrupados
Es fcil de calcular, bastar con observar cual es el dato que ms se repite.
Ejemplo:
Calcule la moda en cada caso
(i): 4 5 6 7 4 5 4 6 5 5 4 5 5
Mo = 5 UNIMODAL (es el valor que ms se repite)
(ii) 7 7 6 8 8 6 8 7 7 9 12 11 10 8
Mo=7 Mo=8 BIMODAL (son dos valores que se repiten con ms frecuencia)
2do.Caso: Datos agrupados en tablas de frecuencias


'
1
1
1 2

o mo mo
d
m x c
d d

| |
= +
|
+
\ .

Estadstica y diseo de experimentos


25
Donde:
X

mo-1
: Lmite inferior de la clase modal.
c
mo
: amplitud de la clase modal.
d
1
: Diferencia entre la frecuencia absoluta de la clase modal menos la
frecuencia absoluta anterior.
d
2
: Diferencia entre la frecuencia absoluta de la clase modal menos la siguiente.
Clase Modal. Representa el intervalo con la mayor frecuencia absoluta.
Ejemplo:
De la Tabla de Frecuencias anterior, luego de calcular la media aritmtica y me-
diana para datos agrupados, ahora se calcula la moda.
El intervalo que presenta ms datos (mayor frecuencia absoluta) es el cuarto,
entonces esa es la clase modal, adems:
'
1
160
mo
x

= c
mo
= 8
1 2
9 7 2 9 5 4 d d = = = =
Reemplazamos en la frmula
2
160 8 162, 6667
2 4
o
m C
| |
= + =
|
+
\ .

Este es el valor de la moda para datos agrupados en tabla de frecuencias.
Finalmente, se observa que las tres medidas son muy cercanas y cualquiera de
ellas puede representar al conjunto de observaciones.
2.4.1.4. Relacin entre la media aritmtica, mediana y moda
- La media aritmtica es muy sensible cuando hay valores extremos, y como la
mediana es un valor posicional, se ve menos afectada por valores extremos;
esta es una ventaja de la mediana que la convierte en ms representativa que
la media aritmtica cuando hay valores extremos.
-
X
= mediana = moda, si la distribucin es simtrica (frecuencias absolutas
equidistantes son iguales), es decir polgono de frecuencias simtrico.
-

X < mediana < moda o moda < mediana < X, si la distribucin de las frecuencias
no es simtrica

Cecilia Ros Varillas


26
2.4.1.5 Otras medidas de tendencia Central
Tambin existen otras medidas de tendencia central, algunas de ellas son:
Media Geomtrica
Representa a un valor de tendencia central y se calcula mediante la raz ensima
del producto de los datos de la muestra.
1 2
....
n
n
Mg x x x =
No es muy til en qumica ni en textiles, ya que cuando la variable toma al menos
un valor cero entonces la Mg se anula, y si la variable toma valores negativos se
pueden presentar una gama de casos particulares en los que tampoco queda de-
terminada debido al problema de las races de ndice par de nmeros negativos.
Media armnica
Esta medida representa la inversa del promedio de las inversas de cada dato
recopilado.
1 1
1

1 1
n n
i i
i i
n
Mh
x x
n
= =
= =

Se suele utilizar para promediar variables tales como productividades, velocida-
des, tiempos, rendimientos, cambios, etc.
Su clculo no tiene sentido cuando algn valor de la variable toma valor cero.
2.4.2 Medidas de Dispersin
En el laboratorio, cuando se realizan mediciones, la variabilidad de los datos
afecta la precisin y exactitud de los resultados, y esto puede influir en los anli-
sis que se realicen con ellos. Por eso es muy importante calcular una medida que
cuantifique la dispersin de los datos.
En esta seccin se presenta las medidas de dispersin, estas medidas son nme-
ros que miden o cuantifican la variabilidad de las observaciones con respecto a
un estadgrafo de tendencia central (generalmente la media aritmtica).
Los principales estadgrafos de dispersin son los siguientes:
Estadstica y diseo de experimentos
27
2.4.2.1 Varianza V(X)
Se define como el promedio del cuadrado de las desviaciones con respecto a la
media.
Cuando la varianza es muestral, entonces V(X) se puede denotar como S
2
(x) ; y
si la varianza es poblacional, entonces V(X) se denota como o
2
.En este captulo
estudiaremos la varianza muestral.
Clculo de la varianza
La varianza se calcula teniendo en cuenta los siguientes casos:
1er. Caso: Datos no agrupados en tablas de frecuencias

( )
2
2 1
-
( )
-1
n
i
i
x x
S x
n
=
=

Desarrollando esta sumatoria, se obtiene una forma ms simple para calcular la


varianza:

( )
2
2 2 2
2 1 1 1 1
- 2 - 2
( )
- 1 - 1
n n n n
i i i i
i i i i
x x x x x x x x
S x
n n
= = = =
+ +
= =


2 2 2 2
1
1 1 1
- 2 - 2
- 1 - 1
n
i n n n
i
i i i
i i i
x
n
x x x n x x x n n x
n n
n n
=
= = =
| |
+ +
|
\ .
= =



2
2 2 2 2
1 1
- 2 - 2
- 1 - 1
n n
i i
i i
x x n x n x x n x n x
n n
= =
+ +
= =

2 2
2 1
-
( )
- 1
n
i
i
x n x
S x
n
=
=

x
Cecilia Ros Varillas
28
2do. Caso: Datos agrupados en tablas de frecuencias

( )
2
2 1
-
( )
-1
m
i i
i
x x f
S x
n
=
=

De manera similar a la anterior, desarrollando esta sumatoria se obtiene:



2 2
2 1
-
( )
- 1
m
i i
i
x f n x
S x
n
=
=

Donde:
X
i
= marca de clase
f
i
= frecuencia absoluta
Propiedades de la varianza
Propiedad 1
El valor de la varianza es un valor no negativo: S
2
(x) 0
Propiedad 2
Si todos los datos son iguales, no hay dispersin. Esto es si cada x
i
= k (constante):
S
2
(k) = 0
Demostracin

( )
( )
2
2
2 1 1
- -
( ) 0
-1 -1
n n
i i
k k k k
S k
n n
= =
= = =

Propiedad 3
Si a cada dato x
i
se le suma (o resta) una constante k entonces la varianza no
cambia:
S
2
(x k) = S
2
(x)
Demostracin:

( )
( ) ( )
( )
( ) ( )
2 2
2 1 1
- -
( )
- 1 - 1
n n
i i
i i
x k x k x k x k
S x k
n n
= =
+ + + +
+ = = =

Estadstica y diseo de experimentos
29
( ) ( )
2 2
2 1 1
- - -
( )
- 1 - 1
n n
i i
i i
x k x k x x
S x
n n
= =
+
= = =

Propiedad 4
Si a cada dato se multiplica (o divide) por una constante k, entonces la varianza
queda multiplicada por la constante al cuadrado.
S
2
(kx) = k
2
S
2
(x)
Demostracin:

( )
( ) ( )
( )
( ) ( )
2 2
2 1 1
- -
( )
- 1 - 1
n n
i i
i i
x k xk x k xk
S xk
n n
= =
= = =


( ) ( )
2 2
2
2 2 2 1 1
- -
( )
- 1 - 1
n n
i i
i i
k x x x x
k k S x
n n
= =
= = =

Propiedad 5
En general:
2 2 2 2 2
( ) ( ) ( ) S ax by a S x b S y = +
Siendo a y b constantes, x e y variables independientes.
La varianza no tiene la misma magnitud que las observaciones (ejemplo: si las
observaciones se miden en metros (m), la varianza lo hace en m
2
). Si queremos
que la medida de dispersin sea de la misma dimensionalidad que las observa-
ciones, bastar con tomar su raz cuadrada.
2.4.2.2 Desviacin estndar o tpica
Se define como la raz cuadrada positiva de la varianza, y como la varianza esta
expresada en unidades cuadradas, la desviacin estndar (que est expresada en
las mismas unidades de los datos) representa mejor la variabilidad de las obser-
vaciones.
2
( ) ( ) S x S x =
Cecilia Ros Varillas
30
2.4.2.3 Coeficiente de variacin (C.V.)
Las medidas de tendencia central y la desviacin estndar nos dan informacin
sobre una muestra y se expresan en las mismas unidades de medida que presen-
tan los datos. Ahora, si se desea comparar dos muestras de diferentes unidades
de medida, por ejemplo, en la variable altura podemos usar como unidad de
longitud el metro y en la variable peso, el kilogramo; comparar una desviacin
medida en metros con otra en kilogramos no tiene ningn sentido. El mismo
problema se plantea si medimos cierta cantidad, por ejemplo la masa, de dos
muestras, pero con distintas unidades de valor, por ejemplo si comparamos el
peso en gramos de una muestra de 20 hornos microondas con el correspondiente
en gramos de una muestra de 50 sobres de t filtrante.
El problema no se resuelve tomando las mismas escalas para ambas poblaciones.
El coeficiente de variacin es lo que nos permite evitar estos problemas, pues elimi-
na la dimensionalidad de las variables y tiene en cuenta la proporcin existente
entre la media X y la desviacin estndar S(x).
Se calcula del siguiente modo:
( )
. . .100%
S x
CV
x
=
El C.V. como no tiene unidades se debe expresar en porcentaje y sirve como me-
dida de comparacin con otras distribuciones de cualquier tipo de unidad, es
decir, el coeficiente de variacin mide el grado de dispersin de los datos.
Para calcular el C.V. se considera al promedio en valor absoluto, adems se debe
tener en cuenta lo siguiente:
C.V. < 10% representa a una muestra que tiende a ser homognea, los datos o
mediciones no son muy dispersos.
10% C.V. 20% presentan una regular o moderada dispersin.
C.V >20% los datos de la muestra son muy dispersos.
Ejemplo:
Se tiene dos muestras, con la siguiente informacin para cada una de ellas:
1 1 1
3 3
2 2 2
25 274.46 8, 58
27 7, 3 0, 75
n x kg S kg
n x cm S cm
= = =
= = =
En qu muestra hay menos variabilidad en las observaciones?

Estadstica y diseo de experimentos


31
Solucin
Primero hay que tener en cuenta que no se puede comparar las desviaciones es-
tndares de cada muestra, porque estn expresadas en diferentes unidades, pero
s podemos compararlas con sus respectivos C.V.
1
1
1
8, 58
.100% .100% 3,126%
274.46
S
CV
x
= = =
2
2
2
0, 75
.100% .100% 10, 274%
7, 3
S
CV
x
= = =
Entonces, comparando ambos coeficientes de variacin se observa que existe me-
nor dispersin en los datos de la primera muestra, es as que, la primera muestra
es ms homognea y la dispersin es mnima.
2.5 Aplicacin usando el paquete estadstico minitab
Tambin se pueden procesar los datos usando Minitab, se presenta a continua-
cin de una manera prctica y muy simple:
Procedimiento:
Se ingresan los datos correspondientes a las variables: Tipos de Tela, Nmero de
imperfecciones y Punto de Ebullicin (de los ejemplos anteriores).
Los datos se pueden ingresar por variable (en columnas). Se debe ingresar el
nombre de la columna. Cuando los datos son del tipo alfanumrico (variable
cualitativa), el Minitab automticamente a la columna le aade el sufijo T.
La versin del Minitab que se us para este texto usa la coma como separador
decimal, ya que algunas versiones del Minitab usan el punto como separador
decimal.
Guardar los datos como un proyecto: del men la opcin File / Save Proyect As
Nombre del archivo lab1.MPJ .
Cecilia Ros Varillas
32
Ejecute los siguientes comandos: Stat/Tables/ Tally Individual Variables.
Para variable Cualitativa:
Seleccione la variable Cualitativa Tipos de tela luego elija las opciones Counts
y Percents, luego OK y se obtiene el siguiente cuadro, para la variable cualitativa
Tipos de tela (Tabla de Frecuencias):
Tipos de tela Count Percent
Brocado 5 10.00
Chenille 10 20.00
Cretona 20 40.00
Gasa 10 20.00
Organza 5 10.00
Para realizar los grficos de la variable cualitativa, se elige Graph/Bar Chart, luego
la opcin simple y OK. En la ventana que aparece, se selecciona la variable
Tipos de tela, luego se presiona el botn Chart Options y por Defaultla gr-
fica se presenta como se muestra en la figura (si se elije las opciones Decreasing
Yy Show Y as Percent, las barras aparecen ordenadas de mayor a menor y en
porcentaje). Presione OK. Luego presionamos el botn Labels e ingrese el ttulo
del trabajo: TIPOS DE TELA, al momento seleccione Data Labels y elija Use y-
value labels. En Data View marcar la opcin Bars Presione OK y otra vez OK,
se muestra la siguiente figura:
Estadstica y diseo de experimentos
33
Para el grfico por Sectores Circulares, ejecute los siguientes comandos: Graph/
Pie Char. Seleccione la variable Tipos de tela. Elija Pie Options/Decreasing vo-
lumen OK. Elija Labels (coloque ttulo)/Slice labels/Percent OK. El Grfico es el
siguiente:
Para la variable Cuantitativa Discreta:
Ahora trabajaremos con la variable cuantitativa discreta Nmero de imperfec-
ciones del ejemplo de las imperfecciones en los rollos de Tela.
Ingrese: Stat/Tables/ Tally Individual Variables, luego se selecciona la variable
cuantitativa discreta Nmero de Imperfecciones y se elije las opciones Counts,
Percents, Cumulative counts, Cumulative Percents, OK y se obtiene lo siguiente:
Cecilia Ros Varillas
34
Tally for Discrete Variables: Nde Imperfecciones
Nmero de
Imperfecciones
Count CumCnt Percent CumPct
0 8 8 26,67 26,67
1 8 16 26,67 53,33
2 4 20 13,33 66,67
3 3 23 10,00 76,67
4 6 29 20,00 96,67
5 1 30 3,33 100,00
N=30
Para graficar esta variable discreta, se ejecuta los siguientes comandos: Graph/
Bar Chart, elija la opcin simple, OK, luego se selecciona la variable Nmero
de Imperfecciones. Presione el botn Chart Options y elija la opcin Show
Y as Percent (debe estar activada la opcin Default). Presione OK, luego pre-
sione el botn Labels e ingrese el ttulo del trabajo Nmero de Imperfecciones,
al momento seleccione Data Labels y elija Use y-value labels. Presione OK.
Seguidamente, presione el botn Data View y elija la opcin Project lines
(desactivar la opcin Bars si se encuentra activa). Presionar OK y la grfica es
la siguiente figura:
Para la variable Cuantitativa Continua:
Ahora se har el procesamiento para los datos correspondiente a la variable
cuantitativa continua, se elige Graph/Histogram, luego simple, OK.
Estadstica y diseo de experimentos
35
Seleccionar la variable Punto de ebullicin, presione Labels (coloque ttulo)
elegir la ficha Data labels, luego elija Use Y-value labels o si no desea que apa-
rezca las frecuencias sobre cada barra entonces elegir None, OK y luego otra
vez OK. Aparece el Histograma con 11 intervalos (por defecto).
Para modificar el Histograma, hacemos clic dos veces dentro del histograma, en la
ventana que aparece escoja en la ficha Binning, las opciones cutpoint,Midpoint
/cutpoint positions, seguidamente se ingresa el valor mnimo (136), dos puntos,
valor mximo (183), diagonal y finalmente la amplitud 8, como aparece en la
siguiente ventana:
Hacer clic en OK y aparece el Histograma:
Cecilia Ros Varillas
36
Para graficar el Polgono de frecuencias, ingrese los valores de las frecuencias
relativas y de las marcas de clase de la tabla de frecuencias en otras columnas
C2 (punto de ebullicin) y C3 (Porcentaje) de Minitab, finalmente ejecute los si-
guientes comandos: Graph/Scatterplot y elija With Connect Line. OK:
Estadsticos:
Para calcular los estadsticos de las variables cuantitativas: Stat/Basic Statistics/
Display Descriptive Statistics, se seleccionan los datos ingresados en la columnas
C2 (N de imperfecciones) y C3 (punto de ebullicin), se hace clic en statistics y se
marcan los estadsticos que se desean encontrar seguido de OK; los estadsticos
resultantes para los datos de estas dos variables (sin agrupar en tablas de fre-
cuencias) aparecen en la ventana Session que se muestra a continuacin:

Descriptive Statistics: Nde Imperfecciones, Punto de ebullicin
Variable Mean StDev Variance CoefVar Minim Median Maximum
Nde Imperfecciones 1.800 1.606 2.579 89.22 0.000 1.000 5.000
Punto de ebullicin 160.93 11.39 129.72 7.08 136.00 161.00 183.00
N for
Variable Range Mode Mode
Nde Imperfecciones 5.000 0, 1 8
Punto de ebullicin 47.00 148, 157, 160, 162 2
The data contain at least five mode values. Only the smallest four are shown.
Estadstica y diseo de experimentos
37
2.6 EJERCICIOS DESARROLLADOS
Ejercicio 1
Los siguientes datos corresponden a 20 lecturas de temperatura (en F) tomadas
en varios puntos de un horno de gran tamao
415 460 510 475 430 410 425 490 500 470
450 425 485 470 450 455 460 480 475 465
Sin agrupar los datos en tabla de frecuencias, calcule: media aritmtica, mediana,
moda y el coeficiente de variacin C.V. interprete.
Solucin
1
415 460 510 ..... 465 9200
460
20 20
n
i
i
X
X F
n
=
+ + + +
= = = =

Para calcular la mediana ordenamos


410 415 425 425 430 450 450 455 460 460
465 470 470 475 475 480 485 490 500 510
460 465
462, 5
2
e
m F
+
= =
Es polimodal, las modas son:
mo
1
= 425 mo
2
= 450 mo
3
= 460 mo
4
= 470 mo
5
= 475 (todas se repiten dos veces)
( ) 27, 9096286 S x F = (Se calcula directamente con la calculadora)
27, 9096286
. . 100% 6, 07 %
460
CV = =
Los datos son pocos dispersos
Cecilia Ros Varillas
38
Ejercicio 2
En el laboratorio de qumica se han realizado n determinaciones del volumen (cm
3
)
de una sustancia qumica, los datos se han clasificado en una tabla de frecuencias
con 6 intervalos de igual amplitud, donde se conoce la siguiente informacin:
6
3
1
264 (suma de marcas de clase) mediana=43, 625
i
i
x cm
=
=

2 4 4 3 6 1
4
10 7 25 -30
17
F f F h f f n = = = = = =
Calcular la media aritmtica, moda, determine e interprete el coeficiente de va-
riacin (C.V.)
Solucin
Colocamos los datos dados, donde X
1
: es la primera marca de clase y c es la amplitud
del intervalo
Intervalo X
i
f
i
F
i
h
i
H
i
X
1
X
1
+ c 10
X
1
+ 2c 4/17
X
1
+ 3c 7 25
X
1
+ 4c
X
1
+ 5c
Se observa que:
3 4 4
- 25- 7 18 F F f = = =
3 3 2
- 18-10 8 f F F = = =
3
3
4 8
34
17
f
h n
n n
= = =
6 1
entonces 34-30 4 f f = = =
Estadstica y diseo de experimentos
39
Se completa las frecuencias absolutas y relativas:
Intervalo X
i
f
i
F
i
h
i
% H
i
%
X
1
4 4 11,8 11,8
X
1
+ c 6 10 17,6 29,4
X
1
+ 2c 8 18 23,5 52,9
X
1
+ 3c 7 25 20,6 73,5
X
1
+ 4c 5 30 14,7 88,2
X
1
+ 5c 4 34 11,8 100
Como: 17 10 17 18
2
n
= < <
Entonces: F
me1
= 10 y F
me
= 18
La mediana est en el 3er. intervalo
'
-1 1 1
3
2 -
2 2
me
c
x x c x c = + = +

(Lmite inferior de la clase mediana)
1
3 17 -10
43, 625
2 8
e
m x c c
| |
= + + =
|
\ .
1 1
19
43, 625 8 19 349.......(1)
8
x c x c + = + =
Del dato:
1
1
264 6 15 264 ........(2)
m
i
i
x x c
=
= + =

Resolviendo las ecuaciones (1) y (2) se obtienen: X


1
= 36,5 c = 3
Cecilia Ros Varillas
40
Entonces la tabla de frecuencias completa es:
Intervalos X
i
f
i
F
i
h
i
% H
i
%
35 38 36,5 4 4 11,8 11,8
38 41 39,5 6 10 17,6 29,4
41 44 42,5 8 18 23,5 52,9
44 47 45,5 7 25 20,6 73,5
47 50 48,5 5 30 14,7 88,2
50 53 51,5 4 34 11,8 100
Luego:
( )( ) ( )( ) ( )( )
6
3 1
36, 5 4 39, 5 6 ... 51, 5 4
43, 8235
34 34
i i
i
x f
X cm
=
+ + +
= = =

X = 43,8235 cm
3
La clase modal es el tercer intervalo ya que tiene la mayor cantidad de mediciones
d
1
= 8 - 6 = 2 d
2
= 8 - 7 = 1
Reemplazando en la frmula de la moda, tenemos:
3
2
41 3 43 43
2 1
mo mo cm
| |
= + = =
|
+
\ .
Ahora calculamos la desviacin estndar:
6
2 2
2
3 1
-
66002, 5 - 34(43, 8235)
( ) 4, 6238
-1 33
i i
i
x f n x
S x cm
n
=
= = =

Finalmente se calcula el coeficiente de variacin (C.V.)


( ) 4, 6238
. . 100% 100% 10, 55% . . 10, 55%
43, 8235
S x
CV CV
x
= = = =
Se observa una moderada dispersin en las mediciones.

Estadstica y diseo de experimentos


41
Ejercicio 3
Para encontrar el efecto de la carga de polvo en la salida de un sistema con un
precipitante, se efectuaron las siguientes mediciones (en gramos por m
3
en el
tubo del gas):
1,5 1,5 1,4 1,1 1,7 1,8 1,6 1,5 1,6 2,2 1,7 1,4 1,9 1,9 1,5 1,4 1,9 2,1
1,8 2,0 1,7 1,2 1,5 2,2 2,1 2,0 1,8 1,7 1,3 1,9 1,4 1,7 1,5 1,2
a. Clasifique los datos en una tabla de frecuencias usando la regla de Sturges.
b. Calcule la media, mediana y C.V. para los datos agrupados e interprtelos.
Solucin
Primero hacemos el procedimiento para la construccin de la tabla de frecuencias
por intervalos:
m = 1 + 3,3 log(34) = 6,054 6
R = 2,2 - 1,1 = 1,1
1,1
0,183 0, 2
6
c = =

Se ha redondeado a un decimal porque los datos tienen un decimal.
La tabla de frecuencias es la siguiente:
Intervalos X
i
f
i
F
i
h
i
% H
i
%
1,1 1,3 1,2 3 3 8,8 8,8
1,3 1,5 1,4 5 8 14,7 23,5
1,5 1,7 1,6 8 16 23,5 47
1,7 1,9 1,8 8 24 23,5 70,5
1,9 2,1 2,0 6 30 17,7 88,2
2,1 - 2,3 2,2 4 34 11,8 100
Clculo de los estadsticos pedidos:

3
1, 2(3) 1, 4(5) 1, 6(8) 1, 8(8) 2(6) 2, 2(4)
1, 7235 por
34
X g m
+ + + + +
= =
Cecilia Ros Varillas
42
3
17 16
1, 7 0, 2 1, 725 por
8
e
m g m

| |
= + =
|
\ .
2 2
2
2 1
-
103, 88- 34(1, 7235)
( ) 0, 087412833
-1 33
( ) 0, 087412833 0, 2956566
m
i i
i
x f nX
S x
n
S x
=
= = =
= =

( ) 0, 2956566
. . 100% 100% 17,15%
1, 7235
S x
CV
X
= = =
Se observa una regular dispersin en las mediciones.
Ejercicio 4
Se realizaron las mediciones del volumen (cm
3
) de 30 sustancias qumicas so-
metidas a la misma temperatura, los resultados se clasificaron en una tabla de
frecuencias simtrica con 5 intervalos de igual amplitud. Se conoce la siguiente
informacin:
X
4
= 61 (cuarta marca de clase) X = 55 cm
3
f
1
= 4 F
2
= 10
Complete la tabla de frecuencias, luego calcule la mediana, moda y el coeficiente
de variacin, interprete sus resultados.
Solucin
Como la tabla de frecuencias es simtrica y con la informacin dada, entonces
f
1
= f
5
= 4 f
2
= f
4
= 6
Se ubican los datos en la tabla de frecuencias y se tiene:
Intervalos X
i
f
i
F
i
h
i
% H
i
%
61-3c 4 4
61-2c 6 10
61-c 10 20
61 6 26
61+c 4 30

Estadstica y diseo de experimentos


43
Sea c = amplitud, usamos el valor de la media:
(61 3 )(4) (61 2 )(6) (61 )(10) (61)(6) (61 )(4)
55
30
c c c c
X
+ + + + +
= =
1830 - 30c = 1650 30c = 180 c = 6
Luego la tabla de frecuencias completa es la siguiente:
Intervalos X
i
f
i
F
i
h
i
% H
i
%
40 - 46 43 4 4 13,3 13,3
46 52 49 6 10 20,0 33,3
52 58 55 10 20 33,3 66,7
58 64 61 6 26 20,0 86,7
64 70 67 4 30 13,3 100
Como la distribucin de frecuencias es simtrica:
X = me = mo = 55 cm
3
Entonces, el volumen promedio, la mediana y la moda de las mediciones corres-
pondientes a las 30 sustancias es 55 cm
3
2 2
2
2 1
-
92334 30(55)
( ) 54, 62068966
-1 29
m
i i
i
x f nX
S x
n
=

= = =

3
( ) 54, 62068966 7, 39058 S x cm = =
Por lo tanto el C.V. es:
( ) 7, 39058
. . 100% 100% 13, 44%
55
S x
CV
X
= = =
Este valor indica que los datos son regularmente heterogneos, la dispersin es
moderada.

Cecilia Ros Varillas


44
Ejercicio 5
La contaminacin con petrleo de los mares estimula el crecimiento de ciertos
tipos de bacterias. Un conteo de microorganismos oleolticos (bacterias por 100
mililitros) en n muestras de agua de mar, fueron clasificados en una tabla de
frecuencias con 6 intervalos de igual amplitud, adems se presenta los siguientes
resultados:
f
1
= f
5
h
4
% = 25% h
5
% + h
6
% = 15% F
3
= 24
H
1
% = 10% f
3
= 6f
6
X = 21 X
3
=
Complete la tabla de frecuencias y calcule la mediana.
Solucin
Primero se coloca la informacin dada:
Intervalo X
i
f
i
F
i
h
i
% H
i
%
a
10%
n/2 6b 24
25%
a
b
h
4
% = 25% h
5
% + h
6
% = 15% h
4
% + h
5
% + h
6
% = 40%
h
1
% + h
2
% + h
3
% = 100% 40% = 60% = H3%
3 3
3
3
24
como : 40
0, 60
F F
H n
n H
= = = =
Colocando algunos resultados en la tabla de frecuencias:
n
2

Estadstica y diseo de experimentos


45
Intervalo X
i
f
i
F
i
h
i
% H
i
%
20-2c 4 4 10% 10%
20-c 8 12 20% 30%
20 12 24 30% 60%
20+c 10 34 25% 85%
20+2c 4 38 10% 95%
20+3c 2 40 5% 100%
X=
(20-2c)(4) + (20-c)(8) + (20)(12) + (20+c)(10) + (20+2c)(4) + (20 + 3c)(2)
= 21
40
800 + 8c = 840 c = 5
Completando la tabla de frecuencias:
Intervalos X
i
f
i
F
i
h
i
% H
i
%
7,5 - 12,5 10 4 4 10% 10%
12,5 17,5 15 8 12 20% 30%
17,5 -22,5 20 12 24 30% 60%
22,5 27,5 25 10 34 25% 85%
27,5 32,5 30 4 38 10% 95%
32,5 37,5 35 2 40 5% 100%
Calculando la mediana (el tercer intervalo contiene a la mediana):
20 12
17, 5 5 20, 8333
12
e
m

| |
= + =
|
\ .
El valor de la mediana es de 20,8333 bacterias por 100 mililitros.
Ejercicio 6
La siguiente tabla de frecuencias, representa la distribucin de la Resistencia a la
ruptura (en onzas) de 50 fibras de nylon. La longitud de clase es constante e igual
a 20, adems se conoce que la resistencia promedio es 76 onzas y S(X) = (30/7) 58

onzas.

Cecilia Ros Varillas


46
Resistencia Frecuencia absoluta
a
8
b
[ - 100 > 17
c
6
Se pide,
a. Las frecuencias a, b y c.
b. El valor de la mediana.
Solucin
2
2
30 30
58 58
7 7
S S
| |
= =
|
\ .
2 2 2 2 2
2 2
( ) 50(76)
30
58 341000
49 7 49
i i i i
i i
x f n X x f
S x f

| |
= = =
|
\ .


Como la amplitud es 20 y con los datos de la tabla se tiene:
Resistencia X
i
f
i
20 - 40 30 a
40 - 60 50 8
60 - 80 70 b
80 - 100 90 17
100 - 120 110 c
120 - 140 130 6
2 2 2 2
341000 30 70 110 81900 9 49 121 819
i i
x f a b c a b c = + + = + + =

76 3800 3 7 11 109
50
i i
i i
x f
x x f a b c = = = + + =



Estadstica y diseo de experimentos
47
50 19
i
f a b c = + + =

Operando y simplificando tenemos:


9 49 121 819 (1) a b c + + =
19 (2) a b c + + =
3 7 11 109 (3) a b c + + =
10 5 4 a b c = = =
El valor de la mediana es:
25 23
80 20 82, 3529 onzas
17
me
| |
= + =
|
\ .
Ejercicio 7
Una fbrica de productos qumicos paga en promedio 700 soles de salario sema-
nal a los trabajadores y la desviacin estndar de los salarios es de 54 soles, el
sindicato pide un aumento para cada trabajador del 15% de su salario ms una
bonificacin por riesgo de planta de 25 soles por semana.
a. Calcule el promedio y la desviacin estndar de los salarios de los trabajadores
considerando el aumento.
b. Compare el C.V. sin el aumento y el C.V. con el aumento, cambi la dispersin?
Solucin
Este ejercicio se resuelve considerando las propiedades de la media y varianza,
entonces:
Sean
x = salario inicial de cada trabajador
y = salario de cada trabajador con el aumento
Datos: X = 700 S(X) = 54
Y
i
= x
i
+ 0,15x + 25 = 1,15x
i
+ 25
Y = 1,15X + 25 = 1,15(700) + 25 = 830 soles
S(1,15x + 25) = 1,15 S(x) = 1,15(54) = 62,1 soles


Cecilia Ros Varillas
48
El salario promedio de los trabajadores considerando los aumentos es de 830
soles, y la desviacin estndar respectiva es de 62,1 soles.
Calculando el C.V. :
54
. .( ) 100% 7, 71%
700
CV x = =
62,1
. .( ) 100% 7, 48%
830
CV y = =
La dispersin en los sueldos se modific muy brevemente, con los aumentos la
dispersin en los sueldos disminuy.
2.7 EJERCICIOS PROPUESTOS
Ejercicio 1
Los siguientes datos representan el peso (g) de 34 madejas de lana de las mismas
dimensiones:
6,23 6,78 6,32 6,34 6,17 6,32 6,54 6,70 6,78 6,43 6,89 6,54 6,78 6,54 6,54
6,78 6,54 6,32 6,73 6,58 6,54 6,76 6,50 6,43 6,32 6,54 6,21 6,45 6,65 6,64
6,63 6,43 6,54 6,69.
a. Clasificar los datos en una tabla de frecuencias, usando la regla de Sturges.
b. Calcular la media aritmtica, mediana, moda y C.V., interpretar
Ejercicio 2
Los qumicos orgnicos a menudo purifican los compuestos orgnicos por un
mtodo conocido como cristalizacin fraccionada. Un experimentador deseaba
preparar y purificar 4,85 gramos de anilina. Se prepararon individualmente 30
cantidades de anilina de 4,85 gramos y se purificaron convirtindose en acetani-
lida. Las cantidades obtenidas fueron las siguientes (en gramos):
3,85 3,88 3,90 3,62 3,72 3,80 3,85 3,36 4,02 3,83
3,80 3,85 3,36 4,01 3,85 3,88 3,90 3,90 3,62 3,72
3,62 3,72 3,80 3,85 3,72 3,80 3,85 3,36 4,01 3,85
Agrupando los datos en una tabla de frecuencias por intervalos:
a. Calcule el nmero medio de gramos de acetanilida que se ha obtenido.
b. Calcule la mediana, moda y C.V.
Estadstica y diseo de experimentos
49
Ejercicio 3
En una determinada prueba se obtuvieron los siguientes datos acerca de los pesos
(en gramos) de n productos elaborados por una fbrica. Los datos se agruparon en
una tabla de frecuencias con 7 intervalos de igual amplitud y se obtuvo un peso pro-
medio de 170 gramos, se sabe que el menor peso recopilado es de 100 gramos y que:
F
2
= 9 f
3
= 7 F
3
= f
4
H
4
% = 64% h
1
% = 6% f
5
+ f
7
= 12
Lmite superior del 5to intervalo = 200, complete la tabla de frecuencias y calcule
la mediana, la moda y el coeficiente de variacin.
Ejercicio 4
Los datos correspondientes a una muestra de 60 sustancias qumicas se clasifi-
caron en una tabla de frecuencias simtrica con 7 intervalos de igual amplitud,
resultando la mediana igual a 25,5 gramos.
Adems algunos valores de la tabla son:
L6 = 50 (lmite superior del 6to. intervalo); h
3
= 0,2; H
4
= 0,65; H
6
=0,95; se pide:
a. Complete la tabla de frecuencias
b. Calcule el C.V. e interprtelo.
Ejercicio 5
Los siguientes son los resultados obtenidos en la determinacin de plomo en
partculas suspendidas en el aire en ug/m
3
: 2,4 2,1 1,6 2,2 1,9
2,5 2,8 2,2 3,5 3,9
a. Sin agrupar los datos calcule la media, mediana, moda y C.V. Interprete
b. Si cada dato disminuye un 18% y luego aumenta en 0,5 ug/m
3
Cul es la nueva
media y el nuevo C.V.?
Ejercicio 6
En un Laboratorio de Qumica, se realizan mediciones acerca de los tiempos de ig-
nicin (en segundos) de ciertos materiales expuestos al fuego. Se elabor una tabla
de frecuencias con 6 intervalos de igual amplitud, resultando ser simtrica, adems:
X
3
= 16,5 X
6
= 25,5 f
1
= 4a + 1 (a es la amplitud del intervalo)
h
5
= 0,26 y
H
2
H
3
=
2
5
Cecilia Ros Varillas
50
a. Calcule qu tanto por ciento tienen un tiempo menor de 21 minutos.
b. Calcule la mediana de los datos.
Ejercicio 7
Los gastos (en dlares) correspondientes al mes de junio del 2005 de un grupo
de personas profesionales, las cuales fueron seleccionadas al azar en la ciudad
de Lima se distribuy en una tabla de frecuencias con 6 intervalos de clase con
amplitud constante igual a 80 dlares; si se conocen los siguientes datos:
f
1
= f
6
f
2
= f
5
f
4
f
3
= 4 h
1
% h
2
% = 9% h
4
% = 30%
6
H
3
% = 49% X
i
= 4800 (suma de marcas de clase)
i=1
Complete la tabla de frecuencias y calcule la mediana y la moda.
Ejercicio 8
El coeficiente de variacin de los ingresos de 200 empleados de una compaa
es 57%. Despus de reajustar, segn ley, todos los sueldos en 11 dlares, este
coeficiente de variacin es ahora de 50%. Sin embargo, la gerencia fija un sueldo
mnimo de 71 dlares. Antes del reajuste haba 35 personas que tenan un sueldo
promedio de 40 dlares y todos ellos ganaban menos de 60 dlares, con la nueva
poltica de la gerencia, sus sueldos sern elevados en promedio a 71 dlares. De-
termine la cantidad de dinero que necesitar mensualmente la compaa, para
pagar los sueldos despus de hacer efectivos los reajustes.
Ejercicio 9
Un ingeniero qumico vigila la calidad del agua midiendo la cantidad de slidos
suspendidos en una muestra de agua pluvial. En n das distintos observ los
slidos suspendidos (partes por milln) y estas mediciones las agrup en una
tabla de frecuencias con 6 intervalos de amplitud constante e igual a 10, se sabe
que la suma de las marcas de clase es igual a 240, y adems se tiene la siguiente
informacin de la tabla de frecuencias.

6
2 3 1 6
4
2 4 5
% 52, 5% 28 38
% % 38, 75 % % 21, 25 %
j
j
h F F f f
h h h
=
= = = =
+ = =


Complete la tabla de frecuencias.
En base a la tabla de frecuencias calcule la media, mediana, moda y C.V., interprete.
Estadstica y diseo de experimentos
51
Los mtodos estadstico-matemticos emergieron desde la teora de probabili-
dad, la cual data desde la correspondencia entre Pascal y Pierre de Fermat (1654).
Christian Huygens (1657) da el primer tratamiento cientfico que se conoce a la
materia. El Ars Coniectandi (1713) de Jakob Bernoulli y la Doctrina de posibili-
dades (1718) de Abraham de Moivre estudiaron la materia como una rama de
las matemticas. Laplace (1774) represent la ley de probabilidades de errores
mediante una curva y dedujo una frmula para la media de tres observaciones.
En la era moderna, el trabajo de Kolmogrov ha sido un pilar en la formulacin
del modelo fundamental de la Teora de Probabilidades, el cual es usado a travs
de la estadstica.
En los captulos anteriores se han tratado principalmente las tcnicas empleadas
para describir y presentar en la forma ms significativa posible, la informacin
que se obtiene cuando se realizan mediciones o determinaciones en el laborato-
rio, o simplemente cuando se recopila una muestra.
En este captulo se presentar de una manera didctica la teora de probabilida-
des, algo que no es tan extrao para muchas personas, ya que en la vida diaria
con mucha frecuencia emitimos juicios probabilsticos, debido a las acciones o ex-
perimentos que realizamos, as tambin se genera cierto grado de incertidumbre
cuando queremos realizar estas actividades. La cuantificacin de esa incertidum-
bre es base en la teora de probabilidades, la que se basa en la experimentacin.
3.1 DEFINICIONES BSICAS
3.1.1 Experimento
Es todo proceso de observacin o ejecucin de un fenmeno, se dice que un ex-
perimento es aleatorio cuando tiene dos o ms resultados posibles y no se conoce
a priori el resultado a obtener.
Por ejemplo, se presentan tres experimentos aleatorios:
Probabilidades
CAPTULO 3
Cecilia Ros Varillas
52
E1: lanzar un dado
E2: Seleccin de un artculo
E3: Medir la resistencia a la ruptura (onzas) de fibras de nylon
3.1.2 Espacio muestral
Conjunto de todos los resultados posibles de un experimento. (Como un conjun-
to universo), el espacio muestral puede ser finito o infinito.
Por ejemplo, de cada uno de los experimentos anteriores, se presenta su respec-
tivo espacio muestral:

1
= {1, 2, 3, 4, 5, 6}

2
= {Defectuoso, no defectuoso}

3
= { x R / x > 10}
Entonces
1
,
2
son espacios muestrales finitos y
3
es un espacio muestral in-
finito.
3.1.3 Evento o suceso
Es un subconjunto del espacio muestral y rene ciertos resultados de inters. Al
igual que los conjuntos, los eventos se denotan con letras maysculas: A, B, C,...
Los eventos pueden ser:
a. Evento Elemental; formado por cada resultado individual del espacio muestral.
A = {2}
b. Evento imposible (); aquel evento que no tiene resultados que pertenezca al
espacio muestral, es el evento que nunca ocurre.
Ejemplo:
A: resultado siete al lanzar un dado normal A = { } =
c. Evento seguro; aquel evento formado por todos los resultados del espacio
muestral, entonces el evento seguro es el mismo espacio muestral .
d. Evento Contrario (A); aquel evento formado por todos los resultados que no
estn en A, el evento A ocurre cuando el evento A no ocurre.
Se cumple que: A A' =
e. Eventos mutuamente excluyentes (m.e).
Dos eventos A y B; definidos en , son m.e. si A B =
(No ocurren simultneamente)
Las operaciones o lgebra de eventos son las mismas que las operaciones entre
los conjuntos y cumplen todas las propiedades de los conjuntos.
Estadstica y diseo de experimentos
53
Ocurrencias de eventos:
Sean los eventos A
1
, A
2
, ... A
k
luego se dice que:
1
k
i
i
A
=

ocurre, si ocurre al menos un A


i

1
k
i
i
A
=

ocurre, si ocurre todos los eventos A


i

A ocurre, si A no ocurre.
A-B ocurre, si ocurre A y no ocurre B.
Ejemplo 1 de espacio muestral:
Determinar el espacio muestral del siguiente experimento:
Se clasifica un artculo en defectuoso (d) y no defectuoso (d) y el control de cali-
dad consiste en extraer artculos hasta observar dos defectuosos o hasta extraer
4 artculos.
Solucin
El espacio muestral ser:
= {dd, ddd, dddd, dddd, ddd, dddd, dddd, dddd, dddd, dddd, dddd}
Ejemplo 2 de espacio muestral:
En un laboratorio qumico, el volumen producido por da de un en producto par-
ticular vara entre 15 cm
3
y un valor mximo de 50 cm
3
, los cuales corresponden a
la capacidad. Se escoge un da aleatoriamente y se observa la cantidad produci-
da. Escribir el espacio muestral.
Solucin
= {x

R / 15 x 50}
Ejemplo 3 (ocurrencia de eventos):
Sean A, B, C, D eventos de , expresar los siguientes eventos usando simbologa
de los conjuntos.
Cecilia Ros Varillas
54
a. Al menos ocurra un evento
b. Que ocurran todos los eventos
c. Que ninguno ocurra
d. Que exactamente uno ocurra
Solucin
a. (A B C D)
b. (A B C D)
c. (A' B' C' D') = (A B C D)'
d. (A B' C' D') (A' B C' D') (A' B' C D') (A' B' C' D)
3.2 TCNICAS DE CONTEO
Las tcnicas de conteo estudian los mtodos que permite encontrar el nmero de
resultados posibles de algunos experimentos. Nos dice cuntos son y no necesa-
riamente cules son esos resultados.
Las principales tcnicas de conteo son las siguientes:
3.2.1 Principio de adicin
Sean los eventos A
1
, A
2
,...A
k
definidos en , si el evento A
1
se puede realizar de
n(A
1
)

formas posibles, el evento A
2
se puede realizar de n(A
2
) formas posibles, y
as sucesivamente, el evento A
k
se puede realizar de n(A
k
) formas posibles, enton-
ces el evento o proceso (A
1
A
2
... A
k
) se puede realizar de:
n(A
1
) + n(A
2
) + ... + n(A
k
) formas posibles.
Los eventos A
1
, A
2
,...A
k
son mutuamente excluyentes, no ocurren simultneamente.
Ejemplo:
Un estudiante debe elegir un microscopio para hacer un anlisis qumico. En
una mesa del laboratorio hay 15 microscopios, en otra mesa hay 20 y en otra 10.
Cuntos microscopios tiene el estudiante para elegir?
Solucin
Tiene para elegir cualquiera de los microscopios de cada mesa, es decir:
15 + 20 + 10 = 45 opciones
Estadstica y diseo de experimentos
55
3.2.2 Principio de multiplicacin
Si un proceso completo consiste en k diferentes etapas A
1
, A
2
,...A
k

de los cuales el
primero se puede realizar de n(A
1
) formas posibles, el evento A
2
se puede reali-
zar de n(A
2
) formas posibles,. y el evento A
k
se puede realizar de n(A
k
) formas
posibles, entonces el proceso completo se puede realizar de:
n(A
1
) x n(A
2
) x ... x n(A
k
) formas posibles.
Ejemplo:
Un anlisis qumico completo requiere de un reactivo tipo A, un reactivo tipo B
y un reactivo tipo C. En el laboratorio hay 5 reactivos tipo A, 8 reactivos tipo B y
10 reactivos tipo C De cuntas formas posibles puede hacer el anlisis qumico?
Solucin
5 x 8 x 10 = 400 formas posibles
3.2.3 Permutacin
Son arreglos lineales de los elementos de un conjunto teniendo en cuenta el orden
que ocupa en cada arreglo, es decir, interesa el orden.
Tenemos:
Permutacin de n elementos (todos distintos) tomados todos a la vez (de n en n)
!
n
n
P n =
Ejemplo:
Un mecanismo electrnico de control requiere de 5 chips de memoria iguales.
De cuntas maneras puede ensamblarse este mecanismo colocando los cinco
chips en las cinco posiciones dentro del controlador?
Respuesta:
5
5
5! 120 P = = maneras.
Permutacin de n elementos (todos distintos) tomados de r en r
( )
!
- !
n
r
n
P
n r
=
Cecilia Ros Varillas
56
Ejemplo:
Cuntos nmeros (todos distintos) de tres cifras se pueden formar con los dgi-
tos 5; 3; 4; 6; 9?
Respuesta:
( )
5
3
5! 120
60
5- 3 ! 2
P = = = nmeros de tres cifras
Permutacin de n elementos (no todos distintos) tomados todos a la vez (de n en n)
1 2
, ,.....
1 2
!
! !.... !
r
n
n n n
r
n
P
n n n
=

donde n
1
+ n
2
+ ... n
r
= n

Ejemplo:
Cuntas palabras diferentes se pueden formar con todas las letras de la palabra
LABORATORIO?
Solucin
n = 11 n(L) = 1 n(A) = 2 n(B) = 1 n(O) = 3 n(R) = 2 n(T) = 1 n(I) = 1
11
1, 2, 1,3,2, 1, 1
11!
1 663 200
1!2!1!3!2!1!1!
P = =
3.2.4 Permutacin Circular
Cuando los elementos se disponen en forma circular (puede ser una mesa re-
donda, una rueda, etc.), entonces el nmero de permutaciones circulares de n
elementos tomados todos a la vez, se calcula:
Pcir, n = (n -1)!

Esta frmula se obtiene cuando se fija uno de los n objetos en el arreglo circular,
los restantes (n 1) se consideran como una permutacin lineal, la cual se realiza
de (n - 1)!
Ejemplo:
Estadstica y diseo de experimentos
57
En el laboratorio hay una gran mesa circular y 10 estudiantes se sientan alrede-
dor de la mesa De cuantas maneras se pueden sentar los 10 estudiantes alrede-
dor de la mesa circular?
Solucin
Hay n= 10 elementos para permutar, y se fija un estudiante y se permuta el resto,
entonces se tiene:
(10 1)! = 9! = 362 880 formas de sentarse alrededor de la mesa circular los 10
estudiantes.
3.2.5 Combinacin
Son arreglos lineales de los elementos de un conjunto sin considerar el orden en
cada arreglo, es decir, no interesa el orden. Tenemos:
Combinacin de n elementos (todos distintos) tomados de r en r
( )
!
! - !
n
r
n
C
r n r
=
Ejemplo:
De un conjunto de seis estudiantes hombres y cinco estudiantes mujeres se desea
formar comits de 8 estudiantes Cuntos comits se pueden formar? Cuntos
comits si cada uno de ellos debe contener por lo menos tres estudiantes muje-
res?
Solucin
A: Comits de 8 estudiantes B: Comits con al menos 3 mujeres
11
8
( ) 165 n A C = =
( )( ) ( )( ) ( )( )
6 5 6 5 6 5
5 3 4 4 3 5
( ) 6 10 15 5 20 1 155 n B C C C C C C = + + = + + =

3.2.6 Ejercicios de Conteo
Ejercicio 1
Se tienen disponibles 8 consonantes y 4 vocales, todas diferentes Cuntas pala-
bras de 5 letras pueden formarse, sabiendo que las palabras tienen 3 consonantes
y 2 vocales? No es necesario que las palabras tengan significado.
Cecilia Ros Varillas
58
Solucin
Primero se eligen las 3 consonantes de las 8 disponibles y 2 vocales de las 4 voca-
les disponibles, luego una vez elegidas estas 5 letras se permutan ya que cuando
se forman palabras (al igual que los nmeros) interesa el orden, entonces el n-
mero total de palabras que se pueden formar es:
! 5 C C
4
2
8
3
= 40 320 palabras
Ejercicio 2
Se tienen los dgitos {1; 2; 3; 4; 5; 6; 7}, se seleccionan en forma aleatoria cuatro
dgitos, si los dgitos no se pueden repetir:
a. Cuntos mayores de 5000 se pueden obtener?
b. Cuntos nmeros si 4 y 5 no deben estar juntos en la misma muestra?
Solucin
a. Slo puede ser 5; 6 7
3 x 6 x 5 x 4 = 360 nmeros mayores de 5000
b. Los nmeros 4 y 5 no deben estar juntos
5 x 4 x 3 x 2 = 120 (ni 4 ni 5)
4
1 x 5 x 4 x 3 = 60x4=240 (sale 4 y no 5, y el 4 en cualquier lugar)
5
1 x 5 x 4 x 3 = 60x4=240 (sale 5 y no 4, y el 5 en cualquier lugar)
Total de casos= 120+240+240= 600

Estadstica y diseo de experimentos
59
Ejercicio 3
En el laboratorio de qumica hay 5 diferentes anlisis que realizar y hay 8 alum-
nos para hacerlo De cuntas formas pueden ser asignados los 8 alumnos para
hacer los 5 anlisis?
(Cada anlisis es realizado slo por un alumno).
Solucin
El primer anlisis puede ser realizado por cualquiera de los 8 alumnos, el segun-
do anlisis puede ser realizado por cualquiera de los 7 alumnos que quedan, el
tercer anlisis por cualquiera de 6 alumnos restantes, el cuarto anlisis por cual-
quiera de los 5 que quedan y el ltimo anlisis por cualquiera de los 4 alumnos
restantes, por lo tanto el nmero de formas que se pueden asignar a los 8 alum-
nos los 5 anlisis es:
8 x 7 x 6 x 5 x 4 = 6720 formas posibles
Tambin se puede realizar mediante:
8
5
8! 8! 8 7 6 5 4 3!
8 7 6 5 4 6720
(8 5)! 3! 3!
P

= = = = =

3.3 PROBABILIDAD
Podemos definir probabilidad, como la teora relacionada con posibles resulta-
dos de experimentos, es decir, la cuantificacin de una incertidumbre basada en
la experimentacin. Para poder cuantificar numricamente el valor de la proba-
bilidad de un evento se deber enumerar cada resultado posible del evento dado
y establecer las frecuencias relativas de estos resultados.
3.3.1 Enfoque Clsico (Probabilidad de un Evento)
Para asignar probabilidad a los eventos definidos en un espacio muestral finito
donde todos los eventos elementales son igualmente probables, la probabilidad
de cualquier evento A se define:
P(A) =
nmero de casos favorables a A
nmero de casos posibles
Es decir:
Cecilia Ros Varillas
60

( )
( )
( )
n A
P A
n
=

Esta norma de asignacin se atribuye a Laplace.


El punto ms importante de la definicin clsica de probabilidad es la suposi-
cin de una situacin ideal en la que se conoce el nmero total de resultados
posibles de un experimento, a travs de un razonamiento deductivo se llega a la
frecuencia relativa esperada en cada resultado. As, la probabilidad de un evento
se interpreta como la frecuencia relativa terica con que se presentar el evento.
3.3.2 Enfoque Emprico
Este enfoque permite determinar la probabilidad con base en la proporcin de
veces que ocurre un resultado favorable en cierto nmero experimentos.
Aunque es fcil asignar frecuencias relativas esperadas a cada uno de los resulta-
dos posibles en un juego de azar, no es igualmente fcil hacerlo en la mayora de
los experimentos de la vida real. En casos reales, la frecuencia relativa esperada
se asigna con base en resultados de experimentos empricos. As, podemos no
conocer la proporcin exacta de alimentos contaminados en una feria, pero po-
demos estudiar una muestra al azar tomada entre todos los alimentos y estimar
la proporcin del total que est contaminada de acuerdo con los resultados de
la muestra. Una vez que hayamos llegado a una estimacin podemos emplear la
teora clsica de probabilidad.
3.4 AXIOMAS DE PROBABILIDAD
La probabilidad de todo evento A definido en cumple con los siguientes axio-
mas:
1) P(A) 0
2) P() = 1
1 1
3) ( ) ,
i i i i j
i i
P A P A A A A i j

= =
| |
= =
|
\ .

3.5 PROPIEDADES DE PROBABILIDAD
Propiedad 1
P() = 0
Estadstica y diseo de experimentos
61
Demostracin
( )
( ) 0
0
( ) ( )
n
P
n n

= = =

Propiedad 2
P(A') = 1- P(A)
Demostracin
P() = P(A' A) = P(A') + P(A)
luego:
1 = P(A') + P(A)
Despejando:
P(A') = 1 P(A)
Propiedad 3
P (A B) P(A) + P(B) - P(A B)
Si los eventos son disjuntos => P(A B) = P(A) + P(B)
(Esta propiedad se puede extender para ms eventos)
Ejemplo:
Una clase consta de 18 hombres y de 15 mujeres, de los cuales la mitad de los
hombres y la tercera parte de las mujeres han desaprobado el curso de Estadstica
y Probabilidades. Se elige un estudiante al azar y se pide la probabilidad.
a. De que sea hombre o haya desaprobado el curso de Estadstica y Probabilidades.
b. De que no sea mujer y no haya desaprobado el curso de Estadstica y
Probabilidades
Solucin
n() = 33 (Cualquiera de los 33 alumnos puede ser seleccionado)
Sean los eventos:
H: escoger un hombre
M: escoger una mujer
D: desaprobado el curso de Estadstica y Probabilidades.
Cecilia Ros Varillas
62
Entonces:
P(H) = 18/33 P(M) = 15/33
P(H D) = 9 P(M D) = 5 => P(D) = 14/33
P(H D) = P(H) + P(D) - P(H D)
P(H D) = 18/33 + 14/33 - 9/33 = 23/33 = 0,69697
P(M D') = P(M D)' = 1 P(M D)
= 1 [P(M) + P(D) P(M D)]
= 1 [15/33 + 14/33 5733]
= 1 24/33 = 9/33 = 0,2727
3.6 PROBABILIDAD CONDICIONAL
En muchas situaciones la ocurrencia de ciertos eventos o procesos afectan la
ocurrencia de otro evento dado cuya probabilidad deseamos evaluar, esto es, la
ocurrencia del nuevo evento est condicionado a un evento previo por lo que el
valor de la probabilidad ya no es una simple probabilidad sino que se restringe
al evento ocurrido.
Esto sucede con mucha frecuencia en anlisis en laboratorio, cuando se desea
realizar un nuevo proceso, hay algunos que dependen de otros procesos que ya
ocurrieron.
Entonces ahora se va a definir la probabilidad de un evento que est condiciona-
do a otro evento que ya ocurri y que va a afectar a su probabilidad.
3.6.1 Definicin de probabilidad condicional
Sean los eventos A y B definidos en , entonces, la probabilidad de que ocurra el
evento A dado que ha ocurrido el evento B, se denota P(A/B), y es aquella proba-
bilidad de A condicionada a B, o probabilidad de A sabiendo que pasa B.
Se calcula:
( )
( )
/
( )
P A B
P A B
P B

=
Tambin se puede definir con base en el nmero de elementos:
Estadstica y diseo de experimentos
63
( )
( )
( )
( )
( )
( )
( )
/
( )
( )
n A B
n A B
n
P A B n
P A B
n B
P B
n


= = =

( )
( ) n B
n
( )
( )
/
( )
n A B
P A B
n B

=
Es decir, el espacio muestral se reduce al evento B que ya ocurri.
3.6.2 Propiedades de probabilidad condicional
Sean A, B y C eventos definidos en entonces.
Propiedad 1
0 P(A/B) 1
Esto es:
(i) P(A/B) = 0 <> A B =
(ii) P(A/B) = 1 <> B A
Demostracin:
Por definicin ( )
( )
/
( )
P A B
P A B
P B

=
como: ( )
( ) 0
/ 0
( ) ( )
P
A B P A B
P B P B

= = = =
Por definicin ( )
( )
/
( )
P A B
P A B
P B

=
Si
( )
( )
/ 1
( )
P B
B A P A B
P B
= =

Cecilia Ros Varillas


64
Propiedad 2
P(A/B) P(B/A)
Propiedad 3
P (A/ ) = P(A)
Propiedad 4
P(/B) = 1
Propiedad 5
P(A B / C) = P(A/C) + P(B/C) <> A B =
Propiedad 6
P(A/B) + P(A'/B) = 1
Ejemplo de probabilidad condicional:
En el laboratorio de qumica hay 20 instrumentos para medir el volumen, 5 son
tubos de prueba de los cuales 2 estn fallados, 10 son probetas de los cuales 4 no
tienen fallas y el resto son pipetas; del total de instrumentos 12 estn con fallas. Si
se escoge un instrumento al azar:
a. Cul es la probabilidad de que sea tubo de prueba si se observa que est fallado?
b. Si no est fallado Cul es la probabilidad de que sea pipeta?
c. Cul es la probabilidad de que no sea probeta dado que no est fallado?
d. Si es tubo de prueba Cul es la probabilidad de que este fallado?
e. Cul es la probabilidad de que no sea probeta ni est fallado?
Solucin
Sean los eventos
F: instrumento fallado T: tubo de prueba
R: probeta I: pipeta
Adems
T R I
F 2 6 4 12
F 3 4 1 8
5 10 5 20
Estadstica y diseo de experimentos
65
a)

( )
( ) 2 1
/
( ) 12 6
n T F
P T F
n F

= = =
b)

( )
( )
'
1
/ '
( ' ) 8
n I F
P I F
n F

= =
c)

( ) ( )
( )
'
4 1
' / ' 1 - / ' 1 0, 5
( ') 8 2
n R F
P R F P R F
n F

= = = = =
d)

( )
( ) 2
/ 0, 4
( ) 5
n F T
P F T
n T

= = =
e)

( ) ( ) ( )
' ' ' 1- P R F P R F P R F = =

| |
1 ( ) ( ) ( ) P R P F P R F = +

10 12 6 16 1
1 1 0, 2
20 20 20 20 5
(
= + = = =
(

3.6.3 Tipos de muestreo
Cuando se realizan extracciones sucesivas de los elementos u objetos de un con-
junto (una urna, caja, lote, etc.) pueden ocurrir dos tipos de muestreo:
Muestreo con reposicin (con sustitucin). En este caso el objeto extrado se de-
vuelve o repone y el nmero total de objetos (o espacio muestral) no disminuye
extraccin tras extraccin).
Muestreo sin reposicin (sin sustitucin). en este caso el objeto extrado no se
devuelve ni se repone y el nmero total de objetos (o espacio muestral) disminu-
ye extraccin tras extraccin.
Cecilia Ros Varillas
66
3.6.4 Teorema de multiplicacin de probabilidades (probabilidad
conjunta)
Sean A y B eventos definidos en , si estos eventos estn relacionados de tal
manera que la ocurrencia de uno de ellos depende de la ocurrencia del otro, en-
tonces la probabilidad de que ocurran ambos A y B (probabilidad conjunta), se
define:
P(A B) = P(A) P(B/A) + P(B) P(A/B)
Esto es si cualquiera de ellos puede ocurrir primero.
Si se tienen los eventos A
1
y A
2
, entonces la probabilidad de que ocurran ambos
eventos en ese orden es:
P(A
1
A
2
) = P(A
1
) P(A
2
/A
1
)
En general, sean los eventos A
1
, A
2
, A
3
, ..., A
K
, la probabilidad de que ocurran los
eventos A
1
, A
2
, A
3
, ..., A
K
en forma simultnea y en ese orden es:
( )
1 2 1 3 1 2 1 2 -1
1
( ) ( / ) ( / ).... / .....
k
i k k
i
P A P A P A A P A A A P A A A A
=
| |
=
|
\ .

Nota. Para calcular probabilidades conjuntas se puede usar el diagrama del r-


bol, donde cada rama del rbol es una probabilidad condicional y la ramifica-
cin completa es la probabilidad conjunta, adems es necesario saber cmo fue
el muestreo.
Ejemplo:
Se tiene una urna con 4 fichas blancas y 5 rojas, se realizan dos extracciones su-
cesivas. Calcular la probabilidad de que ambas fichas extradas sean de diferente
color, si el muestreo:
a. Es con reposicin
b. Es sin reposicin
Solucin
Sean los eventos
B
i
: Ficha blanca en la i-sima extraccin
R
i
=Ficha roja... en la i-sima extraccin
Estadstica y diseo de experimentos
67
El diagrama del rbol es el siguiente:
B
2
B
1
R
2
B
2
B
1
R
2
Fichas de diferente color B y R, se consideran en cualquier orden,
a. Cuando el muestreo es con reposicin, entonces:
P(B
1
R
2
) + P(R
1
B
2
) = P(B
1
) P(R
2
/B
1
) + P(R
1
) P(B
1
/R
1
)
= (4/9) (5/9) + (5/9) (4/9) = 40/81 = 0,4938
b. Cuando el muestreo es sin reposicin, entonces:
P( B
1
R
2
) + P(R
1
B
2
) = P(B
1
) P(B
1
) P(R
2
/B
1
) + P(R
1
) P(B
2
/R
1
)
= (4/9) (5/8) + (5/9) (4/8) = 40/72 = 0,5556
3.7 EVENTOS INDEPENDIENTES
Dos eventos A y B son mutuamente independientes, si la ocurrencia o no ocu-
rrencia de uno de ellos no afecta a la ocurrencia o no ocurrencia del otro.
La probabilidad conjunta es:
P(A B) = P(A) P(B)
Entonces la probabilidad condicional es la siguiente:
P (A/B) = P(A) (La ocurrencia de B no afecta la ocurrencia de A)
Ejemplo:
En una planta productora de plstico, 2 tuberas vacan distintos productos qu-
micos en un recipiente mezclador. La tubera 1 tiene una probabilidad de 0,6
de llegar su flujo al recipiente y la tubera 2 tiene una probabilidad de 0,75 de
Cecilia Ros Varillas
68
llegar su flujo al recipiente, para obtener una solucin. Si las dos tuberas estn
funcionando. Cul es la probabilidad de que en el recipiente tenga flujos slo
de la tubera 1?
Solucin
Sean los eventos:
T
1
: llega flujo de la tubera 1
T
2
: llega flujo de la tubera 2
Estos eventos son independientes, ya que si llega flujo de una de las tuberas, eso
no implica que llegue o no llegue flujo de la otra tubera, entonces la probabilidad
de que llegue flujo slo de la tubera 1 y no llegue flujo de la tubera 2 es:
P (T
1
T
2
) = P(T
1
) P(T
2
)
P (T
1
T
2
) = (0,6) (1 0,75) = (0,6) (0,25) = 0,15
3.8 PARTICIN DEL ESPACIO MUESTRAL
Sean los eventos B
1
, B
2
, B
3
, ..., B
K
, stos forman una particin del espacio muestral
si cumplen las siguientes condiciones:
a. B
i
B
j
= i j (todos los eventos son mutuamente excluyentes entre s).
b.

1 1
( ) 1
k k
i i
i i
B P B
= =
= =

Figura 3.1. Particin del espacio muestral
Estadstica y diseo de experimentos
69
3.9 ECUACIN DE LA PROBABILIDAD TOTAL
Sea un experimento aleatorio cuyo espacio muestral es , sean los eventos B
1
, B
2
,
B
3
, ..., B
K
que forman una particin de y sea el evento A definido tambin en B
1
,
B
2
, B
3
, ..., B
K
; la probabilidad de que ocurra el evento A se define:
1
( ) ( ) ( / )
k
i i
i
P A P B P A B
=
=

Demostracin
Figura 3.2. Probabilidad Total
El evento A es la unin de las intersecciones de cada evento B
i
con el evento A,
A = (B
1
A) (B
2
A) ... (B
K
A)
Entonces la probabilidad del evento A es:
P(A) = P(B
1
A) + P(B
2
A) + ... + (B
K
A)
Luego:
P(A) = P(B
1
)P(A / B
1
) + P(B
2
)P(A / B
2
) + ... + P(B
k
)P(A / B
k
)
1
( ) ( ) ( / )
k
i i
i
P A P B P A B
=
=

Cecilia Ros Varillas


70
Tambin se puede presentar el diagrama del rbol siguiente:
A
B
1
A
A
B
2
A



A
B
k
A
Figura 3.3. Diagrama de rbol
Ejemplo de probabilidad total:
El volumen diario de produccin en tres plantas diferentes de una fbrica textil
es de 1000 chompas en la primera; 2000 chompas en la segunda y 3000 chompas
en la tercera. El porcentaje de chompas defectuosas producidas en las tres plantas
son 2%, 3% y 5% respectivamente. Si una persona extrae al azar una chompa de
cualquiera de las plantas Cul es la probabilidad de que sea defectuosa?
Solucin
Sean los eventos:
C1: chompa fabricada en la primera planta
C2: chompa fabricada en la segunda planta
C3: chompa fabricada en la tercera planta
D: chompa defectuosa
Segn los datos
.
.
.
.
.
.
Estadstica y diseo de experimentos
71
P(C1) = 1/6 P(C2) = 2/6 P(C3) = 3/6
P (D/C1) = 0,02 P(D/C2) = 0,03 P(D/C3) = 0,05
Entonces la probabilidad de que la chompa sea defectuosa es:
P(D) = P(C1) P(D/C1) + P(C2) P(D/C2) + P(C3) P(D/3)
( ) ( ) ( )
1 2 3
( ) 0, 02 0, 03 0, 05 0, 038
6 6 6
P D = + + =
3.10 TEOREMA DE BAYES
Sea un experimento aleatorio cuyo espacio muestral es , sean los eventos B
1
, B
2
,
B
3
, ... B
k
que forman una particin de y sea el evento A definido tambin en
; la probabilidad de que un evento B
j
ocurra dado que el evento A ha ocurrido
est dado por:
1
( ) ( / )
( / )
( ) ( / )
j j
j k
i i
i
P B P A B
P B A
P B P A B
=
=

Demostracin
Por definicin de probabilidad condicional
( )
( / )
( )
j
j
P B A
P B A
P A

=
Por probabilidad conjunta:
P(B
j
A) = P(B
j
) P(A/B
j
)
La ecuacin de la probabilidad total es:
1
( ) ( ) ( / )
k
i i
i
P A P B P A B
=
=

reemplazando
Cecilia Ros Varillas
72
1
( ) ( / )
( / )
( ) ( / )
j j
j k
i i
i
P B P A B
P B A
P B P A B
=
=

Ejemplo del teorema de Bayes:


Del ejemplo anterior, si la chompa elegida resulta defectuosa, calcule la probabi-
lidad de que se haya manufacturado en la segunda planta.
Solucin
P(C2/D) =
P(C2) P(D/C2)
=
P(D)
=
P(C2) P(D/C2)
=
(2/6)(0,03)
= 0,2632
P(C1) P(D/C1) + P(C2) P(D/C2) + P(C3) P(D/C3) 0,038
Hay un 26,32% de posibilidad que la chompa defectuosa haya sido manufactura-
da en la segunda planta.
3.11 EJERCICIOS DESARROLLADOS
Ejercicio 1
Un qumico est interesado en analizar muestras de agua en una planta elctrica
de vapor. Las pruebas sern engaosas si se encuentra presente nitrgeno o si-
licio en las muestras. Los dispositivos automticos indican que la probabilidad
de que ambos elementos se encuentren presentes simultneamente es despre-
ciable. La probabilidad de que se encuentre nitrgeno en la muestra es de 0,15 y
la probabilidad de que se encuentre silicio en la muestra es de 0,20 Calcular la
probabilidad de que las pruebas hayan sido engaosas?
Solucin
Sean los eventos
N: se encuentra nitrgeno en la muestra
S: se encuentra silicio en la muestra
E: prueba engaosa
Las pruebas sern engaosas si se encuentra presente nitrgeno o silicio, entonces:
Estadstica y diseo de experimentos
73
P(E) = P(N S) = P(N) + P(S) - P(N S)
= 0,15 + 0,20 -0 = 0,35
Por lo tanto la probabilidad de que las pruebas hayan sido engaosas es de 0,35.
Ejercicio 2
Sea el experimento aleatorio E, que consiste en el lanzamiento de dos dados al
aire (dados normales), el espacio muestral de este experimento y sean los
eventos A, B y C definidos en , donde:
A = {(x,y)
/ x+y 3} B = {(x,y)

/ x+y = 4} C = {(x,y)

/ 2 < x+y 4}
Calcule las siguientes probabilidades:
a. P (A - B)
b. Probabilidad de que ocurra al menos un evento
c. P [(B C) A]
Solucin
= { (1;1), (1;2);...; (6;6)} N() = 36
A = {(1,1), (1,2), (2,1)} B = {(1,3), (2,2), (3,1)} C = {(1,2), (2,1), (1,3), (2,2), (3,1)}
de los datos: B C y A B =

3
) ( ) ( ') ( ) 0, 08333
36
a P A B P A B P A = = = =

6
) ( ) 0,166666
36
b P A B C = =

2
) ( ) ) ( ) 0, 055555
36
c P B C A P C A = = =
Ejercicio 3
Si
( )
2
'
7
P A B = ,
6
( )
7
P A B = ,
5
( )
7
P B =
Calcule P(B/A)
Cecilia Ros Varillas
74
Solucin
1/7 3/7 2/7
1/7
P(A) P(B)
( ' ) 1/ 7 1
( ' / )
( ) 4 / 7 4
P B A
P B A
P A

= = =
Ejercicio 4
En una urna hay 4 fichas rojas y 5 blancas, se toma al azar una muestra de 5 fichas
y se las deja en una mesa, luego se extrae una ficha ms. Calcular la probabilidad
de que esta ltima ficha extrada sea blanca.
Solucin
Segn el experimento, primero se extraen cinco fichas del total y para que que-
den algunas blancas, de las cinco fichas blancas se deben extraer: 4, 3, 2, 1 y
luego se realiza la ltima extraccin, cuya probabilidad de que esta ltima ficha
sea blanca es:
4 5 4 5 4 5 4 5
2 3 3 2 1 4 4 1
9 9 9 9
5 5 5 5
1 2 3 4 280
. . . . 0, 55556
4 4 4 4 504
C C C C C C C C
C C C C
+ + + = =

Ejercicio 5
En una caja hay 8 sustancias qumicas, tres de ellas son de un proveedor A y las
otras 5 son de un proveedor B, se realizan tres extracciones sucesivas y sin repo-
sicin del total de sustancias, entonces se pide calcular la probabilidad de que:
a) Las dos primeras sean del proveedor A y la ltima sustancia del proveedor B.
b) Las tres sustancias qumicas seleccionadas provengan del mismo proveedor.
Solucin
Sean los eventos:
Estadstica y diseo de experimentos
75
A
i
: sustancia qumica proveniente del proveedor A en la extraccin i-sima.
B
i
: sustancia qumica proveniente del proveedor B en la extraccin i-sima.
El diagrama del rbol respectivo es el siguiente:
1/6 A
3
2/7 A
2
5/6 B
3

A
1
A
3
3/8 B
2
B
3
A
3
5/8 A
2

B
1
B
3
A
3
B
2

4/7
3/6 B
3
Las probabilidades pedidas son:
a. P(A
1
A
2
B
3
) = P(A
1
) P(A
2
/A
1
) P(B
3
)/A
1
A
2
)

3 2 5 5
8 7 6 56
| || || |
= =
| | |
\ .\ .\ .
b. P(A
1
A
2
A
3
) + P (B
1
B
2
B
3
)
3 2 1 5 4 3 1 10 11
= + = + =
8 7 6 8 7 6 56 56 56
| || || | | || || |
| | | | | |
\ .\ .\ . \ .\ .\ .
Cecilia Ros Varillas
76
Ejercicio 6
En la facultad de Qumica de cierta universidad, los estudiantes publican tres
revistas A, B y C. Realizada una encuesta, se estima que del total de estudiantes
el 20% lee la revista A, el 30% lee la revista B y el 25% lee la revista C, el 10% lee
A y B, el 8% lee A y C y 12% lee B y C, adems el 3% lee las tres revistas. Se elige
un estudiante al azar,
a. Calcule la probabilidad de que lea al menos una de las tres revistas
b. Calcule la probabilidad de que lea slo una de las revistas
c. Calcule la probabilidad de que no lea ninguna revista
d. Calcule la probabilidad de que lea al menos dos de las revistas
Solucin
De los datos:
P(A) = 0,20 P(B) = 0,30 P(C) = 0,25 P(A B) = 0,10
P(A C) = 0,08 P(B C) = 0,12 P(A B C) = 0,03
Colocamos los datos en el diagrama de Venn
P()
P(A) P(B)

0,05 0,07 0,11

0,03
0,05 0,09

0,08 0,52

P(C)
a. P(A B C) = 0,48
b. P(A B C) + P(A B C) + P(A B C) = 0,05 + 0,11 + 0,08 = 0,24
c. P(A B C) = 0,52
d. P(A B C) + P(A B C) + P(A B C) + P(A B C)
= 0,07 + 0,09 + 0,05 + 0,03 = 0,24
Estadstica y diseo de experimentos
77
Ejercicio 7
Una caja contiene 3 monedas: una corriente (I ), otra de 2 caras(II) y la tercera
cargada (III) tal que la probabilidad de que se obtenga cara al lanzarla es 2/3. Se
escoge una moneda al azar y se lanza. Si aparece cara se lanza la moneda de nue-
vo. Si aparece sello se escoge otra moneda entre las dos que quedan y se lanza.
Sea M el evento. Se escoge primero la moneda cargada (III); sea X el evento
Sale primero sello y despus cara Calcule P (M / X)
Solucin
M: Se escoge primero la moneda cargada III
X: sale primero sello(s) y despus cara (c).
P(M/X) =
P(M X)
=
P(X)
Cecilia Ros Varillas
78
=
(1/3)(1/3)(1/2)(1/2) + (1/3)(1/3)(1/2)(1)
=
3
(1/3)(1/2)(1/2)(1) + (1/3)(1/2)(1/2)(2/3) + (1/3) (1/3) (1/2)(1/2) + (1/3)(1/3)(1/2)(1) 8
Ejercicio 8
Conteste brevemente cada pregunta:
a. Sean A y B eventos tales que P(A)= 1/3; P(B)=1/5 y P(A|B)+P(B|A)=2/3, calcule
P(A' B').
b. Dados los eventos A, B y C tales que A y B son eventos independientes, adems:
P(A B C) = 0,04; P(C/ A B) = 0,25 y P(B) = 4P(A). Calcule P(A B).
Solucin
a. De los datos:
2
( ) 1/ 3 ( ) 1/ 5 ( | ) ( | )
3
P A P B P A B P B A = = + =
( ) ( ) 2 ( ) ( ) 2

1 1
( ) ( ) 3 3
5 3
P A B P A B P A B P A B
P B P A

+ = + =
2 1
5 ( ) 3 ( ) ( )
3 12
P A B P A B P A B + = =
( ' ' ) ( ) '
1 11
1- ( ) 1
12 12
P A B P A B
P A B
=
= = =
b. De los datos A y B son independientes:
( ) 0, 04 0, 04
( | )
( ) ( ) ( ) ( ) 4 ( )
P A B C
P C A B
P A B P A P B P A P A

= = = =

2
0, 04 1 4
= 0, 25 ( ) y ( ) 4 ( )
4 ( ) 5 5
P A P B P A
P A
= = = =
Luego: P(A B) = P(A) + P(B) - P(A B)
1 4 1 4 4 21
( ) 1 0,84
5 5 5 5 25 25
P A B
| |
= + = = =
|
\ .
Estadstica y diseo de experimentos
79
Ejercicio 9
Si: P(A) = 1/2 P(B) = 13 P(A B) = 1/4
Calcule: P(A' / B')
Solucin
P(A B) = P(A) + P(B) P(A B) =
1
+
1
+
1
=
7
2 3 4 12
Se pide:
P(A' / B') =
P (A' B')
=
P(B')
Usando algebra de eventos:
P(A' B') = P(A B)' = 1 - P(A B) = 1 -
7
=
5
12 12
P(B') = 1 - P(B) = 1 -
1
=
2
3 3
Reemplazando:
( )
(5 / 12) 5
'/ '
(2 / 3) 8
P A B = =
Ejercicio 10
Una urna A contiene 9 cartas numeradas del 1 al 9, y otra urna B contiene 5 cartas
numeradas del 1 al 5, se escoge una urna al azar y se saca una carta, si la carta
indica un nmero par, se saca otra carta de la misma urna; si la carta indica un
nmero impar se saca carta de la otra urna. Si ambas cartas indican nmeros pa-
res. Cul es la probabilidad de que las 2 cartas procedan de la urna A?
Cecilia Ros Varillas
80
3/8 PA
4/9 PA
5/8 IA
1/2 A
2/5 PB
5/9 IA
3/5 IB
1/4 PB
2/5 PB
3/4 IB
1/2 B
4/9 PA
3/5 IB
5/9 IA
Solucin
M: ambas cartas son pares
N: Cartas procedan de la urna A
1 4 3
( ) 5 2 9 8
( / ) 0, 625
1 4 3 1 2 1 ( ) 8
2 9 8 2 5 4
P N M
P N M
P M
| || || |
| | |

\ .\ .\ .
= = = =
| || || | | || || |
+
| | | | | |
\ .\ .\ . \ .\ .\ .
Ejercicio 11
Tres personas trabajan independientemente en descifrar un mensaje, con proba-
bilidad de descifrarlo igual a 1/5, 1/4 y 1/3 respectivamente:
a. Cul es la probabilidad de que exactamente uno de ellos descifre el mensaje?
b. Si dos de ellos descifran el mensaje Cul es la probabilidad de que sean la
primera y tercera persona?
Solucin
a. Los eventos son independientes, entonces
Estadstica y diseo de experimentos
81

( ' ' ) ( ' ' ) ( ' ' )
( ) ( ') ( ') ( ') ( ) ( ') ( ') ( ') ( )
1 3 2 4 1 2 4 3 1 26
0, 43333
5 4 3 5 4 3 5 4 3 60
P A B C P A B C P A B C
P A P B P C P A P B P C P A P B P C
+ + =
= + +
| || || | | || || | | || || |
= + + = =
| | | | | | | | |
\ .\ .\ . \ .\ .\ . \ .\ .\ .
b. M: Dos de ellos descifran el mensaje
N: que sean A y C
P(M) = P(A B C') + P(A' B C') + P(A B' C')

1 3 1
( ) 1
5 4 3
( / )
1 1 2 4 1 1 1 3 1
( ) 3
5 4 3 5 4 3 5 4 3
P N M
P N M
P M

= = =
+ +
Ejercicio 12
Una fbrica produce cierto tipo de productos usados en experimentos qumicos
con tres mquinas distintas, las cantidades de produccin diaria de cada mqui-
na son:
Mquina 1: 3 000 unidades
Mquina 2: 2 500 unidades
Mquina 3: 4 500 unidades
La experiencia nos demuestra que el 1% de las unidades producidas por la m-
quina 1 son defectuosas, los correspondientes porcentajes para las otras dos m-
quinas son 1,2% y 2% respectivamente. Se selecciona un artculo cualquiera al
azar de la produccin total de un da y se pide:
a. Calcular la probabilidad de que el artculo seleccionado sea defectuoso.
b. Si el artculo seleccionado es defectuoso, calcule la probabilidad de que haya
sido producido:
i. Por la mquina 1
ii. Por la mquina 2
iii. Por la mquina 3
Solucin
Sean los eventos:
M1: artculo producido por la mquina 1
M2: artculo producido por la mquina 2
Cecilia Ros Varillas
82
M3: artculo producido por la mquina 3
D: artculo defectuoso
Segn los datos: produccin total 10 000 unidades
P (M1) = 0,3 P(M2) = 0,25 P(M3) = 0,45
P (D/M1) = 0,01 P(D/M2) = 0,012 P(D/M3) = 0,02
a. Se calcula la probabilidad de que el artculo seleccionado sea defectuoso, para
eso se utiliza el teorema de la probabilidad total:
P(D) = P(M1) P(D/M1) + P(M2) P(D/M2) + P(M3) P(D/M3)
P(D) = (0,3) (0,01) + (0,25) ( 0,012) + (0,45) ( 0,02) = 0,015
b. Ahora como ya el artculo seleccionado es defectuoso, se calcula la probabilidad
de que ha sido producido por cada una de las mquinas, entonces:

i.

( 1) ( / 1) (0, 3) (0, 01)
( 1/ ) 0, 2
( ) 0, 015
P M P D M
P M D
P D
= = =
ii.

( 2) ( / 2) (0, 25) (0, 012)
( 2 / ) 0, 2
( ) 0, 015
P M P D M
P M D
P D
= = =
iii.

( 3) ( / 3) (0, 45) (0, 02)
( 1/ ) 0, 6
( ) 0, 015
P M P D M
P M D
P D
= = =
El artculo defectuoso, es mucho ms probable que haya sido producido por la
Mquina 3.
Ejercicio 13
Una caja contiene 6 tubos de radio de los cuales tres son defectuosos. Se prueban
los tubos unos tras otro hasta que se descubren dos defectuosos. Cul es la pro-
babilidad de que se suspenda el proceso en la:
a. Segunda prueba,
b. En la tercera prueba?
Solucin
Estadstica y diseo de experimentos
83
2/5 D
D 2/4 D
3/6 3/5 B
B
2/4 D

3/5
D
3/6 B
B
D
B
B
La probabilidad de que se suspenda el proceso en la segunda prueba es:

3 2 1
0, 2
6 5 5
= =
La probabilidad de que se suspenda el proceso en la tercera prueba es:
3 3 2 3 3 2 3
0, 3
6 5 4 6 5 4 10
+ = =
3.12 EJERCICIOS PROPUESTOS
Ejercicio 1
En una habitacin hay 10 personas que llevan insignias numeradas del 1 al 10. Se
eligen 3 personas al azar y se les solicita que abandonen la habitacin Cul es la
probabilidad de que:
a. El nmero menor de las insignias sea 5?
b. El nmero mayor de las insignias sea 5?
Cecilia Ros Varillas
84
Ejercicio 2
Se tienen los dgitos {4; 9; 3; 4; 5; 6}, se seleccionan en forma aleatoria cinco dgi-
tos, si los dgitos no se pueden repetir:
a. Cuntos mayores de 5 600 se pueden obtener?
b. Cuntos nmeros si 4 y 5 no deben estar juntos en la misma muestra?
c. Cuntos nmeros pares se pueden formar?
Ejercicio 3
Una fundidora produce piezas de hierro fundido para uso en las transmisiones
automticas de camiones. Son dos las dimensiones cruciales de dicha pieza, A y
B. Suponga que si la pieza cumple con la especificacin de la dimensin A, existe
la probabilidad de 98% de que tambin cumpla la de la dimensin B. Adems,
existe 95% de probabilidad de que se cumpla con la especificacin de la dimen-
sin A y de 97% de que se haga con la dimensin B. Se selecciona aleatoriamente
e inspecciona una unidad de dicha pieza. Cul es la probabilidad de que se
cumpla con las especificaciones de ambas dimensiones?
Ejercicio 4
En un proceso de manufactura hay seis operaciones distintas, que se indican con
A, B, C, D, E y F. Cuntas secuencias diferentes pueden ocurrir,
a. si no existe una secuencia fija para las operaciones?
b. con la salvedad de que A debe efectuarse al principio y F al final?
c. con la salvedad de que C debe efectuarse siempre antes que D?
Ejercicio 5
Un ingeniero qumico est a cargo de un proceso especfico en una refinera. La
experiencia indica que 10% de los paros de la planta se deben nicamente a fallas
de equipo, 5% a fallas de equipo y errores de operadores, y 40% a errores de los
operadores. Ocurre un paro de la refinera. Calcule la probabilidad de que:
a. Se deba a fallas de equipo o errores de los operadores.
b. Se deba slo a errores de los operadores.
c. No se deba slo a fallas de equipo ni errores de los operadores.
d. Se deba a errores de los operadores, dado que ocurri una falla de equipo.
e. Se deba a errores de los operadores, dado que no ocurri una falla de equipo
Estadstica y diseo de experimentos
85
Ejercicio 6
El 20% de los empleados de una empresa son ingenieros y otro 20% economistas.
El 75% de los ingenieros ocupan un puesto directivo y el 50% de los economistas
tambin, mientras que de los no ingenieros y no economistas solamente el 20%
ocupan un puesto directivo. Se selecciona al azar un empleado y es directivo Cul
es la probabilidad de que el empleado directivo elegido al azar sea ingeniero?
Ejercicio 7
Suponga que el total de produccin de un determinado artculo contiene 10% de
unidades defectuosas, si la produccin es llenada al azar en cajas de n unidades
cada una, determinar el valor de n de manera que haya una probabilidad de 0.01
de que ninguna caja contenga artculo defectuoso.
Ejercicio 8
Un lote que contiene 12 artculos de los cuales x son defectuosos y el resto no
defectuosos es sometido a dos controles. En el primer control se extrae de este
lote un artculo al azar, si est bueno se le devuelve al lote y si es defectuoso se lo
reemplaza por uno bueno, luego se pasa el lote al segundo control.
a. Determinar el nmero de artculos defectuosos que hay en el lote si este pasa
al segundo control de forma tal que la probabilidad de extraer al azar aqu un
artculo no defectuoso es 61/72.
b. Suponga que el lote pasa al segundo control con el nmero de defectuosos
hallados en la parte a). El segundo control consiste en extraer 3 artculos al azar
a la vez y rechazar el lote si se encuentran al menos dos artculos defectuosos,
calcular la probabilidad de aceptar el lote.
Ejercicio 9
La probabilidad de que un accidente de aviacin sea correctamente previsto de-
bido a fallas mecnicas es 0.85 y la probabilidad que un accidente de aviacin sea
correctamente previsto debido a fallas no mecnicas es 0.35. Encontrar la probabi-
lidad que un accidente de aviacin sea por fallas mecnicas, dado que fue previsto
correctamente, si el 30% de accidentes de aviacin es debido a fallas mecnicas.
Ejercicio 10
Se tiene dos urnas. La primera tiene dos fichas blancas y tres negras, y la segunda
tiene dos blancas y tres rojas. Se extrae al azar una ficha de la primera urna y se
pasa a la segunda urna, luego se extrae una ficha de la segunda urna y se pasa a
la primera, finalmente se extrae al azar dos fichas de la primera urna y resultan
ser blanca y negra. Determinar la probabilidad de que la primera urna no tenga
ninguna ficha roja.
Cecilia Ros Varillas
86
Ejercicio 11
Se tiene dos urnas. La primera con tres bolas blancas y dos negras; la segunda dos
blancas y tres negras. Se lanza un dado y si sale 1 o 2 o 3 o 4 se extrae una bola de
la primera urna, si sale 5 6, se extrae una bola de la segunda urna.
a. Calcular la probabilidad de que la bola salga negra,
b. Calcular la probabilidad de que la bola provenga de la 1era urna sabiendo que
fue negra.
Ejercicio 12
En una ciudad se publican tres peridicos: A, B y C. Realizada una encuesta, se
estima que de la poblacin adulta el 20% lee el peridico A, el 16% B y el 14% C.
Se obtuvo tambin que el 13% leen al menos dos peridicos; los que leen slo A
y B representan el triple de los que leen slo B y C, y el doble de los que leen slo
A y C; y los que leen los tres peridicos es igual a los que leen slo B y C.
a. Qu porcentaje lee al menos uno de estos peridicos?
b. De los que leen al menos un peridico, qu porcentaje lee A y B?
Ejercicio 13
Se desea realizar un experimento con una sustancia qumica, donde dicha sustan-
cia puede estar compuesta por tres componentes A, B, y C. En el laboratorio hay
3 tubos de ensayo con el componente A, dos tubos con el componente B y cinco
tubos con el componente C. La probabilidad de que el componente A produzca
una reaccin fuerte es de 1/3, que la produzca B es de 2/3 y que la produzca el
componente C es de 1/7. Se realiza el experimento y se produce la reaccin fuerte.
Cul es la probabilidad de que el componente que la produjo sea el C?
Ejercicio 14
Un empresario tiene una mquina automtica en su fbrica que produce deter-
minados artculos. Con su pasada experiencia ha comprobado que si la mquina
se ajusta en forma apropiada, la mquina producir un 90% de piezas aceptables,
mientras que si su acondicionamiento no es adecuado, slo producir un 30% de
aceptables. El empresario tambin ha observado que el 75% de los acondiciona-
mientos se hace en forma correcta. Si la primera pieza producida es aceptable, Qu
probabilidad existe de que el acondicionamiento se haya hecho correctamente?
Ejercicio 15
Una compaa est estudiando la posibilidad de construir una granja en un cierto
sector agropecuario. La compaa considera de gran importancia la construccin
de un reservorio en las cercanas del lugar. Si el gobierno aprueba este reservorio
Estadstica y diseo de experimentos
87
la probabilidad de que la compaa construya la granja es 0.9, de otra manera
la probabilidad es de slo 0.2. El presidente de la compaa estima que hay una
probabilidad de 0.6 de que el reservorio sea aprobado.
a. Hallar la probabilidad de que la compaa construya la granja.
b. Si la granja fue construida, hallar la probabilidad de que el reservorio haya
sido aprobado.
Ejercicio 16
Cierta industria envasa en caja sus productos. La proporcin de defectuosos en
cada caja es de 0.02. El control de calidad de los productos se efecta en la forma
siguiente:
Se toma una muestra de 100 productos de una caja elegida al azar. Si se encuen-
tra a lo sumo dos defectuosas, se acepta, la caja si se encuentra 3 o 4 defectuosos,
se elige una muestra de 80 productos. Si en total 180 productos elegidos hay 5
ms defectuosos, se rechaza la caja. Y en caso contrario se le acepta. Calcular la
probabilidad de que la caja elegida sea aceptada.
Ejercicio 17
En una eleccin a la presidencia se obtienen los siguientes resultados en la prime-
ra vuelta: el 10% de los electores inscritos votaron en blanco, 32% de los electores
votaron por A, el 23% lo hicieron por B y el 35% restante, por otros candidatos.
Se estima que todos los electores que votaron en la primera vuelta lo harn en la
segunda vuelta, pero una encuesta indica que en razn de las declaraciones con-
tradictorias de los candidatos, 15% de los que votaron por A en la primera vuelta
votarn por B en la segunda vuelta y 20% de los que votaron por B votarn por
A. La misma encuesta indica los que votaron en blanco en la primera vuelta vo-
tarn en la segunda, a razn de 30% por A, 20% por B y el resto seguir votando
en blanco. Adems de los que votaron por otros candidatos en la primera vuelta,
el 38% votar por A, el 32% votar por B y el 30% restante votar en blanco Si la
encuesta es fiable,
Quin saldr elegido en la segunda vuelta?
Cecilia Ros Varillas
88
Estadstica y diseo de experimentos
89
4.1 DEFINICIN
La funcin que asigna nmeros a cada uno de los elementos del espacio muestral
con una probabilidad definida se llama variable aleatoria. En ocasiones las va-
riables aleatorias estn ya implcitas en los puntos muestrales, sobre todo en los
casos de variables cuantitativas donde los valores son numricos. En el caso de
las variables cualitativas donde los resultados no se dan en trminos numricos,
entonces se les puede asignar nmeros y tratarlos como cuantitativos, esta asig-
nacin est sujeta a ciertas condiciones que se propone el investigador.
La variable aleatoria es una funcin X, cuyo dominio es el espacio muestral ,
y el rango es un conjunto dentro de los reales, llamado rango o recorrido de la
variable aleatoria (R
x
).
s
R
x
R
x
Figura 4.1. Dominio y rango de la variable aleatoria
Clases de Variable Aleatoria
Segn el rango o recorrido (R
x
), la variable aleatoria se clasifica en:
- Variable aleatoria discreta
- Variable aleatoria continua
Variable aleatoria
CAPTULO 4
Cecilia Ros Varillas
90
4.2 VARIABLE ALEATORIA DISCRETA
Una variable aleatoria es discreta si el rango o recorrido de la variable aleatoria es
finito o infinito numerable de valores enteros.
4.2.1 Funcin de probabilidad (Distribucin de probabilidades) de
la variable aleatoria discreta
La Ley de probabilidad o distribucin de probabilidad de una variable aleatoria
es una manera de modelar la variabilidad o la forma cmo se distribuyen los
valores de la variable.
Dada una variable aleatoria discreta, su funcin de probabilidad o de cuanta
p(x) P(X=x), se define de modo que p(x) es la probabilidad de que X tome el
valor x, y que cumple las siguientes condiciones:
1) ( ) 0
2) ( ) 1
x
x Rx
p x x R
p x

Ejemplo:
Se lanzan tres monedas y la variable aleatoria X se define:
X: nmero de caras nmero de sellos,
Entonces R
x
= {-3; -1; 1; 3}
Se buscan todos los puntos muestrales que dan lugar a cada valor de la variable
y a ese valor se le asigna la probabilidad del suceso correspondiente, entonces se
tiene que:
{ } ( )
1 1 1 1
(-3) ( 3)
2 2 2 8
p P X P sss = = = = =
{ } ( )
1 1 1 1 1 1 1 1 1 3
(-1) ( 1) , ,
2 2 2 2 2 2 2 2 2 8
p P X P ssc scs css = = = = + + =
{ } ( )
1 1 1 1 1 1 1 1 1 3
(1 ) ( 1) , , csc
2 2 2 2 2 2 2 2 2 8
p P X P scc ccs = = = = + + =
{ } ( )
1 1 1 1
(3) ( 3)
2 2 2 8
p P X P ccc = = = = =
Estadstica y diseo de experimentos
91
Estas probabilidades, lo presentamos en la siguiente tabla (distribucin de pro-
babilidades):
x -3 -1 1 3
p(x) 1/8 3/8 3/8 1/8
Observacin
Obsrvese que X est definido sobre el espacio muestral, mientras que p(x) lo est
sobre el espacio de nmeros reales R. Las propiedades de la funcin de proba-
bilidad de variable aleatoria se deducen de forma inmediata de los axiomas de
probabilidad:
La representacin grfica de la funcin de probabilidad de una variable discreta
se realiza mediante un diagrama de lneas:
p(x)
1 3 2 -1 -2 -3
1/8
3/8
Propiedad
Si X es una variable aleatoria discreta, la probabilidad en cada intervalo es diferente.
P(a < x < b) P(a x b) P(a < x b) P(a x < b)
4.2.2 Funcin de distribucin (acumulada) de la variable aleatoria
discreta
Otro concepto importante es el de funcin de distribucin de una variable aleato-
ria discreta, F, que se define de modo que si x
i
R, F(x
i
) es igual a la probabilidad
de que X tome un valor inferior o igual a x
i,
es decir, acumula las probabilidades
hasta x
i
.
1
( ) ( ) ( )
i
i i j
j
F x P X x P X x
=
= = =

Cecilia Ros Varillas


92
Volviendo al ejemplo de las tres monedas se tiene que:
1
( 3) ( 3) ( 3)
8
F P X p = = =
1 3 4
( 1) ( 1) ( 3) ( 1)
8 8 8
F P X p p = = + = + =
1 3 3 7
(1) ( 1) ( 3) ( 1) (1)
8 8 8 8
1 3 3 1 8
(3) ( 3) ( 3) ( 1) (1) (3) 1
8 8 8 8 8
F P X p p p
F P X p p p p
= = + + = + + =
= = + + + = + + + = =
0 3
1/ 8 3 1
( ) 4 / 8 -1 1
7 / 8 1 3
1 3
si x
si x
F x si x
si x
si x
<

<

= <

<

Grfico de la funcin de distribucin de la variable aleatoria discreta


F(x)
1 3 -1 -3
1/8
7/8
1
Hay que observar que a valores no admisibles por la variable les pueden corres-
ponder valores de F no nulos. Por ejemplo:
F(4) = P(X 4) = P() = 0
Propiedades de la funcin de distribucin de la variable aleatoria discreta F(x)
1. Su grfica es una funcin escalonada no decreciente, es decir:
x
1
< x
2
=> F(x
1
) F(x
2
)
Estadstica y diseo de experimentos
93
2.

( ) lim ( ) 0
x
F F x

= =
3.

( ) lim ( ) 1
x
F F x
+
+ = =
4.
-1
( ) ( ) ( )
i i i
P x F x F x =
5.
( ) ( ) - ( ) ( ) - ( ) P a x b P x b P x a F b F a < = =
4.3 VARIABLE ALEATORIA CONTINUA
Una variable aleatoria X es continua, si puede tomar cualquiera de los valores de
un intervalo.
4.3.1 Funcin de probabilidad de la variable aleatoria continua
La funcin de probabilidad de la variable aleatoria continua tambin es conocida
como funcin de densidad, es una funcin integrable, que verifica las dos condi-
ciones siguientes:
-
1) ( ) 0
2) ( ) 1 es decir : ( ) 1
x
x
x R
f x x R
f x dx f x dx
+


= =

Figura: Funcin de densidad f. La probabilidad de un intervalo, es el rea que
existe entre la funcin y el eje de abscisas.
a b
) ( b X a P
Figura 4.2. Funcin de Densidad f
( ) ( )
b
a
P a X b f x dx =

Observacin. Por ser f una funcin integrable, la probabilidad de un punto es nula:


( ) ( ) ( ) 0
a
a
P x a P a x a f x dx = = = =

Cecilia Ros Varillas


94
y por ello al calcular la probabilidad de un intervalo no afectar nada el que ste
sea abierto o cerrado por cualquiera de sus extremos, pues estos son puntos y por
tanto de probabilidad nula:
P(a X b) = P(a < X < b) = P(a < X b) = P(a X < b) =
b
f(x) dx

a
4.3.2 Funcin de distribucin (acumulada) de la variable aleatoria
continua
Se denota F(x) y se define de modo que dado X

R y f(x) es la funcin de pro-


babilidad de la variable aleatoria continua X, F(x) es la probabilidad de que X sea
menor o igual que x, es decir:
-
( ) ( ) ( ) ( )
x
F x P X x P X x f t dt

= = < =

Propiedades de la funcin de distribucin de la variable aleatoria continua F(x)
1. La funcin de distribucin F, es no decreciente y continua:
X
1
< x
2
=> F(x
1
) F(x
2
)
2. Es una funcin absolutamente continua que verifica:
F() = lim F(x) = 0

x >

F(+) = lim F(x) = 0

x > +
3. f(x) = F'(x)
P(a X b) = P(a < X < b) = P(a < X b) = P(a X < b) =
b
f(x) dx = F(b)
F(a)

a
Ejemplo:
Sea X una variable aleatoria continua con la siguiente funcin de probabilidad:
0 1
( ) 2 1 2
0 en otros casos
x x
f x x x
<

Graficar la funcin de probabilidad f(x) y calcular:


a. P(-1 X 1/2)
b. P(X < 3/2)
c. La funcin de distribucin F(x)
Estadstica y diseo de experimentos
95
Solucin
La grfica de la funcin de probabilidad dada es:
0
1
0 1 2 x
f(x)
1
a.
1 2 0 1/ 2
1 1 0
( 1 1/ 2) ( ) (0) ( ) P X f x dx dx x dx

= = +

1/ 2
2 2
(1/ 2) 1

2 2 8
0
x
= = =
b.

3/ 2
( 3/ 2) ( ) P X f x dx

< = =

0 1 3/ 2
0 1
(0) (2 ) 7 / 8 dx xdx x dx

= + + =

c. Clculo de F(x):
Si x < 0 => F(x) = 0

0
0
2 2
Si 0 1 ( ) ( ) (0) ( )

2 2
0
x
x F x P X x dt t dt
x
t x

< = = +
= =

Cecilia Ros Varillas
96
0 1
0 1
2 2
Si 1 2 ( ) ( ) (0) ( ) (2 )
1
2
1
2 2
0 1

x
x F x P X x dt x dx t dx
x
x t
x
t

= = + +
= + =
=

2
2
1 1
2 2
2 2 2
2 1
2
x
x
x
x
+ +

= +
0 1 2
0 1
Si 2 ( ) ( ) (0) ( ) (2 ) 0 1 x F x P X x dt x dx x dx

> = = + + + =

Entonces:
2
2
0 0
0 1
2
( )
2 1 1 2
2
1 2
x
x
x
F x
x
x x
x
<

<

>

Se puede calcular F(3/2) = 7/8


4.4 VALOR ESPERADO Y VARIANZA DE LA VARIABLE ALEATORIA
Los parmetros de la variable aleatoria son:
4.4.1 Valor esperado de la variable aleatoria
Se le conoce tambin como media o esperanza matemtica es un promedio pon-
derado de los resultados que se esperan en el futuro.
Es una medida de localizacin, que indica el valor alrededor del cual flucta la
variable aleatoria X
Si X es discreta, el valor esperado se define como:
( ) ( )
i i
i
E X x p x

Estadstica y diseo de experimentos


97
Si X es continua, el valor esperado se define como:
E(X) =
+
x f(x)dx
-
Nota: El valor esperado tambin presenta la notacin de la media poblacional.
E(X) =
x
Teorema
Esperanza Matemtica de una funcin de una variable aleatoria.
Sea X una variable aleatoria discreta o continua y h(x) es una funcin de la varia-
ble aleatoria. X, entonces el valor esperado de

h(x)

est dado por:
E(h(x)) = h(x)p(x) Si X es v.a discreta
E(h(x)) = h(x)f(x)dx Si X es v.a continua
En ambos casos para todo x
R
x

respectivo, la funcin de probabilidad no
cambia.
Propiedades del valor Esperado
1. E(X)

R (puede asumir cualquier valor real).


2. E(a) = a a es una constante real.
3. E(aX) = aE(X) a es una constante real.
4. E(a + bX) = a + bE(X) a,b son constantes reales.

n n
5. E( X
i
) = E(X
i
)
i=1 i=1
Ejemplo de valor esperado para la variable aleatoria discreta:
Del ejemplo inicial, donde X: Nmero de sellos nmero de caras
R
x
= {-3; -1; 1; 3}
La distribucin de probabilidades es:
x -3 -1 1 3
p(x) 1/8 3/8 3/8 1/8 1
Calcular E(x).
Cecilia Ros Varillas
98
Solucin
Como la variable es discreta, entonces:
E(x) = x.p(x) = (-3)(1/8) + (-1)(3/8) + (1)(3/8) + (3)(1/8)
E(x) = 0
Ejemplo de valor esperado para la variable aleatoria continua:
Sea X una variable aleatoria continua, que representa el peso (Kg) de conservas
envasadas de frutas para exportacin, cuya funcin de densidad es la siguiente:
3
(2 ) 0 2
( )
4
0 en otros casos
x x x
f x

Hallar E(x)
Solucin
Sea X: peso (Kg) de conservas envasadas de frutas para exportacin
Como X es una variable aleatoria continua
E(x) = x.f(x)dx para todo x

[0;2]

2
E(x) = x.
3
x(2 x)dx = 1

0 4
El peso promedio esperado de las latas de conservas para exportacin es de 1 Kg.
4.4.2 Varianza de la variable aleatoria
Se le conoce tambin como varianza esperada, estas medidas numricas descri-
ben la dispersin o variabilidad de la variable aleatoria mediante el promedio
o valor esperado de las desviaciones cuadrticas de los valores de x a partir de
su media o valor esperado.
V(X) = E(X
2
) (E(X))
2
A la varianza esperada tambin se le denota igual que la varianza poblacional:
2
V(X) =
x

Estadstica y diseo de experimentos
99
Propiedades de V(X)
1. V(x) 0 (varianza es no negativa)
2. V(a) = 0 a es una constante real
3. V(aX) = a
2
V(X) a es una constante real
4. V(X + a) = V(X)
5. V(aX + bY) = a
2
V(X) + b
2
V(Y) a,b son constantes reales. X e Y son variables
aleatorias independientes.
Como la varianza est en unidades cuadradas sacamos su raz cuadrada, que nos
da la desviacin estndar, que es la que mejor indica la dispersin de los datos ya
que est en sus mismas unidades.
Desviacin Estndar o Tpica:
x
= V(X)
Ejemplo de varianza si la variable aleatoria es discreta:
De ejemplo donde X: Nmero de sellos Nmero de caras
R
x
= {-3; -1; 1; 3}
x -3 -1 1 3
p(x) 1/8 3/8 3/8 1/8 1
Calcular V(x).
Solucin
E(X) =0; calculado anteriormente
Calculamos:
2 2 2 2 2 2
2
1 3 3 1
( ) . ( ) ( 3) ( 1) 1 3 3
8 8 8 8
( ) 3 (0) 3
E X x p x
V X
| | | | | | | |
= = + + + =
| | | |
\ . \ . \ . \ .
= =

Nota: cuando la variable aleatoria es discreta, muchas veces la varianza no tiene


sentido calcularla.
Ejemplo de varianza si la variable aleatoria es continua:
Del ejemplo donde X: peso (Kg) de latas de conservas para exportacin, cuya
funcin de densidad es la siguiente:
Cecilia Ros Varillas
100
3
(2 ) 0 2
( )
4
0 en otros casos
x x x
f x

Se desea calcular la dispersin esperada en los pesos de las latas de conservas.


Solucin
Se debe calcular la varianza:
E(x) = 1 , calculado anteriormente.
E(X
2
) = x
2
.f(x)dx x

[0;2]

2
E(X
2
) =
x
2
.
3
x(2 x)dx
=

6

0 4 5
Reemplazando:
V(X) =

6
1
2

=

1
=
0,2 (Kg)
2

5 5
Como la varianza est en unidades cuadradas, calculamos la desviacin estndar
que es la que mejor indica la dispersin en sus mismas unidades.

x
= 0,2 = 0,447214 Kg
4.5 EJERCICIOS DESARROLLADOS
Ejercicio 1
En una urna hay dos bolas rojas, 3 azules, 4 verdes y 1 blanca. Cuando se extrae
una bola y es roja el jugador recibe $ 6,00, cuando es azul recibe $ 5,00, cuando es
verde el jugador paga $ 2,50 y cuando es blanca paga $ 15,00. Cul es la ganancia
esperada del jugador? (Si es que le conviene o no jugar en estas condiciones).
Solucin
Sea X: Ganancia ($) del jugador
P(6) = P(Roja) = 2/10 P(5) = P(Azul) = 3/10
R
x
= {6; 5; -2,5; 15}
P(-2,5) = P(Verde) = 4/10 P(-15) = P(Blanca) = 1/10
x 6,00 5,00 -2,5 -15,00
p(x) 0,2 0,3 0,4 0,1 1
Estadstica y diseo de experimentos
101
E(x) = xP(x) = 6(0,2) + 5(0,3) +(-2,5)(0,4) + (-15)(0,1) = $ 0,20
Lo que espera ganar este jugador.
Ejercicio 2
En una urna hay tres fichas rojas y cinco blancas, en otra urna hay cuatro fichas
rojas y tres blancas; se toma una urna al azar y se saca una ficha, esta ficha se co-
loca en la otra urna, luego de esta ltima urna se saca una muestra de tres fichas.
Sea X: nmero de fichas rojas en la muestra extrada de la ltima urna, calcular:
a. La funcin de probabilidad de X
b. F(x), E(X) y P(1< X < 4)
Solucin
5R => Se sacan tres fichas
3/8 R 3B

II
I
1/2 4R => Se sacan tres fichas
5/8 R 4B

II

4R => Se sacan tres fichas

1/2
3/8 R 5B

I
II
3R => Se sacan tres fichas
5/8 R 6B

I

a. X: nmero de fichas rojas en la muestra extrada de la ltima urna.
Rx = {0; 1; 2; 3}

5 3 4 4 4 5 3 6
0 3 0 3 0 3 0 3 1 3 1 5 1 4 1 3 14581
(0) 0,1107036565
8 8 9 9 2 8 2 8 2 7 2 7 131712
3 3 3 3
p
| || | | || | | || | | || |
| | | | | | | |
\ .\ . \ .\ . \ .\ . \ .\ .
= + + + = =
| | | | | | | |
| | | |
\ . \ . \ . \ .
Cecilia Ros Varillas
102
5 3 4 4 4 5 3 6
1 2 1 2 1 2 1 2 1 3 1 5 1 4 1 3 57295
(1) 0, 4350021259
8 8 9 9 2 8 2 8 2 7 2 7 131712
3 3 3 3
p
| || | | || | | || | | || |
| | | | | | | |
\ .\ . \ .\ . \ .\ . \ .\ .
= + + + = =
| | | | | | | |
| | | |
\ . \ . \ . \ .
5 3 4 4 4 5 3 6
2 1 2 1 2 1 2 1 1 3 1 5 1 4 1 3 50358
(2) 0,3823341837
8 8 9 9 2 8 2 8 2 7 2 7 131712
3 3 3 3
p
| || | | || | | || | | || |
| | | | | | | |
\ .\ . \ .\ . \ .\ . \ .\ .
= + + + = =
| | | | | | | |
| | | |
\ . \ . \ . \ .
5 3 4 4 4 5 4 6
3 0 3 0 3 0 3 0 1 3 1 5 1 4 1 3 9478
(3) 0,0719600340
8 8 9 9 2 8 2 8 2 7 2 7 131712
3 3 3 3
p
| || | | || | | || | | || |
| | | | | | | |
\ .\ . \ .\ . \ .\ . \ .\ .
= + + + = =
| | | | | | | |
| | | |
\ . \ . \ . \ .
x 0 1 2 3
P(x)
14581
131712
57295
131712
50358
131712
9478
131712
0 ; x < 0
0,110704 ; 0 x < 1
F(x) =
{
0,5457 ; 1 x 2
0,9280 ; 2 x < 3
1 ; x 3
E(x) = 1,41555 P(1 < X < 4) = 0,45429
Ejercicio 3
Sea X una variable aleatoria que representa el peso (gramos) de ovillos de hilo,
cuya funcin de probabilidad es:
1
1 2
2
2 2, 5
( )
6 2 2, 5 3
0 caso contrario
x
x
k
x
f x
k
x x

<

<
=

<

Estadstica y diseo de experimentos


103
a. Determine el valor de k
b. Calcular E(x) e interprete.
Solucin
a.

2 5/ 2 3
1 2 5/ 2
1 2
(6 2 ) 1
x
dx dx x dx
k k

+ + =

k = 2

1
( 1) 1 2
2
1 2 2, 5
( )
6 2 2, 5 3
0 caso contrario
x x
x
f x
x x

<

<
=

<

b. E(x) = xf(x)dx
2 5/ 2 3
2 2
1 2 5/ 2
1
( ) ( ) (6 2 )
2
E x x x dx xdx x x dx = + +

53
( ) 2, 2083
24
E x g = =
Ejercicio 4
Se tienen dos cajas A y B. La caja A tiene en total 9 bolas de las cuales 3 son rojas
y las dems negras y verdes. En B hay 5 bolas: 3 verdes y 2 negras. Se propone el
siguiente juego: se saca una bola de A y se pone en B y luego se saca una bola de
B. Si de sta ltima caja sale una roja se gana $ 60, si sale una verde se pierde $45
y si sale una negra se gana $20. Calcular la ganancia esperada, si se sabe que la
probabilidad de que salga una bola negra en la ltima caja es de 10/27.Determine
la funcin de probabilidad.
Solucin
Sea x: Nro. de bolas negras en la caja A. 6-x: Nro. de bolas verdes en la caja A.
La probabilidad de que al final resulte la bola negra es:

( ) 6-
3 2 3 2 10
2
9 6 9 6 9 6 27
x
x
x + + = =

Cecilia Ros Varillas
104
G 60 -45 20
P(x)
3
54
31
54
20
54
3 1 3
(60)
9 6 54
3 3 2 3 4 4 31
( 45)
9 6 9 6 9 6 54
3 2 2 3 4 2 20
(20)
9 6 9 9 9 6 54
P
P
P
| || |
= =
| |
\ .\ .
| || | | || | | || |
= + + =
| | | | | |
\ .\ . \ .\ . \ .\ .
| || | | || | | || |
= + + =
| | | | | |
\ .\ . \ .\ . \ .\ .
( ) ( ) ( )
3 31 20 815
( ) 60 -45 20 -
54 54 54 54
E G = + + =
E(G) -15,0926
En estas circunstancias y con las condiciones del juego, se espera obtener una
prdida de aproximadamente $ 15,0926.
Ejercicio 5
Las mquinas tejedoras en una fbrica de elstico usan un rayo lser para detec-
tar los hilos rotos. Cuando se rompe un hilo, es necesario detener la mquina y el
tcnico debe localizar y reparar el hilo roto. Suponer que la funcin de probabili-
dad de X: nmero de veces que se detiene cada da una mquina, est dada por:
1
( ) 0;1; 2;3; 4
2
x
p x k x
| |
= =
|
\ .
a. Halle el valor de la constante k y luego presente en una tabla la distribucin
de probabilidad de X.
b. Si en un da la mquina se tuvo que detener a lo ms 3 veces, halle la
probabilidad de que sea detenida por lo menos una vez.
c. Si cada vez que se detiene la mquina para reparar el hilo se emplean 3,5 minutos
Cuntos minutos por da esperara usted que se empleen en reparar el hilo?
Solucin
a. Sea X: nmero de veces que se detiene la mquina.
Considerando la funcin de probabilidad dada, se tiene:
Estadstica y diseo de experimentos
105
x 0 1 2 3 4
p(x)
k
k
2

k
4

k
8
k
16
Como p(x) = 1 => k =
16

31

Reemplazando, la distribucin de probabilidades es:
x 0 1 2 3 4
p(x)
16
31

8
31

4
31

2
31
1
31
( )
( )
( )
14
1 3
14
31
1
P 0, 46667
3
30
3 30
31
P x
x
x
P x

= = = =


Sea T: Tiempo (minutos) que se emplea cada vez que se detiene la mquina
x 0 1 2 3 4
T 0 3,5 7 10,5 14
p(x)
16
31

8
31

4
31

2
31
1
31
( ) ( ) ( ) ( ) ( )
16 8 4 2 1
( ) 0 3, 5 7 10, 5 14 2, 93548
31 31 31 31 31
E T
| | | | | | | | | |
= + + + + =
| | | | |
\ . \ . \ . \ . \ .
En reparar el hilo se esperara emplear aproximadamente 2,94 minutos por da.
Ejercicio 6
El contenido de magnesio de una determinada aleacin es una variable aleatoria
dada por la siguiente funcin de densidad:
, 0 6
( )
18
0 , en otros casos
x
x
f x

<

Cecilia Ros Varillas


106
a. Cul es la probabilidad de que una aleacin tenga un contenido de magnesio
entre 2,2 y 4,8?
b. La utilidad (en soles) que se obtiene de esta aleacin es U=10+2X.Calcule el
coeficiente de variacin de la variable U.
Solucin
a. Sea X: contenido de magnesio en una determinada aleacin
Se pide:

( )
4,8 4,8
2,2 2,2
91
P 2, 2 4, 8 f(x) dx= dx= 0, 5056
18 180
x
x < < = =

b.

6 6
0 0
( ) ( ) 4
18
x
E x x f x dx x dx = = =


6 6
2 2 2
0 0
( ) ( ) 18
18
x
E x x f x dx x dx = = =

V(x) = E(x
2
) - E
2
(x) = 18 - (4)
2
= 2
U = 10 + 2x => E(U) = 10 + 2E(x) = 10 + 2(4) = 18
V(U) = V(10 + 2x) = 4V(x) = 4(2) = 8

Se calcula el CV de la utilidad U:

( )
( ) 8
. . 100% 100% 15, 7135%
( ) 18
V U
CV U
E U
= = =
Se presenta una dispersin moderada en el contenido de magnesio.
Ejercicio 7
Supngase que el error de medicin (mm) de determinado aparato electrnico es
un fenmeno aleatorio con funcin de densidad.
f(x) = |x|e
-x
2
V x

R
Estadstica y diseo de experimentos
107
a. Determine la funcin de distribucin.
b. Cul es la probabilidad de que el error sea menor que 2, si se sabe que es
mayor que 1?
Solucin
a. La funcin de densidad, para cada valor de x es:

2
2
2
0
( )
0
x
x
x
xe x
f x x e
xe x

= =

<

Luego, la funcin de distribucin es la siguiente:


2
2
0
2
( )
1
1 0
2
x
x
e
x
F x
e x

<

b.

( )
( ) 1 2
(2) (1) 0,1747819
2
P 0, 950213
1
( 1) 1 (1) 0,1839397
P x
F F
x
x
P x F
< <

<
= = = =
>
>
Donde:
4
1
(2) 1
2
F e

=

1
1
(1) 1
2
F e

=
1 4
1 1
(2) (1) 0,1747819
2 2
F F e e

= =
1
1
1 (1) 0,1839397
2
F e

= =
Por lo tanto, la probabilidad de que el error de medicin sea menor que 2, sabien-
do que es mayor que 1 mm es de 0,950213, una probabilidad muy alta.
Ejercicio 8
Dada la funcin de distribucin de una variable aleatoria continua X que repre-
senta el volumen (cm
3)
:
Cecilia Ros Varillas
108

2
2
0, 0
/ 4, 0 1
( ) 1/ 4 ( 1) / 2, 1 2
1 [(3 ) / 4], 2 3
1, 3
x
x x
F x x x
x x
x
<

<

= + <

<

a. Hallar la funcin de probabilidad f(x)


b. Encontrar P(0.75< X < 2.2).
Solucin
Se sabe que f(x) = F(x) entonces, derivando F(x) se encuentra la funcin de pro-
babilidad:
( )
1
0 1
2
1
1 2
( )
2
1
3 2 3
2
0 en otros casos
x x
x
f x
x x

<

<

<

P(0,75 < x < 2,2) = F(2,2) F(0,25) =


( )
( )
2
2
0, 75
1 [(3 2, 2) / 4] 0, 84 0,140625 0, 699375
4
| |
| = = =
|
\ .
Ejercicio 9
El error en la temperatura de reaccin (en C) para un experimento controlado
de laboratorio es una variable aleatoria continua X, que tiene la siguiente funcin
de probabilidad:
2
4 0
( )
0 en otros casos
x
xe x
f x


=

Determine P(X 2
2
)

x
Estadstica y diseo de experimentos
109
Solucin
Primero se calcula el valor esperado y varianza:
2 2 2
0 0 0
( ) ( ) 4 4 1
x x
E X x f x dx x xe dx x e dx
+ + +

= = = =

2 2 2 2 3 2
0 0 0
3
( ) ( ) 4 4
2
x x
E X x f x dx x xe dx x e dx
+ + +

= = = =

( ) ( )
2
2 2
3 1
( ) ( ) 1
2 2
X
V X E X E X o = = = =
Ahora ya se puede calcular:
( ) ( )
2
1
2 2 1
2
X
P X P X P X o
| |
= = =
|
\ .
1 0 1
2
0
( ) 0 4
x
f x dx dx xe dx


= = + =

= 1 3e
-2
= 0,593994
4.6 EJERCICIOS PROPUESTOS
Ejercicio 1
Una urna contiene 6 bolas numeradas de 1 a 6. Se extraen al azar dos bolas, una
despus de otra con reposicin. Sea X el menor de los dos nmeros obtenidos.
a. Encuentre la funcin de probabilidad de X.
b. A partir de la funcin de distribucin acumulada de X, calcular P(2< X < 4).
Ejercicio 2
Cierta aleacin se forma al cambiar la mezcla fundida de 2 metales. La aleacin
que resulta contiene cierto porcentaje de plomo x, que puede considerarse como
una variable aleatoria con funcin de densidad.

( )
( )
5
3
10 100 0 100
5
0 en otros casos
x x x
f x

Cecilia Ros Varillas


110
Calcular el porcentaje de plomo que se espera obtener.
Determine:

( ) ( )
2
3
- ; donde
2
x X X X
P x E x V x o o
| |
= =
|
\ .
Ejercicio 3
El tiempo de retraso, medido en minutos, de la ciudad A a la Ciudad B en tren,
sigue una variable aleatoria continua con funcin de distribucin acumulada:
2
2
0 si 1
1
( 1) 1 0
2
( )
1
( 1) 0 1
2
1 1
x
x
k x x
F x
x
k x x
x

+ + <

=

+

+ <

>

a. Calcule el valor de k.
b. Calcule la probabilidad de que el tren llegue entre medio minuto de adelanto
y un minuto de retraso.
c. Sabiendo que el tren ha llegado con retraso, calcule la probabilidad de que lo
haya hecho menos de 15 segundos despus de lo previsto.
Ejercicio 4
Dada la funcin de distribucin de una variable aleatoria continua X
2
2
0, 0
/ 4, 0 1
( ) 1/ 4 ( 1) / 2, 1 2
1 [(3 ) / 4], 2 3
1, 3
x
x x
F x x x
x x
x
<

<

= + <

<

a. Hallar f(x)
b. Calcular E(X) y P( 0,75 < X < 2,2)
Estadstica y diseo de experimentos
111
Ejercicio 5
La duracin de un componente electrnico (en aos) se distribuye con funcin
de densidad:
2 0 1/ 2
( ) 1/ 2 2
0 en otros casos
x si x
f x k si x

= <

Sabiendo que un componente se considera vlido si su duracin es superior a


tres meses. Se pide:
a. El valor de k y F(X)
b. La duracin esperada
c. Probabilidad de que un componente sea vlido
Ejercicio 6
Sea X una variable aleatoria con la siguiente funcin de distribucin
0 si 0
1
( ) si 0
1
1 si
x
F x x x
x

= < <

Verifique que F(x) es una funcin de distribucin. Adems encuentre la funcin


de probabilidad f(x), y calcule la siguiente probabilidad:
1
0
2
P x

| |

|
\ .
Ejercicio 7
El contenido x de magnesio en cierto compuesto es una variable aleatoria, cuya
funcin de densidad es:
/ 8 0 6
( )
0 en otro caso
cx si x
f x

Cecilia Ros Varillas


112
La ganancia que se obtiene por este compuesto es G = 10 + 2X. Cul es la ganan-
cia esperada?
Ejercicio 8
En cierta ciudad el consumo diario de agua (en millones de litros) es una variable
aleatoria cuya densidad de probabilidad est dada por:

>
=

0 , 0
0 ,
9
) (
3 /
x
x e
x
x f
x
Encuentre la funcin de distribucin.
Cul es la probabilidad de que en un da dado el suministro de agua sea insufi-
ciente si la capacidad diaria del reservorio de la ciudad es de 9 millones de litros?
Si en un determinado momento del da, el reservorio esta menos de la tercera
parte de su capacidad (capacidad=9 millones de litros), cul es la probabilidad
de que el suministro de agua sea suficiente para ese da?
Encuentre la media y varianza del consumo diario de agua.
Estadstica y diseo de experimentos
113
Como complemento al captulo anterior en el que definimos todos los conceptos
relativos a variables aleatorias, se describe en este captulo las principales leyes
de probabilidad que encontramos en las aplicaciones del clculo de probabilida-
des. Es as que atendiendo a la clasificacin de las variables aleatorias en discretas
y continuas, se presenta las principales leyes de probabilidad de cada una de
ellas, las cuales constituirn el soporte subyacente de la inferencia estadstica y a
las que ser necesario hacer referencia en el estudio de dicho bloque.
A la tabla, grfica o expresin matemtica, que presente las probabilidades con
que una variable aleatoria toma diferentes valores, se llama distribucin de pro-
babilidad de la variable aleatoria y a al conjunto de pares (x; f(x)) se le llama
funcin de probabilidad, donde x es el valor de la variable aleatoria y f(x) es la
probabilidad asignada a x.
Se inicia este captulo con el estudio de las distribuciones notables para cada clase
de variable aleatoria.
5.1 DISTRIBUCIONES DISCRETAS NOTABLES
Segn las formas especiales que pueden tener las funciones de probabilidad y se-
gn las caractersticas de la variable para cada experimento, se conocen algunas
distribuciones especiales para las variables discretas y son las siguientes:
5.1.1 Distribucin Binomial
Consideremos un experimento con las siguientes caractersticas:
- Experimento de Bernoulli: Que consiste en n ensayos o repeticiones.
- Cada ensayo tiene dos resultados posibles: xito (E) o Fracaso (F)
- La probabilidad de xito = p, y la probabilidad de fracaso = 1 p = q
- Los ensayos son independientes, es decir la probabilidad de xito p es constante
en cada ensayo o repeticin.
- Si el experimento consiste en un muestreo, ste ser con reposicin.
Distribucin de probabilidades
CAPTULO 5
Cecilia Ros Varillas
114
La distribucin binomial aparece cuando estamos interesados en el nmero de
veces que un evento o suceso A ocurre (xitos) en n intentos independientes de
un experimento.
Sea X: nmero de xitos obtenidos en los n ensayos o repeticiones.
La funcin de probabilidad es la siguiente:
( ) 0,1, 2,......;
x n x
n
P X x p q x n
x

| |
= = =
|
\ .

x = 0, 1, 2, ... ; n
La variable aleatoria discreta X es Binomial, que se distribuye con parmetros n
y p: X ~ B(n ; p)
Propiedades
1. P(X = x) 0 x = 0,1,2, ...; n
2.

1
( ) 1
n
i
i
P X x
=
= =

3. E(X) = n p
4. V(X) = n q p
0,2
0,18
0,16
0,14
0,12
0,1
0,08
0,06
0,04
0,02
0
1 4 7 10 13 16 19
Figura 5.1. Distribucin Binomial.
Estadstica y diseo de experimentos
115
Ejemplo:
Un agente qumico produce la decoloracin del 5% de los rollos de papel produ-
cido por cierta compaa. En una muestra de 20 rollos de papel,
- Cul es probabilidad de que 3 rollos presenten decoloracin debido al agente
qumico?
- Cul es probabilidad de que por lo menos 2 rollos presenten decoloracin
debido al agente qumico?
- Cuntos rollos se espera que presenten decoloracin debido al agente
qumico?
Solucin
X: nmero de rollos que presenten decoloracin debido al agente qumico de los
20 rollos de papel
Este problema se puede considerar como un problema de distribucin binomial
para el cual n=20 y p=0,05
xito: presenta decoloracin debido al agente qumico
P(xito) = p = 0,05 P(fracaso) = 1- p = q = 0,95
La funcin de probabilidad es la siguiente
20
( ) (0, 05) (0, 95) 0,1, 2,......; 20
x n x
P X x x
x

| |
= = =
|
\ .
a.

3 17
20
( 3) (0, 05) (0, 95) 0, 05958
3
P X
| |
= = =
|
\ .
b. P(X 2) = 1 - P(X < 2) = 1 - [p(0) + p(1)]

0 20 1 19
20 20
1 (0, 05) (0, 95) (0, 05) (0, 95)
0 1
(
| | | |
= +
( | |
\ . \ .

= 0,26416
c. E(X) = np = 20 ( 0,05) = 1
Se espera que un rollo de papel presente decoloracin debido al agente qumico.
Cecilia Ros Varillas
116
Algunos clculos para obtener las probabilidades de valores particulares de n y
x, resultan bastante tediosos; razn por la cual se pueden usar tablas estadsticas
de la Distribucin Binomial para n 20 y valores disponibles de p.
En general, la distribucin binomial tiene poca aplicacin en el anlisis qumico
de laboratorio, ya que es una variable aleatoria discreta; su principal uso est
en el control estadstico de calidad, en la deteccin de porcentajes de productos
defectuosos en lotes de produccin.
5.1.2 Distribucin de Poisson
La distribucin de Poisson es una de las distribuciones discretas ms importan-
tes, cuyo nombre se debe al matemtico francs, Simeon Denis Poisson (1781
1840), quien la introdujo en 1837.
Esta distribucin se puede deducir de dos formas:
5.1.2.1 A partir de un proceso Poisson
La caracterstica principal de este proceso es la ocurrencia de eventos discretos
en espacios o unidades continuas, ejemplos: nmero de hilos por cm
2
de tela, n-
mero de llamadas telefnicas por hora, nmero de bacterias por cm
3
de agua, etc.
Las asunciones de este proceso Poisson son:
- El nmero de eventos discretos (xitos) en los espacios continuos es grande,
entonces se conoce el promedio de xitos que ocurren en dicha unidad de
medida, definida como .
- La ocurrencia de los eventos son independientes.
- La probabilidad de que ocurra un evento es pequea.
La variable aleatoria se define:
X: Nmero de xitos por unidad de medida.
X~Poisson (), se dice que X sigue una distribucin de Poisson con parmetro

,
si la funcin de densidad es como sigue:
( ) 0,1, 2,......
!
x
e
P X x x
x

= = =
Si X: Nmero de xitos en t unidades de medida
( )
( ) 0,1, 2,......
!
t x
e t
P X x x
x

= = =
Estadstica y diseo de experimentos
117
Propiedades
1. P(X = x) 0 x = 0,1,2,....


2.

P(X = x
i
) = 1

i= 1
3. E(X) =
4. V(X) =
Ejemplo:
Supongamos que el nmero de imperfecciones en un alambre delgado de cobre
tiene una media de 0,7 imperfecciones por milmetro.
a. Determine la probabilidad de 2 imperfecciones en un milmetro de alambre.
b. Determine la probabilidad de 10 imperfecciones en 5 milmetros de alambre.
c. Determine la probabilidad de que haya a lo ms 4 imperfecciones en 2mm de
alambre.
Solucin
Sea X: nmero de imperfecciones por milmetro.
= 0,7 imperfecciones por mm
X ~ Poisson ( = 0,7)
La funcin de probabilidad es la siguiente:
( )
0.7
0, 7
( ) 0,1, 2,......
!
x
e
P X x x
x

= = =
a.

( )
0.7 2
0, 7
( 2) 0,12166
2!
e
P X

= = =
b. En este caso se usa otro
1
= (0,7) (5) = 3,5 imperfecciones por 5 mm

( )
3,5 10
3, 5
( 10) 0, 00229555
10!
e
P X

= = =
c.
2
= (0,7) (2) = 1,4 imperfecciones por 2 mm
P(X 4) = 0,986

Cecilia Ros Varillas
118
Este resultado se ha obtenido usando tablas estadsticas.
La probabilidad de que haya a lo ms 4 imperfecciones en 2 mm de alambre, es
muy alta, ya que resulta 0,986.
5.1.2.2 Como Lmite de la Distribucin Binomial
Se obtiene como aproximacin de una distribucin binomial con la misma media,
cuando n es grande (n > 30) y la probabilidad de xito p es muy pequea (p < 0,1).
Es decir:
( )
( )
0
( )

!
lim
n p x
x n x
n
p
n
e np
P X x p q
x x

| |
= =
|
\ .

= np
Ejemplo:
Una fbrica enva al depsito 500 artculos, la probabilidad de deterioro de un ar-
tculo es de 0,002. Deterrmine la probabilidad de que en el camino se deterioren:
a. Exactamente tres artculos
b. A lo ms tres artculos
Solucin
X: nmero de artculos que se deterioran de los 500 artculos enviados
X ~ B (500 ; 0,002)
X se distribuye como una Binomial, pero como n es muy grande y p muy peque-
o, entonces se puede aproximar a Poisson con = np = (500) (0,002) = 1, es decir:
X ~ B(500 ; 0,002) X ~ Poisson ( = 1)
a. P(X = 3) =
e
-1
(1)
3
= 0,061313

3!
La probabilidad de que en el camino se deterioren slo tres artculos es muy
pequea.
P(X 3) = 0,981
La probabilidad de que en el camino e deterioren a lo ms tres artculos es muy
alta; es decir, existe un 98,1% de posibilidad de que esto ocurra.
Estadstica y diseo de experimentos
119
5.1.3 Distribucin Hipergeomtrica
La distribucin hipergeomtrica suele aparecer en procesos muestrales sin reem-
plazo, en los que se investiga la presencia o ausencia de cierta caracterstica.
Esta distribucin se puede ilustrar del modo siguiente:
- Una poblacin finita de N elementos, particionados en dos clases mutuamente
excluyentes: clase xito y clase fracaso.
- La clase xito tiene k elementos y la clase fracaso (N k)
- Se extrae de esta poblacin, una muestra tamao n.
- Si el experimento consiste en un muestreo, ste es sin reposicin.
Sea X una variable aleatoria discreta que se define:
X: nmero de elementos de la muestra extrada que pertenecen a la clase xito.
La funcin de probabilidad est dada por:
( )
-
-
0;1; 2;......, mn ( ; )
k N k
x n x
P X x x n k
N
n
| | | |
| |
\ . \ .
= = =
| |
|
\ .
Propiedades
1. P(X = x) 0 x = 0, 1, 2, ...; min (n, k)
2. P(X = x
i
) = 1
i=1
3. E(X) = n (
k
)

n
4. V(X) = n

(
k
)(
1 -

k
) (
N - n
)

n n N - 1
Ejemplo:
Se sabe que el 7% de los insumos qumicos en un lote de 100 no cumplen ciertas
especificaciones de calidad. Tomada una muestra al azar de 10 insumos qumi-
cos sin reemplazo, interesa conocer la probabilidad de que no ms de dos sean
defectuosos.
Cecilia Ros Varillas
120
Solucin
El nmero de tiles defectuosos en el lote es 7% de 100 = 7. Para un tamao mues-
tral de n=10, la funcin de probabilidad es la siguiente:
( )
7 93
10-
2 (0) (1) (2)
100
10
x x
P X p p p
| | | |
| |
\ . \ .
= = + + =
| |
|
\ .
7 93 7 93 7 93
0 10 1 9 2 8
0, 97924
100 100 100
10 10 10
| | | | | | | | | | | |
| | | | | |
\ . \ . \ . \ . \ . \ .
= + + =
| | | | | |
| | |
\ . \ . \ .
La probabilidad de que a lo sumo haya dos tiles defectuosos en el lote es aproxi-
madamente 0,98.
5.2 DISTRIBUCIONES CONTINUAS NOTABLES
Desde hace 300 aos se ha estudiado la distribucin de los datos experimentales
y se han propuesto muchas frmulas para representar estas distribuciones. Estas
frmulas expresan de diferentes maneras la distribucin de las frecuencias de
mediciones repetidas o de otros acontecimientos que se basan en la probabilidad.
En esta seccin se estudian las distribuciones ms importantes de las variables
aleatorias continuas unidimensionales.
Algunas distribuciones continuas notables son: distribucin uniforme, distribu-
cin exponencial y distribucin normal, esta ltima es la que ms se aplica, por
eso slo citaremos brevemente a la distribucin uniforme y a la exponencial.
5.2.1 Distribucin uniforme
Una variable aleatoria continua X posee una distribucin uniforme en el interva-
lo [a, b], si su funcin de probabilidad es la siguiente:
| |
1
si ;
( )
-
0 en caso contrario
x a b
f x
b a

X ~ U (a,b)
Estadstica y diseo de experimentos
121
Su funcin de distribucin es:
0 si
-
( ) si
-
1 si
x a
x a
F x a x b
b a
x b
<

= <

El valor esperado y varianza de una variable aleatoria con distribucin uniforme


se presentan a continuacin:
1
( )
b - a 2
b
a
b a
E X x dx
+
= =

( )
2
2 2
1
( )
b - a 3
b
a
b a
E X x dx
+
= =


( )
2
2
2
2 2
( )
( ) ( ) ( )
3 2 12
b a
b a b a
V X E X E X
+
+ +
| |
= = =
|
\ .
La grfica de la funcin de probabilidad es:
Figura 5.2. Distribucin Uniforme
5.2.2 Distribucin exponencial
La distribucin exponencial describe procesos en los que nos interesa saber el
tiempo hasta que ocurre determinado evento, sabiendo que, el tiempo que pue-
da ocurrir desde cualquier instante dado t hasta que ello ocurra en un instante
cualquiera t
i
, no depende del tiempo transcurrido anteriormente en el que no ha
pasado nada.
1
n
a
b
Distribucin Uniforme
Cecilia Ros Varillas
122
Ejemplos de este tipo de distribuciones son:
El tiempo que tarda una partcula radiactiva en desintegrarse. El conocimiento
de la ley que sigue este evento se utiliza en Ciencias, por ejemplo, la datacin
de fsiles o cualquier materia orgnica mediante la tcnica del carbono 14 (C14).
Concretando, una variable aleatoria continua X distribuida a lo largo de los rea-
les positivos, se distribuye en forma exponencial si su funcin de densidad es:
si 0
( )
0 en caso contrario
x
e x
f x

Su funcin de distribucin es:


0 si 0
( )
1 si 0
x
x
F x
e x

<
=

El valor esperado y la varianza de una variable aleatoria X con distribucin ex-


ponencial son:
0
1
( )
x
E X x e dx

= =

2
1
( ) V X

=
La grfica de la funcin de probabilidad de la variable aleatoria X con distribu-
cin exponencial es:
0
0.1
0.2
0.3
0.4
0.5
0.6
0 2 4 6 8 10 12 14 16 18 20
Distribucin Exponencial
Figura 5.3. Distribucin Exponencial
Estadstica y diseo de experimentos
123
Ejemplo:
El tiempo de vida de una bacteria (en horas) sigue una distribucin exponencial
con media de 16 horas.
a. Cul es la probabilidad de que dicha bacteria tenga un tiempo de vida menor
de 20 horas?
b. Si la bacteria vive ms de 5 horas, cul es la probabilidad de que viva hasta 25
horas?
Solucin
Sea X: tiempo de vida (en horas) de la bacteria
1 1
( ) 16 =
16
E X

= =
1
16
1
si 0
( )
16
0 en caso contrario
x
e x
f x


=

La funcin de distribucin es:


1
16
0 si 0
( )
1 si 0
x
x
F x
e x

<

a.

( )
20 1 20
16 16
0
1
20 (20) 1 0, 7135
16
x
P X e dx F e

= = = =

b.

( )
( )
( )
5 25
(25) (5)
25
0, 713495
5
5 1 (5)
P X
F F
X
P
X
P X F

= = =


5.2.3 Distribucin normal o gaussiana
La distribucin normal es, sin duda, la distribucin de probabilidad ms impor-
tante del clculo de probabilidades y de la Estadstica. Fue reconocida por pri-
mera vez por el francs Abraham de Moivre (1667-1754). Posteriormente, Carl
Friedrich Gauss (1777-1855) elabor desarrollos ms profundos y formul la
ecuacin de la curva; de ah que tambin se la conozca, ms comnmente, como
la Campana de Gauss.
1
~ X Exp

| |
|
\ .
Cecilia Ros Varillas
124
La importancia de la distribucin normal queda totalmente consolidada por ser
la distribucin lmite de numerosas variables aleatorias especialmente las conti-
nuas. La distribucin normal se aplica en todos los campos de las ciencias emp-
ricas: biologa, medicina, psicologa, qumica, fsica, economa, ingeniera, etc. En
particular, muchas medidas de datos continuos en qumica y textiles (volumen,
peso, temperatura, resistencia a la ruptura de fibras etc.) se aproximan a la dis-
tribucin normal.
Se dice que una variable aleatoria continua X sigue una distribucin normal de
parmetros
x
y
2
, y se denota como X ~ N(
x
;
2
) si su funcin de probabilidad
o densidad es la siguiente:
2
1
2
1
( )
2
x
x
x
x
f x e x R

o
o
| |

|
\ .
=

x
: media poblacional

2
: varianza poblacional
Se ha encontrado experimentalmente que la funcin de distribucin normal des-
cribe satisfactoriamente aquellos sistemas en los que las mediciones en estudio
vienen afectadas por un nmero grande de errores que actan todos indepen-
dientemente.
f(x)

Figura 5.4. Grfica de la funcin de probabilidad de Distribucin Normal


Caractersticas de la funcin de probabilidad de la distribucin normal
a. Forma acampanada.
b. Asinttica respecto al eje X.
c. Es unimodal ya que solo tiene un valor mximo en el que coincide la media,
mediana y la moda.
x
x
x
Estadstica y diseo de experimentos
125
d. El punto central en la distribucin es la media e indica la posicin de la
campana (parmetro de centralizacin); mientras que las distancias de la
media se expresan en funcin de la desviacin estndar ya que es el parmetro
de dispersin.
e. El rea bajo la curva representa la probabilidad de que ocurra una observacin
dentro de los lmites del rea.
f. El rea total bajo la curva se considera igual a la unidad.
g. Este valor indica la proporcin de la poblacin que se encuentra en
determinados intervalos centrados en la media. Si
x
es el valor medio y
x
es
la desviacin estndar, entonces:
- El 68 % de las observaciones estn en el intervalo [
x

x
;

x
+
x
]
- El 95,5% de las observaciones estn en el intervalo [
x
2
x
;

x
+ 2
x
]
- El 99,7% de las observaciones estn en el intervalo [
x
3
x
;

x
+ 3
x
]
Observacin
Estos dos parmetros
x
y
2
coinciden adems con la media (esperanza) y la
varianza respectivamente, es decir: E(X) =
x
y V(X) =
2
La forma de la funcin de densidad es la llamada campana de Gauss.
Se puede interpretar la media como un factor de traslacin y la desviacin estn-
dar como un factor de escala o de dispersin.
o o +
16% 16%
68%
2 o

2 o +
95.5%
2.25%
2.25%
3 o
3 o +
99.7%

Figura 5.5. Grficos de la normal, con probabilidades notables
Si una variable aleatoria X tiene una distribucin normal y queremos calcular
la probabilidad de que X caiga entre dos valores a y b entonces, se debe hallar
el rea debajo de la curva entre a y b; es decir, se debe integrar de la siguiente
manera:
x
x
Cecilia Ros Varillas
126
( )
2
1
2
1
( )
2
x
x
x
b b
a a x
P a x b f x dx e dx

o
o
| |

|
\ .
= =

Debido a que estos clculos son algo complicados, entonces se puede realizar una
transformacin para estandarizar la variable normal.
5.2.3.1 Distribucin normal estndar
Sea X una variable aleatoria continua que se distribuye normalmente X ~ N(
x
;
2
),
esta variable se puede transformar en otra variable normal con media 0 y varianza
1, la cual se le conoce como Distribucin Normal Estndar y se representa por Z.
La estandarizacin de cualquier normal es de la siguiente manera:
( )
-
0 , 1
x
x
X
Z N

o
=
Caracterstica de la Distribucin normal estndar
- El valor esperado o media es 0 y la varianza 1, es decir: E(Z) = 0 V(Z) = 1
- Esta distribucin es simtrica respecto a su media
- La grfica es asinttica respecto al eje de abscisas
Figura 5.6. Distribucin Normal Estndar
Existen tablas estadsticas que da el rea debajo de la curva normal estndar (pro-
babilidad acumulativa). Ver Anexo 2, donde F(Z) = P(Z z)
Ejemplo 1 Usando la Distribucin Normal:
Si X ~ N(15;4). Calcular usando Tablas estadsticas del Anexo 2
x
0
0.05
0.1
0.15
0.2
0.25
0.3
0.35
0.4
0.45
-
3
-
2
.
7
-
2
.
4
-
2
.
1
-
1
.
8
-
1
.
5
-
1
.
2
-
0
.
9
-
0
.
6
-
0
.
3 0
0
.
3
0
.
6
0
.
9
1
.
2
1
.
5
1
.
8
2
.
1
2
.
4
2
.
7 3
Distribucin Normal Estndar
Estadstica y diseo de experimentos
127
P(X 16) = P(
x
x

>
16 15
) = P(Z 0,5) = F(0,5) = 0,69146

x

2
P(X > 14,5) = P(
x
x

>
14,5 15
) = P(Z > 0,25) = P(Z < 0,25) = F(0,25) = 0,59871

x

2
Nota: Los valores negativos por simetra.
Ejemplo 2 de la Distribucin normal:
En el laboratorio de qumica, se realiz estudios acerca de la duracin de unas
laminillas de acero sumergidas en el agua. Los resultados mostraron que la dura-
cin de dichos productos estn distribuidos normalmente con una duracin me-
dia de 491 horas y una desviacin estndar en la duracin de dichas laminillas,
de 5 horas. Calcular la probabilidad de que las laminillas tengan una duracin
comprendida entre 480 y 500 horas.
Solucin
Sea X: duracin (en horas) de laminillas de acero sumergidas en agua.
Como X ~ N(
x
;
2
) es decir X ~ N(491; 25), entonces se debe estandarizar para
calcular la probabilidad pedida P(480 < X < 500):
( )
480 - 491 500 - 491
480 500
5 5
X
X
X
P X P

o
| |
< < = < < =
|
\ .
P(2,2 < Z < 1,8) = F(1,8) F(2,2) = 0,96407 0,01390 = 0,95017
Entonces se dice que existe un 95,017% de posibilidad de que las laminillas de
acero sumergidas en agua, tengan una duracin entre 480 y 500 horas.
Nota. Las probabilidades acumuladas se han calculado con las tablas estadsticas
de la normal estndar.
5.2.3.2 Aproximacin de la binomial a la normal
Una variable aleatoria discreta con distribucin binomial se puede aproximar
mediante una distribucin normal si n es suficientemente grande y p no est ni
muy prximo a 0 ni a 1. Como el valor esperado y la varianza de X son respecti-
vamente np y npq, la aproximacin consiste en decir que:
n > 30
X ~ B(n,p) donde
{
=> X = N (np; npq)
np 5
x
Cecilia Ros Varillas
128
Cuando ocurren las condiciones anteriores, la grfica de la distribucin Binomial,
es muy parecida a la distribucin Normal, por lo que es adecuado calcular pro-
babilidades con la Normal en lugar de la Binomial y de una forma ms rpida.
En resumen, se utiliza la aproximacin Normal para evaluar probabilidades Bi-
nomiales siempre que p no est cercano a 0 1. La aproximacin es excelente
cuando n es grande y bastante buena si p est razonablemente cercana a . Una
posible gua para determinar cundo puede utilizarse la aproximacin Normal
es tener en cuenta el clculo de np y nq. S ambos, np y nq son mayores o iguales
a 5, la aproximacin ser buena.
Antes de empezar a resolver problemas con la aproximacin Normal, es bueno
aclarar que se estn evaluando probabilidades asociadas a una variable discreta,
con una distribucin que evala variables de tipo continuo como es la Normal,
por este motivo se usa un factor de correccin .
El cuadro para conversiones es el siguiente:
Cuadro 5.1. Cuadro de Conversiones
X se distribuye Binomial X se aproxima a la Normal
P(X = x) P
(
x
1
X x +
1
)

2 2
P(X x)
P
(
X x +
1
)

2
P(X < x)
P
(
X x
1
)

2
P(X x)
P
(
X x
1
)

2
P(X > x)
P
(
X x +
1
)

2
P(a X b)

P
(
a
1
X b +
1
)

2 2
P(a < X b)

P
(
a +
1
X b +
1
)

2 2
P(a X < b)
P
(
a
1
X < b
1
)

2 2
P(a < X < b)
P
(
a +
1
< X < b
1
)

2 2
Estadstica y diseo de experimentos
129
Ejemplo:
Si 35% de los productos manufacturados en cierta lnea de produccin son de-
fectuosos, cul es la probabilidad de que entre los siguientes 1000 productos
manufacturados en esa lnea
a. menos de 354 productos sean defectuosos?
b. entre 342 y 364 productos sean defectuosos?
Solucin
Sea X: nmero de productos defectuosos que se manufacturan en la lnea
n = 1000
p = P (un producto sea defectuoso) = 0,35
q = P (un producto no sea defectuoso) = 1- p = 0,65

x
= np = 1000(0,35) = 350
x
= npq = 1000(0,35)(0,65) = 15,0831
a.

( )
( ) ( ) 354-1/ 2 354-1/ 2 350
354
15, 0831
np
P X P Z P Z
npq
| |
| |
< < = < =
|
|
|
\ .
\ .
= P(Z < 0,23) = F(0,23) = 0,59095

b.

( )
342, 5 350 363, 5 350
342 364
15, 0831 15, 0831
P X P Z
| |
< < < < =
|
\ .
P(-0,50 < Z < 0,90) = F(0,90) F(0,50) = 0,81594 0,30854 = 0,5074

5.2.4 Distribuciones relacionadas con la normal, distribuciones para
muestras pequeas
La teora de la distribucin normal se desarrolla a partir de tamaos de muestra
suficientemente grandes, generalmente mayores a 30 observaciones y no aplica-
ble a muestras pequeas.
En el laboratorio no podemos permitirnos la libertad de realizar un gran nmero
de observaciones y, por ello, las pruebas de hiptesis estadsticas basadas en la
distribucin normal llevaran al qumico a falsas conclusiones.
El hecho fue reconocido por W. S. Gosset, un qumico irlands que en 1908 publi-
c, bajo el pseudnimo de Student, un trabajo titulado El error probable de una
medida. En parte por consideraciones tericas y en parte por el uso de muestras
Cecilia Ros Varillas
130
aleatorias, obtuvo la distribucin terica del promedio de tamaos de muestra
pequeas (n< 30), ajustada a una distribucin normal.
Cuando queramos hacer inferencia estadstica la distribucin normal aparece de
forma casi inevitable, en Inferencia estadstica se utilizan tambin distribuciones
continuas de probabilidad que son funciones de distribuciones normales, depen-
diendo del problema, podemos encontrar otras (asociadas):
- X
2
(chi o ji- cuadrado)
- t- student
- F-Snedecor
Estas distribuciones resultan directamente de operar con distribuciones norma-
les. Tpicamente aparecen como distribuciones de ciertos estadsticos como la
media muestral, o la varianza, que son variables aleatorias normales o funciones
de variables aleatorias normales.
5.2.4.1 Distribucin X
2
(Chi-cuadrado)
Tiene un slo parmetro denominado grados de libertad.
La funcin de densidad es asimtrica positiva. Slo tienen densidad los valores
positivos.
La funcin de densidad se hace ms simtrica incluso casi gaussiana cuando au-
menta el nmero de grados de libertad.
Normalmente consideraremos anmalos aquellos valores de la variable de la
cola de la derecha.
Decimos que una variable aleatoria tiene distribucin chi-cuadrado con v = (n-1)
grados de libertad, cuando sigue la misma distribucin que la suma de n varia-
bles aleatorias normales (0,1) elevadas al cuadrado, independientes.
2 2
1
n
i
i
Z
=
=

La funcin de probabilidad es la siguiente:


2
2 1
2 2
1
2
( ) 0
2
v
v
x
f x x e x
v


| |
|
\ .
=
| |

|
\ .
E(X)= v y V(X)= 2v
Estadstica y diseo de experimentos
131
Su funcin de distribucin depende de los grados de libertad (g.l.)
Para el clculo de probabilidades se usa la siguiente expresin:
2
2 2
( 1) . .
2
( 1)
~
n g l
X
n S

o

=
Figura 5.7. Distribucin Chi-Cuadrado
Grados de libertad
Los grados de libertad pueden ser interpretados como el nmero de valores de la
muestra que pueden ser fijados arbitrariamente y su cuantificacin depende del
nmero de variables o del tamao de la muestra .Una muestra de tamao n tiene
(n 1) grados de libertad, si hay restricciones los niveles de libertad se reducen.
Para tamaos grandes de la muestra la distribucin chi-cuadrado puede aproxi-
marse a una normal estndar (Z).
5.2.4.2 Distribucin T-student
Dadas dos variables aleatorias independientes; una Z ~ N (0,1) y otra X
2
con
(n 1), grados de libertad, generamos una nueva variable aleatoria llamada t-
student donde:
2
~ ( -1) . .
1
x
x
x Z
t n T n g l
S
n

| |

= =
|
\ .

Que sigue una distribucin t de Student con v = (n -1) grados de libertad, la fun-
cin de probabilidad es:
0
0.05
0.1
0.15
0.2
0.001 2 4 6 8 10 12 14 16
Distribucin Chi Cuadrado
Cecilia Ros Varillas
132
1
2
2
1
1 2
( )

1
2
n
n
f x
n
n x
n

+
| |
+ | | |

|
|
\ .
=
|
| |
|
| |
|
| +
\ . |
|
\ . \ .
Propiedades de la distribucin T-student
1. Cada curva t tiene forma de campana con media igual a 0 y varianza v/(v-2).
2. Tiene un parmetro denominado grados de libertad.
3. Cuando aumentan los grados de libertad, ms se acerca a la curva normal
estndar N(0,1).
4. Es simtrica con respecto al cero.
5. Se consideran valores anmalos los que se alejan de cero (positivos o negativos).
Figura 5.8. Distribucin T
Ejemplo:
Usando las tablas estadsticas del Anexo 1.
Si n=12, se tiene 11gl, luego, las tablas de t tienen la forma: F(t) = P(T t), as te-
nemos:
P(T 1,796) = 0,95 P(T 2,201) = P(T 2,201) = 0,975
P(T 0,876) = P(T 0,876) = 1 P(T < 0,876) = 1 0,8 = 0,2
5.2.4.3 Distribucin F de Fisher-Snedecor
La variable aleatoria F, se define como el cociente de dos variables aleatorias
independientes con distribucin ji-cuadrado divididas por sus correspondientes
grados de libertad.
0
0.05
0.1
0.15
0.2
0.25
0.3
0.35
0.4
0.45
-3 -2.7-2.4-2.1-1.8-1.5-1.2-0.9-0.6-0.3 0 0.3 0.6 0.9 1.2 1.5 1.8 2.1 2.4 2.7 3
Distribucin T
Estadstica y diseo de experimentos
133
2
1 1
1 2
2
2 2
( 1)
( 1; 1)
( 1)
n
F n n
n

Entonces F(n
1
1; n
2
1) sigue una distribucin F con (n
1
1) y (n
2
1) g.l
- La funcin de densidad depende de dos parmetros (n
1
1) y (n
2
1) que son
los grados de libertad del numerador y denominador respectivamente.
- Slo toma valores positivos. Es asimtrica a la derecha.
- Normalmente se consideran valores anmalos los de la cola de la derecha.
- Distribucin asociada a la normal.
- Se usa en las tcnicas del anlisis de la varianza y del diseo de experimentos.
0
0.2
0.4
0.6
0.8
1
0 1 2 3 4 5
Distribucin F
g/1 = 5; g/2 = 6
0 1 2 3 4 5
Figura 5.9. Distribucin F
5.3 EJERCICIOS DESARROLLADOS
Ejercicio 1
Una prueba contiene 10 preguntas y cada una de ellas 5 respuestas de las cuales 1
es la correcta. Si un estudiante desconoca las respuestas y contest al azar todas
las preguntas. Hallar la probabilidad:
a. De que conteste por lo menos tres preguntas correctas
b. De que conteste a lo ms cuatro preguntas correctas.
c. Que conteste ms de cinco pero a lo ms ocho preguntas correctas.
d. Cuntas respuestas correctas espera contestar?
Solucin
X: nmero de respuestas correctas en las 10 preguntas contestadas
xito: respuesta correcta
P(xito) = p = 1/5 P(fracaso) = 1- p = q = 4/5, entonces X ~ Binomial (n=10, p=1/5)
gl.1 = 5; gl.2 = 6
Cecilia Ros Varillas
134
La funcin de probabilidad es la siguiente:
10
( ) (1/ 5) (4 / 5) 0,1, 2,......;10
x n x
P X x x
x

| |
= = =
|
\ .
a. P(X 3) = 1 P(X < 3) = 1 [p(0) + p(1) + p(2)]

0 10 1 9 2 8
10 10 10
1 (1/ 5) (4 / 5) (1/ 5) (4 / 5) (1/ 5) (4 / 5) 0, 3222
0 1 2
( | | | | | |
= + + =
( | | |
\ . \ . \ .
b. P(X 4) = p(0) + p(1) + p(2) + p(3) + p(4)
Con tablas: P(X 4) = 1 P(X > 4) = 1 P(X 5) = 1 0,033
c. P(5 < X 8) = P(X 6) P(X 9) = 0,006 0
+
0,006
0
+
(Nmero positivo muy cercano a 0)
d. E(X) = np = 10 ( 1/5) = 2
Al marcar aleatoriamente las respuestas, espera que slo 2 respuestas sean
correctas.
Ejercicio 2
Los mensajes que llegan a una computadora utilizada como servidor lo hacen
con una tasa promedio de 10 mensajes por hora.
a. Cul es la probabilidad de que en 24 minutos lleguen por lo menos 3 y no ms
de 7 mensajes?
b. Determine el intervalo de tiempo necesario para que la probabilidad de que no
llegue mensaje alguno durante ese lapso sea 0,90.
Solucin
X: Nmero de mensajes que llegan a una computadora utilizada como servidor.
= 10 mensajes por hora
a.

1
10
60
=
minutos
24
minutos
4 =

mensajes en 24 minutos
P(3 X 7) = P(X 7) P(X 2)
= 0,949 0,238 = 0,711
b. X ~ Poisson (
2
)

2
2
0
2
2
( 0) 0, 90 0,105360
0!
e
P X e

= = = = =
Pero
2
= 10t => t = 0,010 horas (cada 0,010 horas no llega mensaje alguno)
Estadstica y diseo de experimentos
135
Ejercicio 3
El nmero promedio de clientes que llegan a un banco es 12 cada 10 minutos. Si
se considera que el nmero X de clientes llegan en intervalos de 10 minutos tiene
el modelo de Poisson.
a. Cul es la probabilidad de que entre las 9 a.m. y las 9:10 a.m. lleguen a lo ms
ocho clientes?
b. Cul es la probabilidad de que entre las 9 a.m. y las 9:05 a.m. lleguen ms de
tres clientes?
Solucin
X : Nmero de clientes que llegan cada 10 minutos
= 12 clientes cada 10 minutos
a. P(x 8) = 0,155 ( = 12)
b. P(x > 3) = 1 P(x 3) ( = 6)
= 1 0,151
= 0,849
Ejercicio 4
Una mquina fabrica una determinada pieza y se sabe que produce un 7 por 1000
de piezas defectuosas. Hallar la probabilidad de que al examinar 80 piezas slo
haya dos piezas defectuosas.
Solucin
X: nmero de piezas defectuosas en las 80 piezas analizadas.
xito: pieza defectuosa
P(xito) = p = 0.007 n= 80
Como n es grande y p es muy pequeo entonces la distribucin Binomial se
aproxima a Poisson, donde = np = 80(0,007) = 0,56 por lo tanto la probabilidad
pedida es:
P(X=2) =
e
-0,56
(0,56)
2
= 0,08957

0!
Ejercicio 5
Se supone que en un proceso de fabricacin de botellas de vidrio es ideal que
el porcentaje de defectuosas sea pequeo. Para comprobar si se mantiene con el
tiempo esa calidad se extrae una muestra de tamao n cada cierto tiempo. Si en
una de estas muestras se encuentra por lo menos una defectuosa el proceso se de-
Cecilia Ros Varillas
136
tiene. Si el proceso pasara a producir el 5% de defectuosas el fabricante deseara
que este cambio se notara con probabilidad igual a 0,95, Cul debe ser el valor
de n para que se cumplan los deseos del fabricante?
Solucin
P(X 1) = 0,95 p = 0,05 (pequeo)
X ~ B(n,p) X ~ Poisson( = 0,05n)
P(X 1) = 0,95 1 P(X 0) = 0,95
P(X = 0) = 0,05
e
-0,05n
. (0,05n)
0

= 0,05 e
-0,05n
= 0,05 => n = 59,9146 60
0!

Ejercicio 6
Supngase que la resistencia a romperse de un gnero de algodn (en onzas) se
distribuye normalmente con una desviacin estndar de 3 onzas; se sabe que el
19,766% de estos gneros tiene una resistencia no menor de 160 onzas Cul es la
resistencia media a la ruptura?
Solucin
Sea X: resistencia a la ruptura de un gnero de algodn
De los datos: X ~ N(
x
; 3
2
)
P(X 160) = 0,19766
Estandarizando:
160 160
P P Z
3 3
X X X
X
X
o
| | | |
= =
| |
\ .
\ .
160 160 160
1 1 0,19766 0, 80234
3 3 3
X X X
P Z F F
| | | | | |
= < = = =
| | |
\ . \ . \ .
De la tabla:
160
x
= 0,85 =>
x
= 157,45 onzas
3
Ejercicio 7
Los promedios de un curso de la UNI se distribuyen normalmente con una media
de 7 puntos. Si el 6,681% de los alumnos tienen nota aprobatoria, Cunto debe
aumentarse en promedio a cada uno para conseguir un 45% de aprobados?
Estadstica y diseo de experimentos
137
Solucin
X ~ N(7,
2
)

x
P (x 10) = 0,06681
P(Z <
10 7
)

= 0,93319
P (x < 10) = 0,93319

de la tabla:
3
= 1,5

=> = 2

Entonces: X ~ N(7, 2
2
)
Y = X + a donde a: es lo que debe aumentarse a c/u
y
= u
x
+ u
a
P (Y 10) = 0,45
P (Y < 10) = 0,55
10 (7 )
( ) 0, 55
2
a
P Z
+
< =
3
0,13 2, 74
2
a
a


Debera aumentarse a cada uno 2,74 puntos en promedio.
Ejercicio 8
La resistencia elctrica media de unas piezas metlicas es de 503 ohmios y su
varianza es de 100 ohmios
2
. Suponiendo que su distribucin es normal, calcular:
a. Los lmites de resistencia entre los cuales se encontrarn el 99%.
b. Si no se conociera la varianza. Cul sera su valor para que con tolerancias de
50310 las defectuosas no sobrepasen el tres por mil?
Solucin
a. De los datos:
u
x
= 503
x
= 100 X ~ N(503,100)

0,99
0,005
-Zo
0,005
Zo =2,58
2
Cecilia Ros Varillas
138
P(a < X < b) = 0,99
P(-Z
0
< Z < Z
0
) = 0,99

0
503
2, 58 528, 8
10
b
Z b

= = =

0
503
2, 58 477, 2
10
a
Z a

= = =
Entonces, los lmites de resistencia entre los cuales se encontrarn el 99%,
son: a = 477,2 y b = 528,8
b.Clculo de la nueva varianza:
P(503 10 < X < 503 + 10) = 0,997

493 503 513 503
( ) 0, 997 P Z
o o

< < =

10 10
( ) 0, 997 P Z
o o

< < =
0,997
0,0015
0,0015
10
o

10
o
De acuerdo a tabla:

10
2, 96 3, 3778378 ohmios
x
x
o
o
= =

2
= 11,4134

La nueva varianza es de
2
= 11,4134ohmios
2
Ejercicio 9
Una panadera vende cierto tipo de pastel, tal que con probabilidad de 0,52 con-
tiene por lo menos 30 pasas. Dicho pastel si contiene menos de 30 pasas se le
considera No apto para la venta. Si en un pedido de 100 de estos pasteles hay a
Estadstica y diseo de experimentos
139
lo ms 32 pasteles No apto para la venta, Cul es la probabilidad de que hayan
por lo menos 29 pasteles No apto para la venta?
Solucin
X: Nmero de pasteles no aptos para la venta (contiene menos de 30 pasas)
p = 0,48 n = 100
X ~ Binomial (n = 100 ; p = 0,48) X ~ Normal (48 ; 24,96)
(29 32) (28, 5 32, 5)
( 29 / 32)
( 32) ( 32, 5)
P X P X
P X X
P X P X

= =

Donde:
( )
28, 5 48 32, 5 48
(28, 5 32, 5) 3, 9 3,10
24, 96 24, 96
P X P Z P Z
| |

= =
|
\ .
= F(3,10) F(3,9) = 0,00097 0,00005 0,00092
( )
32, 5 48
( 32, 5) 3,10 0, 00097
24, 96
P X P Z P Z
| |

= = =
|
\ .
Entonces:
0, 00092
( 29 / 32) 0, 948454
0, 00097
P X X
Ejercicio 10
Se sabe que cierto virus ha invadido la UNI y ataca a la mitad de los estudiantes.
Se toma una muestra aleatoria de 200 estudiantes y se pide calcular la probabili-
dad que en dicha muestra a lo ms el 49% sean atacadas por el virus.
Solucin
X: Nmero de estudiantes atacados por el virus.
p: Probabilidad de xito de X.
n = 200 p = 0,5 X ~Bin(n,p) u = np = 100
2
= npq = 50
49
(
100
P X 200 ) ( 98) P X =

Aproximacin de la Binomial a la Normal
Usando el factor de correccin:
Cecilia Ros Varillas
140
98, 5 100
( 98) ( 98, 5) ( ) ( 0, 21) 0, 41683
50
P X P X P Z P Z


Existe una probabilidad de 0,41683 que a lo ms 98 alumnos de la muestra de 200
sean atacados.
Ejercicio 11
Si el 52% de las nubes impregnadas con yoduro de plata muestran un crecimien-
to espectacular. Cul es la probabilidad de que entre 40 nubes impregnadas de
yoduro de plata, a lo ms 18 muestren un crecimiento espectacular?
Solucin
Sea X: nmero de nubes impregnadas con yoduro de plata que muestran un
crecimiento espectacular
Con los datos: p = 0,52 n = 40 como n es grande (n > 30), X se aproxima a la Normal.
np npq
Entonces: X ~ Bin X ~ N(20,8 ; 9,984)
Se pide: P(X 18)
1
( 18) ( 18 ) ( 18, 5)
2
P X P X P X +
18, 5 20, 8
( 0, 73) 0, 23270
9, 984
P Z P Z
| |

= = =
|
\ .
Existe una probabilidad de 0,2327 de que a lo ms 18 nubes muestren un creci-
miento espectacular.
5.4 EJERCICIOS PROPUESTOS
Ejercicio 1
Una prueba de laboratorio para detectar el peso (g) de cierta muestra qumica
tiene un 52% de precisin. Si se analizan 20 muestras en un mes, cul es la pro-
babilidad de que
a. A lo mucho 16 estn correctamente evaluadas?
b. Ms de 12 pero menos de 18 estn correctamente evaluadas?
c. Exactamente 15 estn correctamente evaluadas?
{ {
Estadstica y diseo de experimentos
141
Ejercicio 2
Un laboratorio afirma que una droga causa de efectos secundarios en una pro-
porcin de 3 de cada 100 pacientes. Para contrastar esta afirmacin, otro labora-
torio elige al azar a 5 pacientes a los que aplica la droga. Cul es la probabilidad
de los siguientes eventos?
a. Ningn paciente tenga efectos secundarios.
b. Al menos dos tengan efectos secundarios.
Ejercicio 3
Un lote contiene 40 piezas de un proveedor de tubera local y 30 unidades de un
proveedor de tubera del estado vecino. Si se seleccionan cuatro piezas al azar y
sin reemplazo:
a. Cul es la probabilidad de que dos o ms piezas de la muestra sean del
proveedor local?
b. Cul es la probabilidad de que al menos una pieza de la muestra sea del
proveedor local?
Ejercicio 4
Una compaa de productos qumicos elimina sus residuos en un ro situado en
la vecindad de su ubicacin. Para verificar el grado de contaminacin creado por
estos residuos desea obtener algunas estimaciones. Suponga que los residuos de
contaminante tienen una distribucin normal con media de 1,7 gramos por litro
(g/l) y desviacin estndar de 0,223 gramos por litro (g/l) Cul es la probabilidad
que los residuos del contaminante:
a. Sean mayores de 1,72?
b. Entre 1,46 y 1,88?
c. Inferiores de 2,05?
Ejercicio 5
Se realiza un experimento para comparar la efectividad de un compuesto qu-
mico en producir resistencia en porcentaje de humedad en productos textiles.
Suponga que las medidas de resistencia a la humedad tienen una distribucin
normal con media de 11,9 y varianza 1,21. Qu porcentaje de las medidas de
resistencia a la humedad es menor que 11,8?
Ejercicio 6
Un fabricante de medicamentos sostiene que cierto medicamento cura una en-
fermedad de la sangre en promedio el 80% de los casos. Para verificar esta afir-
Cecilia Ros Varillas
142
macin, inspectores de gobierno utilizan el medicamento en una muestra de 100
individuos y deciden aceptar la afirmacin si 75 o ms se curan
a. Cul es la probabilidad de que el gobierno acepte la afirmacin?
b. Cul es la probabilidad de que el gobierno rechace la afirmacin si en realidad
la probabilidad de curarse es de 0,70?
Ejercicio 7
Por anlisis anteriores se sabe que la resistencia a la ruptura (onzas) de una fi-
bra de camo, se distribuye normalmente y adems existe una posibilidad de
76,115% de que la resistencia sea no menor de 14 onzas y un 85,543% de posibi-
lidad de que la resistencia tenga a lo ms 16,5 onzas, se pide:
a. Calcular la resistencia media y la desviacin estndar de dicha variable.
b. Calcular P(13 < X < 15,5).
c. Calcular la probabilidad de que la resistencia difiera de su media en por lo
menos 1,5.
Ejercicio 8
El peso de las unidades de cierta sustancia qumica se distribuye normalmente
con media u
x

y varianza
x
. Si este peso es tal que el 93,056 % es no mayor que 12
g. y el 93,319 % excede a 8 g.
Calcular la probabilidad de que los pesos de estos productos se encuentren com-
prendidos en el intervalo < 10; 11,5 >.
Ejercicio 9
Sea X una variable aleatoria que representa el peso (kg) de una pieza de acero,
la experiencia dice que dicha variable se distribuye normalmente, y es tal que el
2,275% de las piezas pesan menos de 6 kg y el 84,134% pesan no menos de 8 kg.
Calcule:
a. La media y la desviacin estndar de los pesos.
b. La probabilidad de que el peso de las piezas sea de por lo menos 3,5 y a lo ms
7 kg.
c. La probabilidad de que los pesos difieran de la media en por lo menos 0,5 kg.
2
Estadstica y diseo de experimentos
143
A menudo necesitamos estudiar las propiedades de una determinada poblacin,
pero nos encontramos con el inconveniente de que es demasiado numerosa como
para analizar a todos los individuos que la componen. Por tal motivo, recurrimos
a extraer una muestra de la misma y a utilizar la informacin obtenida para hacer
inferencias sobre toda la poblacin. La muestra debe ser aleatoria, para que sea
representativa de la poblacin.
Consideremos todas las posibles muestras que pueden extraerse de una pobla-
cin dada. Para cada muestra se puede calcular un estadstico, tal como la media,
la desviacin estndar, la varianza, que variar de una muestra a otra. De esta
forma se obtiene una distribucin del estadstico que se conoce como distribu-
cin muestral o distribuciones en el muestreo.
En este captulo, se tratar el estudio de las distribuciones muestrales de los prin-
cipales estadsticos: media muestral, varianza muestral y diferencia de medias
muestrales.
6.1 DEFINICIONES BSICAS
6.1.1 Distribucin muestral
La distribucin muestral de un estimador es la distribucin de probabilidades
de todos los posibles valores de un estimador que se pueden obtener extrayendo
infinitas muestras aleatorias de tamao n de la poblacin.
Entonces, la distribucin muestral se genera extrayendo todas las posibles mues-
tras del mismo tamao de la poblacin y calculndoles su estadstico.
6.1.2 Muestra aleatoria
Se dice que x
1
, x
2
,..., x
n
es una muestra aleatoria de tamao n si cumple las siguien-
tes condiciones:
Muestreo aleatorio y distribuciones
en el muestreo
CAPTULO 6
Cecilia Ros Varillas
144
- Cada x
i
tiene la misma distribucin que la poblacin respectiva.
- Los x
i
son mutuamente independientes.
Una forma de asegurarnos que el subconjunto escogido es representativo de
toda la poblacin consiste en tomar una muestra aleatoria simple, en la cual cada
miembro de la poblacin tiene la misma probabilidad de ser elegido.
As, el muestreo es una tcnica que utilizaremos para inferir algo respecto de una
poblacin mediante la seleccin de una muestra de esa poblacin.
6.1.3 Error en el muestreo
Tras entender la importancia de escoger una muestra representativa de la pobla-
cin, veamos que para lograr esto podemos seleccionar, por ejemplo, una mues-
tra aleatoria simple de la poblacin, pero es muy improbable que la media de la
muestra sea idntica a la media de la poblacin.
De la misma manera, tal vez otra medicin que se calcule con base en la muestra
no sea igual al valor correspondiente de la poblacin, a dicha diferencia se la co-
noce como error de muestreo.
6.2 DISTRIBUCIN DE LA MEDIA MUESTRAL
Si la poblacin de la que se extraen las muestras es normal, la distribucin mues-
tral de medias ser normal sin importar el tamao de la muestra.
6.2.1 Teorema 1.- La media y la varianza de las medias muestrales
Se extraen muestras aleatorias de tamao n de una poblacin infinita con media
poblacional x y varianza
x
:
La media de las medias muestrales es igual a la media poblacional. Es decir,

x
=
x
La varianza de las medias muestrales es igual a la varianza poblacional dividida
por n. En consecuencia la desviacin estndar de las medias muestrales (llamada
tambin el error estndar de la media muestral), es igual a la desviacin estndar
poblacional dividida por la raz cuadrada de n. Es decir:
2
2
error estndar de la media muestral
X X
x x
n n
o o
o o = =

error estndar de la media muestral
Nota. Si la poblacin fuera finita de tamao N, se aplica el factor de correccin:
1
N n
N


al error estndar de la media muestral.
2
Estadstica y diseo de experimentos
145
Demostracin
( ) ( )
1
1
1 1
( )
n
i n
i
i x x
x
i
x
E X E E x n
n n n

=
=
| |
|
| = = = = =
|
|
\ .

( )
2
2 2 1
2
1
( )
n
i
i x
x x
x
V X V n
n n n
o
o o
=
| |
|
| = = = =
|
|
\ .

6.2.2 Teorema 2.- Distribucin de la media muestral cuando la


poblacin es normal
Si la poblacin de la que se extraen las muestras es normal, la distribucin mues-
tral de medias ser normal sin importar el tamao de la muestra.
Sea X una variable aleatoria que sigue una distribucin normal X ~ N(
x
,
x
)

y
sea X la media muestral de una muestra aleatoria de cualquier tamao n (n 2)
extrada de la poblacin X, entonces:
( )
2
2
~ , ~ ,
x
x x x
X N X N
n
o
o
| |

|
\ .
Observacin:
Como

2
~ ,
x
x
X N
n
o

| |
|
\ .

entonces para el clculo de probabilidades se debe es-
tandarizar:
2
~ (0,1)
x x x
x
x
x
x x x
Z n N
n
n

o
o
o
| |
= = =
|
\ .
6.2.3 Teorema 3.- Teorema del lmite central
De una poblacin infinita con media
X
y varianza
X
se extraen muestras aleato-
rias de tamao n, entonces la media muestral X se comporta aproximadamente
como una variable aleatoria normal con media igual a la media poblacional y con
varianza igual a la varianza poblacional dividida por el tamao de la muestra,
siempre que n sea grande.
2
2
Cecilia Ros Varillas
146
Esto es: Sea X una variable aleatoria con distribucin desconocida o diferente
de la Normal, de parmetros
X
y
X
, y sea X la media muestral de una muestra
aleatoria tamao n (n > 30), entonces:
2
30 ~ ,
X
X
Si n X N
n
o

| |
>>>
|
\ .
Mientras ms grande sea la muestra la aproximacin es mejor.
6.3 DISTRIBUCIONES MUESTRALES DE LOS ESTIMADORES
Uno de los objetivos de la estadstica es saber acerca del comportamiento de pa-
rmetros poblacionales tales como: la media (
X
), la varianza (
X
) o la diferencia
de medias (
1

2
).
Se extrae una muestra aleatoria de la poblacin y se calcula el valor de un esta-
dstico correspondiente, por ejemplo, la media muestral (
X
), la varianza mues-
tral (S
x
) o la diferencia de medias muestrales (X
1


X
2
). El valor del estadstico es
aleatorio porque depende de los elementos elegidos en la muestra seleccionada.
Y, por lo tanto, el estadstico tiene una distribucin de probabilidad la cual es
llamada la distribucin muestral del estadstico.
6.3.1 Distribucin de la media muestral cuando la varianza
poblacional
X
es conocida
Si X ~ N (
x ;

x
) y n 2 o si X cualquier distribucin y n 30
2
;
entonces: ~
x
x
X N
n
o

| |
|
\ .
-
~ (0;1)
x
x
X
Z N
n

o
=
Ejemplo:
Una compaa vende insumos qumicos, y se hace entrega de pedidos a cada em-
presa que lo solicita. El tiempo de demora en la entrega tiene distribucin normal
con promedio de 25 minutos y desviacin estndar 7 minutos Cuntos pedidos
de insumos qumicos se deben atender, para tener un tiempo promedio de entre-
ga de insumos a lo ms de 30 minutos, con una probabilidad de 0,98?
Solucin
2
2
2
2
2
Estadstica y diseo de experimentos
147
Sea X: tiempo de demora (minutos) en la entrega de pedidos de insumos qumicos
Se conoce que: X ~ N(25;7
2
) y que:
Como la varianza poblacional es conocida, entonces, para el clculo de probabi-
lidades se usa:
-

x
x
X
Z
n

o
=
Se pide: P(X 30)

y para calcularlo se procede a la estandarizacin:
30 25 30 25
( 30) 0, 98
7 7
P X P Z F
n n
| | | |

| |
= = =
| |
| |
\ . \ .
De la tabla de Z acumulativa:
2,05
0, 98
0, 02
5
2, 05 8, 2369
7
8
n n
n

Se debe atender aproximadamente 8 pedidos de insumos qumicos, para tener un


tiempo promedio de entrega de insumos a lo ms de 30 minutos.
6.3.2 Distribucin de la media muestral cuando la varianza
poblacional
x
no es conocida
Si X ~ N(
x
;
x
) y n < 30, adems se conoce la varianza muestral
( -1) . .
-
entonces: ~
x
n g l
x
X
t t
S
n

=
Nota. Si
x
no es conocida y n > 30, S
2
se aproxima a
2
entonces se puede usar Z.
2
7
~ 25; X N
n
| |
|
\ .
2
2
2
Cecilia Ros Varillas
148
-
~ (0;1)
x
x
x
Z N
S
n

=
6.3.3 Distribucin de la varianza muestral S
2
Se toma una muestra de tamao n de una poblacin normal con varianza
x

Entonces
2
2 2
( -1) . .
2
( 1)
~
x
n g l
X
n S

o

=
Ejemplo:
El tiempo de atencin de un profesor en la asesora en una facultad, es una varia-
ble aleatoria normal con desviacin estndar de 15 minutos. Este profesor es ob-
servado en la atencin de 25 alumnos seleccionados al azar Qu valor mximo
tomar la desviacin estndar de la muestra con probabilidad 0,98?
Solucin
Sea X: tiempo de atencin de un profesor en la asesora
Con los datos:
= 15 n = 25
Se pide el valor mximo (a) que tomar la desviacin estndar:
P(S a) = 0,98
2 2
2 2
2 2
( 1) 24
( )
n S a
P S a P
o o
| |
=
|
\ .
Como

2
2
2
( 1) n S

=
2
2
24
0, 98
225
a
P
| |
=
|
\ .
De la tabla acumulativa de X
2
(Ver anexo 3)
2
Estadstica y diseo de experimentos
149
39,3641
0,02
0,98
X
2
(0,98),24gl
= 40,27
2
24
40, 27 19, 43 minutos
225
a
a = =
El valor mximo que puede tomar la desviacin estndar de la muestra de los
tiempos de asesora a los 25 alumnos es de 19,43 minutos.
6.3.4 Distribucin de la diferencia de medias muestrales si
1
y
2

son conocidas
X
1
~ N (
1
;
1
) X
2
~ N (
2
;
2
)
2 2
1 2
1 2
1 2
1 2
( - ) ~ ; X X N
n n
o o

| |
+
|
\ .
1
2 1 2
2 2
1 2
1 2
( ) ( )
~ (0;1)
X X
Z N
n n

o o

=
| |
+
|
\ .
Nota. Tambin si X
1
y X
2
siguen cualquier distribucin, y n
1
30 y n
2
30
6.3.5 Distribucin de la diferencia de medias muestrales si
1
y
2


no son conocidas
X
1
~ N (
1
;
1
) X
2
~ N (
2
;
2
)
2 2
1 2
1 2
1 2
1 2
( - ) ~ ; X X N
n n
o o

| |
+
|
\ .
Muestras pequeas y varianzas muestrales S
1
y S
2
conocidas
Si
1
=

2
:
2 2
2 2
2 2
2 2
2 2
2 2
Cecilia Ros Varillas
150
( )
1 2
1 2 1 2
( 2) . .
- ( )
~
n n g l
X X
t t
Sp

+

=
Donde S
p
es la desviacin estndar de la varianza ponderada S
p
2 2
2 1 1 2 2
1 2 1 2
( 1) ( 1) 1 1
2
p
S n S n
S
n n n n
| || | +
= +
| |
+
\ .\ .
Si
1

2
:
( ) ( )
1 2 1 2
. .
2 2
1 2
1 2
~
G g l
X X
t t
s s
n n

=
| |
+
|
\ .
Donde
2 2
1 2
1 2
2 2
2 2
1 2
1 2
1 2
1 1
s s
n n
G
s s
n n
n n
| |
+
|
\ .
=
| |
| | | |
|
| |
|
\ . \ .
+
|

|
|
\ .
6.4 EJERCICIOS DESARROLLADOS
Ejercicio 1
Si P(a
X
b) = 1 . Determinar , a y b; de modo que la probabilidad de que la
media de una muestra de 100 observaciones difiera de la media verdadera en no
ms de 2 sea de 1 , adems se conoce:
100
2
1
30000
i
i
x
=
=


y S
x
= 100

Solucin
P(a
X
b) = 1 P(
|
X
X
|
2) = 1 n =100 S
x

X
=> Usar Z
2 2
(-2 2) 100 100 1
10 10
X
P X P Z
| |
= =
|
\ .
2
2 2
2
2 2
Estadstica y diseo de experimentos
151
= P(2 Z 2) = F(2) F(2) = 0,9545 = 1
luego = 0,0455
2 2
2
2
30000 100
100 14,1774
1 99
i
x
x nx
x
S x
n


= = =

=> P(2 x
x
2) = P(x 2
x
x + 2)
= P(12,1774
x
16,1774)
a b
Entonces los valores pedidos son:
= 0,0455 a = 12,1774 b = 16,1774
Ejercicio 2
En un laboratorio se est produciendo cierta clase de vacuna donde se mide el
grado de resistencia (%), esta variable sigue una distribucin normal con una
resistencia media de 12%. Para probar dicha efectividad se toma una muestra de
20 personas y se les aplica la vacuna, donde se encontr una desviacin estndar
en la resistencia de 2,5%. Calcular la probabilidad de que el grado de resistencia
promedio de estas 20 personas est comprendido en <11,8; 12,4> (%).
Solucin

2
No se conoce
X ~ N(12;
2
) X ~ N(12;

2
) n < 30 Usar t-student

20
n = 20 S = 2,5 P(11,8 < X < 12,4)
11, 8 12 12,4-12
P 20 < 20 ( 0,3578< t <0,7155)
2, 5 2,5
t P
| |
< =
|
\ .
Interpolando, en la tabla de t-student con 19 g.l.
t P(Tt)
0,688
0,7155
0,861
0,75
p
0
0,8

{ {
0
0
0, 861 0, 688 0, 7155 0, 688
0, 75795
0, 80 0, 75 0, 75
p
p

= =

Cecilia Ros Varillas
152
t P(Tt)
0
0,3578
0,688
0,5
p
1
0,75

= F(0,7155) F(0,3578)
= 0,75795 0,3700 0,38795
La probabilidad de que el grado de resistencia est comprendido en el intervalo
dado es de 0,38795.
Ejercicio 3
La densidad de un lquido orgnico (en g/cm3) es una variable aleatoria con dis-
tribucin desconocida, sin embargo se conoce que la media general es de 0,9130
g/cm3 y la desviacin estndar es de 9,65978x10
-4
, se realizan cincuenta deter-
minaciones de la densidad del lquido orgnico (en g/cm3) y se desea calcular la
probabilidad de que el promedio de las cincuenta mediciones de la densidad sea
a lo ms 0,9132 g/cm3
Solucin
Sea X: densidad de un lquido orgnico (en g/cm
3
)
Se conocen los parmetros
x
= 0,9130 g/cm
3
y
x
= 9,65978 x 10
-4
g/cm
3
, y sea X la
media muestral de las 50 determinaciones (n > 30), entonces:
Por el teorema del lmite central
2
Como 30 ~ ,
X
X
n X N
n
o

| |
>>>
|
\ .
( )
2
4
9, 65978 10
~ 0, 9130 ,
50
X N

| |

|
|
\ .
Se pide: P(X 0,9132) => estandarizando:
( )
4
0, 9132 0, 9130
1, 46
9, 65978 10
50
X
X
X
P P Z
n

o

| |
|

=
|

|
\ .
De la tabla normal estndar acumulativa: F(1,46) = 0,92785
1 1
1
0, 688 0 0, 3578 0
0, 630014 1 0, 36999 0, 37
0, 75 0, 5 0, 5
p p
p

= = =

Estadstica y diseo de experimentos
153
Ejercicio 4
Un qumico analiza dos tcnicas para determinar el punto de fusin del estao,
las mediciones con cada tcnica siguen una distribucin normal con media de
232,26C y 250C y desviaciones estndares de 1,4C y 1,8C respectivamente.
Para estos anlisis realiza 15 mediciones usando la primera tcnica y 12 medi-
ciones con la segunda tcnica, se desea calcular la probabilidad de que la media
de la primera muestra exceda a la media de la segunda muestra en no ms de
12,5C.
Solucin
X
1
~ N(232,26 ; (1,4)
2
) n
1
= 15, X
2
~ N(250 ; 1,8
2
) n
2
= 12
(X
1
X
2
) ~
2 2
1, 4 1, 8
( 17, 74 ; )
15 12
N +
P(X
1
X
2
+ 12,5) > P(X
1
X
2
12,5) = ?
2 2
12, 5 ( 17, 74)
( ) ( 47, 77) 1
1, 4 1, 8
15 12
P Z P Z

=
+
La probabilidad es aproximadamente 1, es decir es casi seguro que la media de la
primera muestra exceda a la media de la segunda muestra en no ms de 12,5C.
Ejercicio 5
Los pesos de los usuarios regulares de un ascensor siguen una distribucin Nor-
mal, con una media de 70 Kg y una desviacin estndar de 10 Kg
a. Qu peso mximo debera soportar el ascensor, de modo que, solo en el 1%
de las ocasiones el peso de 4 personas supere ese peso mximo?
b. Si el ascensor admite como peso mximo 585 kg. Cuntas personas a la vez
pueden entrar al ascensor de manera que, la probabilidad de que el peso no
supere el mximo permitido sea 0,0668?
Solucin
X: Peso (Kg) de usuarios regulares de un ascensor
X ~ N(70,100)
a. Sea Y = x
1
+ x
2
+ x
3
+ x
4
, la suma de los pesos de las cuatro personas.
Cecilia Ros Varillas
154
Calculando
E(Y) = 4 = 4(70) = 280
V(Y) = 4V(X) = 4(100) = 400
Entonces: Y ~N(280,400)
P(x
1
+ x
2
+ x
3
+ x
4
> M) = 0,01
Y
280 280
( ) ( ) 0, 01 ( ) 0, 99
20 20
M M
P Y M P Z P Z

> = > = =
En tablas:
280
2, 33 326, 6
20
M
M

= =
El peso mximo que debera soportar el ascensor, para que cumpla la condicin
dada es de 326,6 Kg.
b. Sea n: nmero de personas que pueden entrar en el ascensor de manera que, la
probabilidad de que el peso no supere el mximo permitido sea 0,0668.
Sea W = x
1
+ x
2
+ ... + x
n
, luego calculamos sus parmetros respectivos:
E(W) = E(x
1
+ ... + x
n
) = 70n
V(W) = V(x
1
+ ... + x
n
) = 100n
Entonces:
P(X 585) = 0,0668
585 70
( ) 0, 0668
100
n
P Z
n

=
En tablas:
585 70
1, 5 9
100
n
n
n

= =

Pueden entrar en el ascensor 9 personas, de tal manera que la probabilidad de
que el peso no supere el mximo permitido sea 0,0668.
{
Estadstica y diseo de experimentos
155
Ejercicio 6
Considere un juego de azar, en donde uno puede ganar 10 dlares o perder 1, 2,
3 4 dlares; cada posibilidad tiene una probabilidad 0,20 Cuntas veces pode-
mos jugar este juego si ha de haber una probabilidad de 0,95 que en el resultado
final, la ganancia prdida promedio por juego est entre -2 y 2 dlares? (asuma
distribucin normal)
X: Ganancia en el juego de azar
x 10 -1 -2 -3 -4
P(x) 0,2 0,2 0,2 0,2 0,2
Solucin
Calculando los parmetros respectivos:

x
= E(x) = 0
V(x) = E(x
2
) E(x)
2
= 26
Entonces: X ~ N(0;26)
P(2 < X < 2) = 0,95
( 2 2) 0, 95
2 2
( ) 0, 95
26 26
P X
P Z
n n
< < =

< < =
2
1, 96
26
n
=
n = 24,9704 25
Ejercicio 7
Se tiene 2 mtodos para medir el volumen de una sustancia qumica: El mtodo
A (con pipeta) y el mtodo B (con probeta), ambos mtodos se distribuyen nor-
malmente con medias de 30 y 38(cm
3
) respectivamente. Se realizan 8 mediciones
con pipeta y se encuentra una desviacin estndar de 2 cm
3
y 10 mediciones con
probeta y se obtiene una desviacin estndar de 2,5 cm
3
. Calcular la probabilidad
de que las medias muestrales de ambos mtodos difieran en no menos de 7 cm
3
.
(Asumir varianzas poblacionales iguales).
Cecilia Ros Varillas
156
Solucin
2 2
1 2
1 2
( ) ~ -8;
8 10
X X N
o o | |
+
|
\ .

1
y
2
desconocidas
1
=
2
=> usar t con Sp
P(|X
1
X
2
| 7) = 1 P(|x
1
x
2
| < 7) = 1 P( 7 < x
1
x
2
< 7)
2 2
2 2 2 1 2
1 2
7 9 1 1
4 (2, 5) 1, 08847
8 10 16
p
S S
S S S
| | + | |
= = = + =
| |
\ .
\ .
7 ( 8) 7 ( 8)
1
p p
P t
S S
| |
+
=
|
|
\ .
= 1 P(0,9187 t 13,7808) = 1 [F(13,7808) F(0,9187)] F(0,9187)
F(13,7808) 1
interpolando para t
16gl
=> F(0,9187) = 0,81303
6.5 EJERCICIOS PROPUESTOS
Ejercicio 1
La v.a. X: Temperatura (F) de cierto compuesto qumico, se distribuye en forma
Normal, Se realizan 9 determinaciones de la temperatura y se sabe que:
P(X 5) = 0,9772 P(X 7) = 0,0668
Donde X es la media de una muestra de las 9 determinaciones efectuadas. Calcular:
a. E(X) y varianza V(X)
b. Probabilidad de que la media muestral difiera de la media poblacional en no
menos de 3,5.
Ejercicio 2
S X: Peso de sobres de caf (g.) se distribuye Normalmente con media
x
y va-
rianza
x
se toma una muestra tamao n = 9, adems:
P(X < 124,05) = 0,91149 P(X > 122,76) = 0,17879
Calcular:
a. La media
x
y varianza
x

b. P (123 < X < 124,20)
2 2 2 2
2
2
Estadstica y diseo de experimentos
157
Ejercicio 3
Se estudian dos tcnicas para comparar el nivel de productividad de frutos de
manzano, se toman dos muestras de 8 y 6 rboles respectivamente. Se asumen
que la productividad de cada tcnica sigue una distribucin normal con medias
de 15 y 17 manzanos respectivamente, y desviaciones estndares poblacionales
de 3,5 y 4,0 manzanos respectivamente. Calcular la probabilidad de que la dife-
rencia de medias muestrales difiera en menos de 2 frutos.
Ejercicio 4
En una planta industrial se realizan emisiones diarias (en toneladas) de xidos
de azufre que estn distribuidas normalmente con una media de 21,8 Tn. De la
emisin de un da, se realizan 20 determinaciones de xidos de azufre, obtenin-
dose una desviacin estndar de 5,4 Tn.. Se desea calcular la probabilidad de que
la emisin promedio de ese da difiera de 2, en por lo menos 20 Tn.
Ejercicio 5
El consumo promedio de gasolina de autos de la marca A es 45 Km/galn. De
manera anloga para autos de marca B es 50 Km/galn. Asumiendo que el con-
sumo de gasolina de ambas marcas esta normalmente distribuido. Se toma una
muestra de 10 autos de la marca A y se obtiene una desviacin estndar de 8 Km/
galn y 12 autos de la marca B y se obtiene una desviacin estndar de 6 Km/
galn Cul es la probabilidad que el consumo promedio de gasolina de los 10
autos de la marca A sea mayor que el consumo promedio de gasolina de los 12
autos de la Marca B?
Cecilia Ros Varillas
158
Estadstica y diseo de experimentos
159
Luego de haber presentado la estadstica descriptiva, se ha estudiado una serie
de procedimientos y tcnicas que permiten un conocimiento descriptivo de las
caractersticas bsicas de una poblacin.
Pero en general, no se puede casi nunca tratar con informacin completa de la
poblacin. Ya sea porque la poblacin a estudiar es muy grande, por motivos
econmicos, falta de personal calificado, etc.; para una mayor rapidez en la reco-
gida y presentacin de los datos, lo que se suele hacer es obtener los datos de una
muestra representativa de la poblacin.
Los resultados experimentales cuantitativos carecen de inters si no van acompa-
ados de una estimacin de los errores ocurridos en su medida. Es muy comn
usar a la media como la estimacin de la cantidad medida y la desviacin estn-
dar como la estimacin de la precisin.
En este captulo se estudiar la estimacin de los parmetros que nos permitan
tener una idea muy prxima a los verdaderos valores que representan a la po-
blacin, como tambin realizar procedimientos para probar hiptesis propuestas
por los investigadores y que se desee analizar.
7.1 DEFINICIN DE LA ESTADSTICA INFERENCIAL
La Estadstica inferencial se ocupa de extender o extrapolar a toda una pobla-
cin, de informaciones obtenidas de una muestra, para la toma de decisiones. As
por ejemplo, cuando se pretende conocer de antemano los resultados de algunas
pruebas en laboratorio, se hacen un grupo de mediciones sobre lo que se desea
analizar. Se trata en este caso, de extrapolar para toda la poblacin, los resultados
derivados de las mediciones. La Estadstica Inferencial nos ayuda en este caso,
cabe mencionar que siempre existir un margen de error en los resultados obte-
nidos.
La Inferencia Estadstica es la parte de la estadstica matemtica que se encarga
del estudio de los mtodos para la obtencin del modelo de probabilidad (forma
funcional y parmetros que determinan la funcin de distribucin) que sigue una
Inferencia estadstica
CAPTULO 7
Cecilia Ros Varillas
160
variable aleatoria de una determinada poblacin, a travs de una muestra (parte
de la poblacin) obtenida de la misma. Es decir, estudia el comportamiento de
una poblacin a partir de una muestra, con cierto grado de incertidumbre. Los
dos problemas fundamentales que estudia la inferencia estadstica son el Pro-
blema de la estimacin y el Problema del contraste o prueba de hiptesis.
Todo nuestro estudio se basa en la normalidad de las distribuciones que emplea-
mos.
7.2 OBJETIVOS DE LA INFERENCIA ESTADSTICA
- Estimar los parmetros de la poblacin como la media poblacional, varianza
poblacional y diferencias de medias poblacionales
- Utilizar distintos tamaos muestrales para controlar la confianza y el error
admitido
- Contrastar los resultados obtenidos a partir de muestras
- Visualizar grficamente, mediante las respectivas curvas normales, las
estimaciones realizadas
Principios Bsicos de estadstica inferencial
- Tamao que ha de tener. Parece evidente, que a mayor tamao, ms se
acercaran los parmetros que calculemos, a los de la poblacin.
- Muestras han de ser representativas.
Cuando no se tienen en cuenta estos dos principios bsicos, las inferencias reali-
zadas son deficientes.
La Inferencia se basa en:
- Estimacin de Parmetros
- Prueba de Hiptesis
7.3 ESTIMACIN DE PARMETROS
Llamaremos as al procedimiento utilizado cuando se quiere conocer las carac-
tersticas de un parmetro poblacional, a partir del conocimiento de la muestra.
En una poblacin cuya distribucin es conocida pero desconocemos algn par-
metro, podemos estimar dicho parmetro a partir de una muestra representativa.
Un estimador es un valor que puede calcularse a partir de los datos muestrales y
que proporciona informacin sobre el valor del parmetro. Por ejemplo, la media
muestral es un estimador de la media poblacional, la varianza observada en la
muestra es un estimador de la varianza de la poblacin.
Estadstica y diseo de experimentos
161
Por ejemplo, si se estudia el peso (Kg) de cierto producto y queremos saber cul
es la verdadera media del peso de dicho producto, mediante una muestra de n=
40 productos. Podemos hacer una primera aproximacin, utilizando la media
muestra; sin embargo, este valor est sesgado debido a que solo representa a una
muestra.
Podramos decir que la media buscada es prxima a 3 Kg., pero cunto de prxi-
ma? Digamos que 200 gramos ms o menos? Esto significara que la media esta-
ra entre 2,8 y 3,2 Kg.. Esto ltimo se denomina estimar por intervalo, y es uno de
los mtodos que ahora vamos a ver.
La estimacin de parmetros puede ser:
- Estimacin puntual
- Estimacin por intervalos
7.3.1 Estimacin puntual
Una estimacin es puntual cuando se obtiene un nico valor para el parmetro.
Los estimadores ms probables en este caso son los estadsticos obtenidos en la
muestra, aunque es necesario cuantificar el riesgo que se asume al considerarlos.
Recordemos que la distribucin muestral indica la distribucin de los valores que
tomar el estimador al seleccionar distintas muestras de la poblacin. Las dos
medidas fundamentales de esta distribucin son la media que indica el valor pro-
medio del estimador y la desviacin estndar, tambin denominada error tpico
de estimacin, que indica la desviacin promedio que podemos esperar entre el
estimador y el valor del parmetro.
Para que un estadstico sea un buen estimador puntual debe ser:
- Consistente, el estimador es consistente cuando al aumentar el tamao de la
muestra la varianza tienda a cero
- Insesgado; el estimador es insesgado, si la esperanza del estimador es igual
a su parmetro respectivo: E() = es el estimador de (Es cercano al valor
verdadero)
- Eficiente, varianza mnima de todos los posibles estimadores insesgados.
- Suficiente; Un estimador es suficiente cuando no da lugar a prdida de
informacin; es decir, cuando la inferencia basada en es tan buena como la
que hiciera uso de toda la muestra.
Ejemplo: = X es un buen estimador puntual del parmetro =
x
, ya que cumple
con las condiciones citadas anteriormente:
2
( ) ( )
X
X
E X V X
n
o
= =
Es la menor varianza.

Cecilia Ros Varillas


162
La estimacin puntual, implica cierto riesgo, ya que con un solo valor se estima al
verdadero parmetro de la poblacin, no es el mtodo ms utilizado para estimar
parmetros, el que ms se aplica es la estimacin por intervalos.
7.3.2 Estimacin por intervalos (Lmites de Confianza)
La estimacin por intervalos resulta til ya que con ella calculamos dos valores
entre los que se encontrar el parmetro, con un nivel de confianza fijado de
antemano.
Llamamos Intervalo de confianza al intervalo que con un cierto nivel de confian-
za, contiene al parmetro que se est estimando.
La tcnica de la estimacin confidencial consiste en asociar a cada muestra un
intervalo que se sospecha que debe contener al parmetro y se le denomina in-
tervalo de confianza, evidentemente esta tcnica no tiene porqu dar siempre un
resultado correcto.
A la probabilidad de que hayamos acertado al decir que el parmetro est con-
tenido en dicho intervalo se la denomina nivel de confianza. Es decir: Nivel de
confianza es la probabilidad de que el intervalo calculado contenga al verdade-
ro valor del parmetro. Se indica por (1 )

y habitualmente se da en porcentaje
(1 ) 100%.
Tambin se denomina nivel de significacin a la probabilidad de equivocarnos: .
Si L
1
y L
2
(son los lmites de confianza), y estimador de , entonces:
P(L
1
L
2
) = 1
Al valor L
1
se le llama lmite inferior de confianza y al valor L
2
se le llama lmite
superior de confianza de dicho intervalo.
7.3.2.1 Intervalo de confianza para la media poblacional
X

Conjunto o rango de valores o intervalo centrado en una media muestral (estima-
dor de
x
), que consiste en calcular L
1
y L
2
(los lmites de confianza).
L
1

X
L
2
: Lmites dentro del cual se espera que est contenida la media pobla-
cin
X
con una probabilidad de confianza de (1 ) o (1 ) 100% denominado
nivel o coeficiente de confianza.
Donde:
(1 ): Nivel de confianza (xito)
: Nivel de significacin (error o fracaso)

Estadstica y diseo de experimentos


163
Para calcular los lmites de confianza se presentan dos casos:
1er. caso. Si la varianza poblacional
X
es conocida
La estimacin para la media poblacional "
X
" por intervalo de confianza cuando

x

es conocida, se realiza utilizando la distribucin normal.
Para estimar
X
, el estadstico que mejor nos va a ayudar es X del que conocemos
su distribucin:
X ~ N (
X
,

x
)

n
Esa distribucin depende de
X
(desconocida). Lo ms conveniente es hacer que
la ley de distribucin no dependa de ningn parmetro desconocido, y como
x

es conocida, estandarizamos:
~ (0,1)
X
X
X
Z N
n

=
De este modo, fijado

0,1 consideramos la variable aleatoria Z ~ N(0,1) y
tomamos un intervalo que contenga una masa de probabilidad de 1 . Este in-
tervalo lo queremos tan pequeo como sea posible. Por ello lo mejor es tomarlo
simtrico con respecto a la media (0), ya que all es donde se acumula ms masa
(vase la figura). As las dos colas de la distribucin (zonas ms alejadas de la
media) se repartirn a partes iguales el resto de la masa de probabilidad,
1
/ 2
Z
1 / 2
Z

/ 2
/ 2
0
Figura 7.1. Intervalo de confianza
Z
/2
y Z
1/2
difieren en el signo
Vamos a precisar cmo calcular el intervalo de confianza:
Sean P(Z z
/2
) = /2 y P(Z z
1 /2
) = 1 /2
Es til considerar en este punto la simetra de la distribucin normal, y observar
que los valores anteriores son los mismos aunque con el signo cambiado:
2
2
2

2
Cecilia Ros Varillas
164
z
/2
= z
1 /2
El intervalo alrededor del origen que contiene la mayor parte de la masa 1 ,
es el intervalo siguiente [z
/2
,z
1 /2
]

lo que habitualmente escribiremos como:

|z| z
1 /2
, es decir:
P(|z| z
1 /2
) = 1
De este modo podemos afirmar que existe una probabilidad de 1 de que al
extraer una muestra aleatoria de la variable en estudio, ocurra:
1 / 2 1 / 2 1 / 2
X X
X
X
X
z z z X z
n
n

o


, de este modo un interva-
lo de confianza al nivel 1 , para la esperanza de una normal de varianza cono-
cida es el comprendido entre los valores:
/ 2 1 / 2
1 / 2 1 / 2
X
X
x X z
n
x X z
n


o
o


=
= +
Es decir:
1 / 2 1 / 2
( ) 1
X X
X
P X z X z
n n

o o


+ =

La forma habitual de escribir este intervalo es:
1 / 2
( )
X
X
LC X z
n


=
A la expresin E, tambin se le conoce como error mximo de estimacin.
1 / 2
X
E z
n

=
Estimacin del tamao muestral
Antes de realizar un estudio de inferencia estadstica sobre una variable, lo pri-
mero es decidir el nmero de elementos, n a elegir en la muestra aleatoria. Para
ello consideremos que el estudio se basa en una variable de distribucin normal,
Estadstica y diseo de experimentos
165
y nos interesa obtener para un nivel de significacin dado, una precisin (error
mximo de estimacin) E .
Para ello, de la frmula anterior:
1 / 2
X
X
X z
n


=

Siendo:
1 / 2
X
E z
n

=

Despejando
2
1 / 2
.
X
z
n
E

| |

|
\ .
2do Caso: Si no se conoce la varianza poblacional
X

Como hemos mencionado, los casos anteriores se presentarn poco en la prc-
tica, ya que lo usual es que sobre una poblacin quizs podamos conocer si se
distribuye normalmente, pero el valor exacto de los parmetros
X
y

X
no son
conocidos. De ah nuestro inters en buscar intervalos de confianza para ellos.
El problema que tenemos en este caso es ms complicado que el anterior, pues
no es tan sencillo eliminar los dos parmetros a la vez. Para ello, cuando n 30 y
se conoce S
2
x
nos vamos a ayudar de la prueba estadstica de t-student siguiente:
( 1) . .
~
X
n g l
X
X
T t
S
n

=
Dado el nivel de confianza 1- buscamos en una tabla de T, el valor de t
(n1)
con
1-/2 de probabilidad. Por simetra de la distribucin de Student se tiene que
t
(n1,1/2) =
t
(n1,/2)
, luego
P(|t| t
(n1,1/2)
) = 1
El intervalo de confianza se obtiene a partir del siguiente clculo:
( 1,1 / 2) ( 1,1 / 2) ( 1,1 / 2)
X X
n n X n
X
X S
t t t X t
S
n
n


2
2
Cecilia Ros Varillas
166
Entonces:

( 1,1 / 2) ( 1,1 / 2)
( ) 1
X X
n X n
S S
P X t X t
n n



+ =
Es decir, el intervalo de confianza al nivel 1 para la esperanza de una distri-
bucin normal cuando sus parmetros son desconocidos es:

( 1,) (1 / 2)
( )
X
X n gl
S
LC X t
n


=
Ejemplo:
Se quiere estimar un intervalo de confianza al nivel de significacin = 0,05
para el volumen promedio
X
correspondientes a las mediciones del volumen
al realizar una investigacin. En principio slo sabemos que la distribucin de
los volmenes (cm
3
.) es una variable aleatoria X de distribucin normal. Para
ello se realizan 25 mediciones del volumen y se obtienen sus estadsticos res-
pectivos: X = 170 cm
3
y S
x
= 10 cm
3
.
Solucin
Como no se conoce
x
, entonces usamos:
( 1,) (1 / 2)
( )
X
X n gl
S
LC X t
n


=

t
(24gl;0,975)
= 2,06
Reemplazando, tenemos.
10
( ) 170 (2, 06) 170 4,12
25
X
LC = = =
P(170 4,12
X
170 + 4,12) = P(165,88
X


174,12) = 1 = 0,95
Con un nivel de confianza del 95% podemos decir que la media poblacional est
en el intervalo siguiente
X
[165,88; 174,12] cm
3
.
Nota. En este 2do. Caso, cuando no se conoce
x
y muestras grandes: (n > 30),
entonces S
X

x
y se puede usar Z.
Estimacin del tamao muestral
En este caso, usamos:
( 1) ,(1 / 2)
( )
X
X n gl
S
LC X t
n


=
2
2
2

Estadstica y diseo de experimentos


167
Siendo:

1
( 1,1 / 2)
X
n
S
E t
n

=

, error de estimacin
Despejando

1
2
( 1,1 / 2
).
n X
t S
n
E

| |

|
\ .
Donde S
X
es la varianza muestral (estimacin de la varianza poblacional). Para
obtenerla, tomamos una muestra piloto que sirve para dar una idea previa de los
parmetros que describen una poblacin.
Ejemplo:
En el ejemplo anterior se ha estudiado la variable volumen (cm
3
) de las mediciones,
considerando que sta es una variable que se distribuye de modo normal. Para
ello se realizaron de 25 mediciones del volumen, que ofreci los siguientes resul-
tados: X = 170 cm
3
y S
x
= 10 cm
3
.
Calcular cuntas mediciones del volumen, se debe realizar para que se obtuviese
un intervalo de confianza para la media poblacional con un nivel de significacin
=0,01 (al 99%) y con una precisin de E = 1 cm
3
.
Solucin
Obsrvese que sobre la muestra piloto, el error cometido al estimar el intervalo
al 95% fue aproximadamente de 4.12cm
3
por lo que si buscamos un intervalo de
confianza tan preciso, el tamao de la muestra, n, deber ser bastante mayor, en-
tonces se debe considerar en este caso S
X

x
, y se obtiene: (con = 0,01).
2 2
1 / 2
. 2, 58 10
665, 64 666
1
X
z
n n n n
E

| | | |

| |
\ . \ .
Por tanto, si queremos realizar la investigacin con toda la precisin requerida
en el enunciado, se debera realizar 666 mediciones del volumen. Esto es una
indicacin de gran utilidad antes de comenzar la investigacin. Una vez que se
haya ejecutado las mediciones, se debe confirmar que el error para el nivel de
significacin dado es inferior o igual a 1 cm
3
, utilizando la muestra obtenida.
7.3.2.2 Intervalo de confianza para la varianza poblacional
X

Para estimar un intervalo de confianza para la varianza poblacional, se usa la
distribucin

:
2
2 2
( 1) . . 2
( 1)
x
n g l
X
n S

o

=
2
2
2
2
2

Cecilia Ros Varillas


168
Consideremos dos valores de esta distribucin que nos dejen una probabilidad
1- en la zona central de la distribucin
( )
( )
2 2
, / 2 1
2 2
, 1 / 2 1
( ) / 2
( ) / 2
gl n
n gl
P
P


< =
> =

Entonces un intervalo de confianza al nivel 1- para la varianza de una distribu-
cin normal (cuyos parmetros desconocemos) lo obtenemos del siguiente modo:
( ) ( ) ( ) ( )
2
2 2 2 2 2
, / 2 , 1 / 2 , / 2 , 1 / 2 1 1 1 1 2
( 1)
x
gl gl gl gl n n n n
X
n S


o



( ) ( )
2 2
2
2 2
, 1 / 2 , / 2 1 1
( 1) ( 1)
x x
X
gl gl n n
n S n S

o




Entonces:

( ) ( )
2 2
2
2 2
, 1 / 2 , / 2 1 1
( 1) ( 1)
P 1
x x
X
gl gl n n
n S n S

o


| |

| =
|
\ .
Por tanto el intervalo que se busca es
( ) ( )
2 2
2
2 2
, 1 / 2 , / 2 1 1
( 1) ( 1)
;
x x
X
gl gl n n
n S n S

o


(

(
(

con una con-
fianza del (1 ) 100%.
Ejemplo:
En el ejemplo anterior se estudiaba el volumen (cm
3
) de las mediciones, consideran-
do que sta es una variable que se distribuye de forma normal y que se realizaron
25 mediciones del volumen, que ofreci los siguientes resultados: X = 170 cm
3
y
S
x
= 10 cm
3
.
Calcule un intervalo de confianza con =0,05 para la varianza
X
del verdadero
volumen de las mediciones realizadas.
Solucin
Para estimar un intervalo de confianza para
X
(varianza poblacional) lo obtene-
mos mediante:
2 2
2 2
24;0,975 24;0,025
(25 1)100 (25 1)100 (25 1)100 (25 1)100
39, 4 12, 4
X X
o o



Entonces:
X
[60,9137;193.5484] (cm
3
)
2

( ) ( )
2 2 2
, / 2 , 1 / 2 1 1
( ) 1
gl gl n n
P



=
2
2

2
Estadstica y diseo de experimentos
169
Por tanto, para el valor poblacional de la desviacin estndar tenemos que

X
[7,80472;13,91217] cm
3
con una confianza del 95%, que por supuesto contie-
ne a la estimacin puntual S
x
= 10 cm
3
calculado sobre la muestra.
7.3.2.3 Intervalos para la diferencia de medias de dos poblaciones
1

2
Consideremos el caso en que tenemos dos poblaciones de modo que el carcter
que estudiamos en ambas (X
1
y X
2
) son variables aleatorias distribuidas segn
leyes normales.
X
1
~ N(
1
;
1
) X
2
~ N(
2
;
2
)
En cada una de estas poblaciones se extrae mediante muestreo aleatorio simple,
muestras que no tienen por qu ser necesariamente del mismo tamao (respec-
tivamente n
1
y n
2
) y sean X
1
y X
2
las medias de estas dos muestras. Como ya
sabemos:
2 2
1 2
1 2 1 2
1 2
~ ( , ) X X N
n n
o o
+
Podemos plantearnos a partir de las muestras el saber qu diferencias existen en-
tre las medias de ambas poblaciones, o por ejemplo estudiar las relaciones exis-
tentes entre sus dispersiones respectivas.
A ello vamos a dedicar los siguientes puntos:
1er. Caso, si las varianzas
1
y
2
son conocidas
Esa ley de distribucin depende de
X
(desconocida). Lo ms conveniente es ha-
cer que la ley de distribucin no dependa de ningn parmetro desconocido, y
como
1
y
2
son conocidas, estandarizamos:
1 2 1 2
2 2
1 2
1 2
( ) ( )
~ (0,1)
X X
Z N
n n

o o

=
+
Siguiendo los mismos pasos, del 1er. Caso para estimar el intervalo de confianza
para
X
, obtenemos en este caso:
2 2
1 2
1 2 1 2 1 / 2
1 2
( ) ( ) LC X X z
n n

o o


= +
2 2
2 2
2 2
Cecilia Ros Varillas
170
2do. Caso, si las varianzas
1
y
2
no son conocidas
En este caso, si las muestras son pequeas, se conocen las varianzas muestrales
S
1
y S
2
y las varianzas poblacionales desconocidas (asumiendo
1
=
2
homoce-
dasticidad), usaremos:
1 2
1 2 1 2
( 2) .
( ) ( )
~
n n g l
X X
T t
Sp

+

=
Donde:

2 2
2 1 1 2 2
1 2 1 2
( 1) ( 1) 1 1
2
p
S n S n
S
n n n n
| || | +
= +
| |
+
\ .\ .
Si 1- es el nivel de confianza con el que deseamos establecer el intervalo para la
diferencia de las dos medias, calculamos el valor t
((n
1
+ n
2
2)gl, 1/2)
. Luego el intervalo
de confianza al nivel 1- para la diferencia de medias de dos poblaciones con la
misma varianza (aunque esta sea desconocida) es:
LC (
1

2
) = (X
1
X
2
) t
((n
1
+ n
2
2)gl, 1/2).
S
p
7.4 PRUEBA O CONTRASTE DE HIPTESIS
Una hiptesis estadstica es una asuncin relativa a una o varias poblaciones, que
puede ser cierta o no. Las pruebas de hiptesis permiten verificar la veracidad de
alguna hiptesis establecida acerca de una poblacin, determinando si los valo-
res difieren significativamente de los esperados por la hiptesis.
Las hiptesis estadsticas se pueden contrastar con la informacin extrada de las
muestras y tanto si se aceptan como si se rechazan puede presentar error.
Por ejemplo. Se realiza Prueba de Hiptesis si se piensa que un mtodo de pro-
duccin nuevo puede tener un porcentaje de rendimiento mayor que otro anti-
guo, o cuando se plantea si los contenidos de cierta sustancia qumica de distin-
tos detergentes vendidos en el mercado nacional son similares.
En esta seccin se presenta las pruebas de hiptesis para los parmetros ms
usuales que fueron citados en la seccin anterior: media, varianza y diferencia
de medias poblacionales, con la asuncin que los datos de partida siguen una
distribucin normal.
En las pruebas de hiptesis se distinguen dos tipos de hiptesis:
Hiptesis nula
Es la hiptesis formulada con intencin de rechazarla y se representa por H
0
, es
la hiptesis que se formula antes de tener informacin de la muestra, general-
mente en base a estudios anteriores o por la experiencia del investigador.
2 2
2 2
2 2
Estadstica y diseo de experimentos
171
Hiptesis alternante
Rechazar H
0
implica aceptar una hiptesis alternativa (H
1
), es la hiptesis que se
formula como alternativa de la nula, despus de tener informacin de la mues-
tra. Normalmente H
1
es la negacin de H
0
, aunque esto no es necesariamente as.
7.4.1 Tipos de errores
La decisin de rechazar o no la hiptesis nula est justificada en la eleccin de
una muestra tomada al azar, y por tanto es posible cometer decisiones errneas.
Los errores que se pueden cometer se clasifican como sigue:
Error de tipo I
Es el error que consiste en rechazar H
0
cuando es cierta. La probabilidad de come-
ter este error es lo que anteriormente se ha denominado nivel de significacin. Es
una costumbre establecida el denotarlo siempre con la letra .
= P (rechazar H
0
| H
0
cierta)
Error de tipo II
Es el error que consiste en no rechazar H
0
cuando es falsa. Se denota con la letra .
= P (aceptar H
0
| H
0
falsa) Potencia =1- = P (rechazar H
0
|H
0
falsa)
La situacin se puede esquematizar:
Cuadro 7.1. Tipos de Errores
H
0
cierta
H
0
falsa
H
1
cierta
H
0
rechazada Error tipo I () Decisin correcta
H
0
no rechazada Decisin correcta Error tipo II ()
7.4.2 Tipos de prueba
Cuando se realiza una prueba o contraste de hiptesis, se presentan los siguien-
tes tipos de prueba que se pueden analizar, y dependiendo de lo que se quiera
probar y su contraste respectivo, slo una de ellas ser la que queda.
H
0
: =
0
H
1
:
0
Prueba de 2 colas (contraste bilateral)
Cecilia Ros Varillas
172
H
0
:
0
H
1
: <
0
Prueba de una cola a la Izquierda (contraste unilateral a la iz-
quierda)
H
0
:
0
H
1
: >
0
Prueba de una cola a la Derecha (contraste unilateral a la de-
recha)
7.4.3 Pasos necesarios para realizar una Prueba de Hiptesis a un
parmetro
Paso 1
Establecer la hiptesis nula en trminos de igualdad y su hiptesis alternativa
respectiva:
H
0
: =
0
H
0
:
0
H
0
:
0
H
1
:
0
H
1
: <
0
H
1
: >
0
La hiptesis nula, en cualquiera de los casos puede ser: H
0
: =
0
Paso 2
Elegir un nivel de significacin: nivel crtico
Paso 3
Suposiciones del Modelo:
Poblaciones Normales
Muestras aleatorias
Paso 4
Elegir un estadstico de prueba o de contraste: Z, T;
2
estadstico cuya distri-
bucin muestral se conozca en H
0
, y establecer en base a dicha distribucin, la
regin crtica: Regin de Rechazo de H
0
(probabilidad ) regin en la que, si el
estadstico cayera en la misma, se rechazara H
0
; y tambin la Regin de Acepta-
cin H
0
(probabilidad de 1-).
Paso 5
Calcular el estadstico para una muestra aleatoria reemplazando el valor pro-
puesto del parmetro (valor calculado) y compararlo con la regin crtica (de
acuerdo a las tablas estadsticas).
Estadstica y diseo de experimentos
173
- La regin de aceptacin de la hiptesis nula es la que corresponde a 1 .
- Si el valor calculado cae en la zona de Aceptacin de H
0

=>
Se acepta la H
0
.
- Si el valor calculado cae en la zona de Rechazo de H
0

=>
Se rechaza H
0
y se
acepta la Alternativa H
1

Obsrvese que, de esta manera, se est ms seguro cuando se rechaza una hip-
tesis que cuando no. Por eso se fija como H
0
lo que se quiere rechazar. Cuando
no se rechaza, no se ha demostrado nada, simplemente no se ha podido rechazar.
Por otro lado, la decisin se toma de acuerdo a la distribucin muestral en H
0
, por
eso es necesario que tenga la igualdad.
Paso 6
Interpretacin, de acuerdo al problema.
Observacin. Para dar una forma homognea a todos los contrastes de hiptesis
es costumbre denominar al valor del estadstico del contraste calculado sobre la
muestra como valor calculado o experimental y a los extremos de la regin crti-
ca, como valores tericos o tabulados.
Estudiaremos Prueba o Contrastes de Hiptesis para:
a. La Media Poblacional (Varianza conocida y Desconocida).
b. La diferencia de Medias Poblacionales (Varianzas Conocidas y Desconocidas)
c. La Varianza Poblacional
d. Prueba de Homogeneidad de Varianzas
7.4.4 Prueba de Hiptesis para los Parmetros
De manera similar a los intervalos de confianza, tambin se presenta las pruebas
de hiptesis para los parmetros como la media poblacional, la diferencia de me-
dias poblacionales, para la varianza poblacional y tambin se presenta la prueba
de homogeneidad de varianzas, que es una prueba necesaria cuando se presen-
tan dos poblaciones con varianzas desconocidas y un paso muy importante es
comprobar que esas varianzas desconocidas sean iguales.
7.4.4.1 Prueba de hiptesis para la media poblacional
X

Suponemos que la poblacin se distribuye normalmente: X ~ N(
X
,
x
), luego para
realizar la prueba de hiptesis se presenta dos casos:
1er. Caso. Si la varianza poblacional
x
es conocida
Las hiptesis respectivas son:
2
2
Cecilia Ros Varillas
174
H
0
: =
0
H
0
:
0
H
0
:
0
H
1
:
0
H
1
: <
0
H
1
: >
0
En cualquiera de los casos la hiptesis nula tambin puede ser: H
0
: =
0 .
El valor del parmetro propuesto se reemplaza en la prueba de Z, y se encuentra
un valor calculado:
0
cal
X
X -
= n
Z

o
| |
|
\ .
Las regiones crticas de una media
X
con varianza conocida, puede ser bilateral
o unilateral (depende de H
1
)
Prueba bilateral: (de 2 colas)
Regin de
Aceptacin
/ 2
Z

0
1 / 2
Z

1 0
: H
Pruebas unilaterales
Regin de
Aceptacin
Z

0
1 0
: H <

Prueba de 1 cola a la izquierda Prueba de 1 cola a la derecha
Figura 7.2. Regiones crticas de una media
X
con varianza conocida
Si Z
cal
R.Aceptacin de H
0
> Aceptar H
0
Si Z
cal
R.Rechazo de H
0
> Rechazar H
0
y

Aceptar H
1
Regin de
Aceptacin
0
1
Z

1 0
: H >

Estadstica y diseo de experimentos


175
2do. Caso. Si la varianza poblacional
X
no es conocida
Las hiptesis respectivas son:
H
0
: =
0
H
0
:
0
H
0
:
0
H
1
:
0
H
1
: <
0
H
1
: >
0
En cualquiera de los casos la hiptesis nula tambin puede ser: H
0
: =
0
El valor del parmetro propuesto se reemplaza, y se encuentra un valor calculado
de t:
0
cal
X
X -
= n
t
S
| |
|
\ .
Las regiones crticas de una media
X
con varianza desconocida, puede ser bila-
teral o unilateral (depende de H
1
) .
Prueba bilateral: (de 2 colas)
Regin de
Aceptacin
/ 2
t

0
1 / 2
t

1 0
: H
Pruebas unilaterales
Regin de
Aceptacin
t

0
1 0
: H <
Prueba de 1 cola a la izquierda Prueba de 1 cola a la derecha
Figura 7.3. Regiones crticas de una media
X
con varianza desconocida
Si t
cal
R.Aceptacin de H
0
> Aceptar H
0
Si t
cal
R.Rechazo de H
0
> Rechazar H
0
y

Aceptar H
1
2
Regin de
Aceptacin
0
1
t

1 0
: H >

Cecilia Ros Varillas


176
7.4.4.2 Prueba de hiptesis para la diferencia de medias poblacionales
1

2
Sean dos poblaciones X
1
y X
2

dos poblaciones, cuyas distribuciones son:
X
1
~ N(
1
;
1
) X
2
~ N(
2
;
2
)
De cada una de ellas se toma una muestra y se calculan sus promedios muestra-
les respectivos X
1
y X
2
, cuya distribucin es la siguiente:
2 2
1 1
1 2 1 2
1 1
~ , X X N
n n
o o

| |
+
|
\ .
Como se analiz en el captulo anterior, aqu tambin tenemos dos casos:
1er. caso, si las varianzas poblacionales
1
y

2
son conocidas
Las hiptesis respectivas son:
H
0
:
1

2
=

H
0
:
1

2


H
0
:
1

2

H
1
:
1

2


H
1
:
1

2
<

H
1
:
1

2
>
En cualquiera de los casos la hiptesis nula tambin puede ser: H
0
:
1

2
=
El valor del parmetro propuesto se reemplaza en el estadstico de prueba (Z), y
se encuentra un valor calculado de Z:
1 2
1 2
( )
cal
2 2
1 2
x - x
Z =
+
n n
o o

2do. caso, si las varianzas poblacionales
1
y

2
no son conocidas
Las hiptesis respectivas son:
H
0
:
1

2
=

H
0
:
1

2


H
0
:
1

2

H
1
:
1

2


H
1
:
1

2
<

H
1
:
1

2
>
En cualquiera de los casos la hiptesis nula tambin puede ser: H
0
:
1

2
=
Antes de reemplazar el valor del parmetro propuesto en el estadstico de prue-
ba, se realiza la Prueba de Homogeneidad de varianzas (la ltima prueba de
hiptesis en esta seccin) y al finalizar, puede ocurrir lo siguiente:
2 2
2 2
2 2
Estadstica y diseo de experimentos
177
a. Si
1
=

2
(Homogeneidad de varianzas)
Si se comprueba que las varianzas desconocidas son iguales, entonces el parme-
tro propuesto se reemplaza en el siguiente estadstico de prueba:

1 2
( )

cal
p
x x
t
S

=
donde: S
p
: varianza ponderada

2 2
1 1 2 2
1 2 1 2
( 1) ( 1) 1 1
2
p
n s n S
S
n n n n
| || | +
= +
| |
+
\ .\ .

Desviacin estndar ponderada
Los valores tabulados para ubicarlos en las regiones crticas se buscan en la tabla
de T
(n
1
+ n
2
2)gl

b. Si
1

2
Si se comprueba que las varianzas desconocidas son diferentes, entonces el par-
metro propuesto se reemplaza en el siguiente estadstico de prueba:
( )
1 2
2 2
1 2
1 2
cal
x x
t
S S
n n

=
+
Los valores tabulados para ubicarlos en las regiones crticas se buscan en la tabla
de t(G)g.l donde:
2 2
1 2
1 2
2 2
2 2
1 2
1 2
1 2
1 1
S S
n n
G
S S
n n
n n
| |
+
|
\ .
=
| |
| | | |
|
| |
|
\ . \ .
+
|

|
|
\ .
Nota. si lo que se quiere contrastar es si las medias poblacionales de dos muestras
independientes obtenidas de poblaciones normales son idnticas, esto se reduce
a los casos anteriores tomando =0, es decir, realizando el contraste:
H
0
:
1

2
= 0 (No hay diferencia significativa)
H
1
:
1

2
0 (Existe diferencia significativa)
2 2
2
2 2
Cecilia Ros Varillas
178
7.4.4.3 Prueba de hiptesis para la Varianza poblacional
X
H
0
:
X
= k

H
0
:
X
k

H
0
:
X
k
H
1
:
X
k

H
1
:
X
< k

H
1
:
X
> k
En cualquiera de los casos H
0
puede ser: H
0
:
X
= k
2
2
( 1)
x
cal
n S
k


=
Prueba Bilateral (de 2 colas)
Regin de
Aceptacin
2
1 / 2
x

2
1
: H k o
2
/ 2
x

Pruebas unilaterales
Regin de
Aceptacin
2
1
:
x
H k o <
2
x

Regin de
Aceptacin
2
1
x

2
1
:
x
H k o >
Prueba de 1 cola a la izquierda Prueba de 1 cola a la derecha
Figura 7.4. Prueba de Hiptesis para la varianza poblacional
X
Si
cal
R.Aceptacin de H
0
> Aceptar H
0
Si
cal
R.Rechazo de H
0
> Rechazar H
0
y

Aceptar H
1
7.4.4.4 Prueba de Homogeneidad de Varianzas
Para determinar la homogeneidad de varianzas (si las varianzas de las dos pobla-
ciones son iguales) es necesario hacer la prueba de homogeneidad de varianzas.
En esta nueva prueba se comparan las varianzas de las poblaciones en la hipte-
sis nula.
2
2
2
2
2
2
2
2
2
Estadstica y diseo de experimentos
179
H
0
:
1
=
2
H
1
:
1

2
Regin de
Aceptacin
1 / 2
F

2 2
1 1 2
: H o o
/ 2
F

Figura 7.5. Regiones crticas en la prueba de Homogeneidad de Varianzas


Si F
cal
R.Aceptacin de H
0
> Aceptar H
0
Si F
cal
R.Rechazo de H
0
> Rechazar H
0
y

Aceptar H
1
7.5 EJERCICIOS DESARROLLADOS
Ejercicio 1
El punto de ebullicin del azufre tiene una varianza de 0,6889 (grados Celsius)
2
.
Qu tamao debe tener la muestra para asegurar con una confianza del 99% que
el error para estimar el punto promedio de ebullicin del azufre sea a lo ms de
0,15 grados Celsius?
Solucin

x
= 0,6889 1 = 0,99 => = 0,01
0,99
0,005 0,005
2,58
Error de estimacin:
1
2
0, 6889
(2, 58) 0,15 E Z
n n

= =
2 2
2 2
2
1
2
2
cal
S
F
S
=
2
Cecilia Ros Varillas
180
=> n 14,276 => n
2
14,276
2
=> n 203,8041

La muestra debe ser de por lo menos 204 determinaciones.
Ejercicio 2
Un intervalo de Confianza del 95% para estimar el peso promedio de los hornos
microondas (de las mismas dimensiones) usados en laboratorio, basado en una
muestra de 36 hornos, result ser [4,0; 10,5] libras
a. Hallar el peso promedio muestral y el error de estimacin
b. Un intervalo de confianza del 90% ser ms amplio que uno del 95%? Justificar
su respuesta.
c. Un tcnico del laboratorio, afirma que el peso promedio de los hornos
microondas es mayor que 6,5 libras. A qu conclusin se llegar?, para
responder esta pregunta use la desviacin estndar de la muestra de 1,2 lb.
Nota. Se asume poblacin normal y muestra aleatoria
Solucin
a. Se sabe que: LC(
X
) = X E
De los datos para un 95% de confianza:
X E = 4
X + E = 10,5
Resolviendo se tiene que el peso promedio de la muestra y el error mximo de
estimacin son:
X = 7,25 lb E = 3,25 lb
b. Primero se calcula la desviacin estndar (como n >30 entonces se usar Z, y
adems la desviacin estndar de la muestra se aproxima al de la poblacin),
usando el error de estimacin calculado en el paso anterior:
0,975
3, 25
1, 96 3, 25 9, 94898
6 36
X X
X
E
E Z
o o
o
=
= = = =
Con el valor de la desviacin estndar calculada, se encuentra el valor de E cuan-
do = 0,10, es decir confianza del 90%.
2 0,95
1, 64 2, 7194
6 6
S S
E Z = = =
Estadstica y diseo de experimentos
181
LC
2
(
X
) = [ X E
2
] = [7,25 2,7194]
LC
2
= [4,5306 9,9694]
Como se observa, ste ltimo intervalo con 90% de confianza es menos amplio
que el intervalo anterior con 95% de confianza; en este segundo caso el error de
estimacin es menor y las mediciones del peso (lb) estn menos dispersas alrede-
dor de su verdadera media.
c. Se debe realizar la prueba de hiptesis:
H
0
: = 6,5
H
1
: > 6,5 n > 30 => usar Z
= 0,05
7, 25 6, 5
36 3, 75
1, 2
c
Z
| |
= =
|
\ .
Las regiones crticas (prueba de 1 cola a la derecha)
0,95
0,05
1,64
Zc

RA H
0
=> Aceptar H
1
Si es mayor, el tcnico del laboratorio no est equivocado, tiene razn.
Ejercicio 3
La probabilidad de que la media muestral difiera de la verdadera media en no
ms de 2 cm, es de (1 ). Adems se conoce los siguientes datos:

200
2 2
1
200 S 100 71100
i
n x = = =

a. Determine el valor de
b. Calcule un intervalo de confianza para la verdadera media (usando calculado
anteriormente).
Cecilia Ros Varillas
182
Solucin
De los datos:

200
2 2
1
200 S 100 71100
i
n x = = =

P(|X | 2) = 1
Como la muestra es grande:
S
X
=> t Z
a.

2 200 2 200
( 2 2) ( ) ( 2, 83 2, 83) 1
10 10
P X P Z P Z

= = =

-2,83 2,83
1
/ 2

1 0, 99767 0, 00466
2

= =
b. Para calcular el intervalo de confianza, primero se calcula el valor de la media
muestral

2 2
2
2
71100 200
? S 100 16
1 199
i
x nx
x
X X
n


= = = =


Se reemplazan los resultados anteriores:

1 / 2
10
( ) 16 (2,83)
200
X
LC X Z
n


= =
Entonces los lmites de confianza son:
L
1
= 13,99888 L
2
= 18,0011

P(13,99888
X
18,0011) = 1 = 1 0,00466 = 0,99534

Existe una confianza del 99,534%, de que la verdadera media se encuentre
comprendida en el intervalo: [13,99888; 18,0011]
Estadstica y diseo de experimentos
183
Ejercicio 4
Las cajas de un compuesto qumico deben tener un contenido promedio de 160
gramos. Un inspector de INDECOPI tom una muestra aleatoria de 10 cajas para
calcular los pesos x
i
en gramos. Si de la muestra resultan las siguientes sumas:
10 10
x
i
= 252858 y x
i
= 1590
i=1 i=1
Mediante un intervalo de confianza del 98% para la media poblacional, es razo-
nable que INDECOPI multe al fabricante? Suponer que el peso de las cajas sigue
una distribucin normal.
Solucin
2 2
2
2
2
252858 10(159)
159
1 9
5, 3333
i
x nx
X S
n
S


= = =

Se reemplazan estos datos y se obtienen los lmites de confianza pedidos.


1
2
156, 9398
( ) 159
161, 0602
x
L
S
LC t
L
n

=
=
=

t
(9gl;0,99)
= 2,821
Tambin se puede hacer una prueba de Hiptesis:
0
1
: 160
: 160
159 160
10 1, 369
5, 3333
cal
H
H
t

| |

= =
|
\ .
0,98
0,01
-2,821
0,01
T(0,99;9gl)
2,821
t
calc
RA H
0
2
Cecilia Ros Varillas
184
No lo multa, ya que al aceptar Ho, se concluye que el verdadero contenido pro-
medio que contienen las cajas es de 160 gramos.
De manera similar se llega a esta conclusin con el intervalo calculado, ya que
el verdadero peso promedio, cae dentro de los lmites de confianza calculados.
Ejercicio 5
Se obtuvieron los resultados de la normalidad de una disolucin de cido clor-
hdrico segn el mtodo de determinacin gravimtrica de cloruros y el mtodo
de valoraciones frente a carbono sdico puro. Estos resultados estn distribuidos
normalmente. Se tomaron 13 y 10 muestras respectivamente de cada mtodo y
se obtuvieron los siguientes resultados: una media de 0,10505 y una desviacin
estndar de 2,38E-04 segn el mtodo de determinacin gravimtrica y con una
media de 0,1055 y una desviacin estndar 6,04E-04 segn el mtodo de valora-
ciones. El estudio deseaba saber si haba alguna diferencia significativa entre los
valores medios de las normalidades obtenidas por los dos mtodos, con un nivel
de confianza del 95%. Asumir
1
=
2

Solucin
Formulacin de hiptesis:
H
0
:
1
=
2
H
1
:
1

2
Datos:
S
1
= 2,38E 04 n
1
= 13
S
2
= 6,04E 04 n
2
= 10
Asumiendo
1
=
2
2 2
2 8 1 2
(12) (9) 1 1
3, 33885 10
13 10 21
p
S S
S

| | + | |
= + =
| |
\ .
\ .
4
4
(0,10505 0,1055) 0 4, 5 10
2, 4627
1, 82725 10
cal cal
p
t t
S


= = =

2 2
2 2
Estadstica y diseo de experimentos
185
Las regiones crticas:
0,95 0,025
0,025
-2,08 (1 ;21gl)
2
t

2,08
t
calc
= 2,4627

Regin de aceptacin H
0
=> Se rechaza H
0
Con un nivel de confianza del 95%, existe evidencia estadstica para afirmar
que s hay diferencias significativas entre los valores medios de las normalidades
obtenidas por el mtodo de determinacin gravimtrica de cloruros y el mtodo
de valoraciones frente a carbono sdico puro.
Ejercicio 6
Para determinar qu influencia ejerce la temperatura del medio ambiente en el
error sistemtico de cierto instrumento goniomtrico, han sido efectuadas las me-
diciones del ngulo horizontal de un objeto durante la maana (a temperatura de
10C) y durante el medio da (a temperatura 26C). Se sabe que las mediciones
del ngulo horizontal se distribuyen normalmente durante la maana y el medio
da. Y se obtienen ngulos medios de 35,8 y 36,5; y una desviacin estndar de
2,5 y 3,1 respectivamente.
Se realizan 10 determinaciones por la maana y 8 durante el medioda.
a. Se puede considerar que la temperatura ambiente influye en el error
sistemtico del instrumento goniomtrico? = 0,05.
b. Realizar un intervalo del 90% de confianza para el verdadero promedio
durante el medioda.
Solucin
a. Las hiptesis a contrastar son:
H
0
:
1
=
2
H
0
:
1

2
= 0

n
1
= 10

H
1
:
1

2
H
1
:
1

2
0 n
2
= 8
1 Hacer la Prueba de Homogeneidad de varianzas: (ya que
2 2
1 2
, o o no se
conocen)
Cecilia Ros Varillas
186
H
0
:
1
=
2
H
1
:
1

2
Las regiones crticas:
0,238 4,82
0,025
0,025
RAHo
0,95
Los valores de F de la tabla son:
F
0,025(9,7)gl
= 0,238
F
0,975(9,7)gl
= 4,82
El valor de F calculado es:
2
1
2
2
0, 6504
calc
S
F
S
= =
F
calc
Regin de aceptacin H
0
=> No se rechaza H
0

1
=

2
Se comprueba que las varianzas poblacionales son desconocidas, pero iguales,
entonces se procede al siguiente paso:
2 Contrastar la hiptesis
H
0
:
1

2
= 0
H
1
:
1

2
0
Considerar = 0,05.
Como
1
=

2
, entonces se usa:

1 2
( )
cal
p
x x
t
S

=

donde:
S
p
: varianza ponderada
2 2
2 2
2 2
2 2
2
Estadstica y diseo de experimentos
187
2 2
1 1 2 2
1 2 1 2
( 1) ( 1) 1 1
2
p
n s n s
S
n n n n
| || | +
= +
| |
+
\ .\ .

Desviacin estndar ponderada
Datos:
x
1
= 35,8 x
2
= 36,5
n
1
= 10 n
2
= 8
s
1
= 2,5 s
2
= 3,1
Reemplazando los datos tenemos:
(35, 8) (36, 5) 0, 7
0, 5311
1, 3179
calc
p
t
S

= = =
Donde:
2 2
1 2
(9) (7) 1 1
1, 3179
10 8 16
p
S S
S
| | + | |
= + =
| |
\ .
\ .
Las regiones crticas son las siguientes:
0.95 0,025
0,025
-2,12
( ) 0,975 16
2,12
gl
t =
de la tabla de t-student t
(0,975)16gl
= 2,12
t
calc
RA H
0
=> Aceptar H
0
No existen diferencias entre las mediciones tomadas en la maana y durante
el medioda, esto significa que la temperatura ambiente no influye en el error
sistemtico del instrumento goniomtrico.
b. Se procede a calcular el intervalo de confianza para el verdadero promedio de
las mediciones del ngulo horizontal de un objeto durante el medioda.
Cecilia Ros Varillas
188
0,90 0,05
0,05
-1,895 1,895
t
(0,95)7gl
= 1,895
2
2
2 2 (1 / 2, 1)
2
(3,1)
( ) 36,5 (1,895)
8
n
S
LC x t
n


= =
P(34,42305)
2
38,5769) = 0,95
Existe una confianza del 90% que el verdadero promedio de las mediciones del
ngulo horizontal de un objeto durante el medioda, est comprendido en el in-
tervalo: [34,42305;38,5769]
Ejercicio 7
Se tienen dos localidades de cultivo, se toman 16 muestras de tierra de la locali-
dad A y 13 de la localidad B, se realizan determinaciones respectivas de laborato-
rio (se evala el porcentaje de arcilla), obtenindose los siguientes datos:
16
2
1
13
2
1
38 ( ) 150
31 ( ) 159
A Ai A
i
B Bi B
i
X X X
X X X
=
=
= =
= =

Suponiendo poblaciones normales:


a. Existen diferencias significativas entre los porcentajes promedios de arcillas
de cada localidad?
b. Si por experiencias anteriores, se asegura que la variabilidad (varianza) del
porcentaje de arcilla de la localidad B es no menor de 16,5 (%)
2
Qu puede
decir al respecto? = 0,01
.
c. Calcule un intervalo del 95% para el verdadero promedio de arcilla en la
localidad A.
Solucin
De los datos:
n
A
= 16 x
A
= 38 n
B
= 13 x
B
= 31
Estadstica y diseo de experimentos
189
Se reemplaza en la frmula de la varianza para cada localidad y se obtienen:
16 13
2 2
2 2 1 1
( ) ( )
= =
1 1
Ai A Bi B
i i
A B
A B
X X X X
S S
n n
= =



2 2
150 159
10 13, 25
15 12
A B
S S = = = =
a. Como no se conocen las varianzas poblacionales, entonces.
1 Hacer la Prueba de Homogeneidad:
H
0
:
A
=
B
H
1
:
A

B
Las regiones crticas con la tabla de F:
0,337 3,18
0,025
0,025
RAHo
0,95
Los valores de F de la tabla son:
F
0,025(15,12)gl
= 0,337
F
0,975(15,12)gl
= 3,18
El valor de F calculado es:
2
2
10
0, 7547
13, 25
A
calc
B
S
F
S
= = =
Se observa que:
F
calc
RA H
0
=>
A
=
B
Luego de esta prueba, se procede al siguiente paso:
2 Contrastar la hiptesis
H
0
:
A

B
= 0
H
1
:
A

B
0
2 2
2 2
2 2
Cecilia Ros Varillas
190
Considerar = 0,05.
Como en el paso anterior se concluy que
A
=
B
, entonces se usa:

( )
A B
cal
p
x x
t
S

=

2
donde:
: varianza ponderada
p
S
38 31 7
5, 5415
1, 2632
1 1 10(15) 13, 25(12)
16 13 27
calc
t

= = =
+ | || |
+
| |
\ .\ .
Las regiones crticas, usando t-student:
RAHo
0,025 0,025
-2,052
( 0,975;27 )
2, 052
gl
t =
Conclusin:
t
calc
RR H
0
=> Rechazar H
0

Aceptar H
1
Considerando un error de 5%, existen diferencias significativas, entre los ver-
daderos porcentajes promedios de cada localidad.
b. Se realiza la prueba de hiptesis para la varianza poblacional considerando los
datos de la localidad B.
H
0
:
B
16,5
H
1
:
B
< 16,5
En este caso el nivel de significacin es:
= 0,01
La prueba a usar es:
2
12(13, 25)
9, 6364
16, 5
cal
= =
2 2
2
2
Estadstica y diseo de experimentos
191
Las regiones crticas son:
0,01
RAHo
0,99
3, 57

2
(0,01;12gl)
= 3,57

cal
= 9,6364 Regin de aceptacin H
0
S, es cierto lo que se asegura, que
B
16,5. Se presenta la evidencia estadstica
de lo mencionado, considerando un error del 1%.
c. Clculo del intervalo de confianza para el verdadero promedio de arcilla en la
localidad A:
Los datos se reemplazan en:
( ) 0,975 ; 15gl
16
A
A
S
LC X t =
Buscando en la tabla de t, para un = 0,05
0,95
0,025 0,025
-2,131 2,131
Donde: t
(0,975;15gl)
= 2,131
Reemplazando, se tiene que:
10
38 (2,131)
16
LC =
Realizando los clculos, se encuentran los lmites de confianza:
P(36,3153
A
39,6847) = 0,95
Se tiene un 95% de confianza que el verdadero porcentaje promedio de arcilla en
la localidad A, est comprendido en [36,3153; 39,6847]%
2
2
Cecilia Ros Varillas
192
7.6 EJERCICIOS PROPUESTOS
Ejercicio 1
Una empresa decide comprar dos mquinas. Antes de elegir una decide realizar
una prueba para saber si las dos mquinas ofertadas pueden producir la misma
cantidad de unidades por hora. Para ello, observa la produccin de las dos m-
quinas y observa los resultados que se reflejan en la tabla adjunta:
Mquina A 89 84 81 87 79 97 92 87 89 80
Mquina B 88 77 87 92 81 94 79 85 84 88
a. Determine un intervalo del 95% de confianza para la verdadera produccin
promedio de la Mquina A.
b. Determine un intervalo del 90% de confianza para la verdadera varianza de la
Mquina B.
c. Se desea saber si existe diferencias significativas en la verdadera produccin
promedio de ambas mquinas = 0,05. (Hacer primero la prueba de
Homogeneidad de Varianzas).
d. Se sospecha que la verdadera varianza de los productos producidos por la
Mquina A es 8,45 Es correcta esta sospecha? = 0,01
e. Luego de tomar la informacin de estas muestras, se desea probar si la
verdadera varianza de la Mquina B es menor que 7,55
Ejercicio 2
Se desea comparar un nuevo mtodo enzimtico para determinar colesterol con
el mtodo estndar de Lieberman (colorimtrico). Para ello, se observ una mues-
tra para ambos mtodos con los resultados siguientes: (en mg/dl). Suponiendo
poblaciones Normales y varianzas poblacionales homogneas:
Enzimtico 305 385 193 162 478 455 238
Colorimtrico 300 392 185 152 480
a. Calcule un intervalo del 90% de confianza para el verdadero promedio con el
Mtodo Enzimtico.
b. Determine un intervalo del 95% de confianza para el verdadero promedio con
el Mtodo Colorimtrico.
c. Calcule un intervalo del 90% de confianza para la Diferencia de promedios
poblacionales de ambos mtodos.
d. Determine un intervalo del 95% de confianza para la verdadera varianza con
el Mtodo Enzimtico.
e. Un ingeniero qumico sospecha que el verdadero promedio usando el mtodo
Enzimtico es de 350 mg/dl Qu puede decir de esta sospecha? = 0,05.
Estadstica y diseo de experimentos
193
f. Existe diferencia significativa con un nivel de confianza del 99% entre los
mtodos?
g. En base a estudios anteriores, se afirma que la verdadera varianza con el
Mtodo Colorimtrico es no ms de 12 500 (mg/dl)
2
Qu podemos asegurar
de esta afirmacin? = 0,05.
Ejercicio 3
Una fbrica de productos qumicos ha producido en promedio 800 toneladas por
semana. Las producciones en las ltimas semanas fueron 785, 805, 790, 793 y 802
toneladas. Indican estos datos que la produccin promedio fue menor que 800
toneladas y que, por lo tanto, el rendimiento de la planta ha disminuido? Realice
una prueba (nivel de significacin del 5%).
Ejercicio 4
Se realiza un experimento para comparar la resistencia (en onzas) de dos tipos de
tela. Se seleccion una muestra aleatoria de tiras de tela de cada tipo. El tipo 1, pa-
pel estndar, una muestra de tamao 60 present una resistencia media aritmti-
ca 1.364 y una desviacin estndar de 0.112. En tanto, de la tela tipo 2, el estndar
pero tratado con una sustancia qumica, el promedio aritmtico y desviacin es-
tndar de una muestra de tamao 50 resultaron, 1.442 y 0.123, respectivamente.
Pruebe la hiptesis de que no hay diferencia entre la resistencia de los dos tipos
de tela = 0,10.
Ejercicio 5
Se aplican dos mtodos diferentes para medir la resistencia de los lotes de algo-
dn (lb), necesarias para romper una madeja. Con este fin se toman los siguientes
lotes de algodn:
Mtodo I 74 100 90 99 97 89 108 94 87 88
Mtodo II 101 90 105 83 91 96 98 95
Suponiendo poblaciones normales y varianzas poblacionales iguales:
a. Determine un intervalo del 90% de confianza para la verdadera desviacin
estndar del Mtodo I.
b. Se sospecha que la verdadera resistencia promedio del segundo mtodo es de
2 gramos ms que el otro. Qu puede decir de esta sospecha?
c. Un ingeniero sostiene que la verdadera varianza del mtodo I es de 25 (lb)
2
,
qu se puede decir al respecto?
Cecilia Ros Varillas
194
Ejercicio 6
Se le pide a una analista experimentada la evaluacin de dos mtodos diferentes
para la determinacin de trazas de plomo en cido actico glacial. Se realizaron
ocho determinaciones mediante cada mtodo, que dieron los siguientes resulta-
dos para la concentracin del plomo (en ppm):
Mtodo A 1.34 1.33 1.32 1.35 1.32 1.43 1.34 1.31
Mtodo B 1.3 1.26 1.3 1.33 1.2 1.24 1.24 1.33
a. Existe una diferencia significativa en el promedio de trazas de plomo
determinado por ambos mtodos? = 0,05.
b. Determine los lmites de confianza para el verdadero promedio de trazas de
plomo, mediante el mtodo B (90% de confianza).
c. Con una confianza del 95% determine los lmites de la verdadera varianza
usando el mtodo A.
d. Determine los lmites de confianza de la diferencia de medias de ambos
mtodos.
Ejercicio 7
La dureza del agua en la salida de cierta planta de energa elctrica tiene una
distribucin normal con
X
= 55 ppm, y desviacin estndar de 5,5 ppm Doce
muestras de agua dieron como resultado una media aritmtica de 53 ppm. Se
puede concluir que la dureza media del agua es inferior a 55 ppm? = 0,10.
Estadstica y diseo de experimentos
195
El diseo de experimentos es en la actualidad una de las herramientas principa-
les utilizadas en la investigacin estadstica, el objetivo que se tiene es estudiar el
efecto de un factor sobre una variable respuesta. Disear un experimento, sim-
plemente significa planear un experimento de modo que se rena la informacin
que sea pertinente al problema bajo investigacin.
En ciencias e ingeniera, el diseo de experimentos es muy necesario ya que im-
plica investigacin, anlisis y comprobacin de los resultados.
8.1 DEFINICIN E IMPORTANCIA DEL DISEO EXPERIMENTAL
El diseo de un experimento, es la secuencia completa de pasos tomados de an-
temano para asegurar que los datos apropiados se obtendrn de modo que per-
mitan un anlisis objetivo que sea posible de analizar inferencias estadsticas
vlidas con respecto al problema establecido.
Cuando un investigador est planeando realizar un experimento, se formula mu-
chas interrogantes, algunas de las cuales es saber cules son los factores o trata-
mientos que se estudiarn, cul sera la mejor forma de analizarlos, cuntas veces
se ejecutar el anlisis, entonces surge la necesidad de aplicar un buen diseo,
que sea el ms adecuado para lograr sus objetivos.
El propsito del diseo experimental es proporcionar una cantidad mxima de
informacin pertinente al problema bajo investigacin, es tambin importante
que el diseo o plan, sea tan simple como sea posible, es decir debe ser eficiente
tanto en lo estadstico como en lo econmico.
Un experimento diseado estadsticamente proporciona una estimacin del error
que puede servir como norma por la que pueden ser medidos los resultados del
experimento. Un investigador que planee un experimento debera incorporar
ambos de estos factores en sus diseos, esforzarse para lograr eficiencia estads-
tica (buena metodologa estadstica) y economizar recursos.
Aplicaciones del diseo experimental:
Diseos experimentales
CAPTULO 8
Cecilia Ros Varillas
196
- Mejora en el rendimiento del proceso
- Menor variabilidad y mayor ajuste a los requerimientos del proceso
- Menor tiempo de desarrollo
- Menores costos globales del proceso
8.2 PASOS A SEGUIR EN EL DISEO DE EXPERIMENTOS
Es muy importante que todo investigador siga cuidadosamente una secuencia
de pasos que l mismo crea conveniente; sin embargo, segn Kempthorne
1
un
experimento diseado estadsticamente consta de los siguientes pasos:
1. Enunciado del problema (Comprensin y planteamiento del problema)
2. Formulacin de las Hiptesis
3. Seleccin de tratamientos y el Diseo Experimental
4. Examen de los sucesos posibles y referencias en que se basan las razones que
asegure que el experimento proporciona la informacin requerida y en la
extensin adecuada
5. Consideracin de los posibles resultados desde el punto de vista de los
procedimientos estadsticos que se les aplicar, para asegurar que se satisfagan
las condiciones necesarias para que sean vlidos estos procedimientos.
6. Ejecucin del experimento
7. Aplicacin de las tcnicas estadsticas a los resultados experimentales
8. Interpretacin de resultados y extraccin de conclusiones y recomendaciones
9. Valuacin de la investigacin realizada y preparacin del informe final
Esta lista es una gua referencial para cualquier investigador, ya que puede ase-
gurar que nada ha pasado desapercibido.
8.3 DEFINICIONES BSICAS
Tratamiento
Se usa el trmino tratamiento, para denominar los diferentes procesos cuyos efec-
tos van a ser medidos y comparados. Un tratamiento es un conjunto particular
de condiciones experimentales que deben imponerse a una unidad experimental.
Un diseo de experimentos tendr dos o ms tratamientos, tal que una com-
paracin entre ellos permitir resolver los problemas planteados al inicio del
experimento. En la seleccin de tratamientos es importante definir claramente
cada uno de ellos y entender el papel que jugar para alcanzar los objetivos del
experimento.
1
The Design and Analysis of Experiments
Estadstica y diseo de experimentos
197
La especificacin de los tratamientos puede originar casos difciles relativos a las
condiciones bajo las cuales van a ser comparados los tratamientos.
Los tratamientos son una creacin de las circunstancias para el experimento. Es
necesario identificar los tratamientos con el papel que cada uno tiene en la eva-
luacin de la hiptesis de investigacin. Si no se logra delinear con claridad esta
hiptesis y el objetivo del estudio, puede haber dificultades en la seleccin de los
tratamientos y experimentos sin xito. Por eso es muy importante que el inves-
tigador se asegure de que los tratamientos elegidos concuerden con la hiptesis
de investigacin.
Unidad Experimental
Se usar el trmino de unidad experimental para representar el conjunto de ma-
terial al cual se aplica un tratamiento en un solo ensayo.
La unidad puede ser una parcela, un alumno en el laboratorio, un lote de semi-
llas, una porcin de masa, etc., especficamente en la industria qumica, ejemplos
de unidades experimentales pueden ser: lotes de material, trabajadores, mqui-
nas. Entonces la unidad experimental es el material experimental unitario que re-
cibe la aplicacin de un tratamiento, es el elemento donde se realiza la medicin.
Es caracterstico de tales unidades, que produzcan diversos resultados aun cuan-
do se sujeten al mismo tratamiento: estas diferencias, bien sean grandes o peque-
as, contribuyen a formar los errores experimentales.
Error Experimental
Es la medida de la variacin, existente entre dos o ms unidades experimentales
que han recibido la aplicacin de un mismo tratamiento.
El trmino error experimental se aplica frecuentemente a estas variaciones. La
palabra error no es sinnimo de equivocacin sino que incluye todos los
tipos de variacin extraa. Por eso se dice tambin que el trmino error experi-
mental describe el fracaso de llegar a resultados idnticos con dos unidades
experimentales tratadas idnticamente.
Se pueden distinguir dos fuentes principales de errores experimentales en los
diseos de experimentos. La primera es la variabilidad inherente al material ex-
perimental (unidad experimental) al cual se aplican los tratamientos. La segunda
fuente de variabilidad es la falta de uniformidad en la conduccin fsica del ex-
perimento; es decir, la deficiencia en poder uniformizar la tcnica experimental
(variabilidad debida a los tratamientos)
Causas del Error Experimental: puede ser errores de experimentacin, de obser-
vacin, de medicin, variacin en el material experimental y factores extraos.
Cecilia Ros Varillas
198
Para reducir el Error Experimental se debe:
- usar material experimental ms homogneo
- dar buena direccin del experimento
- repetir el experimento
- usar un diseo experimental apropiado
Factor
Un factor es un grupo especfico de tratamientos, como por ejemplo: temperatu-
ra, humedad, dosis de nitrgeno en trigo, tipos de suelo, aditivo qumico, etc., se
consideran un factor cada uno.
Las diversas categoras de un factor se denominan niveles del factor, como por
ejemplo:
- cuatro diferentes dosis de nitrgeno: O; 37,5; 75,0 y 112,5 (kg/ha)
- tres diferentes tipos de suelo: normal, salino, sdico.
Al primero de ellos se le conoce como factor cuantitativo, tiene niveles asocia-
dos con puntos ordenados en alguna escala de medicin, y el segundo ejemplo
corresponde a los niveles de un factor cualitativo, que representan distintas cate-
goras o clasificaciones, que no se pueden acomodar conforme alguna magnitud.
Al tratamiento tambin se le define como a cada una de las combinaciones de
niveles de los distintos factores.
Variable respuesta o variable de inters
Los datos que se recogen en un experimento son medidas de una variable deno-
minada variable respuesta o variable de inters.
Es importante precisar de antemano cul es la variable respuesta y en qu uni-
dades se mide. Tambin se debe especificar con claridad la forma en que se rea-
lizarn las mediciones: instrumentos de medida, tiempo en el que se harn las
mediciones, etc.
8.4 PRINCIPIOS BSICOS DEL DISEO EXPERIMENTAL
Reproduccin
Se entiende por reproduccin la repeticin del experimento bsico. Es importan-
te la reproduccin ya que:
- Proporciona una estimacin del error experimental que acta como una unidad
bsica de medida para indicar el significado de las diferencias observadas o
para determinar la amplitud de un intervalo de confianza.
Estadstica y diseo de experimentos
199
- La reproduccin proporciona algunas veces una estimacin ms aproximada
del error experimental.
Aleatorizacin
Consiste en asignar al azar los tratamientos a las unidades experimentales. La aleato-
rizacin permite proceder como si la independencia de errores fuera un hecho. Los
errores asociados con unidades experimentales, tendern a correlacionarse, y lo que
hace la aleatorizacin es asegurar que el efecto de esta correlacin sea muy pequeo.
La aleatorizacin es una de las pocas caractersticas de los diseos experimenta-
les modernos, las ocasiones en que se requiere la aleatorizacin varan con el tipo
de experimento y deben dejarse a juicio del investigador.
La aleatorizacin es en cierta forma un seguro, por el hecho de que es una pre-
caucin contra interferencias que pueden o no ocurrir, y ser o no importantes si
ocurren.
Control Local
Control local, se refiere a la cantidad de balanceo, bloqueo y agrupamiento de las
unidades experimentales que se emplean en el diseo estadstico que se emplea.
El propsito del control local es hacer al diseo experimental ms eficiente. Esta
eficiencia significa la reduccin del error experimental mediante el control de
todos los factores.
8.5 ANLISIS DE VARIANZA (ANVA)
El Anlisis de Varianza, es una las tcnicas ms utilizadas en los anlisis de los
datos de los diseos experimentales que se usa para comprobar si existen diferen-
cias significativas entre los promedios de los tratamientos (2 ms), por lo que
puede verse como una extensin de la prueba t para diferencias de dos medias.
Bsicamente es un procedimiento que permite dividir la varianza de la variable
dependiente (la que se estudia) en dos o ms componentes, cada uno de los cua-
les puede ser atribuido a una fuente (variable o factor) identificable.
El anlisis de varianza se aplica en la investigacin, pues est relacionado con el di-
seo de experimentos, y puede ser usado para dos tipos de anlisis: para contrastar
hiptesis acerca de varianzas y para contrastar hiptesis acerca de medias; aunque
las conclusiones acerca de las medias dependern de las varianzas observadas.
Supuestos del anlisis de varianza
El ANVA est basado en ciertos supuestos, acerca de dichas variables aleatorias.
Es evidente que cuantos ms factores introduzcamos menos cantidad de varia-
Cecilia Ros Varillas
200
cin residual (error) quedar por explicar. Pero siempre quedar alguna varia-
cin residual (o error).
Los supuestos del ANVA son:
1. El valor esperado de cada variable aleatoria residual es cero.
2. Las variables aleatorias residuales son mutuamente independientes.
3. Todas las variables aleatorias residuales tienen la misma varianza.
4. Toda variable aleatoria residual se distribuye normalmente.
En algunos casos los datos o mediciones que se realizan no satisfacen las su-
posiciones, sobre todo cuando las varianzas de las respuestas para diferentes
tratamientos no son iguales, entonces en estos casos interviene el criterio del in-
vestigador, ya que no se puede desechar las mediciones realizadas en laborato-
rio, lo que s se puede hacer es transformar las mediciones; es decir, usando las
mediciones originales, se podran usar sus races cuadradas, logaritmos o alguna
otra funcin. Muchas de las transformaciones realizadas tienden a estabilizar la
varianza de la respuesta y hacen tambin que las distribuciones de probabilidad
de las respuestas transformadas estn ms cerca de la normalidad.
Cuando es imposible lograr que se satisfagan estos supuestos del ANVA, se debe
utilizar procedimientos no-paramtricos de pruebas de hiptesis.
8.6 MODELO MATEMTICO
El modelo matemtico especificado debe indicar la relacin que se supone que
existe entre la variable respuesta y las principales fuentes de variacin identifica-
das. Es fundamental que el modelo elegido se ajuste a la realidad con la mayor
precisin posible.
El modelo ms habitual es el modelo lineal:
1
n
i
i
Y e
=
= +

En este modelo la respuesta viene dada por una combinacin lineal de trminos
que representan las principales fuentes de variacin planificada ms un trmino
residual (error) debido a las fuentes de variacin no planificada. Los modelos
que ms se estudian y aplican, se ajustan a esta forma general.
8.7 TIPOS DE MODELOS ESTADSTICOS
Los modelos de diseos de experimentos segn la seleccin de tratamientos y los
efectos de los factores, pueden ser:
Estadstica y diseo de experimentos
201
Modelo de efectos fijos
Es un modelo en el que los niveles del factor han sido seleccionados por el expe-
rimentador. Es apropiado cuando el inters se centra en comparar el efecto sobre
la respuesta de esos niveles especficos.
Ejemplo: un ingeniero est interesado en comparar el rendimiento de tres mqui-
nas del mismo tipo que tiene en su empresa.
El modelo de efectos fijos es el que ms se usa y aplica en ingeniera, y es el que
se va a usar en los diseos bsicos que se presenta en este captulo.
Modelo de efectos aleatorios
Es un modelo en el que todos los factores son factores de efectos aleatorios; es de-
cir, que slo se incluyen en el experimento una muestra aleatoria simple de todos
los posibles niveles del mismo. Evidentemente se utilizan estos factores cuando
tienen un nmero muy grande de niveles y no es razonable o posible trabajar
con todos ellos. En este caso se est interesado en examinar la variabilidad de la
respuesta debida a la poblacin entera de niveles del factor.
Modelo mixto
Es un modelo en el que hay factores de efectos fijos y factores de efectos alea-
torios.
8.8 DISEOS BSICOS
Los diseos bsicos y de uso comn en trabajos de investigacin son los si-
guientes:
1. Diseo Completamente Aleatorio
2. Diseo de Bloques Aleatorios
3. Diseo Cuadrado Latino
8.9 DISEO COMPLETAMENTE ALEATORIO O AL AZAR (DCA)
Es el diseo ms simple y aplicativo en diseos experimentales. El diseo com-
pletamente al azar, es el diseo en el cual los tratamientos son asignados comple-
tamente al azar a las unidades experimentales, o viceversa.
En este diseo solamente se estudia el efecto de un factor, el cual se vara en dife-
rentes tratamientos o niveles, por eso al diseo completamente aleatorio tambin
se le llama diseo unifactorial o de clasificacin de un solo criterio.
Cecilia Ros Varillas
202
8.9.1 Caractersticas del diseo completamente al azar
- No impone restricciones en la distribucin de los tratamientos a las unidades
experimentales.
- Se debe disponer de unidades experimentales homogneas. Por lo tanto este
diseo se usara en laboratorios o invernaderos.
- Cada tratamiento puede tener igual o diferente nmero de unidades
experimentales.
- El nmero de tratamientos est en funcin del nmero de unidades
experimentales. (es conveniente menos tratamientos y ms unidades
experimentales).
8.9.2 Modelo aditivo lineal en el diseo completamente aleatorio
En el diseo completamente al azar con una observacin por unidad experimen-
tal, las observaciones pueden ser representadas por el siguiente modelo aditivo
lineal (de efectos fijos):
Y
ij
= +
i
+ e
ij
i = 1,2,..., t (tratamientos)
j = 1,2,..., n (iguales repeticiones por tratamiento)
j = 1,2,..., n
i
(diferentes repeticiones por tratamiento)
Donde:
: es el efecto medio verdadero

i
: es el efecto verdadero del i-simo tratamiento.
e
ij
: es el efecto verdadero de la j-sima unidad experimental sujeta al i-simo
tratamiento.
Y
ij
: Respuesta de la j-sima unidad experimental sujeta al i-simo tratamiento.
Asunciones: ( )
2
1
0 ~ 0,
t
i ij
i
e N o
=
=

8.9.3 Representacin simblica de los datos en el diseo


completamente aleatorio
Los resultados del experimento se pueden agrupar de la siguiente forma:
Estadstica y diseo de experimentos
203
Cuadro 8.1. Agrupacin de resultados del experimento
en el diseo completamente aleatorio
Tratamientos
1 2 ... i ... t
Y
11
Y
12
.
.
.
Y
1j
.
.
.
Y
1n
1
Y
21
Y
22
.
.
.
Y
2j
.
.
.
Y
2n
2
...
...
...
...
Y
i1
Y
i2
.
.
.
Y
ij
.
.
.
Y
in
i
...
...
...
...
Y
t1
Y
t2
.
.
.
Y
tj
.
.
.
Y
tn
t
Totales Y
1.
Y
2.
... Y
i.
... Y
t.
Y..
Donde:
Y
ij
: es el resultado de la medicin del i-simo tratamiento en la j-sima repeticin.
Y.. = i=1 Yi.
.
=
j=1
Y
ij
: La suma de todas las observaciones
n. =
i=1
ni : El nmero total de unidades experimentales
8.9.4 Anlisis de varianza en el diseo completamente aleatorio
En esta parte desarrollaremos el Anlisis de Varianza para el modelo de Efectos
fijos del diseo completamente aleatorio.
Para el cual se siguen los siguientes pasos:
1. Formulacin de las hiptesis
H
0
:
1
=
2
= ... =
t
H
1
: al menos un
i

j
i j
Equivalentemente se puede formular la hiptesis en funcin de los efectos de
los tratamientos de la siguiente forma:
H
0
:
i
= 0, i = 1,2,...,t
H
1
:
i
0 para algn i
Donde:
i
=
i
- , efecto de un nivel del factorH t i a i 0 0 1 2 : , , ,..., = =
2. Presentar un nivel de significacin adecuado, generalmente = 0,05
t ni
t
Cecilia Ros Varillas
204
3. Realizar los clculos respectivos, teniendo en cuenta si presentan igual o
diferente nmero de unidades experimentales por tratamiento, los clculos se
presentan en las Tabla 1 y Tabla 2. (tambin puede ser directamente aplicando
paquetes estadsticos como el Minitab, SPSS y otros).
Se debe tener presente:
La Ecuacin Fundamental del Anlisis de Varianza en el DCA:
Suma total de
cuadrados
SCTo
=
Suma de cuadrados de
los tratamientos
SCTr
+
Suma de cuadrado de
los errores
SCE
Tabla 1. ANVA Diseo Completo Aleatorio (Igual nmero de u.e. por tratamiento)
Fuente de
Variacin
Grados
de
Libertad
Suma de Cuadrados
Cuadrados
Medios
(varianzas)
F calculado
(F
c
)
Tratamientos 1 t
2 2
. ..
1
t
i
i
y y
SCTr
n tn
=
| |
=
|
\ .

1
SCTr
CMTr
t
=

CMTr
Fc
CME
=
Error ( 1) t n
SCE SCTo SCTr =
( 1)
SCE
CME
t n
=

Total 1 tn
2
2 ..
1 1
n t
ij
i j
y
SCTo y
tn
= =
| |
=
|
\ .

Tabla 2. ANVA Diseo Completo Aleatorio (diferente nmero de u.e. por tratamiento)
Fuente de
Variacin
Grados
de
Libertad
Suma de Cuadrados
Cuadrados
Medios
(varianzas)
F calculado
(F
c
)
Tratamientos 1 t
2
.
1
t
i
i
i
y
SCTr TC
n
=
=

1
SCTr
CMTr
t
=

CMTr
Fc
CME
=
Error ( )
1
1
t
i
i
n
=

SCE SCTo SCTr =


SCE
CME
n t
=

Total
1
1
t
i
i
n
=

2
1 1
i
n t
ij
i j
SCTo y TC
= =
=

Donde:

2
..
1
t
i
i
y
TC
n
=
=

: Trmino de correccin

..
. .
CME
CV
y
=
Estadstica y diseo de experimentos
205
4. Analizar las regiones crticas
Por otra parte el cociente de dos variables
2
se distribuye mediante la
distribucin de F.

c
CMTr
F
CME
=

~ F
1 [(gl.Trat),(gl.Error)]

Figura 8.1. Regiones crticas en el diseo completamente aleatorio
5. Conclusiones e interpretacin.
Conclusiones:
Si Fc > F
1
=> Se rechaza Ho
Si Fc < F
1
=> No se rechaza Ho
Nota: Los valores de F para = 0,05 y = 0,01 en el Anexo 4.
Ejemplo de un diseo completamente aleatorio
Se utilizaron tres mtodos diferentes para determinar la concentracin (ppm) de
Mg. en agua natural. Se hallan los siguientes resultados:
Mtodo A 5.65 5.75 5.64 5.73 5.69 5.71
Mtodo B 5.83 5.78 5.79 5.92 5.95 5.82
Mtodo C 5.75 5.63 5.68 5.64 5.72 5.66
Existe diferencia significativa con un nivel de significacin del 5%, entre los m-
todos? Suponer poblaciones normales.
Solucin
El modelo aditivo lineal es el siguiente:
Y
ij
= + i + e
ij
i = 1,2,3 (mtodos) j = 1,2,...,6
Y
ij
: Concentracin (ppm) de Mg en agua natural
1
F

Cecilia Ros Varillas
206
Las hiptesis a probar son las siguientes:
H
0
:
1
=
2
=
3
H
1
: al menos un
i

j
i j
Se usar el nivel de significacin = 0,05
Se procede a los clculos usando la Tabla 1, ya que se presenta igual nmero de
unidades experimentales por tratamiento:
2 2 2 2
1 1
5, 65 5, 75 ... 5, 66 593, 4358
n t
ij
i j
y
= =
= + + + =

( )
2
2
..
103, 34
593, 2864222
3(6)
y
TC
tn
= = =
Entonces reemplazando en la frmula de la suma de cuadrados del total:
2
2 ..
1 1
593, 4358 593, 2864222 0,14937778
n t
ij
i j
y
SCTo y
tn
= =
| |
= = =
|
\ .

Ahora se calcula la suma de cuadrados de tratamiento:


Y
A
= 34,17 Y
B
= 35,09 Y
C
= 34,08
2 2
. ..
1
2 2 2
34,17 35, 09 34, 08
( ) 593, 2864222 0,1041444667
6
t
i
i
y y
SCTr
n tn
SCTr mtodos
=
| |
= =
|
\ .
| | + +
= =
|
\ .

La suma de cuadrados del error experimental se puede calcular por diferencia:


SCE = SCTo SCTr = 0,14937778 0,1041444667 = 0,04523331333
Los valores calculados se reemplazan en la tabla del ANVA, se completan los
cuadrados medios y los dems clculos:
Fuente de
Variacin
Grados de
Libertad
Suma de Cuadrados
Cuadrados Medios
(varianzas)
F calculado
(F
c
)
Mtodos 2 0,1041444667 0,05207223 17,2679
Error 15 0,04523331333 0,00301555
Total 17 0,14937778
Estadstica y diseo de experimentos
207
Se calcula el valor crtico (ver anexo 5):
F
1 [(gl.Trat),(gl.Error)]
= F
0,95(2;15)gl
= 3,682
Conclusin
F
c
= 17,2679 > F
1


= 3,682 => Se rechaza H
0
Por lo tanto se concluye que hay diferencias significativas en la concentracin
(ppm) de Mg. en agua natural en al menos dos de los tres mtodos utilizados,
esto es que los mtodos usados producen diferentes concentraciones (ppm) de
Mg en agua natural.
Cuando se requiere saber entre cuales de los mtodos hay estas diferencias, se
procede a las pruebas de comparaciones de medias (como Tuckey, Duncan, DLS,
etc.), los paquetes estadsticos presentan estos resultados de manera inmediata.
8.9.5 Prueba de Homogeneidad de varianzas
Como se ha mencionado, uno de los supuestos del anlisis de varianza es la ho-
mogeneidad de varianzas, cuando se trata de dos poblaciones aplicamos de ma-
nera directa la prueba de F, pero cuando son ms poblaciones existen muchas
pruebas de comprobacin, una de ellas es el Test de Bartlett que se presenta a
continuacin:
La hiptesis que se desea probar es
H
0
:
1
=
2
=
3
= ... =
t
H
1
: al menos un
i

j
Se tienen t tratamientos con n
i
repeticiones, y sean:
S
i
: Varianza del error en cada tratamiento
S : Varianza comn (coincide con el CME en el ANVA)
C : factor de correccin
Los clculos son los siguientes:
2
2 1
1
( 1)
( 1)
t
i i
i
t
i
i
n S
S
n
=
=

2 2 2 2
2
2
Cecilia Ros Varillas
208
1
1
1 1 1
1
3( 1) ( 1)
( 1)
t
t
i
i
i
i
C
t n
n
=
=
(
(
| |
( = +
|

(
\ .

(

2 2
2 1 1
( 1). ( 1).
t t
i i i
i i
n Ln S n Ln S
X cal
C
= =

=

X
2
1
Se distribuye como Chi-cuadrado con (t - 1) g.l.
Conclusin:
Si X
2
cal < X
2
1
=> No se rechaza Ho Existe homogeneidad de varianzas
Ejemplo:
Se sospecha que cuatro mquinas llenadoras en una planta, estn sacando pro-
ductos con diferentes pesos. Se realiz un experimento para comprobarlo, me-
diante una muestra de 17 productos, cuyos pesos en onzas fueron recopilados
usando las mquinas A, B, C y D. Los datos en onzas son los siguientes:
MQUINAS
(Peso neto en onzas)
A B C D
12.25
12.27
12.24
12.25
12.20
12.18
12.25
12.26
12.24
12.23
12.23
12.20
12.20
12.17
12.19
12.18
12.16
Total 61.21 36.69 48.9 60.9
(n
i
) 5 3 4 5 17
S
i
0.00067 0.0019 0.0003 0.00025
2
Estadstica y diseo de experimentos
209
Desarrollar la prueba de Homogeneidad de Varianzas mediante el Test de Bart-
lett:
(n
i
1)S
i

4S
A
+ 2S
B
+ 3S
C
+ 4S
D
S
2
= = = 0.0006446 (CMEE)
(n
i
1)
13
1
1
1 1 1
1
3( 1) ( 1)
( 1)
t
t
i
i
i
i
C
t n
n
=
=
(
(
| |
( = +
|

(
\ .

(

=
1 1 1 1 1 1
1 1.1396
3(3) 4 2 3 4 13
C
(
| |
= + + + + =
| (
\ .

cal
=
[
(n
i
1) ln S
2
(n
i
1) ln S
i
]

cal
= [(ln 0.0006446)13 (4ln S
A
+ 2S
B
+ 3S
C
+ 4S
D
)] = 3.3053
Se compara:

1
=
0,95(3)gl
= 7,81
Conclusin:

cal
= 3,3053 <

0,95(3)gl
= 7,81 => existe homogeneidad de varianzas

Con la aprobacin de este supuesto, se puede realizar el ANVA (Ver pg. 222).
8.10 DISEO BLOqUE COMPLETAMENTE AL AZAR (DBCA)
Es aquel modelo en que las unidades experimentales sobre las que se toman las
medidas se asignan al azar a los diferentes niveles de tratamientos y bloques,
donde los bloques son subgrupos homogneos con relacin a la variable exgena
cuyos efectos se desea eliminar.
La variable que define el bloque, recibe el nombre de variable de bloque.
t
i = 1
t
i = 1
2
2 2 2 2
2 2
1
c
t
i = 1
t
i = 1
1
1.1396
2 2 2 2
2 2
2 2
Cecilia Ros Varillas
210
8.10.1 Caractersticas del diseo bloque completamente al azar
- El Diseo es completo en el sentido de que cada tratamiento aparece en cada
bloque.
- Los tratamientos se asignan al azar dentro de cada bloque.
- Este tipo de diseo tiene por objeto hacer que la variacin entre los sujetos
dentro de los subgrupos (bloque) resulte ms pequea que la variacin entre
los sujetos cuando no se hace ningn subgrupo o bloque.
8.10.2 Modelo aditivo lineal en el diseo bloque completamente aleatorio
En el diseo bloque completamente aleatorio con una observacin por unidad
experimental, las observaciones pueden ser representadas por el siguiente mo-
delo aditivo lineal (de efectos fijos):
Y
ij
= +
i
+
j
+ e
ij
i = 1,2,..., t (tratamientos)
j = 1,2,..., r (bloques)
Donde:
: es el efecto medio verdadero

i
: es el efecto verdadero del i-simo tratamiento.

j
: es el verdadero efecto del j-simo bloque
e
ij
: es el efecto verdadero de la unidad experimental en el j-simo bloque que est
sujeta al i-simo tratamiento.
Y
ij
: Respuesta de la de la unidad experimental en el j-simo bloque que est
sujeta al i-simo tratamiento.
Asunciones:
Los supuestos que deben cumplir los errores, son los siguientes: independencia,
homocedasticidad y Normalidad.
Adems:

j
= 0 e
ij
~N(0,
2
)
r
j = 1
Estadstica y diseo de experimentos
211
8.10.3 Representacin simblica de los datos en el diseo bloque
completamente aleatorio
Se presenta t tratamientos en r bloques:
Cuadro 8.2 . Representacin simblica de los datos en el diseo bloque
completamente aleatorio
Tratam. 1 2 ... i ... t
Totales
bloques
Bloque I
Bloque II
.
.
.
Bloque j
Bloque r
Y
11
Y
12
.
.
.
Y
1j
.
.
.
Y
1r
Y
21
Y
22
.
.
.
Y
2j
.
.
.
Y
2r
...
...
...
...
Y
i1
Y
i2
.
.
.
Y
ij
.
.
.
Y
ir
...
...
...
...
Y
t1
Y
t2
.
.
.
Y
tj
.
.
.
Y
tr
Y.1
Y.2
.
.
.
Y
.r
Total Trat. Y
1
Y
2
... Y
i
... Y
r
Y
..
8.10.4 Anlisis de varianza en el diseo bloque completamente aleatorio
En esta parte desarrollaremos el Anlisis de Varianza para el modelo de Efectos
fijos del diseo bloque completamente aleatorio.
Para el cual se siguen los siguientes pasos:
1. Formulacin de las hiptesis
As las hiptesis de inters son:
Para tratamientos Para bloques
H
0
:
1
=
2
= ... =
t
H
0
:
1
=
2
= ... =
r
H
1
: al menos un
i

j
H
1
: al menos un
i

j
2. Presentar un nivel de significacin adecuado, generalmente = 0,05
3. Realizar los clculos respectivos. Se presentan los clculos en la Tabla 3
(tambin puede ser directamente aplicando paquetes estadsticos como el
Minitab, SPSS y otros)
Se debe tener presente:
La Ecuacin Fundamental del Anlisis de Varianza
SCTo = SCTr + SCBI + SCE

Cecilia Ros Varillas
212
Tabla 3. Anlisis de varianza para un diseo bloque completo al azar
Fuente de
Variacin
Grados de
Libertad
Suma de
Cuadrados
Cuadrados
Medios
F calculado
(Fc)
Tratamientos t 1
2
. i
y
TC
r

SCTr
t 1
CMTr
CME
Bloque r 1
2
. j
y
TC
t

SCBloque
(r 1)
CMBloque
CME
Error (t 1)(r 1)
SC
E
(por
diferencia)
SCE
(t 1)(r 1)
Total tr 1
2
1 1
t r
ij
i j
y TC
= =

Matemticamente:

.
1
1, 2,....,
r
i ij
j
Y Y i t
=
= =


.
1
1, 2,....,
t
j ij
i
Y Y j r
=
= =



.. . .
1 1 1 1
t r t r
i j ij
i j i j
Y Y y Y
= = = =
= = =


2
.. Y
TC
tr
=
4. Analizar las regiones crticas
Se establece las regiones crticas y se compara con los F calculados, tanto para
bloques como para tratamientos.

F
c(tr)
=
CMTr
~ F
1[(gl.Trat),(gl.Error)]
CME

F
c(bloq)
=
CMBloque
~ F
1[(gl.bloque),(gl.Error)]
CME
F
1[(gl.Trat),(gl.Error)]

Figura 8.2. Regiones crticas en el diseo bloque
completamente aleatorio
Estadstica y diseo de experimentos
213
5. Conclusiones e interpretacin.
Conclusiones:
Si F
c
> F
1
=> Se rechaza H
0
Si F
c
< F
1
=> No se rechaza H
0
Ejemplo en el diseo bloque completamente aleatorio
Un ingeniero textil, mide la resistencia a la ruptura de cinco clases de fibras tex-
tiles por medio de cuatro distintos instrumentos, y obtiene los resultados (en
onzas) que se muestran en la tabla siguiente:
Instrumentos de medicin
Fibras I
1
I
2
I
3
I
4
F
1
F
2
F
3
F
4
F
5
20,6
24,7
25,2
24,5
19,3
20,7
26,5
23,4
21,5
21,5
20,0
27,1
21,6
23,6
22,2
21,4
24,3
23,9
25,2
20,6
a. Indique cul es la variable respuesta y cul es el factor principal.
b. Calculando el ANVA, responda si Existe diferencias significativas entre las
fibras textiles?, Los instrumentos de medicin tienen que ver en las diferencias
de la resistencia a la ruptura? Y diga si el bloqueo tuvo xito. = 0,05. Interprete
sus resultados.
Solucin
a. La variable respuesta es: resistencia a la ruptura de fibras textiles (en onzas)
El factor principal: fibras textiles
b. Para calcular el ANVA, las hiptesis de inters son:
Para fibras textiles Para instrumentos de medicin
H
0
:
1
=
2
=
3
=
4
=
5
H
0
:
1
=
2
=
3
=
4
H
1
: al menos un
i

j
H
1
: al menos un
i

j
Realizando los clculos:
Instrumentos de medicin
Fibras I
1
I
2
I
3
I
4
Total Fibras
F
1
F
2
F
3
F
4
F
5
20,6
24,7
25,2
24,5
19,3
20,7
26,5
23,4
21,5
21,5
20,0
27,1
21,6
23,6
22,2
21,4
24,3
23,9
25,2
20,6
82,7
102,6
94,1
94,8
83,6
Total Inst.Med. 114,3 113,6 114,5 115,4 457,8
Cecilia Ros Varillas
214
Se calcula primero el trmino de correccin
( )
2
2
457,8
..
10479, 042
20
Y
TC
tr
= = =
Se procede a calcular la Suma de cuadrados del total
( ) ( )
2
1 1
10574, 86 10479, 042 95, 818
t r
ij
i j
SCto y TC
= =
= = =

Se calcula la Suma de cuadrados de las fibras y de los instrumentos de medicin


( )
2 2 2 2 2
.
82, 7 +102, 6 +94,1 +94, 8 +83, 6
10479, 042 70,173
4
i
y
SCFibras TC
r
= = =

( )
2
2 2 2 2
.
114, 3 +113, 6 +114, 5 +115, 4
10479, 042 0, 330
5
j
y
SCInsMed TC
t
= = =

Se completa los otros resultados de manera inmediata en el ANVA:


Fuente de
Variacin
Grados de
Libertad
Suma de
Cuadrados
Cuadrados
Medios
F calculado
(Fc)
Fibras 4 70,173 17,54325 8,316
Instrumento
Medicin
3 0,330 0,11 0,0521
Error 12 25,315 2,10958
Total 19 95,818
Luego de ver los resultados del ANVA, comparamos los F calculados con los F de
la tabla, se usa = 0,05, entonces:
Para fibras:
F
c(fibras)
=

CMfibras


F
(0,95)[4,12]gl
= 3,26
CME
F
c(fibras)
= 8,316 > 3,26 => Se rechaza H
0

Estadstica y diseo de experimentos
215
Para instrumentos de medicin:
F
c(InsMed)
=

CMInsMed


F
(0,95)[3,12]gl
= 3,49
CME
F
c(InsMed)
= 0,0521 < 3,49 => No se rechaza H
0

Conclusin:
Existen diferencias significativas entre las fibras textiles; sin embargo, los instru-
mentos de medicin no afectan a esta diferencia en la resistencia a la ruptura, por
lo tanto el bloqueo no tuvo xito.
Al decir que hay diferencias significativas entre las fibras textiles, se debe enten-
der que al menos dos de ellas nos dan resultados diferentes, y si se desea compa-
rar entre ellas, en estadstica hay pruebas de comparacin que nos permite saber
entre cuales hay diferencias, esas pruebas de comparacin lo realiza de manera
inmediata cualquier paquete estadstico.
8.11 DISEO CUADRADO LATINO (DCL)
El diseo cuadrado latino es una ampliacin del diseo bloque completo aleato-
rio. Este diseo se usa frecuentemente en experimentos agrcolas e industriales.
Este diseo permite al investigador delimitar, con toda seguridad, los efectos re-
lativos de varios tratamientos, cuando se impone a las unidades experimentales
una restriccin del tipo doble bloqueo.
El efecto del doble agrupamiento es el de eliminar de los errores todas las dife-
rencias entre filas, al igual que todas las diferencias entre columnas. As el cua-
drado latino mediante una planificacin hbil, da ms oportunidad para reducir
los errores que el diseo bloque completo al azar.
8.11.1 Caractersticas del diseo cuadrado latino
- Las unidades experimentales se agrupan en dos direcciones: filas y columnas,
y los tratamientos se asignan al azar en las unidades experimentales tal que en
cada fila y en cada columna se encuentren todos los tratamientos.
- Existe homogeneidad dentro de filas y dentro de columnas.
- El nmero de filas es igual al nmero de columnas e igual al nmero de
tratamientos.
Cecilia Ros Varillas
216
8.11.2 Modelo aditivo lineal en el diseo cuadrado latino
En el diseo cuadrado latino con una observacin por unidad experimental, las
observaciones pueden representarse mediante el modelo aditivo lineal siguiente:
Y
ij(k)
= + f
i
+ c
j
+
k
+ e
ij(k)
i = 1, 2, ...., n j = 1, 2, ...., n k = 1, 2, ...., n
Donde:
: Media general
f
i
: Efecto de la i-sima fila
c
j
: Efecto de la j-sima columna

k
: Efecto del k-simo tratamiento
e
ij(k)
: Error experimental de la unidad observada de la fila i, columna j,
correspondiente al tratamiento k.
8.11.3 Anlisis de varianza en el diseo cuadrado latino
En esta parte desarrollaremos el Anlisis de Varianza para el modelo de Efectos
fijos del diseo cuadrado latino.
Para el cual se siguen los siguientes pasos:
1. Formulacin de las hiptesis
As las hiptesis de inters son:
Para filas Para columnas
H
0
:
f1
=
f2
= ... =
fn
H
0
:
c1
=
c2
= ... =
cn
H
1
: al menos un
i

j
H
1
: al menos un
i

j
Para tratamientos
H
0
:
1
=
2
= ... =
n
H
1
: al menos un
i

j
2. Presentar un nivel de significacin adecuado, generalmente = 0,05
.
3. Realizar los clculos respectivos. Se presentan stos clculos en la Tabla 4 (
tambin puede ser directamente aplicando paquetes estadsticos como el
Minitab, SPSS y otros)
Estadstica y diseo de experimentos
217
Tabla 4 Anlisis de varianza en el diseo cuadrado latino
F.V. g.l. S.C C.M. Fcal
Fila
n 1
2
.(.) i
Y
TC
n

SCfila
n 1
Fc(c)fila
Columna n 1
2
. (.) j
Y
TC
n

SCcolum
n 1
Fc(Col)
Tratamiento n 1
2
.. ( ) k
Y
TC
n

SCTr
n 1
Fc(tr)
EE (n-1)(n-2) SCEE
SCE
(n 1) (n 2)
Total n
2
1
Y
2
ij(k)
TC
Donde:
2
..(.)
2
Y
TC
n
=
4. Analizar las regiones crticas
Se establece las regiones crticas y se compara con los F calculados, tanto para
filas, columnas y tratamientos.

( ) ( ) ( )

c fila c colum c tr
CMfila CMcolum CMTr
F F F
CME CME CME
= = =

Cada uno de los F calculados anteriores se compara con el mismo F tabulado:
El valor del F tabulado, es el mismo para cada fuente de variabilidad, cada F
calculado se contrasta con el mismo F tabulado.

F
1[(n 1)gl,(gl.Error)]
5. Conclusiones e interpretacin.
Conclusiones:
Si F
c
> F
1
=> Se rechaza H
0
Si F
c
< F
1
=> No se rechaza H
0
Ejemplo en Diseo Cuadrado Latino
La tabla que se muestra contiene los resultados (codificados) de nueve distintas de-
terminaciones de la viscosidad de caucho de silicn usando tres mtodos diferentes
(A, B, C). Se ha seleccionado materiales proporcionados por tres proveedores dife-
rentes aparentemente de la misma calidad y las muestras se han enviado a tres dife-
Cecilia Ros Varillas
218
rentes laboratorios. Analice los resultados en busca de efectos significativos, usando
una probabilidad de error del 5%. Haga los comentarios que correspondan.
Laboratorios
Proveedores I II III
1 9(A) 8(B) 3(C)
2 7(B) 5(C) 7(A)
3 2(C) 4(A) 2(B)
Solucin
La variable respuesta es: determinaciones de la viscosidad de caucho de silicn.
El factor principal: Mtodos para la determinacin de la viscosidad.
Hiptesis a probar:
Para proveedores Para laboratorios
H
0
:
p1
=
p2
=
p3
H
0
:
l1
=
l2
=
l3
H
1
: al menos un
i

j
H
1
: al menos un
i

j
Para mtodos
H
0
:
A
=
B
=
C
H
1
: al menos un
i

j
Realizando los clculos:
Laboratorio Total
Proveedor I II III proveedor
1 9(A) 8(B) 3(C) 20
2 7(B) 5(C) 7(A) 19
3 2(C) 4(A) 2(B) 8
Total laboratorio 18 17 12 47
Ordenando los tratamientos:
Mtodos
A B C
9 8 3
7 7 5
4 2 2
Total Mtodos 20 17 10
Estadstica y diseo de experimentos
219
Clculo del trmino de correccin:
( )
2
2
..(.)
2
47
245, 4444
9
Y
TC
n
= = =
Calculando la suma de cuadrados del total
SCTotal = Y
2
ij(k)
TC = 301 245,4444 = 55,5556
Calculando la suma de cuadrados para proveedor, laboratorios y mtodos
2 2 2
20 +19 +8
r 245, 4444 29, 5556
3
SCp oveedor = =
2 2 2
18 +17 +12
245, 4444 6, 8889
3
SClaboratorio = =
2 2 2
20 +17 +10
245, 4444 17, 5556
3
SCmtodos = =
SCE = SCTotal (SCproveedor + SClaboratorio + SCmtodos)
Los resultados se colocan en el ANVA respectivo y se realizan de manera inme-
diata los otros clculos:
F.V. g.l. S.C C.M. Fcal F
0.95
Proveedor 2 29,5556 14,7778 19,0007 19
Laboratorio 2 6,8889 3,44445 4,428737 19
Mtodos 2 17,5556 8,7778 11,2861 19
EE 2 1,5555 0,77775
Total 8 55,5556
Al comparar los F calculados con el F de la tabla:
F
1[(n 1)gl,(gl.Error)]
= F
0,95(2,2)gl
= 19
Se concluye lo siguiente:
En cuanto a los Mtodos empleados:
Fc = 11,2861 < F
1
= 19

=> No se rechaza H
0
No hay diferencias significativas entre los mtodos. Los mtodos empleados no
interfirieren en las diferencias de las determinaciones de caucho de silicn, por lo
tanto, igual da realizarlo con cualquiera de esos mtodos.
Cecilia Ros Varillas
220
En cuando a laboratorios donde se realizan los anlisis:
Fc = 4,428737 < F
1
= 19

=> No se rechaza H
0
No hay diferencias significativas entre los laboratorios donde se realizan los an-
lisis; los resultados realizados por los analistas de cada laboratorio no se dife-
rencian, por lo tanto no interfirieren en las diferencias de las determinaciones de
caucho de silicn, igual da realizarlo con cualquiera de los laboratorios.
En cuando a los proveedores:
Fc = 19,40007 > F
1
= 19

=> Se rechaza H
0
En este caso, algunos investigadores pueden considerar que son iguales, tanto el
F calculado como el F de la tabla, y la decisin es segn su criterio; sin embargo
si respetamos el resultado como est, se observa que Fcal es mayor, por lo tanto
hay diferencias significativas entre los proveedores que han proporcionado los
materiales, al menos dos de los proveedores estn enviando materiales que inter-
firieren en las diferencias de las determinaciones de caucho de silicn.
8.12 DISEOS ESTADSTICOS USANDO MINITAB
El paquete estadstico Minitab, proporciona de manera directa y prctica muchas
soluciones inmediatas como los Diseos Estadsticos,
Ejemplo en Diseo Completamente Aleatorio.
Se sospecha que cuatro mquinas llenadoras en una planta, estn sacando pro-
ductos con diferentes pesos.
Se realiz un experimento para comprobarlo y los datos en onzas son los si-
guientes:
Peso neto en onzas
Mquinas
A B C D
12,25
12,27
12,24
12,25
12,20
12,18
12,25
12,26
12,24
12,23
12,23
12,20
12,20
12,17
12,19
12,18
12,16

Estadstica y diseo de experimentos
221
Solucin
Paso 1
En la Columna 1, la variable respuesta (Peso Neto en onzas) ingrese los datos, en
la Columna 2 el Tipo de Mquina.
Paso 2
Para la Prueba de Homogeneidad de Varianzas, seleccione: Stat/ ANOVA/ Test
for Equal Variances
En la ventana Test for Equal Variances, en Response: Peso Neto, en Factors: M-
quinas y en Title: Prueba de Homogeneidad de Varianzas.
Cecilia Ros Varillas
222
Como p-value > 0,05, por defecto, indicara que las varianzas son estadsticamente
homogneas.
Nota: En todo paquete estadstico aparece por defecto el valor p-value, y se com-
para as:
p > 0,05 => No se rechaza H
0
p < 0,05 => Se rechaza H
0
=> hay diferencias significativas
Paso 3
Para realizar el ANVA para el ejemplo en DCA: Stat / ANOVA / One-Way.
Se marca Comparisons en la ventana One-Way Multiple Comparisons, se per-
mite elegir un mtodo (se ofrecen tres distintos) se marca generalmente Prueba
de Tuckeys, para calcular intervalos de confianza para las diferencias entre me-
dias (intervalos necesarios en el caso de que se observen diferencias significati-
vas) y en Graphs se pueden representar los residuos para validar el mtodo
aplicado para la resolucin.
One-way ANOVA: peso versus mquinas
Source DF SS MS F P
Mquinas 3 0,010726 0,003575 5,55 0,011
Error 13 0,008380 0,000645
Total 16 0,019106
El p-valor del anlisis de varianza sale 0,011< 0,05, luego estadsticamente se ob-
servan diferencias significativas en el peso neto de los productos llenados por las
mquinas.
Como las pruebas se han realizado con 4 mquinas distintas, se requiere con-
cluir entre cules de estas mquinas existe esta diferencia (entre todas, o solo
entre algunas de ellas). El Minitab ofrece stos mtodos de comprobacin, me-
diante el mtodo Tuckey (uno de los ms utilizados). Edgar Acua, en su libro
Anlisis Estadstico de datos usando Minitab, presenta todos los procedimien-
tos necesarios.
Ejemplo en diseo bloque completamente aleatorio
Una industria qumica desea probar el efecto de cuatro agentes qumicos sobre
la resistencia de un tipo particular de tela. Dado que puede haber variabilidad
entre un rollo de tela y otro decide utilizar a los rollos de tela como bloques, y
selecciona 5 rollos y les aplica los cuatro agentes qumicos en orden aleatorio. A
continuacin se presentan los datos de la resistencia a la tensin (en psi).
Estadstica y diseo de experimentos
223
Agente
qumico
Rollo de tela
1 2 3 4 5
1
2
3
4
73
73
75
73
68
67
68
71
74
75
78
75
71
72
73
75
67
70
68
69
a. Indique cul es la variable respuesta y los factores, indicando cual es el factor
de inters.
b. Plantee las hiptesis que interesara probar en esta situacin y mediante una
tabla ANVA, determine si hay diferencias entre los agentes qumicos y si las
hay entre los rollos de tela. = 0.05.
Solucin
Paso 1
En la Columna 1, la variable respuesta (Resistencia a la Tensin) ingrese los da-
tos, en la Columna 2 (Rollo de Tela) y en la Columna 3 (Agente Qumico).
Paso 2
Para realizar el ANVA para el ejemplo en DBCA: Stat / ANOVA / Two-Way.
Cecilia Ros Varillas
224
Results for: dbca.MTW
Two-way ANOVA: RESISTENCIA A LA TENSIN versus Agente Qumico,
Rollo de tela
Source DF SS MS F P
Agente Qumico 3 12,95 4,3167 2,38 0,121
Rollo de tela 4 157,00 39,25 21,61 0,000
Error 12 21,80 1,8167
Total 19 171,75
Conclusin: p-value = 0,121>0,05 no existe diferencias significativas entre los
Agentes Qumicos.
p-value = 0,000 < 0,05 existe diferencias significativas entre los rollos de tela.
Ejemplo en cuadrado latino
Un diseo estadstico se us para comparar las resistencias de las conexiones de
conductores con sus terminales por medio de tres diferentes mtodos: A, B, C.
Las conexiones fueron hechas por tres operadores diferentes y luego encapsula-
das usando tres plsticos diferentes, con los siguientes resultados, expresados en
libras de fuerza requeridas para romper la unin.
Operador
O1 O2 O3
P1 3,0 A 2,4 B 1,9 C
P2 2,1 B 2,7 C 2,3 A
P3 2,1 C 2,6 A 2,5 B
Estadstica y diseo de experimentos
225
Analice esos resultados, aplique las hiptesis correspondientes y d sus conclu-
siones.
Solucin
Paso 1
En la Columna 1, la variable respuesta (Fuerza) ingrese los datos, en la Columna
2 (Mtodos), en la Columna 3 (Operadores) y en la Columna 4 (Plsticos).
Paso 2
Para realizar el ANVA para el ejemplo en DCL: Stat-ANOVA-General Linear Mo-
del.
En la ventana que aparece, en Responses: Fuerza, en Model: Selecciones MTO-
DOS OPERADORES PLSTICOS
General Linear Model: Fuerza versus OPERADORES, PLSTICOS, MTODOS
Cecilia Ros Varillas
226
Analysis of Variance for Fuerza, using Adjusted SS for Tests
Source DF SS MS F P
operadores 2 0,1667 0,0833 0,33 0,752
plsticos 2 0,0067 0,0033 0,01 0,987
mtodos 2 0,2600 0,1300 0,51 0,661
Error 2 0,5067 0,2533
Total 8 0,9400
El p-value del anlisis de varianza en los tres casos es p > 0,05, estadsticamente se
observan que no hay diferencias significativas en los operadores, tipos de plsti-
cos y tampoco hay diferencias entre los mtodos.
8.13 EJERCICIOS DESARROLLADOS
8.13.1 Ejercicios desarrollados en diseo completamente aleatorio
Ejercicio 1
Un fabricante de calzado desea mejorar la calidad de las suelas, las cuales se
pueden hacer con uno de los cuatro tipos de cuero A, B, C, y D disponibles en el
mercado.
Para hacer ello, prueba los cueros con una mquina que hace pasar los zapatos
por una superficie abrasiva; la suela de los zapatos se desgasta al pasarla por
dicha superficie. Como criterio de desgaste se usa la prdida de peso despus de
un nmero fijo de ciclos. Se prueban en orden aleatorio 24 zapatos, seis de cada
tipo de cuero.
(Prdida de peso)
A B C D
264
260
258
241
262
255
208
220
216
200
213
206
220
263
219
225
230
228
217
226
215
224
220
222
a. Realice el test de Bartlett para varianzas homogneas. = 0,01
b. El tipo de cuero tiene influencia sobre la calidad de la suela? = 0,01
Estadstica y diseo de experimentos
227
Solucin
a. Se realizan clculos con la tabla de datos:
A B C D
264 208 220 217
260 220 263 226
258 216 219 215
241 200 225 224
262 213 230 220
255 206 228 222
n
1
6 6 6 6 24
Y
i
1540 1263 1385 1324 5812
Y
i
256,67 210,5 230,83 220,67
S
i
8,29 7,26 16,34 4,18
Se realiza la prueba de Homogeneidad de Varianzas mediante el Test de Bartlett:
) 1 (
) 1 (
1
1
2
2

=
=
t
i
i
t
i
i i
n
S n
S =
2 2 2 2
5 5 5 5
20
A B C D
S S S S + + +
= 101,474925 (CMEE)
1
1
1 1 1
1
3(4 1) ( 1)
( 1)
t
t
i
i
i
i
C
n
n
=
=
(
(
| |
( = +
|

(
\ .

(

= 1,0833
2 2 2
1 1
1
( 1) ln ( 1) ln
t t
cal i i i
i i
n S n S
C

= =
(
=
(


=8,476565
Se compara con = 0,01 =>
0,993(3gl)
= 11,3449
Conclusin:
Si
cal
< 11,3449
Luego, se concluye que: existe Homogeneidad de Varianzas
b. Planteamiento del experimento: Observar el efecto del tipo de cuero sobre la
calidad de las suelas.
2
2
Cecilia Ros Varillas
228
Tratamiento (Factor): tipo de cuero
Niveles: cueros A, B, C, y D
Variable de respuesta: calidad de las suelas, medida como la prdida de peso
despus de un nmero fijo de ciclos.
Repeticiones: seis
Hiptesis a contrastar
H
o
:
A
=
B
=
C
=
D
(El tipo de cuero no tiene efecto sobre la calidad de las
suelas).
H
1
: Al menos un par
i

j
. (El tipo de cuero si tiene efecto sobre la calidad de
las suelas)

2
2 ..
1 1
24
n t
ij
i j
Y
SCTotal y
= =
| |
= =
|
\ .


2
2 2 2
5812
264 260 ... 222 9101, 33
24
SCTo
| |
= + + + =
|
\ .
Ahora se calcula la suma de cuadrados de tratamiento (tipos de cuero):

2
2
1
. ..
(tipos de cuero) 7072, 33
t
i
i
y
y
SC
n tn
=
| |
= =
|
\ .

La suma de cuadrados del error experimental se puede calcular por diferencia:


SCE = SCTo SCTr = 9101.33 7072.33 = 2029
Los valores calculados se reemplazan en la tabla del ANVA, se completan los
cuadrados medios y los dems clculos:
Fuente de
Variacin
Grados de
Libertad
Suma de
Cuadrados
Cuadrados
Medios
F calculado
(Fc)
Tipos de cuero 3 7072,33 2357,44 23,24
Error 20 2029,0 101,45
Total 23 9101,33
Ftab(3,20) = 3,098
Como Fcal > Ftab > Se rechaza Ho
El factor tipo de cuero influye sobre la calidad de las suelas, es claro observar
que los diferentes tipos de cuero, dan calidades diferentes en cuanto a la
prdida de peso.
Estadstica y diseo de experimentos
229
Ejercicio 2
En cierto estudio de calibracin de espectroscopa de absorcin atmica, las me-
didas de respuesta fueron las unidades de absorcin de un instrumento segn la
cantidad de cobre diluido en una solucin cida. Se usaron cinco niveles de cobre
con cuatro rplicas del nivel cero y dos rplicas de los otros cuatro niveles. En la
siguiente tabla se dan los datos de espectroscopia para cada nivel de cobre como
microgramos de cobre/mililitro de solucin.
Cobre (mg/ml)
0,00 0,05 0,10 0,20 0,50
0,045
0,047
0,051
0,054
0,084
0,087
0,115
0,116
0,183
0,191
0,395
0,399
a. Realice el Test de Bartlett para varianzas homogneas: = 0,05
b. Calcule el ANVA
c. Pruebe la hiptesis de que no hay diferencias significativas entre las medias de
los cinco niveles de cobre, con = 0,05. Interprete sus resultados.
Solucin
Se realizan clculos con la tabla de datos:
Cobre (mg/ml)
0,00 0,05 0,10 0,20 0,50
0,045 0,084 0,115 0,183 0,395
0,047 0,087 0,116 0,191 0,399
0,051
0,054
n
1
4 2 2 2 2 12
Y
i
0,197 0,171 0.231 0,374 0,794
Y
i
0,04925 0,08550 0,11550 0,187 0,397
S
i
0,00403 0,00212 0,00071 0,00566 0,00283
a. Se realiza la prueba de Homogeneidad de Varianzas mediante el Test de
Bartlett:

2
2 2 2 2 2
2 1 1 2 3 4 5
1
( 1)
3 1 1 1 1
0, 0000134
7
( 1)
t
i i
i
t
i
i
n S
S S S S S
S
n
=
=

+ + + +
= = =


(CME)
Cecilia Ros Varillas
230
1
1
1 1 1
1
3( 1) ( 1)
( 1)
t
t
i
i
i
i
C
t n
n
=
=
(
(
| |
( = +
|

(
\ .

(

1 1 1
1 1 1 1 1 1, 3492
3(5 1) 3 7
C
( | |
= + + + + + =
| (

\ .
2 2 2
1 1
1
( 1) ln ( 1) ln
t t
cal i i i
i i
n S n S
C

= =
(
=
(


( ) ( )
2 2
1
1
7 ln 0, 0000134 ( 1) ln
1, 3492
t
cal i i
i
n S
=
(
=
(

( ) ( ) ( )
2
1
7 ln 0, 00334 81, 9807 2, 5489
1, 3492
cal
= = (

Se compara: Para = 0.05 =>
1
=
0,95(4)gl
= 9,4877
Conclusin:
Si
cal
= 2,5489 < 9,4877
Por lo tanto: existe Homogeneidad de Varianzas
b. Clculo del ANVA
La hiptesis a probar, para niveles de cobre:
H
0
:
1
=
2
=
3
=
4
=
5
H
1
: al menos un
i

j
Realizando los clculos:
2
2
1, 767
..
0, 26019075
12 12
Y
TC = = =
2
1 1
n t
ij
i j
SCTotal y TC
= =
= =

SCTo = 0,045
2
+ 0,047
2
+ ... + 0,399
2
(0,26019075) = 0,1760623
2 2
2
Estadstica y diseo de experimentos
231
Ahora se calcula la suma de cuadrados de tratamiento (niveles de cobre):
( )
2 2 2 2 2
0,197 0,171 0, 231 0, 374 0, 794
(niveles de cobre) + + + + 0, 26019075 0,1759685
4 2 2 2 2
SC
| |
= =
|
\ .
(0,26019075) = 0,1759685
La suma de cuadrados del error experimental se puede calcular por diferencia:
SCE = SCTo SCTr = 0,0000938
Los valores calculados se reemplazan en la tabla del ANVA, se completan los
cuadrados medios y los dems clculos:
F.V. g.l. S.C C.M. Fcal
Niveles de cobre 4 0,1759685 0,0439921 3284,75
Error 7 0,0000938 0,0000134
Total 11 0,1760623
De la tabla de F acumulativa: F
(1)(4,7)gl
= F
0,95(4,7)gl
= 4,12
Como el Fcal es mayor que el F tabulado, entonces se rechaza H
o
, por lo tanto se
concluye que s hay diferencias significativas en los niveles de cobre, al menos
dos de los niveles producen diferencias en los resultados de espectroscopa en
las unidades de absorcin.
Ejercicio 3
Para estudiar el efecto de la temperatura sobre el rendimiento de un proceso
qumico se produjeron cinco lotes con cada uno de tres valores de temperatura
(50C, 60C y 70C). Luego de presentar los datos y realizando los clculos en
MINITAB, el ANVA result:
One-way ANOVA: Rendimiento versus Temperaturas
Source DF p
Temperaturas 2 0,210
Error 12
Total 14
a. Indique la unidad experimental, la variable respuesta y el factor (tratamientos)
y sus niveles.
Cecilia Ros Varillas
232
b. El nivel de temperatura tiene efecto sobre la media del rendimiento del
proceso qumico?
Solucin
a.
La unidad experimental = 1 lote
Variable respuesta. = Rendimiento del proceso qumico
Factor = Temperatura
Niveles = 50C, 60C y 70C
b.
El Minitab calcula automticamente el p-value (valor de probabilidad) que en
este caso es p = 0,210 > 0,05 => No se rechaza H
0

El nivel de temperatura no tiene efecto sobre el rendimiento del proceso
qumico.
8.13.2 Ejercicios desarrollados en Diseo Bloque Completamente
Aleatorio
Ejercicio 1
Se realiza un experimento para determinar el efecto de cuatro sustancias qumi-
cas diferentes sobre la resistencia de una tela. Las sustancias se emplean como
parte del proceso terminal de planchado permanente. Para ello, se escogen cinco
muestras de tela y se aplica un diseo por bloques completos aleatorizados me-
diante la prueba de cada sustancia en un orden aleatorio sobre cada una de las
muestras de tela. El promedio general es de 1,96 y el Coeficiente de Variabilidad
(CV) es 14,44 %. El ANVA respectivo es el siguiente:
Fuentes de
Variacin
G.L.
Suma de
Cuadrados
Cuadrado
Medio
Fcalc
Sustancias 75,13
Muestras 6,69
Error
Total
a. Completar el Cuadro de ANVA
b. Determine si existe diferencias significativas entre las sustancias qumicas, y
tambin entre las muestras. ( = 0,05).
Solucin
a. Las pruebas de hiptesis son las siguientes:
Estadstica y diseo de experimentos
233
H
0
:
sus
1
=
sus
2
=
sus
3
=
sus
4
H
1
: al menos dos son diferentes
H
0
:
muestras
1
=
muestras
2
=
muestras
3
=
muestras
4

=
muestras
5
H
1
: al menos dos son diferentes
Datos:

..
1, 96 100% 14, 44%
20
Y S
Y CV S CME
Y
= = = = =
Reemplazando en CV:
100% 14, 44% 0, 08010
1, 96
CME
CME = =
75,13 6, 0179
0, 0801
Tr Tr
c Tr
CM CM
F CM
CME
= = = =
Finalmente:
Fuentes de
Variacin
Grados de
Libertad
Suma de
Cuadrados
Cuadrado
Medio
Fcalc
Sustancias 3 18,0537 6,0179 75,13
Muestras 4 6,69 1,6725 20,8801
Error 12 0,9612 0,08010
Total 19
b. Para las sustancias qumicas: F
(0,95) (4,7)gl
= 3,49
F
cal
= 75,13 > 3,49 => Se rechaza H
0
Para las muestras: F
(0,95) (4,12)gl
= 3,26
F
cal
= 20,8801 > 3,26 => Se rechaza H
0
S existen diferencias significativas entre las sustancias qumicas, y tambin
entre las muestras, es decir afectan la resistencia de la tela.
Ejercicio 2
Los datos presentados son ensayos de variedades de trigo. Cuatro variedades
de trigo crecieron en cada una de cinco localidades diferentes. Las respuestas en
bushels por acre, son dadas en la tabla siguiente:
Cecilia Ros Varillas
234
Variedades
Loc. 1 2 3 4
1 43,60 24,05 19,47 19,41
2 40,40 21,76 16,61 23,84
3 18,08 14,19 16,69 16,08
4 19,57 18,61 17,78 18,29
5 45,20 29,33 20,19 30,08
Asumiendo varianza poblacionales iguales y distribucin Normal: ( = 0,05)
a. Calcule un intervalo de confianza para la verdadera varianza de la variedad 3
de trigo.
b. Determine si hay diferencias significativas en las variedades
c. Debido a que la construccin de bloques se ha diseado para controlar el efecto
de una variable extraa, la pregunta natural es Ha tenido xito la construccin
de bloques?
Solucin
a.
2 2
2 2 3 3
3 3 2 2
1 2
( 1) ( 1) 4(2, 63602) 4(2, 63602)
11,1 0, 484
n S n S
P P
x x
o o
| | | |
=
|
|
\ .
\ .
Donde x
1(4gl) (0,975)
= 11,1 x
2(4gl)(0,025)
= 0,484
El intervalo de confianza para la varianza de la variedad 3 de trigo es:
[0,9499 ; 21,7853] (bushels por acre)
2
Realizando el ANVA, tenemos:
Fuentes de
Variacin
Grados de
Libertad
Suma de
Cuadrados
Cuadrado
Medio
Fcalc
1
F

Variedades 3 607,2691 222,423 7,0249 3,49
Localidades 4 601,6076 150,4019 4,7502 3,26
EE 12 379,9444 31,6620
Total 19 1648,8210
Para variedades: F
(1) (3,12)gl
= 3,49


F
cal
= 7,0249 > 3,49 => Se rechaza H
0
S, existe diferencia significativa de las respuestas dadas de los cuatro tipos de
variedades, es decir las variedades de trigo producen diferentes respuestas en
bushels por acre.
2 2
Estadstica y diseo de experimentos
235
c. Del ANVA, se recoge los resultados de F calculado y del F tabulado.
Para las localidades: F
(1) (4,12)gl
= 3,26
F
cal
= 4,7502 > 3,26 => Se rechaza H
0
Existe diferencias de las respuestas dadas de las cinco localidades, las localidades
producen diferentes respuestas en bshels por acre.
S, ha tenido xito el bloqueo.
Ejercicio 3
Se ha realizado un estudio para determinar si hay diferencias significativas entre
tres mtodos para montar un mecanismo. Se registraron los datos de 5 operarios
supuestamente de la misma velocidad. El nmero de montajes terminados dia-
rios por cada operario y con cada mtodo se present en una tabla y al desarrollar
el ANVA se tuvo los siguientes resultados:
F.V. G.L. S.C. C.M. F
calc
Mtodos 2
Operarios 90
Error Exp. 5
Total
Complete el ANVA y haga las pruebas de hiptesis respectivas.
Solucin
De la tabla se observa que:
( )
( )
2
c Met
CM Mt
F
CME
= =
Entonces:
( )
2 ( ) 10
5
CM Mt
CM Mt = =
Se completa la tabla del ANVA:
F.V. G.L. S.C. C.M. F
calc
Mtodos 2 20 10 2
Operarios 4 90 22,5 4,5
Error Exp. 8 40 5
Total 12 150
Cecilia Ros Varillas
236
Los valores de la Tabla de F son:
F
(0,95,2,8)
= 4,46 => F
cal
= 2 < 4,46 => No hay diferencias significativas
F
(0,95,4,8)
= 3,84 => F
cal
= 4,5 > 3,84 => Si hay diferencias significativas
No hay diferencias significativas entre los diferentes mtodos para montar un
mecanismo; sin embargo, el registro de los operarios si difieren en cuanto a la
velocidad del montaje del mecanismo.
8.13.3 Ejercicios desarrollados en Cuadrado Latino
Ejercicio 1
Se probaron 4 tipos de raciones alimenticias (A, B, C y D) para pollos, criados en
jaula tipo batera de 4 pisos (filas) y 4 casilleros (columnas). La variable analizada
fue: peso del pollo (kg) a las 8 semanas de edad.
Pisos
Casilleros
1 2 3 4
1 1,40(A) 1,38(B) 1,40(C) 1,60(D)
2 1,35(B) 1,28(A) 1,45(D) 1,62(C)
3 1,38(C) 1,40(D) 1,42(B) 1,63(A)
4 1,39(D) 1,39(C) 1,40(A) 1,60(B)
a. Realice el ANVA para determinar si existe diferencias significativas entre las
raciones alimenticias, tambin responda si Existe diferencias significativas
entre los pisos? y entre los casilleros?, interprete sus respuestas.
b. Utilice la prueba T para comparar si el peso promedio utilizando la racin C
es menor al peso promedio usando la racin B. Use = 0,05
Nota. Se asume que las varianzas poblacionales son iguales.
Solucin
a. Para realizar el ANVA:
Hiptesis a probar:
Para pisos: Para casilleros:
H
0
:
p1
=
p2
=
p3
=
p4
H
0
:
c1
=
c2
=
c3
=
c4
H
1
: al menos un
i

j
H
1
: al menos un
i

j

Estadstica y diseo de experimentos
237
Para raciones:
H
0
:
A
=
B
=
C
=
D
H
1
: al menos un
i

j
Realizando los clculos de los totales:
Pisos
Casilleros
Total
Pisos
1 2 3 4
1 1,40(A) 1,38(B) 1,40(C) 1,60(D) 5,78
2 1,35(B) 1,28(A) 1,45(D) 1,62(C) 5,7
3 1,38(C) 1,40(D) 1,42(B) 1,63(A) 5,83
4 1,39(D) 1,39(C) 1,40(A) 1,60(B) 5,78
Total
casilleros
5,52 5,45 5,67 6,45 23,09
Raciones
A B C D
1,40 1,38 1,40 1,60
1,28 1,35 1,62 1,45
1,63 1,42 1,38 1,40
1,40 1,60 1,39 1,39
Total
raciones
5,71 5,75 5,79 5,84 23,09
Clculo del trmino de correccin:
( )
2
23, 09
33, 32175625
16
TC = =
Calculando la suma de cuadrados del total
SCTotal = 33,4941 33,32175625 = 0,17234
Calculando la suma de cuadrados para raciones, pisos y casilleros
( )
2 2 2 2
5, 71 +5, 75 +5, 79 +5,84
33, 32175625 0, 002319
4
SCRaciones = =
2 2 2 2
5, 78 +5, 7 +5,83 5, 78
33, 32175625 0, 002169
4
SCpisos
+
= =
Cecilia Ros Varillas
238
2 2 2 2
5, 52 +5, 45 +5, 67 6, 45
33, 32175625 0,15932
4
SCcasilleros
+
= =
SCE = SCTotal (SCproveedor + SClaboratorio + SCmtodos)
Los resultados se colocan en el ANVA respectivo y se completan de manera in-
mediata los otros clculos:
ANVA G.L. S.C. C.M. F
calc
Raciones 3 0,002319 0,00077 0,54319
Pisos 3 0,002169 0,000723 0,50805
Casilleros 3 0,15932 0,053106 37,324
Error 6 0,00854 0,0014229
Total 15 0,17234
Al comparar los F calculados con los F de la tabla:
F
(1) [(n1)gl,(gl.Error)]
= F
0,95(3;6) gl
=

4,76


Se concluye lo siguiente:
En cuanto a las raciones probadas:
F
c
=

0,54319 <

F
1
= 4,76 => No se rechaza H
0
No existen diferencias significativas en los pesos de pollos, considerando las cua-
tro raciones alimenticias probadas.
En cuando a los pisos de las jaulas:
F
c
=

0,50805 <

F
1
= 4,76 => No se rechaza H
0
No hay diferencias significativas en los pesos de pollos, criados en los 4 pisos.
En cuando a los casilleros:
F
c
=

37,324 <

F
1
= 4,76 => Se rechaza H
0
Hay diferencias significativas en los pesos de pollos, criados en las 4 columnas o
casilleros, al menos dos de los casilleros, influyen en los pesos de los pollos.
b. Prueba de hiptesis para comparar los verdaderos pesos promedios usando
las raciones B y C.
Estadstica y diseo de experimentos
239
H
0
:
C

B
= 0
H
1
:
C
<
B
<>
C

B
< 0
(1, 4475 1, 4375) 0
0,12439
cal
p
t
S

= =
Donde S
P
= 0,08039
0,95
0,05
T(6gl)=-1,943
t
c
RA H
0
Hay evidencia estadstica para afirmar que el verdadero peso promedio de los
pollos usando la racin C no es menor que el verdadero peso promedio de los
pollos usando la racin B.
Ejercicio 2
Un ingeniero est investigando el efecto que tienen cuatro variedades de qui-
nua (A, B, C, D) sobre el rendimiento de una parcela agrcola. Se supuso, para
el diseo, que la humedad y el contenido de Nitrgeno del terreno derivan en
una heterogeneidad del medio y que un doble criterio de agrupamiento podra
reducir el error experimental. El ingeniero decide utilizar el DCL. Los resultados
se muestran a continuacin (en 100 kg por parcela).
Nitrgeno
Humedad
1 2 3 4
1 A= 8,5 B= 5,0 C=11,5 D= 8,2
2 B= 6,2 A= 10,1 D= 9,2 C= 10,5
3 C= 6,4 D= 2,4 B= 6,0 A= 9,0
4 D= 6,4 C= 9,8 A= 13,5 B= 5,8
a. Cul es la variable respuesta?
b. Realice el ANVA y pruebe las hiptesis respectivas
0 C
t RA H
Cecilia Ros Varillas
240
Solucin
a. La variable respuesta es: Rendimiento en 100 Kg por parcela
b. Las hiptesis a probar son las siguientes:
Para Nitrgeno: Para humedad:
H
0
:
N1
=
N2
=
N3
=
N4
H
0
:
h1
=
h2
=
h3
=
h4
H
1
: al menos un
i

j
H
1
: al menos un
i

j
Para variedades de quinua
H
0
:
A
=
B
=
C
=
D
H
1
: al menos un
i

j
Realizando los clculos respectivos, se calcula el ANVA:
F.V. G.L. S.C. C.M. Fcalc
Variedades de Quinua 3 58,9569 19,6523 21,2113
Nitrgeno 3 24,2169 8,0723 8,7127
Humedad 3 27,9419 9,3140 10,0529
Error 6 5,5587 0,9265
Total 15 116,6744
El F calculado de las variedades de quinua, del contenido de nitrgeno y la hu-
medad, es mayor que el F de la tabla; F
(0,95;3;6)
=

4,76

Entonces se concluye tanto las variedades de quinua, como la humedad y el con-
tenido de nitrgeno, afectan el rendimiento de la parcela agrcola.
Ejercicio 3
Un ingeniero est investigando el efecto que tienen cuatro mtodos de ensambla-
je (A, B, C y D) sobre el tiempo de ensamblaje (en horas) de un componente para
televisores a color. Se seleccionaron cuatro operadores para realizar el estudio.
Asumiendo varianzas homogneas. A continuacin se presentan los datos:
Orden de
Montaje
Operador
1 2 3 4
I 5,8 C 1,7 D 3,2 A 4,4 B
II 4,2 B 5,5 C 1,4 D 3,0 A
III 3,1 A 4,0 13 5,3 C 1,5 D
IV 1,5 D 3,3 A 4,1 B 5,5 C
Estadstica y diseo de experimentos
241
Realice el ANVA para las Pruebas de Hiptesis correspondientes y comparar si
existe diferencias entre los mtodos de montaje en estudio, entre los operadores
y entre las rdenes de montaje. Use = 0,05. Interprete sus resultados.
Solucin
Las hiptesis a probar son las siguientes:
Para orden de montaje: Para operador:
H
0
:
I
=
II
=
III
=
IV
H
0
:
1
=
2
=
3
=
4
H
1
: al menos un
i

j
H
1
: al menos un
i

j
Para Mtodos de ensamblaje
H
0
:
A
=
B
=
C
=
D
H
1
: al menos un
i

j
Realizando los clculos, el ANVA respectivo es:
F.V. G.L. S.C. C.M. Fcalc
1
F

Mtodo de ensamblaje
3 34,1769 11,3923 1272,8826 4,76
Operador
3 0,0519 0,0173 1,93296 4,76
Orden Montaje
3 0,2069 0,06897 7,70615 4,76
Error
6 0,0537 0,00895
Total 15 34,4894
Se concluye lo siguiente:
Los mtodos de ensamblaje y las rdenes de montaje tienen efecto sobre el tiem-
po de ensamblaje de un componente para televisores a color; sin embargo el es-
tudio realizado por los operadores no brinda diferencias significativas sobre el
tiempo de ensamblaje.
8.14 EJERCICIOS PROPUESTOS
8.14.1 Diseo completamente aleatorio
Ejercicio 1
Los datos que se muestran a continuacin son los grados de dureza Brinell obte-
nidos para muestras de cuatro aleaciones de magnesio:
Cecilia Ros Varillas
242
Aleacin 1: 66,3 63,5 64,9 61,8 64,3 64,7 65,1 64,5
Aleacin 2: 71,3 60,4 62,6 63,9 68,8 70,1
Aleacin 3: 68,3 65,5 64,9 71,8 64,3 64,8 67,1 62,6
Aleacin 4 71,3 70,4 62,5 63,4 65,8
Existe una diferencia significativa en los grados dureza de las cuatro aleaciones?
= 0,05.
Ejercicio 2
Se ensayan tres mtodos para la determinacin del calor de fusin del hielo en
caloras por gramo. Se desea conocer si existen diferencias entre los mtodos a un
nivel de significacin del 5%.
Mtodo A 79,9 80 79,9 80,2 80,5 80,4 80,3 80,1
Mtodo B 80 79,9 80,3 79,9 79,9 79,9
Mtodo C 78,9 85 74,9 82,2 81,5 78,4 80,5
Ejercicio 3
Un fabricante sospecha que el contenido de nitrgeno en un producto vara de
un lote a otro. Selecciona una muestra aleatoria de cuatro lotes y realiza cinco
determinaciones del contenido de nitrgeno en cada lote. Existe una diferencia
significativa en el contenido de nitrgeno de un lote a otro? = 0,05.
Lote
1 26,15 26,25 26,39 26,18 26,2
2 24,95 25,01 24,89 24,85 25,13
3 25 25,36 25,2 25,09 25,12
4 26,81 26,75 26,15 26,5 26,7
8.14.2 Diseo bloque completamente aleatorio
Ejercicio 1
Se efectu un experimento para comparar los efectos de tres catalizadores en el
rendimiento de un proceso qumico. Se llevaron a cabo tres ejecuciones del ex-
perimento, una empleando el catalizador A, otra usando el catalizador B y otra
utilizando el catalizador C. Tres das despus se obtuvieron muestras, una de
cada una de las ejecuciones, y se hicieron los anlisis, de manera similar (toman-
do muestras y efectuando los anlisis) se efectuaron cinco y siete das despus.
Analice e interprete los datos resultantes.
Estadstica y diseo de experimentos
243
Rendimientos codificados del proceso qumico
Das A B C
3 das 68 90 82
5 das 82 96 88
7 das 90 93 91
Ejercicio 2
En una compaa manufacturera, se usan micrmetros para comprobar calidad;
a su vez los micrmetros se comprueban por el uso de bloques calibradores. Sin
embargo, hay cinco departamentos y cada uno de ellos tiene sus propios micr-
metros y bloques calibradores. Debido a la sospecha de que hay variacin entre
micrmetros y/o bloques calibradores, el ingeniero de control de la calidad llev
a cabo una prueba utilizando una muestra al azar de instrumentos. Analice e
interprete los siguientes datos.
Bloque Micrmetro
Calibrador 1 2 3 4 5
A 0,0110 0,0115 0,0130 0,0151 0,0121
B 0,0135 0,0127 0,0132 0,0155 0,0128
C 0,0127 0,0124 0,0132 0,0152 0,0130
Ejercicio 3
Una industria qumica desea probar el efecto de cuatro agentes qumicos sobre
la resistencia de un tipo particular de tela. Dado que puede haber variabilidad
entre un rollo de tela y otro decide utilizar a los rollos de tela como bloques, y
selecciona 5 rollos y les aplica los cuatro agentes qumicos en orden aleatorio. A
continuacin se presentan los datos de la resistencia a la tensin (en psi).
Agente
qumico
Rollo de tela
1 2 3 4 5
1
2
3
4
73
73
75
73
68
67
68
71
74
75
78
75
71
72
73
75
67
70
68
69
a. Indique cul es la variable respuesta y los factores, indicando cual es el factor
de inters.
b. Plantee las hiptesis que interesara probar en esta situacin y mediante una
tabla ANVA, determine si hay diferencias entre los agentes qumicos y si las
hay entre los rollos de tela = 0,05.
Cecilia Ros Varillas
244
Ejercicio 4
Se desea determinar de qu manera la solubilidad del metronidazol se ve afec-
tada por los parabenos (conservadores) y las macromolculas no inicas, para lo
cual se realiza el siguiente experimento: Se preparan cuatro soluciones de macro-
molculas no inicas diferentes y se coloca cada una en tres conservadores; luego
se determinan las solubilidades del metronidazol en cada una de las macromol-
culas, obtenindose los siguientes resultados:
Macromolculas no inicas
Conservadores Sol. 1 Sol. 2 Sol. 3 Sol. 4
metilparabeno 146 107 153 107
etilparabeno 199 114 310 104
propilparabeno 364 115 781 108
Realizar las pruebas para las dos hiptesis correspondientes,
Ejercicio 5
En un experimento para comparar el porcentaje de eficiencia en la extraccin
de iones metlicos en solucin acuosa por agentes quelantes, se obtuvieron los
siguientes resultados:
Agente quelante
Das A B C D
1 84 80 83 79
2 79 77 80 79
3 83 78 80 78
Cada da se prepararon disoluciones del ion metlico (con concentracin especi-
ficada) y se realiz la extraccin con cada uno de los agentes quelantes, tomados
de una manera aleatoria.
a. Probar si los diferentes agentes quelantes tienen eficiencias significativamente
diferentes.
b. Probar si hay diferencias significativas da a da.
8.14.3 Diseo cuadrado latino
Ejercicio 1
Se realiz un experimento para asegurar las resistencias relativas a la abrasin de
4 tipos de pieles (A, B, C, D). Se us una mquina en la cual se probaron las mues-
tras en una cualquiera de cuatro posiciones. Puesto que se conoce que diferentes
Estadstica y diseo de experimentos
245
ejecuciones del experimento (repeticiones) dan resultados variables, se decidi
hacer 4 ejecuciones del mismo. Los datos son:
Ejecucin
Posicin
1 2 3 4
1
2
3
4
118(B)
127(D)
174(A)
130(C)
136(D)
141(B)
173(C )
170(A)
168(A)
129(C)
126(B)
125(D)
135(C)
151(A)
134(D)
95(B)
Analizar en el ANVA e interprete este problema.
Ejercicio 2
En un experimento para probar los sesgos relativos de tres instrumentos (X, Y,
Z) empleados en el muestreo de sacos de fertilizante, tres operarios usan cada
uno de los instrumentos en tres rdenes diferentes, obtenindose los resultados
que se muestran en el cuadro adjunto. Los datos son desviaciones (en dcimas
de uno por ciento) del porcentaje real de fsforo total encontrado en las mues-
tras con respecto al 10% nominal estampado en el saco. Determine si hay alguna
evidencia de sesgos instrumentales significativos. Existe adems, la duda de que
el orden del muestreo podra ser la causa de las desviaciones y tambin se dice
que depende de la persona (operario) que realiza el ensayo. Usar nivel de signi-
ficacin del 5%.
OPERARIO
Orden 1 2 3
1 10(X) 9(Z) 9(Y)
2 10(Y) 11(X) 9(Z)
3 11(Z) 10(Y) 10(X)
Ejercicio 3
Un investigador quiere evaluar la productividad de cuatro variedades de trigo
y decide realizar el ensayo en un terreno que posee un gradiente de pendiente
de oriente a occidente y adems, diferencias en la disponibilidad de nitrgeno
de norte a sur, para controlar los efectos de la pendiente y la disponibilidad de
nitrgeno, utiliz un diseo de cuadrado latino, las variedades son: A, B, C y D,
los datos corresponden a la produccin en kg/parcela.
Cecilia Ros Varillas
246
Disponibilidad
de Nitrgeno
Pendiente
1 2 3 4
1 785(D) 730(A) 700( C) 795(B)
2 855(A) 775(B) 760(D) 710( C)
3 950( C) 885(D) 795(B) 780(A)
4 945(B) 950( C) 880(A) 835(D)
a. Cul es el factor principal?
b. Indique la variable de respuesta.
c. Presente las hiptesis respectivas, calcule el ANVA e interprete sus resultados.
Estadstica y diseo de experimentos
247
Desviacin estndar. La medida de
dispersin ms comn. Puede usarse
con la media para describir la distri-
bucin de las observaciones. Es la raz
cuadrada del promedio de desviacio-
nes al cuadrado de las observaciones
desde su media.
Distribucin (poblacin). Correspon-
de los valores de una caracterstica o
variable junto con la frecuencia de su
ocurrencia. Las distribuciones pueden
basarse en observaciones empricas o
ser distribuciones tericas de probabi-
lidad (por ejemplo, normal, binomial,
ji cuadrada).
Distribucin F. Distribucin de proba-
bilidad usada para probar la igualdad
de dos estimaciones de la varianza. Es
la distribucin usada con la prueba F
en ANVA.
Grado de libertad. Cantidad que per-
mite introducir una correccin mate-
mtica en los clculos estadsticos para
restricciones impuestas en los datos.
Representa al nmero de variables in-
dependientes de la muestra corregida
(n-1).
Hiptesis nula. Es la que se est pro-
bando acerca de una poblacin. En ge-
Glosario
neral nulo significa "sin diferencia" y
por lo tanto, se refiere a una situacin
en la que no hay diferencia (por ejem-
plo, entre las medias en un grupo de
tratamiento y un grupo control).
Homocedasticidad. Situacin en la
que las varianzas de las poblaciones
son iguales.
Prueba de dos colas. Mtodo en donde
la hiptesis alterna especifica una des-
viacin a partir de la hiptesis nula en
las dos direcciones. La regin crtica se
localiza en ambos extremos de la dis-
tribucin de la estadstica de prueba.
Tambin se llama prueba direccional
P-value. El valor p (p-value) se puede
definir como el menor nivel de signi-
ficacin al que se puede rechazar una
hiptesis nula cuando es verdadera.
Sesgo. Error relacionado con las for-
mas en que difieren la ubicacin y
muestreo de la poblacin; llamado
tambin error de medicin, amenaza la
validez de un estudio.
Valor crtico. Cantidad que una prueba
estadstica debe exceder (en un sentido
de valor absoluto) para poder rechazar
la hiptesis nula.
Cecilia Ros Varillas
248
Estadstica y diseo de experimentos
249
Bibliografa
Acua F, Edgar. Anlisis estadstico de datos usando minitab. 3
a.
edicin. Puerto Rico:
Universidad de Puerto Rico, 2010.
Araya Alpzar, Carlo Magno. Estadstica para laboratorista qumico. San Jos, C.R.:
Editorial de la Universidad de Costa Rica, 2004.
Chue, Jorge; Barreno, Enma; Millones, Rosa; Vsquez, Flix y Castillo, Carlos.
Estadstica aplicada. Lima: Fondo Editorial de la Universidad de Lima, 2009.
Chue, Jorge; Barreno, Enma; Millones, Rosa; Vsquez, Flix y Castillo, Carlos.
Estadstica descriptiva y probabilidades. Lima: Fondo Editorial de la Universidad de
Lima, 2007.
Cochran, William G. y Cox, Gertrude M. Diseos experimentales. 2
a.
edicin. Mxi-
co: Editorial Trillas. 1980.
Espinoza, Juan. Distribuciones muestrales de los principales estadsticos. En:
Revista Ciencia Ahora N 15, Ao 8, Abril 2005. Concepcin: Universidad de Con-
cepcin.
Johnson, Richard A. Probabilidad y estadstica para ingenieros de Miller y Freund. 5
a.

edicin, Editorial Prentice Hall.
Kazmier, Leonard. Estadistica aplicada a la administracion y economia. Mxico: Mc-
Graw Hill, 2006.
Marques de Cant, Mara Jos. Probabilidad y estadstica para ciencias qumico-biol-
gicas. Mxico: McGraw-Hill, 1991.
Ostle, Bernard. Estadstica aplicada. 2
a.
edicin. Mxico: Editorial Limusa-Wiley,
1970.
Vlez, Ricardo y Hernndez Vctor. Clculo de probabilidades. Madrid: Universi-
dad Nacional de Educacin a distancia, 1995.
Cecilia Ros Varillas
250
Estadstica y diseo de experimentos
251
ANEXO 1. TABLA FUNCIN DE DISTRIBUCIN ACUMULATIVA
distribucin t-student F(t)=P(tt)
Funcin de distribucin acumulativa distribucin t-student
n (gl)
Prob
0,750 0,800 0,850 0,900 0,950 0,975 0,990 0,995 0,9995
1 1,000 1,376 1,963 3,078 6,314 12,706 31,821 63,657 636,619
2 0,816 1,061 1,386 1,886 2,920 4,303 6,965 9,925 31,599
3 0,765 0,978 1,250 1,638 2,353 3,182 4,541 5,841 12,924
4 0,741 0,941 1,190 1,533 2,132 2,776 3,747 4,604 8,610
5 0,727 0,920 1,156 1,476 2,015 2,571 3,365 4,032 6,869
6 0,718 0,906 1,134 1,440 1,943 2,447 3,143 3,707 5,959
7 0,711 0,896 1,119 1,415 1,895 2,365 2,998 3,499 5,408
8 0,706 0,889 1,108 1,397 1,860 2,306 2,896 3,355 5,041
9 0,703 0,883 1,100 1,383 1,833 2,262 2,821 3,250 4,781
10 0,700 0,879 1,093 1,372 1,812 2,228 2,764 3,169 4,587
11 0,697 0,876 1,088 1,363 1,796 2,201 2,718 3,106 4,437
12 0,695 0,873 1,083 1,356 1,782 2,179 2,681 3,055 4,318
13 0,694 0,870 1,079 1,350 1,771 2,160 2,650 3,012 4,221
14 0,692 0,868 1,076 1,345 1,761 2,145 2,624 2,977 4,140
15 0,691 0,866 1,074 1,341 1,753 2,131 2,602 2,947 4,073
16 0,690 0,865 1,071 1,337 1,746 2,120 2,583 2,921 4,015
17 0,689 0,863 1,069 1,333 1,740 2,110 2,567 2,898 3,965
Anexos
continua en la pg. siguiente
Cecilia Ros Varillas
252
18 0,688 0,862 1,067 1,330 1,734 2,101 2,552 2,878 3,922
19 0,688 0,861 1,066 1,328 1,729 2,093 2,539 2,861 3,883
20 0,687 0,860 1,064 1,325 1,725 2,086 2,528 2,845 3,850
21 0,686 0,859 1,063 1,323 1,721 2,080 2,518 2,831 3,819
22 0,686 0,858 1,061 1,321 1,717 2,074 2,508 2,819 3,792
23 0,685 0,858 1,060 1,319 1,714 2,069 2,500 2,807 3,768
24 0,685 0,857 1,059 1,318 1,711 2,064 2,492 2,797 3,745
25 0,684 0,856 1,058 1,316 1,708 2,060 2,485 2,787 3,725
26 0,684 0,856 1,058 1,315 1,706 2,056 2,479 2,779 3,707
27 0,684 0,855 1,057 1,314 1,703 2,052 2,473 2,771 3,690
28 0,683 0,855 1,056 1,313 1,701 2,048 2,467 2,763 3,674
29 0,683 0,854 1,055 1,311 1,699 2,045 2,462 2,756 3,659
30 0,683 0,854 1,055 1,310 1,697 2,042 2,457 2,750 3,646
35 0,682 0,852 1,052 1,306 1,690 2,030 2,438 2,724 3,591
40 0,681 0,851 1,050 1,303 1,684 2,021 2,423 2,704 3,551
45 0,680 0,850 1,049 1,301 1,679 2,014 2,412 2,690 3,520
50 0,679 0,849 1,047 1,299 1,676 2,009 2,403 2,678 3,496
55 0,679 0,848 1,046 1,297 1,673 2,004 2,396 2,668 3,476
60 0,679 0,848 1,045 1,296 1,671 2,000 2,390 2,660 3,460
70 0,678 0,847 1,044 1,294 1,667 1,994 2,381 2,648 3,435
80 0,678 0,846 1,043 1,292 1,664 1,990 2,374 2,639 3,416
90 0,677 0,846 1,042 1,291 1,662 1,987 2,368 2,632 3,402
100 0,677 0,845 1,042 1,290 1,660 1,984 2,364 2,626 3,390
200 0,676 0,843 1,039 1,286 1,653 1,972 2,345 2,601 3,340
300 0,675 0,843 1,038 1,284 1,650 1,968 2,339 2,592 3,323
400 0,675 0,843 1,038 1,284 1,649 1,966 2,336 2,588 3,315
500 0,675 0,842 1,038 1,283 1,648 1,965 2,334 2,586 3,310
1.000 0,675 0,842 1,037 1,282 1,646 1,962 2,330 2,581 3,300
viene de la pgina anterior
Estadstica y diseo de experimentos
253
ANEXO 2. TABLA DE LA FUNCIN DE DISTRIBUCIN ACUMULATIVA
normal estndar P(ZZ)=F(Z)
Tabla de la funcin de distribucin acumulativa normal estndar
Z 0 0,01000 0,02000 0,03000 0,04000 0,05000 0,06000 0,07000 0,08000 0,09000
0 0,50000 0,50399 0,50798 0,51197 0,51595 0,51994 0,52392 0,52790 0,53188 0,53586
0,1 0,53983 0,54380 0,54776 0,55172 0,55567 0,55962 0,56356 0,56749 0,57142 0,57535
0,2 0,57926 0,58317 0,58706 0,59095 0,59483 0,59871 0,60257 0,60642 0,61026 0,61409
0,3 0,61791 0,62172 0,62552 0,62930 0,63307 0,63683 0,64058 0,64431 0,64803 0,65173
0,4 0,65542 0,65910 0,66276 0,66640 0,67003 0,67364 0,67724 0,68082 0,68439 0,68793
0,5 0,69146 0,69497 0,69847 0,70194 0,70540 0,70884 0,71226 0,71566 0,71904 0,72240
0,6 0,72575 0,72907 0,73237 0,73565 0,73891 0,74215 0,74537 0,74857 0,75175 0,75490
0,7 0,75804 0,76115 0,76424 0,76730 0,77035 0,77337 0,77637 0,77935 0,78230 0,78524
0,8 0,78814 0,79103 0,79389 0,79673 0,79955 0,80234 0,80511 0,80785 0,81057 0,81327
0,9 0,81594 0,81859 0,82121 0,82381 0,82639 0,82894 0,83147 0,83398 0,83646 0,83891
1,0 0,84134 0,84375 0,84614 0,84849 0,85083 0,85314 0,85543 0,85769 0,85993 0,86214
1,1 0,86433 0,86650 0,86864 0,87076 0,87286 0,87493 0,87698 0,87900 0,88100 0,88298
1,2 0,88493 0,88686 0,88877 0,89065 0,89251 0,89435 0,89617 0,89796 0,89973 0,90147
1,3 0,90320 0,90490 0,90658 0,90824 0,90988 0,91149 0,91309 0,91466 0,91621 0,91774
1,4 0,91924 0,92073 0,92220 0,92364 0,92507 0,92647 0,92785 0,92922 0,93056 0,93189
1,5 0,93319 0,93448 0,93574 0,93699 0,93822 0,93943 0,94062 0,94179 0,94295 0,94408
1,6 0,94520 0,94630 0,94738 0,94845 0,94950 0,95053 0,95154 0,95254 0,95352 0,95449
1,7 0,95543 0,95637 0,95728 0,95818 0,95907 0,95994 0,96080 0,96164 0,96246 0,96327
1,8 0,96407 0,96485 0,96562 0,96638 0,96712 0,96784 0,96856 0,96926 0,96995 0,97062
1,9 0,97128 0,97193 0,97257 0,97320 0,97381 0,97441 0,97500 0,97558 0,97615 0,97670
2,0 0,97725 0,97778 0,97831 0,97882 0,97932 0,97982 0,98030 0,98077 0,98124 0,98169
2,1 0,98214 0,98257 0,98300 0,98341 0,98382 0,98422 0,98461 0,98500 0,98537 0,98574
2,2 0,98610 0,98645 0,98679 0,98713 0,98745 0,98778 0,98809 0,98840 0,98870 0,98899
2,3 0,98928 0,98956 0,98983 0,99010 0,99036 0,99061 0,99086 0,99111 0,99134 0,99158
2,4 0,99180 0,99202 0,99224 0,99245 0,99266 0,99286 0,99305 0,99324 0,99343 0,99361
2,5 0,99379 0,99396 0,99413 0,99430 0,99446 0,99461 0,99477 0,99492 0,99506 0,99520
2,6 0,99534 0,99547 0,99560 0,99573 0,99585 0,99598 0,99609 0,99621 0,99632 0,99643
2,7 0,99653 0,99664 0,99674 0,99683 0,99693 0,99702 0,99711 0,99720 0,99728 0,99736
2,8 0,99744 0,99752 0,99760 0,99767 0,99774 0,99781 0,99788 0,99795 0,99801 0,99807
2,9 0,99813 0,99819 0,99825 0,99831 0,99836 0,99841 0,99846 0,99851 0,99856 0,99861
3,0 0,99865 0,99869 0,99874 0,99878 0,99882 0,99886 0,99889 0,99893 0,99896 0,99900
3,1 0,99903 0,99906 0,99910 0,99913 0,99916 0,99918 0,99921 0,99924 0,99926 0,99929
continua en la pg. siguiente
Cecilia Ros Varillas
254
3,2 0,99931 0,99934 0,99936 0,99938 0,99940 0,99942 0,99944 0,99946 0,99948 0,99950
3,3 0,99952 0,99953 0,99955 0,99957 0,99958 0,99960 0,99961 0,99962 0,99964 0,99965
3,4 0,99966 0,99968 0,99969 0,99970 0,99971 0,99972 0,99973 0,99974 0,99975 0,99976
3,5 0,99977 0,99978 0,99978 0,99979 0,99980 0,99981 0,99981 0,99982 0,99983 0,99983
3,6 0,99984 0,99985 0,99985 0,99986 0,99986 0,99987 0,99987 0,99988 0,99988 0,99989
3,7 0,99989 0,99990 0,99990 0,99990 0,99991 0,99991 0,99992 0,99992 0,99992 0,99992
3,8 0,99993 0,99993 0,99993 0,99994 0,99994 0,99994 0,99994 0,99995 0,99995 0,99995
3,9 0,99995 0,99995 0,99996 0,99996 0,99996 0,99996 0,99996 0,99996 0,99997 0,99997
4,0 0,99997 0,99997 0,99997 0,99997 0,99997 0,99997 0,99998 0,99998 0,99998 0,99998
4,1 0,99998 0,99998 0,99998 0,99998 0,99998 0,99998 0,99998 0,99998 0,99999 0,99999
4,2 0,99999 0,99999 0,99999 0,99999 0,99999 0,99999 0,99999 0,99999 0,99999 0,99999
4,3 0,99999 0,99999 0,99999 0,99999 0,99999 0,99999 0,99999 0,99999 0,99999 0,99999
4,4 0,99999 0,99999 1,00000 1,00000 1,00000 1,00000 1,00000 1,00000 1,00000 1,00000
4,5 1,00000 1,00000 1,00000 1,00000 1,00000 1,00000 1,00000 1,00000 1,00000 1,00000
4,6 1,00000 1,00000 1,00000 1,00000 1,00000 1,00000 1,00000 1,00000 1,00000 1,00000
4,7 1,00000 1,00000 1,00000 1,00000 1,00000 1,00000 1,00000 1,00000 1,00000 1,00000
4,8 1,00000 1,00000 1,00000 1,00000 1,00000 1,00000 1,00000 1,00000 1,00000 1,00000
4,9 1,00000 1,00000 1,00000 1,00000 1,00000 1,00000 1,00000 1,00000 1,00000 1,00000
5,0 1,00000 1,00000 1,00000 1,00000 1,00000 1,00000 1,00000 1,00000 1,00000 1,00000
viene de la pgina anterior
Estadstica y diseo de experimentos
255
ANEXO 3. TABLA DE LA FUNCIN DE DISTRIBUCIN ACUMULATIVA
DISTRIBUCIN JI-CUADRADO
Funcin de distribucin acumulativa distribucin ji-cuadrado
n\P 0,001 0,005 0,010 0,020 0,025 0,050 0,100 0,250 0,500
1 0,000 0,000 0,000 0,001 0,001 0,004 0,016 0,102 0,455
2 0,002 0,010 0,020 0,040 0,051 0,103 0,211 0,575 1,386
3 0,024 0,072 0,115 0,185 0,216 0,352 0,584 1,213 2,366
4 0,091 0,207 0,297 0,429 0,484 0,711 1,064 1,923 3,357
5 0,210 0,412 0,554 0,752 0,831 1,145 1,610 2,675 4,351
6 0,381 0,676 0,872 1,134 1,237 1,635 2,204 3,455 5,348
7 0,598 0,989 1,239 1,564 1,690 2,167 2,833 4,255 6,346
8 0,857 1,344 1,646 2,032 2,180 2,733 3,490 5,071 7,344
9 1,152 1,735 2,088 2,532 2,700 3,325 4,168 5,899 8,343
10 1,479 2,156 2,558 3,059 3,247 3,940 4,865 6,737 9,342
11 1,834 2,603 3,053 3,609 3,816 4,575 5,578 7,584 0,341
12 2,214 3,074 3,571 4,178 4,404 5,226 6,304 8,438 11,340
13 2,617 3,565 4,107 4,765 5,009 5,892 7,042 9,299 2,340
14 3,041 4,075 4,660 5,368 5,629 6,571 7,790 10,165 13,339
15 3,483 4,601 5,229 5,985 6,262 7,261 8,547 11,037 14,339
16 3,942 5,142 5,812 6,614 6,908 7,962 9,312 11,912 15,338
17 4,416 5,697 6,408 7,255 7,564 8,672 10,085 12,792 16,338
18 4,905 6,265 7,015 7,906 8,231 9,390 10,865 13,675 17,338
19 5,407 6,844 7,633 8,567 8,907 10,117 11,651 14,562 18,338
20 5,921 7,434 8,260 9,237 9,591 10,851 12,443 15,452 19,337
21 6,447 8,034 8,897 9,915 10,283 11,591 13,240 16,344 20,337
22 6,983 8,643 9,542 10,600 10,982 12,338 14,041 17,240 21,337
23 7,529 9,260 10,196 11,293 11,689 13,091 14,848 18,137 22,337
24 8,085 9,886 10,856 11,992 12,401 13,848 15,659 19,037 23,337
25 8,649 10,520 11,524 12,697 13,120 14,611 16,473 19,939 24,337
26 9,222 11,160 12,198 13,409 13,844 15,379 17,292 20,843 25,336
27 9,803 11,808 12,879 14,125 14,573 16,151 18,114 21,749 26,336
28 10,391 12,461 13,565 14,847 15,308 16,928 18,939 22,657 27,336
29 10,986 13,121 14,256 15,574 16,047 17,708 19,768 23,567 28,336
30 11,588 13,787 14,953 16,306 16,791 18,493 20,599 24,478 29,336
31 12,196 14,458 15,655 17,042 17,539 19,281 21,434 25,390 30,336
continua en la pg. siguiente
Cecilia Ros Varillas
256
32 12,811 15,134 16,362 17,783 18,291 20,072 22,271 26,304 31,336
33 13,431 15,815 17,074 18,527 19,047 20,867 23,110 27,219 32,336
34 14,057 16,501 17,789 19,275 19,806 21,664 23,952 28,136 33,336
35 14,688 17,192 18,509 20,027 20,569 22,465 24,797 29,054 34,336
36 15,324 17,887 19,233 20,783 21,336 23,269 25,643 29,973 35,336
37 15,965 18,586 19,960 21,542 22,106 24,075 26,492 30,893 36,336
38 16,611 19,289 20,691 22,304 22,878 24,884 27,343 31,815 37,335
39 17,262 19,996 21,426 23,069 23,654 25,695 28,196 32,737 38,335
40 17,916 20,707 22,164 23,838 24,433 26,509 29,051 33,660 39,335
Funcin de distribucin acumulativa distribucin ji-cuadrado
n\P 0,750 0,900 0,950 0,925 0,980 0,990 0,995 0,999
1 1,323 2,706 3,841 3,170 5,412 6,635 7,879 10,828
2 2,773 4,605 5,991 5,181 7,824 9,210 10,597 13,816
3 4,108 6,251 7,815 6,905 9,837 11,345 12,838 16,266
4 5,385 7,779 9,488 8,496 11,668 13,277 14,860 18,467
5 6,626 9,236 11,070 10,008 13,388 15,086 16,750 20,515
6 7,841 10,645 12,592 11,466 15,033 16,812 18,548 22,458
7 9,037 12,017 14,067 12,883 16,622 18,475 20,278 24,322
8 10,219 13,362 15,507 14,270 18,168 20,090 21,955 26,124
9 11,389 14,684 16,919 15,631 19,679 21,666 23,589 27,877
10 12,549 15,987 18,307 16,971 21,161 23,209 25,188 29,588
11 13,701 17,275 19,675 18,294 22,618 24,725 26,757 31,264
12 14,845 18,549 21,026 19,602 24,054 26,217 28,300 32,909
13 15,984 19,812 22,362 20,897 25,472 27,688 29,819 34,528
14 17,117 21,064 23,685 22,180 26,873 29,141 31,319 36,123
15 18,245 22,307 24,996 23,452 28,259 30,578 32,801 37,697
16 19,369 23,542 26,296 24,716 29,633 32,000 34,267 39,252
17 20,489 24,769 27,587 25,970 30,995 33,409 35,718 40,790
18 21,605 25,989 28,869 27,218 32,346 34,805 37,156 42,312
19 22,718 27,204 30,144 28,458 33,687 36,191 38,582 43,820
20 23,828 28,412 31,410 29,692 35,020 37,566 39,997 45,315
21 24,935 29,615 32,671 30,920 36,343 38,932 41,401 46,797
22 26,039 30,813 33,924 32,142 37,659 40,289 42,796 48,268
23 27,141 32,007 35,172 33,360 38,968 41,638 44,181 49,728
continua en la pg. siguiente
viene de la pgina anterior
Estadstica y diseo de experimentos
257
24 28,241 33,196 36,415 34,572 40,270 42,980 45,559 51,179
25 29,339 34,382 37,652 35,780 41,566 44,314 46,928 52,620
26 30,435 35,563 38,885 36,984 42,856 45,642 48,290 54,052
27 31,528 36,741 40,113 38,184 44,140 46,963 49,645 55,476
28 32,620 37,916 41,337 39,380 45,419 48,278 50,993 56,892
29 33,711 39,087 42,557 40,573 46,693 49,588 52,336 58,301
30 34,800 40,256 43,773 41,762 47,962 50,892 53,672 59,703
31 35,887 41,422 44,985 42,948 49,226 52,191 55,003 61,098
32 36,973 42,585 46,194 44,131 50,487 53,486 56,328 62,487
33 38,058 43,745 47,400 45,311 51,743 54,776 57,648 63,870
34 39,141 44,903 48,602 46,488 52,995 56,061 58,964 65,247
35 40,223 46,059 49,802 47,663 54,244 57,342 60,275 66,619
36 41,304 47,212 50,998 48,835 55,489 58,619 61,581 67,985
37 42,383 48,363 52,192 50,005 56,730 59,893 62,883 69,346
38 43,462 49,513 53,384 51,173 57,969 61,162 64,181 70,703
39 44,539 50,660 54,572 52,338 59,204 62,428 65,476 72,055
40 45,616 51,805 55,758 53,501 60,436 63,691 66,766 73,402
Cecilia Ros Varillas
258
ANEXO 4. TABLA DE VALORES DE LA DISTRIBUCIN F PARA UNA
PROBABILIDAD ACUMULADA DE 0,99
Valores de la distribucin f para una probabilidad acumulada de 0,99 (=0.01)
V2\v1 1 2 3 4 5 6 7 8 9 10 11 12
1 4052 4999 5403 5625 5764 5859 5928 5981 6022 6056 6083 6106
2 98,50 99,00 99,17 99,25 99,30 99,33 99,36 99,37 99,39 99,40 99,41 99,42
3 34,1 30,8 29,5 28,7 28,2 27,9 27,7 27,5 27,3 27,2 27,1 27,1
4 21,2 18,0 16,7 16,0 15,5 15,2 15,0 14,8 14,7 14,5 14,5 14,4
5 16,26 13,27 12,06 11,39 10,97 10,67 10,46 10,29 10,16 10,05 9,963 9,888
6 13,75 10,92 9,780 9,148 8,746 8,466 8,260 8,102 7,976 7,874 7,790 7,718
7 12,25 9,547 8,451 7,847 7,460 7,191 6,993 6,840 6,719 6,620 6,538 6,469
8 11,26 8,649 7,591 7,006 6,632 6,371 6,178 6,029 5,911 5,814 5,734 5,667
9 10,56 8,022 6,992 6,422 6,057 5,802 5,613 5,467 5,351 5,257 5,178 5,111
10 10,04 7,559 6,552 5,994 5,636 5,386 5,200 5,057 4,942 4,849 4,772 4,706
11 9,646 7,206 6,217 5,668 5,316 5,069 4,886 4,744 4,632 4,539 4,462 4,397
12 9,330 6,927 5,953 5,412 5,064 4,821 4,640 4,499 4,388 4,296 4,220 4,155
13 9,074 6,701 5,739 5,205 4,862 4,620 4,441 4,302 4,191 4,100 4,025 3,960
14 8,862 6,515 5,564 5,035 4,695 4,456 4,278 4,140 4,030 3,939 3,864 3,800
15 8,683 6,359 5,417 4,893 4,556 4,318 4,142 4,004 3,895 3,805 3,730 3,666
16 8,531 6,226 5,292 4,773 4,437 4,202 4,026 3,.890 3,780 3,691 3,616 3,553
17 8,400 6,112 5,185 4,669 4,336 4,102 3,927 3,791 3,682 3,593 3,519 3,455
18 8,285 6,013 5,092 4,579 4,248 4,015 3,841 3,705 3,597 3,508 3,434 3,371
19 8,185 5,926 5,010 4,500 4,171 3,939 3,765 3,631 3,523 3,434 3,360 3,297
20 8,096 5,849 4,938 4,431 4,103 3,871 3,699 3,564 3,457 3,368 3,294 3,231
21 8,017 5,780 4,874 4,369 4,042 3,812 3,640 3,506 3,.398 3,310 3,236 3,173
22 7,945 5,719 4,817 4,313 3,988 3,758 3,587 3,453 3,346 3,258 3,184 3,121
23 7,881 5,664 4,765 4,264 3,939 3,710 3,539 3,406 3,299 3,211 3,137 3,074
24 7,823 5,614 4,718 4,218 3,895 3,667 3,496 3,363 3,256 3,168 3,094 3,032
25 7,770 5,568 4,675 4,177 3,855 3,627 3,457 3,324 3,217 3,129 3,056 2,993
26 7,721 5,526 4,637 4,140 3,818 3,591 3,421 3,288 3,182 3,094 3,021 2,958
27 7,677 5,488 4,601 4,106 3,785 3,558 3,388 3,256 3,149 3,062 2,988 2,926
28 7,636 5,453 4,568 4,074 3,754 3,528 3,358 3,226 3,120 3,032 2,959 2,896
29 7,598 5,420 4,538 4,045 3,725 3,499 3,330 3,198 3,092 3,005 2,931 2,868
30 7,562 5,390 4,510 4,018 3,699 3,473 3,304 3,173 3,067 2,979 2,906 2,843
35 7,419 5,268 4,396 3,908 3,592 3,368 3,200 3,069 2,963 2,876 2,803 2,740
40 7,314 5,179 4,313 3,828 3,514 3,291 3,124 2,993 2,888 2,801 2,727 2,665
45 7,234 5,110 4,249 3,767 3,454 3,232 3,066 2,935 2,830 2,743 2,670 2,608
continua en la pg. siguiente
Estadstica y diseo de experimentos
259
50 7,171 5,057 4,199 3,720 3,408 3,186 3,020 2,890 2,785 2,698 2,625 2,562
60 7,077 4,977 4,126 3,649 3,339 3,119 2,953 2,823 2,718 2,632 2,559 2,496
100 6,895 4,824 3,984 3,513 3,206 2,988 2,823 2,694 2,590 2,503 2,430 2,368
200 6,763 4,713 3,881 3,414 3,110 2,893 2,730 2,601 2,497 2,411 2,338 2,275
300 6,720 4,677 3,848 3,382 3,079 2,862 2,699 2,571 2,467 2,380 2,307 2,244
500 6,686 4,648 3,821 3,357 3,054 2,838 2,675 2,547 2,443 2,356 2,283 2,220

Valores de la distribucin f para una probabilidad acumulada de 0,99 (=0.01)
v2\v1 13 14 15 20 25 30 40 50 60 100 500
1 6126 6143 6157 6209 6240 6261 6287 6303 6313 6334 6360
2 99,42 99,43 99,43 99,45 99,46 99,47 99,47 99,48 99,48 99,49 99,50
3 27,0 26,9 26,9 26,7 26,6 26,5 26,4 26,4 26,3 26,2 26,1
4 14,3 14,2 14,2 14,0 13,9 13,8 13,7 13,7 13,7 13,6 13,5
5 9,825 9,770 9,722 9,553 9,449 9,379 9,291 9,238 9,202 9,130 9,042
6 7,657 7,605 7,559 7,396 7,296 7,229 7,143 7,091 7,057 6,987 6,902
7 6,410 6,359 6,314 6,155 6,058 5,992 5,908 5,858 5,824 5,755 5,671
8 5,609 5,559 5,515 5,359 5,263 5,198 5,116 5,065 5,032 4,963 4,880
9 5,055 5,005 4,962 4,808 4,713 4,649 4,567 4,517 4,483 4,415 4,332
10 4,650 4,601 4,558 4,405 4,311 4,247 4,165 4,115 4,082 4,014 3,930
11 4,342 4,293 4,251 4,099 4,005 3,941 3,860 3,810 3,776 3,708 3,624
12 4,100 4,052 4,010 3,858 3,765 3,701 3,619 3,569 3,535 3,467 3,382
13 3,905 3,857 3,815 3,665 3,571 3,507 3,425 3,375 3,341 3,272 3,187
14 3,745 3,698 3,656 3,505 3,412 3,348 3,266 3,215 3,181 3,112 3,026
15 3,612 3,564 3,522 3,372 3,278 3,214 3,132 3,081 3,047 2,977 2,891
16 3,498 3,451 3,409 3,259 3,165 3,101 3,018 2,967 2,933 2,863 2,775
17 3,401 3,353 3,312 3,162 3,068 3,003 2,920 2,869 2,835 2,764 2,676
18 3,316 3,269 3,227 3,077 2,983 2,919 2,835 2,784 2,749 2,678 2,589
19 3,242 3,195 3,153 3,003 2,909 2,844 2,761 2,709 2,674 2,602 2,512
20 3,177 3,130 3,088 2,938 2,843 2,778 2,695 2,643 2,608 2,535 2,445
21 3,119 3,072 3,030 2,880 2,785 2,720 2,636 2,584 2,548 2,475 2,384
22 3,067 3,019 2,978 2,827 2,733 2,667 2,583 2,531 2,495 2,422 2,329
23 3,020 2,973 2,931 2,781 2,686 2,620 2,535 2.483 2,447 2,373 2,280
24 2,977 2,930 2,889 2,738 2,643 2,577 2,492 2.440 2,403 2,329 2,235
25 2,939 2,892 2,850 2,699 2,604 2,538 2,453 2,400 2,364 2,289 2,194
26 2,904 2,857 2,815 2,664 2,569 2,503 2,417 2,364 2,327 2,252 2,156
27 2,871 2,824 2,783 2,632 2,536 2,470 2,384 2,330 2,294 2,218 2,122
continua en la pg. siguiente
viene de la pgina anterior
Cecilia Ros Varillas
260
28 2,842 2,795 2,753 2,602 2,506 2,440 2,354 2,300 2,263 2,187 2,090
29 2,814 2,767 2,726 2,574 2,478 2,412 2,325 2,271 2,234 2,158 2,060
30 2,789 2,742 2,700 2,549 2,453 2,386 2,299 2,245 2,208 2,131 2,032
35 2,686 2.639 2,597 2,445 2,348 2,281 2,193 2,137 2,099 2,020 1,918
40 2,611 2.563 2,522 2,369 2,271 2,203 2,114 2,058 2,019 1,938 1,833
45 2,553 2.506 2,464 2,311 2,213 2,144 2,054 1,997 1,958 1,875 1,767
50 2,508 2.461 2,419 2,265 2,167 2,098 2,007 1,949 1,909 1,825 1,713
60 2,442 2.394 2,352 2,198 2,098 2,028 1,936 1,877 1,836 1,749 1,633
100 2,313 2.265 2,223 2,067 1,965 1,893 1,797 1,735 1,692 1,598 1,466
200 2,220 2.172 2,129 1,971 1,868 1,794 1,694 1,629 1,583 1,481 1,328
300 2,190 2.142 2,099 1,940 1,836 1,761 1,660 1,594 1,547 1,441 1,276
500 2,166 2,117 2,075 1,915 1,810 1,735 1,633 1,566 1,517 1,408 1,232
viene de la pgina anterior
Estadstica y diseo de experimentos
261
ANEXO 5. TABLA DE VALORES DE LA DISTRIBUCIN F PARA UNA
PROBABILIDAD ACUMULADA DE 0,95
Valores de la distribucin f para una probabilidad acumulada de 0,95 ( =0,05 )
v2\v1 1 2 3 4 5 6 7 8 9 10 11 12
1 161,4 199,5 215,7 224,6 230,2 234,0 236,8 238,9 240,5 241,9 243,0 243,9
2 18,51 19,00 19,16 19,25 19,30 19,33 19,35 19,37 19,38 19,40 19,40 19,41
3 10,13 9,552 9,277 9,117 9,013 8,941 8,887 8,845 8,812 8,786 8,763 8,745
4 7,709 6,944 6,591 6,388 6,256 6,163 6,094 6,041 5,999 5,964 5,936 5,912
5 6,608 5,786 5,409 5,192 5,050 4,950 4,876 4,818 4,772 4,735 4,704 4,678
6 5,99 5,14 4,757 4,534 4,387 4,284 4,207 4,147 4,099 4,060 4,027 4,000
7 5,59 4,737 4,347 4,120 3,972 3,866 3,787 3,726 3,677 3,637 3,603 3,575
8 5,32 4,459 4,066 3,838 3,687 3,581 3,500 3,438 3,388 3,347 3,313 3,284
9 5,12 4,256 3,863 3,633 3,482 3,374 3,293 3,230 3,179 3,137 3,102 3,073
10 4,96 4,103 3,708 3,478 3,326 3,217 3,135 3,072 3,020 2,978 2,943 2,913
11 4,844 3,982 3,587 3,357 3,204 3,095 3,012 2,948 2,896 2,854 2,818 2,788
12 4,747 3,885 3,490 3,259 3,106 2,996 2,913 2,849 2,796 2,753 2,717 2,687
13 4,667 3,806 3,411 3,179 3,025 2,915 2,832 2,767 2,714 2,671 2,635 2,604
14 4,600 3,739 3,344 3,112 2,958 2,848 2,764 2,699 2,646 2,602 2,565 2,534
15 4,543 3,682 3,287 3,056 2,901 2,790 2,707 2,641 2,588 2,544 2,507 2,475
16 4,494 3,634 3,239 3,007 2,852 2,741 2,657 2,591 2,538 2,494 2,456 2,425
17 4,451 3,592 3,197 2,965 2,810 2,699 2,614 2,548 2,494 2,450 2,413 2,381
18 4,414 3,555 3,160 2,928 2,773 2,661 2,577 2,510 2,456 2,412 2,374 2,342
19 4,381 3,522 3,127 2,895 2,740 2,628 2,544 2,477 2,423 2,378 2,340 2,308
20 4,351 3,493 3,098 2,866 2,711 2,599 2,514 2,447 2,393 2,348 2,310 2,278
21 4,325 3,467 3,072 2,840 2,685 2,573 2,488 2,420 2,366 2,321 2,283 2,250
22 4,301 3,443 3,049 2,817 2,661 2,549 2,464 2,397 2,342 2,297 2,259 2,226
23 4,279 3,422 3,028 2,796 2,640 2,528 2,442 2,375 2,320 2,275 2,236 2,204
24 4,260 3,403 3,009 2,776 2,621 2,508 2,423 2,355 2,300 2,255 2,216 2,183
25 4,242 3,385 2,991 2,759 2,603 2,490 2,405 2,337 2,282 2,236 2,198 2,165
26 4,225 3,369 2,975 2,743 2,587 2,474 2,388 2,321 2,265 2,220 2,181 2,148
27 4,210 3,354 2,960 2,728 2,572 2,459 2,373 2,305 2,250 2,204 2,166 2,132
28 4,196 3,340 2,947 2,714 2,558 2,445 2,359 2,291 2,236 2,190 2,151 2,118
29 4,183 3,328 2,934 2,701 2,545 2,432 2,346 2,278 2,223 2,177 2,138 2,104
30 4,171 3,316 2,922 2,690 2,534 2,421 2,334 2,266 2,211 2,165 2,126 2,092
35 4,121 3,267 2,874 2,641 2,485 2,372 2,285 2,217 2,161 2,114 2,075 2,041
40 4,085 3,232 2,839 2,606 2,449 2,336 2,249 2,180 2,124 2,077 2,038 2,003
continua en la pg. siguiente
Cecilia Ros Varillas
262
45 4,057 3,204 2,812 2,579 2,422 2,308 2,221 2,152 2,096 2,049 2,009 1,974
50 4,034 3,183 2,790 2,557 2,400 2,286 2,199 2,130 2,073 2,026 1,986 1,952
60 4,001 3,150 2,758 2,525 2,368 2,254 2,167 2,097 2,040 1,993 1,952 1,917
100 3,936 3,087 2,696 2,463 2,305 2,191 2,103 2,032 1,975 1,927 1,886 1,850
200 3,888 3,041 2,650 2,417 2,259 2,144 2,056 1,985 1,927 1,878 1,837 1,801
300 3,873 3,026 2,635 2,402 2,244 2,129 2,040 1,969 1,911 1,862 1,821 1,785
500 3,860 3,014 2,623 2,390 2,232 2,117 2,028 1,957 1,899 1,850 1,808 1,772
Valores de la distribucin f para una probabilidad acumulada de 0,95 ( =0,05 )
v2\v1 13 14 15 20 25 30 40 50 60 100 500
1 244,7 245,4 245,9 248,0 249,3 250,1 251,1 251,8 252,2 253,0 254,1
2 19,42 19,42 19,43 19,45 19,46 19,46 19,47 19,48 19,48 19,49 19,49
3 8,729 8,715 8,703 8,660 8,634 8,617 8,594 8,581 8,572 8,554 8,532
4 5,891 5,873 5,858 5,803 5,769 5,746 5,717 5,699 5,688 5,664 5,635
5 4,655 4,636 4,619 4,558 4,521 4,496 4,464 4,444 4,431 4,405 4,373
6 3,976 3,956 3,938 3,874 3,835 3,808 3,774 3,754 3,740 3,712 3,678
7 3,550 3,529 3,511 3,445 3,404 3,376 3,340 3,319 3,304 3,275 3,239
8 3,259 3,237 3,218 3,150 3,108 3,079 3,043 3,020 3,005 2,975 2,937
9 3,048 3,025 3,006 2,936 2,893 2,864 2,826 2,803 2,787 2,756 2,717
10 2,887 2,865 2,845 2,774 2,730 2,700 2,661 2,637 2,621 2,588 2,548
11 2,761 2,739 2,719 2,646 2,601 2,570 2,531 2,507 2,490 2,457 2,415
12 2,660 2,637 2,617 2,544 2,498 2,466 2,426 2,401 2,384 2,350 2,307
13 2,577 2,554 2,533 2,459 2,412 2,380 2,339 2,314 2,297 2,261 2,218
14 2,507 2,484 2,463 2,388 2,341 2,308 2,266 2,241 2,223 2,187 2,142
15 2,448 2,424 2,403 2,328 2,280 2,247 2,204 2,178 2,160 2,123 2,078
16 2,397 2,373 2,352 2,276 2,227 2,194 2,151 2,124 2,106 2,068 2,022
17 2,353 2,329 2,308 2,230 2,181 2,148 2,104 2,077 2,058 2,020 1,973
18 2,314 2,290 2,269 2,191 2,141 2,107 2,063 2,035 2,017 1,978 1,929
19 2,280 2,256 2,234 2,155 2,106 2,071 2,026 1,999 1,980 1,940 1,891
20 2,250 2,225 2,203 2,124 2,074 2,039 1,994 1,966 1,946 1,907 1,856
21 2,222 2,197 2,176 2,096 2,045 2,010 1,965 1,936 1,916 1,876 1,825
22 2,198 2,173 2,151 2,071 2,020 1,984 1,938 1,909 1,889 1,849 1,797
23 2,175 2,150 2,128 2,048 1,996 1,961 1,914 1,885 1,865 1,823 1,771
24 2,155 2,130 2,108 2,027 1,975 1,939 1,892 1,863 1,842 1,800 1,747
25 2,136 2,111 2,089 2,007 1,955 1,919 1,872 1,842 1,822 1,779 1,725
26 2,119 2,094 2,072 1,990 1,938 1,901 1,853 1,823 1,803 1,760 1,705
continua en la pg. siguiente
viene de la pgina anterior
Estadstica y diseo de experimentos
263
27 2,103 2,078 2,056 1,974 1,921 1,884 1,836 1,806 1,785 1,742 1,686
28 2,089 2,064 2,041 1,959 1,906 1,869 1,820 1,790 1,769 1,725 1,669
29 2,075 2,050 2,027 1,945 1,891 1,854 1,806 1,775 1,754 1,710 1,653
30 2,063 2,037 2,015 1,932 1,878 1,841 1,792 1,761 1,740 1,695 1,637
35 2,012 1,986 1,963 1,878 1,824 1,786 1,735 1,703 1,681 1,635 1,574
40 1,974 1,948 1,924 1,839 1,783 1,744 1,693 1,660 1,637 1,589 1,526
45 1,945 1,918 1,895 1,808 1,752 1,713 1,660 1,626 1,603 1,554 1,488
50 1,921 1,895 1,871 1,784 1,727 1,687 1,634 1,599 1,576 1,525 1,457
60 1,887 1,860 1,836 1,748 1,690 1,649 1,594 1,559 1,534 1,481 1,409
100 1,819 1,792 1,768 1,676 1,616 1,573 1,515 1,477 1,450 1,392 1,308
200 1,769 1,742 1,717 1,623 1,561 1,516 1,455 1,415 1,386 1,321 1,221
300 1,753 1,725 1,700 1,606 1,543 1,497 1,435 1,393 1,363 1,296 1,188
500 1,740 1,712 1,686 1,592 1,528 1,482 1,419 1,376 1,345 1,275 1,159
Cecilia Ros Varillas
264
Estadstica y diseo de experimentos
265
Este libro se termin de imprimir en los talleres
de la imprenta de la Editorial Universitaria de la
Universidad Nacional de Ingeniera
en el mes de setiembre de 2012