Vous êtes sur la page 1sur 63

DISEOS EXPERIMENTALES Ciclo 2013 I UCV

PRUEBA DE HIPOTESIS Hiptesis Es el enunciado acerca de una poblacin, elaborado con el propsito de ponerlo aprueba Prueba de hiptesis Procedimiento basado en la evidencia muestral y en la teora de probabilidad que se emplea para determinar si la hiptesis es un enunciado razonable. Procedimiento para probar una hiptesis: 1.- Plantear la hiptesis nula Hiptesis nula y la hiptesis alternativa .

.- Hiptesis planteada con el objetivo de ser probada. Podemos aceptarla o rechazarla.

Tal hiptesis es una afirmacin que se aceptar si los datos muestrales no pueden proporcionar evidencia convincente que es falsa. Hiptesis alternativa .- Denominada tambin hiptesis de investigacin. Afirmacin que se es falsa

aceptar si los datos muestrales proporcionaron amplia evidencia de que

2.- Seleccionar el nivel de significancia.- Nivel de significancia es la probabilidad de rechazar la hiptesis nula cuando es verdadera. Al nivel de significacin se le denomina el nombre de nivel de riesgo. Generalmente se usa el nivel del 5% para proyectos de investigacin, 1% para el aseguramiento de calidades y 10% para encuestas polticas. En el proceso de probar una hiptesis podemos cometer dos tipos de errores: error del tipo I o del tipo II. Error tipo I es rechazar la hiptesis nula ( Error tipo II es aceptar la hiptesis nula ( Hiptesis nula Ho es verdadera Ho es falsa cuando en realidad es verdadera. cuando en realidad es falsa Se acepta Decisin Correcta Error correcta Tipo II Se rechaza Error Decisin Correcta Tipo I correcta , tambin se le conoce con

3.-Calcular el valor estadstico de prueba.- Existen muchos valores estadsticos de prueba: z, t, chi cuadrado, F, etc. Es el valor obtenido a partir de la informacin muestral que se utiliza para determinar si se rechaza la hiptesis nula.

DISEOS EXPERIMENTALES Ciclo 2013 I UCV

4.- Formular la regla de decisin.- Es un enunciado de las condiciones segn las que se acepta o se rechaza la hiptesis nula.

Valor crtico es el valor que es el punto divisorio entre la regin de aceptacin y la regin de rechazo de la hiptesis nula 5.-Toma de decisin.- Es aceptar o rechazar la hiptesis nula. Potencia de una prueba.- Es la probabilidad de tomar la decisin acertada de rechazar es falsa o de aceptar cuando esta .

cuando esta es verdadera. La potencia de una prueba se calcula mediante 1

Prueba para la media de la poblacin: Muestra grande Prueba de hiptesis con muestras grandes (n 30) respecto a una media de poblacin para una prueba de dos colas (bilateral) de la forma: Ho = Ha Estadstico de prueba: conocida Z= Estadstico de prueba: desconocida: Z=

Regla de rechazo a un nivel de significancia Rechazar si Z - Z Z

: Z

Ejemplo La tasa anual de resurtido de botellas de aspirinas es 6.0 (esto indica que las existencias del medicamento tienen que renovarse en promedio 6 veces al ao en un establecimiento). La desviacin estndar es 0,50.

DISEOS EXPERIMENTALES Ciclo 2013 I UCV

Se sospecha que el volumen de ventas promedio ha cambiado y no es 0,60. Se utilizar el nivel de significancia de 0.05 para probar esta hiptesis. a.- Plantee la hiptesis nula y alternativa b.- Cul es la probabilidad de un error tipo I? c.- Proporcione la frmula para el valor estadstico de la prueba. d.- Enuncie la regla de decisin e.- Se selecciona una muestra aleatoria de 64 frascos de tal producto, con una media de 5.84, Debe rechazarse la hiptesis de que la media poblacional es 0.60? Interprete los resultados. Solucin:

a.
b.-

Ho = 6 Ha

c.- El valor estadstico de la prueba es: d.- El valor crtico de 1.96

Z=

Si el valor del estadstico de prueba resulta mayor a 1.96 o menor a -1.96 se rechaza hiptesis nula Z= - 2.56

la

Como el valor de la prueba est en la regin de rechazo, se rechaza

y, por lo tanto, se acepta

(la

tasa media no es igual a 6). Ejemplo El supermercado local gast en una remodelacin miles de nuevos soles durante muchas semanas. Aunque la interrupcin espant a los clientes temporalmente, el gerente espera que los clientes vuelvan a disfrutar de las nuevas comodidades. Antes de remodelar, los recibos de la tienda promediaban $ 32 533 por semana. Ahora que se ha terminado la remodelacin, el gerente toma una muestra de 36 semanas para ver si la construccin afect de alguna manera el negocio. Se report una media de $34 166 y una desviacin estndar de $12 955 Qu puede decir el gerente a un nivel de significancia del 1%? Solucin Ho = 32 533 Ha

DISEOS EXPERIMENTALES Ciclo 2013 I UCV

Rechazar Ho si: Z - 2.576 Z 2.576

El estadstico de la prueba: Z

0.756 El valor de prueba est dentro de la zona de aceptacin, entonces se acepta Ho Es decir la media es 32 533 Prueba de hiptesis con muestras grandes (n de una cola (unilateral) de la forma H0 H a: Estadstico de prueba: o 30) respecto a una media poblacional para pruebas

conocida Z=

Estadstico de prueba:

desconocida: Z=

Regla de rechazo a un nivel de significacin Rechazar si Z Z

Prueba de hiptesis con muestras grandes (n de una cola (unilateral) de la forma H0: Ha: Estadstico de prueba: conocida Z= Estadstico de prueba: desconocida: Z= o o

30) respecto a una media poblacional para pruebas

DISEOS EXPERIMENTALES Ciclo 2013 I UCV

Regla de rechazo a un nivel de significacin Rechazar si Z - Z

Ejemplo.-

Una encuesta nacional reciente, encontr que estudiantes de la Universidad miraban un

promedio de 6.8 DVD por mes. Una muestra aleatoria de 36 estudiantes universitarios de la facultad de Agronoma, revel que el nmero medio de DVD observado el mes pasado fue de 6.2, con una

desviacin estndar de 0.5. En el nivel de significancia de 0.05. Puede concluirse que los estudiantes de la facultad de Agronoma ven menos DVD al mes que los de la Universidad? H0: Ha: 6.8 6.8

Regla de la decisin Rechazar Valor de la prueba Z= - 7.2 si Z - 1.645

Como el valor de la prueba est en la zona de rechazo se concluye rechazando la hiptesis nula, esto es, que los estudiantes de la facultad de Agronoma ven menos DVD, en promedio, que los estudiantes de la Universidad Pruebas respecto a la proporcin poblacional. La prueba de hiptesis sobre proporciones se usa cuando queremos determinar si la proporcin de los elementos en una poblacin, que tiene cierta caracterstica, es mayor, igual o menor que algn valor especifico. Relacin proporcional: Es la relacin por cociente, o porcin relativa, que tiene un atributo particular de inters.

DISEOS EXPERIMENTALES Ciclo 2013 I UCV

Antes de probar una relacin proporcional debemos considerar algunos supuestos y cumplirse algunas condiciones: - Los datos muestrales recopilados son el resultado de conteo - El resultado de un experimento se clasifica como xito o fracaso - La probabilidad de xito se mantiene igual en cada ensayo - Los ensayos son independientes La prueba es adecuada cuando n y n( 1) valen al menos 5 El valor estadstico de prueba Z viene dado por: Z

Donde: Relacin proporcional poblacional Relacin proporcional muestral n Tamao de muestra Prueba para la proporcin poblacional Prueba de hiptesis respecto a una proporcin poblacional para pruebas de una cola (unilateral) de la forma:

El estadstico de la prueba Z Regla de rechazo a un nivel de significacin

Ejemplo Una investigacin en la Universidad de Toledo indica que el 50% de los estudiantes cambian su rea principal de especializacin despus del primer ao en el programa de estudios. Una muestra de 100 alumnos en la escuela de Administracin revel que 48 de ellos cambi de dicha rea despus del lapso mencionado. Ha habido un decremento significativo en la proporcin de estudiantes que cambian su rea de especializacin despus del primer ao en el programa? Realice la prueba al nivel de significancia de 0.05. n: 100

DISEOS EXPERIMENTALES Ciclo 2013 I UCV

0.48 0.05

Regla de decisin Rechazar si Z - 1.645

El estadstico de la prueba Z - 0.4

Como Z - 0.4, entonces se acepta

, es decir, la proporcin de estudiantes que cambian de carrera

despus del primer ao no ha tenido un decremento significativo. Prueba de hiptesis respecto a una proporcin poblacional para prueba de una cola (unilateral) de la forma:

Estadstico de prueba Z

Rechazar

si

Ejemplo Un artculo en la publicacin Piura 21 report que solo hay un empleo disponible para uno de cada tres egresados de la Universidad. Las principales razones aportadas fueron que existe una sobrepoblacin de estos ltimos y una economa dbil. Suponga que una encuesta de 200 egresados recientes de la Universidad de Jan revel que 80 tenan empleo. Al nivel de significancia de 0.02, Se puede concluir que tienen trabajo una proporcin mayor de egresados de la Universidad de Jan?

DISEOS EXPERIMENTALES Ciclo 2013 I UCV

Regla de la decisin. Rechazar si Z 2.054

Valor de la prueba:

Se acepta

por lo tanto, la proporcin de egresados que tienen trabajo es menor o igual a

Prueba de hiptesis respecto a una poblacin poblacional para pruebas de dos colas (bilateral) de la forma:

Estadstico de prueba Z

Regla de rechazo a un nivel de significancia

DISEOS EXPERIMENTALES Ciclo 2013 I UCV

Rechazar

si

Ejemplo Se establece la siguiente hiptesis: : p = 0.4 :p Una muestra de 120 observaciones revel la hiptesis nula? a,. Establezca la regla de decisin. b.- Calcule el valor estadstico de la prueba. c.- Cul es su decisin respecto a la hiptesis nula? Solucin a.- Regla de decisin al nivel de significacin de 0.05 Puede rechazarse

Rechazar

si Z

-1,96

1.96

b.- Valor de prueba Z = -2.24

c.- Se rechaza

, pues el estadstico de prueba cae en la zona de rechazo. respecto a dos medias poblacionales 30) respecto a dos medias poblacionales para una

Prueba de hiptesis con muestras grandes (n Prueba de hiptesis con muestras grandes (n prueba de dos colas (bilateral) de la forma : : Estadstico de prueba Conocida

desconocida

Donde

DISEOS EXPERIMENTALES Ciclo 2013 I UCV

Tamao de muestra Poblacin 1 Poblacin 2

Media muestral

Variancia poblacional

Regla de rechazo a nivel de significancia Z Ejemplo

Una importante compaa de transporte pblico de Chiclayo debe decidir entre dos marcas de llantas para su parque automotor, con un nivel de confianza del 95%. Para tomar una decisin seleccion una muestra aleatoria de 100 llantas de cada marca y encontr que la marca 1 tiene una vida til de 98 000 Km, en promedio, con una desviacin estndar de 8 000 Km. Por otro lado, las estadsticas calculadas para la marca 2 son, en promedio, de 101 000 Km y desviacin estndar de 12 000 Km Que marca de llantas debera adquirir la compaa de transporte si la diferencia de precios es mnima? Solucin

= 98 000 = 101 000

Regla de decisin Rechazar Z Z

Valor de la prueba

10

DISEOS EXPERIMENTALES Ciclo 2013 I UCV

= - 2.08

Como -2.08 est en la zona de rechazo, se rechaza

a un nivel de significancia del 5%. Esto es, existe

diferencia significativa entre la vida til promedio de ambas marcas. Sin embargo, no hemos contestado a nuestra pregunta inicial de qu marca de llantas se debe adquirir. Realizamos una nueva prueba de hiptesis suponiendo que la vida til media de la marca 2 es mayor que la de la marca 1. Para lo cual establecemos la prueba de hiptesis para una cola Prueba de hiptesis con muestras grandes (n prueba de 1 cola de la forma: : : Estadstico de prueba Conocida desconocida : : 0 0 respecto a dos medias poblacionales para una

Regla de rechazo a un nivel de significancia

Rechazar

si Z

respecto a dos medias poblacionales para una

Prueba de hiptesis con muestras grandes (n prueba de 1 cola de la forma: : : Estadstico de prueba Conocida : :

0 0

desconocida

11

DISEOS EXPERIMENTALES Ciclo 2013 I UCV

Regla de rechazo a un nivel de significacin

Rechazar

si Z

Del ejercicio anterior, para decidir qu marca comprar, realizamos una nueva prueba de hiptesis suponiendo que la vida til promedio de la llanta de marca 2 es mayor que la vida til promedio de la marca 1, esto es :

Usando los mismos datos anteriores tenemos

Con los datos mostrados se calcula Z

= - 2.08

Como 2.08 est en la zona de rechazo tenemos que la marca 2 tiene mayor vida til promedio que la marca 1.Por lo tanto, la compaa de transporte debe abastecerse de la marca 2 Prueba de hiptesis con muestras grandes (n para la diferencia entre dos proporciones:

La prueba de hiptesis para la diferencia entre dos proporciones se realiza cuando queremos determinar si las proporciones de dos poblaciones son o no iguales. La lgica del procedimiento es idntica para la diferencia de las medias poblacionales.

12

DISEOS EXPERIMENTALES Ciclo 2013 I UCV

Tomamos una muestra aleatoria de cada poblacin y calculamos las proporciones muestrales; si la diferencia entre estas proporciones se puede atribuir al azar, aceptamos la hiptesis de que las dos poblaciones tienen igual proporciones. Valor estadstico de prueba.

Z=

Tamao de muestra

Proporcin muestral

Proporcin ponderada

Poblacin 1 Poblacin 2 = Alternativamente =

Ejemplo El departamento de investigacin en la casa Matriz de una compaa aseguradora, realiza una investigacin acera de las causas de accidentes automovilsticos, las caractersticas de los conductores, etc. Se seleccion una muestra aleatoria de 400 plizas de seguros expedidas a personas solteras. Se descubri que en el periodo anterior de tres aos, 120 sufrieron al menos un accidente automovilstico. En forma semejante, una muestra de 600 plizas expedidas a personas casadas revel que 150 haban tenido al menos un accidente. Al nivel de significancia de 0.05, Hay diferencia significativa en las personas solteras y casadas que sufrieron un accidente durante un lapso de tres aos? Solucin 400 = 0.30 600 = 0.25

Regla de decisin Rechazar Z Z

13

DISEOS EXPERIMENTALES Ciclo 2013 I UCV

Valor de la prueba

Z=

= 0.27

Z=

= 1.74

Como 1.74 est en la regin de aceptacin se acepta , no hay diferencia significativa entre las proporciones de personas solteras y casadas que sufrieron un accidente durante un lapso de tres aos. Prueba de hiptesis para muestras pequeas En los casos en los que se desconoce y el nmero de observaciones en la muestra es menor a 30, se puede utilizar la desviacin estndar muestral, s, como una estimacin de , pero no puede utilizar la distribucin de Z como valor estadstico de prueba. La t de Student o distribucin t, sirve como valor estadstico de prueba. Prueba para la media poblacional Se utiliza el mismo procedimiento que en el caso de la muestra grande pero el valor estadstico de prueba es el siguiente:

=
Ejemplo

Por registros pasados se sabe que la vida til promedio de una pila elctrica que se utiliza en un reloj digital es de 305 das. La vida til de las pilas se distribuye normalmente. Tal elemento elctrico fue modificado recientemente para que tenga mayor duracin. Se prob una muestra de 20 pilas modificadas y se encontr que la vida media era de 311 das con una desviacin estndar de la muestra de 12 das. Al nivel de significancia de 0.05. La modificacin increment la duracin promedio de la pila? a.- Plantear la hiptesis nula y alternativa. b.- Ilustrar grficamente la regla de decisin. c.- Calcular t y llegar a una decisin. Resuma la manera breve el resultado. Solucin:

Grados de libertad (g.l.): 20 1 = 19

Regla de decisin:

14

DISEOS EXPERIMENTALES Ciclo 2013 I UCV

Rechazar

si t

Valor de prueba: t=

= 2.24

Por lo tanto se rechaza

porque 2.24 est en la zona de rechazo.

Prueba de dos medias poblacionales: Muestras aleatorias independientes Valor de prueba

t t con grados de libertad:

Donde: Tamao de muestra Poblacin 1 Poblacin 2 Grados de libertad: Observacin Las varianzas son desconocidas, pero iguales: Donde Ejemplo: Una muestra de calificaciones en un examen presentado en un curso de Estadstica (en escala 100) es: Hombres: 72, 69, 98, 66, 85, 76,79 80,77 Mujeres: 87, 90, 78, 81, 80, 76 Al nivel de significancia de 0.01, La calificacin de las mujeres es ms alta que la calificacin de los hombres? es un estimador insesgado de 2 Media muestral Varianza ponderada

15

DISEOS EXPERIMENTALES Ciclo 2013 I UCV

Solucin:

: : H 78 9.49 9 M 82 5.40 6

s n

Regla de decisin: Rechazar si t

Valor de la prueba

= 66.6153

= 0.10

Se acepta porque 0.42 est en la zona de aceptacin. Por lo tanto, no se puede afirmar que la calificacin de las mujeres es ms alta que la calificacin de los hombres. Prueba para la diferencia entre dos medias poblacionales: una prueba de diferencia pareada Hay dos casos: a.- Caso I: < 30 Variancias poblacionales desconocidas pero iguales 1.-Hiptesis nula: Ho: (12) = d = 0 2.- Hiptesis nula: Prueba de una cola Ha: d> 0 Ha: d < 0 Prueba de dos colas Ha: d 0

16

DISEOS EXPERIMENTALES Ciclo 2013 I UCV

3.- Estadstico de prueba t= = 1

4.- Regin de rechazo: Rechazar Ho cuando Prueba de una cola t>t t>t Ejemplo.- Antes de contratar la instalacin de un sistema que trasmita msica a las oficinas de una empresa, el gerente selecciona al azar 7 oficinas para instalarles el nuevo sistema. El tiempo promedio en minutos que pasaban los empleados fuera de esas oficinas, fue registrado antes y despus de instalarse el sistema de msica, obtenindose los siguientes resultados Numero de oficina No msica Con msica 1 2 3 4 5 6 7 7 8 = 0.05 Prueba de dos colas t> t<

8 9 5 6 5 10 5 6 7 5 6 7

Sugerira Ud. que el ejecutivo proceda con la instalacin? Solucin Ho: d = 0 Ha: d > 0 No msica 8 9 5 6 5 10 7 Con msica 5 6 7 5 6 7 8

d 3 3 2 1 1 3 1

=7,14

=6,28

=0,85

=2,6457

t=

=1,025

En las tablas t (7-1) 0,05 1,943

17

DISEOS EXPERIMENTALES Ciclo 2013 I UCV

Conclusin: No hay una evidencia estadstica para afirmar que con la instalacin de la msica en las oficinas, los empleados pasaran ms tiempo en estas. b.. Caso II:

Variancias poblacionales desconocidas pero diferentes Las hiptesis son las mismas, pero la prueba estadstica ser:

Los grados de libertad se calculan de la siguiente manera: [ ]


] [ ]

g.l.
[

Los dems pasos son los mismos Prueba de hiptesis para la Varianza Hay casos que se tiene el problema de desconocer la varianza, o desviacin estndar de la poblacin, en donde las distribuciones son normales. Si se desea probar una hiptesis acerca de la varianza se puede hacer utilizando la distribucin de Ji cuadrada (Chi cuadrada). As mismo, supngase que se tiene inters en dos poblaciones normales independientes, donde las medias y las varianzas de la poblacin son desconocidas. Se desea probar la igualdad de las dos varianzas, ya que para poder comparar las medias de estas dos poblaciones se ha utilizado la distribucin de t de Student, en la cual podemos tener varianzas iguales o diferentes en la poblacin. Par conocer esto ltimo se requiere de la distribucin F de Fisher, y despus de utilizarla se tomar la decisin de tener o no varianzas iguales en la poblacin, dando pie a realizar la comparacin de las dos medias segn sea el caso. En un primer caso en el que las varianzas de la poblacin son desconocidas, pero iguales, o en un segundo caso, donde se tiene varianzas desconocidas, pero diferentes Prueba de hiptesis para la varianza de un distribucin normal A continuacin se desarrollar el procedimiento para contrastar hiptesis sobre la varianza poblacional , a partir de una muestra aleatoria de n observaciones de una poblacin normal. Prueba bilateral de la varianza de una poblacin

Estadstico de prueba:

Regla de decisin a un nivel de significancia

18

DISEOS EXPERIMENTALES Ciclo 2013 I UCV

Rechazar

si:

Ejemplo Una manera de evaluar la eficacia de un profesor ayudante es analizar las calificaciones obtenidas por sus estudiantes en un examen al final del curso. Evidentemente, es interesante la puntuacin media, sin embargo, la varianza tambin contiene informacin til; algunos profesores tienen un estilo que funciona muy bien con los estudiantes ms sobresalientes, pero es ineficiente con los estudiantes con menos capacidad o menos motivados. Un profesor realiza un examen al final de cada semestre para todas las secciones del curso, la varianza de las calificaciones de este examen suelen estar muy prximos a 300 : Un nuevo ayudante tiene una clase de 30 estudiantes, cuyas calificaciones en el examen tuvieron una varianza de 480; considerando estas calificaciones como una muestra aleatoria de una poblacin normal, contrastar la hiptesis nula de que la varianza poblacional de sus calificaciones es 300 frente a una alternativa bilateral con 0.05

Regla de decisin Rechazar si:

Valor de prueba = Entonces dado que 45.72, se rechaza = 46.40 , lo cual significa que la varianza es diferente de 300

19

DISEOS EXPERIMENTALES Ciclo 2013 I UCV

Prueba unilateral derecha de la varianza de una poblacin

Estadstico de prueba = Regla de decisin a un nivel de significancia Rechazar si:

Ejemplo Un producto, se debe maquinar determinada parte con tolerancias muy estrechas, para que los clientes la puedan aceptar. Las especificaciones del producto piden que la varianza mxima de las longitudes de las partes sea 0.0004. Suponga que en 30 partes, la varianza de la muestra result ser 0.0005. Pruebe con un 0.05 si se ha violado la especificacin de varianza de la poblacin

Estadstico de prueba = Regla de decisin a un nivel de significancia Rechazar si: = = 36.25

Regla de decisin Rechazar si: , se acepta la Ho, lo cual significa que las especificaciones del producto

Entonces dado que no han sido violadas.

20

DISEOS EXPERIMENTALES Ciclo 2013 I UCV

Prueba unilateral izquierda de la varianza de una poblacin

Estadstico de prueba = Regla de decisin a un nivel de significancia Rechazar si:

Inferencia acerca de la varianza de dos poblaciones normales Distribucin de F Denominada as por sir Ronald Fisher, uno de los fundadores de la ciencia estadstica moderna. Esta distribucin se utiliza como la entidad estadstica de prueba en varios casos, sirve para probar si dos muestras proceden de poblaciones con varianzas iguales. Asimismo, tambin sirve cuando se desea comparar simultneamente varias medias poblacionales, esta comparacin simultanea de varias de tales medias se denomina anlisis de varianza (ANAVA) (ANOVA), en estos dos casos las poblaciones deben ser normales. Prueba de hiptesis bilateral respecto a la varianza de dos poblaciones

Estadstico de prueba

Regla de decisin a un nivel de significacin Rechaza F s:

21

DISEOS EXPERIMENTALES Ciclo 2013 I UCV

Prueba unilateral derecha acerca de la varianza de dos poblaciones normales.

Estadstico de prueba F Regla de decisin a un nivel de significacin Rechaza s: F

Observacin.- La varianza muestral ms grande se coloca en el numerador, en consecuencia, la razn F siempre es mayor a 1. Por lo tanto, el valor crtico de la cola de valores superiores es el nico que se necesita ( )

Ejemplo: La compaa Piura Com realiz un estudio acerca de los hbitos de escuchar radio por parte de los hombres y las mujeres. Un aspecto del estudio comprendi el tiempo promedio de audicin. Se descubri que tal tiempo para los varones es de 35 minutos al da. La desviacin estndar de la muestra de 11 personas de sexo masculino que se estudiaron fue de 10 minutos diarios. El tiempo promedio de audicin para las 13 mujeres en el estudio fue tambin de 35 minutos, pero la desviacin estndar de la muestra, result 12 minutos. Al nivel de significancia de 0.10, es posible concluir que existe diferencia en la variacin del nmero de minutos que los hombres y las mujeres escuchan la radio?

22

DISEOS EXPERIMENTALES Ciclo 2013 I UCV

Recuerde que 0.36

Rechaza F

s: F

Estadstico de prueba F 1.44

Por lo tanto, al ser F 1.44 se acepta , lo cual significa que la variacin del nmero de minutos que escuchan radio los hombres es igual al de las mujeres. Ejemplo En su incansable bsqueda de un sistema de llenado adecuado, cierta empresa prueba dos mquinas. Robot Fill se usa para llenar 16 tarros y resulta una desviacin estndar de 1.9 onzas en el llenado. Con Automatic Fill se llenan 21 frascos que dan desviacin estndar de 2.1 onzas. Si la empresa tiene que elegir uno de estos sistemas en funcin de la uniformidad de llenado, Cul deber seleccionar? Use un 0.05 Solucin Robot Fill Automatic Fill

23

DISEOS EXPERIMENTALES Ciclo 2013 I UCV

De acuerdo a la tabla de F:

Regla de decisin a un nivel de significacin Rechaza s: F Estadstico de prueba F Dado que el valor de F es 1.22 se acepta Ho. Por lo tanto, se elige el proceso Automatic Fill porque es el que presenta mejor uniformidad de llenado. Prueba de bondad de ajunte e independencia Prueba de Una medida de la diferencia existente entre las frecuencias observadas y esperadas es suministrada por el estadstico, dado por: Donde Frecuencia observada Frecuencia esperada. Ejemplo La siguiente tabla muestra las frecuencias observadas al lanzar un dado 120 veces. Ensayar la hiptesis de que el dado est bien hecho al nivel de dignificacin de 0.05 Cara Frecuencia observada Solucin Hiptesis: : Las frecuencias observadas y esperadas son significativamente iguales (dado bien hecho). : La frecuencias observadas y esperadas son diferentes (dado cargado) Primero se procede a encontrar los valores esperados. La probabilidad de obtener cualquier numero en un dado no cargado es de Cara 1 2 3 4 5 Frecuencia observada 25 17 15 23 24 Frecuencia esperada 20 20 20 20 20 Buscamos el valor en la tabla para K 1 = 6 1 = 5 grados de libertad 6 16 20 Total 120 1 25 2 17 3 15 4 23 5 24 6 16

24

DISEOS EXPERIMENTALES Ciclo 2013 I UCV

Regla de Rechazar 11.07 Valor de la

decisin

prueba

+
Como 5 es menor que 11.07 se acepta la bien hecho Tabla de contingencia

=5
y se concluye con una significacin de 0.05, que el dado est

En muchas ocasiones, los n elementos de una muestra tomada de una poblacin puede clasificarse con dos criterios diferentes. Por tanto, es interesante saber si los dos mtodos de clasificacin son estadsticamente independientes. El inters recae en probar la hiptesis de que los dos mtodos de clasificacin rengln columna son independientes. Si se rechaza esta hiptesis, entonces, se concluye que existe alguna interaccin entre los dos criterios de clasificacin. Ejemplo Una asociacin de profesores universitarios quiere determinar si la clasificacin en el trabajo es independiente de la categora acadmica. Para ello se realiz un estudio nacional entre los acadmicos universitarios y encontr los resultados que se muestran a continuacin, Con al 0.05 haga una prueba para saber si son dependientes la satisfaccin en el trabajo y la categora acadmica Categora Profesor auxiliar 60 87 63

Satisfaccin En el trabajo . Solucin

Mucha Regular Poca

Profesor Asistente 40 78 57

Profesor asociado 52 82 66

Profesor principal 63 88 64

Planteamiento de las hiptesis La satisfaccin en el trabajo y la categora acadmica son independientes La satisfaccin en el trabajo y la categora acadmica no son independientes

Grados de libertad: (r 1)(c 1) = (3 -1)(4 -1) = 6

25

DISEOS EXPERIMENTALES Ciclo 2013 I UCV

Regla de decisin Rechazar 12.59

Se procede a calcular los valores esperados de cada celda: Donde: i= fila j = columna

Se toma en cuenta los totales del rengln y la columna

Satisfaccin En el trabajo

Mucha Regular Poca Total

Profesor asistente 40 78 57 175

categora Profesor auxiliar 60 87 63 210

Profesor asociado 52 82 66 200

Profesor principal 63 88 64 215

Total 215 335 250 800

= = = =

= 47.03 = 56.44 = 53.75 = 57.78

= = = =

= 73.28 = 87.94 = 83.75 = 90.03

= = = =

= 54.69 = 65.62 = 62.50 = 62.50

Satisfaccin En el trabajo

Mucha Regular Poca Total

Profesor asistente 47.03 73.28 54.69 175

categora Profesor auxiliar 56.44 87.94 65.62 210

Profesor asociado 53.75 83.75 62.50 200

Profesor principal 57.78 90.03 67.19 215

Total 215 335 250 800

Valor de la prueba:

26

DISEOS EXPERIMENTALES Ciclo 2013 I UCV

= 2.75

Como 2.75 es menor que el valor critico 12.59, por lo tanto, no se rechaza y se concluye con un = 0.05, que la satisfaccin en el trabajo y la categora acadmica son independiente. Anlisis de regresin y correlacin Anlisis de correlacin Conjunto tcnicas estadsticas empleadas para medir la intensidad de la asociacin de dos variables. Diagrama de dispersin Grfica que presenta la relacin entre dos variables. Variable dependiente Es aquella cuyos datos dependen de otras variables. Variable independiente Son los valores que no tienen relacin de dependencia con otras variables. Por convencin, la variable conocida o independiente se grafica en el eje de abscisas (x), y la variable independiente o estimada en eje de las ordenadas (y) Ejemplo La empresa Rzuri Hnos. un negocio familiar que ha vendido al menudeo en Piura durante muchos aos, se anuncia ampliamente por radio y televisin, destacando sus bajos precios y accesibles condiciones de crdito. Al dueo le gustara analizar la relacin entre las ventas y lo que gasta en publicidad. A continuacin se muestra la informacin acerca de las ventas y lso gastos de publicidad durante los ltimos cuatro meses. Mes Julio Agosto Setiembre Octubre Gastos de publicidad (miles de dlares) 2 1 3 4 Ingreso por ventas (miles de dlares) 7 3 8 10

Se plantea la hiptesis de que a medida que aumentan los gastos de publicidad, aumentan los ingresos por ventas. Debemos comenzar por el diagrama de dispersin, que nos permite tener una idea sobre el grado (intensidad) y la naturaleza (forma) de la relacin entre las dos variables. Entonces podemos dar cuenta si

la relacin es lineal o no lineal, positiva o negativa, o simplemente no existe una relacin aparente.

27

DISEOS EXPERIMENTALES Ciclo 2013 I UCV

Observando el diagrama podremos establecer lo siguiente: 1.- Existe una relacin lineal entre los gastos de publicidad y el ingreso por ventas en ese periodo de 4 meses. Por lo tanto, es posible trazar una lnea recta que se ajuste a los puntos graficados en el diagrama de dispersin 2.- La relacin no es determinstica; vale decir, cualquiera que sea la lnea recta que se trace, la mayora de los puntos estarn por encima o por debajo de dicha recta. Coeficiente de correlacin Medida de la intensidad de la relacin lineal entre dos variables. Para determinar el valor numrico del coeficiente de correlacin se utiliza la siguiente expresin

r=
Donde:

][

n= Nmero de pares de observaciones x = Suma de los valores de la variable x y = Suma de los valores de la variable y = Suma de los valores de x elevados al cuadrado Cuadrado de la suma de los valores de x = Suma de los valores de y elevados al cuadrado = Cuadrado de la suma de los valores de y xy = Suma del producto de x e y El coeficiente de correlacin ( r ) puede tomar cualquier valor de -1.00 a +1.00 inclusive. Un coeficiente de correlacin -1.00 de +1.00 indica una correlacin perfecta Un coeficiente cercano a cero indica que la relacin es dbil. Con los datos del problema tenemos:

28

DISEOS EXPERIMENTALES Ciclo 2013 I UCV

x 2 1 3 4 10

Total

y 7 3 8 10 28

xy 14 3 24 40 81

4 1 9 16 30

49 9 64 100 222

r=
r=

][

][

= 0.96

Por lo tanto existe una fuerte correlacin entre el gasto en publicidad y el ingreso por ventas. Anlisis de regresin A travs del anlisis de regresin buscamos que la lnea de ajuste se aproxime lo mejor posible a todos los puntos del diagrama de dispersin. La ecuacin para la lnea recta empleada para calcular y con base en x se conoce como ecuacin de regresin. Ecuacin de regresin Expresin matemtica que define la relacin entre dos variables. Principio de mnimos cuadrado Tcnica empleada para obtener la ecuacin de la regresin, minimizando la suma de los cuadrados de las distancias verticales entre los valores y verdaderos y los valores pronosticados . Dicha recta se define como: y = a +bx Par determinar la calidad estimadora de esta recta necesitamos alguna medida de la distancia de los puntos ( a esta recta. El siguiente grafico muestra, para un solo punto, como se mide esta distancia. Para el valor el correspondiente valor y en nuestra recta es a + bx mientras que el valor realmente observado para la variable dependiente es .La diferencia entre los dos es:

29

DISEOS EXPERIMENTALES Ciclo 2013 I UCV

Ahora bien, cualquier estimador razonable de la recta de regresin verdadera dejar algunos de los datos observados por debajo y otros por encima de la recta estimada. Por lo tanto, algunos de los sern positivos y otros negativos a=

b= b=
La recta: = a + bx Se denomina recta de regresin muestral de y sobre x El coeficiente b significa que cada unidad adicional de x incrementa el valor de y en b unidades El valor a solo tiene interpretacin matemtica, indica el punto de corte de la recta con el eje y. Ejemplo Los datos siguientes muestran las ventas (en millones) de cajas y los gastos de publicidad (en millones de dlares) para 7 marcas principales de refrescos: Marca Coca cola Pepsi Kola real Sprite Inca cola Concordia 7 up Gastos de publicidad 131.3 92.4 60.4 55.7 40.2 29.0 11.6 Ventas de cajas 1929.2 1384.6 811.4 541.5 536.9 535.6 219.5

a.- Trace un diagrama de dispersin para estos datos, con los gastos de publicidad como variable independiente. b.- Qu parece indicar este diagrama acerca de la relacin entre las dos variables? trace una recta que pase por los datos, para aproximar una relacin lineal entre los gastos de publicidad y las ventas. c.- Aplique el mtodo de mnimos cuadrados para plantear la ecuacin estimada de regresin d.- Presente una interpretacin de la pendiente de esta ecuacin Solucin: Variable independiente: Gastos de publicidad Variable dependiente: Ventas de cajas Diagrama de dispersin.

30

DISEOS EXPERIMENTALES Ciclo 2013 I UCV

El diagrama parece indicar que la relacin entre las variables es linealmente positiva. Ahora encontraremos los valores de r, a y b Gastos de x 131.3 92.4 60.4 55.7 40.2 29 11.6 420.6 Publicidad 17 239.69 8 537.76 3 648.16 3 102.49 1 616.04 841 134.56 35 119.7 Ventas de y 1929.2 1 384.6 811.4 541.5 536.9 535.6 219.5 5 958.7 ][ cajas 3 721 812.64 1 917 117.16 658 369.96 293 222.25 288 261.61 286 867.36 48 180.25 7 213 831.23 ] = 0.97810014 xy 253 303.96 127 937.04 49 008.56 30 161.55 21 583.38 15 532.4 2 546.2 500 073.09

Sumas

r= r=

][

Como r se aproxima a uno, entonces diremos que la relacin que hay entre las dos variables es bastante fuerte o intensa. La ecuacin que mejor se ajusta a los datos es una recta, como se aprecia en el siguiente grfico.

31

DISEOS EXPERIMENTALES Ciclo 2013 I UCV

b= b=
a= a= Por lo tanto la ecuacin de la recta seria: y = a +bx y = - 15.42 + 14.424x La interpretacin que tiene a es solo matemtica, esto es el punto de corte con el eje y El valor que toma b se interpreta como: por cada incremento en la variable dependiente se espera una variacin de 14.424 en la variable dependiente Coeficiente de determinacin ( ) = - 15.42

= 14.42378282

Es el estadstico que mide la proporcin de la variacin total en y que puede ser explicada por la variacin en x. El coeficiente de determinacin se calcula elevando al cuadrado el coeficiente de correlacin. En el ejemplo anterior como r = 0.9781, el coeficiente de determinacin ser 0.9567, luego pude decirse que 95.67% de la variacin en el nmero de cajas vendidas se explica por la variacin en los gastos de publicidad. Prueba de significancia del coeficiente de correlacin Es importante estudiar si r es significativo (distinto de cero) ya que ello implica que el modelo de regresin lineal es significativo. Planteamiento de hiptesis: 0 (la correlacin en la poblacin es nula) (la correlacin en la poblacin no es nula) Estadstico de prueba t

, con n 2 grados de libertad

32

DISEOS EXPERIMENTALES Ciclo 2013 I UCV

Rechazar

si: T
( )

Del ejemplo anterior, pruebe la hiptesis de que no existe correlacin en la poblacin. Emplee 0.02 de nivel de significancia Solucin Planteamiento de hiptesis 0 (la correlacin en la poblacin es nula) (la correlacin en la poblacin no es nula) Regla de la decisin

Rechazar

si: T t

Estadstico de prueba

= 10.5093

Se acepta la hiptesis alternativa, es decir existe relacin entre las variables en estudio ERROR ESTNDAR DE LA ESTIMACIN: Mide la dispersin de los valores observados, con respecto a la recta de regresin.

=
Gastos de Publicidad x 131.3 92.4 60.4 55.7 40.2 29.0 11.6

Marca Coca cola Pepsi Kola real Sprite Inca cola Concordia 7 up

Ventas de Cajas y 1929.2 1384.6 811.4 541.5 536.9 535.6 219.5

Rendimiento Pronosticado 1878.45 1317.35 855.78 787.99 564.42 402.87 151.89

Desviaciones y 50.75 67.25 - 44.38 - 246.49 - 27.52 132.73 67.61

Desviaciones al cuadrado 2575.56 4522.56 1969.58 60757.32 757.35 17617.25 4571.11

33

DISEOS EXPERIMENTALES Ciclo 2013 I UCV

= 136.21

ESTIMACIN DE LOS INTERVALOS DE CONFIANZA El error estndar de la estimacin es una medida vlida para utilizarla al fijar los intervalos de confianza cuando el tamao de muestra es grande y de alguna forma la dispersin con respeto a la recta de la regresin est distribuida de manera normal. Un intervalo de confianza se determinar para: 1.- El valor medio de Y para un valor dado de X 2.- Un valor individual de Y para un valor dado de X
( )

t(Syx)
De donde

Y' = es el valor pronosticado para cualquier valor X seleccionado X = es cualquier valor seleccionado de X = es la media de X n = en el nmero de observaciones Syx = es el error estndar de la estimacin t = es el valor de t tomado para n 2 Ejemplo De acuerdo a los datos anteriores. Calcular los intervalos de confianza para la venta de cajas de gaseosas cuando la inversin en publicidad es 100.00 (millones de dlares) = es 1426.98 para un x igual a 100 = es 60.0857 n = es 7 Syx = 136.21 t (n 2) =t(7 -2)(0,05)= 2.571 1426.98 1426.98 Interpretacin.Cuando se invierte 100 millones de dlares en publicidad, se espera que la venta de gaseosas est comprendida entre1622.1091 y 1231.8509 miles de cajas Pero cuando a se trata de un valor individual la frmula es: t(Syx)
( )

195.1291 = 1622.1091 y 1231.8509

34

DISEOS EXPERIMENTALES Ciclo 2013 I UCV

Ejemplo. - Cuanto ser la venta de cajas de Inca cola, cuando esta compaa invierta 100 millones en publicidad: 1426.98 1426.98 Interpretacin.Con una probabilidad del 0,95 se puede afirmar que cuando la Inca Cola invierta 100 millones en publicidad sus ventas estarn comprendidas entre 1972.305 y 881.655 cajas.. RELACIN ENTRE COEFICIENTE DE CORRELACIN, DETERMINACIN Y ERROR ESTANDAR DE ESTIMACIN COEFICIENTE DE 1972.305y 881.655

Un medio conveniente para mostrar la relacin entre estas tres medidas es la ANAVA, recordemos que: El error estndar de la estimacin mide cun cerca de la recta de regresin se encuentra los valores reales. Cuando el valor es pequeo indica que las dos variables estn relacionadas muy de cerca. El coeficiente de correlacin mide la fuerza de la asociacin entre dos variables. Cundo los puntos del diagrama de dispersin parecen cercanos a la lnea recta, se observa que el coeficiente de correlacin tiende a ser grande. Luego el error estndar de la estimacin y coeficiente de correlacin indican la misma informacin, pero utilizan escalas diferentes. El coeficiente de determinacin mide el porcentaje de la variacin de Y que se explica por la variacin de A Fuentes de Variacin Regresin Error Total SC r = Suma de Cuadrados N A V A Cuadrado Medio Prueba de significacin Significacin estadstica

Grados de Libertad 1 n2 n1

SC e= ( ) =SC t SC r SC t = (
y

)
( ) ( )

1929.2 1384.6 811.4 541.5 536.9 535.6 219.5

1878.45 1317.35 855.78 787.99 564.42 402.87 151.89

851.2428 851.2428 851.2428 851.2428 851.2428 851.2428 851.2428

1077.9572 533.3572 - 39.8428 -309.7428 -314.3428 -315.6428 -631.7428

1161991.725 284469.9028 1587.4487 95940.6021 98811.3959 99630.3771 399098.9654

50.75 67.25 -44.38 -246.49 -27.52 132.73 67.61

2575.5625 4522.5625 1969.5844 60757.3201 757.3504 17617.2529 4571.1121

1027.2072 466.1072 4.5372 -63.2528 -286.8228 -448.3728 -699.3528

1055154.632 217255.9219 20.5861 4000.9167 82267.3186 201038.1678 489094.3389

35

DISEOS EXPERIMENTALES Ciclo 2013 I UCV

A Fuentes de Variacin Regresin Error Total SC

V GL

A CM 2048831.882 18554.1489 F 110.4244 Sign. Estad. **

2048831.882 1 92770.7449 5 2141530.417 6 F (1,5)= 6.61 ( 16.26 (

Interpretacin: Realizado el anlisis de variancia (ANAVA) para la regresin se encontr una alta significacin estadstica para la regresin, por lo tanto podemos decir que existe asociacin entre ambas variables en estudio

=
=

= 1
= 0,9567 = 95.67%

= 1

El 95.67% de las variaciones de la venta de cajas de gaseosas (Y) es explicado por la inversin que se hizo en publicidad (X) r= 1 = 0.9781 (Coeficiente de correlacin)

= 4.33% (Coeficiente de no determinacin)

El error estndar de la estimacin tambin puede ser calculado de la siguiente forma

S yx=

= 136.2136

Por ltimo se como se observa que conforme la Suma de Cuadrado del error disminuye ta y por el contrario, conforme disminuye el error estndar se incrementa r 2 Anlisis de regresin mltiple Estudia la influencia de dos o ms variables independientes sobre la dependencia de otra variable dependiente. La ecuacin ser: = bo + b1X1 +b2X2 X 1,X2 = son las dos variables independientes bo = es la interseccin en Y, es decir, la ordenada con el eje del punto de interseccin con el eje Y b1= es el cambio neto en Y por cada cambio unitario de X1 manteniendo x2 constante (o sea sin cambios). Se denomina coeficiente de regresin parcial, coeficiente de regresin neta, ms brevemente, coeficiente de regresin. b2 = Es el cambio neto en Y por unidad de cambio en X2, manteniendo X1 constante (sin cambios). Tambin se denomina coeficiente de regresin parcial o simplemente coeficiente de regresin.

36

DISEOS EXPERIMENTALES Ciclo 2013 I UCV

La ecuacin de la regresin mltiple se puede ampliar a ms variables independientes. Y' = bo +b1X1 + b2X2 +b3X3 ++bkXk El mtodo de mnimos cuadrados, minimiza la suma de cuadrados de las desviaciones verticales con respecto a la lnea de la regresin, principios que se cumple para la regresin lineal como para la regresin mltiple. En el caso de dos variables independientes es necesario resolver las siguientes ecuaciones: Y = na + b1X1 +b2X2 X1Y = boX1 + b1 + b2X1X2 X2Y = boX2 + b1X1X2 + b2 Este sistema de ecuaciones se puede resolver de diferentes maneras, una de ellas es empleando matrices Ejemplo.- El director de personal de una empresa que tiene un importante grupo de vendedores, debe entrevistar y seleccionar nuevo personal. Ha diseado una prueba que ayuda a seleccionar los mejores aspirantes para su personal de ventas A fin de verificar la validez de una prueba como instrumento de prediccin de las ventas semanales. Eligi al azar a cinco vendedores y aplic la prueba a cada uno. Los importes de ventas semanales se aparearon con el puntaje obtenido en la prueba y con la calificacin que se les hizo a su desempeo 1.- Cul ser la ecuacin de regresin mltiple? 2. Supngase que un solicitante de empleo en el departamento de ventas tuvo un puntaje de 6,0 en la prueba y una calificacin de desempeo de 3,8. Cules son las ventas semanales estimadas del solicitante? Vendedor Ventas semanales (en miles de soles) Y 5 12 4 8 11 Puntaje de la Prueba 4 7 3 6 10 Calificacin de Desempeo 2 5 1 4 6

Juan Milagritos Ral Steffany Eduardo

Solucin: 1.- La ecuacin podr ser calculada de la siguiente forma:

] [

] =[ ]

Y 5 12 4 8 11 40 Total

4 7 3 6 10 30

2 5 1 4 6 18

16 49 9 36 100 210

4 25 1 16 36 82

8 35 3 24 60 130

20 84 12 48 110 274

10 60 4 32 66 172

Reemplazamos en el arreglo matricial

37

DISEOS EXPERIMENTALES Ciclo 2013 I UCV

] [

] =[ ]

Encontramos determinante de la matriz 3x3 | |

Procedemos a invertir la matriz cuadrada 3x3 * + = 320 * + = 120 * + = 120

+ =120

+ = 86

+ = 110

+ = 120

+ = 110

+ = 150

[ ][ ] =[ ]

Calculamos los coeficientes de la regresin mltiple


[ ( ) ]

= 3,5

[(

=0,975
]

= 2,875

Luego la ecuacin ser igual a: = bo + b1X1 + b2X2 = 3,5 + ( 0,975) X1 + 2,875X2 2.- Y' = 3,5 + (0,975)6,0 + 2,875(3,8) Y' = 8,575 miles de nuevos soles.

38

DISEOS EXPERIMENTALES Ciclo 2013 I UCV

ERROR ESTNDAR MLTIPLE DE LA ESTIMACIN: El error estndar de la estimacin en el anlisis de la regresin mltiple mide el error para valores de Y con respecto al plano de regresin si es que intervienen dos variables independientes.

Sy.12 =
Puntaje de Prueba

Calificacin de Desempeo

Ventas semanales (miles de soles)

Ventas semanales Pronosticadas (miles de soles)

Juan Milagritos Ral Steffany Eduardo

4 7 3 6 10

2 5 1 4 6

5 12 4 8 11

5,35 11,05 3,45 9,15 11,00 Total

0,35 0,95 0,55 1,15 0,00 0,00

0,1225 0,9025 0,3025 1,3225 0,0000 2,6500

Sy.12 =

= 1,151 miles de soles

COEFICIENTE DE CORRELACIN MULTIPLE. (r) Es la medida de la fuerza de la asociacin entre la variable dependiente y dos o ms variables independientes Este coeficiente toma valores entre 0 y a 1 inclusive, siempre es positiva Ejemplo Un coeficiente de 0,94 indica una asociacin muy fuerte entre las variables dependiente e independiente. Un coeficiente de 0,09 revela una relacin muy dbil

Correlacin pequea

Correlacin moderada

Correlacin grande

0 sin correlacion

0,50

1,00 correlacin perfecta

COEFICIENTE DE DETERMINACIN MLTIPLE (r2).-- Proporcin (porcentaje) de la variacin total en la variable dependiente Y que se explica por medio del conjunto de variables independientes COEFICIENTE DE NO DETERMINACIN MLTIPLE (1 r2).- mide la proporcin de la variacin total en la variable dependiente Y, que no se debe a las variables independiente. A Fuentes de Variacin Regresin Error Total Suma de Cuadrados N A V A Cuadrado Medio Prueba de significacin Significacin estadistica

Grados de Libertad K n n1

El coeficiente de determinacin se puede calcular de la siguiente manera:

39

DISEOS EXPERIMENTALES Ciclo 2013 I UCV

Error estndar de la estimacin mltiple ser igual a:

Sy.12 =
y 5 12 4 8 11 40 5,39 11,05 3,45 9,15 11 40 8 8 8 8 8 ( ) 3 4 4 0 3 0 ( 9 16 16 0 9 50 )

0,1225 0,9025 0,3025 1,3225 0 2,65 ( ) 2,65 3,05 4,55 1,15 3 0 ( ) 7,0225 9,3025 20,7025 1,3225 9 47,35

0,35 0,95 0,55 1,15 0 0

Total A Fuentes de variacin Regresin Error Total SC N GL A CM V A F 17.87 SIG N.S.

47.35 2 23.675 2.65 2 1.325 50 4 F(2,2)= 19,00 ( 99,50 (

Coeficiente de determinacin:

=
Coeficiente de regresin mltiple r= Error estndar de la estimacin mltiple: = 0,9731

Quiere decir que el 94,70% de la variacin es explicado por la regresin

Sy.12 =

= 1,1510

FUNDAMENTOS DE LA EXPERIMENTACIN AGRCOLA; DISEOS EXPERIMENTALES La estadstica es uno de los elementos bsicos de la experimentacin agrcola, ya que mediante ella se pueden obtener algunas conclusiones acerca de tales experimentos. El desarrollo agrcola de un pas se basa en las investigaciones que se realizan en ese campo, valindose de la experimentacin. Cualquier modalidad en las tcnicas de cultivo, al introducirse por primera vez a una regin, necesita de la experimentacin para poder adaptarlo y divulgarlo entre los agricultores. Esto se debe a que las condiciones de clima y suelo varan en cada regin, estacin y ao.

40

DISEOS EXPERIMENTALES Ciclo 2013 I UCV

Para el aprovechamiento ptimo de los recursos disponibles, los experimentos se deben disear de acuerdo con los principios estadsticos que permiten al experimentador llegar a conclusiones correctas acerca de un problema especfico. Los experimentadores y estadsticos deben planear los experimentos conjuntamente. Para ello el estadista debe tener un criterio prctico y el experimentador un criterio estadstico. Las etapas de todo trabajo de investigacin se pueden resumir de la siguiente manera: a) Enunciado del problema.

b) Colaboradores. c) Formulacin de hiptesis.

d) Seleccin del procedimiento y diseo experimentales. e) f) Realizacin del experimento. Aplicacin de los mtodos estadsticos a los resultados,

g) Interpretacin de resultados. h) Anlisis econmico y su utilidad prctica para la comunidad. La biometra es primordial para analizar e interpretar los datos y se manifiesta en diversas formas: a) Estudio de la variacin de una poblacin de seres vivos. b) Comparacin entre poblaciones y muestras para juzgar su semejanza. c) Interpretacin de resultados de experimentos biolgicos y agropecuarios, en donde se comparan poblaciones o muestras sometidas a diferentes estudios o pertenecientes a diferentes variedades o razas. d) Determinacin de la relacin entre dos o ms variedades (correlacin y regresin). e) Aplicacin de mtodos para reducir las fuentes de error en la correlacin de datos. f) En poblaciones segregadas, separacin de la variacin atribuible a la seccin de los genes debido al medio, en estudios de herencia cuantitativa. En general, la experimentacin agrcola la deben realizar los profesionales relacionados con las ciencias agronmicas y biolgicas. Disear un experimento significa planear un trabajo de modo que rena la informacin aplicable al problema en investigacin. Steel y Torrie consideran un experimento como una pregunta que detectar nuevos hechos, confirmar los resultados de ensayos anteriores y dar recomendaciones de aplicacin prctica. El experimento es el conjunto de reglas usadas para obtener una muestra de la poblacin y al concluir el ensayo obtener informacin acerca de la poblacin. Little y Jackson afirman que el experimento es un elemento de investigacin utilizada para descubrir algo desconocido, o para probar un principio o una hiptesis. Es un caso importante del mtodo cientfico, ya que las preguntas que el experimento pretende contestar sern fundamentales para apoyar o rechazar una hiptesis.

41

DISEOS EXPERIMENTALES Ciclo 2013 I UCV

TRATAMIENTO Es una de las formas que, en cantidad o calidad, el factor a estudiar toma durante el experimento. Por ejemplo, s el factor a estudiar es variedad de arroz, un tratamiento es la variedad NIR si el factor a estudiar es cantidad de lisina, cada una de las dosis de lisina aplicada durante el experimento es un tratamiento. Los tratamientos a estudiar durante el experimento pueden ser una combinacin de varios factores simples: si quiere estudiarse la distancia entre hileras y la distancia entre plantas en un cultivo, se pueden considerar tratamientos simples como 80 cm. entre hileras o 3 cm entre plantas, o tratamientos combinados como 80 cm entre hileras y 3 cm entre plantas. Por ejemplo, en la industria el productor de detergentes puede establecer como tratamiento el tipo de agua (dura o suave), la temperatura del agua, la duracin del lavado, la marca y el tipo de lavadora. En los estudios sociolgicos y psicolgicos, los tratamientos se pueden referir a edad, sexo, grado de educacin, religin, etctera. Unidad experimental es el material experimental al que se aplica un tratamiento de manera uniforme. Puede ser un animal, un conjunto de semillas, una parcela, una maceta, un rbol, un tubo de ensayo, etctera. Tratamiento testigo Es un tratamiento que se compara. Por ejemplo, si se quiere probar en una regin el grado de adaptacin y rendimiento de una variedad nueva de pltano, se planear el ensayo de tal manera que se incluyen variedades locales como testigos. Si la nueva variedad presenta mayor resistencia a enfermedades, insectos, vientos, precipitacin, etc., y en consecuencia produce mayor rendimiento por hectrea, esa variedad se recomendar para la zona. En investigacin con animales se pueden probar sexos, localidades, raciones, pocas, sistemas de pastoreo, carga de animal ptima, tipos de vacuna, uso de vitaminas y minerales, etc. En tales casos, se forman grupos de animales tan homogneos como sea posible para la investigacin. Para formar los grupos se deben considerar aspectos como edad, sexo y raza. Si a varios grupos de animales se les administran diferentes dosis de vitaminas, pero no a un grupo testigo, el anlisis estadstico dar informacin acerca del aumento de peso, altura y precocidad de los animales que recibieron la vitamina comparados con los que no la recibieron. REPETICIN Cuando en un experimento se tiene un conjunto de tratamientos para poder estimar el error experimental, es necesario que dichos tratamientos aparezcan ms de una vez en el experimento, para as aumentar la precisin de ste, controlar el error experimental y disminuir la desviacin estndar de la media. Por lo tanto, se entender por repeticin al nmero de veces que un tratamiento aparece en el experimento.

42

DISEOS EXPERIMENTALES Ciclo 2013 I UCV

DISEO EXPERIMENTAL Es el procedimiento que se sigue para asignar los tratamientos a las unidades experimentales. Es un mtodo aleatorio, o sea, de asignacin al azar, porque se decide el tratamiento que corresponde a cada unidad experimental mediante un sorteo o por medio de una tabla de nmeros aleatorios. BLOQUE O REPETICIN Es un conjunto de unidades experimentales lo ms homogneas posibles, en el cual aparecen todos los tratamientos una sola vez; dicho bloque se debe colocar perpendicular al gradiente para tratar de minimizar el error. ERROR EXPERIMENTAL Los resultados experimentales varean no solo por la accin de los tratamientos, sino tambin por variaciones ambientales que tienden a enmascarar el efecto de los tratamientos. Por lo general. Para expresar estas variaciones se usa el trmino error experimental. Pero el trmino error no quiere decir equivocacin, sino que incluye todo tipo de variacin externa ajena al material experimental. El error experimental es la medida de variacin que existe entre las observaciones de unidades experimentales en el mismo tratamiento, es decir, la variacin no proviene de los tratamientos. Existen dos clases de variaciones; la variacin inherente al material experimental, al que se aplican los tratamientos, y la que proviene de la falta de uniformidad en la realizacin fsica del experimento. Si los resultados obtenidos tienen la precisin necesaria para llegar a conclusiones validas, ninguna de las dos fuentes de variacin deben preocupar al investigador. El error experimental no se puede eliminar, pero sus efectos se pueden reducir para obtener una mejor estimacin de los efectos de los tratamientos. Las modalidades ms recomendadas para disminuir error son: a.-Utilizar unidades experimentales muy uniformes, como suelo homogneo, riegos, densidad de siembra, fertilizacin, control de plagas y hierbas, etctera. b.- Tamao adecuado de la unidad experimental. c.- Eliminacin del efecto de orilla y de la competencia entre tratamientos d.- Distribucin adecuada de los tratamientos mediante sorteos. e.- Usar el nmero adecuado de repeticiones para cada tratamiento. f.- Poner todos los tratamientos en iguales condiciones, de manera que si alguno es superior a los dems, se puede probar. Existen ciertos detalles tcnicos al realizar los experimentos que parecen obvios, sin embargo, muchas veces pasan inadvertidos. Una vez que se tiene listo el terreno para el experimento, es conveniente marcar los contornos de los bloques y la posesin de las parcelas de acuerdo con el diseo experimental. Si el campo est surcado y el nmero de surcos por parcela es impar se debe marcar el surco central de cada parcela, y si es par el primer surco de la derecha. Adems, las bolsas que contengan las semillas, abonos, etc., que se aplican a las parcelas, tendrn claramente indicado el nmero de bloque y parcela a que

43

DISEOS EXPERIMENTALES Ciclo 2013 I UCV

pertenecen. Antes de empezar la siembra y su preparacin, el experimentador debe verificar que cada bolsa est en el campo frente a la parcela correspondiente. Durante la realizacin del experimento debe quedar claro que todas las labores se harn con uniformidad para todo el lote experimental, excepto las que estn en estudio. Cuando se efectan experimentos de abonamiento, variedades, etc., es importante conocer el origen de cada tratamiento, las caractersticas de las variedades y el anlisis de los abonos. Los materiales para aplicar los tratamientos se deben conseguir y preparar oportunamente, y nunca esperar hasta el da del inicio del experimento. La siembra, abonamiento, labores culturales y otras, se deben realizar el mismo da para todo el experimento. Lo anterior es necesario en los lugares lluviosos, porque las labores realizadas antes y despus de llover encuentran el terreno en condiciones diferentes, lo cual puede causar variabilidad en la germinacin, efecto de los abonos, etc. Si no es posible realizar las labor completa en un da se debe evitar dejar bloques sin terminar Si se trata de experimentos comparativos de variedades es til compara las caractersticas de las variedades sembradas, con aquellas que se obtienen al momento de la cosecha, para determinar cmo se adaptan a las condiciones ecolgicas de la localidad. Tambin es muy importante que una parte de la semilla de las variedades introducidas se cultive aparte para mantener su pureza, adems de multiplicarla y aclimatarla, ya sea para utilizarla en experimentos siguientes o para distribuirla entre los agricultores. En ciertos casos, para mantener la pureza de la variedad es necesario ir al embolsado de las flores para evitar la polinizacin cruzada. Cuando se trabaja con varios obreros de campo es importante cuidar que ninguno se dedique a un mismo tratamiento en todas las repeticiones del experimento. Ya que, un obrero puede trabajar mejor que otro y, en consecuencia, el tratamiento que realice estar en ventaja. Un experimento nunca se debe sembrar fuera de poca porque pierde su valor. En los experimentos de abonamiento no debe descartarse el testigo sin abono, ni el testigo que representa la prctica de la localidad. Debido a que muchos experimentos se pierden por los daos que causan los animales se debe extremar la vigilancia, especialmente en la poca prxima a la cosecha. En la toma de datos y observaciones en los experimentos, es importante que el experimentador se libere de toda preferencia por determinado tratamiento para evitar falsear de manera inconsciente los resultados. Tambin es importante que l mismo sea quien haga las observaciones y que anote slo los datos debidamente comprobados. En los experimentos no deben interesar solamente los rendimientos, ya que de proceder as no se conoceran las causas que determinan ciertos resultados de buena calidad del producto. Se aconseja revisar los experimentos cuando menos una vez por semana, para hacer las observaciones oportunamente. Todas las observaciones se deben anotar cuidadosamente sin dejan nada al azar ni confiar en la memoria. Los datos deben estar en orden, de tal manera que otro experimentador pueda utilizarlos si es necesario.

44

DISEOS EXPERIMENTALES Ciclo 2013 I UCV

Para muchos investigadores el tamao y la forma de la unidad experimental es nicamente un problema de control. Sin embargo, investigaciones realizadas en diferentes cultivos con datos de ensayo en blanco, han indicado que el tamao adecuado se relaciona con el grado de precisin y con una mejor estimacin de los efectos de los tratamientos, el aspecto del costo por unidad experimental y la precisin del experimento: aqu se prefiere un mayor nmero de repeticiones que el tamao, y la unidad experimental se orienta de manera que la mayor dimensin se dirija hacia donde est la mayor variacin del suelo. ELECCIN DEL DISEO EXPERIMENTAL Cuando el experimentador ya defini el objetivo del trabajo y los tratamientos por probar, el siguiente paso es determinar el diseo experimental que se debe usar. Para un experimento especfico, el mejor diseo es el ms sencillo y el que usa la menor cantidad de material para lograr el objetivo. En la prctica, las unidades experimentales, las condiciones ambientales y de manejo no son iguales, y los mtodos de medida son inexactos. Por ello, es necesario hacer repeticiones y utilizar un diseo experimental. Si se considera que el experimentador estudia un fenmeno complejo (como la produccin de trigo, de leche o el crecimiento de una colonia de hongos), que mantiene fijos todos los factores que intervienen en el fenmeno y que los mtodos de medida son exactos, el resultado ser el mismo cada vez que se realice el experimento. Entonces, cada combinacin de factores determina un resultado que permanecer constante si se repite el experimento. El experimentador, de acuerdo con su objetivo, vara uno o ms factores para evaluar el efecto de tales variaciones en el resultado. TCNICA DE ALEATORIEDAD Debido a la variabilidad del suelo, para evitar que un tratamiento sea favorecido o puesto en desventaja en forma sistemtica en sus repeticiones, Fisher ide la tcnica de aleatoriedad, cuya finalidad es dar una estimacin insesgada del error experimental. Las parcelas contiguas tienden a correlacionarse, por eso cualquiera de ellas debe recibir al azar algn tratamiento. La aleatoriedad tiende a destruir la correlacin entre errores y hacer vlidas las pruebas de significacin. El ejemplo ms comn de la tcnica de aleatoriedad est dado por la rifa de un objeto. Si se colocan papeles o fichas numeradas en un nfora y se supone que estn completamente mezcladas, cualquier secuencia en que salgan se considerar aleatoria. Cuando el investigador tiene pocos tratamientos recurre a esta tcnica. Sin embargo, es preferible recurrir a una tabla de nmeros aleatorios. ANLISIS DE VARIANZA Anteriormente se analizaron datos provenientes de dos muestras o dos tratamientos. Se observ que por medio de la prueba t de Student es posible determinar si la variedad A es estadsticamente ms productiva que la variedad B, o si un forraje con fertilizante es mejor que un forraje sin fertilizante.

45

DISEOS EXPERIMENTALES Ciclo 2013 I UCV

El trabajo del investigador pocas veces se limita a estudiar dos tratamientos a la vez. Para ahorrar tiempo y esfuerzo, y para aumentar la precisin del experimento, por lo general, se estudian ms de dos factores a la vez, con varios niveles dentro de cada factor. Sir Ronald Fisher introdujo el anlisis de varianza (ANAVA), que es un procedimiento aritmtico que consiste en desdoblar la suma de cuadrados total (variacin total) en fuentes de variacin reconocidas, con todo y la variacin que no se pudo medir (proveniente de la variabilidad inherente al material experimental o de la falta de homogeneidad del ambiente donde se realiz el experimento); fuente de variacin que se conoce como residuo o error experimental. Por ejemplo, cuando se trat lo concerniente a regresin, la suma de cuadrados total se descompuso en suma de cuadrados debido a la regresin, ms la suma de cuadrados debido al error. El ANAVA se utiliza en todos los campos de investigacin cuando los datos se miden cuantitativamente. Su uso ha sido muy ventajoso en el diseo experimental. Las suposiciones bsicas del ANAVA son a) Los efectos de tratamientos y ambientales son aditivos.

b) El error experimental es un elemento aleatorio, normal e independiente, distribuido con media cero y varianza comn.

GRADOS DE LIBERTAD Los grados de libertad son el nmero de contrastes ortogonales menos el nmero de restricciones impuestas, que se pueden hacer en un grupo de datos. Por ejemplo, si se supone que el rendimiento de cinco variedades de un cultivo es de 25, 26, 27, 28 y 29 kg, la meda es 27 kg. Las desviaciones de los nmeros con respecto a su medida (que deben sumar cero) son: 25 -2 26 -1 27 0 28 +1 29 +2

En esta muestra de cinco datos, uno queda fijo (la restriccin est dada por X= 27), porque X se utiliz como el origen para las desviaciones. Entonces quedan cuatro valores (cuatro grados de libertad) que se pueden comparar independientemente con la media, o sea que el nmero de grados de libertad de una muestra de datos est dado por el total de observaciones menos uno (n - 1). La varianza de la muestra est dada por:
( )

Es decir, la varianza es el cociente que resulta de dividir la suma de cuadrados entre el nmero de grados de libertad. Dentro del ANAVA, y para obtener el valor F (que denota la significacin entre tratamientos) se divide el cuadrado medio del tratamiento entre el cuadrado medio del error.

46

DISEOS EXPERIMENTALES Ciclo 2013 I UCV

Al comparar el valor de F calculado con el F tabulado, se podr establecer si existe significancia. Habr significancia en caso de que el valor F calculado sea mayor que el valor F tabulado. Este ltimo se encuentra en la tabla de F, con el nivel de significancia apropiado, los grados de libertad del error en la vertical. Si se rechaza la hiptesis nula de que no existen diferencias en los tratamientos, el siguiente paso es efectuar la prueba de significancia entre medias de tratamiento, para conocer cules de ellos son mejores. DISEO COMPLETAMENTE AL AZAR El diseo completamente al azar es el diseo ms simple y se usa cuando las unidades experimentales son homogneas, y la variacin entre ellas es muy pequea. Tal es el caso de experimentos de laboratorios, invernadero, gallineros, porcinas, etc. En experimentos en que las condiciones ambientales son

controladas, tal diseo es una prueba con un solo criterio de clasificacin. Las ventajas de este diseo son: a.- Es fcil de planear. b.- Es flexible en cuanto al nmero de tratamientos y repeticiones, el lmite est dado por el nmero de unidades experimentales en general. c.- No es necesario que el nmero de tratamientos sea igual al nmero de repeticiones. d.- No se estima parcelas perdidas. e.- El nmero de grados de libertad para el error aumenta al no tener muchas restricciones. Las desventajas del diseo son: a.- No es eficiente con material experimental heterogneo. b.- Puesto que no existen restricciones en cuanto a la aleatoriedad, el error experimental incluye la variacin total entre unidades experimentales A FUENTE DE VARIACION Tratamiento Error Total N A V A CUADRADO MEDIO CM PRUEBA ESTADISTICA F

SUMA DE CUADRADOS SC TC SC tot. SCtra. TC

GRADOS DE LIBERTAD GL t 1 t(r 1) tr 1

Termino de correccin (TC) =

DISEO COMPLETAMENTE AL AZAR CON IGUAL NMERO DE UNIDADES POR TRATAMIENTO En un ensayo con macetas se aplicaron cinco tratamientos a clones de pasto estrella. Se tomaron cuatro macetas por tratamiento. Los rendimientos se presentan a continuacin. Probar las hiptesis correspondientes.

47

DISEOS EXPERIMENTALES Ciclo 2013 I UCV

Macetas 1 2 3 4 Total Media

TRATAMIENTOS 1 2 3 4 5 101 51 83 67 29 93 61 68 40 45 93 59 72 46 51 96 58 75 52 42 383 229 298 205 167 93,7 57,2 74,5 51,2 41,7

128 2

5 5 0 5 5 No existe diferencia entre tratamientos Si existe diferencia entre tratamientos TC SC total SC tratamientos = SC error = SC total SC tratamientos = 82176 7286 = 882 ANAVA Fuentes de Variacin Tratamiento VvvAvariacion Error Total SC 7286 882 8168 GL CM 4 1821,5 15 58,15 19 F 0.05 = 3,06 0,01= 4,89 100= 46,33% F 30,98 SIG ** 82176 TC = 8168 7286

C.V. =

El coeficiente de variabilidad o coeficiente de variacin indica la confiablidad en los datos, a medida que su valor disminuye la confiabilidad es mayor. Prueba de significacin de t Las pruebas de hiptesis sern: 1 vs 3 Ho Ha 1 vs 4 Ho Ha 1vs 5 Ho Ha

1 vs 2 Ho Ha

2 vs 3 Ho Ha

2 vs 4 Ho Ha

2 vs 5 Ho Ha

3 vs 4 Ho Ha 4 vs 5 Ho Ha

3 vs 5 Ho Ha

48

DISEOS EXPERIMENTALES Ciclo 2013 I UCV

S =

El error estndar ser =

= 5, 39

Se busca en las tablas de t t t Comparaciones 0,05= 2,131 0,01= 2,947

t=
t=

se repite para cada par de comparaciones

= = = = = = = = = =

= 6, 77** = 3, 57** = 7, 88** = 9, 64** = 17, 25 * = 1, 11 N.S. = 2, 87* = 4, 31** = 6, 07**


= 1, 76 N.S.

t= t= t= t= t= t= t= t= t=

Prueba de D. L. S. D.L.S. = t . S = 2,131 x 5,39= 11.48

1 vs 2 = 93,75 57,25 = 36,5* 1 vs 3 = 93,75 74,50 = 19,25* 1 vs 4 = 93,75 51,25 = 42,5* 1 vs 5 = 93,75 41,75 = 52,00* 2 vs 3 = 57,25 74,50 = 17,25* 2 vs 4 = 57,25 51,25 = 6,00 N.S. 2 vs 5 = 57,25 41,75 = 15,50*

49

DISEOS EXPERIMENTALES Ciclo 2013 I UCV

3 vs 4 = 74,50 51,25 = 23,25* 3 vs 5 = 74,50 41,75 = 32,75* 4 vs 5 = 51,25 41,75 = 9,5 N.S.
Prueba de significacin de Duncan Esta prueba tiene en cuenta el orden de los promedios de cada uno de los tratamientos. S = = =3,81

Con los grados de libertad del error buscamos en la tabla de Duncan (A.E.S) 3,01 3,16 3,25 3,31 Encontramos la A.L.S.

A.L.S. =A.E.S. x S 2 A.E.S. S A.L.S. 3.01 3.81 11.46 3 3.16 3.81 12.03 4 3.25 3.81 12.38 5 3.31 3.81 12.61

Ordenamos en orden creciente los promedios


Tratamiento Promedio 5 41,75 4 51,25 3 57,25 2 74,50 1 93,73

Comparamos los promedios desde el mayor hasta el menor 1 5 = 93,73 41,75 = 51,98 > 12,61 * 1 4 = 93,73 51,25 = 42,48 > 12,38 * 1 2 = 93,73 57,25 = 36,48 > 12,03 * 1 3 = 93,73 74,50 = 19,23 > 11,46 * 3 5 = 74,50 41,74 = 32,76 > 12,38 * 3 4 = 74,50 51,25 = 23,25 > 12,03 * 3 2 = 74,50 57,25 = 17,00 > 11,46 * 2 5 = 57,25 41,75 = 15,50 > 12,03 * 2 4 = 57,25 51,25 = 6,00 < 11,46 N.S. 4 5 = 51,25 41,75 = 9,50 < 11,46 N.S.

50

DISEOS EXPERIMENTALES Ciclo 2013 I UCV

Otro mtodo Tratamiento 1 3 2 4 5 Promedio 93,70 74,50 57,25 51,25 41,75

Los tratamientos bajo la misma recta son estadsticamente iguales.

Prueba de significacin de Tukey S = = =3,81

Buscamos en la tabla de Tukey con los grados de libertad del error y el nmero de tratamientos.

A.E.S. (T) = A.E.S. (15 y 5) = 4,37 A.L.S. = S A.E.S. (T)

A.L.S. = 3,81 X 4,37 =16,64 Realizamos las comparaciones mltiples Tratamiento Promedio 2 4 2 4 5 93,70 74,50 57,25 51,25 41,75

Los promedios bajo la misma recta son estadsticamente iguales

DISEO COMPLETAMENTE AL AZAR CON DIFERENTE NMERO DE UNIDADES POR TRATAMIENTO A veces se presenta el caso de que por insuficiencia de material para todos los tratamientos, o porque se han perdido unidades experimentales, no se dispone de igual nmero de observaciones por tratamiento. Esta es una de las ventajas del diseo completamente al azar, ya que los datos se pueden analizar directamente sin necesidad de estimar parcelas perdidas. Por ejemplo se analiz un experimento de cuatro raciones para cerdos con nueve cerdos por racin. Durante el experimento se present una enfermedad y murieron 16 cerdos. La hiptesis a probar es: No existe diferencia entre los tratamientos Ha Si existe diferencia entre los tratamientos

51

DISEOS EXPERIMENTALES Ciclo 2013 I UCV

Repeticiones 1 2 3 4 5 6 7 8 9 Total

1 45 46 49 44

RACIONES 2 3 35 34 33 34 35 34 33

184 46

68 54

170 34

4 41 41 44 43 41 42 44 41 41 378 42

800

Gran Total

TC =
SC trat. = SCtotal=

32 000=464

SC error = SC total SC tratamientos =464 432 = 32 ANAVA Fuentes de Variacin Tratamiento Error Total SC 432 32 464 GL 3 16 19 CM, 72 2 F 36 SIG **

F 0.05 3,24 0,01 5,29 C.V. = x 100= 3,52%

Como F es altamente significativo, nos permite rechazar la hiptesis nula de que no hay diferencias entre los tratamientos El coeficiente de variabilidad o coeficiente de variacin indica la confiablidad en los datos, a medida que su valor disminuye la confiabilidad es mayor.

DISEO DE BLOQUES COMPLETOS AL AZAR

El objetivo del diseo bloques completos al azar es reunir las unidades experimentales a las cuales se aplicaran los tratamientos, en bloques de cierto tamao, de tal modo de que los tratamientos se efecten dentro de cada bloque. La variabilidad entre unidades experimentales de bloques diferentes ser mayor que entre unidades dentro del mismo bloque, como consecuencia, las diferencias encontradas entre unidades, se deben principalmente a discrepancias entre tratamientos. La disparidad que no se deba a tratamientos, se elimina por el diseo y forma parte del error experimenta. De acuerdo con esto, es fcil observar que la variabilidad entre bloques no afecta las diferencias entre medias de tratamientos, porque en cada bloque aparece una vez por tratamiento, y as los bloques y tratamientos son ortogonales.

52

DISEOS EXPERIMENTALES Ciclo 2013 I UCV

Durante el experimento todas las parcelas dentro del bloque se deben tratar igual, excepto cuando se aplique un tratamiento cuyo efecto se quiere medir. Por ejemplo, si los tratamientos son niveles de fertilizacin, todos los dems factores como preparacin del suelo, poca, densidad de siembra, labores de cultivo, uso de plaguicidas, riegos y variedades deben ser exactamente iguales para todas las parcelas, si no es as, se introduciran otras fuentes de variacin cuyo efecto no se podra medir, y ocultaran el efecto de los tratamientos en estudio. El diseo bloque completo al azar se caracteriza por su equilibrio, fcil planeacin y procedimiento de clculo simple. Su nica desventaja es que cuando el nmero de tratamientos es alto, aumenta la superficie del terreno dentro de cada bloque y tambin el error experimental.

REPETICIONES Tratamiento i=1,2,3t 1 2 1 J=1,2,3,r 2 r

Suma

Media

t Suma Media

A N A V A Fuente de Variacin TRATAMIENTOS REPETICIONES ERROR TOTAL SC TC TC SC tot. SCtrat. SC rep. TC GL t1 r1 (t 1)(r 1) n1 CM F

TC = El siguiente ejemplo presenta los resultados de seis variedades de frijol (rendimiento expresado en gr/parcela) en el que se usaron cuatro repeticiones por tratamiento. Se quiere probar la siguiente hiptesis: Ho No existe diferencias entre tratamientos Ha Existe diferencias entre tratamientos, ms all de lo que puede atribuirse al azar

53

DISEOS EXPERIMENTALES Ciclo 2013 I UCV

Variedades Bayo Canario Blanco Testigo De Palo Panamito Total Promedio


( )

REPETICIONES 1 2 3 4 42 46 38 41 32 38 31 30 25 32 28 26 18 20 26 24 35 42 46 40 36 25 22 26 188 203 191 187 31,33 33,83 31,83 31,17

total 167 131 111 88 163 109 769

Promedio 41,75 32,75 27,75 22,00 40,75 27,25 32,04

TC = SC total SC repeticiones SC tratamientos

24640 = 1251

SC error = 1565 27 1251 = 287 A Fuentes de Variacin Tratamiento Repeticin Error Total SC 1251 27 287 1365 N A GL 5 3 15 23 V A CM 250.2 9.0 19.13 F 13.08 0.47 Sig. ** n.s.

F (0,05) (5,15) = 2,90 F(0,05) (3,15) = 3,29 F (0,01) (5,15) = 4,56 F(0,01) (3,15) = 5,42

C.V. =

x 100= 28, 49%

Los datos indican que se debe rechazar Ho, por lo tanto existe diferencia entre los tratamientos. La prueba de significacin establecer la superioridad estadstica de una variedad respecto a otras. Estimacin de parcela perdida: Cuando se usa el diseo completamente al azar, la perdida de una parcela no afecta el procedimiento de clculo. Con el diseo de bloques completos al azar, se pude presentar el caso que un ataque de pjaros, o insectos haya destruido una parcela, o que en un ensayo con animales uno de ellos haya muerto. En tales casos es necesario estimar el valor que falta, antes de aplicar el anlisis de variancia, mediante la ecuacin:

54

DISEOS EXPERIMENTALES Ciclo 2013 I UCV

Donde: Parcela a estimar r Nmero de repeticiones B Total del bloque donde se perdi la parcela t Nmero de tratamientos T Total del tratamiento donde se perdi la parcela G Total general Cuando ya se estima este valor, se coloca en la parcela faltante y se analiza el experimento normalmente, slo que los grados de libertad del error y total se disminuyen en una unidad. Esto se debe a que dicho valor o valores estimados no tienen desviaciones, por tal razn, no contribuyen a la suma de cuadrados del error. Por lo tanto, en el total, la suma de cuadrados del tratamiento est aumentada en la cantidad dada por la siguiente ecuacin (siempre y cuando el nmero de tratamientos sea mayor a diez)

DISEO DE CUADRADO LATINO En este diseo la restriccin para controlar la variabilidad est en dos direcciones, hileras y columnas. Los tratamientos se arreglan en bloques de dos sentidos y cada tratamiento aparece una vez en cada hilera y columna. El anlisis de los datos puede eliminar del erro la variabilidad debida a la hilera y columna. Por ejemplo, considrese: - Tratamiento con cinco niveles de vitamina para el crecimiento. - Hileras con cinco camadas de cerdos de cinco cerdos cada una. - Columnas con cinco sistemas de crianza. Debe existir el mismo nmero de tratamientos, hileras y columnas, o sea, el nmero de tratamientos es igual al nmero de repeticiones. Un arreglo para cuatro tratamientos podra ser:

A D C B A Fuente de Variacin Tratamientos Hileras Columnas Error Total SC

D C B A N

B A D C A V

C B A D A GL
t1 r1 c1 (r 1)(r 2) n1

CM

TC TC TC
SC tot. SCtrat. SCHiler. SCcolum

TC

TC =
55

DISEOS EXPERIMENTALES Ciclo 2013 I UCV

Ejemplo: Un experimento con cuatro variedades de arroz, con gradientes en dos sentidos, se muestran a continuacin (el rendimiento se d en Kg/parcela) Total hilera 19 24 28 25 96

Total columna Total de Tratamientos A = 32 TC = = = 576

B 2 A 7 D 5 C 6 20 B =16

D 3 C 5 B 4 A 9 21

A 6 B 5 C 9 D 5 25

C 8 D 7 A 10 B 5 30 D = 20

C = 28

S96c total = SC hileras = SC columna = SC tratamientos = 576 10,5 576 = 15,5 576 =40 9,78

576 = 74

Sc error = SC total SC tratamiento SC hilera SC columna = 74 40 10,5 15,5 = 8

A F 10.00 2.625 3.875 SIG ** N.S N.S

Fuentes de Variabilidad Tratamiento Hilera Columna Error Total

SC GL CM 10 3 13.333 10.5 3 3.5 15.5 3 5.166 8 6 1.1333 74 15 F (0,05) = 4,76 (0,01) = 9,78

La significacin de hileras columnas indica en qu direccin del terreno est la fertilidad del suelo. En este experimento no se detect dicha variabilidad en ninguna hilera ni en columna. El coeficiente de variabilidad indicar la confiabilidad en los datos C.V. =

x 100=17,90%

La prueba de significacin correspondiente indicar cul o cules tratamientos son los mejores. ESTIMACIN DE PARCELAS PRDIDAS Cuando en el diseo de cuadrado latino se pierde una unidad experimental, se puede estimar con la siguiente ecuacin.

56

DISEOS EXPERIMENTALES Ciclo 2013 I UCV

X= Donde: X = Parcela estimada

] ( )( )

H = Total de hileras donde est la parcela perdida C = Total de columnas donde est la parcela perdida T = Total del tratamiento donde est la parcela perdida G = Total general r = Nmero de repeticiones Igual que en el diseo de bloques al azar, la suma de cuadrados de los tratamientos se debe corregir cuando el nmero de tratamientos sea mayor de 10, restndole el siguiente trmino [ [ ] ]

Cuando se hace el ANAVA debe restarle un grado de libertad al total EXPERIMENTOS FACTORIALES Llmese experimentos factoriales aquellos experimentos en los que se estudian simultneamente dos o ms factores, stos se diferencian de los experimentos simples en los que se estudia slo un factor. Los experimentos factoriales en si no constituyen un diseo experimental como muchas veces se cree, ms bien ellos deben ser llevados en cualquiera de los diseos, tal como el completamente randomizado, bloque completamente randomizado, cuadrado latino, etc. La informacin que se obtiene de los experimentos factoriales es ms amplia, debido a que permite comparar los tratamientos o niveles de cada factor entre s, y adems, evaluar las interacciones que resultan como consecuencia de las combinaciones de los factores. En los experimentos factoriales todos los tratamientos de un factor se combinan con todos los tratamientos de los otros factores. Ventajas de los experimentos factoriales 1.- Permite el estudio de los factores principales, efectos de interaccin de los y efectos cruzados. factores, efectos simples

2.- Todas las unidades experimentales intervienen en la determinacin de los efectos principales y de los efectos de interaccin de los factores, por lo que el nmero de repeticiones es elevado para estos casos. 3.- El nmero de grados de libertad del error es alto comparndolo con los experimentos simples de los mismos factores, lo que contribuye a disminuir la variancia del error, aumentando por este motivo la precisin del experimento. Desventajas de los experimentos factoriales. 1.- Requiere mayor nmero de unidades experimentales en relacin con los experimentos simples y por consiguiente mayor trabajo en la ejecucin del experimento. As, cuando el nmero de factores y tratamientos es por ejemplo (3 factores con 4 niveles cada uno) con 5 repeticiones, el nmero de unidades experimentales requerido seria de 4 x 4 x5 = 320, nmero que es elevado para la mayor parte de experimentos

57

DISEOS EXPERIMENTALES Ciclo 2013 I UCV

2.- Como en los experimentos factoriales cada uno de los tratamientos de un factor debe combinarse con todos los tratamientos de un factor debe combinarse con todos tratamientos de cada uno de los otros factores a fin de que exista balance en el anlisis estadstico, el resultado es que algunas de las combinaciones en algunos experimentos no tiene inters prctico, pero hay que incluirlas para mantener el balance; por ejemplo, en un experimento de nmero de labranzas (sin labranza, una labranza, dos labranzas) y dosis de encalado del suelo (sin encalado, 4 toneladas de encalado, 8 toneladas de encalado), resultan algunas combinaciones que no tienen inters practico para la agricultura, tal por ejemplo la que combina encalado sin labranzas, ya que la cal quedara sin enterrar 3.- El anlisis estadstico es ms complicado que en los experimentos simples, y la interpretacin de los resultados se hace ms difcil a medida que aumenta el nmero de factores y tratamientos en los experimentos Experimentos factoriales de dos factores (pq) En los experimentos factoriales de dos factores pueden estudiarse los siguientes efectos (diferencias entre niveles) a.- Efectos principales de los factores; los que estn dados para un factor en promedio de los niveles del otro factor. b.- Efectos simples; los que estn dados para un factor en cada uno de los niveles del otro factor. c.- Efecto de interaccin; que est dado por la variacin que tiene un efecto simple de un factor al pasar de un nivel a otro del factor. d.- Efectos cruzados; que estn dados por las combinaciones cruzadas de los dos factores. Ejemplo. Para explicar estos factores consideremos un experimento factorial de pq = que es el ms pequeo de los experimentos factoriales dona tiene dos niveles y el factor B tambin tiene dos niveles.

Supongamos que el diseo usado sea el completamente randomizado y los resultados se dan a continuacin

1 2 2 4 10 1 4 7 7 6 4 2

4 3 3 3

58

DISEOS EXPERIMENTALES Ciclo 2013 I UCV

Resultados ordenados de un experimento pq =

BLOQUE I II III IV AB A B B1 1 2 3 2 8

A1 B2 2 4 6 4 16 A1 = 24 B1 = 20 B1 1 3 4 4 12

A2 B2 4 7 7 10 28 A2 = 40 B2 = 44

TOTAL 8 16 20 20 64 64 64

TC = Sc total = SC de A = SC de B = = 16 256 =36 56 90

SC de combinado AB = SC de la interaccin AB = 56 16 36 = 4 SC de block = 256 =24

SC del error = SC total SC de A SC de B SC de AB SC de Block = 90 16 36 4 24 = 10 A N A V A Fuentes de variabilidad Block A B AB Error Total SC 24 16 36 4 10 90 GL 3 1 1 1 9 15 CM 8 16 36 4 1,11 F 7,21* 14,41** 32,43** 3,60N.S.

Se puede deducir las siguientes conclusiones, relacionadas con los efectos principales de A y B; tales como: que la variedad Y supera a la variedad X en rendimiento, y que con el abonamiento nitrogenado aumenta se aumenta la produccin. Por otra parte, por los resultados obtenidos, no se justifica estudiar los efectos simples A ni de B Ejemplo Se tiene el siguiente experimento en el que se estudia tre variedades de soya y la cantidad de plantas por golpe

59

DISEOS EXPERIMENTALES Ciclo 2013 I UCV

Variedades

= 2 plantas cada 20 cm. en surcos de 80 cm. de ancho Cantidad de plantas plantas cada 20 cm. en surcos de 80 cm.de ancho

= 4 plantas cada 20 cm. en surcos de 80 cm. de ancho Se instal en 5 repeticiones o block y el diseo experimental usado fue block completamente randomizado. Los datos ordenados son: BLOQUE I II II IV V VC V C C1 9 10 11 11 14 55 V1 C2 10 13 15 16 15 69 V1 = 182 C1 = 157 V2 C2 12 10 9 16 13 60 V2 = 182 C2 = 195 V3 C2 10 12 14 16 14 66 V3 = 184 C3 = 196 TOTAL C3 9 13 16 19 17 74 89 97 107 132 123 548 548 548

C3 10 12 12 13 11 58

C1 10 9 12 12 15 58

C3 13 11 9 17 14 64

C1 6 7 9 12 10 44

TC = SC de block = SC de V = SC de C = SC de VC = SC de VC = 122.18 65,91 0,18 = 56,09 SC total = 356,58 122.18 6673,42 = 0,18

SC del error =356,58 141,24 0,18 65,91 56,09 = 93,16 A N A V A Fuentes de Block variabilidad V C VC Error Total SC 141,24 0,18 65,91 56,09 93,16 356,58 GL 4 2 2 4 32 144 CM 35,31 0,09 32,95 14,02 2,91 F 12,13** 0,03NS 11,32** 4,81*.

60

DISEOS EXPERIMENTALES Ciclo 2013 I UCV

C.V. =

Como es significativa la interaccin VC debe estudiarse los efectos simples del experimento. As, las SC de los efectos simples de los niveles de C en cada nivel de V estn dadas por: SC de C en

SC de C en

SC de C en A N A V A Fuentes de variabilidad Efectos simples de C Efecto C en Efecto C en Efecto C en Error SC 21,7 3,7 96,5 93,16 GL 2 2 2 32 CM 10,85 1,85 48,25 2,91 F 3,72* 0,63 NS 16,58**

Podemos observar que entre los niveles de C hay diferencias significativas en la variedad altamente significativas en la variedad Experimento factorial

y diferencias

A continuacin se dan los datos del rendimiento en tm/ ha de arroz obtenido del siguiente experimento: Se tiene dos niveles de abonamiento nitrogenado (A),dos niveles de abonamiento fosforado(B) y dos de potasio (C), y 5 repeticiones. y el estudio se realiz con el diseo bloque completamente randomizado BLOQUE A0 B0 C0 C1 5 5 7 10 3 5 3 4 2 1 20 25 A0B0 = 45 B0B0 = 50 A0C0 = 40 B1 C0 C1 4 4 7 9 3 4 4 3 2 0 20 20 A0B0 = 40 B0C0 = 45 A0C0 = 45 B0 A1 B1 C0 C1 C0 C1 6 3 6 9 7 7 9 10 6 5 7 9 5 3 4 8 6 2 4 9 30 20 30 45 A1B0 = 50 A1B1 = 75 B1C0 = 50 B1C1 = 65 A1C0 = 60 A1C1 = 65 A1 = 125 B1 = 115 C2 = 100 TOTAL

I II III IV V ABC AB BC AC A B C

A0 = 85 B0 = 95 C1 = 100

42 66 42 34 26 210 210 210 210 210 210 210

TC =

61

DISEOS EXPERIMENTALES Ciclo 2013 I UCV

SC total = SC de block = SC de A = SC de B = SC de C = SC de AB = SC de AB (corregida) = 72,5 40,0 SC de AC = 1102,5 =42,5

SC de AC (corregida) = 42,5 40,0 2,5 =0,0 SC de BC = 1102,5 =22,5

SC de BC (corregida) = 22,5 10,0 2,5 =10,0 SC de ABC = 1102,5 = 107,5

SC de ABC (corregido) =107,5 40,0 10,0 2,5 22,5 0,0 10,0 = 22,5 SC de error = 259,5 40,0 10,0 2,5 22,5 0,0 10,0 22,5 112,0 ANAVA
FUENTES DE VARIACION

SC 112,0 SC 40,0 10,0 2,5 22,5 0,0 10,0 22,5 40,0 259,5

GL 4 GL 1 1 1 1 1 1 1 28 39

CM 28,8 CM 40,0 10,0 2,5 22,5 0,0 10,0 22,5 1,4

F 20.00** F 28,57** 7,14** 1,79** 16,07** 0,00 NS 7,14** 16,07**

FuentesBloques de variabilidad Efecto principal A Efecto principal B Efecto principal C Efecto de Int. AB Efecto de Int. AC Efecto de Int. BC Efecto de Int. ABC Error total

Bibliografa: Alvarado Pintado Luis y Agurto Mejia Hugo. Estadstica para Administradores y Economa aplicaciones en Excel. Editorial San Marcos E.I.R.L. 2009 Per con

62

DISEOS EXPERIMENTALES Ciclo 2013 I UCV

63