Académique Documents
Professionnel Documents
Culture Documents
OBSERVAO: O contedo desta apostila o mesmo que o utilizado nos perodos I e II de 2008. Por esta razo, o cabealho dos captulos contm a informao I/2008 ao invs de II/2009
UNIVERSIDADE FEDERAL DE VIOSA Departamento de Estatstica EST220 Estatstica Experimental 2009 / II 1. CONTEDO Captulo 1 Testes de hipteses Captulo 2 Contrastes Captulo 3 Introduo Experimentao Captulo 4 Delineamento Inteiramente Casualizado Captulo 5 Procedimentos para Comparaes Mltiplas Captulo 6 Delineamento em Blocos Casualizados Captulo 7 Delineamento em Quadrado Latino Captulo 8 Experimentos Fatoriais Captulo 9 Experimentos em Parcelas Subdivididas Captulo 10 Regresso 2. AVALIAO Prova 1 2 3 Data 11/09 (Sex) 16/10 (Sex) 27/11 (Sex) Horrio 18:20 h 18:20 h 18:20 h Local A CONFIRMAR A CONFIRMAR A CONFIRMAR
O sistema de avaliao constar de trs provas com pesos iguais, cujas datas foram sugeridas ao Registro Escolar. A nota final ser a mdia das provas. Ser aplicada uma quarta prova escrita (30/11 Seg 12:00 h) que abordar todo o assunto do semestre, somente para o estudante que perder pelo menos uma das trs provas por qualquer motivo. Levar documento com foto para fins de fiscalizao durante as provas. Levar tabelas dos testes de hipteses, formulrio e calculadora para as provas, pois so de uso individual. O coordenador da disciplina marcar um nico perodo de reviso para cada uma das provas que dever ser respeitado, dado que no sero abertas excees para revises de provas fora do perodo estabelecido. As revises de provas sero realizadas com o monitor durante o seu horrio na sala 301 B do prdio do CCE, mesmo que a monitoria regular esteja marcada para outro local. A data da prova final ser marcada pelo Registro Escolar. 3. MONITORIA O horrio e local da monitoria sero divulgados na terceira semana de aula. Sero agendados horrios extras durante a semana de cada prova, sendo o horrio e local divulgados no quadro de avisos do Departamento de Estatstica do prdio do CCE.
4. BIBLIOGRAFIA
BARBETTA, P.A.; REIS, M.M. e BORNIA, A.C. Estatstica para cursos de engenharia e informtica. Editora Atlas, So Paulo, 2004. 410 p. BANZATTO, D.A. e KRONKA, S.N. Experimentao agrcola. FUNESP, Jaboticabal, 1989. 249 p. COSTA NETO, P.L.O. Estatstica. Editora Edgard Blcher, So Paulo, 1977, 264 p. DRUMOND, F.B.; WERKEMA, M.C.C. e AGUIAR, S. Anlise de varincia: comparao de vrias situaes. Fundao Christiano Ottoni, UFMG, Belo Horizonte, 1996. 276 p. GOMES, F.P. Curso de estatstica experimental. 12a edio, Livraria Nobel S.A, So Paulo, 1987. 467 p. HINES, W.W.; MONTGOMERY, D.C.; GOLDSMAN, D.M. e BORROR, C.M. Probabilidade e estatstica na engenharia. 4a edio, LTC Editora, Rio de Janeiro, 2006. 588 p. HOFFMANN, R. e VIEIRA, S. Anlise de regresso: uma introduo econometria. 2a edio, Editora Hucitec, So Paulo, 1983. 379 p. MONTGOMERY, D.C. e RUNGER, G.C. Estatstica aplicada e probabilidade para engenheiros. 2a edio, LTC Editora, Rio de Janeiro, 2003. 463 p. RIBEIRO JNIOR, J.I. Anlises estatsticas no Excel guia prtico. Editora UFV, Viosa, 2004. 249 p. VIEIRA, S. e HOFFMANN, R. Estatstica experimental. Editora Atlas, So Paulo, 1989, 179 p. WERKEMA, M.C.C. Como estabelecer concluses com confiana: entendendo inferncia estatstica. Fundao Christiano Ottoni, UFMG, Belo Horizonte, 1996. 309 p. WERKEMA, M.C.C. e AGUIAR, S. Anlise de regresso: como entender o relacionamento entre as variveis de um processo. Fundao Christiano Ottoni, UFMG, Belo Horizonte, 1996. 311 p. WERKEMA, M.C.C. e AGUIAR, S. Planejamento e anlise de experimentos: como identificar e avaliar as principais variveis influentes em um processo. Fundao Christiano Ottoni, UFMG, Belo Horizonte, 1996. 294 p.
5. PROFESSORES Antonio Policarpo Souza Carneiro CCE 313B Ramal 1786 Jos Ivo Ribeiro Jnior CCE 306B Ramal 1783 (Coordenador) Nerilson Terra Santos CCE 312B Ramal 1784 6. HORRIOS DAS TURMAS Horrio 8 10 14 16 T2 - PVB209 Policarpo Ter T1 - PVB308 Nerilson T4 - PVB209 T3 - PVB209 Jos Ivo Nerilson Seg Qui Sex T4 - PVB209 T3 - PVB209 Jos Ivo Nerilson T1 - PVB308 Nerilson T5 - PVB105 T2 - PVB209 Policarpo Policarpo T5 - PVB105 Policarpo Qua
7. PLANEJAMENTO Aula 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 Semana 10 a 14/08 17 a 21/08 Assunto Apresentao da disciplina Testes de hipteses: conceitos Teste t e intervalo de confiana para uma mdia Teste F para duas varincias, teste t e intervalo de confiana para duas mdias independentes Teste t e intervalo de confiana para duas mdias dependentes Contrastes: conceitos Mtodos para obteno de contrastes ortogonais Princpios bsicos da experimentao Tira dvidas Prova 1 11/09 Sex 18:20 h Delineamento inteiramente casualizado (DIC) Anlise de varincia e pressuposies Testes de Tukey e Duncan Testes t e de Scheff Delineamento em blocos casualizados (DBC) Delineamento em quadrado latino (DQL) Exerccios dos delineamentos Tira dvidas Prova 2 16/10 Sex 18:20 h Experimento fatorial (EF) Interao AxB no significativa de EF Interao AxB significativa de EF Experimento em parcelas subdivididas (EPS) Interaes AxB no significativa de EPS Interaes AxB significativa de EPS Regresso linear de 1o grau Regresso linear de 2o grau Regresso linear com delineamento experimental Anlise de correlao Tira dvidas Prova 3 27/11 Sex 18:20 h Prova Substitutiva 30/11 Seg 12:00 h Aula de Software estatstico 01/12 Ter 12:00 h
1 2 1 2 1 2 1 2 1 1 2 1 2 1 1 2 1 1 2 1 2 1 1 2 1 2 1 2 1 2
24 a 28/08
31 a 04/09 07 a 11/09 14 a 18/09 21 a 25/09 28 a 02/10 05 a 09/10 12 a 16/10 19 a 23/10 26 a 30/10 02 a 06/11 09 a 13/11 16 a 20/11 23 a 27/11
30 a 04/12
ndice
Captulo 1 - Testes de Hipteses Captulo 2 - Contrastes Captulo 3 Introduao Experimentao Captulo 4 - Delineamento Inteiramente Casualizado Captulo 5 Procedimentos para Comparaes Mltiplas Captulo 6 - Delineamento em Blocos Casualizados Captulo 7 - Delineamento em Quadrado Latino Captulo 8 - Experimentos Fatoriais Captulo 9 - Experimentos em Parcelas Subdivididas Captulo 10 - Regresso Captulo 11 Respostas dos Exerccios Anexo 1 - Formulrio e Tabelas 1 22 30 37 45 53 65 71 95 111 125 151
Anexo 2 Frmula Geral para o Clculo de Soma de Quadrados 167 Anexo 3 Introduo ao Uso do Programa SAS Anexo 4 p-valor Anexo 5 Exemplo Extra ANOVA 169 190 191
1. Testes de Hipteses
1.1. Introduo
Os testes de hipteses fazem parte de um conjunto de procedimentos inferenciais usados em estatstica. O uso de tais procedimentos permite ao pesquisador fazer inferncias a respeito de uma populao a partir de uma ou mais amostras representativas da populao da qual as amostras foram retiradas. No dia a dia usamos de inferncia para tomarmos certas decises. Por exemplo, quando vamos a feira para comprar abacaxi e um feirante nos oferece um pedao de abacaxi. Qual o nosso procedimento? Se aquele pedao de abacaxi for doce, conclumos que todo o lote de abacaxi vendido por aquele feirante doce. Por outro lado, se o pedao for azedo, inferimos que todo o lote azedo. lgico que podemos tomar decises erradas devido amostragem. Por exemplo, corremos o risco de levar abacaxi azedo para casa, mesmo que a nossa prova tenha sido doce. Isto pode acontecer porque o lote de abacaxi pode no ser completamente uniforme no teor de acar, ou porque experimentamos um abacaxi doce no meio de um lote composto por abacaxis azedos. Este um exemplo prtico que ilustra o princpio bsico do teste de hipteses. Porm, em cincia necessrio que todos os procedimentos sejam padronizados e bem especificados. O objetivo deste captulo fornecer os conceitos tericos fundamentais para um correto uso dos testes de hipteses. Neste captulo, sero abordados alguns dos testes de hipteses mais comuns para comparar no mximo parmetros de duas populaes. Outros testes de hipteses aplicveis para comparaes de parmetros envolvendo mais de duas populaes sero apresentados no Captulo 5.
As medidas de disperso indicam quanto os valores de uma populao esto dispersos em torno de sua mdia. Como exemplo de medidas de disperso temos a varincia ( 2 = V( X) ) e o desvio-padro ( ).
1.2.2 Estimador
Na grande maioria das situaes, no possvel realizar o censo de uma populao, porque ou a populao muito grande ou de tamanho infinito. Para contornar este problema, o pesquisador pode retirar uma amostra da populao e a partir desta amostra caracterizar a populao de onde a amostra foi retirada sem nenhum vis. Para alcanar este objetivo deve-se usar frmulas estatsticas, conhecidas como estimadores, que apresentem caractersticas estatsticas desejveis, tais como no1
Cap 1 Testes de Hipteses ____________________________________________________________________ tendenciosidade, varincia mnima, fornecer estimativas que se aproximem do valor paramtrico medida que o tamanho da amostra aumenta, e etc.. , que usada para Exemplos de estimadores so a mdia aritmtica amostral, m 2 estimar a mdia populacional; e a varincia amostral, s , que usada para estimar a varincia populacional. Outras simbologias comuns para a mdia amostral so e X, e 2 ( X) . eV para a varincia amostral so
Observe que algumas vezes a simbologia usada para representar os parmetros e seus respectivos estimadores muito parecida. Por exemplo, podemos representar a , ou seja, a diferena entre o parmetro mdia populacional por m e seu estimador por m e o seu estimador o chapu que existe no smbolo usado para representar o estimador. Isto parece ser uma diferena mnima, mas do ponto de vista estatstico, a diferena conceitual entre parmetro e estimador enorme. O parmetro sempre um valor constante, pois para a obteno do mesmo so usados todos os elementos da populao. Por outro lado, o estimador representa uma varivel aleatria, pois os seus valores mudam de amostra para amostra. Isto acontece porque os elementos que pertencem a uma amostra geralmente no so os mesmos em outras amostras. Conseqentemente, possvel estabelecer uma distribuio de probabilidades para os valores de um estimador. Para o parmetro, isto no possvel, pois se assume que ele tem um valor constante. Por isto recomenda-se muito cuidado para usar corretamente a simbologia para o parmetro e paro o estimador. Conforme mencionado anteriormente, os estimadores podem assumir valores diferentes em amostras diferentes. Estes diferentes valores que um estimador assume so tambm conhecidos como estimativas.
EST 220 Estatstica Experimental I/2008 ________________________________________________________________ Uma outra alternativa seria a situao em que ele no tem nenhuma desconfiana de qual sabor teria um teor mdio de glicose maior do que o outro. Neste caso, a hiptese alternativa expressa por m morango m chocolate Neste ponto fica claro que para realizar um teste de hipteses necessrio que o pesquisador lance duas hipteses. A primeira que contm um sinal de igualdade conhecida como hiptese de nulidade, comumente denotada por Ho. dado este nome, pois ela representa uma nulidade de diferena entre mdias. J a outra hiptese que contm um sinal de desigualdade, conhecida como hiptese alternativa, comumente designada por Ha ou H1. Como o prprio nome diz, ela uma alternativa a hiptese de nulidade. Na verdade, quando um pesquisador realiza um experimento, a hiptese de nulidade construda com o expresso propsito de ser rejeitada. Isto faz sentido porque, quem teria o trabalho de realizar um experimento se achasse que duas mdias so iguais? Qualquer um se daria ao trabalho de instalar um experimento, apenas se desconfiar que existe diferena significativa entre as mdias de duas populaes. No entanto, num teste de hipteses, at que se prove o contrrio, a Ho considerada como a hiptese verdadeira. Para o exemplo dado, supondo que o pesquisador no desconfie a princpio qual sabor que apresenta maior teor mdio de glicose, o par de hipteses a ser lanado expresso por H0 : m morango = m chocolate
Ha : m morango m chocolate Observe que apesar de ser possvel existir trs possibilidades para Ha, apenas uma possibilidade foi lanada. Outro ponto importante que as hipteses foram lanadas em termos dos parmetros e no em termos dos seus estimadores. No faz sentido lanar as hipteses usando os estimadores, pois os mesmos no possuem um valor fixo, ou seja, apresentam valores diferentes para amostras diferentes, enquanto que o parmetro possui um valor fixo.
Cap 1 Testes de Hipteses ____________________________________________________________________ Por outro lado, se as duas fontes de variao apresentarem valores bem diferentes, conclui-se que a variao entre o valor especificado para o parmetro e o de sua estimativa no prpria dos dados. Neste caso a variao entre o valor paramtrico e a estimativa significativa, o que leva a rejeitar-se a hiptese de nulidade. Para ento decidirmos entre rejeitar ou no-rejeitar a hiptese de nulidade devemos estabelecer o que uma pequena e uma grande variao. Para isto, precisamos conhecer a distribuio de probabilidades do estimador usado para estimar o parmetro. Vamos ilustrar esta situao com o seguinte exemplo. Suponha que um pesquisador desconfie que a estatura mdia de adolescentes na faixa etria de 13 a 15 anos menor do que aquela informada por um rgo oficial como sendo igual a 1,5 metros. Este pesquisador sabe de fontes seguras que a estatura uma varivel aleatria que segue uma distribuio normal com varincia igual a 0,25 metros2. Se a informao do rgo oficial for verdadeira, ou seja a mdia de estatura igual a 1,50 metros, poderamos descrever a distribuio de valores da varivel estatura, digamos X, como X ~ N(1 ,5 ; 0,25) e representar esta distribuio por meio do grfico
f (X ) 1. 1 1. 0 0. 9 0. 8 0. 7 0. 6 0. 5 0. 4 0. 3 0. 2 0. 1 0. 0 0. 0 0. 5 1. 0 m = 1. 5 V ar i avel : X 2. 0 2. 5 3. 0
A funo densidade de probabilidade de uma varivel aleatria contnua que tem distribuio normal, no caso, f(X) dada por:
f ( X) = 1 2 e
1 x m 2
2
Para verificar se a informao do rgo oficial correta, o pesquisador tem duas opes: medir a estatura da populao de todos os adolescentes, ou ento tomar uma amostra de adolescentes e medir a estatura dos mesmos e usar um teste de hipteses. Na primeira opo nenhum teste de hipteses seria necessrio, pois o pesquisador teria condies de conhecer o verdadeiro valor da mdia de estatura, ou seja, ele conheceria o parmetro mdia daquela populao de adolecentes. Na segunda opo, o pesquisador teria que usar uma mdia da amostra para tomar a sua deciso.
EST 220 Estatstica Experimental I/2008 ________________________________________________________________ evidente que a segunda opo operacionalmente mais fcil, pois o custo e o tempo gasto so muito menores. Para realizar a segunda opo, o pesquisador deve escolher um tamanho de amostra adequado, por exemplo, suponha que para este exemplo o tamanho amostral ideal seja igual a 10 indivduos. Da populao de adolecentes possvel retirar um grande nmero de diferentes amostras de tamanho 10. Cada amostra fornece um valor para a mdia amostral. Pode ser demonstrado que a mdia de todas as mdias amostrais igual mdia da varivel original, a varincia igual varincia original dividido pelo tamanho da amostra e que a varivel aleatria m ~ N(1 tambm segue distribuio normal, ou seja, m ,5 ; 0,025 ) . O grfico da distribuio das mdias amostrais seria
f (X b) 1. 1 1. 0 0. 9 0. 8 0. 7 0. 6 0. 5 0. 4 0. 3 0. 2 0. 1 0. 0 0. 0 0. 5 1. 0 m = 1. 5 V ar i avel : X b 2. 0 2. 5 3. 0
e f(Xb) = f( m ). em que Xb = m
Como pode ser notado, a distribuio das mdias amostrais para a varivel estatura, representadas no grfico por Xb, mais concentrada em torno da mdia do que a varivel original X. Isto acontece porque a varincia das mdias amostrais menor do que a varincia da varivel original estatura. Deve ficar entendido que possvel retirar um nmero muito grande de amostras de mesmo tamanho de uma populao, principalmente se a populao for muito grande. No entanto, numa pesquisa geralmente toma-se deciso usando-se apenas uma nica amostra. As hipteses estatsticas para esta situao seriam: H O : m altura = 1,5 metros H a : m altura < 1,5 metros Para se entender a lgica dos testes de hipteses, vamos supor diferentes resultados possveis para a mdia amostral obtida a partir de uma amostra de 10 estudantes. Suponha inicialmente que o pesquisador, obtenha uma mdia amostral, , igual a 1,49 metros. Neste caso, a variao entre o valor observado igual a digamos m 1,49 e o valor suposto igual a 1,50 muito pequena. Poder-se-ia atribuir esta variao ao 5
Cap 1 Testes de Hipteses ____________________________________________________________________ acaso, ou seja, esta variao uma variao prpria de uma populao que apresente mdia igual a 1,5 metros. Em termos probabilsticos poderamos dizer que existe uma grande probabilidade de numa populao com mdia igual a 1,50 metros existir grupos de 10 indivduos que apresentem uma mdia de estatura igual ou inferior a 1,49 metros. Justificativa semelhante poderia ser atribuda a mdias amostrais que tivessem valores prximos ao valor suposto, tais como: 1,48; 1,47; 1,42; etc. Por outro lado, se a mdia amostral apresentar um valor muito distante do valor suposto, como por exemplo, 0,60 metros, o pesquisador tem a tendncia de rejeitar a hiptese de nulidade, isto porque h um forte indcio de que a amostra foi retirada de uma populao que apresenta uma mdia menor do que a suposta de 1,5 metros. Em termos probabilsticos poderia se dizer que a probabilidade de encontrar um grupo de indivduos com mdia igual ou inferior a 0,60 metros muito pequena, em uma populao que apresenta uma mdia igual a 1,5 metros. Veja na figura a seguir
f (X b) 1. 1 1. 0 0. 9 0. 8 0. 7 0. 6 0. 5 0. 4 0. 3 0. 2 0. 1 0. 0 0. 0 0. 60 1. 0 1. 5 V ar i avel : X b 2. 0 2. 5 3. 0
A funo densidade de probabilidade da mdia amostral de uma varivel aleatria que tem distribuio normal, no caso, f(Xb), dada por:
1
1 x m 2 n
2
e 2 n A rea sob a curva abaixo do valor 0,60 m, indica a probabilidade de se encontrar um valor igual ou inferior a 0,60 metros em uma populao com mdia igual a 1,5 metros. Como pode ser notado, esta probabilidade pequena em relao rea total do grfico. Com base neste raciocnio que o pesquisador estabelece um valor crtico que o ajuda a decidir sobre rejeitar ou no-rejeitar a hiptese de nulidade. Este valor crtico pode a princpio ser estabelecido de duas maneiras. A primeira delas seria a situao em que o pesquisador de posse de seu conhecimento prvio no assunto estabeleceria um valor crtico antes de coletar a amostra. Este valor crtico seria um valor para a mdia amostral tal que acima dele o pesquisador no-rejeitaria a hiptese de nulidade e abaixo dele rejeitaria a hiptese de nulidade. Digamos que neste caso o valor crtico adotado fosse igual a 1,0 metro. O valor para a mdia igual a 1,0 metro determinaria duas regies na
f ( Xb) =
EST 220 Estatstica Experimental I/2008 ________________________________________________________________ distribuio das mdias amostrais, conforme apresentado na figura a seguir. Estas duas regies so denominadas como Regio de No-Rejeio da Hiptese de Nulidade (RNRHo) e Regio de Rejeio da Hiptese de Nulidade (RRHo) . Como os respectivos nomes indicam, se o valor da mdia amostral estiver contido na RNRHo, o pesquisador no deve rejeitar a hiptese de nulidade. Caso contrrio, se o valor da mdia amostral estiver contido na RRHo, o pesquisador deve rejeitar a hiptese de nulidade e considerar a hiptese alternativa como sendo a hiptese verdadeira.
Deve-se observar que ao adotar o critrio acima, o pesquisador sempre estar sujeito a cometer um de dois erros possveis. Um destes erros, conhecido como erro tipo I ou erro alfa (), se refere probabilidade de rejeitar uma hiptese verdadeira, no caso a hiptese de nulidade. Na figura citada anteriormente, o critrio adotado pelo pesquisador foi que se a mdia amostral assumisse um valor menor que 1,0 metro, ento rejeitar-se-ia a hiptese de nulidade. exatamente a adoo deste critrio que pode levar o pesquisador a cometer um erro em sua tomada de deciso, pois como se pode observar na figura, em uma populao que realmente apresenta mdia igual a 1,5 metros, existe uma pequena percentagem de indivduos que podem apresentar uma altura mdia inferior a 1,0 metro. No entanto, o pesquisador acaba assumindo que devido ao fato daquela chance ser muito pequena, ele decide que se uma amostra de elementos apresentar mdia menor que 1,0 metro, ela pertence a uma populao com mdia inferior especificada de 1,5 metros, conforme mostrado na figura a seguir.
Nesta figura, pode-se observar duas curvas: a da esquerda quando se assume que a populao tem uma mdia inferior a especificada, isto a curva para a hiptese alternativa (Ha) com m < 1,5 metros; e a curva da direita para a situao em que a populao apresenta mdia igual especificada, ou seja, curva para a hiptese de nulidade (Ho) com mdia m = 1,5 metros. Quando o pesquisador toma a deciso de rejeitar a Ho, ele na verdade acaba por concluir que a populao de onde foi retirada a amostra pertence aquela populao com mdia m < 1,5 metros. Observe, valores nesta regio podem levar a duas concluses que a rigor ambas estariam corretas, mas a probabilidade de encontrar indivduos com mdia inferior ou igual ao valor crtico, no caso 1,0 metro, bem maior numa populao com m < 1,5 metros do que numa populao com mdia m = 1,5 metros. esta diferena nas probabilidades que leva o pesquisador a rejeitar Ho ao invs de no rejeit-la. Conforme mencionado anteriormente, a rea sob a curva da hiptese Ho que leva a sua rejeio se refere probabilidade de se rejeitar Ho quando Ho verdadeira. Isto foi definido anteriormente como erro alfa. Um raciocnio lgico que se tem tentar fazer este erro ser o menor possvel. No entanto, em todo teste de hipteses existe tambm um outro erro, conhecido como erro tipo II ou erro beta (), o qual aumenta o seu valor medida que se diminui o erro alfa. Este erro se refere probabilidade no-rejeitar a hiptese Ho quando Ho falsa (ver figura anterior). No exemplo que estamos trabalhando, este erro beta ser tanto maior, quanto menor for o valor crtico. Se por exemplo, fizermos que o valor crtico para a mdia amostral seja igual a 0,9 m, ento a nova proporo entre os erros alfa e beta seria conforme figura a seguir.
f (X b) 1. 1 1. 0 0. 9 0. 8 0. 7 0. 6 0. 5 0. 4 0. 3 0. 2 0. 1 0. 0 0. 0 0. 5 er r o al f a cur va H a
R R H o
R N R H o cur va H o er r o bet a
X bc= 0. 9
1. 5 V ar i avel : X b
2. 0
2. 5
3. 0
m edi a
0. 8
1. 5
Ns acabamos de ver a maneira emprica de realizar um teste de hiptese, a qual se baseia no fato do pesquisador estabelecer o valor crtico de rejeio da hiptese Ho com base em seu prvio conhecimento do problema. Este procedimento, embora seu forte apelo prtico, traz a desvantagem de no poder estabelecer a princpio qual seria a probabilidade de se cometer o erro tipo I, ou seja, a que nvel de significncia que o teste de hipteses ser realizado. de consenso que se publique, que nos trabalhos cientficos, a que nvel de significncia um teste de hipteses foi realizado. Desta forma, possvel comparar os resultados e concluses de diferentes trabalhos de pesquisa, pois existe uma tendncia que, para determinada rea do conhecimento, o nvel de significncia esteja dentro de uma faixa de valores aceito pela maioria dos pesquisadores. A determinao do nvel de significncia quando se usa o mtodo emprico possvel, embora computacionalmente no seja uma tarefa fcil, pois envolve a integrao de funes complexas tais como exponenciais, gama, beta, e etc. . Devido a todas estas razes, o mtodo no-emprico o mais usado. O procedimento para um teste de hipteses usando o mtodo no-emprico similar ao mtodo emprico. A diferena est basicamente que no mtodo no-emprico, o valor crtico conhecido a partir do nvel de significncia estabelecido e o uso de tabelas estatsticas. Existe uma tabela estatstica apropriada para cada tipo de teste de hipteses. Estas tabelas fornecem valores crticos que delimitam regies de rejeio e de norejeio de Ho. O valor obtido de uma ou mais amostras retirada da(s) populao(es) ento usado para calcular o valor de uma estatstica que tem distribuio de probabilidades idntica quela usada para identificar o valor tabelado. A comparao dos valores calculado e tabelado permite ao pesquisador decidir entre rejeitar ou no-rejeitar Ho. Os prximos itens deste captulo iro tratar sobre alguns testes de hipteses que usam este mtodo no-emprico.
f (t ) 0. 5
0. 4
0. 3
0. 2
0. 1
0. 0 - 3. 5 - 2. 5 - 1. 5 - 0. 5 0. 5 1. 5 2. 5 3. 5
V ar i avel : t n 1 5 30
10
EST 220 Estatstica Experimental I/2008 ________________________________________________________________ As hipteses num teste t, para uma mdia populacional, so do seguinte tipo H0: Ha: Ha: Ha: m = m0 m > m0 m < m0 m m0 versus ou ou
Para decidirmos entre Rejeitar ou No-Rejeitar HO, comparamos o valor de t com o valor tabelado de t obtido por t tab = t (n 1) . A tabela apresentada no final deste livro uma tabela elaborada para testes bilaterais. Neste caso, para encontrarmos o valor tabelado basta entrar com o valor de e o respectivo nmero de graus de liberdade. Por outro lado, se desejarmos realizar um teste unilateral e usarmos uma tabela bilateral, devemos entrar na tabela com 2 como nvel de significncia. Este procedimento garante que realizaremos o teste ao nvel de significncia como desejado para testes unilaterais. Depois de obtido o valor calculado e o valor tabelado de t, usamos a seguinte regra decisria: - se t t tab ento Rejeita-se Ho
-
se
Exerccios 1.1. Em indivduos sadios, o consumo renal de oxignio distribui-se normalmente em torno de 12 cm3/min. Deseja-se investigar, com base em cinco indivduos portadores de certa molstia, se esta tem influncia no consumo renal mdio de oxignio. Os consumos medidos para os cincos pacientes foram: 14,4 12,9 15,0 13,7 13,5
Qual a concluso ao nvel de 1% de significncia? 1.2. Uma amostra de seis elementos, extrada de uma populao normal, forneceu
X i = 84,0
i =1
(X
6 i =1
) = 55,0 m
2
Deseja-se saber se a mdia da populao pode ser considerada como superior a 11. Qual a concluso, ao nvel de 5% de significncia?
11
Cap 1 Testes de Hipteses ____________________________________________________________________ Conforme mencionado anteriormente, para comparar as mdias das duas populaes, toma-se uma amostra de cada populao. Suponha que as amostras geradas sejam X11, X12,... , X1n e X21, X22, ... , X2m, onde o tamanho das amostras podem ser diferentes, ou seja, n pode ser diferente de m. Para cada amostra, ento calcula-se a sua mdia e varincia. Um estimador comum para a varincia obtido tomando-se uma mdia ponderada das estimativas de varincia obtidas para as duas amostras. O tamanho da amostra utilizado como um peso para o clculo desta varincia mdia ponderada. A obteno de um estimador comum para a varincia pressupe que a varincia das duas 2 populaes sejam idnticas, ou seja 1 = 2 2 . A frmula do estimador comum :
s =
2 c 2 1 2 2
n1 + n 2 2
em que s e s so as varincias amostrais das populaes 1 e 2, respectivamente. A frmula geral para o clculo da varincia amostral dada por
n Xi n i=1 2 Xi n s 2 = i=1 n 1
2
Esta estatstica tem distribuio t de Student com (n1 + n 2 2) graus de liberdade. A comparao do valor calculado de t com o valor tabelado dado por t tab = t (n1 + n 2 2) , usada para testar a hiptese de nulidade versus H0: m1 = m2 Ha: m1 > m2 ou Ha: m1 < m2 ou Ha: m1 m2 A regra de deciso idntica ao caso anterior, ou seja: - se | t | ttab Rejeita-se Ho - se | t | ttab No-Rejeita-se HO.
Exerccio 1.3. Os dados que seguem referem-se a cinco determinaes da resistncia de dois tipos de concreto. Ao nvel de 5% de significncia, h evidncia de que o concreto 1 seja mais resistente que o concreto 2?
Uma vez obtidas estas estimativas, calcula-se o valor da estatstica t dada por: m (m1 m 2 ) m 2 t= 1 1 2 1 sc n + n 2 1
Concreto 1 Concreto 2
54 50
55 54
58 56
51 52
57 53
1.3.1.2.2 Teste de hipteses para o caso de duas amostras dependentes Duas amostras de elementos so ditas serem dependentes quando existe algo que as relacione. Por exemplo, se os valores de duas amostras foram obtidos de um mesmo conjunto de elementos amostrais, podemos dizer que as duas amostras de 12
EST 220 Estatstica Experimental I/2008 ________________________________________________________________ valores so dependentes uma vez que foram tomados de um conjunto de elementos amostrais comum. O objetivo neste caso verificar se houve alterao na mdia de uma populao quando a mesma avaliada sob duas condies diferentes. Cada condio representa uma populao distinta, embora se suponha que os elementos populacionais sejam os mesmos nas duas condies. Para verificar se houve alterao na mdia, avalia-se uma caracterstica de interesse do pesquisador num conjunto de elementos amostrais tomados ao acaso na populao quando a mesma esteja sob a condio 1. Digamos que a avaliao da caracterstica resulte nos seguintes valores amostrais X11, X12,... , X1n. Depois de feita esta avaliao, os elementos amostrais que originaram a primeira amostra, sejam submetidos condio 2. Os mesmos elementos amostrais so novamente avaliados para a mesma caracterstica na nova condio 2. Digamos que esta nova avaliao resulte nos seguintes valores amostrais X21, X22, ... , X2n. Se a condio 2 no tiver nenhum efeito, espera-se que em mdia os valores observados nas duas condies sejam iguais. Em termos de desvios, se a alterao das condies no resultasse em nenhum efeito significativo, poderamos dizer que a diferena entre os valores observados na primeira condio e na segunda condio seria em mdia igual a zero. Portanto para verificar se houve alterao na mdia de uma populao avaliada em duas condies diferentes, pode-se testar a hiptese de que o desvio mdio ser estatisticamente igual a zero. Portanto, a partir de duas amostras obtm-se uma outra baseada nos desvios, conforme mostrado a seguir. Elemento amostral i Amostra 1 Amostra 2 di=X1i-X2i 1 X11 X21 d1 2 X11 X22 d2 ... ... ... ... n X1n X2n dn
Apresentado desta forma, o teste t para duas amostras dependentes reduz-se teste t para uma mdia populacional, visto anteriormente. No presente caso, deseja-se testar se a mdia dos desvios igual por exemplo a um valor m0. Escrevendo em termos de hipteses estatsticas teramos H0: Ha: Ha: Ha: m = m0 m > m0 m < m0 m m0 versus ou ou
Para decidir entre Rejeitar ou No-Rejeitar a hiptese de nulidade, deve-se calcular o valor da estatstica t dada por m0 m t= s2 n em que = m
d
i=1
13
n di n i=1 2 di n s 2 = i=1 n 1 Sob Ho, esta estatstica t tem distribuio t de Student com n-1 graus de liberdade. A comparao deste valor calculado com o valor de ttab dado por t tab = t (n 1) . Depois de obtido os valores calculado e tabelado de t, usamos a seguinte regra decisria: - se t t tab ento Rejeita-se Ho
-
Exerccios 1.4. Com o objetivo de avaliar se determinado produto qumico eficiente para repelir insetos domsticos, foi realizada uma contagem do nmero de insetos, antes e aps a aplicao deste produto qumico, em 7 residncias. O nmero de insetos observado em cada residncia foi
Residnca 1 2 3 4 5 6 7 Antes da aplicao 8 6 7 8 9 6 7 Aps a aplicao 4 0 3 5 3 4 2 Por meio destes dados e ao nvel de 5% de probabilidade, possvel concluir, em termos mdios, que o produto utilizado eficiente para repelir insetos? 1.5. Com a finalidade de testar se determinado mtodo de secagem rpida consegue reduzir significativamente a quantidade mdia de gua de gros de cereais, uma poro de cada um dos seguintes tipos de cereais: Milho, Cevada, Trigo, Arroz e Sorgo, foi exposta ao referido mtodo de secagem. Os resultados obtidos, para o peso da poro (em g) amostrada por cereal, com a realizao do experimento foram: Sem a secagem Com a secagem Milho 30 21 Cevada 34 28 Trigo 41 33 Arroz 25 21 Sorgo 36 31
possvel concluir ao nvel de 5% de significncia que o mtodo de secagem proposto, eficiente para secar os gros?
14
EST 220 Estatstica Experimental I/2008 ________________________________________________________________ s2 1 2 s2 Sob a hiptese de nulidade, este quociente tem distribuio F, de Fisher-Snedecor, com n 1 e n 2 graus de liberdade, ou seja a distribuio de probabilidades da estatstica F depende dos nmeros de graus de liberdade n1 e n2. Um grfico para a distribuio F, para trs diferentes pares de graus de liberdade ilustrado na figura a seguir. F=
A concluso do teste feita mediante a comparao do valor de F com o valor de Ftab= F = (n1 , n 2 ) . Se F Ftab Rejeita-se H0 ao nvel de probabilidade. Caso contrrio NoRejeita-se HO
Exerccios 1.6. Com o intuito de controlar a homogeneidade da produo de certas partes ao longo do tempo, amostras semanais so retiradas da produo corrente. Uma primeira amostra, de dez elementos, forneceu mdia 284,55 e desvio padro 0,320, ao passo que, numa segunda amostra, forneceu, nas mesmas unidades, os seguintes valores:
284,6
283,9
284,8
285,2
284,3
283,7
284,0
Ao nvel de 5% de significncia, podemos concluir que a semana 2 apresentou maior variabilidade que a semana 1? 1.7. A qualidade de rebites tanto melhor quanto maior sua homogeneidade. Seis rebites de duas marcas foram ensaiados ao cisalhamento, tendo-se obtido as seguintes cargas de ruptura: 15
Cap 1 Testes de Hipteses ____________________________________________________________________ Rebite 1 2 3 4 5 6 Marca A 34,9 35,5 38,8 39,2 33,7 37,6 Marca B 38,5 39,0 40,7 42,9 37,8 41,4 Estes resultados ratificam a afirmao do produtor da marca B, de que seus rebites so melhores? Use o nvel de 5% de significncia.
1.9. Um material isolante foi utilizado com a finalidade de reduzir a temperatura mdia interna em ambientes similares. Para testar a hiptese H o , 10 ambientes foram selecionados ao acaso e expostos a uma determinada fonte de radiao de calor. Testar a hiptese H o e concluir para = 5%. Os dados obtidos (em C) so fornecidos abaixo. AMBIENTE s/isolante c/isolante 1 30,5 28,2 2 35,3 35,1 3 33,2 33,2 4 40,8 35,6 5 42,3 40,2 6 41,5 37,4 7 36,3 34,2 8 43,2 42,1 9 34,6 30,5 10 38,5 38,4
1.10. Dois processos que tm por objetivo o controle da temperatura mdia interna em ambientes foram colocados em competio. Para testar a H o , 20 ambientes foram convenientemente preparados. Testar e concluir para = 5% , considerando os dados abaixo. PROCESSO s/isolamento c/isolamento 30,5 28,2 35,3 35,1 33,2 33,2 40,8 35,6 Temperatura C 42,3 41,5 36,3 40,2 37,4 34,2 43,2 42,1 34,6 30,5 38,5 38,4
1.11. Um produto foi desenvolvido com o objetivo de reduzir a mdia da temperatura do funcionamento de motores. Para testar o produto, foram selecionados ao acaso 8 motores e aps 10 minutos de funcionamento, em cada condio, foram obtidos os dados (em C) do quadro abaixo. Testar a hiptese H o e concluir, para = 5% . MOTOR SEM PRODUTO COM PRODUTO 1 80,5 75,8 2 99,6 98,8 3 83,4 77,6 4 100,2 99,9 5 81,5 74,2 6 84,6 80,5 7 85,0 83,6 8 105,8 105,8
1.12. Um experimentador deseja testar o efeito de certo fertilizante na mdia de produo de milho. Para realizar o experimento tinha-se 12 unidades experimentais de reas iguais, onde 7 receberam o fertilizante e as outras no; sendo as outras condies mantidas iguais. As produes em kg/unidade experimental foram as seguintes:
16
EST 220 Estatstica Experimental I/2008 ________________________________________________________________ Com Fertilizante Sem Fertilizante 25 35 35 25 45 20 30 15 20 30 25 30
De posse dos dados acima, pode o experimentador concluir que houve aumento da mdia de produo de milho por causa do fertilizante, com nvel de significncia igual a 5%. 1.13. Desejando comparar os efeitos de dois analgsicos A e B, em termos do tempo mdio de ao sobre pacientes com certa doena (bastante prolongada), ambos foram aplicados a 14 doentes, em dias diferentes, sendo que 7 pacientes receberam primeiro o A, e outros 7 primeiro o B. A situao foi controlada de forma a no haver interferncia do efeito de um sobre o outro. Os resultados (em minutos) foram: Paciente XA XB 1 2 3 4 5 6 7 8 9 10 11 12 13 14 362 345 356 370 360 365 345 363 358 332 335 370 335 362 320 330 315 325 323 328 318 322 320 310 308 332 307 325
Testar a hiptese de diferena nula entre as mdias populacionais, ao nvel de significncia igual a 1%. 1.14. Os dados abaixo se referem aos pesos, em gramas, de ratos machos da raa Wistar com 15 dias de idade, segundo a condio normal e submetidos extirpao do timo (timectomizao) aos 4 dias de idade. Verificar se a timectomizao piora o ganho mdio de peso destes animais, usando = 5% . Condio Normal Timectomizado 40,3 18,6 40,0 20,3 39,6 23,6 35,2 22,2 32,0 20,9
1.15. Em determinada propriedade rural, foi avaliado o efeito de Suprimento Mineral (SM) na engorda de sunos. Para tanto, tomou-se 14 sunos similares em peso. Cada animal recebeu um dos SM. Os resultados obtidos, aps certo perodo de tempo, foram os seguintes: Pesos (Kg) 36 35 31 37
SM 1 SM 2
38 40
33 30
36 38
32 32
30 37
possvel afirmar ao nvel de 1% de probabilidade que o SM 1 promove menor mdia de ganho de peso que o SM 2?
1.16. Determinada fbrica, interessada em ampliar o seu quadro de pessoal com indivduos do sexo que apresentam menor variabilidade no tempo gasto para realizar a montagem de determinado equipamento eletrnico, realizou uma pesquisa. Os dados (em minutos) obtidos so fornecidos abaixo. Ao nvel de 1% de probabilidade, pode-se concluir que indivduos do sexo masculinos deveriam ser contratados porque apresentaram menor variabilidade no tempo gasto? Masculino Feminino 4 1 8 5 3 2 9 14 7 3 5 11
17
Cap 1 Testes de Hipteses ____________________________________________________________________ 1.17. Um fazendeiro, visando otimizar os recursos de sua propriedade e aumentar a mdia de produo de leite, realizou uma pesquisa para verificar se o fornecimento da cama de galinha da sua granja poderia substituir, em parte, o fornecimento de rao ao seu gado. Para tanto, seguindo as recomendaes de um zootecnista, selecionou um plantel de 10 animais e obteve os seguintes dados, em kg de leite por dia: Rao com cama Rao sem cama 45 38 47 37 49 35 48 39 46 37
De acordo com os resultados obtidos e ao nvel de 5% de probabilidade, voc recomendaria o uso de cama de galinha para substituir parte a rao?
1.18. Por meio dos dados amostrais fornecidos abaixo, possvel concluir que a mdia salarial de determinada empresa inferior a R$ 950,00? (use o nvel de 1% de significncia) Mdia N de indivduos avaliados Varincia
o
945 15 25
1.19. Dentre um rebanho de vacas reprodutoras, foram selecionadas ao acaso 10 animais. Dos animais selecionados, foram anotadas as produes mdias dirias (kg/dia) durante o perodo de amamentao das crias 1 e 2. Pode-se afirmar que durante a amamentao da 2a cria ocorre maior produo de leite? Use = 5% Cria 1 2 Produo de cada animal (Kg de leite/dia) 19,5 14,5 16,2 20,2 14,6 13,1 17,2 19,8 18,5 19,1 18,3 16,5
15,6 18,3
16,3 16,3
16,2 19,5
17,1 19,8
1.20. Dois novos tipos de embalagens (A e B) foram testados para armazenar extrato de tomate. Uma boa embalagem mantm o pH do extrato de tomate em 7,2 at trs meses aps a sua armazenagem. Para comparar estes dois tipos de embalagens, 10 embalagens de cada um dos dois tipos testados, receberam a mesma quantidade de extrato de tomate e foram avaliados quanto ao seu pH trs meses aps a sua armazenagem. Os resultados das avaliaes so apresentados a seguir Embalagem A Embalagem B 6,8 7,2 7,0 7,3 7,1 7,4 7,0 7,3 7,1 7,4 7,3 7,6 7,4 7,7 7,5 7,8 7,4 7,6 7,4 7,7
Admitindo-se que a variabilidade do pH em extratos armazenados nas embalagens A e B a mesma, pede-se: a. Pode-se concluir que existe diferena significativa entre as duas embalagens com relao a mdia do pH do extrato de tomate trs meses aps a sua armazenagem? Use o nvel de 5% de probabilidade. b. Baseado nos seus clculos do item a, qual embalagem deveria ser recomendada? Justifique.
18
EST 220 Estatstica Experimental I/2008 ________________________________________________________________ 1.21. Em humanos relativamente comum o hipotiriodismo, a qual uma deficincia da glndula tireide para produzir certos hormnios. Uma indstria farmacutica, visando testar um novo tipo de droga, realizou uma pesquisa com 6 indivduos portadores desta doena. Com tal finalidade, fez a avaliao da dosagem do hormnio H nos indivduos portadores da doena antes e depois de serem medicados com a nova droga. Os resultados desta pesquisa so fornecidos a seguir Indivduo Antes Depois 1 100 140 2 110 135 3 98 125 4 105 145 5 108 135 6 105 140
Pode-se concluir que a nova droga capaz de aumentar a dosagem mdia do hormnio H ao nvel de 5% de significncia? 1.22. Um fabricante de componentes eletrnicos elaborou um novo tipo de microprocessador. No entanto, desejvel que este novo microprocessador tenha velocidade mdia de processamento superior a 2,5 GHz. Para testar o novo microprocessador, o fabricante retirou ao acaso, uma amostra de 6 unidades, da qual obteve as seguintes informaes: Processador Velocidade (GHz) 1 3,0 2 2,0 3 3,7 4 4,1 5 1,9 6 3,8
Mdia da velocidade de processamento dos 6 processadores amostrados = 3,08 GHz Desvio padro da velocidade de processamento dos 6 processadores amostrados = 0,95 GHz Com base nas informaes fornecidas, pergunta-se: 1.22.1 As hipteses estatsticas para este problema so a. Ho : m = 2,5 GHz, Ha : m < 2,5 GHz b. Ho : m = 2,5 GHz, Ha : m 2,5 GHz c. Ho : m = 2,5 GHz, Ha : m > 2,5 GHz = 2,5 GHz, Ha : m < 2,5 GHz d. Ho : m = 2,5 GHz, Ha : m 2,5 GHz e. Ho : m f. Ho : m > 2,5 GHz, Ha : m = 2,5 GHz g. nenhuma das anteriores 1.22.2 O valor da estatstica t calculada para este problema, ao nvel de 5% de probabilidade, leva a concluso de que o novo microprocessador possui velocidade mdia de processamento a. superior a 2,5 GHz b. inferior a 2,5 GHz c. igual a 2,5 GHz d. nenhuma das anteriores 1.22.3 O valor da velocidade mdia amostral a partir do qual a hiptese H0 rejeitada igual a = 1,72 GHz a. m = 1,50 GHz b. m 19
1.23. Selecionaram-se aleatoriamente oito comprimidos diferentes de cada um de dois remdios antigripais concorrentes, Dozenol (D) e Niteze (N). Fez-se um teste do contedo de acetaminofena em cada um deles, obtendo-se os seguintes resultados (em mg): Dozenol Niteze 472 562 487 512 506 523 512 528 489 554 503 513 511 516 501 510
Ao nvel de 5% de significncia, teste a afirmao de que a quantidade mdia de acetaminofena a mesma nas duas marcas. 1.24. Uma mquina foi regulada para fabricar placas de 5 mm de espessura, em mdia. Iniciada a produo, foi colhida uma amostra de tamanho 10, que forneceu as seguintes medidas de espessura, em mm: 5,1 4,8 5,0 4,7 4,8 5,0 4,5 4,9 4,8 5,2 Ao nvel = 0,01, pode-se aceitar a hiptese de que a regulagem da mquina foi satisfatria? 1.25. Um banho de leo aquecido aos poucos e sua temperatura medida de meia em meia-hora por dois termmetros. Tendo-se obtido os valores abaixo, h diferena entre as indicaes dos dois termmetros, a = 5%? Termmetro 1: 38,2 44,5 53,0 59,0 66,4 71,3 Termmetro 2: 37,5 44,2 51,6 58,0 66,8 72,4 1.26. Um aparelho utilizado para testar a durabilidade de lmpadas, o qual consta de oito soquetes ligados em paralelo e de um reostato ligado em srie com um gerador. Oito lmpadas da marca A e oito lmpadas da marca B foram ensaiadas nesse aparelho, sob as mesmas condies, fornecendo as seguintes duraes, em horas: Marca A: 35 26 40 35 31 49 38 24 Marca B: 23 28 31 35 36 30 27 26 Podemos concordar com a afirmao do fabricante da marca A, de que suas lmpadas tm maior mdia de durabilidade que as da marca B ( = 1%). 1.27. Dois produtos A e B, foram avaliados quanto ao gosto, de acordo com as notas fornecidas por 10 indivduos. Admitindo-se os valores 1 (pssimo), 2 (ruim), 3 (regular), 4 (bom) e 5 (timo) e um nvel de significncia de 5%, qual o melhor produto em termos da mdia da nota recebida? Indivduo: Produto A: Produto B: 1 2 3 4 5 6 7 8 9 10 3 3 4 4 4 4 4 5 5 5 3 3 3 3 2 2 2 1 1 1
20
EST 220 Estatstica Experimental I/2008 ________________________________________________________________ 1.28. Dois candidatos a um emprego, A e B, foram submetidos a um conjunto de oito questes, sendo anotados os minutos que cada um gastou na soluo. Podemos, ao nvel de 5% de significncia, concluir que B seja mais rpido que A? Questo Indivduo A Indivduo B 1 11 5 2 8 7 3 15 13 4 2 6 5 7 4 6 18 10 7 9 3 8 10 2
1.29. Numa competio de mercado de lmpadas fluorescentes, duas marcas alegam para si o ttulo de, em mdia, apresentar mais economia de energia. Para sanar esta dvida, uma associao de consumidores resolve fazer uma bateria de testes com lmpadas das duas marcas. O resultado do consumo em watts/hora desta bateria de testes fornecido a seguir: Marca Consumo (watts/hora) A 69 72 73 72 70 B 89 92 93 92 90 Com base em um teste de hiptese, qual marca de lmpada a associao de consumidores deveria recomendar? Utilize o nvel de 5% de significncia. 1.30. Suponha que um pesquisador da rea de sade deseja mostrar que os indivduos portadores de febre amarela apresentam um teor de glicose inferior mdia de 120 mg dos indivduos no portadores. Para tanto, coletou uma amostra de sangue em sete indivduos portadores de febre amarela e para cada um deles fez a avaliao do teor de glicose, em mg. Os resultados obtidos foram: Indivduo Teor de glicose 1 119 2 122 3 120 4 110 5 112 6 115 7 116
Com base em um teste de hipteses apropriado, qual deveria ser a concluso do pesquisador? Utilize o nvel de 5% de significncia.
21
Cap 2 Contrastes
2. Contrastes
2.1. Introduo
O estudo de contrastes muito importante na Estatstica Experimental, principalmente quando o experimento em anlise composto por mais do que dois tratamentos. Com o uso de contrastes possvel ao pesquisador estabelecer comparaes, entre tratamentos ou grupos de tratamentos, que sejam de interesse. Este captulo visa dar fundamentos para estabelecer grupos de contrastes, obter a estimativa para cada contraste estabelecido, bem com estimar a variabilidade associada a cada um destes contrastes. Todos os conhecimentos adquiridos neste captulo sero utilizados no Captulo 5 para se realizar testes de hipteses para o grupo de contrastes estabelecidos.
2.2. Definies
Contraste
Considere a seguinte funo linear de mdias populacionais de tratamentos
C = a1m1 + a 2m 2 + ... + a ImI
a
i=1
=0
Estimador do Contraste
Na prtica, geralmente no se conhece os valores das mdias populacionais mi , mas suas estimativas. Da, em Estatstica Experimental, no se trabalhar com o contraste , que tambm uma funo linear de mdias obtidas por C mas com o seu estimador C meio de experimentos ou amostras. Assim tem-se que o estimador para o contraste de mdias dado por:
=a m C 1 1 + a 2 m 2 + ... + a ImI
Exerccio 2.1 Num experimento de consrcio na cultura do abacaxi, com 5 repeties, as mdias de produo de frutos de abacaxi (em t/ha), foram as seguintes:
Tratamentos 1 - Abacaxi (0,90 x 0,30m) monocultivo 2 - Abacaxi (0,80 x 0,30 m) monocultivo 3 - Abacaxi (0,80 x 0,30 m) + amendoim 4 - Abacaxi (0,80 x 0,30 m) + feijo Pede-se obter as estimativas dos seguintes contrastes: C1 = m1 + m2 m3 m4 C2 = m1 m2 C3 = m3 m4
22
()
) () ) = a V (m ) + a V (m ) + ... + a V (m ) V (C
1 1 2 2 I I
2 1
2 2
2 I
ri
2 i
, assim
2 2 2 2 1 2 2 2 I V C = a1 + a2 + ... + aI r1 r2 rI
()
a2 a2 a2 = 1 + 2 + ... + I VC r r2 rI 1
()
I 2 a2 = 2 i i=1 ri
Na prtica, geralmente, no se conhece a varincia 2 , mas sua estimativa a qual obtida por meio de dados experimentais. Esta estimativa denominada como estimador 2 . Ento o que normalmente se obtm o valor do estimador da varincia do comum s c estimador do contraste, a qual obtida por 2 I = s 2 ai C V c i=1 ri
( )
()
Exerccio 2.2 Por meio dos dados e dos contrastes fornecidos abaixo, obter as estimativas dos contrastes e as estimativas das varincias das estimativas dos contrastes.
1 = 11,2 m r1 = r2 = 6 2 = 10,5 m r3 = 4 r4 = 5 3 = 10,0 m
2 sc = 0,45
4 = 21,0 m
C1 = m1 + m2 m3 m4 C2 = m1 m2 C3 = m3 m4
23
2 1 2 2 + a 2b 2 2 + ... + aIb I I r1 r2 rI Admitindo que exista homogeneidade de varincias entre os tratamentos, ou seja: 2 2 2 1 = 2 2 = ... = I = , ento.
I a1b1 a 2 b 2 a Ib I 2 a ib i 2 ,C = = Cov C ... + + + 1 2 r r2 rI i=1 ri 1 Sabe-se que, se duas variveis aleatrias so independentes, a covarincia entre eC so independentes, a covarincia entre eles igual elas igual a zero. Assim, se C 1 2 a zero, isto : ,C =0 Cov C 1 2 Para que a covarincia seja nula, necessrio, portanto que: I a ib i = 0. i=1 ri Esta a condio de ortogonalidade entre dois contrastes para um experimento com nmero diferente de repeties para os tratamentos. Para um experimento com o mesmo nmero de repeties, satisfazendo as mesmas pressuposies (mdias independentes e homogeneidade de varincias), a condio de ortogonalidade se resume a:
a b
i=1 i
=0
Para um experimento com I tratamentos, podem ser formados vrios grupos de contrastes ortogonais, no entanto cada grupo dever conter no mximo (I-1) contrastes ortogonais, o que corresponde ao nmero de graus de liberdade para tratamentos. Dentro de um grupo de contrastes ortogonais, todos os contrastes tomados dois a dois, sero tambm ortogonais.
Exerccios 2.3. Verificar se os contrastes do Exerccio 2.1 formam um grupo de contrastes ortogonais.
24
Suponha que ao estabelecer as comparaes dos hbridos com relao a produo, seja levado em considerao o porte; o incio do florescimento; o ndice de acamamento.
Obtenha um grupo de contrastes ortogonais que permita testar as comparaes segundo os critrios citados.
Cap 2 Contrastes Multiplicar os coeficientes obtidos pelo nmero de repeties da respectiva mdia. Se possvel, simplificar os coeficientes obtidos por uma constante. No caso em que o nmero de repeties igual para todos os tratamentos, este passo pode ser eliminado.
Exerccio
2.6. Num experimento inteiramente casualizado, com 4 repeties, foram comparados os efeitos de 5 tratamentos em relao ao crescimento de mudas de Pinus oocarpa, 60 dias aps a semeadura. Os tratamentos utilizados e os resultados obtidos foram (BANZATTO e KRONKA, 1989): Tratamentos 1 Solo de cerrado (SC) 2 Solo de cerrado + esterco (SC+E) 3 Solo de cerrado + esterco + NPK (SC+E+NPK) 4 Solo de cerrado + vermiculita (SC+V) 5 Solo de cerrado + vermiculita + NPK (SC+V+NPK) Obtenha um grupo de contrastes ortogonais entre as mdias. 2.7. Suponha agora para o exemplo 1 que os tratamentos 1 e 4 tenham 3 repeties e os tratamentos 2, 3 e 5 tenham 4 repeties. Obtenha um grupo de contrastes ortogonais entre mdias. Totais 21,0 27,1 26,6 22,1 25,6
ri 5 5 5 6
C1 = m1 m 2 C 2 = m1 + m 2 2m 3
C 3 = m1 + m 2 + m 3 3m 4 Admitindo-se que os estimadores das mdias sejam independentes e que 2 s c = 0,45 , pede-se , C e C a) C
1
, V , eV C C C b) V 1 2 3 c) as estimativas das covarincias entre os estimadores dos contrastes, e por meio das mesmas, dizer quais so os contrastes ortogonais entre si.
( ) ( )
2
( )
26
EST 220 Estatstica Experimental I/2008 ___________________________________________________________________ 2.9. Supondo independncia entre mdias, homogeneidade de varincias entre tratamentos e admitindo que m1,m 2 e m 3 tm, respectivamente, 5, 3 e 6 repeties, verificar se os contrastes dados abaixo so ortogonais. C 1 = m1 m 2 C 2 = m1 + m 2 2m 3 . 2.10. Considere um experimento com 4 tratamentos e as seguintes informaes:
2 sc = 4,10
r1 = r2 = r3 = 4; r4 = 3 C1 = m1 + m 2 + m 3 3m 4
C 2 = m1 2m 2 + m 3 Pede-se: a) Forme um grupo de contrastes ortogonais, a partir dos contrastes C1 e C2, por meio do mtodo do sistema de equaes lineares. C b) Obtenha V 1 c) Obtenha V(C1) 2.11. Num experimento com 4 tratamentos e 5 repeties, so dados os seguintes contrastes ortogonais: C1 = m 2 m 4 C 2 = 2m1 + m 2 + m 4 Determinar um contraste C3 que seja ortogonal a C1 e C2. 2.12. Com os dados abaixo, obter o contraste C 3 ortogonal aos contrastes C 1 e C 2 . C1 = m1 m 2 r1 = r3 = 4
( )
C 2 = 4m 1 + 5m 2 9m 4 r2 = r 4 = 5 2.13. Dado o contraste C1 = 2m1 m2 m3, referente a um experimento com 3 tratamentos (r1 = r2 = r3 = 5), obter um contraste ortogonal C2 em relao a C1. 2.14. Dado o contraste C1 = 2m1 m2 m3, referente a um experimento com 3 tratamentos (r1 = r2 = 4 e r3 = 5), obter um contraste ortogonal C2 em relao a C1 2.15. Dado o contraste C1 = 9m1 4m2 5m3, referente a um experimento com 3 tratamentos (r1 = r2 = 4 e r3 = 5), obter um contraste ortogonal C2 em relao a C1. 2.16. Dados os contrastes C1 = m2 m4 e Y2 = 2m1 + m2 + m4, referente a um experimento com 4 tratamentos (r1 = r2 = r3 = r4 = 5), obter um contraste ortogonal C3 em relao a C1 e C2. 2.17. Dados os contrastes C1 = m1 + m2 + m3 3m4 e C2 = m1 2m2 + m3, referente a um experimento com 4 tratamentos (r1 = r2 = r3 = 4 e r4 = 3), obter um contraste ortogonal C3 em relao a C1 e C2. 2.18. Dados os contrastes C1 = m1 4m2 + m3 + 2m4 e C2 = m1 m3, referente a um experimento com 4 tratamentos (r1 = r3 = 6, r2 = 4 e r4 = 5), obter um contraste ortogonal C3 em relao a C1 e C2.
27
Cap 2 Contrastes 2.19. Para verificar o efeito de trs tipos de adoantes no teor de glicose no sangue, foi realizada uma pesquisa em que se ministrou cada um destes tipos de adoantes a um determinado grupo de cobaias, por certo perodo de tempo. Ao final deste perodo, o teor i ) no sangue foi avaliado para cada grupo, obtendo-se os seguintes mdio de glicose ( m resultados: Adoante 1-Qumico 2- Qumico 3- Natural No de Cobaias 8 10 5
i m 115 90 75
s2 30 30 30
A partir dos dados fornecidos acima, pede-se: 2.19.1 Desejando-se testar o teor mdio de glicose do conjunto de cobaias que recebeu adoante qumico contra o grupo que recebeu adoante natural, qual seria o contraste apropriado? Qual o valor da estimativa deste contraste? 2.19.2 Suponha que seja de interesse testar a seguinte comparao: C1 = m2 m3, no entanto, desejamos testar outros contrastes que sejam ortogonais a C1. Obtenha o (s) outro (s) contraste (s) ortogonal (is) necessrio (s) para completar o grupo de contrastes ortogonais a C1. 2.20. Num experimento, 4 novos tipos de herbicida foram comparados para verificar se so eficazes para combater ervas daninhas e assim manter a produo de milho em nveis elevados. Um resumo do experimento dado a seguir
Herbicida 1 Biolgico 2 Qumico base de nitrognio e enxofre 3 Qumico base de nitrognio e fsforo 4 Qumico base de inativadores enzimticos Mdia de produo (kg/ha) 46 31 32 25 Repeties 4 4 4 4
Suponha que seja de interesse testar o seguinte contraste entre as mdias de tratamentos C1 = 3m1 m 2 m 3 m 4 . Suponha ainda que todos os tratamentos possuam uma mesma varincia e que sua estimativa igual a 35 (kg / ha) 2 . Pergunta-se: a) Qual a comparao que est sendo feita pelo contraste C1? Qual a estimativa para este contraste? b) Por meio da estimativa obtida para o contraste C1 pode-se AFIRMAR que exista um grupo melhor de herbicidas do que outro? Justifique a sua resposta. c) Qual a estimativa da varincia para a estimativa do contraste C1? d) Forme um grupo de contrastes ortogonais a partir do contraste C1. Descreva qual comparao que est sendo feita por cada contraste que voc obteve. Baseando-se nos dados amostrais fornecidos, obtenha tambm a estimativa para cada um dos contrastes.
28
EST 220 Estatstica Experimental I/2008 ___________________________________________________________________ 2.21. Considere um experimento, onde foi avaliada a varivel produo (kg/parcela) de quatro tratamentos (adubaes), denominados como: T1 = Sulfato de Amnio, T2 = Sulfato de Amnio + Enxofre, T3 = Nitroclcio e T4 = Nitroclcio + Enxofre. Os resultados obtidos foram: Tratamentos 1 Sulfato de Amnio 2 Sulfato de Amnio + Enxofre 3 Nitroclcio 4 Nitroclcio + Enxofre
i m 24,0 28,0 27,0 25,0
ri 4 5 4 5
2 sc = 0,75 a) Estabelecer as seguintes comparaes de interesse (as comparaes solicitadas, no so necessariamente ortogonais): i) Sulfato de Amnio versus Nitroclcio na ausncia de Enxofre ii) Sulfato de Amnio versus Sulfato de Amnio + Enxofre iii) Nitroclcio versus Nitroclcio + Enxofre
b) Sendo dados, com base em outros critrios, os seguintes contrastes: C1 = m1 m2 C2 = 4m1 + 5m2 + 4m3 13m4 Pede-se: i) Obter a estimativa do contraste C2. ii) Obter a estimativa da varincia da estimativa do contraste C2. iii) Obter a varincia do contraste C. iv) Os contrastes C1 e C2 so ortogonais? Justifique a sua resposta.
29
3. Introduo Experimentao
3.1. Introduo
A experimentao tem por objetivo o estudo dos experimentos, isto , seu planejamento, execuo, anlise dos dados obtidos e interpretao dos resultados.
Princpio da Repetio
A repetio consiste em aplicar o mesmo tratamento a vrias unidades experimentais, ou seja, consiste na reproduo do experimento bsico. No existe uma regra dizendo qual deve ser o nmero mnimo de repeties. Isto depende do conhecimento do pesquisador sobre o assunto e do conjunto de condies em que ser realizado o experimento. Como regra prtica, sugere-se que os experimentos tenham pelo menos 20 unidades experimentais e 10 graus de liberdade para o resduo. Quanto maior o nmero de repeties, espera-se que seja maior a preciso do experimento. Em termos estatsticos, o uso do princpio da repetio tem por finalidade obter uma estimativa do erro experimental. 30
Princpio da Casualizao
O princpio da casualizao consiste em distribuir ao acaso os tratamentos s unidades experimentais. Este princpio tem por finalidade propiciar, a todos os tratamentos, a mesma chance de serem designados a qualquer uma das unidades experimentais, visando evitar que algum dos tratamentos seja sistematicamente favorecido ou desfavorecido por fatores fora de controle do pesquisador. Sendo assim com o uso do princpio da casualizao, as variaes que contribuem para o erro experimental so convertidas em variveis aleatrias. Do ponto de vista estatstico, com o uso do princpio da casualizao em um experimento: a. obtm-se uma estimativa vlida do erro experimental; b. fica garantido o uso de testes de significncia, pois os erros experimentais atuam de forma independente nas diversas unidades experimentais. Todo experimento deve conter no mnimo os princpios bsicos da repetio e da casualizao.
Premeditada
aquela introduzida pelo pesquisador com a finalidade de fazer comparaes. Por exemplo: tratamentos.
Sistemtica
Variaes no intencionais, mas de natureza conhecida. Variao inerente ao material experimental. Podem ser controladas pelo pesquisador. Por exemplo: heterogeneidade do solo, tamanho de semente, etc.
Aleatria
So variaes de origem desconhecida, no podendo ser controladas. Constituem o erro experimental. So devidas a duas fontes: variaes no material experimental e falta de uniformidade nas condies experimentais.
31
3.5. Exerccios
3.1. Um experimento deve conter no mnimo o(s) seguinte(s) princpio(s) bsico(s) da experimentao: a) repetio b) casualizao c) controle local d) repetio e controle local e) repetio e casualizao f) casualizao e controle local g) nenhuma das respostas anteriores 3.2. A repetio tem a funo de: a) fornecer uma estimativa do erro experimental b) validar a estimativa do erro experimental c) controlar a heterogeneidade das unidades experimentais d) nenhuma das anteriores 3.3. A casualizao tem a funo de: a) fornecer uma estimativa do erro experimental b) validar a estimativa do erro experimental c) controlar a heterogeneidade das unidades experimentais d) nenhuma das anteriores 3.4. Um extensionista, desejando comparar 10 raes para ganho de peso em animais, procedeu da seguinte forma: tomou 10 animais de uma propriedade rural. Estes 10 animais visivelmente no eram homogneos entre si, porque foram oriundos de diferentes cruzamentos raciais e apresentavam idades diferentes. as raes que o extensionista julgou ser as melhores foram designadas aos melhores animais, e as raes que o extensionista julgou ser as piores foram designadas aos piores animais, de tal forma que cada animal recebeu uma nica rao. ao final de sua pesquisa, o extensionista recomendou a rao que proporcionou maior ganho de peso nos animais. Baseado nestas informaes, pergunta-se: 3.4.1 Quantos e quais foram os tratamentos em teste nesta pesquisa? Justifique sua resposta. 3.4.2 Qual foi a constituio de cada unidade experimental nesta pesquisa? Justifique sua resposta. 3.4.3 Qual(is) foi(ram) o(s) princpio(s) bsico(s) da experimentao utilizados nesta pesquisa? Justifique a sua resposta. 3.4.4 possvel estimar o erro experimental nesta pesquisa? Justifique sua resposta. 3.4.5 A concluso dada pelo extensionista ao final da pesquisa, estatisticamente aceitvel? Justifique a sua resposta.
32
EST 220 Estatstica Experimental I/2008 ___________________________________________________________________ 3.5. Um bioqumico desejando verificar qual entre 5 enzimas (identificadas como E1, E2, E3, E4 e E5) produz maiores fragmentos de DNA de clulas epiteliais de cobaias, realizou o seguinte ensaio: selecionou um conjunto de 15 cobaias (sistematicamente identificadas como 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14 e 15) que eram supostamente homogneas para as caractersticas essenciais; de cada uma das 15 cobaias, tomou uma amostra de tecido epitelial de cada um dos seguintes membros: superior, mediano e inferior. Procedeu posteriormente a uma mistura das amostras coletadas dos trs membros, denominada de amostra composta; cada amostra composta foi convenientemente tratada para a extrao do DNA. A amostra obtida contendo apenas o DNA foi denominada amostra genmica. As amostras genmicas foram identificadas de acordo com o nmero da cobaia que a originou, ou seja, a amostra genmica identificada como C1, conteve DNA extrado da cobaia 1; a amostra genmica identificada como C2, conteve DNA extrado da cobaia 2; e assim por diante. Ao final obteve-se as amostras genmicas C1, C2, C3, C4, C5, C6, C7, C8, C9, C10, C11, C12, C13, C14 e C15; cada uma das amostras genmicas foi tratada com um tipo de enzima. A distribuio das enzimas s amostras foi feita da seguinte forma sistemtica: E1 foi destinada s amostras genmicas C1, C2 e C3; E2 foi destinada s amostras genmicas C4, C5 e C6; E3 foi destinada s amostras genmicas C7, C8 e C9; E4 foi destinada s amostras genmicas C10, C11 e C12; e E5 foi destinada s amostras genmicas C13, C14 e C15; uma amostra de 1 ml de cada substrato qumico dos fragmentos de DNA foi colocado para correr em um gel. O tempo, em minutos, gasto por cada uma das 15 amostras para percorrer a distncia de 25 cm foi registrado para comparar o efeito das enzimas E1, E2, E3, E4 e E5.
Com base nas informaes fornecidas deste ensaio e das explicaes fornecidas em sala de aula, pergunta-se: 3.5.1 Quais foram os tratamentos em teste neste experimento? Justifique a sua resposta. 3.5.2 Neste experimento os tratamentos surgiram de uma forma aleatria, premeditada ou sistemtica? Justifique a sua resposta. 3.5.3 Qual foi a unidade experimental nesta pesquisa? Justifique a sua resposta. 3.5.4 O princpio da repetio foi utilizado nesta pesquisa? Justifique a sua resposta. Em caso afirmativo, explique porque diferentes observaes obtidas para um mesmo tratamento no so iguais. Em caso negativo, faa uma anlise crtica quanto necessidade do uso de repeties num experimento. 3.5.5 O princpio da casualizao foi utilizado nesta pesquisa? Justifique a sua resposta. 3.5.6 O princpio do controle local foi utilizado nesta pesquisa? Justifique a sua resposta. Em termos gerais, quando que o princpio do controle local deve ser utilizado em um experimento? 3.5.7 possvel estimar o erro experimental nesta pesquisa? Justifique a sua resposta. Em caso afirmativo, a estimativa do erro experimental vlida? Justifique a sua resposta. Em caso negativo, indique o que deveria ser feito de diferente neste ensaio para ser possvel estimar o erro experimental. Justifique a sua resposta. 3.5.8 Neste ensaio, qual foi a varivel resposta utilizada para comparar os efeitos de tratamentos? Justifique a sua resposta.
33
Cap 3 Introduo Experimentao ____________________________________________________________________ 3.6. Um pesquisador desejava comparar os efeitos que 8 tipos de leo tm sobre o teor de gordura total em preparos de maionese. Com esta finalidade, esse pesquisador procedeu da seguinte forma: para a avaliao do teor de gordura total, o pesquisador tinha sua disposio 8 bioqumicos. Devido falta de experincia dos bioqumicos, o pesquisador temia que a medio dos mesmos pudesse interferir na comparao dos tipos de leo. Visando controlar esta fonte de variao, o pesquisador decidiu que cada um dos 8 bioqumicos deveria fazer a medio do teor de gordura dos preparos de maionese produzidos utilizando os 8 tipos de leo; baseado em experimentos anteriores, o pesquisador sabia que, apesar do controle de qualidade, havia variao entre os lotes de substrato de preparos de maionese. O substrato de preparo da maionese o composto que tem todos os ingredientes do preparo da maionese, exceto o leo. Como um lote de substrato no seria suficiente para testar os 8 tipos de leo em todas as repeties desejadas, o pesquisador decidiu que prepararia 8 lotes de substrato e dividiria cada lote em 8 partes iguais. Cada uma das 64 partes, assim obtidas, seria denominada de amostra bsica; foi ento realizada uma distribuio ao acaso dos 8 tipos de leo s amostras bsicas, tendo as seguintes restries na casualizao:
1a) cada tipo de leo deveria ser aplicado em uma nica amostra bsica de cada um dos 8 lotes de substrato. 2a) os 8 tipos de preparo de maionese obtidos misturando cada uma das amostras bsicas com cada um dos 8 tipos de leo, deveriam ser avaliadas por cada um dos 8 bioqumicos; No local que foi conduzido o experimento, o pesquisador constatou que, aps certo tempo do experimento ter sido instalado, houve uma pequena contaminao por fungo em algumas unidades experimentais. O pesquisador, usando do seu conhecimento tcnico na rea, julgou que a contaminao no comprometeria os resultados obtidos no experimento. Baseando-se nestas informaes, responda com objetividade e clareza, as seguintes perguntas: 3.6.1 Quais foram os tratamentos em teste? Justifique a sua resposta. 3.6.2 Como voc classificaria a fonte de variao contaminao por fungo, observada nesse experimento? Justifique a sua resposta. 3.6.3 Qual foi a unidade experimental utilizada nesta pesquisa? Justifique a sua resposta. 3.6.4 O princpio da repetio foi utilizado nesta pesquisa? Se sua resposta for afirmativa, responda qual foi o nmero de repeties utilizado. Se a sua resposta for negativa, responda se o procedimento do pesquisador est correto. 3.6.5 O princpio da casualizao foi utilizado nesta pesquisa? Justifique a sua resposta. 3.6.6 O princpio do controle local foi utilizado nesta pesquisa? Se a sua resposta for afirmativa, explique como este princpio foi utilizado. Se a sua resposta for negativa, explique por que no houve a necessidade da utilizao deste princpio. 3.6.7 Qual foi a caracterstica utilizada pelo pesquisador para avaliar o efeito de tratamentos neste experimento. Justifique a sua resposta.
34
EST 220 Estatstica Experimental I/2008 ___________________________________________________________________ 3.7. Um fabricante de mveis realizou um experimento para verificar qual dentre cinco marcas de verniz proporciona maior brilho. Com esta finalidade, procedeu da seguinte forma: Em sua fbrica identificou amostras de madeira que estariam disponveis para a realizao deste experimento. Verificou que possua cinco tbuas de Jatob, cinco tbuas de Cerejeira, cinco tbuas de Mogno, cinco tbuas de Goiabo e cinco tbuas de Castanheira. Constatou tambm que as cinco tbuas de cada tipo de madeira eram homogneas para as caractersticas essenciais e que havia uma grande variedade de cores entre os cinco tipos de madeira (Jatob, Cerejeira, Mogno, Goiabo e Castanheira). Sabe-se que a cor da madeira pode influenciar muito o brilho da mesma quando envernizada; Resolveu ento distribuir ao acaso as cinco marcas de verniz s tbuas de madeira, de tal forma que cada tipo de madeira fosse testada com todas as marcas de verniz; O brilho foi medido por meio de um aparelho que mede a refletncia da luz branca projetado sobre a tbua de madeira envernizada;
Baseado nas informaes deste experimento, pergunta-se: 3.7.1. Qual foi a unidade experimental utilizada neste experimento? Justifique a sua resposta. 3.7.2. Quais foram os tratamentos comparados neste experimento? Justifique a sua resposta. 3.7.3. Quais foram os princpios bsicos da experimentao utilizados neste experimento? Justifique a sua resposta. 3.7.4. possvel estimar o erro experimental neste experimento? Justifique a sua resposta. Se a resposta for afirmativa, a estimativa do erro vlida? Justifique. Se a resposta foi negativa, explique o que deveria ser feito para obter uma estimativa vlida para o erro experimental. 3.7.5. O que faz surgir o erro num experimento? possvel eliminar totalmente o efeito do erro experimental em um experimento? Justifique a sua resposta. 3.7.6. O procedimento adotado pelo pesquisador de distribuir as marcas de verniz ao acaso dentro de cada tipo de madeira foi realmente necessrio? Justifique a sua resposta. 3.8. Um pesquisador de uma indstria de alimentos desejava verificar se seis sabores de sorvete apresentavam o mesmo o teor de glicose. O pesquisador, baseado em experimentos anteriores, sabia que duas outras fontes de variao indesejveis poderiam influenciar o valor mensurado do teor de glicose: o tipo de recipiente utilizado para armazenagem do sorvete e o equipamento utilizado para mensurao do teor de glicose. Para controlar estas duas fontes de variao o pesquisador decidiu que cada sabor deveria ser avaliado em cada um dos seis equipamentos disponveis; e armazenado em cada um dos seis tipos de recipientes disponveis. Com esta finalidade, o pesquisador planejou o experimento da seguinte maneira: - preparar 6 lotes de 100 ml de cada sabor. O total de lotes a serem preparados seria de 36 lotes; - os lotes de sorvetes deveriam ser distribudos ao acaso aos recipientes, com a restrio de que cada tipo de recipiente recebesse todos os 6 sabores uma nica vez;
35
Cap 3 Introduo Experimentao ____________________________________________________________________ os lotes de sorvetes seriam designados ao acaso aos equipamentos para a anlise do teor de glicose, com a restrio de que cada equipamento avaliasse cada um dos seis sabores uma nica vez. Baseando-se nestas informaes, pergunta-se: 3.8.1. Quais foram os tratamentos em teste neste experimento? Justifique a sua resposta. 3.8.2. O princpio da repetio foi utilizado neste experimento? Justifique a sua resposta. 3.8.3. O princpio do controle local foi utilizado neste experimento? Justifique a sua resposta. Se a resposta for afirmativa, quantas vezes o mesmo foi utilizado? Se a resposta for negativa, discuta sobre a necessidade do mesmo ser utilizado neste experimento.
36
Tratamentos 2 ... ... Y21 ... Y22 ... ... ... Y2J
T2
...
Deste quadro pode-se retirar algumas informaes de interesse: no de unidades experimentais: N = I x J Total geral: G =
i =1, j =1
I,J
Yij = Ti = Y
i =1
EST 220 Estatstica Experimental I/2008 ____________________________________________________________________ em que, Yij o valor observado para a varivel resposta obtido para o i-simo tratamento
em sua j-sima repetio; m mdia de todos os valores possveis da varivel resposta; t i o efeito do tratamento i no valor observado Yij ;
t i = mi m eij o erro experimental associado ao valor observado Yij ;
e ij = Yij m i O erro experimental ocorre em todos os experimentos, porque no possvel controlar o efeito de fontes de variaes que ocorrem de forma aleatria e desconhecida. Este erro o responsvel pela variao observada entre as observaes obtidas nas repeties para cada tratamento.
aplicando somatrio
i=1, j=1
(Y
I,J I,J
ij
)2 = m
i=1, j=1
[(m
I,J I,J
) + (Yij m i)2 , m
ij
i=1, j=1
(Y
I,J
ij
)2 = m
I,J
i=1, j=1
i m )2 + (m
i=1, j=1
(Y
i )2 + m
i=1, j=1
duplos produtos
I,J
i =1, j =1
duplos produtos = 0 .
SQTotal = SQTrat + SQRes
Escrevendo de uma forma mais simplificada a igualdade anterior temos: Por meio das frmulas obtidas anteriormente, pode-se obter os valores para as respectivas somas de quadrados. No entanto, essas frmulas demandam muitos clculos.
38
EST 220 Estatstica Experimental I/2008 ____________________________________________________________________ Frmulas de mais fcil aplicao podem ser obtidas, conforme mostrado a seguir. Inicialmente trabalharemos com a frmula da SQTotal. Tem-se que:
SQTotal =
i =1, j =1
(Y
I,J 2 ij
ij
) m
(Y
I,J ij
ij
)2 = m
I,J
i =1, j =1
(Y
I,J
Yij + m 2 2m
I,J I,J
)
2
(Y
I,J i =1, j =1
) = m
2 ij
i =1, j =1
Yij + Yij2 2m
i =1, j =1 I,J
i =1, j =1
(Y
)2 = m
i =1, j =1
I,J
2 ij
Yij + IJm 2 2m
i =1, j =1
i =1, j =1
Y
IJ
I,J
ij
, assim
2
i =1, j =1
(Y
I,J
ij
) m
I,J Y Yij ij I,J I,J i =1, j =1 i=1, j =1 2 Yij + IJ = Yij 2 IJ i=1, j=1 IJ i =1, j =1
I,J
simplificando tem-se,
i =1, j =1
(Y
I,J
ij
) m
finalmente temos:
SQTotal =
i =1, j =1
(Y
I,J
ij
) m
que a frmula mais prtica para se calcular a SQTotal. Para a SQTratamentos tem-se:
SQTrat =
i =1, j =1
(m
I,J
) m
i m )2 (m
I,J
=
I,J
i =1, j =1
(m
I,J
2 i
m i +m 2 2m
I,J I,J
)
2
i m )2 (m (m
i
I,J
=
2
i =1, j =1 I
i2 2m m i + m
i =1, j =1 I
i =1, j =1
i =1, j =1
) = J m i2 2m J m i + IJm 2 m
i =1 i =1
A mdia geral e a mdia para tratamentos podem ser escritas respectivamente como: 39
= m
i =1, j =1
I,J
ij
i = e m
I,J
Ti J
i =1, j =1
(m
I,J J
)2 m
i =1, j =1
(m
I,J
) m
simplificando, tem-se.
(m
I,J
i =1, j =1
)2 m
finalmente tem-se:
I,J Yij I,J I T 2 i=1, j=1 i m )2 = i SQTrat = (m IJ i =1, j =1 i =1 J A frmula anterior utilizada quando o nmero de repeties igual para todos os tratamentos. No caso em que o nmero de repeties varia de acordo com o tratamento a frmula apropriada I,ri Yij I T2 i =1, j =1 SQTrat = i N i =1 ri
2
r
i =1
A Soma de Quadrados do Resduo (SQRes) obtida por diferena, SQRes = SQTotal - SQTrat O quadro da anlise de varincia, geralmente denotada por ANOVA (ANalysis Of VAriance) para a anlise de um experimento instalado segundo o DIC, com igual nmero de repeties para todos os tratamentos do seguinte tipo:
40
A partir das SQTrat e SQRes, obtm-se os respectivos quadrados mdios, por meio do quociente entre a soma de quadrados com o respectivo nmero de graus de liberdade. Para se concluir se existe diferena entre tratamentos, calcula-se o valor de F, que obtido pelo quociente do QMTrat com o QMRes. Este valor de F calculado deve ser comparado com o valor de F tabelado, o qual obtido na tabela de distribuio da varivel aleatria F, de acordo com o nvel de significncia do teste, graus de liberdade para tratamentos e graus de liberdade para resduo. As hipteses para o teste F da anlise de varincia para tratamentos so as seguintes: H 0 : m1 = m 2 = ... = m I = m , o que equivale a dizer que todos os possveis contrastes entre as mdias dos tratamentos, so estatisticamente nulos, ao nvel de probabilidade que foi executado o teste. H a : no H 0 , o que equivale a dizer que existe pelo menos um contraste entre as mdias dos tratamentos, estatisticamente diferentes de zero, ao nvel de probabilidade que foi realizado o teste. A regra decisria para o teste F a seguinte:
-
se o valor do F calculado for maior ou igual ao valor do F tabelado, ento rejeita-se H0 e conclui-se que os tratamentos tem efeito diferenciado ao nvel de significncia em que foi realizado o teste; se o valor de F calculado for menor que o valor do F tabelado, ento no rejeita-se H0 e conclui-se que os tratamentos tm efeitos iguais ao nvel de significncia em que foi realizado o teste.
O CV utilizado para avaliao da preciso de experimentos. Quanto menor o CV mais preciso tende a ser o experimento. A ttulo de classificao geral pode-se utilizar a seguinte tabela C.V. < 10% 10 a 20% 20 a 30% >30% Avaliao Baixo Mdio Alto Muito Alto Preciso Alta Mdia Baixa Muito Baixa
Porm o valor do CV no tem nada de absoluto, pois existe uma variabilidade inerente a cada rea de pesquisa. Por exemplo, experimentos realizados em locais com
41
EST 220 Estatstica Experimental I/2008 ____________________________________________________________________ ambiente controlado geralmente so mais precisos e podem apresentar CV menores que 5%.
Desvantagens
a) no fcil conseguir e manter total homogeneidade das condies durante a toda a realizao do experimento; b) todas as variaes exceto a devida a tratamentos, so consideradas como sendo variaes que ocorrem ao acaso. Isto pode acarretar em uma estimativa muito alta para o erro experimental.
4.7. Exerccios
4.1. Para comparar a produtividade de quatro variedades de milho, um agrnomo tomou vinte parcelas similares e distribuiu, inteiramente ao acaso, cada uma das 4 variedades em 5 parcelas experimentais. A partir dos dados experimentais fornecidos abaixo, possvel concluir que existe diferena significativa entre as variedades com relao a produtividade, utilizando o nvel de significncia de 5%? A 25 26 20 23 21 115 23 Variedades B C 31 22 25 26 28 28 27 25 24 29 135 130 27 26 D 33 29 31 34 28 155 31
Totais Mdias
4.2. Um treinador de corrida rstica, objetivando melhorar o desempenho de seus atletas, testou trs novas tcnicas de preparao. Para tanto trabalhou com um grupo de 15 atletas completamente homogneos para as caractersticas essenciais. A designao das tcnicas de preparao aos atletas foi feita totalmente ao acaso e de tal forma que o nmero de atletas avaliados em cada uma das tcnicas fosse o mesmo. Os resultados obtidos, aps um determinado perodo de tempo de aprendizado da tcnica pelos atletas, foram os seguintes (minutos / 25 Km):
42
EST 220 Estatstica Experimental I/2008 ____________________________________________________________________ Repeties 1 2 3 4 5 Totais Tcnicas de Preparao 1 2 3 130 125 135 129 131 129 128 130 131 126 129 128 130 127 130 643 642 653
De acordo com os resultados obtidos, pede-se. a) Quais foram os Princpios Bsicos da Experimentao utilizados pelo pesquisador neste experimento? b) Qual foi a unidade experimental nesta pesquisa? c) possvel concluir que existe diferena entre as tcnicas de preparao com relao ao tempo mdio gasto para percorrer a distncia de 25 km? ( = 1%) d) Qual seria a tcnica a ser recomendada? 4.3. Com o objetivo de diminuir o consumo dos motores gasolina, uma determinada indstria petroqumica testou 4 novas formulaes de gasolina, as quais se diferenciavam pelo tipo de aditivo que era acrescentado mesma durante o seu processo de fabricao. Para efetuar o teste, a indstria petroqumica utilizou carros completamente homogneos para todas as caractersticas. A designao das formulaes aos carros foi feita inteiramente ao acaso. Aps os testes de rodagem, os resultados obtidos foram (km/l): Aditivo a base de cido Forte Mdias 14,81 N de carros 10 SQResduo=6,0264 cido Fraco 6,56 10 Base Forte 10,06 10 Base Fraca 10,09 10
Com base nos resultados acima, pede-se: a) Existe diferena entre os 4 tipos de formulaes? ( = 5%) b) Estabelea um contraste entre o grupo base de formulao cida contra o grupo base de formulao bsica. Obtenha a estimativa para este contraste. c) Estabelea um contraste para comparar aditivos de formulao cida. Obtenha a estimativa para este contraste. d) Estabelea um contraste para comparar aditivos de formulao bsica. Obtenha a estimativa para este contraste. 4.4. Com o objetivo de verificar se a partida tem influncia na taxa de glicose no sangue, em ratos, um experimento no DIC foi realizado. Vinte e quatro ratos machos da raa W foram escolhidos aleatoriamente e separados em trs grupos. Os dados referentes as taxas de glicose, em miligramas por 100 ml de sangue, segundo o grupo, em ratos machos com 60 dias de idade so dados abaixo: Parotidectomizado 96,0 Pseudoparotidectomizado 90,0 Normal 86,0 95,0 100,0 108,0 120,0 110,5 97,0 93,0 89,0 88,0 87,0 92,5 87,5 85,0 105,0 105,0 90,0 100,0 95,0 92,5 85,0 95,0
Usando = 5% , testar a hiptese de que as mdias relativas aos trs grupos so iguais, e concluir. 4.5.O resultado das vendas efetuadas por 3 vendedores de uma indstria de pesticidas durante certo perodo dado a seguir. Ao nvel de 5% de probabilidade e considerando os 43
EST 220 Estatstica Experimental I/2008 ____________________________________________________________________ vendedores como tratamentos de um D.I.C., verifique se h diferena de eficincia entre os vendedores. A 29 27 31 29 32 30 178 Vendedores B 27 27 30 28 C 30 30 31 27 29 147
Totais
112
4.6. Baseado nas informaes fornecidas abaixo e supondo que os tratamentos que possuem as maiores mdias so os desejados, pergunta-se: Qual(is) tratamento(s) deve(m) ser recomendado(s)? Justifique a sua resposta. Use o nvel de 1% de significncia. FV Tratamentos Resduo Total Mdias de tratamentos: 1 = 128,6 m 2 = 128,4 m 3 = 130,6 m GL SQ 2 14,80 14 78,40 QM 7,40 F
4.7. Os seguintes dados referem-se a ganhos de peso, em kg, de animais durante um perodo experimental. Repeties 2 3 8,9 6,0 8,8 4,9 5,0 9,1 10,8 10,2 11,3 10,0
Raes A B C D E
Tais dados so descritos segundo o modelo estatstico: Yij = m + ti + eij. Baseando nas informaes fornecidas, pede-se: 4.7.1. Proceda a anlise de varincia dos dados (use = 5%) 4.7.2. De acordo com o resultado do teste F, pode-se concluir que existe efeito significativo de raes com relao ao ganho de peso mdio proporcionado pelas mesmas? 4.7.3. Proponha um contraste que compare as raes B e C juntas contra as raes D e E. Obtenha a estimativa para este contraste. 4.7.4. Calcule o coeficiente de variao e interprete-o.
44
45
EST 220 Estatstica Experimental I/2008 ____________________________________________________________________ A princpio um determinado contraste, por exemplo, entre duas mdias poderia ser testado por cada um dos procedimentos aqui apresentados. A concluso a respeito da significncia do contraste pode variar de um procedimento para outro, pois o valor da dms varia de um teste para outro, pois cada um se baseia numa distribuio de probabilidades especfica. Devido a esta possibilidade na diferena de concluses a respeito da significncia do contraste, ns podemos dizer que um teste mais conservador (ou rigoroso) que o outros. Na estatstica dizemos que um teste mais conservador que o outro quando a dms dele maior, pois ele tende a conservar a hiptese de igualdade entre mdias como verdadeira. Isto porque quanto maior a dms mais difcil se torna rejeitar a hiptese de nulidade. Este maior ou menor conservadorismo de um teste pode ajudar o pesquisador a escolher um procedimento de comparao mltipla. Se por exemplo, por experincia prpria o pesquisador sabe que as diferenas entre os efeitos dos nveis do fator em teste so pequenas e ele deseja detectar estas pequenas diferenas, ento ele deve usar um procedimento menos conservador, ou seja, que apresenta uma menor dms. Se por outro lado, ele quer concluir que os nveis do fator tm efeitos diferentes somente quando a diferena nos seus efeitos for realmente grande, ento ele deve usar um teste mais conservador, ou seja, com maior dms. Vamos ver a partir de agora cada procedimento com mais detalhe. Considere para tanto, que estamos interessados em comparar as mdias dos I nveis de um fator qualitativo, as quais foram obtidas a partir da realizao de um experimento no delineamento inteiramente casualizado com J repeties, para o qual o teste F para fator foi significativo; e que o nmero de graus de liberdade para o fator em estudo foi igual a n1 e para o resduo foi igual a n2, ou seja, FV Fator Resduo Total GL I-1 I(J-1) IJ - 1 SQ SQFator SQRes SQTotal QM QMTrat QMRes F significativo
Teste de Tukey
O teste de Tukey, pode ser utilizado para comparar a totalidade dos contrastes entre duas mdias, ou seja, para os I(I1)/2 contrastes do tipo C=mi mu; para 1 i < u I, em que I o nmero de nveis do fator em estudo. Este teste baseia-se na diferena mnima significativa (d.m.s.) representada por e dada por: 1 =q VC 2 em que, q = q (I, n 2 ) o valor tabelado da amplitude total estudentizada, que obtido em
()
funo do nvel de significncia do teste, nmero de nveis do fator em estudo (I) e nmero de graus de liberdade do resduo (n2) da anlise de varincia.
46
()
No caso em que todos os tratamentos apresentaram o mesmo nmero de repeties, ou seja, ri = ru = K, o valor de simplificado com a seguinte expresso
=q
QM Re s K
Para a realizao do teste Tukey,a um nvel de significncia , necessrio: 1. enunciar as hipteses: H0: C = 0 vs Ha: C 0, em que C = mi mu, para i u; =m i m u , com base nos valores 2. obteno das estimativas dos contrastes, C amostrais; 3. clculo do ; 4. concluir a respeito da significncia dos I(I1)/2 contrastes em teste, usando a , rejeita-se H ; caso contrrio, no se rejeita H . Neste seguinte relao: se C 0 0 caso, indicar as mdias iguais, seguidas por uma mesma letra. Consideraes: 1. O teste de Tukey vlido para a totalidade dos contrastes de duas mdias. 2. O teste de Tukey exige, em princpio, balanceamento. Mas, no caso dos tratamentos apresentarem nmeros de repeties diferentes, o resultado obtido por este teste apenas uma aproximao. 3. O teste de Tukey exato para testar a maior diferena, nos demais casos conservador.
Teste de Duncan
Tal como o teste de Tukey, o teste de Duncan um procedimento seqencial, vlido para a totalidade dos contrastes de duas mdias do tipo C = mi mu. O teste de Duncan necessita a prvia ordenao das mdias, dos nveis do fator em estudo. Este teste baseia-se na amplitude total mnima significativa (D i ) dada por:
Di = z i 1 VC 2
()
em que, z i = z (n, n 2 ) o valor tabelado da amplitude total estudentizada, que obtido em funo do nvel de probabilidade, nmero de mdias ordenadas abrangidas pelo contraste entre os nveis do fator em estudo (i) e nmero de g.l. do resduo da ANOVA (n2). Como se trata de um processo seqencial, n1 varia seu valor durante a aplicao do teste; 1 1 = QM Re s C V r + r u i No caso em que todos os tratamentos apresentaram o mesmo nmero de repeties, ou seja, ri = ru = K, o valor de Di simplificado com a seguinte expresso
()
D =z i i
QM Re s K
47
EST 220 Estatstica Experimental I/2008 ____________________________________________________________________ Para a realizao do teste Duncan a um nvel de significncia necessrio: 1. enunciar as hipteses: H0: C = 0 vs Ha: C 0, em que C = mi mu, para i u; 2. ordenar as mdias do fator em estudo em ordem crescente ou decrescente; 3. obter o valor da estimativa do contraste entre a maior e a menor mdia, com base nos valores amostrais; 4. calcular o valor de Di , com base no nmero de mdias ordenadas abrangidas pelo contraste. Neste primeiro passo i= I; 5. concluir a respeito da significncia do contraste em teste, usando o seguinte critrio: a) Se o valor de D i for maior do que o mdulo da estimativa do contraste, no rejeita-se H 0 e as mdias so ligadas por um trao, indicando que no h diferena entre elas; b) Caso contrrio, reduzir de uma unidade o valor de n1. Calcula-se o novo valor de D i e, para todos os pares de mdias que no estejam ligadas por um mesmo trao e que envolvem n1 mdias, repetir o procedimento que consta no item 3 e nos seguintes; 6. Proceder ao item 3 e seguintes at que i = 2. Este teste tem como inconveniente, alm de ser um teste trabalhoso, o fato das mdias ordenadas no serem independentes e o valor de zi em conseqncia, no ser exato. Consideraes: 1. O teste Duncan um procedimento seqencial vlido para a totalidade dos contrastes de duas mdias. 2. Tal como o teste de Tukey, o teste de Duncan exige, em princpio, balanceamento. Mas, no caso de serem diferentes os nmeros de repeties este teste pode ainda ser usado, mas ento apenas aproximado. 3. Quando a maior mdia no diferir significativamente da menor, no se admitir diferena significativa, entre as mdias intermedirias.
Teste t de Student
O teste t pode ser utilizado para testar contrastes envolvendo duas ou mais mdias. Porm este teste exige que: 1. as comparaes a serem realizadas sejam escolhidas a priori, ou seja, antes de serem examinados os dados; 2. podem-se testar no mximo, tantos contrastes quantos so os graus de liberdade para tratamentos, e estes contrastes devem ser ortogonais. A ortogonalidade entre os contrastes indica independncia linear na comparao estabelecida por um contraste com a comparao estabelecida pelos outros contrastes. Entre I mdias de um fator, podem ser obtidos I 1 contrastes ortogonais. Consideremos um contraste de mdias, entre os nveis de um fator, em sua forma geral: C = a1m1 + a 2m 2 + ... + a ImI do qual obtemos a estimativa por meio do estimador =a m +a m + ... + a m , C
1 1 2 2 I I
que pode ser testada pelo teste t, calculando-se a estatstica t, dada por.
48
C C a i2 QMRe s i=1 ri
I
que tem distribuio t de Student com n2 graus de liberdade, sendo n2 o nmero de graus de liberdade do resduo e QMResduo o quadrado mdio residual da anlise de varincia. Caso o nmero de repeties seja o mesmo para todos os tratamentos, ou seja r1=r2=...=rI=K, ento a frmula para a aplicao do teste t C C t= QM Re s I 2 ai K i=1 Quando aplicamos o teste t a um contraste, C, geralmente o interesse testar as hipteses: H0: C = 0 vs Ha: C 0. O valor tabelado de t obtido por ttab=t (n2). A regra de deciso, neste caso, a seguinte: Se |t| ttab rejeita-se H 0 . Caso contrrio no se rejeita H 0 . Consideraes: 1. O nvel de significncia vlido para um nico contraste, e no para uma srie deles; 2. O nvel de significncia vlido somente se o contraste for estabelecido a priori e no sugerido pelos dados, pois, pode ficar caracterizado uma estatstica de ordem ao querer comparar a maior com a menor mdia, o que acarretaria certa dependncia entre as mdias.
Teste de Scheff
Este teste pode ser aplicado para testar todo e qualquer contraste entre mdias, mesmo quando sugerido pelos dados. freqentemente utilizado para testar contrastes que envolvam grupos de mdias. um teste mais conservador que o teste t, porm no exige que os contrastes a serem testados sejam ortogonais e nem que estes contrastes sejam estabelecidos antes de se examinar os dados. Se o valor de F obtido no for significativo, nenhum contraste poder ser significativo pelo teste de Scheff, e sua utilizao no se justifica. A estatstica do teste, denotada por S, calculada por: ) (C S = (I 1)F V
tab
em que, I = o nmero de nveis do fator em estudo; Ftab = F(I-1;n2) o valor tabelado de F, obtido em funo do nvel de probabilidade, nmero de graus de liberdade do fator em estudo, ou seja I-1, e nmero de graus de liberdade do resduo, ou seja n2; 2 I ) = QMRe s a i (C V i =1 ri
49
EST 220 Estatstica Experimental I/2008 ____________________________________________________________________ Caso o nmero de repeties seja o mesmo para todos os tratamentos, ou seja, r1=r2=...=rI=K, ento a frmula para a aplicao do teste Schheff
S = (I 1)Ftab QM Re s I 2 ai K i=1
Deve-se ento, calcular a estimativa do contraste C, ou seja, =a m C 1 1 + a 2 m 2 + ... + a ImI | S, dizemos que o contraste significativamente diferente Se verificarmos que | C
de zero ao nvel de probabilidade, indicando que os grupos de mdias confrontados no contraste diferem entre si a esse nvel de probabilidade. Consideraes: 1. O teste de Scheff vlido para a totalidade dos contrastes. 2. Para testar um nico contraste, ou para testar um nmero pequeno deles, o teste de Scheff bastante rigoroso.
5.4. Exerccios
5.1. Aplique os testes Tukey e Duncan, aos exemplos dados ao final da apostila do Captulo de Delineamento Inteiramente Casualizado. 5.2. Para os dados fornecidos a seguir, conclua pelo teste Duncan e Tukey ( = 5 %) . 1 = 370 m D 6 = 31 2 = 338 m D 5 = 30,2 3 = 380 m D 4 = 28,7 4 = 320 m D 3 = 26 5 = 325 m D 2 = 24,6 6 = 367 m = 33
50
Cap 5 Comparaes Mltiplas ____________________________________________________________________ 5.3. Aplicar o teste de Duncan s comparaes mltiplas obtidas com as mdias dos tratamentos instalados em um experimento segundo o Delineamento Inteiramente Casualizado (DIC).Concluir para = 5% de probabilidade. T1 = 452,16 T2 = 481,80 T3 = 442,56 T4 = 469,52 T5 = 439,48 T6 = 461,6 SQTratamen to = 331,8677 SQTotal = 783,4964 r=4
5.4. Um experimento para avaliar a influncia de 4 tipos de aleitamento no ganho de peso de leites foi conduzido utilizando-se o delineamento inteiramente casualizado com 4 repeties. Foram obtidos os seguintes resultados parciais: Tratamentos Totais FV Tratamento Resduo Total 1 37,2 GL 2 44,8 SQ 26,76 33,82 3 31,6 QM 4 32,8 F
Complete o quadro da ANOVA e, considerando-se = 1%, responda qual(is) o(s) melhor(es) tipo(s) de aleitamento. (Use o teste de Tukey, se necessrio) 5.5. Com o objetivo de verificar se existe diferena, no tempo mdio gasto para ir de 0100 km/h, entre 5 marcas de carro de mesma categoria, 4 carros de cada marca foram escolhidos inteiramente ao acaso da linha de produo de cada marca e avaliados em uma pista de provas apropriada. Os resultados obtidos, em segundos, foram: Marcas 3 8 7 8 6
1 12 11 11 13
2 12 10 10 11
4 12 12 10 11
5 13 14 15 13
Usando o nvel de 5% de probabilidade a. Existe de diferena significativa entre as marcas de carro quanto ao tempo mdio gasto para ir de 0-100 km/h? b. Qual(is) (so) a(s) marca(s) mais lenta(s) para ir de 0-100 km/h, pelo teste de Duncan? c. Qual(is) (so) a(s) marca(s) mais rpida(s) para ir de 0-100 km/h, pelo teste de Tukey? d. Suponha que em termos de custo final ao consumidor pode-se classificar os carros produzidos pela marca 1 como de custo alto, os produzidos pelas marcas 2 e 3 de custo mdio e aqueles produzidos pelas marcas 4 e 5 como de custo alto. Suponha tambm que este experimento tinha como objetivos verificar se existe diferena no tempo mdio para ir de 0-100 km/h entre: 1) os carros de custo alto e os demais carros; 2) entre os carros de custo mdio e os de custo alto; 3) os carros de custo mdio; e 4) os carros de
51
EST 220 Estatstica Experimental I/2008 ____________________________________________________________________ custo baixo. Utilize os testes de Scheff e de t para verificar se estas comparaes so significativas. 5.6. Quatro padarias da cidade de So Paulo, foram fiscalizadas para verificar a quantidade de bromato de potssio existente nos pes franceses que elas produzem. Com esta finalidade foi tomada uma amostra de pes, inteiramente ao acaso, de cada padaria e para cada um deles foi avaliado o teor de bromato de potssio (mg de bromato de potssio/1kg de po). O resumo da avaliao fornecido a seguir: Padaria Teor mdio Nm. de pes avaliados SQResduo = 52 Usando o nvel de 5% de probabilidade a. Pode-se concluir que existe diferena significativa no teor mdio de bromato de potssio no po entre as padarias avaliadas? b. Suponha que as padarias 1 e 2 suprem a classe social A, a padaria 3 a classe B e a 4 a classe C. Verifique, por meio de um contraste, pelo teste de Scheff e pelo teste t, se existe diferena no teor mdio de bromato de potssio entre as padarias que suprem as classes A e C. 5.7. Com os dados fornecidos a seguir oriundos de um experimento instalado no DIC com 4 repeties, para o qual o teste F da ANOVA para tratamentos foi significativo, aplicar o teste de Duncan e o teste de Tukey para se concluir qual(is) tratamento(s) apresentou(aram) maior(es) mdia(s) ao nvel de 5% de probabilidade. SQResduo = 905,6790 T1 = 813,44 T2 = 729,52 T3 = 786,32 T4 = 661,52 T5 = 755,44 T6 = 612,50 1 10 7 2 11 8 3 8 7 4 9 8
52
53
EST 220 Estatstica Experimental I/2008 _____________________________________________________________________ pode acarretar em no identificar nenhuma diferena nos efeitos dos tratamentos, quando de fato uma ou mais diferenas possam existir. No entanto, a instalao de um experimento no DBC quando o mesmo no necessrio, pode implicar na perda de eficincia do experimento, pois quando se instala um experimento no DBC com J blocos, quando na verdade o DIC seria suficiente, so perdidos (J-1) graus de liberdade para o resduo. No DBC o no de graus de liberdade para o resduo menor. Conseqente o F tabelado maior. Portanto maior dever ser a diferena entre os efeitos dos nveis do fator para que tais diferenas atinjam significncia estatstica.
Totais B1 B2 ... BJ G
Deste quadro pode-se retirar algumas informaes de interesse: n de unidades experimentais: N = I x J; Total geral: G =
i =1, j =1
I,J
ij
= Ti = B j = Y ;
i =1 j =1
Ti ; J
Bj I
G . IJ
bloco j,
54
Cap 6 Delineamento em Blocos Casualizados _____________________________________________________________________ m mdia de todas as unidades experimentais para a varivel em estudo. t i o efeito do particular tratamento i no valor observado Yij :
t i = mi m b j o efeito do bloco j no valor observado Yij :
substituindo m m i , m j e e ij por seus estimadores tem-se: = (m i m ) + (m j m )+ e ij , Yij m elevando ambos os membros ao quadrado )2 = (m i m ) + (m j m )+ e ij 2 , (Yij m
aplicando somatrio
i=1, j=1
(Y
I,J
ij
)2 = m
I,J
i =1, j =1
[(m
I,J
) + (m j m )+ e ij m
I,J I,J
i=1, j=1
(Y
I,J
ij
) = m
2
i=1, j=1
i m )2 + (m j m )2 + e ij 2 + duplos produtos (m
I,J i=1, j=1 i=1, j=1 i=1, j=1
duplos produtos
I,J
i =1, j =1
duplos produtos = 0 .
Por meio das frmulas obtidas no desenvolvimento anterior, pode-se obter os valores para as respectivas somas de quadrados. No entanto, essas frmulas so muito trabalhosas para se obter tais valores. So fornecidas a seguir, frmulas mais prticas para se obter as somas de quadrados.
55
SQTotal =
i =1, j =1
I,J
Yij
SQResduo = SQTotal - SQTratamentos - SQBlocos Estas frmulas prticas so deduzidas a partir das somas de quadrados, obtidas no desenvolvimento anterior, mediante o desenvolvimento do quadrado do binmio, aplicao dos somatrios a todos os termos e substituio de cada uma das mdias pelo quociente do total pelo n de observaes que origina cada total. As dedues so semelhantes quelas apresentadas no captulo de Delineamento Inteiramente Casualizado. O quadro da ANOVA para a anlise de um experimento instalado segundo o DBC do seguinte tipo:
FV Blocos Tratamentos Resduo Total GL (J-1) (I-1) (I-1)(J-1) IJ - 1 SQ SQBlocos SQTratamentos SQResduo SQTotal QM SQTrat
I1 SQ Re s
F QMTrat
QM Re s
(I 1)(J 1)
-
Geralmente, o que interessa na anlise de um experimento, avaliar se existe diferena entre os tratamentos, o que pode ser verificado por meio do teste F para tratamentos. As hipteses para o teste F da anlise de varincia para tratamentos so as seguintes: H 0 : m1 = m 2 =...= m I = m , o que equivale a dizer que todos os possveis contrastes entre mdias de tratamentos, so estatisticamente nulos, ao nvel de probabilidade que foi executado o teste. H a : n~ ao H 0 , o que equivale a dizer que existe pelo menos um contraste entre mdias, estatisticamente diferente de zero, ao nvel de probabilidade que foi realizado o teste. O teste F para blocos, ou seja, comparao entre blocos, geralmente desnecessria, pois ao instalar o experimento no DBC, o pesquisador utilizou os blocos para controlar uma causa de variao conhecida. Nos casos em que a variao entre blocos duvidosa, o pesquisador pode realizar o teste F para blocos, para servir como orientao para a instalao de futuros experimentos.
56
6.5. Exerccios
6.1. Os dados abaixo, se referem a um experimento instalado segundo o DBC, em que os tratamentos, 5 produtos comerciais para suprir deficincia de micronutriente em caprinos, foram fornecidos aos animais os quais foram separados em 3 grupos segundo a idade. Os resultados obtidos, expressos em ppm de micronutriente/ml de sangue, foram os seguintes: Produtos comerciais 2 3 4 86 103 116 69 79 81 61 79 79 216 261 276
Bloco 1 2 3 Totais
1 83 63 55 201
5 132 98 91 321
Pede-se proceder a ANOVA e aplicar o teste Tukey e Duncan, usando o nvel de 5% de probabilidade.
6.2. Com a finalidade de aumentar a produo de l de suas ovelhas, por meio de uma alimentao mais apropriada um criador separou 28 ovelhas de sua criao. Como as ovelhas eram de idades diferentes, dividiu-as em 7 grupos, sendo que dentro de cada um destes grupos havia 4 ovelhas de mesma idade e homogeneidade para as demais caractersticas. Dentro de cada grupo foi realizado um sorteio para distribuir ao acaso, os 4 Tipos de Alimentao (TA) s ovelhas do grupo. O experimento se iniciou logo aps as ovelhas terem sido submetidas a uma tosquia e se encerrou quando j era o momento de se realizar uma nova tosquia da qual foram obtidos os seguintes resultados, expressos em unidade de medida de l por animal: grupos 3 4 5 33 34 29 34 31 33 46 47 48 21 19 20 134 131 130
TA 1 2 3 4 Totais
1 30 29 43 23 125
2 32 31 47 25 135
6 30 33 44 21 128
7 33 29 47 22 131
Com base nas informaes anteriores, pede-se ( = 1% ): a) Qual o tipo de delineamento experimental que o criador utilizou? Justifique sua resposta. b) Existe diferena entre os tipos de alimentao fornecidos s ovelhas com relao a produo de l? c) Com base no teste Tukey, qual(is) seria(m) o(s) tipo(s) de alimentao a ser(em) recomendada(s) s ovelhas?
57
EST 220 Estatstica Experimental I/2008 _____________________________________________________________________ 6.3. Um experimento no DBC com 4 repeties forneceu os dados abaixo: Blocos Tratamento 1 2 3 4 5 Total 1 142,36 139,28 140,73 150,88 153,49 726,74 2 144,78 137,77 134,06 135,83 165,02 717,46 3 145,19 144,44 136,07 136,97 151,75 714,42 4 138,88 130,61 144,11 136,36 150,22 700,18 Total 571,21 552,10 554,97 560,04 620,48 2858,80
Para o nvel de 5% de significncia, pede-se: a) ANOVA b) Teste Tukey c) Teste Duncan d) Aplicar o teste Scheff ao contraste C = m 1 + m 2 2m 5 e) Aplicar o teste t aos contrastes C1 = m1 + m 2 2m 4 C 2 = m 2 + m 3 m1 m 4 C 3 = m1 m 2 6.4. O resumo da Anlise de Varincia de um experimento instalado segundo o Delineamento em Blocos Casualizados, para verificar se existe diferena entre 5 tipos de Levedura na produo de cerveja, fornecido a seguir: FV Blocos Tratamentos Resduo Total Totais de Tratamentos: T1 = 12,0 T2 = 25,2 T3 = 22,0 T4 = 24,0 T5 = 45,6 Ao nvel de 5% de probabilidade, pede-se: a)Existe diferena entre os 5 tipos de Levedura, na produo de cerveja? b)Pelo teste Tukey, qual(is) o(s) tipo(s) de Levedura que apresentou(aram) maior produo? c)Pelo teste Duncan, qual(is) o(s) tipo(s) de Levedura que apresentou(aram) menor produo? 6.5. Um Engenheiro-Agrcola, com o objetivo de verificar qual tipo de pneu que proporciona menor consumo de combustvel, para trabalhar em terrenos encharcados, testou 4 diferentes tipos de pneus. Como a rea que dispunha para realizar o experimento era heterognea com relao declividade, ele subdividiu a rea total em 3 sub-reas de tal forma que dentro de cada uma delas existia uniformidade com relao declividade. Aps isto, dentro de cada sub-rea realizou um sorteio ao acaso, dos tipos de pneus s unidades experimentais. Com a realizao da pesquisa, obteve-se os seguintes resultados de consumo expressos em litros/hora trabalhada. 58 GL 3 QM --4,895 F ---
Cap 6 Delineamento em Blocos Casualizados _____________________________________________________________________ Pneu Sub-reas 1 2 3 Tipo 1 30 29 25 Tipo 2 32 30 26 Tipo 3 33 31 30 Tipo 4 35 33 31
Por meio das informaes fornecidas acima, pede-se (use o nvel de 5% de significncia, quando necessrio). a)Quais foram os Princpios Bsicos da Experimentao utilizados neste experimento? Justifique sua resposta. b)Qual foi o tipo de delineamento experimental utilizado pelo Engenheiro-Agrcola? Justifique sua resposta. c)Em termos do consumo, conclua com relao aos tipos de pneus, por meio de uma anlise de varincia. d)Qual tipo de pneu que proporciona o pior consumo? Use o teste Duncan, se necessrio.
6.6. Suponha que algum solicite sua ajuda, na aplicao de testes de mdias aos dados de um experimento, instalado segundo o DBC com 4 repeties, para o qual o F da Anlise de Varincia para tratamentos foi significativo. Para tanto voc recebe as seguintes informaes: Tratamentos 1 2 3 Totais 400 440 360 SQResduo=360 = 5% C 1 = 3m 1 2m 2 2m 3 C 2 = m 1 2m 2 + m 3 C 3 = m 1 m 2 a)Obtenha a V(C2) b)Admita que ele deseja aplicar o teste de Scheff em C1 e C2. Proceda a aplicao do teste Scheff de maneira adequada conforme visto em sala de aula. c)Admita que ele deseja aplicar o teste t em C2 e C3. Proceda a aplicao do teste t de maneira adequada conforme visto em sala de aula. d)Obtenha um grupo de contrastes ortogonais a partir apenas de C3, usando o mtodo do sistema de equaes lineares. 6.7. Um pesquisador foi encarregado de verificar se havia diferena de durabilidade entre 4 tipos de microaspersores presentes no mercado, produzidos por duas fbricas diferentes, conforme quadro abaixo: Tratamentos 1 2 3 4 Microaspersor Tipo A Tipo B Tipo C Tipo nico Fabricado por gua Boa S.A. gua Boa S.A. gua Boa S.A. gua Ardente Ltda.
Desconsiderando como o experimento foi conduzido, bem como o tipo de informao usado na avaliao, considere os seguintes dados, aps uma anlise parcial dos mesmos:
59
EST 220 Estatstica Experimental I/2008 _____________________________________________________________________ F.V. Tratamentos Bloco Resduo Total G.L. 3 4 12 19 Q.M. 1760,00 ---50,00 F 35,2 Mdias dos Tratos 1 = 36 m 2 = 40 m 3 = 60 m
4 = 40 m
Com base nas informaes acima pede-se: (use =5%) a)Cada tratamento foi repetido quantas vezes? Justifique sua resposta. b)Que hiptese estaramos testando pela ANOVA? Qual a sua concluso no presente caso? c)Para responder qual o melhor microaspersor, o que deveramos fazer? Apenas comente rapidamente. d)Faa um teste ( sua escolha) para saber se h diferena entre os resultados mdios apresentados pelos microaspersores da fbrica gua Boa S.A. com o apresentado pelo microaspersor da fbrica gua Ardente Ltda. 6.8. Em um experimento com 5 variedades de batatinhas (A, B, C, D e E), em blocos casualizados, as produes, em toneladas por hectare, foram: Variedades B C D 21 22 15 27 29 11 26 24 10 25 25 12
Blocos 1 2 3 4
A 9 13 11 9
E 12 18 18 17
Para o nvel de significncia igual a 5%, pede-se: a) O quadro da ANOVA b) Aplicar o teste de Duncan c) Teste t para o contraste : C = m A + m B 2m D 6.9. Obtenha o quadro da Anlise de Varincia, proceda ao teste de mdia se necessrio e conclua para = 1% , considerando os dados do delineamento em blocos casualizados (DBC), fornecidos a seguir: T1 = 130,6 T2 = 183,4 T3 = 152,6 T4 = 185,6 T5 = 143,2
B
j =1
2 j
= 159.306,92
Y
i, j
2 ij
= 32.889,70
6.10. Um melhorista de plantas instalou um experimento visando selecionar as melhores prognies para dar continuidade ao seu programa de melhoramento. Na instalao do experimento, ele verificou que a rea a ser utilizada no era completamente homognea. Ento dividiu a rea em 4 sub-reas de tal forma que cada uma fosse completamente homognea e pudesse conter todas as prognies em teste. Aps esta diviso, as prognies foram distribudas ao acaso dentro de cada sub-rea. Na poca da colheita ele avaliou a produo de gros por planta (kg/planta), cujos resultados foram: 60
Cap 6 Delineamento em Blocos Casualizados _____________________________________________________________________ Sub-reas Prognie 1 2 3 4 5 Totais 1 2,7 2,7 2,6 2,6 2,7 13,3 2 2,8 2,5 3,2 3,1 2,8 14,4 3 2,9 2,8 3,0 2,8 2,8 14,3 4 3,3 2,4 3,5 2,5 2,5 14,2 Totais 11,7 10,4 12,3 11,0 10,8 56,2
Com base nestas informaes, pede: (utilize = 5% quando necessrio) 6.10.1. Qual delineamento experimental foi utilizado? Justifique a sua resposta. 6.10.2. Verificar se existe diferena entre as prognies com relao produo. Faa a ANOVA e aplique o teste de Duncan, se necessrio, concluindo corretamente. (Dado: SQTotal = 1,5780) 6.11. Uma nutricionista formulou dois novos tipos de dieta (A e B) para diminuir o peso de pessoas obesas. Desejando verificar qual tipo de dieta proporciona maior perda de peso, resolveu fazer um teste com os seus pacientes. Com esta finalidade, solicitou que aqueles que estivessem interessados em participar deste teste se apresentassem como voluntrios. Um grupo de 8 indivduos apresentou-se para trabalhar com o nutricionista. No entanto, a nutricionista verificou que naquele grupo de indivduos havia diferentes faixas de idade, sendo 2 indivduos pertencentes faixa infantil, 2 faixa adolescente, 2 faixa adulta e 2 faixa idosa. Com receio de que a diferena de idade dos indivduos pudesse diminuir a preciso do seu experimento, a nutricionista resolveu que cada um dos dois tipos de dieta fosse testado em cada uma das faixas de idade. Para tanto, dividiu o grupo de 8 indivduos em subgrupos de tal forma que cada subgrupo inclusse indivduos de mesma faixa de idade. Aps isso, fez a distribuio dos tipos de dieta ao acaso dentro de cada subgrupo. As perdas de peso (em Kg) obtidas por cada um dos oito indivduos so fornecidas a seguir: Faixa de Idade Adolescente 7 13 20
Dieta A B Totais
Infantil 3 7 10
Adulta 14 22 36
Idosa 8 14 22
Totais 32 56 88
Dado: SQResduo = 4,00 Com base nas informaes fornecidas pede-se: 6.11.1.Qual foi a unidade experimental utilizada? a) cada faixa de idade b) cada dieta c) cada indivduo d) todos os indivduos e) os dois tipos de dieta f) nenhuma das alternativas anteriores 6.11.2. Qual(is) foi(ram) o(s) princpio(s) bsico(s) da experimentao utilizado(s)? a) repetio e casualizao b) repetio e controle local c) casualizao e controle local 61
EST 220 Estatstica Experimental I/2008 _____________________________________________________________________ d) e) f) g) h) i) controle local repetio casualizao controle local repetio, casualizao e controle local nenhuma das alternativas anteriores
6.11.3 Qual foi o delineamento experimental utilizado? a) Delineamento em Quadrado Latino b) Delineamento Inteiramente Casualizado c) Delineamento em Blocos Casualizados d) Delineamento em Ltice e) nenhuma das alternativas anteriores 6.11.4. De acordo com o teste F da anlise de varincia para a fonte de variao dieta, pode-se concluir ao nvel de 5% de probabilidade que: a) no existe diferena entre os tipos de dieta b) o valor de F menor que um e no possvel concluir c) a dieta B possui a maior mdia d) nenhuma das alternativas anteriores 6.11.5 Qual o tipo de dieta deveria ser recomendado? Use o teste Duncan e o nvel de 5% de probabilidade, se necessrio. a) qualquer uma das dietas b) todas as dietas c) nenhuma das dietas d) a dieta B e) a dieta A f) nenhuma das alternativas anteriores 6.12. Um experimento instalado segundo o Delineamento em Blocos Casualizados produziu os seguintes resultados: Tratamentos Totais Blocos Totais Dados: 1 125 2 135 1 221 3 134 2 220 4 131 3 322 5 130 4 151 6 128 7 131
SQTotal = 2214,43 SQTratamentos = 2125,29 Com base nas informaes fornecidas, pede-se (use o nvel de significncia de 1% quando necessrio): 6.12.1. Conclua a respeito dos efeitos de tratamentos, com base na anlise de varincia. 6.12.2. Se so desejados tratamentos que propiciam menores mdias, qual(is) tratamento(s) deve(m) ser recomendado(s)? Utilize o teste de Tukey, se necessrio. Caso contrrio, justifique a sua resposta. 6.13. Quatro pesquisadores realizaram um experimento com 4 tratamentos (A, B, C e D) e 5 repeties segundo um delineamento em blocos casualizados (DBC), obtendo-se as seguintes mdias de tratamentos: 62
Cap 6 Delineamento em Blocos Casualizados _____________________________________________________________________ Tratamentos Mdias A 27,8 B 26,0 C 23,8 D 31,4
Dados: QMRes = 1,82; GLRes = 12; F calculado = 28,34 e = 5%. Os procedimentos adotados por cada um dos quatro pesquisadores foram os seguintes: - O pesquisador 1 estabeleceu, a priori, trs contrastes ortogonais com o objetivo de aplicar, separadamente a cada um deles, o teste de Scheff. Os contrastes foram os seguintes: Y1 = 3mA mB mC mD,
-
Y2 = mB + mC 2mD
Y3 = mB mC
O pesquisador 2 estabeleceu, a priori, os mesmos trs contrastes ortogonais estabelecidos pelo pesquisador 1, porm com o objetivo de aplicar, separadamente a cada um deles, o teste t O pesquisador 3 estabeleceu seis contrastes entre duas mdias (Y3 = mB mC Y4 = mA mB, Y5 = mA mC, Y6 = mA mD, Y7 = mB mD e Y8 = mC mD), com o objetivo de aplicar, separadamente a cada um deles, o teste de Tukey O pesquisador 4, aps observar os dados, estabeleceu o seguinte contraste: Y9 = mA + mB mC mD.
No entanto, os pesquisadores 1, 2 e 3, utilizando um mesmo valor para o nvel de significncia, apresentaram divergncias com relao aos resultados das anlises estatsticas para a caracterstica estudada, conforme mostrado a seguir: O pesquisador 2 obteve uma concluso diferente da encontrada pelo pesquisador 1, em relao ao contraste Y3 - O pesquisador 3 obteve uma concluso diferente da encontrada pelo pesquisador 2 em relao ao contraste Y3 Pede-se: 6.13.1 Com base na diferena das concluses encontradas pelos pesquisadores 1 e 2 em funo da utilizao de testes diferentes, marque a alternativa correta e justifique a sua resposta. a) O procedimento adotado pelo pesquisador 1 est correto e o procedimento adotado pelo pesquisador 2 est errado b) O procedimento adotado pelo pesquisador 2 est correto e o procedimento adotado pelo pesquisador 1 est errado c) Ambos os procedimentos adotados pelos pesquisadores 1 e 2 esto corretos d) Ambos os procedimentos adotados pelos pesquisadores 1 e 2 esto errados. 6.13.2. Com base na diferena das concluses encontradas pelos pesquisadores 2 e 3 em funo da utilizao de testes diferentes, marque a alternativa correta e justifique a sua resposta. a) O procedimento adotado pelo pesquisador 2 est correto e o procedimento adotado pelo pesquisador 3 est errado b) O procedimento adotado pelo pesquisador 3 est correto e o procedimento adotado pelo pesquisador 2 est errado c) Ambos os procedimentos adotados pelos pesquisadores 2 e 3 esto corretos 63
EST 220 Estatstica Experimental I/2008 _____________________________________________________________________ d) Ambos os procedimentos adotados pelos pesquisadores 2 e 3 esto errados 6.13.3. O procedimento adotado pelo pesquisador 4 foi correto? Se a sua resposta for afirmativa, aplique o teste de Scheff ao contraste Y9. Se a sua resposta for negativa, justifique a sua resposta. 6.14. Considere um experimento no delineamento em blocos casualizados, com 4 tratamentos e 3 repeties, para o qual o teste F para a fonte de variao tratamentos foi significativo ao nvel de 5% de probabilidade. Baseando-se nestas informaes, pede-se: 6.14.1 Qual a frmula geral dos contrastes a serem testados pelo teste de Tukey? Qual o nmero mximo de contrastes a serem testados pelo teste de Tukey? 6.14.2. Suponha que para este experimento, a diferena mnima significativa de Tukey foi igual a 10, ou seja = 10. Usando-se este , o seguinte resultado foi obtido para as comparaes de mdias de tratamentos
1 = 100 a m 4 = 92 ab m 3 = 88 m bc 2 = 79 m c
Pode-se observar que as mdias 1 e 4, mdias 4 e 3 e mdias 3 e 2 so estatisticamente iguais. Deste modo, pode-se concluir que as mdias 1 e 2 so tambm estatisticamente iguais? Justifique a sua resposta. 6.14.3. Caso dois outros pesquisadores realizassem o mesmo experimento e obtivessem, respectivamente 1 = 5 e 2 = 20 , pelo teste de Tukey, qual dos dois pesquisadores obteve maior preciso experimental? Justifique a sua resposta. 6.14.4. Aplique o teste de Tukey s mdias de tratamentos com base no 2 = 20 , considerando que o pesquisador 2 obteve as mesmas mdias listadas no item b, com teste F significativo. 6.14.5. Se o interesse fosse testar os quatro contrastes:
Y1 = m1 m 2 Y2 = m 1 + m 2 2m 3
Y3 = m 1 + m 2 2m 4 Y4 = m 1 + m 2 m 3 m 4 Qual(is) o(s) teste(s) visto(s) em sala de aula, que poderia(m) ser aplicado(s) a todos estes contrastes? Justifique a sua resposta.
64
Note que os nveis de uma fonte formam as linhas e os nveis da outra fonte formam as colunas Exemplo 2 - Num experimento com sunos pretende-se testar 4 tipos de rao (A,B,C,D), em 4 raas e 4 idades de animais. Sendo interesse fundamental o comportamento dos 4 tipos de rao, toma-se a raa e a idade como blocos, ou seja:
Raa Idade I1 I2 I3 R1 A B D R2 B C A R3 D A C R4 C D B
I4
Exemplo 3 - Um experimento de competio de 6 variedades de cana-de-acar em que a rea experimental apresenta gradiente de fertilidade do solo em duas direes. O 65
Cap 7 Delineamento em Quadrado Latino _____________________________________________________________________ quadrado latino possibilita a formao de blocos nas duas direes, ou seja, procedemos a um duplo controle local. O croqui seguinte ilustra a distribuio das variedades (A, B, C, D, E, F) nas parcelas.
Linhas 1 2 3 4 5 6 1 F B D A C E 2 B D F C E A Colunas 3 4 C E E A A C D F F B B D 5 D F B E A C 6 A C E B D F
Linhas 1 2 3 4 5
1 A E D C B
2 B A E D C
4 D C B A E
5 E D C B A
2o) Em seguida distribui-se ao acaso as linhas entre si, e depois as colunas, podendo-se obter um quadrado final semelhante ao apresentado abaixo. Casualizando as linhas (2, 4, 5, 1, 3) E C B A D A D C B E B E D C A C A E D B D B A E C
66
Quadrado final
em que, Yij( k ) o valor observado para a varivel em estudo referente ao k-simo tratamento,
m li cj na i-sima linha e na j-sima coluna; mdia de todas as unidades experimentais para a varivel em estudo; o efeito da linha i; o efeito da coluna j;
Admitindo-se I tratamentos, conseqentemente I linhas e I colunas, o esquema da anlise de varincia fica: FV Linhas Colunas Tratamentos Resduo Total Considerando Li = Total da linha i; Cj = Total da coluna j; Tk = Total do tratamento k; G = total geral; as somas de quadrados so dadas por: SQTotal = Yij2 C,
i, j
Exemplo 1 4 4 4 12 24
Exemplo 2 3 3 3 6 15
Exemplo 3 5 5 5 20 35
onde
C=
G2 G2 = 2 I I I
7.5. Exerccios
7.1. Num experimento de competio de variedades de cana forrageira foram usadas 5 variedades: A=CO290; B=CO294; C=CO297; D=CO299 e E=CO295, dispostas em um quadrado latino 5x5. O controle feito atravs de blocos horizontais e verticais teve por objetivo eliminar influncias devidas a diferenas de fertilidade em duas direes. As produes, em kg/parcela, foram as seguintes: Colunas 3 458(B) 524(A) 556(C) 313(E) 438(D) 2289
Linhas 1 2 3 4 5 Totais
Considerando = 5% , pede-se: a. Anlise de Varincia b. Qual a variedade a ser recomendada? Utilize teste de Tukey, se necessrio. 7.2. Em um experimento no delineamento em quadrado latino com 5 tratamentos, so dados: 1 = 50,0; m 2 = 60,0; m 3 = 47,5; m 4 = 40,0; m 5 = 52,5 m SQ Re sduo = 388,80 a. Verificar se existe efeito significativo de tratamentos, pelo teste F, e concluir para = 5% . b. Qual o tratamento deve ser recomendado nos seguintes casos: b.1. Se estivssemos avaliando a produo de uma certa cultura (em kg/ha)? b.2. Se estivssemos avaliando a perda de gros, durante a colheita, de uma certa cultura (em g/parcela)? Obs.: Utilize = 5% e o Teste de Duncan (se necessrio) 7.3. Aplicar o teste de Tukey para comparar as mdias de tratamentos, relativos ao Quadrado Latino 5x5, dados: T1 = 3024,0; T2 = 2549,0; T3 = 2349,0; T4 = 1970,0; T5 = 1734,0 SQ Re siduo = 34116,0
= 5%
7.4. O objetivo de um experimento foi estudar o efeito da poca de castrao no desenvolvimento e produo de sunos. Dispunha-se para esse estudo, de 5 matrizes da mesma raa, que foram submetidas mesma alimentao e manejo durante o perodo de gestao. Os tratamentos foram: (A) Castrao aos 56 dias de idade; (B) Castrao aos 7 dias de idade; (C) Castrao aos 36 dias de idade; (D) Inteiros; (E) Castrao aos 21 dias de idade. Foi utilizado o delineamento em quadrado latino buscando controlar a variao entre leitegadas (linhas) e a variao no peso inicial dos leites (colunas), sendo a parcela experimental constituda de um leito. Os ganhos de pesos, em kg, aps o perodo experimental (28 semanas), esto apresentados no quadro abaixo:
68
EST 220 Estatstica Experimental I/2008 _____________________________________________________________________ Leitegadas 1 2 3 4 5 Totais 1 93,0(A) 110,6(C) 102,1(B) 115,4(D) 117,6(E) 538,7 Faixas de Peso Inicial 2 3 4 115,4(C) 116,9(E) 110,2(D) 96,5(E) 108,9(B) 97,6(A) 108,6(D) 77,9(A) 102,0(E) 94,9(A) 114,0(C) 100,2(B) 114,1(B) 118,7(D) 108,8(C) 529,5 536,4 518,8 5 110,4(B) 112,0(D) 111,7(C) 118,5(E) 80,2(A) 532,8 Totais 545,9 525,6 502,3 543,0 539,4 2656,2
Considerando = 5% , pede-se: a. Faa a anlise de varincia. DADO: SQTotal = 2998,4824 b. Formule um contraste que permita avaliar o efeito mdio da prtica de castrao. c. Teste o contraste obtido no item anterior. Utilize os teste de Scheff e t. 7.5. Um experimento foi conduzido numa regio do Pantanal com o objetivo de selecionar forrageiras que garantissem uma maior produo de matria seca. Foi utilizado o delineamento em quadrado latino, buscando controlar diferenas de fertilidade em duas direes, sendo avaliadas 7 forrageiras (A, B, C, D, E, F, G). Foram obtidos os seguintes resultados parciais com a realizao do experimento: Tratamentos Totais A 30,8 B 25,2 C 19,6 D 14,0 E 13,3 F 9,8 G 8,4
Linhas Totais
1 18,9
2 19,9
3 14,5
4 18,1
5 15,6
6 17,4
7 16,7
SQTotal=72,36 SQColunas=1,27 Verificar se existe efeito significativo de forrageiras, pelo teste F, e concluir para =1%. 7.6. Um pesquisador instalou um experimento para comparar 5 tipos de bacilos (A, B, C, D, e E) usados para produo de iogurte. No momento da instalao do experimento, o pesquisador verificou que o material experimental disponvel (25 unidades de 1 litro de leite) no era completamente homogneo entre si, pois apresentavam variao quanto ao teor de gordura e grau de acidez. Para controlar estas duas fontes de variao, o pesquisador distribuiu os bacilos ao acaso s amostras de leite de tal forma que cada bacilo pudesse ser testado em todas as condies de teor de gordura e grau de acidez. O quadro dado a seguir ilustra a distribuio dos bacilos s amostras de leite bem como o volume (em ml) de iogurte produzido:
69
Cap 7 Delineamento em Quadrado Latino _____________________________________________________________________ Teor de Gordura 1 2 3 4 5 Totais TA = 3395 1 450 A 750 C 750 D 650 E 750 B 3350 Grau de Acidez 2 3 4 620 680 620 E C D 990 750 660 B E A 910 690 990 C A B 890 835 850 D B C 720 850 770 A D E 4130 3805 3890 TC = 4080 TD = 3940 5 780 B 830 D 760 E 875 A 890 C 4135 Totais 3150 3980 4100 4100 3980 19310
TB = 4345
TE = 3550
Com base nas informaes fornecidas, pergunta-se: 7.6.1. Qual foi a unidade experimental utilizada? 7.6.2. Quais foram os tratamentos em teste? 7.6.3. Quantas vezes o princpio do controle local foi utilizado neste experimento? 7.6.4. Qual foi o Delineamento experimental utilizado nesta pesquisa? 7.6.5. Usando os dados experimentais fornecidos anteriormente e o teste F para testar a fonte de variao bacilos, pode-se concluir que ao nvel de 5% de probabilidade que a) existe pelo menos um contraste entre mdias de bacilos estatisticamente diferente de zero b) todos os possveis contrastes entre mdias de bacilos so estatisticamente nulos c) o bacilo A o melhor d) o bacilo B o melhor e) o bacilo C o melhor f) nenhuma das alternativas anteriores 7.6.6. O teste de Tukey indica que o(s) bacilo(s) que proporciona(m) maior(es) mdia(s) de produo de iogurte (so) (use o nvel de 5% de significncia) foi(ram) a) o bacilo A b) o bacilo B c) o bacilo C d) o bacilo D e) o bacilo E f) os bacilos A, B e C g) os bacilos B, C e D h) os bacilos C, D e E i) os bacilos A, D e E j) nenhuma das alternativas anteriores
70
8. Experimentos Fatoriais
8.1. Introduo
Experimentos fatoriais so aqueles em que se estudam simultaneamente dois ou mais fatores, cada um deles com dois ou mais nveis. O fatorial um tipo de esquema, ou seja, uma das maneiras de organizar os tratamentos e no um tipo de delineamento, que representa a maneira pela qual os tratamentos so distribudos s unidades experimentais. Na verdade, os experimentos fatoriais so montados segundo um tipo de delineamento experimental, como por exemplo: o DIC e o DBC. Nos experimentos fatoriais, os tratamentos so obtidos pelas combinaes dos nveis dos fatores. Num experimento fatorial completo, cada nvel de um fator combina com todos os nveis dos outros fatores. A principal aplicao de experimentos fatoriais quando se quer saber sobre o efeito de diversos fatores que influenciam na varivel em estudo e o relacionamento entre eles. A simbologia comumente utilizada, para experimentos fatoriais indicar o produto dos nveis dos fatores em teste. Por exemplo: Experimento Fatorial 2x4x6. O produto 2x4x6 informa que no experimento foram testados simultaneamente 3 fatores. O primeiro possui 2 nveis, o segundo 4 nveis e o terceiro 6 nveis. Quando o nmero de nveis igual para todos os fatores, pode-se utilizar a seguinte simbologia: nF , em que F o nmero de fatores n o nmero de nveis de cada fator. Por exemplo: Experimento Fatorial 43. A potncia 43 informa que o experimento tem 3 fatores com 4 nveis cada um.
71
EST 220 Estatstica Experimental I/2008 ___________________________________________________________ Suponha os seguintes resultados fictcios, para a varivel altura de plantas (cm), deste experimento, nas seguintes situaes: 1) No h interao Espaamentos E1 E2 Variedades V1 V2 V3 8 10 12 6 8 10
Quando no h interao as diferenas entre os resultados dos nveis de um fator so estatisticamente iguais para todos os nveis do outro fator.
12 10 8 Altura de plantas (cm) 6 4 2 0 V1 V2 V3
E1 E2
Quando h interao as diferenas entre os nveis de um fator dependem dos nveis do outro fator.
10 9 8 7 6 Altura de 5 plantas (cm) 4 3 2 1 0 V1 V2 E1 E2
V3
72
Cap 8 Experimentos Fatoriais ____________________________________________________________ A1 Repetio B1 B2 ... Y111 Y121 ... 1 Y112 Y122 ... 2 ... ... ... ... Y11K Y12K ... K Y11 Y12 ... Total BJ Y1J1 Y1J2 ... Y1JK
Y1J
A2 B1 B2 ... Y211 Y221 ... Y212 Y222 ... ... ... ... Y21K Y22K ... Y21 Y22 ...
AI B1 B2 ... YI11 YI21 ... YI12 YI22 ... ... ... ... YI1K YI2K ... YI1 YI2 ...
Deste quadro, pode-se tirar algumas informaes que posteriormente sero teis na anlise de varincia:
-
k =1 J,K
j =1,k =1 I,K
ijk
= Yi = Y j
i =1,k =1
ijk
i =1, j =1,k =1
Yijk = A i = B j = YL
i =1 j =1
Ai JK Bj
IK
Pode-se montar um quadro auxiliar contendo os totais de tratamentos, cujos valores so obtidos pela soma de todas as repeties para o tratamento em questo. Este quadro facilita o clculo das somas de quadrados devido aos fatores A e B, e da interao entre eles. Para a situao citada, o quadro de totais de tratamentos do seguinte tipo:
Fator B B1 B2 ... BJ Y11. Y12. ... Y1J. Y21. Y22. ... Y2J. ... ... ... ... YI1. YI2. ... YIJ. B1 B2 ... Bj
Totais A1 A2 ... AI G
73
m
i
repetio da combinao do i-simo nvel do fator A com o j-simo nvel do fator B; a mdia de todas as unidades experimentais para a varivel em estudo; o efeito do i-simo nvel do fator A no valor observado Yijk ; o efeito do j-simo nvel do fator B no valor observado Yijk ; do fator B; o erro associado a observao Yijk .
Para um experimento fatorial instalado segundo o DBC, com K blocos, o modelo estatstico seria: Y = m + + + ( )ij + + e ijk i j k ijk em que, k o efeito do k-simo bloco na observao Yijk .
74
I,J,K
SQTotal =
i=1, j=1,k =1
2 Yijk C
SQTrat =
J
i=1, j=1
I,J
Yij2 . K
SQA =
JK C
i=1
A i2
SQB =
IK
j=1
B2 j
O quadro abaixo apresenta como seria a anlise de um experimento fatorial, com 2 fatores A e B, com I e J nveis, respectivamente, e K repeties (ou blocos), instalado segundo o DBC.
FV A B AxB (Trat) Blocos Resduo Total GL (I-1) (J-1) (I-1)(J-1) (IJ-1) K-1 n2=(IJ-1)(K-1) IJK - 1 SQ SQA SQB SQAxB (SQTrat) SQBlocos SQRes SQTotal QM F QMAxB QMRe s Ftab, [(I-1)(J-1); n2] -
(I 1)(J 1)
SQ Re s (IJ 1)(K 1) -
SQAxB
Nesta situao,
SQBlo cos =
2 Wk C IJ k =1 I,J
em que,