Vous êtes sur la page 1sur 22

ROTEIRO ESTATSTICO

Planeamento de Experincias e Investigao

CONTEDOS
Introduo O planeamento de experincias A Anlise de Varincia Testes de comparao mltipla e contrastes Modelos lineares generalizados Anlise de regresso Multicolinearidade Aplicabilidade do R nos MLG Concluso e futuros trabalhos Bibliografia

Introduo
O que se espera com a realizao de uma experincia? determinar as principais causas de variao de uma resposta medida, encontrar as condies que do origem a uma resposta mxima ou mnima, comparar as respostas obtidas em diferentes configuraes de variveis controlveis, obter um modelo matemtico, a fim de prever as futuras respostas.

Objetivos
Incurso sobre as tcnicas estatsticas focadas na UC

Produo de um roteiro de fcil leitura


Conceitos mais relevantes em cada uma das tcnicas

Planeamento de Experincias
Teve origem com os trabalhos de Fisher no inicio do sc. XX Fisher introduziu 3 conceitos : randomizao, aleatorizao e Blocking (agrupamento)

O planeamento foi abraado por outros estatsticos : Box, Cox, Wilson, Cochran, Bose, Yates,etc.

Princpios bsicos do Planeamento de Experincias:


Utilizar o nosso conhecimento no estatstico do problema

Manter o planeamento o mais simples possvel


Reconhecer a diferena entre significncia prtica e estatstica

As experincias normalmente so interativas/sequenciais

Passos a percorrer pelo investigador


Antes do planeamento propriamente dito, devemos identificar e definir o problema (o que pretendemos estudar), escolher os factores e nveis e seleccionar a varivel-resposta; Escolher qual o plano experimental que mais se adequa ao nosso problema; Levar ento a cabo a nossa experincia nas melhores condies; Analisar estatisticamente os resultados, i.e, recolher os dados e trabalh-los com as tcnicas apropriadas; Elaborar as concluses ou recomendaes possveis;

A Anlise de Varincia
Desenvolvida por Fisher O objetivo a comparao de mais do que duas mdias

No deve ser usado o teste t-student para este efeito para minimizar os erros que se acumulam
Existem vrios modelos quanto ao n de fatores: - Anova 1 fator - Anova 2 fatores - Anova 3 fatores ou mais

Quanto forma como os grupos so constituidos : - Anova de efeitos fixos - Anova de efeitos aleatrios Um estudo de Anlise de Varincia pode ser executado mo e tambm atravs de software apropriado

O porqu da Anova?
Permite-nos determinar se as diferenas entre mdias so apenas amostrais ou populacionais (se so estatisticamente diferentes)

O modelo:

Em que valores observados em cada grupo - mdia geral parmetro para o tratamento termos residuais (diferena entre o valor observado e o modelo ajustado erro/resduo) - refere-se ao grupo refere-se observao dentro do grupo

Pressupostos da Anova
Para se poder conduzir um estudo de anlise de varincia, necessrio que os seguintes pressupostos se verifiquem:
Os grupos de observaes devem ser independentes entre si Cada grupo de observaes deve seguir uma distribuio Normal

Deve existir homogeneidade de varincias

O modelo de efeitos fixos


Hipteses a testar H0 : 1= 2= = k = H1 : i j para pelo menos um par (i,j) Representao Yio soma total das observaes do i-simo tratamento Yimdia das observaes do i-simo tratamento ymdia global das observaes

Yio= Yi = Yoo= y =

=1 =1

, i=1,2,,k
=1

, n=

=1

A variabilidade total pode ser expressa como uma partio:


k i=1 ni 2 j=1(yij y )

k i=1

ni j=1(yi

y )2

=1

=1(

)2

Teste de comparao mltipla


Utilizados quando ocorre a rejeio da hiptese nula na Anova Procura identificar quais os tratamentos que diferem mais uns dos outros Os primeiros trabalhos foram desenvolvidos por Tuckey e Scheff na dcada de 1950 A sua aplicabilidade depende por exemplo das dimenses das amostras Tm potncias e rigor diferentes

Os mais utilizados Student Neuman Keuls (SNK) Tukey Honestly Significant Difference (HSD ou Tukey) Fisher Protected Least Significant Difference (LSD) Duncan Multiple Range Test (Duncan) Teste de Ryan Teste de Peritz Teste de Scheff Teste de Dunnett Correco de Bonferroni sequencial Teste T3 de Dunnet (rank based) outros

Modelos lineares generalizados


Constituem uma alternativa quando os dados no respeitam os pressupostos da normalidade e da homocedasticidade So constitudos por 3 componentes : - aleatria - sistemtica - funo de ligao As funes de ligao cannica definem se os MLG so modelos discretos ou contnuos

Modelos discretos : Regresso logistica Poisson Dose resposta Modelos continuos Normal Gama Normal inversa

Anlise de Regresso
Tenta relacionar a relao existente entre um conjunto de variveis preditoras e uma varivel resposta

Tem por objetivos: Predio


Seleo de variveis Estimao de parmetros Inferncia

A importncia da Multicolinearidade
A existncia de multicolinearidade entre as variveis compromete os resultados do estudo A multicolinearidade pode ser detetada atravs: - por um valor elevado de 2 - sinais dos coeficientes do modelo diferentes do esperado - identificao de correlao entre as variveis - observao do comportamento dos coeficientes perante retirada/colocao de variveis

A multicolinearidade pode ser minimizada : Se retirarmos a(s) varivel(ies) correlacionada(s) Se aumentarmos a amostra Testes para estudar a multicolinearidade: Teste de Ferrar & Glauber Teste VIF Teste Tolerance

Aplicabilidade do R nos MLG


Levmos a cabo um pequeno estudo no qual se pretendia determinar se a altura das rvores era fator determinante para a existncia de ninhos de uma espcie de aves Crimos um MLG para esse efeito, apenas com o fator altura Concluimos que quanto menor era a altura da rvore menor era a probabilidade de encontrar um ninho da espcie Fregata magnificens

Concluses e trabalhos futuros


Muito ficou por dizer mas muitas coisas importantes foram ditas Percorremos vrias tcnicas estatsticas salientando os seus aspetos mais relevantes e que esperamos terem despertado a curiosidade para trabalhos futuros Concluimos que alguns dos procedimentos se fazem sem recurso a software com relativa facilidade

Ficmos ansiosos por poder desenvolver estes temas numa prxima oportunidade

Vous aimerez peut-être aussi