Académique Documents
Professionnel Documents
Culture Documents
Outubro/2007
Autores :
Marcus Antonio Viana Duarte
Tatiana Meola
1. Planejamento Experimental 1
1.1. Introduo 1
1.1.1. Tcnicas Para Definio da Seqncia de Ensaios 2
1.1.2. Etapas do Planejamento Experimental e Anlise de Resultados 4
1.2. Conceitos Bsicos de Estatstica 5
1.2.1. Experimentos Aleatrios 5
1.2.2. Espao Amostral e Eventos 6
1.2.3. Freqncia Relativa 6
1.2.4. Probabilidade 7
1.2.5. Variveis Aleatrias 8
1.2.6. Medidas de Tendncia Central 10
1.2.7. Medidas de Disperso 11
1.2.8. Momentos, Assimetria e Curtose. 13
1.2.9. Desigualdade de Chebyshev 15
1.2.10. Teorema do Limite Central 16
1.2.11. Distribuies Caractersticas de Amostragens 17
Distribuio Normal 17
Distribuio Chi-quadrado 2 18
Distribuio t de Student 20
Distribuio F de Snedcor 21
1.2.12. Estimadores 22
Propriedades dos Estimadores 23
1.2.13. Intervalos de confiana. 25
Intervalo de Confiana para a Mdia 25
Varincia conhecida 25
Varincia Desconhecida 27
Diferena entre duas mdias (a - b ). 28
Varincias Conhecidas 28
Varincias Desconhecidas 29
Intervalo de Confiana para Proporo 30
Intervalo de confiana para a diferena entre propores 31
Intervalo de confiana para a varincia (2) 31
1.3. Testes de Hipteses 32
1.3.1. Tipos de Erros 34
1.3.2. Procedimento geral de teste 35
1.3.3. Teste para uma mdia 36
1.3.4. Teste para uma proporo 37
1.3.5. Decises e poder 39
1.4. Comparao entre dois tratamentos 39
1.4.1. Diferena entre mdias de dois grupos 39
Erro padro - assumindo desvios padres iguais 40
I.C. para a diferena entre mdias assumindo desvios padro iguais 40
Teste para a diferena das mdias 40
I.C. para diferena de mdias - desvios padro diferentes 41
1.4.2. Comparando propores 41
Intervalo de confiana para a diferena em propores 41
Teste para a diferena de duas propores 42
2. Comparaes entre Mais de dois Tratamentos 43
2.1. Introduo 43
2.1.1. Objetivo 43
2.1.2. Pressupostos 43
2.1.3. Hipteses 43
2.1.4 Notao 44
2.1.5 Modelo 44
2.1.6. Estatstica do Teste 45
2.1.7. Anlise 45
2.1.8. Tabela de ANOVA 46
2.2. Teste de Normalidade 47
2.2.1 - Teste de Kolmogorov-Smirnov 47
2.2.2 Teste de Shapiro-Wilk 50
2.2.3 - Teste DAgostino-Pearson 52
2.3. Teste de Homocedasticidade 54
2.3.1. Teste de Hartley 54
2.3.2. Teste de Cochran 55
2.3.3. Teste de Bartlett 55
2.4. Teste de Kruskal-Wallis 56
2.4.1 Pressupostos 56
2.4.2 Limitaes 56
2.4.3 O Teste 56
3. Blocos Aleatorizados e Planejamentos Fatoriais com Duas Classificaes 59
3.1. Testes de Hiptese de Dados Emparelhados 59
3.2. Blocos Aleatorizados 60
3.3. Efeitos de Tratamentos: Planejamento Aleatorizado por Nveis 61
3.3.1. Anlise de um modelo de efeitos fixos 63
3.3.2 Comparao das mdias individuais dos tratamentos 66
3.3.3 Anlise de um modelo de efeitos aleatrios 70
3.4. Efeitos de Blocos 71
3.4.1. Planejamento por Nveis Completo Aleatorizado por Blocos 71
3.4.2. Planejamento Por Nveis Incompleto Aleatorizados Por Blocos 74
4. Planejamentos com Mltiplos Blocos 77
4.1. Planejamentos Quadrados Latinos 77
4.2. Planejamento Quadrado Greco-Latino 80
5. Planejamentos Fatoriais: Modelos Empricos 83
5.1. Planejamento Fatorial Completo 22* 83
5.1.1. Clculo dos efeitos 85
5.1.2. Interpretao geomtrica dos efeitos 86
5.1.3. Interpretao dos Resultados de um planejamento 22 87
5.1.4. Codificao dos fatores 88
p
5.2. Experimentos Fatoriais Fracionados 2kResoluo 88
1. Planejamento Experimental
1.1. Introduo
O planejamento experimental, tambm denominado delineamento experimental,
representa um conjunto de ensaios estabelecido com critrios cientficos e estatsticos,
com o objetivo de determinar a influncia de diversas variveis nos resultados de um
dado sistema ou processo (Button, 2005). Com isso, objetiva a determinao do nmero
ideal de experimentos que leve obteno de resultados com um dado grau de
confiabilidade.
Esse objetivo maior pode ser dividido em outros objetivos de acordo com o
propsito dos ensaios:
a. determinar quais variveis so mais influentes nos resultados;
b. atribuir valores s variveis influentes de modo a otimizar os resultados;
c. atribuir valores s variveis influentes de modo a minimizar a variabilidade dos
resultados;
d. atribuir valores s variveis influentes de modo a minimizar a influncia de
variveis incontrolveis;
A utilizao das tcnicas estatsticas de planejamento experimental possibilita:
a reduo do nmero de ensaios sem prejuzo da qualidade da informao;
o estudo simultneo de diversas variveis, separando seus efeitos;
a determinao da confiabilidade dos resultados;
a realizao da pesquisa em etapas, num processo iterativo de acrscimo de novos
ensaios;
a seleo das variveis que influem num processo com nmero reduzido de
ensaios;
a representao do processo estudado atravs de expresses matemticas;
a elaborao de concluses a partir de resultados qualitativos.
O planejamento experimental uma ferramenta essencial no desenvolvimento de
novos processos e no aprimoramento de processos em utilizao. Um planejamento
adequado permite, alm do aprimoramento de processos, a reduo da variabilidade de
resultados, a reduo de tempos de anlise e dos custos envolvidos. (Button, 2005)
No que se refere ao projeto de produtos, o planejamento experimental permite a
avaliao e comparao de configuraes (projetos) distintas, avaliao do uso de
1
materiais diversos, a escolha de parmetros de projeto adequados a uma ampla faixa de
utilizao do produto e otimizao de seu desempenho. Os conceitos sobre
planejamento experimental podem ser resumidos em trs termos muito empregados
atualmente: qualidade, produtividade e competitividade.
2
Por exemplo, ao se definir para o caso do exemplo anterior (influncia da presso
sobre a velocidade de reao) trs valores para a presso e quatro rplicas para cada
valor de presso, teremos doze ensaios, como mostrado na Tabela 1.
Tabela 1
Presso Nmero dos Ensaios
p1 1 2 3 4
p2 5 6 7 8
p3 9 10 11 12
3
ao acaso a seqncia como cada corpo-de-prova ser ensaiado (primeiramente pelo
penetrador no. 1 ou vice-versa).
4
um conhecimento profundo dos instrumentos, equipamentos e mtodos de controle e
monitoramento;
6. Anlise dos resultados, com o uso de mtodos estatsticos, a fim de que as concluses
estabelecidas sejam objetivas. Destaque-se que esses mtodos no permitem afirmar se
uma dada varivel apresenta ou no um determinado efeito: eles apenas garantem a
confiabilidade e a validade dos resultados, de modo que se possa determinar o erro
associado nas concluses, de acordo com um dado grau de confiana previamente
estabelecido;
7. Elaborao das concluses e recomendaes a partir da anlise dos resultados.
As concluses e recomendaes permitiro que decises sejam tomadas a respeito
do processo em estudo. Uma documentao extensa, com o uso de grficos e tabelas
permite que se apresentem os resultados obtidos, a anlise efetuada, bem como futuras
repeties do procedimento empregado.
5
1.2.2. Espao Amostral e Eventos
O conjunto formado por todos os possveis resultados de um processo aleatrio
denominado espao amostral (S).
Exemplo1: Lanamento simultneo de trs moedas e o registro das faces obtidas. Para
este experimento o espao amostral :
S = {KKK; KKC; KCK; CKK; KCC; CKC; CCK; CCC}em que , K = cara e C =
coroa.
Exemplo 2: Processo aleatrio: Verificar a vida til de uma lmpada.
S = {x R : 0 x 24 meses}
Exemplo 3: Processo aleatrio: Verificar a cor das flores de uma planta de feijoeiro.
S = {branca; roxa; amarela}.
Qualquer sub-conjunto do espao amostral (S) denominado evento. O evento A:
exatamente duas caras obtidas no lanamento de uma moeda, representado pelo
conjunto:
A = { KKC; KCK; CKK }
Uma vez que os eventos podem ser interpretados como conjuntos, a eles podemos
aplicar as operaes empregadas na teoria de conjuntos. Assim: Se A e B forem
eventos:
A B ser o evento que ocorrer se, e somente se, A ou B (ou ambos)
ocorrerem.
A B ser o evento que ocorrer se, e somente se, A e B ocorrerem.
A ser o evento que ocorrer se, e somente se, A no ocorrer.
A e B so mutuamente excludentes se no puderem ocorrer juntos, ou seja, A B =
, onde indica o evento vazio (nenhuma ocorrncia).
6
3) fA = 0 se, e somente se, A nunca ocorrer nas n repeties
4) Se A e B forem mutuamente excludentes e se fAB for a frequncia relativa
do evento A B, ento fAB = fA + fB.
1.2.4. Probabilidade
A chamada definio clssica de probabilidade de: Dado um conjunto de N eventos
equiprovveis, a probabilidade de ocorrncia de um determinado evento A, dada pela
razo:
n
P( A) =
N
onde:
n o nmero de eventos de interesse
N o nmero total de eventos
As propriedades bsicas da probabilidade de A so:
1. 0 P(A) 1
2. P(S) = 1
3. Se A e B forem mutuamente excludentes: P(A B) = P(A) + P(B)
A escolha das probabilidades acima , obviamente, sugerida, pelas correspondentes
caractersticas da freqncia relativa.
Pode-se mostrar que os nmeros P(A) e fA so prximos um do outro quando fA for
baseado em um grande nmero de repeties.
Com base nas propriedades da probabilidade e das operaes conhecidas da teria
dos conjuntos, pode-se demonstrar os seguintes teoremas:
Teorema 1: P() = 0.
Teorema 2: Para um evento A qualquer, P(A) = 1 P(A).
Teorema 3: Se A e B so dois eventos quaisquer, ento, P(A B) = P(A) + P(B) -
P(A B).
Teorema 4: Se A, B e C forem trs eventos quaisquer, ento, P(A B C) = P(A)
+ P(B) + P(C) - P(A B) - P(A C) - P(B C) + P(A B C).
7
Existem vrios experimentos aleatrios para os quais os resultados possveis so
igualmente provveis. Entretanto, muitos experimentos no apresentam esta
caracterstica, a qual deve, portanto, ser cuidadosamente testada e justificada.
Exemplo: Um dado equilibrado lanado, a probabilidade do evento A = {resultado
maior do que 4}, o nmero de resultados favorveis a A, que so dois resultados, sair
os nmeros 5 e 6, e o nmero de resultados possveis de todo o espao amostral 6.
Ento:
nmero de resultados favorveis a A
P( A) = (1.1)
nmero de resultados possveis em todo o espao amostral
2 1
P( A) = =
6 3
8
incontrolveis. A existncia deste erro caracteriza a varivel de resposta como sendo
uma varivel aleatria (V.A.), que pode ser discreta se apresentar um nmero finito de
valores possveis, ou contnua, se estiver dentro de um intervalo de valores.
A probabilidade de uma varivel aleatria x dada pela sua distribuio de
probabilidade. Caso a varivel seja discreta, essa distribuio uma funo
probabilidade p(x), caso seja contnua, passa a ser denominada funo densidade de
probabilidade f(x) (f.d.p).
Na figura 1, representa-se p(x), para uma distribuio discreta, onde a funo
representa a probabilidade P da distribuio.
Na figura 2, mostrada f(y), sendo P representada pela rea sob a curva num dado
intervalo. Juntamente com cada figura, apresentam-se as propriedades de cada uma das
probabilidades em cada caso.
9
Observaes:
9 f(x), a funo densidade de probabilidade, no probabilidade. Somente
quando for integrada entre dois limites ela produzir uma probabilidade, que
ser a rea sob a curva y = f(x) entre x = a e x =b, sendo a < b.
x0
9 P( x = x0 ) = f ( x)dx = 0
x0
= x p( x) , se x discreta.
todos y
(1.4)
= x f ( x) dx , se x contnua.
Pode-se definir como o valor mdio esperado para um nmero elevado de ensaios,
ou seja E(X), tambm denominado operador do valor esperado (Bendat, 1986).
Exemplo: Para a varivel aleatria contnua definida por:
f ( x) = 0 para x<0
x
f ( x) = para 0 x 2
2
f ( x) = 0 para x>2
tem-se:
0 2x2 4
E( X ) = xf ( x)dx = 0dx + dx + 0dx = unidade
0 2 3
2
2
Em particular, para f(x) = x , o valor esperado para esta funo dado por:
E(x 2 ) = x f ( x) dx = 2x
2
(1.5)
10
1.2.7. Medidas de Disperso
A varincia 2 representa a disperso de uma distribuio e definida como:
= (x )
2 2
f ( x) dx , se x for contnua. (1.7)
2 = E[( x ) 2 ] (1.8)
Tambm se pode definir um operador de varincia V(x) igual a:
V ( x) = E[( x ) 2 ] = 2 (1.9)
A partir dos parmetros m, s2 e c (constante), tm-se as seguintes propriedades:
1. E(c) = c 7. E(y1 + y2) = E(y1) + E(y2) = 1 + 2
2. E(y) = 8. V(y1 + y2) = V(y1) + V(y2) + 2Cov(y1 y2)
3. E(c y) = c E(y) = c 9. V(y1 - y2) = V(y1) + V(y2) 2Cov(y1 y2)
4. V(c) =0 10. V(y1 y2) = V(y1) + V(y2) = 12 + 22
5. V(y) = 2 11. E(y1 y2) = E(y1) E(y2) = 1 2
6. V(c y) = c V(y) = c
2 2 2
y E ( y1 )
12. E 1
y2 E ( y2 )
iguais a 12 e 22 .
No caso das propriedades 10 e 11, assume-se que essas variveis sejam
independentes.
O parmetro covarincia ( Cov(x,y) ) representa a associao linear que existe entre as
variveis x e y. A covarincia, a qual mede o grau de disperso conjunta de duas
variveis aleatrias, dada por:
cov(x, y ) = E[( x x )( y y )]
11
E ( XY ) = ( xy)dxdy (1.10)
que a soma corrigida dos quadrados das observaes (xi), ou seja, a soma dos
quadrados das diferenas x1 x , x2 x , x3 x , K, xn x . Como a somatria dessas
diferenas igual a zero, somente n-1 elementos so independentes. Assim, SS tem n-1
graus de liberdade, ou = n-1, de modo que:
SS
E = 2
12
1.2.8. Momentos, Assimetria e Curtose.
Momentos
Se x1; x2; . . . ; xn so os n valores assumidos pela varivel X, define-se a
quantidade:
n
x r + x2r + L + x nr xrr
X = 1
r
= i =1
(1.13),
n n
como o momento de ordem r em relao a origem. Nota-se que o primeiro momento em
relao origem ( X 1 ) a mdia de X.
O momento de ordem r em relao a uma origem k, qualquer, dado por:
n
( xi k ) r
i =1
M r' (k ) = (1.14)
n
O momento de ordem r em relao mdia X dado por:
n
( xi X ) r (1.15)
i =1
M r' ( X ) =
n
onde:
xi o ponto mdio da i-sima classe
Fi = freqncia absoluta da i-sima classe.
13
distribuio assimtrica direita ou assimtrica positiva. Se o inverso ocorre, diz-se
que ela assimtrica esquerda ou negativa.
O coeficiente de assimetria (Cs) dado por:
M 3'
Cs = (1.17)
( 2 )1,5
14
Coeficiente de Curtose
Curtose o grau de achatamento de uma distribuio, considerado usualmente em
relao distribuio normal, que ser detalhada na seo 1.2.11. A distribuio que
tem um pico relativamente alto chamada leptocrtica, enquanto a distribuio que
possui o topo achatado denominada platicrtica e a distribuio que no muito
pontiaguda, nem muito achatada, como acontece com a distribuio normal
denominada mesocrtica. O coeficiente de curtose dado por:
M 4'
Ck = (1.20)
( 2 ) 2
Distribuio Platicrtica
15
2
x p(x)dx x x p(x )dx
2 (1.22)
x2
Pr ob[ x ] =
x p (x )dx (1.24)
2
Substituindo x por x - , 2 ser substitudo por 2 e a desigualdade de Chebyshev
pode ser escrita como:
x2
Pr ob[ x x ] (1.25)
2
Fazendo = c, uma constante real vezes o desvio padro, chega-se forma final da
desigualdade de Chebyshev:
Pr ob[ x x c ]
1
(1.26)
c2
16
1.2.11. Distribuies Caractersticas de Amostragens
Distribuio Normal
Uma das distribuies de amostragem mais empregadas em tcnicas estatsticas para
modelar experimentos aleatrios com nmero de rplicas elevado a distribuio
normal f(x) ou distribuio de Gauss, definida para uma varivel aleatria x.
a mais importante das distribuies de probabilidades contnuas, pois a maioria
delas segue esta distribuio, aliado ao fato da facilidade e boa preciso que obtida na
aproximao de outras distribuies para a normal, e o Teorema do Limite Central
(TLC) que a base das estimativas e testes de hipteses, realizados sobre a mdia de
uma populao qualquer, que garante que a distribuio amostral das mdias segue uma
distribuio normal, independentemente da distribuio da varivel em estudo (Silva,
2005).
A funo densidade probabilidade normal dada por:
2
1 x
1
f ( x) = e 2 (1.28)
2
17
9 As trs medidas de posio, mdia, mediana e moda se confundem no ponto de
mximo da curva (x = )
9 Fica perfeitamente definida conhecendo-se a mdia e o desvio padro
9 Tem dois pontos de inflexo em x =
9 assinttica em relao ao eixo das abicissas
Sendo a equao (1.28) uma funo densidade probabilidade (f.d.p), a rea
compreendida entre a curva e o eixo x igual a 1, ou seja,
f ( x)dx = 1 . Portanto, a
b
rea sob a curva entre os pontos a e b dada por
a
f ( x)dx = 1 representa a probabilidade
Distribuio Chi-quadrado 2
Uma distribuio de amostragem bastante empregada a chi-quadrado, ou
distribuio 2:
18
Se z1, z2, z3,...., zk so variveis aleatrias, normalmente e independentemente
distribudas, com = 0 e 2 = 1 [NID(0,1)], ento:
k2 = z12 + z 22 + ..... + z k2
onde k2 uma varivel aleatria que segue a distribuio chi-quadrado com k graus de
liberdade. A funo densidade de chi-quadrado :
1
( 2 ) ( k / 2)1 e
2
f ( 2 ) = /2
, 2 > 0 (1.29)
k
2 k / 2
2
onde (n) a funo gama. Para n inteiro positivo, (n) = (n-1)!
A distribuio chi-quadrado assimtrica e distorcida, com = k e 2 = 2k.
Seja uma distribuio normal, onde x1, x2, ..., xn, representam uma amostra retirada de
uma distribuio N(, 2). Tem-se que:
n
SS
( xi x ) 2
i =1
= n21 (1.30)
2
2
19
Distribuio t de Student
x
Viu-se que a varivel z = ~ N(0; 1). De modo semelhante, pode-se
demonstrar que:
x
z= ~ N(0; 1)
(1.31)
n
Suponha que o parmetro em 1.31 seja substitudo por seu estimador no
tendencioso:
s 2
=
( xi x ) 2
(1.32)
n 1
Assim, a equao 1.31 ficar:
x
t=
s (1.33)
n
Pode-se demonstrar que a varivel t, segue uma distribuio t de student com k = n
1 graus de liberdade, cuja funo densidade probabilidade :
k +1 k +1
2 2 2
f ( x) = 1 + x (1.34)
k k
k
2
Esperana: E(t) = 0;
k
Varincia: V (t ) =
k+2
Caractersticas:
9 simtrica em relao ao ponto x = 0 (mdia)
9 Se k tende para infinito, t tende para z, como pode ser observado na figura abaixo.
20
Distribuies t de student com 5 e 30 graus de liberdade e distribuio normal
padronizada.
Distribuio F de Snedcor
u2 u
Fu ,v = (1.36)
v2 v
segue a distribuio F, com u graus de liberdade para o numerador e v para o
denominador.
A distribuio de probabilidade de F dada por:
u/2
u + v u
F (u / 2)1
h( F ) = 2 v 0<F<
(u + v ) / 2 (1.34)
u v u
F + 1
2 2 v
21
Por exemplo, suponha duas populaes com distribuio normal e varincias
idnticas. Se retirarmos uma amostra de cada populao, respectivamente x11, x12, ..., x1n
e x21, x22, ..., x2n, com n1-1 e n2-1 graus de liberdade, ento:
S12
Fn1 1,n2 1
S 22
onde S12 e S 22 so as varincias das amostras. Ou seja, a razo das varincias das
amostras segue uma distribuio F.
Caso 12 22 , tem-se:
S12
12 S12 S 22
F= pois (n1 1) n21 1 e (n2 1) n22 1
S 22 12 22
22
1.2.12. Estimadores
Estimador
Consideremos uma amostra (x1; x2; x3; ... ; xn) de uma varivel aleatria que deve
descrever uma caracterstica de interesse da populao. Seja um parmetro que
desejamos estimar, como por exemplo a mdia = E(x) ou a varincia 2 = V (x). Um
estimador, , do parmetro uma varivel aleatria, que funo das observaes x1;
x2; x3; ... ; xn.
Assim,
22
n
xi
i =1
x= um estimador da mdia populacional
n
n
( xi x ) 2
i =1
s2 = um estimador da varincia populacional 2
n 1
Estimativa
Estimativa o valor numrico assumido pelo estimador quando os valores
observados x1; x2; x3; ... ; xn so considerados.
Assim,
x = 70 kg um estimador da mdia populacional
23
n
( xi x ) 2
i =1
Exemplo 2: s 2 = um estimador tendencioso da varincia populacional 2
n 1
Portanto:
B) Consistncia
Um estimador um estimador consistente do parmetro se:
lim n E[ ] = ;
24
lim n V[ ] = 0;
n
xi
i =1
x= um estimador consistente da mdia populacional , pois:
n
E( x ) = ;
2
lim n V[ x ] = = 0.
n
C)
D) Eficincia
Se 1 e 2 so dois estimadores no tendenciosos de , ento 1 mais eficiente que
2 se V(1) < V(2).
A eficincia relativa do estimador 1 em relao ao estimador 2 dada por:
V ( 2 )
Ef1 , 2 =
V (1 )
1.2.13. Intervalos de confiana.
Conhecendo-se a distribuio amostral do estimador, de um parmetro , pode-se
facilmente determinar um intervalo que apresente uma confiana 1 - para , como
ser visto a seguir.
25
E o intervalo de confiana para , com uma confiana de 1 - , pode ser ento
escrito como:
IC ( )1 = x z (1.35)
2
n
N n
IC ( )1 = x z (1.36)
n N 1
2
onde:
N o tamanho da populao;
n o tamanho da amostra.
Exemplo: Uma mquina produz rolamentos que apresentam desvio padro de 0.042
polegadas em seu dimetro. Desejando-se conhecer o dimetro mdio dos rolamentos
produzidos por esta mquina, extraiu-se uma amostra de 100 rolamentos, observando-se
uma mdia igual a 0.824 polegadas: Obter o intervalo com 0.90 de confiana para o
verdadeiro dimetro mdio dos rolamentos.
Soluo:
Tem-se x = 0.824, = 0.042, n= 100, 1- = 0.90 substituindo esses valores em
1.35 vem:
26
obviamente incorreto, do ponto de vista da estatstica clssica, dizer que a
probabilidade do intervalo [0.817; 0.831] conter o valor 0,90. Pois essa
probabilidade 0 ou 1, dependendo de pertencer ou no ao intervalo fixo.
Varincia Desconhecida
Quando no se conhece 2 e consequentemente , mas sim sua estimativa s, o
intervalo de confiana para a mdia ser dado por:
Amostras Pequenas (n 30)
s
IC ( )1 = x t (1.37)
2
n
s N n
IC ( )1 = x t (1.38)
n N 1
2
onde:
N o tamanho da populao;
n o tamanho da amostra.
Amostras Grandes (n > 30)
Foi visto que medida que se aumenta o tamanho da amostra, a distribuio t de
Student se aproxima da distribuio normal. Deste modo, quando se estiver trabalhando
com amostras grandes (n > 30), pode-se utilizar a distribuio normal padronizada z em
lugar da t na obteno dos intervalos de confiana, mesmo que 2 seja desconhecida.
Exemplo: Uma Companhia adquiriu 500 cabos. Uma amostra de 30 deles
selecionados ao acaso apresentou tenso de ruptura mdia igual a 2400 kg com desvio
padro de 150 kg. Obter o intervalo com 95% de confiana para a verdadeira tenso
mdia de ruptura destes cabos.
Soluo:
27
Tem-se: N = 500 n = 30, x = 2400, s = 150, 1- = 0.95.
a2 b2
IC ( a b )1 = x a xb z (1.39)
na nb
2
onde:
xa e xb so as estimativas pontuais das mdias das populaes a e b, respectivamente;
28
Concluso: Pode-se afirmar com 95% de confiana que a verdadeira diferena entre os
dimetros mdios dos tubos produzidos pelas empresas A e B est entre -2 1.2973mm,
isto , entre -3.2973 e -0.7027 mm. Como esse intervalo no compreende o valor 0
(zero) tem-se 95% de confiana em afirmar que os dimetros mdios dos tubos
produzidos por estas empresas no so iguais.
Varincias Desconhecidas
Populaes Homocedsticas
1 1
IC ( a b )1 = x a xb t s p + (1.40)
n a nb
2
onde:
29
Populaes Heterocedsticas
s a2 sb2
IC ( a b )1 = x a xb t + (1.41)
n a nb
2
p q
IC ( P)1 = p z (1.42)
n
2
onde:
p a proporo estimada na amostra;
q = 1 p ;
n o tamanho da amostra
Obs.: Se ocorrer ASRPF, o intervalo de confiana para proporo dado por:
p q N n
IC ( )1 = p z (1.43)
n N 1
2
30
p q
IC ( P)1 = p t (1.44)
n
2
p q N n
IC ( )1 = p t (1.45)
n N 1
2
onde:
p a a proporo estimada na amostra;
q a = 1 p a ;
q b = 1 p b
na e nb so os tamanhos das amostras a e b, respectivamente.
Obs.: Se ocorrer ASRPF, deve-se multiplicar o componente da varincia, referente
N n
populao na qual ocorreu ASRPF pelo fator de correo .
N 1
Amostras pequenas (n 30):
p a q a p b q b
IC ( Pa Pb )1 = ( p a p b ) t + (1.47)
na nb
2
31
Sabe-se que:
(n 1) s 2
~ n21 (1.48)
2
Ento,
(n 1) s 2 2
(n 1) s
2 = 1 (1.49)
2
2
1 2 2
32
Teste de hipteses fornece-nos a estrutura para que faamos isto. Veremos que
intervalos de confiana e testes de hipteses esto intimamente relacionados.
(Shimakura e Ribeiro, 2003)
Para a realizao de um teste de hipteses, devem-se formular duas hipteses
estatsticas, a saber:
9 Hiptese de nulidade (H0) a hiptese que seria testada, sendo geralmente
formulada com o intuito de ser rejeitada.
9 Hiptese alternativa (Ha) qualquer hiptese que contrarie H0.
Exemplo: Suponha que se esteja interessado em verificar se a verdadeira
performance (km/litro de combustvel) dos veculos, de determinada marca, equipados
com motores 1.6 c.c. seja de 14km/l, como afirma o fabricante, ou se este inferior a
14km/l. Ento deve-se formular as seguintes hiptese estatsticas:
33
ser menor que 14 km/l. Nesta situao, diz-se que a diferena foi significativa, portanto
a hiptese H0 deve ser rejeitada (o teste foi significativo).
Obs.: No existe nenhum argumento cientfico para se fixar o nvel de probabilidade
limite de um teste em 0.05. Este apenas um valor usual, devido facilidade de sua
obteno em tabelas. Nos nossos exemplos temos:
2
x ~ N , , assumindo = 14 km/l, e como no se conhece 2, mas sim s2, tem-se:
n
4
x ~ t (8) 14,
9
grfico:
x 13 14
tc = = = 1.5
2
n 9
Ento,
34
verdade 14 km=/l, e por efeito de acaso obter uma estimativa, que nos leve a no
rejeio da hiptese H0 : = 14 km/l. Nesta situao ter-se- cometido o erro Tipo II
(aceitar H0 falsa). A probabilidade de cometer este erro (), sendo esta uma funo de
, H0 e do tamanho amostral. As probabilidades de se cometer os erros Tipo I e Tipo II,
( e ) so inversamente proporcionais, como pode ser observado na figura abaixo,
sendo que, a nica maneira de se diminuir simultaneamente e aumentando o
tamanho amostral (n).
Os tipos de erros que podem ser cometidos em um teste de hipteses, bem como
suas probabilidades esto resumidos na tabela 1.1.
Tabela 1.1. Tipos de erros passveis de serem cometidos ao se testar uma hiptese.
35
2. Decida qual o teste a ser usado, checando se este vlido para o seu problema.
3. Calcule a estatstica de teste, T.
4. Encontre a probabilidade (p-valor) de observar um valor to extremo ou maior do
que T se a hiptese nula de fato verdadeira. Voc precisar se referir aos valores
crticos nas tabelas estatsticas as quais fornecem p-valores correspondendo aos
valores das estatsticas de teste.
5. Avalie a fora da evidncia contra H0.(Quanto menor p-valor, tanto mais evidncia
contra a hiptese nula.) Se necessrio, decida se esta evidncia suficiente para
rejeitar (ou no rejeitar) a hiptese nula.
6. Estabelea as concluses e interpretao dos resultados.
36
s
3. Calcule o erro padro, SE = .
n
( 0 )
4. Calcule a estatstica de teste t = . Este o nmero de erros padro que
SE
dista do valor de hiptese 0.
5. Encontre o p-valor da distribuio t, com r = n-1 graus de liberdade, da tabela
usando os valores absolutos da estatstica de teste.
6. Estabelea concluses e interprete os resultados.
Agora suponha que tenhamos um valor hipottico p0 para uma proporo. Podemos
realizar um teste de H0: p = p0 praticamente da mesma forma que o test-t acima. A
dualidade com intervalos de confiana segue exatamente da mesma forma. Suponha que
tenhamos uma amostra aleatria de tamanho n de uma populao de interesse onde a
verdadeira proporo de membros numa categoria em particular p. A hiptese nula
H0: p = p0. Se o nmero observado na categoria de interesse , ento um teste da
hiptese como segue:
1. Estabelea a hiptese nula, H0: p = p0, e a hiptese alternativa Ha: H0: p p0..
x
2. Calcule a proporo amostral p = .
n
)
p(1 p )
3. Calcule o erro padro, SE =
n
( p p 0 )
4. Calcule t = , o nmero de erros padro que p dista do valor de
SE
hiptese p0.
5. Encontre o p-valor usando o valor absoluto da estatstica de teste da tabela da
distribuio normal (ou equivalentemente da t com r = graus de liberdade).
Uma regra geral que este teste vlido quando tem-se ambos np e
n (1 p) maiores do que digamos 10.
37
Quantas vezes ouvimos dizer 85 em cada 100 brasileiros preocupam-se com .
Se um pesquisador srio quiser saber o tamanho da amostra para fazer esta afirmao
com um erro mximo igual a , como dever proceder?
x
P ( ) = P ( p p ) = P p
n
Portanto:
n x np n
P ( ) = P <
np (1 p ) np (1 p ) np (1 p )
x np
z= tem distribuio N(0,1).
np(1 p)
n
z=
p(1 p)
Portanto, para um dado erro , e uma projeo para p, possvel fazer uma
estimativa do tamanho necessrio para a amostra. Quando no se tem nenhuma
expectativa com relao a p (por ex. p>90%), utiliza-se o valor mximo para o
denominador que para p=0,5.
z=1,96
38
1.3.5. Decises e poder
Ao tomar uma deciso a favor ou contra uma hiptese existem dois tipos de erros
que voc pode cometer. Voc pode rejeitar a hiptese nula quando de fato ela
verdadeira (erro tipo I) ou voc pode falhar em rejeitar H0 quando de fato ela falsa
(erro tipo II). Existe um balano entre esses dois tipos de erros, no sentido de que ao
tentar-se minimizar a possibilidade de um tipo, aumenta-se a probabilidade do outro.
Frequentemente, denotamos as probabilidades destes dois erros como e ,
respectivamente.
medidas por x1 , s1, n1 para a amostra um e x2 , s1, n1 para a amostra dois. Denote as
correspondentes mdias populacionais e desvios padro 1, 2, 1 e 2 respectivamente.
39
Erro padro - assumindo desvios padres iguais
dada por
Agora podemos calcular o erro padro das diferenas nas mdias como
40
que a estimativa de 1 - 2 menos o valor hipottico (zero neste caso) e tudo dividido
pelo erro padro. Sob a hiptese nula, este segue uma distribuio t com n1 + n2 - 2
g.d.l. O valor obtido para t (ignorando seu sinal) comparado com os valores tabelados
com os graus de liberdade apropriados, para obter um p-valor.
41
onde p1 e p 2 so as estimativa de p1 e p2.
Com isso podemos construir um intervalo de confiana da forma usual, ou seja,
42
2. Comparaes entre Mais de dois Tratamentos
Apesar de ser muito eficiente para comparao entre duas amostras, o teste t no
deve ser aplicado para comparaes mltiplas devido a problemas com o erro do Tipo I.
Sabendo que em um teste de hiptese a probabilidade p de ocorrer um erro do tipo I
igual ao nvel de significncia , ao realizarmos n testes de hipteses a distribuio
resultante ser uma binomial. Portanto, a probabilidade de ocorrer k erros do tipo I pode
ser calculada pela Eq. 2.1.
prob ( k ) = C nk p k (1 p )
n k
(2.1)
2.1. Introduo
A anlise de varincia ANOVA a tcnica universalmente utilizada em
comparaes envolvendo vrias amostras de dados.
2.1.1. Objetivo
Ao se utilizar uma ANOVA, o objetivo a comparao de a grupos (tratamentos,
populaes) representados por ni indivduos (observaes) em cada grupo.
2.1.2. Pressupostos:
As amostras so aleatrias e independentes.
Os grupos tm distribuio normal.
Os grupos so homocedsticos (varincias constantes).
2.1.3. Hipteses
H 0 : i = i = 1,L , I
H1 : i para pelo menos um i
43
2.1.4 Notao
ni
x i 1
x i = =
ni ni
xij , a mdia das ni observaes do grupo i;
j=1
X 1 a ni
x = = x ij , a mdia total.
N N i =1 j=1
onde N o nmero total de observaes
2.1.5 Modelo
Dado a j-sima varivel aleatria xij do i-zimo grupo, a diferena com relao
mdia amostral global pode ser escrita como:
x ij x = ( x i x ) + ( x ij x i )
a n a n a n a n
( x ij x ) = ( x i x ) + ( x ij x i ) + 2 ( x i x ) ( x ij x i ) (2.2)
2 2 2
(x
j=1
ij x i ) = 0
a n a a n
( x x ) = n ( x i x ) + ( x ij x i )
2 2 2
ij (2.3)
i =1 j=1 i =1 i =1 j=1
ou
SQDt = SQDg + SQDe
44
onde N o nmero total de observaes e gl (ou ) significa graus de liberdade.
Portanto, podemos definir:
(2.4)
2.1.7. Anlise
Se os pressupostos forem vlidos, MQe um estimador da varincia das populaes.
Por outro lado, se a hiptese nula for verdadeira a esperana matemtica de MQg ser
nula. Se a hiptese nula for falsa, MQg tende a resultar em valores maiores do que MQe
para compensar a disperso de MQt, como pode ser visto na Figura 2.2 (lembre-se que
SQg=SQt-SQe), a qual mostra as curvas funo densidade de probabilidade de trs
populaes com distribuio normal e a populao resultante da combinao das trs.
45
Figura 2.1. Exemplo de Hiptese H0 aceita.
46
Tabela 2.1. Tabela com os resultados da ANOVA
Fonte de Soma dos Graus de Mdias
F F(,g,e)
Variao Quadrados liberdade quadrticas
Entre
SQDg a-1 QMg QMg/ QMe
Grupos
Dentro dos
SQDe N-a QMe
grupos
Total SQDt N-1
Apesar da anlise de varincia ser bem robusta com relao aos pressupostas, um
teste de normalidade e um de homocedasticidade devem ser realizados para fins de
controle.
Nos testes de normalidade, o passo inicial consiste na formulao das hipteses:
47
A estatstica apropriada do teste baseada na maior diferena absoluta entre a
funo de distribuio normal acumulada, F(zi) , e a freqncia relativa observada
acumulada e ajustada, F0,5 . As expresses utilizadas so:
1
D mx = g mx +
2n
onde:
gmx : maior valor calculado de g;
n : tamanho da amostra ou nmero de parcelas.
g = F ( zi ) F0,5
F0,5 =
( i 0,5)
n
F(zi): funo de distribuio normal acumulada;
i: nmero da amostra;
Passo 4: Concluso
Quando o valor Dmx for maior que o valor crtico dado pela Tabela 2.3, para um
tamanho de amostra n, = 0,5 e significncia ), a hiptese Ho rejeitada e conclui-se
que a caracterstica em estudo da populao no segue a distribuio normal. Por outro
lado, se Dmx for menor que o valor crtico tabelado ( Dmx < Dt ), a hiptese Ho
aceita e conclui-se que a caracterstica em estudo da populao segue a distribuio
normal.
48
Para n>40 os valores crticos de Dn podem ser aproximados pelas seguintes
expresses:
Fig. 2.3. Tabela com os passos necessrios para calcular Dmx para o exemplo.
49
Passo 4: Concluso
Como a amostra menor que 100, o valor de Dmx = 0,1704 deve ser comparado
com o valor Dt = 0,21072 obtido na Tabela 2.2 para n = 10 , = 0,5 e significncia 0,05.
Como o valor calculado de Dmx menor que o valor crtico tabelado Dt, a hiptese Ho
aceita e conclui-se que a massa de matria fresca de sementes de Dolichos biflorus L.
na populao segue a distribuio normal.
3 Calcular:
50
4 Calcular a estatstica de teste:
Passo 4: Concluso
Quando o valor W for maior que o valor crtico dado pela Tabela 2.4, para um
tamanho de amostra n e significncia ), a hiptese Ho rejeitada e conclui-se que a
caracterstica em estudo da populao no segue a distribuio normal. Por outro lado,
se W for menor que o valor crtico tabelado, a hiptese Ho aceita e conclui-se que a
caracterstica em estudo da populao segue a distribuio normal.
51
Exemplo: Considere a seguinte amostra: 8 12 10 24 12 10 16 19 9 10. Teste se a
amostra provm de uma populao Normal, isto :
H0:A amostra provm de uma populao Normal
H1:A amostra no provm de uma populao Normal
1 - Ordenar a amostra:
8 9 10 10 10 12 12 16 19 24
3 Calcular b:
4 Calcular W: 0.840
5 Deciso:
Wcalc=0,840 < W(0,05,10) = 0.842
Deve-se rejeitar-se a hiptese de normalidade da amostra para um ndice de
significncia de 5%.
52
n ( Xi X )
3
( n 2 ) g1
g1 = k 3 / (S ) 2 3
; k3 =
( n 1)( n 2 )
; b1 =
n ( n 1)
A = b1
( n + 1)( n + 3)
; B=
( )
3 n 2 + 27n 70 ( n + 1)( n + 3)
;
6 ( n 2) ( n 2 )( n + 5)( n + 7 )( n + 9 )
1 A
C = 2 ( B 1) 1 ; D= C; E= ; F=
ln D 2
C 1
(
Zg1 = E ln F + F2 + 1 ; ) Simetria
2
( Xi X ) n ( n + 1)( n 1) 3 ( Xi X )
4 2
g 2 = k 4 S4 ; k4 =
( n 2 )( n 3)
24n ( n 2 )( n 3) ( n 2 )( n 1) g 2
G= ; H=
( n + 1) ( n + 3)( n + 5 )
2
( n + 1)( n 1) G
J=
(
6 n 2 5n + 2 ) 6 ( n + 3)( n + 5 )
; K = 6 + 8 / J 2 / J 1 + 4 / J2
( n + 7 )( n + 9 ) n ( n 2 )( n 3)
2
1
L= K
2
1+ H
K4
2 3
1 L
Zg 2 = 9K ; Curtose
2
9K
53
2 - Calcular a estatstica de teste:
2 2
Dp = Zg1 + Zg2
liberdade ( 22 )
Passo 4: Concluso
Quando o valor Dp for maior que o valor crtico 22 , para um tamanho de amostra n
54
onde Smax e Smin so, respectivamente, os valores mximo e mnimo de desvio padro
estimados para as n amostras.
Passo 4: Concluso
Rejeitar H0 se Fmax > F(,a,N-1)
onde o ndice de significncia do teste, a o nmero de amostras sendo testadas e N
o nmero de observaes global.
S2max
C= a
Si2
i =1
Passo 4: Concluso
Rejeitar H0 se C > C(,a,N-1)
( n i 1) ln i
( n 1)Si2
( n 1)
( )
( n i 1) ln Si2
c2 = i
1 1 1
1+
3 ( k 1) n i 1 ( n i 1)
55
Passo 4: Concluso
Apesar da ANOVA ser bastante robusta em relao aos pressupostos, nos casos em
que os pressupostos falham de maneira significativa, pode utilizar o teste de Kruskal-
Wallis, o qual uma abordagem no paramtrica para comparao de mdias.
2.4.1 Pressupostos
Os dados devem ser variveis aleatrias independentes.
As distribuies no precisam ser normais e a varincia das populaes no
precisam ser iguais.
O nmero mnimo de observaes por amostra cinco.
Os tamanhos das amostras devem, sempre que possvel, serem iguais, apesar de ser
aceito uma pequena diferena.
2.4.2 Limitaes
Se a hiptese nula for aceita, voc no pode dizer que as amostras so as mesmas.
2.4.3. O Teste
Passo1: Formulao das hipteses
H0: Todas a k (a) populaes so idnticas
H1: Pelo menos uma das populaes gera observaes mais elevadas do que pelo
menos uma das populaes.
56
Cada uma das k amostras contm ni observaes, totalizando N observaes. As N
observaes so graduadas por ordem crescente, isto , para cada observao xij
atribuda uma graduao R(xij). Caso existam observaes iguais, a elas sero
atribudos os valores mdios.
2 - Calcular Ri:
k
R i = R x ij ( )
i =1
12 k
R i2
H= 3 ( N + 1)
N ( N + 1) i =1 n i
Passo 4: Concluso
Rejeitar H0 se H > w1
Os valores crticos so retirados da tabela com a estatstica de Kruskal-Wallis, ou
57
Verifique se os reatores tm rendimento mdio idntico.
Soluo:
58
3. Blocos Aleatorizados e Planejamentos Fatoriais com Duas Classificaes
A mdia e o desvio padro so -0.9 e 0.81 /l, respectivamente. Ento o erro padro
0.81 / 6 = 0.33 / l .
Podemos agora realizar um test-t pareado para testar a hiptese nula de que a perda
na concentrao mdia 0. Para isso calculamos:
59
Note que este valor negativo (porque a mudana mdia observada foi a reduo na
concentrao do poluente -- um valor positivo seria um aumento na concentrao do
poluente). Observamos o valor absoluto da estatstica de teste (2.73) na tabela, usando a
linha com n 1 = 5 graus de liberdade.
A quinta linha da tabela mostra que 0.01 < p < 0.05 (porque o valor 2.73 est entre
os valores tabelados 2.571 e 4.032). Ento, rejeitamos a hiptese nula ao nvel de 5%.
Existe evidncia ao nvel de 5% de que a rea em estudo sofreu uma reduo em mdia
nos nveis do contaminante durante o perodo de seis meses.
Podemos adicionar nossa concluso o intervalo de confiana de 95% para a
reduo mdia nos nveis do contaminante:
Estamos 95% confiantes que a reduo mdia nos nveis do contaminante est entre
0.05 /l e 1.75 /l.
onde, yij uma observao (ou resultado), obtida para o nvel i na rplica j, i a mdia
para o nvel i, j o efeito sobre o resultado devido j-sima rplica e ij, um erro
60
O valor esperado para a diferena :
O teste da hiptese nula H0: 1 = 2 pode ser feito pela diferena por pares d, ou
seja,
H0: d = 0
H1: d 0
O teste estatstico feito com:
onde:
61
onde yij o j-simo elemento obtido no tratamento (nvel) i. Esses elementos podem ser
definidos pelo modelo estatstico linear:
62
3.3.1. Anlise de um modelo de efeitos fixos
Neste caso, os efeitos dos tratamentos i so definidos como desvios a partir da
mdia geral, de modo que:
63
O ltimo termo da expresso nulo pois:
Assim,
onde SSTRATAMENTOS denomina-se soma dos quadrados devidos aos tratamentos (entre
tratamentos) e SSE denominada soma dos quadrados devidos ao erro (dentro dos
tratamentos). SST apresenta N-1 graus de liberdade, SSTRATAMENTOS apresenta a-1 e SSE,
N-a graus de liberdade.
SS E
Assim, uma estimativa da varincia dentro de cada um dos tratamentos e
Na
SSTRATAMENTOS
, a estimativa da varincia entre os tratamentos.
a 1
Para a anlise estatstica das hipteses, tem-se que SST uma soma de quadrados de
variveis aleatrias normalmente distribudas, SST/2, SSE/2 e SSTRATAMENTOS/2 so
distribudas como chi-quadrado respectivamente, com N-1, N-a e a-1 graus de
liberdade, se a hiptese nula H0 : i = 0 for verdadeira. Nesse caso, aplicando-se o
teorema de Cochran (N-1 = N-a + a-1) tem-se que SSE/2 e SSTRATAMENTOS/2 so
variveis aleatrias chi-quadrado independentes.
64
Se a hiptese nula verdadeira, ou seja, no h diferena entre as mdias dos
SSTRATAMENTOS (a 1)
tratamentos, a razo F0 = uma distribuio F com a-1 e N-a
SS E ( N a )
graus de liberdade.
No caso da hiptese nula ser verdadeira, tanto o numerador quanto o denominador
da expresso so estimadores confiveis de 2. Assim, se o valor esperado para o
numerador maior que o valor esperado para o denominador, deve-se rejeitar H0 para
valores do teste de hipteses que sejam muito grandes, ou seja, a hiptese nula ser
rejeitada se F0 > F, a-1, N-a
A anlise da varincia pode ser feita construindo tabelas como a seguir:
65
3.3.2 Comparao das mdias individuais dos tratamentos
O mtodo apresentado anteriormente permite verificar-se se as mdias de diversos
tratamentos so diferentes ou no, mas no possibilita verificar quais delas divergem.
Para tanto, h necessidade de as somatrias das observaes de cada tratamento (yi) ou
de suas mdias ( y i ). Essas comparaes so feitas atravs dos denominados mtodos de
comparao mltipla. Os testes de comparao mltipla permitem investigar onde se
encontram as diferenas possveis entre k mdias populacionais.
Existem muitos testes deste tipo, no entanto, sero abordados apenas trs:
Teste HSD (honestly significant difference) de Tuckey
Teste de Scheff
Teste do contraste
Estes testes permitem examinar simultaneamente pares de mdias amostrais para
identificar quais os pares onde se registram diferenas significativas.
P(W ST (1 ) ) = 1 , W ~ ST (k , N -k).
66
Exemplo: Dado as mdias amostrais de venda, relativas a 12 observaes cada, de trs
lojas, existe evidncias estatstica de que as vendas das lojas so diferentes?
x1 x2 = 49 56 = 7
x1 x3 = 49 51 = 2
x2 x3 = 56 51 = 5
Assim, h evidncia de que a loja 2 tem um volume mdio de vendas diferente das
lojas 1 e 3. Isto , a mdia observada para a loja 2 difere significativamente das mdias
observadas para as lojas 1 e 3, enquanto que, a diferena registrada entre o volume de
vendas da loja 1 e da loja 3 no significativa.
67
Teste Scheff
Neste teste a hiptese nula H0: i = j rejeitada se:
Exemplo:
x1 x2 = 6.4 9.5714 = 3.1714
68
Teste de contraste
Um contraste C uma combinao linear dos totais yi, que permite a comparao
das mdias dos tratamentos.
a
C = ci y i
i =1
a
ni ci = 0 , para tratamentos com n diferentes.
i =1
Um contraste testado comparando-se SSC com SSE/(N-a) que deve ser distribudo
como F,1,N-a caso a hiptese nula seja verdadeira, ou seja, com H0 ser rejeitada se F0 >
F,1,N-a.
O uso de contrastes ortogonais um caso particular deste mtodo, que oferecem
testes independentes para as mdias dos tratamentos. Dois contrastes {ci} e {di} so
ortogonais se
a
ci d i = 0 , para tratamentos com n iguais.
i =1
a
ni ci d i = 0 , para tratamentos com n diferentes.
i =1
69
3.3.3 Anlise de um modelo de efeitos aleatrios
Numa situao em que se deseja verificar um fator que apresenta um grande nmero
de nveis possveis e seleciona-se aleatoriamente alguns destes nveis para anlise, diz-
se que esse fator aleatrio. Como a escolha foi feita aleatoriamente, as concluses
extradas a partir dos resultados obtidos nos nveis analisados, podem ser estendidas
para toda a populao de nveis. Nesse caso, assume-se que essa populao infinita ou
suficientemente grande para ser considerada infinita (Button, 2005).
O modelo estatstico linear pode ser novamente utilizado.
V ( y ij ) = 2 + 2
O teste de hipteses neste modelo, assume-se que {ij} seja NID( 0, 2 ), que {i}
tratamentos ( 2 ):
respectivamente, com N-a e a-1 graus de liberdade, se a hiptese nula H0 for verdadeira
e ambas so variveis aleatrias chi-quadrado independentes. Desta forma, a razo
SSTRATAMENTOS (a 1)
F0 = uma distribuio F com a-1 e N-a graus de liberdade.
SS E ( N a )
70
Definindo MSTRAT como SSTRATAMENTOS/ a - 1 e MSE como SSE/ (N - a) pode-se
provar que:
como 2N a .
( )
J a razo (a 1) MS TRAT 2 + n 2 distribuda como a2 1 , de modo que o
2
intervalo de confiana para a relao dado por:
2 + 2
onde
71
3.4. Efeitos de Blocos
3.4.1. Planejamento por Nveis Completo Aleatorizado por Blocos
Nesse tipo de planejamento, tem-se por objetivo avaliar a influncia dos tratamentos
para uma dada varivel de influncia, bloqueando-se uma fonte de variabilidade, que se
deseja eliminar (Button, 2005).
Como exemplo, teramos a verificao de penetradores (tratamentos) na medio de
dureza de materiais distintos. Assim, os materiais seriam bloqueados.
O planejamento definido como completo pois cada bloco contm todos os
tratamentos e, aleatorizado dentro dos blocos.
Nesse estudo, tem-se a tratamento e b blocos, com o seguinte modelo estatstico:
a
onde a mdia da populao, i efeito do tratamento i, ( i = 0 ) j o efeito do
i =1
b
bloco j ( i = 0 ) e ij o erro aleatrio, distribudo como NID( 0, 2 ).
i =1
72
SS E
Assim, uma estimativa da varincia do conjunto total de dados,
(a 1)(b 1)
SSTRATAMENTOS
, a estimativa da varincia dentro de cada um dos tratamentos e
a 1
SS blo cos
, a estimativa da varincia dentro de cada um dos blocos.
b 1
Para a anlise estatstica das hipteses, tem-se que SST uma soma de quadrados de
variveis aleatrias normalmente distribudas, SST/2, SSTRATAMENTOS/2, SSBLOCOS/2 e
SSE/2 so distribudas como chi-quadrado respectivamente, com N-1, a-1, b-1 e (a-
1).(b-1) graus de liberdade, se a hiptese nula H0 : i = 0 for verdadeira.
Nesse caso, aplicando-se o teorema de Cochran (N-1 = a-1+b-1+( a-1).(b-1)) tem-se
que SSE/2, SSBLOCOS/2 e SSTRATAMENTOS/2 so variveis aleatrias chi-quadrado
independentes.
Se a hiptese nula verdadeira, ou seja, no h diferena entre as mdias dos
tratamentos, a razo:
SSTRATAMENTOS (a 1)
F0 = para os tratamentos
SS E (a 1)(b 1)
SS BLOCOS (b 1)
F0 = para os blocos
SS E (a 1)(b 1)
73
so distribuies F com a-1 e (a-1).(b-1) e b-1 e (a-1).(b-1) graus de liberdade,
respectivamente.
No caso da hiptese nula ser verdadeira, tanto o numerador quanto o denominador
da expresso so estimadores confiveis de 2. Assim, se o valor esperado para o
numerador maior que o valor esperado para o denominador, deve-se rejeitar H0 para
valores do teste de hipteses que sejam muito grandes, ou seja, a hiptese nula ser
rejeitada se:
F0 > F, a - 1, (a - 1)(b - 1) para o teste dos tratamentos.
F0 > F, b -1, (a - 1)(b - 1) para o teste dos blocos.
Caso a hiptese nula seja rejeitada (os tratamentos tm influncia), pode-se verificar
a influncia de cada tratamento atravs de comparaes mltiplas, com o uso de
contrastes.
Nesse caso, o procedimento idntico ao usado no modelo de efeitos fixos, apenas
empregando-se:
Um contraste ser testado comparando-se SSC com SSE/((a-1).(b-1)) que deve ser
distribudo como F, 1, (a - 1)(b - 1) caso a hiptese nula seja verdadeira, ou seja, com:
SS C
F0 =
SS E (a 1)(b 1)
H0 ser rejeitada se F0 > F, 1, (a - 1)(b - 1).
74
vezes no planejamento (ou replicado r vezes), e assim, existem N = a.r = b.k
observaes. J o nmero de vezes que cada par de tratamentos aparece no mesmo
bloco dado por l (que deve ser inteiro):
onde
a - nmero de tratamentos
b - nmero de blocos
k - nmero de tratamentos por bloco
r - nmero de vezes de ocorrncia de cada tratamento
Se a = b, o planejamento denominado simtrico.
O modelo estatstico que representa esse planejamento dado por:
75
SST apresenta N-1 graus de liberdade, SSTRAT (ajust.), a-1, SSBLOCOS, b-1 e SSE tem N-
a-b+1 graus de liberdade.
O teste estatstico apropriado para verificar a influncia dos efeitos dos tratamentos
:
SS TRAT .( ajust ) (a 1)
F0 =
SS E ( N a b + 1)
76
4. Planejamentos com Mltiplos Blocos
4.1. Planejamentos Quadrados Latinos
Este planejamento til quando se tem por objetivo eliminar duas fontes de
variabilidade, bloqueando duas direes.
Como exemplo, assuma-se um estudo em que se deseja determinar a influncia da
formulao sobre a quantidade de energia liberada num processo. Assim, tem-se a
energia como varivel de resposta e a formulao como varivel de influncia. Porm,
as formulaes podem ser preparadas por operadores diversos com diferentes matrias-
primas, o que configura duas fontes de variabilidade que se deseja eliminar.
O quadrado latino consiste de um arranjo quadrado p x p, onde os tratamentos
(nveis) da varivel de influncia so representados por letras latinas maisculas (A, B,
C,....), sendo que cada letra s pode aparecer uma nica vez em cada linha e coluna.
As linhas e colunas do quadrado so ocupadas pelos nveis das fontes de
variabilidade bloqueadas. Denomina-se padro um quadrado latino que tem a primeira
linha e a primeira coluna com os nveis em ordem alfabtico, tem-se que um arranjo
quadrado latino 3 x 3 poder apresentar somente uma combinao, enquanto que um
arranjo 4 x 4 apresentar 4 combinaes, um 5 x 5 ter 56 e um 7 x 7 ter 16.942.080
(Button, 2005).
Alguns exemplos:
4x4 5x5
A B D C A B C D E
B C A D B C D E A
C D B A C D E A B
D A C B D E A B C
E A B C D
77
Este planejamento tem seus resultados analisados pelo seguinte modelo estatstico:
como NID( 0, 2 ).
78
Novamente, para a anlise estatstica das hipteses, tem-se que SST uma soma de
quadrado respectivamente, com N-1 , p-1, p-1, p-1 e (p-2).(p-1) graus de liberdade, se a
hiptese nula H0 : i = 0 for verdadeira.
Nesse caso, aplicando-se o teorema de Cochran (N-1 = p-1+p-1+p-1+(p-2).(p-1)),
SSTRATAMENTOS ( p 1)
F0 =
SS E ( p 1)( p 2)
para os tratamentos
numerador maior que o valor esperado para o denominador, deve-se rejeitar H0 para
valores do teste de hipteses que sejam muito grandes, ou seja, a hiptese nula ser
rejeitada se F0 > F, p - 1, (p - 1)(p- 1).
Os testes com as fontes das linhas e das colunas perdem objetividade estatstica
visto que durante o planejamento eles foram bloqueados, ou seja, tiveram sua
aleatoriedade restrita (Button, 2005).
A grande desvantagem do planejamento quadrado latino com quadrados pequenos
(3 x 3 ou 4 x 4) o pequeno nmero de graus de liberdade associado. Para evitar esse
problema, usa-se replicar os experimentos. Essa rplica pode ser feita de trs modos
distintos:
1. usando combinaes com os mesmos nveis das fontes (linhas e colunas) em cada
rplica;
2. alternando nveis das fontes em cada rplica, fixando o nvel da linha e alterando
o nvel da coluna, ou vice-versa, para cada combinao;
79
3. usando diferentes nveis de linhas e colunas para cada rplica.
Nesses casos, as somatrias dos quadrados das diferenas so dadas por:
SST = SSTRATAMENTOS + SSLINHAS + SSCOLUNAS + SSRPLICAS + SSE
O quadro de anlise para o caso (a) tem o ndice representando as rplicas, assim
cada resultado identificado por yijkl, ou seja, a observao na linha i, no tratamento j,
na coluna k e na rplica l. Com n rplicas para cada conjunto i, j, k tem-se um nmero
total de observaes N = np2.
80
com um total de p2 observaes. Podem-se obter quadrados greco-latinos a partir de
p3, exceto para p = 6.
A seguir, apresenta-se um exemplo de quadrado greco-latino 4 x 4:
81
A anlise estatstica do planejamento com quadrados greco-latinos similar usada
para os quadrados latinos. Assim, a hiptese nula ser rejeitada para os nveis da
varivel de influncia, caso F0 > F, p - 1, (p - 1)(p - 3).
onde
SSTRATAMENTOS ( p 1)
F0 =
SS E ( p 1)( p 3)
para os tratamentos (letras latinas)
82
5. Planejamentos Fatoriais: Modelos Empricos
5.1. Planejamento Fatorial Completo 22*
1
Fonte EITON P. SILVA, SEZIMRIA F. P. SARAMAGO, FAMAT - UFU
83
Ep = W l (1 cos ) F l sen (5.1)
onde W = 400N e l =2,5m.
Este exemplo ser usado para ilustrar a execuo e a anlise dos resultados de um
planejamento fatorial 22. partir deste exemplo, sero apresentados alguns conceitos
fundamentais que depois podero ser aplicados a planejamentos envolvendo um nmero
qualquer de fatores.
Para executar um planejamento fatorial necessrio em primeiro lugar especificar
os nveis em que cada fator ser estudado, isto , os valores dos fatores (ou as verses,
nos casos qualitativos) que sero empregados. Pode-se, por exemplo, querer estudar o
efeito do fator fora F em quatro nveis, 10N, 20N, 80N e 100N, e o efeito do ngulo
em trs nveis, 0, 45 e 90.
Um planejamento fatorial requer a execuo de experimentos para todas as possveis
combinaes dos nveis dos fatores. Cada um desses experimentos, em que o sistema
submetido (por exemplo: F= 10N e = 45), um ensaio experimental. Havendo 4
nveis num fator e 3 no outro, como nesse caso, sero necessrio 4x3 = 12 ensaios
diferentes, e o planejamento chamado de fatorial 4x3. Em geral, se houver n1 nveis do
fator 1, n2 do fator 2, ..., e nk do fator k, o planejamento ser um fatorial n1x n2 x ...x nk
de experimentos. Este o nmero mnimo para se ter um planejamento fatorial
completo. O pesquisador pode querer repetir ensaios, para ter uma estimativa do erro
experimental, e nesse caso o nmero total de experimentos ser maior.
Havendo k fatores, isto , k variveis controladas pelo experimentador, o
planejamento de dois nveis ir requerer a realizao de 2x2x...x2 = 2k ensaios
diferentes, sendo chamado por isso de planejamento fatorial 2k (Barros, 1995).
Para o Exemplo 1, foram escolhidos os nveis 80N e 100N para a fora F e 5 e
85 para o ngulo . A execuo do planejamento 22 consiste em realizar ensaios e
84
registrar as respostas observadas (a energia potencial Ep, neste caso) em todas as
possveis combinaes desses nveis: (80N, 5), (80N, 85), (100N, 5) e (100N, 85). A
listagem dessas combinaes, que chamada de matriz de planejamento, apresentada
na Tab. 5.1, juntamente com os valores de Ep.
A Eq. (5.2) pode ser reescrita como a diferena entre as duas mdias:
1 1
A = (17,98 + 663,79) (13,63 + 713,60) =-27,08 (5.3)
2 2
85
1 1
B = (713,60 + 663,79) (13,63 17,98)
2 2
B=704,5 (5.4)
1
AB = (663,79 (17,98) ) (713,60 ( 13,63) )
2 14442 444 3 14442444 3
onde obtido com F fixo no nvel superior, variando-se ; obtido com F fixo no
nvel inferior, variando-se . Pode-se verificar facilmente que AB = BA.
86
(a)
(b)
(c)
Figura 5.3. Interpretao geomtrica dos efeitos em um planejamento 22.
87
Figura 5.4. Diagrama para interpretao dos resultados de um planejamento 22.
conveniente trabalhar com os fatores em uma escala onde cada fator varia de 1
para +1. Uma maneira comum de fazer isso :
2 (F F ) 2 ( )
x1 = e x2 = (5.6)
u
(F F ) l
( u l )
p
5.2. Experimentos Fatoriais Fracionados 2kResoluo
88
completo.
A idia por traz de um projeto fatorial fracionrio consiste em utilizar o fato de
que um projeto fatorial ortogonal e que a interaes de mais altas no so
significativas, ou seja: utilizam-se as interaes de mais alta ordem para blocar
(confudir) fatores extras. Portanto, a frao um subgrupo, cuidadosamente prescrito,
de todas as combinaes possveis. A anlise dos fatoriais fracionrios relativamente
direta e, em funo de sua estrutura, a utilizao de um fatorial fracionrio no impede a
possibilidade de uma complementao posterior de todo o experimento fatorial.
A B C Observao Z
- - + 8
+ - - 11
- + - 9
+ + + 14
89
2. O efeito principal de B estimado como sendo (9 + 14) / 2 - (8 +11) / 2 = 2.
3. O efeito principal de C estimado como sendo (8 + 14) / 2 - (11 + 9) = 1,0.
Agora ao considerar a estimativa da interao dos fatores AB, o analista
descobrir que os sinais necessrios para estimar a interao AB so idnticos aqueles j
empregados para estimar o efeito principal de C. Portanto, o efeito principal de C e a
interao de dois fatores AB se confundem. Em outras palavras, a estatstica Z+ -Z-=1.0,
possui uma estrutura de sinnimos, isto , a estatstica tanto pode se identificada
como C ou como AB. Na verdade, o valor esperado da estatstica igual a C + AB, a
soma dos dois efeitos, e na ausncia de informaes claras sobre o efeito principal de C,
no somos capazes de dizer se o efeito AB positivo, negativo, grande ou pequeno. Da
mesma maneira:
A estimativa de A confunde-se com BC.
A estimativa de B confunde-se com AC.
Quando alguns, ou todos, efeitos principais se confundem com interaes de dois
fatores, diz-se que o delineamento fatorial fracionrio de Resoluo III. Quando um
ou mais efeitos principais confundem-se com interaes de (no mnimo) trs fatores,
diz-se que o fracionrio um delineamento de Resoluo IV. Fracionrios com
efeitos principais confundidos com interaes de (no mnimo) quatro fatores so de
Resoluo V e etc.
90
Primeiramente devemos construir 3 (p) relaes geradoras:
I=ABCDE E=ABCD
I=ABCF F=ABC
I=ABDG G=ABD
lgico que outras relaes geradoras poderiam ser construdas. Quando se utilizam
todas as combinaes possveis de relaes geradoras diz-se que o planejamento
saturado. A resoluo do planejamento dado pelo tamanho da menor relao geradora,
Para saber quais interaes confundem uma estimativa, basta isolar a estimativa
do lado esquerdo das relaes geradoras. Por exemplo:
91
A estimativa de A confunde-se com:
92
tambm deve ser robusta (pouco sensvel) influncia do rudo. O mtodo de Taguchi
prope que se analise a resposta mdia para cada combinao no arranjo interno, e que a
variabilidade seja analisada escolhendo uma razo sinal-rudo (SN) apropriado. Trs
razes SN padro so amplamente empregadas:
__ 2
y
SN T = 10 log ,
s2
1 n 1
SN L = 10 log10 2
n
i =1 yi
1 n
SNS = 10 log10 yi2
n
i =1
93
mistura para bolo.
Tempo/Leite/Temperatura
F G A O --+ -+- +-- +++ y s SNT
- - - - 85 96 97 92 92,5 5,45 24,6
- - - + 82 81 78 79 80 1,83 32,8
- + + - 75 80 70 73 74,5 4,20 25,0
- + + + 66 75 83 70 73,5 7,33 20,0
+ - + - 84 91 95 90 90 4,55 25,9
+ - + + 78 72 80 69 74,8 5,12 23,3
+ + - - 86 85 90 91 88 2,94 29,5
+ + - + 86 82 77 75 80 4,97 24,1
94
6. Anlise de Regresso
6.1. Ajuste de Parmetros
No problema de estimao de parmetros, a expresso matemtica para a funo de
transferncia ( TF ) do modelo em funo dos parmetros do sistema conhecida. Os
valores das entradas f e sadas Y, bem como as condies iniciais ou valores de
contorno so avaliveis, caso necessrio, e alguns ou todos os parmetros do modelo
so desconhecidos. Caso haja rudo nos dados medidos m, uma hiptese comumente
utilizada de que o mesmo aditivo aos dados r, do sistema real, como mostrado na
figura 6.1. A soluo para o problema obter a melhor estimada dos parmetros
desconhecidos, usando alguns valores medidos das excitaes e das respostas do
sistema (Duarte, 1994).
95
Como pode ser observado no esquema mostrado na figura 6.2, o modelo
matemtico usado para o ajuste de parmetros, dado por:
= TF 1 (Y, )
(6.1)
m = r +
= X(Y ).
(6.2)
= r +
96
= TF(f , )
(6.3)
m = r +
onde X(b) a matriz de sensibilidade das respostas em relao aos parmetros, com um
elemento genrico da linha i e coluna j, calculado pela Equao 6.5.
(i )
X(i, j) = (6.5)
b( j)
Substituindo-se a Equao 6.4 na Equao 6.3, resulta na Equao 6.6 que tem, a
menos de uma constante, a mesma forma da equao 6.2.
= TF(f , b ) + X(b ).
m = r + (6.6)
97
Utiliza-se uma expanso em srie de Taylor da funo objetivo, no linear, retendo
os termos de at segunda ordem, resultando em:
1
r (b + b ) = r (b ) + J(b ).b + b'.H(b ).b (6.7)
2
b = H 1 (b ). J (b ) (6.9)
P( m | ).P()
P( | m ) = (6.10)
P( m )
98
9 e so estatisticamente independentes.
9 No existe erro na matriz de sensibilidade X.
Com estas hipteses, a varivel aleatria m tem uma distribuio Normal, sendo:
E[ m ] = X.o
Cov[ m ] = X.V.X' + (6.11)
P( | ). / m P( ).P( ) P( ).P( m X. )
P( | m ) = = = (6.13)
P( m ) P( m ) P( m )
1 1
g ( | m ) = K. exp .( o ) .( m X )'. 1 .( m X. ) (6.14)
2 2
1
(
ln (g( | m )) = ln (K ) . ( o )'.V 1 .( o ) + ( m X )'. 1 .( m X )
2
) (6.15)
99
6.2.1. Estimador de Mximo a Posteriori (MAP)
K +1
bMAP = bMAP
K
+ MAP
K
( ( ) (
. X ' K . X ' K . 1 . m K + V 1 . o bMAP
K
)) (6.17)
onde:
( ) K
MAP
1
= X ' K . 1 . X K + V 1
100
- Polarizao: o estimador polarizado com E(bMAP) = o.
- Eficincia: o estimador eficiente, de mnima varincia, cuja covarincia de
estimativa dada por:
Cov(bMAP ) = (X '. 1
. X + V 1 )
1
(6.18)
O fato do estimador MAP ser polarizado muito til quando se procura ajustar
simultaneamente os valores de parmetros de um sistema composto por modelos
lineares e no lineares. Nestes casos, o ajuste torna-se difcil, s vezes impossvel, pois
as curvas de resposta do modelo do sistema so, normalmente, muito mais sensveis s
variaes dos valores dos parmetros dos modelos lineares do que s dos modelos no
lineares. Uma maneira de contornar este problema dividir o procedimento em duas
etapas: inicialmente controlam-se as foras de excitao de maneira que os nveis de
vibrao sejam baixos e, consequentemente, os efeitos das no linearidades sejam
desprezveis. Em seguida o ajuste refeito com as curvas de respostas para nveis mais
altos de vibrao do sistema.
Na primeira etapa os valores dos parmetros dos modelos lineares so ajustados e as
matrizes de covarincia de suas estimativas so calculadas. Para os parmetros dos
modelos no lineares, completa-se a matriz de covarincia total com valores grandes na
diagonal e nulo fora dela. Na segunda etapa, utiliza-se o estimador MAP com a matriz
de covarincia total gerada, para o ajuste simultneo de todos os parmetros do sistema.
Devido s caractersticas de polarizao do estimador MAP, na segunda etapa os
valores dos parmetros dos modelos das no linearidades sero ajustados sem grande
variao nos valores dos parmetros dos modelos lineares ajustados anteriormente.
101
elevados (da ordem de 1012), significando que no existe qualquer certeza sobre os
valores dos parmetros. Com a matriz de covarincia montada desta maneira, da
Equao 6.16 resulta:
K +1
bML = bML
K
+ ML
K
( (
. X ' K . X ' K . 1 . m K )) (6.20)
onde:
( ) K 1
ML = X ' K . 1 . X K
Cov(bML ) = (X '. 1
.X )
1
(6.21)
r = ( m )' . W .( m ) (6.22)
onde W uma matriz que pondera as incertezas sobre os valores medidos. Se W for
igual a matriz identidade tem-se o estimador de Mnimos Quadrados Comuns MQC. Se
W for uma matriz inversa da covarincia do rudo presente na medio, tem-se o
102
estimador de Markov (MAK), que equivalente ao estimador ML com as hipteses
simplificadoras j apresentadas (Duarte, 1994).
Os valores dos parmetros so, geralmente, avaliados via funo normal, resultando:
Estes estimadores podem ser derivados do estimador ML, bastando substituir -1 por
W. Substituindo W na Equao 6.22, tem-se para os estimadores no lineares MAK,
MQC e MQP:
( (
b K +1 = b K + K . X ' K . X ' K .W . m K )) (6.24)
Onde:
( ) K 1
= X ' K .W . X K
Nos casos em que o produto matricial [X.W.X] for mal condicionado, uma tcnica
pseudo-inversa, baseada no clculo de valores singulares da matriz X, pode ser
utilizada.
As principais caractersticas dos estimadores de Mnimos Quadrados so:
- No necessrio nenhum conhecimento a priori das propriedades estatsticas dos
parmetros.
- Para o estimador MQC nenhuma hiptese assumida para os dados.
- Condio para utilizao: |X.W.X| 0.
- Condies de despolarizao: o rudo deve ter mdia zero e ser aditivo s
respostas.
- m e mo podem ser processos estocsticos.
- Condies de mnima varincia: do teorema de Gauss-Markov necessrio que:
a) Cov(m | ) = 2 .W (rudo com varincia constante 2).
b) Para MQC, Cov(ij) = 0 para i j ( erros no correlacionados).
- As covarincias dos valores estimados so:
Cov bMQC = 2 . ( X '.W . X )
1
(6.25)
MQP
103
Cov(bMAK ) = (X '. 1
.X )
1
(6.26)
104
6.4. Estimativa dos Erros
O critrio utilizado neste trabalho para avaliar a preciso dos valores estimados
baseado na estimada das matrizes de covarincia dadas pelas Equaes 6.18, 6.21 e
6.25.
Definem-se os erros percentuais tericos (ET), de i-simo parmetro de um dado
estimador (EST), pela Equao 6.27.
( m X .b )' . W .( m X .b )
2 = (6.28)
n p
105
correlao e regresso que vale a pena discutir, nem que seja para esclarecer seu
verdadeiro significado e suas limitaes (Barros, 2001).
Imaginemos que tanto X quanto y sejam variveis aleatrias e que, portanto, seja
apropriado definir um coeficiente de correlao entre elas, dado por:
__
__
X i X y i y
s s
x y
r (X, y ) = (6.29)
N 1
S xy
r (X, y ) = (6.30)
S xx S yy
S xy
1 = (6.31)
S xx
S yy
1 = r(X , y) (6.32)
S xx
ou
Sy
1 = r(X , y) , (6.33)
Sx
106
representa a variao em y correspondente variao de uma unidade em X, ou seja, a
derivada dy/dX.
Para um modelo linear, podemos tambm esclarecer uma relao entre a
percentagem de variao explicada (ou coeficiente de determinao),
2
_
SQ R
yi y
,
R2 = =
SQ T _ 2
i
y y
ou, simplificando,
R2 = r 2 (X, y ) (6.34)
R = r (y, y ) (6.35)
Esta relao legtima, pois tanto os valores observados quanto os valores previstos
so variveis aleatrias. O valor de R, que chamado de coeficiente de correlao
mltipla, nunca negativo. Ele o maior valor da correlao que uma combinao
107
linear das variveis independentes, na forma especificada pelo modelo, pode ter com os
valores de y observados.
Amostra:
108
yi = 0 + 1xi1 + 2xi2 + ... + kxik + ei
onde ei o termo aleatrio (erro)
Suposies:
Os erros (ei) so independentes e variam aleatoriamente segundo uma
distribuio (normal) com mdia zero e varincia constante.
Suposio adicional: no deve haver correlaes muito fortes entre as variveis
independentes.
Y = X +
Y = X +
109
6.6.1. Estimador de Mnimos Quadrados (Resumo)
Valores preditos:
Resduos:
110
7. Tcnica das Superfcies de Resposta
Em processos industriais, muito comum a existncia de muitos fatores ou variveis
que afetam a qualidade global do produto final. Neste contexto, alguns estatsticos vm
estudando a Metodologia de Superfcie de Resposta (SR), desde 1970. Em essncia, esta
metodologia consiste em estimar coeficientes da regresso polinomial para a gerao de
um modelo emprico. Ento, usando a metodologia possvel aproximar um modelo
emprico a uma relao (inicialmente desconhecida ou conhecida) entre os fatores e as
respostas do processo (Saramago, 2006).
A superfcie de resposta til quando o pesquisador no conhece a relao exata
entre os fatores. Mas, geralmente quando a expresso analtica da funo conhecida, a
metodologia pode ser til em alguns casos: freqentemente pode-se encontrar funes
descontnuas, e em muitos casos se trabalha com valores discretos das variveis de
projeto ou fatores. Assim, til usar a superfcie de resposta para obter uma
aproximao polinomial.
Atualmente, o desenvolvimento da computao e o uso rotineiro dos computadores
tm proporcionado uma facilidade no trabalho de gerao de modelos empricos ou
superfcie de resposta com o uso de softwares modernos. Entretanto, isto demanda do
usurio conhecimentos bsicos de computao e estatstica para interpretar os
resultados.
Dentre as vantagens da Metodologia, a principal que seus resultados so
resistentes a influncia de condies no ideais, como erros aleatrios e pontos
influentes, porque a metodologia robusta. Outra vantagem a simplicidade analtica
da superfcie de resposta obtida, pois a metodologia gera polinmios. Em geral,
polinmios de duas ou mais variveis, so funes contnuas. Assim, a otimizao de
um processo ou sistema torna absolutamente fcil com o uso de mtodos tradicionais de
otimizao (Saramago, 2006).
Para mostrar como se constri uma SR linear, o Mtodo dos Mnimos Quadrados
(MQM) ser aplicado aos dados codificados do Exemplo abaixo.
111
Exemplo 1: Na Figura 8.1, sob a ao da fora F, o sistema de peso W se move at a
Figura 7.1. Pendulo de peso W sob a ao de uma fora constante F (Saramago, 2006).
1 80 5 -1 -1 -13,63
2 100 5 1 -1 -17,98
3 80 85 -1 1 713,60
4 100 85 1 1 663,79
5 90 45 0 0 133,79
Seja a Tab. 7.1 formada pelos dados codificados do Exemplo 1 juntamente com o
ponto central.
112
Para usar o MQM, o prximo passo escrever a matriz X formada pelos nveis dos
fatores x1 e x2 juntamente com a sua primeira coluna formada pela unidade. Considere,
tambm, o vetor coluna y formado pelos valores de Ep:
x1 x2
13,63
1 1 1 17,98
1
1 1
e y = 713,60 (7.2)
X = 1 1 1
663,79
1 1 1
133,79
1 0 0
b0 295.91
b = b1 = - 13.54 (7.4)
b2 352.25
A Eq. (7.5) representa a SR linear que poder, depois de uma anlise dos resduos,
ser usada para estimar a energia potencial para diferentes valores de F e , dentro da
regio investigada R, onde R=((x1,x2) 2 : 1 x1 1 e 1 x2 1). A Figura 7.2
mostra a superfcie de resposta obtida na regio de investigao. Enquanto a Figura 7.3
mostra o grfico de Ep na regio do plano onde 0,0873 1,4835 (radianos) e 80N
F 100 (N) correspondente a regio R. Comparando-se as duas curvas, nota-se que a
SR linear no representou bem a funo desejada para a energia potencial.
113
Figura 7.2. Superfcie de resposta obtida Figura 7.3. Grfico da energia potencial,
para o Exemplo. obtida atravs da Eq. (7.1).
114
Tabela 7.2. Resultados do planejamento em estrela obtido pela ampliao da Tabela 7.1.
1 80 5 -1 -1 -13,63
2 100 5 1 -1 -17,98
3 80 85 -1 1 713,60
4 100 85 1 1 663,79
5 90 45 0 0 133,79
6 75,86 45 -21/2 0 158,79
7 90 101,57 0 21/2 980,14
8 104,14 45 21/2 0 108,80
1/2
9 90 -11,56 0 -2 65,37
115
x1 x2 x12 x 22 x1 x 2
1 1 1 1 1 1
1
1 1 1 1 1
1 1 1 1 1 1
1 1 1 1 1 1
(7.6)
X= 1 0 0 0 0 0
1 2 0 2 0 0
1 0 2 0 2 0
1 2 0 2 0 0
1
0 2 0 2 0
- 13,63
- 17,98
713,60
663,79 (7.7)
y = 133,79
158,79
980,14
108,80
65,37
A Figura 7.5 representa a SR quadrtica, dada pela Eq. (7.8). Pode-se observar que,
comparando com a curva da Figura 7.3, este resultado melhor do que a SR linear.
116
7.3. Outros Planejamentos Fatoriais
Ensaios 1 2 3 Ep
1 -1 -1 -1 -14,58
2 1 -1 -1 -18,93
3 -1 1 -1 485,39
4 1 1 -1 435,58
5 -1 -1 1 -13,62
6 1 -1 1 -17,98
7 -1 1 1 713,60
8 1 1 1 663,79
9 0 0 0 97,18
117
x1 x2 x3
1 1 1 1
1
1 1 1
1 1 1 1
1 1 1 1
(7.9)
X = 1 1 1 1
1 1 1 1
1 1 1 1
1 1 1 1
1
0 0 0
- 14,58
- 18,93
485,39
435,58 (7.10)
y = - 13,62
- 17,98
713,60
663,79
97,18
118
Tabela 7.7. Resultados de um planejamento fatorial 24 com o ponto central.
Ensaio 1 2 3 4 Ep (Nm)
1 -1 -1 -1 -1 -5,83
2 1 -1 -1 -1 -7,57
3 -1 1 -1 -1 194,16
4 1 1 -1 -1 174,23
5 -1 -1 1 -1 -5,45
6 1 -1 1 -1 -7,19
7 -1 1 1 -1 285,44
8 1 1 1 -1 265,52
9 -1 -1 -1 1 -17,49
10 1 -1 -1 1 -22,72
11 -1 1 -1 1 582,47
12 1 1 -1 1 522,70
13 -1 -1 1 1 -16,35
14 1 -1 1 1 -21,58
15 -1 1 1 1 856,33
16 1 1 1 1 796,55
17 0 0 0 0 77,75
119
x1 x2 x3 x4
1 1 1 1 1
1 1 1 1 1
1 1 1 1 1
1 1 1 1 1
1 1 1 1 1
1 1 1 1 1
1 1 1 1 1
1 1 1 1 1
X = 1 1
(7.12)
1 1 1
1 1 1 1 1
1 1 1 1 1
1 1 1 1 1
1 1 1 1 1
1 1 1 1 1
1 1 1 1 1
1 1 1 1 1
1 0 0 0 0
- 5,83
- 7,57
194,16
174,23
- 5,45
- 7,19
285,44
265,52
y = - 17,49
(7.13)
- 22,72
582,47
522,70
- 16,35
- 21,58
856,33
796,55
77,75
120
y r = 214,75 10,85 x1 + 236,33 x 2 + 45,85 x3 + 111,65 x 4 (7.14)
N
yi
i =1
y= (7.15)
N
( )
N 2
SQ yy = y i y (7.16)
i =1
( )
N 2
SQ E = yi y r i (7.17)
i =1
( )
N 2
SQR = y r i y (7.18)
i =1
SQ yy = SQ R + SQ E (7.19)
121
A Eq. (7.19) mostra que a soma total dos quadrados particionada na soma dos
quadrados devida aos erros e na soma dos quadrados devida ao modelo ou devida
regresso. Quanto maior for a frao descrita pela regresso, melhor ser o ajuste do
modelo.
De posse destes parmetros que so as parcelas nas quais foi decomposta a
variabilidade total do modelo, constri-se a Tab. 7.8, conhecida como Tabela ANOVA
(anlise da varincia). Nesta tabela, p o nmero de parmetros estimados do modelo.
SQE
Erro SQE (N-p) MS E =
Np
Total SQyy (N-1)
122
Alm do teste de hipteses bsico, apresentado acima, os parmetros de soma dos
quadrados podem ser empregados em outras verificaes quanto qualidade do ajuste.
Neste caso, SQE decomposto como:
(
SQ E = yij yi ) + ( yi y i )2
2
i, j i, j
Onde:
SQE a soma dos quadrados do ajuste,
SQEP o erro mdio quadrtico das observaes (erro puro),
SQfaj a soma quadrtica da falta de ajuste.
SQfaj
mp
F= Fm p,m n
SQ EP
mn
Onde:
m o nmero de nveis.
n o nmero de replicaes.
SQR SQE
R2 = = 1 (7.20)
SQ yy SQ yy
123
7.4.3 Coeficiente de Mltipla Determinao Ajustado.
Uma vez que o valor de R2 cresce medida que novos termos so acrescentados ao
modelo, isto , quando o grau do polinmio ajustado aumentado, o coeficiente de
mltipla determinao ajustado (R2a), que leva em conta o nmero de termos no
modelo, pode ser usado como forma de verificar a influncia dos termos includos ou
retirados na qualidade da aproximao:
N 1
R a2 = 1 1 R 2 (7.21)
N p
MS E
CV = (7.22)
y
Exemplo 4: Analisar e comparar o ajuste obtido atravs da SR linear dada pela Eq.
(7.5) e da SR quadrtica dada pela Eq. (7.8).
Estas superfcies sero comparadas atravs dos parmetros estatsticos definidos
anteriormente. Caso nenhuma delas apresente um ajuste adequado, o prximo passo
seria adotar um polinmio de maior grau, at ter-se um ajuste adequado.
p = 3; N = 5; F0 = 14,89 (7.23)
124
Fixando-se um nvel de 95% de confiana para um teste com p-1 = 2 graus de
liberdade da soma SQR e N-p = 2 graus de liberdade da soma SQE, obtm-se F2, 2 =
19,00 > F0. Portanto, o ajuste no est estatisticamente validado. Ou seja, existe a
hiptese de que todos os coeficientes sejam nulos.
Observe tambm, que os valores de R2 e R2a esto relativamente distantes um do
outro. Ento se poderiam acrescentar novos pontos ao conjunto dos pontos observados,
a fim de obter um melhor ajuste. Entretanto, com foi visto anteriormente, o grfico da
funo Ep no tem um comportamento linear (Fig. 7.3). Portanto, ainda se uma
quantidade grande de dados fosse usada, o ajuste linear no permitiria uma distribuio
normal dos resduos. Assim, no teria sentido a analise da significncia do ajuste. Pois o
emprego do teste F pressupe uma distribuio normal dos resduos.
Para a SR quadrtica, Eq. (7.8), obtm-se os seguintes parmetros estatsticos:
F0 = 361,14; R2 = 0.9983
R2a = 0.9956 (7.24)
CV = 0.07961; p = 6; N = 9
bj
t=
se c jj
125
8. Referncias Bibliogrficas
Barros B. N., Scarminio I. S., Bruns R. E., Como Fazer Experimentos Pesquisa e
Desenvolvimento na Cincia e na Indstria, 2001. Campinas SP.
Bendat J. S., Piersol A. G., Randon Data Analysis and Measurement Procedures,
1986, USA.
Button S. T., Metodologia Para Planejamento Experimental E Anlise De Resultados,
2005. Campinas - SP.
Cunha F. D., Anlise de Confiabilidade de Sistemas: Fundamentos, Normatizao e
Estudo de Caso, 2007. Monografia apresentada Universidade Federal de
Uberlndia, curso de Segurana do Trabalho.
Duarte M. A. V., Ajuste de Modelos Dinmicos de Estruturas com no Linearidades
Concentradas, 1994. Tese de Doutorado apresentada Universidade Estadual de
Campinas. Faculdade de Engenharia Mecnica.
Shimakura, S. E., Ribeiro P. J., Apostila de Estatstica,2003. Departamento de
Estatstica da Universidade Federal do Paran.
Silva H. D., Estatstica, 2005.
Saramago S. F. P., Silva N.,Uma Introduo ao Estudo de Surperfcies de Resposta,
2006. Uberlndia MG.
126