Vous êtes sur la page 1sur 85

PLANEJAMENTO FATORIAL

Exemplo
O QUE É PLANEJAMENTO FATORIAL?

É uma ferramenta fundamentada na teoria estatística, que


fornece informações seguras sobre o processo, minimizando o
empirismo que envolve a técnica de tentativa e erro (Box et all,
1978).
PORQUE UTILIZAR O PLANEJAMENTO FATORIAL?

Porque através dele, pesquisadores podem determinar as


variáveis que exercem maior influência no desempenho de um
determinado processo (CALADO, V.; MONTGOMERY, D, 2003).
QUAIS AS VANTAGENS DO PLANEJAMENTO
FATORIAL?

1. Reduz o número de experiências ou repetições e melhora a qualidade


da informação obtida através dos resultados;

2. Os fatores são analisados simultaneamente;

3. É possível otimizar mais de uma resposta ai mesmo tempo;

4. Permite calcular e avaliar o erro experimental. Etapa essencial, pois


poderemos estimar a reprodutibilidade do resultado desejada e analisar
se a variação de uma resposta é fruto da alteração da condição de um
parâmetro ou se é devida a erros grosseiros.
METODOLOGIA DO PLANEJAMENTO FATORIAL

Para iniciar o planejamento fatorial, deve-se definir as


variáveis independentes ou fatores (entradas do sistema) e seus
respectivos níveis e as variáveis dependentes (respostas ou
saídas do sistema). Bruns, Neto e Scarminio (2001), ainda
ressaltam que os fatores, em geral, são as variáveis que o
experimentador tem condições de controlar, podendo estes,
serem qualitativos ou quantitativos.
TRATAMENTOS

• Experimentos delineados em esquemas fatoriais são aqueles


que envolvem combinações entre os níveis de dois ou mais
fatores;

• Em que cada combinação (ensaio ou provas) é um tratamento;

• Se todas as combinações possíveis, entre todos os níveis de


cada fator, estão presentes, o esquema fatorial é dito completo.
TRATAMENTOS

Se em um delineamento com dois fatores, cada qual com


dois níveis, sendo o fator A = Temperatura, com dois níveis ‘1’ e
‘2’ e B = pH, com dois níveis ‘1’ e ‘2’, temos as seguintes
combinações:

A1B1 - A1B2
A2B1 - A2B2
EXECUÇÃO DO PLANEJAMENTO FATORIAL
MODELO MATEMÁTICO

Após a obtenção dos resultados o processo permite a geração


de uma função que é capaz de prever os resultados de acordo com
alterações que possam acontecer nos fatores e para que isso ocorra
de uma maneira confiável, o planejamento fatorial permite calcular o
erro experimental.

O modelo matemático é apresentado da seguinte maneira:

Y = b₀ + b₁X₁ + b₂X₂ + b₃X₃ + b₁₂(X₁X₂) + b₁₃(X₁X₃) + b₂₃(X₂X₃)

Onde bn apresenta os coeficientes dos efeitos dos fatores X₁,


X₂, X₃, assim como de suas interações através de relações linerares.
EXEMPLO
EXEMPLO

Suponhamos um experimento para estudar a atividade


enzimática em função do:

• pH (fator A), com dois níveis que denominaremos apenas baixo


(-) e alto (+);
• Temperatura (fator B), que tem dois níveis: baixo (-) e alta (+);

Com um ensaio para cada nível e três repetições no ponto


central.
DEFINIÇÃO DAS VARIÁVEIS

Sendo assim:

Variáveis independentes, controláveis ou fatores são: pH e


Temperatura;

Variável dependente ou resposta é: atividade enzimática.


NÚMERO DE ENSAIOS

Nº de Repetições
Número de
Nº de Fatores (n) Nº de Níveis (X) no Ponto Central
Repetições (r)
(pc)

2 2 1 3

Nº Mínimo de ensaios (Me): Nº Total de ensaios (Te):

= = . +
=2 = 4 1 +3
=4 =7

O número de ensaios cresce exponencialmente, inviabilizando a utilização de esquemas completos


para 6 ou mais fatores com dois níveis e para 4 ou mais fatores com 3 níveis, sendo necessário a
aplicação de técnicas como DCCR.
MATRIZ DO PLANEJAMENTO FATORIAL

Matriz planejamento é a lista das combinações entre os níveis dos


fatores.

ENSAIOS pH (A) Temperatura (B) Atividade


1 -1 -1 200
2 1 -1 72
3 -1 1 404
4 1 1 250
5 0 0 150
6 0 0 140
7 0 0 160
EFEITO PRINCIPAL

O efeito principal de um fator ‘X’ pode ser entendido como


a variação causada na resposta, quando percorremos todos os
níveis de ‘X’, independente dos demais fatores
CÁLCULO DA MÉDIA

Atividade
200
200 + 72 + 404 + 250 + 150 + 140 + 160
72 é =
7
404
é = 196,57
250
150
140
160
CÁLCULO DOS EFEITOS (pH)

pH Atividade −1 ∗ 200 + 72 + −1 ∗ 404 + (250)


!=
-1 200 2

1 72
-1 404 ! = −141
1 250

A passassem do nível baixo para o nível alto do pH, levou a uma diminuição de 141 U/mL, na média
da atividade enzimática.
CÁLCULO DOS EFEITOS (Temperatura)

Temperatura Atividade −1 ∗ 200 + −1 ∗ 72 + 404 + (250)


& '( =
-1 200 2

-1 72
1 404 & '( = 191

1 250

A passassem do nível baixo para o nível alto da temperatura, levou a um aumento de 191 U/mL, na
média da atividade enzimática.
CÁLCULO DOS EFEITOS (AxB)

pH Temperatura Jogo de Atividade 200 + −1 ∗ 72 + −1 ∗ 404 + (250)


Sinal ) *=
2
-1 -1 1 200
1 -1 -1 72 ) * = −13
-1 1 -1 404
1 1 1 250

Neste exemplo, temos apenas uma interação de primeira ordem, isto é, uma interação entre os níveis
de dois fatores. O efeito da interação de primeira ordem pode ser entendido como a variação
causada na resposta, quando se faz variar os níveis de um dos fatores ‘dentro’ de cada nível do
outro.
AJUSTE DO MODELO

Fatores Efeito Coeficientes


Média 196,57 196,57
pH −141 -70,50
Temperatura 191 95,50
AxB −13 -6,5

Y = b₀ + b₁.X₁ + b₂.X₂ + b₃.X₃ + b₁₂.(X₁.X₂)

Para fins práticos, a estimativa bo é a media geral, e as estimativas


dos demais parâmetros são iguais a metade das estimativas dos
efeitos correspondentes:

Y = 196,57 - 70,50.X₁ + 95,50.X₂ - 6,5.X₁.X₂


ÁNALISE DE VARIÂNCIA

• O exame dos resíduos é fundamental, para que possamos avaliar a


qualidade do ajuste de qualquer modelo.

• Em primeiro lugar, os resíduos devem ser pequenos. Se um determinado


modelo deixa resíduos consideráveis, ele é um modelo ruim.

• O método mais usado para se avaliar numericamente a qualidade do


ajuste de um modelo é a Análise da Variância. Que consiste na
decomposição algébrica dos desvios das respostas observadas em
relação à resposta média global.
ÁNALISE DE VARIÂNCIA

Essa decomposição parte do principio de que:

Resposta observada (y) = valor estimado (ŷ) + erro correspondente (ê)


ÁNALISE DE VARIÂNCIA

Verificou-se que os vetores (ŷ) e (ê) são ortogonais, ou seja, seu produto
escalar é nulo.

Assim, genericamente, podemos associar a decomposição ortogonal do


vetor de respostas ao Teorema de Pitágoras.
ÁNALISE DE VARIÂNCIA

Pelo Teorema de Pitágoras, temos:

Essa decomposição acima é dita análise de variância.

Utilizando essa definição de norma ou comprimento de vetor:


ÁNALISE DE VARIÂNCIA

Dado que os temos dessa soma têm apelo de somas de quadrados, a


igualdade em questão é referida como:

SQ Total = SQ Parâmetros + SQ Resíduos

SQ Total = é a soma de quadrados devida à variação total;

SQ Parâmetros = é a soma de quadrados devida aos parâmetros


consideramos no modelo;

SQ Resíduos = é a soma de quadrados devida aos erros de ajustamento.


ÁNALISE DE VARIÂNCIA

SQ Total = SQ Parâmetros + SQ Resíduos

Aplicado ao exemplo, obtemos:

+, = +, ! + +, & + +, )* + +,- .
ÁNALISE DE VARIÂNCIA

Após os cálculos das soma de quadrados , monta-se a chamada Tabela de


Análise da Variância (ou simplesmente ANOVA, um acrônimo de Analysis of
Variance).

GRAUS DE SOMA DOS QUADRADO MEDIO


FONTE F CALC
LIBERDADE (GL) QUADRADOS (SQ) (QM)
SQ QM
Regressão p-1 SQ Parâmetros Parâmetros/GL Regressão/QM
regressão resíduo
SQ Resíduo/GL
Resíduos n-p SQ Resíduos -
Residuo
Total n-1 +, - -

p = numero de parâmetros do modelo linear; n = numero de ensaios; k = numero de ensaios distintos.


COEFICIENTE DE DETERMINAÇÃO (R²)

R² é chamado de coeficiente de determinação do modelo. O valor máximo


de R² é 1, e só ocorrerá se não houver resíduo nenhum e portanto toda a
variação em torno da média será explicada pela regressão. Quanto mais
perto de 1 estiver o valor de R², melhor terá sido o ajuste do modelo às
respostas observadas.
ÁNALISE DE VARIÂNCIA

• Soma dos quadrados dos fatores:

(2 ∗ / '0)
+,( ) =
+,1 ∗

SQ = Soma dos quadrados;


SQC = soma dos coeficientes;
r = repetições.
ÁNALISE DE VARIÂNCIA

• Soma dos quadrados dos fatores:


ÁNALISE DE VARIÂNCIA

• Soma dos quadrados Totais:

Quadrado das
Atividade
Atividades +, = Σ )' 3 − (&é )²
200 40.000
72 5.184 +, = 338.600 − 7 (196,57)²
404 163.216
250 62.500 +, = 68.117,71
150 22.500
140 19.600
160 25.600 +,- . = +, − +, ) − +, * − +,()*)
Total 338.600
+,- . = 68.117,71 − 19.881 − 36.481 − 169
+,- . = 11.586,71
ÁNALISE DE VARIÂNCIA

• Tabela ANOVA:

Graus de Soma dos Quadrados


Causas F-Calc
Liberdade (GL) Quadrados (SQ) Médios (QM)
pH 1 19.881 19.881 5,15
Temperatura 1 36.481 36.481 9,45
pH x T 1 169 169 0,04
Resíduo 3 11.586,71 3.862,24 -
Total 6 68.117,71 - -

11.586,71 O que significa que 17% da variação total


- = - = 17% em torno da média é explicada pela
68.117,71 regressão. Para os resíduos fica 83%.
ÁNALISE DE VARIÂNCIA

O quociente entre dois-quidrados independentes, divididos por seus respectivos graus de


liberdade, tem distribuição F de Snedecor com graus de liberdade das somas de
quadrados envolvidos.

Assim, por exemplo, para testar a hipótese de ausência de regressão linear, ou seja, a
hipótese de que a reta é paralela ao eixo X, não existindo assim a interação entre fatores,
podemos escrever:
Hipótese 1: b1=0 (não existe interação);
Hipótese 2: b1≠0 (existe interação).

9:;<
Assim, se 7 8 = ≥ Ftab (n1,n2,α), rejeita-se a primeira hipótese e conclui-se
9: ;=>
sobre a existência da regressão linear.
ÁNALISE DE VARIÂNCIA

De uma forma mais clara, o F teste, verifica possiblidade do primeiro termo da


equação, b1, ser igual a 0:

Y = b₀ + b₁.X₁ + b₂.X₂ + b₃.X₃ + b₁₂.(X₁.X₂)

Caso, isso venha a ser comprovado, consequentemente constata-se que não


existe interação nenhuma e o que modelo não se adequa aos valores observados gerado
gráficos sem inclinação:
TESDE DE HIPÓTESES

É importante fixar o nível de significância α e determinar as regiões criticas


do teste. Em geral α=0,05 (5%) para delineamentos completos ou α=0,1
(10%) para delineamentos de seleção de variáveis.
Nesse exemplo adota-se α=0,05 (5%).

Regiões criticas são as regiões


de não rejeição de Ho, que
denotaremos RA Ho , e de
rejeição de o que denotaremos
RR Ho.
TESDE DE HIPÓTESES

Teoricamente, isto significa que se retirarmos todas as amostras possíveis


de uma população e. com cada uma delas construirmos um intervalo de
confiança, então, 95% dos intervalos construídos devem conter a média
populacional. Em outras palavras, 5 em cada 100 ou 1 em cada 20
intervalos não deve conter a média populacional.
ÁNALISE DE VARIÂNCIA

• Tabela ANOVA simplificada:

Graus de Soma dos Quadrados


Causas F-Calc
Liberdade (GL) Quadrados (SQ) Médios (QM)
Regressão 3 56.531,00 18.843,67 4,87
Resíduo 3 11.586,71 3.862,24 -
Total 6 68.117,71 - -

% variação explicada (R²) = 17% Ftab 3; 3; 0,05 = 9,28

, -? 18.843,67
7 8 = 7 8 = 7 8 = 4,87
, - . 3.862,24

Assim, se Fcalc ≤ Ftab, logo conclui-se a não existência da regressão linear.


ESTIMATIVA POR PONTO E POR INTERVALO E TESTE
DE HIPÓTESES PARA OS EFEITOS
ERRO PADRÃO

Erro padrões:

D , - .
ep y =
C

n = número de ensaios.
ERRO PADRÃO

Para demais efeitos:


Para a constante:
D 11.586,71
ep A; B; A ∗ B =
D 11.586,71 1
ep média =
7
ep A; B; A ∗ B = 62,15
ep média = 23,49

Regressão:
62,15
ep A; B; A ∗ B =
2

ep A; B; A ∗ B = 31,07
TESDE DE HIPÓTESES

Nesse tópico vamos testar a hipótese de nulidade de cada um dos efeitos,

Hipótese 1: pH = 0;
Hipótese 2: Temp = 0;
Hipótese 3: AB = 0;

Comparando os valores de Tcalc com o valor de Ttab.


TESDE DE HIPÓTESES

• Rejeita-se as hipóteses anteriores, quando t calc ≥ t tab ou,


equivalentemente, quando p – valor ≤ 0,05.
TESDE DE HIPÓTESES

• Não se rejeita as hipóteses quando t calc < t tab ou, equivalentemente,


quando p – valor > 0,05.
TESDE DE HIPÓTESES

Probabilidade de significância, p-valor ou nível descritivo do teste:

Quando o teste de hipóteses é feito em computador, através de


algum programa estatístico, recebemos como output o p-valor (p-value),
nível descritivo ou probabilidade de significância do teste, que é a
probabilidade de ocorrência de valores da variável V do teste mais
extremos que o obtido através dessa amostra.
Dessa forma rejeitamos a hipótese nula, conforme valor seja,
respectivamente, menor ou não que o nível α de significância, estabelecido
a priori.

α = 0,05 = nível de significância = área à direita de T tab.


P-valor = área à direita de T calc.
EFEITOS PADRONIZADOS

• Efeito padronizado ou Tcalc:

MN=OPQ
T 8 =
MRRQ STURãQ

• Ttab:

T ' W = (nº de graus de liberdade do resíduo; α [nível de significância])


EFEITOS PADRONIZADOS

tTab= 3,18
Os valores devem ficar fora da
faixa -3,18 < t calc < 3,18, para 191
comprovação da não-nulidade. T calc Temp =
62,15
T calc Temp = 3,07

196,57 −13
T calc média = T calc AB =
23,49 62,15
T calc média = 8,36 T calc AB =-0,20

−141
T calc pH = Nota-se que com exceção da média,
62,15 todos pertencem a região de não rejeição
T calc pH = −2,26 das hipóteses de nulidade.
INTERVALO DE CONFIANÇA [IC]

Podemos obter as estimativas por intervalo através dos valores de


Ttab, para os testes de nulidade dos efeitos. Os efeitos serão
estatisticamente significativos, se no intervalo em questão, não contiver o
ponto zero.
INTERVALO DE CONFIANÇA [IC]

tTab=t(GL resíduo, nível de significância/2)


tTab=t(3, 5%/2)
tTab= 3,18

IC [Média]: coeficiente de regressão ± Ttab (ep(Efeito))


IC[Média]: 196,57 ± 3,18(23,49) => 121,87 ≤ Média ≤ 271,26
IC[pH]: −70,5 ± 3,18(31,07) => -169,30 ≤ pH ≤ 28,30 – contem o valor zero;
IC[Temp]: 90,50 ± 3,18(31,07) => -3,39 ≤ Temp ≤ 194,30 - contem o valor zero;
IC[pHxTemp]: -6,50 ± 3,18(31,07) => -105,30 ≤ pHxTemp ≤ 92,30 - contem o valor zero.
INTERVALO DE CONFIANÇA [IC]

• Ajuste do modelo:

Nível de significância de 5% (p < 0,05).

Estimativas por Intervalo (95%)


Coeficiente Erro
Fatores tCalc (3) Limite
de Regressão Padrão Limite Inferior
Superior
Média 196,57 23,49 8,37 121,87 271,26
pH - X1 -70,50 31,07 -2,27 -169,30 28,30
Temp - X2 95,50 31,07 3,07 -3,39 194,30
X1.X2 -6,50 31,07 -0,21 -105,30 92,30

Com exceção da média, nenhum efeito foi estatisticamente significativo.


CODIFICANDO E DESCODIFICANDO VARIAVÉIS

• Codificando Variáveis: • Descodificando Variáveis:

8 − &é >lm=ROQR − O N=ROQR


0 = R=Tj = kQU + néUOT
.( 0 − C/ 0 2
2
F tab
T tab
EXEMPLO USANDO STATISTICA
1º PASSO

• Abrir o Statistica em seguida clica em Statistics e segue o esquema


abaixo
2º PASSO

Parte 1 Parte 2
3º PASSO

Number of genuine replicates: número


de replicas, nesse caso, não teremos
nenhuma, 0.

Number of center points: número de


pontos centrais, no exemplo, temos 3.

Numer of blank columns: número de


colunas em brando, na qual vamos inserir
os resultados dos ensaios, nesse caso
inserimos apenas uma coluna, pois
obtemos como resposta apenas a
atividade enzimática.
4º PASSO

Denote fators: os fatores serão


denotados por nomes;

Order of runs: ordem de ensaios,


selecionamos ordem padrão;

Após os ajustes, clicamos em Change


fator names, values, etc, para inserir o
nome dos fatores.
5º PASSO

Parte 1 Parte 2
6º PASSO

Summary: Display desing

Aqui vamos inserir os resultados obtidos


nos ensaios.
7º PASSO

Apaga-se DV_1, e inseri o nome da


resposta desejada, nesse exemplo,
inserimos, Ativ, em seguida em,
clicamos em OK.
Nas células abaixo, insere-se os
resultados dos ensaios.

Parte 1 Parte 2
8º PASSO

Ao final a tabela fica assim, devemos


salvá-la antes de prosseguir.
9º PASSO: SALVANDO A MATRIZ PLANEJAMENTO

Parte 1 Parte 2
10º PASSO: SALVANDO A MATRIZ PLANEJAMENTO

Em seguida salvamos o arquivo em alguma pasta, verificamos se a extensão do arquivo é .sta, e clicamos em
salvar.
11º PASSO

Em seguida para evitar erros, fechamos o programa e abrimos novamente, e executamos os


seguintes comandos.
12º PASSO

Essa janela irá aparecer, primeiro devemos selecionar o arquivo que acabamos de salvar e em
seguida clicar em OK.
13º PASSO

Parte 1 Parte 2
14º PASSO

Pressionado o botão Crtl, selecionamos as variáveis, lembrando que em Dependent, selecionamos a


variável correspondente a resposta e em Indep. Selecionamos as variáveis correspondente aos
fatores, e clicamos em OK.

Parte 1 Parte 2
15º PASSO

Essa janela irá aparecer, primeiro devemos clicar em Model para realizar algumas alterações.
16º PASSO
17º PASSO: B (Manual x Statistica)

Estimativas por Intervalo (95%)


Coeficiente Erro
Fatores tCalc (3) Limite
de Regressão Padrão Limite Inferior
Superior
Média 196,57 23,49 8,37 121,87 271,26
pH - X1 -70,50 31,07 -2,27 -169,30 28,30
Temp - X2 95,50 31,07 31,07 -3,39 194,30
X1.X2 -6,50 31,07 -0,21 -105,30 92,30

Efeitos dos fatores Coeficientes do modelo matemático


17º PASSO: C (Manual x Statistica)

Graus de Soma dos Quadrados


Causas F-Calc
Liberdade (GL) Quadrados (SQ) Médios (QM)
pH 1 19.881 19.881 5,15
Temperatura 1 36.481 36.481 9,45
pH x T 1 169 169 0,04
Resíduo 3 11.586,71 3.862,24 -
Total 6 68.117,71 - -
17º PASSO: D

Gráfico de Pareto com os efeitos


padronizados (Tcalc);

O diagrama de Pareto, apresenta de forma


rápida e clara os efeitos que são
estatisticamente importantes. Os efeitos
cujos retângulos estiverem à direita da
linha divisória (p = 0,05) devem ser
considerados no modelo matemático.
18º PASSO
18º PASSO: A

Os resultados apresentados
anteriormente podem também ser
visualizados através de uma superfície,
chamada Superfície de Resposta, que no
caso de um planejamento fatorial
comum, terá a forma de um plano, visto
que o modelo matemático é linear.
18º PASSO: B

Nas curvas de nível, cada linha tem um


mesmo valor da variável de resposta.
Quando essas linhas não têm curvatura,
pode-se dizer que não há efeito de
interação entre as variáveis colocadas
nos eixos.
18º PASSO: C

Os valores previstos versus os valores


observados podem ser visualizados na
Figura ao lado. Quanto mais os dados
experimentais caem próximos à linha
reta, melhor o ajuste do modelo.
19º PASSO
19º PASSO: A – Efeitos isolados
19º PASSO: B – Efeito entre fatores

Se essas linhas fossem perfeitamente paralelas,


o efeito de interação não seria importante.
Como as linhas nos diferentes níveis de
temperatura não se cruzam, o efeito de
interação entre a pH e a temperatura é
praticamente inexistente.
19º PASSO: C

Representação esquemática dos resultados obtidos.


CALCULANDO P-VALUE NO STATISTICA
CALCULANDO P-VALUE NO STATISTICA (TEST F)
Seleciona o “F (Fisher)”
Seleciona: “1-cumulative p”

Insere graus de
liberdade do fator.

Insere graus de
Insere o valor do liberdade do resíduo.
F calc E clica em compute

Resultado do p-value
CALCULANDO P-VALUE NO STATISTICA (TEST T)
Seleciona o “t (Student)”
Seleciona: “1-cumulative p”
Seleciona: “Two-tailed”

Insere graus de
Insere o valor do liberdade do resíduo.
T calc E clica em compute

Resultado do p-value
CALCULANDO Ftab NO STATISTICA
Deselecionar todos os itens, a opção Inverse não altera nenhum resultado

Insere graus de
liberdade do fator.
Seleciona “F (Fisher)”

Insere graus de
Valor de Ftab liberdade do resíduo.

E clica em compute

Se o α=5%;
Fazemos 100-5=0,95,
E inserimos esse valor
no software.
CALCULANDO Ttab NO STATISTICA
Deselecionar todos os itens

Seleciona “t (Student)”

Insere graus de
Valor de Ttab liberdade do resíduo.

E clica em compute

Se o α=5%;
Fazemos 5%/2=2,5%
Em seguida 100-2,5%=0,975,
E inserimos esse valor no
software.

Vous aimerez peut-être aussi