Vous êtes sur la page 1sur 408

BIOESTATSTICA

Aplicada Pesquisa Experimental

BIOESTATISTICA_VOL02.indb 1 25/06/12 17:20


BIOESTATISTICA_VOL02.indb 2 25/06/12 17:20
BIOESTATSTICA
Aplicada Pesquisa Experimental

VOLUME 2

M AU RO J O S FO N T E L L E S
Doutor em Cirurgia pela Faculdade de Cincias Mdicas da Unicamp
Professor das Disciplinas de Anatomia Humana e Bioestatsca da
Universidade do Estado do Par (UEPA).
Membro Titular do Colgio Brasileiro de Cirurgies (TCBC).
Membro da Associao Brasileira de Educao Mdica (ABEM).
Membro da Associao Brasileira de Mdicos Escritores (SOBRAMES).

BIOESTATISTICA_VOL02.indb 3 25/06/12 17:20


Copyright 2012 Editora Livraria da Fsica
1a edio

Direo editorial Jos Roberto Marinho


Editor-assistente Victor Pereira Marinho

Capa Ana Maria Hitomi/Typodesign
Projeto grfico e diagramao Typodesign

Edio revisada segundo o Novo Acordo Ortogrfico da Lngua Portuguesa

Dados Internacionais de Catalogao na Publicao (CIP)


(Cmara Brasileira do Livro, SP, Brasil)

Fontelles, Mauro Jos


Bioestatstica aplicada pesquisa experimental: volume 2/
Mauro Jos Fontelles. So Paulo:
Editora Livraria da Fsica, 2012.

Bibliografia
ISBN 978-85-7861-138-5

1. Bioestatstica 2. Pesquisa - Experincias I. Ttulo.

12-01764 CDD-570.15195

ndice para catlogo sistemtico


1. Bioetatstica e pesquisa experimental:
Cincias biolgicas 570.15195

Todos os direitos reservados. Nenhuma parte desta obra poder ser reproduzida
sejam quais forem os meios empregados sem a permisso da Editora.
Aos infratores aplicam-se as sanes previstas nos artigos 102, 104, 106 e 107
da Lei no 9.610, de 19 de fevereiro de 1998

Editora Livraria da Fsica


www.livrariadafisica.com.br

BIOESTATISTICA_VOL02.indb 4 25/06/12 17:20


BIOESTATISTICA_VOL02.indb 5 25/06/12 17:20
BIOESTATISTICA_VOL02.indb 6 25/06/12 17:20
querida esposa Marilda, companheira inseparvel, que
por sua dedicao incondicional famlia,
propiciou momentos tranquilos para que esta obra
pudesse ser concluda.
Aos filhos Gustavo e Renata.
Orgulhosos admiradores deste autor.
minha me Celina, corao bondoso a perdoar
os longos perodos de ausncia do filho, no por falta
de lembranas, mas escrever preciso.

BIOESTATISTICA_VOL02.indb 7 25/06/12 17:20


BIOESTATISTICA_VOL02.indb 8 25/06/12 17:20
Prefcio

Quando fui gentilmente convidado para fazer o prefcio deste livro, senti-me pres-
tigiado e contente, mas, conhecendo na sua plenitude o que pretendia a referida obra,
confesso que sofri. Uma vez que sempre enfrentei, de frente, as dificuldades da vida, e,
se era este, um grande desafio, dispus-me a enfrent-lo.
A histria deste livro teve incio h muitos anos atrs, quando o Professor Mauro
Fontelles veio at ns, na Universidade Estadual de Campinas, para realizar, sob minha
orientao, suas teses de Mestrado e Doutorado, as quais foram concludas e defendidas
com raro brilhantismo. Como seu orientador, pude, de perto, acompanhar o interesse e
a necessidade deste Professor em adquirir, em curto prazo, todo o aprendizado relativo
Bioestatstica, o qual era exigido para os seus estudos, nas suas teses. A poca, alm
de ter demonstrado ser um mdico detentor de vasto conhecimento clnico, a par de
suas excelentes qualidades como exmio cirurgio e pesquisador de mo cheia, dedi-
cou-se com muito afinco, adquirindo vasta experincia sobre o assunto, tornando-se,
consequentemente, um especialista na rea, o que lhe conferiu uma grande vanta-
gem sobre os estaticistas disponveis. Com este cabedal, soube muito bem aplicar seus
conhecimentos, quando, ento, passou a oferecer uma anlise crtica mais apurada
e minuciosa em seus trabalhos de pesquisa. Assim, ao apreciarmos o vasto contedo
desta obra, temos a certeza que ser de grande valia para estudantes, professores e
pesquisadores, pois, talvez nenhuma outra rea do saber tenha expandido tanto seus
horizontes quanto a Bioestatstica, a qual tem sido amplamente empregada no campo
da pesquisa e, em decorrncia desta grande expanso e do intercmbio com outras

BIOESTATISTICA_VOL02.indb 9 25/06/12 17:20


reas de conhecimento, vem contribuindo de forma decisiva para tornar a rotina do
pesquisador, atravs de leitura de livros como este que ora temos a rara oportunidade
de apreciar, um trabalho mais produtivo e interessante.
Desta forma, o valor altamente relevante desta obra esclarecer dvidas e apre-
sentar solues que a pesquisa nos impe, de modo a abrir um novo caminho que permita
sua aplicao direta em estudos de campo ou laboratoriais, sejam clnicos ou experi-
mentais. Nesta atividade, ocorre um fato notrio: quando os trabalhos de pesquisa so
concludos e, na nsia de comunicar os seus resultados em congressos ou publicaes,
existe sempre a necessidade de divulgar estes achados com uma preciso estatstica que
permita avaliaes mais acuradas e anlises justas dentro da metodologia cientfica.
Atualmente, em grande parte das publicaes, a Bioestatstica disposio muitas
vezes aplicada por profissional no mdico, o que, no entendimento do pesquisador,
torna-a frequentemente confusa ou no expressa a grandeza da avaliao clnica ou
experimental, da a necessidade de respaldo de algo mais profundo, sendo esta a carac-
terstica do livro em questo, o qual, dentro do esprito crtico do autor, passa a oferecer
uma tica diferente para o entendimento desta importante ferramenta de pesquisa.
Portanto, trata a presente obra, de um livro muito bem planejado e bastante did-
tico, pois aborda os aspectos da Bioestatstica mais utilizados em projetos de pesquisa
na rea das Cincias da Sade. Destarte, um de seus objetivos fornecer ao pesquisador
iniciante e alunos dos cursos de graduao e ps-graduao, um texto direto e de fcil
compreenso, tornando o aprendizado desta importante cincia uma tarefa mais sim-
ples e de maior aplicao. Assim, o lanamento deste livro a coroao dos esforos do
autor para a aplicao prtica da parte dos interessados pelo tema, sobre o qual tenho
a certeza que alcanar todos os seus objetivos, de modo a contribuir para a formao
dos profissionais dos cursos de graduao e como fonte de complementao de conheci-
mento das reas da sade e de outros profissionais de reas correlatas, sendo, portanto,
motivo de jbilo e muito orgulho para o autor, pois contribui de forma inegvel para
todos que se interessam pelo assunto por ele abordado.
A todos e a todas, fica aqui o convite para que a leitura deste livro seja um
estmulo ao consciente que traduza o conhecimento, em resposta s necessidades
acadmicas do nosso pas.

Dr. Mario Mantovani (in memorian).


Professor Titular do Departamento de Cirurgia da Unicamp.

BIOESTATISTICA_VOL02.indb 10 25/06/12 17:20


SUMRIO

VOLUME 2

Parte III TESTES DE HIPTESE PARAMTRICOS.................................................. 17


11. Teste t de Student ................................................................................................ 19
11.1. A distribuio t de Student .......................................................................... 19
11.2. O teste t de Student .................................................................................... 27
11.2.1. Teste t para amostras independentes com varincias iguais ............... 29
11.2.2. Teste t para amostras independentes com varincias desiguais .......... 35
11.2.3. Teste t para amostras pareadas (emparelhadas) ................................ 38
12. Correlao e regresso linear simples ................................................................... 45
12.1. Correlao linear simples ............................................................................. 46
12.1.1. Diagrama de disperso ...................................................................... 48
12.1.2. Coeficiente de correlao produto-momento (r) ................................. 50
12.1.3. Teste de hiptese para correlao ...................................................... 54
12.1.4. Coeficiente de determinao (r2) ......................................................... 56
12.2. Regresso linear simples ............................................................................. 57
12.2.1. Determinao da reta de regresso .................................................... 59
12.2.2. Teste de hiptese para regresso linear .............................................. 62
12.2.3. Anlise de resduos ............................................................................ 66
13. Testes de aderncia ............................................................................................. 73
13.1. Teste Kolmogorov-Smirnov (teste D) ............................................................ 75
13.2. Teste de Shapiro-Wilk (teste W) ................................................................... 78

Parte IV TESTES DE HIPTESE NO-PARAMTRICOS........................................... 83


14. Distribuio qui-quadrado .................................................................................... 85
14.1. Tabelas de contingncia .............................................................................. 86
14.2. A distribuio qui-quadrado ......................................................................... 89
14.3. Teste do qui-quadrado ................................................................................ 91
14.3.1. Teste do qui-quadrado da independncia ........................................... 95

BIOESTATISTICA_VOL02.indb 11 25/06/12 17:20


14.3.2. Teste do qui-quadrado da homogeneidade ........................................ 97
14.3.3. Teste do qui-quadrado de aderncia (ajustamento) ............................. 101
14.4. Teste do qui-quadrado de McNemar ............................................................ 108
14.5. Teste exato de Fisher ................................................................................... 117
15. Probabilidade e medidas de associao ............................................................... 121
15.1. Teoria da probabilidade ................................................................................ 122
15.1.1. Operaes com probabilidades .......................................................... 124
15.2. Medidas de associao ............................................................................... 126
15.2.1. Razo de risco (RR) ........................................................................... 129
15.2.2. Razo de chances (odds ratio) ........................................................... 131
15.2.3. Risco atribuvel (RA) ........................................................................... 134
15.2.4. Porcentagem de Risco Atribuvel (RA%) ............................................. 135
15.2.5. Risco Atribuvel na Populao (RAP) ................................................... 136
15.2.6. Porcentagem de Risco Atribuvel na Populao (RAP) ........................ 136
16. Testes de rastreamento diagnstico ..................................................................... 139
16.1. Bases para os testes de rastreamento diagnstico ...................................... 140
16.2. Indicadores de um teste diagnstico ............................................................ 144
16.2.1. Sensibilidade e especificidade ............................................................ 144
16.2.2 Curva ROC ......................................................................................... 150
16.2.3. Acurcia e prevalncia ....................................................................... 154
16.3. Valores preditivos ........................................................................................ 155
16.4. Razo de probabilidades (verossimilhana) .................................................. 157
16.5. Combinaes de mltiplos testes diagnsticos ............................................ 159
16.5.1. Testes em paralelo ............................................................................. 161
16.5.2. Testes em srie .................................................................................. 163
16.6. Teorema de Bayes ....................................................................................... 166
17. Inferncia para variveis ordinais .......................................................................... 171
17.1. Teste U de Wilcoxon-Mann-Whitney ............................................................ 172
17.2. Teste T de Wilcoxon .................................................................................... 178
17.3.Coeficiente de correlao de Spearman ........................................................ 183
17.4. Teste de concordncia kappa ...................................................................... 189
17.5. Teste paramtrico versus no-paramtrico ................................................... 192

Parte V ANALISE MULTIVARIADA............................................................................. 195


18. Anlise conceitual multivariada ............................................................................. 197
18.1. Bases conceituais da estatstica multivariada ............................................... 198
18.2. Objetivos da estatstica multivariada ............................................................. 200
18.3. A escolha do teste estatstico ...................................................................... 201
19. Anlise de Varincia (ANOVA) ............................................................................... 205
19.1. Base conceitual da ANOVA (Teste F) ............................................................ 207

BIOESTATISTICA_VOL02.indb 12 25/06/12 17:20


19.2. Tipos de ANOVA ......................................................................................... 209
19.2.1. Requisitos para uso da ANOVA .......................................................... 212
19.3. ANOVA de um critrio .................................................................................. 213
19.4. Testes de comparaes mltiplas ................................................................ 216
19.4.1. Teste Tukey (HSD) .............................................................................. 216
19.4.2. Teste de Student-Newman-Keuls (SNK) ............................................. 222
19.4.3. Teste de Bonferroni ............................................................................ 224
19.5. ANOVA de mltiplos critrios ....................................................................... 225
20. Anlise de varincia no-paramtrica ................................................................... 231
20.1. Teste de Kruskal-Wallis ................................................................................ 232
20.1.1. Teste de Dunn (Teste Q) ..................................................................... 237
20.2. Teste de Friedman ....................................................................................... 240
21. Regresso mltipla ............................................................................................... 245
21.1. Regresso linear mltipla ............................................................................. 245
21.1.1. Construo do modelo....................................................................... 248
21.2. Regresso logstica simples e mltipla ......................................................... 256
22. Anlise de sobrevida ............................................................................................ 267
22.1. Mtodo atuarial ........................................................................................... 269
22.2. Mtodo de Kaplan-Meier ............................................................................. 273
22.3. Testes de significncia estatstica ................................................................. 277
22.3.1. Teste do logrank ................................................................................ 277
22.3.2. Estatstica do qui-quadrado de Mantel-Haenszel ................................ 282
23. Experimentos fatoriais .......................................................................................... 287
23.1. Noes bsicas sobre experimentos fatoriais ............................................... 288
23.2. Experimento fatorial 22 ................................................................................ 296
23.3. Experimento fatorial no MINITAB .................................................................. 305
23.4. Anlise de superfcie de resposta ................................................................. 323

Tabelas ................................................................................................................... 335


Referncias bibliogrficas .............................................................................. 397
ndice remissivo ................................................................................................... 403

BIOESTATISTICA_VOL02.indb 13 25/06/12 17:20


BIOESTATISTICA_VOL02.indb 14 25/06/12 17:20
Vo l u m e I I

BIOESTATISTICA_VOL02.indb 15 25/06/12 17:20


BIOESTATISTICA_VOL02.indb 16 25/06/12 17:20
parte 3

Testes de Hipteses
paramtricos

No interessa quem disse isso ou aquilo,


a natureza no d a menor bola para a autoridade.
O nico modo de aprender algo sobre
os fenmenos naturais mediante experimentos
cuidadosos.

Galileu Galilei (1564-1642)

BIOESTATISTICA_VOL02.indb 17 25/06/12 17:20


BIOESTATISTICA_VOL02.indb 18 25/06/12 17:20
11
Teste t de Student

11.1 A DISTRIBUIO t DE STUDENT

A distribuio t foi desenvolvida pelo matemtico ingls William Gosset1,


pesquisador da empresa de cerveja irlandesa Guinness, que, em 1908, publi-
cou seu trabalho com o pseudnimo de Student, trabalho este posteriormente
aperfeioado por Sir Ronald Fisher2, em 1926.
Semelhante distribuio z, a t de Student uma distribuio terica de
probabilidades, que tem sua aplicao direcionada para a inferncia estats-
tica que trabalha com mdias de pequenas amostras, quando o desvio padro
da populao () no conhecido. O fundamento da distribuio t de Student
tem por base o princpio no qual, em um teste de hiptese, geralmente a mdia
da populao tomada como referncia (0) conhecida, mas se desconhece o
desvio padro populacional () e, portanto, no se conhece, tambm, o erro
padro, situao esta que impede o teste de hiptese. Neste caso, a soluo
considerar que a variao da amostra semelhante da populao e, ento,

1. William Sealy Gosset (1876-1937) Qumico e matemtico ingls conhecido pelo pseudnimo
de Student, ficou famoso pelo seu trabalho no desenvolvimento da distribuio t de Student.
2. Sir Ronald Aylmer Fisher (1890-1962) Estatstico e bilogo ingls, criador das fundaes
para a cincia estatstica moderna.

BIOESTATISTICA_VOL02.indb 19 25/06/12 17:20


substituir o desvio padro da populao () pelo desvio padro amostral (s),
para que se possa obter o erro padro estimado (EP) para a mdia, o qual
dado pela frmula:

s
X = , onde: EP =
n n

A restrio desta substituio que ela verdadeira somente para grandes


amostras aleatrias, no sendo verdade para pequenas amostras. Assim, a fim
de resolver esta questo, William Gosset props que, quando em um teste de
hiptese, desvio padro populacional () desconhecido, o valor crtico obtido
na curva normal z deve ser substitudo pelo valor crtico da distribuio por ele
idealizada, a distribuio t de Student, o qual calculado por:

x x
z= , onde substituindo por s , temos: t =
s
n n

Assim, como o desvio padro populacional () substitudo pelo des-


vio padro da amostra (s), se tomarmos uma srie infinita de valores de t,
o histograma da distribuio mostrar uma forma semelhante curva nor-
mal gaussiana, com mdia igual a zero, porm com o pico ligeiramente mais
achatado e com as caudas mais elevadas. Ou seja, a distribuio t de Student
platicrtica em relao curva normal. A Figura 11.1 mostra a relao entre
as duas curvas.
Observe que as deformaes das duas curvas so diferentes, e que os pon-
tos de inflexo no so coincidentes. Como consequncia desta diferena, os
valores que correspondem ao ponto crtico o qual delimita a rea bilateral de
significncia de 0,05 tambm no so coincidentes, ficando o da distribuio t
de Student ligeiramente mais afastado de 0 quando comparado ao ponto cr-
tico da distribuio normal, aumentando, portanto, a probabilidade do erro
tipo I em um teste de hiptese. Para solucionar esta diferena, William Gosset
calculou novos valores crticos e criou uma nova tabela para a distribuio t,
cujos valores so maiores que os da distribuio normal z, em razo da subs-

20 Bioestatstica aplicada Pesquisa Experimental

BIOESTATISTICA_VOL02.indb 20 25/06/12 17:20


Fig. 11.1 Comparao entre a distribuio normal e a distribuio t de Student


para uma amostra com n = 30. Notar a diferena dos valores crticos que delimitam a regio
de significncia de 0,05, bilateral

tituio, na frmula, do desvio padro populacional () pelo desvio padro


da amostra (s).
Outra diferena importante entre as duas distribuies que, na distribui-
o normal z, o tamanho da amostra no interfere no clculo do valor crtico,
ao passo que, na distribuio t de Student, a diferena entre e s depende do
tamanho da amostra. por essa razo que os valores crticos, na distribuio t,
so calculados no somente com base no nvel de significncia () estipulado
na pesquisa, mas, tambm, com base no tamanho da amostra, o qual determi-
nado em graus de liberdade (gl), cujo valor igual a n 1. Assim, o valor de
t deve sempre ser indicado pela notao t;gl. Por exemplo: se tomarmos uma
amostra com n = 30 e considerarmos um nvel = 0,05, bicaudal, o valor crtico
na distribuio normal gaussiana ser z = 1,96, enquanto, na distribuio t, esse
valor passa para t0,05;29 = 2,045(gl = 30 1 = 29), como mostrado na Figura 11.1.
Note que, para o exemplo acima citado, se for utilizada a distribuio t
para verificar se a diferena entre as mdias pode ser considerada como esta-
tisticamente significativa, necessrio que ela seja igual ou maior que 2,045
erros padro. Se fosse considerada a distribuio normal, esse valor deveria
ser igual ou maior que 1,96 erros padro. Ou seja, ao utilizar a distribuio t, o
pesquisador necessita, no teste de hiptese, de um valor crtico maior para que
a hiptese nula seja rejeitada. Na prtica, medida que o tamanho da amostra

Teste t de Student 21

BIOESTATISTICA_VOL02.indb 21 25/06/12 17:20


aumenta, a diferena entre as duas distribuies diminui, sendo consideradas
iguais para valores de n > 30.
Em outras palavras: caso o desvio padro populacional seja desconhecido,
o pesquisador pode estim-lo pela utilizao do desvio padro amostral, desde
que a inferncia estatstica seja feita pela aplicao do teste t de Student e que
a distribuio de frequncia dos valores de x da amostra siga o padro da dis-
tribuio normal. Caso contrrio, o pesquisador dever converter os dados
para valores z ou utilizar testes no-paramtricos. De qualquer forma, caso o
pesquisador tenha alguma dvida quanto ao padro de normalidade dos seus
dados, ele dever utilizar o histograma ou aplicar um teste de aderncia, tal
como o teste de Smirnov-Kolmogorov ou o teste do qui-quadrado de ade-
rncia, os quais sero discutidos em outro captulo deste livro. A Figura 11.2
mostra o algoritmo para a aplicao da distribuio t de Student.

Incio

Pelo teorema do limite


Sim central, pode-se
N > 30
utilizar a distribuio t
de Student.
No

Converter os dados* * Frmulas para


A populao tem No ou utilizar testes no- converter os dados
distribuio normal?
paramtricos. para uma distribuio
Sim normal
(1) x = log x
Utilizar a distribuio (2) x =
O desvio padro da Sim
populao normal (3) x = 1/x
conhecido? (4) x = x2
(1, 2, 3) Indicadas
No
para curvas com
inclinao direita.
Utilizar a distribuio t
(4) Indicada para
de Student com o
curvas inclinadas
desvio padro da
amostra. esquerda.

Fig. 11.2 Algoritmo de deciso para a utilizao do teste t de Student

22 Bioestatstica aplicada Pesquisa Experimental

BIOESTATISTICA_VOL02.indb 22 25/06/12 17:20


Propriedades da distribuio t de student
A mdia igual a zero;
Diferente da curva normal padronizada, a distribuio t no descrita
como uma distribuio nica, mas por uma famlia de distribuies, pois,
para cada grau de liberdade da amostra, h uma curva t diferente;
As curvas tm a forma de sino e so simtricas em torno da mdia, porm
so mais achatadas (platicrticas) em relao curva normal padronizada;
Quanto maior o tamanho da amostra, mais a distribuio t se aproxima da
distribuio normal padronizada, pois, quando n tende para , o desvio
padro da amostra (s) tender para . Para n > 30, a distribuio t consi-
derada, na prtica, igual distribuio normal3;
a distribuio indicada para se fazer inferncia com duas mdias amos-
trais e clculo da estimativa dos intervalos de confiana para a mdia
populacional, independentemente do tamanho da amostra, desde que os
valores sejam normalmente distribudos e desconhecido.

Embora tradicionalmente o teste t seja utilizado para fazer inferncias


entre as mdias conhecidas de duas amostras, a distribuio t pode ser til
quando se quer comparar a mdia de uma amostra com a mdia populacio-
nal, mesmo que seja desconhecido, como tambm til para a estimao da
mdia populacional atravs do intervalo de confiana, a partir da mdia amos-
tral. Essas determinaes sero mostradas a seguir.

Teste de hiptese entre a mdia amostral e a mdia da


populao ( desconhecido)
Em algumas situaes, o pesquisador precisa comparar uma mdia amos-
tral com uma mdia populacional j bem estabelecida. Isto acontece quando
uma amostra obtida de uma populao-base tratada com um procedimento
diferente daquele inerente prpria populao. Neste caso, a mdia x A obtida
das observaes da amostra selecionada, apresentar um desvio em relao
mdia 0 da populao-base, por sorte que, o pesquisador est interessado

3. Quando o tamanho da amostra de dois grupos comparados maior que 120, a diferena entre
as duas distribuies desprezvel. Por esse motivo, na tabela da distribuio t de Student, os
valores crticos so calculados at 120 graus de liberdade.

Teste t de Student 23

BIOESTATISTICA_VOL02.indb 23 25/06/12 17:20


em saber se esta diferena observada entre a mdia amostral e a mdia popu-
lacional ( x A 0 ) , de fato, real, isto , se ocorreu em razo da modificao do
procedimento ou se ela decorrente do erro aleatrio, da variao decorrente
do processo de amostragem.
Por exemplo: um pesquisador deseja saber se o uso de contraceptivos orais
tem efeito sobre a temperatura corporal basal4 (TCB) de mulheres na faixa etria
de 18 a 25 anos. Para tal finalidade, ele seleciona uma amostra de 20 mulheres
que usam contraceptivos orais, e encontra uma temperatura mdia x A = 36,7 C
o

, com desvio s A = 0,5 C . Ele deseja comparar esses dados com aqueles da popu-
o

lao de mulheres na mesma faixa etria, mas que no usam contraceptivos orais,
para a quais a temperatura corporal basal mdia (0) admitida ser igual a 36,3
o
C. Considerando que os dados sejam normalmente distribudos, existe diferena
estatisticamente significativa entre a TCB de mulheres com uso de contracepti-
vos e a TCB de mulheres da populao, na mesma faixa etria?

Passo 1 Formular as hipteses estatsticas:


H 0 : x A = 0 = 36,3 e H A : x A 0 = 36,3
Passo 2 Escolher o nvel de significncia (nvel alfa):
= 0,05 (5%)
Passo 3 Determinar o valor crtico do teste:
gl = n 1 = 20 1 = 19 t 0,05;19 = 2,093
Passo 4 Calcular o valor do teste:

x A 0 36,7 36,3 0, 4
t calc = = = = 4 , 44
s 0 ,5 0,09
n 20

Passo 5 Regra de deciso:

Se |t calc | < t 0,05;19 , aceita-se H 0 .

Se |t calc | t 0,05;19 , rejeita-se H 0 .

Como |t calc | = 4 , 44 > t 0,05;19 = 2,093, rejeita-se H 0 .

4. Temperatura do corpo medida imediatamente aps a pessoa acordar, antes que qualquer
atividade fsica seja realizada.

24 Bioestatstica aplicada Pesquisa Experimental

BIOESTATISTICA_VOL02.indb 24 25/06/12 17:20


Passo 6 Concluso:
A mdia da temperatura corporal basal (TCB) das mulheres em uso de
contraceptivos orais significativamente maior do que a mdia da tempe-
ratura corporal basal das mulheres que no usam este tipo de anovulatrio.

Determinao do intervalo de confiana para a mdia


populacional
O intervalo de confiana em torno da mdia x calculado para que se possa
fazer uma estimativa da verdadeira mdia populacional, pois, na maioria dos
casos, esta nunca verdadeiramente conhecida. Como j foi demonstrada no
captulo 10 desta obra, a estimativa de um parmetro pode ser pontual e inter-
valar. Na estimao pontual da mdia, o pesquisador admite que o valor da
mdia populacional seja igual ao valor da mdia amostral ( = x ) . Isto uma
idia errnea, pois sabemos que, na prtica, raramente a mdia amostral coin-
cide com a mdia populacional. Por outro lado, na estimativa intervalar, um
intervalo calculado em torno da mdia amostral x , no interior do qual se
acredita que esteja contida a verdadeira mdia da populao, com um nvel
de confiana 1- preestabelecido.
Assim, para construir um intervalo de confiana (IC) de uma mdia popu-
lacional, pode-se empregar tanto o valor z quanto a distribuio t. No primeiro
caso, o intervalo calculado quando o desvio padro conhecido. No segundo
caso, o intervalo pode ser calculado para pequenas amostras, especialmente
quando somente o desvio padro amostral (s) conhecido. Quando o desvio
padro conhecido, os intervalos de confiana de 95% e 99% so calculados
pelas frmulas:


IC 95%( ) = x 1, 96 e IC 99%( ) = x 2,58
n n

Os valores 1,96 e 2,58 foram obtidos na tabela dos valores z da distribuio


normal. No caso da primeira frmula, existem 95% de chance de que o verda-
deiro valor de esteja situado no intervalo entre x 1, 96 / n e x + / n .
Da mesma forma, h uma chance igual a 5% de que o intervalo no contenha
esta mdia.

Teste t de Student 25

BIOESTATISTICA_VOL02.indb 25 25/06/12 17:20


Porm, quando desconhecido, a soluo estimar a partir do desvio
padro da amostra (s). Para calcular este intervalo, utiliza-se a distribuio t
com n 1 graus de liberdade, em vez do valor z, cujas frmulas para 95% e 99%
de confiana so dadas por:

s s
IC 95%( ) = x t 0,05;gl e IC 99%( ) = x t 0,01;gl
n n

Exemplo: Selecionou-se uma amostra de 10 indivduos cujas estaturas, em


centmetros, esto expressas no quadro abaixo. Qual o intervalo de confiana
de 95% para a mdia populacional?
178 180 185 176 186
Estatura (cm):
183 179 182 178 184

Dados: n = 10, x = 181,10 cm e s = 3,38 cm

Clculo do erro padro

t 0,05;gl = t 0,05;9 =2,262

s 3,38 3,38
EP = = = = 1,07 cm
N 10 3,16

Ento, t 0,05;gl EP = 2,262 1,07 = 2,42 cm

Clculo do intervalo de confiana de 95% (IC95%)

IC 95%( ) = x t 0,05;gl EP

IC 95%( ) = 181,10 2, 42

IC 95%( ) = 181,10 2, 42 = 178,68 (limite inferior)

= 181,10 + 2, 42 = 183,52 (limite superior)

IC 95%( ) = 178,68 cm < < 183,52 cm

26 Bioestatstica aplicada Pesquisa Experimental

BIOESTATISTICA_VOL02.indb 26 25/06/12 17:20


Interpretao do resultado: a verdadeira mdia das estaturas dos indiv-
duos da populao, da qual a amostra foi retirada, est situada no intervalo
compreendido entre 178,68 cm e 183,52 cm, com 95% de certeza.
Em outras palavras, o nvel de confiana indica que, se o procedimento
for repetido para um grande nmero de mdias amostrais retiradas da mesma
populao, espera-se que 95% dos intervalos de confiana resultantes conte-
nham o verdadeiro valor da mdia populacional .

11.2 O TESTE t DE STUDENT

O teste t de Student, que pode ser unicaudal ou bicaudal, um dos testes


mais utilizados em estatstica inferencial para dados paramtricos, devendo ser
usado quando o objetivo do pesquisador comparar as mdias de duas amostras
retiradas de diferentes populaes, cujos parmetros populacionais, tal como a
mdia e o desvio padro, no sejam conhecidos. Para tal finalidade, importante
que as duas populaes sejam independentes, e que as amostras selecionadas
sejam diferentes entre si apenas em relao ao fator a ser estudado, devendo as
demais caractersticas dos indivduos das amostras, tais como a idade, sexo, esta-
tura etc, apresentarem-se o mais semelhante possvel, de maneira que qualquer
diferena, encontrada no resultado da comparao entre os grupos, possa ser
atribuda exclusivamente influncia da diferena do fator em estudo.

Frmula para calcular o valor t


Os valores crticos de t so calculados dividindo-se a diferena entre as
mdias observadas dos grupos estudados pelo erro padro da diferena (EPD)
entre as mdias dos dois grupos.

Diferena entre as mdias x A x B 2


t= = , onde: Erro padro = =
Erro padro da difereena EPD n n

Por definio, EPD igual raiz quadrada da soma das varincias das
populaes estudadas, divididas pelo respectivo tamanho da populao.
Porm, como as varincias das populaes so geralmente desconhecidas, as

Teste t de Student 27

BIOESTATISTICA_VOL02.indb 27 25/06/12 17:20


varincias das amostras (s2) podem ser utilizadas na frmula, desde que o total
das duas amostras seja maior que 30 ou que seus valores estejam normalmente
distribudos. Assim temos:

2A B2 s A2 s B2
EPD( A B ) = + , onde: EPD( x A x B ) = +
NA NB nA 1 nB 1

Como o teste t utilizado pra estimar a hiptese de nulidade (H0), ou seja,


que no h diferena entre as duas mdias ( x A = x B ) , pressupe-se, ento, que
a variabilidade igual nas duas populaes, isto , que as varincias so iguais
( 2A = 2B ) . Deste modo, uma estimativa conjunta das varincias ( s 02 ) das
duas populaes deve ser obtida pela mdia ponderada das varincias amos-
trais. A frmula para calcular s 02 a seguinte:

s 02 =
( nA 1) s A2 + (nB 1) s B2 2
, onde s A = Varincia da primeira amostra.
nA + nB 2
s B2 = Varinciia da segunda amostra.
nA = Tamanho da primeira amostra.
nB = Tamanho da segunda amostra.

No teste t de Student prefervel que as amostras comparadas tenham o


mesmo tamanho n, o que, geralmente, no possvel. Assim, quando se deseja
fazer comparaes entre amostras de tamanho diferentes, necessrio que
sejam atribudas ponderaes para cada uma das diferentes amostras, de tal
2
sorte que essas ponderaes possam ajustar o valor de s 0 . Desta forma, o EPD
passa a ser determinado pela seguinte frmula:

1 1
EPD( x A x B ) = s 02 +
n
A nB

Ento, quando o teste t de Student utilizado para verificar a hiptese de


nulidade em uma pesquisa envolvendo duas amostras provenientes de diferen-
tes populaes, a equao tem a seguinte frmula geral:

28 Bioestatstica aplicada Pesquisa Experimental

BIOESTATISTICA_VOL02.indb 28 25/06/12 17:20


x A xB
t= , para gl = nA + nB 2
1 1
s 02 +
n
A nB

11.2.1 Teste t para amostras independentes com


varincias iguais
Este tipo de teste t deve ser utilizado para comparar dois subconjuntos
de uma populao, os quais foram selecionados de forma independente e
aleatria, podendo apresentar tamanhos iguais ou desiguais. No entanto,
existem duas condies que devem ser satisfeitas para que ele possa
ser utilizado:

Que as duas amostras apresentem distribuio normal, ou aproximada-


mente normal, quando individualmente analisadas. Esta condio garante
que a diferena entre as mdias amostrais tambm seja normalmente dis-
tribuda. Por outro lado, se o teste bicaudal e os tamanhos das amostras
so iguais, ou quase iguais, o teste pode ser aplicado mesmo que as amos-
tras apresentem-se bastante desviadas do padro de normalidade. Caso as
amostras no tenham distribuio normal, deve-se tentar transformar os
dados, como demonstrado na Figura 11.2, ou utilizar o teste no-param-
trico de Mann-Whitney;

Que as amostras sejam homocedsticas, ou seja, que haja homogeneidade


de suas varincias. Isto , que as varincias dos subconjuntos testados
sejam iguais, e, portanto, oriundas da mesma populao. A homocedasti-
cidade importante porque ela garante que, se o tratamento A diferir do
tratamento B, o seu efeito altera os valores uniformemente, de tal modo que
a disperso dos dados permanea a mesma. Caso esta condio de igual-
dade das varincias seja duvidosa, o pesquisador deve realizar o teste de
homogeneidade antes de aplicar o teste t, como ser mostrado adiante. A
seguir, demonstraremos, pela aplicao de um exemplo, os passos para a
realizao do teste t para amostras independentes.

Teste t de Student 29

BIOESTATISTICA_VOL02.indb 29 25/06/12 17:20


Exemplo: Um pesquisador deseja saber se a concentrao de lipdios da
espcie de peixe mapar (Hypophthalmus edentatus) influenciada por dois
diferentes mtodos de medio: Soxhlet e Bligh Dyer. Para tal intento, ele sele-
cionou 10 amostras medidas pelo mtodo Soxhlet e 12 amostras medidas pelo
mtodo Bligh Dyer. Para um nvel de significncia de 0,05, existe diferena esta-
tisticamente significativa entre os dois mtodos? Os resultados esto expressos
na Tabela 11.1.

Tabela 11.1 Valores da concentrao de lipdios da espcie de peixe mapar,


medidos por dois diferentes mtodos

Mtodos utilizados
Amostra Soxhlet
Bligh Dyer (g/100g)
(g/100g)
01 14,8 15,8
02 15,2 16,7
03 16,8 15,9
04 15,9 17,2
05 16,9 16,2
06 15,2 15,3
07 16,5 15,1
08 15,4 15,7
09 17,2 16,6
10 16,9 17,1
11 15,5
12 16,7

Mdia x S = 16,08 x B = 16,15

Desvio padro s S = 0,88 s B = 0,70

Dados fictcios

Passo 1 Formular as hipteses estatsticas:


H0 : x S = x B e H A : x S x B

Passo 2 Escolher o nvel de significncia (nvel alfa):


= 0,05 (5%) bilateral

30 Bioestatstica aplicada Pesquisa Experimental

BIOESTATISTICA_VOL02.indb 30 25/06/12 17:20


Passo 3 Determinar o valor crtico do teste:
gl = nS + nB 2 = 10 + 12 2 = 20 t 0,05;20 = 2,086

Passo 4 Calcular o valor do teste:

xS xB (nS 1)s S2 + (nB 1)s B2


t calc = s 02 =
1 1 nS + nB 2
s 02 +
n n
S B

(10 1)(0,88)2 + (12 1)(0,70)2


s 02 = = 0,62
10 + 12 2

16,08 16,15 0,070


t calc = = = 0,207
1 1 0,337
0,62 +
10 12

Passo 5 Regra de deciso:

Se |t calc | < t 0 ,05;20 , aceita - se H0 .


Se |t calc | t 0 ,05;20 , rejeita - se H0 .
Como |t calc | = 0,207 < t 0 ,05;20 = 2,086, aceita - se H0 .

Passo 6 Concluso:
As mdias das duas amostras no diferem significativamente, e isto evi-
dencia que os dois mtodos no diferem quanto determinao das con-
centraes de lipdios na espcie de peixe mapar (Hypophthalmus edenta-
tus), pois t calc = 0,207; gl = 20; P = 0,8378 .

Teste de homogeneidade para duas varincias


Na literatura especializada, podemos encontrar vrios tipos de testes de
homogeneidade para varincias, cada um com sua particularidade de apli-
cao, dentre os quais citamos o teste F, o teste de Levene e o teste do qui-

Teste t de Student 31

BIOESTATISTICA_VOL02.indb 31 25/06/12 17:20


-quadrado da homogeneidade. Estes testes consistem em determinar se duas
ou mais amostras tm caractersticas parecidas, isto , eles consistem em
mtodos para avaliar se a variabilidade das amostras pode ser considerada
desprezvel quando comparada variabilidade resultante do procedimento
a ser testado. Como citado anteriormente, quando houver dvidas quanto
homogeneidade das amostras, o pesquisador dever aplicar um teste para
determinar a homogeneidade das varincias, pois isto garante um melhor de-
sempenho para os testes paramtricos, uma vez que estes exigem que as va-
rincias das amostras envolvidas na anlise sejam homogneas, porm, no
necessariamente idnticas. A seguir, mostraremos a aplicao do teste F e do
teste de homogeneidade de Cochran.

Teste F para varincias iguais


O teste F foi desenvolvido por Ronald Aylmer Fisher (1890-1962), da a
sua denominao, sendo, tambm, utilizado para comparar as varincias de
mais de dois grupos de estudo, quando conhecido como anlise de varincia
(ANOVA). Este teste calculado dividindo-se a maior varincia pela menor,
para, ento, obter-se a razo crtica, a qual comparada com o valor crtico
da distribuio F (ver tabela para distribuio F), conforme o nvel de signi-
ficncia (nvel alfa) preestabelecido pelo pesquisador. Assim, o raciocnio o
seguinte: caso as varincias sejam iguais, a razo entre elas ser 1, ou, se ligei-
ramente diferentes, ser aproximadamente 1. Por outro lado, caso a razo
entre as varincias seja significativamente maior que 1, pode-se concluir que
as varincias so desiguais. Porm, quanto maior que 1 o valor F precisa ser
para que as varincias sejam consideradas desiguais mais do que se poderia
esperar apenas por acaso? Para responder a esta questo, compara-se o valor
calculado para a razo crtica, com o valor crtico tabelado da distribuio
F, o qual determinado segundo o nvel de significncia e os graus de liber-
dade. Se o resultado calculado para o teste F for menor que o valor crtico da
tabela, no se rejeita a hiptese nula das varincias iguais; caso o valor F seja
maior que o valor da tabela, a hiptese nula deve ser rejeitada, afirmando-se,
ento, que a diferena entre as varincias estatisticamente diferente. No
primeiro caso, o teste t de Student pode ser empregado, pois as varincias
das amostras so homogneas; no segundo caso, a abordagem deve ser reali-

32 Bioestatstica aplicada Pesquisa Experimental

BIOESTATISTICA_VOL02.indb 32 25/06/12 17:20


zada pela aplicao do teste t de Student para varincias desiguais (teste t), o
qual calculado mediante a reduo dos graus de liberdade pela aplicao da
frmula de correo de Welch-Satterthwaite (1946), como mostrado mais
adiante, ou, ento, aplicar um teste no-paramtrico. Assim, para calcular o
valor F, temos:

2
s Maior
Fcalc =
2
s Menor

Note que, por conveno, o numerador representado pela maior das duas
varincias, porm, no necessariamente a da maior amostra. Isso permite que o
valor calculado de F seja sempre um valor igual ou maior que 1.
A determinao do valor crtico na tabela da distribuio F depende do
nvel de significncia (valor ) estipulado pelo pesquisador e do nmero de
graus de liberdade(n 1) de cada amostra, sendo dado por:

F;g l , onde: gln = Graus de liberdade da varincia do numerador.


N ;glD
gld = Graus de liberdade da varincia do denominador.

Tomando-se como base os dados do exemplo anterior (exemplo 2), a se-


guir mostraremos a sequncia de passos para a aplicao do teste F. Lembre-se,
porm, que este teste de homogeneidade deve ser aplicado antes da realizao
do teste t de Student.

Passo 1 Formular as hipteses estatsticas:


s S2 s S2
H 0 : s S2 = s B2 ou H 0 : = 1 e H A : s S2 s B2 ou H A : >1
s B2 s B2

Passo 2 Escolher o nvel de significncia (nvel alfa):

= 0,05 (5%) bilateral

Teste t de Student 33

BIOESTATISTICA_VOL02.indb 33 25/06/12 17:20


Passo 3 Determinar o valor crtico do teste:

gl N = ns 1 = 10 1 = 9

gl D = nB 1 = 12 1 = 11 F0,05;9;11 = 3,59

Passo 4 Calcular o valor do teste:


2
s Maior (0,88)2
Fcalc = = = 1,58
2
s Menor (0,70)2

Passo 5 Regra de deciso:


Se |Fcalc | < F0,05;9;11 , aceita-se H 0 .
Se |Fcalc | < F0,05;9;11 , aceita-se H 0 .

Se |Fcalc | F0,05;9;11 , rejeita-se H 0 .


Se |Fcalc | F0,05;9;11 , rejeita-se H 0 .

Como |Fcalc | = 1,58 < F0,05;9;11 = 3,059, aceita-se H 0 .


Como |Fcalc | = 1,58 < F0,05;9;11 = 3,059, aceita-se H 0 .

Passo 6 Concluso:
Como o valor do teste (Fcalc) menor que o valor crtico tabelado (F0,05;9;11),
aceita-se H0, pois no h evidncias que as varincias das amostras sejam
diferentes. Neste caso, o teste t de Student pode ser aplicado para verifi-
car se h diferena estatisticamente entre os mtodos Soxhlet e Bligh Dyer
para determinao da concentrao de lipdios na espcie de peixe mapar
(Hypophthalmus edentatus).

Note que nem sempre necessria a aplicao de um teste de homogenei-


dade, pois, na maioria das vezes, o bom senso mostra se existe ou no igualdade
entre as varincias. Por exemplo, valores de varincia muito prximos indicam
que elas so homogneas; por outro lado, valores bastante discrepantes mos-
tram que as varincias so desiguais. Na prtica, o teste necessrio quando a
diferena entre os valores das varincias no pequeno o suficiente para que
se possa afirmar com segurana que elas sejam iguais, como no exemplo citado,
cujos valores so s S = 0,7744 e s B = 0, 4900 .
2 2

34 Bioestatstica aplicada Pesquisa Experimental

BIOESTATISTICA_VOL02.indb 34 25/06/12 17:20


Teste de Cochran para varincias iguais
Simples e de fcil aplicao, o teste de Cochran utilizado para verificar a
homogeneidade das varincias de um grupo de amostras. calculado determi-
nando-se, inicialmente, as varincias envolvidas no experimento, para, ento,
dividir a maior delas pela soma de todas as outras. O resultado da diviso
ento comparado com os valores crticos de uma tabela estatstica apropriada,
que leva em conta o nmero de varincias envolvidas (k) e o nmero de graus
de liberdade (gl) utilizado nos clculos, nmero esse que deve ser o mesmo
para todas as varincias, pois a tabela construda dessa forma. A frmula do
teste de Cochran dada por:

max s i2
C=
n
si2
i =1

Lembre que o tamanho deve ser igual para todas as amostras, e um valor
calculado maior que o valor crtico tabelado indica que as varincias so
significativamente diferentes, o que nega a hiptese de igualdade (ou de homo-
geneidade) das varincias envolvidas no experimento.

11.2.2 Teste t para amostras independentes com


varincias desiguais
Se aps aplicar o teste de homogeneidade, o pesquisador verificar que as
varincias das amostras no so homogneas, o teste t de Student tradicional
no deve ser utilizado. Neste caso, deve-se utilizar uma das solues propos-
tas pela estatstica, sendo a de mais fcil utilizao aquela que corrige os graus
de liberdade do teste t pela aplicao da frmula de Welch-Satterthwaite.
Em estatstica, essa comparao entre as mdias de duas amostras quando
s A2 s B2 , conhecida como o problema de Behrens-Fisher5.

5. Problema da estimao do intervalo e da aplicao do teste de hiptese sobre a diferena entre


as mdias de duas amostras independentes, retiradas de populaes normalmente distribudas,
porm com varincias desiguais. W. V. Behrens, em 1929, e Sir Ronald Aylmer Fisher, em 1935,
propuseram a soluo para o problema.

Teste t de Student 35

BIOESTATISTICA_VOL02.indb 35 25/06/12 17:20


Assim, as diferenas entre a aplicao da frmula tradicional e a frmula
corrigida so:
Na frmula corrigida, utilizam-se as varincias observadas nas duas amos-
2
tras, em vez de uma estimativa comum para as varincias (s 0 ) , como na fr-
mula tradicional. Com isto, a frmula corrigida escrita da seguinte maneira.

x A xB
,
t calc =
s A2 s B2
+
nA nB

Para encontrar a razo crtica na tabela da distribuio t de Student, o cl-


culo do nmero de graus de liberdade deve ser modificado. Na frmula
tradicional, ele dado por (nA + nB 2). Na frmula corrigida, o nmero
de graus de liberdade (gl) deve ser determinado pela equao de Welch-
-Satterthwaite, cuja frmula :
2
s2 s2
A+ B
nA nB
gl , =
2 2
s2 s2
A B
nA nB
+
nA 1 nB 1

A fim de mostrar a aplicao da frmula do teste t para amostras indepen-


dentes com varincias desiguais, utilizaremos o exemplo a seguir.

Exemplo: dois pesquisadores compararam o ganho de peso dirio de


ratos Wistar (Rattus norvegicus), com a utilizao de dois diferentes tipos
de dieta. Para tal finalidade, dois grupos de 10 animais foram selecionados.
Para o grupo CA, foi administrada dieta contendo protena do leite (casena),
durante um perodo de 14 dias. Para o grupo SO, dieta contendo protena
de soja, por igual perodo de tempo. As concentraes proticas e as quan-
tidades dirias ofertadas foram iguais para ambas as dietas. Os dados esto
expressos na Tabela 11.2.

36 Bioestatstica aplicada Pesquisa Experimental

BIOESTATISTICA_VOL02.indb 36 25/06/12 17:20


Tabela 11.2 Valores do ganho de peso dirio de ratos submetidos a dois diferentes
tipos de dieta

Grupos estudados
Animal Grupo CA Grupo SO
(g/dia) (g/dia)
01 13,1 10,8
02 15,2 10,7
03 15,8 9,9
04 13,9 10,2
05 12,9 9,6
06 15,2 10,3
07 15,5 9,1
08 15,4 10,1
09 16,2 10,6
10 15,9 10,1

Mdia xCA = 14 , 91 x SO = 10,14

Desvio padro sCA = 1,180 s SO = 0,519

Dados fictcios

Passo 1 Formular as hipteses estatsticas:


H 0 : xCA = x SO e H A : xCA x SO

Passo 2 Escolher o nvel de significncia (nvel alfa):


= 0,05 (5%) bilateral

Passo 3 Verificar a homogeneidade das varincias para escolher o teste:

2
s Maior (1,180)2
Fcalc = = = 5,17 Valor crtico (Ftabelado ) = F0,05;9;9 = 4 ,03
2
s Menor (0,519)2

Como Fcalc = 5,17 > Ftabelado = 4 ,03 as varincias so estatisticamente di-


ferentes (heterocedsticas), ento, a escolha adequada o teste t para
varincias desiguais.

Teste t de Student 37

BIOESTATISTICA_VOL02.indb 37 25/06/12 17:20


Passo 4 Determinar o valor crtico do teste t:

2
s2 s2
CA + SO
nCA nSO (0.139 + 0,027)2
gl , = = =
0,0276
= 12
2 2 2 2 0,0023
s2 s2 0.139 0,027
+
CA SO 9 9
nCA nSO
+
nCA 1 nSO 1

Como gl = 12, ento, o valor crtico ser: t 0,05;12 = 2,179 .


,

Passo 5 Calcular o valor do teste:

xCA x SO 14 , 91 10,14 4 ,770


,
t calc = = = = 11,72
2
sCA 2
s SO 0,139 + 0,027 0, 407
+
nCA nSO

Passo 6 Regra de deciso:

,
Se |t calc | < t 0, ,05;12 , aceita-se H 0 .

,
Se |t calc | t 0, ,05;12 , rejeita-se H 0 .

,
Como |t calc | = 11,72 > t 0, ,05;12 = 2,179, rejeita-se H 0 .

Passo 7 Concluso:
As mdias dos ganhos de peso dirio dos dois grupos de animais diferem
significativamente entre si, o que evidencia que a dieta base de protena
do leite mais eficaz quando comparada dieta base de protena de soja,
pois t calc = 11,72; gl = 12; P < 0,001 .

11.2.3 Teste t para amostras pareadas (emparelhadas)


O teste t pareado o ideal para ser aplicado quando se deseja detec-
tar pequenas diferenas em grupos cujos indivduos so muito heterogneos,

38 Bioestatstica aplicada Pesquisa Experimental

BIOESTATISTICA_VOL02.indb 38 25/06/12 17:20


sendo, portanto, para estes casos, considerado um teste mais robusto que o t
de Student tradicional. Contudo, ao contrrio do teste t para amostras inde-
pendentes, que compara as mdias e varincias de duas diferentes amostras,
o teste t pareado compara as diferenas entre duas situaes distintas de uma
mesma amostra (ou populao). Essa comparao geralmente feita para
que se possa verificar se ocorreu, em decorrncia da aplicao de um pro-
cedimento experimental, uma mudana significativa nos valores da varivel
estudada. Como exemplo, para verificar se houve uma reduo nos nveis da
presso sangunea sistlica aps administrao de uma nova droga para tra-
tamento da hipertenso arterial, o pesquisador precisa medir os valores da
presso arterial dos indivduos, antes e depois da administrao da droga, e,
ento, compar-los, na tentativa de detectar alguma possvel alterao. Nesse
caso, o melhor teste a ser empregado o t pareado, pois qualquer mudana
nos valores da presso arterial detectada pelo teste, pode ser atribuda
interveno.
A tcnica de pareamento tradicional aquela em que apenas uma amos-
tra randomicamente selecionada, e cada indivduo o seu prprio controle,
tal como mostrado no exemplo anteriormente citado, sendo esta a tcnica que
proporciona melhor sensibilidade ao teste estatstico. Uma outra maneira de
emparelhar a amostra selecionar, dois a dois, os participantes da pesquisa,
isto , aos pares, sendo um deles aleatoriamente designado ao grupo tra-
tamento, e o outro, para o grupo controle. Neste processo, os sujeitos que
compem cada um dos pares selecionados devem ser o mais semelhante pos-
svel, especialmente no que tange s caractersticas que possam influenciar
no resultado da pesquisa, tais como a idade, sexo, raa, estatura, tempo de
doena etc.

Frmula para calcular o teste t pareado


Os valores do teste t pareado no so calculados com os dados originais
das observaes (x) obtidas de cada uma das duas amostras ou nos momentos
antes e depois da interveno, mas com as diferenas (d) entre as observa-
es de cada par. Este teste considera como hiptese nula (H0) aquela em que
a mdia das diferenas ( d ) igual a 0 (d = 0), isto , quando no h diferena
entre os valores medidos antes (xA) e depois (xD) da interveno, o que seria

Teste t de Student 39

BIOESTATISTICA_VOL02.indb 39 25/06/12 17:20


esperado caso a interveno no apresentasse qualquer efeito nos indivduos
da amostra. A frmula dada por:

d d
tp = = , onde: d = d / n
EPd sd
sd= Erro padro da mdia das diferenas.
n n - Nmero de pares ou de repeties (no o
nmero total de indivduos ou observaes).
Obs.: A mdia das diferenas tambm pode ser
dada por: d = x A x B

( di )2
(di d ) 2 di2
n
sd = = , onde: n 1 = Graus de liberdade
n 1 n 1

Interpretao para o teste t pareado Para a realizao do teste t pare-


ado, calcula-se a diferena, em termos de desvio padro, entre valor calculado
de d e d = 0. O valor encontrado ento comparado o com valor crtico da
tabela da distribuio t de Student, conforme o nvel de significncia prees-
tabelecido (nvel alfa) e com n 1 graus de liberdade, tal como foi feito para
os outros testes. A diferena ser considerada estatisticamente significativa
quando o valor de tP calculado for maior que o valor crtico da tabela. Neste
caso, conclui-se que h diferena entre os grupos pareados estudados ou que
h diferena entre as mdias das medidas antes e depois da interveno. Caso
contrrio, conclui-se que a diferena no significante, ou seja, que ela decor-
rente do erro aleatrio, do acaso.
Para efeito de ilustrao, tomaremos como exemplo um teste t com parea-
mento do tipo antes e depois.
Exemplo: a fim de testar a eficcia de uma nova droga para tratamento da
hipercolesterolemia, um pesquisador selecionou, aleatoriamente, um grupo de 10
pacientes hipercolesterolmicos, entre aqueles atendidos no ambulatrio de um
determinado hospital pblico. Para efeito de comparao, os valores do colesterol
total plasmtico foram medidos antes e depois da administrao da droga por um
perodo de duas semanas. Os dados esto expressos na Tabela 11.3, abaixo.

40 Bioestatstica aplicada Pesquisa Experimental

BIOESTATISTICA_VOL02.indb 40 25/06/12 17:20


Tabela 11.3 Valores do colesterol total plasmtico antes e depois da administrao da droga
por um perodo de duas semanas
Dosagem do colesterol total (mg/dL)
Paciente d = xA xD d2
Antes (xA) Depois (xD)
01 248 202 46 2.116
02 257 183 74 5.476
03 264 176 88 7.744
04 252 198 54 2.916
05 278 168 110 12.100
06 246 187 59 3.481
07 271 182 89 7.921
08 268 194 74 5.476
09 246 198 48 2.304
10 254 204 50 2.500
Total x A = 258, 40 x D = 189,20 692 52.034
Dados fictcios

Passo 1 Formular as hipteses estatsticas:


H 0 :d = 0 e H A :d 0

Passo 2 Escolher o nvel de significncia (nvel alfa):


= 0,05 (5%) bilateral

Passo 3 Determinar o valor crtico do teste t:

gl = n 1 = 10 1 = 9 t 0,05;9 = 2,262

Passo 4 Calcular o valor do teste:

(di )2 (692)2
d di2 n
52.034
10 = 21, 47
tP = , onde: sd = =
sd n 1 10 1
n

69,2 69,2
tP = = = 10.191
21, 47 6,79
10

Teste t de Student 41

BIOESTATISTICA_VOL02.indb 41 25/06/12 17:20


Passo 5 Regra de deciso:
Se |t P | < t 0,05;9 , aceita-se H 0 .

Se |t P | t 0,05;9 , rejeita-se H 0 .

Como |t P | = 10,191 > t 0,05;9 = 2,262, rejeita-se H 0 .

Passo 6 Concluso:
As mdias dos valores do colesterol total plasmtico, medidas antes e
depois da administrao da nova droga, diferem significativamente en-
tre si, o que evidencia ter a droga se mostrado eficaz em reduzir os valo-
res do colesterol total plasmtico no grupo de pacientes estudados, pois
t P = 10,191; gl = 9; P < 0,0001 .

Determinao do intervalo de confiana para a mdia de


amostras pareadas
O intervalo de confiana para a mdia de amostras pareadas dado pela
seguinte frmula:

IC 95%( ) = d t 0,05;gl EP , onde: EP = sd / n

- Diferena.
d - Mdia das diferenas.
sd - Desvio padro das diferenas.

Para calcular o intervalo de confiana de 95%, utilizaremos os dados do


exemplo anterior.

Dados: n = 10 d = 69,2 mg/dL sd = 21, 47 mg/dL


Clculo do erro padro

t 0 ,05; gl = t 0 ,05;9 = 2,262

sd 21, 47 21, 47
EP = = = = 6,80 mg / dL
N 10 3,16

Ento, t 0 ,05; gl EP = 2,262 6,80 = 15,38 mg / dL

42 Bioestatstica aplicada Pesquisa Experimental

BIOESTATISTICA_VOL02.indb 42 25/06/12 17:20


Clculo do intervalo de confiana de 95% (IC95%)

IC 95%( ) = d t 0,05;gl EP

IC 95%( ) = 69,2 15,38


IC 95%( ) = 69,2 15,38 = 53,82 (limite inferior)
= 69,2 + 15,38 = 84 ,58 (limite superior)
C 95%( ) = 53,82 mg/dL < d < 84 ,58 mg/dL
IC

Interpretao do resultado: a verdadeira mdia das diferenas dos va-


lores do colesterol total plasmtico dos indivduos da populao da qual a
amostra foi retirada, est situada no intervalo compreendido entre 53,82
mg/dL e 84,58 mg/dL, com 95% de certeza.

Assim, ao aplicar o teste t de Student, lembre-se sempre que as observaes


de cada grupo devem seguir a distribuio normal. Para pequenas amostras, o
no cumprimento dessa regra resulta em valores P menores do que deveriam ser,
o que pode levar o pesquisador a rejeitar a hiptese nula e afirmar que h uma
diferena real entre as mdias comparadas, quando, na verdade, esta diferena
no existe (erro tipo I). De igual maneira, os intervalos de confiana so mais
estreitos, o que tambm pode levar a concluses erradas. Nestes casos, o teste
no-paramtrico da soma de postos de Wilcoxon deve ser a escolha. O Quadro
11.1 mostra as opes de teste para comparar as mdias de duas amostras.

Quadro 11.1 Opo de testes para comparao entre as mdias de duas amostras

Tipo de dados Tipo de distribuio Teste apropriado

Normal com varincias iguais - Teste t de Student tradicional.


- Teste t com varincias desiguais
No-pareados Normal com varincias diferentes
(Welch-Satterthwaite).
No-gaussiana - Teste de Mann-Whitney.
Normal das diferenas - Teste t pareado.
Pareados
No-gaussiana - Teste de Wilcoxon.

Teste t de Student 43

BIOESTATISTICA_VOL02.indb 43 25/06/12 17:20


BIOESTATISTICA_VOL02.indb 44 25/06/12 17:20
12
Correlao e Regresso
Linear Simples

Em certos delineamentos, muitas vezes, um pesquisador se depara


com situaes em que ele precisa avaliar o comportamento simultneo de
duas variveis quantitativas normalmente distribudas, coletadas em uma
mesma amostra, no sentido de tentar estabelecer uma relao (ou associao)
entre elas. Da mesma forma, alm de estabelecer uma relao, o pesquisa-
dor geralmente deseja fazer previses a respeito do comportamento de uma
delas em relao outra, assim como quantificar o quanto de alterao de
uma determina pela alterao da outra. Por exemplo: se um pesquisador
deseja estudar a relao entre a idade (em anos) e os valores da presso
arterial sistlica (em mmHg), provavelmente ele estar interessado em
saber se, de fato, essas duas variveis esto associadas, isto , se elas esto
correlacionadas. Da mesma maneira, ele desejar saber se medida
que aumentam os valores da idade, os valores da presso arterial sistlica
aumentam ou diminuem concomitantemente. Caso isto ocorra, o quanto
de aumento ou diminuio nos valores da presso arterial sistlica
explicado pela variao dos valores da idade. Em estatstica, as respostas
a todas essas questes devem ser examinadas pelo estudo da correlao
e da regresso linear, as quais sero mostradas neste captulo.

Correlao e Regresso Linear Simples 45

BIOESTATISTICA_VOL02.indb 45 25/06/12 17:20


Assim, em qualquer uma dessas anlises, seja de correlao ou de
regresso, uma das duas variveis considerada a varivel independente
(varivel preditora), a qual, por conveno, representada por x, enquanto
que a outra, a varivel dependente (varivel-resposta), representada
por y. Em geral, a varivel preditora a varivel explicativa, que capaz de
modificar o comportamento da varivel-resposta. Por outro lado, impor-
tante saber a diferena entre as anlises de correlao e regresso linear,
diferena esta que toma como base o objetivo da anlise. Na correlao
linear, o investigador apenas est interessado em estabelecer e medir o
grau de uma associao entre as duas variveis x e y, assim como verificar
se ela positiva ou negativa, ao passo que, na regresso linear, ele tenta
quantificar o efeito de uma sobre a outra, alm de estabelecer uma equao
matemtica que possa prever o valor da varivel-resposta a partir dos valo-
res da varivel preditora.
Portanto, para melhor entendimento, iniciaremos a discusso pela anlise
de correlao linear.

12.1 CORRELAO LINEAR SIMPLES

Define-se como correlao linear simples a relao entre duas vari-


veis quantitativas normalmente distribudas, sendo os dados da amostra
representados por pares ordenados (x, y), onde x a varivel independente
(preditora) e y a varivel-resposta. Portanto, interessante notar que,
neste tipo de anlise, as informaes devem ser coletadas aos pares e de uma
mesma amostra, de tal maneira que seja pertinente o estabelecimento de uma
associao entre as variveis.
Assim que os dados quantitativos de um determinado estudo so coletados,
a maneira mais fcil de organiz-los, disp-los em uma tabela de distribui-
o de frequncia e calcular os parmetros de interesse para anlise, tal como
mostrado no Tabela 12.1, a qual relaciona as medidas das presses arteriais
sistlica e diastlica em 12 pacientes.

46 Bioestatstica aplicada Pesquisa Experimental

BIOESTATISTICA_VOL02.indb 46 25/06/12 17:20


Tabela 12.1 Valores das presses arteriais sistlica e diastlica de 12 pacientes
Valores da presso arterial
Paciente (mmHg)
Sistlica (x) Diastlica (y)
01 108 65
02 125 74
03 100 64
04 108 68
05 112 72
06 102 66
07 112 68
08 122 70
09 116 70
10 116 70
11 120 72
12 108 70
x s 112,417,71 69,082,99

Deste modo, ao fazer a anlise dos dados, o pesquisador pode estar inte-
ressado em responder a algumas questes importantes, tais como:
Existe ou no uma relao entre as variveis estudadas?
Se a relao existe, ela positiva ou negativa?
Caso exista, qual a fora desta associao?
Ela real, verdadeira, ou ocorreu por acaso?
Porm, ao analisar a tabela de distribuio de frequncia, verifica-se que
ela no se presta para uma anlise mais acurada no que tange ao estabeleci-
mento de uma correlao entre os valores das variveis estudadas, e, portanto,
no responde s questes anteriormente formuladas, posto que, praticamente
impossvel estabelecer qualquer tipo de associao entre os dados coletados.
Assim, no sentido de responder s questes relativas associao entre as
duas variveis, os dados devem ser agora dispostos em um grfico chamado de
diagrama de disperso e, posteriormente, submetidos a uma anlise estats-
tica, o coeficiente de correlao, os quais sero mostrados a seguir.

Correlao e Regresso Linear Simples 47

BIOESTATISTICA_VOL02.indb 47 25/06/12 17:20


12.1.1 Diagrama de disperso
O diagrama de disperso um grfico cartesiano de pontos (diagrama de
pontos), onde cada ponto representa, concomitantemente, os valores das duas
variveis x e y, coletadas a partir de cada indivduo da amostra. A Figura 12.1
mostra o diagrama de disperso para o exemplo anteriormente citado.

Fig. 12.1 Diagrama de disperso dos valores da presso arterial de 12 indivduos


Observando-se o diagrama, algumas informaes podem ser, de pronto,


verificadas. Por exemplo:
Os pontos esto distribudos tomando uma mesma direo, ao longo de
uma reta imaginria que vai da esquerda para a direita e de baixo para
cima. Esta distribuio mostra que existe uma relao, mesmo imperfeita,
entre as duas variveis estudadas (x e y). Esta informao responde pri-
meira questo formulada, entretanto, visualmente, no se pode afirmar o
quo forte a fora desta relao, como, da mesma maneira, no se pode
dizer se ela ocorreu ou no por acaso. Essas questes somente sero res-
pondidas pelo clculo do coeficiente de correlao e pela aplicao do
teste de hiptese para calcular a probabilidade de a correlao ter ocorri-
do por acaso, os quais sero mostrados mais adiante.
Pode-se observar, tambm, medida que aumentam os valores de x, os va-
lores de y aumentam concomitantemente, demonstrando existir uma cor-

48 Bioestatstica aplicada Pesquisa Experimental

BIOESTATISTICA_VOL02.indb 48 25/06/12 17:20


relao linear positiva entre as variveis estudadas. Porm, somente com
esta informao, no se podem fazer previses para valores de y a partir
de outros valores de x. Isto somente possvel pela aplicao da regresso
linear, a qual ser demonstrada item 12.2 deste captulo.

A Figura 12.2 mostra exemplos de diagrama de disperso com outras pos-


sveis associaes entre as variveis.

Correlao
Correlao linear linear
positiva Correlao llinear
Correlao inear nnegativa
egativa
positiva

Sem
Sem ccorrelao
orrelao Correlao
Correlao nno-linear
o-linear

Fig. 12.2 Diagramas de disperso mostrando quatro diferentes tipos de correlao

Correlao e Regresso Linear Simples 49

BIOESTATISTICA_VOL02.indb 49 25/06/12 17:20


12.1.2 Coeficiente de correlao produto-momento (r)
Como podemos verificar, a interpretao da correlao a partir do dia-
grama de disperso uma avaliao puramente subjetiva e pouco precisa,
o que torna necessria uma maneira mais consistente de analis-la. Para
tanto, a aplicao do coeficiente de correlao produto-momento (r), tambm
conhecido como coeficiente de correlao de Pearson, por ter sido inicial-
mente proposto por Karl Pearson em 1896, o mtodo mais utilizado para
avaliar esta correlao. Esse coeficiente, que uma medida da associao
entre duas variveis quantitativas, mostra o grau de dependncia linear entre
elas, com a grande vantagem de ser representado por um nmero adimensio-
nal, independentemente da unidade de medida das duas variveis analisadas,
podendo ser calculado pela seguinte equao:

r=
cov xy
, onde: Cov xy =
(x x )( y y )
sx s y n 1

Sendo Covxy igual soma das covarincias das variveis x e y.

Deste modo, define-se como covarincia entre duas variveis aleatrias


x e y, o somatrio do produto dos desvios das observaes em relao mdia
da varivel x e os mesmos desvios das observaes em relao mdia da
varivel y. Portanto, a frmula mais simplificada para calcular r dada pela
seguinte equao:

xi yi
xi yi n
r= , onde: n = nmero de pares de dados..
2 2
( x i ) ( y i )
x i y i
2 2
n n

Assim, tomando-se os dados do exemplo anterior, temos:

50 Bioestatstica aplicada Pesquisa Experimental

BIOESTATISTICA_VOL02.indb 50 25/06/12 17:20


Tabela 12.2 Valores das presses arteriais sistlica e diastlica de 12 pacientes

Valores da presso arterial (mmHg)


Paciente
Sistlica (x) Diastlica (y) x.y x2 y2
01 108 65 7.020 11.664 4.225
02 125 74 9.250 15.625 5.476
03 100 64 6.400 10.000 4.096
04 108 68 7.344 11.664 4.624
05 112 72 8.064 12.544 5.184
06 102 66 6.732 10.404 4.356
07 112 68 7.616 12.544 4.624
08 122 70 8.540 14.884 4.900
09 116 70 8.120 13.456 4.900
10 116 70 8.120 13.456 4.900
11 120 72 8.640 14.400 5.184
12 108 70 7.560 11.664 4.900
1.349 829 93.406 152.305 57.369

(1.349 x 829)
93.406
r= 12
(1.349)2 (829)2
152.305 57.369
12 12

93.406 93.193, 42
r=
(152.305 151.650,08)(57.369 57.270,08)

212,58 212,58
r= = = 0,8352
(654.92)(98, 92) 254.53

Interpretao do valor r
Valor r O coeficiente de correlao indica a intensidade da relao line-
ar entre as duas variveis estudadas. Este valor pode variar de 1 a + 1
( 1 r +1). Valor de r = 0 indica uma ausncia total de correlao entre as
variveis, indicando que elas no esto associadas, enquanto o valor de r = |1|,
indica uma relao linear perfeita, chamada de relao determinstica.

Correlao e Regresso Linear Simples 51

BIOESTATISTICA_VOL02.indb 51 25/06/12 17:20


O sinal da correlao Uma correlao positiva indica uma relao direta
entre as duas variveis, isto , quando os valores da varivel x aumentam,
os valores da varivel y aumentam concomitantemente ou quando os valo-
res da varivel x diminuem, os valores da varivel y diminuem na mesma
proporo. Ao contrrio, uma correlao negativa indica uma relao do
tipo inversa, ou seja, quando os valores da varivel x aumentam, os valores
da varivel y diminuem (ou vice-versa). Valores mximos positivos e nega-
tivos (r = +1 ou r = 1) so obtidos quando todos os pontos do diagrama
esto dispostos em uma reta inclinada (Figura 12.3 A e B), ao passo que
valores intermedirios so obtidos quando os pontos do diagrama apre-
sentam uma distribuio elptica, inclinada, sendo mais estreita quanto
maior for a correlao (Figura 12.3 C). Entretanto, se a elipse for paralela a
um dos eixos do grfico, ou se todos os pontos esto dispostos ao longo de
uma reta horizontal, a correlao nula (Figura 12.3 D).

Correlao linear perfeita Correlao linear perfeita Correlao linear Ausncia de correlao
positiva negativa intermediria

Fig. 12.3 Diagramas de disperso mostrando quatro diferentes valores de r

De qualquer maneira, pelo simples fato de duas variveis apresentarem uma


forte correlao entre si, no , necessariamente, uma indicao de que haja
uma relao de causa e efeito entre elas, uma vez que o coeficiente de corre-
lao mede a existncia de uma associao, no de uma relao de causa e
efeito entre as variveis. Portanto, se o valor de r for diferente de zero, uma
das quatro situaes abaixo descritas deve ser considerada pelo pesquisador:
A varivel x influencia o comportamento da varivel y So os valo-
res da varivel x que determinam as variaes na varivel y, isto , qual-

52 Bioestatstica aplicada Pesquisa Experimental

BIOESTATISTICA_VOL02.indb 52 25/06/12 17:20


quer alterao em x causa modificaes no comportamento da varivel y.
Por exemplo, considere os dados do exemplo citado. razovel concluir
que os valores da presso arterial sistlica influenciam positivamente
nos valores da presso arterial diastlica. Neste caso, a presso arterial
sistlica a varivel preditora, enquanto que a presso arterial diastlica
a varivel-resposta.
A varivel y influencia o comportamento da varivel x - So os valores
da varivel y que determinam as variaes na varivel x, isto , qualquer
alterao em y causa modificaes no comportamento da varivel x. Para o
exemplo dado, seria a presso arterial diastlica que determinaria o com-
portamento da presso sistlica.
As variveis no so correlacionadas Neste caso, qualquer relao
entre as variveis estudadas se deve exclusivamente ao acaso, pura
coincidncia, sem qualquer significado clnico, mesmo que o diagrama
de disperso mostre, em relao aos pontos do grfico, uma distribuio
tpica de uma correlao perfeita, pois, nesse caso, o coeficiente apenas
demonstra que as duas variveis esto variando concomitantemente,
sem que isto indique que uma influencia a outra. Neste caso, os valores
das presses sistlica e diastlica no apresentam qualquer relao de
causa e efeito.
As variveis x e y so influenciadas por uma terceira varivel No
fenmeno observado, pode haver a influncia de uma terceira varivel,
desconhecida ou no considerada na anlise, cuja ao modifica, simulta-
neamente, o comportamento tanto da varivel x quanto da varivel y. Ou,
talvez, vrias outras variveis estejam afetando o comportamento de x e y.
Desta maneira, pode ser que, para o exemplo em questo, a resistncia vas-
cular perifrica e/ou o volume de sangue circulante estejam modificando,
de maneira semelhante, o comportamento das presses arteriais sistlica
e diastlica, simultaneamente.

Assim, afirmar qual das condies acima descritas aquela vlida para o
estudo, pode ser uma tarefa bastante difcil. Porm, uma vez que tenha sido
determinada a correlao entre as duas variveis, pode-se, agora, mensurar a
intensidade da mesma, com base na seguinte tabela:

Correlao e Regresso Linear Simples 53

BIOESTATISTICA_VOL02.indb 53 25/06/12 17:20


Tabela 12.3 Avaliao do grau de intensidade da correlao entre duas variveis x e y

Valor de |r| Intensidade da correlao

0 Sem correlao

0 0,3 Fraca

0,3 0,6 Mdia

0,6 0,9 Forte

0,9 1 Muito forte

1 Perfeita

12.1.3 Teste de hiptese para correlao


Sempre que um coeficiente de correlao r calculado, preciso verificar
se a associao entre as duas variveis analisadas real, isto , se ela verda-
deira ou se ocorreu somente em razo do erro amostral aleatrio, em razo do
acaso. Ou seja, se ela, de fato, pode ser inferida ou no para a populao de onde
a amostra foi retirada. Para tal objetivo, necessria a aplicao de um teste de
hiptese, para o qual se usa o mesmo raciocnio aplicado nos testes de hiptese
para mdias.
O raciocnio do teste o seguinte: o verdadeiro coeficiente de corre-
lao populacional 1 (l-se r) somente poderia ser calculado caso todos
os possveis pares x e y, da populao, pudessem ser obtidos. Como isto
geralmente no possvel, a inferncia para a populao feita a partir do
coeficiente de correlao amostral r, o qual representa uma estimativa por
ponto de . Assim, temos que o coeficiente um parmetro geralmente
desconhecido, para o qual os valores podem variar de 1 a +1, sendo a rela-
o linear considerada direta quando for positivo, e inversa quando for
negativo. O valor de ser zero quando as duas variveis no forem linear-
mente correlacionadas.
Para realizar o teste de hiptese, supe-se, inicialmente, que = 0, isto
, no existe correlao entre as variveis x e y. Se isto for verdade, para um
conjunto de vrias amostras aleatrias, os valores de r obtidos devem ser, na

1. = ro (l-se r) Letra r minscula, no alfabeto grego.

54 Bioestatstica aplicada Pesquisa Experimental

BIOESTATISTICA_VOL02.indb 54 25/06/12 17:20


sua maioria, prximos de zero, com somente alguns poucos valores mais afas-
tados do centro da distribuio. Caso contrrio, se 0, espera-se que a maior
parte dos valores de r esteja bastante afastada de zero, alm do que seria de
se esperar somente por acaso. Assim, para avaliar a significncia estatstica do
coeficiente de correlao r, testa-se a hiptese nula (H0) que = 0, utilizando-se
a distribuio t com n 22 graus de liberdade, sendo n o nmero de pares das
observaes de x e y. O valor de tcalc dado pela seguinte frmula:

r r
t calc = = , onde: = 0 (por supossio)
EPr 1r2
n 2
Portanto, se o valor de tcalc for menor que o valor crtico de t tabelado, para
um nvel de significncia predeterminado e n 2 graus de liberdade, a correla-
o no apresenta significncia estatstica e, portanto, H0 no deve ser rejeitado.
Por outro lado, quando tcalc for maior que o valor de t tabelado, rejeita-se H0 e a
correlao dita estatisticamente significativa. A seguir, utilizando-se os dados
do exemplo da Tabela 12.2, mostraremos as etapas para o teste de hiptese
para correlao.

Passo 1 Formular as hipteses estatsticas:


H 0 : = 0 e H A : 0
Passo 2 Escolher o nvel de significncia (nvel alfa):
= 0,05 (5%) bilateral
Passo 3 Determinar o valor crtico do teste t:
gl = n 2 = 12 2 = 10 t 0,05;10 = 2,228

Passo 4 Calcular o valor do teste t para r = 0,8352:

r 0,8352 0,8352
t calc = = = = 4 ,80
1r2 1 (0,8352)2 0,1740
n 2 12 2

2. Considera-se n 2 graus de liberdade, porque um grau de liberdade perdido para cada


varivel.

Correlao e Regresso Linear Simples 55

BIOESTATISTICA_VOL02.indb 55 25/06/12 17:20


Passo 5 Regra de deciso:

Se |t calc | < t 0,05;10 , aceita-se H 0 .

Se |t calc | t 0,05;10 , rejeita-se H 0 .

Como |t calc | = 4,80 > t 0,05;10 = 2,228, rejeita-se H 0 .

Passo 6 Concluso:
Existe, portanto, uma forte evidncia que as variveis presso arterial
sistlica e presso arterial diastlica estejam diretamente relacionadas,
isto , que existe uma correlao linear significante entre elas, na popula-
o de onde a amostra foi retirada, pois t calc = 4 ,80; gl = 10; P = 0,0007 .

12.1.4 Coeficiente de determinao (r2)


O coeficiente de determinao r2 uma boa maneira de medir a associao
linear entre duas variveis quantitativas, pois ele representa a proporo da
variabilidade de uma varivel, no caso a varivel y, que explicada pela variabi-
lidade da outra varivel, no caso, a varivel x. Este coeficiente oscila entre 0 e 1,
assim, quanto maior for o valor de r2, maior ser a dependncia de uma varivel
em relao a outra, isto , melhor ser o ajuste da reta em relao aos dados
coletados. Assim, para os dados do exemplo anterior, temos:

r = 0,8352 r 2 = 0,6976 ou r 2 70%

Com base no valor de r2, pode-se concluir que 70% da variao da pres-
so arterial diastlica podem ser explicados pelos valores da presso arterial
sistlica. Com base neste raciocnio, os 30% restantes da variao da presso
arterial diastlica devem ser explicados por outros fatores, alm da presso
arterial sistlica, os quais no foram includos nos estudos, tais como o volume
sistlico ou a frequncia cardaca, por exemplo.
Note que, antes de realizar o clculo do coeficiente de correlao (r),
para, ento, calcular o coeficiente de determinao (r2), o pesquisador pre-
cisar definir qual das duas variveis ser a varivel preditora (x) e qual ser

56 Bioestatstica aplicada Pesquisa Experimental

BIOESTATISTICA_VOL02.indb 56 25/06/12 17:20


a varivel resposta (y). Essa escolha deve ser feita a fim de que a pesquisa
apresente uma lgica de raciocnio para o coeficiente de determinao,
embora os valores de r, r 2 e valor P no sofram alterao, independen-
temente de qual das variveis seja x ou y. Por exemplo, se o pesquisador
estiver correlacionando a idade com a estatura de crianas, a idade dever
ser considerada a varivel preditora x, ao passo que a estatura, a varivel
resposta y, uma vez que, em crianas, ser sempre a idade a influenciar na
estatura e no o contrrio, pois no faz sentido que variaes da estatura
modifiquem a idade da criana. Note, tambm, que, em algumas situaes,
a definio de qual das variveis ser x e qual ser y no tem importn-
cia para o raciocnio do coeficiente de determinao, uma vez que elas se
influenciam mutuamente, como o caso de um experimento que correla-
cione presso e temperatura, por exemplo. Do mesmo modo, pode ocorrer
que variveis no apresentem qualquer relao de causa e efeito entre elas,
sendo a correlao, apenas uma coincidncia.

12.2 REGRESSO LINEAR SIMPLES

Aps a verificao de que a correlao entre duas variveis significa-


tiva, o prximo passo determinar a equao da linha que melhor modela
os dados. Este procedimento, que em estatstica chamado de regresso
linear, pode ser definido como a tentativa de se estabelecer uma equao
matemtica simples que descreva a relao entre duas variveis aleatrias
quantitativas, normalmente distribudas, sendo uma delas, a varivel inde-
pendente x, e a outra, a varivel dependente y. O termo foi introduzido por
sir Francis Galton3, em 1886, em trabalho por ele publicado, que tentou
explicar a variao das estaturas dos filhos em relao s estaturas dos pais,
quando, ento, descreveu o fenmeno conhecido como regresso em dire-
o mdia. Na prtica, na regresso linear simples, o pesquisador cria um
modelo matemtico com o objetivo de descrever o comportamento da vari-

3. Francis Galton (1822-1911) Estatstico, matemtico e meteorologista ingls, foi o criador do


conceito estatstico de correlao e regresso em direo mdia. Aplicou mtodos estatsticos
para o estudo das diferenas e herana humanas de inteligncia, e fundou a psicometria e a
psicologia diferencial.

Correlao e Regresso Linear Simples 57

BIOESTATISTICA_VOL02.indb 57 25/06/12 17:20


vel resposta y (dependente) em funo das variaes da varivel preditora
x (independente), na tentativa de utilizar uma delas para fazer previses a
respeito da outra.
Matematicamente, o procedimento da regresso linear consiste em cal-
cular uma reta que, no diagrama de disperso, melhor represente todos os
pontos do grfico, de tal maneira que a relao existente entre as duas variveis
possa ser expressa por meio de uma equao de regresso, cujos coeficientes
reflitam a intensidade desta relao. Ou seja, neste procedimento, o objetivo
buscar a equao matemtica de uma reta (da o termo linear) na qual a vari-
vel resposta y possa ser expressa como uma funo da varivel preditora x.
Assim, a linha reta calculada por essa equao, chamada de linha de regresso
ou linha de melhor ajuste, pode ser usada a fim de predizer o valor de y para
um dado valor de x. A equao da reta dada por:

y = a + bx

Onde: y = Valor da varivel resposta (dependente).


x = Valor da varivel preditora (independente).
 a = Coeficiente linear (corresponde ao ponto onde a reta intercepta
o eixo y, isto , onde x = 0).
b = Coeficiente angular ou coeficiente de regresso (mostra a incli-
nao da reta, isto , a variao de y para cada acrscimo de uma
unidade em x).

A Figura 12.4, abaixo, mostra a reta de melhor ajuste para os valores das
variveis presso arterial sistlica e diastlica. Note que no diagrama, um
conjunto de linhas pode ser desenhado atravs de um conjunto de pontos,
porm a linha de regresso determinada de modo a obedecer a critrios
especficos, pois ela representa os valores mdios esperados de y para distin-
tos valores de x. Isto , a reta contm os valores esperados para y medida
que os valores de x aumentam. Portanto, o diagrama contm os valores obser-
vados, ao passo que a reta contm os valores que se esperariam encontrar se
a correlao fosse perfeita, com r =1.

58 Bioestatstica aplicada Pesquisa Experimental

BIOESTATISTICA_VOL02.indb 58 25/06/12 17:20


Fig. 12.4 Diagrama de disperso dos valores da presso arterial de 12 indivduos

Note, tambm, que, em um experimento, todos os pontos observados difi-


cilmente se posicionaro exatamente sobre uma linha reta perfeita, embora,
se a correlao existe (r 0), eles sempre tendero para o alinhamento, sendo
estes desalinhamentos atribudos ao acaso, ao desvio aleatrio. Assim, para
cada ponto observado de x, di representa a diferena (desalinhamento) entre o
valor observado e o valor esperado de y, sendo estas diferenas chamadas de
erros ou resduos, os quais podem ser positivos, negativos ou iguais a zero.
Quando o ponto est acima da linha de regresso, d > 0; quando est abaixo da
linha, d < 0; e quando o valor y observado igual ao valor y esperado, o ponto
coincide com a linha de regresso, sendo, portanto, d = 0. Com base neste racio-
cnio, a linha de regresso aquela que melhor se ajusta aos valores observados
de y, ou seja, a reta para a qual a soma dos quadrados dos resduos (d2)
mnimo. A este processo d-se o nome de mtodo de mnimos quadrados.

12.2.1 Determinao da reta de regresso


A verdadeira reta de regresso para uma dada populao somente seria
obtida caso todos os valores de x e y fossem conhecidos. Porm, como normal-
mente isso impossvel de ser feito, o mais comum que a regresso entre
as variveis estudadas seja calculada tomando-se uma amostra n de pontos,
aleatoriamente coletados, da populao e, a partir desses pontos, determi-

Correlao e Regresso Linear Simples 59

BIOESTATISTICA_VOL02.indb 59 25/06/12 17:20


nar os valores do coeficiente linear (a) e do coeficiente angular (b), de tal
maneira que a reta encontrada possa ser ajustada aos pontos do diagrama de
disperso. Assim, como explicado no item anterior, os valores dos parmetros
a e b so calculados de modo que a soma dos quadrados dos desvios dos valo-
res y observados e a reta seja mnima. As frmulas so as seguintes:

( x i )( y i )
xi yi n (x i x )( y i y )
b= =
( x i )
2
( x i x )
x i2 n

a = y bx
Onde: x = Mdia dos valores de x .
y = Mdia dos valores de y .

Assim, tomando-se os dados do exemplo anterior, temos:

Tabela 12.4 Valores das presses arteriais sistlica e diastlica de 12 pacientes


Valores da presso arterial (mmHg)
Paciente
Sistlica (x) Diastlica (y) x.y x2 y2

01 108 65 7.020 11.664 4.225


02 125 74 9.250 15.625 5.476
03 100 64 6.400 10.000 4.096
04 108 68 7.344 11.664 4.624
05 112 72 8.064 12.544 5.184
06 102 66 6.732 10.404 4.356
07 112 68 7.616 12.544 4.624
08 122 70 8.540 14.884 4.900
09 116 70 8.120 13.456 4.900
10 116 70 8.120 13.456 4.900
11 120 72 8.640 14.400 5.184
12 108 70 7.560 11.664 4.900
1.349 829 93.406 152.305 57.369

60 Bioestatstica aplicada Pesquisa Experimental

BIOESTATISTICA_VOL02.indb 60 25/06/12 17:20


( x i )( y i )
xi yi
(1.349)(8829)
93.406
b= n = 12
( x i )
2
(1.349)2
152.305
x i2
n
12

93.406 93.193, 41 212,59


b= = = 0,32
152.305 151.650.08 654 , 92

a = y bx = 69,08 0,32 112, 41 = 69,08 35, 97 = 33,11

Portanto, aps calcular os valores estimados para a = 0,32 e b = 33,11,


possvel, agora, determinar o traado da reta de regresso. Para isso, utiliza-se
a equao de regresso, na qual, para cada um dos valores de x, pode-se calcular
o respectivo valor de y. Assim, a reta estimada para a regresso linear dada por:

y = a + bx

Onde y representa o valor estimado de y para um especfico valor de x.

Deste modo, a equao da reta estimada para os dados da Tabela 12.4


dada por y = 33,11 + 0,32x . Assim, para um valor de x igual a 116 mmHg, temos:

y = 33,11 + 0,32 116 y = 33,11 + 37,12 = 70,23 mm


mHg .

Desta forma, para se desenhar a reta de regresso estimada, sobre o


grfico de disperso, utiliza-se a frmula de regresso com valores calcula-
dos de a e b. Para tal finalidade, dois valores extremos observados de x so
escolhidos, de tal maneira que erros no traado possam ser minimizados. A
seguir, calculam-se os correspondentes valores esperados para ( y ) . Como
exemplo, temos:

Para x = 100 mmHg , y = 33,11 + 0,32 100 = 65,11 mmHg.

Para x = 125 mmHg , y = 33,11 + 0,32 125 = 73,11 mmHg.

Correlao e Regresso Linear Simples 61

BIOESTATISTICA_VOL02.indb 61 25/06/12 17:20


Isto feito, e de posse dos pares ordenados (100; 65,11) e (125; 73,11),
marcam-se os pontos no grfico e traa-se a reta que une esses pontos.
A Figura 12.4 mostra os pontos observados no experimento e a reta ajus-
tada. Note que, no grfico, os pontos no esto posicionados sobre a reta de
ajustamento, mas um pouco afastados em relao a ela. Isto indica que os
valores observados de y no so iguais aos valores esperados ( y ) . A Tabela
12.5 mostra os valores observados e esperados de y, para cada um dos
valores de x.

Tabela 12.5 Valores das presses arteriais sistlica e diastlica de 12 pacientes


Valores da presso arterial (mmHg)
Paciente
Sistlica (x) Diastlica (y) Diastlica (y)
01 108 65 67,67
02 125 74 73,11
03 100 64 65,11
04 108 68 67,67
05 112 72 68,95
06 102 66 65,75
07 112 68 68,95
08 122 70 72,15
09 116 70 70,23
10 116 70 70,23
11 120 72 71,51
12 108 70 67,67

No dia-a-dia da pesquisa, a reta de ajuste traada pelos programas de


estatstica para computadores.

12.2.2 Teste de hiptese para a regresso linear


Para que se possa utilizar a reta de regresso a fim de fazer previ-
ses para y, com base em valores determinados de x, deve-se realizar um
teste de hiptese com o objetivo de verificar se a regresso de x sobre y
verdadeira, isto , se a dependncia de y em relao a x real, se no
ocorreu por acaso, em razo do erro aleatrio. Assim, como a dependncia
de y em relao a x dada pelo coeficiente de regresso (b), o qual geral-
mente calculado com base em uma amostra, o teste de hiptese serve

62 Bioestatstica aplicada Pesquisa Experimental

BIOESTATISTICA_VOL02.indb 62 25/06/12 17:20


para verificar se existe uma diferena estatisticamente significativa entre
o coeficiente calculado b e o verdadeiro coeficiente da populao (B) de
onde a amostra foi retirada.
O teste segue o mesmo raciocnio utilizado para a correlao linear: o
verdadeiro valor do coeficiente de regresso populacional B somente
poderia ser calculado caso todos os possveis valores de x e y, da populao,
pudessem ser conhecidos. Como isto geralmente no possvel, a infern-
cia para a populao feita a partir do coeficiente de regresso amostral b,
o qual representa uma estimativa por ponto de B. Para realizar o teste de
hiptese, supe-se, inicialmente, que B = 0, isto , no existe dependncia de
y em relao x. Se isto for verdade, para um conjunto de vrias amostras
aleatrias, os valores de b obtidos devem ser, na sua maioria, prximos de
zero, com somente alguns poucos valores mais afastados. Caso contrrio, se B
0, espera-se que a maior parte dos valores de b esteja bastante afastada de
zero, alm do que seria de se esperar somente por acaso. Assim, para avaliar a
significncia estatstica do coeficiente de regresso b, testa-se a hiptese nula
(H0) que B = 0, utilizando-se a distribuio t com n 2 graus de liberdade,
sendo n o nmero de pares das observaes de x e y. O valor de tcalc dado
pela seguinte frmula:

b B b b
t calc = = = , onde B = 0 (por suposio)
EPb EPb
( y y )2
(n 2)( x x )2

O EPb tambm pode ser calculado pela seguinte frmula:

EPb =
y 2 a y b xy
( x )2
(n 2) x 2
n

Portanto, se o valor de tcalc for menor que o valor crtico de t tabelado,


para um nvel de significncia predeterminado e n 2 graus de liberdade,
a regresso no apresenta significncia estatstica e, portanto, H0 no deve

Correlao e Regresso Linear Simples 63

BIOESTATISTICA_VOL02.indb 63 25/06/12 17:20


ser rejeitado. Por outro lado, quando tcalc for maior que o valor de t tabelado,
rejeita-se H0 e a regresso dita estatisticamente significativa. A seguir, utili-
zando-se os dados do exemplo da Tabela 12.4, mostraremos as etapas para o
teste de hiptese para regresso.

Passo 1 Formular as hipteses estatsticas:


H0 : B = 0 e H A : B 0

Passo 2 Escolher o nvel de significncia (nvel alfa):

= 0,05 (5%) bilateral

Passo 3 Determinar o valor crtico do teste t:

gl = n 2 = 12 2 = 10 t 0,05;10 = 2,228

Passo 4 Calcular o valor do teste t para b = 0,32:

EPb =
y 2 a y b xy = 57.369 (33,11x829) (0,32x93.406)
( x )2 1.3492
(n 2) x 2 (12 2)(152.305
n 12

30,89
= = 0,0048 = 0,069
6.549,20

b 0,32
t calc = = = 4 ,63
EPb 0,069

Passo 5 Regra de deciso:

Se |t calc | < t 0,05;10 , aceita-se H 0 .

Se |t calc | t 0,05;10 , rejeita-se H 0 .

Como |t calc | = 4,63 > t 0,05;10 = 2,228, rejeita-se H 0 .

64 Bioestatstica aplicada Pesquisa Experimental

BIOESTATISTICA_VOL02.indb 64 25/06/12 17:20


Passo 6 Concluso:
Existe, portanto, na populao de onde a amostra foi retirada, uma depen-
dncia positiva da presso arterial diastlica em relao presso arterial
sistlica. Isto , para cada acrscimo de um mmHg no valor da presso arterial
sistlica, espera-se que a presso arterial diastlica aumente em 0,32 mmHg,
pois t calc = 4 ,63; gl = 10; P = 0,0007 .

Condies para o uso da regresso linear


Antes que o investigador decida utilizar a reta de regresso para fazer infe-
rncias sobre as variveis analisadas, ele deve observar os seguintes pontos
(pressuposies):
Condio de normalidade Ao menos, a varivel dependente y deve
apresentar-se normalmente distribuda ou aproximadamente normal.
Como os valores da varivel independente so geralmente escolhidos pelo
pesquisador, esta condio de normalidade no exigida para x, diferente-
mente da anlise de correlao, em que as duas variveis devem apresen-
tar distribuio normal.
Homocedasticidade A variao da varivel dependente y deve ser a
mesma para cada valor da varivel independente x. Caso esta condio no
seja cumprida, deve-se tentar transformar os dados.
Linearidade O diagrama de disperso deve apresentar os pontos dis-
tribudos com uma tendncia linear, de modo que indique a existncia
de uma correlao entre as variveis. Caso os pontos do diagrama se
apresentem de maneira muito dispersa, a equao no ser uma reta, de-
vendo, o pesquisador, tentar transformar os dados de maneira que possa
obt-la.
Aleatoriedade Os valores das variveis devem ser obtidos ao acaso na
populao, sendo, portanto, independentes.

De qualquer forma, mesmo que os requisitos acima citados tenham sido


cumpridos, alguns cuidados devem ser observados:
Se no h correlao estatisticamente significativa, no se deve utilizar a
equao de regresso para fazer predies;
Ao utilizar a equao de regresso para fazer predies, o pesquisador

Correlao e Regresso Linear Simples 65

BIOESTATISTICA_VOL02.indb 65 25/06/12 17:20


deve-se manter no mbito dos dados amostrais, pois no correto utilizar
a equao para fazer predies sobre uma populao diferente daquela de
onde os dados foram coletados;
Para uma determinada populao, a equao de regresso baseada em
dados do passado no necessariamente vlida para dados do presente,
pois as caractersticas da populao podem ter mudado com o passar do
tempo;
Para calcular os coeficientes da equao de regresso, devem ser utilizados
os dados individualmente coletados, de cada uma das variveis estudadas.
No utilizar mdias nem valores outliers, pois eles podem distorcer a cor-
relao e, tambm, os coeficientes da regresso.

12.2.3 Anlise de resduos ()


Uma outra maneira de avaliar a regresso linear pela aplicao do
mtodo grfico da anlise de resduos, os quais so definidos como erros
observados, isto , eles correspondem s diferenas entre os valores observa-
dos de y e os valores y previstos pela equao de regresso.

= ( y y )

Para aplicao do mtodo, desenha-se um grfico de disperso, no qual


os valores dos resduos so colocados no eixo vertical e os valores de y no
eixo horizontal. Traa-se, na altura do resduo zero, uma linha horizontal
paralela ao eixo x. Os pontos do diagrama devem apresentar uma distribui-
o equilibrada acima e abaixo da reta horizontal, de maneira semelhante
a uma faixa horizontal. A Figura 12.5 mostra o teste grfico para validar as
pressuposies da regresso linear dos valores das presses arteriais do
exemplo anterior.
Caso o grfico de resduos mostre uma distribuio em forma de curva, isto
indica falta de linearidade dos pontos do diagrama de disperso. Do mesmo
modo, se o grfico de resduos apresentar uma distribuio de seus pontos, em
forma de um megafone (cone deitado), isto indica falta de homocedasticidade
entre os valores de x e y.

66 Bioestatstica aplicada Pesquisa Experimental

BIOESTATISTICA_VOL02.indb 66 25/06/12 17:20


Fig. 12.5 Teste grfico da anlise de resduos para a regresso linear dos valores da presso
arterial de 12 indivduos

Aplicao da regresso linear simples


A anlise de regresso linear simples tem ampla aplicao na pesquisa
experimental, alm de ser um dos mtodos estatsticos mais utilizados quando
se deseja estudar a relao entre duas variveis quantitativas normalmente
distribudas. Para ilustrar sua aplicao, mostraremos dois exemplos de an-
lise de regresso em modelos experimentais. O primeiro exemplo mostra uma
anlise isolada, ao passo que, no segundo exemplo, o objetivo comparar dois
conjuntos de dados para verificar se existem diferenas entre eles.

Exemplo 1: Um pesquisador estudou a relao entre o comprimento total


e o peso da espcie de peixe bagre (Arius passany). Para tal, selecionou uma
amostra de 20 exemplares adultos da espcie. Os dados e os grficos da corre-
lao esto representados abaixo. Existe associao entre o comprimento e o
peso na espcie estudada?

Comprimento
710 715 770 790 730 800 780 705 740 775 870 710 725 860 760 820 720 770 785 860
(cm)

Peso (kg) 3,70 3,35 3,65 5,10 4,00 5,00 4,70 3,35 3,55 4,10 5,70 3,55 3,85 5,50 4,20 5,90 3,05 4,20 4,85 5,55

Correlao e Regresso Linear Simples 67

BIOESTATISTICA_VOL02.indb 67 25/06/12 17:20


Fig. 12.7 Diagrama de disperso da regresso linear e da anlise de resduos da correlao


entre o comprimento e o peso da espcie bagre (Arius passany)

Anlise da regresso:
Coeficiente de correlao (r = 0,9180) Indica que existe correlao li-
near fortemente positiva entre o comprimento total e o peso da espcie
de peixe avaliada. Isto , a variao do peso est diretamente associada
variao do comprimento do corpo.
Coeficiente de determinao (r2 = 0,8428) Mostra que, em mdia,
84,28% da variao do peso da espcie bagre explicada pela variao do
comprimento total do corpo. Isto , 84,28% do peso corporal dependem

68 Bioestatstica aplicada Pesquisa Experimental

BIOESTATISTICA_VOL02.indb 68 25/06/12 17:20


diretamente do comprimento do corpo. Os 15,72% restantes do peso do
corpo so explicados por outros fatores no estudados na pesquisa, tais
como a circunferncia abdominal, o comprimento das nadadeiras etc.
Valor P < 0,0001 Indica que a regresso linear no ocorreu ao acaso,
existindo, portanto, na espcie estudada, uma dependncia verdadeira en-
tre as variveis peso e comprimento total do corpo, ou seja, existe re-
gresso do peso sobre o comprimento do corpo.
Equao de regresso ( y = 7,55 + 0,01x ) Pela anlise do coeficiente
de regresso da equao (b = 0,01), pode-se concluir que, para cada acrs-
cimo de 1,0 cm no comprimento total do corpo, espera-se que ocorra, em
mdia, um aumento de 10 g no peso do peixe. A equao pode ser utilizada
para se fazer predies sobre o peso em relao ao comprimento total do
corpo, para a espcie estudada.
Anlise de resduos O grfico mostra os pontos com uma distribuio
equilibrada acima e abaixo da reta horizontal. Isto indica que as pressupo-
sies para a homocedasticidade e linearidade dos dados foram cumpridas.
Concluso H evidncias para se afirmar que existe associao entre o
comprimento total e o peso na espcie estudada?

Exemplo 2: Um pesquisador desejava estudar o valor biolgico da protena


da soja e compar-lo com a protena do leite (casena), tomada como valor de
referncia. Para tal finalidade, selecionou duas amostras de 10 de ratos adultos,
da espcie Wistar (Rattus norvegicus). Ambos os grupos receberam dietas de
composio idnticas, exceto para o tipo de protena. Para o grupo CA, foi admi-
nistrada dieta contendo a protena do leite (casena), durante um perodo de
14 dias. Para o grupo SO, dieta contendo a protena de soja, por igual perodo de
tempo. Os valores mdios da ingesto de protena e do ganho de peso, dirios,
foram registrados para avaliao da correlao nos grupos estudados. Os dados
e os grficos esto representados a seguir. O valor biolgico da protena da soja
difere daquele da protena do leite?

Grupo Consumo protico (g) 14,31 13,63 14,89 14,60 13,42 16,25 14,59 16,35 13,50 15,75
CA Ganho de peso (g) 54,93 50,53 55,03 51,13 51,73 60,33 56,43 61,33 52,33 52,73
Grupo Consumo protico (g) 9,70 8,52 11,73 8,64 9,30 10,14 9,92 11,44 8,49 11,34
SO Ganho de peso (g) 55,10 50,82 57,32 51,12 51,74 57,84 56,18 58,20 52,34 52,20

Correlao e Regresso Linear Simples 69

BIOESTATISTICA_VOL02.indb 69 25/06/12 17:20


Fig. 12.8 Diagrama de disperso da regresso linear e da anlise de resduos da correlao


entre a ingesto de casena e o ganho de peso de ratos Wistar

Fig. 12.9 Diagrama de disperso da regresso linear e da anlise de resduos da correlao


entre a ingesto de protena da soja e o ganho de peso de ratos Wistar

Anlise das regresses:


Coeficientes de correlao (r = 0,7839 e r = 0,6827) Comparando os
dois coeficientes, verifica-se que tanto a protena do leite quanto a prote-
na da soja apresentaram uma forte correlao com o ganho de peso dos
animais.
Coeficientes de determinao (r2 = 0,6145 e r2 = 0,4661) Mostram que,
para o primeiro grupo, a ingesto da casena explica, na mdia, 61,45% da
variao de peso dos animais, ao passo que, no segundo grupo, a prote-

70 Bioestatstica aplicada Pesquisa Experimental

BIOESTATISTICA_VOL02.indb 70 25/06/12 17:20


na da soja responsvel somente por 46,61% desta variao. Tomando-se
como base este raciocnio, pode-se concluir que, no experimento, a pro-
tena do leite mostrou-se mais efetiva em aumentar o peso dos animais
quando comparada protena da soja.
Valores P (0,0073 e 0,0295) Indica que, em ambas as dietas, a regresso
linear no ocorreu ao acaso, e que existe, portanto, uma dependncia ver-
dadeira entre as dietas estudadas e o ganho de peso dos animais, ou seja,
existe regresso do ganho de peso sobre o consumo de protena.
Equaes de regresso ( y = 14 ,74 + 2,70x e y = 38,13 + 1,63x ) Pela
anlise dos coeficientes de regresso das equaes (b1 = 2,70 e b2 = 1,63),
pode-se concluir que, para o primeiro grupo, para cada acrscimo de 1,0
g na ingesto de casena, espera-se que ocorra, em mdia, um aumento
de 2,70 g/dia no peso dos animais, ao passo que, para o segundo grupo,
para cada acrscimo de 1,0 g na ingesto da protena da soja, espera-se
que ocorra, em mdia, um aumento de peso de 1,63 g/dia. Esta compa-
rao mostra que a casena produz um ganho de peso dirio maior que a
protena da soja, embora o teste de comparao dos coeficientes de regres-
so no tenha mostrado diferena estatisticamente significativa, pois valor
P = 0,2826 (calculado pelo programa BioEstat).
Anlises de resduos Os grficos mostram, nos dois casos, que os pontos
apresentam uma distribuio equilibrada, acima e abaixo da reta horizon-
tal. Isto indica que as pressuposies para a homocedasticidade e lineari-
dade dos dados foram cumpridas
Concluso No h evidncias para se afirmar que o valor biolgico da pro-
tena da soja difere daquele da protena do leite, pois os coeficientes de re-
gresso no mostraram diferena estatisticamente significativa (P = 0,2826).

Correlao e Regresso Linear Simples 71

BIOESTATISTICA_VOL02.indb 71 25/06/12 17:20


72 Bioestatstica aplicada Pesquisa Experimental

BIOESTATISTICA_VOL02.indb 72 25/06/12 17:20


13
Testes de Aderncia

Os testes de hipteses para inferncias estatsticas univariadas so aqueles


que correlacionam um parmetro amostral com o mesmo parmetro da popu-
lao estudada. Geralmente, esta correlao ocorre pela comparao dos valo-
res dos dados amostrais com os valores que se esperaria obter em uma distri-
buio terica, sendo, por este motivo, denominados de testes de aderncia,
os quais pertencem a uma classe de teste de hiptese cuja funo verificar
se a distribuio de frequncia dos dados da amostra estudada segue a forma
da curva de uma distribuio hipottica. Na prtica, como qualquer teste de
hiptese, eles tm o objetivo de verificar se existe uma diferena estatistica-
mente significativa entre os dados observados e aqueles que se esperaria obter
atravs de uma distribuio terica, casos esses dados tenham sido obtidos da
mesma populao hipottica.
Por exemplo, um pesquisador que deseja comparar os dados de duas
amostras, supe que estes dados apresentem uma distribuio normal, pois
isto permite que ele possa escolher a maioria das tcnicas de inferncia es-
tatstica conhecidas. Para avaliar se sua suposio est correta, ele deve es-
colher, dentre os diversos existentes, um teste de aderncia, para verificar
se a distribuio dos seus dados amostrais adere, isto , segue o modelo da
distribuio normal.

BIOESTATISTICA_VOL02.indb 73 25/06/12 17:20


Isso sempre possvel, porque uma varivel aleatria, seja ela a estatura
ou a idade de um determinado grupo de indivduos, por exemplo, sempre as-
sume um tipo de distribuio de frequncia especfica dentre as diversas das
muitas distribuies tericas citadas na literatura. Essas distribuies so mo-
delos que procuram representar o comportamento de um determinado even-
to em funo da frequncia de sua ocorrncia, sendo, portanto, distribuies
de probabilidades, nas quais, para um determinado evento, podemos prever a
probabilidade de sua ocorrncia. Em outras palavras, podemos inferir com que
probabilidade determinado evento pode ocorrer novamente. Assim, quando
um pesquisador assume que um determinado grupo de dados se distribui con-
forme um modelo probabilstico, isso permite que ele realize estimativas sem
precisar da totalidade das informaes da populao de onde os dados foram
retirados. Porm, muito frequentemente, surge uma dvida: como estimar se a
distribuio de um conjunto de dados segue um determinado modelo terico?
Para que possa responder sua pergunta, o pesquisador dever aplicar um
teste de aderncia, muitas vezes chamados de Testes de Bondade de Ajuste
(goodness of fit test), uma vez que estes testes tentam verificar se os dados
amostrais se ajustam bem ou no a uma distribuio terica.
Por sua vez, interessante notar que existem testes de aderncia que ser-
vem para avaliar hipteses mais gerais sobre a distribuio dos dados, enquan-
to que outros so especficos para determinados modelos tericos. Assim, na
rea das cincias biolgicas e da sade, os testes de aderncia mais utilizados
so: o teste de Kolmogorov-Smirnov1 e o teste do qui-quadrado da adern-
cia, sendo o primeiro, o teste no-paramtrico mais apropriado para quando se
trabalha com dados ordinais, e ideal para variveis contnuas, e o segundo, ide-
al para variveis dicotmicas. Outros testes, tais como o de Anderson-Darling
e o de Shapiro-Wilk, tambm podem ser utilizados e constituem uma alterna-
tiva para os testes de Kolmogorov-Smirnov e do qui-quadrado, pois apresen-
tam, como vantagem, maior sensibilidade, sendo o de Shapiro-Wilk o teste de
normalidade preferido em razo de ser mais poderoso para amostras menores

1. 
Andrei Nikolaevich Kolmogorov (1903-1987) - Matemtico russo, autor das principais
descobertas cientficas do sculo XX nas reas de probabilidade e estatstica. Vladimir
Ivanovich Smirnov (1887-1974) Matemtico russo, autor de significativas contibuies para
matemtica pura e aplicada, assim como para a histria da matemtica.

74 Bioestatstica aplicada Pesquisa Experimental

BIOESTATISTICA_VOL02.indb 74 25/06/12 17:20


ou iguais a 50, enquanto que o teste de Anderson-Darling tem mais poder para
amostras maiores de 50.
Assim, para qualquer tipo de teste de aderncia, o princpio bsico que,
para uma dada amostra de tamanho n, observada a partir de uma varivel
aleatria x, o objetivo testar a hiptese nula (H0) de que x segue uma dis-
tribuio terica, contra a hiptese alternativa (H1), na qual x no segue a
distribuio. Portanto, neste captulo, abordaremos os testes de Kolmogorov-
-Smirnov e o teste de Shapiro-Wilk, ao passo que, para melhor compreenso,
o teste do qui-quadrado da aderncia ser discutido no captulo que trata dos
testes no-paramtricos.

13.1 TESTE DE KOLMOGOROV-SMIRNOV (TESTE D)

Teste de aderncia no-paramtrico, com base em amostras finitas, utili-


zado para determinar se duas distribuies de probabilidade subjacentes dife-
rem uma da outra, ou se uma distribuio de probabilidade observada difere
de uma distribuio terica. uma prova aplicada para testar a hiptese de que
um conjunto de dados amostrais provm ou no de uma determinada distribui-
o. Neste caso, a comparao feita para se verificar o grau de concordncia
entre a distribuio acumulada de um conjunto de valores de uma amostra ale-
atria e a distribuio terica esperada.
Neste teste, de execuo simples quando comparado ao qui-quadrado, cal-
cula-se o mdulo da maior diferena (Dmx) entre a funo de distribuio nor-
mal acumulada esperada (Fesp)2 e a funo da distribuio da frequncia relativa
observada acumulada e ajustada (Fobs) dos valores amostrais observados. Para
tal, necessrio, inicialmente, que os valores observados sejam normalizados. A
seguir, esta diferena comparada com o desvio mximo tabelado (Dt), o qual
encontrado na tabela dos valores crticos da distribuio Kolmogorov-Smirnov.
Caso a diferena mxima calculada seja maior que o desvio mximo tabelado,
rejeita-se H0 e afirma-se que no h concordncia entre os valores observados e
esperados. Isto , conclui-se que os dados amostrais no seguem a distribuio

2. conveno usar um F maisculo para a funo de distribuio acumulada.

Teste de Aderncia 75

BIOESTATISTICA_VOL02.indb 75 25/06/12 17:20


terica esperada, para um determinado nvel de significncia. Caso contrrio, se
a diferena mxima calculada for menor que o desvio mximo tabelado, se aceita
H0 e conclui-se que os dados seguem a distribuio terica esperada.
Na prtica, a maneira mais fcil de executar o teste de Kolmogorov-Smir-
nov construir uma tabela de distribuio de frequncias (Tabela 13.1), na
qual sero colocados todos os dados calculados. A frmula para realizar o teste
a seguinte:

1 (i 0,5)
Dmx = m x| Fesp ( x ) Fobs ( x )| + , sendo: Fobs ( x ) =
2n n

Para n 100 o desvio mximo tabelado (Dt) obtido diretamente da tabela.


Para n > 100, o valor Dt calculado pela seguinte equao:

1
ln
Dt = 2 , onde: ln = Logaritmo natural.
2n
= Nvel de significncia estabelecido.
n = Tamanho da amostra.

Exemplo: Em um estudo para avaliar a funo hormonal da glndula pa-


ratireide, um pesquisador dosou o clcio srico em uma amostra aleatria de
oito pacientes atendidos no ambulatrio de um hospital pblico. Os valores
esto expressos no quadro abaixo. Estes resultados tm distribuio normal,
sabendo-se que na populao, em geral, os valores do clcio srico apresentam-
-se normalmente distribudos, com mdia igual a 9,4 mg/dL e desvio padro de
0,8 mg/dL?

Clcio srico (mg/dL) 8,8 9,7 9,2 9,3 8,6 9,1 8,9 8,4

Passo 1 Formular as hipteses estatsticas:


H 0 : Fesp ( x ) = Fobs ( x ) e H A : Fesp ( x ) Fobs ( x )
Passo 2 Escolher o nvel de significncia (nvel alfa):
= 0,05 (5%) bilateral
Passo 3 Determinar o valor crtico do teste:
D0.05;8 = 0, 4570

76 Bioestatstica aplicada Pesquisa Experimental

BIOESTATISTICA_VOL02.indb 76 25/06/12 17:20


Passo 4 Calcular o valor do teste:

Tabela 13.1 Valores da dosagem do clcio, em mg/dL, de oito pacientes

xi x (i 05)
i xi zi = Fesp ( x ) Fobs ( x ) = | Fesp ( x ) Fobs ( x )|
s n

1 8,4 1,5 0,0668 0,0625 0,0043

2 8,6 1 0,1587 0,1875 0,0288

3 8,8 0,5 0,3085 0,3125 0,0040

4 8,9 0,25 0,4013 0,4375 0,0362

5 9,1 0,25 0,5987 0,5625 0,0362

6 9,2 0,5 0,6915 0,6875 0,0040

7 9,3 0,75 0,7734 0,8125 0,0391

8 9,7 1,75 0,9599 0,9375 0,0224


x = 9, 0
s = 0, 4

Quando o valor de zi for negativo, deve-se subtrair o valor tabelado (da


tabela da distribuio normal) do valor 0,5. Assim, para zi = 1,5 o valor
tabelado 0,4332. Ento, Fesp ( x 1 ) = 0,5 0, 4332 = 0,0668.
Quando o valor de zi for positivo, deve-se somar 0,5 ao valor tabelado (da
tabela da distribuio normal). Assim, para z8 = 1,75 o valor tabelado
0,4599. Ento, Fesp ( x 8 ) = 0,5 + 0, 4599 = 0, 9599.

1
Dmax = 0,0391 + = 0,1016
16

Passo 5 Regra de deciso:

Se Dmx < D0,05;8 , aceita-se H 0 .

Se Dmx D0,05;8 , rejeita-se H 0 .

Como Dmx = 0,1016 < D0,05;8 = 0, 4570, aceita-se H 0 .

Teste de Aderncia 77

BIOESTATISTICA_VOL02.indb 77 25/06/12 17:20


Passo 6 Concluso:
Como o valor calculado para Dmx menor que o valor crtico tabelado Dt,
se aceita H0 e conclui-se que os valores do clcio srico da amostra seguem
a distribuio normal.

A Figura 13.1 mostra a relao entre as duas curvas de funo dos valores
esperados e observados. Observar que as diferenas entre elas so pequenas, o
que mostra que ambas possuem distribuio normal.

Fig. Relao entre as curvas dos valores esperados e observados

13.2 TESTE DE SHAPIRO-WILK (TESTE W)

Publicado em 1965 por Samuel Shapiro3 e Martin Wilk4, um teste utili-


zado para verificar se os dados seguem a distribuio normal, sendo o mais
indicado quando o tamanho da amostra menor que 50. Igualmente ao teste
de Kolmogorov-Smirnov, o teste de Shapiro-Wilk considera como hiptese nula
(H0), aquela em que a amostra foi retirada de uma populao normalmente

3. Samuel Harvey Shapiro (1907-1987) Estatstico russo que emigrou para os Estados Unidos,
estudou na Universidade de Illinois, onde foi governador em 1960 e 1964.
4. Martin Bradbury Wilk (1922) Engenheiro qumico e estatstico canadense que, juntamente
com Samuel Shapiro, desenvolveu o teste de aderncia Shapiro-Wilk.

78 Bioestatstica aplicada Pesquisa Experimental

BIOESTATISTICA_VOL02.indb 78 25/06/12 17:20


distribuda, sendo obtido pela diviso entre o quadrado da combinao linear
apropriada dos valores ordenados da amostra e a varincia simtrica estimada.
dado pela equao:

N /2
b2 n
Wcalc = , onde: b = aN i +1 .( x N i +1 x i ) e SQD = ( x x )2
SQD i =1 i =1

SQD = Soma dos quadrados dos desvios.

m V 1
Constante a determinada por: (a1 ,...,an ) =
(m V 1V 1m )1/2
Sendo: m os valores esperados da estatstica de ordem da normal padro
para uma amostra de tamanho n.
 m = (m1,, mn)T onde m = n/2 se n par e m = (n 1)/2 se n for
mpar.
V - Matriz de covarincia correspondente.

Obs.: Os coeficientes aN-i+1 podem ser obtidos diretamente da tabela para o tes-
te W de normalidade de Shapiro-Wilk, no final deste livro.

Assim, se o valor de Wcalc for menor que o valor crtico Wt obtido na tabela
dos valores crticos para o teste de Shapiro-Wilk, em funo do tamanho da
amostra (n) e do nvel de significncia preestabelecido, rejeita-se a hiptese
H0 e conclui-se que os dados no seguem a distribuio normal; caso contr-
rio, aceita-se H0.

Exemplo: Com o objetivo de estudar o comportamento da presso arterial


aps a prtica de atividades fsicas, um pesquisador mediu os valores da pres-
so arterial diastlica de 10 indivduos frequentadores de uma academia. Os
dados esto dispostos no quadro abaixo. Os valores da presso arterial diast-
lica apresentam-se normalmente distribudos?

Presso arterial (mmHg) 80 100 90 70 80 100 90 70 90 100

Teste de Aderncia 79

BIOESTATISTICA_VOL02.indb 79 25/06/12 17:20


Passo 1 Formular as hipteses estatsticas:
H0: A amostra provm de uma populao normal.
HA: A amostra no provm de uma populao normal.
Passo 2 Escolher o nvel de significncia (nvel alfa):
= 0,05 (5%) bilateral
Passo 3 Determinar o valor crtico do teste:
W0,05;10 = 0,8420
Passo 4 Calcular o valor do teste:
Ordenar as observaes 70 70 80 80 90 90 90 100 100 100
Calcular b2 (utilizar tabela de distribuio).

Tabela 13.2 Valores da dosagem do clcio, em mg/dL, de oito pacientes


i N-i+1 aN-i+1 xN-i+1 xi aN-i+1(xN-i+1-xi)
1 10 0,5739 100 70 17.2170
2 9 0,3291 100 70 9.8730
3 8 0,2141 100 80 4.2820
4 7 0,1224 90 80 1.2240
5 6 0,0399 90 90 0.0000
= 32, 5960

Ento: b 2 = (32,5960)2 = 1.062,50

n
Calcular: SQD = ( x x )2 =1.210,00
i =1

b2 1.062,50
Wcalc = = = 0,8781
SQD 1.210,00

Passo 5 Regra de deciso:

Se Wcalc < W0,05;10 , rejeita-se H 0 .

Se Wcalc W0,05;10 , aceita-se H 0 .

Como Wcalc = 0,8781 > W0,05;10 = 0,8420, aceita-se H 0 .

80 Bioestatstica aplicada Pesquisa Experimental

BIOESTATISTICA_VOL02.indb 80 25/06/12 17:20


Passo 6 Concluso:
Como o valor calculado para Wcalc maior que o valor crtico tabelado W0,05;10,
aceita-se H0 e conclui-se que os valores da presso arterial diastlica dos
indivduos da amostra seguem a distribuio normal, pois Wcalc = 0,8781;
P = 0,1527 .

Teste de Aderncia 81

BIOESTATISTICA_VOL02.indb 81 25/06/12 17:20


BIOESTATISTICA_VOL02.indb 82 25/06/12 17:20
parte 4

Testes de Hipteses
NO-paramtricos

Uma distino importante entre cincia e religio


que, em cincia, as hipteses
precisam ser comprovadas experimentalmente.

Marcelo Gleiser (1959 - )


Autor do livro Poeira das Estrelas.

BIOESTATISTICA_VOL02.indb 83 25/06/12 17:20


BIOESTATISTICA_VOL02.indb 84 25/06/12 17:20
14
Distribuio Qui-Quadrado

Em um processo de anlise bivariada, alm do estudo com variveis


contnuas, para as quais o teste mais utilizado o t de Student, muitas vezes
o pesquisador se depara com testes de hipteses que utilizam variveis no-
-paramtricas do tipo nominal ou dicotmica, como por exemplo, quando
quer comparar variveis qualitativas arranjadas em duas ou mais categorias
bem definidas, tal como doena ou cura, sobrevida ou morte, hipertenso ou
normotenso. Nestes casos, em que cada indivduo do estudo classificado
em somente uma das categorias, as frequncias relativas ou absolutas po-
2
dem ser analisadas pela aplicao da distribuio qui-quadrado ( ), sendo
o teste do qui-quadrado, o teste de probabilidade exata de Fisher e o
teste do qui-quadrado de McNemar os mais utilizados na anlise dados
no-paramtricos na rea das cincias da sade, os quais sero objetos de
estudo neste captulo.
Embora de grande versatilidade e de fcil interpretao, a aplicao de
cada um destes testes requer a utilizao da tabela de contingncia, na
qual sero colocados os valores observados das variveis estudadas. Isto
permite que os grupos em estudo possam ser comparados, de tal maneira
que se possa verificar a existncia ou no de associao entre eles, alm de

BIOESTATISTICA_VOL02.indb 85 25/06/12 17:20


tornar os clculos mais simples e mais fceis de interpretar. Assim, antes de
iniciarmos a discusso sobre cada um destes testes, necessrio que o lei-
tor se familiarize com o uso da tabela de contingncia, que descreveremos
a seguir.

14.1 TABELAS DE CONTINGNCIA

Tambm conhecidas como tabelas de dupla entrada, as tabelas de


contingncia so amplamente utilizadas para registrar e analisar o rela-
cionamento entre duas ou mais variveis qualitativas do tipo categricas
dicotmicas, de tal modo que se possam comparar as frequncias das cate-
gorias de uma das variveis em relao s categorias da outra. Neste tipo de
tabela, alm dos testes de hiptese que sero aqui descritos, outros testes
tambm podem ser executados, tais como o clculo da razo de risco (risk
ratio) e da razo de chance (odds ratio), assim como vrias outras anlises
de interesse frequentemente utilizadas em estatstica, dentre as quais se
destacam as anlises de sensibilidade e de especificidade para os testes de
rastreamento de diagnstico. Sua denominao advm do fato de que ela
utilizada para determinar se a distribuio de uma varivel dependente
(contingente) da outra, cujo objetivo testar a hiptese nula de que as vari-
veis so independentes.
Uma tabela clssica constituda por duas linhas (l) e duas colunas (c),
as quais formam, pelas suas interseces, quatro clulas ou caselas que, por
conveno, so designadas pelas letras a, b, c, e d. Na prtica, as caselas for-
mam uma matriz 2 x 2 e, na tabela, os dados podem ser registrados, tomando-
-se por base as linhas ou as colunas, da o termo tabela de dupla entrada.
Tradicionalmente, nas linhas, so registrados os valores referentes aos gru-
pos que sero comparados, ao passo que, nas colunas, so registrados os va-
lores referentes ao desfecho estudado. A Tabela 14.1 mostra um exemplo de
uma tabela de contingncia padro.

86 Bioestatstica aplicada Pesquisa Experimental

BIOESTATISTICA_VOL02.indb 86 25/06/12 17:20


Tabela 14.1 Tabela de contingncia 2 x 2 padro
Desfecho
Total
Presente Ausente
Presente a b a+b
Fator de risco
Ausente c d c+d
Total a+c b+d a+b+c+d
a - Indivduos com fator de risco e com a doena
b - Indivduos com fator de risco, sem a doena
c - Indivduos sem o fator de risco, mas com a doena
d - Indivduos sem fator de risco e sem a doena
a + b - Todos os Indivduos com fator de risco
c + d - Todos os Indivduos sem fator de risco
a + c - Todos os Indivduos com a doena
b + d - Todos os Indivduos sem a doena
a + b + c + d - Todos os indivduos do estudo

Note que utilizao da tabela muito verstil e, como foi referido anterior-
mente, serve para vrios propsitos, alm do teste do qui-quadrado. Visualizar
a distribuio dos dados e montar a tabela de contingncia o primeiro desafio
para um pesquisador menos experiente, pois o que se coloca nas linhas e nas
colunas depende do estudo que ser realizado. Por exemplo, na Tabela 14.1,
somente dois grupos so comparados, sendo um deles o grupo constitudo pe-
los indivduos expostos a um dado fator de risco, enquanto que o outro grupo
constitudo por indivduos no-expostos ao mesmo fator. No exemplo em tela,
a varivel preditora um fator de risco, mas poderia ser uma interveno te-
raputica, um fator de proteo, tal como uma vacina, ou outra caracterstica
qualquer que pudesse ser testada em um experimento. Tradicionalmente, os
valores dos grupos testados so distribudos nas linhas da tabela e, a ordem
de alocao, seja na primeira ou na segunda linha, no altera o valor do teste.
Por outro lado, os valores para o desfecho esperado no estudo devem ser
alocados, tomando-se como referncia as colunas da tabela. Os indivduos que,
ao final do estudo, apresentam o desfecho esperado devem ser colocados na
primeira coluna, ao passo que o grupo de pacientes cujo desfecho no foi ob-

Distribuio Qui-Quadrado 87

BIOESTATISTICA_VOL02.indb 87 25/06/12 17:20


servado, deve ocupar a segunda coluna. Esta disposio, apesar de tambm no
influenciar no resultado do teste, pode facilitar a interpretao dos resultados
do mesmo. Do mesmo modo, o desfecho pode ser qualquer evento esperado re-
lacionado varivel preditora, tal como a evoluo de uma doena, o resultado
de um tratamento etc. Na margem lateral direita da tabela, sero colocados os
totais das linhas, e na margem inferior, os totais das colunas; no canto inferior
direito, o total dos indivduos participantes do estudo. Este valor muito im-
portante, pois ele deve corresponder ao somatrio das linhas que, obrigatoria-
mente, igual ao somatrio das colunas. A Tabela 14.2 mostra, para o exemplo
a seguir, a distribuio dos dados em um estudo caso-controle que compara
dois grupos segundo suas exposies ao fator de risco tabagismo.

Exemplo: Em um estudo caso-controle, dois grupos de pacientes foram


acompanhados quanto incidncia de cncer do pulmo associado ao tabagis-
mo. No grupo de fumantes, constitudo por 100 indivduos, a incidncia de cn-
cer ocorreu em 28 pacientes, enquanto que, no grupo controle (no-fumantes),
constitudo por 200 pacientes, a incidncia foi igual a 16 casos. Qual a distribui-
o na tabela de contingncia?

Tabela 14.2 Tabela de contingncia para um estudo do tipo caso-controle


Desfecho
Cncer sim Cncer no Total
Tabagismo sim 28 (28%) 72 (72%) 100 (100%)
Fator de risco
Tabagismo no 16 (8%) 184 (92%) 200 (100%)
Total 44 (14,7%) 256 (85,3%) 300 (100%)

Observe que, na tabela, alm do valor absoluto de cada uma das caselas,
podem ser colocadas as porcentagens dos valores observados em cada um dos
grupos comparados no estudo. Isto facilita o entendimento, pois simplifica a
comparao em relao s incidncias nos diferentes grupos. Do mesmo modo,
deve-se colocar a soma das porcentagens (100%) nos totais marginais de cada
categoria, para que fique claro ao leitor, em relao a que total a porcentagem
foi calculada. Na margem inferior, colocam-se as porcentagens relacionadas ao

88 Bioestatstica aplicada Pesquisa Experimental

BIOESTATISTICA_VOL02.indb 88 25/06/12 17:20


desfecho, que, igualmente, deve somar 100%. Observe tambm que, na tabela,
a incidncia de cncer parece ter sido maior no grupo de pacientes sujeitos ao
fator de risco tabagismo, porm so necessrios testes estatsticos para que
essas concluses iniciais possam ser confirmadas. Esses testes, assim como os
mtodos para calcular as porcentagens, sero discutidos mais adiante.
Note, ainda, que a tabela de dupla entrada pode ser expandida para que
trs ou mais grupos possam ser simultaneamente comparados em relao a
um mesmo tipo de desfecho. Neste caso, criam-se matrizes l x c, de tal modo
que o total das clulas da tabela pode ser descrito como 3 x 3, 4 x 4 etc., sendo
o modelo mais empregado a matriz 2 x 2. A Tabela 14.3 mostra um exemplo de
uma tabela do tipo 4 x 2.

Tabela 14.3 Tabela de contingncia 4 x 2


Desfecho
Fumante No-fumante Total
20 a 30 anos 18 32 50
31 a 40 anos 15 35 50
Faixa etria
41 a 50 anos 17 33 50
51 a 60 anos 15 35 50
Total 65 135 200

14.2 A DISTRIBUIO QUI-QUADRADO (2)

Desenvolvida por Karl Pearson, em 1899, a distribuio do qui-quadrado ,


sem dvida, a mais apropriada para ser utilizada quando o objetivo comparar
variveis qualitativas distribudas em duas ou mais categorias. A distribuio
geralmente empregada para verificar, mediante a aplicao do teste do qui-
-quadrado ( ), se existe diferena estatisticamente significante entre os valo-
2

res da frequncia observada (O) de um determinado evento e a frequncia com


que ele esperado (E), segundo uma determinada teoria. Isto , a distribuio
do qui-quadrado fornece a probabilidade com que as diferenas entre os valo-
res observados e esperados ocorreriam somente em razo do acaso.

Distribuio Qui-Quadrado 89

BIOESTATISTICA_VOL02.indb 89 25/06/12 17:20


Essa distribuio corresponde a uma famlia de curvas cuja forma varia
de acordo com o nvel de significncia (nvel ) estipulado para o teste e com o
nmero de grupos comparados. Porm, na prtica, geralmente representada
por uma curva assimtrica, inclinada direita, cuja assimetria diminui me-
dida que aumenta o nmero de categorias comparadas, as quais determinam
os graus de liberdade (gl) do teste. A curva comea sempre no valor zero e
apresenta somente valores positivos, sendo a mdia da distribuio igual ao
nmero de graus de liberdade, o qual calculado, para o teste do qui-quadrado
da independncia, pela equao gl = (l -1)(c -1). A Figura 14.1 mostra a forma
da curva da distribuio do considerando gl = 1.
2

Fig. 14.1 Forma geral da curva da distribuio para gl = 1, com regio de significncia
2

=0,05

Assim, medida que aumentam os graus de liberdade, a mdia desloca-


da para a direita, aumentando, tambm, o desvio padro da distribuio, de
forma que a curva se torna cada vez mais simtrica. Deste modo, medida que
os graus de liberdade ficam muito grandes, a distribuio do qui-quadrado as-
sume a forma semelhante distribuio normal gaussiana, de tal forma que a
regio de significncia ou de rejeio da hiptese nula sempre unilateral e
deslocada para a cauda direita da curva, uma vez que valores do prximos de
2

zero, por indicarem diferenas pequenas entre os valores observados e espera-


dos, caem na zona de aceitao, no interessando, portanto, para a rejeio da
hiptese de nulidade. O valor crtico para o teste deve ser procurado na tabela

90 Bioestatstica aplicada Pesquisa Experimental

BIOESTATISTICA_VOL02.indb 90 25/06/12 17:20


da distribuio qui-quadrado, considerando-se o nmero de graus de liberdade
e o nvel alfa preestabelecido no delineamento.
Portanto, para utilizar a distribuio do qui-quadrado para o teste de
hiptese, o valor do teste calculado e comparado com o valor crtico encon-
trado na tabela. Como o valor calculado depende das diferenas entre os valo-
res observados e esperados (O E), o ser igual a zero quando no houver
2

diferena entre os grupos comparados, crescendo medida que aumentam as


discrepncias entre eles. Com base neste raciocnio, diferenas muito grandes
so pouco provveis de acontecer somente por acaso. Assim, se o valor calcula-
do ( calc ) for maior que o valor crtico tabelado ( ;gl ), a hiptese nula a qual
2 2

afirma que as frequncias dos valores observados so iguais s frequncias dos


valores esperados (O = E) dever ser rejeitada. Caso contrrio, a hiptese nula
dever ser aceita.

14.3 TESTE DO QUI-QUADRADO (2)

Teste no-paramtrico, geralmente empregado para comparar as caracte-


rsticas entre duas ou mais populaes, no intuito de verificar se a frequncia
ou proporo com que um determinado evento observado em uma delas se
desvia significativamente da frequncia ou proporo com que o mesmo even-
to ocorre nas demais. Na prtica, o teste do qui-quadrado um modelo estats-
tico que compara o comportamento de uma varivel dependente com base no
conhecimento de uma ou mais variveis independentes, mediante a aplicao
de um processo de comparao das contagens observadas (O) com as conta-
gens esperadas (E). Isto , se as contagens observadas para o evento se ajus-
tam s contagens esperadas para o mesmo evento, com base em um modelo
predefinido, no qual a hiptese nula (H0) aquela que afirma que as variveis
comparadas so independentes. Em outras palavras, o teste compara os valores
observados com os valores esperados, para verificar o quanto das diferenas
entre eles pode ser atribudo ao acaso, em razo do erro aleatrio decorrente
do processo de amostragem. O valor do calculado pela seguinte equao:
2

(O E )2
calc
2
=
E

Distribuio Qui-Quadrado 91

BIOESTATISTICA_VOL02.indb 91 25/06/12 17:20


Observe que, para calcular o valor do , necessrio calcular as diferenas
2

entre as frequncias dos valores observados (O) e as frequncias dos valores


esperados (E), o que implica, a princpio, que os valores esperados sejam calcu-
lados. Observe, tambm, que as diferenas so elevadas ao quadrado, para que
a soma no seja igual a zero. Cada diferena (O E)2 deve ser dividida pelo valor
esperado (E) para ajustar, na tabela de contingncia, as ponderaes entre os
valores observados e esperados nos diferentes grupos comparados. Para mos-
trar a maneira como calculado o valor do , utilizaremos o exemplo a seguir.
2

Exemplo: Objetivando testar uma nova droga para o tratamento da AIDS,


um investigador realizou um estudo experimental para o qual selecionou, ale-
atoriamente, 300 pacientes. Para 240 dos pacientes selecionados, foi adminis-
trada a droga A, ao passo que para os outros 60 pacientes, foi administrada a
droga B. A taxa de mortalidade em dois anos foi de 88 e 12 pacientes, para a
droga A e B, respectivamente. Qual o valor do para o estudo em questo?
2

Tabela 14.4 Tabela de contingncia para um estudo experimental com 300 pacientes
Mortalidade
Total
Sim No
A 88 152 240
Droga
B 12 48 60
Total 100 200 300

Clculo das contagens esperadas Para cada casela da tabela de con-


tingncia, a contagem esperada (El,c) dada pela seguinte equao:

Total da linha
E l ,c = Total da co
oluna
Total do estudo

Assim, para cada casela, temos os seguintes valores esperados:

240 100 240 200


E1,1 = = 80 E1,2 = = 160
300 300

60 100 60 200
E 2,1 = = 20 E 2,2 = = 40
300 300

92 Bioestatstica aplicada Pesquisa Experimental

BIOESTATISTICA_VOL02.indb 92 25/06/12 17:20


Clculo das percentagens Para cada casela da tabela de contingncia, a
percentagem (Pl,c) deve ser calculada, de tal maneira que se possam com-
parar as frequncias relativas dos desfechos estudados. A percentagem
calculada pela seguinte equao:

Total da casela
Pl ,c = 100
Total da linha

Assim, para cada casela, temos as seguintes percentagens:

88 100 152 100


P1,1 = = 36,7% P1,2 = = 63,3%
240 240

12 100 48 100
P2,1 = = 20,0% P2,2 = = 80,0%
60 60

Clculo do qui-quadrado

(88 80)2 (152 160)2 (12 20)2 (48 40)2


calc
2
= + + + = 0,8 + 0, 4 + 3,2 + 1,6 = 6,0
80 160 20 40

A Tabela 14.5 mostra as frequncias dos valores observados e esperados


para o estudo em questo.

Tabela 14.5 Valores do clculo do 2 para um estudo experimental com 300 indivduos
Caselas O E O-E (O E)2 (O E)2/E
a 88 80 8 64 0,8
b 152 160 -8 64 0,4
c 12 20 -8 64 3,2
d 48 40 8 64 1,6

300 300 0,0 256 calc


2
= 6,0

interessante notar que o teste do qui-quadrado ( ) usado para avaliar


2

a relao entre duas ou mais variveis qualitativas, sem que seja preciso a
suposio de normalidade das mesmas para que se possa analisar o grau

Distribuio Qui-Quadrado 93

BIOESTATISTICA_VOL02.indb 93 25/06/12 17:20


de associao entre elas. De qualquer maneira, o qui-quadrado pode ser
empregado em trs diferentes tipos de anlise estatstica, as quais definem
o tipo de teste e que passaremos a descrever a seguir.
Teste do qui-quadrado da independncia Ou teste de associao, uti-
lizado para verificar se duas variveis qualitativas apresentam associao
estatstica entre si.
Teste do qui-quadrado da homogeneidade Serve para comparar duas
ou mais populaes com relao a uma determinada varivel categrica.
Teste do qui-quadrado de aderncia Tambm chamado de teste de
ajustamento, utilizado para verificar se uma distribuio de um conjunto
de dados amostrais ajusta-se a uma determinada distribuio terica es-
perada.

Para que o leitor possa entender a lgica do teste do qui-quadrado e saiba


diferenciar um teste de independncia de um teste de homogeneidade, traba-
lharemos com o exemplo a seguir: suponhamos que uma fazenda de piscicul-
tura queira analisar se existe diferena estatisticamente significativa entre as
taxas de crescimento de trs diferentes espcies de peixe, quando mantidas
juntas em um mesmo tipo de lago artificial, por um perodo de seis meses. Nes-
te experimento, o melhor tipo de teste seria uma anlise paramtrica do tipo
anlise de varincia (ANOVA), mas, por questes prticas, suponhamos, tam-
bm, que os pesos das espcies foram categorizados em baixo, mdio e alto, e
que uma amostra de 600 peixes seria necessria para a anlise. Neste caso, a
fazenda poder conduzir a pesquisa com base em dois tipos de delineamento,
conforme seus objetivos:
Delineamento tipo 1 O pesquisador poder selecionar uma amostra ale-
atria de 600 peixes e verificar em que casela da tabela de contingncia cada
um dos peixes estar alocado. Note que o nico valor fixo ser o total geral igual
a 600 peixes, enquanto que os valores totais das colunas e das linhas (totais
marginais) variaro livremente conforme a aleatoriedade. Neste caso, estare-
mos falando de um teste do qui-quadrado da independncia.
Delineamento tipo 2 Neste delineamento, o pesquisador selecionar
uma amostra aleatria de 200 peixes de cada uma das trs diferentes espcies.
Note que os totais das linhas sero fixos, ao passo que os totais das colunas

94 Bioestatstica aplicada Pesquisa Experimental

BIOESTATISTICA_VOL02.indb 94 25/06/12 17:20


variaro conforme os valores aleatrios das caselas. Neste caso, estaremos fa-
lando de um teste do qui-quadrado da homogeneidade.
Assim, quando os totais das linhas e das colunas variam livremente, o teste
de associao chamado qui-quadrado da independncia, e quando um dos
totais marginais, seja das linhas ou das colunas, fixado, o teste dito qui-
-quadrado da homogeneidade.

14.3.1 Teste do qui-quadrado da independncia


Este tipo de teste utilizado para verificar se existe uma correlao entre
as duas variveis categricas a serem comparadas. Aqui, a hiptese a ser tes-
tada que as duas variveis so estatisticamente independentes. Para tal, os
indivduos selecionados para compor a amostra so alocados em uma tabela
de contingncia conforme as categorias das duas variveis analisadas, sendo
as caselas preenchidas pelas frequncias observadas. Como relatado anterior-
mente, neste tipo de teste, o total da amostra o nico valor fixado pelo pesqui-
sador, e a hiptese de nulidade aquela que afirma que no h associao entre
as variveis estudadas. Isto , que a variveis so independentes. O exemplo a
seguir mostra a aplicao do teste do qui-quadrado da independncia.

Exemplo: Uma indstria de panificao queria testar a qualidade da con-


servao de seus produtos com a utilizao de trs diferentes tipos de emba-
lagem, aps um perodo 20 dias de prateleira. O critrio utilizado para compa-
rao foi a formao ou no de fungos no interior da embalagem. Para tal, os
investigadores estudaram uma amostra de 300 unidades de um determinado
produto, colhida aleatoriamente em trs diferentes supermercados da regio.
Os dados esto relacionados na Tabela 14.6. Existe associao entre o tipo de
embalagem e a presena de fungo no produto aps um perodo de 20 dias?

Tabela 14.6 Presena de fungo conforme o tipo de embalagem


Presena de Tipo de embalagem
Total
fungo Tipo A Tipo B Tipo C
Sim 48 (34,5%) 42 (43,3%) 28 (43,8%) 118 (39,3%)
No 91 (65,5%) 55 (56,7%) 36 (56,2%) 182 (60,7%)
Total 139 (100%) 97 (100%) 64 (100%) 300

Distribuio Qui-Quadrado 95

BIOESTATISTICA_VOL02.indb 95 25/06/12 17:20


Passo 1 Formular as hipteses estatsticas:
H 0 :O = E (as variveis so independentes, isto , no existe associao en-
tre o tipo de embalagem e a presena de fungo).
H A :O E (existe associao entre as variveis estudadas, isto , a presen-
a de fungo depende do tipo de embalagem utilizada).
Passo 2 Escolher o nvel de significncia (nvel alfa):
= 0,05 (5%)
Passo 3 Determinar o valor crtico do teste:

gl(l - 1)(c - 1)= (2 - 1)(3 - 1)= 2

20,05;2 = 5,99

Passo 4 Calcular o valor do teste:


Caselas O E O-E (O E)2 (O E)2/E
a 48 54,67 -6,67 44,49 0,81
b 42 38,15 3,85 14,82 0,39
c 28 25,17 2,83 8,01 0,32
d 91 84,33 6,67 44,49 0,53
e 55 58,85 -3,85 14,82 0,25
f 36 38,83 -2,83 8,01 0,21

300 300 0,0 134,64 calc


2
= 2,51

Ento: calc
2
= 2,51

Passo 5 Regra de deciso:

Se calc
2
< 20,05;2 , aceita-se H 0 .

Se calc
2
20,05;2 , rejeita-se H 0 .

Como calc
2
= 2,51 < 20,05;2 = 5, 99, aceita-se H 0 .

Passo 6 Concluso:
Como o valor calculado para calc menor que o valor crtico tabelado
2

20,05;2 , aceita-se H0 e conclui-se que as variveis so independentes, isto

96 Bioestatstica aplicada Pesquisa Experimental

BIOESTATISTICA_VOL02.indb 96 25/06/12 17:21


, no existe associao entre o tipo de embalagem e a presena de fungo,
pois calc
2
= 2,51; P = 0,285 .

14.3.2 Teste do qui-quadrado da homogeneidade


Tambm chamado de teste qui-quadrado de comparao, este tipo de teste
utilizado quando se deseja comparar as propores de uma varivel qualitativa em
duas ou mais populaes. Os dados devem ser introduzidos em uma tabela de con-
tingncia, onde as linhas contm as amostras a ser comparadas e as colunas, as dife-
rentes categorias da varivel estudada. Neste teste, o pesquisador fixa, a priori, os ta-
manhos das amostras, isto , o total das linhas, ao passo que os valores das categorias
so aleatrios. Neste caso, a hiptese nula a ser testada aquela em que a proporo
de indivduos em cada categoria igual nas diferentes populaes estudadas. Isto ,
que as populaes no diferem entre si em relao varivel estudada. O exemplo a
seguir mostra a aplicao do teste do qui-quadrado da homogeneidade.

Exemplo: Em uma localidade, uma rede de supermercados queria ve-


rificar o padro de vendas para um determinado produto, segundo o poder
aquisitivo da populao dos bairros onde suas lojas esto instaladas. Para
tal finalidade, trs lojas foram selecionadas, sendo cada uma delas localizada
em um bairro classificado como de classe A, B e C. O produto em anlise es-
tava sendo vendido em trs diferentes tamanhos de embalagem, classificados
como pequeno, mdio e grande. Para realizar o estudo, uma amostra de 100
consumidores do produto foi aleatoriamente selecionada em cada uma das
trs lojas da rede. Os dados esto dispostos na Tabela 14.7. Existe diferena
estatisticamente significativa no padro de vendas do produto conforme o
poder aquisitivo da populao e o tamanho da embalagem?

Tabela 14.7 Padro de venda do produto conforme o tamanho da embalagem e o poder


aquisitivo da populao
Tamanho da embalagem
Bairro Total
Grande Mdio Pequeno
Classe A 12 (11,5%) 29 (34,9%) 59 (52,2%) 100
Classe B 28 (26,9%) 34 (40,9%) 38 (33,6%) 100
Classe C 64 (61,6%) 20 (24,2%) 16 (14,2%) 100
Total 104 (100%) 83 (100%) 113 (100%) 300

Distribuio Qui-Quadrado 97

BIOESTATISTICA_VOL02.indb 97 25/06/12 17:21


Note que, neste tipo de teste, a varivel tamanho da embalagem no
uma varivel dicotmica, que aceita dois nveis de resposta, como observado
na tabela do exemplo anterior. Aqui, o que se deseja, realmente, comparar as
propores (P) de venda para cada tamanho de embalagem conforme a classe
econmica do bairro onde a loja est localizada, sendo a hiptese nula (H0)
aquela que pressupe no existir diferena nas propores observadas, isto
que PclasseA = PclasseB = PclasseC. Neste caso, o teste do qui-quadrado da homogenei-
dade compara as propores das trs amostras simultaneamente, sem que haja
necessidade de dicotomizar os dados, evitando-se, com isso, que as informa-
es sejam perdidas. Assim, temos:

Passo 1 Formular as hipteses estatsticas:


H 0 :O = E (no existe diferena no padro das vendas relativas
aos tamanhos das embalagens e as classes dos bairros analisados).
H A :O E (o padro das vendas relativas aos tamanhos das em
balagens est relacionado s classes dos bairros analisados).
Passo 2 Escolher o nvel de significncia (nvel alfa):
= 0,05 (5%)
Passo 3 Determinar o valor crtico do teste:

gl(l - 1)(c - 1)= (3 - 1)(3 - 1)= 4

20,05;4 = 9,49

Passo 4 Calcular o valor do teste:


Caselas O E O-E (O E)2 (O E)2/E
a 12 34,67 -22,67 513,93 14,82
b 29 27,67 1,33 1,77 0,06
c 59 37,66 21,34 455,40 12,09
d 28 34,67 -6,67 44,49 1,28
e 34 27,67 6,33 40,07 1,45
f 38 37,66 0,34 0,12 0,00
g 64 34,67 29,33 860,25 24,81
h 20 27,67 -7,67 58,83 2,13
i 16 37,66 -21,66 469,16 12,46
300 300 0,0 2.444,00 2calc = 69,11

98 Bioestatstica aplicada Pesquisa Experimental

BIOESTATISTICA_VOL02.indb 98 25/06/12 17:21


Ento: calc = 69,11
2

Passo 5 Regra de deciso:

Se 2calc < 20,05;4 , aceita-se H 0 .

Se 2calc 20,05;4 , rejeita-se H 0 .

Como 2calc = 69,11 > 20,05;4 = 9, 49, rejeita-se H 0 .


Passo 6 Concluso:
Como o valor calculado para calc maior que o valor crtico tabelado
2

20,05;4 , rejeita-se H e conclui-se que as frequncias observadas diferem


0
significativamente das frequncias esperadas, isto , existe diferena esta-
tisticamente significativa para o padro de consumo entre as trs classes
de bairros analisadas, com o bairro classe A apresentando preferncia pela
embalagem de tamanho pequeno; o bairro classe B, pela embalagem de
tamanho mdio, e o bairro classe C, pela embalagem de tamanho grande,
pois calc = 69,11; P < 0,0001 .
2

Anlise de resduos padronizados (tabelas l x c)


No teste do qui-quadrado, assim como em qualquer outro tipo de teste de
hiptese, a determinao do valor P fundamental para que se possa verificar a
significncia estatstica. Porm, no teste do qui-quadrado, em particular, no se
pode concluir como se d a relao, uma vez que ele testa apenas a hiptese ge-
ral de que as variveis estudadas sejam independentes. Assim, em tabelas l x c,
uma interpretao mais robusta dos resultados deve ser realizada pela anlise
de resduos, a qual mostra como as diversas caselas da tabela contribuem para
o valor final do qui-quadrado calculado ( calc ). , portanto, uma ferramenta
2

estatstica til para a elaborao de uma anlise mais detalhada de cada uma
das variveis consideradas no estudo.
A anlise feita em trs etapas sucessivas:
Clculo do resduo padronizado (R p) O qual dado pela seguinte
equao:

Distribuio Qui-Quadrado 99

BIOESTATISTICA_VOL02.indb 99 25/06/12 17:21


O E
Rp =
E

Clculo do resduo ajustado (Raj) Corresponde a cada resduo padroni-


zado, corrigido pela equao a seguir:

Rp
Raj = , onde: TC = Total da coluna.
TC TL TL = Total da linha.
1 1
TG TG TG = Total geral.

Comparao dos valores calculados Os valores calculados para Raj so,


ento, comparados com o valor crtico da distribuio normal, segundo o
nvel de significncia previamente estabelecido para o teste. Por exemplo:
para um nvel de significncia estabelecido em 0,05, o valor crtico ser z =
1,96. Assim, se em uma dada casela o valor de Raj for maior do que z = + 1,96
ou menor que z = 1,96, conclui-se que o valor observado (O) desvia-se sig-
nificativamente do valor esperado (E), para mais ou para menos, conforme o
sinal. Desconsiderando o sinal, quanto maior for o valor do Raj em relao ao
valor z, maior ser o desvio em relao ao valor esperado E, mostrando que,
naquela casela, a variao entre os grupos foi estatisticamente significativa.

A Tabela 14.8 mostra, entre os parnteses, os valores dos resduos padro-


nizados para o exemplo anterior da Tabela 14.7. O clculo ser mostrado para
a casela a.

Tabela 14.8 Resduos padronizados para o padro de venda do produto conforme o tamanho
da embalagem e o poder aquisitivo da populao
Bairro Tamanho da embalagem Total
Grande Mdio Pequeno
Classe A 12 ( 5,83) 29 (0,36) 59 (5,39) 100
Classe B 28 (1,71) 34 (1,73) 38 (0,08) 100
Classe C 64 (7,54) 20 ( 2,09) 16 ( 5,47) 100
Total 104 83 113 300

100 Bioestatstica aplicada Pesquisa Experimental

BIOESTATISTICA_VOL02.indb 100 25/06/12 17:21


O E 12 34 ,67
E 34 ,67 3,85
Raj 1,1 = = = = 5,83
TC TL 104 100 0,66
1 1 1 1
TG TG 300 300

Observando-se o valor do resduo ajustado da casela a (Raj = 5,83), con-


clui-se que o nmero de vendas da embalagem grande, na classe A, foi signifi-
cativamente menor do que o esperado se as variveis fossem independentes,
indicando existir uma associao positiva entre a classe do bairro e o tamanho
da embalagem vendida. Por outro lado, quando consideramos a casela g (Raj =
7,54), verificamos que a venda da embalagem de tamanho grande, na classe C,
foi significativamente maior do que o esperado. Porm, na casela f (Raj = 0,08),
a venda de embalagem de tamanho pequeno, na classe B, no foi significativa-
mente maior do que o valor esperado, pois Raj < z.

14.3.3 Teste do qui-quadrado de aderncia


(ajustamento)
Tambm chamado de teste de ajustamento, o teste do qui-quadrado de
aderncia utilizado para verificar se uma distribuio de frequncias obser-
vadas (O) de um conjunto de dados amostrais ajusta-se a uma determinada
distribuio de valores esperados (E), segundo uma determinada teoria. Ou
seja, este teste verifica se um conjunto de dados observados se adequa a um
determinado modelo probabilstico, e a hiptese de nulidade (H0) a ser testada
aquela que afirma que a distribuio da varivel de interesse comporta-se
conforme a distribuio terica adotada. Portanto, se o modelo probabilstico
testado for compatvel com a distribuio amostral, as frequncias observadas
no iro diferir significativamente das frequncias esperadas.
Para tornar o entendimento mais fcil ao leitor, inicialmente, utilizaremos
o arremesso de dados como exemplo, sendo este o mais caracterstico para o
modelo. Assim, temos: um jogador deseja verificar se um dado honesto. Para
tal intento, ele arremessa o dado 600 vezes e anota os resultados observados.
Se o dado honesto, os valores observados para cada face no sero estatisti-
camente diferentes dos valores esperados (E = 100).

Distribuio Qui-Quadrado 101

BIOESTATISTICA_VOL02.indb 101 25/06/12 17:21


Valor da face 1 2 3 4 5 6 Total

Frequncia Observada 88 103 96 101 104 108 600

Frequncia esperada 100 100 100 100 100 100 600

Passo 1 Formular as hipteses estatsticas:


H 0 : Pi = 1 / 6 (i = 1, 2, 3, ...) - A distribuio de frequncia observada
igual distribuio de frequncia esperada.
H A : ao menos uma probabilidade Pi 1 / 6.
Passo 2 Escolher o nvel de significncia (nvel alfa):
= 0,05 (5%)
Passo 3 Determinar o valor crtico do teste:
gl(l - 1)(c - 1)= (2 - 1)(6 - 1)= 5

20,05;5 = 11,07

Passo 4 Calcular o valor do teste:

(88100)2 (103100)2 (96100)2 (101100)2 (104100)2 (108100)2


calc
2
= + + + + +
100 100 100 100 100 100

250
calc
2
c
= =2,5
100

Passo 5 Regra de deciso:

Se calc
2
< 20,05;5 , aceita-se H 0 .

Se calc
2
20,05;5 , rejeita-se H 0 .

Como calc
2
= 2,50 < 20,05;5 = 11,07, aceita-se H 0 .

Passo 6 Concluso:
2
Como o valor calculado para calc menor que o valor crtico tabelado
20,05;4 , aceita-se H e conclui-se que a distribuio de frequncia dos va-
0

102 Bioestatstica aplicada Pesquisa Experimental

BIOESTATISTICA_VOL02.indb 102 25/06/12 17:21


lores observados no difere da distribuio esperada, isto , as diferenas
foram casuais. Portanto, no h razo para discordar que o dado seja ho-
nesto, pois calc
2
= 2,50; P = 0,776 .

A seguir, mostraremos outro exemplo relacionado rea da pesquisa.

Exemplo: Uma escola pblica queria verificar o padro racial dos seus alu-
nos e compar-lo com o padro normal da populao. Para uma amostra alea-
tria de 400 alunos, os resultados obtidos foram os seguintes: Brancos = 128;
Negros = 62; Pardos = 186; Outros = 24. Os resultados obtidos concordam com
o padro racial determinado para a cidade estudada (Brancos = 51,5%; Negros
= 5,6%; Pardos = 40,4%; e Outros = 2,5%)?

Passo 1 Formular as hipteses estatsticas:

H 0 :O = E (B=128; N=62; P=186; O=24)

H A :O E (B=206,0; N=22,4; P=161,6; O=10,0)

Passo 2 Escolher o nvel de significncia (nvel alfa):


= 0,05 (5%)
Passo 3 Determinar o valor crtico do teste:

gl(l - 1)(c - 1) = (2 - 1)(4 - 1) = 3

02,05;3 = 7,81
Passo 4 Calcular o valor do teste:
Categoria O E O-E (O E)2 (O E)2/E

Brancos 128 206,0 -78.0 6084.0 29.53

Negros 62 22.4 39.6 1568.1 70.01

Pardos 186 161.6 24.4 595.3 3.68

Outros 24 10,0 14.0 196.0 19.60

400 400 0,0 8.443,52 calc


2
= 122,82

Distribuio Qui-Quadrado 103

BIOESTATISTICA_VOL02.indb 103 25/06/12 17:21


Passo 5 Regra de deciso:
2
Se calc < 20,05;3 , aceita-se H 0 .

Se calc
2
20,05;3 , rejeita-se H 0 .

Como calc
2
= 122,82 > 20,05;3 = 7,81, rejeita-se H 0 .

Passo 6 Concluso:
2
Como o valor calculado para calc maior que o valor crtico tabelado
20,05;4 , rejeita-se H e conclui-se que a distribuio de frequncia dos
0
valores observados difere significativamente da distribuio esperada.
Portanto, o padro racial dos alunos da escola diferente daquele encon-
trado na populao, pois 2calc = 122,82; P < 0,0001 .

Correo de continuidade (correo de Yates)


Originalmente descrita por Frank Yates1 em 1934, a correo de continui-
dade deve ser aplicada nos casos em que o teste do qui-quadrado for realizado
em tabelas de contingncia com apenas um grau de liberdade (gl = 1) e com
amostras menores que 40 (n < 40). Esta correo efetuada subtraindo-se 0,5
do valor absoluto da diferena entre os valores observados e esperados, antes
de calcular o quadrado desta diferena. Deste modo, a frmula para obteno
do corrigido a seguinte:
2

(|O E | 0,5)2
Yates
2
=
E

Com aplicao da correo de Yates, o teste do qui-quadrado fica mais


robusto, pois a frmula reduz o tamanho do valor calculado, o que, de cer-
ta maneira, reduz a chance de encontrar uma diferena estatisticamente
significativa. Assim, tomando-se a tabela de clculo do exemplo anterior,

1. Frank Yates (1902-1994) Matemtico e estatstico ingls que introduziu a correo de


continuidade para o teste do qui-quadrado.

104 Bioestatstica aplicada Pesquisa Experimental

BIOESTATISTICA_VOL02.indb 104 25/06/12 17:21


podemos verificar o novo valor do qui-quadrado calculado com a correo
de Yates, mesmo sabendo-se que, neste caso, no seria necessrio aplicar a
correo, pois n > 40. Note que, com a correo, o valor do teste passa de
122,82 para 119,17.

Categoria O E OE (|O E| 0,5) (|O E| 0,5)2/E

Brancos 128 206,0 -78.0 77,50 29,16

Negros 62 22.4 39.6 39,10 68,25

Pardos 186 161.6 24.4 23,90 3,53

Outros 24 10,0 14.0 13,50 18,23

400 400 0,0 154 2calc = 119,17


Frmula alternativa em tabela 2 x 2
Quando o objetivo for a anlise de dados em tabela de contingncia 2 x 2,
a frmula para calcular o valor do pode ser simplificada de modo a torn-la
2

mais facilmente aplicvel, desde que se tenha certeza que nenhum dos valores
esperados menor que cinco (E < 5). Para o clculo com a correo de Yates,
acrescenta-se ao numerador da frmula, o valor n/2, sendo n o nmero de su-
jeitos participantes do estudo, conforme mostrado abaixo:
2
n
n | ad bc |
n(ad bc )2 2
2 = e Yates
2
=
(a + b )(c + d )(a + c )(b + d ) (a + b )(c + d )(a + c )(b + d )

Exemplo: Em um estudo de coorte, um pesquisador investigou 40 pa-


cientes com ferida penetrante no trax, atendidos em um hospital pblico,
com o objetivo de avaliar a associao entre o fator de risco hemotrax coa-
gulado e a ocorrncia de infeco do espao pleural, ps-drenagem torcica
fechada. Os pacientes foram divididos em dois grupos: com hemotrax coa-
gulado e sem hemotrax. Os pacientes foram acompanhados por um pero-
do de 30 dias, e as ocorrncias de infeco ps-operatria foram registradas
conforme a Tabela 14.9, a seguir:

Distribuio Qui-Quadrado 105

BIOESTATISTICA_VOL02.indb 105 25/06/12 17:21


Tabela 14.9 Presena de infeco do espao pleural ps-drenagem pleural fechada
com e sem hemotrax coagulado
Infeco do espao pleural
Grupos de pacientes Total
Sim No
Com hemotrax coagulado 13 07 20

Sem hemotrax coagulado 06 14 20

Total 19 21 40

Resoluo sem a correo de Yates

n(ad bc )2 40(13 14 7 6)2 784.000


2 = = = = 4 , 91
(a + b )(c + d )(a + c )(b + d ) 20 20 19 21 159.600

Resoluo com a correo de Yates


2
n
n | ad bc | 40
40(|13 14 7 6| )2
2 2 = 576.000 = 3,61
Yates
2
= =
(a + b )(c + d )(a + c )(b + d ) 20 20 19 21 159.600

Observe que, no exemplo acima, para = 0,05 e gl = 1, o valor crtico


tabelado 0,05;1 = 3,84 . Assim, se for considerado o valor do qui-quadrado
2

no corrigido ( 2 = 4 , 91 ), pode-se verificar que a hiptese nula deve ser


rejeitada, pois = 4 , 91 > 0,05;1 = 3,84 . Ou seja, que existe uma associao
2 2

positiva entre o fator de risco estudado e a incidncia de infeco do espa-


o pleural, concluindo-se, ento, que os pacientes com hemotrax coagulado
apresentam uma incidncia maior de complicao ps-operatria (13/20
ou 65%). Por outro lado, se considerarmos o valor do qui-quadrado com a
correo de Yates ( Yates = 3,61 ), a hiptese nula no deve ser rejeitada, pois
2

Yates
2
= 3,61 < 20,05;1 = 3,84 . Isto , que no h relao entre o fator de risco he-
motrax coagulado e a incidncia de infeco do espao pleural em pacientes
submetidos drenagem pleural fechada.
Note, tambm, que, neste caso, pode-se usar o teste , uma vez que, na
2

tabela de contingncia, nenhum dos valores esperados menor que cinco

106 Bioestatstica aplicada Pesquisa Experimental

BIOESTATISTICA_VOL02.indb 106 25/06/12 17:21


(E < 5), sendo a melhor opo a frmula corrigida, pois n = 40. Os requisitos
para a utilizao do teste do qui-quadrado so apresentados a seguir.

Requisitos para usar o teste do qui-quadrado


A aplicao do teste do qui-quadrado exige, da parte do pesquisador, que
alguns cuidados sejam observados, em especial referentes ao tamanho das
amostras e aos valores esperados em cada uma das caselas da tabela de contin-
gncia. Estes cuidados decorrem do fato da distribuio terica do 2 se apre-
sentar como um mtodo aproximado, baseado na distribuio z, e quando o
nmero de graus de liberdade for igual a 1 (gl = 1), a distribuio dos valores
observados ( calc
2
) difere da distribuio terica, de tal modo que a correo
de continuidade deve ser introduzida ao teste para melhor aproximar as duas
distribuies. Assim, de modo geral, as condies para uso do teste do qui-qua-
drado so as seguintes:

O teste deve ser realizado com frequncias observadas e expressadas em va-


lores absolutos, isto , em nmero de casos. Porm, caso o qui-quadrado seja
calculado com os valores das caselas expressados em percentuais, o valor
final do teste deve ser corrigido. Para isto, basta multiplicar o valor calculado
pelo tamanho amostral (n) dividido por 100. Para facilitar o entendimento,
vamos considerar o seguinte exemplo: um jogador deseja verificar se uma
moeda honesta. Para tanto, ele executa 60 arremessos e obtm 27 (45%)
caras e 33 (55%) coroas. Os clculos do qui-quadrado de aderncia, com
valores absolutos e, em percentagem, so mostrados a seguir.

Clculo com valores absolutos Clculo com valores em percentagem

(45 50)2 (55 50)2


2 = + = 1, 0
(27 30)2 (33 30)2 50 50
2 = + = 0,60
30 30 60
2 = 1,0 x = 0,60
100

Em tabelas de contingncia do tipo 2 x 2, deve-se sempre utilizar a corre-


o de Yates se n < 40. Porm, se em alguma casela o valor esperado for

Distribuio Qui-Quadrado 107

BIOESTATISTICA_VOL02.indb 107 25/06/12 17:21


menor que 5 (E < 5), o teste do qui-quadrado dever ser substitudo pelo
teste exato de Fisher.
Em tabelas de contingncia do tipo 2 x c, o qui-quadrado pode ser calcula-
do se em todas as caselas o valor esperado for maior ou igual a 1 (E 1).
Em tabelas de contingncia do tipo l x c, o teste do qui-quadrado pode ser
calculado com segurana se a mdia dos valores esperados for 6 para
testes com nvel de significncia = 0,05, e 10 para testes com = 0,01.
A mdia dos valores esperados pode ser obtida dividindo-se o total de in-
divduos do estudo pelo nmero de caselas da tabela.

Existem algumas outras exigncias relacionadas aplicao do teste do qui-


-quadrado de aderncia (ajustamento). Porm, na prtica do dia-a-dia da pesqui-
sa, a utilizao de programas computacionais mais sofisticados torna mais simples
a obteno exata dos valores do qui-quadrado para amostras com pequenos valo-
res esperados, o que, de certa forma, tem facilitado a atuao do pesquisador.
interessante notar que, no teste do qui-quadrado, o que de fato interessa
so os valores esperados (E) e no os valores observados (O). Assim, se tomar-
mos a frmula utilizada para calcular o teste, podemos observar que valores
pequenos de E, no denominador de um dos termos da equao, faz com que
este termo se torne muito grande, o que, por sua vez, aumenta o valor do qui-
-quadrado, e isto pode levar a erros falso-positivos, pois o valor calculado ten-
der a cair na zona de rejeio da hiptese nula. Essa questo, frequentemente
mal interpretada, tem levado alguns pesquisadores a pensar que o teste no
pode ser calculado quando em alguma das caselas da tabela ocorra um valor
observado muito pequeno ou igual a zero.

14.4 TESTE DO QUI-QUADRADO DE McNEMAR


2
( McNemar )

Em algumas situaes de pesquisa, o investigador pode estar interessado


em testar dois diferentes procedimentos em um mesmo grupo de sujeitos para
saber o quanto as medidas da primeira interveno concordam com as medi-
das da segunda, ou, ainda, pode estar interessado em comparar dois grupos pa-

108 Bioestatstica aplicada Pesquisa Experimental

BIOESTATISTICA_VOL02.indb 108 25/06/12 17:21


reados em um estudo do tipo caso-controle (anlise pareada). Outras vezes,
porm, o que se deseja conhecer se houve alguma mudana entre as medidas
antes e depois de uma dada interveno aplicada no mesmo grupo de sujeitos
(anlise tipo antes e depois). Em ambos os casos, se as variveis estudadas
so dicotmicas, nominais ou ordinais, e as amostras a serem comparadas so
dependentes entre si, o teste a ser empregado o teste no-paramtrico de
McNemar, o qual a alternativa para o teste do qui-quadrado da independn-
cia. Aqui, vlido enfatizar que ocorre dependncia entre as amostras quando
cada indivduo controle de si mesmo ou quando realizado um pareamento
indivduo a indivduo entre os sujeitos de duas amostras.
Assim, com base no raciocnio explicitado acima, podemos distinguir trs
situaes prticas para as quais o teste de McNemar a melhor opo:

Teste de McNemar para comparar dois tipos de tratamento uti-


lizado a fim de avaliar o grau de discordncia de dois diferentes tipos de
tratamento institudos para o mesmo grupo de indivduos. Ou seja, o quan-
to as medidas de uma interveno concordam com as medidas da outra.
Teste de McNemar para comparao tipo antes e depois o teste
no-paramtrico apropriado para comparar as medidas coletadas em um
mesmo grupo de indivduos, antes e depois de uma determinada interven-
o a que foram submetidos, com o objetivo de detectar se ocorreu alguma
mudana em razo da interveno instituda.
Teste de McNemar para comparar grupos pareados utilizado para
comparar dois diferentes grupos de pacientes, cujas amostras foram pa-
readas indivduo a indivduo, com base em alguma caracterstica da po-
pulao, tal como a idade, sexo, raa etc. Este tipo de teste de McNemar
frequentemente utilizado em estudos do tipo caso-controle, nos quais os
grupos so comparados para verificar a importncia de um determinado
fator de risco.

Na prtica, o teste de McNemar uma modificao do teste do qui-quadra-


do com 1 grau de liberdade, pois s existem duas categorias a serem estudadas,
sendo, portanto, um teste de ajustamento que compara as frequncias obser-
vadas (O) com as frequncias esperadas (E), supondo a igualdade das medidas

Distribuio Qui-Quadrado 109

BIOESTATISTICA_VOL02.indb 109 25/06/12 17:21


em ambas as medies. Tal como no teste do qui-quadrado da independncia,
os dados devem ser colocados em tabelas de contingncia 2 x 2, com a diferen-
a que, no teste de McNemar, os resultados devem ser analisados par a par, com
os dados organizados quanto concordncia ou discordncia dentro do par,
conforme o exemplo mostrado na Tabela 14.10, que abrange os trs tipos de
aplicaes para o teste. Note que a organizao da tabela difere daquela usada
para o teste do qui-quadrado da independncia.

Tabela 14.10 Tabela-padro 2 x 2 para o teste de McNemar


Tratamento B
Medidas Depois
Grupo Controle
Sim No Total
Tratamento A Sim a (+ +) b (+ ) a+b
Medidas Antes
Grupo Caso No c ( +) d ( ) c+d
Total a+c b+d a+b+c+d
a - Indivduos que responderam aos tratamentos A e B
b - Indivduos que responderam somente ao tratamento A
c - Indivduos que responderam somente ao tratamento B
d - Indivduos que no responderam aos tratamentos A e B
a e d - Pares concordantes
b e c - Pares discordantes

De clculo fcil e rpido, este teste foi introduzido na estatstica por Quinn
McNemar2, em 1947, e tem como hiptese nula (H0) a ser testada, a afirmativa
a qual considera que as propores dos valores medidos nos dois momentos
temporais no diferem entre si. Caso a hiptese nula seja negada, a hiptese
alternativa (HA) que as propores pareadas sejam diferentes. A frmula para
calcular o valor do teste dada pela seguinte equao:

( )
2
|b c | 1
McNemar =
2
b +c

2. Quinn McNemar (1900-1986) Matemtico e estatstico americano que ficou conhecido


por seus trabalhos sobre coeficiente de inteligncia e pela publicao do livro Psychological
Statistics, em 1949.

110 Bioestatstica aplicada Pesquisa Experimental

BIOESTATISTICA_VOL02.indb 110 25/06/12 17:21


Por se tratar de um teste com 1 grau de liberdade, a correo de con-
tinuidade de Yates introduzida na frmula em razo das mesmas exign-
cias aplicadas para o teste do qui-quadrado de aderncia. A correo
feita subtraindo-se 1 do valor absoluto do numerador antes de o elevar ao
quadrado. Observe, tambm, que a frmula considera apenas as caselas b
e c da tabela 2 x 2, isto , as caselas onde houve discordncia entre dois
momentos temporais avaliados, uma vez que os valores das caselas a e d
no se alteram, e, portanto, no fornecem informaes que permitam uma
deciso a respeito se houve ou no alguma mudana em razo da interven-
o instituda. Assim, se a hiptese nula (H0) verdadeira, espera-se que o
nmero de pares discordantes da casela b (+ ) seja igual ou muito prximo
ao nmero de pares discordantes da casela c ( +). Por outro lado, se hou-
ver uma diferena significativa entre os pares discordantes, alm do que se
esperaria ocorrer por puro acaso, em razo do erro amostral aleatrio, a
hiptese nula ser rejeitada e a hiptese alternativa (HA) ser tomada como
verdadeira.
Por conseguinte, para que a hiptese nula possa ser testada, o valor calcu-
lado para o McNemar comparado ao valor crtico da tabela do qui-quadrado,
2

segundo o nvel de significncia estabelecido para o teste. Se o valor calculado


para o McNemar for menor que o valor crtico tabelado ( 0,05;1 ), a hiptese nula
2 2

ser verdadeira. Caso contrrio, rejeita-se H0 e conclui-se que h diferena es-


tatisticamente significante entre os pares discordantes.
A seguir, mostraremos um exemplo para cada uma das trs situaes de
aplicao do teste do qui-quadrado de McNemar.

Comparao entre dois tipos de tratamentos


Exemplo: Uma indstria alimentcia conduziu um estudo no sentido de
avaliar a inteno de compra de um determinado produto elaborado com
duas diferentes formulaes. Para tal experimento, selecionou-se, aleatoria-
mente, 80 clientes de uma rede de supermercados, aos quais foram oferecidos
os dois produtos em estudo, em ordem previamente escolhida por sorteio,
de modo a evitar qualquer efeito indutivo na preferncia dos clientes. Cada
provador deveria manifestar sua inteno de compra respondendo sim ou
no. Os dados esto relacionados na Tabela 14.11.

Distribuio Qui-Quadrado 111

BIOESTATISTICA_VOL02.indb 111 25/06/12 17:21


Tabela 14.11 Resultado da preferncia de clientes quanto inteno de compras para um
produto elaborado com duas diferentes formulaes
Formulao B
Sim No Total
Sim 22 10 32
Formulao A
No 27 21 48
Total 49 31 80
a - Comprariam ambos os produtos A e B
b - Comprariam o produto A e no comprariam B
c - Comprariam o produto B e no comprariam A
d - No comprariam ambos os produtos A e B

Passo 1 Formular as hipteses estatsticas:


H0: No h discordncia nos resultados das opes pelos produtos A e B.
HA: H discordncia nos resultados das opes pelos produtos A e B.
Passo 2 Escolher o nvel de significncia (nvel alfa):
= 0,05 (5%)
Passo 3 Determinar o valor crtico do teste:

gl(l - 1)(c - 1) = (2 - 1)(2 - 1) = 1

0,05;1
2
= 3,84
Passo 4 Calcular o valor do teste:

(|b c | 1) = (|10 27 | 1)
2 2
256
2McNemar = = = 6, 92
b +c 10 + 27 37

Passo 5 Regra de deciso:



Se 2McNemar < 20,05;1 , aceita-se H 0 .

Se 2McNemar 20,05;1 , rejeita-se H 0 .

Como 2McNemar = 6,92 > 20,05;1 = 3,84 , rejeita-se H 0 .

112 Bioestatstica aplicada Pesquisa Experimental

BIOESTATISTICA_VOL02.indb 112 25/06/12 17:21


Passo 6 Concluso:
Como o valor calculado para McNemar maior que o valor crtico tabelado
2

20,05;1 , rejeita-se H e conclui-se existir discordncia quanto s opes de


0
compra para os dois produtos oferecidos, pois 2McNemar = 6, 92; P = 0,008 .
O produto com a formulao B foi mais aceito do que o produto com a for-
mulao A, uma vez que, considerando as 37 vezes em que apenas um dos
produtos foi escolhido, em 27 (72,9%) a opo foi pelo produto B e somente
10 (27,1%) dos clientes optaram pelo produto A.

Comparao tipo antes e depois


Exemplo: Com o objetivo de testar sua diviso de marketing, uma loja
de departamentos selecionou, aleatoriamente, 90 clientes e solicitou que os
mesmos manifestassem sua inteno de compra de determinado produto,
antes e depois que lhes fosse exibido um folheto publicitrio sobre o referido
produto. Cada cliente deveria manifestar sua inteno de compra respon-
dendo sim ou no, antes e depois de analisar o folheto. Os dados esto
relacionados na Tabela 14.12.

Tabela 14.12 Resultado da inteno de compra de clientes, antes e depois


de uma campanha publicitria

Inteno depois
Sim No Total
Sim 26 12 38
Inteno antes
No 27 25 52
Total 53 37 90
a Comprariam antes e depois
b Comprariam antes e no comprariam depois
c Comprariam depois e no comprariam antes
d No comprariam nem antes nem depois

Passo 1 Formular as hipteses estatsticas:


H0: No h discordncia nos resultados das opes antes e depois.
HA: H discordncia nos resultados das opes antes e depois.

Distribuio Qui-Quadrado 113

BIOESTATISTICA_VOL02.indb 113 25/06/12 17:21


Passo 2 Escolher o nvel de significncia (nvel alfa):
= 0,01 (1%)
Passo 3 Determinar o valor crtico do teste:

gl(l - 1)(c - 1) = (2 - 1)(2 - 1) = 1

0,01;1
2
= 6,63
Passo 4 Calcular o valor do teste:

(|b c | 1) = (|12 27 | 1)
2 2
196
2McNemar = = = 5,02
b +c 12 + 27 39

Passo 5 Regra de deciso:



Se 2McNemar < 20,01;1 , aceita-se H 0 .

Se 2McNemar 20,01;1 , rejeita-se H 0 .

Como 2McNemar = 5,02 < 20,01;1 = 6,63, aceita-se H 0 .

Passo 6 Concluso:
Como o valor calculado para McNemar menor que o valor crtico tabela-
2

do 0,01;1 , no se rejeita H0 e conclui-se que no existe discordncia quan-


2

to inteno de compra antes e depois da campanha publicitria, pois


2McNemar = 5,02; P = 0,025 . Isto , no h evidncia suficiente para se afir-
mar que a campanha publicitria instituda tenha influenciado na inteno
de compra dos clientes selecionados para o estudo, ao nvel de significn-
cia de 1% ( = 0,01).

Comparao entre grupos pareados


Observe que, diferente do qui-quadrado da independncia, no qual os gru-
pos so escolhidos separadamente, neste tipo de teste, os sujeitos so escolhi-
dos par a par, isto , um indivduo de cada grupo. Somente aps a escolha dos
pares, verifica-se se ambos, se um ou o outro, ou se nenhum dos indivduos de

114 Bioestatstica aplicada Pesquisa Experimental

BIOESTATISTICA_VOL02.indb 114 25/06/12 17:21


cada par foi exposto, no passado, ao fator de risco estudado. A seguir, os dados
so anotados na tabela de contingncia, tal como no modelo a seguir.
Exemplo: Um estudo caso-controle foi conduzido no sentido de verifi-
car a associao entre a exposio prolongada ao fator de risco irradiao
solar e a ocorrncia de neoplasia da cutnea do tipo carcinoma basocelular.
Para tal finalidade, foram pareados 100 indivduos portadores da neoplasia
(grupo caso) com 100 indivduos no-portadores da doena (grupo contro-
le). Todos os indivduos do estudo foram investigados quanto exposio
prolongada ou no ao fator de risco, no passado. Os dados esto expressos na
Tabela 14.13, abaixo.

Tabela 14.13 Resultado do estudo caso-controle com 400 indivduos

Grupo controle
Com Sem
Total
exposio Exposio
Com exposio 29 25 54
Grupo caso
Sem exposio 8 38 46
Total 37 63 100
a Expostos no grupo caso e no grupo controle
b Expostos no grupo caso e no-expostos no grupo controle
c No-expostos no grupo caso e expostos no grupo controle
d No-expostos no grupo caso e no grupo controle

Passo 1 Formular as hipteses estatsticas:


H0: A exposio prolongada irradiao solar no est associada neoplasia.
HA: A exposio prolongada irradiao solar est associada neoplasia.
Passo 2 Escolher o nvel de significncia (nvel alfa):
= 0,01 (1%)
Passo 3 Determinar o valor crtico do teste:
gl(l - 1)(c - 1)= (2 - 1)(2 - 1)= 1

20,01;1 = 6,63

Distribuio Qui-Quadrado 115

BIOESTATISTICA_VOL02.indb 115 25/06/12 17:21


Passo 4 Calcular o valor do teste:

(|b c | 1) = (|25 8 | 1)
2 2
256
2McNemar = = = 7,75
b +c 25 + 8 33
Passo 5 Regra de deciso:

Se 2McNemar < 20,01;1 , aceita-se H 0 .

Se 2McNemar 20,01;1 , rejeita-se H 0 .

Como 2McNemar = 7,75 > 20,01;1 = 6,63, rejeita-se H 0 .



Passo 6 Concluso:
Como o valor calculado para McNemar maior que o valor crtico tabelado
2

20,01;1 , rejeita H e conclui-se que existe discordncia quanto exposio


0
irradiao solar nos grupos estudados, pois McNemar = 7,75; P = 0,005 . Isto
2

, que os indivduos do grupo caso apresentaram maior propenso do que


o esperado pelo acaso de terem sido expostos irradiao solar quando
comparados aos indivduos do grupo controle, ao nvel de significncia de
1% ( = 0,01).

Observe, ainda, que, na tabela do teste de McNemar para estudos pareados,


a odds ratio (razo de chance) pode ser calculada pela frmula OR = b /c.
No exemplo em questo, temos:

b 25
OR = = = 3,12
c 8

O resultado encontrado indica que a chance da ocorrncia de neoplasia


cutnea associada exposio prolongada radiao solar 3,12 vezes maior
nos indivduos do grupo caso quando comparada incidncia nos indivduos
do grupo controle.

116 Bioestatstica aplicada Pesquisa Experimental

BIOESTATISTICA_VOL02.indb 116 25/06/12 17:21


14.5 TESTE EXATO DE FISHER ( PFisher )

Como explicado anteriormente, quando em uma tabela de contingncia


2 x 2, uma ou mais caselas apresentam contagens esperadas (E) menores que
5 ou o nmero total de indivduos estudados menor do que 20, o teste do
qui-quadrado no pode ser usado, devendo ser substitudo pelo teste de pro-
babilidade exata de Fisher, o qual calcula a probabilidade exata de se obter, ao
acaso, os valores observados nas caselas.
Inicialmente proposto por Sir Ronald Fisher3, em 1930, o teste baseado na
distribuio hipergeomtrica4 originada quando as propores de duas amostras
independentes so inseridas numa tabela 2 x 2 com valores marginais fixos. Ele
considera, como hiptese nula (H0), a independncia entre as variveis estuda-
das, sendo realizado pelo clculo da probabilidade de ocorrer a distribuio veri-
ficada para os dados observados na tabela de contingncia. Essa probabilidade ,
na realidade, o nvel crtico amostral ou o valor P, o qual traduz a probabilidade
de rejeitar a hiptese nula admitindo-se a suposio de independncia, ou seja,
a probabilidade de se estar errado em afirmar que existe dependncia entre as
variveis quando, de fato, elas so independentes. O valor calculado para o teste
deve ser comparado com o nvel de significncia (valor ) estipulado para a pes-
quisa. Assim, se a probabilidade calculada for inferior ao valor preestabelecido,
rejeita-se a hiptese nula, pois a distribuio observada no deve ter ocorrido
por puro acaso. Caso contrrio, a hiptese de nulidade no deve ser rejeitada.
A frmula para calcular o teste a seguinte:

(a + b )!(c + d )!(a + c )!(b + d )!


PFisher =
n!a!b !c !d !

A probabilidade calculada pela frmula acima no o resultado final para


o teste, pois a hiptese nula tambm seria rejeitada caso os resultados obser-
vados na tabela de contingncia fossem ainda mais extremos, tal como o valor
zero em uma das caselas. Da porque se devem calcular as probabilidades rela-

3 Sir Ronald Aylmer Fisher (1890-1962) Estatstico e bilogo ingls, criador das fundaes
para a cincia estatstica moderna.
4 Mtodo de amostragem sem reposio.

Distribuio Qui-Quadrado 117

BIOESTATISTICA_VOL02.indb 117 25/06/12 17:21


tivas a esses resultados mais extremos, as quais sero somadas probabilidade
inicialmente calculada, de modo que se obtenha a rea da cauda da distribui-
o. Assim, designando-se por P1 a probabilidade calculada para a tabela de
dados observada, os valores das probabilidades calculadas para os resultados
mais extremos sero designados por P2 , P3 ,... Pn etc. Deste modo, para calcular
as demais probabilidades, uma nova tabela de contingncia deve ser constru-
da, subtraindo-se uma unidade dos valores das caselas da diagonal com me-
nor nmero de casos. A seguir, adicionam-se aos valores das caselas da outra
diagonal, as duas unidades subtradas, de maneira que os totais marginais no
sejam alterados. A partir dessa nova tabela, calcula-se a probabilidade P2 . O
processo se repete at que, em uma das caselas, o valor zero seja atingido. Para
um teste unicaudal, a probabilidade final PFisher consiste da soma de todas as
probabilidades calculadas ( PFisher = P1 + P2 ... + Pn ). Para um teste bicaudal, a pro-
babilidade final deve ser multiplicada por dois.
O exemplo, a seguir, ilustra a aplicao do teste exato de Fisher.

Exemplo: Suponha que um pesquisador queira verificar a associao en-


tre o tipo de acidulante adicionado e a presena de contaminao por fungo
no interior de embalagens de alimentos. Para tal experimento, dois grupos
de 10 embalagens so selecionados. Ao primeiro grupo, ele adiciona o aci-
dulante A, e ao segundo grupo, o acidulante B. A contaminao por fungo
categorizada como presente e ausente. Os dados esto relacionados na
Tabela 14.14, abaixo.

Tabela 14.14 Resultado do estudo com 20 embalagens de alimentos


Fungo
Total
Presente Ausente

Tipo de Acidulante A 6 4 10
acidulante Acidulante B 3 7 10

Total 9 11 20

Passo 1 Formular as hipteses estatsticas:


H0: A proporo de fungos a mesma com os dois tipos de acidulante.

118 Bioestatstica aplicada Pesquisa Experimental

BIOESTATISTICA_VOL02.indb 118 25/06/12 17:21


HA: A proporo de fungos diferente para os dois tipos de acidulante.
Passo 2 Escolher o nvel de significncia (nvel alfa):
= 0,05 (5%) - Bicaudal.
Passo 3 Calcular o valor do teste:
6 4 10
10!10!9!11! 1
3 7 10 P1 = = 0,1500
20! 6!4!3!7!
9 11 20

7 3 10
10!10!9!11! 1
2 8 10 P2 = = 0,0321
20! 7!3!2!8!
9 11 20

8 2 10
10!10!9!11! 1
1 9 10 P3 = = 0,0026
20! 8!2!1!9!
9 11 20

9 1 10
10!10!9!11! 1
0 10 10 P4 = = 0,0001
20! 9!1!0!10!
9 11 20

PFisher = 2(0,1500 + 0,0321 + 0,0026 + 0,0001) = 2 0,184


48=0,3696

Passo 4 Regra de deciso:


Se PFisher < , rejeita-se H 0 .

Se PFisher , aceita-se H 0 .

Como PFisher = 0,3696 > = 0,05, aceita-se H 0 .


Passo 5 Concluso:
Como o valor calculado para PFisher = 0,3696 maior que o nvel de signi-
ficncia = 0,05, no se rejeita H0 e conclui-se que a proporo de embalagens

Distribuio Qui-Quadrado 119

BIOESTATISTICA_VOL02.indb 119 25/06/12 17:21


com fungo no grupo tratado com o acidulante A no difere da proporo das
embalagens tratadas com acidulante B.
Note que o clculo da probabilidade exata de Fisher envolve o clculo de
fatoriais, o que torna a operao bastante complexa e trabalhosa. O uso de cal-
culadoras mais sofisticadas ou de programas computacionais de estatstica tem
facilitado a determinao do valor P. Uma outra maneira mais simples atravs
da transformao logartmica da equao, cujo valor P corresponde ao anti-
logaritmo do resultado obtido. A seguir, demonstraremos o clculo de P1 , do
exemplo anterior, obtido pela transformao logartmica da equao.

(a + b )!(c + d )!(a + c )!(b + d )! (a + b )!(c + d )!(a + c )!(b + d )!/ n!


P1 = =
n!a!b !c !d ! a!b !c !d !

Sendo: (a + b) = Total da linha 1 (TL1)


(c + d) = Total da linha 2 (TL2)
(a + c) = Total da coluna 1 (TC1)
(b + d) = Total da coluna 2 (TC2)
log(AxB) = log A + log B
log(A/B) = log A log B

Ento:

( ) ( )
log P1 = logTL1 !+ logTL2 !+ logTC1 !+ logTC 2 ! log n! log a!+ log b !+ log c !+ log d !

log P = ( log 10! + log10! + log9! + log11! log20!) ( log 6! + log4! + log3! + log7!)
1

log P1 = (6,560 + 6,560 + 5,560 + 7,601 18,386) (2,857 + 1,380 + 0,778 + 3,702)

log P1 = (7,894) (8,718) = 0,824

P1 = antilog ( 0,824) = 100,824 = 0,1500

Observe que o resultado de P1 = 0,1500 , calculado com a transformao lo-


gartmica, igual ao resultado calculado com a frmula original do teste exato
de Fisher.

120 Bioestatstica aplicada Pesquisa Experimental

BIOESTATISTICA_VOL02.indb 120 25/06/12 17:21


15
Probabilidade e Medidas
de Associao

A principal razo para a realizao de pesquisas experimentais genera-


lizar, a toda uma populao, os achados ocorridos em um conjunto de
observaes verificadas nos indivduos participantes do estudo. Ou seja,
fazer inferncias para um grupo maior de sujeitos, com base nos achados do
estudo de uma amostra retirada da populao. No entanto, sempre que isto
feito, o pesquisador no pode estar totalmente seguro ao fazer afirmaes
sobre possveis desfechos na populao estudada, uma vez que a ocorrncia
de inmeros acontecimentos do dia-a-dia podem ser determinados apenas
pelo efeito do acaso. Porm, mesmo que existam situaes de incerteza, nas
quais no se sabe o que de fato pode ocorrer, na maioria dos casos, o pesqui-
sador pode conhecer todos os resultados possveis da pesquisa, e prever, com
razovel margem de acerto, a frequncia com que cada resultado pode ser
esperado no estudo, com base na probabilidade conhecida para a ocorrncia
do evento na populao estudada. A esta previso para a ocorrncia de eventos
possveis esperados, chamamos de ensaio probabilstico.
Assim, alguns conceitos da teoria da probabilidade so realmente impor-
tantes a fim de que se possa compreender o que, de fato, significa a inferncia
estatstica quando se estuda a associao de causa e efeito entre um possvel
fator de risco (ou de proteo) e um desfecho de interesse, tal como uma doena

BIOESTATISTICA_VOL02.indb 121 25/06/12 17:21


ou um evento qualquer. Desta forma, o objetivo do presente captulo descrever
as principais medidas de efeito e associao mais utilizadas em pesquisa
experimental, assim como discutir suas aplicabilidades com base na teoria da
probabilidade.

15.1 TEORIA DA PROBABILIDADE

Em estatstica, o estudo da teoria da probabilidade tem ajudado os


pesquisadores a compreender e interpretar os dados obtidos atravs de seus
experimentos, alm de permitir que afirmativas mais confiveis possam ser
feitas, especialmente no que tange aos estimadores calculados a partir de
estudos de amostras, tal como a determinao das medidas de associao
do tipo razo de risco e razo de chance. Do mesmo modo, conhecer seus
conceitos pea fundamental a fim de que se possam entender as regras
elementares para o clculo das probabilidades dos desfechos estudados.
Assim, facilitando o entendimento do leitor, algumas definies sero aqui
apresentadas.
Suponhamos que um dado experimento possa ser repetido inmeras
vezes, e que cada repetio seja denominada de ensaio. Suponha, ainda, que,
em cada repetio (ensaio), um ou mais eventos mutuamente excludentes
possam ocorrer. Assim, a probabilidade para esse evento dada pela diviso
entre o nmero de vezes que ele ocorre no experimento e o nmero total de
ensaios do experimento. Portanto, para a ocorrncia do evento A, a probabi-
lidade de A dada por:

Nmero de eventos de A
P( A ) =
Nmero total de eventtos do experimento

Com base nessa linha de raciocnio, podemos deduzir que a probabilidade


para um determinado evento varia de 0 a 1, sendo 0 a probabilidade para um
evento impossvel e 1 a probabilidade para um evento certo. Do mesmo modo,
se os eventos forem mutuamente excludentes, a soma das probabilidades de
todos os eventos possveis para um experimento sempre igual a 1.

122 Bioestatstica aplicada Pesquisa Experimental

BIOESTATISTICA_VOL02.indb 122 25/06/12 17:21


Portanto, para a aplicao da teoria da probabilidade em estatstica, vamos
considerar o seguinte exemplo: um estudo para verificar a resposta de pacientes
portadores de uma determinada doena, ao de uma nova droga a ser testada.
Os possveis desfechos podem ser caracterizados como piora, inalterado,
melhora e cura. Os dados esto representados na Tabela 15.1, abaixo.

Tabela 15.1 Resultados para o teste de uma nova droga

N de casos
Tipo de resposta
Homens Mulheres
Piora 5 6
Inalterado 10 8
Melhora 42 35
Cura 53 61
Total 110 110

Experimento definido como qualquer processo planejado que permita


ao pesquisador fazer observaes, cuja finalidade a coleta de dados. O
exemplo acima constitui um experimento. A probabilidade de cura no gru-
po dos homens dada por:

53
P(cura) = = 0, 48
110

Ensaio cada uma das repeties independentes que compem um de-


terminado experimento. Para o exemplo anterior, cada ensaio consiste em
testar a droga em cada um dos 110 indivduos selecionados para o estudo.

Evento Corresponde ao desfecho obtido em cada um dos ensaios de um


experimento. Um evento dito simples quando no pode ser desdobrado.
Um evento denominado complementar quando ele o oposto ao evento
estudado, podendo ser calculado como 1 menos a probabilidade do evento
em questo. Ou seja, a probabilidade do evento estudado no ocorrer.
Para o exemplo dado, o evento pode ser qualquer um dos desfechos con-

Probabilidade e Medidas de Associao 123

BIOESTATISTICA_VOL02.indb 123 25/06/12 17:21


siderados no estudo, de acordo com a resposta individual droga testada.
Ou seja, pode ser a piora, o estado inalterado, a melhora ou a cura do
paciente. A probabilidade complementar para a cura no grupo das mulhe-
res dada por:

P(complementar para cura) = 1 P(cura)

61
= 1
110

= 0, 45

Espao amostral Consiste no conjunto de todos os eventos simples pos-


sveis de um experimento. No caso em tela, o espao amostral constitudo
por quatro eventos simples: piora, inalterado, melhora e cura.

15.1.1 Operaes com probabilidades


A seguir, mostraremos as regras bsicas para operaes com probabilidades.

A Regra da adio
Eventos mutuamente excludentes Dois ou mais eventos so ditos exclu-
dentes quando a ocorrncia de um impedir a ocorrncia do outro. Tome-
-se, como exemplo, o sexo; uma criana no pode nascer com os dois sexos,
masculino e feminino, ao mesmo tempo. Com base nesse princpio, todos os
eventos complementares so mutuamente excludentes, embora os eventos
possam ser mutuamente excludentes sem que sejam complementares. Isto
ocorre quando o espao amostral constitudo por trs ou mais eventos.
Assim, a probabilidade da ocorrncia de dois ou mais eventos mutuamente
excludentes igual soma das probabilidades de suas ocorrncias no mes-
mo experimento. Para o exemplo da Tabela 15.1, qual a probabilidade de um
paciente do sexo masculino evoluir com melhora ou cura?

P( melhora ou cura) = P(melhora) + P(cura)

42 53
= + = 0,86
110 110

124 Bioestatstica aplicada Pesquisa Experimental

BIOESTATISTICA_VOL02.indb 124 25/06/12 17:21


Eventos no mutuamente excludentes Eventos no mutuamente ex-
cludentes so aqueles cuja ocorrncia de um no impede a ocorrncia
do outro, tal como o sexo e grupo sanguneo, pois o nascimento de uma
criana do sexo masculino sempre ter um dos grupos sanguneos tpi-
cos da espcie humana. Deste modo, regra da adio de probabilidades
deve ser modificada, de tal maneira que a probabilidade da ocorrncia
de ambos os eventos no seja acrescentada duas vezes no mesmo clculo
final. Portanto, a probabilidade da ocorrncia de dois ou mais eventos
no mutuamente excludentes igual soma das probabilidades de suas
ocorrncias no mesmo experimento, menos a probabilidade de que os
eventos ocorram simultaneamente. No Quadro 15.1, a probabilidade do
paciente ser do sexo feminino 0,50 e a probabilidade de cura 0,55
(61/110). Entretanto a probabilidade de pertencer ao sexo feminino ou
evoluir com cura no igual a 0,50 + 0,55, pois nessa soma, as mulheres
com evoluo para cura foram contadas duas vezes. Assim, a proba-
bilidade conjunta de pertencer ao sexo feminino e de ter evoludo para
cura deve ser subtrada do clculo. O valor a ser subtrado calculado
pela regra da multiplicao para eventos independentes, a qual ser mos-
trada no prximo item. O clculo dado por:

P(mulher ou cura) = P(mulher) + P(cura) P(mulher e cura)

= 0,5 + 0,55 (0,5 0,55)

= 1,05 0,27 = 0,77

B Regra da multiplicao
Eventos independentes Dois ou mais eventos so ditos independentes
se a ocorrncia de um no tiver efeito sobre a ocorrncia do outro, tal como
o sexo e o tipo sanguneo, pois o tipo sanguneo de um indivduo no est
relacionado ao fato deste indivduo ser homem ou mulher. Assim, a proba-
bilidade conjunta de que dois ou mais eventos ocorram simultaneamente
igual ao produto da ocorrncia de suas probabilidades isoladamente. Para
o exemplo da Tabela 15.1, a probabilidade conjunta do paciente ser ho-
mem e evoluir para a cura dada por:

Probabilidade e Medidas de Associao 125

BIOESTATISTICA_VOL02.indb 125 25/06/12 17:21


P(hom em e cura) = P(hom em) P(cura)
= 0,5 0, 48 = 0,24

Eventos no-independentes Tambm ditos associados ou correlacionados,


so aqueles cuja probabilidade da ocorrncia de um deles depende da ocorrn-
cia do outro, isto , a ocorrncia de um deles altera a probabilidade da ocor-
rncia do outro. Por exemplo: para dois eventos A e B1 considerados no-inde-
pendentes, se quisermos saber a probabilidade do evento A, supondo-se que o
evento B tenha ocorrido, ou vice-versa, a probabilidade condicional dada por:

P( A e B) = P( A | B) P(B) ou P(B e A) = P(B | A) P( A)

Como: P( A e B) = P(B e A); P( A | B) P(B) = P(B | A) P( A)

P(B | A) P( A) P( A | B) P(B)
Ento: P( A | B) = ou P (B | A) =
P (B) P( A)

As duas equaes resultantes so derivadas da frmula do teorema de Bayes,


que ser discutido mais adiante, sendo o termo P(A), direita da equao P(A | B),
denominado probabilidade anterior, uma vez que o seu valor conhecido antes
do clculo, ao passo que o termo P(A | B), da mesma equao, denominado proba-
bilidade posterior, pois seu valor somente conhecido aps o clculo.

15.2 MEDIDAS DE ASSOCIAO

De modo geral, na maioria dos estudos estatsticos, o principal objetivo


verificar se existe uma relao de causa e efeito entre duas ou mais variveis,
sempre no sentido de avaliar o quanto a ao de uma influencia sobre o
desfecho da outra. Estes mtodos, frequentemente chamados de medidas
de fora de associao, tm sido amplamente utilizados em pesquisas
epidemiolgicas, cujo intuito mensurar a magnitude da associao entre
a exposio a um dado fator de risco e o desfecho de interesse, sendo as

1. A grafia P(A | B) lida como a probabilidade do evento A dado o evento B.

126 Bioestatstica aplicada Pesquisa Experimental

BIOESTATISTICA_VOL02.indb 126 25/06/12 17:21


variveis apresentadas sob a forma categrica (dicotmica) ou contnua.
Nesta parte do livro, abordaremos apenas as medidas de fora de associao
com variveis categricas, pois aquelas com variveis contnuas j foram
discutidas em outros captulos.
De qualquer forma, as medidas de fora de associao podem ser calcu-
ladas tanto em termos relativos, do tipo razo, como em termos absolutos,
do tipo diferena, e a escolha de um ou de outro mtodo depende do tipo
de estudo realizado. Porm, seja um ou outro o mtodo escolhido, o nvel de
significncia deve ser previamente estabelecido, de tal maneira que a signifi-
cncia estatstica possa ser testada para se verificar se a diferena encontrada
no tenha ocorrido em razo do acaso. O Quadro 15.1, abaixo, mostra a classi-
ficao das medidas de fora de associao mais utilizadas em estatstica.

Quadro 15.1 Classificao geral das medidas de fora de associao

Medidas de associao Tipos


- Risco Relativo (RR)
Relativas (tipo razo)
- Razo de Chances (OR)
- Risco Atribuvel (RA)
- Porcentagem de Risco Atribuvel (RA%)
Absolutas (tipo diferena)
- Risco Atribuvel na Populao (RAP)
- Porcentagem de Risco Atribuvel na Populao (RAP%)
- Coeficiente de correlao
Outras
- Tamanho de efeito padronizado (TEP)

As medidas de associao relativas (tipo razo) so utilizadas quando


o objetivo mensurar a associao entre a exposio ao fator de risco e a
ocorrncia de uma doena. Isto , quando queremos medir quantas vezes a
ocorrncia da doena no grupo dos expostos maior em relao ocorrncia
no grupo dos no-expostos. Portanto, as medidas de associao relativas
podem variar entre 0 e , de modo que, quando o valor igual a 1, isto
significa que as frequncias da doena entre os expostos e no-expostos so
iguais, no existindo, portanto, associao entre o fator de risco incriminado
e a doena estudada. Por sua vez, quando o valor for maior que 1, significa que
a frequncia no grupo dos expostos maior que no grupo dos no-expostos,

Probabilidade e Medidas de Associao 127

BIOESTATISTICA_VOL02.indb 127 25/06/12 17:21


indicando, portanto, que a exposio ao fator de risco est associado a um
aumento na ocorrncia da doena. Por outro lado, valores entre 0 e 1 indicam
que a frequncia da doena no grupo dos expostos menor em relao aos
no-expostos, sugerindo que a exposio um fator de proteo.
Por sua vez, as medidas de associao absolutas (tipo diferena)
so utilizadas quando o objetivo mensurar o quanto a frequncia de
uma doena no grupo dos expostos excede a frequncia no grupo dos
no-expostos, de tal modo que se possa determinar o nmero de casos
atribuveis exposio ao fator de risco estudado. Assim, com base nesta
relao, se a doena acomete igualmente os dois grupos, a diferena entre
as frequncias ser igual a zero, logo se conclui que no h associao
entre o fator de risco incriminado e a doena estudada. Porm, se alguma
diferena verificada, isto sugere que pode existir uma associao entre o
fator de risco e a doena em questo. Assim, com base neste raciocnio, as
medidas absolutas podem variar de uma associao fortemente positiva,
situao em que muitos expostos adoecem e poucos no-expostos adoecem,
a uma associao fortemente negativa, quando poucos expostos adoecem
e muitos no-expostos adoecem.
De qualquer maneira, seja para calcular as medidas de fora de associao
relativas ou absolutas, necessitamos utilizar a tabela de contingncia 2 x 2
padro, a qual mostrada, a seguir, com os dados hipotticos de um estudo
de coorte que ser tomado como exemplo para que se possam demonstrar os
clculos das diferentes mediadas de associao. Nas linhas, sero colocadas
as categorias relativas exposio ao fator de risco estudado; nas colunas,
estaro as categorias relativas doena de desfecho.

Exemplo: Um estudo de coorte prospectivo foi conduzido no sentido de


verificar a associao entre o fator de risco consumo de gordura saturada
e incidncia de hipercolesterolemia. Parar tal experimento, dois grupos de
200 pacientes, com nvel de colesterol srico normal, foram selecionados.
Ao grupo dos expostos, foi administrada dieta rica em gordura saturada; ao
grupo dos no-expostos, foi administrada dieta normal. O ponto de corte
considerado para a dosagem de colesterol total foi de 200 mg/dL.

128 Bioestatstica aplicada Pesquisa Experimental

BIOESTATISTICA_VOL02.indb 128 25/06/12 17:21


Tabela 15.2 Resultados de um estudo de coorte com 400 indivduos
Doena
Presente Ausente Total

Exposio ao fator Exposto (a) 36 (b) 164 200


de risco No-exposto (c) 12 (d) 188 200
Total 48 352 400
a - Indivduos expostos ao fator de risco e com a doena
b - Indivduos expostos ao fator de risco e sem a doena
c - Indivduos no-expostos ao fator de risco, mas com a doena
d - Indivduos no-expostos ao fator de risco e sem a doena
a + b - Todos os Indivduos expostos ao fator de risco
c + d - Todos os Indivduos no-expostos ao fator de risco
a + c - Todos os Indivduos com a doena
b + d - Todos os Indivduos sem a doena
a + b + c + d - Todos os indivduos do estudo

15.2.1 Razo de Risco (RR)


Tambm conhecida como risco relativo ou risk ratio, a razo de risco
corresponde razo entre o risco de adoecer em um grupo de indivduos
expostos ao fator de risco e o risco de adoecer em um grupo de indivduos
no-expostos ao mesmo fator de risco. A razo de risco pode ser calculada pela
seguinte frmula:

Risco(Expostos ) a c
RR = , onde Risco(Expostos ) = e Risco( No-expostos ) =
Risco( No-expostos ) a +b c +d

Para o exemplo dado, temos:

a 36
RR = a + b = 200 = 3,0
c 12
c + d 200

O risco relativo fornece uma estimativa da magnitude da associao entre


a exposio ao fator de risco e o desfecho estudado, isto , ele mostra quantas
vezes o risco de desenvolver a doena nos indivduos expostos maior em

Probabilidade e Medidas de Associao 129

BIOESTATISTICA_VOL02.indb 129 25/06/12 17:21


relao aos indivduos no-expostos. Assim, para o exemplo em questo, o risco
no grupo exposto foi trs vezes maior que no grupo no-exposto. Ou seja, os
indivduos que consumiram dieta rica em gordura saturada apresentaram uma
probabilidade trs vezes maior de evoluir com hipercolesterolemia quando
comparados aos indivduos com consumo de dieta normal.
Observe que este resultado foi calculado com base em um estudo amostral
e, portanto, deve ser avaliado para que se possa verificar a sua significncia
estatstica, a qual pode ser testada pela aplicao do teste do qui-quadrado
(2), j discutido no captulo anterior. Para o exemplo dado, importa
saber que o resultado para o teste foi estatisticamente significante, pois
calc
2
= 13,64 e valor P = 0,0002.
Uma outra maneira de testar a significncia estatstica atravs da anlise
do intervalo de confiana (IC), o qual pode ser calculado por diferentes mtodos
estatsticos, todos eles bastante complexos, porm com resultados muito
semelhantes, de modo que a utilizao de programas estatsticos tem facilitado
este tipo de anlise. No caso do exemplo da Tabela 15.2, o intervalo de confiana
de 95% (IC95%) calculado pelo programa Epi Info 3.5.1 (sries de Taylor)
igual a 1,61 - 5,59, indicando que na populao de onde a amostra foi retirada, a
verdadeira razo de risco pode ser qualquer valor entre 1,61 e 5,59, com 95% de
confiana. Assim, uma vez que o referido intervalo no contm a razo de risco
igual a 1, isto significa que, em nenhum momento, os riscos so iguais, e que,
portanto, o resultado encontrado (RR = 3,0) estatisticamente significante, fato
este que confirma o achado do teste de significncia do qui-quadrado.
De qualquer maneira, o intervalo de confiana para a razo de risco (RR)
pode ser determinado pela seguinte frmula:

IC95% para Razo de Risco

1 a /(a + b ) 1 c /(c + d )

IC 95% = exp ln(RR ) 1, 96 +
a c

1 (36 / 200) 1 (12 / 200


IC 95% = exp ln(3,0) 1, 96 +
36 12

IC 95% = exp 1,098 1, 96 0,101



130 Bioestatstica aplicada Pesquisa Experimental

IC 95% = exp 1,098 0,623

IC 95% = 1,61 (limite inferior)


BIOESTATISTICA_VOL02.indb 130 25/06/12 17:21
IC 95% = exp ln(RR ) 1, 96 +
a c

1 (36 / 200) 1 (12 / 200


IC 95% = exp ln(3,0) 1, 96 +
36 12

IC 95% = exp 1,098 1, 96 0,101


IC 95% = exp 1,098 0,623

IC 95% = 1,61 (limite inferior)

= 5,59 (limite superior)

C 95% = 1,61 < RR < 5,59


IC

Observe, ainda, que o risco relativo no pode ser calculado para um


estudo do tipo caso-controle. Este tipo de medida de associao somente deve
ser utilizado para um estudo de coorte ou para um ensaio clnico, nos quais
um grupo de indivduos com o fator de risco e um grupo sem o fator de risco
so selecionados e acompanhados ao longo do tempo, para determinar quais
indivduos desenvolvero o desfecho de interesse.

15.2.2 Razo de Chance (RC)


Tambm conhecida como odds ratio (OR), a razo de chance dada pela
razo entre chance de exposio no grupo de indivduos doentes e a chance
de exposio no grupo de indivduos no-doentes. A razo de chance pode ser
calculada pela seguinte frmula:

a c
Chance(Doena )
, onde Chance(Doena ) = a +b = e Chance( No-doena ) = c +d =
a c
OR =
Chane( No-doena ) b b d d
a +b c +d

Para o exemplo dado, temos:

a
c a d 36 188 6.768
OR = = = = = 3, 44
b b c 164 12 1.968
d

Probabilidade e Medidas de Associao 131

BIOESTATISTICA_VOL02.indb 131 25/06/12 17:21


Observe que dada a disposio de sua frmula na tabela de contingncia,
a razo de chances tambm conhecida como razo dos produtos cruzados,
sendo usada quando o objetivo avaliar se a chance de ocorrer a doena no
grupo de expostos maior ou menor que no grupo de no-expostos. Assim,
para o exemplo em questo, a chance no grupo exposto foi 3,4 vezes maior
que no grupo no-exposto. Ou seja, os indivduos que consumiram dieta rica
em gordura saturada apresentaram uma chance 3,4 vezes maior de evoluir
com hipercolesterolemia quando comparados aos indivduos com consumo
de dieta normal.
Portanto, embora a razo de risco no possa ser calculada em um estudo
caso-controle, a razo de chances pode, sendo esta medida de associao uma
boa estimativa da razo de risco que seria obtida neste tipo de estudo, especial-
mente quando a frequncia da doena na populao muito baixa.
Por outro lado, erroneamente, comum a utilizao do termo risco
relativo para designar as medidas calculadas pela razo de chance. Em termos
prticos, as duas medidas apresentam frmulas matemticas diferentes.
Mas, afinal, por que nos estudo caso-controle no pode ser utilizada a razo
de risco? A questo simples. Se fssemos calcular a chance de doena no
grupo exposto ao fator de risco, a frmula seria a/b; ao passo que a chance
de doena no grupo no-exposto seria c/d, e a razo de chance entre os
dois grupos seria OR = (a/b)/(c/d). Matematicamente, no teria diferena
se a razo de chance fosse calculada desta maneira ou pela frmula tradi-
cionalmente correta, OR = (a/c)/(b/d), pois a multiplicao cruzada, em
cada caso, seria sempre OR = ad/bc. Porm, em termos conceituais, no tem
sentido usar a frmula OR = (a/b)/(c/d), pois os valores das clulas a e b
vm de diferentes grupos estudados, isto , a vem do grupo caso, enquanto
b vem do grupo controle.
Note que, neste tipo de estudo, as nicas medidas disponveis so
as propores de pessoas expostas entre os casos e entre os controles.
No temos dados sobre o nmero de pessoas expostas e no-expostas na
populao que produziu os casos e que, tambm, produziu os controles, pois
o nmero de casos e controles definido arbitrariamente pelo pesquisador
e no reflete a proporo real entre o nmero de casos, ou controles, e o
total de pessoas na populao. Por este motivo, a apresentao dos dados

132 Bioestatstica aplicada Pesquisa Experimental

BIOESTATISTICA_VOL02.indb 132 25/06/12 17:21


tabulares nos estudos caso-controle no inclui a coluna de total, que soma
casos e controles nos grupos expostos e no-expostos ao fator de risco. Por
isso, no podemos calcular os riscos de doena em expostos e no-expostos,
nem, tampouco, a razo de risco, da porque, em estudos caso-controle,
os grupos so comparados quanto frequncia de exposio pela
aplicao da razo de chance de exposio, que corresponde ao valor de
quanto a exposio mais frequente em um grupo em relao ao outro.
Como a razo de chance (OR) de exposio e a razo de chance de doena,
em expostos e no-expostos, so, matematicamente, iguais, esta ltima
tambm pode ser calculada em estudos caso-controle, pois ela semelhante
razo de risco de doena, quando esta relativamente rara, em especial,
quando sua incidncia na populao menor que 5%, sendo a razo
de chance uma boa estimativa da razo de risco. Nestes casos, a razo de
chance semelhante razo de risco, e isso explica o uso do termo razo de
risco ou risco relativo, quando a razo de chance calculada em estudos do
tipo caso-controle.
Outro ponto importante a ser considerado no clculo das medidas de
associao do tipo razo a disposio dos grupos na tabela de contingncia
2 x 2. Como j explicado anteriormente, para o clculo do qui-quadrado, a
posio dos grupos no altera o resultado final, porm, nos clculos da razo
de risco (RR) e da razo de chances (RC), essa disposio importante para
a interpretao do resultado. Tradicionalmente, o grupo exposto colocado
no numerador, uma vez que, quase sempre, o risco, neste grupo, maior que
no grupo no-exposto, o que leva a um valor maior que 1, tal como ocorreu
no exemplo mostrado na Tabela 15.2, onde o risco para hipercolesterolemia
3 vezes maior no grupo exposto em relao ao no-exposto. Por outro
lado, nada impede que o grupo exposto seja colocado no denominador. Nesta
disposio, o risco seria 1/3, isto , 0,33, o que significa que os indivduos
os quais consumiram dieta normal tm um tero do risco dos indivduos
com dieta rica em gordura saturada. Neste caso, poderamos dizer que no
consumir gordura saturada um fator de proteo para a hipercolestero-
lemia. De qualquer forma, as duas maneiras fazem sentido, e a interpretao
matematicamente compreensvel, esteja o grupo exposto no numerador ou
no denominador da equao.

Probabilidade e Medidas de Associao 133

BIOESTATISTICA_VOL02.indb 133 25/06/12 17:21


IC95% para Razo de Chances

1 1 1 1
IC 951% = exp ln(OR ) 1, 96 + + +
a b c d

1 1 1 1
IC 95% = exp ln(3, 44) 1, 96 + + +
36 164 12 188

IC 95% = exp(1,235 1, 96 0,122 )

IC 95% = exp(1,235 0,684)

IC 95% = 1,73 (limite inferior) e 6,81 (limite sup


perior)

IC 95% = 1,73 < OR < 6,81

15.2.3 Risco Atribuvel (RA)


Tambm conhecido como diferena de risco, o risco atribuvel dado
pela diferena entre o risco em um grupo exposto e o risco em um grupo
no-exposto.

RA = Risco(Expostos) Risco(No-expostos)

a c 36 12
RA = =
a + b c + d 200 200

RA = 0,18 0,06 = 0,12

O risco atribuvel fornece uma estimativa do efeito da exposio ao fator de


risco sobre o excesso de risco da doena no grupo exposto em relao ao grupo
no-exposto. Isto , mostra a quantidade de risco que atribuda ao fator de
risco estudado, desde que a relao entre a exposio e a doena no ocorra
por acaso. Isto significa que, para cada 100 indivduos expostos ao fator de
risco, em mdia 18 (36/200) deles apresentam hipercolesterolemia, e desses
18, a exposio ao consumo excessivo de gordura saturada responsvel pela
hipercolesterolemia em 12 indivduos. Assim, caso a exposio fosse eliminada

134 Bioestatstica aplicada Pesquisa Experimental

BIOESTATISTICA_VOL02.indb 134 25/06/12 17:21


e a doena fosse reversvel, o risco no grupo dos expostos reduziria de 0,18
para 0,06, o que evitaria que, de cada 100 pessoas expostas ao fator de risco,
12 indivduos apresentassem a doena.

15.2.4 Porcentagem de Risco Atribuvel (RA%)

Corresponde ao risco atribuvel (RA) expresso em porcentagem em relao


incidncia no grupo dos expostos. dada pela equao:

Risco(Expostos) Risco(No-expostos)
RA % = x 100
Risco(Expostos)

0,18 0,06
RA % = x 100
0,18

RA % = 66,66%

A porcentagem de risco atribuvel reflete que porcentagem de risco total


para hipercolesterolemia devido ao consumo de gordura saturada. Assim,
para o exemplo em questo, 66,6% do risco entre os expostos so atribudos
exposio ao fator de risco estudado.
Uma outra maneira de calcular o RA% tomar como base o risco relativo
(RR). Esta maneira deve ser considerada quando, no estudo, no for possvel
calcular o risco absoluto. A frmula :

RR 1
RA % = 100
RR

31
RA % = 100 RA % = 66,66%
3

Nos estudos do tipo caso-controle, nos quais no se pode estimar a


incidncia da doena, ou nas pesquisas em que a doena estudada de baixa
frequncia e, portanto, com baixo risco na populao, a razo de chances (OR)
pode ser usada como um estimador aproximado do risco relativo (RR). Nestes
casos, a frmula da RA% pode ser escrita substituindo-se o RR pelo OR.

Probabilidade e Medidas de Associao 135

BIOESTATISTICA_VOL02.indb 135 25/06/12 17:21


OR 1
RA % = 100
OR

3, 44 1
RA % = 100
3, 44

RA % = 70, 93%

15.2.5 Risco Atribuvel na Populao (RAP)


calculado pela diferena entre o risco total na populao menos o risco
no grupo no-exposto. Estima, na populao em geral, o quanto do risco total
para a doena em questo decorrente do fator de risco estudado. dado
pela frmula:

RAP = Risco(Total ) Risco( No-expostos )

a +c c 48 12
RAP = =
a + b + c + d c + d 400 200

RAP = 0,12 0,06 = 0,06

Portanto, se no houvesse o consumo de gordura saturada na populao, o


total de indivduos com hipercolesterolemia seria somente de 6 para cada 100
pessoas avaliadas, sendo o excesso sobre esse nmero, isto , de 6 indivduos
hipercolesterolmicos, atribudo ao fator de risco estudado.

15.2.6 Porcentagem de Risco Atribuvel na


Populao (RAP%)
Igualmente ao RA%, a porcentagem de risco atribuvel na populao
(RAP%) tambm pode ser calculada com base na diferena de risco absoluto
ou no risco relativo. A frmula que utiliza a diferena de risco a seguinte:

Risco(total ) Risco( No-exposto )


RAP % = 100
Risco(Total )

0,12 0,06
RAP % = 100
136 Bioestatstica aplicada Pesquisa 0 ,12
Experimental

RAP % = 50%

BIOESTATISTICA_VOL02.indb 136 25/06/12 17:21


Risco(total ) Risco( No-exposto )
RAP % = 100
Risco(Total )

0,12 0,06
RAP % = 100
0,12

RAP % = 50%

A RAP% informa, na populao em geral, que porcentagem de risco total


para a doena devido ao fator de risco estudado. No caso em questo, 50%
do risco de hipercolesterolemia decorrente do consumo de gordura saturada.
Portanto, as medidas de associao, sejam do tipo razo ou do tipo
diferena, tm sido amplamente utilizadas para avaliao de custos e benefcios
de programas de sade pblica para investigao e controle de riscos que
podem causar doenas na populao em geral. O perfeito entendimento de suas
aplicaes e a correta interpretao dos resultados constituem importantes
pontos a serem considerados pelos pesquisadores envolvidos com estudos na
rea da epidemiologia.

Probabilidade e Medidas de Associao 137

BIOESTATISTICA_VOL02.indb 137 25/06/12 17:21


BIOESTATISTICA_VOL02.indb 138 25/06/12 17:21
16
Testes de Rastreamento
Diagnstico

No dia-a-dia da prtica da pesquisa clnica, o mdico e outros profis-


sionais da rea da sade so frequentemente chamados a decidir quanto ao
diagnstico e ao tipo mais indicado de tratamento para as mais diversas varie-
dades de doenas. Neste complexo processo de tomada de decises, estes
profissionais se deparam com situaes que exigem no apenas a escolha
correta dos exames diagnsticos, mas, tambm, a perfeita interpretao e
minuciosa avaliao da preciso dos resultados fornecidos, sejam eles positivos
ou negativos. Entretanto, como geralmente existem diferentes exames, sejam
clnicos ou laboratoriais, a fim de que se possa diagnosticar uma determinada
doena, o pesquisador sempre dever buscar aquele que fornea um resultado
mais confivel, escolha esta que, certamente, depender de vrios fatores, tais
como a acurcia, a sensibilidade e a especificidade do teste solicitado, assim
como do espectro da doena na populao e do estgio em que a ela se encontra
no momento do estudo.
De qualquer maneira, antes de se decidir por um ou por outro tipo exame,
ou at mesmo antes que um novo exame de diagnstico seja implantado como
um bom teste de rastreamento para uma determinada doena, um pesqui-
sador dever submet-lo a uma srie de anlises no sentido de verificar sua
efetividade. Estas anlises, geralmente realizadas comparativamente com

BIOESTATISTICA_VOL02.indb 139 25/06/12 17:21


outros testes j bem estabelecidos pela cincia, so embasadas em princpios
estatsticos e teorias probabilsticas anteriormente explanadas neste livro,
as quais tm assumido grande destaque na rea da pesquisa mdica, pois
constituem uma importante ferramenta de orientao e de avaliao de
polticas de sade pblica. Assim, o objetivo do presente captulo orientar
o pesquisador quanto correta aplicao do processo de tomada de decises
teraputicas, com base no mtodo de anlise e validao de teste de
diagnstico e de rastreamento.

16.1 BASES PARA OS TESTES DE RAsTREAMENTO


DIAGNSTICO

Tambm conhecidos como screening test, os testes de rastreamento


tm sido largamente empregados como estimadores de doenas em estudos
de pesquisas epidemiolgicas e clnicas, de modo a oferecer uma forma
segura para o processo de tomada de deciso se um determinado proce-
dimento diagnstico deve ou no ser aplicado para uma dada populao.
Como o diagnstico condio fundamental para o planejamento teraputico,
essencial que o profissional envolvido possa dispor de mtodos seguros
para avaliar a efetividade do exame solicitado, de maneira que o tratamento
indicado tenha mais chances de sucesso. Assim, a escolha do instrumento
utilizado para a tomada de deciso assume grande importncia, uma vez
que, dos dados obtidos a partir de sua aplicao, depende todo um planeja-
mento teraputico.
Na prtica clnica, um teste de rastreamento diagnstico utilizado
para a deteco de uma doena especfica ou de um agravo sade em uma
populao exposta a um determinado fator de risco, mesmo que na ausncia
de queixas, isto , ainda na fase pr-clnica da doena, podendo, porm,
ser ampliado para toda a populao de acordo com critrios tcnicos bem
definidos, tal como a alta prevalncia da doena na populao em questo,
a faixa etria ou o sexo acometido, sempre no sentido de contribuir com o
prognstico da doena estudada. Com base neste raciocnio, um bom teste
de rastreamento diagnstico, alm de outras caractersticas, deve detectar

140 Bioestatstica aplicada Pesquisa Experimental

BIOESTATISTICA_VOL02.indb 140 25/06/12 17:21


o maior nmero possvel de casos da doena investigada na populao
alvo, de modo que possa distinguir, com preciso, as pessoas que esto
aparentemente bem, mas que se encontram doentes, daquelas que no
apresentam a doena investigada. Ou seja, um bom teste deve ser preciso
quando separa os casos positivos (com a doena) dos casos negativos
(sem a doena).
Porm, como no existe um teste diagnstico perfeito no que tange
identificao da doena estudada, o pesquisador sempre ir incluir, em
sua avaliao, uma razovel margem de erro quanto ao resultado obtido,
seja ele positivo ou negativo. Essa margem de erro pode ser aumentada ou
diminuda segundo algumas caractersticas assumidas para o teste, tal como
a sensibilidade, a especificidade e o ponto de corte definido como limite
de normalidade para os valores encontrados no exame diagnstico, assim
como um bom juzo crtico baseado na experincia do avaliador. Por essa
razo, ao solicitar um determinado exame diagnstico, o pesquisador dever
considerar que o resultado obtido poder incluir uma das seguintes possi-
bilidades: teste positivo (alterado) para um paciente portador da doena
investigada (teste verdadeiro-positivo); teste positivo (alterado) para um
paciente sem a doena investigada (teste falso-positivo); teste negativo
(normal) para um paciente com a doena investigada (teste falso-negativo);
teste negativo (normal) para um paciente sem a doena investigada
(teste verdadeiro-negativo).
Assim, diante destas quatro possibilidades acima expostas, o pesquisador
dever decidir qual aquela que melhor se aplica para a situao em estudo. Esta
tomada de deciso requer, alm do conhecimento das particularidades clnicas
inerentes doena investigada, a determinao das medidas de sensibilidade
e especificidade que definem a qualidade intrnseca do teste utilizado, assim
como a anlise dos parmetros que refletem a sua capacidade de produzir
decises clnicas corretas, dentre as quais se destacam os valores de predio
positiva e negativa, todas elas embasadas nos princpios da teoria da probabi-
lidade, j anteriormente demonstradas.
No entanto, para que um teste seja considerado efetivo como instrumento
de diagnstico clnico ou de rastreamento para uma determinada doena ou
agravo populao, necessrio submet-lo a um processo de avaliao, de

Testes de Rastreamento Diagnstico 141

BIOESTATISTICA_VOL02.indb 141 25/06/12 17:21


modo que se possa verificar a sua sensibilidade e especificidade em sujeitos
com caractersticas semelhantes s da populao em que o teste ser usado.
Para tal, deve-se comparar a proporo de resultados corretos para o teste
a ser avaliado, quando aplicado em dois grupos distintos: a) um grupo de
sujeitos sabidamente saudveis e que, portanto, os resultados do teste devem
ser negativos; b) um grupo de sujeitos no qual se tem a certeza que a doena
esta presente e que, portanto, os resultados do teste devem ser positivos.
Note que, nesta avaliao, a presena da doena no segundo grupo tambm
foi confirmada por um teste diagnstico, o qual utilizado como referncia.
Este teste, geralmente chamado padro-ouro1 (gold standard), deve
ser teoricamente melhor que o teste avaliado e, de preferncia, totalmente
isento de erros.
Em resumo, para um exame de diagnstico clnico ou de rastrea-
mento poder ser utilizado correntemente, de forma a produzir resultados
confiveis, h de se proceder a sua validao com base em um teste consi-
derado teoricamente melhor no momento da execuo da pesquisa, mesmo
que este no oferea uma certeza absoluta a respeito do diagnstico.
Assim, o desafio do pesquisador encontrar um teste o mais prximo possvel
do ideal, mais rpido, com menor custo e menos invasivo.
De qualquer maneira, para executar a validao de um teste diagnstico
ou de rastreamento, a maneira mais didtica a utilizao da tabela de
contingncia 2 x 2, j amplamente discutida no captulo 14 deste livro.
Nesta tabela, so comparados os resultados do teste avaliado e do teste
padro-ouro tomado como referncia. A partir destes resultados,
possvel calcular as medidas que caracterizam as qualidades intrnsecas e
os parmetros de decises do teste em anlise. Um modelo para a tabela-
-padro 2 x 2, que compara os resultados do teste analisado e a verdadeira
condio de doena nos indivduos testados, mostrada a seguir. Note que
os pacientes so classificados apenas como doentes e no-doentes, no se
admitindo estgios intermedirios.

1. Termo utilizado para designar testes com satisfatria exatido diagnstica, tal como bipsias,
inspees cirrgicas e outros.

142 Bioestatstica aplicada Pesquisa Experimental

BIOESTATISTICA_VOL02.indb 142 25/06/12 17:21


Tabela 16.1 Tabela-padro 2 x 2 para a validao de um teste de rastreamento diagnstico

Resultado do teste padro ouro

Doente No-doente Total

Positivo a b a+b
Resultado do teste
analisado
Negativo c d c+d

Total a+c b+d a + b +c + d

a - Indivduos com resultado verdadeiro-positivo para o teste


b - Indivduos com resultado falso-positivo para o teste
c - Indivduos com resultado falso-negativo para o teste
d - Indivduos com resultado verdadeiro-negativo para o teste
a + b - Todos os Indivduos com resultado positivo para o teste
c + d - Todos os Indivduos com resultado negativo para o teste
a + c - Todos os Indivduos com a doena (teste padro ouro)
b + d - Todos os Indivduos sem a doena (teste padro ouro)
a + b + c + d - Todos os indivduos do estudo

Note, tambm, que apenas nas caselas a e d o teste em anlise est


correto. Isto ocorre porque, na prtica, no existem testes diagnsticos
perfeitos, capazes de identificar todos os indivduos portadores da doena
investigada. Assim, com o objetivo de demonstrar todos os clculos envol-
vidos no processo de avaliao de um teste diagnstico, tomaremos como
base o seguinte exemplo:

Exemplo: Suponha que um laboratrio queira realizar um estudo para


verificar a confiabilidade de um teste rpido para gravidez com o uso de
um kit caseiro. Para tal finalidade, os autores compararam os resultados do
teste realizado pela deteco qualitativa de gonadotrofina corinica humana
(hCG) na urina de mulheres supostamente grvidas. O diagnstico definitivo de
gravidez foi feito pela dosagem da gonadotrofina corinica humana no sangue
(padro ouro). Os resultados esto expressos na Tabela 16.2, a seguir.

Testes de Rastreamento Diagnstico 143

BIOESTATISTICA_VOL02.indb 143 25/06/12 17:21


Tabela 16.2 Resultado da avaliao do teste rpido para gravidez em 800 mulheres
supostamente grvidas

Resultado do teste padro ouro


Grvida No-grvida Total

Resultado do teste Positivo 416 105 521


rpido Negativo 48 231 279
Total 464 336 800

16.2 INDICADORES DE UM TESTE DIAGNSTICO

16.2.1 Sensibilidade e Especificidade


A preciso de um teste diagnstico mais frequentemente medida atravs
de dois importantes indicadores, a sensibilidade e a especificidade, os quais
sero descritos a seguir:

Sensibilidade (S)
Refere-se capacidade do teste em detectar a doena que est sendo inves-
tigada quando ela est de fato presente. Ou seja, de ser positivo nos pacientes
que realmente tm a doena. A sensibilidade expressa a porcentagem dos
pacientes com a doena, cujos resultados do exame foram positivos. calculada
pela seguinte frmula:

a 416
S= , onde, para o exemplo dado: S = = 0,897 (89,7%)
a +c 464

Se o teste apresentar alta sensibilidade, raramente deixar de diagnos-


ticar indivduos com a doena. Por outro lado, se o teste no sensvel, ele no
detectar a doena em alguns dos indivduos doentes, os quais iro aparecer
na casela c. A proporo destes indivduos chamada de taxa de erro falso-
-negativo (EFN), cujo denominador inclui todos os indivduos doentes, pois
somente eles podem ser falsamente chamados de no-doentes. A EFN
calculada por:

144 Bioestatstica aplicada Pesquisa Experimental

BIOESTATISTICA_VOL02.indb 144 25/06/12 17:21


c 48
EFN = = = 0,103 (10,3%)
a + c 464

Importa saber que a sensibilidade e a taxa de erro falso-negativo somam


1,0 (100%).

Especificidade (E)
Refere-se capacidade do teste em identificar os indivduos que no tm
a doena investigada quando, de fato, ela no est presente. Ou seja, de ser
negativo nos pacientes que realmente no tm a doena. A especificidade
expressa a porcentagem dos pacientes sem a doena, cujos resultados do exame
foram negativos. calculada pela seguinte frmula:

d 231
E= , onde, para o exemplo dado: E = = 0,687 (68,7%)
b +d 336

Se o teste apresentar alta especificidade, raramente classificar como


doente um indivduo sem a doena. Por outro lado, se o teste no especfico,
ele indicar, erroneamente, a presena da doena em alguns dos indivduos
no-doentes, os quais iro aparecer na casela b. A proporo destes indivduos
chamada de taxa de erro falso-positivo (EFP), cujo denominador inclui
todos os indivduos no-doentes, pois somente eles podem ser falsamente
chamados de doentes. A EFP calculada por:

b 105
EFP = = = 0,313 (31,3%)
b + d 336

Importa saber que a especificidade e a taxa de erro falso-positivo somam


1,0 (100%).

De maneira geral, para a deteco de uma determinada condio clnica,


o ideal seria a escolha de um teste com alta sensibilidade e especificidade. No
entanto, nem sempre existem testes que combinem estas duas caractersticas,
simultaneamente. Na prtica clnica, o mais comum se encontrar mais de um

Testes de Rastreamento Diagnstico 145

BIOESTATISTICA_VOL02.indb 145 25/06/12 17:21


teste para a mesma doena, da a necessidade da comparao entre eles, de
modo que a escolha recaia sobre aquele mais adequado para a situao. Assim,
suponha que dois diferentes testes estejam disponveis: um com alta sensibi-
lidade e baixa especificidade, e outro com alta especificidade, porm com baixa
sensibilidade. Qual seria a escolha mais apropriada? Neste caso, alguns pontos
devem ser considerados, dentre eles as indicaes pertinentes condio clnica
do paciente e o tipo de doena a ser diagnosticada, assim como a capacidade
do teste em fazer previses diagnsticas (valores preditivos), que dependem
conjuntamente da sensibilidade e especificidade. A seguir, citaremos algumas
indicaes clnicas para a escolha do melhor teste. Os valores preditivos e a
razo de probabilidades sero descritas mais adiante.
Quando o objetivo rastrear uma doena ou agravo sade em grupos
populacionais, como por exemplo, traar o perfil epidemiolgico da soropre-
valncia2 de uma determinada doena infecciosa, como a hepatite B e C, a
escolha deve recair sobre um teste de alta sensibilidade. Igualmente, os testes
mais sensveis devem ser utilizados para diagnosticar condies clinicamente
graves, especialmente na fase inicial da doena, quando o objetivo fazer
diagnstico diferencial.
Por sua vez, os testes mais especficos dever ser escolhidos quando o
objetivo for confirmar um diagnstico indicado por um teste mais sensvel,
pois raramente ele mostrar um resultado positivo na ausncia de doena.
Do mesmo modo, a especificidade deve ser prioritria nos casos em que um
resultado falso-positivo possa comprometer a sade do paciente pela indicao
de um tratamento desnecessrio, por exemplo.
Assim, para o exemplo mostrado na Tabela 16.2, o teste rpido para
diagnstico da gravidez apresenta alta sensibilidade (89,7%), porm com
razovel especificidade (68,7%).

Relao entre sensibilidade e especificidade


Como referido anteriormente, o teste ideal seria aquele em que a sensibi-
lidade e a especificidade fossem iguais a 100%. Porm, como na prtica isto no
ocorre, os valores da sensibilidade e da especificidade devem ser combinados a

2. 
Refere-se aos indivduos que tm positividade para anticorpos contra um dado agente
infeccioso. O surgimento da soropositividade chamado de soroconverso.

146 Bioestatstica aplicada Pesquisa Experimental

BIOESTATISTICA_VOL02.indb 146 25/06/12 17:21


fim de que se possa determinar a utilidade do exame como meio de diagnstico
para uma determinada doena. Entretanto, o que frequentemente existe um
equilbrio (contrabalano ou trade-off) entre estas duas propriedades, de tal
modo que, quando aumenta a sensibilidade, a especificidade tende a diminuir
e vice-versa. Assim, esses indicadores tambm devem ser combinados com o
ndice de suspeita (ou probabilidade anterior) do mdico de que o indivduo
pesquisado tenha ou no a doena investigada, visando a determinar a proba-
bilidade da doena (ou sua ausncia), tendo em vista o conhecimento do
resultado do exame.
Quando o resultado do teste expresso de forma dicotmica, isto , como
positivo ou negativo, normal ou anormal, por exemplo, muito pouco se pode
fazer para ajustar a sensibilidade ou a especificidade. Porm, para um teste
diagnstico cujo resultado determinado por uma escala contnua de valores,
como o mtodo enzimtico para a dosagem de colesterol srico, expressa em
mg/dL, por exemplo, necessrio que se estabelea um limite (ponto de corte
ou cutoff point) entre os valores considerados normais e os anormais. Neste
caso, alterando-se o ponto de corte para mais ou para menos, pode-se modificar
as propriedades do teste, de modo que a sensibilidade somente poder ser
aumentada se ocorrer uma diminuio considervel da especificidade e
vice-versa. Assim, como a escolha envolve uma deciso entre aumentar a sensi-
bilidade custa de reduo da especificidade, ou vice-versa, deve-se optar por
um ponto de corte para o qual ocorra o menor erro possvel, tanto para falsos-
-positivos quanto para falsos-negativos.
O exemplo a seguir mostra a importncia da determinao do melhor
ponto de corte. A dosagem srica do hormnio triiodotironina (T3) pelo mtodo
enzima-imuno-fluorimtrico usada para diagnosticar o hipertireoidismo,
cujo ponto de corte 200 ng/100 ml. O ideal seria que todos os indivduos com
dosagem acima deste valor fossem considerados com hipertireoidismo, e os
indivduos com dosagem abaixo fossem considerados normais (Figura 16.1A).
Contudo, na prtica clnica, podemos encontrar indivduos com sintomas
de hipertireoidismo mesmo apresentando valores de T3 dentro dos limites
da normalidade, assim como indivduos clinicamente normais, porm com
elevados nveis hormonais, existindo, portanto, uma sobreposio dos sintomas
em relao aos valores definidos para o exame (Figura 16.1B).

Testes de Rastreamento Diagnstico 147

BIOESTATISTICA_VOL02.indb 147 25/06/12 17:21



A B

200 200
T3 (ng/100ml) T3 (ng/100ml)

Fig. 16.1 Distribuio dos valores sricos da triiodotironina (T3) em indivduos normais
e com hipertireoidismo. A Distribuio ideal em relao ao ponto de corte. B Sobreposio
de sintomas em relao aos valores hormonais

De qualquer maneira, a critrio do pesquisador, o ponto de corte para um


determinado exame poder ser modificado para mais ou para menos, de modo a
torn-lo mais sensvel ou mais especfico. Entretanto, essa mudana acarretar
uma alterao no equilbrio (contrabalano) entre estas duas propriedades, o
que leva a uma diminuio (ou aumento) na sensibilidade ou na especificidade,
respectivamente, conforme mostrado na Figura 16.2. Assim, se um ponto de corte
mais baixo for selecionado, isso acarretar um aumento na sensibilidade do teste,
e todos os indivduos com hipertireoidismo sero detectados pelo exame, porm,
muitos dos indivduos normais (assintomticos) podero ser taxados como
portadores da doena (falsos-positivos). Por outro lado, se for selecionado um
ponto de corte mais elevado, isso aumentar a especificidade do teste, e todos
os indivduos sem a doena sero classificados como normais, embora muitos
pacientes com hipertireoidismo no sejam detectados pelo exame (falsos-
-negativos). As reas sombreadas na Figura 16.2 representam, respectivamente,
a taxa de erro falso-positivo para um ponto de corte reduzido (Figura 16.2A) e a
taxa de erro falso-negativo quando o ponto de corte aumentado (Figura 16.2B).
Portanto, uma questo importante que sempre deve ser considerada o
ponto de corte que positivar o teste avaliado. Como a escolha sempre envolve
a deciso entre aumentar a sensibilidade custa de reduo da sensibilidade
e vice-versa, o pesquisador deve avaliar, com muita cautela, a importncia
relativa da sensibilidade e especificidade do teste, de modo que possa estabe-

148 Bioestatstica aplicada Pesquisa Experimental

BIOESTATISTICA_VOL02.indb 148 25/06/12 17:21



A B

180 220
T3 (ng/100ml) T3 (ng/100ml)

Figura 16.2 Variaes da sensibilidade e especificidade conforme as alteraes


no ponto de corte do teste para a dosagem da triiodotironina

lecer o ponto de transio diagnstica mais adequada. Assim, como regra geral,
quando o objetivo evitar resultado falso-negativo, o ponto de corte deve buscar
o mximo de sensibilidade, e se o objetivo for evitar o resultado falso-positivo,
o ponto de corte deve objetivar o mximo de especificidade. Na prtica, o
pesquisador dever buscar um equilbrio para o ponto de corte, de maneira
que possa ajustar a sensibilidade e a especificidade do teste diagnstico, otimi-
zando tanto o erro falso-positivo quanto o falso-negativo. A Figura 16.3 mostra
o ponto de corte com o mnimo de erro para o teste de diagnstico do hiperti-
reoidismo, enquanto que a Tabela 16.3 mostra a relao entre a sensibilidade e
a especificidade para diferentes pontos de corte em relao ao teste utilizado.

200
T3 (ng/100ml)
Fig. 16.3 Ponto de corte ideal para o teste da triiodotironina

Testes de Rastreamento Diagnstico 149

BIOESTATISTICA_VOL02.indb 149 25/06/12 17:21


Tabela 16.3 Relao entre sensibilidade e especificidade (diferentes pontos de corte)

T3 Sensibilidade Especificidade
(ng/100ml) (%) (%)

150 99,2 9,7


160 97.9 17,7
170 95,8 29,4
180 92,9 43,8
190 85,1 60,9
200 69,6 77,6
210 51,2 86,8
220 28,5 95,4
230 9,1 98,6
240 2,3 100,0

Em resumo, um bom teste de rastreamento deve ter alta sensibilidade para


no perder os casos da doena presentes na populao testada, bem como alta
especificidade a fim de reduzir o nmero de pessoas com resultados falsos-
-positivos que necessitem de posterior investigao.

16.2.2 Curva ROC


Originalmente desenvolvida pela rea de engenharia eltrica, na Inglaterra,
a curva ROC (receiver operating characteristic curve) foi primeiramente
utilizada em programas para analisar a sensibilidade na deteco de sinais de
radar durante a batalha da Gr-Bretanha, na segunda Guerra Mundial. Porm,
somente a partir de 1950, o modelo foi empregado na rea da sade, inicial-
mente na rea da psicofsica e, mais recentemente, na medicina, onde tem
sido amplamente empregada no campo da epidemiologia para avaliao de
testes diagnsticos. Assim com base no modelo inicialmente desenvolvido, a
curva ROC (curva de operadores recebedores de caractersticas) um mtodo
estatstico e grfico utilizado para determinar o melhor ponto de corte de um
teste diagnstico. Neste mtodo, a relao entre a sensibilidade e a especi-
ficidade determinada pela construo de uma curva a partir dos pontos
marcados em um grfico binrio.

150 Bioestatstica aplicada Pesquisa Experimental

BIOESTATISTICA_VOL02.indb 150 25/06/12 17:21


Para construir uma curva ROC, devem-se marcar, no grfico, os pares
ordenados constitudos pelos valores da sensibilidade e da especificidade,
calculados a partir de diferentes pontos de corte determinados para o teste
diagnstico avaliado. Sobre o eixo das ordenadas (eixo y) colocam-se os valores
da sensibilidade (proporo de verdadeiros positivos) e sobre o eixo das
abscissas (eixo x) so colocados os valores do complemento da especificidade
(1 especificidade), isto , a proporo de falsos-positivos. A seguir, os pontos
so conectados entre si por uma linha, conforme demonstrado na Figura 16.4,
abaixo, que representa a curva ROC para diferentes pontos de corte da triiodo-
tironina srica.


Fig. 16.4 Curva ROC para determinar o melhor ponto de corte para os valores da dosagem
da triiodotironina, conforme mostrado na Tabela 16.3

Raciocnio para o modelo


Suponhamos que um pesquisador quisesse determinar o melhor ponto
de corte para a triiodotironina (T3) em um programa de rastreamento para o
hipertireoidismo. Inicialmente, ele deveria dosar o hormnio em uma grande
amostra representativa da populao, e, ento, executar uma avaliao clnica
(padro ouro) para definir quais os indivduos que, de fato, apresentam
a doena. Assim, cada indivduo teria um valor para a dosagem de T3 e um
diagnstico, presente ou ausente, para a doena investigada. A seguir, o

Testes de Rastreamento Diagnstico 151

BIOESTATISTICA_VOL02.indb 151 25/06/12 17:21


pesquisador deveria definir diferentes valores limtrofes (pontos de corte)
que separariam os indivduos sadios dos doentes, e, ento, verificar, com base
no diagnstico clnico, quais aqueles em que os diagnsticos laboratorial e
clnico foram coincidentes ou no. Aps esse procedimento, os valores da
sensibilidade e da especificidade do teste seriam calculados para cada um dos
diferentes pontos de corte previamente estabelecidos. Com base nas infor-
maes coletadas, uma curva ROC seria construda.
Portanto, com base neste raciocnio, se o ponto de corte para T3 fosse
estabelecido em 0,0 ng/100ml, todos os indivduos com hipertireoidismo
seriam detectados, e a sensibilidade do exame seria de 100%. Neste caso,
porm, todas as pessoas sem a doena tambm seriam detectadas como
portadoras do hipertireoidismo, o que levaria a uma taxa de erro falso-
-positivo igual a 100%, com o ponto da curva situado no canto superior
direito do grfico. Por outro lado, se fosse estabelecido para T3 um ponto de
corte muito elevado, algo em torno de 400 ng/100ml, nenhuma pessoa seria
detectada pelo exame como portadora de hipertireoidismo, pois raramente o
pesquisador encontraria algum com a dosagem hormonal acima deste valor,
logo, a sensibilidade do teste seria 0%. Nesta condio, a taxa de erros falsos-
-positivos tambm seria igual a 0%, com o ponto da curva situado no canto
inferior esquerdo do grfico. Posteriormente, o pesquisador marcaria, no
grfico, os valores da sensibilidade e da especificidade (1 especificidade)
calculados para os demais pontos de corte estabelecidos, tais como 160
ng/100ml, 170 ng/100ml, 180 ng/100ml, e assim, sucessivamente. A seguir,
os pontos seriam unidos pela linha que desenharia a curva ROC para o teste
de rastreamento em questo.
Note que, medida em que o ponto de corte se torna maior, o ponto da
curva, que corresponde sensibilidade e especificidade, desloca-se para
baixo e para a esquerda, pois o teste fica menos sensvel e mais especfico. Do
mesmo modo, se o ponto de corte diminudo, o ponto da curva deslocado
para cima e para a direita, ficando, o teste, mais sensvel e menos especfico.
Assim, quanto mais prxima a curva ROC estiver do canto superior esquerdo
do grfico, onde a taxa de verdadeiros-positivos 100% e a taxa de falsos-
-positivos 0%, mais exata ela ser, e melhor ser o poder discriminatrio do
teste diagnstico. Da mesma maneira, quanto mais distante estiver do canto

152 Bioestatstica aplicada Pesquisa Experimental

BIOESTATISTICA_VOL02.indb 152 25/06/12 17:21


superior esquerdo, at o limite mximo da diagonal do grfico, menor ser o
poder discriminatrio do teste estudado.
Em outras palavras, a curva ideal para um teste seria aquela que subiria
quase verticalmente a partir do canto inferior esquerdo e, ento, na parte
superior do grfico, mover-se-ia horizontalmente em direo ao canto
superior direito. Por outro lado, uma curva sem qualquer poder discrimina-
trio (curva ruim) seria aquela que coincidiria com a diagonal do grfico,
traada do canto inferior esquerdo at canto superior direito. Na prtica, a
curva ROC para um teste diagnstico estar sempre situada entre a curva
boa e a curva ruim, e o melhor ponto de corte seria aquele mais prximo do
canto superior esquerdo do grfico. A Figura 16.5 mostra os trs diferentes
exemplos de curva ROC.

Fig. 16.5 Exemplos de curva ROC para trs diferentes teste

vlido ressaltar que a curva ROC pode ser utilizada com o objetivo comparar
a acurcia entre dois ou mais exames diagnsticos para uma mesma doena. O
mtodo realizado pela comparao das reas localizadas sob as curvas ROC.
Assim, quanto maior for a rea, melhor ser o teste diagnstico. Porm, um teste
estatstico dever ser aplicado para decidir se as reas diferem significativa-
mente entre si. Neste caso, deve-se utilizar o teste da soma de Wilcoxon.

Testes de Rastreamento Diagnstico 153

BIOESTATISTICA_VOL02.indb 153 25/06/12 17:21


16.2.3 Acurcia e prevalncia
Outras medidas para um teste diagnstico tambm podem ser determi-
nadas a partir da tabela de contingncia 2 x 2.
Acurcia (A)
Refere-se proporo de acertos de um teste diagnstico. Ou seja, mostra
a proporo dos indivduos verdadeiros-positivos e verdadeiros-negativos em
relao a todos os resultados possveis para o teste. calculada pela seguinte
frmula:

a +d 47
64
A= , onde, para o exemplo dado: A = = 0,808 (80,7%)
a +b +c +d 800

Prevalncia (P)
Tambm chamada de probabilidade pr-teste, a prevalncia corresponde
proporo de casos da doena existentes antes da realizao do teste em
relao ao total de indivduos da populao. Isto , ela expressa a probabilidade
da doena antes do teste ser realizado. calculada pela seguinte frmula:

a +c 64
46
P= , onde, para o exemplo dado: P = = 0,580 (58,0%)
a +b +c +d 800

A acurcia do teste diagnstico utilizado depende, no apenas da sensi-


bilidade e da especificidade, mas, tambm, da prevalncia da doena na
populao na qual o mesmo est sendo utilizado. Assim, quanto mais baixa a
prevalncia da doena, mais especfico deve ser o teste de rastreamento para
que ele seja passvel de detectar os casos presentes na populao, pois, nesse
caso, um teste positivo pode refletir um resultado falso, aumentando o nmero
de casos falsos-positivos para o teste em questo. Do mesmo modo, quando
a prevalncia da doena muito alta, o teste deve ser muito sensvel, porque,
nessa situao, um teste negativo ter uma razovel probabilidade de ser falso,
o que aumentaria o nmero de falsos-negativos para o teste.
Ainda em relao prevalncia, note que a taxa calculada pela frmula
acima citada representa apenas a prevalncia determinada para a populao
em estudo, ou seja, para a qual o teste foi aplicado, no significando, portanto,

154 Bioestatstica aplicada Pesquisa Experimental

BIOESTATISTICA_VOL02.indb 154 25/06/12 17:21


que o valor seja considerado o mesmo para a prevalncia na populao em
geral, uma vez que este indicador pode apresentar grandes variaes entre
diferentes localidades, municpios, estados, pases etc.

16.3 VALORES PREDITIVOS

Ao aplicar um teste de rastreamento diagnstico, alm da sensibilidade e


da especificidade, o pesquisador tambm dever estar interessado em deter-
minar a capacidade do mesmo em fazer previses quanto s probabilidades
de um indivduo ter ou no a doena investigada. A estas probabilidades da
ocorrncia ou no da doena, calculadas a partir dos resultados de um teste
diagnstico, d-se o nome de valores preditivos, os quais so expressos como
mostrado a seguir:
Valor Preditivo Positivo (VPP)
Refere-se proporo de verdadeiros-positivos entre todos os indivduos
com resultado positivo para o teste diagnstico. Ou seja, expressa a probabi-
lidade de um paciente com o teste positivo ter, de fato, a doena. calculado
pela seguinte frmula:

a 416
VPP = , onde, para o exemplo dado: VPP = = 0,798 (79,8%)
a +b 52
21

Valor Preditivo Negativo (VPN)


Refere-se proporo de verdadeiros-negativos entre todos os indivduos
com resultado negativo para o teste diagnstico. Ou seja, expressa a probabi-
lidade de um paciente com o teste negativo no ter, de fato, a doena. calculado
pela seguinte frmula:

d 231
VPN = , onde, para o exemplo dado: VPN = = 0,828 (82,8%)
c +d 27
79

Em resumo: o VPP mostra a probabilidade de o paciente estar realmente


doente quando o resultado do teste positivo, enquanto que o VPN reflete

Testes de Rastreamento Diagnstico 155

BIOESTATISTICA_VOL02.indb 155 25/06/12 17:21


a probabilidade do paciente no estar doente quando o resultado do teste
negativo. No entanto, note que a sensibilidade e a especificidade embora repre-
sentem bons indicadores da qualidade de um teste diagnstico, na prtica,
apresentam limitaes quanto s suas aplicaes, pois pouco auxiliam no
critrio de deciso do pesquisador que, diante de um teste positivo, ainda
precisa avaliar se o indivduo tem ou no a doena investigada. Isto ocorre
porque tanto a sensibilidade quanto a especificidade so indicadores calcu-
lados a partir de uma situao em que h certeza total sobre o diagnstico, o
que, no dia-a-dia do consultrio, isto no acontece. Assim, como no se pode
depender apenas destes dois indicadores, necessrio que se calculem os
valores preditivos para o teste em anlise.
Contudo, importante ressaltar que os valores preditivos de um teste
diagnstico refletem probabilidades cujos valores esto condicionados ao
resultado do prprio teste que, na prtica, acontece primeiro. Deste modo,
como os resultados do teste dependem da prevalncia da doena na populao
estudada, a qual tambm denominada de probabilidade pr-teste, os
valores preditivos tambm variam com a prevalncia da doena na populao
estudada. Assim, como os valores preditivos estimam as probabilidades de
ter ou no a doena nos indivduos com teste positivo ou negativo, esses
estimadores so tambm chamados de probabilidade ps-teste, podendo
ser calculados para qualquer prevalncia, conforme as frmulas mostradas
no exemplo abaixo.

Exemplo: Tomando-se como referncia o exemplo anterior, cujos resultados


so mostrados na Tabela 16.2, quais os valores preditivos para o teste de rastre-
amento, supondo-se que a prevalncia de gravidez na populao igual a 5%?

Valor Preditivo Positivo

S xP
VPP =
(S x P ) + (1 E ) x (1 P )

0,897 x 0,05 0,0449


VPP = = = 0,131 (13,1%)
(0,897 x 0,05) + (1 0,687) x (1 0,05) 0,3423

156 Bioestatstica aplicada Pesquisa Experimental

BIOESTATISTICA_VOL02.indb 156 25/06/12 17:21


Valor Preditivo Negativo
E x (1 P )
VPN =
(1 S ) x P + E x (1 P )

0,687 x (1 0,05) 0,6527


VPN = = = 0, 992 (99,2%)
(1 0,897) x 0,05 + 0,687 x (1 0,05) 0,6579

Observe que se a prevalncia da doena na populao for muito baixa, o


valor preditivo positivo tambm ser baixo, mesmo que a sensibilidade e a
especificidade do teste sejam altas. Assim, ao escolher um teste de rastrea-
mento diagnstico, o investigador dever considerar os seguintes pontos:

Quanto mais sensvel for o teste diagnstico, melhor ser o seu valor pre-
ditivo negativo. Isto , maior ser a certeza de que um paciente com resul-
tado negativo no tenha a doena investigada;
Quanto mais especfico for o teste diagnstico, melhor ser o seu valor pre-
ditivo positivo. Isto , maior ser a certeza de que um paciente com resul-
tado positivo tenha a doena investigada;
Para um mesmo teste diagnstico, quanto maior for a prevalncia da do-
ena na populao estudada, maior ser o valor preditivo positivo e menor
ser o valor preditivo negativo do teste.

16.4 RAZO DE PROBABILIDADES


(VEROSSIMILHANA)

Tambm chamada de razo de verossimilhana3, a razo de probabili-


dades (likelihood ratio) constitui um mtodo alternativo para avaliar um
teste diagnstico. O mtodo expressa a razo entre a probabilidade de que um
determinado resultado de um exame ocorra nos pacientes com a doena e a
probabilidade do mesmo resultado nos pacientes sem a doena. Assim, com

3. Verossimilhana - Qualidade ou carter de verossmil. Semelhante verdade; que parece


verdadeiro (Dicionrio Aurlio).

Testes de Rastreamento Diagnstico 157

BIOESTATISTICA_VOL02.indb 157 25/06/12 17:21


base neste raciocnio, os exames positivos e negativos tm razes de probabili-
dades diferentes, as quais sero demonstradas a seguir:

Razo de Probabilidade Positiva (RV+)


Refere-se razo entre probabilidade de um teste ser positivo nos
pacientes com a doena (sensibilidade) e a probabilidade do mesmo teste
ser positivo nos pacientes sem a doena (falsos-positivos). A RV+ expressa
quantas vezes mais provvel encontrar um resultado positivo em pessoas
doentes quando comparado com pessoas no doentes. calculada pela
seguinte frmula:

S 0,897
RV + = , onde, para o exemplo dado: RV + = = 2,86
1E 1 0,687

Razo de Probabilidade Negativa (RV-)


Refere-se razo entre a probabilidade de um teste ser negativo nos
pacientes com a doena (falsos-negativos) e a probabilidade do mesmo teste
ser negativo nos pacientes sem a doena (especificidade). A RV- expressa
quantas vezes mais provvel encontrar um resultado negativo em pessoas
doentes quando comparado com pessoas no doentes. calculada pela
seguinte frmula:

1S 1 0,8
897
RV = , onde, para o exemplo dado: RV = = 0,15
E 0,687

Observando-se o resultado obtido para RV+, pode-se concluir que a chance


do teste positivo ser verdadeiro 2,8 vezes maior que a chance de ser falso.
Isto , que a chance de se encontrar um resultado positivo entre os pacientes
doentes (verdadeiros-positivos) 2,8 vezes maior que a chance de se encontrar
um resultado positivo entre os pacientes no doentes. Neste caso, um resultado
positivo ter apenas uma chance muito pequena para discriminar uma paciente
grvida de uma no grvida.
Do mesmo modo, o resultado de RV- indica que a chance do teste
negativo ser falso 0,15 (15:100) vezes maior que a chance de ser

158 Bioestatstica aplicada Pesquisa Experimental

BIOESTATISTICA_VOL02.indb 158 25/06/12 17:21


verdadeiro. Isto , que a chance de se encontrar um resultado negativo
entre os pacientes doentes 0,15 vezes maior que a de se encontrar um
resultado positivo entre os pacientes no doentes. Em outras palavras:
a chance do teste negativo ser verdadeiro 6,66 (100:15) vezes maior
do que a de ser falso. No caso em questo, um resultado negativo para o
teste ir discriminar, de forma bastante segura, as mulheres no grvidas
das grvidas.
Note que a razo de probabilidade pode ser utilizada a fim de comparar
diferentes pontos de corte para um teste de rastreamento diagnstico, e definir,
a partir dos resultados encontrados, qual aquele que melhor discrimina os
pacientes doentes dos no doentes em uma populao.

16.5 COMBINAO DE MLTIPLOS TESTES


DIAGNSTICOS

No dia-a-dia dos consultrios, o mdico, frequentemente, levado a


solicitar mais de um teste diagnstico para identificar, com segurana, uma
determinada doena. Esta opo por mltiplos testes decorrente do fato de
que, na prtica, no existe um nico teste perfeito, com 100% de sensibilidade
e especificidade, ou, se existe, este muito dispendioso ou oferece grande
risco e/ou muito desconforto ao paciente. Nestas circunstncias, a opo
mais frequente a utilizao de testes mais simples que, quando combinados,
aumentam a acurcia e a preciso diagnstica, diminuindo a ocorrncia de
resultados falso-positivos ou falso-negativos.
Desta forma, quando os resultados dos testes solicitados so coinci-
dentes, isto , todos positivos ou negativos, o processo de deciso diagnstica
quanto presena ou ausncia da doena investigada muito fcil. Contudo,
quando os resultados so discordantes, o mtodo requer um critrio mais
apurado para o processo de deciso, devendo o profissional lanar mo de
um conjunto de probabilidades associadas a cada um dos testes solicitados.
Assim, ao optar por associar os resultados de mltiplos testes, o mdico dever
decidir como solicit-los, se todos ao mesmo tempo (testes em paralelo) ou
de forma sequencial (testes em srie), com a escolha por um ou por outro

Testes de Rastreamento Diagnstico 159

BIOESTATISTICA_VOL02.indb 159 25/06/12 17:21


mtodo recaindo sobre aquela mais apropriada para a situao em anlise.
Como a forma mais simples combinar os resultados de dois testes, impor-
tante saber que, no caso de testes em paralelo, considera-se o resultado da
combinao como positiva (evidncia da doena) se um dos dois testes solici-
tados positivo. Por outro lado, no caso de testes em srie, o resultado da
combinao considerado positivo se os dois testes forem positivos quando
individualmente analisados. O mesmo raciocnio aplicado para o caso de
mais de dois testes.
A seguir, ser demonstrada a combinao de dois testes, em paralelo e em
srie, os quais sero chamados de teste A e teste B. As frmulas sero apresen-
tadas conforme o quadro de notao mostrado abaixo:

Teste em paralelo Teste em srie

TP+ - Teste em paralelo positivo. TS+ - Teste em srie positivo.


A+ - Resultado positivo para o teste A A+ - Resultado positivo para o teste A
B+ - Resultado positivo para o teste B B+ - Resultado positivo para o teste B
SP - Sensibilidade combinada em paralelo SS - Sensibilidade combinada em srie

SA - Sensibilidade para o teste A SA - Sensibilidade para o teste A

SB - Sensibilidade para o teste B SB - Sensibilidade para o teste B

EP - Especificidade combinada em paralelo ES - Especificidade combinada em srie

EA - Especificidade para o teste A EA - Especificidade para o teste A

EB - Especificidade para o teste B EB - Especificidade para o teste B

O exemplo a seguir ser utilizado para ilustrar os clculos.

Exemplo: Suponha, agora, que o mesmo laboratrio queira verificar qual a


melhor associao, se em paralelo ou em srie, entre os resultados obtidos para
o diagnstico da gravidez com o uso do teste rpido (teste A) e os resultados
obtidos pela dosagem da gonadotrofina corinica humana no sangue (teste
B). O diagnstico definitivo de gravidez foi feito pela presena de batimentos
cardacos fetais constatados na quinta semana da provvel gestao (padro
ouro). Os resultados esto expressos a seguir.

160 Bioestatstica aplicada Pesquisa Experimental

BIOESTATISTICA_VOL02.indb 160 25/06/12 17:21


Teste A: SA = 89,7% e EA = 68,7%
Teste B: SB = 96,8% e EB = 92,4%

16.5.1 Testes em paralelo


A associao de testes em paralelo deve ser utilizada pelo mdico quando
a situao requer um diagnstico rpido, como, por exemplo, nos casos de
urgncia ou emergncia, ou em outra situao, como para pacientes com difcil
acesso ao atendimento. Neste caso, a interao entre os testes A e B pode ser
representada da seguinte maneira:

TP + = A+ B +

Sensibilidade Combinada (SP)


Admitindo-se que os resultados dos dois testes so conhecidos, a sensi-
bilidade combinada em paralelo pode ser calculada pela aplicao das regras
para o clculo de probabilidades para a unio de dois eventos independentes.
A frmula a seguinte:

SP = S A + SB (S A SB )

SP = 0,897 + 0, 968 (0,897 0,968)

SP = 0, 997 (99,7%)

Especificidade Combinada (EP)


Admitindo que o resultado negativo do teste em paralelo somente ser
considerado se ambos os testes apresentarem resultados negativos, a especifi-
cidade combinada pode ser calculada, utilizando-se as regras para o clculo da
probabilidade condicional. A frmula a seguinte:

EP = E A EB

E P = 0,687 0, 924

E P = 0,635 (63,5%)

Testes de Rastreamento Diagnstico 161

BIOESTATISTICA_VOL02.indb 161 25/06/12 17:21


Valores Preditivos
A partir da sensibilidade e da especificidade combinadas, os valores
preditivos positivo (VPPP) e negativo (VPNP) para o teste em paralelo podem
ser calculados. Para tal, utiliza-se a prevalncia da doena na populao em
estudo. No caso em questo, P = 5%. As frmulas e os respectivos clculos so
mostrados a seguir.

SP P
VPPP =
(SP P ) + (1 E P ) (1 P )

0, 997 0,05
VPPP =
(0, 997 0,05) + (1 0,635) (1 0,05)

0,0499
VPPP = = 0,126 (12,6%)
0,3967

E P (1 P )
VPN P =
(1 SP ) P + E P (1 P )

0,635 (1 0,05)
VPN P =
(1 0, 997) 0,05 + 0,635 (1 0,05)

0,6033
VPN P = = 0, 999 (99,9%)
0,6034

Os valores da sensibilidade e da especificidade para cada um dos testes A


e B, individualmente e combinados em paralelo, assim como os resultados dos
valores preditivos (VPP e VPN), para uma prevalncia de 5%, so mostrados na
Tabela 16.4, a seguir.

162 Bioestatstica aplicada Pesquisa Experimental

BIOESTATISTICA_VOL02.indb 162 25/06/12 17:21


Tabela 16.4 Sensibilidade, Especificidade e Valores Preditivos Positivo e Negativo
para os testes A e B, individuais e combinados em paralelo

Testes S (%) E (%) VPP (%) VPN (%)


Teste A 89,7 68,7 13,1 99,2
Teste B 96,8 92,4 40,9 99,9
Teste A U B 99,7 63,5 12,6 99,8

Observando-se os valores da Tabela 16.4, pode-se constatar que para uma


mesma prevalncia, o uso dos testes em paralelo aumentou a sensibilidade e
o valor preditivo negativo, enquanto que a especificidade e o valor preditivo
positivo diminuram.

16.5.2 Testes em srie


A associao de testes em srie deve ser utilizada pelo mdico quando a
situao no requer um diagnstico rpido, de urgncia, como nos casos de
pacientes ambulatoriais que podem ser acompanhados por um tempo mais
prolongado, ou naqueles internados para investigao diagnstica. Tambm
pode ser utilizada nos casos em que os exames so muito dispendiosos ou
oferecem risco ao paciente. Neste caso, o mdico deve inicialmente optar por
exames mais seguros e de baixo custo, ficando a solicitao dos exames de
maior risco ou mais caros somente quando ele necessite confirmar a presena
da doena, caso o primeiro exame seja sugestivo. Assim, como regra geral, o
segundo exame somente ser solicitado se o primeiro apresentar um resultado
positivo, pois se for negativo, no justificada a realizao do segundo exame.
Lembre-se que o teste em srie somente ser considerado positivo se o segundo
teste tambm for positivo. A interao entre os testes A e B pode ser repre-
sentada da seguinte maneira:

TS + = A+ B +

Sensibilidade Combinada (SS)


Admitindo-se que os resultados dos dois testes so conhecidos, a sensi-
bilidade combinada em srie pode ser calculada pela aplicao das regras do

Testes de Rastreamento Diagnstico 163

BIOESTATISTICA_VOL02.indb 163 25/06/12 17:21


clculo de probabilidades para a interseo de dois eventos independentes. A
frmula a seguinte:

SS = S A SB

SS = 0,897 0, 968

SS = 0,868 (86,8%)

Especificidade Combinada (ES)


Considerando-se as regras para o clculo da probabilidade condicional, a
especificidade combinada pode ser calculada pela seguinte frmula:

E S = E A + E B (E A E B )

E S = 0,687 + 0, 924 (0,687 0, 924))

E S = 0, 976 (97,6%)

Valores Preditivos
A partir da sensibilidade e da especificidade combinadas, os valores
preditivos positivo (VPPS) e negativo (VPNS) para o teste em srie podem
ser calculados. Para tal, utiliza-se a prevalncia da doena na populao em
estudo. No caso em questo, P = 5%. As frmulas e os respectivos clculos so
mostrados a seguir.

SS P
VPPS =
(SS P ) + (1 E S ) (1 P )

0,868 0,05
VPPS =
(0,868 0,05) + (1 0, 976) (1 0,05)

0,0434
VPPS = = 0,678 (67,8%)
0,0640

164 Bioestatstica aplicada Pesquisa Experimental

BIOESTATISTICA_VOL02.indb 164 25/06/12 17:21


E S (1 P )
VPN S =
(1 SS ) P + E S (1 P )

0, 976 (1 0,05)
VPN S =
(1 0,868) 0,05 + 0, 976 (1 0,05)

0, 9272
VPN S = = 0, 993 (99,3%)
0, 9335

Os valores da sensibilidade e da especificidade para cada um dos testes


A e B, individualmente e combinados em srie, assim como os resultados dos
valores preditivos (VPP e VPN), para uma prevalncia de 5%, so mostrados na
Tabela 16.5, abaixo.

Tabela 16.5 Sensibilidade, Especificidade e Valores Preditivos Positivo e Negativo para os


testes A e B, individuais e combinados em srie

Testes S (%) E (%) VPP (%) VPN (%)


Teste A 89,7 68,7 13,1 99,2
Teste B 96,8 92,4 40,9 99,9
Teste A B 86,8 97,6 67,8 99,3

Comparando-se os valores da Tabela 16.5, pode-se constatar que para


uma mesma prevalncia, o uso dos testes em srie aumentou a especificidade
combinada e o valor preditivo positivo, enquanto que a sensibilidade e o valor
preditivo negativo diminuram.
Visto que a combinao de dois ou mais testes diagnsticos uma conduta
frequentemente adotada, o mdico, ao solicitar os exames, dever observar os
seguintes pontos:

A combinao em paralelo melhora a sensibilidade diagnstica, mas a sua


especificidade menor que a dos testes quando analisados isoladamente;
A combinao em srie apresenta alta especificidade, ao passo que a sensi-
bilidade relativamente baixa quando comparada com a dos testes isolados;

Testes de Rastreamento Diagnstico 165

BIOESTATISTICA_VOL02.indb 165 25/06/12 17:21


Os valores preditivos negativos so bastante elevados, tanto para os tes-
tes isolados quanto para as formas combinadas em paralelo e em srie,
enquanto que os valores preditivos positivos no so to altos, com a com-
binao em srie, apresentando melhor resultado quando comparada
combinao em paralelo;
Para o clculo da sensibilidade e da especificidade, tanto para a combi-
nao em paralelo quanto em srie, pressupe-se que os testes sejam
independentes entre si, pois, caso contrrio, os valores combinados da
sensibilidade e da especificidade tendero a superestimar o verdadeiro
valor do parmetro.

16.6 TEOREMA DE BAYES

Como citado anteriormente, todas as vezes que o mdico recebe o resultado


de um exame diagnstico, ele se depara com duas importantes questes as
quais devem ser bem definidas: se o resultado for positivo, qual a probabi-
lidade de que o paciente tenha a doena? Ou, se o resultado for negativo, qual a
probabilidade de que esse paciente no tenha a doena? Um mtodo alternativo
para responder tais questes envolve a utilizao de uma frmula matemtica
conhecida como teorema de Bayes4, um corolrio5 do teorema da probabilidade
total que permite calcular o valor preditivo positivo de um teste diagnstico, ou
a chance de que um paciente com resultado positivo tenha, de fato, a doena. A
frmula do teorema de Bayes a seguinte:

P(T + | D + )P(D + )
P(D + |T + ) =
P (T + | D + )P (D + ) + P (T + | D )P(D )

Onde: P = Probabilidade que um determinado evento acontea.

4. Thomas Bayes (1702-1761) - Matemtico ingls e pastor presbiteriano, conhecido por ter
formulado o caso especial do teorema de Bayes, o qual deu origem estatstica bayesiana.
5. Proposio que imediatamente se deduz de outra que pode ser demonstrada a partir de um
teorema, o qual uma afirmao que pode ser provada.

166 Bioestatstica aplicada Pesquisa Experimental

BIOESTATISTICA_VOL02.indb 166 25/06/12 17:21


P(D+|T+) = Probabilidade que a doena esteja presente, sendo o
teste positivo.
D+ - O paciente tem a doena.
D- - O paciente no tem a doena.
T+ - Teste diagnstico positivo para a doena.
T- - Teste diagnstico negativo para a doena.

A referida frmula, na verdade, refere-se quela utilizada para calcular


o valor preditivo positivo, citada anteriormente. Ou seja, ela mostra a proba-
bilidade da ocorrncia da doena, na presena de um teste positivo. Observe
que as duas probabilidades expressas no numerador da equao do teorema
de Bayes correspondem, respectivamente, probabilidade de que o exame
seja positivo, considerando que a doena est presente (sensibilidade); e
a probabilidade anterior de que o paciente tenha a doena (prevalncia).
Essas duas probabilidades, em conjunto, descrevem os resultados verda-
deiro-positivos para o teste.
J o denominador da equao expressa duas probabilidades: a primeira,
que igual ao numerador, descreve os resultados verdadeiro-positivos (sensi-
bilidade x prevalncia), enquanto que a segunda representa a probabilidade
do teste ser positivo, tendo em vista que a doena est ausente, multiplicado
pela probabilidade de que a doena no esteja presente. Nessa segunda parte
do denominador, o primeiro termo representa a taxa de erro falso-positivo,
enquanto o segundo representa 1 menos a probabilidade de que a doena
esteja presente (1 - prevalncia). Assim, podemos reescrever o teorema de
Bayes considerando a sensibilidade e especificidade para o teste em questo,
tornando-o mais compreensvel ao leitor, tal como mostrado a seguir:

(Sensibilidade)(Prevalncia)
P(D + |T + ) =
(Sensibilid
dade )(Prevalncia) + (Taxa de erro falso-positivo)(1 Prevalncia)

Portanto, como foi relatado anteriormente, se a prevalncia da doena na


populao for muito baixa, o valor preditivo positivo tambm ser baixo, mesmo
que a sensibilidade e a especificidade do teste sejam altas. Neste caso, a maioria
dos resultados positivos encontrados para a doena em questo podem ser

Testes de Rastreamento Diagnstico 167

BIOESTATISTICA_VOL02.indb 167 25/06/12 17:21


falso-positivos. Embora isto no invalide o programa de rastreamento, outras
providncias podem ser tomadas no sentido de ajustar a sensibilidade e a especi-
ficidade para o teste, de maneira que melhore o valor preditivo positivo e diminua
a taxa de erro falso-positivo. Esta melhora pode ser conseguida pela aplicao do
teorema de Bayes em diferentes pontos de corte para o teste utilizado.
Assim, suponha que um programa de rastreamento foi implantado para
detectar uma determinada doena cuja prevalncia na populao igual a 5%.
O teste diagnstico empregado apresenta uma sensibilidade de 89,7% e uma
especificidade de 68,7%, com uma taxa de erro falso-positivo igual a 31,3%.
Se a sensibilidade e a especificidade do teste em questo e a prevalncia da
doena na populao so conhecidas, o teorema de Bayes pode ser utilizado
para predizer que proporo de pessoas com resultado positivo para o teste
est realmente doente.
Dados: S = 89,7%; P = 0,05%; EFP = 31,3

(0,897)(0,05)
P(D + |T + ) =
(0,897)(0,05) + (0,313)(1 0,05)

0,0449
P (D + |T + ) = = 0,131 (13,1%
%)
0,3423

Portanto, se o teste empregado tem uma sensibilidade de 89,7% e uma


especificidade de 68,7%, e se a prevalncia da doena na populao estudada
igual a 5%, pode-se prever que, apenas 13,1% das pessoas com teste positivo
esto realmente doentes.
Observe que uma frmula para o teorema de Bayes, semelhante primeira,
pode ser utilizada para prever o valor de um resultado negativo. A frmula a
seguinte:

P(T | D )(P(D )
P(D |T ) =
P (T | D )(P (D ) + P (T | D + )(P(D + )

Quando escrita em termos de sensibilidade, especificidade e prevalncia,


assume a seguinte forma:

168 Bioestatstica aplicada Pesquisa Experimental

BIOESTATISTICA_VOL02.indb 168 25/06/12 17:21


(Especificidade)(1 Prevalncia)
P(D |T ) =
(Especificidade)(1 Prevalncia) + (Taxa de erro falso-negativo)(Prevalncia)

De qualquer forma, ao solicitar um teste de rastreamento diagnstico, o


mdico deve sempre atentar para trs pontos que so muito importantes:

Para excluir a possibilidade de uma determinada doena, ele precisa da


certeza de que um resultado negativo para o teste , de fato, negativo, isto
, que o resultado no seja um falso-negativo. Para tal deciso, a escolha de
um teste de alta sensibilidade a melhor opo, pois o aumento da sensi-
bilidade reduz o nmero de falso-negativos e ajuda a excluir a doena se o
resultado do teste for negativo;
Para detectar a presena de uma doena, ele precisa da certeza de que um
resultado positivo para o teste , de fato, positivo, isto , que o resultado
no seja um falso-positivo. Para tal deciso, a escolha dever recair sobre
um teste de alta especificidade, pois o aumento da especificidade reduz o
nmero de falso-positivos e ajuda a detectar a doena se o resultado for
positivo;
Para confirmar o diagnstico, o mdico precisa conhecer a importncia da
prevalncia da doena (probabilidade anterior). Se a prevalncia for ex-
tremamente baixa, um resultado positivo tem pouco significado e deve ser
seguido de um exame de alta especificidade, ao passo que a importncia
de um resultado negativo depender da sensibilidade do exame solicitado.

Testes de Rastreamento Diagnstico 169

BIOESTATISTICA_VOL02.indb 169 25/06/12 17:21


BIOESTATISTICA_VOL02.indb 170 25/06/12 17:21
17
Testes para Variveis Ordinais

Como citado nos captulos anteriores, as tcnicas estatsticas classicamente


utilizadas para a estimao de parmetros e testes de hipteses compreendem
os chamados testes paramtricos, cujos modelos mais utilizados so o teste
t de Student e a anlise de varincia (ANOVA), os quais pressupem que a
varivel estudada seja medida numa escala dimensional contnua e apresente,
a princpio, uma distribuio normal e varincias iguais (homocedasticidade)
entre os grupos estudados. Porm, na prtica, em muitas pesquisas os dados
no obedecem a estes princpios, pois se apresentam distribudos em uma
escala ordinal de valores ou sem nenhuma distribuio previsvel, violando,
portanto, os pressupostos bsicos necessrios para a utilizao de um teste
paramtrico. Nestes casos, a opo pela utilizao de testes no-param-
tricos, os quais no exigem a estimao da varincia, da mdia populacional
ou da distribuio da varivel estudada, alm de outros pr-requisitos, embora
apresentem menor robustez quando comparados aos testes paramtricos.
Assim, em razo de sua pouca exigncia, estes testes so chamados de testes
de distribuio livre, entre os quais se destaca o teste do qui-quadrado, o qual
j foi abordado no captulo 14 deste livro. Aqui, neste captulo, sero discutidos
outros testes no-paramtricos bivariados para dados ordinais, os quais sero
descritos a seguir.

BIOESTATISTICA_VOL02.indb 171 25/06/12 17:21


17.1 TESTE U DE WILCOXON-MANN-WHITNEY
(WMW)

Tambm chamado de teste da soma de postos (Wilcoxon rank-sum


test), na estatstica inferencial o teste U de Wilcoxon-Mann-Whitney um
dos mais conhecidos entre todos os testes de significncia no-param-
tricos, sendo utilizado para comparar se duas amostras independentes e
de tamanhos iguais provm de uma mesma populao. O teste foi inicial-
mente proposto por Frank Wilcoxon1, em 1945, como uma alternativa para
o teste t de Student para amostras independentes. Posteriormente, foi
aperfeioado por H. B. Mann 2 e D. R. Whitney, da a origem do nome e a sigla
WMW, que o generalizaram para que pudesse ser aplicado em amostras de
tamanhos diferentes,
Para que o teste possa ser utilizado, necessrio que as duas amostras
sejam aleatrias e as observaes independentes, tanto dentro de cada
amostra como entre as amostras estudadas, ao mesmo tempo em que a
varivel considerada seja mensurada em escala ordinal, isto , que seja
apresentada do menor para o maior valor. Para tal, necessrio que cada
valor da mostra corresponda a um posto (escore ou rank), o qual deve ser
representado por um nmero natural que indicar sua posio no conjunto
de dados amostrais, quando ordenados. Assim, o menor valor da amostra
receber o posto de nmero 1, e assim sucessivamente, at que o maior valor
receba o posto de maior nmero. Quando ocorre a presena de valores iguais
na amostra, considera-se a mdia dos postos que seriam ocupados por eles,
de tal modo que no afete o posto seguinte. Tome-se, como exemplo, um
conjunto de seis valores j ordenados: {9; 15; 17; 17; 21; 23}. Os respectivos
postos sero: {1; 2; 3,5; 3,5; 5; 6}.

1 Frank Wilcoxon (1892-1965) Qumico e estatstico irlands que publicou mais de 70 trabalhos,
dos quais o mais conhecido descreve dois novos testes estatsticos: o teste da soma de Wilcoxon
e o teste de Wilcoxon.
2 Henry Berthold Mann (1905-2000) Renomado matemtico austraco responsvel por
significativas contribuies no campo da lgebra, da teoria dos nmeros e da estatstica,
particularmente na anlise de varincia.

172 Bioestatstica aplicada Pesquisa Experimental

BIOESTATISTICA_VOL02.indb 172 25/06/12 17:21


Raciocnio do teste
Para ilustrar o raciocnio, consideremos a comparao entre duas amostras,
A e B. Se os valores para os indivduos da amostra A forem, em geral, menores
que os valores para os indivduos da amostra B, quando se ordenam, do menor
para o maior, todos os valores das duas amostras consideradas conjuntamente,
os postos ocupados pelos indivduos da amostra A sero, em geral, menores do
que os postos ocupados pelos indivduos da amostra B. Como consequncia,
o posto mdio (mediana) da amostra A ser menor do que o posto mdio
(mediana) da amostra B. Neste caso, se a diferena encontrada for grande o
suficiente para que possa ser explicada alm do que se esperaria encontrar
somente pelo acaso, a diferena entre os dois postos mdios dita estatistica-
mente significativa, o que indica que a populao A diferente da populao B.
O teste envolve o clculo de um valor estatstico, usualmente chamado de
valor U, cuja distribuio testada contra a hiptese de nulidade. No caso de
pequenas amostras, isto , nenhuma delas maior do que 20 indivduos, a distri-
buio pode ser tabulada, mas para grandes amostras, das quais ao menos uma
delas maior que 20, existe uma boa aproximao com a distribuio normal.
Assim, importa saber que os procedimentos para a utilizao do teste U de
Wilcoxon-Mann-Whitney diferem de acordo com o tamanho amostral, todos
facilmente calculados. Os procedimentos sero mostrados a seguir:

Inicialmente, denomina-se a amostra menor como amostra 1 e a maior


como amostra 2;
Determinam-se os tamanhos amostrais, os quais so designados por n1 e n2;
A seguir, ordenam-se, do menor para o maior, os valores das duas amostras
e anota-se, ao lado de cada valor, o nmero de ordem (ou posto) correspon-
dente. No esquea que quando houver empate, o posto para cada valor
empatado corresponde mdia dos postos que seriam ocupados por eles;
Obtm-se os valores para R1 e R2 que correspondem s somas dos postos
para as amostras 1 e 2, respectivamente. Se a ordenao estiver correta,
teremos:

N (N + 1)
R1 + R2 = ; para N = n1 + n2
2

Testes Para Variveis Ordinais 173

BIOESTATISTICA_VOL02.indb 173 25/06/12 17:21


Em seguida, calculam-se os valores de U1 e U2 conforme mostrado abaixo.
Para o teste de hiptese, o menor destes dois valores ser denominado
como U calculado (Ucalc), o qual ser comparado ao valor crtico U tabelado
( U a;n ;n ), encontrado na tabela de valores crticos da distribuio U de
1 2
Mann-Whitney (ver tabelas dos valores crticos no final deste livro).

n1 (n1 + 1)
U 1 = n1n2 + R1
2

n2(n2 + 1)
U 2 = n1n2 + R2 ou U 2 = n1n2 U 1
2

Finalmente, o teste de hiptese realizado conforme mostrado abaixo:


H0: as duas populaes no diferem entre si quanto locao;
HA: as duas populaes diferem entre si quanto locao.

Para demonstrar a aplicao do teste de WMW, utilizaremos o seguinte exemplo:

Exemplo: A Escala de coma de Glasgow (ECG) uma escala neurolgica


que constitui um mtodo confivel para avaliar o nvel de conscincia de uma
pessoa, aps um traumatismo cranienceflico. Ela compreende trs testes que
avaliam a abertura ocular, a resposta verbal e a melhor resposta motora, cujos
escores obtidos variam de trs a 15 pontos. Quanto menor o escore, mais grave
o comprometimento da funo cerebral. Um pesquisador, que queria verificar
se o uso de capacete diminui a gravidade da leso craniana em motociclistas
acidentados, comparou os escores obtidos em dois grupos de pacientes, com e
sem uso de capacete. Os escores (j ordenados) so apresentados nas tabelas
17.1 e 17.2, abaixo.

Tabela 17.1 Ordem, escore da escala de coma de Glasgow e posto de cada um dos 18
pacientes do estudo
Paciente 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18

Escore 5 6 6 7 7 8 8 8 8 9 9 10 10 11 12 13 14 14

Posto 1 2,5 4,5 7,5 10,5 12,5 14 15 16 17,5

174 Bioestatstica aplicada Pesquisa Experimental

BIOESTATISTICA_VOL02.indb 174 25/06/12 17:21


Tabela 17.2 Ordem, escore da escala de coma de Glasgow e posto de 10 pacientes com uso
de capacete e 8 pacientes sem uso de capacete
Pacientes com capacete Pacientes sem capacete
Paciente Escore Posto Paciente Escore Posto
5 7 4,5 1 5 1
6 8 7,5 2 6 2,5
7 8 7,5 3 6 2,5
11 9 10,5 4 7 4,5
13 10 12,5 8 8 7,5
14 11 14 9 8 7,5
15 12 15 10 9 10,5
16 13 16 12 10 12,5
17 14 17,5
18 14 17,5
n2 = 10 md = 10,5 R2 = 122,5 n1 = 8 md = 7,5 R1 = 48,5

Uma vez que no existe um padro de distribuio para a escala de coma de


Glasgow na populao estudada, e o nmero de indivduos nas duas amostras
pequeno, a melhor maneira de compar-las utilizar um teste no-param-
trico. Neste caso, o teste WMW o mais adequado, pois as duas amostras so
independentes e a varivel estudada do tipo ordinal.

WMW para pequenas amostras (n 20)


Passo 1 Formular as hipteses estatsticas:
H 0 :U 1 = U 2 (As duas populaes no diferem entre si quanto aos escores
da escala de coma de Glasgow, com e sem uso do capacete).
H A :U 1 U 2 (As duas populaes diferem entre si quanto aos escores da
escala de coma de Glasgow, com e sem uso do capacete).
Passo 2 Escolher o nvel de significncia (nvel alfa):
= 0,05 (5%)
Passo 3 Calcular os valores para U1 e U2:
8(8 + 1) 10 + 1)
10(1
U 1 = 8 10 + 48,5 = 67,5 e U 2 = 8 10 + 122,5 = 12,5
2 2

Testes Para Variveis Ordinais 175

BIOESTATISTICA_VOL02.indb 175 25/06/12 17:21


N (N + 1) 18(18 + 1)
Sendo R1 + R2 = ; ento (48,5 + 122,5) = 171 =
2 2

A ordenao est correta.

Como U calc = mn{U 1 ;U 2 }; tem-se que: U calc = 12,5

Passo 4 Determinar o valor crtico do teste:


U ;n = U 0,05;8;10 = 17
1 ;n2

Passo 5 Regra de deciso:

Se Ucalc U 0,05;8;10 , rejeita-se H 0 .

Se U calc > U 0,05;8;10 , aceita-se H 0 .

Como U calc = 12,5 < U 0,05;8;10 = 17, rejeita-se H 0 .

Passo 6 Concluso:
Como o valor para U calc menor que o valor crtico tabelado U 0,05;8;10 ,
rejeita-se H0 e conclui-se que os escores da escala de coma de Glasgow
observados para os pacientes que usavam capacete so significativa-
mente maiores que escores dos pacientes que no usavam capacete.
Portanto, o uso do capacete diminuiu a gravidade da leso, pois
U calc = 12,5; P = 0,0145 .

WMW para grandes amostras (n > 20)


Quando a maior das duas amostras apresenta mais de 20 observaes
(n2 > 20), a estatstica U aproxima-se da distribuio normal gaussiana, cuja
significncia estatstica verificada na tabela dos valores crticos da distri-
buio z. O valor de zcalc dado por:

U U
zcalc = , onde:
U

176 Bioestatstica aplicada Pesquisa Experimental

BIOESTATISTICA_VOL02.indb 176 25/06/12 17:21


onde:
 U- Mdia de U. Tanto U1 como U2 podem ser utilizados para o
clculo de zcalc.
aU - Desvio padro de U.

n1n2 n1n2(n1 + n2 + 1)
Sendo U = e U = , ento:
2 12

n1n2
U
ento: zcalc = 2
n1n2(n1 + n2 + 1)
12

Assim, supondo-se n > 20 para o exemplo mostrado na Tabela 17.2, temos:

Passo 1 Formular as hipteses estatsticas:


H 0 :U 1 = U 2 (As duas populaes no diferem entre si quanto aos escores
da escala de coma de Glasgow, com e sem uso do capacete).
H A :U 1 U 2 (As duas populaes diferem entre si quanto aos escores da
escala de coma de Glasgow, com e sem uso do capacete).
Passo 2 Escolher o nvel de significncia (nvel alfa):
= 0,05 (5%)
Passo 3 Determinar o valor crtico do teste:
z 0,05 = 1, 96
Passo 4 Calcular o valor do teste:
n1n2
U
2 12,5 40 196
zcalc = = = = 2, 44
n1n2(n1 + n2 + 1) 11,25 39
12

Passo 5 Regra de deciso:

Se |zcalc | < z0,05 , aceita-se H 0 .

Se |zcalc | z 0,05 , rejeita-se H 0 .

Como |zcalc |= 2,44 > z 0,05 = 1, 96, rejeita-se H 0 .


Testes Para Variveis Ordinais 177

BIOESTATISTICA_VOL02.indb 177 25/06/12 17:22


Se |zcalc | < z0,05 , aceita-se H 0 .

Se |zcalc | z 0,05 , rejeita-se H 0 .

Como |zcalc |= 2,44 > z 0,05 = 1, 96, rejeita-se H 0 .

Passo 6 Concluso:
Como o valor para zcalc maior que o valor crtico tabelado z 0,05 , rejeita-
-se H0 e conclui-se que os escores da escala de coma de Glasgow observados
para os pacientes que usavam capacete so significativamente maiores do que
os escores dos pacientes que no usavam capacete. Portanto, o uso do capacete
diminuiu a gravidade da leso, pois zcalc = 2, 44; P = 0,0145 .

Quando n2 > 20 e ocorrerem empates, o denominador de zcalc deve ser


substitudo por:

nn N 3 N CE
U = 1 2 , onde: CE = (t 3 t )
N2 N 12

Sendo t o nmero de observaes empatadas em cada posto. Por exemplo:


se hover dois empates com o posto 2,5 e outros quatro empates com o posto
7,5, o clculo para CE ser:

CE = (23 2) + (43 4) = 66

17.2 TESTE T DE WILCOXON

um teste de hiptese no-paramtrico utilizado para amostras pareadas,


isto , para comparar dois tratamentos em duas amostras relacionadas
(amostras pareadas) ou para comparar os resultados de uma mesma medida
quando esta repetida em uma mesma amostra (teste pareado). Este teste
pode ser usado como uma alternativa ao teste t de Student pareado quando
a populao estudada no assume o padro da distribuio normal gaussiana,
sendo a varivel medida em uma escala intervalar ou ordinal.

178 Bioestatstica aplicada Pesquisa Experimental

BIOESTATISTICA_VOL02.indb 178 25/06/12 17:22


Tal como o teste WMW, a prova de Wilcoxon (signed-rank test) tambm
foi idealizada por Frank Wilcoxon em 1945 e tem como princpio ordenar os
postos das diferenas intrapares, com nfase para a maior diferena, para a
qual se atribui o maior valor (posto), diminuindo-se este valor de acordo com
as menores diferenas encontradas. Para a utilizao do teste, pressupe-se que
as duas amostras sejam aleatrias e que as diferenas intrapares constituem
uma varivel contnua, de distribuio simtrica em torno da mediana.

Raciocnio do teste
Para ilustrar o raciocnio, consideremos a comparao entre duas
amostras, A e B. Se o tratamento para A produz valores maiores que aqueles
encontrados para o tratamento B, as diferenas entre os pares de A e B (A B),
de sinal positivo, sero em maior nmero e graus do que as diferenas de sinal
negativo. Caso ambos os tratamentos tenham o mesmo efeito, as diferenas
positivas e negativas devem se anular. Assim, se a diferena encontrada for
grande o suficiente para que possa ser explicada alm do que se esperaria
encontrar somente pelo acaso, a diferena entre os dois postos mdios dita
estatisticamente significativa, o que indica que a populao A diferente da
populao B.
O teste envolve o clculo de um valor estatstico usualmente chamado
de valor T, cuja distribuio testada contra a hiptese de nulidade. No caso
de pequenas amostras (n 25), o valor T deve ser comparado ao valor crtico
encontrado na tabela de valores crticos da distribuio T de Wilcoxon, que
consta no final deste livro, mas para grandes amostras (n > 25), a distribuio
da estatstica T aproxima-se da distribuio normal gaussiana e o teste de
significncia pode ser realizado, usando-se essa distribuio. Na prtica, como
a tabela da distribuio T de Wilcoxon possui valores crticos para amostras
com at 100 diferenas intrapares, somente ser necessrio calcular o valor
z quando o tamanho amostral for superior a este nmero. Os procedimentos
sero mostrados a seguir:
Inicialmente, calcula-se a diferena (d) em cada um dos pares, conser-
vando-se o sinal da diferena. As diferenas iguais a zero so desprezadas.
Assim, como se pressupe que as diferenas constituem uma varivel
contnua, poucos zeros devem aparecer nos clculos dessas diferenas;

Testes Para Variveis Ordinais 179

BIOESTATISTICA_VOL02.indb 179 25/06/12 17:22


As diferenas restantes so designadas por n;
A seguir, ordenam-se, do menor para o maior, os valores das diferenas,
ignorando-se o sinal. No esquea que, quando houver empate, o posto
para cada valor empatado corresponde mdia dos postos que seriam
ocupados por eles. Se a ordenao estiver correta, teremos:

n(n + 1)
| postos | = 2

Transfere-se o sinal da diferena ao posto correspondente e somam-se


os postos conforme o sinal seja positivo ou negativo. Denomina-se T+
soma dos postos com sinal positivo e T soma dos postos com sinal
negativo. Para o teste de hiptese, o menor destes dois valores, em
valor absoluto, ser denominado como T calculado (Tcalc), o qual ser
comparado ao valor crtico T tabelado (T ;n), encontrado na tabela de
valores crticos da distribuio T de Wilcoxon (ver tabelas dos valores
crticos no final deste livro). Semelhante ao teste WMW, a hiptese nula
ser rejeitada se Tcalc T;n.
Finalmente, o teste de hiptese realizado conforme mostrado abaixo:
H0: as medidas antes e depois no diferem entre si;
HA: as medidas antes e depois diferem entre si.

Para demonstrar a aplicao do teste de T de Wilcoxon, utilizaremos o


seguinte exemplo:

Exemplo: Anlise Sensorial uma cincia que utiliza os sentidos humanos


para avaliar as caractersticas organolpticas de um alimento, constituindo
uma poderosa ferramenta frequentemente utilizada pelas indstrias alimen-
tcias para o desenvolvimento e otimizao da qualidade de seus produtos.
Uma empresa realizou uma anlise sensorial para comparar o sabor de duas
diferentes formulaes para um determinado produto. Foram realizadas duas
anlises para cada provador: a primeira, com a formulao normal; a segunda,
com a frmula modificada. Os escores, medidos de zero a 10, esto apresen-
tados na Tabela 17.3, abaixo.

180 Bioestatstica aplicada Pesquisa Experimental

BIOESTATISTICA_VOL02.indb 180 25/06/12 17:22


Tabela 17.3 - Ordem, escore e posto de 10 anlises antes e aps a modificao da formulao

Escores
Provador d=AB Posto
Antes (A) Depois (B)

1 7,40 7,10 0,3 2,5


2 9,30 8,30 1,0 8
3 6,80 7,40 0,6 6
4 7,50 8,70 1,2 9
5 8,10 9,40 1,3 10
6 8,80 9,10 0,3 2,5
7 9,20 8,40 0,8 7
8 7,20 7,60 0,4 4,5
9 7,50 7,90 0,4 4,5
10 9,40 9,20 0,2 1

mdA = 8,45 mdB = 9,25 = |55|

Teste t para pequenas amostras (n 25)

Passo 1 Formular as hipteses estatsticas:


H0: os valores dos escores no diferem nas duas formulaes;
HA: os valores dos escores so diferentes para as duas formulaes.
Passo 2 Escolher o nvel de significncia (nvel alfa):
= 0,05 (5%)
Passo 3 Calcular os valores para T+ e T:
T+ = +18,5 e T = 36,5

n(n + 1) 10(10 + 1)
Sendo | postos | = = = 55 , a ordenao est correta.
2 2

Como Tcalc = mn{TA ;TB }; tem-se que: Tcalc = | + 18,5 | = 18,5

Passo 4 Determinar o valor crtico do teste:


T ;n = T0,05;10 = 8

Testes Para Variveis Ordinais 181

BIOESTATISTICA_VOL02.indb 181 25/06/12 17:22


Passo 5 Regra de deciso:
Se Tcalc T0,05;10 , rejeita - se H 0 .

Se Tcalc > T0,05;10 , aceita - se H 0 .

Como Tcalc = 18,5 > T0,05;10 = 8, aceita - se H 0 .

Passo 6 Concluso:
Como o valor para Tcalc maior que o valor crtico tabelado T0,05;10 , se
aceita H0 e conclui-se que os escores da anlise sensorial relatados pelos
provadores para a formulao normal no diferiram dos escores relatados
para a formulao modificada. Portanto, as formulaes do produto so
equivalentes quanto ao sabor, pois Tcalc = 18,5; P = 0,386 .

Teste t para grandes amostras (n > 25)


A frmula utilizada para o teste T de Wilcoxon para grandes amostras a
seguinte:

n(n + 1)
T
4
zcalc = , onde: CE = (t 3 t )
CE
n(n + 1)(2n + 1)
2
24

Sendo t o nmero de observaes empatadas em cada posto. Por exemplo:


se hover dois empates com o posto 2,5 e outros quatro empates com o posto
7,5, o clculo para CE ser:

CE = (23 2) + (43 4) = 66

Assim, supondo-se n > 25 para o exemplo mostrado na Tabela 17.3, temos:


Passo 1 Formular as hipteses estatsticas:
HO: os valores dos escores no diferem nas duas formulaes;
HA: os valores dos escores so diferentes para as duas formulaes.

182 Bioestatstica aplicada Pesquisa Experimental

BIOESTATISTICA_VOL02.indb 182 25/06/12 17:22


Passo 2 Escolher o nvel de significncia (nvel alfa):
a = 0, 05 (5%)
Passo 3 Determinar o valor crtico do teste:
z0,05 = 1,96
Passo 4 Calcular o valor do teste:

n(n + 1) 10(10 + 1)
T 18,5
4 4 9, 0
zcalc = = = = 0, 918
CE 12 9, 8
n(n + 1)(2n + 1) 10(10 + 1)(20 + 1)
2 2
24 24

Passo 5 Regra de deciso:

Se |zcalc | < z0,05 , aceita-se H 0 .

Se |zcalc | z 0,05 , rejeita-se H 0 .

Como |zcalc |= 0,918 < z 0,05 = 1, 96, aceita-se H 0 .

Passo 6 Concluso:
Como o valor para zcalc menor que o valor crtico tabelado z 0,05 , acei-
ta-se H0 e conclui-se que os escores da anlise sensorial relatados pelos
provadores para a formulao normal no diferiram dos escores relatados
para a formulao modificada. Portanto, as formulaes do produto so
equivalentes quanto ao sabor, pois zcalc = 0, 918; P = 0,386 .

17.3 COEFICIENTE DE CORRELAO DE


SPEARMAN (TESTE rho)

Tambm chamado de coeficiente de correlao de postos de Spearman,


o teste foi inicialmente idealizado por Charles Spearman3, em 1904, e constitui

3 Charles Edward Spearman (1863-1945) - Psiclogo ingls conhecido pelo seu trabalho na rea
da estatstica, como um pioneiro da anlise fatorial e pelo coeficiente de correlao de postos
de Spearman.

Testes Para Variveis Ordinais 183

BIOESTATISTICA_VOL02.indb 183 25/06/12 17:22


uma alternativa para o teste do coeficiente produto-momento de Pearson
quando este apresenta variveis que no satisfazem as condies exigidas para
o teste, tais como a homocedasticidade e a distribuio normal.
No teste rho, para que as variveis possam ser ordenadas, necessrio que
sejam medidas em escala ordinal e, tal como no teste de Pearson, o coeficiente
de Spearman (rs) varia de +1, que indica uma correlao perfeita positiva, a 1,
uma correlao perfeita negativa. O valor 0 indica ausncia de correlao. A
interpretao semelhante ao teste de Pearson.

Raciocnio para o teste


Para calcular o valor rs, necessrio que as duas variveis supostamente
correlacionadas tenham sido medidas para cada um dos indivduos da amostra.
Deste modo, cada indivduo ter um par ordenado determinado por (x, y), sendo x
os valores da varivel tomada como preditora e y os valores da varivel resposta,
se for o caso. Note que rs indica a correlao entre postos e no entre os valores
medidos para as variveis. Assim, x e y devem ser ordenados em separado para
que seus postos possam ser comparados. Neste caso, se as variveis estiverem
correlacionadas positivamente, os postos mais baixos de x sero acompanhados
dos postos mais baixos de y, enquanto que os postos altos de x correspondero
aos postos altos de y. Por outro lado, se a correlao for negativa, os postos altos
de uma varivel estaro relacionados aos postos baixos da outra varivel e vice-
-versa. Porm, se no houver correlao entre x e y, no haver coerncia na
associao entre os postos das duas variveis estudadas, uma vez que os postos
altos de x podem corresponder a postos altos, mdios ou baixos de y, indistinta-
mente. Portanto, tem-se como hiptese nula para o teste, aquela em que os postos
de uma varivel no se alteram de igual maneira com os postos da outra varivel;
em outras palavras, enquanto os postos de uma varivel aumentam, os postos
da outra varivel podem aumentar ou diminuir sem qualquer relao entre elas.

Determinao do coeficiente de spearman (rs)


O teste envolve o clculo do valor estatstico rs, cujos procedimentos sero
mostrados a seguir:
Inicialmente, ordenam-se, do menor para o maior, os valores das duas
amostras x e y, e anota-se, ao lado de cada valor, o nmero de ordem (ou

184 Bioestatstica aplicada Pesquisa Experimental

BIOESTATISTICA_VOL02.indb 184 25/06/12 17:22


posto) correspondente. No esquea que, quando houver empate, o pos-
to para cada valor empatado corresponde mdia dos postos que seriam
ocupados por eles;
A seguir, calculam-se as diferenas (d) entre os postos de x e de y determi-
nados para cada um dos indivduos da amostra. O sinal da operao deve
ser conservado, pois o somatrio das diferenas deve ser igual a zero;
O valor de rs calculado pela seguinte frmula:

6d 2
rs = 1 , onde n o nmero de pares.
n3 n

Quando ocorrerem empates nos postos, deve-se usar a frmula corrigida,


a qual mostrada a seguir:

Ax + A y d 2 (n3 n ) (t 3 t )
rs = , onde: A x ou y =
2 Ax A y ( ) 12

Sendo t o nmero de observaes empatadas em cada posto. Por exemplo:


se hover dois empates com o posto 2,5 e outros quatro empates com o posto
7,5, o clculo para (t3 t) ser:

(t 3 t ) = (23 2) + (43 4) = 66

Para demonstrar a aplicao do teste de correlao de Spearman, utiliza-


remos o seguinte exemplo:

Exemplo: Na indstria alimentcia, a densidade aparente de um sorvete


dada pela multiplicao entre a quantidade de ar incorporado (overun), a
massa do produto e uma constante igual a 0,2. Essa medida constitui um impor-
tante parmetro de qualidade, pois sua variao influencia na relao entre
a textura e a palatibilidade do produto. Simes et al (2008) realizaram uma
anlise sensorial com 10 diferentes formulaes de um sorvete de fruta, com
o objetivo de verificar se a sua densidade aparente est relacionada ao grau de

Testes Para Variveis Ordinais 185

BIOESTATISTICA_VOL02.indb 185 25/06/12 17:22


aceitao quanto palatibilidade do mesmo. As densidades (g/L) e os respec-
tivos escores, medidos de zero a 10, esto apresentados na Tabela 17.4, abaixo.

Tabela 17.4 Variao do escore atribudo pela anlise sensorial em funo da densidade
relativa (g/L) de um tipo de sorvete de fruta

Provador Densidade Posto de Escore Posto de d d2


(x) x (y) y (x y)
01 480 1 8.1 5,5 -4.5 20,25
02 500 2 9.4 9 -7 49,00
03 520 3 9.8 10 -7 49,00
04 540 4 8.1 5,5 -1.5 2.25
05 560 5 8.8 7 -2 4,00
06 580 6 8.9 8 -2 4,00
07 600 7 7.6 3,5 3.5 12.25
08 620 8 7.6 3,5 4.5 20.25
09 640 9 7.2 1 8 64,00
10 660 10 7.4 2 8 64,00
=0 = 289

Uma vez que as duas variveis correlacionadas so medidas por postos,


o uso do coeficiente de Spearman (rs), em vez do coeficiente de correlao de
Pearson (r), justificado. Assim, para os dados do exemplo apresentado na
Tabela 17.4, o valor de rs calculado como mostrado a seguir:

6d 2 6 x 289 1.734
rs = 1 = 1 = 1 = 1 1,7515 = 0,7515
n n
3
10 10
3 990

Como apenas os postos da varivel anlise sensorial apresentam empates,


no necessria a aplicao da frmula corrigida. Assim, com base no resultado
calculado, o coeficiente de correlao de Spearman indica uma forte correlao
negativa entre a densidade aparente e o grau de aceitao quanto palatibi-
lidade do sorvete de frutas analisado, pois rs = 0,7515. No entanto, para que se
possa concluir com segurana, necessrio realizar um teste de hiptese para
verificar se essa correlao foi um achado casual ou se, de fato, ela estatistica-
mente significante. Esse procedimento ser demonstrado a seguir.

186 Bioestatstica aplicada Pesquisa Experimental

BIOESTATISTICA_VOL02.indb 186 25/06/12 17:22


Teste de hiptese para o coeficiente de spearman
O teste de hiptese realizado comparando-se o valor calculado de rs(calc)
com o valor verificado na tabela dos valores crticos para o coeficiente de corre-
lao de Spearman (ver tabela no final do livro). Nesta tabela, esto indicados
todos os valores significativos para rs(;n) conforme o nvel de significncia ()
preestabelecido e os diferentes tamanhos amostrais para n 100. Para testar
a hiptese, aplica-se o seguinte raciocnio: se o valor obtido para rs(calc) for igual
ou superior ao tabelado, a correlao estatisticamente significativa para o
nvel preestabelecido para a pesquisa, caso contrrio, aceita-se a hiptese
nula de que no h correlao entre as variveis estudadas. Assim, para o
exemplo apresentado na Tabela 17.4, o valor calculado para rs(calc) foi igual a
0,7515, enquanto que o valor tabelado para um teste bilateral, com = 0,05 e
n = 10, rs(0,05;10) = 0,648. Deste modo, o coeficiente de correlao obtido para o
teste realizado entre os valores da densidade aparente e do grau de satisfao
quanto palatibilidade do sorvete analisado estatisticamente significativo,
pois rs(calc) = 0,7515 > rs(0,05;10) = 0,648, com valor P = 0,0104.
No entanto, para valores de n maiores que 30 e menores ou iguais a 100
(30 < n 100), podemos usar tanto a tabela dos valores crticos para o coefi-
ciente de correlao de Spearman quanto um teste t, tal como foi utilizado para
avaliar a significncia do coeficiente de correlao de Pearson (ver captulo 12).
Neste caso, o valor obtido para tcalc comparado com o valor crtico da tabela t
de Student (ver tabela no final do livro), com (n 2) graus de liberdade. A regra
de deciso a mesma para o teste t: se |tcalc| for igual ou maior que o t crtico
tabelado (t;n-2), a correlao estatisticamente significativa, caso contrrio,
aceita-se que no h correlao entre as variveis estudadas. A frmula para
calcular t a seguinte:

rs
t calc =
1 rs2
n 2

Exemplo: Uma indstria de alimentos congelados realizou uma anlise


para verificar se existe uma correlao significativa entre a densidade aparente
e o tempo de derretimento de seus sorvetes de frutas. Para tal, foram selecio-

Testes Para Variveis Ordinais 187

BIOESTATISTICA_VOL02.indb 187 25/06/12 17:22


nadas 32 amostras de diferentes sabores de sorvete. Pela anlise da simetria
das variveis, verificou-se que os valores do tempo de derretimento no se
apresentavam normalmente distribudos, enquanto que, no grfico de distri-
buio conjunta (grfico de disperso), os pontos no apresentavam uma
nuvem de formato elptico. Por este motivo, a opo da anlise recaiu sobre o
coeficiente de correlao de Spearman. O valor obtido foi rs = 0,7842.

Passo 1 Formular as hipteses estatsticas:


H 0 : rs = 0 (No existe correlao entre a densidade aparente e tempo de
derretimento dos sorvetes analisados).
H A : rs 0 (A densidade aparente e o tempo de derretimento esto corre-
lacionados).
Passo 2 Escolher o nvel de significncia (nvel alfa):
= 0,01 (1%) bilateral
Passo 3 Determinar o valor crtico do teste t:
gl = n 2 = 32 2 = 30 t 0,01;30 = 2,750
Passo 4 Calcular o valor do teste t para rs = 0,7842:

rs 0,6842 0,6842
t calc = = = = 43,859
1 rs2 1 ( 0,6842) 2 0,0156
n 2 32 2

Passo 5 Regra de deciso:

Se |t calc | < t 0,01;30 , aceita-se H 0 .

Se |t calc | t 0,01;30 , rejeita-se H 0 .

Como |t calc | = 43,859 > t 0,01;30 = 2,750, rejeita-se H 0 .

Passo 6 Concluso:
Existe, portanto, uma forte evidncia de que as variveis densidade apa-
rente e tempo de derretimento estejam inversamente relacionadas, isto
, que existe uma correlao linear estatisticamente significante entre elas,
pois t calc = 43,859; gl = 30; P = 0,001 .

188 Bioestatstica aplicada Pesquisa Experimental

BIOESTATISTICA_VOL02.indb 188 25/06/12 17:22


17.4 TESTE DE CONCORDNCIA KAPPA

Tambm chamado de coeficiente kappa, o teste, inicialmente sugerido


por Jacob Cohen4, em 1960, tem a finalidade de medir o grau de concor-
dncia entre as propores encontradas para a mesma varivel mensurada
em duas diferentes ocasies. O teste baseado no nmero de resultados
concordantes, ou seja, no nmero de casos cujo resultado o mesmo entre
os avaliadores, sendo, portanto, uma medida interobservador, que mede
o grau de concordncia alm do esperado to somente pelo acaso. Esse
teste, que pressupe que as variveis sejam medidas em escala dicotmica,
tem o valor mximo igual a 1, que representa total concordncia entre os
tratamentos, ao passo que os valores prximos ou abaixo de zero indicam
ausncia de concordncia, ou que a concordncia ocorreu em razo do
acaso. Por outro lado, um valor de kappa eventualmente menor que zero
sugere que a concordncia encontrada foi menor do que aquela que seria
esperada somente por acaso, isto , que existe discordncia entre os trata-
mentos, embora este valor no tenha interpretao como intensidade de
discordncia. Em outras palavras, testa-se a reprodutibilidade dos resul-
tados, admitindo-se que haver concordncia entre eles em relao s
propores medidas nas duas ocasies consideradas.
Neste teste, os dados devem ser introduzidos em uma tabela de contin-
gncia conforme mostrado abaixo:

Tabela 17.5 Tabela de contingncia para a concordncia entre os diagnsticos de dois


diferentes avaliadores

Avaliador 1
Presente (+) Ausente () Total
Presente (+) a (++) b (+) n1 = a + b
Avaliador 2
Ausente () c (+) d () n2 = c + d
Total m1 = a + c m2 = b + d n

4. Jacob Cohen (1923-1998) Psiclogo e estatstico americano melhor conhecido pelo seu
trabalho sobre poder estatstico e medidas de efeito de tratamento.

Testes Para Variveis Ordinais 189

BIOESTATISTICA_VOL02.indb 189 25/06/12 17:22


O clculo do coeficiente de kappa toma como base a relao entre a
proporo de concordncia observada (po) e a proporo da concordncia
esperada (pe), conforme as frmulas mostradas abaixo:

po pe a +d n .m + n .m
kappa = , onde: po = e pe = 1 1 2 2
1 pe n n2

Um teste deve ser realizado para avaliar a significncia estatstica do


valor calculado para Kappa, cuja hiptese nula a ser testada aquela que
indicaria uma ausncia de concordncia entre os observadores (kappa = 0).
No caso de rejeio da hiptese nula (kappa > 0), h a indicao de que existe
alguma concordncia entre os observadores, sem, no entanto, significar neces-
sariamente que a concordncia seja alta, cabendo ao pesquisador avaliar se a
medida obtida satisfatria ou no. Alguns autores, como Landis e Koch, 1977,
sugerem a seguinte interpretao:

Tabela 17.6 Avaliao do grau de intensidade da concordncia entre dois observadores

Valor de kappa Intensidade da concordncia


<0 Sem concordncia
0,0 0,20 Leve
0,21 0,40 Moderada
0,41 0,60 Forte
0,61 0,80 Muito forte
0,81 0,99 Quase perfeita
1,0 Perfeita

Observe que esta tabela no universalmente aceita, uma vez que os autores
no mostram evidncias que amparem a sua exatido, sendo baseada apenas
na experincia pessoal, pois, na prtica, verifica-se que o nmero de categorias
e de sujeitos afeta o valor de kappa, o qual ser maior quando existirem poucas
categorias. Assim, apesar de suas limitaes, o teste considerado como uma
medida mais robusta do que um simples clculo de percentagens, j que o
mesmo considera o grau de concordncia em razo da ocorrncia da chance.

190 Bioestatstica aplicada Pesquisa Experimental

BIOESTATISTICA_VOL02.indb 190 25/06/12 17:22


Entretanto, alguns autores afirmam que o teste subestima o grau de concor-
dncia entre os observadores, isto porque, quando no completamente certos,
estes tendem a advinhar os resultados de suas observaes. O exemplo a seguir
mostra uma aplicao para o teste de concordncia de kappa.

Exemplo: Um estudo foi conduzido por Ferreira et al (2006) para verificar


a capacidade dos odontlogos em identificar o sexo dos pacientes pela anlise
visual de suas arcadas dentrias. Para tal experimento, foram selecionadas
as fotografias das arcadas de 20 indivduos adultos jovens, sendo 10 do sexo
masculino e 10 do sexo feminino. A identificao das arcadas foi feita em dois
diferentes momentos, com intervalo de 30 dias entre eles. Para que os odontlogos
selecionados fizessem o reconhecimento, as fotografias foram aleatoriamente
misturadas imediatamente antes de cada sesso de identificao. Os resultados
das avaliaes efetuadas por um dos odontlogos esto mostrados abaixo. Existe
concordncia estatisticamente significativa entre os resultados?

Foto 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
Sexo F M M F F M F M M M F M F M F F M F F M
Primeira F M M F F M M M F M M M F F M F F F F M
avaliao + + + + + + + + + + + + + +
Segunda F F M F M M F F M M M M F M M F M F F M
avaliao + + + + + + + + + + + + + + +

M Masculino; F Feminino.

Com base no resultado acima, pode-se construir a seguinte tabela de


contingncia:

Tabela 17.7 Tabela de contingncia para a concordncia entre os diagnsticos de um


odontlogo em duas diferentes avaliaes
Primeira avaliao
Total
Correta Incorreta
Segunda Correta 11 4 15
avaliao Incorreta 3 2 5
Total 14 6 20

Testes Para Variveis Ordinais 191

BIOESTATISTICA_VOL02.indb 191 25/06/12 17:22


Passo 1 Formular as hipteses estatsticas:
H 0 : kappa = 0 (No existe concordncia quanto aos resultados encontra-
dos nas duas avaliaes).
H A : kappa > 0 (Existe concordncia quanto aos resultados encontrados
nas duas avaliaes).
Passo 2 Escolher o nvel de significncia (nvel alfa):
= 0,05 (5%) unilateral
Passo 3 Calcular o valor de kappa:

a + d 11 + 2
po = = = 0,65
n 20

n1 .m1 + n2 .m2 (15 x 14) + (5 x 6) 240


pe = = = = 0,60
2
n 202 400

po pe 0,65 0,60 0.05


kappa = = = = 0,125
1 pe 1 0,60 0, 40

Passo 4 Concluso:
No existem, portanto, evidncias que comprovem ter havido concordn-
cia em relao s observaes nos dois momentos avaliados. Isto , no
houve concordncia na identificao do sexo dos indivduos avaliados, pois
kappa = 0,125; P = 0,286 .

Note que o teste de concordncia de Kappa mede apenas o grau de concor-


dncia entre dois avaliadores. Para uma medida de concordncia entre trs ou
mais avaliadores, o teste a ser utilizado a estatstica pi de Scott.

17.5 TESTE PARAMTRICO versus


NO-PARAMTRICO

Antes de se decidir por um teste no-paramtrico, o pesquisador deve


conhecer algumas de suas vantagens e devantagens em relao aos testes
baseados na distribuio normal gaussiana. So elas:

192 Bioestatstica aplicada Pesquisa Experimental

BIOESTATISTICA_VOL02.indb 192 25/06/12 17:22


Quando as exigncias clssicas para a utilizao dos testes paramtricos
no so atendidas, os testes no-paramtricos so os mais apropriados,
pois so mais livres em termos de regras, sendo, portanto, de aplicao
mais ampla. Porm, quando utilizados em dados que satisfazem as exign-
cias de simetria, os testes no-paramtricos so menos eficientes em de-
tectar alguma diferena entre os grupos comparados, especialmente quan-
do o tamanho amostral pequeno. Nestes casos, a preferncia de escolha
recai sempre sobre um teste paramtrico;
Os testes no-paramtricos so indicados quando o modelo de distribui-
o dos dados na populao desconhecida ou assimtrica, assim como
quando os grupos a serem comparados apresentam varincias desiguais
(heterocedasticidade). Ou ainda, quando entre os grupos a serem compa-
rados, alguns apresentam distribuio simtrica enquanto que outros so
assimtricos;
Em geral, os testes no-paramtricos so menos robustos em relao
aos testes paramtricos, uma vez que so empregados em dados mensu-
rados em escalas no-dimensionais, do tipo nominal, ordinal ou dicot-
mica. De fato, a transformao de dados quantitativos dimensionais em
dados categricos, ou a sua reduo para uma escala qualitativa orde-
nvel que possa ser substituda por postos, tal como ocorre no teste de
Wilcoxon-Mann-Whitney, causa perda de informao relativa variabili-
dade dos dados da amostra estudada, fato este que pode comprometer a
qualidade do teste de hiptese. Portanto, antes de escolher este ou aquele
teste, o pesquisador dever proceder minuciosa anlise de seus dados,
de maneira que possa optar pelo teste mais apropriado ao delineamento
de sua pesquisa.

Testes Para Variveis Ordinais 193

BIOESTATISTICA_VOL02.indb 193 25/06/12 17:22


BIOESTATISTICA_VOL02.indb 194 25/06/12 17:22
parte 5

ANLISE MULTIVARIADA

Para alguns, a frase pode parecer contundente,


mas, aps longos anos estudando o assunto,
posso dizer que, quem ainda no aprendeu estatstica
no pode afirmar que sabe fazer pesquisa.

Prof. Mauro Fontelles


Mdico, cirurgio do trauma e pesquisador.

BIOESTATISTICA_VOL02.indb 195 25/06/12 17:22


BIOESTATISTICA_VOL02.indb 196 25/06/12 17:22
18
Anlise Conceitual
Multivariada

O objetivo do presente captulo fornecer ao leitor, subsdios para que


ele possa compreender os princpios que regem o processo de aplicao
da estatstica multivariada, de modo que, dentre todos os diferentes testes
estatsticos existentes, ele possa escolher aquele que melhor se aplica ao
modelo delineado no projeto de sua pesquisa, assim como possa interpretar
de modo correto os resultados observados. Na prtica, nos modelos de
estudo multivariado, o pesquisador estuda a influncia relativa simultnea
de duas ou mais variveis preditoras, possivelmente causais, sobre uma
nica varivel resposta, a qual tomada como desfecho. Assim, embora com
algumas limitaes, este modelo , sem dvida, mais atraente que aqueles
de anlise bivariada, pois, em razo de analisar vrios fatores simulta-
neamente, reflete de forma mais fidedigna os fenmenos observados na
prtica do dia-a-dia da pesquisa. Por isso, importante que os pesquisa-
dores dominem suas tcnicas, pois, somente dessa maneira, podem extrair
o mximo de informaes contidas em seus experimentos.

BIOESTATISTICA_VOL02.indb 197 25/06/12 17:22


18.1 BASES CONCEITUAIS DA ESTATSTICA
MULTIVARIADA

A compreenso de como a interao de mltiplas variveis atua sobre um
determinado desfecho o objetivo maior de um estudo que emprega a anlise
multivariada como mtodo de pesquisa, sendo, portanto o resultado final
da investigao. Assim, para tornar mais fcil a base do raciocnio para esta
compreenso, utilizaremos um exemplo extrado do cotidiano: suponha que,
aps uma longa viagem turstica de nibus, um passageiro queira mensurar o
seu grau de satisfao com a referida viagem, isto , se ela deve ser classificada
como excelente, boa, mdia ou ruim. Com vistas a este objetivo, ele considera
que alguns fatores inerentes viagem contriburam de forma efetiva para sua
classificao. So eles: o conforto do nibus, o preo da passagem, o tempo
de viagem e o roteiro turstico. Neste caso, podemos afirmar que o conforto,
o preo, o tempo e o roteiro so as variveis preditoras (independentes), que
atuaram conjuntamente, modificando o desfecho da varivel resposta (depen-
dente) grau de satisfao. Existe, portanto, uma relao entre as variveis
estudadas, a qual pode ser posta da seguinte maneira: o grau de satisfao
depende do conforto, do preo, do tempo e do roteiro. Tornando a afirmao
mais lgica, podemos escrev-la da seguinte forma:

Grau de satisfao Conforto + Preo + Tempo + Roteiro

Aqui, um fato importante deve ser considerado. As quatro variveis indepen-


dentes no atuam, necessariamente, com a mesma intensidade na determinao
do desfecho. Cada uma delas tem uma determinada importncia quanto ao grau
de satisfao do passageiro. Em outras palavras, para cada uma das variveis
independentes deve ser atribudo um fator de ponderao (peso), de tal maneira
que as suas importncias relativas sejam proporcionalmente ajustadas s demais
na determinao do desfecho estudado. Assim, a afirmao anterior pode ser
reescrita de uma maneira mais apropriada, tal como mostrado a seguir:

Grau de satisfao pesoc .Conforto + pesop .Preo + pesot .Tempo + pesor .Roteiro

198 Bioestatstica aplicada Pesquisa Experimental

BIOESTATISTICA_VOL02.indb 198 25/06/12 17:22


O prximo passo a ser considerado transformar a afirmao em um
modelo matemtico que possa ser utilizado para clculos estatsticos. Para tal,
necessrio transform-la em uma equao matemtica, tomando-se como
referncia a equao da reta y = a + bx, a qual, em estatstica, considerada
como a frmula da regresso linear simples. Porm, como existem outras
variveis independentes que tambm atuam no grau de satisfao, como por
exemplo, o horrio da partida do nibus, mas que no foram consideradas
pelo passageiro, a frmula no perfeita, necessitando, portanto, de um fator
de correo chamado termo de erro (e), para que a igualdade, em ambos os
membros da equao, seja satisfeita. Este termo de erro, embora de nome um
tanto inadequado, pois no significa necessariamente um erro no processo
de avaliao da interao, englobar todas as outras variveis que no esto
sendo analisadas, mas que tambm atuam no desfecho do estudo. Assim, repre-
sentando-se a varivel-resposta grau de satisfao pela letra y, as variveis
preditoras conforto, preo, tempo e roteiro por x1, x2, x3 e x4, e os respec-
tivos pesos por b1, b2, b3 e b4, a equao pode ser escrita da seguinte forma:

y = a + b1x 1 + b2x 2 + b3x 3 + b4 x 4 + e

Como se pode observar, o uso desta equao no permite que o verda-


deiro valor para y (desfecho) possa ser calculado, pois o termo de erro e no
conhecido. Na prtica, para que a equao possa ser empregada, o que na
verdade se calcula o valor estimado de y, designado por (l-se y-chapu).
Deste modo, o valor de e deve ser subtrado da equao, a qual passa a ser
escrita da seguinte forma:

y = a + b1x 1 + b2x 2 + b3x 3 + b4 x 4

Assim, subtraindo-se a segunda da primeira equao, tem-se: (y ) = e.


Deste modo, o termo de erro e corresponde ao valor observado para a varivel-
-resposta y, menos o valor previsto para a mesma varivel, sendo, por isso,
chamado de resduo. Portanto, com base neste raciocnio, podemos afirmar
que as melhores estimativas para os valores da varivel de desfecho so obtidas
quando o resduo for mnimo.

Anlise Conceitual Multivariada 199

BIOESTATISTICA_VOL02.indb 199 25/06/12 17:22


A equao para calcular comumente chamada de modelo linear geral,
a qual utilizada como base para diversos procedimentos de anlise multiva-
riada, entre os quais se destacam a anlise de varincia (ANOVA), a regresso
linear mltipla e a regresso logstica mltipla, todos mostrados nos captulos
subsequentes deste livro.
Como em outros captulos, nosso objetivo fornecer subsdios suficientes
para que o leitor possa identificar as situaes em que a anlise multivariada
a mais adequada, assim como interpretar os resultados obtidos. Portanto,
agora que estes fundamentos foram explicados, o leitor poder demonstrar,
a ttulo de exerccio, os procedimentos para um estudo que queira avaliar a
interao das variveis preditoras idade, estatura, massa corporal e sexo
na determinao da varivel resposta presso arterial. Caso tenha interesse
em aprender mais sobre este procedimento, consultar Jekel et al (2005).

18.2 OBJETIVOS DA ESTATSTICA MULTIVARIADA

Os objetivos de uma anlise multivariada podem ser resumidos como


mostrado a seguir:
Testar se existe, de fato, uma associao verdadeira entre cada uma das
variveis preditoras (x) estudadas e a varivel resposta analisada (y). Ou
seja, verificar se a correlao entre cada uma das variveis preditoras e a
varivel resposta no ocorreu por puro acaso;
Verificar se existe uma interao entre as diversas variveis predi-
toras (x) na determinao da varivel resposta (y). A interao est
presente quando uma das variveis preditoras influencia a maneira
pela qual outra varivel, tambm preditora, explica o comportamento
da varivel resposta;
Caso exista interao entres as variveis preditoras, compreender quo
importante so estas variveis preditoras (x), tanto individual como
conjuntamente, para explicar a variao da varivel resposta (y);
Determinar qual das variveis independentes a mais forte ao predizer
o comportamento da varivel resposta, ou como interage com as outras
variveis na sua capacidade para a predio.

200 Bioestatstica aplicada Pesquisa Experimental

BIOESTATISTICA_VOL02.indb 200 25/06/12 17:22


18.3 A ESCOLHA DO TESTE ESTATSTICO

A escolha do teste estatstico apropriado deve ser realizada ainda na fase


de delineamento do estudo, logo aps a escolha das variveis que comporo a
pesquisa. Esta escolha, que geralmente se traduz em algum grau de dificuldade
para um pesquisador menos experiente, envolve uma srie de fatores que
devero ser considerados, sendo os mais importantes o tipo de delineamento
do estudo, o tipo de varivel estudada e o nmero de grupos comparados. Assim,
quando se considera o modelo de delineamento, deve-se verificar se a compa-
rao entre os grupos um estudo do tipo pareado ou se envolve comparao
de grupos de amostras independentes, ou se o estudo do tipo caso-controle
ou coorte etc. Quanto ao tipo de varivel, o pesquisador deve estar atento, pois
as variveis podem ser paramtricas, ordinais, dicotmicas ou nominais e, para
cada tipo de varivel, um tipo diferente de teste estatstico deve ser escolhido.
Igualmente, o nmero de variveis a serem comparadas tambm determina
o tipo de teste, pois a anlise pode ser univariada, bivariada ou multivariada,
assim como o nmero de grupos estudados tambm deve ser considerado.
Com base nesses requisitos, os testes estatsticos podem ser classificados
em dois grandes grupos, os testes paramtricos e os testes no-paramtricos,
conforme o tipo de varivel estudada. Os testes paramtricos so mais robustos
do que os no-paramtricos e, consequentemente, devem ser a primeira escolha
do investigador, quando o seu emprego for permitido, isto , quando os dados
coletados achem-se normalmente distribudos. Quando a escolha um teste
no-paramtrico, o pesquisador admite que a distribuio de seus dados no
seja normal, ou que ele no tem elementos suficientes para poder afirmar que
o sejam. Na dvida, o pesquisador deve optar pela estatstica no-paramtrica.
De qualquer maneira, seja qual for a opo do pesquisador, ele precisa
ainda decidir qual, dentre os diversos testes existentes, em ambos os grupos,
o mais apropriado para o modelo de sua pesquisa. Isto porque, existem
testes especficos para amostras dependentes e independentes, como, da
mesma forma, o nmero de comparaes a serem realizadas na pesquisa
tambm importante, uma vez que existem testes indicados para comparao
somente entre duas amostras, e outros indicados para comparaes mltiplas,
entendendo-se como mltiplas, um nmero de comparaes superior a duas

Anlise Conceitual Multivariada 201

BIOESTATISTICA_VOL02.indb 201 25/06/12 17:22


amostras. Deste modo, com o intuito de facilitar ao leitor quanto escolha do
teste estatstico apropriado, os quadros 18.1 e 18.2 mostram as opes para as
anlises bivariadas e multivariadas, respectivamente.

Quadro 18.1 Escolha do teste estatstico para anlise bivariada, conforme o tipo
de varivel estudada

Tipos de Primeira varivel


variveis Contnua Ordinal Dicotmica Nominal
- Teste de - Teste
Dicotmica Mann-Whitney qui-quadrado
- Teste t de Student ---
no-pareada - Teste qui-quadrado - Teste exato de
para tendncia linear Fisher
- Teste do
Dicotmica
- Teste t pareado - Teste de Wilcoxon qui-quadrado de ---
pareada
McNemar
- Anlise de
- Teste - Teste
Segunda varivel

Nominal varincia de uma - Teste Kruskal-Wallis


qui-quadrado qui-quadrado
via (ANOVA).

- Coeficiente de
correlao de
Ordinal --- Spearman --- ---
- Coeficiente de
correlao de Kendall

- Agrupar a variveis
-C
 oeficiente de contnuas e calcular o
correlao de coef. de correlao de
Contnua Pearson --- ---
Spearman ou coef. de
-R
 egresso linear correlao de Kendall
ou qui-quadrado.

202 Bioestatstica aplicada Pesquisa Experimental

BIOESTATISTICA_VOL02.indb 202 25/06/12 17:22


Quadro 18.2 Escolha do teste estatstico para anlise multivariada, conforme
o tipo de varivel estudada
Tipos de Varivel dependente
variveis Contnua Ordinal Dicotmica Nominal
- Regresso
Todas so - Anlise de logstica - Anlise do
categricas varincia (ANOVA) - Anlise do log-linear
- No existe teste log-linear
para anlise - Agrupar as
Algumas
Variveis independentes

- Anlise de multivariada variveis


categricas de variveis - Regresso
covarincia contnuas e
e algumas dependentes logstica
(ANCOVA) realizar anlise do
contnuas ordinais. log-linear.
- Tratar como
variveis contnuas - Anlise da funo
ou realizar a discriminante
- Regresso
anlise do - Agrupar as
Todas so - Regresso linear logstica
log-linear.
contnuas mltipla - Anlise da funo variveis
discriminante contnuas e
realizar anlise do
log-linear.

Anlise Conceitual Multivariada 203

BIOESTATISTICA_VOL02.indb 203 25/06/12 17:22


BIOESTATISTICA_VOL02.indb 204 25/06/12 17:22
19
Anlise de Varincia
(ANOVA)

Na pesquisa experimental, embora o mais frequente seja a comparao


de apenas dois grupos amostrais, no raro o pesquisador desafiado a
comparar os resultados de trs ou mais amostras, simultaneamente. Neste
caso, quando os dados so obtidos de amostras cujas variveis so expressas
em uma escala contnua e com distribuio normal, a comparao ser feita
entre trs ou mais mdias amostrais ao mesmo tempo. Por exemplo, se o
interesse verificar se pessoas em diferentes grupos etrios, isto , crianas,
adultos e idosos tm, em mdia, diferentes valores para a dosagem srica do
colesterol total, o estudo ser feito comparando-se as mdias das medidas
dos trs grupos, simultaneamente.
Do mesmo modo, se o que se deseja comparar diferentes situaes
experimentais em uma mesma populao, como por exemplo, testar quatro
diferentes tipos de tratamentos em uma mesma comunidade, o investigador
dever separar, aleatoriamente, quatro grupos de indivduos e administrar um
tipo de tratamento para cada um dos grupos estudados. Aqui, novamente, ter
que comparar quatro mdias amostrais, simultaneamente.
Note que, em ambos os casos, a hiptese nula a ser testada que as mdias
amostrais no diferem entre si. Ou seja, H0: 1 = 2 = 3 = ... n. Como os valores
que sero comparados so mdias resultantes de variveis contnuas, num

BIOESTATISTICA_VOL02.indb 205 25/06/12 17:22


primeiro momento, pode parecer correto realizar vrios testes t de Student
entre os diferentes grupos, tomando-se as amostras duas a duas. Esta seria
uma soluo pouco eficiente, uma vez que, para um nmero k de amostras, a
formao total de pares (p) seria:

k (k 1)
p=
2

Assim, para o caso de quatro amostras, tem-se a formao de seis pares


e, portanto, a aplicao de seis testes t para comparar as mdias duas a duas:
x 1x x 2 , x 1x x 3 , x 1x x 4 , ... e assim, sucessivamente. Tal processo de comparao,
no entanto, estatisticamente incorreto, pois resulta num trabalho exaustivo
e desnecessrio, alm de aumentar a probabilidade de se cometer um erro
falso-positivo (erro tipo I), porque, com o aumento do nmero de mdias a
serem comparadas, maior ser a possibilidade de se encontrar, entre elas, uma
diferena estatisticamente significante somente por acaso, em razo do erro
amostral. Isto ocorre porque o teste t de Student foi idealizado para comparar
apenas duas mdias, com probabilidade de se concluir, de maneira incorreta,
por uma diferena que no existe. Desta forma, quando se aumenta o nmero
de mdias, aumenta-se a probabilidade de erro.
Portanto, quando o objetivo comparar vrios grupos, simultaneamente,
e para que se possa manter o erro tipo I em um nvel constante, o proce-
dimento correto o emprego de um teste de abrangncia global, o qual
utilizado para avaliar se existe alguma diferena entre as mdias e, somente se
este primeiro teste for positivo, deve-se, ento, testar as vrias combinaes
entre elas. Neste caso, a tcnica a ser empregada a anlise de varincia
(ANOVA1), a qual compara todas as mdias em um nico teste, objetivando
identificar se existe ao menos uma diferena estatisticamente significativa
entre os grupos comparados. Caso esta diferena exista, aplica-se, ento, uma
das diversas tcnicas de comparaes mltiplas para que se possam identi-
ficar quais os grupos diferem entre si.

1. ANOVA Acrnimo das palavras inglesas analysis of variance.

206 Bioestatstica aplicada Pesquisa Experimental

BIOESTATISTICA_VOL02.indb 206 25/06/12 17:22


19.1 BASE DA ANOVA (TESTE F)

Desenvolvida por Sir Ronald Fisher2, o teste ANOVA constitui uma
poderosa ferramenta estatstica de anlise multivariada que, com base no
modelo linear geral, permite comparar mais de duas mdias simultanea-
mente, constituindo-se, portanto, no primeiro passo para identificar a variao
entre trs ou mais grupos estudados simultaneamente. O argumento do teste
baseado no seguinte princpio: se tomarmos dois mtodos diferentes para
estimar a varincia, sendo o primeiro empregado para o clculo em diferentes
amostras e o segundo para o clculo em uma determinada populao; se todas
as amostras vierem desta populao, estas duas estimativas da varincia devem
ser necessariamente iguais. Isto , se a varincia de diferentes amostras no
diferirem significativamente entre si, elas so estimativas da mesma varincia
populacional 2 e, portanto, da mesma mdia populacional . Com base neste
princpio, Fischer desenvolveu duas maneiras distintas para medir a varincia
das observaes de diferentes grupos. So elas:
2
Varincia entre grupos ( s E ) aquela que tem como base a variao
entre as mdias dos grupos estudados, isto , que mede a variao
existente entre todas as mdias amostrais selecionadas para o estudo. A
varincia entre grupos tambm chamada de quadrado da mdia entre
grupos (QME);
2
Varincia dentro dos grupos ( s D ) aquela que tem como base a
variao dentro de cada grupo, isto , que mede a variao dentro de
cada uma das mdias amostrais selecionadas para o estudo. A varincia
dentro dos grupos tambm chamada de quadrado da mdia dentro
dos grupos (QMD);
2
Varincia total ( sT ) Corresponde quela que obtida quando todos os
grupos so reunidos de modo a formar um nico bloco, composto da soma
de todos os elementos das amostras.

De tal modo que podemos escrever: sT = s E + s D


2 2 2

2. Sir Ronald Aylmer Fisher (1890-1962) Estatstico e bilogo ingls, criador das fundaes
para a cincia estatstica moderna.

Anlise de varincia 207

BIOESTATISTICA_VOL02.indb 207 25/06/12 17:22


Note que o quadrado da mdia corresponde a um outro nome para a
varincia, a qual definida como a soma dos quadrados dos desvios em relao
mdia (SQ), dividida pelo nmero de graus de liberdade (gl), de modo que o
teste F corresponde razo entre as varincias entre os grupos e dentro dos
grupos, o qual pode ser expresso da seguinte maneira:

Varincia entre os grupos s 2 QM E SQE / gl E


Teste F = = E = =
Varincia dentro dos grupos s 2 QM D SQD / gl D
D

Portanto, o teste F consiste em um procedimento estatstico que calcula a


variao total observada no estudo e a divide em dois componentes perfeitamente
identificveis: o primeiro componente a variao entre mdia de cada grupo e a
mdia geral de todos os indivduos do estudo (variao entre os grupos). Este
componente representa o efeito dos diferentes tratamentos. O segundo compo-
nente a variao observada entre cada indivduo e a mdia de seu respectivo
grupo (variao dentro dos grupos). Este componente representa as diferenas
individuais aos tratamentos. Assim, se as mdias dos grupos forem bastantes
diferentes umas das outras, ocorrer uma variao considervel entre elas e a
mdia geral de todos os indivduos do estudo. Entretanto, se as mdias dos grupos
no forem muito diferentes entre si, a variao entre elas e a mdia geral no ser
muito maior do que a variao entre os indivduos dentro de cada grupo.
Desta forma, a hiptese nula (H0) para o teste F a afirmativa de que as duas
varincias (entre e dentro) so iguais. Isto , que a variao entre as mdias no
maior do que a variao entre as observaes individuais dentro de um grupo.
Assim, para que a hiptese nula seja aceita, bastar que se demonstre que as mdias
amostrais ( x ) no diferem significativamente entre si, alm do que seria de se
esperar somente pelo acaso, em razo do erro aleatrio. Isto , que elas estimam a
mesma mdia populacional . Caso contrrio, rejeita-se a hiptese nula e se aceita a
hiptese alternativa (HA) de que as mdias amostrais no estimam a mesma mdia
. Neste caso, conclumos que nem todas as mdias so iguais, ou seja, que pelo
menos uma delas difere das demais. Entretanto, o teste F no mostra qual ou quais
delas so diferentes entre si, o que explica a necessidade da utilizao de testes de
comparao mltipla (post hoc) para que se possa determinar qual ou quais das
diferenas entre as mdias so estatisticamente significantes (verdadeiras).

208 Bioestatstica aplicada Pesquisa Experimental

BIOESTATISTICA_VOL02.indb 208 25/06/12 17:22


Portanto, se o valor calculado para o teste F for prximo a 1, as duas
estimativas da varincia so semelhantes, e a hiptese nula de que todas as
mdias provm de uma mesma populao no rejeitada. Porm, se o valor
Fcalc muito maior que 1, com o valor desta diferena maior do que seria de se
esperar somente por acaso, deve haver alguma razo que explique esta grande
diferena entre os grupos comparados, a qual deve ser atribuda ao efeito dos
tratamentos. Neste caso, a hiptese da no-diferena deve ser rejeitada.
Da mesma maneira, para que se possa testar a significncia estatstica do
valor de Fcalc obtido no experimento, compara-se este valor com o valor F ;gl ;gl
N D
extrado da tabela de valores crticos da distribuio F, a qual encontrada no
final deste livro. Este valor crtico determina o limite para uma diferena ao
acaso entre as varincias entre e dentro dos grupos comparados. Assim, para
um determinado nvel de significncia (nvel ) preestabelecido e com (k 1)
graus de liberdade no numerador e (n k) graus de liberdade no denominador,
se o valor de Fcalc for menor que F ;glN ;glD tabelado, aceita-se a hiptese nula
de que no h diferena entre os tratamentos, pois a variao observada entre
os grupos da mesma ordem daquela observada dentro dos grupos. Caso
contrrio, se o valor de Fcalc for maior que F ;glN ;glD , rejeita-se a hiptese nula e
se conclui que h diferena entre os grupos comparados.

19.2 TIPOS DE ANOVA

O uso da anlise de varincia como mtodo estatstico requer que o pesqui-


sador conhea suas diferentes formas de aplicao, uma vez que so possveis
vrios modelos experimentais para a ANOVA. Na prtica, entretanto, a maioria
dos modelos mais complexos constituem combinaes de modelos mais simples,
os quais podem ser classificados conforme o nmero de variveis indepen-
dentes analisadas no estudo. So eles: modelo de delineamento inteiramente
casualizado, tambm chamado de ANOVA de um critrio (one way ANOVA)
e modelo de delineamento em blocos casualizados, conhecido como ANOVA
de dois critrios, ou mltiplos critrios. Outros modelos mais complexos, tais
como os modelos fatoriais, modelos de quadrados latinos, modelos agrupados
e modelos de medidas repetidas (dados emparelhados) tambm podem ser

Anlise de varincia 209

BIOESTATISTICA_VOL02.indb 209 25/06/12 17:22


calculados. Neste livro, abordaremos apenas os modelos bsicos de anlise de
varincia. Caso o leitor tenha interesse em aprender mais sobre os procedi-
mentos mais complexos, consultar Dawson et al (2003) e Beiguelman (2002).
Assim, no sentido de melhor esclarecer o leitor, antes de mostrar as carac-
tersticas de cada um dos modelos bsicos da ANOVA, convm definir alguns
termos especficos mais utilizados neste tipo de anlise estatstica.

Tratamento (k) Corresponde a cada um dos diferentes processos experi-


mentais estudados em um dado experimento;
Unidade experimental cada um dos grupos de indivduos que
recebem um determinado processo experimental (tratamento). A escolha
dos indivduos para a formao de uma unidade experimental deve ser
aleatria. , portanto, cada uma das amostras do estudo;
Repetio (r) a aplicao de um mesmo tratamento a todos os
indivduos que compem uma determinada unidade experimental. As
repeties permitem uma aferio da variabilidade intrnseca de cada
unidade experimental, assim como da variabilidade entre as diversas
unidades experimentais estudadas em um experimento;
Erro experimental Corresponde variao entre as unidades experi-
mentais (indivduos) que constituem um mesmo tratamento (grupo).
, portanto, a variao dentro do mesmo tratamento, a qual estimada
pela mdia das varincias de cada grupo, sendo, por isso, chamada de
varincia mdia dentro dos grupos (varincia dentro). Tambm
conhecida como varincia residual, ela representa a frao da variabi-
lidade que no explicada pelo efeito dos tratamentos;
Bloco Tambm chamado de fator, representa cada um dos conjuntos
formados por unidades experimentais semelhantes e homogneas entre
si. Um experimento poder ser formado por um, dois ou mais blocos,
segundo seja ANOVA de um critrio ou de mltiplos critrios. Assim,
em cada bloco, haver tantas unidades experimentais quantos forem os
tratamentos a ser comparados.

Deste modo, dependendo do tipo de delineamento experimental, o teste F


para anlise da varincia pode ser classificado como:

210 Bioestatstica aplicada Pesquisa Experimental

BIOESTATISTICA_VOL02.indb 210 25/06/12 17:22


ANOVA de um critrio (one way ANOVA)
Tambm chamado de modelo inteiramente casualizado, o tipo de
delineamento em que os grupos (amostras) estudados so comparados
segundo um nico critrio de classificao, isto , pelo tipo de tratamento
que recebem. Neste modelo de estudo, testa-se apenas uma varivel indepen-
dente, designada pelo tipo de tratamento, o qual analisado em apenas um
bloco constitudo por vrias unidades experimentais, sendo os elementos
dentro de cada amostra obtidos de maneira aleatria (randmica). Assim,
para cada unidade experimental sorteado um dos tipos de tratamentos que
devero ser comparados no estudo. Por exemplo: Simes et al (2008) anali-
saram a estabilidade oxidativa da carne mecanicamente separada (CMS) da
piramutaba (Branchyplatystoma vaillant) por meio de vrias anlises fsico-
-qumicas e microbiolgicas, dentre elas o pH. Foram coletadas 10 amostras
em quatro momentos distintos: 0, 30, 60 e 90 dias de estocagem 18oC.
Neste exemplo de ANOVA, testou-se o efeito do tempo de estocagem (tipo de
tratamento ou varivel preditora) sobre o valor do pH (varivel resposta ou
dependente), em quatro diferentes amostras (grupos).
A Tabela 19.1 mostra a notao e o modelo de organizao de dados para
uma ANOVA de um critrio, com um nico bloco experimental.

Tabela 19.1 Notao e modelo de organizao de dados para uma ANOVA


de um critrio (bloco nico)

Tratamentos Total
1 2 3 ... k
x11 x21 x31 ... xk1
x12 x22 x32 ... xk2
. . . ... .
. . . ... .
x1r x2r x3r ... xkr

Total T1 T2 T3 ... Tk T = x
Repeties r r r ... r N= kr
Mdia x1 x2 x3 xk
Adaptado de Rossi, RM (2006)

Anlise de varincia 211

BIOESTATISTICA_VOL02.indb 211 25/06/12 17:22


ANOVA de dois critrios (two way ANOVA)
Tambm chamado de modelo fatorial, este tipo de delineamento semelhante
ANOVA de um critrio, exceto pelo fato de que so analisados dois fatores (ou
duas variveis independentes) simultaneamente, sendo cada fator distribudo
em um bloco constitudo por trs ou mais unidades experimentais homogneas
(grupos). Neste caso, o pareamento feito por blocos. Por exemplo: no experi-
mento anterior em que se relaciona a variao do pH com o tempo de estocagem
da carne mecanicamente separada da espcie de peixe piramutaba, suponha que
o pesquisador tenha realizado o mesmo experimento para as temperaturas de
18 oC, 25 oC e 36 oC. Neste caso, cujos blocos seriam representados pelos experi-
mentos realizados em diferentes temperaturas, o pesquisador busca controlar a
variao entre os sujeitos das amostras para que ela no seja confundida com
uma possvel diferena entre os tempos de congelamento. Assim, a variao
total do pH observada no experimento seria atribuda variao natural entre
os sujeitos da amostra (variao residual), entre os tempos de congelamento
(tratamentos) e entre as diferentes temperaturas (blocos).

19.2.1 Requisitos para uso da ANOVA


Para que os dados de trs ou mais amostras possam ser submetidos a um
teste de anlise de varincia, necessrio que algumas condies sejam obser-
vadas. So elas:
Que a varivel em estudo (x) apresente-se normalmente distribuda na
populao. Porm, para grandes amostras, em razo do teorema do limite
central, essa condio pode ser relaxada;
Que as amostras sejam randmicas e haja homocedasticidade de suas
varincias, isto , que elas no difiram significativamente entre si. Assim,
antes de realizar a ANOVA, fundamental que se proceda a um teste
de homogeneidade das varincias, o que pode ser feito pela aplicao
do teste de Cochran, para nmeros iguais de repetio dentro de cada
grupo, e o teste de Bartlett, para variveis com nmeros desiguais de
repetio. Em razo de ser um teste bastante robusto, a ANOVA fornece
resultados confiveis mesmo na presena de uma considervel heteroce-
dasticidade entre as varincias, desde que os tamanhos amostrais sejam
iguais ou quase iguais.

212 Bioestatstica aplicada Pesquisa Experimental

BIOESTATISTICA_VOL02.indb 212 25/06/12 17:22


19.3 ANOVA DE UM CRITRIO

Os clculos para a obteno do valor do teste F podem ser realizados pela


aplicao de frmulas alternativas, desenvolvidas a partir das frmulas tradi-
cionais das somas dos quadrados total, entre os grupos e dentro dos grupos.
Como o objetivo deste livro no a deduo das frmulas gerais, mostraremos
apenas a aplicao das frmulas alternativas, as quais so mostradas na Tabela
19.2, tambm denominada tabela de anlise de varincia, cujo objetivo
mostrar o modelo geral de um experimento inteiramente casualizado. Esta
tabela utilizada pela maioria dos programas computacionais estatsticos
tradicionais.

Tabela 19.2 Modelo geral de tabela de anlise de varincia contendo as frmulas alternativas

Graus de liberdade Soma dos quadrados Varincia


Fontes de variao Razo F
(gl) (SQ) (s2)
2
n
Entre os grupos x SQE
k1 k s E2 =
(tratamentos) SQE = C k 1 s E2
n Fcalc =
s D2
Dentro dos grupos SQD
SQD = SQT SQE s D2 =
(variao residual) Nk N k
k n
Total SQT = x 2 C
N1
2
k n k Nmero de amostras (tratamentos) do estudo
x N Total de elementos das k amostras
Fator de correo C =
n Nmero de elementos de cada amostra
N

Exemplo: Com o objetivo de avaliar o padro de ensino de uma escola


pblica estadual, um pesquisador selecionou, aleatoriamente, a nota de seis
alunos nas disciplinas de lngua portuguesa, fsica, qumica e matemtica. Os
dados esto relacionados na Tabela 19.3. Existe diferena estatisticamente
significante entre os aproveitamentos dos alunos em relao s disciplinas
cursadas? Considerar nvel de significncia de 5%.

Anlise de varincia 213

BIOESTATISTICA_VOL02.indb 213 25/06/12 17:22


Tabela 19.3 Valores das notas escolares de seis alunos de uma escola pblica estadual

Notas nas disciplinas


Total
Portugus Matemtica Fsica Qumica
6 9 8 6
9 8 6 5
9 7 7 4
8 8 6 5
7 8 7 6
9 8 8 4
Totais 48 48 42 30 x = 168
Repeties (n) 6 6 6 6 N = 24
Mdias ( x ) 8 8 7 5
x2 392 386 298 154 1.230

Passo 1 Formular as hipteses estatsticas:


HO: No existem diferenas entre as mdias das notas das disciplinas
analisadas, pois P = M = F = Q .
HA: Ao menos uma das mdias difere das demais, sendo P M ou P F
ou P Q ou M F ou M Q ou F Q .
Passo 2 Escolher o nvel de significncia (nvel alfa):
= 0,05 (5%) unilateral
Passo 3 Determinar o valor crtico do teste F:
gl do numerador (entre) - gl E = k 1 = 4 1 = 3
gl do denominador (dentro) - gl D = N k = 24 4 = 20
gl do total - glT = N 1 = 24 1 = 23
Ento, F ;gl ;gl = F0,05;3;20 = 3,10
N D
Passo 4 Calcular o valor do fator de correo C:
2
k n
x 2
C= = 168 = 28.224 = 1.176
N 24 24

Passo 5 Calcular o valor do teste F:


k n
SQT = x 2 C = 1.230 1.176 = 54

214 Bioestatstica aplicada Pesquisa Experimental

BIOESTATISTICA_VOL02.indb 214 25/06/12 17:22


2
n
x
k
C = 48 + 48 + 42 + 30 1.176 = 36
2 2 2 2
SQE =
n 6

SQE 36
s E2 = =
= 12
k 1 3

SQD = SQT SQE = 54 36 = 18

SQD 18
s D2 = = = 0, 90
N k 20

s E2 12
Fcalc = = = 13,33
s D2 0, 9

Tabela 19.4 Anlise de varincia dos dados da Tabela 19.3

Fonte de variao gl SQ QM (s2) Fcalc

Entre os grupos
3 36 12
(tratamentos) 13,33
Dentro dos grupos P = 0,0001
20 18 0,9
(variao residual)
23 54

Passo 6 Regra de deciso:

Se Fcalc < F0,05;3;20 , aceita-se H 0 .

Se Fcalc F0,05;3;20 , rejeita-se H 0 .

Como Fcalc = 13,33 > F0,05;3;20 = 3,10, rejeita-se H 0 .

Passo 7 Concluso:
Como o valor para Fcalc maior que o valor crtico tabelado F0,05;3;20 ,
rejeita-se H0 e conclui-se que ao menos uma das mdias difere das de-

Anlise de varincia 215

BIOESTATISTICA_VOL02.indb 215 25/06/12 17:22


mais. Portanto, existe alguma diferena estatisticamente significan-
te entre as mdias referentes s notas nas disciplinas avaliadas, pois
Fcalc = 13,33; P = 0,0001 .

Assim, como j anteriormente explicado, quando o resultado do teste F


no estatisticamente significante, nenhum outro teste adicional necessrio,
uma vez que se estima que todas as mdias so estatisticamente semelhantes e
foram retiradas da mesma populao. Isto , elas estimam a mesma mdia . No
entanto, quando ocorre uma diferena significante entre as mdias amostrais,
o teste F no indica quais destas mdias so estatisticamente diferentes entre
si. Neste caso, para que se possam determinar quais so diferentes, deve-se
passar para a segunda fase da ANOVA, na qual se aplica um dos testes de
comparaes mltiplas disponveis em estatstica, dos quais os mais utilizados
sero descritos a seguir.

19.4 TESTES DE COMPARAES MLTIPLAS

Os testes de comparaes mltiplas so complementos para a ANOVA,


que identificam as diferenas entre as mdias, comparando-as duas a duas.
Semelhantes ao teste t de Student, estes testes controlam o erro ao considerar o
nvel de significncia conforme o nmero de comparaes realizadas no experi-
mento. Alm do mais, a varincia dentro dos grupos estimada entre todas as
amostras analisadas, ao passo que, no teste t, a varincia dentro dos grupos
estimada somente com base entre duas amostras.

19.4.1 Teste Tukey (HSD)


Desenvolvido por John Tukey3, o mesmo estatstico que criou o diagrama
de caule e folha (steam-and-leaf) e o grfico box plot (box-and-whisker plot), o
teste tambm conhecido como teste HSD, do ingls honestly significant diffe-

3. John Wilder Tukey (1915-2000) Estatstico americano, premiado, em 1982, com a medalha
de honra do Institute of Electrical and Electronics Engineers (EUA) pela sua contribuio para
a anlise espectral dos processos randmicos e pela transformada rpida do algoritmo de
Fourier. Durante a Segunda Guerra Mundial, trabalhou com Samuel Wilks e William Cochran.

216 Bioestatstica aplicada Pesquisa Experimental

BIOESTATISTICA_VOL02.indb 216 25/06/12 17:22


rence (diferena verdadeiramente significante), assim chamado em razo dos
outros testes de comparaes mltiplas tornarem a significncia estatstica
mais fcil de ser obtida.
Na prtica, o teste de Tukey mais exato e mais eficaz em relao aos
demais testes existentes, pois permite que se estabelea a diferena mnima
significante (d.m.s) entre as mdias amostrais quando estas so comparadas
duas a duas, tomando-se como referncia um determinado nvel de signifi-
cncia previamente estabelecido para o experimento. Esta eficcia significa
que a hiptese nula com mais frequncia corretamente rejeitada.

Tukey para amostras de mesmo tamanho


Para amostras, ou grupos, com o mesmo nmero de elementos, o teste
Tukey dado por:

QMR
d .m.s = q;k ;glresduo
n

Onde: qa ;k ; glresduo = Amplitude total estudentizada obtida na tabela de


valores crticos da distribuio q (ver tabela no final do livro).
QMR = Quadrado mdio da variao dentro dos grupos (variao
residual) obtido na anlise de varincia.
n = Nmero de elementos submetidos a cada tratamento.

Aps calcular o valor para a d.m.s, deve-se construir uma tabela de compa-
rao entre as mdias, conforme demonstrado na Tabela 19.5. Assim, de acordo
com o teste Tukey, para que qualquer diferena entre as mdias seja consi-
derada estatisticamente significante, necessrio que o valor absoluto da
diferena seja igual ou superior ao valor da d.m.s.

Exemplo: Com base nos dados da Tabela 19.3, anlise de varincia


apresentada na Tabela 19.4 mostra um valor F significante ao nvel de
5%, o que indica que ao menos uma das mdias das notas obtidas nas
disciplinas analisadas diferente das demais. Mas, qual , ou quais so as
mdias diferentes?

Anlise de varincia 217

BIOESTATISTICA_VOL02.indb 217 25/06/12 17:22


Passo 1 Calcular o valor da d.m.s:

Para: q0,05;4 ,20 = 3, 958; QMR = 0, 9 e n = 6


0, 9
Tem-se: d .m.s = 3, 958 = 1,53
6

Passo 2 Calcular as diferenas entre as mdias:

Tabela 19.5 Comparaes entre as mdias pelo teste Tukey

Valor absoluto da
Pares de mdias | | d.m.s Concluso
diferena
P vs M |8 8| = 0 No Mdias no diferem
P vs F |8 7| = 1 No Mdias no diferem
P vs Q |8 5| = 3 Sim Mdias diferem
M vs F |8 7| = 1 No Mdias no diferem
M vs Q |8 5| = 3 Sim Mdias diferem
F vs Q |7 5| = 2 Sim Mdias diferem
P Portugus; M Matemtica; F Fsica; Q Qumica.

Passo 3 Concluso:
Entre as mdias analisadas, conclui-se que ocorreram diferenas estatis-
ticamente significativas somente entre as notas de Portugus e Qumica,
Matemtica e Qumica, e Fsica e Qumica. As demais combinaes de m-
dia no diferiram entre si.

Tukey para amostras de tamanhos diferentes


Para amostras com tamanhos diferentes, o teste de Tukey realizado
comparando-se o valor de qcalc com o valor crtico tabelado q;k;glresduo, para
cada uma das diferena entre as mdias analisadas. O valor qcalc obtido pela
seguinte frmula:

|x A xB | QMR 1 1
qcalc = , onde: EP = +
EP 2 nA nB

218 Bioestatstica aplicada Pesquisa Experimental

BIOESTATISTICA_VOL02.indb 218 25/06/12 17:22


Sendo:  x A e x B = As mdias das duas amostras que esto sendo
comparadas.
 EP = Erro padro de cada diferena entre as mdias.
 QMR = Quadrado mdio da variao dentro dos grupos (variao
residual) obtido na anlise de varincia.

Aps calcular os valores para o erro padro (EP) e para o qcalc, deve-se
construir uma tabela de comparao entre as mdias, conforme demonstrado
na Tabela 19.8. Assim, de acordo com o teste Tukey, para que qualquer diferena
entre elas seja considerada estatisticamente significativa, necessrio que o
valor de qcalc seja maior que o valor tabelado de q;k;glresduo. O exemplo, a seguir,
mostra uma anlise de varincia com grupos de tamanhos desiguais, seguida
da aplicao do teste Tukey.

Exemplo: Um estudo foi conduzido para avaliar o efeito de trs diferentes
programas de treinamento na reduo da massa corporal de pacientes com
sobrepeso, frequentadores de uma academia especializada. Para tal experi-
mento, trs grupos de pacientes foram aleatoriamente selecionados. Para cada
grupo, o programa foi ministrado durante um perodo de 30 dias. Os dados
relativos perda de peso, em kg, esto expressos na Tabela 19.6, abaixo.

Tabela 19.6 Valores da perda de peso, em kg, de pacientes submetidos


a trs diferentes programas de treinamento

Programas de treinamento
Pacientes
A1 B2 C3
01 8 7 12
02 10 8 10
03 7 8 9
04 9 7 11
05 8 8 9
06 10 6 --
n 6 6 5
Total 52 44 51
x 8,66 7,33 10,20

Anlise de varincia 219

BIOESTATISTICA_VOL02.indb 219 25/06/12 17:22


A anlise de varincia mostrou que existe diferena estatisticamente
significativa entre as mdias dos valores das perdas de peso dos programas
comparados no experimento, isto , que ao menos uma das mdias difere
significativamente das demais. Os resultados da ANOVA esto relacionados na
Tabela 19.7, abaixo.

Tabela 19.7 Anlise de varincia dos dados da Tabela 19.6

Fonte de variao gl SQ QM (s2) Fcalc

Entre os grupos
2 22,416 11,208
(tratamentos)
8,98
P = 0,0034
Dentro dos grupos
14 17,467 1,248
(variao residual)

16 39,883

Passo 1 Calcular o valor crtico do teste:


q0,05;3;14 = 3,702

Passo 2 Determinar os valores para qcalc:

| x A1 x B 2 | | 8,66 7,33| 1,330


qcalcA1B 2 = = = = 2, 916
QMR 1 1 1,248 1 1 0, 456
+ +
2 nA1 nB 2 2 6 6

| x A1 x C 3 | | 8,66 10,20 | 1,540


qcalcA1C 3 = = = = 3,377
QMR 1 1 1 , 248 1 1 0 , 456
+ +
2 nA1 nC 3 2 6 6

| x B 2 xC 3 | | 7,33 10,20 | 2,870


qcalcB 2C 3 = = = = 6,004
QMR 1 1 1,248 1 1 0, 478
+ +
2 nB 2 nC 3 2 6 5

220 Bioestatstica aplicada Pesquisa Experimental

BIOESTATISTICA_VOL02.indb 220 25/06/12 17:22


Passo 3 Construir a tabela de comparao:

Tabela 19.8 Comparao entre as mdias pelo teste Tukey

Grupos comparados | x A xB | | qcalc | q0,05;3;14 Concluso

A1 vs B2 1,330 2,916 < 3,702 Mdias no diferem

A1 vs C3 1,540 3,377 < 3,702 Mdias no diferem

B2 vs C3 2,870 6,004 > 3,702 Mdias diferem

Passo 4 Concluso:
Ocorreu diferena estatisticamente significativa somente entre os progra-
mas B2 e C3.

Intervalo de confiana para a mdia


Com o teste Tukey, tambm pode ser calculado o intervalo de confiana para
a mdia de um dos tratamentos participantes da ANOVA. A frmula dada por:

QMR
IC 95% = x i t ;glresduo
n1

Para o grupo A1, o intervalo de confiana para a estimativa da perda de


peso calculada da seguinte maneira:

1,248
IC 95% = 8,66 2,145
6

IC 95% = 8,66 (2,145)(0, 456)

IC 95% = 8,66 0, 98

IC 95% = 8,66 0, 98 = 7,68 (limite inferior)

= 8,66 + 0, 98 = 9.64 (limite superior)

IC 95% = 7,68 kg < A1 < 9,64 kg

Anlise de varincia 221

BIOESTATISTICA_VOL02.indb 221 25/06/12 17:22


19.4.2 Teste de Student-Newman-Keuls (SNK)

O teste SNK corresponde a um outro tipo de anlise de comparao post


hoc derivada do trabalho de William Gosset (1927), Newman (1939) e Keuls
(1952). O modelo, que tambm baseado no teste de significncia entre as
mdias tomadas duas a duas, semelhante ao teste Tukey, exceto pelo valor
crtico, que depende no do nmero de grupos (k) envolvidos no experimento,
mas do nmero de mdias (k) do experimento includas na amplitude entre as
duas mdias que esto sendo testadas. Por exemplo, no caso de quatro mdias
sendo testadas, quando se compara a maior com a menor das quatro mdias,
k = 4; quando se compara a segunda maior mdia com a menor delas, k = 3, e
assim, sucessivamente. Ento o valor crtico dado por: q;k ' ;glresduo .
Para o exemplo mostrado na Tabela 19.6, os valores crticos de q;k ' ;glresduo
so determinados da seguinte maneira:

C3 vs B2: k = 3 e q0,05;3;14 = 3,702 ( amplitude entre 10,20 e 7,33 contm as


mdias 10,20; 8,66 e 7,33).
C3 vs A1: k = 2 e q0,05;2;14 = 3,033 (amplitude entre 10,20 e 8,66 contm as

mdias 10,20 e 8,66).


A1 vs B2: k = 2 e q0,05;2;14 = 3,033 (amplitude entre 8,66 e 7,33 contm as

mdias 8,66 e 7,33).

Assim, o primeiro passo proceder anlise de varincia (teste F), com


o objetivo de verificar se as amostras foram retiradas da mesma populao.
Caso o teste F fornea um valor estatisticamente significante, o prximo passo
dispor as mdias em ordem crescentes de seus valores e calcular o valor qSNKcalc
de acordo com a frmula a seguir:

x A xB
q SNKcalc =
QMR 1 1
+
2 nA nB

Sendo: x A e x B = As mdias das duas amostras que esto sendo


comparadas.

222 Bioestatstica aplicada Pesquisa Experimental

BIOESTATISTICA_VOL02.indb 222 25/06/12 17:22



QMR = Quadrado mdio da variao dentro dos grupos (variao
residual) obtido na anlise de varincia.

Aps calcular os valores para o qcalc, deve-se construir uma tabela de


comparao entre as mdias, conforme demonstrado na Tabela 19.9. Assim, de
acordo com o teste Student-Newman-Keuls, para que qualquer diferena entre
elas seja considerada estatisticamente significativa, necessrio que o valor de
qcalc seja maior que o valor tabelado de q;k;glresduo.

Tabela 19.9 Comparao entre as mdias pelo teste de Student-Newman-Keuls

Grupos comparados x A xB qSNKcalc qtabelado Concluso

C3 vs B2 2,870 6,004 > 3,702 Mdias diferem

C3 vs A1 1,540 3,377 > 3,033 Mdias diferem

A1 vs B2 1,330 2,916 < 3,033 Mdias no diferem

Note que o teste de Student-Newman-Keuls e o teste Tukey utilizam o


mesmo valor crtico para a primeira comparao entre as mdias. De outro
modo, o teste Tukey utiliza o mesmo valor crtico para todas as demais compa-
raes, enquanto que o teste de Student-Newman-Keuls reduz o tamanho do
valor crtico conforme o nmero de mdias contidas na amplitude das mdias
ento comparadas. Isto justificado pelo fato de que algumas diferenas
avaliadas no teste so consideradas como se fosse uma nica diferena entre
duas mdias, quando, na realidade, envolve trs ou mais mdias e, portanto,
trs ou mais diferenas. Como resultado, para alguns autores, o teste SNK
mais robusto que o teste Tukey.
Assim, comparando-se os resultados dos dois testes aplicados ao mesmo
exemplo mostrado na Tabela 19,6, verifica-se que o teste Tukey considerou apenas
uma comparao estatisticamente significante entre as mdias analisadas (C3 vs
B2), ao passo que o teste de Student-Newman-Keuls encontrou duas diferenas
(C3 vs B2 e C3 vs A1). Outro ponto importante a ser considerado que, se no existe
diferena estatisticamente significativa entre duas mdias, conclui-se, portanto,
que tambm no h diferena entre as mdias compreendidas entre elas.

Anlise de varincia 223

BIOESTATISTICA_VOL02.indb 223 25/06/12 17:22


19.4.3 Teste de Bonferroni
Tambm chamado de teste de comparaes mltiplas de Dunn, o procedi-
mento de Bonferroni4 pode ser utilizado para mltiplas comparaes entre todas
as mdias do experimento, assim como para comparaes das mdias experi-
mentais contra um grupo controle, se este existir. Neste caso, a nica diferena
que o nmero de comparaes k menor, porque elas so realizadas somente
contra o grupo controle. Por exemplo, para o estudo mostrado na Tabela 19.6,
supondo-se que o grupo A1 o grupo controle, se as comparaes forem feitas
somente contra ele, o valor de k ser igual a 2. Assim, como condio, neces-
srio que a escolha das comparaes a serem realizadas seja feita antes da
realizao inicial do teste F, sendo, por este motivo, o procedimento proposto
por Bonferroni, considerado um teste de comparaes a priori ou planejadas.
O teste consiste em corrigir o nvel de significncia , de modo a manter a
taxa total de erro igual ou abaixo do valor previamente estipulado para o estudo;
no caso do exemplo dado, em 5%. O valor Bonf corrigido pela seguinte frmula:


Bonf = , onde : - Nvel de significncia preestabelecido para
k
o experimento.
k - Nmero de comparaes que sero realiza-
das no experimento.

Por sua vez, para o caso das comparaes mltiplas realizadas aps o
teste F, o procedimento consiste e calcular o valor de tBonf para cada uma das
diferenas entre as mdias comparadas, o qual dado pela seguinte frmula:

x A xB
t Bonf =
1 1
QMR +
n
A nB

Aps calcular os valores de tBonf, cada valor deve ser comparado com o
valor t crtico tabelado, para um alfa corrigido de Bonferroni (Bonf) e com os

4 Carlo Emilio Bonferroni (1892-1960) Matemtico italiano conhecido pelos seus trabalhos
sobre teorias das probabilidades.

224 Bioestatstica aplicada Pesquisa Experimental

BIOESTATISTICA_VOL02.indb 224 25/06/12 17:22


graus de liberdade do resduo (variao dentro dos grupos) da tabela ANOVA
(tBonf;glresduo). A seguir, deve-se construir uma tabela de comparao entre as
mdias, conforme demonstrado na Tabela 19.10. Assim, de acordo com o teste
de Bonferroni, para que qualquer diferena entre elas seja considerada estatis-
ticamente significativa, necessrio que o valor de tBonf seja maior que o valor
crtico tabelado de tBonf;glresduo.
Para o caso do exemplo mostrado na Tabela 19.6 e para um nvel alfa de
5%, se considerarmos todas as possveis comparaes, o qual ser comparado
com os demais grupos, o valor de Bonf dado por:

0,05
Bonf = = 0,0167
3

Verificando a tabela da distribuio t de Student, para um teste bicaudal, o


valor mais prximo de 0,0167 0,02. Ento o valor crtico a ser utilizado nas
comparaes mltiplas t0,02;14 = 2,624. A Tabela 19.19 mostra os resultados
das comparaes entre os grupos estudados.

Tabela 19.10 Comparao entre as mdias pelo teste de Bonferroni

Grupos comparados x A xB tBonf t0,02;14 Concluso

A1 vs B2 1,330 2,062 < 2,624 Mdias no diferem

A1 vs C3 1,540 2,278 < 2,624 Mdias no diferem

B2 vs C3 2,87 4,245 > 2,624 Mdias diferem

19.5 ANOVA DE MLTIPLOS CRITRIOS

Como referido anteriormente, na ANOVA de mltiplos critrios, a


variao total observada no experimento atribuda variao natural entre
os diferentes tratamentos (entre os grupos), entre os sujeitos das amostras
(dentro dos grupos ou variao residual) e entre os blocos. Portanto, como
dois fatores so analisados neste tipo de estudo, no caso, as duas variveis

Anlise de varincia 225

BIOESTATISTICA_VOL02.indb 225 25/06/12 17:22


independentes, sendo cada uma delas medida em diferentes blocos, o modelo
chamado de delineamento em blocos casualizados, cuja anlise a ANOVA de
dois critrios (two way ANOVA).
Assim, tal como para a ANOVA de um critrio, demonstraremos apenas a
aplicao das frmulas alternativas, as quais esto relacionadas na Tabela 19.11,
tambm denominada tabela de anlise de varincia, cujo objetivo mostrar o
modelo geral de um experimento em blocos casualizados. Esta tabela utilizada
pela maioria dos programas computacionais estatsticos tradicionais.

Tabela 19.11 Modelo geral de tabela de anlise de varincia contendo as frmulas alternativas
para delineamentos em blocos casualizados
Fontes de Graus de liberdade Soma dos quadrados Varincia
Razo F
variao (gl) (SQ) (s2)

( x ) sT2 (Trat.)
2
Entre os grupos SQT
FcalcT =
glT = k 1 = C sT2 =
(tratamentos) SQT
k 1 s R2 (Res.)
b

Entre os blocos gl B = b 1 (TB2 ) s B2 =


SQB
FcalcB =
s B2 (Bloc .)
SQB = C
k b 1 s R2 (Re s .)

SQR
Variao residual gl R = glTot glT gl B SQR = SQTot SQT SQB s R2 =
gl R

Total glTot = (kb ) 1 SQTot = x 2 C

kN  mero de amostras (tratamentos) do


( x )
2

Fator de correo C = estudo


kb b Nmero de blocos do estudo
O raciocnio o mesmo utilizado para a ANOVA de um critrio. Inicialmente,
calcula-se o valor para a razo FcalcT , o qual ser comparado com o valor crtico
tabelado F;gl ;gl , de modo que se possa verificar se existe alguma diferena
T R
estatisticamente significativa entre os diferentes tratamentos (amostras).
Assim, se FcalcT > F;gl ;gl , conclui-se que existe ao menos uma diferena signi-
T R
ficativa, sendo a determinao da significncia entre os tratamentos, tomados
dois a dois, verificada pela aplicao de um teste de comparaes mltiplas
do tipo Tukey, Student-Newman-Keuls ou Bonferroni. Caso contrrio, se
FcalcT < F;gl ;gl , no h necessidade de se aplicar nenhum teste de comparaes
T R
mltiplas, pois no existem diferenas significativas entre os tratamentos. Do

226 Bioestatstica aplicada Pesquisa Experimental

BIOESTATISTICA_VOL02.indb 226 25/06/12 17:22


mesmo modo, para a comparao entre os blocos, o raciocnio idntico quele
empregado para os tratamentos.
A seguir, para ilustrar um modelo de aplicao da ANOVA de dois critrios,
utilizaremos uma variante do exemplo mostrado para a ANOVA de um critrio.

Exemplo: Em uma determinada cidade, com o objetivo de avaliar o padro


do ensino das escolas de ensino mdio, compararam-se as mdias obtidas nas
disciplinas Portugus, Matemtica, Fsica e Qumica (tratamentos), segundo
a categoria da escola de origem do aluno, seja ela federal, estadual, municipal
ou particular (blocos). Os dados esto relacionados na Tabela 19.11. Existe
diferena estatisticamente significante entre os aproveitamentos dos alunos
em relao s disciplinas cursadas? Existe diferena no padro de ensino
conforme a categoria da escola? Considerar nvel de significncia de 5%.

Tabela 19.12 Anlise da varincia para comparar as mdias das notas das disciplinas
(tratamentos) conforme o tipo de escola (blocos)
Mdias nas disciplinas
Total do bloco (TB)
Portugus Matemtica Fsica Qumica
Tipo de escola
Federal 6 9 9 6 30
Estadual 9 8 6 5 28
Municipal 9 7 7 4 27
Particular 8 8 6 5 27
Totais (x) 32 32 28 20 112

Mdias ( x ) 8 8 7 5

x2 262 258 202 102 824

Passo 1 Formular as hipteses estatsticas:


H0: No existe diferena entre as mdias das notas das disciplinas analisa-
das, pois P = M = F = Q .
HA: Ao menos uma das mdias difere das demais, sendo P M ou P F
ou P Q ou M F ou M Q ou F Q .
H0: A categoria da escola no interfere na mdia da disciplina analisada.
HA: A categoria da escola interfere na mdia da disciplina analisada.

Anlise de varincia 227

BIOESTATISTICA_VOL02.indb 227 25/06/12 17:22


Passo 2 Escolher o nvel de significncia (nvel alfa):
= 0,05 (5%) unilateral
Passo 3 Determinar o valor crtico do teste F:
gl do numerador (tratamentos) - glT = k 1 = 4 1 = 3
gl do numerador (blocos) - gl B = b 1 = 4 1 = 3
gl do total - glTot = (kb ) 1 = (4 x 4) 1 = 15
gl do denominador (resduo) - gl R = glTot glT gl B = 15 3 3 = 9

Ento:
Valor crtico para comparao entre os tratamentos = F;gl = F0,05;3;9 = 3,86
T ;glR

Valor crtico para comparao entre os blocos = F;gl = F0,05;3;9 = 3,86


B ;glR

Passo 4 Calcular o valor do fator de correo C:

( x )
2
1122 12.544
C= = = = 784
kb 16 16

Passo 5 Calcular o valor do teste F:

SQTot = x 2 C = 824 784 = 40

( x )
2
322 + 322 + 282 + 202
SQT = C = 784 = 808 784 = 24
b 4

SQT 24
sT2 = =8=
k 1 3

(TB2 ) 302 + 282 + 272 + 272


SQB = C = 784 = 785,50 784 = 1,50
k 4

SQB 1,50
s B2 = =
= 0,50
b 1 3

SQR = SQTot SQT SQB = 40 24 1,50 = 14 ,50

228 Bioestatstica aplicada Pesquisa Experimental

BIOESTATISTICA_VOL02.indb 228 25/06/12 17:22


SQR 14 ,50
s R2 = = = 1,61
gl R 9

sT2 Tratamentos 8 s 2 Blocos 0, 5


FcalcT = = = 4 , 96 e FcalcB = 2B = = 0,31
s R2 Resduo 1,61 s R Resduo 1,61

Tabela 19.13 Anlise de varincia para os dados da Tabela 19.12

Fonte de variao gl SQ QM (s2) Fcalc

Entre os grupos FcalcT = 4 , 96


3 24 8
(tratamentos)
P = 0,026

FcalcB = 0,31
Entre os blocos 3 1,5 0,5
P = 0,818
Dentro dos grupos
9 14,5 1,61
(variao residual)


Passo 6 Regra de deciso para a comparao entre os tratamentos:
Se FcalcT < F0,05;3;9 , aceita-se H 0 .

Se FcalcT F0,05;3;9 , rejeita-se H 0 .

Como FcalcT = 4,69 > F0,05;3;9 = 3,86, rejeita-se H 0 .

Passo 7 Regra de deciso para a comparao entre os blocos:

Se FcalcB < F0,05;3;9 , aceita-se H 0 .

Se FcalcB F0,05;3;9 , rejeita-se H 0 .

Como FcalcB = 0,31 < F0,05;3;9 = 3,86, aceita-se H 0 .

Passo 8 Concluso:
Como o valor para FcalcT maior que o valor crtico tabelado F0,05;3;9 ,
rejeita-se H0 e conclui-se que ao menos uma das mdias difere das de-
mais. Portanto, existe alguma diferena estatisticamente significante entre

Anlise de varincia 229

BIOESTATISTICA_VOL02.indb 229 25/06/12 17:22


as mdias referentes s disciplinas avaliadas, pois FcalcT = 4 ,69; P = 0,026 .
Por outro lado, como o valor de FcalcB menor que o valor crtico tabelado
F0,05;3;9 , aceita-se H0 e se conclui que no ocorreram diferenas estatistica-
mente significativas entre os blocos comparados, demonstrando, portan-
to, que a categoria da escola no influenciou nas mdias dos alunos, pois
FcalcB = 0,31; P = 0,818 .

Note que, no teste da ANOVA de dois critrios, tambm importante o


processo de randomizao para a distribuio dos tratamentos nas amostras,
mesmo que os pacientes sejam distribudos em grupos homogneos. No
exemplo acima, a seleo das mdias de cada disciplina (tratamentos) foi feita
de modo aleatrio entre todos os participantes de cada bloco, o que permite ao
pesquisador estimar a variao que devida categoria da escola, que pode
ser subtrada da variao residual. Este procedimento diminui o tamanho do
resduo, de modo que reste apenas a variao aleatria entre os indivduos
da pesquisa, a qual no pode ser atribuda nem disciplina avaliada nem
categoria da escola estudada.
Observe, tambm, que a distribuio em blocos melhora a preciso do
experimento, desde que seja interessante verificar se h diferena significativa
entre eles, pois, em muitos casos, os blocos so distribudos conforme uma
diferena j previamente reconhecida entre os indivduos do estudo. Porm,
se o teste F para a comparao entre os blocos no for significativo, isto pode
indicar que as unidades experimentais eram originalmente homogneas entre
si e no houve sucesso em reduzir a variao residual, ou que as amostras so
demasiadamente pequenas para apresentar alguma diferena significativa
entre elas.

230 Bioestatstica aplicada Pesquisa Experimental

BIOESTATISTICA_VOL02.indb 230 25/06/12 17:22


20
Anlise de Varincia
No-Paramtrica

Igualmente como j foi referido nos captulos anteriores, na pesquisa experi-


mental, sempre que os requisitos de normalidade dos dados amostrais forem
violados, para que possa testar suas hipteses, o pesquisador dever buscar uma
alternativa nos modelos no-paramtricos. Do mesmo modo, situao semelhante
ocorre na anlise de varincia, pois, embora o teste F seja bastante robusto,
mesmo para os casos de grandes amostras que no sigam princpio da norma-
lidade, o pesquisador deve sempre considerar o uso da ANOVA no-paramtrica,
especialmente quando estas so pequenas e desviam-se consideravelmente em
relao distribuio normal, assim como quando as varincias so acentuada-
mente desiguais e os tamanhos amostrais so diferentes.
De qualquer forma, tal como para os demais testes no-paramtricos,
na ANOVA no-paramtrica, os testes tomam como base a anlise dos dados
por postos em vez de considerarem os valores originais, de modo que, para a
ANOVA de um critrio, o mtodo no-paramtrico o teste de Kruskal-Wallis,
com as comparaes mltiplas post hoc entre as mdias podendo ser feitas
usando-se o teste da soma de postos de Wilcoxon. Por sua vez, para a ANOVA
de dois critrios em que h interesse em mais de duas amostras relacionadas,
em dois momentos distintos, o mtodo no-paramtrico de escolha o teste de
Friedman. Estes testes sero descritos a seguir.

BIOESTATISTICA_VOL02.indb 231 25/06/12 17:22


20.1 TESTE DE KRUSKAL-WALLIS (Teste H)

Tambm conhecido como teste H, o teste de Kruskal1-Wallis2 um procedi-


mento estatstico que objetiva comparar trs ou mais amostras independentes,
do mesmo tamanho ou de tamanhos desiguais, cujos escores so mensurados
em nvel ordinal (por postos), sendo, portanto, um substituto no-paramtrico
para a ANOVA de um critrio. Na prtica, o teste uma extenso do teste da
soma de postos de Wilcoxon-Mann-Whitney (WMW) para trs ou mais grupos.
Note, porm, para que o teste possa ser utilizado, necessrio que as trs
ou mais amostras sejam aleatrias e as observaes independentes, tanto dentro
de cada amostra como entre as amostras estudadas, ao mesmo tempo em que
a varivel considerada deve ser mensurada em escala ordinal, isto , que seja
apresentada do menor ao maior valor. Para tal, necessrio que cada valor da
mostra corresponda a um posto (escore ou rank), o qual deve ser representado
por um nmero natural, que indicar sua posio no conjunto de dados amostrais,
quando ordenados. Portanto, o menor valor da amostra receber o posto de
nmero 1, e assim sucessivamente, at que o maior valor receba o posto de maior
nmero. Quando ocorre a presena de valores iguais na amostra, considera-se a
mdia dos postos que seriam ocupados por eles, de tal modo que no afete o posto
seguinte. Tome-se, como exemplo, um conjunto de seis valores j ordenados: {9;
15; 17; 17; 21; 23}. Os respectivos postos sero: {1; 2; 3,5; 3,5; 5; 6}.

Raciocnio do teste
Para ilustrar o raciocnio, consideremos a comparao entre trs amostras
(tratamentos), A, B e C. Se os valores para os indivduos da amostra A forem,
em geral, menores que os valores para os indivduos das amostras B ou C,
quando se ordenam, do menor para o maior, todos os valores das trs amostras
consideradas conjuntamente, os postos ocupados pelos indivduos da amostra
A sero, em geral, menores do que os postos ocupados pelos indivduos das
amostras B e C. Como consequncia, o posto mdio da amostra A ser menor do

1. William Henry Kruskal (1919-2005) - Matemtico e estatstico americano, foi professor


emrito da Universidade de Chicago.
2 Wilson Allen Wallis (1912-1998) - Economista e estatstico americano, foi sub-secretrio de
economia, negcios e agricultura do governo de Ronald Reagan.

232 Bioestatstica aplicada Pesquisa Experimental

BIOESTATISTICA_VOL02.indb 232 25/06/12 17:22


que os postos mdios das amostras B e C. Neste caso, se a diferena encontrada
for grande o suficiente para que possa ser explicada alm do que se esperaria
encontrar somente pelo acaso, a diferena entre os trs postos mdios dita
estatisticamente significativa, indicando que a populao A diferente das
populaes B e C. O mesmo princpio aplicado para as amostras B e C, isto , o
teste verifica se ao menos uma das amostras difere das demais.
O teste envolve o clculo de um valor estatstico chamado de valor H, cuja
distribuio testada contra a hiptese de nulidade. No caso de pequenas
amostras (n < 6) e para experimentos onde o nmero de grupos (k) pequeno,
a significncia estatstica verificada com a utilizao da tabela de valores
crticos da distribuio H de Kruskal-Wallis (ver tabela no final do livro), a
qual fornece os valores crticos para H ;n ;n ;...n . Mas, para grandes amostras
1 2 i
ou quando mais de cinco grupos (k > 5) so comparados, a estatstica H tem
uma boa aproximao com a distribuio qui-quadrado (2), sendo, neste
caso, o valor Hcalc comparado com o valor crtico tabelado a;gl com (k 1)
2

graus de liberdade. Assim, importante saber que os procedimentos para


a utilizao do teste H de Kruskal-Wallis diferem de acordo com o tamanho
amostral, todos facilmente calculados e que sero mostrados a seguir:

Inicialmente, ordenam-se, do menor para o maior, os valores das amostras


e anota-se, ao lado de cada valor, o nmero de ordem (ou posto) corres-
pondente. No esquea que, se houver empate, o posto para cada valor
empatado corresponde mdia dos postos que seriam ocupados por eles;
A seguir, determinam-se os tamanhos amostrais, os quais so designados
por n1, n2, n3,..., ni;
Obtm-se os valores para R1, R2, R3,..., Ri, que correspondem s somas dos
postos para as amostras 1, 2, 3, ...ki, respectivamente. Se a ordenao estiver
correta, teremos:

N (N + 1)
Ri = 2
; para N = n1

Em seguida, calcula-se o valor do teste (H calc). A frmula mostrada a


seguir:

Anlise de Varincia No-Paramtrica 233

BIOESTATISTICA_VOL02.indb 233 25/06/12 17:22


12 Ri2
Hcalc = 3(N + 1), onde: N = ni
N (N + 1) ni
ni - Tamanho de cada amostra.
Ri - S oma dos postos de cada
amostra.

Se ocorrerem empates nos postos, o valor de Hcalc dever ser corrigido pelo
fator de correo (FC) conforme a frmula abaixo:

CE
FC = 1 ; onde: CE = (t 3 t )
N3 N

Sendo t o nmero de observaes empatadas em cada posto. Por exemplo:


se hover dois empates com o posto 2,5 e outros quatro empates com o posto
7,5, o clculo para CE ser:

CE = (23 2) + (43 4) = 66

Hcalc
Ento: Hcorrig =
FC

Finalmente, o teste de significncia realizado da seguinte maneira: se o


valor de Hcalc for maior que o valor crtico tabelado H a;n ;n ;...n ou ;gl , a
2

1 2 i
hiptese nula rejeitada. Caso contrrio, aceita-se a hiptese nula.
Assim temos:
H0: os tratamentos no diferem significativamente entre si;
H1: ao menos um dos tratamentos difere significativamente dos demais.
Para demonstrar a aplicao do teste Kruskal-Wallis, utilizaremos o
seguinte exemplo:

Exemplo: O teste de Apgar3 um exame rpido realizado imediatamente


aps o nascimento, cujo objetivo avaliar, ainda na sala de parto, a condio

3. Virginia Apgar (1909-1974) Mdica americana especializada em anestesia peditrica, foi a


fundadora da neonatologia, sendo mais conhecida pela criao do teste de Apgar, um mtodo
revolucionrio de avaliar a sade de recm-nascido, que reduziu drasticamente a mortalidade
infantil em todo o mundo.

234 Bioestatstica aplicada Pesquisa Experimental

BIOESTATISTICA_VOL02.indb 234 25/06/12 17:22


fsica do recm-nascido. O teste feito pela anlise dos batimentos cardacos,
reflexos, tnus muscular, cor da pele e respirao, os quais recebem nota de 0 a
2, podendo chegar ao mximo de 10, que corresponde criana mais saudvel,
e os valores inferiores a 5 indicam que o recm-nascido necessita de assis-
tncia mdica imediata para se adaptar ao novo ambiente. Um pesquisador,
que queria verificar se a idade materna interfere no teste de Apgar, comparou
os escores obtidos em trs grupos de mulheres, adolescentes (idade < 20 anos),
adultas jovens (idade de 20 a 34 anos) e adultas maduras (idade > 34 anos).
Os escores (j ordenados) so apresentados nas tabelas 20.1 e 20.2, abaixo.
Portanto, existe diferena estatisticamente significativa nos valores do teste de
Apgar entre as crianas nascidas de mes com diferentes faixas etrias?

Tabela 20.1 Ordem, escore do teste de Apgar e o respectivo posto para cada um
dos 17 recm-nascidos includos no estudo.

Paciente 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17

Escore 4 5 6 6 6 7 7 7 8 8 8 8 9 9 10 10 10

Posto 1 2 4 7 10,5 13,5 16

Tabela 20.2 - Ordem, escore do teste de Apgar e o respectivo posto para cada um
dos 17 recm-nascidos conforme a idade materna

Idade < 20 anos Idade de 20 a 34 anos Idade > 34 anos


RN Escore Posto RN Escore Posto RN Escore Posto
5 6 4 7 7 7 1 4 1
6 7 7 8 7 7 2 5 2
10 8 10,5 9 8 10,5 3 6 4
11 8 10,5 14 9 13,5 4 6 4
13 9 13,5 16 10 16 12 8 10,5
10 10 16 17 10 16 -- -- --
Ri 61,5 70,0 21,5
ni 6 6 5

Ri
Ri = R1 = 10,25 R2 = 11,66 R3 = 4 ,30
ni

Anlise de Varincia No-Paramtrica 235

BIOESTATISTICA_VOL02.indb 235 25/06/12 17:22


Uma vez que, na populao estudada, no existe um padro de distribuio
para o teste de Apgar, e o nmero de indivduos nas trs amostras pequeno,
a melhor maneira de compar-las utilizar um teste no-paramtrico. Neste
caso, o teste Kruskal-Wallis o mais adequado, pois as trs amostras so
independentes e a varivel estudada do tipo ordinal.

Passo 1 Formular as hipteses estatsticas:


H0:No existem diferenas entre as mdias dos escores do teste de Apgar
para os grupos analisados, pois 1 = 2 = 3 .
HA:Ao menos uma das mdias difere das demais, sendo 1 2 ou 1 3
ou 2 3 .
Passo 2 Escolher o nvel de significncia (nvel alfa):
= 0,05 (5%) unilateral
Passo 3 Determinar o valor crtico do teste:
H ;n ;n ;n = H 0,05;6;6;5 = 5,765
1 2 3
Passo 4 Calcular o valor do teste Hcalc:

N (N + 1) 17(17 + 1)
Sendo Ri = ; ento (61,5 + 70,0 + 21,5) = 153 =
2 2
A ordenao est correta.

12 61,52 70,02 21,52


Assim: Hcalc = + + 3(1
17 + 1) = 6,372
17(17 + 1) 6 6 5

Como foram observados empates para os escores 6, 7, 8, 9 e 10, necess-


rio realizar a correo para Hcalc.

Passo 5 Calcular o valor do teste Hcorrig:

CE = (33 3) + (32 3) + (43 4) + (23 2) + (33 3) = 24 + 24 + 60 + 6 + 24 = 138

138 138
FC = 1 = 1 = 1 0,0282 = 0, 972
17 17
3 4.896

Hcalc 6,372
Hcorrig = = = 6,556
FC 0, 972

236 Bioestatstica aplicada Pesquisa Experimental

BIOESTATISTICA_VOL02.indb 236 25/06/12 17:22


Passo 6 Regra de deciso:

Se Hcorrig < H 0,05;6;6;5 , aceita-se H 0 .

Se Hcorrig H 0,05;6;6;5 , rejeita-se H 0 .

Como Hcorrig = 6,556 > H 0,05;6;6;5 = 5,765, rejeita-se H 0 .

Passo 7 Concluso:
Como o valor para Hcorrig maior que o valor crtico tabelado H 0,05;6;6;5 ,
rejeita-se H0 e conclui-se que ao menos uma das mdias difere das demais.
Portanto, existe alguma diferena estatisticamente significativa entre as
mdias dos testes de Apgar de crianas nascidas de mes com diferentes
faixas etrias, pois Hcorrig = 6,556; P = 0,037 .

Assim, como j anteriormente explicado, quando o resultado do teste H no


estatisticamente significante, nenhum outro teste adicional necessrio, uma
vez que se estima que todas as mdias sejam estatisticamente semelhantes e,
portanto, foram retiradas da mesma populao. Isto , elas estimam a mesma
mdia . No entanto, quando ocorre uma diferena significativa entre as
mdias amostrais, o teste H no indica quais destas mdias so estatistica-
mente diferentes entre si. Neste caso, para que se possam determinar quais
so diferentes, deve-se passar para a segunda fase da ANOVA no-paramtrica,
na qual se aplica um dos testes de comparaes mltiplas disponveis, sendo o
teste de Dunn o mais utilizado e que ser mostrado a seguir.

20.1.1 Teste de Dunn (Teste Q)


O teste de Dunn um procedimento no-paramtrico post hoc, que
corresponde ao teste de comparaes mltiplas de Tukey utilizado na ANOVA
paramtrica (Teste F). O raciocnio do teste semelhante e baseia-se na compa-
rao entre os postos mdios ( Ri ) obtidos para cada amostra (tratamento).
O teste de Dunn realizado comparando-se o valor de Qcalc para cada uma
das diferenas entre os postos mdios ( Ri ) analisados, com o valor crtico
tabelado Q;k obtido na tabela de valores crticos da distribuio Q (ver tabela
no final do livro). O valor Qcalc obtido pela seguinte frmula:

Anlise de Varincia No-Paramtrica 237

BIOESTATISTICA_VOL02.indb 237 25/06/12 17:23


RA RB N (N + 1) 1 1
Qcalc = , onde: EP = +
EP 12 nA nB

Sendo: RA e RB = Os postos mdios das duas amostras que esto sendo
comparadas.
EP = Erro padro de cada diferena entre os postos mdios que
esto sendo comparados.
N= ni
nA e nB = Tamanho das duas amostras que esto sendo comparadas.

Se ocorrerem empates, o EP deve ser corrigido pela seguinte frmula:

N (N + 1) CE 1 1
EP = + , onde: CE = (t 3 t )
12 12(N 1) nA nB

Aps calcular os valores para o erro padro (EP) e para o Qcalc, deve-se
construir uma tabela de comparao entre os postos mdios, conforme
demonstrado na Tabela 20.3. Assim, de acordo com o teste de Dunn, para que
qualquer diferena entre eles seja considerada estatisticamente significativa,
necessrio que o valor de Qcalc seja maior que o valor tabelado de Q;k. Assim,
para o exemplo mostrado na Tabela 20.2, os testes de significncia entre os
postos mdios so mostrados abaixo:

Passo 1 Calcular o valor crtico do teste:


Q0,05;3 = 2,394
Passo 2 Determinar os valores para Qcalc:

R1 R2
Qcalc 1;2 =
N (N + 1) CE 1 1
+
12 12(N 1) n1 n2

|10,25 11,66 | 1, 410


= = = 0, 490
17(17 + 1) 138 1 1 2,874
+
12 12(17 1) 6 6

238 Bioestatstica aplicada Pesquisa Experimental

BIOESTATISTICA_VOL02.indb 238 25/06/12 17:23


R1 R3
Qcalc 1;3 =
N (N + 1) CE 1 1
+
12 12(N 1) n1 n3

|10,25 4 ,30 | 5, 950


= = = 1, 974
17(17 + 1) 138 1 1 3,014
+
12 7 1) 6 5
12(17

R2 R3
Qcalc 2;3 =
N (N + 1) CE 1 1
+
12 12(N 1) n2 n3

|11,66 4 ,30 | 7,360


= = = 2, 442
17(17 + 1) 138 1 1 3,014
+
12 7 1) 6 5
12(17

Passo 3 Construir a tabela de comparao:

Tabela 20.3 Comparao entre as mdias pelo teste de Dunn


Grupos etrios
| RA e RB | Qcalc Q0,05;3 Concluso
comparados
< 20 vs 20 a 34 1,410 0,490 < 2,394 Mdias no diferem
< 20 vs > 34 5,950 1,974 < 2,394 Mdias no diferem
20 a 34 vs > 34 7,360 2,442 > 2,394 Mdias diferem

Passo 4 Concluso:
Ocorreu diferena estatisticamente significativa somente entre os recm-
-nascidos dos grupos de mes com idade de 20 a 34 anos e idade > 34 anos.

Observe, tambm, que os valores do teste de Agar foram, em mdia,


maiores para os recm-nascidos de mes com idade compreendida de 20 a 34

Anlise de Varincia No-Paramtrica 239

BIOESTATISTICA_VOL02.indb 239 25/06/12 17:23


anos e menores para os recm-nascidos de mes com idade maior de 34 anos.
Porm, para os valores dos recm-nascidos de mes com idade menor de 20
anos, o resultado do teste de Dunn foi inconclusivo, provavelmente em razo
do pequeno tamanho amostral utilizado na pesquisa.

20.2 TESTE DE FRIEDMAN (Teste r )


2

O teste Friedman4 corresponde a um modelo de teste estatstico


no-paramtrico utilizado como uma alternativa para a ANOVA de dois critrios.
Os dados devem ser mensurados em nvel ordinal, e a comparao feita entre
trs ou mais amostras (tratamentos) relacionadas ou dependentes, cujos
valores so distribudos por blocos. Na prtica, comparam-se os k tratamentos
em que so formados b blocos, com a finalidade de que ocorra um pareamento
entre as diferentes amostras. As amostras devem ter o mesmo tamanho, e os
dados devem ser dispostos em linhas, que representam os blocos, e em colunas,
que representam as condies experimentais ou tratamentos.
A realizao do modelo de Friedman semelhante aos demais testes
no-paramtricos:

Inicialmente, atribui-se o nmero de ordem (posto), de modo crescente,


para os valores dentro de cada bloco (linhas). No esquea que, se houver
empate, o posto para cada valor empatado corresponde mdia dos postos
que seriam ocupados por eles;
Posteriormente, obtm-se os valores para R1, R2, R3,..., Ri, que corres-
pondem s somas dos postos dentro de cada tratamento (colunas);
Em seguida, calcula-se o valor do teste r . A frmula mostrada abaixo:
2

k
12
2r =
b.k (k + 1) i =1
Ri2 3.b(k + 1), onde : b - Nmero de blocos.
k Nmero de tratamentos.
Ri - Soma dos postos de cada
amostra.

4. Milton Friedman (1912-2006) Economista e estatstico americano ganhador do prmio


Nobel de Economia em 1976.

240 Bioestatstica aplicada Pesquisa Experimental

BIOESTATISTICA_VOL02.indb 240 25/06/12 17:23


Se ocorrerem empates nos postos, o valor de r dever ser corrigido
2

pelo fator de correo (FC) conforme a frmula abaixo. A nica diferena que
a ordenao se faz separadamente dentro de cada bloco.

CE
FC = 1 ; onde : CE = (t 3 t )
b(k k )
3

Sendo t o nmero de observaes empatadas em cada posto, dentro de


cada bloco. Por exemplo: se no bloco 1, houver dois empates com o posto 1,5 e,
no bloco 2, 3, empates com o posto 2, o clculo para CE ser:

CE = (23 2) + (33 3) = 30

2r
Ento: c2rorrig =
FC

Finalmente, o teste de significncia realizado da seguinte maneira: no


caso de pequenas amostras, isto , k 6 e b 155, a significncia estatstica
verificada com a utilizao da tabela de valores crticos da distribuio r
2

de Friedman (ver tabela no final do livro), a qual fornece os valores crticos


para r ;k ;b . Mas, para grandes amostras (k > 6 ou b > 15), a estatstica r
2 2

tem uma boa aproximao com a distribuio qui-quadrado (2), sendo, neste
caso, o valor rcalc comparado com o valor crtico tabelado r ;( k -1) com
2 2

(k 1) graus de liberdade. Assim, se o valor de rcalc for maior que o valor


2

crtico tabelado r ;k ;b ou r ;( k -1) , a hiptese nula rejeitada. Caso contrrio,


2 2

aceita-se a hiptese nula. Assim, temos:

H0: os tratamentos no diferem significativamente entre si;


H1: ao menos um dos tratamentos difere significativamente dos demais.

Para demonstrar a aplicao do teste de Friedman, utilizaremos o seguinte


exemplo:

5. A tabela da distribuio de Friedman contm apenas valores crticos at k = 6 e b = 15.

Anlise de Varincia No-Paramtrica 241

BIOESTATISTICA_VOL02.indb 241 25/06/12 17:23


Exemplo: Um estudo simples-cego foi delineado para avaliar o sabor e
aroma de quatro variedades de caf (Coffea sp). Para tal experimento, cinco
baristas6 foram selecionados, e cada um deles deveria atribuir um escore de
zero a dez pontos, conforme a preferncia individual. Os resultados esto
relacionados na Tabela 20.4. A anlise dos baristas foi influenciada pela
variedade do caf?

Tabela 20.4 Valores dos escores, e respectivos postos, atribudos a quatro variedades de caf,
conforme a preferncia individual de cada um dos cinco baristas selecionados para o estudo

Cramer Bourbon Caturra Robusta


Barista
Escore Posto Escore Posto Escore Posto Escore Posto

01 4 1 5 2 7 3 8 4

02 6 1,5 6 1,5 7 3 8 4

03 7 2 6 1 8 3 9 4

04 8 1,5 8 1,5 9 3,5 9 3,5

05 8 1 9 2 10 3,5 10 3,5

Ri R1 = 7 R2 = 8 R3 = 16 R4 = 19

Uma vez que, na populao estudada, no existe um padro de distribuio


para a anlise sensorial avaliada e o nmero de observaes nas amostras
pequeno, a melhor maneira de compar-las utilizar um teste no-paramtrico.
Neste caso, o teste de Friedman o mais adequado, pois as quatro amostras so
relacionadas, e a varivel estudada do tipo ordinal.

Passo 1 Formular as hipteses estatsticas:


H0: No existem diferenas entre as mdias dos escores para as espcies de
caf analisadas, pois 1 = 2 = 3 = 4 .
HA: Ao menos uma das mdias difere das demais, sendo 1 2 ou 1 3
ou 1 4 ou 2 3 ou 2 4 ou 3 4 .

6. Barista - Profissional especializado em cafs, cuja principal funo conhecer todas as fases
da vida do produto, desde o cultivo da planta, etapas de processamento e beneficiamento do
gro, alm dos detalhes dos processos de extrao da bebida.

242 Bioestatstica aplicada Pesquisa Experimental

BIOESTATISTICA_VOL02.indb 242 25/06/12 17:23


Passo 2 Escolher o nvel de significncia (nvel alfa):
= 0,05 (5%) unilateral
Passo 3 Determinar o valor crtico do teste:
2r ;k ;b = H 0,05;4;5 = 7,800

Passo 4 Calcular o valor do teste rcalc :


2

2rcalc =
12
5.4(4 + 1)
( )
72 + 82 + 162 + 192 3.5(4 + 1) = 87,60 75,00 = 12,600

Como foram observados empates nos blocos 2, 4 e 5, necessrio realizar


a correo para rcalc .
2

Passo 5 Calcular o valor do teste rcorrig :


2

Bloco 1 - 2 postos empatados em 1,5 (23 2)


Bloco 4 - 2 postos empatados em 1,5 (23 2)
2 postos empatados em 3,5 (23 2)
Bloco 5 - 2 postos empatados em 3,5 (23 2)

CE = (23 2) + (22 2) + (23 2) + (23 2) = 24

24 24
FC = 1 = 1 = 1 0,080 = 0, 920
5(43 4) 300

2rcalc 12,600
2rcorrig = = = 13,695
FC 0, 920

Passo 6 Regra de deciso:

Se 2rcorrig < 2r 0,05;4;5 , aceita - se H 0 .

Se 2rcorrig 2r 0,05;4;5 , rejeita - se H 0 .

Como 2rcorrig = 13,695 > 2r 0,05;4;5 = 7,800, rejeita - se H 0 .

Anlise de Varincia No-Paramtrica 243

BIOESTATISTICA_VOL02.indb 243 25/06/12 17:23


Passo 7 Concluso:
Como o valor para rcorrig maior que o valor crtico tabelado r 0,05;4;5 ,
2 2

rejeita-se H0 e se conclui que ao menos uma das mdias difere das


demais. Portanto, existe alguma diferena estatisticamente signifi-
cativa entre as avaliaes dos baristas e o tipo de caf analisado, pois
2rcorrig = 13,695; P = 0,005 .

Assim, como j anteriormente explicado, quando o resultado do teste r


2

no estatisticamente significante, nenhum outro teste adicional neces-


srio, uma vez que se estima que todas as mdias sejam estatisticamente
semelhantes e, portanto, foram retiradas da mesma populao. Isto , elas
estimam a mesma mdia . No entanto, quando ocorre uma diferena signifi-
cativa entre as mdias amostrais, o teste r no indica quais destas mdias so
2

estatisticamente diferentes entre si. Neste caso, para que se possam deter-
minar quais so diferentes, deve-se passar para a segunda fase da ANOVA
no-paramtrica, na qual se aplica um dos testes de comparaes mltiplas
disponveis em estatstica.

244 Bioestatstica aplicada Pesquisa Experimental

BIOESTATISTICA_VOL02.indb 244 25/06/12 17:23


21
Regresso Mltipla

Neste captulo, abordaremos dois modelos de anlise de regresso: a


anlise de regresso mltipla e a regresso logstica, todos muito utilizados
em pesquisa na rea das cincias da sade. Em ambos, correlacionam-se duas
ou mais variveis independentes com apenas uma varivel dependente, obser-
vando-se que o primeiro modelo deve ser utilizado quando a varivel-resposta
(dependente) e todas as variveis preditoras (independentes) so contnuas,
enquanto que a regresso logstica deve ser o mtodo de escolha para os casos
em que a varivel-resposta dicotmica (binria) e as variveis preditoras so
contnuas ou categricas.

21.1 REGRESSO LINEAR MLTIPLA

No captulo 12 deste livro, descrevemos os procedimentos para a regresso


linear simples, a qual deve ser utilizada quando o pesquisador deseja fazer
previso para o valor de uma varivel-resposta (y) com base no conhecimento
dos valores de uma nica varivel preditora (x). Do mesmo modo, a anlise de
regresso linear mltipla corresponde a uma generalizao direta da regresso

BIOESTATISTICA_VOL02.indb 245 25/06/12 17:23


linear simples, exceto pelo fato de que, na regresso mltipla utilizam-se duas
ou mais variveis preditoras.
Assim, a ttulo de uma breve reviso, lembramos que o modelo de
regresso linear simples dado pela equao da reta y = a + bx, onde y corres-
ponde ao valor encontrado para a varivel dependente e x o valor da varivel
dependente. Por sua vez, a constante a representa o intercepto, isto , o ponto
em que a reta cruza, no grfico, o eixo das ordenadas (eixo y), ao passo que
a constante b corresponde inclinao da reta, ou seja, ao ngulo que ela
forma com o eixo das abscissas (eixo x), sendo conhecido, tambm, como
coeficiente de regresso.
Portanto, interessante notar que verdadeira reta de regresso para uma
dada populao somente seria obtida caso todos os valores de x e y fossem
conhecidos. Porm, como normalmente isso impossvel de ser feito, o mais
comum que a regresso entre as variveis estudadas seja calculada tomando-
-se uma amostra n de pontos, aleatoriamente coletados, da populao e, a partir
desses pontos, determinar os valores do coeficiente linear (a) e do coeficiente
angular (b), de tal maneira que a reta encontrada possa ser ajustada. Assim,
para que se possa utilizar a reta de regresso a fim de fazer previses para y,
com base em valores determinados de x, deve-se realizar um teste de hiptese
para verificar se a regresso de x sobre y verdadeira, isto , se a dependncia
de y em relao a x real, se no ocorreu por acaso, em razo do erro aleatrio.
Deste modo, como a dependncia de y em relao a x dada pelo coeficiente de
regresso (b), o qual geralmente calculado com base em uma amostra, o teste
de hiptese serve para verificar se existe uma diferena estatisticamente signi-
ficativa entre o coeficiente calculado b e o verdadeiro coeficiente da populao
(B) de onde a amostra foi retirada.
O mesmo princpio aplicado regresso linear mltipla, cujo modelo
matemtico dado pela seguinte equao:

y = a + b1x 1 + b2x 2 + b3x 3 + ... + bk x k

Onde: a = Intercepto do eixo y;


bi = Coeficiente angular da i-sima varivel;
k = Nmero de variveis independentes.

246 Bioestatstica aplicada Pesquisa Experimental

BIOESTATISTICA_VOL02.indb 246 25/06/12 17:23


Na equao, onde b1 o coeficiente de regresso associado primeira
varivel preditora x1 e b2 o coeficiente de regresso associado segunda
varivel preditora x2 e assim por diante, o modelo conhecido como combi-
nao linear, cujas frmulas para calcular a e b foram mostradas no captulo
12. Note que ela representa um modelo para resumir a combinao de
diferentes variveis em um nico valor numrico, pois corresponde a uma
mdia ponderada resultante da soma dos valores de x multiplicados por seus
respectivos coeficientes de regresso, de modo que a introduo de variveis
independentes adicionais aumenta a capacidade de predio do modelo em
relao regresso linear simples. Este procedimento visa a reduzir o valor
do intercepto, o qual, em regresso, significa a parte da varivel dependente
explicada por outras variveis que no aquelas consideradas na pesquisa.
Deste modo, mesmo quando estamos interessados em estudar o efeito
de uma nica varivel preditora sobre uma dada varivel-resposta, sempre
aconselhvel incluir, mediante a aplicao de um modelo de anlise de
regresso mltipla, as outras variveis capazes de afetar o comportamento
desta varivel-resposta. Este procedimento reduz o erro aleatrio decorrente
do processo de amostragem, reduz a varincia residual e aumenta o poder
do teste estatstico, alm de minimizar o vis resultante da no-introduo,
no modelo, de uma varivel importante para o desfecho esperado. Aqui, cabe
uma observao: na anlise de regresso mltipla, a existncia de correlao
entre uma varivel dependente e um conjunto de variveis independentes
no significa necessariamente uma relao de causalidade, mas apenas uma
relao estatstica.
Eventualmente, em uma anlise de regresso mltipla, pode-se incluir,
entre as variveis preditoras, uma varivel nominal do tipo binria, como o
sexo, por exemplo. Quando isto ocorre, os dois resultados possveis para esta
varivel precisam ser convencionalmente codificados. No caso da varivel sexo,
as mulheres podem receber o cdigo 0 e os homens o cdigo 1, ou vice-versa.
Este procedimento, conhecido como codificao dummy, permite que uma
varivel nominal possa ser includa em uma equao de regresso calculada
por programas computacionais. Porm, a deciso de qual dos dois resultados
recebe o cdigo 0 e qual recebe o cdigo 1 puramente arbitrria e depende
exclusivamente do pesquisador, que deve escolher a maneira mais conveniente

Regresso Mltipla 247

BIOESTATISTICA_VOL02.indb 247 25/06/12 17:23


para a interpretao dos seus resultados. A interpretao de uma varivel
dummy feita sempre em relao ao resultado codificado como 1.

21.1.1 Construo do modelo


Em um modelo de regresso linear mltipla, a deciso crucial para o
pesquisador est em selecionar o menor nmero de variveis preditoras, para
que a maior porcentagem possvel de variao da varivel-resposta possa ser
explicada. Por exemplo, acrescentar uma varivel, que seja responsvel apenas
por uma pequena frao de variao, pode no ser compensador. Assim, o
pesquisador dever selecionar um modelo de regresso que lhe permita
escolher, dentre outras, as variveis que atuam de maneira mais importante
sobre o desfecho a ser estudado.

Clculo dos indicadores da correlao mltipla


Tal como na regresso simples, os indicadores representam uma impor-
tante ferramenta para a interpretao dos resultados. A seguir, descreveremos
os principais indicadores utilizados na anlise de regresso mltipla.

Coeficiente de correlao mltipla (R) Semelhante ao coeficiente de


correlao produto-momento de Pearson (r), calculado para a regresso
linear simples, na regresso mltipla, calcula-se o coeficiente de correla-
o mltipla R, o qual interpretado exatamente da mesma maneira, isto
para indicar a intensidade da relao linear entre as variveis preditoras e
a varivel-resposta estudada.
Matriz de correlao O uso da tabela de correlaes uma ferramenta
muito til na verificao de possveis correlaes entre as variveis predi-
toras (colinearidade1). Assim, para evitar o problema de colinearidade, a
matriz de correlaes entre as variveis independentes deve ser analisada.
Como regra geral, se a correlao entre duas variveis for superior a 0,70,
pode haver colinearidade entre elas. Esta regra, no entanto, ineficiente,
sendo a melhor alternativa aquela em que seriam analisadas todas as pos-

1. A colinearidade ocorre quando duas ou mais variveis independentes apresentam correlao


entre si.

248 Bioestatstica aplicada Pesquisa Experimental

BIOESTATISTICA_VOL02.indb 248 25/06/12 17:23


sveis correlaes entre cada uma das variveis preditoras. Isto pode ser
feito construindo-se a matriz de correlaes combinadas.
Coeficiente de determinao mltipla (R2) Do mesmo modo, o coefi-
ciente de determinao da regresso (R2) tambm pode ser calculado, o
qual indica o percentual da varincia total da varivel dependente, que
explicado pela equao de regresso. A colinearidade entre as variveis
preditoras tambm pode ser identificada pelo coeficiente de determina-
o. Isto ocorre quando este coeficiente relativamente alto e, no entan-
to, todos os coeficientes de regresso no apresentam valores estatistica-
mente significativos. Para eliminar o problema da colinearidade, algumas
variveis independentes podem ser retiradas da equao aps anlise da
matriz de correlao.
Coeficiente de determinao mltipla ajustado (R2A) outro im-
portante indicador, pois, na anlise de regresso mltipla, toda vez que
uma varivel independente adicionada equao, o coeficiente de de-
terminao aumenta, mesmo que esta nova varivel no contribua sig-
nificativamente para a explicao da varincia residual. Desta forma,
til analisar o coeficiente de determinao ajustado, que, ao contrrio
do coeficiente de determinao, diminui se a varivel adicionada possuir
um pequeno poder de explicao para a varivel-resposta, podendo ter
at um valor negativo.
Estatstica t calculada para determinar se cada um dos coeficientes de
regresso estatisticamente significativo. Ela utiliza a funo da distribui-
o t de Student para retornar os valores da probabilidade de significncia,
assim como para gerar os intervalos de confiana (IC) para cada coeficien-
te de regresso.
Teste ANOVA utilizado na verificao da significncia estatstica para
os valores do coeficiente de correlao mltipla (R) e coeficiente de deter-
minao (R2). Utiliza a funo da distribuio F para retornar os valores de
probabilidade de significncia.
Estatstica Durbin-Watson (DW) utilizada para verificar se existe co-
linearidade entre as variveis independentes includas no modelo. O valor
da estatstica DW calculado com os resduos (erros) da equao de re-
gresso. A anlise da estatstica de Durbin-Watson feita a partir da ta-

Regresso Mltipla 249

BIOESTATISTICA_VOL02.indb 249 25/06/12 17:23


bela de valores crticos (ver tabela no final do livro). As concluses sobre
o coeficiente DW devem considerar o limite crtico inferior (dL) e o limite
crtico superior (dU), obtidos nessa tabela, o qual depende no nvel de sig-
nificncia (), do nmero de variveis independentes (k) e do tamanho da
amostra (n) do modelo. A frmula a seguinte:

n
(i i 1 )2
DW = i =2
n
2i
i =1

Clculo do coeficiente de regresso padronizado ()


De todo jeito, tal como ocorre na regresso simples, relevante notar que
a regresso mltipla avalia apenas a relao linear entre as variveis preditoras
e a varivel-resposta. Por sua vez, os coeficientes de regresso (bi) so inter-
pretados de modo diferente na regresso mltipla quando comparados com
a regresso simples. Nesta, o coeficiente de regresso b indica a quantidade
de variao da varivel-resposta y, que devida a cada acrscimo de uma
unidade na varivel preditora x. Na regresso mltipla, um determinado coefi-
ciente de regresso bi mostra at que ponto o valor da varivel-resposta y pode
ser alterado em funo do aumento de uma unidade na varivel preditora xi,
mantendo-se constantes os valores das demais variveis preditoras da equao
de regresso. Porm, embora sejam importantes, na anlise mltipla, os valores
dos coeficientes de regresso no podem ser utilizados para se decidir quais
variveis preditoras so as mais importantes, uma vez que eles se referem s
diferentes grandezas, pois cada um deles est relacionado com a escala em
que a varivel x foi mensurada. Deste modo, a nica informao que se pode
inferir desses coeficientes que o sinal positivo ou negativo descreve o sentido
da correlao entre a varivel preditora e o desfecho, ou seja, se a correlao
positiva ou negativa, sendo, por este motivo, chamados de coeficientes de
regresso no-padronizados.
Uma maneira de eliminar este inconveniente, padronizar os coefi-
cientes de regresso, o que pode ser feito a partir da equao de regresso.
Para tal, basta multiplicar o coeficiente de regresso no-padronizado pelo

250 Bioestatstica aplicada Pesquisa Experimental

BIOESTATISTICA_VOL02.indb 250 25/06/12 17:23


desvio padro da varivel x e, em seguida, dividir o resultado pelo desvio-
-padro da varivel y. Assim, temos:

bi .s x
i =
sy

Assim, uma vez que a padronizao tenha sido realizada, pode-se, agora,
comparar as magnitudes dos valores dos coeficientes de regresso e fazer
inferncias acerca de quais variveis preditoras so mais importantes na deter-
minao do desfecho da varivel-resposta, pois, quanto maior for o coeficiente,
maior ser a influncia de x sobre y.

Modelo de regresso mltipla escalonada


A escolha do modelo um dos passos mais importantes na anlise de
regresso mltipla, pois ele que ir possibilitar a escolha das variveis
independentes que mais se correlacionam com a varivel-resposta. Os modelos
mais tradicionais compreendem a seleo progressiva (mtodo forward) e a
eliminao regressiva (mtodo backward).
No modelo de seleo progressiva, o processo comea com a incluso
da varivel preditora x que tiver maior correlao com a varivel-resposta y.
Em seguida, as demais variveis preditoras so acrescentadas uma de cada
vez, at que todas as variveis estatisticamente significativas sejam includas
na equao de regresso, respeitando-se a ordem decrescente de seus coefi-
cientes de correlao. Por sua vez, o modelo de eliminao regressiva comea
pela incluso de todas as variveis preditoras e, em seguida, aquelas que no
apresentam coeficiente de regresso significativo so retiradas da equao.
Aps este procedimento, a equao deve ser recalculada, usando-se, agora,
apenas as variveis significativas, uma vez que estes coeficientes modificam-se
quando algumas variveis so retiradas da anlise.
Uma outra abordagem para a escolha das variveis preditoras usar
o processo regresso escalonada, o qual combina os dois procedimentos
descritos acima. O mtodo inicia da mesma maneira que a seleo progressiva.
Entretanto, aps a incluso, na equao, de uma nova varivel preditora
x, procede-se verificao para saber se todas as variveis anteriormente

Regresso Mltipla 251

BIOESTATISTICA_VOL02.indb 251 25/06/12 17:23


includas mantm o seu nvel de significncia. Caso isto ocorra, cada uma delas
ser mantida na equao de regresso somente se a sua retirada causar uma
reduo significativa no coeficiente de determinao R2. Caso contrrio, ela ser
eliminada. O processo se repete at que todas as variveis explicativas tenham
sido testadas. No dia a dia da pesquisa, a utilizao de programas computa-
cionais oferece opes para a escolha do melhor modelo de combinao entre
todas variveis preditoras includas no estudo.
A seguir, mostraremos um exemplo de regresso linear mltipla. Os clculos
no sero aqui abordados, uma vez que foram apresentados no captulo 12, que
trata da regresso linear simples. Para tal, ser utilizado o programa BioEstat,
de fcil aplicao.
Exemplo: Suponha que uma pesquisa foi conduzida para verificar se existe
correlao entre os valores da presso arterial sistlica e os valores da estatura,
da massa corporal e da idade, em 10 atletas frequentadores de uma academia
de ginstica. Os dados esto relacionados na Tabela 21.1, mostrada a seguir.

Tabela 21.1 Valores da presso arterial sistlica, idade (anos), massa corporal (kg)
e estatura (cm) de 10 atletas

Presso sistlica Idade Massa corporal Estatura


Atleta
y x1 x2 x3
01 132 29 63 162
02 134 33 72 168
03 132 37 72 166
04 143 41 79 179
05 142 43 71 167
05 147 45 69 168
07 144 47 83 173
08 146 49 85 171
09 152 51 64 163
10 149 51 58 165

Passo 1 Formular as hipteses estatsticas:


H0:Os valores da presso arterial sistlica no dependem da estatura e/ou
da massa corporal e/ou da idade, pois b1 = 0, b2 = 0, b3 = 0 ;

252 Bioestatstica aplicada Pesquisa Experimental

BIOESTATISTICA_VOL02.indb 252 25/06/12 17:23


HA:Os valores da presso arterial sistlica dependem da estatura e/ou da
massa corporal e/ou da idade, pois, ao menos um bi 0.
Passo 2 Escolher o nvel de significncia (nvel alfa):
= 0,05 (5%) unilateral
Passo 3 Determinar os valores do teste:
Os dados devem ser introduzidos no grid do programa, com a primeira
coluna contendo os valores da varivel dependente y, e as demais colunas,
os valores das variveis preditoras x. Selecionar o menu estatsticas e es-
colher a opo regresso e clicar em linear mltipla. Selecionar as colunas
e clicar em executar o teste. O programa exibir um quadro contendo as
seguintes informaes:

Passo 4 Concluses:
Como o valor do teste ANOVA (teste F) foi significativo (P = 0,0023), re-
jeita-se a hiptese nula (H0) e aceita-se a hiptese alternativa (HA) que ao

Regresso Mltipla 253

BIOESTATISTICA_VOL02.indb 253 25/06/12 17:23


menos uma das variveis preditoras, idade, massa corporal ou estatura,
influencia no valor da presso arterial sistlica. Entre os coeficientes par-
ciais de regresso, somente o b1 mostrou-se estatisticamente significativo,
com t = 7,4497 e P = 0,0003. Isto mostra, portanto, que a varivel idade (x1)
aquela mais explicativa para a variao da presso arterial sistlica dos
atletas avaliados. Com base nos dados, o valor da presso arterial sistlica
deve aumentar 0,8738 mmHg para cada acrscimo de um ano de idade, a
partir de 29 e at 51 anos.

Os coeficientes de determinao mltipla (R2), de determinao mltipla


ajustado (R2A) e de correlao mltipla (R) so mostrados no quadro de resul-
tados. O valor do coeficiente de determinao igual a 0,9088 alto, o que indica
um poder de explicao da equao de regresso de 90,88%. No entanto, como
dois dos coeficientes parciais de regresso no so significativos, pode-se
suspeitar da existncia de colinearidade nas variveis independentes (variveis
independentes correlacionadas).
Com base nas variveis preditoras, o modelo linear para a predio de y
representado pela seguinte equao:
y = 68, 97 + 0,87x 1 + ( 0,23x 2 ) + 0,31x 3

O programa tambm disponibiliza o procedimento para a anlise de


regresso passo-a-passo (stepwise), progressiva e regressiva. Para o exemplo
descrito, o mtodo progressivo exibe o quadro mostrado abaixo, no qual se
verifica que, quando a varivel x3 (estatura) includa, o coeficiente de deter-
minao (R2) da equao no se altera, indicando, portanto, que esta varivel
deve ser retirada da regresso.

Para o mtodo regressivo, o programa exibe outro quadro, o qual


mostrado a seguir. Neste quadro, verifica-se que, quando a varivel x3 (estatura)

254 Bioestatstica aplicada Pesquisa Experimental

BIOESTATISTICA_VOL02.indb 254 25/06/12 17:23


excluda, o coeficiente de determinao (R2) da equao tambm no se altera,
confirmando, portanto, que esta varivel deve ser retirada da regresso.

O programa BioEstat no mostra a matriz de correlao e a matriz de


correlaes combinadas, ambas bastante teis na anlise da colinearidade.
Estas matrizes sero mostradas nas tabelas 21.2 e 21.3, a seguir:

Tabela 21.2 Matriz de correlao entre as variveis preditoras idade, massa corporal e
estatura de 10 atletas

Idade Massa corporal Estatura


Correlaes
(x1) (x2) (x3)

Idade (x1) 1,00 0,0844 0,1414

Massa corporal (x2) 0,0844 1,00 0,7767

Estatura (x3) 0,1414 0,7767 1,00

A matriz de correlao mostrada na Tabela 21.2 confirma as suspeitas de colinea-


ridade, pois existe uma alta correlao de x2 (massa corporal) em relao a x3 (estatura),
o que sugere mais estudos para concluir sobre a existncia de colinearidade.

Tabela 21.3 Matriz de correlaes combinadas entre as variveis preditoras idade,


massa corporal e estatura de 10 atletas

Correlaes combinadas

x2 : x3 x2 x3
Idade (x1)
0,1471 0,0844 0,1414
x1 : x3 x1 x3
Massa corporal (x2)
0,7772 0,0844 0,7767
x1 : x2 x1 x2
Estatura (x3)
0,7805 0,1414 0,7767

Regresso Mltipla 255

BIOESTATISTICA_VOL02.indb 255 25/06/12 17:23


A tabela de correlaes combinadas uma ferramenta muito til na
verificao das correlaes entre as variveis preditora (colinearidade). Pela
anlise da Tabela 21.3, verifica-se que a varivel x2 apresenta forte corre-
lao com a combinao das variveis x1 e x3, porm, sem correlao com x1,
quando comparada isoladamente. Por sua vez, a varivel x3 apresenta forte
correlao com a combinao das variveis x1 e x2, porm, sem correlao
significativa com x1, quando comparadas isoladamente, sendo provavel-
mente a responsvel pelas interpretaes contraditrias de significncia.
Pela anlise apenas da matriz de correlaes, normalmente no h dados
suficientes para concluir quais variveis podem ou no ser retiradas da
regresso. Mas, olhando para as correlaes combinadas, pode-se inferir
que a varivel x3 deve ser retirada da regresso, pois ela representada pela
combinao de x1 e x2.
vlido ressaltar que, para validar os testes de regresso linear mltipla,
necessrio que o modelo de anlise siga todos os pressupostos bsicos
referentes regresso linear simples, os quais esto relacionados no captulo
12 deste livro.

21.2 REGRESSO LOGSTICA SIMPLES


E MLTIPLA

O mtodo da regresso logstica o modelo ideal de anlise quando a


varivel-resposta em estudo dicotmica (binria) e as variveis preditoras
incluem valores numricos (dimensionais) e medidas nominais. , pois, uma
tcnica estatstica que tem como objetivo produzir, a partir de um conjunto
de observaes, um modelo que permita a predio de valores assumidos
por uma varivel categrica a partir de um conjunto de variveis explicativas,
contnuas e/ou binrias, sendo amplamente utilizada em cincias mdicas e
sociais, como um mtodo til para predizer a probabilidade da ocorrncia
de um determinado evento, como uma doena, por exemplo, em funo da
exposio a determinados fatores de risco. Uma outra vantagem da regresso
logstica que a sua aplicao no exige os pressupostos de normalidade para a
distribuio das variveis preditoras, alm do que, os coeficientes de regresso

256 Bioestatstica aplicada Pesquisa Experimental

BIOESTATISTICA_VOL02.indb 256 25/06/12 17:23


podem ser interpretados em termos de risco relativo nos estudos de coorte, ou
mesmo taxas de tendncia nos delineamentos do tipo caso-controle.
Assim, quando o modelo correlaciona a varivel-resposta y com uma nica
varivel preditora x, ele chamado de regresso logstica simples. Neste
caso, a varivel y, binria, codificada (codificao dummy) como 1 (sucesso)
e 0 (insucesso), o mesmo ocorrendo para a varivel x. Por sua vez, nos casos em
que a correlao realizada entre a varivel-resposta y e duas ou mais variveis
preditoras x, o modelo conhecido como regresso logstica mltipla, sendo
a varivel y do tipo binria, a qual assume valores 1 (sucesso) e 0 (insucesso). As
variveis preditoras podem ser binrias ou contnuas (dimensionais); quando
binrias, tambm recebem a codificao dummy.
Portanto, como no modelo multivariado utilizam-se os valores de um
conjunto de variveis preditoras para calcular a probabilidade da ocorrncia da
varivel-resposta, os efeitos das associaes entre essas variveis podem ser
controlados, sendo a odds ratio, a medida de associao calculada a partir do
modelo logstico. A frmula, tambm denominada Logit, mostrada a seguir.

1
Px =

( )
1 + exp b0 + b1x 1 + b2x 2 + ... + bn x n

Onde: b0 = Intercepto.
b1, b2 ...bn Coeficientes de regresso.
exp = Base do logaritmo natural (2,718) usada para a potncia
mostrada entre parnteses.

Nesta equao, os termos b0 e bn representam os parmetros desconhe-


cidos e que sero estimados a partir dos dados amostrais, com base no mtodo
mxima verossimilhana, o qual mostra a probabilidade mxima de se obter o
resultado observado. Assim, conhecendo-se os parmetros b0 e bn e os valores
das variveis preditoras para um determinado indivduo, pode-se, ento,
aplicar a frmula da regresso logstica para calcular a probabilidade (Px) de
que este indivduo desenvolva o desfecho estudado.
A equao pode ser montada especificando-se as variveis a serem includas
no modelo, ou utilizando-se um dos mtodos semelhantes queles empregados

Regresso Mltipla 257

BIOESTATISTICA_VOL02.indb 257 25/06/12 17:23


para a regresso mltipla. Na regresso logstica, em vez do teste F, utiliza-se
o teste do qui-quadrado (2) para se verificar a significncia estatstica de cada
varivel em relao determinao do resultado da regresso.
A seguir, utilizando-se o programa BioEstat 5.0, mostraremos os exemplos
para os modelos de regresso logstica simples e mltipla.

Modelo de regresso logstica simples


Exemplo: Um estudo foi conduzido para verificar a associao entre a
incidncia de neoplasia cutnea e a histria clnica de exposio excessiva luz
solar. Para tal finalidade, 20 mulheres, na faixa etria de 60 a 70 anos, foram
aleatoriamente selecionadas dentre aquelas atendidas em um ambulatrio
pblico de dermatologia. Os dados esto expressos na Tabela 21.4, abaixo.

A codificao dummy estabelecida foi a seguinte:


Varivel y: neoplasia cutnea presente = 1; ausente = 0.
Varivel x: exposio excessiva radiao solar presente = 1; ausente = 0.

Tabela 21.4 Codificao dummy para as variveis includas na regresso logstica simples

Paciente 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

Varivel y 1 0 1 0 1 0 1 0 0 0 0 0 0 0 1 1 0 1 1 1

Varivel x 1 0 0 0 1 0 1 0 0 0 1 0 0 0 0 1 1 1 1 0

Passo 1 Formular as hipteses estatsticas:


H0: a incidncia de neoplasia cutnea no est associada exposio exces-
siva luz solar , pois b1 = 0 ;
HA: a incidncia de neoplasia cutnea est associada exposio excessiva
luz solar, pois b1 0 .
Passo 2 Escolher o nvel de significncia (nvel alfa):
= 0,05 (5%) unilateral
Passo 3 Determinar os valores do teste:
Os dados devem ser introduzidos no grid do programa, com a primeira co-
luna contendo os valores da varivel dependente y, e a segunda coluna, os
valores da varivel preditora x. Selecionar o menu estatsticas e escolher a

258 Bioestatstica aplicada Pesquisa Experimental

BIOESTATISTICA_VOL02.indb 258 25/06/12 17:23


opo regresso e clicar em logstica simples. Selecionar as colunas e clicar
em executar o teste. O programa exibir um quadro contendo as seguintes
informaes:

Passo 4 Concluses:
Como o valor P do teste foi significativo (P = 0,0371), rejeita-se a hiptese
nula (H0) e aceita-se a hiptese alternativa (HA) que a exposio excessiva
luz solar influencia na incidncia da neoplasia cutnea. Isto , a odds ratio
indica que a chance da ocorrncia de neoplasia 9 vezes maior em mulhe-
res com antecedentes de exposio excessiva radiao solar quando com-
parada chance em mulheres sem antecedentes. O intervalo de confiana
de 95% confirma a significncia estatstica do teste, pois o valor 1 no est
contido no referido intervalo.
O programa fornece a equao de regresso para o modelo proposto. Para
o exemplo acima, a equao dada por:

Logit Pi = 1,0986 + 2,1972x i

Assim, com base na equao mostrada acima, podem-se calcular as


probabilidades para as possveis ocorrncias da varivel-resposta neoplasia
cutnea, tal como mostrado a seguir.

Regresso Mltipla 259

BIOESTATISTICA_VOL02.indb 259 25/06/12 17:23


Para xi = 1 (com antecedentes de exposio excessiva luz solar):

Logit P = 1,0986 + 2,1972 x 1 = 1,0986

1 1
P= = = 0,75 (75%)
1 + exp (1 ,0986 ) 1 + 0,3333

Para xi = 0 (sem antecedentes de exposio excessiva luz solar):

Logit P = 1,0986 + 2,1972 x 0 = 1,0986

1 1
P= = = 0,25 (25%)
1 + exp ( 1 ,0
0986 ) 1 + 2, 9999

Na regresso logstica, cada coeficiente bi, calculado, fornece uma estimativa


do logaritmo natural (ln) da odds ratio ajustada, de modo a permitir que, para
todas as variveis includas no modelo, a odds ratio pode ser estimada direta-
mente a partir da exponenciao destes coeficientes. Assim, para o exemplo
dado, tem-se:

b
OR = exp 1 = exp2,1972 = 8, 9998

O intervalo de confiana de 95% para a odds ratio calculado da seguinte


maneira:

b 1 ,96 x erro padro(b )


IC 95%(OR ) = exp 1 1

2,19721 ,96 x1,0541 2,19722,0660


IC 95%(OR ) = exp = exp

IC 95% = exp0,1312 = 1,1402 (limite inferiorr)

= exp4 ,2632 = 71,0369 (limite superior)

IC 95%(OR ) = 1,1402 < OR < 71,0369

260 Bioestatstica aplicada Pesquisa Experimental

BIOESTATISTICA_VOL02.indb 260 25/06/12 17:23


Modelo de regresso logstica mltipla
Exemplo: Um estudo foi conduzido para verificar a associao entre a
incidncia de neoplasia cutnea em relao ao sexo, exposio excessiva
radiao solar, idade e ao uso de filtro solar. Para tal finalidade,
40 pacientes de ambos os sexos, na faixa etria de 36 a 56 anos, foram
aleatoriamente selecionados dentre aqueles atendidos em um ambulatrio
pblico de dermatologia. Os dados foram introduzidos no grid do programa
BioEstat 5.0.

A codificao dummy estabelecida foi a seguinte:


Varivel y: neoplasia cutnea presente = 1; ausente = 0.
Varivel x1: sexo masculino = 1; feminino = 0.
Varivel x2: exposio excessiva radiao solar presente = 1; ausente = 0.
Varivel x3: idade (varivel contnua).
Varivel x4: uso de filtro solar presente = 1; ausente = 0.

Passo 1 Formular as hipteses estatsticas:


H0: a incidncia de neoplasia cutnea no est associada aos fatores de ris-
co estudados, pois b1=0, b2 = 0, b3 = 0, b4 = 0 ;
HA: a incidncia de neoplasia cutnea est associada a um dos fatores de
risco estudado, sendo b1 0 e/ou b2 0 e/ou b3 0 e/ou b4 0 .

Passo 2 Escolher o nvel de significncia (nvel alfa):


a = 0, 05 (5%) unilateral

Passo 3 Determinar os valores do teste:


Os dados devem ser introduzidos no grid do programa, com a primeira
coluna contendo os valores da varivel dependente y, e as demais colunas,
os valores das variveis preditoras x. Selecionar o menu estatsticas e esco-
lher a opo regresso e clicar em logstica mltipla. Selecionar as colunas
e clicar em executar o teste. O programa exibir um quadro contendo as
seguintes informaes:

Regresso Mltipla 261

BIOESTATISTICA_VOL02.indb 261 25/06/12 17:23


Passo 4 Concluses:
Como o valor do teste foi significativo (P < 0,0001), rejeita-se a hiptese
nula (H0) e aceita-se a hiptese alternativa (HA) que as variveis sexo e
exposio excessiva radiao solar influenciaram na incidncia da ne-
oplasia cutnea. Isto , a odds ratio indica que a chance da ocorrncia de
neoplasia foi 7,6 (1/0.1317)2 vezes maior em pacientes do sexo feminino
quando comparada chance em pacientes do sexo masculino (P = 0,0464).
Porm, se o paciente do sexo masculino e apresenta exposio excessiva
radiao solar, a chance de neoplasia foi 14,7 vezes maior quando compa-
rada chance em um paciente do sexo feminino e sem exposio excessiva
radiao solar (P = 0,0117).
A incidncia de neoplasia cutnea no apresentou relao estatisticamente
significante com as variveis idade e uso de filtro solar.

O programa fornece a equao de regresso para o modelo proposto. Para


o exemplo acima, a equao dada por:

Logit Pi = 5,8443 (2,027x 1 ) + (2,6880x 2 ) + (0,1460x 3 ) (2,286x 4 )

2. Para calcular a chance para o paciente do sexo feminino, divide-se o valor 1 pela chance para
o paciente do sexo masculino (0,1317). Isto , 1/0,1317 = 7,59.

262 Bioestatstica aplicada Pesquisa Experimental

BIOESTATISTICA_VOL02.indb 262 25/06/12 17:23


Assim, com base na equao acima referida, podem-se calcular as probabi-
lidades para as possveis ocorrncias da varivel-resposta neoplasia cutnea
em funo das variveis preditoras, tal como para os dois exemplos mostrados
a seguir.

Para: x1 = 1 (sexo masculino).


x2 = 1 (com exposio excessiva radiao solar).
x3 = 50 (idade igual 50 anos).
x4 = 1 (com uso de filtro solar)

Logit Pi = 5,8443 (2,027 1) + (2,6880 1) + (0,1460 50) (2,286 1)

Logit Pi = 0,1693

1 1
P = = = 0, 4578 (45,78%)
1 + exp ( 0 ,1693) 1 + 1,1845

Para: x1 = 0 (sexo feminino).


x2 = 0 (sem exposio excessiva radiao solar).
x3 = 60 (idade igual a 60 anos).
x4 = 0 (com uso de filtro solar)

Logit Pi = 5,8443 (2,027 0) + (2,6880 0) + (0,1460 60) (2,286 0)

Logit Pi = 2, 9157

1 1
P = = = 0, 9487 (94,87%)
1 + exp ( 2,9157 ) 1 + 0,0541

Estratgia de modelagem reduzida


O objetivo da estratgia de modelagem reduzida obter o melhor ajuste
para o modelo, com um nmero mnimo de variveis preditoras, de tal modo
que aquelas no significativas e que pouco contribuem para o resultado,

Regresso Mltipla 263

BIOESTATISTICA_VOL02.indb 263 25/06/12 17:23


possam ser descartadas da regresso. Como regra geral, permanecem no
modelo (modelo no reduzido) apenas as variveis com valor de P menor
que 0,05, ou aquelas com um P um pouco maior, mas que sejam comprovada-
mente importantes para a varivel-resposta da regresso. Do mesmo modo,
deve permanecer no modelo a varivel que, quando retirada, provoca uma
grande alterao na probabilidade do desfecho, mesmo que ela no seja
estatisticamente significativa. A seguir, mostraremos os passos necessrios
para a realizao do modelo reduzido.

Passo 1 O processo inicia pela realizao da regresso logstica simples


entre a varivel-resposta e cada uma das variveis preditoras includas
no estudo. A seguir, selecionam-se aquelas que apresentarem, no teste
de hiptese, um valor P menor ou igual a 0,20. Para o exemplo mostrado
acima, a Tabela 21.5 relaciona os valores de P das variveis em questo.
Nesta tabela, observa-se que somente a varivel x4 uso de filtro solar
no apresenta o critrio de incluso, pois P > 0,20, devendo, portanto, ser
excluda do modelo.

Tabela 21.5 Variveis e respectivos valores de P obtidos na regresso logstica simples

Varivel Valor de P

Sexo 0,0007

Exposio excessiva radiao solar 0,0032

Idade 0,0667

Uso de filtro solar 0,4005

Passo 2 O prximo passo realizar a regresso logstica mltipla com to-


das as variveis preditoras, exceto com aquela retirada do modelo, no caso,
a varivel x4 uso de filtro solar. Com utilizao do programa BioEstat 5.0,
obteremos o resultado mostrado a seguir:

264 Bioestatstica aplicada Pesquisa Experimental

BIOESTATISTICA_VOL02.indb 264 25/06/12 17:23


A razo de verossimilhana verifica o ajuste global do modelo e testa a
hiptese de nulidade de que todos os coeficientes bi das variveis, exceto o
intercepto, so iguais a zero. O resultado de P = 0,0001 indica que o modelo
se ajusta adequadamente aos dados.

Passo 3 O procedimento seguinte a excluso das variveis que apresen-


tam o valor de P > 0,10. Para o exemplo acima, a varivel x3 idade deve ser
retirada, pois P = 0,8155. Em seguida, executa-se, novamente, a regresso
mltipla com as variveis preditoras que permaneceram no modelo e, en-
to, compara-se o modelo anterior com o modelo reduzido final.

Regresso Mltipla 265

BIOESTATISTICA_VOL02.indb 265 25/06/12 17:23


Passo 4 Concluses:
Como o valor do teste foi significativo (P < 0,0001), rejeita-se a hiptese
nula (H0) e aceita-se a hiptese alternativa (HA), que as variveis sexo e
exposio excessiva radiao solar influenciaram na incidncia da ne-
oplasia cutnea. Isto , a odds ratio indica que a chance da ocorrncia de
neoplasia foi 14,9 (1/0.0667) vezes maior em pacientes do sexo feminino
quando comparada chance em pacientes do sexo masculino (P = 0,0032).
Porm, se o paciente do sexo masculino e apresenta exposio excessiva
radiao solar, a chance de neoplasia foi 9.0 vezes maior quando compa-
rada chance em um paciente do sexo feminino e sem exposio excessiva
radiao solar (P = 0,0166).

Regresso para varivel categrica com mais de dois nveis


Quando uma varivel categrica apresentar mais de dois nveis de resposta,
necessrio proceder ao fatoramento para transform-la em variveis dummies
(categoria 0 - 1). O esquema abaixo, mostra este procedimento para uma varivel
que apresente trs categorias de resposta, como, por exemplo, a religio.

Religio Religio 1 Religio 2 Religio 3

1 - Evanglica 1 0 0

2 - Catlica 0 1 0

3 - Outras 0 0 1

A varivel dummy para a religio evanglica ser a varivel religio 1,


a qual assumir o valor 1 quando a religio for a evanglica e o valor 0 para
as demais. A varivel religio 2 assumir o valor 1 quando a religio for a
catlica e 0 nos demais casos. A varivel religio 3 assumir o valor 1quando
a religio for outra, e o valor 0 para as demais.

266 Bioestatstica aplicada Pesquisa Experimental

BIOESTATISTICA_VOL02.indb 266 25/06/12 17:23


22
Anlise de Sobrevida

Em muitos modelos de pesquisa, a varivel em estudo pode corresponder


ao perodo de acompanhamento para um determinado evento de interesse,
sendo o resultado medido em termos de extenso do tempo apurado desde o
incio da observao at que o referido desfecho ocorra. Na rea da economia,
por exemplo, um economista pode querer estudar o tempo mdio em que uma
determinada classe de trabalhadores permanece desempregada aps a perda
do emprego, e compar-lo com o tempo mdio de outra classe qualquer; ou um
engenheiro pode avaliar o tempo mdio de vida til de um novo equipamento,
at que uma determinada falha mecnica ocorra.
Na rea da sade, muitos estudos so delineados com a finalidade de
avaliar o tempo de acompanhamento de pacientes submetidos a um deter-
minado tipo de tratamento, que pode ser o emprego de uma nova droga, a
aplicao de uma nova interveno clnica ou um novo procedimento cirrgico,
sempre com o intuito de compar-los aos procedimentos j existentes, no
sentido de identificar aquele que apresenta melhor desempenho em termos
de remisso dos sintomas ou de sobrevida1, por exemplo. Em todos os casos,

1. Prolongamento da vida alm de determinado prazo; tempo de vida que ultrapassa determinado
limite (Dicionrio Aurlio).

BIOESTATISTICA_VOL02.indb 267 25/06/12 17:23


seja na rea da sade ou em qualquer outra rea do conhecimento, o modelo
requer que a varivel-resposta (desfecho) seja dicotmica, do tipo sucesso/
insucesso, presena/ausncia ou sobrevida/morte. Porm, como neste tipo de
estudo sempre existe a possibilidade de que alguns participantes possam ser
perdidos durante o perodo de acompanhamento, ou por que abandonam o
tratamento ou por que so excludos, pois o estudo termina antes da ocorrncia
do desfecho de interesse, tcnicas especiais de anlise estatstica devem ser
empregadas para esses casos, sendo a mais apropriada, a tbua de anlise de
sobrevida, que pode ser estudada pelo mtodo atuarial ou pelo mtodo de
Kaplan-Meier, ambos discutidos no presente captulo.
Nestes tipos estudos de sobrevida, geralmente os sujeitos participantes
so includos na pesquisa em diferentes momentos do ano calendrio, porm,
na anlise, todos eles tm seu tempo de sobrevivncia2 contado a partir de sua
entrada no estudo, a qual considerada como o tempo zero para observao
de cada indivduo, sendo o evento final, o bito ou qualquer outro que indique
uma modificao do estado inicial do sujeito da pesquisa, tal como a cura, a
recorrncia da doena ou o seu retorno ao trabalho, por exemplo. Nestes casos,
o evento final denominado ocorrncia ou falha, por referir-se mais frequen-
temente a eventos indesejveis, tais como o aparecimento da doena ou mesmo
a morte do paciente.
Por outro lado, pode ocorrer que alguns indivduos no sejam observados
at a ocorrncia da falha, ou seja, que tenham seu tempo de observao incom-
pleto. Esse tipo de perda no tempo de observao denominado censura. Isso
pode ocorrer quando os indivduos permanecem, ao trmino, sem mudana
da condio estudada, ou falecem por causas no relacionadas com a doena
de interesse, ou abandonam espontaneamente a pesquisa. Os estudos em que
existe censura so denominados com observaes incompletas.
Portanto, em pesquisa clnica, h dois tipos de delineamentos que podem
ser utilizados para acompanhar o tempo como varivel de interesse. Um deles
o estudo experimental do tipo ensaio clnico controlado e randomizado,
o qual indicado para avaliar diferentes formas de tratamento. O outro tipo
o estudo observacional do tipo coorte histrica (retrospectiva), cujos dados

2. Qualidade ou estado de sobrevivente; durao contnua no espao e no tempo (Aurlio).

268 Bioestatstica aplicada Pesquisa Experimental

BIOESTATISTICA_VOL02.indb 268 25/06/12 17:23


podem ser obtidos pela coleta direta em bases de dados j existentes, tais como
registros mdicos existentes pronturios hospitalares.
Assim, neste captulo, abordaremos os dois mtodos mais comumente utili-
zados para determinar as curvas de sobrevida o mtodo atuarial e o mtodo
de Kaplan-Meier, considerando-se o tempo transcorrido desde a entrada do
indivduo no estudo (data da incluso) at a ocorrncia do evento de interesse
(falha) ou at a censura por perda no tempo de observao (observao incom-
pleta). Da mesma maneira, mostraremos o teste do logrank e a estatstica do
qui-quadrado de Mantel-Haenszel, ambos utilizados no teste de significncia
para diferenas entre duas curvas de sobrevida.

22.1 MTODO ATUARIAL

Tambm conhecido como mtodo de anlise do quadro vital ou de Cutler-


Ederer, o mtodo atuarial3, inicialmente desenvolvido pelas companhias seguradoras
para o clculo de prmios de seguro e de aposentadoria, tem sido amplamente
utilizado na prtica mdica para calcular a taxa de sobrevida de pacientes subme-
tidos a avaliaes clnicas decorrentes de tratamentos experimentais.
Neste tipo de anlise, as probabilidades de sobrevida so calculadas para
intervalos fixos e arbitrrios previamente estabelecidos pelo pesquisador,
como em anos ou meses, por exemplo, de modo que o nmero de observaes
seja bem distribudo ao longo de todo o perodo do estudo, sendo o nmero
de pacientes expostos ao risco igual ao nmero de pacientes vivos por ocasio
do incio de cada intervalo. Por sua vez, o mtodo considera que todos os
afastamentos (censuras) ocorrem, em mdia, a meio caminho do intervalo,
de tal maneira que, nas anlises, so considerados apenas os pacientes
presentes no incio do intervalo, mas no no seu trmino, seja porque no
estavam no estudo h tempo suficiente ou porque abandonaram a pesquisa.
Assim, em cada intervalo, o nmero de pacientes expostos ajustado de
acordo com o nmero de censuras, supondo-se que elas ocorreram de modo

3. Aturia - Parte da estatstica que investiga problemas relacionados com a teoria e o clculo de
seguros numa coletividade (Dicionrio Aurlio).

Anlise de sobrevida 269

BIOESTATISTICA_VOL02.indb 269 25/06/12 17:23


uniforme durante cada perodo analisado. Isto feito subtraindo-se metade
das censuras do total de pacientes expostos ao risco no incio do perodo,
supondo-se que estes pacientes ficaram, em mdia, expostos apenas metade
do intervalo analisado. O nmero de pacientes expostos ao risco dado pela
seguinte equao:

wi
E i = ni , onde: ni - Nmero de sujeitos no incio do intervalo.
2
wi - Nmero de censuras no intervalo.

Desta forma, no mtodo atuarial, para cada um dos intervalos, a proba-


bilidade da ocorrncia do desfecho estudado, como o bito, por exemplo, a
probabilidade de sobrevida e a probabilidade acumulada de sobrevida
so calculadas pelas seguintes frmulas:

di di
qi = = , onde: qi - Probabilidade da ocorrncia do desfecho em
Ei wi
ni estudo.
2
di - Nmero de ocorrncias no intervalo.

pi = 1 qi , onde: pi - Probabilidade de sobrevida no intervalo.

Si = p1 x p2 x ... x pi , onde: Si - Probabilidade acumulada de sobrevida ao


final do intervalo.

d
EP(Si ) = Si n (n i d ) , onde: EP - Erro padro da probabilidade acu-
i i i mulada de sobrevida.

Para ilustrar a aplicao prtica do mtodo atuarial para anlise de


sobrevida, utilizaremos os dados do estudo publicado por Bustamante-Teixeira
et al (2002), que avaliou a probabilidade de sobrevida de casos incidentes de
cncer de estmago em Campinas, So Paulo, entre 1991 e 1994. A Tabela 22.1
mostra o resultado do estudo.

270 Bioestatstica aplicada Pesquisa Experimental

BIOESTATISTICA_VOL02.indb 270 25/06/12 17:23


Tabela 22.1 Clculo das probabilidades de sobrevida pelo mtodo atuarial, para casos de
cncer de estmago diagnosticados em Campinas, entre 1991 e 1994

Intervalo Sujeitos Ocorrncias Censuras Pacientes Probabilidade Probabilidade Probabilidade


em anos presentes no intervalo no intervalo expostos do desfecho de sobrevida acumulada
ao incio do ao risco
intervalo
i ni di wi Ei qi pi Si

0-1 337 224 15 329,5 0,6798 0,3202 0,3202

1-2 98 46 4 96 0,4792 0,5208 0,1668

2-3 48 13 0 48 0,2708 0,7291 0,1216

3-4 35 6 2 34 0,1764 0,8235 0,1001

4-5 27 4 2 26 0,1538 0,8461 0,0847

Modificado de Bustamante-Teixeira et al, 2002

Na tabela, a coluna ni corresponde ao nmero de pacientes por ocasio


do incio de cada intervalo, de tal maneira que, na primeira linha, esto todos
pacientes includos no estudo, isto , n1 = 337. Durante este primeiro intervalo
de um ano, morreram 224 pacientes (ocorrncias) e 15 foram perdidos
(censurados), de forma que d1 = 224 e w1 = 15. Assim, no primeiro intervalo, o
nmero ajustado de pacientes expostos ao risco de morrer foi de 337 (15
2) = 329,5; a probabilidade de morte foi 224 329,5 = 0,6798, o que resulta em
uma probabilidade de sobreviver de 1 0,6798 = 0,3202.
Para o segundo intervalo, que corresponde ao espao de tempo decorrido
entre o primeiro e o segundo ano aps o diagnstico, havia somente 98
pacientes vivos no incio do perodo; ocorreram 46 mortes (ocorrncias) e
4 pacientes foram perdidos do acompanhamento (censurados). Assim, 96
(98 (4 2)) pacientes estavam expostos ao risco de morrer, o que resulta
em uma probabilidade de morte de 0,4792 (46 96) e, em consequncia, na
probabilidade de sobreviver de 0,5208 (1 0,4792). Observe que a probabi-
lidade acumulada no segundo intervalo depende do paciente ter sobrevivido
ao intervalo anterior, sendo, portanto, um exemplo de probabilidade condi-
cional. Assim, a sobrevida acumulada aps dois anos do diagnstico de
0,1668, resultado da multiplicao da sobrevida no primeiro intervalo

Anlise de sobrevida 271

BIOESTATISTICA_VOL02.indb 271 25/06/12 17:23


(0,3202) pela sobrevida no segundo intervalo (0,5208). Desta forma, neste
estudo, a probabilidade de um paciente com cncer gstrico estar vivo aps
cinco anos do diagnstico de 0,0847 (8,47%).
As probabilidades acumuladas de sobrevivncia podem ser represen-
tadas em um grfico de curva de sobrevida. Neste grfico, a linha disposta
na forma de degraus de uma escada, irregularmente desnivelados, e, para o
exemplo em questo, ela representa a probabilidade de sobrevivncia para os
337 pacientes introduzidos no estudo. Assim, verifica-se, ao longo do tempo,
medida que o ocorre ampliao do intervalo transcorrido desde a admisso
de cada paciente ao estudo, a probabilidade de sobrevivncia torna-se cada
vez menor, uma vez que o nmero de pacientes que permanecem na anlise
decresce a cada intervalo. Alguns programas estatsticos para computa-
dores fornecem grficos com linhas pontilhadas em cada lado da curva de
sobrevida, que representam os limites para o intervalo de confiana de 95%,
o qual pode ser calculado utilizando-se a frmula do erro-padro da proba-
bilidade acumulada de sobrevida. A Figura 22.1, abaixo, mostra o grfico da
curva de sobrevida para o exemplo dado.

Fig. 22.1 - Curva de probabilidade de sobrevida acumulada para pacientes com diagnstico de
cncer gstrico, em Campinas, no perodo entre 1991 e 1994. Mtodo atuarial

272 Bioestatstica aplicada Pesquisa Experimental

BIOESTATISTICA_VOL02.indb 272 25/06/12 17:23


De qualquer modo, embora o mtodo atuarial tenha ampla aplicao na
anlise da curva de sobrevida de pacientes submetidos a determinados tipos
de tratamento, ele pode ser empregado em estudos que analisem outros
desfechos alm de morte, tal como para comparar o tempo de internao de
pacientes submetidos a diferentes procedimentos, para verificar o tempo de
vida til de prteses ou equipamentos mdicos e laboratoriais, ou para analisar
o tempo de adeso de pacientes a determinados programas de sade pblica
etc. Por outro lado, como este mtodo considera que todas as censura ocorrem a
meio caminho do perodo de tempo transcorrido para cada intervalo, isto pode
levar a vis significativo de avaliao caso estes intervalos sejam muito longos,
se houver muitas censuras ou se elas no ocorrerem na metade do intervalo.
Este vis menos preocupante quando o tamanho da amostra relativamente
grande, porm, para pequenas amostras, o problema pode ser contornado pela
aplicao do mtodo de Kaplan-Meier, que ser descrito a seguir.

22.2 MTODO DE KAPLAN-MEIER

Tambm conhecido como mtodo produto-limite de Kaplan-Meier,


a anlise de sobrevida por este mtodo semelhante anlise atuarial,
exceto que o perodo de tempo transcorrido desde a admisso do paciente
ao estudo no subdividido em intervalos fixos, tal como em anos ou
meses, o que o torna adequado para pesquisas com pequenas amostras.
Neste mtodo, uma nova probabilidade de sobrevida calculada toda vez
que registrada uma ocorrncia, isto , uma morte, sendo os afastamentos
(censuras) ignorados. Assim, a cada morte, o mtodo calcula uma nova linha
para a tbua de sobrevida, de tal maneira que os intervalos de tempo so
desiguais, pois as mortes no ocorrem todas com igual perodo de tempo
contado a partir da entrada do paciente no estudo. Por esta razo, a curva
de Kaplan-Meier parece com uma escada cujos degraus, irregularmente
desnivelados, tambm apresentam diferentes comprimentos. Deste modo,
cada morte marca o trmino de um intervalo e o incio de outro, para o qual
a taxa de sobrevida menor que do intervalo anterior, sendo os perodos
de tempo entre as ocorrncias, livres de morte. Portanto, cada ocorrncia

Anlise de sobrevida 273

BIOESTATISTICA_VOL02.indb 273 25/06/12 17:23


produz uma queda imediata na probabilidade de sobrevivncia e, ento, um
outro perodo livre de mortes inicia.
Desta forma, no mtodo de Kaplan-Meier, para cada um dos intervalos,
a probabilidade da ocorrncia do desfecho estudado, como o bito, por
exemplo, a probabilidade de sobrevida e a probabilidade acumulada de
sobrevida so calculadas pelas seguintes frmulas:

di
qi = , onde: qi - Probabilidade da ocorrncia do desfecho
ni
em estudo.
di - Nmero de ocorrncias no perodo.
ni - Sujeitos vivos no incio do perodo.

pi = 1 qi , onde: pi - Probabilidade de sobrevida no intervalo.

Si = p1 x p2 x ... x pi , onde: Si - Probabilidade acumulada de sobrevida


ao final do intervalo.

d
EP(Si ) = Si n (n i d ) , onde: EP - Erro padro da probabilidade acu-
i i i mulada de sobrevida.

Para ilustrar a aplicao prtica do mtodo produto-limite de Kaplan-Meier


para estudo de sobrevida, novamente utilizaremos, parcialmente, os dados do
estudo publicado por Bustamante-Teixeira et al (2002). A Tabela 22.2 mostra o
resultado do estudo at o tempo de 48 meses aps o incio da pesquisa.
Na tabela, a coluna ni corresponde ao nmero de pacientes por ocasio
do incio do primeiro intervalo, de tal maneira que, na primeira linha esto
todos pacientes includos no estudo, isto n1 = 29. Durante este primeiro
intervalo de um ms aps o diagnstico, morreram 5 pacientes (ocorrncias)
e nenhum paciente foi perdido (censurado), de forma que n1 = 29 e d1 = 5.
Assim, um ms aps de acompanhamento, a probabilidade de morte foi de
0,1724 (5 29), o que resulta em uma probabilidade de sobreviver igual a
0,8276 (1 0,1724).

274 Bioestatstica aplicada Pesquisa Experimental

BIOESTATISTICA_VOL02.indb 274 25/06/12 17:23


Tabela 22.2 Clculo das probabilidades de sobrevida, pelo mtodo de Kaplan-Meier, para
casos de cncer de estmago diagnosticados em Campinas, entre 1991 e 1994

Meses Sujeitos vivos Ocorrncias Censuras Probabilidade Probabilidade Probabilidade


aps o no incio do no perodo no perodo do desfecho de sobrevida acumulada
diagnstico ms
i ni di wi qi pi Si

1 29 5 0 0.1724 0.8276 0.8276


2 24 2 0 0.0833 0.9167 0.7587
3 22 2 1 0.0909 0.9091 0.6897
5 19 2 0 0.1053 0.8947 0.6171
6 17 1 0 0.0588 0.9412 0.5808
10 16 1 1 0.0625 0.9375 0.5445
11 14 2 0 0.1429 0.8571 0.4667
13 12 1 0 0.0833 0.9167 0.4278
14 11 3 0 0.2727 0.7273 0.3111
18 8 1 0 0.1250 0.8750 0.2722
19 7 1 0 0.1429 0.8571 0.2333
38 6 1 0 0.1667 0.8333 0.1945
48 5 1 0 0.2000 0.8000 0.1556
Modificado de Bustamante-Teixeira et al, 2002

No segundo intervalo, que corresponde ao espao de tempo decorrido no


segundo ms aps o diagnstico, dos 24 pacientes vivos no incio do intervalo,
2 morreram ao final do perodo, o que resulta em uma probabilidade de morte
de 0,0833 (2 24) e, em consequncia, na probabilidade de sobreviver igual a
0,9167 (1 0,0833). Observe que, tal qual o mtodo atuarial, a probabilidade
acumulada no segundo intervalo depende do paciente ter sobrevivido ao
intervalo anterior, sendo, portanto, um exemplo de probabilidade condicional.
Assim, a sobrevida acumulada, aps dois meses do diagnstico, de 0,8577,
resultado da multiplicao da sobrevida no primeiro intervalo (0,8276) pela
sobrevida no segundo intervalo (0,9167). Desta forma, neste estudo, a proba-
bilidade de um paciente com cncer gstrico estar vivo aps 48 meses do
diagnstico de 0,1556 (15,56%).

Anlise de sobrevida 275

BIOESTATISTICA_VOL02.indb 275 25/06/12 17:23


Para o mtodo de Kaplan-Meier, as probabilidades acumuladas de sobre-
vivncia tambm podem ser representadas em um grfico de curva de
sobrevida. Neste grfico, a linha disposta na forma de degraus irregular-
mente desnivelados. Para o exemplo em questo, ela representa a probabilidade
de sobrevivncia para os 29 pacientes com cncer gstrico, introduzidos no
estudo. Assim, verifica-se ao longo do tempo, medida que ocorre a ampliao
do intervalo transcorrido desde a admisso de cada paciente ao estudo, a proba-
bilidade de sobrevivncia torna-se cada vez menor, uma vez que o nmero
de pacientes que permanecem na anlise decresce a cada intervalo. Alguns
programas estatsticos para computadores fornecem grficos com linhas
pontilhadas em cada lado da curva de sobrevida, que representam os limites
para o intervalo de confiana de 95%, o qual pode ser calculado utilizando-se
a frmula do erro-padro da probabilidade acumulada de sobrevida. A Figura
22.2, abaixo, mostra o grfico da curva de sobrevida de Kaplan-Meier para o
exemplo da Tabela 22.2.
De qualquer forma, os modelos descritos acima permitem que um
conjunto de curvas de sobrevida acumulada, formadas a partir de duas ou
mais amostras, possam ser comparadas, no sentido de se verificar se elas so
estatisticamente diferentes. Os mtodos mais utilizados para esta compa-
rao sero descritos a seguir.

Fig. 22.2 - Curva de probabilidade de sobrevida acumulada para pacientes com diagnstico de
cncer gstrico, em Campinas, no perodo entre 1991 e 1994. Mtodo de Kaplan-Meier

276 Bioestatstica aplicada Pesquisa Experimental

BIOESTATISTICA_VOL02.indb 276 25/06/12 17:23


22.3 TESTES DE SIGNIFICNCIA ESTATSTICA

Na prtica do dia-a-dia da pesquisa, o que geralmente se deseja comparar


as curvas de sobrevida de pacientes submetidos a diferentes tipos de trata-
mento, no sentido de verificar qual o mais efetivo em termos de prolongar
o tempo de sobrevivncia. No entanto, ao se comparar duas ou mais destas
curvas, pode-se esperar que alguma diferena entre elas ocorra somente por
acaso, em razo do erro aleatrio ou amostral. Assim, para que a hiptese de
nulidade possa ser efetivamente testada, necessria a aplicao de tcnicas
especiais de comparao entre duas distribuies de tempo de sobrevida,
uma vez que o teste t de Student para amostras independentes no pode ser
utilizado, isto porque estes tempos no so normalmente distribudos, ou seja,
no seguem o padro da curva normal gaussiana.
Uma outra opo seria a utilizao de testes no-paramtricos, como o teste
da soma de postos de Wilcoxon-Mann-Whitney, o qual poderia comparar
a ordem dos postos (ranks) dos tempos de sobrevida, conforme explicado no
captulo 17 deste livro. Porm, este teste somente poder ser empregado nos
casos em que todas as ocorrncias (mortes) j tenham acontecido para todos os
sujeitos includos no estudo poca da anlise dos dados. Assim, caso o estudo
da sobrevida seja realizado enquanto alguns indivduos ainda estiverem vivos,
este mtodo no pode ser empregado. Nestes casos, outros procedimentos de
comparao devero ser escolhidos. Dentre estes procedimentos, destacam-se
o teste do logrank e a estatstica do qui-quadrado de Mantel-Haenszel, os
quais sero demonstrados a seguir.

22.3.1 Teste do logrank


Primeiro proposto por Nathan Mantel4 e posteriormente nomeado por
Richard5 e Julian Peto6, o teste do logrank utilizado para comparar as curvas

4. Nathan Mantel (1919-2002) - Bioestatstico americano que, juntamente com William Haenszel,
idealizou o teste conhecido como odds ratio de Mantel-Haenszel.
5. Richard Peto (1943-?) Estatstico e epidemiologista ingls, professor de estatstica mdica e
epidemiologia na Universidade de Oxford.
6. Julian Peto Estatstico e epidemiologista ingls, professor da Escola de Medicina Tropical de
Londres, que, com seu irmo Richard Peto, publicou artigos com o teste do logrank.

Anlise de sobrevida 277

BIOESTATISTICA_VOL02.indb 277 25/06/12 17:23


de sobrevida de duas amostras, geralmente de um grupo controle e um grupo
tratamento, no sentido de verificar a hiptese nula de que cada grupo tem a
mesma probabilidade de sobrevida. Assim, apesar do nome, este teste no
utiliza logaritmos ou postos (ranks) na sua frmula; na prtica, ele compara
o nmero de mortes (ocorrncias) observadas (O) em cada grupo com o
nmero de mortes que seriam esperadas (E) tomando-se por base o nmero
total de bitos verificados nos dois grupos, quando analisados de maneira
combinada. Deste modo, cada vez que uma morte ocorre, o teste calcula a
probabilidade de que esta morte observada tenha ocorrido no grupo trata-
mento e a probabilidade que tenha ocorrido no grupo controle, sendo cada
probabilidade, proporcional ao nmero de sobreviventes em cada grupo,
para aquele ponto no tempo.
Em seguida, o nmero de mortes esperadas para cada grupo, e em cada
ponto no tempo, calculado multiplicando-se o nmero total de mortes
no perodo pela proporo de pacientes ainda vivos no mesmo perodo.
Ento, dentro de cada grupo em estudo, os nmeros das mortes observadas
e esperadas so somados para que os totais possam ser comparados pela
aplicao do teste do qui-quadrado (2) com 1 grau de liberdade, conforme a
frmula mostrada abaixo:

(OT ET )2 (OC EC )2
logrank 2 = +
ET EC

Onde: OT e ET = Mortes observadas e esperadas no grupo tratamento.


OC e EC = Mortes observadas e esperadas no grupo controle.

Como os mtodos de curva de sobrevida podem ser empregados em estudos


que analisem outros desfechos de interesse alm de morte, para ilustrar uma
aplicao prtica do teste logrank, utilizaremos um exemplo fictcio tomado de
uma indstria de processamento de alimentos.

Exemplo: Suponhamos que uma indstria alimentcia queria comparar os


tempos de vida de prateleira (shelflife) de carne bovina resfriada e acondi-
cionada em dois diferentes tipos de embalagem: Tipo A, selada a vcuo; e Tipo

278 Bioestatstica aplicada Pesquisa Experimental

BIOESTATISTICA_VOL02.indb 278 25/06/12 17:23


B, selada com atmosfera modificada. Para tal experimento, 40 peas de carne
resfriada foram pesadas (1 kg) e aleatoriamente divididas em duas amostras
de 20 unidades cada, denominadas A e B. As peas da amostra A foram indivi-
dualmente colocadas em embalagens seladas a vcuo; as peas da amostra B
foram acondicionadas em embalagens com atmosfera modificada7. Ambas as
amostras foram mantidas sob refrigerao a uma temperatura de 4C, durante
o perodo de 16 dias. As ocorrncias foram consideradas pela anlise sensorial
das carnes, quando estas apresentassem caractersticas de deteriorao que
a tornavam imprpria para o consumo, tais como alta limosidade, colorao
plida, formao de exsudato e odor levemente desagradvel. Os dados do
experimento esto relacionados na Tabela 22.3.

Tabela 22.3 Clculo dos valores do teste logrank para as curvas de vida de prateleira de duas
amostras de carne bovina resfriada

Tempo Embalagens expostas ao risco Ocorrncias observadas Ocorrncias Esperadas


(dias) Tipo A Tipo B Total Tipo A Tipo B Total Tipo A Tipo B Total
5 20 20 40 1 0 1 0,50 0,50 1
6 19 20 39 1 0 1 0,49 0,51 1
7 18 20 38 2 0 2 0,95 1,05 2
8 16 20 36 3 1 4 1,78 2,22 4
9 13 19 32 4 1 5 2,03 2,97 5
10 9 18 27 5 1 6 2,00 4,00 6
11 4 17 21 3 2 5 0,95 4,05 5
12 1 15 16 1 2 3 0,19 2,81 3
13 0 13 13 0 3 3 0,00 3,00 3
14 0 10 10 0 4 4 0,00 4,00 4
15 0 6 6 0 4 4 0,00 4,00 4
16 0 2 2 0 2 2 0,00 2,00 2
Totais OA = 20 OB = 20 40 EA = 8,88 EB = 31,12 40

7. Mtodo de embalagem de alimentos, cujo ar atmosfrico ao redor do produto substitudo por


uma mistura otimizada de CO2, N2 e O2. Proporciona um aumento da vida til do produto pelo
controle do desenvolvimento de microorganismos.

Anlise de sobrevida 279

BIOESTATISTICA_VOL02.indb 279 25/06/12 17:23


Passo 1 Formular as hipteses estatsticas:
H 0 :O = E (as duas curvas no diferem entre si quanto ao tempo de prate-
leira das amostras estudadas).
H A :O E (as curvas diferem entre si quanto ao tempo de prateleira das
amostras estudadas).
Passo 2 Escolher o nvel de significncia (nvel alfa):
= 0,05 (5%)
Passo 3 Determinar o valor crtico do teste:
gl = 1

20,05;1 = 3,84

Passo 4 Calcular o valor do teste:

(20 8,88)2 (20 31,12)2


logrank 2 = + = 13, 92 + 3, 97 = 17,89
8,88 31,12

Passo 5 Regra de deciso:

Se log rank 2 < 20,05;1 , aceita - se H 0 .

Se log rank 2 20,05;1 , rejeita - se H 0 .

Como log rank 2 = 17,89 > 20,05;1 = 3,84 , rejeita - se H 0 .

Passo 6 Concluso:
Como o valor calculado para logrank 2 maior que o valor crtico tabelado
20,05;1 , rejeita-se H0 e conclui-se que existe uma diferena estatisticamente
significativa entre as distribuies dos tempos de prateleira das duas
amostras de carne bovina resfriada. Portanto, o produto embalado com
atmosfera modificada apresentou maior probabilidade de conservao at
o tempo analisado, pois logrank 2 = 17,89; P < 0,0001 .

A Figura 22.3 mostra o grfico de comparao para as curvas de probabi-


lidade relativas s duas amostras estudadas

280 Bioestatstica aplicada Pesquisa Experimental

BIOESTATISTICA_VOL02.indb 280 25/06/12 17:23


Fig. 22.3 - Curvas de probabilidade acumulada de vida de prateleira para as duas amostras
de carne bovina resfriada. Mtodo de Kaplan-Meier

Clculo da razo de risco


O mtodo de logrank permite que a razo de risco entre as duas amostras
possa ser facilmente calculada com base nos valores observados e esperados.
Para o exemplo em questo, a razo de risco de deteriorao da carne resfriada
calculada dividindo-se o risco de deteriorao para a amostra embalada a
vcuo pelo risco para a amostra embalada com atmosfera modificada. A frmula
dada pela seguinte equao:

OA / E A 20 / 8,88 2,25
Razo de Risco (RR ) = = = = 3,51
OB / E B 20 / 31,12 0,64

Observe que a razo de risco igual a 3,51 deve ser interpretada da seguinte
maneira: o risco de deteriorao para o grupo de carnes resfriadas e acondicio-
nadas em embalagens seladas a vcuo foi 3,51 vezes maior quando comparado
ao risco para o grupo de carnes resfriadas e acondicionadas em embalagens
com atmosfera modificada. A razo de risco calculada pressupe que o risco ou
a probabilidade de deteriorao igual em qualquer tempo do estudo; no caso,
para qualquer um dos 16 dias da pesquisa.

Anlise de sobrevida 281

BIOESTATISTICA_VOL02.indb 281 25/06/12 17:23


 2.3.2 Estatstica do qui-quadrado de
2
Mantel-Haenszel
O teste do qui-quadrado de Mantel-Haenszel pode ser utilizado para
comparar outros tipos de distribuio, alm das curvas de sobrevida calculadas
pelo mtodo atuarial ou Kaplan-Meier. O mtodo consiste em combinar uma
srie de tabelas de contingncia 2 x 28 construdas a partir dos valores das
amostras, uma para cada um dos diferentes intervalos de tempo de sobrevi-
vncia. Assim, a primeira etapa definir os intervalos de tempo para que as
tabelas possam ser construdas, nas quais os valores dos indivduos vivos e
das ocorrncias (mortos) so colocados nas linhas da tabela, enquanto que o
nmero de sujeitos de cada grupo colocado nas colunas.
Aps calcular os totais das linhas e das colunas de cada tabela, a estatstica
Mantel-Haenszel calculada com base no valor da casela superior esquerda
(casela a), para a qual calculado o seu valor esperado (Ea) e a varincia
deste valor esperado (Va), para cada uma das tabelas 2 x 2. As frmulas so as
seguintes:

Total da linha Total da coluna


E (a) =
Total geral

(a + c )(b + d )(a + b )(c + d )


V (a) = de: n - Total geral da tabela.
, ond
n2(n 1)

Aps o clculo do valor esperado e da varincia da casela a de cada uma


das tabelas, estes valores devem ser somados, assim como devem ser somados
os valores observados para a mesma casela. O teste de Mantel-Haenszel
calculado dividindo-se a diferena entre a soma dos valores observados (Oa)
e a soma dos valores esperados (Ea), elevada ao quadrado, pela soma das
varincias (Va). A frmula a seguinte:

O(a ) E (a )
2

Mantel - Haenszel = 2 i i

V (ai )
8. Para saber mais sobre a tabela de contingncia 2 x 2, sugerimos que o leitor consulte o captulo
14 deste livro.

282 Bioestatstica aplicada Pesquisa Experimental

BIOESTATISTICA_VOL02.indb 282 25/06/12 17:23


Para ilustrar a aplicao prtica do qui-quadrado de Mantel-Haenszel como
mtodo para comparar duas curvas de sobrevida, utilizaremos o exemplo a seguir.

Exemplo: Um estudo experimental com Ratos Wistar cirrticos9 foi


conduzido com o objetivo de comparar as curvas de sobrevida para dois
diferentes tipos de tratamento. Ao primeiro grupo, constitudo de 16 animais,
foi ministrada a droga A por um perodo de cinco semanas; ao segundo grupo,
de 20 animais, a droga B foi ministrada por mesmo perodo de tempo. Existe
diferena estatisticamente significativa entre as curvas de sobrevida para os
grupos estudados? Os dados esto relacionados na Tabela 22.4, abaixo.

Tabela 22.4 Clculo dos valores do teste do qui-quadrado de Mantel-Haenszel para as curvas
de sobrevida de ratos cirrticos submetidos a dois diferentes tipos de tratamento
Tabela 2 x 2 Observado Esperado Varincia Chances
Semanas
Droga A Droga B Total ai E(ai) V(ai) ad/n bc/n
Vivos 13 18 31 13 13,78 1,09 0,72 1,50
1 Mortos 3 2 5
Total 16 20 36
Vivos 9 15 24 9 10,06 1,36 0,87 1,94
2 Mortos 4 3 7
Total 13 18 31
Vivos 4 11 15 4 5,62 1,38 0,67 2,29
3 Mortos 5 4 9
Total 9 15 24
Vivos 2 7 9 2 2,40 0,75 0,53 0,93
4 Mortos 2 4 6
Total 4 11 15
Vivos 1 5 6 1 1,33 0,39 0,22 0,56
5 Mortos 1 2 3
Total 2 7 9
Somas 29,0 33,19 4,98 3,02 7,22
Qui-quadrado de Mantel-Haenszel = 3,52
OR = 0,42

9. A cirrose heptica em ratos pode ser experimentalmente induzida pela ligadura do ducto biliar
comum por um perodo de quatro semanas.

Anlise de sobrevida 283

BIOESTATISTICA_VOL02.indb 283 25/06/12 17:23


Passo 1 Formular as hipteses estatsticas:
H 0 :O = E (as probabilidades das curvas no diferem entre si quanto ao
tempo de sobrevida dos grupos estudados);
H A :O E (as probabilidades das curvas diferem entre si quanto ao tempo
de sobrevida dos grupos estudados).
Passo 2 Escolher o nvel de significncia (nvel alfa):
= 0,05 (5%)
Passo 3 Determinar o valor crtico do teste:
gl = 1

20,05;1 = 3,84

Passo 4 Calcular o valor do teste:

29,0 33,19
Mantel - Haenszel 2 = = 3,52
4 , 98

Passo 5 Regra de deciso:

Se Mantel - Haenszel 2 < 20,05;1 , aceita - se H 0 .

Se Mantel - Haenszel 2 20,05;1 , rejeita - se H 0 .

Como Mantel - Haenszel 2 = 3,52 < 20,05;1 = 3,84 , aceita - se H 0 .

Passo 6 Concluso:
Como o valor calculado para o qui-quadrado de Mantel-Haenszel menor
que o valor crtico tabelado 0,05;1 , aceita-se H0 e conclui-se que no
2

existe diferena estatisticamente significativa entre as probabilidades das


curvas de sobrevida para os dois grupos analisados. Portanto, o tempo
de sobrevida para o grupo de animais tratados com a droga A no diferiu
do tempo de sobrevida do grupo de animais tratados com a droga B, pois
Mantel-Haenszel 2 = 3,52; P = 0,0971 .

A Figura 22.4 mostra o grfico de comparao para as curvas de probabi-


lidade acumulada de sobrevida relativas aos dois grupos de ratos.

284 Bioestatstica aplicada Pesquisa Experimental

BIOESTATISTICA_VOL02.indb 284 25/06/12 17:23


Fig. 22.4 - Curvas de probabilidade acumulada de sobrevida para os dois grupos de ratos
cirrtico submetidos a dois diferentes tipos de tratamento. Mtodo de Kaplan-Meier

Clculo da razo de chance combinada


Embora no seja necessrio para o clculo do teste do qui-quadrado de
Mantel-Haenszel, a odds ratio combinada pode ser estimada para fins de
anlise dos resultados. A frmula dada por:

a di
x
i
ni

ORMH = ORMH =
3,02
= 0, 42
b x c 7,22
n
i i

Para o exemplo em questo, o valor calculado significa que a chance de


sobrevida para o grupo de ratos cirrticos tratados com a droga A foi 0,42
(42:100) vezes maior quando comparada chance para o grupo de animais
tratados com a droga B. Observe que o valor menor que 1 decorre do fato do
numerador da frao ser menor que o denominador, pois a chance absoluta
para o grupo A (3,02) menor que para o grupo B (7,22), o que torna a inter-
pretao do resultado um tanto confuso para os menos experientes. Assim,
uma maneira mais compreensvel seria inverter a frao, o que d uma ORMH
igual a 2,39 (7,22/3,02). Este procedimento no altera a relao das chances

Anlise de sobrevida 285

BIOESTATISTICA_VOL02.indb 285 25/06/12 17:23


entre os grupos. Assim, neste caso, a chance de sobrevida para o grupo de ratos
tratados com a droga B 2,39 vezes maior quando comparada chance para o
grupo de ratos tratados com a droga A. Este valor da razo de chance pressupe
que a probabilidade de sobrevivncia igual em qualquer tempo do estudo; no
caso, para qualquer uma das cinco semanas da pesquisa.
Como anteriormente relatado, os procedimentos descritos acima so os
mais utilizados para a comparao de curvas de sobrevida. Entretanto, vrios
outros mtodos de anlise existentes na literatura podem ser empregados,
sendo todos muito semelhantes. Dentre eles, citamos os testes de Gehan
(Wilcoxon generalizado) ou o modelo de risco proporcional de Cox. Assim,
para um maior aprofundamento sobre o assunto, sugerimos ao leitor consultar
os seguintes autores: Breslow e Day (1993), Dawson e Trapp (2003).

286 Bioestatstica aplicada Pesquisa Experimental

BIOESTATISTICA_VOL02.indb 286 25/06/12 17:23


23
Experimentos Fatoriais
Mauro Jos Fontelles
Edson Marcos Leal Soares Ramos1

Como intensamente explanado ao longo de todos os captulos deste


livro, o objetivo da maioria das pesquisas determinar a influncia de uma
ou mais variveis preditoras sobre uma outra varivel de interesse, a qual
dita varivel-resposta ou dependente. Na prtica, o que sempre se deseja
saber de que maneira estas variveis preditoras, doravante denominadas de
fatores, interagem entre si de modo que possam influenciar o comportamento
da varivel-resposta; como, tambm, desejvel conhecer o comportamento
desta varivel frente a qualquer alterao introduzida em um dos fatores.
Assim, diante desta ideia, percebe-se que o conjunto como um todo constitui
um sistema complexo que atua como uma funo matemtica, de modo que, a
cada alterao de um dos fatores, pode-se prever o comportamento da resposta,
mesmo que de maneira aproximada, sendo o objetivo da pesquisa, determinar
esta funo, para que melhores previses possam ser feitas.
Portanto, em qualquer projeto de pesquisa, o passo inicial escolher os fatores
(variveis) de interesse que sero controlados (manipulados) pelo pesquisador,
e a resposta que se quer estudar, de modo que o experimento possa ser adequa-
damente planejado. Por sua vez, quando desejamos estudar um grande nmero
de fatores na determinao da resposta, sempre possvel que alguns deles no
tenham qualquer influncia sobre o desfecho, e, estud-los, seria desperdcio de

1. Doutor em Estatstica, Professor do Instituto de Cincias Exatas e Naturais da Universidade


Federal do Par.

BIOESTATISTICA_VOL02.indb 287 25/06/12 17:23


tempo e de recursos materiais. Nestes casos, a melhor conduta seria realizar uma
seleo prvia, para decidir quais dos fatores merecem ser includos no modelo,
sendo os experimentos fatoriais o modelo de planejamento mais adequado para
este propsito, os quais sero explanados neste captulo.

23.1 NOES BSICAS SOBRE


EXPERIMENTOS FATORIAIS

No dia-a-dia da pesquisa, geralmente utilizamos experimentos mais


simples, que comparam diferentes nveis de um nico fator, considerando
que todos os demais fatores que possam interferir no resultado da resposta
se mantenham constantes. Isto ocorre, por exemplo, quando comparamos os
efeitos de diferentes doses de uma droga experimental (fator) em um mesmo
grupo de animais, mantendo-se constante a massa corporal, a idade, o sexo
etc. Porm, existem diversos outros modelos de delineamento, nos quais as
variaes de dois ou mais fatores devem ser estudadas simultaneamente; neste
caso, estamos falando de experimento fatorial, como por exemplo, se compa-
rarmos diferentes dosagens da droga em grupos de animais com diferentes
valores da massa corporal e da idade. Desta forma, interessante ressaltar que
os experimentos fatoriais geralmente so mais eficientes que os experimentos
simples, pois permitem, ao pesquisador, extrair concluses mais fidedignas.
Por exemplo, se o objetivo for mensurar o nvel da excreo urinria de
uma nova droga experimental, 1 hora aps a administrao oral da mesma, e
se forem ministradas quatro doses diferentes (D1, D2, D3 e D4), da mesma droga,
em quatro animais com o mesmo peso corporal, somente poderemos concluir
que a dose D1, por exemplo, a que apresentou menor nvel de excreo para
aquela massa corporal estudada. Porm, possvel que, para outro valor de
peso, a dose D2 supere todas as outras dosagens, em relao excreo renal.
Assim, num experimento fatorial, variando-se simultaneamente as doses do
medicamento e os pesos dos animais, todas as possibilidades possveis so
pesquisadas, de maneira que as concluses so mais generalizadas.
Portanto, como regra geral, define-se como experimento fatorial, o tipo de
delineamento que correlaciona as combinaes entre os diferentes nveis mensu-

288 Bioestatstica aplicada Pesquisa Experimental

BIOESTATISTICA_VOL02.indb 288 25/06/12 17:23


rados para dois ou mais fatores, sendo os fatores representados por cada uma das
variveis preditoras, para as quais os nveis so fixados segundo o interesse do
pesquisador. Desta forma, cada uma das subdivises de um fator denominada
de nvel do fator, e todas as possveis combinaes entre os diversos fatores nos
seus diferentes nveis, so denominadas de tratamentos ou ensaios. Assim, se
todas as possveis combinaes, entre todos os nveis mensurados de cada fator
forem consideradas no modelo, o esquema dito experimento fatorial completo.
Caso inclua apenas fraes bem definidas do modelo completo, o delineamento
dito experimeto fatorial incompleto, o qual muito til na seleo dos nveis
adequados e/ou daqueles fatores que, de fato, influenciam na varivel-resposta.
De qualquer modo, a maioria dos autores no considera os experimentos
fatoriais como um delineamento experimental, mas, sim, um esquema de
desdobramento de modelos de tratamento que pode ser adaptado a qualquer
um dos delineamentos experimentais, tais como o delineamento inteiramente
casualizado (DIC) ou em blocos casualizados (DBC), anteriormente abordados
(ver ANOVA), ou em quadrados latinos (DQL) etc. Neste livro, consideraremos
os delineamentos inteiramente casualizados.
Por exemplo, se tomarmos um delineamento inteiramente casualizado, com
somente dois fatores, temperatura (T) e Presso (P), cada um deles, mensurado
em dois nveis, 1 e 2, teremos um experimento fatorial 2 x 2, com 4 possveis
combinaes (tratamentos) as quais so representadas da seguinte forma:

T1P1 T1P2
T2P1 T2P2

Porm, se os fatores forem mensurados em trs nveis, 1, 2 e 3, teremos um


experimento fatorial 3 x 3, isto , com 9 possveis combinaes:

T1P1 T1P2 T1P3


T2P1 T2P2 T2P3
T3P1 T3P2 T3P3

Assim, se representarmos por k o nmero de fatores, e por N o nmero de nveis


mensurados para cada fator, um experimento fatorial completo ter o nmero de

Experimentos Fatoriais 289

BIOESTATISTICA_VOL02.indb 289 25/06/12 17:23


possveis combinaes determinado por Nk. Deste modo, observa-se que o nmero
de ensaios cresce exponencialmente medida que um novo fator ou um nvel de
mensurao acrescentado ao experimento, de tal maneira que modelos completos
com a utilizao de 7 ou mais fatores com dois nveis, ou 4 fatores com 3 ou mais
nveis, tornam-se experimentalmente inviveis em razo do grande nmero de
combinaes. A Tabela 23.1 mostra as possveis combinaes para experimentos
fatoriais completos com at 6 fatores mensurados em at 4 nveis.

Tabela 23.1 Nmero de possveis combinaes para esquemas fatoriais completos


at k = 6 e N = 4

Nveis de Fatores (variveis)


mensurao k=2 k=3 k=4 k=5 k=6
N=2 2 =4
2
2 =8
3
2 = 16
4
2 = 32
5
26 = 64
N=3 32 = 9 33 = 27 34 = 81 35 = 243 36 = 729
N=4 42 = 16 43 = 64 44 = 256 45 = 1.024 46 = 4.096

Note que o principal problema dos experimentos fatoriais que o nmero


de tratamentos aumenta rapidamente com um pequeno aumento do nmero
das variveis. Assim, uma soluo para resolver este problema seria a escolha
de delineamentos fatoriais incompletos ou fracionados, os quais podem ser
utilizados para selecionar os fatores e/ou os seus nveis, que produzem as
melhores respostas para a varivel de desfecho estudada.
Por outro lado, a anlise estatstica mais trabalhosa, pois so necessrios
os clculos dos efeitos principais e da interao de todos os fatores, alm do
que, a interpretao dos resultados se torna mais difcil medida aumenta o
nmero de nveis e de fatores no experimento.

Interao entre fatores


Nos experimentos fatoriais, pode-se estudar no apenas os efeitos indivi-
duais de cada um dos fatores, mas, tambm, se existe interao entre os diversos
fatores considerados no modelo. A interao entre dois ou mais fatores ocorre
quando a modificao na varivel-resposta, decorrente da variao entre os
nveis de um fator, no igual modificao decorrente da mesma variao dos
outros fatores. Isto , a interao ocorre quando a mudana de nvel em um dos

290 Bioestatstica aplicada Pesquisa Experimental

BIOESTATISTICA_VOL02.indb 290 25/06/12 17:23


fatores produz uma modificao na resposta em um dos nveis do outro fator,
diferente da resposta produzida nos outros nveis deste mesmo fator.
Para ilustrar este conceito, vamos considerar o exemplo de um experimento
fatorial que combina 3 doses (D0, D1 e D2) de uma droga, com 2 medidas (P0 e P1)
de massa corporal, em animais, cujo o objetivo mediar a excreo urinria da
referida droga. As mdias dos valores esto apresentadas na tabela abaixo.

Tabela 23.2 Valores mdios da excreo urinria da droga, em mcg/ml, conforme


a dose e a massa corporal
Massa corporal (Fator B)
Dose da droga (Fator A)
P0 P1
D0 10 20
D1 20 30
D2 30 40

Os grficos abaixo ilustram a relao entre os dois fatores considerados no


estudo. Neles, podemos verificar que as linhas correspondentes aos diferentes
nveis de cada um dos fatores so paralelas entre si. Isto mostra que, para todos os
nveis do fator A, a diferena entre as mdias para os nveis do fator B a mesma.
Do mesmo modo, para os dois nveis do fator B, as diferenas entre as mdias
de quaisquer dos nveis do fator A so sempre iguais. Estas trs caractersticas,
quando presentes, mostram no haver interao entre os fatores estudados.

Fig. 23.1 Grficos que mostram a ausncia de interao entre os fatores dose e massa
corporal, em relao excreo urinria de uma droga experimental

Experimentos Fatoriais 291

BIOESTATISTICA_VOL02.indb 291 25/06/12 17:23


Nos experimentos fatoriais, quando a interao entre os fatores est
presente, isto pode afetar as observaes, de tal modo que os resultados da
pesquisa podem ser estudados pela combinao de diferentes nveis de cada
um dos fatores. Assim, quando dois fatores so investigados, uma alternativa
seria conduzir dois diferentes experimentos, um para cada fator. Caso isto seja
feito, cada experimento fornecer apenas informao sobre o seu prprio fator,
de tal maneira que, se mais informaes fossem necessrias, novos fatores
deveriam ser investigados, o que aumentaria consideravelmente o nmero de
experimentos. Por esta razo, a alternativa mais lgica seria estudar todos os
fatores de modo simultneo, todos reunidos em um experimento fatorial, o
que mostra ser um nico experimento com dois ou mais fatores, mais rpido,
preciso e econmico que dois ou mais experimentos com um nico fator.
A Figura 23.2, abaixo, mostra os grficos que ilustram um experimento no
qual ocorre interao entre os fatores.

Fig. 23.2 Grficos que mostram a presena de interao entre os fatores dose e massa
corporal, em relao excreo urinria de uma droga experimental

Assim, quando o efeito de um fator depende do nvel do outro,dizemos que


os dois fatores interagem. Neste caso, possvel calcular o efeito da interao
entre eles, o que ser demonstrado a seguir. Para tal objetivo, vamos considerar
um experimento fatorial 2 x 2, com os fatores, dose da droga, mensurada nos
nveis D0 e D1, e peso corporal (P), nos nveis P0 e P1. A varivel de desfecho
estudada o valor da excreo urinria da referida droga. Os dados esto
representados na Tabela 23.3, abaixo.

292 Bioestatstica aplicada Pesquisa Experimental

BIOESTATISTICA_VOL02.indb 292 25/06/12 17:23


Tabela 23.3 Valores mdios da excreo urinria da droga, em mcg/ml, conforme
a dose e o peso corporal

Peso corporal (Fator B)


Dose da droga (Fator A) Total
P0 P1
D0 22 35 57
D1 48 73 121
Total 70 108 178

A Figura 23.3 mostra a representao geomtrica dos efeitos do experi-


mento relacionado na Tabela 23.3. Os vrtices do quadrado representam os
resultados da excreo urinria da droga para todas as possveis combinaes
entre os dois fatores includos no experimento, ao passo que os sinais + e
representam o menor e o maior nvel desses fatores.

Fig. 23.3 Representao geomtrica de um delineamento fatorial 2 x 2

Efeito simples de um fator


Corresponde ao valor da variao da varivel-resposta, no caso, a excreo
urinria da droga, em razo das variaes nos nveis de um fator, em cada um
dos nveis do outro fator. dado pelas seguintes equaes:

Efeito simples do Fator A (Dose) no nvel P0 do Fator B (Peso).


Dose(em P0) = y2 y1 = 48 22 = 26 mcg/ml.
Interpretao: Ao nvel de P0, a variao da dose da droga causa uma
alterao de 26 mcg/ml na excreo urinria.

Experimentos Fatoriais 293

BIOESTATISTICA_VOL02.indb 293 25/06/12 17:23


Efeito simples do Fator A (Dose) no nvel P1 do Fator B (Peso).
Dose(em P1) = y4 y3 = 73 35 = 38 mcg/ml.
Interpretao: Ao nvel de P1, a variao da dose da droga causa uma
alterao de 38 mcg/ml na excreo urinria.

Efeito simples do Fator B (Peso) no nvel D0 do Fator A (Dose).


Peso(em D0) = y3 y1 = 35 22 = 13 mcg/ml.
Interpretao: Ao nvel de D0, a variao do peso causa uma alterao de
13 mcg/ml na excreo urinria.

Efeito simples do Fator B (Peso) no nvel D1 do Fator A (Dose).


Peso(em D1) = y4 y2 = 73 48 = 25 mcg/ml.
Interpretao: Ao nvel de D1, a variao do peso causa uma alterao de
25 mcg/ml na excreo urinria.

Efeito principal de um fator


Corresponde diferena entre os valores mdios das variaes da
varivel-resposta, no caso a excreo urinria da droga, medidos nveis
de um fator, independentemente dos nveis do outro fator. Para o exemplo
em questo, o efeito principal do Fator A (Dose) pode ser entendido como
a diferena entre as mdias da variao da excreo urinria da droga,
medidas nos dois nveis de A, independente do fator B (Peso). dado pelas
seguintes equaes:

Efeito principal do Fator A (Dose).


( y + y 4 ) ( y3 + y1 ) (73 + 48) (35 + 22
2)
Fator A (Dose ) = 2 = = 32 mcg / ml
2 2 2 2
Interpretao: quando a dose administrada passa do nvel baixo para o
nvel alto, isto causa um aumento mdio de 32 mcg/ml na excreo urinria
da droga.

Efeito principal do Fator B (Peso).


( y + y 4 ) ( y1 + y2 ) (35 + 73) (22 + 48
8)
Fator B (Peso) = 3 = = 38 mcg / ml
2 2 2 2

294 Bioestatstica aplicada Pesquisa Experimental

BIOESTATISTICA_VOL02.indb 294 25/06/12 17:23


Interpretao: quando o peso passa do nvel baixo para o nvel alto, isto
causa um aumento de 38 mcg/ml na excreo urinria da droga.

Efeito da interao entre dois fatores


Corresponde ao valor da variao que ocorre na varivel-resposta, em razo
da variao nos nveis de um fator, quando este passa de um nvel a outro do outro
fator. Para o exemplo em questo, o efeito da interao entre os Fatores A e B pode
ser entendido como a diferena entre a variao de A (Dose) em P1 e a variao de
A (Dose) em P0. Pode ser calculada por uma das duas frmulas abaixo.

Efeito da interao do Fator A (Dose) x Fator B (Peso).

Efeito da Dose(em P1) Efeito da Dose(em P0) (38 26)


Dose Peso = = = 6, ou ainda,
2 2

ou ainda,

Efeito do Peso(em D1) Efeito do Peso(em D0) (25 13)


Peso Dose = = =6
2 2

Note que tanto faz calcular a interao AB como BA, o resultado o mesmo.
Porm, a maneira mais simples de calcular o efeito da interao entre dois
fatores pelo clculo da diferena (contraste) entre as mdias determinadas
pelas duas diagonais. A equao a seguinte:

( y1 + y 4 ) ( y2 + y3 ) y1 y2 y3 + y 4
AB = =
2 2 2

Assim para o exemplo em questo, teramos:

22 48 35 + 73 12
AB = = =6
2 2

Note, tambm, que, na representao geomtrica de um experimento


fatorial, os efeitos principais dos fatores so calculados pelas diferenas entre
os lados opostos, ao passo que o efeito de interao dado pelo contraste entre
as duas diagonais do quadrado. A seguir, mostraremos um delineamento intei-
ramente casualizado, com modelo fatorial 22.

Experimentos Fatoriais 295

BIOESTATISTICA_VOL02.indb 295 25/06/12 17:23


23.2 EXPERIMENTO FATORIAL 22

Para realizar um experimento fatorial 2 x 2, o primeiro passo definir as


variveis preditoras, isto , os dois fatores (ou classes, para dados qualitativos)
que atuaro na determinao da varivel de desfecho (varivel-resposta).
Portanto, para efeito de ilustrao, vamos supor o seguinte exemplo:
Exemplo: Uma indstria de alimentos conduziu um experimento para
estudar os efeitos da temperatura (Fator A) e do tempo (Fator B) sobre o
rendimento, em porcentagem, de um novo produto extrusado (desfecho).
Assim, para que se possa estudar o efeito de qualquer fator sobre uma
varivel-resposta, necessrio faz-lo variar e observar o resultado que essa
variao produz sobre essa varivel de desfecho. Para isso, precisamos estudar
o efeito de cada fator em pelo menos dois diferentes nveis, o que nos leva a
concluir que o experimento mais simples aquele em que cada fator varia
somente entre dois nveis. Neste experimento, cada fator ser medido em dois
nveis: baixo () e alto (+).
O prximo passo escolher os nveis de variao de cada um dos dois fatores.
Esta escolha muito importante e deve ser embasada em conhecimento prvio
sobre a relao entre as variveis estudadas. Na prtica, os melhores nveis
devem ser escolhidos com base em dados publicados na literatura ou colhidos
em ensaios aleatrios realizados em um projeto piloto. Isto evita que o pesqui-
sador atire no escuro, isto , que tente adivinhar quais so os melhores nveis
para o seu experimento. Consideram-se como nveis mximo e mnimo ideais
para um determinado fator, aqueles que, no ensaio piloto, produzem a melhor
e a pior resposta sobre a varivel-resposta, respectivamente, quando este fator
considerado de maneira individual. Para efeitos ilustrativos, tomaremos os
seguintes nveis para as variveis estudadas:
Fator A (Temperatura): Nvel inferior T = 60 oC.
Nvel superior T+ = 80 oC.
Fator B (Tempo): Nvel inferior t = 20 min.
Nvel superior t+ = 30 min.

Portanto, para fazer o experimento, deve-se realizar todos os ensaios


possveis (quatro para o fatorial 2 x 2) e registrar as respectivas respostas

296 Bioestatstica aplicada Pesquisa Experimental

BIOESTATISTICA_VOL02.indb 296 25/06/12 17:23


observadas (rendimentos do produto) para cada uma das quatro possveis
combinaes entre os nveis escolhidos. Assim, teremos: 60 oC x 20 min, 60 oC
x 30 min, 80 oC x 20 min e 80 oC x 30 min. Para que se possa estimar o erro
aleatrio da resposta em cada uma das combinaes, os ensaios so todos reali-
zados com trs repeties (triplicata). Este procedimento importante para que
se possa determinar se existe significncia estatstica entre a ao de cada fator e
o desfecho estudado. Os dados dos ensaios devem ser dispostos em uma matriz
de planejamento, conforme mostrado na Tabela 23.4, abaixo.

Tabela 23.4 Matriz de planejamento para os ensaios

Fator A Fator B Tratamentos Repeties Mdia


Total
(Temperatura) (Tempo) (Ensaios) 1 2 3 (Rendimento)

y1 21 20 19 60 20

+ y2 21 23 22 66 22

+ y3 26 24 25 75 25

+ + y4 33 32 31 96 32

A Figura 23.4 mostra a representao geomtrica dos efeitos do experi-


mento mostrado na Tabela 23.4.

y3 = 25 y4 = 32
t1

Fator B
(Tempo em min)

t0
y1 = 20 y2 = 22

T0 Fator A T1
(Temperatura em 0C)

Fig. 23.4 Representao geomtrica dos resultados obtidos em um experimento que correla-
ciona os efeitos dos fatores Tempo e Temperatura, no rendimento de um produto alimentcio

Experimentos Fatoriais 297

BIOESTATISTICA_VOL02.indb 297 25/06/12 17:23


Clculo dos efeitos dos fatores
O passo seguinte calcular os efeitos dos fatores, tal como foi demonstrado
no item 22.1. Os clculos so os seguintes:

Temperatura:
( y + y 4 ) ( y 1 + y 3 ) (22 + 32) (20 + 25)
T= 2 = = 4 ,5%
2 2 2 2
- A mudana da temperatura, do nvel baixo para o alto, aumentou o rendi-
mento em 4,5%.

Tempo:
( y + y 4 ) ( y 1 + y 2 ) (25 + 32) (20 + 22)
t= 3 = = 8,5%
2 2 2 2
- A mudana do tempo, do nvel baixo para o alto, aumentou o rendimento
em 8,5%.

Temperatura x Tempo:
y y 2 y 3 + y 4 20 22 25 + 32
Txt = 1 = = 5%
2 2
- A interao entre os dois fatores, temperatura e tempo, aumentou o
rendimento em 5%.

A Tabela 23.5 mostra as mdias dos valores dos rendimentos conforme os


efeitos dos fatores estudados.

Tabela 23.5 valores mdios do rendimento conforme o tempo e a temperatura


de processamento
Fator B
Fator A (Tempo) Mdias conforme o
(Temperatura) tempo
+
20 25 y t = 22,5

+ 22 32 y t + = 27

Mdias conforme a y = 24 ,75


yT = 21 yT + = 28,5
temperatura

298 Bioestatstica aplicada Pesquisa Experimental

BIOESTATISTICA_VOL02.indb 298 25/06/12 17:23


Ajuste do modelo de regresso
Quando os fatores em estudo so do tipo quantitativo, como no exemplo em
questo (temperaturas e tempo), est indicado fazer uma anlise de regresso
mltipla. O modelo de regresso para um experimento com dois fatores, cada
um mensurado em dois nveis, dado pela seguinte equao:

y i jr = 0 + 1x 1 j + 2x 2 j + 12x 1 j x 2 j + ijr

Onde: y = a varivel resposta.


 b0, b1, b2 e b12 = Parmetros que sero estimados pelo mtodo dos
mnimos quadrados.
 x1 e x2 = So as variveis que representam os fatores A e B respec-
tivamente. As variveis x1 e x2 so codificadas como -1 e +1, e x1x2
representa a interao entre elas.
e = o termo do erro aleatrio associado resposta y.

Na prtica, os parmetros so calculados da seguinte maneira:

0 = y = 24 ,75

Efeito do fator A 4 ,5%


1 = = = 2,25%
2 2

Efeito do fator B 8,5%


2 = = = 4 ,25%
2 2

Efeito dos fatores AB 5%


12 = = = 2,5%
2 2

Assim, o modelo ajustado dado pela equao abaixo, na qual os coeficientes


b0, b1, b2 e b12 so estimadores dos parmetros populacionais b0, b1, b2 e b12.

y = b0 + b1x 1 + b2x 2 + b12x 1x 2 = 24 ,75 + 2,25x 1 + 4 ,25x 2 + 2,5x 1x 2

De todo jeito, relevante notar que a regresso mltipla avalia apenas


a relao linear entre as variveis preditoras e a varivel-resposta. Por sua

Experimentos Fatoriais 299

BIOESTATISTICA_VOL02.indb 299 25/06/12 17:23


vez, os coeficientes de regresso (bi) so interpretados de modo diferente na
regresso mltipla quando comparados com a regresso simples. Nesta, o
coeficiente de regresso b indica a quantidade de variao da varivel-resposta
y que devida a cada acrscimo de uma unidade na varivel preditora x. Na
regresso mltipla, um determinado coeficiente de regresso bi mostra at que
ponto o valor da varivel-resposta y pode ser alterado em funo do aumento
de uma unidade na varivel preditora xi, mantendo-se constantes os valores
das demais variveis preditoras da equao de regresso.
Assim, necessrio comparar os efeitos dos fatores para que se
possam determinar qual deles significativo. Esta comparao realizada
pela aplicao do teste F (ANOVA), conforme foi abordado no captulo 19
deste livro.

Confirmao por anlise de varincia


Portanto, quando o objetivo comparar vrios fatores, simultaneamente, e
para que se possa manter o erro tipo I em um nvel constante, o procedimento
correto o emprego de um teste de abrangncia global, o qual utilizado para
avaliar se existe alguma diferena entre as mdias e, somente se este primeiro
teste for positivo, deve-se, ento, testar as vrias combinaes entre elas. Neste
caso, a tcnica a ser empregada a anlise de varincia (ANOVA), a qual
compara todas as mdias em um nico teste, objetivando identificar se existe
ao menos uma diferena estatisticamente significativa entre os fatores compa-
rados. Caso esta diferena exista, aplica-se, ento, uma das diversas tcnicas de
comparaes mltiplas para que se possam identificar quais os grupos diferem
entre si. O teste ANOVA tambm utilizado na verificao da significncia
estatstica para os valores do coeficiente de correlao mltipla (R) e coefi-
ciente de determinao (R2). Neste caso, o delineamento foi um experimento
inteiramente casualizado, com os tratamentos dispostos em um modelo de
esquema fatorial 2 x 2, com trs repeties. Os dados obtidos so apresentados
na Tabela 23.6.
Assim, existe diferena estatisticamente significante entre os rendimentos
obtidos para o produto extrusado com as variaes da temperatura (Fator A)
e do tempo (Fator B)?

300 Bioestatstica aplicada Pesquisa Experimental

BIOESTATISTICA_VOL02.indb 300 25/06/12 17:23


Tabela 23.6 Valores, em porcentagem, dos rendimentos, para cada uma das repeties
conforme o tipo de tratamento
Tratamentos (ensaios)
Total
T 0t 0 T 1t 0 T 0t 1 T 1t 1
21 21 26 33
Repeties 20 23 24 32
19 22 25 31
Totais 60 66 75 96 x = 297
Repeties (n) 3 3 3 3 N = 12

Mdias ( x ) 20 22 25 32

x2 1.202 1.454 1.877 3.074 7.607

Passo 1 Formular as hipteses estatsticas:


H 0: 
No existem diferenas entre as mdias dos rendimentos, pois
T t = T t = T t = T t .
0 0 1 0 01 11
HA: Ao menos uma das mdias difere das demais, sendo T t T t ou
0 0 1 0

T t T t ou T t T t ou T t T t ou T t T t ou T t T t
0 0 01 0 0 11 1 0 01 1 0 11 01 11

Passo 2 Escolher o nvel de significncia (nvel alfa):


= 0,05 (5%) unilateral
Passo 3 Determinar o valor crtico do teste F:
gl do numerador (entre) - gl E = k 1 = 4 1 = 3
gl do denominador (dentro) - gl D = N k = 12 4 = 8
gl do total - glT = N 1 = 12 1 = 11
Ento, F;gl = F0,05;3;8 = 4 ,07
N ;glD

Passo 4 Calcular o valor do fator de correo C:


2
k n
x 2
C= = 297 = 88.209 = 7.350,75
N 12 12

Passo 5 Calcular o valor do teste F:


k n
SQT = x 2 C = 7.607 7.350,75 = 256,25

Experimentos Fatoriais 301

BIOESTATISTICA_VOL02.indb 301 25/06/12 17:23


2
n
x
k
C = 60 + 66 + 75 + 96 7.350,75 = 248,25
2 2 2 2
SQE =
n 3

SQE 248,25
s E2 = = = 82,75
k 1 3

SQD = SQT SQE = 256,25 248,25 = 8

SQD 8
s D2 = = =1
N k 8

s E2 82,75
Fcalc = = = 82,75
s D2 1

Tabela 23.7 Anlise de varincia dos dados da Tabela 23.6

Fonte de variao gl SQ QM Fcalc


Entre os grupos
3 248,25 82,75
(tratamentos) 82,75
Dentro dos grupos P = 0,00004
8 8,00 1,00
(variao residual)
Total 11 256,25

Passo 6 Regra de deciso:

Se Fcalc < F0,05;3;8 , aceita-se H 0 .

Se Fcalc F0,05;3;8 , rejeita-se H 0 .

Como Fcalc = 82,75 > F0,05;3;20 = 4 ,07, rejeita-se H 0 .

Passo 7 Concluso:
Como o valor para Fcalc maior que o valor crtico tabelado F0,05;3;8 , rejeita-
-se H0 e conclui-se que ao menos uma das mdias difere das demais.

302 Bioestatstica aplicada Pesquisa Experimental

BIOESTATISTICA_VOL02.indb 302 25/06/12 17:23


Portanto, existe alguma diferena estatisticamente significante entre
as mdias referentes aos rendimentos dos ensaios avaliados, pois
Fcalc = 82,75; P = 0,00004 .

Com este resultado, a continuao da anlise deve envolver a comparao


das mdias dos ensaios pelo emprego de um dos procedimentos de comparaes
mltiplas, tal como os testes de Tukey, Student-Newman-Keuls, Bonferroni etc.
Uma maneira mais simples de anlise baseada no modelo de experimento
fatorial. Assim, tomando-se os totais repeties das diferentes combinaes
dos nveis dos fatores A e B, pode-se construir um novo quadro de anlise de
varincia que permite testar se existe interao entre os fatores estudados, e se
cada um desses fatores tem efeito estatisticamente significante sobre o rendi-
mento do produto em anlise. O Quadro 23.1 mostra os totais das repeties para
cada um dos diferentes nveis dos fatores temperatura (T) e tempo (t).

Quadro 23.1 Valores totais das repeties das diferentes combinaes


dos nveis dos fatores A e B

Fator B
Fator A (Tempo) Totais
(Temperatura)
t0 t1

T0 60 (ya) 25 (yb) 85 (yab)

T1 22 (yc) 32 (yd) 54 (ycd)

Totais 82 (yac) 57 (ybd) 139 (yabcd)

Assim, sendo r o nmero de repeties, a e b o nmero de nveis para


os fatores A e B, respectivamente, as Somas dos Quadrados (SQ) podem ser
escritas pelas seguintes frmulas:
2
y ab + y cd
2 2
y abcd 852 + 542 1392
SQ( A ) = = = 80
0,08
2r a.b.r 6 12

2
y ac + y bd
2 2
y abcd 822 + 572 1392
SQ(B ) = = = 52
2,08
2r a.b.r 6 12

Experimentos Fatoriais 303

BIOESTATISTICA_VOL02.indb 303 25/06/12 17:23


SQ( AB ) = 248,25 80,08 52,08 = 116,09

Obs. As Somas dos Quadrados associadas ao total e ao resduo perma-


necem as mesmas, sendo SQ(T) = SQ(A) +SQ(B) + SQ(AB).

Deste modo, uma nova tabela para a anlise de varincia pode ser
construda:

Tabela 23.8 Anlise de varincia dos dados do Quadro 23.1

Fonte de variao gl SQ QM Fcalc


Temperatura (A) 1 80,08 80,08 80,08
Tempo (B) 1 52,08 52,08 52,08
Interao AB 1 116,09 116,09 116,09
Tratamentos 3 248,25 82,75 82,75
Resduo 8 8,00 1,00
Total 11 256,25

Comparando-se os valores de Fcalc, obtidos na Tabela 23.8, com os valores


crticos tabelados, podemos concluir que:

Para a interao AB:

Se FcalcAB < F0,05;1;8 , aceita-se H 0 .

Se FcalcAB F0,05;1;8 , rejeita-se H 0 .

Como FcalcAB = 116,09 > F0,05;3;20 = 5,32, rejeita-se H 0 .

Assim, como o teste para interao AB foi significativo, isto indica que
o efeito da temperatura estatisticamente diferente entre os dois nveis
do fator tempo considerados no estudo. A Figura 23.5 mostra o grfico das
mdias do rendimento para os diferentes nveis da temperatura, conforme o
nvel do fator tempo.

304 Bioestatstica aplicada Pesquisa Experimental

BIOESTATISTICA_VOL02.indb 304 25/06/12 17:23


Fig. 23.5 Grficos das mdias do rendimento conforme a interao dos fatores
temperatura e tempo

Uma vez que a interao entre os fatores A e B foi estatisticamente signi-


ficativa, no tem sentido estudar os efeitos simples de cada um dos fatores,
isoladamente. O passo seguinte, ento, seria desdobrar a interao para que
se possa estudar o comportamento de um dos fatores dentro de cada nvel
do outro fator. Na prtica, e em razo da tediosidade dos clculos, utilizamos
programas estatsticos computacionais que, alm de fornecer qual a combi-
nao tima dos fatores na obteno da resposta desejada, disponibilizam
mtodos grficos que modelam a funo que relaciona essas variveis, de modo
que uma figura geomtrica possa ser obtida quando uma varivel resposta
plotada como uma funo de um ou mais fatores quantitativos. Dentro dos
diferentes mtodos grficos, destaca-se a anlise de superfcie, a qual ser
abordada no item subsequente deste captulo. Mas, de qualquer maneira, para
o leitor interessado em aprofundar seus conhecimentos a respeito de experi-
mentos fatoriais, sugerimos as seguintes leituras: Rodrigues, M. I.; Iemma, A.
F. (Planejamento de experimentos e otimizao de processos) e Neto, B. B.;
Scarmino, I. S.; Bruns, R. E. (Como fazer experimentos).

23.3 EXPERIMENTO FATORIAL NO MINITAB

O planejamento de experimentos utilizado para determinar qual a


combinao tima de variveis na obteno da resposta desejada. A resposta
a varivel dependente, enquanto as variveis que a influenciam, so as

Experimentos Fatoriais 305

BIOESTATISTICA_VOL02.indb 305 25/06/12 17:23


variveis independentes, denominadas de fatores. Este tipo de planejamento
de experimentos permite estimar os efeitos de vrios fatores e suas respectivas
interaes sobre a varivel resposta, e, para tanto, deve-se selecionar os nveis
em que cada fator ir atuar. O planejamento fatorial completo permite fazer
experimentos com todas as possveis combinaes entre os nveis dos fatores.
Para acessar este planejamento, utiliza-se, no Minitab, o caminho Stat DOE
Factorial, conforme a Figura 23.6, mostrada abaixo.

Fig. 23.6 Comandos para realizao do planejamento fatorial no Minitab

A fim de realizar um planejamento fatorial completo 22, estudamos


dois fatores, cada um mensurado em dois nveis. Inicialmente vamos criar o
planejamento; em seguida executar o experimento e finalmente, analisar o
planejamento. Para tal, utiliza-se o seguinte caminho Stat DOE Factorial
Create Factorial Design, conforme mostrado na Figura 23.6.
Assim, suponha que se queira criar um planejamento fatorial completo com
dois fatores, Temperatura (Fator A) e Tempo (Fator B), cada um a dois nveis,
conforme mostra Tabela 23.9. O planejamento gerado deve ter trs replicaes
e deve estar na ordem padro de execuo.

Tabela 23.9 Planejamento fatorial completo com dois fatores, Temperatura e Tempo
Baixo Alto
Fontes de variao
() (+)
Fator A (Temperatura) 60 80
Fator B (Tempo) 20 30

306 Bioestatstica aplicada Pesquisa Experimental

BIOESTATISTICA_VOL02.indb 306 25/06/12 17:23


A expresso geral de um planejamento fatorial completo com dois fatores
da forma

Y = b0 + b1 A + b2B + b3AB

Onde, b0, b1, b2 e b3 so coeficientes e A, B so os fatores.


A janela inicial mostrada na Figura 23.7. Nesta janela, pode-se escolher o
tipo de planejamento em Type of Design. Os tipos disponveis so:
2-Level factorial (default generators) Esta opo selecionada quando
se deseja criar planejamentos fatoriais com fatores em dois nveis, com os
geradores padro;
2-Level factorial (specify generators) Esta opo selecionada quando
se deseja criar planejamentos fatoriais com fatores em dois nveis e se quer
especificar os geradores;
Plackett-Burman design Esta opo selecionada quando se deseja
criar planejamentos Plackett-Burman (planejamento de seleo);
General full factorial design Esta opo selecionada quando se deseja
criar planejamentos fatoriais completos, com pelo menos um dos fatores
sendo mensurado em mais de dois nveis.

Fig. 23.7 Janela inicial para criar Fig. 23.8 Tabela de escolha
um experimento fatorial do planejamento adequado

Na janela inicial, tm-se os seguintes submenus: Display Available


Designs, Designs, Factors, Options e Results. Em Display Available
Designs, que aparece na Figura 23.8, mostrada uma tabela para auxiliar

Experimentos Fatoriais 307

BIOESTATISTICA_VOL02.indb 307 25/06/12 17:23


na escolha do planejamento mais adequado, baseando-se no nmero de
fatores e execues que ele ter. Nesta tabela, os planejamentos esto classi-
ficados por cores como em um semforo: vermelho (resoluo III - cuidado,
planejamento altamente fracionado), amarelo (resoluo IV - planejamento
deve ser realizado com ateno) e verde (resolues V, VI, VII, VIII e Full - siga
em frente, estes planejamentos so reconhecidos). Este submenu apenas um
guia para a escolha do menor planejamento, mas no h selees a serem feitas.

Em Designs, que aparece na Figura 23.9, podem-se escolher as carac-


tersticas do planejamento. Na primeira caixa escolhe-se o planejamento
a ser criado. Nela, tem-se o nome, o nmero de execues, a resoluo e
a representao do planejamento. Ainda, no submenu Designs, tm-se as
seguintes opes:
Number of center points Nesta opo, entra-se com o nmero de pontos
centrais do planejamento;
Number of replicates Nesta opo, entra-se com nmero de replicaes
de cada fator;
Number of blocks Entra-se com o nmero de blocos do planejamento.

Em Factors, mostrado na Figura 23.10, tm-se as seguintes opes:


Factor Mostra os fatores (variveis) que sero considerados no planejamento;
Name Nesta opo, entra-se com os nomes dos fatores selecionados;
Low Nesta outra opo, entra-se com o nvel baixo de cada fator;
High Nesta, entra-se com o nvel alto de cada fator.

Fig. 23.9 Submenu Designs


Fig. 23.9 Submenu Designs Fig. 23.10 Submenu Factors

308 Bioestatstica aplicada Pesquisa Experimental

BIOESTATISTICA_VOL02.indb 308 25/06/12 17:23


Em Options, que aparece na Figura 23.11, tm-se as seguintes opes:
Fold Design Onde se pode criar um planejamento invertido que
consiste no planejamento original e uma cpia deste, mas com os nveis
invertidos. Esta opo utilizada quando se trabalha com planeja-
mentos fatoriais fracionrios, pois neste tipo de planejamento, pode-se
ter confundimento, isto , um ou mais efeitos no podem ser estimados
separadamente.
Do not fold Utiliza-se esta opo quando se quer usar o planejamento
invertido;
Fold on all factors Utiliza-se esta opo quando o objetivo usar um
planejamento com os nveis invertidos de todos os fatores;
Fold just on factor Para que os nveis sejam invertidos somente no fator
selecionado;
Fraction Esta opo deve ser selecionada quando se quer especificar
qual ser a frao utilizada no planejamento, caso ele seja fracionrio;
Use principal fraction Esta opo deve ser escolhida quando se quer
utilizar a frao principal;
Use fraction number a opo selecionada quando se quer utilizar
outra frao diferente da principal;
Randomize runs Utiliza-se esta opo quando se quer tornar aleatria a
ordem de execuo do planejamento;
Base for random data generator Esta opo permite que se entre com
a semente da ordem aleatria;
Store design in worksheet Esta opo permite que se armazenem os
dados do planejamento em uma planilha.

Em Results, mostrado na Figura 23.12, tm-se as seguintes opes:


Printed Results Utiliza-se esta opo quando se deseja escolher quais resul-
tados sero exibidos na Session Window. Tm-se as seguintes alternativas:
a. None Esta opo deve ser selecionada quando se deseja que nenhum
resultado seja exibido;
b. Summary table Utiliza-se esta opo quando se quer exibir o resumo
do planejamento com o nmero de fatores, execues, blocos, repeties e
pontos centrais;

Experimentos Fatoriais 309

BIOESTATISTICA_VOL02.indb 309 25/06/12 17:23


c. Summary table, alias table Esta opo permite que seja exibido o
resumo do planejamento, como na alternativa acima, e mais a tabela de
confundimento;
d. Summary table, alias table, data table Utiliza-se esta opo quando
se deseja que sejam exibidos o resumo do planejamento, a tabela de
confundimento e uma matriz de planejamento;
e. Summary table, alias table, data table, defining relation Esta opo
permite que sejam exibidos o resumo do planejamento, a tabela de confun-
dimento, a matriz do planejamento e as relaes definidas entre os fatores.

Fig. 23.11 Submenu Options Fig. 23.12 Submenu Results

Na opo Content of Alias Table, tm-se duas alternativas:


a. Default interactions Utiliza-se esta opo quando se quer que mostrar
a tabela de confundimento com um nmero de interaes padro;
b. Interactions up through order Esta opo deve ser selecionada
quando se quer definir a maior ordem de interao que ter a tabela de
confundimento exibida na Session Window.

Para criar o planejamento apresentado na Tabela 23.9, precisa-se


preencher a janela inicial da Figura 23.7 da seguinte forma: em Type of
Design escolhe-se 2-level factorial (default generators) e, na caixa Number
of factors, entra-se com o nmero 2 (os fatores so Temperatura e Tempo).
O submenu Designs deve ser preenchido de acordo com a Figura 22.13, j
que o planejamento solicitado no exemplo tem duas replicaes. O submenu
Factors deve ser preenchido de acordo com a Figura 23.14.

310 Bioestatstica aplicada Pesquisa Experimental

BIOESTATISTICA_VOL02.indb 310 25/06/12 17:23


Fig. 23.13 Submenu Designs Fig. 23.14 Submenu Designs com os


para o exemplo da Tabela 23.9 dados do exemplo mostrado na Tabela 23.9

No submenu Options, a nica alterao necessria desmarcar a opo


Randomize runs, j que se quer o planejamento na ordem-padro. Nenhuma
alterao ser feita no submenu Results. Pode-se, desta forma, gerar o plane-
jamento solicitado na Tabela 23.9. Os resultados exibidos na Session Window
so apresentados na Figura 23.15. Neste resumo, tem-se o nmero de fatores
(Factors), o planejamento base (Base Design), o nmero de execues (Runs),
o nmero de replicaes (Replicates), o nmero de blocos (Blocks) e o nmero
de pontos centrais (Center pts). Na Figura 23.16, tem-se a matriz de planeja-
mento, armazenada na planilha.

Full Factorial Design


Factors: 2 Base Design:2; 4
Runs: 12 Replicates:3
Blocks: 1 Center pts (total):0

All terms are free from aliasing.

Fig. 23.15 Resumo do experimento Fig. 23.16 Matriz de Planejamento para o


fatorial exemplo da Tabela 23.7, armazenada no
Session Window

Experimentos Fatoriais 311

BIOESTATISTICA_VOL02.indb 311 25/06/12 17:23


Seguindo o roteiro inicial, depois que o planejamento desenvolvido,
devem-se executar os experimentos. Cada linha da planilha mostrada na Figura
23.17 um experimento executado.

Fig. 23.17 Matriz de planejamento aps executado o experimento do exemplo


mostrado na Tabela 23.7

Para analisar um planejamento de experimentos fatorial, utiliza-se o


caminho Stat DOE Analyze Factorial Design, mostrado na Figura 23.18.
Agora, suponha que se deseje analisar o planejamento proposto na Tabela 23.9,
considerando como varivel-resposta o Rendimento, conforme a Figura 23.19.
O objetivo obter o modelo do experimento para unidades no codificadas e
construir os grficos dos efeitos (Probabilidade Normal e Pareto). Antes de
iniciar a anlise dos experimentos, necessrio colocar a coluna Rendimento
na planilha do MINITAB, conforme Figura 23.16.

Fig. 23.18 Comando Analyze Factorial Design

312 Bioestatstica aplicada Pesquisa Experimental

BIOESTATISTICA_VOL02.indb 312 25/06/12 17:23


A janela inicial do comando Analyze Factorial Design mostrada na
Figura 23.19. Na caixa Responses, entra-se com a varivel-resposta. Nesta,
tm-se os seguintes submenus: Terms, Covariates, Graphs, Results e Storage.
Em Terms, mostrado na Figura 23.20, pode-se se selecionar os termos que
sero includos no modelo. Neste submenu, tm-se as seguintes opes:
Include terms in the model up through order Utiliza-se esta opo
quando se quer especificar a ordem das interaes entre os fatores;
Available Terms Nesta opo, selecionam-se os termos que podem ser
includos no modelo;
Selected Terms Nesta opo, tm-se os termos que j esto selecio-
nados para fazer parte do modelo. Para incluir ou excluir um termo,
seleciona-se o termo e utilizam-se os botes que aparecem entre as cai-
xas de dilogo;
Include blocks in the model Utiliza-se esta opo quando se quer os
termos relacionados aos blocos;
Include center points in the model Utiliza-se esta opo quando se
querem incluir os termos relacionados aos pontos centrais.

Fig. 23.19 Janela inicial do comando Fig. 23.20 Submenu Terms


Analyze Factorial Design

Em Graphs, podem-se construir grficos para analisar os efeitos e


os resduos. Este submenu mostrado na Figura 23.21. Em Effects Plots,
podem-se selecionar os grficos dos efeitos:
Normal Nesta opo, um grfico de probabilidade normal dos efeitos
construdo;

Experimentos Fatoriais 313

BIOESTATISTICA_VOL02.indb 313 25/06/12 17:23


Pareto Nesta opo, um grfico de Pareto dos efeitos construdo. Na
opo Alpha, especifica-se o nvel de significncia desejado.

Os resduos so obtidos a partir da diferena entre os valores observados


e os valores ajustados pelo modelo. Para construir os grficos de resduos,
deve-se selecionar o tipo de resduo desejado. Em Residuals for Plots, tm-se
as seguintes opes:
Regular Nesta opo, utilizam-se os resduos regulares;
Standardized Nesta opo, utilizam-se resduos padronizados;
Deleted Nesta opo utilizam os resduos studentizados, que so basea-
dos na distribuio t de Student.

Em Residual Plots, tm-se as seguintes opes de grficos de resduos:


Histogram Nesta opo, obtm-se um histograma de resduos;
Normal Plot Nesta opo, obtm-se um grfico de probabilidade normal
dos resduos;
Residual versus fits Nesta opo, obtm-se um grfico de disperso dos
resduos versus os valores ajustados;
Residual versus order Nesta opo, obtm-se um grfico de disperso
dos resduos versus a ordem que os experimentos foram executados;
Residual versus the variables Nesta opo, obtm-se um grfico de dis-
perso dos resduos versus outra varivel de interesse.

Fig. 23.21 Submenu Graphs Fig. 23.22 Submenu Results

314 Bioestatstica aplicada Pesquisa Experimental

BIOESTATISTICA_VOL02.indb 314 25/06/12 17:23


Em Results, mostrado na Figura 23.22, podem-se selecionar quais infor-
maes sero exibidas na Session Window. Nele, tem-se as seguintes opes:
Display of Results, Display of Alias Table e Display of Least Squares Means.

Em Display of Results, pode-se selecionar o conjunto de informaes que


sero exibidas na Session Window. As opes so:
Do not display Nesta opo nenhuma informao exibida;
Coefficients and ANOVA table So exibidos os coeficientes do modelo e
a tabela da anlise de varincia - ANOVA;
Unusual observations in addition to the above So exibidos os co-
eficientes do modelo, a tabela da anlise de varincia e as observaes
no-usuais;
Full table of fits and residuals in addition to the above So exibidos
os coeficientes do modelo, a tabela da anlise de varincia, as observaes
no-usuais e a tabela completa de valores ajustados e resduos.

Em Display of Alias Table, seleciona-se o conjunto de informaes que


so exibidas na Session Window, referente tabela de confundimento. As
opes so:
Do not display Nesta opo nenhuma informao sobre a tabela de con-
fundimento exibida;
Default interactions Exibe a tabela de confundimento com as interaes
padro;
Interactions up through order Exibe a tabela de confundimento com as
interaes at a ordem especificada na caixa ao lado.

Em Display of Least Squares Means possibilita exibir a mdia ajustada


ou mdia de mnimos quadrados dos termos selecionados. Este item possui
duas opes:
Available Terms Nesta opo, tm-se os termos para os quais se podem
calcular a mdia ajustada, e;
Selected Terms Nesta opo tm-se os termos j selecionados, para cal-
cular a mdia ajustada.

Experimentos Fatoriais 315

BIOESTATISTICA_VOL02.indb 315 25/06/12 17:23


Para analisar o exemplo, cujos dados so mostrados na Figura 23.17, deve-se
preencher a janela inicial do comando Analyze Factorial Design, conforme
a Figura 23.19. Como no houve nenhuma restrio aos termos utilizados e
o planejamento no possui blocos ou pontos centrais, no preciso alterar
nenhuma das caixas de dilogo do submenu Terms. O submenu Graphs deve
ser preenchido de acordo com a Figura 23.20. Nenhuma alterao necessria
nos submenus Results e Storage. As sadas geradas, pelo MINITAB, so: anlise
do planejamento (na Session Window) e os grficos dos efeitos (probabi-
lidade normal e Pareto). A sada gerada na Session Window a apresentada
na Figura 23.23.
A partir da Figura 23.23, observam-se as estimativas para os efeitos
(coluna Effect) e para os coeficientes (coluna Coef) de cada termo (coluna
Term). A ltima coluna o valor P para cada termo, com base no qual se decide
se um determinado termo significante ou no. Observando os valores obtidos,
nota-se que a interao Temperatura versus Tempo no possui valor menor que
0,05 (que o nvel de significncia adotado), assim, vemos que este termo no
significante e, portanto, no necessrio inclu-lo no modelo. Ento, deve-se
gerar um novo ajuste fatorial sem a interao Temperatura versus Tempo,
conforme se pode ver na Figura 23.24.
A partir da Figura 23.24, observa-se que no primeiro grupo, tm-se as
estimativas para os efeitos, e que os valores obtidos, todos menores que 0,05,
mostram que todos os termos so significantes e, portanto, necessrio incluir
todos no modelo. Para se obter o modelo do planejamento com unidades codifi-
cadas, utilizam-se os valores da coluna Coef, para cada termo correspondente
da coluna Term.
No segundo grupo, tem-se a tabela de anlise de varincia onde so testados
os efeitos principais e as interaes. A ltima coluna o valor P para cada efeito,
com base no qual se decide qual o efeito significante ou no. Observando os
valores obtidos, v-se que, as interaes (Lack of Fit) no so significantes, mas
os efeitos principais (Main Effects) so significantes e, portanto, necessrio
incluir somente os efeitos principais no modelo.
No terceiro grupo, tem-se o modelo do planejamento, para unidades
no-codificadas. Este modelo :
Rendimento = - 71,50 + 0,65 Temperatura + 3,10 Tempo.

316 Bioestatstica aplicada Pesquisa Experimental

BIOESTATISTICA_VOL02.indb 316 25/06/12 17:23


Factorial Fit: Rendimento versus Temperatura; Tempo

Primeiro Grupo
Estimated Effects and Coefficients for Rendimento (coded units)

Term Effect Coef SE Coef T P


Constant 51,500 1,414 36,42 0,000
Temperatura 13,000 6,500 1,414 4,60 0,002
Tempo 31,000 15,500 1,414 10,96 0,000
Temperatura*Tempo 5,000 2,500 1,414 1,77 0,115

S = 4,89898 R-Sq = 94,75% R-Sq(adj) = 92,78%

Segundo Grupo
Analysis of Variance for Rendimento (coded units)

Source DF Seq SS Adj SS Adj MS F P


Main Effects 2 3390,00 3390,00 1695,00 70,63 0,000
2-Way Interactions 1 75,00 75,00 75,00 3,12 0,115
Residual Error 8 192,00 192,00 24,00
Pure Error 8 192,00 192,00 24,00
Total 11 3657,00

Terceiro Grupo
Estimated Coefficients for Rendimento using data in uncoded units

Term Coef
Constant 16,0000
Temperatura -0,600000
Tempo -0,40000
Temperatura*Tempo 0,0500000

Effects Plot for Rendimento


Alias Structure
I
Temperatura
Tempo
Temperatura*Tempo

Fig. 23.23 Resultado do Ajuste Fatorial Exemplo da Tabela 23.7

Experimentos Fatoriais 317

BIOESTATISTICA_VOL02.indb 317 25/06/12 17:23


Factorial Fit: Rendimento versus Temperatura; Tempo

Primeiro Grupo
Estimated Effects and Coefficients for Rendimento (coded units)

Term Effect Coef SE Coef T P


Constant 51,500 1,572 32,75 0,000
Temperatura 13,000 6,500 1,572 4,13 0,003
Tempo 31,000 15,500 1,572 9,86 0,000

S = 5,44671 R-Sq = 92,70% R-Sq(adj) = 91,08%

Segundo Grupo
Analysis of Variance for Rendimento (coded units)

Source DF Seq SS Adj SS Adj MS F P


Main Effects 2 3390,00 3390,00 1695,00 57,13 0,000
Residual Error 9 267,00 267,00 29,67
Lack of Fit 1 75,00 75,00 75,00 3,13 0,115
Pure Error 8 192,00 192,00 24,00
Total 11 3657,00

Unusual Observations for Rendimento

Obs StdOrder Rendimento Fit SE Fit Residual St Resid


3 3 50,0000 60,5000 2,7234 -10,5000 -2,23R

R denotes an observation with a large standardized residual.

Terceiro Grupo
Estimated Coefficients for Rendimento using data in uncoded units

Term Coef
Constant -71,5000
Temperatura 0,650000
Tempo 3,10000

Fig. 23.24 Resultado do Ajuste Fatorial sem a Interao Exemplo da Tabela 23.7

Os grficos, gerados so: grfico de probabilidade normal e o grfico de


Pareto, mostrados nas figuras 23.25 e 23.26, respectivamente.

318 Bioestatstica aplicada Pesquisa Experimental

BIOESTATISTICA_VOL02.indb 318 25/06/12 17:23


Fig. 23.25 Grfico de probabilidade normal do exemplo mostrado na Tabela 23.9

Fig. 23.26 Grfico de Pareto para o exemplo mostrado na Tabela 23.9

No grfico de probabilidade normal, somente os termos com efeitos signi-


ficantes sero identificados. Os termos que no tm efeitos significantes ficam
prximos reta, ajustada ao valor zero (0). No grfico de Pareto, tm-se os
efeitos em ordem de significncia. Os termos, cujas barras estiverem acima da
linha vermelha pontilhada, so os termos significantes para o valor a definido.
Com base nos resultados da Session Window, j analisados, e nas figuras
23.25 e 23.26, conclu-se que os fatores Temperatura e Tempo, analisados neste
planejamento, influenciam significativamente a varivel resposta Rendimento.
Alm disso, a interao entre estes dois fatores no influencia significativa-
mente na varivel resposta.

Experimentos Fatoriais 319

BIOESTATISTICA_VOL02.indb 319 25/06/12 17:23


Os grficos fatoriais so muito teis para analisar um planejamento. Para
acessar o comando Fatorial Plots, utliza-se o caminho Stat DOE Factorial
Factorial Plots, conforme a Figura 23.27. Assim, suponha que se queiram
construir os grficos de efeitos principais, interaes e a representao geom-
trica para o planejamento da Tabela 23.9.

Fig. 23.27 Comando Factorial Plots


A janela inicial deste comando mostrada na Figura 23.28. Nesta janela,
pode-se escolher entre trs tipos de grficos fatoriais:
Main Effects Plot Nesta opo constri-se o grfico de efeitos principais;
Interaction Plot Nesta opo constri-se o grfico das interaes;
Cube Plot Nesta opo constri a representao geomtrica do planejamento.

Em Type of Means to Use in Plots, seleciona-se o tipo de mdia utilizada


para a construo dos grficos fatoriais. Tm-se duas opes: a mdia dos
valores dos experimentos (Data Means) e a mdia dos valores ajustados pelo
modelo (Fitted Means).

Fig. 23.28 Submenu Factorial Plots Fig. 23.29 Submenu Factorial Plots - Main Effects

320 Bioestatstica aplicada Pesquisa Experimental

BIOESTATISTICA_VOL02.indb 320 25/06/12 17:23


Quando se seleciona qualquer das opes de grficos, o submenu Setup se
torna ativo. Nele, podem-se definir as caractersticas do grfico. Por exemplo,
o submenu Setup, mostrado na Figura 23.29, referente ao grfico Main Effect,
possui as seguintes opes:
Responses Nesta opo entra-se com a varivel resposta;
Factors to Include in Plots Nesta opo podem-se escolher quais fato-
res aparecero no grfico. Para isto, utilizam-se as seguintes opes:
Available Onde se encontram os fatores que podem ser selecionados
para o grfico;
Selected Nesta opo encontram-se os fatores j selecionados para o
grfico.

O submenu Setup para os outros dois tipos de grficos, idntico. Para o


exemplo proposto, marcam-se todos os grficos e seleciona-se a opo Data Means
na janela inicial. Em cada opo Setup, entra-se com a varivel Rendimento em
Responses e selecionam-se todos os fatores possveis. Os grficos fatoriais so
mostrados nas figuras 23.30, 23.31 e 23.32, respectivamente.

Fig. 23.30 Grfico dos Efeitos Principais para o exemplo mostrado na Tabela 23.9

No grfico dos efeitos principais, mostrado na Figura 23.30, v-se que


ambos os fatores melhoram o Rendimento, quando esto no seu nvel alto. No
grfico das interaes, mostrados na Figura 23.31, v-se que existe alguma

Experimentos Fatoriais 321

BIOESTATISTICA_VOL02.indb 321 25/06/12 17:23


interao entre Temperatura e Tempo, j que as linhas no so paralelas. Ou
seja, o efeito da Temperatura muda, dependendo do nvel escolhido para o
Tempo, e vice-versa.

Fig. 23.31 Grfico das Interaes para o exemplo mostrado na Tabela 23.9

A representao geomtrica do planejamento, mostrado na Figura 23.32,


um quadrado, j que o planejamento possui dois fatores. Neste grfico,
confirma-se que a Temperatura e o Tempo devem estar nos seus nveis altos
para aumentar o Rendimento, j que o vrtice do quadrado, cujo valor maior
(76), o que usa Temperatura a 30oC e 20 minutos de Tempo.

Fig. 23.32 Grfico Cube plot para o exemplo mostrado na Tabela 23.9

322 Bioestatstica aplicada Pesquisa Experimental

BIOESTATISTICA_VOL02.indb 322 25/06/12 17:23


23.4 SUPERFCIE DE RESPOSTA NO MINITAB

O grfico superfcie de resposta uma tcnica de otimizao, baseada em


planejamentos fatoriais, que permite investigar a existncia de curvaturas. Para
acessar este comando, utiliza-se o caminho Stat DOE Response Surface,
conforme mostra a Figura 23.33.
A superfcie de resposta possui dois tipos de planejamentos: central
composto e Box-Behnken. Aqui ser mostrado um planejamento central
composto. Inicialmente, ser criado o planejamento, em seguida executado o
experimento e, finalmente, sero analisados os resultados. Para se criar um
planejamento central composto, utiliza-se o caminho Stat DOE Response
Surface Create Response Surface Design, conforme mostra a Figura 23.33.

Fig. 23.33 Comando Response Surface

Inicialmente, considere que um pesquisador deseja saber como se comporta


o Rendimento de um experimento similar aquele apresentado na Tabela 23.9,
que altera dois diferentes fatores, a Temperatura (em graus Celsius) e o Tempo
de (em minutos). O pesquisador sabe que o modelo deste planejamento no
linear, por isto vai usar o planejamento central composto. Este planejamento se
baseia num modelo quadrtico, que tem a expresso dada por,

Y = b0 + b1 A + b2B + b3A2 + b4B2 + b5 AB

Onde, b0, b1, b2, b3, b4 e b5 so coeficientes e A, B so os fatores.

Experimentos Fatoriais 323

BIOESTATISTICA_VOL02.indb 323 25/06/12 17:23


O interesse analisar o planejamento criado pelo pesquisador, de modo
a obter o modelo do planejamento, as curvas de nveis e a superfcie de
resposta. Para facilitar o entendimento do planejamento que se quer criar,
toma-se como base o planejamento mostrado na Tabela 23.10. As colunas
Temperatura e Tempo contm, respectivamente, as unidades no-codifi-
cadas dos fatores Temperatura e Tempo, para cada experimento, ao passo
que as colunas A e B contm, respectivamente, as unidades codificadas para
esses dois fatores.

Tabela 23.10 Planejamento Central Composto com dois fatores, Temperatura e Tempo

Experimento Temperatura Tempo A B


1 60,00 20,00 -1 -1
2 80,00 20,00 1 -1
3 60,00 30,00 -1 1
4 80,00 30,00 1 1
5 55,86 25,00 -1,41 0
6 84,14 25,00 1,41 0
7 70,00 17,93 0 -1,41
8 70,00 32,07 0 1,41
9 70,00 25,00 0 0
10 70,00 25,00 0 0
11 70,00 25,00 0 0

Deve-se, ento, (i) criar o planejamento central composto; (ii) Gerar


a equao do modelo; (iii) Construir curvas de nveis e de superfcie
resposta. A janela inicial deste comando pode ser visualizada na Figura
23.34. Nesta janela, pode-se escolher o tipo de planejamento. Como opes,
tm-se: (i) Central composite e (ii) Box-Behnken. Number of factors
nesta opo pode-se entrar com o nmero de fatores que sero analisados
no planejamento.
No submenu Display Available Designs, apresentado na Figura 23.35,
pode-se ver o nmero de execues do planejamento de acordo com o nmero
de fatores e o tipo de planejamento escolhido.

324 Bioestatstica aplicada Pesquisa Experimental

BIOESTATISTICA_VOL02.indb 324 25/06/12 17:23


Fig. 23.34 Janela inicial do comando Fig. 23.35 Submenu Display


Create Response Surface Design Available Designs

Em designs, apresentado na Figura 23.36, pode-se escolher o planeja-


mento de acordo com o nmero de execues, blocos, pontos centrais e valor
do a. Number of Center Points nesta opo pode-se modificar o nmero de
pontos centrais do planejamento, acessando a opo Custom. Pode-se, ainda,
modificar o valor de alpha, para isso utiliza-se a opo Custom.
Em Factors, apresentado na Figura 23.37, pode-se definir os fatores e seus
nveis. Quando se deseja que os nveis dos fatores representem os pontos cubo
(ou quadrado), escolhe-se Cube points, em Levels Define. Porm, quando se
deseja que os nveis dos fatores representem os pontos axiais, escolhe-se Axial
points, em Levels define. Em Name, entra-se com o nome dos fatores, em Low,
com os nveis baixos dos fatores e, em High, com os nveis altos dos fatores.

Fig. 23.36 Submenu Designs - Fig. 23.37 Submenu Factors -


Superfcie de Resposta Superfcie de Resposta

Experimentos Fatoriais 325

BIOESTATISTICA_VOL02.indb 325 25/06/12 17:23


Em Options, apresentada na Figura 23.38, pode-se aleatorizar a ordem de
execuo do planejamento, em Randomize runs. Em Base for random data
generator pode-se entrar com a semente da ordem aleatria. Para realizar o
armazenamento dos dados do planejamento na planilha, necessrio que a
opo Store design in worksheet esteja selecionada.

Fig. 23.38 Submenu Options - Superfcie de Resposta

Em Results, apresentado na Figura 23.39, escolhe-se quais informaes


sobre o planejamento sero exibidas na Session Window. Como opes,
tm-se:
None Nesta opo, nenhuma informao exibida na Session Window;
Summary table Uma tabela resumo do planejamento exibida;
Summary table and data table exibida uma tabela resumo e uma ta-
bela com os dados do planejamento.

Fig. 23.39 Submenu Factors - Superfcie de Resposta

Para desenvolver o exemplo proposto, deve-se escolher o planejamento


Central composite em Type of Design e, em Number of factors, escolhe-se
dois fatores, conforme apresentado na Figura 23.34.

326 Bioestatstica aplicada Pesquisa Experimental

BIOESTATISTICA_VOL02.indb 326 25/06/12 17:23


Em Designs deve ser preenchida de acordo com a Figura 23.36. Observando
a figura, o planejamento escolhido possui 13 execues, com o padro de cinco
observaes no ponto central. Como, neste caso, o planejamento possui trs
execues no ponto central, precisa-se alterar de 5 para 3 pontos centrais, em
Number of Center Points. Assim, o planejamento ficar com 11 execues,
conforme apresentado na Figura 23.36.
Em Factors deve-se preencher conforme a Figura 23.37. Para se gerar o
planejamento padro, sem ordem aleatria, necessrio desmarcar a opo
Randomize runs, conforme a Figura 23.38. Em Results, nenhuma alterao
ser necessria.
Na tabela resumo da Session Window pode-se confirmar o nmero de
fatores; de blocos, de pontos centrais, de execues, e o valor do nvel alpha
utilizado. O planejamento aps executado, armazenado na planilha e
mostrado na Figura 23.40. A coluna StdOrder mostra a ordem padro dos
experimentos; a coluna RunOrder mostra a ordem aleatria para a execuo
do planejamento; a coluna Blocks mostra o nmero de blocos. Temperatura
indica as unidades no-codificadas do fator Temperatura, e Tempo, indica as
unidades no-codificadas do fator Tempo.


Fig. 23.40 Planejamento Central Composto com dois fatores, Temperatura e Tempo
conforme o exemplo da Tabela 23.8

Agora, devem-se executar os experimentos planejados e apresentados


na planilha mostrada na Figura 23.40 e depois analis-los. Cada linha desta

Experimentos Fatoriais 327

BIOESTATISTICA_VOL02.indb 327 25/06/12 17:23


planilha um experimento que deve ser executado. Os resultados obtidos so
apresentados na Tabela 23.11.

Tabela 23.11 Resultado do Planejamento Central Composto com dois fatores,


Temperatura e Tempo
Experimento Temperatura Tempo Rendimento
1 60,00 20,00 88
2 80,00 20,00 109
3 60,00 30,00 89
4 80,00 30,00 87
5 55,86 25,00 82
6 84,14 25,00 86
7 70,00 17,93 107
8 70,00 32,07 88
9 70,00 25,00 115
10 70,00 25,00 112
11 70,00 25,00 114

Para analisar um planejamento Superfcie de Resposta, utiliza-se o


caminho Stat DOE Response Surface Analyze Response Surface
Design, conforme a Figura 23.41.

Fig. 23.41 Comando Analyze Response Surface Design

O objetivo analisar o Planejamento Central Composto mostrado na


Tabela 23.11. Inicialmente, necessrio que os valores de Rendimentos,
obtidos a partir dos experimentos, sejam armazenados na Planilha do Minitab,

328 Bioestatstica aplicada Pesquisa Experimental

BIOESTATISTICA_VOL02.indb 328 25/06/12 17:23


conforme Figura 23.42. A janela inicial do comando para analisar este tipo de
planejamento apresentada na Figura 23.43.

Fig. 23.42 Resultado do Planejamento Central Composto com dois fatores,


Temperatura e Tempo, conforme o exemplo da Tabela 23.11

Fig. 23.43 Janela inicial do comando Analyze Response Surface Design

Na janela do comando Analyze Response Surface Design, entra-se com


a varivel-resposta na caixa Responses. No exemplo em estudo, a varivel-
-resposta (Y) Rendimento. Nesta caixa pode-se escolher, em Analyze data
using, a unidade usada para analisar o planejamento e para construir o modelo.
Tm-se as seguintes opes:
Coded units Nesta opo tm-se as unidades codificadas, ou seja, usan-
do os cdigos 1 para nvel baixo e 1 para nvel alto, dos fatores;
Uncoded units Nesta opo tm-se as unidades no-codificadas, ou
seja, usando o valor real de cada nvel do fator. O fator Temperatura, por
exemplo, tem nvel baixo 60 oC e nvel alto 80 oC. Quando se seleciona a
opo unidades codificadas, so mostrados, na Session Window, os coe-
ficientes do modelo para unidades codificadas e os coeficientes para uni-
dades no-codificadas.

Experimentos Fatoriais 329

BIOESTATISTICA_VOL02.indb 329 25/06/12 17:23


Nos submenus Terms, Graphs, Results e Storage, pode-se ver que eles
tm opes similares s apresentadas durante a anlise e planejamentos
fatoriais. No experimento em estudo, nenhuma das opes padro devem ser
alteradas. Na Figura 23.44, est a sada gerada e vista na Session Window.

Response Surface Regression: Rendimento versus Temperatura; Tempo


The analysis was done using coded units.
Primeiro Grupo
Estimated Regression Coefficients for Rendimento
Term Coef SE Coef T P
Constant 113,667 1,707 66,573 0,000
Temperatura 3,082 1,046 2,948 0,032
Tempo -5,984 1,046 -5,723 0,002
Temperatura*Temperatura -14,208 1,244 -11,417 0,000
Tempo*Tempo -7,458 1,244 -5,993 0,002
Temperatura*Tempo -5,750 1,479 -3,889 0,012

S = 2,957 R-Sq = 97,5% R-Sq(adj) = 95,0%

Segundo Grupo
Analysis of Variance for Rendimento

Source DF Seq SS Adj SS Adj MS F P


Regression 5 1701,18 1701,18 340,236 38,90 0,001
Linear 2 362,44 362,44 181,219 20,72 0,004
Square 2 1206,49 1206,49 603,246 68,98 0,000
Interaction 1 132,25 132,25 132,250 15,12 0,012
Residual Error 5 43,73 43,73 8,746
Lack-of-Fit 3 39,06 39,06 13,021 5,58 0,156
Pure Error 2 4,67 4,67 2,333
Total 10 1744,91
Unusual Observations for Rendimento
Obs StdOrder Rendimento Fit SE Fit Residual St Resid
4 4 87,000 83,348 2,338 3,652 2,02 R

R denotes an observation with a large standardized residual.

Terceiro Grupo
Estimated Regression Coefficients for Rendimento using data in uncoded units

Term Coef
Constant -961,906
Temperatura 23,0749
Tempo 21,7699
Temperatura*Temperatura -0,142083
Tempo*Tempo -0,298333
Temperatura*Tempo -0,115000

Fig. 23.44 Resultado do Surface Design Exemplo da Tabela 23.8

330 Bioestatstica aplicada Pesquisa Experimental

BIOESTATISTICA_VOL02.indb 330 25/06/12 17:23


A interpretao desta sada muito similar quela feita para o planejamen-
to fatorial. No grupo desta sada, tm-se os coeficientes (coluna Coef) de cada
termo (coluna Term) do modelo. A ltima coluna o valor P para cada termo,
com base no qual se decide qual termo significante ou no. Observando os
valores obtidos, todos menores que 0,05 (que o nvel de significncia adota-
do), conclui-se que todos os termos so significantes e, portanto, necessrio
incluir a todos no modelo.
Para obter o modelo do planejamento com unidades codificadas, utilizam-
-se os valores da coluna Coef, para cada termo correspondente da coluna Term.
Portanto, o modelo obtido :

Rendimento = 113,67 + 3,08 Temperatura 5,98 Tempo 14,21 Tempera-


tura2 7.46 Tempo2 5,75 Temperatura Tempo.

No segundo grupo, tem-se a tabela de anlise de varincia, onde so tes-


tados os modelos e ajustes. Em seguida, colocado um alerta de ocorrncia de
uma observao no usual para a resposta Y. Pode-se ver que o Minitab ajusta
automaticamente o valor 87, resultado do 4 experimento, para o valor 83,348,
indicando que o resduo resultante alto.
No terceiro grupo, apresentado o modelo do planejamento, para unida-
des no-codificadas.
Durante a construo dos grficos de curvas de nveis e superfcie, utiliza-
-se o caminho Stat DOE Response Surface Countour/Surface Plots,
conforme Figura 23.45.

Fig. 23.45 Comando Countour/Surface Plots

Experimentos Fatoriais 331

BIOESTATISTICA_VOL02.indb 331 25/06/12 17:23


Agora, suponha que se queira construir o grfico das curvas de nveis e
a superfcie de resposta para o experimento em estudo. A janela inicial deste
comando mostrada na Figura 23.46.

Fig. 23.46 Janela inicial do comando Countour / Surface Plots

Em Contour/Suface Plotes, selecionam-se as opes Countour plot e Sur-


face (Wireframe) plot para se obter, respectivamente, o grfico de curvas de
nveis e o grfico da superfcie resposta. Cada uma das opes possui o subme-
nu Setup, o qual necessrio ser visualizado, mesmo quando nenhuma altera-
o necessria. Neste submenu, apresentado na Figura 23.47, deve-se sele-
cionar a varivel resposta em Response. Ainda, em Select a pair of factors for
a single plot deve-se selecionar o par de fatores a ser utilizado no grfico, ou
selecionar a opo Generate plots for all pairs or factors, para gerar grficos
para todos os pares de fatores.

Fig. 23.47 Submenu Setup do comando Countour Plot

332 Bioestatstica aplicada Pesquisa Experimental

BIOESTATISTICA_VOL02.indb 332 25/06/12 17:23


Na opo Display plots using, pode-se definir se o grfico ser gerado
com unidades codificadas, selecionando Coded units, ou com unidades no-
-codificadas, selecionando Uncoded units. No submenu Setup do grfico Sur-
face plot, as opes so as mesmas do Setup do grfico Contour plot. Para
analisar o experimento em estudo, preenche-se a janela inicial de acordo com a
Figura 23.45, entrando em cada um dos Setups.
Os grficos gerados so mostrados nas figuras 23.48 e 23.49. Na Figura
23.48, pode-se ver que o maior Rendimento obtido quando a Temperatura
est por volta de 70 oC e quando o Tempo um ponto maior que 20 minutos.

Fig. 23.48 Grfico Countour Plot para o exemplo da Tabela 23.8

Fig. 23.49 Grfico Surface para o exemplo da Tabela 23.8

Experimentos Fatoriais 333

BIOESTATISTICA_VOL02.indb 333 25/06/12 17:23


BIOESTATISTICA_VOL02.indb 334 25/06/12 17:23
TABELAS

BIOESTATISTICA_VOL02.indb 335 25/06/12 17:23


BIOESTATISTICA_VOL02.indb 336 25/06/12 17:23
Tabela 1 - Distribuio normal gaussiana:
valores de z e respectivas reas entre a mdia (zero) e z

rea rea rea rea rea rea


z entre z entre z entre z entre z entre z entre
0ez 0ez 0ez 0ez 0ez 0ez
0,00 0,0000 0,56 0,2123 1,12 0,3686 1,68 0,4535 2,24 0,4875 2,80 0,4974
0,01 0,0040 0,57 0,2157 1,13 0,3708 1,69 0,4545 2,25 0,4878 2,81 0,4975
0,02 0,0080 0,58 0,2190 1,14 0,3729 1,70 0,4554 2,26 0,4881 2,82 0,4976
0,03 0,0120 0,59 0,2224 1,15 0,3749 1,71 0,4564 2,27 0,4884 2,83 0,4977
0,04 0,0160 0,60 0,2257 1,16 0,3770 1,72 0,4573 2,28 0,4887 2,84 0,4977
0,05 0,0199 0,61 0,2291 1,17 0,3790 1,73 0,4582 2,29 0,4890 2,85 0,4978
0,06 0,0239 0,62 0,2324 1,18 0,3810 1,74 0,4591 2,30 0,4893 2,86 0,4979
0,07 0,0279 0,63 0,2357 1,19 0,3830 1,75 0,4599 2,31 0,4896 2,87 0,4979
0,08 0,0319 0,64 0,2389 1,20 0,3849 1,76 0,4608 2,32 0,4898 2,88 0,4980
0,09 0,0359 0,65 0,2422 1,21 0,3869 1,77 0,4616 2,33 0,4901 2,89 0,4981
0,10 0,0398 0,66 0,2454 1,22 0,3888 1,78 0,4625 2,34 0,4904 2,90 0,4981
0,11 0,0438 0,67 0,2486 1,23 0,3907 1,79 0,4633 2,35 0,4906 2,91 0,4982
0,12 0,0478 0,68 0,2517 1,24 0,3925 1,80 0,4641 2,36 0,4909 2,92 0,4982
0,13 0,0517 0,69 0,2549 1,25 0,3944 1,81 0,4649 2,37 0,4911 2,93 0,4983
0,14 0,0557 0,70 0,2580 1,26 0,3962 1,82 0,4656 2,38 0,4913 2,94 0,4984
0,15 0,0596 0,71 0,2611 1,27 0,3980 1,83 0,4664 2,39 0,4916 2,95 0,4984
0,16 0,0636 0,72 0,2642 1,28 0,3997 1,84 0,4671 2,40 0,4918 2,96 0,4985
0,17 0,0675 0,73 0,2673 1,29 0,4015 1,85 0,4678 2,41 0,4920 2,97 0,4985
0,18 0,0714 0,74 0,2704 1,30 0,4032 1,86 0,4686 2,42 0,4922 2,98 0,4986
0,19 0,0753 0,75 0,2734 1,31 0,4049 1,87 0,4693 2,43 0,4925 2,99 0,4986
0,20 0,0793 0,76 0,2764 1,32 0,4066 1,88 0,4699 2,44 0,4927 3,00 0,4987
0,21 0,0832 0,77 0,2794 1,33 0,4082 1,89 0,4706 2,45 0,4929 3,01 0,4987
0,22 0,0871 0,78 0,2823 1,34 0,4099 1,90 0,4713 2,46 0,4931 3,02 0,4987
0,23 0,0910 0,79 0,2852 1,35 0,4115 1,91 0,4719 2,47 0,4932 3,03 0,4988
0,24 0,0948 0,80 0,2881 1,36 0,4131 1,92 0,4726 2,48 0,4934 3,04 0,4988
0,25 0,0987 0,81 0,2910 1,37 0,4147 1,93 0,4732 2,49 0,4936 3,05 0,4989
0,26 0,1026 0,82 0,2939 1,38 0,4162 1,94 0,4738 2,50 0,4938 3,06 0,4989
0,27 0,1064 0,83 0,2967 1,39 0,4177 1,95 0,4744 2,51 0,4940 3,07 0,4989
0,28 0,1103 0,84 0,2995 1,40 0,4192 1,96 0,4750 2,52 0,4941 3,08 0,4990
0,29 0,1141 0,85 0,3023 1,41 0,4207 1,97 0,4756 2,53 0,4943 3,09 0,4990
0,30 0,1179 0,86 0,3051 1,42 0,4222 1,98 0,4761 2,54 0,4945 3,10 0,4990

tabelas 337

BIOESTATISTICA_VOL02.indb 337 25/06/12 17:23


Tabela 1 - Distribuio normal gaussiana: valores de z e respectivas reas
entre a mdia (zero) e z (continuao)

rea rea rea rea rea rea


z entre z entre z entre z entre z entre z entre
0ez 0ez 0ez 0ez 0ez 0ez

0,31 0,1217 0,87 0,3078 1,43 0,4236 1,99 0,4767 2,55 0,4946 3,11 0,4991
0,32 0,1255 0,88 0,3106 1,44 0,4251 2,00 0,4772 2,56 0,4948 3,12 0,4991
0,33 0,1293 0,89 0,3133 1,45 0,4265 2,01 0,4778 2,57 0,4949 3,13 0,4991
0,34 0,1331 0,90 0,3159 1,46 0,4279 2,02 0,4783 2,58 0,4951 3,14 0,4992
0,35 0,1368 0,91 0,3186 1,47 0,4292 2,03 0,4788 2,59 0,4952 3,15 0,4992
0,36 0,1406 0,92 0,3212 1,48 0,4306 2,04 0,4793 2,60 0,4953 3,16 0,4992
0,37 0,1443 0,93 0,3238 1,49 0,4319 2,05 0,4798 2,61 0,4955 3,17 0,4992
0,38 0,1480 0,94 0,3264 1,50 0,4332 2,06 0,4803 2,62 0,4956 3,18 0,4993
0,39 0,1517 0,95 0,3289 1,51 0,4345 2,07 0,4808 2,63 0,4957 3,19 0,4993
0,40 0,1554 0,96 0,3315 1,52 0,4357 2,08 0,4812 2,64 0,4959 3,20 0,4993
0,41 0,1591 0,97 0,3340 1,53 0,4370 2,09 0,4817 2,65 0,4960 3,21 0,4993
0,42 0,1628 0,98 0,3365 1,54 0,4382 2,10 0,4821 2,66 0,4961 3,22 0,4994
0,43 0,1664 0,99 0,3389 1,55 0,4394 2,11 0,4826 2,67 0,4962 3,23 0,4994
0,44 0,1700 1,00 0,3413 1,56 0,4406 2,12 0,4830 2,68 0,4963 3,24 0,4994
0,45 0,1736 1,01 0,3438 1,57 0,4418 2,13 0,4834 2,69 0,4964 3,25 0,4994
0,46 0,1772 1,02 0,3461 1,58 0,4429 2,14 0,4838 2,70 0,4965 3,30 0,4995
0,47 0,1808 1,03 0,3485 1,59 0,4441 2,15 0,4842 2,71 0,4966 3,35 0,4996
0,48 0,1844 1,04 0,3508 1,60 0,4452 2,16 0,4846 2,72 0,4967 3,40 0,4997
0,49 0,1879 1,05 0,3531 1,61 0,4463 2,17 0,4850 2,73 0,4968 3,45 0,4997
0,50 0,1915 1,06 0,3554 1,62 0,4474 2,18 0,4854 2,74 0,4969 3,50 0,4998
0,51 0,1950 1,07 0,3577 1,63 0,4484 2,19 0,4857 2,75 0,4970 3,60 0,4998
0,52 0,1985 1,08 0,3599 1,64 0,4495 2,20 0,4861 2,76 0,4971 3,70 0,4999
0,53 0,2019 1,09 0,3621 1,65 0,4505 2,21 0,4864 2,77 0,4972 3,80 0,4999
0,54 0,2054 1,10 0,3643 1,66 0,4515 2,22 0,4868 2,78 0,4973 3,90 0,49995
0,55 0,2088 1,11 0,3665 1,67 0,4525 2,23 0,4871 2,79 0,4974 4,00 0,49997

338 Bioestatstica aplicada Pesquisa Experimental

BIOESTATISTICA_VOL02.indb 338 25/06/12 17:23


Tabela 2 - Valores crticos da distribuio t de Student

Bilateral: 0,40 0,20 0,10 0,05 0,02 0,01 0,001


gl
Unilateral: 0,20 0,10 0,05 0,025 0,01 0,005 0,0005
1 1,376 3,078 6,314 12,706 31,821 63,656 636,578
2 1,061 1,886 2,920 4,303 6,965 9,925 31,600
3 0,978 1,638 2,353 3,182 4,541 5,841 12,924
4 0,941 1,533 2,132 2,776 3,747 4,604 8,610
5 0,920 1,476 2,015 2,571 3,365 4,032 6,869

6 0,906 1,440 1,943 2,447 3,143 3,707 5,959


7 0,896 1,415 1,895 2,365 2,998 3,499 5,408
8 0,889 1,397 1,860 2,306 2,896 3,355 5,041
9 0,883 1,383 1,833 2,262 2,821 3,250 4,781
10 0,879 1,372 1,812 2,228 2,764 3,169 4,587

11 0,876 1,363 1,796 2,201 2,718 3,106 4,437


12 0,873 1,356 1,782 2,179 2,681 3,055 4,318
13 0,870 1,350 1,771 2,160 2,650 3,012 4,221
14 0,868 1,345 1,761 2,145 2,624 2,977 4,140
15 0,866 1,341 1,753 2,131 2,602 2,947 4,073

16 0,865 1,337 1,746 2,120 2,583 2,921 4,015


17 0,863 1,333 1,740 2,110 2,567 2,898 3,965
18 0,862 1,330 1,734 2,101 2,552 2,878 3,922
19 0,861 1,328 1,729 2,093 2,539 2,861 3,883
20 0,860 1,325 1,725 2,086 2,528 2,845 3,850

21 0,859 1,323 1,721 2,080 2,518 2,831 3,819


22 0,858 1,321 1,717 2,074 2,508 2,819 3,792
23 0,858 1,319 1,714 2,069 2,500 2,807 3,768
24 0,857 1,318 1,711 2,064 2,492 2,797 3,745
25 0,856 1,316 1,708 2,060 2,485 2,787 3,725

tabelas 339

BIOESTATISTICA_VOL02.indb 339 25/06/12 17:23


Tabela 2 - Valores crticos da distribuio t de Student (continuao)

Bilateral: 0,40 0,20 0,10 0,05 0,02 0,01 0,001


gl
Unilateral: 0,20 0,10 0,05 0,025 0,01 0,005 0,0005
26 0,856 1,315 1,706 2,056 2,479 2,779 3,707
27 0,855 1,314 1,703 2,052 2,473 2,771 3,689
28 0,855 1,313 1,701 2,048 2,467 2,763 3,674
29 0,854 1,311 1,699 2,045 2,462 2,756 3,660
30 0,854 1,310 1,697 2,042 2,457 2,750 3,646

40 0,851 1,303 1,684 2,021 2,423 2,704 3,551


60 0,848 1,296 1,671 2,000 2,390 2,660 3,460
120 0,845 1,289 1,658 1,980 2,358 2,617 3,373
infinito 0,842 1,282 1,645 1,960 2,326 2,576 3,290

340 Bioestatstica aplicada Pesquisa Experimental

BIOESTATISTICA_VOL02.indb 340 25/06/12 17:23


Tabela 3.1 - Distribuio F: valores crticos para um teste bilateral ( = 0,05)

gl do gl do numerador
denominador 1 2 3 4 5 6 7 8 9 10 11 12
1 648 799 864 900 922 937 948 957 963 969 973 977
2 38,51 39,00 39,17 39,25 39,30 39,33 39,36 39,37 39,39 39,40 39,41 39,41
3 17,44 16,04 15,44 15,10 14,88 14,73 14,62 14,54 14,47 14,42 14,37 14,34
4 12,22 10,65 9,98 9,60 9,36 9,20 9,07 8,98 8,90 8,84 8,79 8,75
5 10,01 8,43 7,76 7,39 7,15 6,98 6,85 6,76 6,68 6,62 6,57 6,52
6 8,81 7,26 6,60 6,23 5,99 5,82 5,70 5,60 5,52 5,46 5,41 5,37
7 8,07 6,54 5,89 5,52 5,29 5,12 4,99 4,90 4,82 4,76 4,71 4,67
8 7,57 6,06 5,42 5,05 4,82 4,65 4,53 4,43 4,36 4,30 4,24 4,20
9 7,21 5,71 5,08 4,72 4,48 4,32 4,20 4,10 4,03 3,96 3,91 3,87
10 6,94 5,46 4,83 4,47 4,24 4,07 3,95 3,85 3,78 3,72 3,66 3,62

11 6,72 5,26 4,63 4,28 4,04 3,88 3,76 3,66 3,59 3,53 3,47 3,43
12 6,55 5,10 4,47 4,12 3,89 3,73 3,61 3,51 3,44 3,37 3,32 3,28
13 6,41 4,97 4,35 4,00 3,77 3,60 3,48 3,39 3,31 3,25 3,20 3,15
14 6,30 4,86 4,24 3,89 3,66 3,50 3,38 3,29 3,21 3,15 3,09 3,05
15 6,20 4,77 4,15 3,80 3,58 3,41 3,29 3,20 3,12 3,06 3,01 2,96
16 6,12 4,69 4,08 3,73 3,50 3,34 3,22 3,12 3,05 2,99 2,93 2,89
17 6,04 4,62 4,01 3,66 3,44 3,28 3,16 3,06 2,98 2,92 2,87 2,82
18 5,98 4,56 3,95 3,61 3,38 3,22 3,10 3,01 2,93 2,87 2,81 2,77
19 5,92 4,51 3,90 3,56 3,33 3,17 3,05 2,96 2,88 2,82 2,76 2,72
20 5,87 4,46 3,86 3,51 3,29 3,13 3,01 2,91 2,84 2,77 2,72 2,68

21 5,83 4,42 3,82 3,48 3,25 3,09 2,97 2,87 2,80 2,73 2,68 2,64
22 5,79 4,38 3,78 3,44 3,22 3,05 2,93 2,84 2,76 2,70 2,65 2,60
23 5,75 4,35 3,75 3,41 3,18 3,02 2,90 2,81 2,73 2,67 2,62 2,57
24 5,72 4,32 3,72 3,38 3,15 2,99 2,87 2,78 2,70 2,64 2,59 2,54
25 5,69 4,29 3,69 3,35 3,13 2,97 2,85 2,75 2,68 2,61 2,56 2,51
26 5,66 4,27 3,67 3,33 3,10 2,94 2,82 2,73 2,65 2,59 2,54 2,49
27 5,63 4,24 3,65 3,31 3,08 2,92 2,80 2,71 2,63 2,57 2,51 2,47
28 5,61 4,22 3,63 3,29 3,06 2,90 2,78 2,69 2,61 2,55 2,49 2,45
29 5,59 4,20 3,61 3,27 3,04 2,88 2,76 2,67 2,59 2,53 2,48 2,43
30 5,57 4,18 3,59 3,25 3,03 2,87 2,75 2,65 2,57 2,51 2,46 2,41

tabelas 341

BIOESTATISTICA_VOL02.indb 341 25/06/12 17:23


Tabela 3.1 - Distribuio F: valores crticos para um teste bilateral ( = 0,05)
(continuao)

gl do gl do numerador
denominador 1 2 3 4 5 6 7 8 9 10 11 12
32 5,53 4,15 3,56 3,22 3,00 2,84 2,71 2,62 2,54 2,48 2,43 2,38
34 5,50 4,12 3,53 3,19 2,97 2,81 2,69 2,59 2,52 2,45 2,40 2,35
36 5,47 4,09 3,50 3,17 2,94 2,78 2,66 2,57 2,49 2,43 2,37 2,33
38 5,45 4,07 3,48 3,15 2,92 2,76 2,64 2,55 2,47 2,41 2,35 2,31
40 5,42 4,05 3,46 3,13 2,90 2,74 2,62 2,53 2,45 2,39 2,33 2,29
42 5,40 4,03 3,45 3,11 2,89 2,73 2,61 2,51 2,43 2,37 2,32 2,27
44 5,39 4,02 3,43 3,09 2,87 2,71 2,59 2,50 2,42 2,36 2,30 2,26
46 5,37 4,00 3,42 3,08 2,86 2,70 2,58 2,48 2,41 2,34 2,29 2,24
48 5,35 3,99 3,40 3,07 2,84 2,69 2,56 2,47 2,39 2,33 2,27 2,23
50 5,34 3,97 3,39 3,05 2,83 2,67 2,55 2,46 2,38 2,32 2,26 2,22

55 5,31 3,95 3,36 3,03 2,81 2,65 2,53 2,43 2,36 2,29 2,24 2,19
60 5,29 3,93 3,34 3,01 2,79 2,63 2,51 2,41 2,33 2,27 2,22 2,17
65 5,26 3,91 3,32 2,99 2,77 2,61 2,49 2,39 2,32 2,25 2,20 2,15
70 5,25 3,89 3,31 2,97 2,75 2,59 2,47 2,38 2,30 2,24 2,18 2,14
80 5,22 3,86 3,28 2,95 2,73 2,57 2,45 2,35 2,28 2,21 2,16 2,11
100 5,18 3,83 3,25 2,92 2,70 2,54 2,42 2,32 2,24 2,18 2,12 2,08
125 5,15 3,80 3,22 2,89 2,67 2,51 2,39 2,30 2,22 2,15 2,10 2,05
150 5,13 3,78 3,20 2,87 2,65 2,49 2,37 2,28 2,20 2,13 2,08 2,03
200 5,10 3,76 3,18 2,85 2,63 2,47 2,35 2,26 2,18 2,11 2,06 2,01
400 5,06 3,72 3,15 2,82 2,60 2,44 2,32 2,22 2,15 2,08 2,03 1,98
1000 5,04 3,70 3,13 2,80 2,58 2,42 2,30 2,20 2,13 2,06 2,01 1,96
infinito 5,02 3,69 3,12 2,79 2,57 2,41 2,29 2,19 2,11 2,05 1,99 1,94

342 Bioestatstica aplicada Pesquisa Experimental

BIOESTATISTICA_VOL02.indb 342 25/06/12 17:23


Tabela 3.1 - Distribuio F: valores crticos para um teste bilateral ( = 0,05)

gl do gl do numerador
denominador 14 16 20 24 30 40 50 75 100 200 500 infinito
1 983 987 993 997 1001 1006 1008 1011 1013 1016 1017 1018
2 39,43 39,44 39,45 39,46 39,46 39,47 39,48 39,48 39,49 39,49 39,50 39,50
3 14,28 14,23 14,17 14,12 14,08 14,04 14,01 13,97 13,96 13,93 13,91 13,90
4 8,68 8,63 8,56 8,51 8,46 8,41 8,38 8,34 8,32 8,29 8,27 8,26
5 6,46 6,40 6,33 6,28 6,23 6,18 6,14 6,10 6,08 6,05 6,03 6,02
6 5,30 5,24 5,17 5,12 5,07 5,01 4,98 4,94 4,92 4,88 4,86 4,85
7 4,60 4,54 4,47 4,41 4,36 4,31 4,28 4,23 4,21 4,18 4,16 4,14
8 4,13 4,08 4,00 3,95 3,89 3,84 3,81 3,76 3,74 3,70 3,68 3,67
9 3,80 3,74 3,67 3,61 3,56 3,51 3,47 3,43 3,40 3,37 3,35 3,33
10 3,55 3,50 3,42 3,37 3,31 3,26 3,22 3,18 3,15 3,12 3,09 3,08

11 3,36 3,30 3,23 3,17 3,12 3,06 3,03 2,98 2,96 2,92 2,90 2,88
12 3,21 3,15 3,07 3,02 2,96 2,91 2,87 2,82 2,80 2,76 2,74 2,72
13 3,08 3,03 2,95 2,89 2,84 2,78 2,74 2,70 2,67 2,63 2,61 2,60
14 2,98 2,92 2,84 2,79 2,73 2,67 2,64 2,59 2,56 2,53 2,50 2,49
15 2,89 2,84 2,76 2,70 2,64 2,59 2,55 2,50 2,47 2,44 2,41 2,40
16 2,82 2,76 2,68 2,63 2,57 2,51 2,47 2,42 2,40 2,36 2,33 2,32
17 2,75 2,70 2,62 2,56 2,50 2,44 2,41 2,35 2,33 2,29 2,26 2,25
18 2,70 2,64 2,56 2,50 2,44 2,38 2,35 2,30 2,27 2,23 2,20 2,19
19 2,65 2,59 2,51 2,45 2,39 2,33 2,30 2,24 2,22 2,18 2,15 2,13
20 2,60 2,55 2,46 2,41 2,35 2,29 2,25 2,20 2,17 2,13 2,10 2,09

21 2,56 2,51 2,42 2,37 2,31 2,25 2,21 2,16 2,13 2,09 2,06 2,04
22 2,53 2,47 2,39 2,33 2,27 2,21 2,17 2,12 2,09 2,05 2,02 2,00
23 2,50 2,44 2,36 2,30 2,24 2,18 2,14 2,08 2,06 2,01 1,99 1,97
24 2,47 2,41 2,33 2,27 2,21 2,15 2,11 2,05 2,02 1,98 1,95 1,94
25 2,44 2,38 2,30 2,24 2,18 2,12 2,08 2,02 2,00 1,95 1,92 1,91
26 2,42 2,36 2,28 2,22 2,16 2,09 2,05 2,00 1,97 1,92 1,90 1,88
27 2,39 2,34 2,25 2,19 2,13 2,07 2,03 1,97 1,94 1,90 1,87 1,85
28 2,37 2,32 2,23 2,17 2,11 2,05 2,01 1,95 1,92 1,88 1,85 1,83
29 2,36 2,30 2,21 2,15 2,09 2,03 1,99 1,93 1,90 1,86 1,83 1,81
30 2,34 2,28 2,20 2,14 2,07 2,01 1,97 1,91 1,88 1,84 1,81 1,79

tabelas 343

BIOESTATISTICA_VOL02.indb 343 25/06/12 17:23


Tabela 3.1 - Distribuio F: valores crticos para um teste bilateral ( = 0,05)
(continuao)

gl do gl do numerador
denominador 14 16 20 24 30 40 50 75 100 200 500 infinito
32 2,31 2,25 2,16 2,10 2,04 1,98 1,93 1,88 1,85 1,80 1,77 1,75
34 2,28 2,22 2,13 2,07 2,01 1,95 1,90 1,85 1,82 1,77 1,74 1,72
36 2,25 2,20 2,11 2,05 1,99 1,92 1,88 1,82 1,79 1,74 1,71 1,69
38 2,23 2,17 2,09 2,03 1,96 1,90 1,85 1,79 1,76 1,71 1,68 1,66
40 2,21 2,15 2,07 2,01 1,94 1,88 1,83 1,77 1,74 1,69 1,66 1,64
42 2,20 2,14 2,05 1,99 1,92 1,86 1,81 1,75 1,72 1,67 1,64 1,62
44 2,18 2,12 2,03 1,97 1,91 1,84 1,80 1,73 1,70 1,65 1,62 1,60
46 2,17 2,11 2,02 1,96 1,89 1,82 1,78 1,72 1,69 1,63 1,60 1,58
48 2,15 2,09 2,01 1,94 1,88 1,81 1,77 1,70 1,67 1,62 1,58 1,56
50 2,14 2,08 1,99 1,93 1,87 1,80 1,75 1,69 1,66 1,60 1,57 1,55

55 2,11 2,05 1,97 1,90 1,84 1,77 1,72 1,66 1,62 1,57 1,54 1,51
60 2,09 2,03 1,94 1,88 1,82 1,74 1,70 1,63 1,60 1,54 1,51 1,48
65 2,07 2,01 1,93 1,86 1,80 1,72 1,68 1,61 1,58 1,52 1,48 1,46
70 2,06 2,00 1,91 1,85 1,78 1,71 1,66 1,59 1,56 1,50 1,46 1,44
80 2,03 1,97 1,88 1,82 1,75 1,68 1,63 1,56 1,53 1,47 1,43 1,40
100 2,00 1,94 1,85 1,78 1,71 1,64 1,59 1,52 1,48 1,42 1,38 1,35
125 1,97 1,91 1,82 1,75 1,68 1,61 1,56 1,49 1,45 1,38 1,34 1,30
150 1,95 1,89 1,80 1,74 1,67 1,59 1,54 1,46 1,42 1,35 1,31 1,27
200 1,93 1,87 1,78 1,71 1,64 1,56 1,51 1,44 1,39 1,32 1,27 1,23
400 1,90 1,84 1,74 1,68 1,60 1,52 1,47 1,39 1,35 1,27 1,21 1,15
1000 1,88 1,82 1,72 1,65 1,58 1,50 1,45 1,36 1,32 1,23 1,16 1,09
infinito 1,87 1,80 1,71 1,64 1,57 1,48 1,43 1,34 1,30 1,21 1,13 1,01

344 Bioestatstica aplicada Pesquisa Experimental

BIOESTATISTICA_VOL02.indb 344 25/06/12 17:23


Tabela 3.2 - Distribuio F: valores crticos para um teste bilateral ( = 0,01)

gl do gl do numerador
denominador 1 2 3 4 5 6 7 8 9 10 11 12
1 16212 19997 21614 22501 23056 23440 23715 23924 24091 24222 24334 24427
2 198,5 199,0 199,2 199,2 199,3 199,3 199,4 199,4 199,4 199,4 199,4 199,4
3 55,55 49,80 47,47 46,20 45,39 44,84 44,43 44,13 43,88 43,68 43,52 43,39
4 31,33 26,28 24,26 23,15 22,46 21,98 21,62 21,35 21,14 20,97 20,82 20,70
5 22,78 18,31 16,53 15,56 14,94 14,51 14,20 13,96 13,77 13,62 13,49 13,38
6 18,63 14,54 12,92 12,03 11,46 11,07 10,79 10,57 10,39 10,25 10,13 10,03
7 16,24 12,40 10,88 10,05 9,52 9,16 8,89 8,68 8,51 8,38 8,27 8,18
8 14,69 11,04 9,60 8,81 8,30 7,95 7,69 7,50 7,34 7,21 7,10 7,01
9 13,61 10,11 8,72 7,96 7,47 7,13 6,88 6,69 6,54 6,42 6,31 6,23
10 12,83 9,43 8,08 7,34 6,87 6,54 6,30 6,12 5,97 5,85 5,75 5,66

11 12,23 8,91 7,60 6,88 6,42 6,10 5,86 5,68 5,54 5,42 5,32 5,24
12 11,75 8,51 7,23 6,52 6,07 5,76 5,52 5,35 5,20 5,09 4,99 4,91
13 11,37 8,19 6,93 6,23 5,79 5,48 5,25 5,08 4,94 4,82 4,72 4,64
14 11,06 7,92 6,68 6,00 5,56 5,26 5,03 4,86 4,72 4,60 4,51 4,43
15 10,80 7,70 6,48 5,80 5,37 5,07 4,85 4,67 4,54 4,42 4,33 4,25
16 10,58 7,51 6,30 5,64 5,21 4,91 4,69 4,52 4,38 4,27 4,18 4,10
17 10,38 7,35 6,16 5,50 5,07 4,78 4,56 4,39 4,25 4,14 4,05 3,97
18 10,22 7,21 6,03 5,37 4,96 4,66 4,44 4,28 4,14 4,03 3,94 3,86
19 10,07 7,09 5,92 5,27 4,85 4,56 4,34 4,18 4,04 3,93 3,84 3,76
20 9,94 6,99 5,82 5,17 4,76 4,47 4,26 4,09 3,96 3,85 3,76 3,68

21 9,83 6,89 5,73 5,09 4,68 4,39 4,18 4,01 3,88 3,77 3,68 3,60
22 9,73 6,81 5,65 5,02 4,61 4,32 4,11 3,94 3,81 3,70 3,61 3,54
23 9,63 6,73 5,58 4,95 4,54 4,26 4,05 3,88 3,75 3,64 3,55 3,47
24 9,55 6,66 5,52 4,89 4,49 4,20 3,99 3,83 3,69 3,59 3,50 3,42
25 9,48 6,60 5,46 4,84 4,43 4,15 3,94 3,78 3,64 3,54 3,45 3,37
26 9,41 6,54 5,41 4,79 4,38 4,10 3,89 3,73 3,60 3,49 3,40 3,33
27 9,34 6,49 5,36 4,74 4,34 4,06 3,85 3,69 3,56 3,45 3,36 3,28
28 9,28 6,44 5,32 4,70 4,30 4,02 3,81 3,65 3,52 3,41 3,32 3,25
29 9,23 6,40 5,28 4,66 4,26 3,98 3,77 3,61 3,48 3,38 3,29 3,21
30 9,18 6,35 5,24 4,62 4,23 3,95 3,74 3,58 3,45 3,34 3,25 3,18

tabelas 345

BIOESTATISTICA_VOL02.indb 345 25/06/12 17:23


Tabela 3.2 - Distribuio F: valores crticos para um teste bilateral ( = 0,01)
(continuao)

gl do gl do numerador
denominador 1 2 3 4 5 6 7 8 9 10 11 12
32 9,09 6,28 5,17 4,56 4,17 3,89 3,68 3,52 3,39 3,29 3,20 3,12
34 9,01 6,22 5,11 4,50 4,11 3,84 3,63 3,47 3,34 3,24 3,15 3,07
36 8,94 6,16 5,06 4,46 4,06 3,79 3,58 3,42 3,30 3,19 3,10 3,03
38 8,88 6,11 5,02 4,41 4,02 3,75 3,54 3,39 3,26 3,15 3,06 2,99
40 8,83 6,07 4,98 4,37 3,99 3,71 3,51 3,35 3,22 3,12 3,03 2,95
42 8,78 6,03 4,94 4,34 3,95 3,68 3,48 3,32 3,19 3,09 3,00 2,92
44 8,74 5,99 4,91 4,31 3,92 3,65 3,45 3,29 3,16 3,06 2,97 2,89
46 8,70 5,96 4,88 4,28 3,90 3,62 3,42 3,26 3,14 3,03 2,94 2,87
48 8,66 5,93 4,85 4,25 3,87 3,60 3,40 3,24 3,11 3,01 2,92 2,85
50 8,63 5,90 4,83 4,23 3,85 3,58 3,38 3,22 3,09 2,99 2,90 2,82

55 8,55 5,84 4,77 4,18 3,80 3,53 3,33 3,17 3,05 2,94 2,85 2,78
60 8,49 5,79 4,73 4,14 3,76 3,49 3,29 3,13 3,01 2,90 2,82 2,74
65 8,44 5,75 4,69 4,11 3,73 3,46 3,26 3,10 2,98 2,87 2,79 2,71
70 8,40 5,72 4,66 4,08 3,70 3,43 3,23 3,08 2,95 2,85 2,76 2,68
80 8,33 5,67 4,61 4,03 3,65 3,39 3,19 3,03 2,91 2,80 2,72 2,64
100 8,24 5,59 4,54 3,96 3,59 3,33 3,13 2,97 2,85 2,74 2,66 2,58
125 8,17 5,53 4,49 3,91 3,54 3,28 3,08 2,93 2,80 2,70 2,61 2,54
150 8,12 5,49 4,45 3,88 3,51 3,25 3,05 2,89 2,77 2,67 2,58 2,51
200 8,06 5,44 4,41 3,84 3,47 3,21 3,01 2,86 2,73 2,63 2,54 2,47
400 7,97 5,37 4,34 3,78 3,41 3,15 2,95 2,80 2,68 2,57 2,49 2,41
1000 7,91 5,33 4,30 3,74 3,37 3,11 2,92 2,77 2,64 2,54 2,45 2,38
infinito 7,88 5,30 4,28 3,72 3,35 3,09 2,90 2,74 2,62 2,52 2,43 2,36

346 Bioestatstica aplicada Pesquisa Experimental

BIOESTATISTICA_VOL02.indb 346 25/06/12 17:23


Tabela 3.2 - Distribuio F: valores crticos para um teste bilateral ( = 0,01)

gl do gl do numerador
denominador 14 16 20 24 30 40 50 75 100 200 500 infinito
1 24572 24684 24837 24937 25041 25146 25213 25295 25339 25399 25436 25466
2 199,4 199,4 199,4 199,4 199,5 199,5 199,5 199,5 199,5 199,5 199,5 199,5
3 43,17 43,01 42,78 42,62 42,47 42,31 42,21 42,08 42,02 41,92 41,87 41,83
4 20,51 20,37 20,17 20,03 19,89 19,75 19,67 19,55 19,50 19,41 19,36 19,32
5 13,21 13,09 12,90 12,78 12,66 12,53 12,45 12,35 12,30 12,22 12,17 12,14
6 9,88 9,76 9,59 9,47 9,36 9,24 9,17 9,07 9,03 8,95 8,91 8,88
7 8,03 7,91 7,75 7,64 7,53 7,42 7,35 7,26 7,22 7,15 7,10 7,08
8 6,87 6,76 6,61 6,50 6,40 6,29 6,22 6,13 6,09 6,02 5,98 5,95
9 6,09 5,98 5,83 5,73 5,62 5,52 5,45 5,37 5,32 5,26 5,21 5,19
10 5,53 5,42 5,27 5,17 5,07 4,97 4,90 4,82 4,77 4,71 4,67 4,64

11 5,10 5,00 4,86 4,76 4,65 4,55 4,49 4,40 4,36 4,29 4,25 4,23
12 4,77 4,67 4,53 4,43 4,33 4,23 4,17 4,08 4,04 3,97 3,93 3,90
13 4,51 4,41 4,27 4,17 4,07 3,97 3,91 3,82 3,78 3,71 3,67 3,65
14 4,30 4,20 4,06 3,96 3,86 3,76 3,70 3,61 3,57 3,50 3,46 3,44
15 4,12 4,02 3,88 3,79 3,69 3,59 3,52 3,44 3,39 3,33 3,29 3,26
16 3,97 3,87 3,73 3,64 3,54 3,44 3,37 3,29 3,25 3,18 3,14 3,11
17 3,84 3,75 3,61 3,51 3,41 3,31 3,25 3,16 3,12 3,05 3,01 2,98
18 3,73 3,64 3,50 3,40 3,30 3,20 3,14 3,05 3,01 2,94 2,90 2,87
19 3,64 3,54 3,40 3,31 3,21 3,11 3,04 2,96 2,91 2,85 2,80 2,78
20 3,55 3,46 3,32 3,22 3,12 3,02 2,96 2,87 2,83 2,76 2,72 2,69

21 3,48 3,38 3,24 3,15 3,05 2,95 2,88 2,80 2,75 2,68 2,64 2,61
22 3,41 3,31 3,18 3,08 2,98 2,88 2,82 2,73 2,69 2,62 2,57 2,55
23 3,35 3,25 3,12 3,02 2,92 2,82 2,76 2,67 2,62 2,56 2,51 2,48
24 3,30 3,20 3,06 2,97 2,87 2,77 2,70 2,61 2,57 2,50 2,46 2,43
25 3,25 3,15 3,01 2,92 2,82 2,72 2,65 2,56 2,52 2,45 2,41 2,38
26 3,20 3,11 2,97 2,87 2,77 2,67 2,61 2,52 2,47 2,40 2,36 2,33
27 3,16 3,07 2,93 2,83 2,73 2,63 2,57 2,48 2,43 2,36 2,32 2,29
28 3,12 3,03 2,89 2,79 2,69 2,59 2,53 2,44 2,39 2,32 2,28 2,25
29 3,09 2,99 2,86 2,76 2,66 2,56 2,49 2,40 2,36 2,29 2,24 2,21
30 3,06 2,96 2,82 2,73 2,63 2,52 2,46 2,37 2,32 2,25 2,21 2,18

tabelas 347

BIOESTATISTICA_VOL02.indb 347 25/06/12 17:24


Tabela 3.2 - Distribuio F: valores crticos para um teste bilateral ( = 0,01)
(continuao)

gl do gl do numerador
denominador 14 16 20 24 30 40 50 75 100 200 500 infinito
32 3,00 2,90 2,77 2,67 2,57 2,47 2,40 2,31 2,26 2,19 2,15 2,11
34 2,95 2,85 2,72 2,62 2,52 2,42 2,35 2,26 2,21 2,14 2,09 2,06
36 2,90 2,81 2,67 2,58 2,48 2,37 2,30 2,21 2,17 2,09 2,04 2,01
38 2,87 2,77 2,63 2,54 2,44 2,33 2,27 2,17 2,12 2,05 2,00 1,97
40 2,83 2,74 2,60 2,50 2,40 2,30 2,23 2,14 2,09 2,01 1,96 1,93
42 2,80 2,71 2,57 2,47 2,37 2,26 2,20 2,10 2,06 1,98 1,93 1,90
44 2,77 2,68 2,54 2,44 2,34 2,24 2,17 2,07 2,03 1,95 1,90 1,87
46 2,75 2,65 2,51 2,42 2,32 2,21 2,14 2,05 2,00 1,92 1,87 1,84
48 2,72 2,63 2,49 2,39 2,29 2,19 2,12 2,02 1,97 1,90 1,85 1,81
50 2,70 2,61 2,47 2,37 2,27 2,16 2,10 2,00 1,95 1,87 1,82 1,79

55 2,66 2,56 2,42 2,33 2,23 2,12 2,05 1,95 1,90 1,82 1,77 1,73
60 2,62 2,53 2,39 2,29 2,19 2,08 2,01 1,91 1,86 1,78 1,73 1,69
65 2,59 2,49 2,36 2,26 2,16 2,05 1,98 1,88 1,83 1,74 1,69 1,65
70 2,56 2,47 2,33 2,23 2,13 2,02 1,95 1,85 1,80 1,71 1,66 1,62
80 2,52 2,43 2,29 2,19 2,08 1,97 1,90 1,80 1,75 1,66 1,60 1,56
100 2,46 2,37 2,23 2,13 2,02 1,91 1,84 1,74 1,68 1,59 1,53 1,49
125 2,42 2,32 2,18 2,08 1,98 1,86 1,79 1,68 1,63 1,53 1,47 1,42
150 2,38 2,29 2,15 2,05 1,94 1,83 1,76 1,65 1,59 1,49 1,42 1,37
200 2,35 2,25 2,11 2,01 1,91 1,79 1,71 1,60 1,54 1,44 1,37 1,31
400 2,29 2,20 2,06 1,95 1,85 1,73 1,65 1,54 1,47 1,36 1,28 1,21
1000 2,26 2,16 2,02 1,92 1,81 1,69 1,61 1,50 1,43 1,31 1,22 1,13
infinito 2,24 2,14 2,00 1,90 1,79 1,67 1,59 1,47 1,40 1,28 1,17 1,01

348 Bioestatstica aplicada Pesquisa Experimental

BIOESTATISTICA_VOL02.indb 348 25/06/12 17:24


Tabela 4.1 - Distribuio F: valores crticos para um teste unilateral ( = 0,05)

gl do gl do numerador
denominador 1 2 3 4 5 6 7 8 9 10 11 12
1 161 199 216 225 230 234 237 239 241 242 243 244
2 18,51 19,00 19,16 19,25 19,30 19,33 19,35 19,37 19,38 19,40 19,40 19,41
3 10,13 9,55 9,28 9,12 9,01 8,94 8,89 8,85 8,81 8,79 8,76 8,74
4 7,71 6,94 6,59 6,39 6,26 6,16 6,09 6,04 6,00 5,96 5,94 5,91
5 6,61 5,79 5,41 5,19 5,05 4,95 4,88 4,82 4,77 4,74 4,70 4,68
6 5,99 5,14 4,76 4,53 4,39 4,28 4,21 4,15 4,10 4,06 4,03 4,00
7 5,59 4,74 4,35 4,12 3,97 3,87 3,79 3,73 3,68 3,64 3,60 3,57
8 5,32 4,46 4,07 3,84 3,69 3,58 3,50 3,44 3,39 3,35 3,31 3,28
9 5,12 4,26 3,86 3,63 3,48 3,37 3,29 3,23 3,18 3,14 3,10 3,07
10 4,96 4,10 3,71 3,48 3,33 3,22 3,14 3,07 3,02 2,98 2,94 2,91

11 4,84 3,98 3,59 3,36 3,20 3,09 3,01 2,95 2,90 2,85 2,82 2,79
12 4,75 3,89 3,49 3,26 3,11 3,00 2,91 2,85 2,80 2,75 2,72 2,69
13 4,67 3,81 3,41 3,18 3,03 2,92 2,83 2,77 2,71 2,67 2,63 2,60
14 4,60 3,74 3,34 3,11 2,96 2,85 2,76 2,70 2,65 2,60 2,57 2,53
15 4,54 3,68 3,29 3,06 2,90 2,79 2,71 2,64 2,59 2,54 2,51 2,48
16 4,49 3,63 3,24 3,01 2,85 2,74 2,66 2,59 2,54 2,49 2,46 2,42
17 4,45 3,59 3,20 2,96 2,81 2,70 2,61 2,55 2,49 2,45 2,41 2,38
18 4,41 3,55 3,16 2,93 2,77 2,66 2,58 2,51 2,46 2,41 2,37 2,34
19 4,38 3,52 3,13 2,90 2,74 2,63 2,54 2,48 2,42 2,38 2,34 2,31
20 4,35 3,49 3,10 2,87 2,71 2,60 2,51 2,45 2,39 2,35 2,31 2,28

21 4,32 3,47 3,07 2,84 2,68 2,57 2,49 2,42 2,37 2,32 2,28 2,25
22 4,30 3,44 3,05 2,82 2,66 2,55 2,46 2,40 2,34 2,30 2,26 2,23
23 4,28 3,42 3,03 2,80 2,64 2,53 2,44 2,37 2,32 2,27 2,24 2,20
24 4,26 3,40 3,01 2,78 2,62 2,51 2,42 2,36 2,30 2,25 2,22 2,18
25 4,24 3,39 2,99 2,76 2,60 2,49 2,40 2,34 2,28 2,24 2,20 2,16
26 4,23 3,37 2,98 2,74 2,59 2,47 2,39 2,32 2,27 2,22 2,18 2,15
27 4,21 3,35 2,96 2,73 2,57 2,46 2,37 2,31 2,25 2,20 2,17 2,13
28 4,20 3,34 2,95 2,71 2,56 2,45 2,36 2,29 2,24 2,19 2,15 2,12
29 4,18 3,33 2,93 2,70 2,55 2,43 2,35 2,28 2,22 2,18 2,14 2,10
30 4,17 3,32 2,92 2,69 2,53 2,42 2,33 2,27 2,21 2,16 2,13 2,09

tabelas 349

BIOESTATISTICA_VOL02.indb 349 25/06/12 17:24


Tabela 4.1 - Distribuio F: valores crticos para um teste unilateral ( = 0,05)
(continuao)

gl do gl do numerador
denominador 1 2 3 4 5 6 7 8 9 10 11 12
32 4,15 3,29 2,90 2,67 2,51 2,40 2,31 2,24 2,19 2,14 2,10 2,07
34 4,13 3,28 2,88 2,65 2,49 2,38 2,29 2,23 2,17 2,12 2,08 2,05
36 4,11 3,26 2,87 2,63 2,48 2,36 2,28 2,21 2,15 2,11 2,07 2,03
38 4,10 3,24 2,85 2,62 2,46 2,35 2,26 2,19 2,14 2,09 2,05 2,02
40 4,08 3,23 2,84 2,61 2,45 2,34 2,25 2,18 2,12 2,08 2,04 2,00
42 4,07 3,22 2,83 2,59 2,44 2,32 2,24 2,17 2,11 2,06 2,03 1,99
44 4,06 3,21 2,82 2,58 2,43 2,31 2,23 2,16 2,10 2,05 2,01 1,98
46 4,05 3,20 2,81 2,57 2,42 2,30 2,22 2,15 2,09 2,04 2,00 1,97
48 4,04 3,19 2,80 2,57 2,41 2,29 2,21 2,14 2,08 2,03 1,99 1,96
50 4,03 3,18 2,79 2,56 2,40 2,29 2,20 2,13 2,07 2,03 1,99 1,95

55 4,02 3,16 2,77 2,54 2,38 2,27 2,18 2,11 2,06 2,01 1,97 1,93
60 4,00 3,15 2,76 2,53 2,37 2,25 2,17 2,10 2,04 1,99 1,95 1,92
65 3,99 3,14 2,75 2,51 2,36 2,24 2,15 2,08 2,03 1,98 1,94 1,90
70 3,98 3,13 2,74 2,50 2,35 2,23 2,14 2,07 2,02 1,97 1,93 1,89
80 3,96 3,11 2,72 2,49 2,33 2,21 2,13 2,06 2,00 1,95 1,91 1,88
100 3,94 3,09 2,70 2,46 2,31 2,19 2,10 2,03 1,97 1,93 1,89 1,85
125 3,92 3,07 2,68 2,44 2,29 2,17 2,08 2,01 1,96 1,91 1,87 1,83
150 3,90 3,06 2,66 2,43 2,27 2,16 2,07 2,00 1,94 1,89 1,85 1,82
200 3,89 3,04 2,65 2,42 2,26 2,14 2,06 1,98 1,93 1,88 1,84 1,80
400 3,86 3,02 2,63 2,39 2,24 2,12 2,03 1,96 1,90 1,85 1,81 1,78
1000 3,85 3,00 2,61 2,38 2,22 2,11 2,02 1,95 1,89 1,84 1,80 1,76
infinito 3,84 3,00 2,60 2,37 2,21 2,10 2,01 1,94 1,88 1,83 1,79 1,75

350 Bioestatstica aplicada Pesquisa Experimental

BIOESTATISTICA_VOL02.indb 350 25/06/12 17:24


Tabela 4.1 - Distribuio F: valores crticos para um teste unilateral ( = 0,05)

gl do gl do numerador
denominador 14 16 20 24 30 40 50 75 100 200 500 infinito
1 245 246 248 249 250 251 252 253 253 254 254 254
2 19,42 19,43 19,45 19,45 19,46 19,47 19,48 19,48 19,49 19,49 19,49 19,50
3 8,71 8,69 8,66 8,64 8,62 8,59 8,58 8,56 8,55 8,54 8,53 8,53
4 5,87 5,84 5,80 5,77 5,75 5,72 5,70 5,68 5,66 5,65 5,64 5,63
5 4,64 4,60 4,56 4,53 4,50 4,46 4,44 4,42 4,41 4,39 4,37 4,36
6 3,96 3,92 3,87 3,84 3,81 3,77 3,75 3,73 3,71 3,69 3,68 3,67
7 3,53 3,49 3,44 3,41 3,38 3,34 3,32 3,29 3,27 3,25 3,24 3,23
8 3,24 3,20 3,15 3,12 3,08 3,04 3,02 2,99 2,97 2,95 2,94 2,93
9 3,03 2,99 2,94 2,90 2,86 2,83 2,80 2,77 2,76 2,73 2,72 2,71
10 2,86 2,83 2,77 2,74 2,70 2,66 2,64 2,60 2,59 2,56 2,55 2,54

11 2,74 2,70 2,65 2,61 2,57 2,53 2,51 2,47 2,46 2,43 2,42 2,40
12 2,64 2,60 2,54 2,51 2,47 2,43 2,40 2,37 2,35 2,32 2,31 2,30
13 2,55 2,51 2,46 2,42 2,38 2,34 2,31 2,28 2,26 2,23 2,22 2,21
14 2,48 2,44 2,39 2,35 2,31 2,27 2,24 2,21 2,19 2,16 2,14 2,13
15 2,42 2,38 2,33 2,29 2,25 2,20 2,18 2,14 2,12 2,10 2,08 2,07
16 2,37 2,33 2,28 2,24 2,19 2,15 2,12 2,09 2,07 2,04 2,02 2,01
17 2,33 2,29 2,23 2,19 2,15 2,10 2,08 2,04 2,02 1,99 1,97 1,96
18 2,29 2,25 2,19 2,15 2,11 2,06 2,04 2,00 1,98 1,95 1,93 1,92
19 2,26 2,21 2,16 2,11 2,07 2,03 2,00 1,96 1,94 1,91 1,89 1,88
20 2,22 2,18 2,12 2,08 2,04 1,99 1,97 1,93 1,91 1,88 1,86 1,84

21 2,20 2,16 2,10 2,05 2,01 1,96 1,94 1,90 1,88 1,84 1,83 1,81
22 2,17 2,13 2,07 2,03 1,98 1,94 1,91 1,87 1,85 1,82 1,80 1,78
23 2,15 2,11 2,05 2,01 1,96 1,91 1,88 1,84 1,82 1,79 1,77 1,76
24 2,13 2,09 2,03 1,98 1,94 1,89 1,86 1,82 1,80 1,77 1,75 1,73
25 2,11 2,07 2,01 1,96 1,92 1,87 1,84 1,80 1,78 1,75 1,73 1,71
26 2,09 2,05 1,99 1,95 1,90 1,85 1,82 1,78 1,76 1,73 1,71 1,69
27 2,08 2,04 1,97 1,93 1,88 1,84 1,81 1,76 1,74 1,71 1,69 1,67
28 2,06 2,02 1,96 1,91 1,87 1,82 1,79 1,75 1,73 1,69 1,67 1,65
29 2,05 2,01 1,94 1,90 1,85 1,81 1,77 1,73 1,71 1,67 1,65 1,64
30 2,04 1,99 1,93 1,89 1,84 1,79 1,76 1,72 1,70 1,66 1,64 1,62

tabelas 351

BIOESTATISTICA_VOL02.indb 351 25/06/12 17:24


Tabela 4.1 - Distribuio F: valores crticos para um teste unilateral ( = 0,05)
(continuao)

gl do gl do numerador
denominador 14 16 20 24 30 40 50 75 100 200 500 infinito
32 2,01 1,97 1,91 1,86 1,82 1,77 1,74 1,69 1,67 1,63 1,61 1,59
34 1,99 1,95 1,89 1,84 1,80 1,75 1,71 1,67 1,65 1,61 1,59 1,57
36 1,98 1,93 1,87 1,82 1,78 1,73 1,69 1,65 1,62 1,59 1,56 1,55
38 1,96 1,92 1,85 1,81 1,76 1,71 1,68 1,63 1,61 1,57 1,54 1,53
40 1,95 1,90 1,84 1,79 1,74 1,69 1,66 1,61 1,59 1,55 1,53 1,51
42 1,94 1,89 1,83 1,78 1,73 1,68 1,65 1,60 1,57 1,53 1,51 1,49
44 1,92 1,88 1,81 1,77 1,72 1,67 1,63 1,59 1,56 1,52 1,49 1,48
46 1,91 1,87 1,80 1,76 1,71 1,65 1,62 1,57 1,55 1,51 1,48 1,46
48 1,90 1,86 1,79 1,75 1,70 1,64 1,61 1,56 1,54 1,49 1,47 1,45
50 1,89 1,85 1,78 1,74 1,69 1,63 1,60 1,55 1,52 1,48 1,46 1,44

55 1,88 1,83 1,76 1,72 1,67 1,61 1,58 1,53 1,50 1,46 1,43 1,41
60 1,86 1,82 1,75 1,70 1,65 1,59 1,56 1,51 1,48 1,44 1,41 1,39
65 1,85 1,80 1,73 1,69 1,63 1,58 1,54 1,49 1,46 1,42 1,39 1,37
70 1,84 1,79 1,72 1,67 1,62 1,57 1,53 1,48 1,45 1,40 1,37 1,35
80 1,82 1,77 1,70 1,65 1,60 1,54 1,51 1,45 1,43 1,38 1,35 1,32
100 1,79 1,75 1,68 1,63 1,57 1,52 1,48 1,42 1,39 1,34 1,31 1,28
125 1,77 1,73 1,66 1,60 1,55 1,49 1,45 1,40 1,36 1,31 1,27 1,25
150 1,76 1,71 1,64 1,59 1,54 1,48 1,44 1,38 1,34 1,29 1,25 1,22
200 1,74 1,69 1,62 1,57 1,52 1,46 1,41 1,35 1,32 1,26 1,22 1,19
400 1,72 1,67 1,60 1,54 1,49 1,42 1,38 1,32 1,28 1,22 1,17 1,13
1000 1,70 1,65 1,58 1,53 1,47 1,41 1,36 1,30 1,26 1,19 1,13 1,08
infinito 1,69 1,64 1,57 1,52 1,46 1,39 1,35 1,28 1,24 1,17 1,11 1,00

352 Bioestatstica aplicada Pesquisa Experimental

BIOESTATISTICA_VOL02.indb 352 25/06/12 17:24


Tabela 4.2 - Distribuio F: valores crticos para um teste unilateral ( = 0,01)

gl do gl do numerador
denominador 1 2 3 4 5 6 7 8 9 10 11 12
1 4052 4999 5404 5624 5764 5859 5928 5981 6022 6056 6083 6107
2 98,50 99,00 99,16 99,25 99,30 99,33 99,36 99,38 99,39 99,40 99,41 99,42
3 34,12 30,82 29,46 28,71 28,24 27,91 27,67 27,49 27,34 27,23 27,13 27,05
4 21,20 18,00 16,69 15,98 15,52 15,21 14,98 14,80 14,66 14,55 14,45 14,37
5 16,26 13,27 12,06 11,39 10,97 10,67 10,46 10,29 10,16 10,05 9,96 9,89
6 13,75 10,92 9,78 9,15 8,75 8,47 8,26 8,10 7,98 7,87 7,79 7,72
7 12,25 9,55 8,45 7,85 7,46 7,19 6,99 6,84 6,72 6,62 6,54 6,47
8 11,26 8,65 7,59 7,01 6,63 6,37 6,18 6,03 5,91 5,81 5,73 5,67
9 10,56 8,02 6,99 6,42 6,06 5,80 5,61 5,47 5,35 5,26 5,18 5,11
10 10,04 7,56 6,55 5,99 5,64 5,39 5,20 5,06 4,94 4,85 4,77 4,71

11 9,65 7,21 6,22 5,67 5,32 5,07 4,89 4,74 4,63 4,54 4,46 4,40
12 9,33 6,93 5,95 5,41 5,06 4,82 4,64 4,50 4,39 4,30 4,22 4,16
13 9,07 6,70 5,74 5,21 4,86 4,62 4,44 4,30 4,19 4,10 4,02 3,96
14 8,86 6,51 5,56 5,04 4,69 4,46 4,28 4,14 4,03 3,94 3,86 3,80
15 8,68 6,36 5,42 4,89 4,56 4,32 4,14 4,00 3,89 3,80 3,73 3,67
16 8,53 6,23 5,29 4,77 4,44 4,20 4,03 3,89 3,78 3,69 3,62 3,55
17 8,40 6,11 5,19 4,67 4,34 4,10 3,93 3,79 3,68 3,59 3,52 3,46
18 8,29 6,01 5,09 4,58 4,25 4,01 3,84 3,71 3,60 3,51 3,43 3,37
19 8,18 5,93 5,01 4,50 4,17 3,94 3,77 3,63 3,52 3,43 3,36 3,30
20 8,10 5,85 4,94 4,43 4,10 3,87 3,70 3,56 3,46 3,37 3,29 3,23

21 8,02 5,78 4,87 4,37 4,04 3,81 3,64 3,51 3,40 3,31 3,24 3,17
22 7,95 5,72 4,82 4,31 3,99 3,76 3,59 3,45 3,35 3,26 3,18 3,12
23 7,88 5,66 4,76 4,26 3,94 3,71 3,54 3,41 3,30 3,21 3,14 3,07
24 7,82 5,61 4,72 4,22 3,90 3,67 3,50 3,36 3,26 3,17 3,09 3,03
25 7,77 5,57 4,68 4,18 3,85 3,63 3,46 3,32 3,22 3,13 3,06 2,99
26 7,72 5,53 4,64 4,14 3,82 3,59 3,42 3,29 3,18 3,09 3,02 2,96
27 7,68 5,49 4,60 4,11 3,78 3,56 3,39 3,26 3,15 3,06 2,99 2,93
28 7,64 5,45 4,57 4,07 3,75 3,53 3,36 3,23 3,12 3,03 2,96 2,90
29 7,60 5,42 4,54 4,04 3,73 3,50 3,33 3,20 3,09 3,00 2,93 2,87
30 7,56 5,39 4,51 4,02 3,70 3,47 3,30 3,17 3,07 2,98 2,91 2,84

tabelas 353

BIOESTATISTICA_VOL02.indb 353 25/06/12 17:24


Tabela 4.2 - Distribuio F: valores crticos para um teste unilateral ( = 0,01)
(continuao)

gl do gl do numerador
denominador 1 2 3 4 5 6 7 8 9 10 11 12
32 7,50 5,34 4,46 3,97 3,65 3,43 3,26 3,13 3,02 2,93 2,86 2,80
34 7,44 5,29 4,42 3,93 3,61 3,39 3,22 3,09 2,98 2,89 2,82 2,76
36 7,40 5,25 4,38 3,89 3,57 3,35 3,18 3,05 2,95 2,86 2,79 2,72
38 7,35 5,21 4,34 3,86 3,54 3,32 3,15 3,02 2,92 2,83 2,75 2,69
40 7,31 5,18 4,31 3,83 3,51 3,29 3,12 2,99 2,89 2,80 2,73 2,66
42 7,28 5,15 4,29 3,80 3,49 3,27 3,10 2,97 2,86 2,78 2,70 2,64
44 7,25 5,12 4,26 3,78 3,47 3,24 3,08 2,95 2,84 2,75 2,68 2,62
46 7,22 5,10 4,24 3,76 3,44 3,22 3,06 2,93 2,82 2,73 2,66 2,60
48 7,19 5,08 4,22 3,74 3,43 3,20 3,04 2,91 2,80 2,71 2,64 2,58
50 7,17 5,06 4,20 3,72 3,41 3,19 3,02 2,89 2,78 2,70 2,63 2,56

55 7,12 5,01 4,16 3,68 3,37 3,15 2,98 2,85 2,75 2,66 2,59 2,53
60 7,08 4,98 4,13 3,65 3,34 3,12 2,95 2,82 2,72 2,63 2,56 2,50
65 7,04 4,95 4,10 3,62 3,31 3,09 2,93 2,80 2,69 2,61 2,53 2,47
70 7,01 4,92 4,07 3,60 3,29 3,07 2,91 2,78 2,67 2,59 2,51 2,45
80 6,96 4,88 4,04 3,56 3,26 3,04 2,87 2,74 2,64 2,55 2,48 2,42
100 6,90 4,82 3,98 3,51 3,21 2,99 2,82 2,69 2,59 2,50 2,43 2,37
125 6,84 4,78 3,94 3,47 3,17 2,95 2,79 2,66 2,55 2,47 2,39 2,33
150 6,81 4,75 3,91 3,45 3,14 2,92 2,76 2,63 2,53 2,44 2,37 2,31
200 6,76 4,71 3,88 3,41 3,11 2,89 2,73 2,60 2,50 2,41 2,34 2,27
400 6,70 4,66 3,83 3,37 3,06 2,85 2,68 2,56 2,45 2,37 2,29 2,23
1000 6,66 4,63 3,80 3,34 3,04 2,82 2,66 2,53 2,43 2,34 2,27 2,20
infinito 6,63 4,61 3,78 3,32 3,02 2,80 2,64 2,51 2,41 2,32 2,25 2,18

354 Bioestatstica aplicada Pesquisa Experimental

BIOESTATISTICA_VOL02.indb 354 25/06/12 17:24


Tabela 4.2 - Distribuio F: valores crticos para um teste unilateral ( = 0,01)

gl do gl do numerador
denominador 14 16 20 24 30 40 50 75 100 200 500 infinito
1 6143 6170 6209 6234 6260 6286 6302 6324 6334 6350 6360 6366
2 99,43 99,44 99,45 99,46 99,47 99,48 99,48 99,48 99,49 99,49 99,50 99,50
3 26,92 26,83 26,69 26,60 26,50 26,41 26,35 26,28 26,24 26,18 26,15 26,13
4 14,25 14,15 14,02 13,93 13,84 13,75 13,69 13,61 13,58 13,52 13,49 13,46
5 9,77 9,68 9,55 9,47 9,38 9,29 9,24 9,17 9,13 9,08 9,04 9,02
6 7,60 7,52 7,40 7,31 7,23 7,14 7,09 7,02 6,99 6,93 6,90 6,88
7 6,36 6,28 6,16 6,07 5,99 5,91 5,86 5,79 5,75 5,70 5,67 5,65
8 5,56 5,48 5,36 5,28 5,20 5,12 5,07 5,00 4,96 4,91 4,88 4,86
9 5,01 4,92 4,81 4,73 4,65 4,57 4,52 4,45 4,41 4,36 4,33 4,31
10 4,60 4,52 4,41 4,33 4,25 4,17 4,12 4,05 4,01 3,96 3,93 3,91

11 4,29 4,21 4,10 4,02 3,94 3,86 3,81 3,74 3,71 3,66 3,62 3,60
12 4,05 3,97 3,86 3,78 3,70 3,62 3,57 3,50 3,47 3,41 3,38 3,36
13 3,86 3,78 3,66 3,59 3,51 3,43 3,38 3,31 3,27 3,22 3,19 3,17
14 3,70 3,62 3,51 3,43 3,35 3,27 3,22 3,15 3,11 3,06 3,03 3,00
15 3,56 3,49 3,37 3,29 3,21 3,13 3,08 3,01 2,98 2,92 2,89 2,87
16 3,45 3,37 3,26 3,18 3,10 3,02 2,97 2,90 2,86 2,81 2,78 2,75
17 3,35 3,27 3,16 3,08 3,00 2,92 2,87 2,80 2,76 2,71 2,68 2,65
18 3,27 3,19 3,08 3,00 2,92 2,84 2,78 2,71 2,68 2,62 2,59 2,57
19 3,19 3,12 3,00 2,92 2,84 2,76 2,71 2,64 2,60 2,55 2,51 2,49
20 3,13 3,,05 2,94 2,86 2,78 2,69 2,64 2,57 2,54 2,48 2,44 2,42

21 3,07 2,99 2,88 2,80 2,72 2,64 2,58 2,51 2,48 2,42 2,38 2,36
22 3,02 2,94 2,83 2,75 2,67 2,58 2,53 2,46 2,42 2,36 2,33 2,31
23 2,97 2,89 2,78 2,70 2,62 2,54 2,48 2,41 2,37 2,32 2,28 2,26
24 2,93 2,85 2,74 2,66 2,58 2,49 2,44 2,37 2,33 2,27 2,24 2,21
25 2,89 2,81 2,70 2,62 2,54 2,45 2,40 2,33 2,29 2,23 2,19 2,17
26 2,86 2,78 2,66 2,58 2,50 2,42 2,36 2,29 2,25 2,19 2,16 2,13
27 2,82 2,75 2,63 2,55 2,47 2,38 2,33 2,26 2,22 2,16 2,12 2,10
28 2,79 2,72 2,60 2,52 2,44 2,35 2,30 2,23 2,19 2,13 2,09 2,06
29 2,77 2,69 2,57 2,49 2,41 2,33 2,27 2,20 2,16 2,10 2,06 2,03
30 2,74 2,66 2,55 2,47 2,39 2,30 2,25 2,17 2,13 2,07 2,03 2,01

tabelas 355

BIOESTATISTICA_VOL02.indb 355 25/06/12 17:24


Tabela 4.2 - Distribuio F: valores crticos para um teste unilateral ( = 0,01)
(continuao)

gl do gl do numerador
denominador 14 16 20 24 30 40 50 75 100 200 500 infinito
32 2,70 2,62 2,50 2,42 2,34 2,25 2,20 2,12 2,08 2,02 1,98 1,96
34 2,66 2,58 2,46 2,38 2,30 2,21 2,16 2,08 2,04 1,98 1,94 1,91
36 2,62 2,54 2,43 2,35 2,26 2,18 2,12 2,04 2,00 1,94 1,90 1,87
38 2,59 2,51 2,40 2,32 2,23 2,14 2,09 2,01 1,97 1,90 1,86 1,84
40 2,56 2,48 2,37 2,29 2,20 2,11 2,06 1,98 1,94 1,87 1,83 1,80
42 2,54 2,46 2,34 2,26 2,18 2,09 2,03 1,95 1,91 1,85 1,80 1,78
44 2,52 2,44 2,32 2,24 2,15 2,07 2,01 1,93 1,89 1,82 1,78 1,75
46 2,50 2,42 2,30 2,22 2,13 2,04 1,99 1,91 1,86 1,80 1,76 1,73
48 2,48 2,40 2,28 2,20 2,12 2,02 1,97 1,89 1,84 1,78 1,73 1,70
50 2,46 2,38 2,27 2,18 2,10 2,01 1,95 1,87 1,82 1,76 1,71 1,68

55 2,42 2,34 2,23 2,15 2,06 1,97 1,91 1,83 1,78 1,71 1,67 1,64
60 2,39 2,31 2,20 2,12 2,03 1,94 1,88 1,79 1,75 1,68 1,63 1,60
65 2,37 2,29 2,17 2,09 2,00 1,91 1,85 1,77 1,72 1,65 1,60 1,57
70 2,35 2,27 2,15 2,07 1,98 1,89 1,83 1,74 1,70 1,62 1,57 1,54
80 2,31 2,23 2,12 2,03 1,94 1,85 1,79 1,70 1,65 1,58 1,53 1,49
100 2,27 2,19 2,07 1,98 1,89 1,80 1,74 1,65 1,60 1,52 1,47 1,43
125 2,23 2,15 2,03 1,94 1,85 1,76 1,69 1,60 1,55 1,47 1,41 1,37
150 2,20 2,12 2,00 1,92 1,83 1,73 1,66 1,57 1,52 1,43 1,38 1,33
200 2,17 2,09 1,97 1,89 1,79 1,69 1,63 1,53 1,48 1,39 1,33 1,28
400 2,13 2,05 1,92 1,84 1,75 1,64 1,58 1,48 1,42 1,32 1,25 1,19
1000 2,10 2,02 1,90 1,81 1,72 1,61 1,54 1,44 1,38 1,28 1,19 1,11
infinito 2,08 2,00 1,88 1,79 1,70 1,59 1,52 1,42 1,36 1,25 1,15 1,00

356 Bioestatstica aplicada Pesquisa Experimental

BIOESTATISTICA_VOL02.indb 356 25/06/12 17:24


Tabela 5 - Distribuio binomial: probabilidades para x sucessos em n observaes

P
n
x 0,050 0,100 0,200 0,300 0,400 0,500 0,600 0,700 0,800 0,900 0,950
2 0 0,903 0,810 0,640 0,490 0,360 0,250 0,160 0,090 0,040 0,010 0,003
1 0,095 0,180 0,320 0,420 0,480 0,500 0,480 0,420 0,320 0,180 0,095
2 0,003 0,010 0,040 0,090 0,160 0,250 0,360 0,490 0,640 0,810 0,903
3 0 0,857 0,729 0,512 0,343 0,216 0,125 0,064 0,027 0,008 0,001
1 0,135 0,243 0,384 0,441 0,432 0,375 0,288 0,189 0,096 0,027 0,007
2 0,007 0,027 0,096 0,189 0,288 0,375 0,432 0,441 0,384 0,243 0,135
3 0,001 0,008 0,027 0,064 0,125 0,216 0,343 0,512 0,729 0,857
4 0 0,815 0,656 0,410 0,240 0,130 0,063 0,026 0,008 0,002
1 0,171 0,292 0,410 0,412 0,346 0,250 0,154 0,076 0,026 0,004
2 0,014 0,049 0,154 0,265 0,346 0,375 0,346 0,265 0,154 0,049 0,014
3 0,004 0,026 0,076 0,154 0,250 0,346 0,412 0,410 0,292 0,171
4 0,002 0,008 0,026, 0,063 0,130 0,240 0,410 0,656 0,815
5 0 0,774 0,590 0,328 0,168 0,078 0,031 0,010 0,002
1 0,204 0,328 0,410 0,360 0,259 0,156 0,077 0,028 0,006
2 0,021 0,073 0,205 0,309 0,346 0,313 0,230 0,132 0,051 0,008 0,001
3 0,001 0,008 0,051 0,132 0,230 0,313 0,346 0,309 0,205 0,073 0,021
4 0,006 0,028 0,077 0,156 0,259 0,360 0,410 0,328 0,204
5 0,002 0,010 0,031 0,078 0,168 0,328 0,590 0,774
6 0 0,735 0,531 0,262 0,118 0,047 0,016 0,004 0,001
1 0,232 0,354 0,393 0,303 0,187 0,094 0,037 0,010 0,002
2 0,031 0,098 0,246 0,324 0,311 0,234 0,138 0,060 0,015 0,001
3 0,002 0,015 0,082 0,185 0,276 0,313 0,276 0,185 0,082 0,015 0,002
4 0,001 0,015 0,060 0,138 0,234 0,311 0,324 0,246 0,098 0,031
5 0,002 0,010 0,037 0,094 0,187 0,303 0,393 0,354 0,232
6 0,001 0,004 0,016 0,047 0,118 0,262 0,531 0,735
7 0 0,698 0,478 0,210 0,082 0,028 0,008 0,002
1 0,257 0,372 0,367 0,247 0,131 0,055 0,017 0,004
2 0,041 0,124 0,275 0,318 0,261 0,164 0,077 0,025 0,004
3 0,004 0,023 0,115 0,227 0,290 0,273 0,194 0,097 0,029 0,003
4 0,003 0,029 0,097 0,194 0,273 0,290 0,227 0,115 0,023 0,004
5 0,004 0,025 0,077 0,164 0,261 0,318 0,275 0,124 0,041
6 0,004 0,017 0,055 0,131 0,247 0,367 0,372 0,257
7 0,002 0,008 0,028 0,082 0,210 0,478 0,698

tabelas 357

BIOESTATISTICA_VOL02.indb 357 25/06/12 17:24


Tabela 5 - Distribuio binomial: probabilidades para x sucessos em n observaes
(continuao)

P
n
x 0,050 0,100 0,200 0,300 0,400 0,500 0,600 0,700 0,800 0,900 0,950
8 0 0,663 0,430 0,168 0,058 0,017 0,004 0,001
1 0,279 0,383 0,336 0,198 0,090 0,031 0,008 0,001
2 0,051 0,149 0,294 0,296 0,209 0,109 0,041 0,010 0,001
3 0,005 0,033 0,147 0,254 0,279 0,219 0,124 0,047 0,009
4 0,005 0,046 0,136 0,232 0,273 0,232 0,136 0,046 0,005
5 0,009 0,047 0,124 0,219 0,279 0,254 0,147 0,033 0,005
6 0,001 0,010 0,041 0,109 0,209 0,296 0,294 0,149 0,051
7 0,001 0,008 0,031 0,090 0,198 0,336 0,383 0,279
8 0,001 0,004 0,017 0,058 0,168 0,430 0,663
9 0 0,630 0,387 0,134 0,040 0,010 0,002
1 0,299 0,387 0,302 0,156 0,060 0,018 0,004
2 0,063 0,172 0,302 0,267 0,161 0,070 0,021 0,004
3 0,008 0,045 0,176 0,267 0,251 0,164 0,074 0,021 0,003
4 0,001 0,007 0,066 0,172 0,251 0,246 0,167 0,074 0,017 0,001
5 0,001 0,017 0,074 0,167 0,246 0,251 0,172 0,066 0,007 0,001
6 0,003 0,021 0,074 0,164 0,251 0,267 0,176 0,045 0,008
7 0,004 0,021 0,070 0,161 0,267 0,302 0,172 0,063
8 0,004 0,018 0,060 0,156 0,302 0,387 0,299
9 0,002 0,010 0,040 0,134 0,387 0,630
10 0 0,599 0,349 0,107 0,028 0,006 0,001
1 0,315 0,387 0,268 0,121 0,040 0,010 0,002
2 0,075 0,194 0,302 0,233 0,121 0,044 0,011 0,001
3 0,010 0,057 0,201 0,267 0,215 0,117 0,042 0,009 0,001
4 0,001 0,011 0,088 0,200 0,251 0,205 0,111 0,037 0,006
5 0,001 0,026 0,103 0,201 0,246 0,201 0,103 0,026 0,001
6 0,006 0,037 0,111 0,205 0,251 0,200 0,088 0,011 0,001
7 0,001 0,009 0,042 0,117 0,215 0,267 0,201 0,057 0,010
8 0,001 0,011 0,044 0,121 0,233 0,302 0,194 0,075
9 0,002 0,010 0,040 0,121 0,268 0,387 0,315
10 0,001 0,006 0,028 0,107 0,349 0,599
11 0 0,569 0,314 0,086 0,020 0,004
1 0,329 0,384 0,236 0,093 0,027 0,005 0,001
2 0,087 0,213 0,295 0,200 0,089 0,027 0,005 0,001

358 Bioestatstica aplicada Pesquisa Experimental

BIOESTATISTICA_VOL02.indb 358 25/06/12 17:24


Tabela 5 - Distribuio binomial: probabilidades para x sucessos em n observaes
(continuao)

P
n
x 0,050 0,100 0,200 0,300 0,400 0,500 0,600 0,700 0,800 0,900 0,950
3 0,014 0,071 0,221 0,257 0,177 0,081 0,023 0,004
4 0,001 0,016 0,111 0,220 0,236 0,161 0,070 0,017 0,002
5 0,002 0,039 0,132 0,221 0,226 0,147 0,057 0,010
6 0,010 0,057 0,147 0,226 0,221 0,132 0,039 0,002
7 0,002 0,017 0,070 0,161 0,236 0,220 0,111 0,016 0,001
8 0,004 0,023 0,081 0,177 0,257 0,221 0,071 0,014
9 0,001 0,005 0,027 0,089 0,200 0,295 0,213 0,087
10 0,001 0,005 0,027 0,093 0,236 0,384 0,329
11 0,004 0,020 0,086 0,314 0,569
12 0 0,540 0,282 0,069 0,014 0,002
1 0,341 0,377 0,206 0,071 0,017 0,003
2 0,099 0,230 0,283 0,168 0,064 0,016 0,002
3 0,017 0,085 0,236 0,240 0,142 0,054 0,012 0,001
4 0,002 0,021 0,133 0,231 0,213 0,121 0,042 0,008 0,001
5 0,004 0,053 0,158 0,227 0,193 0,101 0,029 0,003
6 0,016 0,079 0,177 0,226 0,177 0,079 0,016
7 0,003 0,029 0,101 0,193 0,227 0,158 0,053 0,004
8 0,001 0,008 0,042 0,121 0,213 0,231 0,133 0,021 0,002
9 0,001 0,012 0,054 0,142 0,240 0,236 0,085 0,017
10 0,002 0,016 0,064 0,168 0,283 0,230 0,099
11 0,003 0,017 0,071 0,206 0,377 0,341
12 0,002 0,014 0,069 0,282 0,540
16 0 0,440 0,185 0,028 0,003
1 0,371 0,329 0,113 0,023 0,003
2 0,146 0,275 0,211 0,073 0,015 0,002
3 0,036 0,142 0,246 0,146 0,047 0,009 0,001
4 0,006 0,051 0,200 0,204 0,101 0,028 0,004
5 0,001 0,014 0,120 0,210 0,162 0,067 0,014 0,001
6 0,003 0,055 0,165 0,198 0,122 0,039 0,006
7 0,020 0,101 0,189 0,175 0,084 0,019 0,001
8 0,006 0,049 0,142 0,196 0,142 0,049 0,006
9 0,001 0,019 0,084 0,175 0,189 0,101 0,020
10 0,006 0,039 0,122 0,198 0,165 0,055 0,003

tabelas 359

BIOESTATISTICA_VOL02.indb 359 25/06/12 17:24


Tabela 5 - Distribuio binomial: probabilidades para x sucessos em n observaes
(continuao)

P
n
x 0,050 0,100 0,200 0,300 0,400 0,500 0,600 0,700 0,800 0,900 0,950
11 0,001 0,014 0,067 0,162 0,210 0,120 0,014 0,001
12 0,004 0,028 0,101 0,204 0,200 0,051 0,006
13 0,001 0,009 0,047 0,146 0,246 0,142 0,036
14 0,002 0,015 0,073 0,211 0,275 0,146
15 0,003 0,023 0,113 0,329 0,371
16 0,003 0,028 0,185 0,440
20 0 0,358 0,122 0,012 0,001
1 0,377 0,270 0,058 0,007
2 0,189 0,285 0,137 0,028 0,003
3 0,060 0,190 0,205 0,072 0,012 0,001
4 0,013 0,090 0,218 0,130 0,035 0,005
5 0,002 0,032 0,175 0,179 0,075 0,015 0,001
6 0,009 0,109 0,192 0,124 0,037 0,005
7 0,002 0,055 0,164 0,166 0,074 0,015 0,001
8 0,022 0,114 0,180 0,120 0,035 0,004
9 0,007 0,065 0,160 0,160 0,071 0,012
10 0,002 0,031 0,117 0,176 0,117 0,031 0,002
11 0,012 0,071 0,160 0,160 0,065 0,007
12 0,004 0,035 0,120 0,180 0,114 0,022
13 0,001 0,015 0,074 0,166 0,164 0,055 0,002
14 0,005 0,037 0,124 0,192 0,109 0,009
15 0,001 0,015 0,075 0,179 0,175 0,032 0,002
16 0,005 0,035 0,130 0,218 0,090 0,013
17 0,001 0,012 0,072 0,205 0,190 0,060
18 0,003 0,028 0,137 0,285 0,189
19 0,007 0,058 0,270 0,377
20 0,001 0,012 0,122 0,358

360 Bioestatstica aplicada Pesquisa Experimental

BIOESTATISTICA_VOL02.indb 360 25/06/12 17:24


Tabela 6 - Valores crticos da distribuio qui-quadrado (2 )


gl 0,20 0,10 0,05 0,02 0,01 0,001
1 1,64 2,71 3,84 5,41 6,63 10,83
2 3,22 4,61 5,99 7,82 9,21 13,82
3 4,64 6,25 7,81 9,84 11,34 16,27
4 5,99 7,78 9,49 11,67 13,28 18,47
5 7,29 9,24 11,07 13,39 15,09 20,51

6 8,56 10,64 12,59 15,03 16,81 22,46


7 9,80 12,02 14,07 16,62 18,48 24,32
8 11,03 13,36 15,51 18,17 20,09 26,12
9 12,24 14,68 16,92 19,68 21,67 27,88
10 13,44 15,99 18,31 21,16 23,21 29,59

11 14,63 17,28 19,68 22,62 24,73 31,26


12 15,81 18,55 21,03 24,05 26,22 32,91
13 16,98 19,81 22,36 25,47 27,69 34,53
14 18,15 21,06 23,68 26,87 29,14 36,12
15 19,31 22,31 25,00 28,26 30,58 37,70

16 20,47 23,54 26,30 29,63 32,00 39,25


17 21,61 24,77 27,59 31,00 33,41 40,79
18 22,76 25,99 28,87 32,35 34,81 42,31
19 23,90 27,20 30,14 33,69 36,19 43,82
20 25,04 28,41 31,41 35,02 37,57 45,31

21 26,17 29,62 32,67 36,34 38,93 46,80


22 27,30 30,81 33,92 37,66 40,29 48,27
23 28,43 32,01 35,17 38,97 41,64 49,73
24 29,55 33,20 36,42 40,27 42,98 51,18
25 30,68 34,38 37,65 41,57 44,31 52,62

26 31,79 35,56 38,89 42,86 45,64 54,05


27 32,91 36,74 40,11 44,14 46,96 55,48
28 34,03 37,92 41,34 45,42 48,28 56,89
29 35,14 39,09 42,56 46,69 49,59 58,30
30 36,25 40,26 43,77 47,96 50,89 59,70

tabelas 361

BIOESTATISTICA_VOL02.indb 361 25/06/12 17:24


BIOESTATISTICA_VOL02.indb 362 25/06/12 17:24
Tabela 7 - Valores crticos da distribuio q para = 0,05

gl k: 2 3 4 5 6 7 8 9 10

1 17,97 26,98 32,82 37,08 40,41 43,12 45,40 47,36 49,07

2 6,085 8,331 9,798 10,88 11,74 12,44 13,03 13,54 13,99

3 4,501 5,910 6,825 7,502 8,037 8,478 8,853 9,177 9,462

4 3,927 5,040 5,757 6,287 6,707 7,053 7,347 7,602 7,826

5 3,635 4,602 5,218 5,673 6,033 6,330 6,582 6,802 6,995

6 3,461 4,339 4,896 5,305 5,628 5,895 6,122 6,319 6,493

7 3,344 4,165 4,681 5,060 5,359 5,606 5,815 5,998 6,158

8 3,261 4,041 4,529 4,886 5,167 5,399 5,597 5,767 5,918

9 3,199 3,949 4,415 4,756 5,024 5,244 5,432 5,595 5,739

10 3,151 3,877 4,327 4,654 4,912 5,124 5,305 5,461 5,599

11 3,113 3,820 4,256 4,574 4,823 5,028 5,202 5,353 5,487

12 3,082 3,773 4,199 4,508 4,751 4,950 5,119 5,265 5,395

13 3,055 3,735 4,151 4,453 4,690 4,885 5,049 5,192 5,318

14 3,033 3,702 4,111 4,407 4,639 4,829 4,990 5,131 5,254

15 3,014 3,674 4,076 4,367 4,595 4,782 4,940 5,077 5,198

16 2,998 3,649 4,046 4,333 4,557 4,741 4,897 5,031 5,150

17 2,984 3,628 4,020 4,303 4,524 4,705 4,858 4,991 5,108

18 2,971 3,609 3,997 4,277 4,495 4,673 4,824 4,956 5,071

19 2,960 3,593 3,977 4,253 4,469 4,645 4,794 4,924 5,038

20 2,950 3,578 3,958 4,232 4,445 4,620 4,768 4,896 5,008

24 2,919 3,532 3,901 4,166 4,373 4,541 4,684 4,807 4,915

30 2,888 3,486 3,845 4,102 4,302 4,464 4,602 4,720 4,824

40 2,858 3,442 3,791 4,039 4,232 4,389 4,521 4,635 4,735

60 2,829 3,399 3,737 3,977 4,163 4,314 4,441 4,550 4,646

120 2,800 3,356 3,685 3,917 4,096 4,241 4,363 4,468 4,560

Infinito 2,772 3,314 3,633 3,858 4,030 4,170 4,286 4,387 4,474

tabelas 363

BIOESTATISTICA_VOL02.indb 363 25/06/12 17:24


Tabela 7 - Valores crticos da distribuio q para = 0,05

gl k: 11 12 13 14 15 16 17 18 19

1 50,59 51,96 53,20 54,33 55,36 56,32 57,22 58,04 58,83

2 14,39 14,75 15,08 15,38 15,65 15,91 16,14 16,37 16,57

3 9,717 9,946 10,15 10,35 10,53 10,69 10,84 10,98 11,11

4 8,027 8,208 8,373 8,525 8,664 8,794 8,914 9,028 9,134

5 7,168 7,324 7,466 7,596 7,717 7,828 7,932 8,030 8,122

6 6,649 6,789 6,917 7,034 7,143 7,244 7,338 7,426 7,508

7 6,302 6,431 6,550 6,658 6,759 6,852 6,939 7,020 7,097

8 6,054 6,175 6,287 6,389 6,483 6,571 6,653 6,729 6,802

9 5,867 5,983 6,089 6,186 6,276 6,359 6,437 6,510 6,579

10 5,722 5,833 5,935 6,028 6,114 6,194 6,269 6,339 6,405

11 5,605 5,713 5,811 5,901 5,984 6,062 6,134 6,202 6,265

12 5,511 5,615 5,710 5,798 5,878 5,953 6,023 6,089 6,151

13 5,431 5,533 5,625 5,711 5,789 5,862 5,931 5,995 6,055

14 5,364 5,463 5,554 5,637 5,714 5,786 5,852 5,915 5,974

15 5,306 5,404 5,493 5,574 5,649 5,720 5,785 5,846 5,904

16 5,256 5,352 5,439 5,520 5,593 5,662 5,727 5,786 5,843

17 5,212 5,307 5,392 5,471 5,544 5,612 5,675 5,734 5,790

18 5,174 5,267 5,352 5,429 5,501 5,568 5,630 5,688 5,743

19 5,140 5,231 5,315 5,391 5,462 5,528 5,589 5,647 5,701

20 5,108 5,199 5,282 5,357 5,427 5,493 5,553 5,610 5,663

24 5,012 5,099 5,179 5,251 5,319 5,381 5,439 5,494 5,545

30 4,917 5,001 5,077 5,147 5,211 5,271 5,327 5,379 5,429

40 4,824 4,904 4,977 5,044 5,106 5,163 5,216 5,266 5,313

60 4,732 4,808 4,878 4,942 5,001 5,056 5,107 5,154 5,199

120 4,641 4,714 4,781 4,842 4,898 4,950 4,998 5,044 5,086

Infinito 4,552 4,622 4,685 4,743 4,796 4,845 4,891 4,934 4,974

364 Bioestatstica aplicada Pesquisa Experimental

BIOESTATISTICA_VOL02.indb 364 25/06/12 17:24


Tabela 7 - Valores crticos da distribuio q para = 0,05 (continuao)

gl k: 20 22 24 26 28 30 32 34 36

1 59,56 60,91 62,12 63,22 64,23 65,15 66,01 66,81 67,56

2 16,77 17,13 17,45 17,75 18,02 18,27 18,50 18,72 18,92

3 11,24 11,47 11,68 11,87 12,05 12,21 12,36 12,50 12,63

4 9,233 9,418 9,584 9,736 9,875 10,00 10,12 10,23 10,34

5 8,208 8,368 8,512 8,643 8,764 8,875 8,979 9,075 9,165

6 7,587 7,730 7,861 7,979 8,088 8,189 8,283 8,370 8,452

7 7,170 7,303 7,423 7,533 7,634 7,728 7,814 7,895 7,972

8 6,870 6,995 7,109 7,212 7,307 7,395 7,477 7,554 7,625

9 6,644 6,763 6,871 6,970 7,061 7,145 7,222 7,295 7,363

10 6,467 6,582 6,686 6,781 6,868 6,948 7,023 7,093 7,159

11 6,326 6,436 6,536 6,628 6,712 6,790 6,863 6,930 6,994

12 6,209 6,317 6,414 6,503 6,585 6,660 6,731 6,796 6,858

13 6,112 6,217 6,312 6,398 6,478 6,551 6,620 6,684 6,744

14 6,029 6,132 6,224 6,309 6,387 6,459 6,526 6,588 6,647

15 5,958 6,059 6,149 6,233 6,309 6,379 6,445 6,506 6,564

16 5,897 5,995 6,084 6,166 6,241 6,310 6,374 6,434 6,491

17 5,842 5,940 6,027 6,107 6,181 6,249 6,313 6,372 6,427

18 5,794 5,890 5,977 6,055 6,128 6,195 6,258 6,316 6,371

19 5,752 5,846 5,932 6,009 6,081 6,147 6,209 6,267 6,321

20 5,714 5,807 5,891 5,968 6,039 6,104 6,165 6,222 6,275

24 5,594 5,683 5,764 5,838 5,906 5,968 6,027 6,081 6,132

30 5,475 5,561 5,638 5,709 5,774 5,833 5,889 5,941 5,990

40 5,358 5,439 5,513 5,581 5,642 5,700 5,753 5,803 5,849

60 5,241 5,319 5,389 5,453 5,512 5,566 5,617 5,664 5,708

120 5,126 5,200 5,266 5,327 5,382 5,434 5,481 5,526 5,568

Infinito 5,012 5,081 5,144 5,201 5,253 5,301 5,346 5,388 5,427

tabelas 365

BIOESTATISTICA_VOL02.indb 365 25/06/12 17:24


Tabela 7 - Valores crticos da distribuio q para = 0,05 (continuao)

gl k: 38 40 50 60 70 80 90 100

1 68,26 68,92 71,73 73,97 75,82 77,40 78,77 79,98

2 19,11 19,28 20,05 20,66 21,16 21,59 21,96 22,29

3 12,75 12,87 13,36 13,76 14,08 14,36 14,61 14,82

4 10,44 10,53 10,93 11,24 11,51 11,73 11,92 12,09

5 9,250 9,330 9,674 9,949 10,18 10,38 10,54 10,69

6 8,529 8,601 8,913 9,163 9,370 9,548 9,702 9,839

7 8,043 8,110 8,400 8,632 8,824 8,989 9,133 9,261

8 7,693 7,756 8,029 8,248 8,430 8,586 8,722 8,843

9 7,428 7,488 7,749 7,958 8,132 8,281 8,410 8,526

10 7,220 7,279 7,529 7,730 7,897 8,041 8,166 8,276

11 7,053 7,110 7,352 7,546 7,708 7,847 7,968 8,075

12 6,916 6,970 7,205 7,394 7,552 7,687 7,804 7,909

13 6,800 6,854 7,083 7,267 7,421 7,552 7,667 7,769

14 6,702 6,754 6,979 7,159 7,309 7,438 7,550 7,650

15 6,618 6,669 6,888 7,065 7,212 7,339 7,449 7,546

16 6,544 6,594 6,810 6,984 7,128 7,252 7,360 7,457

17 6,479 6,529 6,741 6,912 7,054 7,176 7,283 7,377

18 6,422 6,471 6,680 6,848 6,989 7,109 7,213 7,307

19 6,371 6,419 6,626 6,792 6,930 7,048 7,152 7,244

20 6,325 6,373 6,576 6,740 6,877 6,994 7,097 7,187

24 6,181 6,226 6,421 6,579 6,710 6,822 6,920 7,008

30 6,037 6,080 6,267 6,417 6,543 6,650 6,744 6,827

40 5,893 5,934 6,112 6,255 6,375 6,477 6,566 6,645

60 5,750 5,789 5,958 6,093 6,206 6,303 6,387 6,462

120 5,607 5,644 5,802 5,929 6,035 6,126 6,205 6,275

Infinito 5,463 5,498 5,646 5,764 5,863 5,947 6,020 6,085

366 Bioestatstica aplicada Pesquisa Experimental

BIOESTATISTICA_VOL02.indb 366 25/06/12 17:24


Tabela 8 - Valores crticos da distribuio U de Mann-Whitney, para testes unilaterais com =
0,025 e bilaterais com = 0,05

n2
9 10 11 12 13 14 15 16 17 18 19 20
n1

2 0 0 0 1 1 1 1 1 2 2 2 2

3 2 3 3 4 4 5 5 6 6 7 7 8

4 4 5 6 7 8 9 10 11 11 12 13 13

5 7 8 9 11 12 13 14 15 17 18 19 20

6 10 11 13 14 16 17 19 21 22 24 25 27

7 12 14 16 18 20 22 24 26 28 30 32 34

8 15 17 19 22 24 26 29 31 34 36 38 41

9 17 20 23 26 28 31 34 37 39 42 45 48

10 20 23 26 29 33 36 39 42 45 48 52 55

11 23 26 30 33 37 40 44 47 51 55 58 62

12 26 29 33 37 41 45 49 53 57 61 65 69

13 28 33 37 41 45 50 54 59 63 67 72 76

14 31 36 40 45 50 55 59 64 67 74 78 83

15 34 39 44 49 54 59 64 70 75 80 85 90

16 37 42 47 53 59 64 70 75 81 86 92 98

17 39 45 51 57 63 67 75 81 87 93 99 105

18 42 48 55 61 67 74 80 86 93 99 106 112

19 45 52 58 65 72 78 85 92 99 106 113 119

20 48 55 62 69 76 83 90 98 105 112 119 127

tabelas 367

BIOESTATISTICA_VOL02.indb 367 25/06/12 17:24


BIOESTATISTICA_VOL02.indb 368 25/06/12 17:24
Tabela 9 - Valores crticos da distribuio T de Wilcoxon

Bilateral: 0,50 0,20 0,10 0,05 0,02 0,01 0,005 0,001


n
Unilateral: 0,25 0,10 0,05 0,025 0,01 0,005 0,0025 0,0005
4 2 0
5 4 2 0
6 6 3 2 0
7 9 5 3 2 0
8 12 8 5 3 1 0
9 16 10 8 5 3 1 0
10 20 14 10 8 5 3 1

11 24 17 13 10 7 5 3 0
12 29 21 17 13 9 7 5 1
13 35 26 21 17 12 9 7 2
14 40 31 25 21 15 12 9 4
15 47 36 30 25 19 15 12 6
16 54 42 35 29 23 19 15 8
17 61 48 41 34 27 23 19 11
18 69 55 47 40 32 27 23 14
19 77 62 53 46 37 32 27 18
20 86 69 60 52 43 37 32 21

21 95 77 67 58 49 42 37 25
22 104 86 75 65 55 48 42 30
23 114 94 83 73 62 54 48 35
24 125 104 91 81 69 61 54 40
25 136 113 100 89 76 68 60 45
26 148 124 110 98 84 75 67 51
27 160 134 119 107 92 83 74 57
28 172 145 130 116 101 91 82 64
29 185 157 140 126 110 100 90 71
30 198 169 151 137 120 109 98 78

31 212 181 163 147 130 118 107 86


32 226 194 175 159 140 128 116 94
33 241 207 187 170 151 138 126 102
34 257 221 200 182 162 148 136 111
35 272 235 213 195 173 159 146 120

tabelas 369

BIOESTATISTICA_VOL02.indb 369 25/06/12 17:24


Tabela 9 - Valores crticos da distribuio T de Wilcoxon
(continuao)

Bilateral: 0,50 0,20 0,10 0,05 0,02 0,01 0,005 0,001


n
Unilateral: 0,25 0,10 0,05 0,025 0,01 0,005 0,0025 0,0005
36 289 250 227 208 185 171 157 130
37 305 265 241 221 198 182 168 140
38 323 281 256 235 211 194 180 150
39 340 297 271 249 224 207 192 161
40 358 313 286 264 238 220 204 172

41 377 330 302 279 252 233 217 183


42 396 348 319 294 266 247 230 195
43 416 365 336 310 281 261 244 207
44 436 384 353 327 296 276 258 220
45 456 402 371 343 312 291 272 233
46 477 422 389 361 328 307 287 246
47 499 441 407 378 345 322 302 260
48 521 462 426 396 362 339 318 274
49 543 482 446 415 379 355 334 289
50 566 503 466 434 397 373 350 304
51 590 525 486 453 416 390 367 319
52 613 547 507 473 434 408 384 335
53 638 569 529 494 454 427 402 351
54 668 592 550 514 473 445 420 368
55 688 615 573 536 493 465 438 385
56 714 639 595 557 514 484 457 402
57 740 664 618 579 535 504 477 420
58 767 688 642 602 556 525 497 438
59 794 714 666 625 578 546 517 457
60 822 739 690 648 600 567 537 476

61 850 765 715 672 623 598 558 495


62 879 792 741 697 646 611 580 515
63 908 819 767 721 669 634 602 535
64 938 847 793 747 693 657 624 556
65 968 875 820 772 718 681 647 577
66 998 903 847 798 742 705 670 599
67 1029 932 875 825 768 729 694 621
68 1061 962 903 852 793 754 718 643

370 Bioestatstica aplicada Pesquisa Experimental

BIOESTATISTICA_VOL02.indb 370 25/06/12 17:24


Tabela 9 - Valores crticos da distribuio T de Wilcoxon
(continuao)

Bilateral: 0,50 0,20 0,10 0,05 0,02 0,01 0,005 0,001


n
Unilateral: 0,25 0,10 0,05 0,025 0,01 0,005 0,0025 0,0005
69 1093 992 931 879 819 779 742 666
70 1126 1022 960 907 846 805 767 689

71 1159 1053 990 936 873 831 792 712


72 1192 1084 1020 964 901 858 818 736
73 1226 1116 1050 994 928 884 844 761
74 1261 1148 1081 1023 957 912 871 786
75 1296 1181 1112 1053 986 940 898 811
76 1331 1214 1144 1084 1015 968 925 836
77 1367 1247 1176 1115 1044 997 953 862
78 1403 1282 1209 1147 1075 1026 981 889
79 1440 1316 1242 1179 1105 1056 1010 916
80 1478 1351 1276 1211 1136 1086 1039 943

81 1516 1387 1310 1244 1168 1116 1069 971


82 1554 1423 1345 1277 1200 1147 1099 999
83 1593 1459 1380 1311 1232 1178 1129 1028
84 1632 1496 1415 1345 1265 1210 1160 1057
85 1672 1533 1451 1380 1298 1242 1191 1086
86 1712 1571 1487 1415 1332 1275 1223 1116
87 1753 1609 1524 1451 1366 1308 1255 1146
88 1794 1648 1561 1487 1400 1342 1288 1177
89 1836 1688 1599 1523 1435 1376 1321 1208
90 1878 1727 1638 1560 1471 1410 1355 1240

91 1921 1767 1676 1597 1507 1445 1389 1271


92 1964 1808 1715 1635 1543 1480 1423 1304
93 2008 1849 1755 1674 1580 1516 1458 1337
94 2052 1891 1795 1712 1617 1552 1493 1370
95 2097 1933 1836 1752 1655 1589 1529 1404
96 2142 1976 1877 1791 1693 1626 1565 1438
97 2187 2019 1918 1832 1731 1664 1601 1472
98 2233 2062 1960 1872 1770 1702 1638 1507
99 2280 2106 2003 1913 1810 1740 1676 1543
100 2327 2151 2045 1955 1850 1779 1714 1578

tabelas 371

BIOESTATISTICA_VOL02.indb 371 25/06/12 17:24


BIOESTATISTICA_VOL02.indb 372 25/06/12 17:24
Tabela 10 - Valores crticos da distribuio H de Kruskal-Wallis

n1 n2 n3 a: 0,10 0,05 0,02 0,01 0,005 0,002 0,001

2 2 2 4,571
3 2 1 4,286
3 2 2 4,500 4,714
3 3 1 4,571 5,143
3 3 2 4,556 5,361 6,250
3 3 3 4,622 5,600 6,489 (7,200) 7,200
4 2 1 4,500
4 2 2 4,458 5,333 6,000
4 3 1 4,056 5,208
4 3 2 4,511 5,444 6,144 6,444 7,000
4 3 3 4,709 5,791 6,564 6,745 7,318 8,018
4 4 1 4,167 4,967 (6,667) 6,667
4 4 2 4,555 5,455 6,600 7,036 7,282 7,855
4 4 3 4,545 5,598 6,712 7,144 7,598 8,227 8,909
4 4 4 4,654 5,692 6,962 7,654 8,000 8,654 9,269
5 2 1 4,200 5,000
5 2 2 4,373 5,160 6,000 6,533
5 3 1 4,018 4,960 6,044
5 3 2 4,651 5,251 6,124 6,909 7,182
5 3 3 4,533 5,648 6,533 7,079 7,636 8,048 8,727
5 4 1 3,987 4,985 6,431 6,955 7,364
5 4 2 4,541 5,273 6,505 7,205 7,573 8,114 8,591
5 4 3 4,549 5,656 6,676 7,445 7,927 8,481 8,795
5 4 4 4,619 5,657 6,953 7,760 8,189 8,868 9,168
5 5 1 4,109 5,127 6,145 7,309 8,182
5 5 2 4,623 5,338 6,446 7,338 8,131 6,446 7,338
5 5 3 4,545 5,705 6,866 7,578 8,316 8,809 9,521
5 5 4 4,523 5,666 7,000 7,823 8,523 9,163 9,606
5 5 5 4,940 5,780 7,220 8,000 8,780 9,620 9,920

tabelas 373

BIOESTATISTICA_VOL02.indb 373 25/06/12 17:24


Tabela 10 - Valores crticos da distribuio H de Kruskal-Wallis

n1 n2 n3 a: 0,10 0,05 0,02 0,01 0,005 0,002 0,001

6 1 1 ---
6 2 1 4,200 4,822
6 2 2 4,545 5,345 6,182 6,982
6 3 1 3,909 4,855 6,236
6 3 2 4,682 5,348 6,227 6,970 7,515 8,182
6 3 3 4,538 5,615 6,590 7,410 7,872 8,628 9,346
6 4 1 4,038 4,947 6,174 7,106 7,614
6 4 2 4,494 5,340 6,571 7,340 7,846 8,494 8,827
6 4 3 4,604 5,610 6,725 7,500 8,033 8,918 9,170
6 4 4 4,595 5,681 6,900 7,795 8,381 9,167 9,861
6 5 1 4,128 4,990 6,138 7,182 8,077 8,515
6 5 2 4,596 5,338 6,585 7,376 8,196 8,967 9,189
6 5 3 4,535 5,602 6,829 7,590 8,314 9,150 9,669
6 5 4 4,522 5,661 7,018 7,936 8,643 9,458 9,960
6 5 5 4,547 5,729 7,110 8,028 8,859 9,771 10,271
6 6 1 4,000 4,945 6,286 7,121 8,165 9,077 9,692
6 6 2 4,438 5,410 6,667 7,467 8,210 9,219 9,752
6 6 3 4,558 5,625 6,900 7,725 8,458 9,458 10,150
6 6 4 4,548 5,724 7,107 8,000 8,754 9,662 10,342
6 6 5 4,542 5,765 7,152 8,124 8,987 9,948 10,524
6 6 6 4,643 5,801 7,240 8,222 9,170 10,187 10,889
7 7 7 4,594 5,819 7,332 8,378 9,373 10,516 11,310
8 8 8 4,595 5,805 7,355 8,465 9,495 10,805 11,705
2 2 1 1 ---
2 2 2 1 5,357 5,679
2 2 2 2 5,667 6,167 (6,667) 6,667
3 1 1 1 ---
3 2 1 1 5,143
3 2 2 1 5,556 5,833 6,500

374 Bioestatstica aplicada Pesquisa Experimental

BIOESTATISTICA_VOL02.indb 374 25/06/12 17:24


Tabela 10 - Valores crticos da distribuio H de Kruskal-Wallis
(continuao)

n1 n2 n3 a: 0,10 0,05 0,02 0,01 0,005 0,002 0,001

3 2 2 2 5,544 6,333 6,978 7,133 7,533


3 3 1 1 5,333 6,333
3 3 2 1 5,689 6,244 6,689 7,200 7,400
3 3 2 2 5,745 6,527 7,182 7,636 7,873 8,018 8,455
3 3 3 1 5,655 6,600 7,109 7,400 8,055 8,345
3 3 3 2 5,879 6,727 7,636 8,105 8,379 8,803 9,030
3 3 3 3 6,026 7,000 7,872 8,538 8,897 9,462 9,513
4 1 1 1
4 2 1 1 5,250 5,833
4 2 2 1 5,533 6,133 6,667 7,000
4 2 2 2 5,755 6,545 7,091 7,391 7,964 8,291
4 3 1 1 5,067 6,178 6,711 7,067
4 3 2 1 5,591 6,309 7,018 7,455 7,773 8,182
4 3 2 2 5,750 6,621 7,530 7,871 8,273 8,689 8,909
4 3 3 1 5,589 6,545 7,485 7,758 8,212 8,697 9,182
4 3 3 2 5,872 6,795 7,763 8,333 8,718 9,167 9,455
4 3 3 3 6,016 6,984 7,995 8,659 9,253 9,709 10,016
4 4 1 1 5,182 5,945 7,091 7,909 7,909
4 4 2 1 5,568 6,386 7,364 7,886 8,341 8,591 8,909
4 4 2 2 5,808 6,731 7,750 8,346 8,692 9,269 9,462
4 4 3 1 5,692 6,635 7,660 8,231 8,583 9,038 9,327
4 4 3 2 5,901 6,874 7,951 8,621 9,165 9,615 9,945
4 4 3 3 6,019 7,038 8,181 8,876 9,495 10,105 10,467
4 4 4 1 5,564 6,725 7,879 8,588 9,000 9,478 9,758

tabelas 375

BIOESTATISTICA_VOL02.indb 375 25/06/12 17:24


Tabela 10 - Valores crticos da distribuio H de Kruskal-Wallis
(continuao)

n1 n2 n3 a: 0,10 0,05 0,02 0,01 0,005 0,002 0,001

4 4 4 2 5,914 6,957 8,157 8,871 9,486 10,043 10,429


4 4 4 3 6,042 7,142 8,350 9,075 9,742 10,542 10,929
4 4 4 4 6,088 7,235 8,515 9,287 9,971 10,809 11,338
2 1 1 1 1 ---
2 2 1 1 1 5,786
2 2 2 1 1 6,250 6,750
2 2 2 2 1 6,600 7,133 (7,533) 7,533
2 2 2 2 2 6,982 7,418 8,073 8,291 (8,727) 8,727
3 1 1 1 1 ---
3 2 1 1 1 6,139 6,583
3 2 2 1 1 6,511 6,800 7,400 7,600
3 2 2 2 1 6,709 7,309 7,836 8,127 8,327 8,618
3 2 2 2 2 6,955 7,682 8,303 8,682 8,985 9,273 9,364
3 3 1 1 1 6,311 7,111 7,467
3 3 2 1 1 6,600 7,200 7,892 8,073 8,345
3 3 2 2 1 6,788 7,591 8,258 8,576 8,924 9,167 9,303
3 3 2 2 2 7,026 7,910 8,667 9,115 9,474 9,769 10,026
3 3 3 1 1 6,788 6,576 8,242 8,424 8,848 (9,455) 9,455
3 3 3 2 1 6,910 7,769 8,590 9,051 9,410 9,769 9,974
3 3 3 2 2 7,121 8,044 9,011 9,505 9,890 10,330 10,637
3 3 3 3 1 7,077 8,000 8,879 9,451 9,846 10,286 10,549
3 3 3 3 2 7,210 8,200 9,267 9,876 10,333 10,838 11,171
3 3 3 3 3 7,333 8,333 9,467 10,200 10,733 10,267 11,667

376 Bioestatstica aplicada Pesquisa Experimental

BIOESTATISTICA_VOL02.indb 376 25/06/12 17:24


Tabela 11 - Valores crticos da distribuio Q para testes de comparaes mltiplas no-
paramtricas

k : 0,50 0,20 0,10 0,05 0,02 0,01 0,005 0,002 0,001

2 0,674 1,282 1,645 1,960 2,327 2,576 2,807 3,091 3,291

3 1,383 1,834 2,128 2,394 2,713 2,936 3,144 3,403 3,588

4 1,732 2,128 2,394 2,639 2,936 3,144 3,342 3,588 3,765

5 1,960 2,327 2,576 2,807 3,091 3,291 3,481 3,719 3,891

6 2,128 2,475 2,713 2,936 3,209 3,403 3,588 3,820 3,988

7 2,261 2,593 2,823 3,038 3,304 3,494 3,675 3,902 4,067

8 2,369 2,690 2,914 3,124 3,384 3,570 3,748 3,972 4,134

9 2,461 2,773 2,992 3,197 3,453 3,635 3,810 4,031 4,191

10 2,540 2,845 3,059 3,261 3,512 3,692 3,865 4,083 4,241

11 2,609 2,908 3,119 3,317 3,565 3,743 3,914 4,129 4,286

12 2,671 2,965 3,172 3,368 3,613 3,789 3,957 4,171 4,326

13 2,726 3,016 3,220 3,414 3,656 3,830 3,997 4,209 4,363

14 2,777 3,062 3,264 3,456 3,695 3,868 4,034 4,244 4,397

15 2,823 3,105 3,304 3,494 3,731 3,902 4,067 4,276 4,428

16 2,866 3,144 3,342 3,529 3,765 3,935 4,098 4,305 4,456

17 2,905 3,181 3,376 3,562 3,796 3,965 4,127 4,333 4,483

18 2,942 3,215 3,409 3,593 3,825 3,993 4,154 4,359 4,508

19 2,976, 3,246 3,439 3,622 3,852 4,019 4,179 4,383 4,532

20 3,008 3,276 3,467 3,649 3,878 4,044 4,203 4,406 4,554

21 3,038 3,304 3,494 3,675 3,902 4,067 4,226 4,428 4,575

22 3,067 3,331 3,519 3,699 3,925 4,089 4,247 4,448 4,595

23 3,094 3,356 3,543 3,722 3,947 4,110 4,268 4,468 4,614

24 3,120 3,380 3,566 3,744 3,968 4,130 4,287 4,486 4,632

25 3,144 3,403 3,588 3,765 3,988 4,149 4,305 4,504 4,649

tabelas 377

BIOESTATISTICA_VOL02.indb 377 25/06/12 17:24


BIOESTATISTICA_VOL02.indb 378 25/06/12 17:24
Tabela 12 - Valores crticos para o coeficiente de correlao de Spearman (rS) para postos

Bilateral: 0,50 0,20 0,10 0,05 0,02 0,01 0,005 0,002 0,001
n
a Unilateral: 0,25 0,10 0,05 0,025 0,01 0,005 0,0025 0,001 0,0005
4 0,600 1,000 1,000
5 0,500 0,800 0,900 1,000 1,000
6 0,371 0,657 0,829 0,886 0,943 1,000 1,000
7 0,321 0,571 0,714 0,786 0,893 0,929 0,964 1,000 1,000
8 0,310 0,524 0,643 0,738 0,833 0,881 0,905 0,952 0,976
9 0,267 0,483 0,600 0,700 0,783 0,833 0,867 0,917 0,933
10 0,248 0,455 0,564 0,648 0,745 0,794 0,830 0,879 0,903

11 0,236 0,427 0,536 0,618 0,709 0,755 0,800 0,845 0,873


12 0,217 0,406 0,503 0,587 0,678 0,727 0,769 0,818 0,846
13 0,209 0,385 0,484 0,560 0,648 0,703 0,747 0,791 0,824
14 0,200 0,367 0,464 0,538 0,626 0,679 0,723 0,771 0,802
15 0,189 0,354 0,446 0,521 0,604 0,654 0,700 0,750 0,779
16 0,182 0,341 0,429 0,503 0,582 0,635 0,679 0,729 0,762
17 0,176 0,328 0,414 0,485 0,566 0,615 0,662 0,713 0,748
18 0,170 0,317 0,401 0,472 0,550 0,600 0,643 0,695 0,728
19 0,165 0,309 0,391 0,460 0,535 0,584 0,628 0,677 0,712
20 0,161 0,299 0,380 0,447 0,520 0,570 0,612 0,662 0,696

21 0,J56 0,292 0,370 0,435 0,508 0,556 0,599 0,648 0,681


22 0,152 0,284 0,361 0,425 0,496 0,544 0,586 0,634 0,667
23 0,148 0,278 0,353 0,415 0,486 0,532 0,573 0,622 0,654
24 0,144 0,271 0,344 0,406 0,476 0,521 0,562 0,610 0,642
25 0,142 0,265 0,337 0,398 0,466 0,511 0,551 0,598 0,630
26 0,138 0,259 0,331 0,390 0,457 0,501 0,541 0,587 0,619
27 0,136 0,255 0,324 0,382 0,448 0,491 0,531 0,577 0,608
28 0,133 0,250 0,317 0,375 0,440 0,483 0,522 0,567 0,598
29 0,130 0,245 0,312 0,368 0,433 0,4 75 0,513 0,558 0,589
30 0,128 0,240 0,306 0,362 0,425 0,467 0,504 0,549 0,580

tabelas 379

BIOESTATISTICA_VOL02.indb 379 25/06/12 17:24


Tabela 12 - Valores crticos para o coeficiente de correlao de Spearman (rS) para postos
(continuao)

Bilateral: 0,50 0,20 0,10 0,05 0,02 0,01 0,005 0,002 0,001
n
a Unilateral: 0,25 0,10 0,05 0,025 0,01 0,005 0,0025 0,001 0,0005
31 0,126 0,236 0,301 0,356 0,418 0,459 0,496 0,541 0,571
32 0,124 0,232 0,296 0,350 0,412 0,452 0,489 0,533 0,563
33 0,121 0,229 0,291 0,345 0,405 0,446 0,482 0,525 0,554
34 0,120 0,225 0,287 0,340 0,399 0,439 0,475 0,517 0,547
35 0,118 0,222 0,283 0,335 0,394 0,433 0,468 0,510 0,539
36 0,116 0,219 0,279 0,330 0,388 0,427 0,462 0,504 0,533
37 0,114 0,216 0,275 0,325 0,383 0,421 0,456 0,497 0,526
38 0,113 0,212 0,271 0,321 0,378 0,415 0,450 0,491 0,519
39 0,111 0,210 0,267 0,317 0,373 0,410 0,444 0,485 0,513
40 0,110 0,207 0,264 0,313 0,368 0,405 0,439 0,479 0,507

41 0,108 0,204 0,261 0,309 0,364 0,400 0,433 0,473 0,501


42 0,1 07 0,202 0,257 0,305 0,359 0,395 0,428 0,468 0,495
43 0,105 0,199 0,254 0,301 0,355 0,391 0,423 0,463 0,490
44 0,104 0,197 0,251 0,298 0,351 0,386 0,419 0,458 0,484
45 0,103 0,194 0,248 0,294 0,347 0,382 0,414 0,453 0,479
46 0,102 0,192 0,246 0,291 0,343 0,378 0,410 0,448 0,474
47 0,101 0,190 0,243 0,288 0,340 0,374 0,405 0,443 0,469
48 0,100 0,188 0,240 0,285 0,336 0,370 0,401 0,439 0,465
49 0,098 0,186 0,238 0,282 0,333 0,366 0,397 0,434 0,460
50 0,097 0,184 0,235 0,279 0,329 0,363 0,393 0,430 0,456

51 0,096 0,182 0,233 0,276 0,326 0,359 0,390 0,426 0,451


52 0,095 0,180 0,231 0,274 0,323 0,356 0,386 0,422 0,447
53 0,095 0,179 0,228 0,271 0,320 0,352 0,382 0,418 0,443
54 0,094 0,177 0,226 0,268 0,317 0,349 0,379 0,414 0,439
55 0,093 0,175 0,224 0,266 0,314 0,346 0,375 0,411 0,435
56 0,092 0,174 0,222 0,264 0,311 0,343 0,372 0,407 0,432
57 0,091 0,172 0,220 0,261 0,308 0,340 0,369 0,404 0,428

380 Bioestatstica aplicada Pesquisa Experimental

BIOESTATISTICA_VOL02.indb 380 25/06/12 17:24


Tabela 12 - Valores crticos para o coeficiente de correlao de Spearman (rS) para postos
(continuao)

Bilateral: 0,50 0,20 0,10 0,05 0,02 0,01 0,005 0,002 0,001
n
a Unilateral: 0,25 0,10 0,05 0,025 0,01 0,005 0,0025 0,001 0,0005
58 0,090 0,171 0,218 0,259 0,306, 0,337 0,366 0,400 0,424
59 0,089 0,169 0,216 0,257 0,303 0,334 0,363 0,397 0,421
60 0,089 0,168 0,214 0,255 0,300 0,331 0,360 0,394 0,418

61 0,088 0,166 0,213 0,252 0,298 0,329 0,357 0,391 0,414


62 0,087 0,165 0,211 0,250 0,296 0,326 0,354 0,388 0,411
63 0,086 0,163 0,209 0,248 0,293 0,323 0,351 0,385 0,408
64 0,086 0,162 0,207 0,246 0,291 0,321 0,348 0,382 0,405
65 0,085 0,161 0,206 0,244 0,289 0,318 0,346 0,379 0,402
66 0,084 0,160 0,204 0,243 0,287 0,316 0,343 0,376 0,399
67 0,084 0,158 0,203 0,241 0,284 0,314 0,341 0,373 0,396
68 0,083 0,157 0,201 0,239 0,282 0,311 0,338 0,370 0,393
69 0,082 0,156 0,200 0,237 0,280 0,309 0,336 0,368 0,390
70 0,082 0,155 0,198 0,235 0,278 0,307 0,333 0,365 0,388

71 0,081 0,154 0,197 0,234 0,276 0,305 0,331 0,363 0,385


72 0,081 0,153 0,195 0,232 0,274 0,303 0,329 0,360 0,382
73 0,080 0,152 0,194 0,230 0,272 0,301 0,327 0,358 0,380
74 0,080 0,151 0,193 0,229 0,271 0,299 0,324 0,355 0,377
75 0,079 0,150 0,191 0,227 0,269 0,297 0,322 0,353 0,375
76 0,078 0,149 0,190 0,226 0,267 0,295 0,320 0,351 0,372
77 0,078 0,148 0,189 0,224 0,265 0,293 0,318 0,349 0,370
78 0,077 0,147 0,188 0,223 0,264 0,291 0,316 0,346 0,368
79 0,077 0,146 0,186 0,221 0,262 0,289 0,314 0,344 0,365
80 0,076 0,145 0,185 0,220 0,260 0,287 0,312 0,342 0,363

81 0,076 0,144 0,184 0,219 0,259 0,285 0,310 0,340 0,361


82 0,075 0,143 0,183 0,217 0,257 0,284 0,308 0,338 0,359
83 0,075 0,142 0,182 0,216 0,255 0,282 0,306 0,336 0,357

tabelas 381

BIOESTATISTICA_VOL02.indb 381 25/06/12 17:24


Tabela 12 - Valores crticos para o coeficiente de correlao de Spearman (rS) para postos
(continuao)

Bilateral: 0,50 0,20 0,10 0,05 0,02 0,01 0,005 0,002 0,001
n
a Unilateral: 0,25 0,10 0,05 0,025 0,01 0,005 0,0025 0,001 0,0005
84 0,074 0,141 0,181 0,215 0,254 0,280 0,305 0,334 0,355
85 0,074 0,140 0,180 0,213 0,252 0,279 0,303 0,332 0,353
86 0,074 0,139 0,179 0,212 0,251 0,277 0,301 0,330 0,351
87 0,073 0,139 0,177 0,211 0,250 0,276 0,299 0,328 0,349
88 0,073 0,138 0,176 0,210 0,248 0,274 0,298 0,327 0,347
89 0,072 0,137 0,175 0,209 0,247 0,272 0,296 0,325 0,345
90 0,072 0,136 0,174 0,207 0,245 0,271 0,294 0,323 0,343

91 0,072 0,135 0,173 0,206 0,244 0,269 0,293 0,321 0,341


92 0,071 0,135 0,173 0,205 0,243 0,268 0,291 0,319 0,339
93 0,071 0,134 0,172 0,204 0,241 0,267 0,290 0,318 0,338
94 0,070 0,133 0,171 0,203 0,240 0,265 0,288 0,316 0,336
95 0,070 0,133 0,170 0,202 0,239 0,264 0,287 0,314 0,334
96 0,070 0,132 0,169 0,201 0,238 0,262 0,285 0,313 0,332
97 0,069 0,131 0,168 0,200 0,236 0,261 0,284 0,311 0,331
98 0,069 0,130 0,167 0,199 0,235 0,260 0,282 0,310 0,329
99 0,068 0,130 0,166 0,198 0,234 0,258 0,281 0,308 0,327
100 0,068 0,129 0,165 0,197 0,233 0,257 0,279 0,307 0,326

382 Bioestatstica aplicada Pesquisa Experimental

BIOESTATISTICA_VOL02.indb 382 25/06/12 17:24


Tabela 13 - Valores crticos para a distribuio de Friedman ( r )
2

a b

(n) (M)* : 0,50 0,20 0,10 0,05 0,02 0,01 0,005 0,002 0,001

3 2 3,000 4,000

3 3 2,667 4,667 (6,000) 6,000

3 4 2,000 4,500 6,000 6,500 (8,000) (8,000) 8,000

3 5 2,800 3,600 5,200 6,400 (8,400) 8,400 (10,000) (10,000) 10,000

3 6 2,330 4,000 5,330 7,000 8,330 9,000 (10,330) 10,330 12,000

3 7 2,000 3,714 5,429 7,143 8,000 8,857 10,286 11,143 12,286

3 8 2,250 4,000 5,2S0 6,250 7,750 9,000 9,750 12,000 12,250

3 9 2,000 3,556 5,556 6,222 8,000 9,556 10,667 11,556 12,667

3 10 1,800 3,800 5,000 6,200 7,800 9,600 10,400 12,200 12,600

3 11 4,636 3,818 4,909 6,545 7,818 9,455 10,364 11,636 13,273

3 12 1,500 3,500 5,167 6,167 8,000 9,500 10,167 12,167 12,500

3 13 1,846 3,846 4,769 6,000 8,000 9,385 10,308 11,538 12,923

3 14 1,714 3,571 5,143 6,143 8,143 9,000 10,429 12,000 13,286

3 15 1,733 3,600 4,933 6,400 8,133 8,933 10,000 12,133 12,933

4 2 3,600 5,400 (6,000) 6,000

4 3 3,400 5,400 6,600 7,400 8,200 (9,000) (9,000) 9,000

4 4 3,000 4,800 6,300 7,800 8,400 9,600 (10,200) 10,200 11,1 00

4 5 3,000 5,160 6,360 7,800 9,240 9,960 10,920 11,640 12,600

4 6 3,000 4,800 6,400 7,600 9,400 10,200 11,400 12,200 12,800

4 7 2,829 4,886 6,429 7,800 9,343 10371 11,400 12,771 13,800

4 8 2,550 4,800 6,300 7,650 9,450 10,350 11,850 12,900 13,800

4 9 6,467 7,800 9,133 10,867 12,067 14,467

4 10 6,360 7,800 9,120 10,800 12,000 14,640

tabelas 383

BIOESTATISTICA_VOL02.indb 383 25/06/12 17:24


Tabela 13 - Valores crticos para a distribuio de Friedman ( r )
2

(continuao)

a b

(n) (M)* : 0,50 0,20 0,10 0,05 0,02 0,01 0,005 0,002 0,001

4 11 6,382 7,909 9,327 11,073 12,273 14,891

4 12 6,400 7,900 9,200 11,100 12,300 15,000

4 13 6,415 7,985 7,369 11,123 12,323 15,277

4 14 6,343 7,886 9,343 11,143 12,514 15,257

4 15 6,440 8,040 9,400 11,240 12,520 15,400

5 2 7,200 7,600 8,000 8,000

5 3 7,467 8,533 9,600 10,133 10,667 11,467

5 4 7,600 8,800 9,800 11,200 12,000 13,200

5 5 7,680 8,960 10,240 11,680 12,480 14,400

5 6 7,733 9,067 10,400 11,867 13,067 15,200

5 7 7,771 9,143 10,514 12,114 13,257 15,657

5 8 7,800 9,300 10,600 12,300 13,500 16,000

5 9 7,733 9,244 10,667 12,444 13,689 16,356

5 10 7,76 9,280 10,720 12,480 13,840 16,480

6 2 8,286 9,143 9,429 9,714 10,000

6 3 8,714 9,857 10,810 11,762 12,524 13,286

6 4 9,000 10,286 11,429 12,714 13,511 15,286

6 5 9,000 10,486 11,743 13,229 14,2S7 16,429

6 6 9,048 10,571 12,000 13,619 14,762 17,048

6 7 9,122 10,674 12,061 13,857 15,000 17,612

6 8 9,143 10,714 12,214 14,000 15,286 18,000

6 9 9,127 10,778 12,302 14,143 15,476 18,270

6 10 9,143 10,800 12,343 14,299 15,600 18,514

Para o coeficiente de concordncia de Kendall (W), grafadas entre parnteses

384 Bioestatstica aplicada Pesquisa Experimental

BIOESTATISTICA_VOL02.indb 384 25/06/12 17:24


Tabela 14 - Valores crticos para a distribuio de Kolmogorov-Smirnov (D)


n 0,20 0,10 0,05 0,02 0,01 n 0,20 0,10 0,05 0,02 0,01
1 0,900 0,95 0,975 0,990 0,995 21 0,226 0,259 0,287 0,321 0,344
2 0,684 0,776 0,842 0,900 0,929 22 0,221 0,253 0,281 0,314 0,337
3 0,565 0,636 0,708 0,785 0,829 23 0,216 0,247 0,275 0,307 0,330
4 0,493 0,565 0,624 0,689 0,734 24 0,212 0,242 0,269 0,301 0,323
5 0,447 0,509 0,563 0,627 0,669 25 0,208 0,238 0,264 0,295 0,317
6 0,410 0,468 0,519 0,577 0,617 26 0,204 0,233 0,259 0,290 0,311
7 0,381 0,436 0,483 0,538 0,576 27 0,200 0,229 0,254 0,284 0,305
8 0,358 0,410 0,454 0,407 0,542 28 0,197 0,225 0,250 0,279 0,300
9 0,339 0,387 0,430 0,480 0,513 29 0,193 0,221 0,246 0,275 0,295
10 0,323 0,369 0,409 0,457 0,489 30 0,190 0,218 0,242 0,270 0,290
11 0,308 0,352 0,391 0,437 0,468 31 0,187 0,214 0,238 0,266 0,285
12 0,296 0,338 0,375 0,419 0,449 32 0,184 0,211 0,234 0,262 0,181
13 0,285 0,325 0,361 0,404 0,432 33 0,182 0,208 0,231 0,258 0,277
14 0,275 0,314 0,349 0,390 0,418 34 0,179 0,205 0,227 0,254 0,273
15 0,266 0,304 0,338 0,377 0,404 35 0,177 0,202 0,224 0,251 0,269
16 0,258 0,295 0,327 0,366 0,392 36 0,174 0,199 0,221 0,247 0,265
17 0,250 0,286 0,318 0,355 0,381 37 0,172 0,196 0,218 0,244 0,262
18 0,244 0,279 0,309 0,346 0,371 38 0,170 0,194 0,215 0,241 0,258
19 0,237 0,271 0,301 0,337 0,361 39 0,168 0,191 0,213 0,238 0,255
20 0,232 0,265 0,294 0,329 0,352 40 0,165 0,189 0,210 0,235 0,252

- Os valores tabelados correspondem aos pontos Dn;, tais que: P(Dn Dn; ) = .
- Para n > 40, os valores crticos de Dn podem ser aproximados pelas seguintes expresses:


0,20 0,10 0,05 0,02 0,01

1,07 1,22 1,36 1,52 1,63


n n n n n

tabelas 385

BIOESTATISTICA_VOL02.indb 385 25/06/12 17:24


BIOESTATISTICA_VOL02.indb 386 25/06/12 17:24
Tabela 15.1 - Valores crticos para o teste de Durbin-Watson, com = 0,05

k=1 k=2 k=3 k=4 k=5


n
dL du dL du dL du dL du dL du

15 1,08 1,36 0,95 1,54 0,82 1,75 0,69 1,97 0,56 2,21

16 1,10 1,37 0,98 1,54 0,86 1,73 0,74 1,93 0,62 2,15

17 1,13 1,38 1,02 1,54 0,90 1,71 0,78 1,90 0,67 2,10

18 1,16 1,39 1,05 1,53 0,93 1,69 0,92 I,R7 0,71 2,06

19 1,18 1,40 1,08 1,53 0,97 1,68 0,86 1,85 0,75 2,02

20 1,20 1,41 1,10 1,54 1,00 1,68 0,90 1,83 0,79 1,99

21 1,22 1,42 1,13 1,54 1,03 1,67 0,93 1,81 0,83 1,96

22 1,24 1,43 l,l5 1,54 1,05 1,66 0,96 1,80 0,96 1,94

23 1,26 1,44 1,17 1,54 1,08 1,66 0,99 1,79 0,90 1,92

24 1,27 1,45 1,19 1,55 1,10 1,66 1,01 1,18 0,93 1,90

25 1,29 1,45 1,21 1,55 1,12 1,66 1,04 1,77 0,95 1,89

26 1,30 1,46 1,22 1,55 1,]4 1,65 1,06 1,76 0,98 1,88

27 1,32 1,47 1,24 1,56 1,16 1,65 1,08 1,16 1,01 t86

28 1,33 1,48 1,26 1,56 1,18 1,65 1,10 1,75 1,03 1,85

29 1,34 1,48 1,27 1,56 1,20 1,65 1,12 1,74 1,05 1,84

30 1,35 1,49 1,28 1,57 1,21 1,65 1,14 1,74 1,07 1,83

31 1,16 1,50 1,30 1,51 1,23 1,65 1,16 1,74 1,09 1,83

32 1,37 1,50 1,31 1,57 1,24 1,65 1,18 1,73 1,11 1,82

33 1,38 1,51 1,32 1,58 1,26 1,65 1,19 1,73 1,13 1,81

34 1,39 1,51 1,33 1,58 1,27 1,65 1,21 1,73 l,t5 1,81

35 1,40 1,52 1,34 1,58 1,28 1,65 1,22 1,73 1,16 1,80

36 1,41 1,52 1,35 1,59 1,29 1,65 1,24 1,73 1,18 1,80

37 1,42 1,53 1,36 1,59 1,31 1,66 1,25 1,72 1,19 1,80

38 1,43 1,54 1,37 1,59 1,32 1,66 1,26 1,72 1,21 1,79

39 1,43 1,54 1,38 1,60 1,33 1,66 1,27 1,72 1,22 1,79

40 1,44 1,54 1,39 1,60 1,34 1,66 1,29 1,72 1,23 1,79

tabelas 387

BIOESTATISTICA_VOL02.indb 387 25/06/12 17:24


Tabela 15.1 - Valores crticos para o teste de Durbin-Watson, com = 0,05
(continuao)

k=1 k=2 k=3 k=4 k=5


n
dL du dL du dL du dL du dL du

45 1,48 1,51 1,43 1,62 1,38 1,67 1,34 1,72 1,29 1,78

50 1,50 1,59 1,46 1,63 1,42 1,67 1,38 1,72 1,34 1,77

55 1,53 1,60 1,49 1,64 1,45 1,68 1,41 1,72 1,38 1,77

60 1,55 1,62 1,51 1,65 1,48 1,69 1,44 1,73 1,41 1,77

65 1,57 1,63 1,54 1,66 1,50 1,70 1,47 1,73 1,44 1,77

70 1,58 1,64 1,55 1,67 1,52 1,10 1,49 1,74 1,46 1,77

75 1,60 1,65 1,57 1,68 1,54 1,71 1,51 1,74 1,49 1,77

80 1,61 1,66 1,59 1,69 1,56 1,72 1,53 1,74 1,51 1,77

85 1,62 1,67 1,60 1,70 1,57 1,12 1,55 1,75 1,52 1,77

90 1,63 1,68 1,61 1,70 1,59 1,73 1,57 1,75 1,54 1,78

95 1,64 1,69 162 1,71 1,60 1,73 1,58 1,75 1,56 1,78

100 1,65 1,69 1,63 1,72 1,61 1,74 1,59 1,76 1,57 1,78

388 Bioestatstica aplicada Pesquisa Experimental

BIOESTATISTICA_VOL02.indb 388 25/06/12 17:24


Tabela 15.2 - Valores crticos para o teste de Durbin-Watson, com = 0,01

k=1 k=2 k=3 k=4 k=5


n
dL du dL du dL du dL, du dL du

15 0,81 1,07 0,70 1,25 0,59 1,46 0,49 1,70 0,39 1,96

16 0,84 1,09 0,74 1,25 0,63 1,44 0,53 l,66 0,44 1,90

17 0,87 1,10 0,77 1,25 0,67 1,43 0,57 1,30 0,48 1,85

18 0,90 1,12 0,80 1,26 0,71 1,42 0,61 1,60 0,52 1,80

19 0,93 1,13 0,83 1,26 0,74 1,41 0,65 1,58 0,56 1,77

20 0,95 1,15 0,86 1,27 0,77 1,41 0,68 1,57 0,60 1,74

21 0,97 1,16 0,89 1,27 0,80 1,41 0,72 1,55 0,63 1,71

22 1,00 1,17 0,91 1,28 0,83 1,40 0,75 1,54 0,66 1,69

23 1,02 1,19 0,94 1,29 0,86 1,40 0,77 1,53 0,70 1,67

24 1,04 1,20 0,96 1,30 0,88 1,41 0,80 1,53 0,72 1,66

25 1,05 1,21 0,98 1,30 0,90 1,41 0,83 1,52 0,75 1,65

26 1,07 1,22 1,00 1,31 0,93 1,41 0,85 1,52 0,78 1,64

27 1,09 1,23 1,02 1,32 0,95 1,41 0,88 1,51 0,81 1,63

28 1,10 1,24 1,04 1,32 0,97 1,41 0,90 1,51 0,83 1,62

29 1,12 1,25 1,05 1,33 0,99 1,42 0,92 1,51 0,85 1,61

30 1,13 1,26 1,07 1,34 1,01 1,42 0,94 1,51 0,88 1,61

31 1,15 1,27 1,08 1,34 1,02 1,42 0,96 1,51 0,90 1,60

32 1,16 1,28 1,10 1,35 1,04 1,43 0,98 1,51 0,92 1,60

33 1,17 1,29 1,11 1,36 1,05 1,43 1,00 1,51 0,94 1,59

34 1,18 1,30 1,13 1,36 1,07 1,43 1,01 1,51 0,95 1,59

35 l,19 1,31 1,14 1,27 1,08 1,44 1,03 1,51 0,97 1,59

36 1,21 1,32 1,15 1,38 1,10 1,44 1,04 1,51 0,99 1,59

37 1,22 1,32 1,16 1,38 1,11 1,45 1,06 1,51 1,00 1,59

38 1,23 1,33 1,18 1,39 1,12 1,45 1,07 1,52 1,02 1,58

39 1,24 1,34 1,19 1,39 1,14 1,45 1,09 1,52 1,03 1,58

40 1,25 1,34 1,20 1,40 1,15 1,46 l,l0 1,52 1,05 1,58

tabelas 389

BIOESTATISTICA_VOL02.indb 389 25/06/12 17:24


Tabela 15.2 - Valores crticos para o teste de Durbin-Watson, com = 0,01
(continuao)

k=1 k=2 k=3 k=4 k=5


n
dL du dL du dL du dL, du dL du

45 1,29 1,38 1,24 1,42 1,20 1,48 1,16 1,53 1,11 1,58

50 1,32 1,40 1,28 1,45 1,24 1,49 1,20 1,54 1,16 1,59

55 1,36 1,43 1,32 1,47 1,28 1,51 1,25 1,55 1,21 1,59

60 1,38 1,45 1,35 1,48 1,32 1,52 1,28 1,56 1,25 1,60

65 1,41 1,47 1,38 1,50 1,35 1,53 1,31 1,57 1,28 1,61

70 1,43 1,49 1,40 1,52 1,37 1,55 1,34 1,58 1,31 1,61

75 1,45 1,50 1,42 1,53 1,39 1,56 1,37 1,59 1,34 1,62

80 1,47 1,52 1,44 1,54 1,42 1,57 139 1,60 1,36 1,62

8S 1,48 1,53 1,46 1,55 1,43 1,58 1,41 1,60 1,39 1,63

90 1,50 1,54 1,47 1,56 1,45 1,59 1,43 1,61 1,41 1,64

95 1,51 155 1,49 1,57 1,47 1,60 1,45 1,62 1,42 1,64

100 1,52 1,56 1,50 1,58 1,48 1,60 1,46 1,63 1,44 1,65

390 Bioestatstica aplicada Pesquisa Experimental

BIOESTATISTICA_VOL02.indb 390 25/06/12 17:24


Tabela 16.1 - Valores dos coeficientes N-i+1 para o teste de normalidade W de Shapiro-Wilk

i N: 2 3 4 5 6 7 8 9 10

1 0,7071 0,7071 0,6872 0,6646 0,6431 0,6233 0,6052 0,5888 0,5739

2 0,0000 0,1677 0,2413 0,2806 0,3031 0,3164 0,3244 0,3291

3 0,0000 0,0875 0,1401 0,1743 0,1976 0,2141

4 0,0000 0,0561 0,0947 0,1224

5 0,0000 0,0399

i N: 11 12 13 14 15 16 17 18 19 20

1 0,5601 0,5475 0,5359 0,5251 0,5150 0,5056 0,4968 0,4886 0,4808 0,4734

2 0,3315 0,3325 0,3325 0,3318 0,3306 0,3290 0,3273 0,3253 0,3232 0,3211

3 0,2260 0,2347 0,2412 0,2460 0,2495 0,2521 0,2540 0,2553 0,2561 0,2565

4 0,1429 0,1586 0,1707 0,1802 0,1878 0,1939 0,1988 0,2027 0,2059 0,2085

5 0,0695 0,0922 0,1099 0,1240 0,1353 0,1447 0,1524 0,1587 0,1641 0,1686

6 0,0000 0,0303 0,0539 0,0727 0,0880 0,1005 0,1109 0,1197 0,1271 0,1334

7 0,0000 0,0240 0,0433 0,0593 0,0725 0,0837 0,0932 0,1013

8 0,0000 0,0196 0,0359 0,0496 0,0612 0,0711

9 0,0000 0,0163 0,0303 0,0422

10 0,0000 0,0140

tabelas 391

BIOESTATISTICA_VOL02.indb 391 25/06/12 17:24


BIOESTATISTICA_VOL02.indb 392 25/06/12 17:24
Tabela 16.2 Valores crticos da estatstica W de Shapiro-Wilk

Nvel de significncia
N
0,01 0,02 0,05 0,10 0,50 0,90 0,95 0,98 0,99
3 0,753 0,756 0,767 0,789 0,959 0,998 0,999 1,000 1,000
4 0,0687 0,707 0,748 0,792 0,935 0,987 0,992 0,996 0,997
5 0,686 0,715 0,762 0,806 0,927 0,979 0,986 0,991 0,993

6 0,713 0,743 0,788 0,826 0,927 0,974 0,981 0,986 0,989


7 0,730 0,760 0,803 0,838 0,928 0,972 0,979 0,985 0,988
8 0,749 0,778 0,818 0,851 0.932 0,972 0,978 0,984 0,987
9 0,764 0,791 0,829 0,859 0,935 0,972 0,978 0,984 0,986
10 0,781 0,806 0,842 0,869 0,938 0,972 0,978 0,983 0,986

11 0,792 0,817 0,850 0,876 0,940 0,973 0,979 0,984 0,986


12 0,805 0,828 0,859 0,883 0,943 0,973 0,979 0,984 0,986
13 0,814 0,837 0,866 0,889 0,945 0,974 0,979 0,984 0,986
14 0,825 0,846 0,874 0,895 0,947 0,975 0,980 0,984 0,986
15 0,835 0,855 0,881 0,901 0,950 0,975 0,980 0,984 0,987

16 0,844 0,863 0,887 0,906 0,952 0,976 0,981 0,985 0,987


17 0,851 0,869 0,892 0,910 0,954 0,977 0,981 0,985 0,987
18 0,858 0,874 0,897 0,914 0,956 0,978 0,982 0,986 0,988
19 0,863 0,879 0,901 0,917 0,957 0,978 0,982 0,986 0,988
20 0,868 0,884 0,905 0,920 0,959 0,979 0,983 0,986 0,988

21 0,873 0,888 0,908 0,923 0,960 0,980 0,983 0,987 0,989


22 0,878 0,892 0,911 0,926 0,961 0,980 0.984 0,987 0,989
23 0,881 0,895 0,914 0,928 0,962 0,981 0,984 0,987 0,989
24 0,884 0,898 0,916 0,930 0,963 0,981 0,984 0,987 0,989
25 0,888 0,901 0,918 0,931 0,964 0,981 0,985 0,988 0,989

26 0,891 0,904 0,920 0,933 0,965 0,982 0,985 0,988 0,989


27 0,894 0,906 0,923 0,935 0,965 0,982 0,985 0,988 0,990
28 0,996 0,908 0,924 0,936 0,966 0,982 0,985 0,988 0,990
29 0,898 0,910 0,926 0,937 0,966 0,982 0,985 0,988 0,990
30 0,900 0,912 0,927 0,939 0,967 0,983 0,985 0,988 0,900

tabelas 393

BIOESTATISTICA_VOL02.indb 393 25/06/12 17:24


BIOESTATISTICA_VOL02.indb 394 25/06/12 17:24
Tabela 17 - Nmeros aleatrios

14835 07362 26733 66337 20020 46848 24360 67813 17531 96160
84156 22328 08704 06439 64789 19606 74597 42899 36235 91089
07439 84935 67799 78493 03976 72783 31131 60452 23680 88212
60562 06499 56274 89528 77248 82823 29149 02415 46849 34372
92554 02182 58212 23811 74399 01856 50828 05868 60178 36120
57154 33430 44547 19479 28029 98735 02523 07352 26115 05784
33592 35545 09878 39291 05498 20618 13325 88848 05151 10298
63113 59196 90890 52945 95027 82655 76150 00102 23247 38135
53456 15261 00582 37612 11971 92844 44112 48161 15426 26704
89202 77388 51468 91049 19894 02188 13318 22280 34959 55245
88891 23578 84958 96820 99600 94748 42738 57576 79063 07765
84885 80345 96016 01251 09348 28560 11147 01657 00755 43642
38697 69389 98345 73048 29507 18526 67736 56657 49748 02160
39871 02677 13729 60302 49365 36310 29226 52028 93731 58365
33006 74668 41831 49768 95000 21495 32144 09647 64404 36257
07154 82834 40799 10422 81214 26325 65495 48346 27304 76266
31432 17859 22968 94194 06884 34888 65166 25467 35774 61056
56960 26638 36632 91651 29180 98155 01805 51464 49138 05710
02355 56388 09067 75695 25493 97169 22686 21475 31110 53045
82103 63195 65527 66243 96807 69165 95289 62930 66343 83711
50825 82955 24147 75012 20103 60267 04051 11654 81456 02920
03628 55427 72771 11270 13391 42267 25646 96957 39640 34334
15891 95262 89450 10087 92371 99885 94941 46284 77397 40100
50811 44401 92573 84821 49314 34342 01290 91163 37248 35041
59943 24172 16959 76008 04121 99199 55271 38518 07155 97528
45342 34103 48817 53536 03630 80439 17091 77911 87900 91034
74881 27536 54074 82623 64322 32241 66784 14590 17966 72187
77329 75480 19058 91100 21175 87860 98479 87996 39068 14348
35196 84012 03780 47762 94498 89812 71238 54070 43360 61395
84371 38352 85742 01610 41863 59977 58513 79876 87152 50249
22980 08123 98993 35609 45406 57914 96884 23851 65979 03903
58486 17927 91107 83002 90223 04731 88063 95720 91892 01246
61376 95034 53865 29670 13302 67790 92887 69725 98265 90459
23756 35575 07730 38317 40512 95941 66943 68526 24235 38609
04044 43464 90762 94781 68427 50021 82905 33939 41037 54417
60047 50681 64384 42320 46016 51491 23656 55597 47347 18863
83531 86235 40884 45400 96397 37285 06290 04315 05773 18621
06544 92307 69731 53410 63161 31227 10973 87011 59483 09370
49791 25181 29805 45135 94955 77642 45637 28200 77295 40800
21295 61442 44858 73413 19594 59741 39278 78953 24769 77854

tabelas 395

BIOESTATISTICA_VOL02.indb 395 25/06/12 17:24


BIOESTATISTICA_VOL02.indb 396 25/06/12 17:24
Referncias Bibliogrficas

ADES, A. E.; HIGGINS. J. P. T. The Interpretation of Random-Effects Meta-Analysis in


Decision Models. Medical Decision Making, v. 12, p. 646-654, 2005.
ARMITAGE, P.; BERRY, G. The planning statistical investigations. In: ______ Statistical
methods in medical research. 2. ed. Oxford, Blackwell, 1987.
ASSOCIAO BRASILEIRA DE NORMAS TCNICAS. NBR 10520: informao e docu-
mentao: apresentao de citaes em documentos. Rio de Janeiro, 2002.
BANERJEE, M. et al. Beyond Kappa: A Review of Interrater Agreement Measures
The Canadian Journal of Statistics, vol. 27, n. 1, p. 3-23, 1999.
BEGHETTO, M. G.; ASSIS, M. C. S; LUFT, V.C.; Mello, E. D. Preciso e acurcia na afe-
rio do peso corporal em adultos hospitalizados. Rev Assoc Med Bras, v. 52,
n. 1, p. 23-7, 2006.
BEIGUELMAN, B. Curso prtico de bioestatstica. 5. ed. Ribeiro Preto: FUNPEC-
Editora, 2002.
BLAND, J. M.; ALTMAN, D. G. Measurement error and correlation coefficients. BMJ,
v. 313, p. 41-2, 1996.
BLAND, J. M.; ALTMAN, D. G. Measuring agreement in method comparison studies.
Statistical Methods in Medical Research. Stat Methods Med Res, v. 8, n. 2,
p.135-60, 1999.
BLAND, J. M.; ALTMAN, D. G. Statistical method for assessing agreement between two
methods of clinical measurement. The Lancet, v. 1, n. 8476, p. 307-10, 1986.

BIOESTATISTICA_VOL02.indb 397 25/06/12 17:24


BUSSAB, W. O.; MORETTIN, P. Estatstica bsica. 4 ed. So Paulo, Atual, 1987.
BUSTAMENTE-TEIXEIRA, M. T.; FAERSTEIN, E. LATORRE, M. R. Tcnicas de anlise
de sobrevida. Cadernos de Sade Publica, Rio de Janeiro, v. 18, n. 3, p. 579-
594, 2002.
CALLEGARI-JACQUES, S. Bioestatstica - princpios e aplicaes. 1 ed. Porto Alegre:
Artmed Editora, 2003.
CHOEN, J. A coefficient of agreement for nominal scales. Educ Psychol Meas, v. 20,
p. 37-46, 1960.
DAWSON, B.; TRAPP, R. G. Bioestatstica bsica e clnica. 3 ed. Rio de Janeiro, RJ:
McGraw-Hill Interamericana do Brasil Ltda., 2003.
DERSIMONIAN, R.; LAIRD, N. Meta-analysis in Clinical Trials. Controlled Clinical
Trials, v. 7, p. 177-188, 1986.
DOWNING, D.; CLARK, J. Estatstica Aplicada. 1 ed. So Paulo, SP: Editora Saraiva,
2000.
DUPONT, W. D. Power and sample size calculations. Controlled Clinical Trials, v. 11,
p. 116-128, 1990.
FERREIRA, A.B.H. Novo Dicionrio Aurlio em CD-ROM. Verso 5.0. Curitiba, PR:
Editora Positivo, 2005
FLEISS, J. L. Statistical methods for rates and proportions. New York: John Wiley,
1981. p. 212-236.
FLEISS, J. L.; COHEN, J. The equivalence of weighted kappa and the intraclass cor-
relation coefficient as measures of reliability. Educational and Psychological
Measurement, v. 33, p. 613619, 1973.
FLEISS, J. L.; GROSS, A. J. Meta-analysis in epidemiology, with special reference to
studies of the association between exposure to environmental tobacco smoke
and lung cancer: A critique. J Clin Epidemiol, v. 44, p. 127-39, 1991.
FLETCHER, R. H.; FLETCHER S. W.; WAGNER E. H. Epidemiologia Clnica: Elementos
Essenciais. 3 ed. Porto Alegre, RS: Artes Mdicas, 1996.
FLETCHER, R. H.; FLETCHER S. W.; WAGNER, E. H. Epidemiologia Clnica: Bases
Cientficas da Conduta Mdica. 1 ed. Porto Alegre: Artes Mdicas, 1989.
GAVAGHAN, D. J.; MOORE, A. R.; MCQAY, H. J. An evaluation of homogeneity tests in
meta-analysis in pain using simulations of patient data. Pain, v. 85, p. 415-24,
2000.

398 Bioestatstica aplicada Pesquisa Experimental

BIOESTATISTICA_VOL02.indb 398 25/06/12 17:24


GREENLAND, S. A simple method to calculate the confidence interval of a stan-
dardized mortality ratio. American Journal of Epidemiology, v. 133, n. 2, p.
212-213, 1990.
GREENLAND, S.; ROBINS, J. M. Estimation of common effect parameter from sparse
follow up data. Biometrics, v. 41, p. 55-68, 1985.
GREENLAND, S.; SALVAN, A. Bias in the one-step method for pooling study results.
Statistics in Medicine, v. 9, p. 247-252, 1990.
HEDGES, L. V.; PIGOTT, T. D. The power of statistical tests in meta-analysis,
Psychological Methods, v. 6, p. 203-217, 2001.
HIGGINS, J. P. T.; THOMPSON, S. G. Quantifying heterogeneity in a meta-analysis.
Statistics in Medicine, v. 21, p. 1539-1558, 2002.
HIGGINS, J. P. T.; THOMPSON, S. G.; DEEKS, J. J.; et al. Measuring inconsistency in
meta-analyses. British Medical Journal, v. 327, p. 557-560, 2003.
HOUWELINGEN, H. C. V.; ARENDS, L. R.; STIJNEN, T. Advanced methods in meta-
-analysis: multivariate approach and meta-regression. Stat Med, v. 21, p.
589-624, 2002.
HULLEY, S. B.; CUMMINGS, S. R.; BROWNER, W. S. et al. Delineando a pesquisa cl-
nica uma abordagem epidemiolgica. 2 ed. Porto Alegre, RS: Artmed Editora,
2001.
IBGE: Normas de apresentao tabular. 3. ed. Rio de Janeiro, 1993.
JEKEL, J. F.; ELMORE, J. G.; KATZ, D. L. Epidemiologia, Bioestatstica e medicina pre-
ventiva. 2 ed. Porto Alegre, RS: Artmed: Editora, 2004.
KAPLAN, E. L.; MEIER, P. Non parametric estimation from incomplete observation.
Journal of the American Statistics Association, v. 53, p. 457-481, 1958.
KIRKWOOD, B. R. Essentials of medical statistics. Oxford: Blackwell, 1988.
LACATOS, E. M.; MARCONE, M. A. Metodologia Cientfica. 2 ed. So Paulo: Atlas,
1991.
LEMESHOW, S.; HOSMER, DAVID. Adequacy of sample size in health studies.
Chichester, John Wiley, 1990.
LEVY, P.; LEMESHOW, S. Sampling for health professionals. Belmont, LLP, 1980.
LEWIS, S.; CLARKE, M. Forest plots: trying to see the wood and the trees. BMJ, v.
322, p.1479-80, 2001.
LOVATTO, P.A. et al. Meta-anlise em pesquisas cientficas: enfoque em metodolo-
gias. R Bras Zootec, v. 36, supl. 2008, p. 285-294, 2007.

tamanho da amostra e randomizao 399

BIOESTATISTICA_VOL02.indb 399 25/06/12 17:24


LWANGA, S. K.; LEMESHOW, S. Sample size determination in health studies: a prac-
tical manual. Geneva, World Health Organization, 1991.
MARCANTONIO, A. T.; SANTOS, M. M.; LEHFELD, N. A. Elaborao e divulgao do
trabalho cientfico. So Paulo: Atlas, 1993.
MEDRONHO, R. A.; CARVALHO, D. M.; BLOCH, K. V.; LUIZ, R. R. et al. Epidemiologia.
1 ed. So Paulo, SP: Editora Atheneu, 2005.
MOTTA, V. T.; WAGNER, M. B. Bioestatstica. 1 ed. Caxias do Sul, RG: Robe Editorial,
2003.
NETER, J.; WASSERMAN, W.; KUTNER, M. H. Planning sample sizes, nonprametric
tests, and random ANOVA model. In: _____ Applied linear statistical models:
regression, analysis of variance and experimental designs. 3. ed. Boston,
Irwin, 1990. p. 633-42.
NETO, B. B.; SCARMINO, I. S.; BRUNS, R. E. Como fazer experimento. 2 ed. Campinas
, So Paulo: Editora da Unicamp, 2002.
NETO, B. B.; SCARMINO, I. S.; BRUNS, R. E. Como fazer experimento. 3 ed. Campinas
, So Paulo: Editora da Unicamp, 2007.
OLIVEIRA, S. L. Tratado de metodologia cientfica: Projetos de pesquisas, TGI, TCC,
monografias, dissertaes e teses. So Paulo: Pioneira, 1997.
PEREIRA, M. G. Epidemiologia, Teoria e Prtica. 1 ed. Rio de Janeiro, RJ: Guanabara
Koogan, 1995.
RODRIGUES, M. I.; IEMMA, A. F. Planejamento de experimentos e otimizao de pro-
cessos. 1 ed. Campinas, So Paulo: Casa do Po Editora, 2005.
ROTHMAN, K. J. Modern Epidemiology. Boston, Little Brown, 1986. p.23-34.
SACKETT, D. L. Bias in analytic research. J Chron Dis, v. 32, p. 51-63, 1979.
SEVERINO, A. J. Metodologia do trabalho cientfico. 20 ed. So Paulo: Cortez, 1996.
SIEGEL, S. Estatstica No Paramtrica. So Paulo: 1 ed. Editora McGraw-Hill do
Brasil Ltda., 1975.
SIEGEL, S.; CASTELLAN, N. Nonparametric Statistics for the Behavioral Sciences. 2.
ed. New York: McGraw-Hill, 1988. p. 284-285.
SILVA, C. R. O. Metodologia e organizao do projeto de pesquisa. 1 ed. Fortaleza,
CE: Centro Federal de Educao Tecnolgica do Cear, 2004.
SILVA, E. L.; MENEZES, E. M. Metodologia da pesquisa e elaborao de dissertao. 3
ed. Florianpolis, SC: Universidade Federal de Santa Catarina, 2001.

400 Bioestatstica aplicada Pesquisa Experimental

BIOESTATISTICA_VOL02.indb 400 25/06/12 17:24


SIM, J.; WRIGHT, C. C. The Kappa Statistic in Reliability Studies: Use, Interpretation,
and Sample Size Requirements. Physical Therapy, v. 85, p. 257-268, 2005.
SNEDECOR, G. W.; COCHRAN, W. G. Statistical methods. 6th ed. Iowa: Iowa State
University Press, 1967. 505 p.
STEEL, R. G. D, TORRIE, J. H. Principles and procedures of statistics. 2nd ed. New
York: Mc Graw-Hill, 1980. 633 p.
STEVENSON, W. J. Estatstica Aplicada Administrao.1 ed. So Paulo, SP: Editora
Harper & Row do Brasil Ltda., 1981.
TRIOLA, M. F. Introduo Estatstica. 7 ed. Rio de Janeiro, RJ: Livros Tcnicos e
Cientficos Editora S.A., 1999.
VELSQUEZ-MELNDEZ, G.; PIMENTA, A. M.; KAC G. Epidemiologia do sobrepeso
e da obesidade e seus fatores determinantes em Belo Horizonte (MG), Brasil:
estudo transversal de base populacional. Rev Panam Salud Publica, v. 16, n. 5,
p. 308-14, 2004.
VIEIRA, S. Metodologia cientfica para a rea de sade. So Paulo, Sarvier, 1984. p.
77-82.

tamanho da amostra e randomizao 401

BIOESTATISTICA_VOL02.indb 401 25/06/12 17:24


402 Bioestatstica aplicada Pesquisa Experimental

BIOESTATISTICA_VOL02.indb 402 25/06/12 17:24


ndice Remissivo

A do qui-quadrado 497
Acurcia 558 do resduo ajustado 504
Ajuste do modelo de regresso 703 do resduo padronizado 503
Aleatoriedade 469 dos efeitos dos fatores 702
Anlise dos indicadores da correlao mltipla
da regresso 472 652
de resduos 472 Codificao dummy 651, 661
de resduos padronizados 503 Coeficiente
de sobrevida 671 angular 463
de varincia 704 de correlao 472
de varincia no-paramtrica 635 de correlao de Pearson 454
do quadro vital 673 de correlao de Spearman 587
multivariada 601 de correlao mltipla 652
ANOVA de correlao produto-momento 454
de dois critrios 613 de determinao 460
de mltiplos critrios 629 de determinao mltipla 653
de um critrio 613 de determinao mltipla ajustado 653
Aplicao da regresso linear simples 471 de regresso 654
B kappa 593
Base da ANOVA 611 linear 650
Bases conceituais da estatstica multivariada Combinao de mltiplos testes
602 diagnsticos 563
Behrens-Fisher 439 Condio
Bloco 614 de normalidade 468
C Condies para o uso da regresso linear
Clculo 468
da razo de chance combinada 689 Contrabalano 551, 552
da razo de risco 685 Correo
das contagens esperadas 496 de continuidade 508
das percentagens 497 de Welch-Satterthwaite 436
do coeficiente de regresso de Yates 508
padronizado 654 Covarincia 454
do erro de estimao 430 Curva

ndice Remissivo 403

BIOESTATISTICA_VOL02.indb 403 25/06/12 17:24


de sobrevida 676 mutuamente excludentes 528
ROC 554 no-independentes 530
D Experimento 527
Determinao fatorial completo 710
da reta de regresso 463 fatorial incompleto 693
do coeficiente de spearman 588 fatorial no Minitab 709
do intervalo de confiana para a mdia Experimentos Fatoriais 691
de amostras pareadas 446 F
do intervalo de confiana para a mdia Frmula
populacional 429 para calcular o teste t pareado 443
Diagrama para calcular o valor t 431
de disperso 451, 452 H
de pontos 452 Homocedasticidade 469
Diferena de risco 538 I
Distribuio Indicadores de um teste diagnstico 548
Qui-Quadrado 489 Interao entre fatores 694
t DE STUDENT 423 Interpretao do valor r 455
E Intervalo de confiana para a mdia 625
Efeito L
principal de um fator 698 Linearidade 469
simples de um fator 697 Linha
Ensaio 527 de melhor ajuste 461
Ensaio probabilstico 525 de regresso 461
Equao de regresso 461470 M
Erro Matriz de correlao 652
falso-negativo 545 Medidas de Associao 530
falso-positivo 549 Mtodo
padro estimado 424 Atuarial 673
verdadeiro-negativo 545 de Kaplan-Meier 677
verdadeiro-positivo 545 de mnimos quadrados 462
Erro experimental 614 produto-limite de Kaplan-Meier 677
Escolha do teste estatstico 605 Modelo
Espao amostral 528 de regresso logstica mltipla 665
Especificidade 548 de regresso logstica simples 662
combinada 565 de regresso mltipla escalonada 655
Estatstica linear geral 604
do qui-quadrado de Mantel-Haenszel O
673 Objetivos da Estatstica Multivariada 604
Durbin-Watson 653 Odds ratio 535
t 653 One way ANOVA 613
estimativa conjunta das varincias 432 Operaes com probabilidades 528
Estratgia de modelagem reduzida 667 P
Evento 527 Ponto de corte 551
Eventos Porcentagem
independentes 529 de Risco Atribuvel 539

404 Bioestatstica aplicada Pesquisa Experimental

BIOESTATISTICA_VOL02.indb 404 25/06/12 17:24


de Risco Atribuvel na Populao 540 Combinada 565
Prevalncia 558 Sinal da correlao 456
Probabilidade Superfcie de resposta no Minitab 727
acumulada de sobrevida 674 T
anterior 530 Tabela de anlise de varincia 617
ps-teste 560 Tabelas de contingncia 490
pr-teste 558, 560 de dupla entrada 490
Problema de Behrens-Fisher 439 Taxa de erro
Propriedades da distribuio t de student falso-negativo 548
427 falso-positivo 549
R Teorema de Bayes 570
Razo Teoria da probabilidade 525
crtica 436 Termo de erro 603
de chances 536 Teste
de Probabilidade Negativa 562 ANOVA 611
de Probabilidade Positiva 562 de Bonferroni 628
de probabilidades 561 de Cochran para varincias iguais 438
de risco 685 de concordncia Kappa 593
de verossimilhana 561 de Dunn 641
Regra de Friedman 644
da adio 528 de hiptese para a regresso linear 466
da multiplicao 529 de hiptese para correlao 458
Regresso de hiptese para o coeficiente de
em direo mdia 461 spearman 591
escalonada 655 de homogeneidade 435
linear mltipla 649 de homogeneidade para duas varincias
linear simples 461476 435
logstica mltipla 661 de Kolmogorov-Smirnov 478
logstica simples 661 de Kruskal-Wallis 635
mltipla 649 de Shapiro-Wilk 482
para varivel categrica 670 de Student-Newman-Keuls 626
Relao entre sensibilidade e especificidade do logrank 681
550 do qui-quadrado 495
Repetio 614 do qui-quadrado da homogeneidade
Requisitos 498
para usar o teste do qui-quadrado 511 do qui-quadrado da independncia 498
para uso da ANOVA 616 do qui-quadrado de aderncia 498
resduos 462, 469 do qui-quadrado de McNemar 489
reta de regresso 463 exato de fisher 520
Risco Atribuvel 538 f 611
na Populao 540 f para varincias iguais 436
risk ratio 533 padro-ouro 546
S paramtrico versus no-paramtrico
Screening test 544 596
Sensibilidade 548 Q 641

ndice Remissivo 405

BIOESTATISTICA_VOL02.indb 405 25/06/12 17:24


t de Student 423
t de Wilcoxon 582
t para amostras independentes com
varincias desiguais 439
t para amostras independentes com
varincias iguais 433
t para amostras pareadas 442
t pareado 442
Tukey 620
U de Wilcoxon-Mann-Whitney 576
Testes
de aderncia 477
de bondade de ajuste 478
de comparaes mltiplas 620
de rastreamento diagnstico 543
de significncia estatstica 681
em paralelo 565
em srie 567
para variveis ordinais 575
Tipos de ANOVA 613
Tratamento 614
Two way ANOVA 616
V
Valor
crtico da distribuio 436
preditivo Negativo 559
preditivo Positivo 559
r 455
Valores preditivos 559
Varincia
dentro dos grupos 611
entre grupos 611
mdia dentro dos grupos 614
residual 614
total 611
W
Welch-Satterthwaite 436

406 Bioestatstica aplicada Pesquisa Experimental

BIOESTATISTICA_VOL02.indb 406 25/06/12 17:24


BIOESTATISTICA_VOL02.indb 407 25/06/12 17:24
BIOESTATISTICA_VOL02.indb 408 25/06/12 17:24

Vous aimerez peut-être aussi