Vous êtes sur la page 1sur 50

APOSTILA DE BIOESTATSTICA BSICA

PARTE 2

Professores: Profa. Lugya A. Henriques Knop Prof. Ricardo Lima Shintcovsk

2009

APOSTILA DISCIPLINA BIOESTATSTICA BSICA PARTE 2 INTRODUO Nesta segunda parte da apostila, sero estudados

probabilidades, Bioestatstica Indutiva e testes estatsticos.

2. PROBABILIDADES
Embora o clculo das probabilidades pertena ao campo da Matemtica, sua incluso nesta apostila se justifica pelo fato de a maioria dos fenmenos de que trata a Estatstica ser de natureza aleatria ou probabilstica. Conseqentemente, o conhecimento dos aspectos fundamentais do clculo de probabilidades uma necessidade essencial para o estudo da Estatstica Indutiva ou Inferencial. Procuramos resumir aqui os conhecimentos que julgamos necessrios para termos um ponto de apoio em nossos primeiros passos no caminho da Estatstica Inferencial.

2.1.1. EXPERIMENTO ALEATRIO Em quase tudo, em maior ou menor grau, vislumbramos o acaso. Assim, da afirmao provvel que o meu time ganhe a partida de hoje pode resultar: a). que, apesar do favoritismo, ele perca; b) que, como pensamos, ele ganhe; c) que empate. Como vimos, o resultado final depende do acaso. Fenmenos como esse, so chamados fenmenos aleatrios ou experimentos aleatrios. Experimentos ou fenmenos aleatrios so aqueles que, mesmo repetidos vrias vezes sob condies semelhantes, apresentam resultados imprevisveis.

2.1.2. ESPAO AMOSTRAL A cada experimento correspondem, em geral,vrios resultados

possveis. Assim, ao lanarmos uma moeda, h dois resultados possveis: ocorrer cara ou ocorrer coroa. J ao lanarmos um dado h seis resultados possveis: 1, 2, 3, 4, 5 ou 6. Ao conjunto desses resultados possveis damos o nome de espao amostral ou conjunto universo, representado por S. Os dois experimentos citados anteriormente tm os seguintes espaos amostrais: Lanamento de uma moeda: S = (Ca, Co); Lanamento de um dado: S = (1, 2, 3, 4, 5, 6). Do mesmo modo, como em dois lanamentos sucessivos de uma moeda podemos obter cara nos dois lanamentos, ou cara no primeiro e coroa no segundo, ou coroa no primeiro e cara no segundo, ou coroa nos dois lanamentos, o espao amostral : S = {(Ca, Ca), (Ca, Co), (Co, Ca), (Co, Co)}. Cada um dos elementos de S que corresponde a um resultado recebe o nome de ponto amostral. Assim:

2 S 2 um ponto amostral de S.

2.1.3. EVENTOS Chamamos de evento qualquer subconjunto do espao amostral S de um experimento aleatrio. Assim, qualquer que seja E, se E S (E est contido em S), ento E um evento de S. Se E = S, E chamado evento certo. Se E S e E um conjunto unitrio, E chamado evento elementar. Se E = , E chamado evento impossvel. No lanamento de um dado, onde S = {1, 2, 3, 4, 5, 6}, temos:

A = (2, 4, 6) S; logo, A um evento de S. B = { l, 2, 3, 4, 5, 6} S; logo, B um evento certo de S (B = S). C = {4} S; logo, C um evento elementar de S. D = S; logo, D um evento impossvel de S. Um evento sempre definido por uma sentena. Assim, os eventos acima podem ser definidos pelas sentenas: Obter um nmero par na face superior. Obter um nmero menor ou igual a 6 na face superior. Obter o nmero 4 na face superior. Obter um nmero maior que 6 na face superior.

2.2. PROBABILIDADES As decises nos negcios so freqentemente baseados na anlise de incertezas tais como as seguintes: a) Quais so as chances de as vendas decrescerem se aumentarmos os preos? b) Qual a plausibilidade de um novo mtodo de montagem aumentar a produtividade? c) Qual a probabilidade de o projeto terminar no prazo? d) Quais so as chances de um novo investimento ser lucrativo? A probabilidade uma medida numrica da plausibilidade de que um evento ocorrer. Assim, as probabilidades podem ser usadas como medidas do grau de incerteza associado aos quatro eventos previamente listados. Se as probabilidades estiverem disponveis, poderemos determinar a plausibilidade de cada evento ocorrer. Os valores da probabilidade so sempre atribudos numa escala de 0 a 1. A probabilidade prxima de zero indica um evento improvvel de ocorrer; uma probabilidade prxima de 1 indica um evento quase certo.

2.2.1. DEFINIO CLSSICA OU A PRIORI Se um evento pode ocorrer de h maneiras diferentes, em um total de n maneiras possveis (todas igualmente provveis), ento a probabilidade do evento h/n. Suponha-se que desejemos determinar a probabilidade do aparecimento de 1 cara em uma jogada de uma moeda. Como h dois resultados igualmente provveis, a saber, cara e coroa (admite-se que a moeda no se detenha sobre seu bordo), e como s h uma maneira de aparecer cara, dizemos que a probabilidade do evento cara na jogada de uma moeda . Naturalmente, para que tal concluso seja vlida, preciso que a moeda seja honesta, ou no-viciada. Dado um experimento aleatrio, sendo S o seu espao amostral, vamos admitir que todos os elementos de S tenham a mesma chance de acontecer, ou seja, que S um conjunto equiprovvel. Chamamos de probabilidade de um evento A (A S) o nmero real P(A), tal que:

onde: n(A) o nmero de elementos de A; n(S) o nmero de elementos de S.

Exemplos: Considerando o lanamento de uma moeda e o evento A obter cara, temos:

Logo: O resultado acima nos permite afirmar que, ao lanarmos uma moeda equilibrada, temos 50% de chance de que aparea cara na face superior.

Considerando o lanamento de um dado, vamos calcular: - a probabilidade do evento A obter um nmero par na face superior. Temos:

- a probabilidade do evento B obter um nmero menor ou igual a 6 na face superior. Temos:

- a probabilidade do evento C obter um nmero 4 na face superior. Temos:

- a probabilidade do evento D obter um nmero maior que 6 na face superior. Temos:

Considerando o jogo de cartas (52 cartas): Um baralho de 52 cartas tem quatro naipes: copas, espadas, paus, ouros. Cada naipe tem 13 cartas sendo trs figuras. Doze figuras no total. Veja a figura abaixo.

- a probabilidade do evento C(sair uma figura na retirada de uma carta)

Temos:

Considerando um jogo de futebol ou basquetebol ou handebol: Qualquer um desses jogos acima tem trs resultados possveis: S = {Vencer, perder, empatar}.

- a probabilidade de um time vencer : S = {Vencer, perder, empatar}. D = {Vencer} Temos:

Pelos exemplos que acabamos de ver, podemos concluir que, sendo n(S) = n: a) a probabilidade do evento certo igual a l: P(S) = 1 b) a probabilidade do evento impossvel igual a zero: P() = 0 c) a probabilidade de um evento E qualquer (E S) um nmero real P(E), tal que: 0 P(E) 1

d) a probabilidade de um evento elementar E qualquer , lembrando que n(E) = 1:

2.3. PROBABILIDADE CONDICIONAL O problema da interseo entre eventos no mutuamente exclusivos requer o emprego da probabilidade condicional, expressa matematicamente assim: P(BA) ou probabilidade de ocorrer o evento B desde que (dado que) tenha ocorrido o evento A. A probabilidade condicional utilizada para determinar a ocorrncia de um evento quando este afetado por outra condio. Por exemplo, no caso da retirada de um rei no jogo de cartas, considerando-se um total de 52 cartas, sendo 13 de cada naipe:

A probabilidade de retirar um rei, tendo sido previamente retirado um rei, assim determinada:

que o mesmo valor determinado inicialmente (p/2 Rei)=0,0588.

2.4. EVENTOS DEPENDENTES E INDEPENDENTES A utilizao da probabilidade condicional P(B|A) est intimamente relacionada ao conceito de eventos dependentes e independentes. De um modo geral, dizemos que dois eventos so independentes quando a ocorrncia de um no tem o menor efeito na probabilidade de ocorrncia do outro. Dando um exemplo do nosso cotidiano, se um casal tem trs filhos do sexo masculino e deseja que o prximo seja do sexo feminino, a ocorrncia anterior de trs filhos do sexo masculino influi na probabilidade de que, na quarta gestao, a criana seja do sexo feminino? Evidentemente no, pois a chance de nascer uma menina continua sendo p = , independentemente do sexo dos filhos que nasceram anteriormente. Consideremos relacionando-o aos mais um exemplo de e probabilidade independentes. condicional Seja um

eventos

dependentes

experimento de lanar dois dados: A o evento em que, no primeiro dado, aparece um nmero par, e B o evento em que a soma dos pontos de ambos os dados quatro. A = {2, 4, 6} B = {1,3; 2,2; 3,1} O espao amostral do evento A abrange trs elementos: dois, quatro e seis; como o total de possibilidade seis, temos P (A) =3/6=1/2 . Em relao ao evento B, o espao amostral compreender os seguintes elementos: 1,3; 2,2; 3,1, cada soma totalizando quatro. Cada dado tem seis nmeros. A combinao dos seis nmeros dois a dois, pois trata-se de dois dados, leva a trinta e seis resultados. Como so trs elementos em 36 combinaes possveis, teremos para o evento B: P(B) = 3/36=1/12. Examinemos agora a probabilidade condicional para essa situao. Os eventos so dependentes, pois desejamos saber a probabilidade de uma soma de quatro pontos dos dois dados, sendo que no primeiro ocorreu um nmero par. Traduzindo esta frase para a linguagem da probabilidade condicional teremos: P(B|A) = 1/36.

Ento, ao fazermos 36 lanamentos de dois dados, apenas o elemento (2,2) atende aos critrios referidos nos eventos A e B. Temos, como regra geral, que para eventos dependentes, P (B) P(B|A); isto quer dizer que o fato de um evento influir no outro afeta a probabilidade de ocorrncia desse outro. Neste caso constatamos que realmente

No exemplo a seguir, ilustraremos o assunto utilizando uma mesma situao em que podem ocorrer eventos dependentes ou independentes: o caso do jogo de cartas, que se presta aos dois tipos de ocorrncias. Vejamos a primeira possibilidade, relativa a retirada sucessiva de duas cartas de um baralho, sem que a primeira seja nele reposta. Seja A o evento em que a primeira carta um rei e B o evento em que a segunda carta um s. Os eventos so dependentes, pois a retirada de uma carta diminui o total de cartas de 52 para 51. Temos, ento, como probabilidade de retirar em primeiro lugar um rei P (A) = 4/52, pois existem 52 quatro reis no baralho. J na segunda retirada, contamos com um total de 51 cartas e quatro ases, ento P(B|A) = 4/51. Observamos a que a segunda retirada de carta sofreu efeito da primeira. Convm ainda destacar que, neste exemplo, P (A) = 4/52 e P(B|A) = 4/51, o que confirma matematicamente a dependncia dos eventos. O que ocorreria se a primeira carta retirada, o rei, fosse recolocada no baralho, que voltaria a ter 52 cartas? Neste caso, teramos dois eventos independentes, pois a retirada da primeira carta no influi na probabilidade de retirada da segunda. Obteramos, ento:

Neste contexto, as probabilidades de retirada de um rei e logo aps de um s so equivalentes.

2.5. REGRAS DE MULTIPLICAO (TEOREMA DO PRODUTO) A interseo de dois eventos A e B de um espao amostral designada por P (A B). A ocorrncia conjunta de A e B implica na observao apenas dos elementos comuns aos dois eventos. Para determinar matematicamente esta interseo, utilizamos a regra de multiplicao, que difere conforme os eventos sejam dependentes ou independentes. Para eventos independentes, a regra a seguinte:

A probabilidade de que ocorra um evento e o outro nfase na conjuno E obtida pelo produto das probabilidades dos dois eventos. Vejamos um exemplo: suponhamos que, ao lanar dois dados, queremos que no primeiro aparea o nmero 6 (A) e no segundo o nmero 4 (B). Os dois eventos so independentes? Sim, pois a ocorrncia de um no influi na ocorrncia do outro. Como resolver ento o problema? Em primeiro lugar, temos que P (A) = 1/6, pois existe uma nica face dentre as seis existentes que pode apresentar o nmero seis. P(B)=1/6, por razes similares. Aplicando a frmula acima teremos:

Assim, a probabilidade de que no lanamento de dois dados seja retirado um seis e um quatro, no primeiro e no segundo dado, respectivamente de 1/36. Examinemos agora um exemplo da regra de multiplicao para eventos dependentes. Estes, como j foram mencionados, requerem a utilizao da probabilidade condicional. Como um evento influi na probabilidade do outro, o segundo elemento da frmula para o produto modificado, ficando assim:

A situao a seguinte: ao se retirar duas cartas de um baralho, sem reposio, queremos que uma e outra sejam s. Estes eventos so

independentes? No, pois h uma diminuio no total de cartas (de 52 para 51) e no total de ases (de quatro para trs). Neste caso, a retirada da primeira carta influi na probabilidade da segunda. Aplicando a frmula, teramos:

Na mesma situao de jogo de cartas, desde que haja reposio (o que caracteriza os eventos independentes), se queremos obter um s (A) e um rei (B), a determinao de sua probabilidade conjunta se simplificada. Voltando-se a utilizar a primeira frmula de produto, temos:

2.5. REUNIO DE EVENTOS (TEOREMA DA SOMA) At agora nos preocupamos em aprender a determinar a probabilidade de ocorrncia conjunta de dois eventos, expressa como probabilidade de A e B P(A B). Examinemos, agora, outro ngulo a ser considerado: a ocorrncia de um evento ou outro ou ambos. Consideremos o seguinte exemplo: estamos fazendo uma primeira entrevista com um paciente e suspeitamos de que ele possa ter problemas na rea familiar ou social; isto no quer dizer que ambas as reas no possam estar comprometidas. Ento, o paciente pode ter dificuldades na rea familiar ou social ou em ambas. Este exemplo ilustra, com bastante clareza, a diferena entre interseo - multiplicao de eventos e reunio - adio de eventos. Enquanto no primeiro caso lidamos com pelo

menos dois eventos, em que nosso nico interesse o que h de comum entre eles expresso por um E no segundo focalizamos apenas um evento, propondo vrias alternativas possveis o que caracterizado pela expresso OU. A expresso P (A ou B) formulada matematicamente assim: P (A B). Da mesma forma que para a multiplicao de probabilidades a adio tambm apresenta duas estratgias, relacionadas ao fato de os eventos serem ou no mutuamente exclusivos. O uso da palavra OU tem ento dois sentidos diferentes, sendo freqente que tenhamos de adivinhar a qual delas nos referimos. Se Joaquim diz: Vou levar Patrcia ou Lcia ao baile de sbado, presumimos que levar uma ou outra, mas no ambas. Nesse contexto, os eventos so mutuamente exclusivos e o uso do OU denominado ou exclusivo, pois fica excluda a possibilidade de ambos os eventos ocorrerem simultaneamente. J quando um professor diz aos seus alunos: Darei um MB (muito bom) a todos os que obtiverem notas superiores a 89 nas provas mensais ou a todos cuja nota seja superior a 94 no exame final, qual o significado de sua afirmao? O aluno que obtiver ambas as notas superiores a esses valores mnimos ficar excludo do MB? O aluno s ganhar um MB se obtiver nota superior a 89 nas provas mensais ou nota superior a 94 no exame final? Neste caso, configura-se o ou inclusivo, pois os eventos no so mutuamente exclusivos. O aluno pode ter nota superior a 89 nas provas mensais ou superior a 94 no exame final ou ambos. Estando claras as duas situaes - eventos mutuamente exclusivos ou no , como aplicar a elas as regras de adio ou reunio de eventos? Ao retirarmos uma carta de um baralho, os eventos rei (A) e s (B) so mutuamente exclusivos, pois no podem ocorrer simultaneamente. Neste caso, a probabilidade de tirar um rei ou um s a seguinte:

A regra de adio para dois eventos mutuamente exclusivos , portanto, a seguinte:

3. PROBABILIDADE E TESTE DE HIPTESE O objetivo do emprego da estatstica em pesquisas cientficas no se resume apenas descrio dos valores e caracterizao da distribuio dos dados da amostra. importante e imprescindvel que o pesquisador busque estabelecer inferncias sobre a populao, com base na amostra estudada. Entretanto, como a investigao cientfica tem suas limitaes, no se pode considerar que todas essas inferncias estejam absolutamente corretas. Dessa forma, para se estabelecer concluses cientficas vlidas, necessrio definir o risco assumido pelo pesquisador ao se estabelecer concluses a partir da amostra pesquisada. Para tanto, o estabelecimento de inferncias estatsticas se baseia no conhecimento de princpios probabilsticos a partir da distribuio de probabilidades dos dados (distribuio normal ou curva de Gauss, distribuio t de Student, distribuio F de Snedecor, distribuio qui-quadrado, etc.). A figura 3 corresponde probabilidade de ocorrncia de um evento e ilustra o problema da inferncia. Observa-se que a probabilidade de ocorrncia de um valor maior prximo do ponto central da distribuio normal, correspondente mdia. medida que os valores se distribuem, para mais ou para menos em relao mdia, sua probabilidade de ocorrncia se torna menor quanto mais extremo for esse valor. O desvio padro corresponde ao ponto de inflexo da curva, separando os valores mais comuns (mais prximos da mdia) dos valores menos comuns (mais distantes da mdia).

A curva normal definida a partir de dois parmetros: mdia e desvio padro. A distribuio normal a distribuio contnua de probabilidade mais importante, em funo de que: a) representa com boa aproximao as distribuies de freqncias observadas de muitos fenmenos naturais e fsicos; b) tanto as distribuies de mdias como de propores em grandes amostras tendem a ser distribudas normalmente, o que tem grande importncia em amostragem. Se os dados se distribuem segundo a curva normal, pode-se afirmar que: a) aproximadamente 68,26% dos dados se localizam entre a mdia mais ou menos um desvio padro; b) aproximadamente 95,44% dos dados se localizam entre a mdia mais ou menos dois desvios padres; c) aproximadamente 99,74% dos dados se localizam entre a mdia mais ou menos trs desvios padres. Para se obter resultados conclusivos a partir de amostras de uma populao necessrio estabelecer certas hipteses iniciais que sero testadas utilizando mtodos estatsticos apropriados que

permitiro aceit-las ou rejeit-las. O objetivo de se testar uma hiptese permitir, a partir de uma nica amostra, generalizaes para a populao da qual a amostra foi extrada.

3.1 DEFINIO DA HIPTESE ESTATSTICA Freqentemente precisamos tomar decises sobre

populaes, com base em informaes amostrais, as quais so chamadas de decises estatsticas. Por exemplo, com base em resultados amostrais, podemos querer decidir se determinada resina melhor do que outra, se um processo educacional mais eficiente, se determinado medicamento mais eficiente, etc. Assim, admite-se inicialmente, um valor hipottico para um parmetro populacional desconhecido (mdia, mediana, desvio padro, proporo) e, a seguir, baseando-se em informaes obtidas da amostra, aceita-se ou no esse valor. Os testes de hipteses podem ser divididos em paramtricos e no-paramtricos. Os testes de hipteses paramtricos se referem s hipteses sobre os parmetros populacionais e dependem de pressuposies sobre a forma da distribuio da populao (distribuies normais ou amostras maiores que 30). Por outro lado, os testes de hipteses no-paramtricos se referem s hipteses sobre os parmetros populacionais e no dependem de pressuposies sobre a forma da distribuio da populao. O processo de testar a significncia estatstica envolve seis passos bsicos:
1 Estabelecer a hiptese nula Ho; 2 Estabelecer a hiptese alternativa H1;

3 Fixar o nvel de significncia ; 4 Determinar a regio de rejeio da hiptese nula Ho; 5 Definir o tamanho da amostra, coletar os dados e calcular o valor da estatstica correspondente; 6 Rejeitar ou aceitar Ho, conforme o valor da estatstica baseada na amostra cair na regio de rejeio ou na regio de aceitao. Admitindo-se que duas amostras tenham sido obtidas de uma populao e se deseje testar, em relao a uma determinada caracterstica, se a diferena encontrada entre as duas amostras devida ao acaso, como conseqncia da variabilidade dos dados, ou se, de fato, as amostras so diferentes, a aplicao do teste consiste na definio de duas hipteses iniciais: a hiptese nula (H0), afirmando que no h diferena entre os dois grupos, trata-se de uma hiptese que atribui ao acaso a ocorrncia do resultado observado; e a hiptese alternativa (H1), afirmando que h diferena entre eles. Aps a aplicao de um teste estatstico apropriado para a comparao das mdias, se h evidncia amostral para se rejeitar a hiptese nula, ento se conclui pela hiptese alternativa. Por outro lado, se o teste no evidencia diferena entre os grupos, a hiptese nula no rejeitada. O fato da hiptese nula no ser rejeitada no implica, necessariamente, que ela seja verdadeira, mas que as evidncias obtidas a partir da amostra analisada no so suficientes para rejeit-la.

3.2. DETERMINAO DO NVEL DE SIGNIFICNCIA ALFA PARA O TESTE ESTATSTICO E DO VALOR DE P O nvel de significncia alfa, representado pela letra grega alfa (), corresponde probabilidade mxima assumida pelo pesquisador para fazer uma inferncia estatstica. O nvel de significncia corresponde probabilidade de se rejeitar incorretamente a hiptese nula quando ela , na realidade, verdadeira. Como extremamente indesejvel se rejeitar uma hiptese nula verdadeira, esse risco assumido deve ser baixo. Os valores normalmente utilizados so 0,05 (5%) e 0,01 (1%).

O nvel de significncia est intimamente relacionado ao valor de p, obtido com a aplicao do teste estatstico. O valor de p considerado a probabilidade do resultado observado ser devido apenas ao acaso. Se o valor de p for menor ou igual que o valor de estabelecido a priori, a hiptese nula rejeitada. Considera-se, nesse caso, que h diferena estatisticamente significante entre as mdias das amostras. Caso ocorra o contrrio, ou seja, se o valor de p for maior que o valor de , a hiptese nula no rejeitada e a diferena entre as mdias das amostras , ento, considerada no significante.

3.3. ERRO ESTATSTICO Em funo de vrios fatores como imprecises nos mtodos de coleta dos dados, influncia de fatores externos ou mesmo variabilidade natural que ocorre nos dados, existe a possibilidade do pesquisador decidir erroneamente ao testar uma hiptese. Dois erros so possveis: Erro tipo I o erro cometido quando se rejeita a hiptese nula, sendo que a mesma verdadeira. Tambm denominado erro alfa () ou erro falso-positivo. Erro tipo II o erro cometido quando se aceita a hiptese nula, sendo que a mesma falsa, tambm denominado erro beta () ou erro falso-negativo. A adoo de um valor de pequeno (p 0,05) necessria para evitar o erro tipo I. Amostras pequenas e anlises sucessivas podem aumentar o risco de se incorrer em erro do tipo I, ou seja, de se encontrar uma diferena quando ela, na verdade, no existe. Se o valor de p pequeno, a diferena encontrada tem pouca chance de ser devida ao acaso variabilidade inerente das amostras conclui-se, portanto que as populaes so, com grandes probabilidades, diferentes, e espera-se que em menos de cinco vezes em 100 de que tal resultado seja devido ao efeito do acaso na composio das amostras. O erro tipo II () ocorre devido presena de grande variabilidade dos dados, amostras pequenas e mtodos experimentais incorretos. Esses fatores

aumentam a possibilidade de no se detectar uma diferena quando, na verdade, ela ocorre. Um valor de considerado aceitvel de 10 a 20%. Considerando como sendo a probabilidade de erro tipo II, possvel determinar o poder do teste como sendo igual a (1-). a probabilidade de corretamente rejeitar uma hiptese nula quando ela for falsa. Um teste estatstico tem mais poder quanto mais for capaz de rejeitar uma hiptese nula quando ela, de fato for falsa, ou seja, o poder corresponde capacidade do estudo em detectar diferenas. O poder do estudo muitas vezes utilizado para o planejamento do tamanho da amostra e para ajudar na interpretao de um experimento em que a diferena encontrada no foi estatisticamente significante. Quando a diferena encontrada no foi estatisticamente significante, interessante calcular que poder tem o teste realizado para detect-la. Quando da aplicao de um teste de hiptese, o erro estatstico pode ser minimizado evitando-se amostras muito pequenas, comparaes demasiadas, muitos subgrupos e reduzindo-se a variabilidade dos mesmos (C.V. 30%). Para fins prticos, n > 100 pode ser considerada amostra grande. 30 n 100 considerada amostra mdia. 10 n < 30 considerada amostra pequena e, n < 10 so amostras muito pequenas. Para a aplicao de um teste de hiptese paramtrico quando a varivel quantitativa (contnua), importante considerar que para amostras em que n < 30 , a populao de onde a amostra foi obtida, com relao varivel de interesse, deve ter distribuio normal. Quando no se sabe se a populao tem distribuio normal, pode-se testar a normalidade da amostra atravs do teste de normalidade de Kolmogorov-Smirnov ou Shapiro-Wilk. Para amostras em que n 30 no existe restrio com relao normalidade ou no da populao, pois a distribuio amostral de mdias normal ou tende para a normal, para n 30.

3.4 ESCOLHA DO TESTE ESTATSTICO Dentre os inmeros testes e tcnicas estatsticas que se apresentam no contexto de um trabalho de pesquisa, natural um certo grau de desorientao quanto identificao daqueles que so ou no aplicveis a cada situao. A utilizao correta de um teste de hiptese se baseia em cinco parmetros que orientam a deciso do pesquisador. 3.4.1 Natureza da Varivel A identificao das variveis do estudo o passo inicial para a escolha do teste estatstico apropriado para a anlise dos dados. As variveis devem ser inicialmente identificadas quanto ao tipo de escala: nominal, ordinal ou quantitativa (discreta, intervalar ou escala de razo).

3.4.2 Distribuio de Probabilidade dos Grupos Quando a varivel apresenta escala ordinal ou quantitativa e o tamanho da amostra em cada grupo menor que 30, testes adicionais devem ser aplicados para definir se a distribuio de probabilidade dos dados seguem o padro da distribuio normal (ou curva de Gauss) ou se a distribuio dos dados desconhecida ou diferente da distribuio normal.

3.4.3 Nmero de Grupos includos no Estudo Inicialmente deve-se definir o nmero de grupos (um, dois ou mais grupos) e o tamanho da amostra dentro de cada grupo, selecionado atravs de tcnicas de amostragem apropriadas.

3.4.4 Dependncia ou Independncia dos Grupos includos no Estudo A forma de organizao dos grupos tambm tem grande influncia na escolha do tipo de teste estatstico a ser aplicado. Essa organizao definida quando do planejamento da pesquisa e pode dispor os grupos de trs maneiras: dependente (emparelhada), independente (no-emparelhada) ou ambas (dependente e independente).

Considere em primeiro lugar, que um estudo tem como objetivo identificar diferena entre dois grupos de pacientes em relao a uma determinada doena. No caso em questo, um grupo tem a doena (caso), enquanto o outro grupo no apresenta a doena (controle). Assim, os dois grupos so considerados independentes (ou no-emparelhados) porque so compostos de diferentes indivduos. Por outro lado, considere um estudo representado por um grupo de pacientes que avaliado duas vezes, antes e aps a instituio de um tratamento. Nesse caso cada indivduo avaliado duas vezes, atuando como seu prprio controle. Nesse caso, obtm-se dois grupos (antes e aps a instituio do tratamento), considerados dependentes (ou emparelhados) uma vez que so compostos pelos mesmos indivduos. Finalmente, considere um estudo que tem como objetivo identificar diferena entre dois grupos de pacientes em relao a uma determinada doena, em dois momentos. No caso em questo, um grupo apresenta a doena (caso), enquanto o outro grupo no apresenta a doena (controle). Assim, os dois grupos so considerados independentes (ou noemparelhados) porque so compostos por diferentes indivduos, enquanto que dentro de cada grupo, em relao aos dois momentos as amostras so dependentes (ou emparelhadas), uma vez que so compostas pelos mesmos indivduos em T1 e T2.

3.4.5 Tipo de Inferncia Desejada O objetivo principal de uma pesquisa cientfica realizar inferncias, a partir de uma amostra, que possam ser extrapoladas para a populao da qual a amostra foi extrada. Tendo em vista o tipo de inferncia desejada, o planejamento da pesquisa orientado segundo um ou mais objetivos: a) comparar grupos; b) verificar a associao entre variveis;

c) medir a variabilidade na obteno de dados. A comparao entre grupos utilizada quando se deseja avaliar se diferentes tratamentos promovem efeitos diferenciados ou se a prevalncia ou incidncia de uma determinada caracterstica a mesma em diferentes grupos ou em diferentes momentos, ou qualquer outro tipo de anlise comparativa. Uma pesquisa para avaliar o grau de associao entre diferentes variveis utilizada quando se deseja verificar a influncia de uma varivel sobre a outra, ou at mesmo, estabelecer a relao de causa e efeito de uma ou mais variveis sobre a outra. O conhecimento de uma ou mais variveis contribui ou no para o conhecimento de outras variveis do estudo, ou seja, buscar na teoria se as variveis so associadas ou independentes entre si. Por outro lado, o pesquisador pode estar interessado em avaliar se fatores externos influenciam a obteno de dados. Desta forma, testes estatsticos so empregados visando estabelecer a concordncia nos valores obtidos por diferentes examinadores, por avaliaes distintas realizadas pelo mesmo examinador, ou para comparar a concordncia de diferentes mtodos ou critrios de avaliao. Incluem-se tambm nessa categoria os testes empregados para determinao da acuidade de mtodos de diagnstico.

3.5 TESTE DE COMPARAO ENTRE GRUPOS A seguir sero apresentados os testes de hipteses para comparao entre grupos a partir de variveis qualitativas.

3.5.1 Variveis Qualitativas Ao se comparar grupos que so medidos numa escala nominal categrica (dicotmica ou politmica), tem-se as seguintes opes de aplicao de testes estatsticos, conforme quadro 6. O Teste de Qui-Quadrado o teste mais empregado para a comparao de dados em escala nominal categrica (dicotmica ou politmica), representado por 2. Como os dados para o teste so definidos em categorias e pela freqncia com que ocorrem, no podem ser utilizados dados

quantitativos. O teste de 2 pode ser utilizado tanto para testar diferena entre duas propores, quanto para avaliar a independncia entre duas variveis categricas. A hiptese a ser comprovada a de que os dois grupos diferem em relao determinada caracterstica e, consequentemente, com respeito freqncia relativa com que os componentes dos grupos se enquadram nas diversas categorias.

Para a realizao do teste, os indivduos de uma amostra so estudados segundo duas variveis qualitativas e os dados so organizados em uma tabela de contingncia C x L, na qual as colunas e as linhas representam as categorias das duas variveis em anlise, conforme quadro 7.

Vrios

procedimentos

de

pesquisa

do

origem

freqncias

apresentadas no quadro 7: ensaios clnicos, estudos prospectivos, estudos retrospectivos e estudos transversais.

Para a realizao de um ensaio clnico controlado, o pesquisador deve definir uma amostra de n pacientes, ao acaso, em dois ou mais grupos: cada grupo recebe certo tratamento. Se o tratamento de cada paciente tem apenas duas possibilidades de resultado, como sucesso e fracasso e dois grupos experimentais, os dados do experimento devem ser apresentados em uma tabela 2 x 2. A incidncia pode ser definida como sendo a freqncia (nmero) de transies de saudvel para doente, de no-acidentado para acidentado ou de vivo para morto em um estudo populacional durante um determinado perodo de tempo. O risco relativo, ou razo de incidncias, expressa o quociente entre o risco de adoecer em um grupo exposto a um fator qualquer e o risco correspondente em um grupo no-exposto ao mesmo fator. O risco atribuvel, ou diferena de incidncia, resulta da diferena entre dois indicadores de ocorrncia, informando o excesso, ou resduo, de um sobre o outro. Avalia quanto da incidncia na populao em estudo pode ser imputado ao efeito do suposto fator de risco. dado pela diferena entre o risco no total da populao e o risco no grupo no-exposto. No estudo retrospectivo, o pesquisador necessita de um grupo de pessoas com determinada doena e um grupo comparvel de pessoas sem essa doena. O pesquisador calcula a proporo de pessoas com a caracterstica suspeita em cada grupo, visando identificar se foram ou no expostas a determinado fator. Existe a suspeita de que o cncer de pulmo ocorra mais em pessoas fumantes. Se o pesquisador no tem condies em funo de tempo e recursos de acompanhar um grupo de fumantes e no-fumantes at que alguns deles desenvolvam a doena (estudo prospectivo), pode tomar um grupo de pessoas com a doena e outro grupo comparvel, de pessoas sem a doena (estudo de caso-controle), para obter o nmero de fumantes e nofumantes em cada grupo. Assim sendo, os efeitos das variveis intervenientes como sexo, idade, nvel socioeconmico ficam controlados.

Com base nesse estudo, o pesquisador pode comparar a probabilidade de uma pessoa ser fumante dado que tm a doena, com a probabilidade de uma pessoa ser fumante, dado que no tm a doena. Essas probabilidades podem ser iguais (hiptese da nulidade) ou diferentes (hiptese alternativa), sendo possvel a obteno de estatsticas como odds ratio, alm da aplicao do teste de Qui-Quadrado e Mantel-Haenszel. O odds ratio, ou razo de produtos cruzados, dado pelo quociente entre a chance de exposio no grupo doente pela chance de exposio no grupo no-doente. Nos estudos transversais, o pesquisador obtm uma amostra

representativa de uma populao e classifica cada indivduo amostrado segundo variveis de interesse. Com base no exemplo anterior, se o pesquisador considera as variveis: ser ou no ser fumante e apresentar ou no cncer de pulmo, e classifica cada uma segundo a presena ou no da doena e o fato de ser ou no fumante. Os dados obtidos permitiro verificar se o fato de a pessoa ter a doena est associado ao fato de ser fumante. Assim sendo, o pesquisador pode testar a hiptese de que o aparecimento da doena est associado ao fato da pessoa ser fumante; ou de que o aparecimento da doena no depende de a pessoa ser fumante. Nesse tipo de estudo, possvel a obteno de estatsticas como prevalncia, razo de prevalncia, alm da aplicao de testes de diferena de propores e o teste de Qui-Quadrado. A prevalncia o nmero de pessoas, em uma determinada populao, que tem uma doena especfica ou condio em um ponto do tempo. Em tabelas de contingncia, devemos observar as seguintes condies: a) tabela 2 x 2: O tamanho da amostra deve ser maior que 20. Se a amostra for menor que 40, nenhum valor esperado pode ser menor do que 5. Alm disso, deve-se utilizar a correo de continuidade de Yates no clculo do 2 , gerando assim um resultado mais conservador, ou seja, um teste com menor probabilidade de rejeitar a hiptese nula. Se existir clulas com valor esperado menor do que 5, utilizar o Teste Exato de Fisher; b) quando n < 20, utilizar o Teste Exato de Fisher; c) tabelas 2 x L: o 2 pode ser calculado se todos os

valores esperados forem maiores do que 1 e se o nmero de clulas com freqncia inferior a 5 de no mximo 20% do total de clulas; d) tabelas C x L: o teste 2 um procedimento seguro se o nmero esperado mdio for maior ou igual a 6, para testes com nvel de significncia de 5% e 10% ou maior do que 6 para testes com nvel de significncia de 1%. O nmero mdio esperado pode ser obtido dividindo-se o total de indivduos da amostra pelo nmero de celas. O Teste de Mantel-Haenszel se aplica a dados categricos, em situaes como a do teste de Qui-Quadrado. Contudo, em alguns casos, pode existir alguma varivel independente associada varivel dependente (fator discriminante), que esteja tambm exercendo influncia sobre a varivel independente (fator discriminado). Dessa forma, poderia ser desejvel entender o efeito isolado da varivel dependente sobre a independente, isto , eliminar o efeito no desejado da varivel independente interveniente (de confundimento) associada varivel dependente. O teste consiste no clculo do quociente entre a soma das freqncias observadas e esperadas que relacionam positivamente a varivel dependente e a varivel independente, para todas as possveis condies da varivel independente interveniente e a soma das varincias para todas as possveis condies da varivel independente interveniente. O Teste Exato de Fisher empregado para comparar dados categorizados em tabelas 2 x 2 quando o nmero total de casos menor que 20 e existem clulas cujo valor esperado menor do que 5. O Teste de Igualdade de Duas Propores um teste equivalente ao teste de 2, para tabelas 2 x 2, com a diferena de que as freqncias absolutas so convertidas em propores. Para tanto, as amostras devem ser relativamente grandes e as freqncias esperadas maiores que 5. O coeficiente de Contingncia (C) uma medida da associao ou relao entre dois conjuntos de atributos. indicado quando tem-se apenas informaes categricas (escala nominal) sobre os dois conjuntos de atributos. Os dados podem consistir de qualquer nmero de categorias, isto , pode-se calcular um coeficiente de contingncia com base em uma tabela de contingncia C x L. Para testar a hiptese de associao, compara-se os

valores observados com os valores esperados caso a hiptese nula seja verdadeira. Quanto maior a discrepncia entre esses valores esperados (tericos) e os valores observados nas clulas, maior o grau de associao entre as duas variveis e, assim, maior o valor de C. Para qualquer tabela de contingncia C x L pode-se determinar a significncia do grau de associao determinando a probabilidade de ocorrncia, sob H0, de valores to grandes quanto o valor observado de 2. Se essa probabilidade no supera , pode-se rejeitar a hiptese de nulidade, quele nvel. Se o valor de 2 obtido com base na amostra estatisticamente significante, pode-se concluir que, na populao, a associao entre os dois conjuntos estatisticamente diferente de zero. A variao do coeficiente de contingncia C no segue o mesmo padro do coeficiente de correlao linear de Pearson, uma vez que seu valor varia entre zero e um limite superior menor do que um, dependendo do nmero de categorias. Seu clculo somente deve ser realizado se os pressupostos para a aplicao do teste de 2 forem satisfeitos. importante ressaltar que a comparao de dois coeficientes de contingncia s possvel quando forem obtidos a partir de tabelas de contingncia com o mesmo nmero de categorias. O Coeficiente (fi) uma medida muito utilizada pelos pesquisadores visando estimar o grau de associao entre duas variveis categricas nominais (dicotmicas ou politmicas), uma vez que o teste de 2 serve apenas para verificar a significncia da associao, mas no para medir o grau de associao entre as duas variveis. Se o coeficiente = 0, indica que a associao nula. Quanto mais prximo de 1, maior ser o grau de associao entre as variveis. Da mesma forma que o coeficiente de correlao de Pearson, se 0 < < 0,30, existe fraca associao. Se 0,30 < 0,60, existe associao regular. Se 0,60 < 0,90, existe associao forte. Finalmente, se 0,90 < 1, existe associao muito forte. O Coeficiente V de Cramr, assim como o coeficiente de contingncia C, uma medida de associao entre duas variveis categricas nominais

(dicotmicas ou politmicas). Se o coeficiente V = 0, indica que a associao nula. Quanto mais prximo de 1, maior ser o grau de associao entre as variveis. O Teste das Significncias das Mudanas de Mc-Nemar indicado para duas variveis categricas dicotmicas (Presena e Ausncia) com o objetivo de avaliar diferenas na freqncia de discordncia entre os pares de dados, para amostras em que n 25. um teste adequado para experimentos do tipo antes e depois (amostras emparelhadas), em que cada indivduo utilizado como seu prprio controle, visando detectar as mudanas de uma categoria para a outra. O teste deve ser aplicado desde que as freqncias esperadas sejam pelo menos igual a 5. Para comprovar a significncia de qualquer mudana observada, constri-se uma tabela de freqncias de dupla entrada (quatro casas) para representar o primeiro e o segundo conjunto de reaes das mesmas unidades observacionais. O Teste dos Sinais empregado na comparao dos resultados de amostras emparelhadas de dados nominais categricos dicotmicos, baseados na distribuio binomial, para amostras em que n < 25 O teste converte a diferena em cada par selecionado nos sinais de mais (+) ou de menos (). Quando um par no acusa diferena (sem sinal), o mesmo desprezado na anlise, reduzindo-se, assim, o tamanho da amostra n. Se a hiptese nula verdadeira, espera-se encontrar uma ocorrncia de aproximadamente 50% de sinais positivos e 50% de sinais negativos. O Teste Q de Cochran indicado para se testar a hiptese de que trs ou mais condies experimentais tm o mesmo efeito sobre os elementos que compem a amostra. As variveis dependentes so dicotmicas e devem ser medidas sobre os mesmos indivduos (amostras emparelhadas) ou quando o pesquisador conseguir emparelhar indivduos semelhantes em relao a uma srie de variveis (sexo, idade, altura, peso, hbitos, etc.). O teste consiste em avaliar se a proporo ou freqncia de resposta de determinado tipo a mesma para cada condio experimental, excetuadas as diferenas devidas ao acaso. Se Ho rejeitada, as comparaes duas a duas podem ser feitas utilizando o teste das significncias das mudanas de Mc-Nemar.

3.5.2 Variveis Quantitativas ou Ordinais A comparao de grupos relacionados a variveis quantitativas ou ordinais realizada utilizando testes estatsticos diferentes das variveis qualitativas. A identificao de uma varivel medida numa escala numrica no suficiente para se definir o tipo de teste indicado para a comparao dos grupos. necessrio verificar quando n < 30 se a distribuio dos dados para cada grupo segue a distribuio normal (paramtrica) ou se a distribuio dos dados desconhecida ou diferente da distribuio normal. Uma forma de se testar o padro de distribuio dos dados utilizando os testes de normalidade de Kolmogorov-Smirnov ou Shapiro-Wilk. O Teste de Kolmogorov-Smirnov compara a distribuio de freqncia real acumulada dos dados da amostra com uma distribuio normal acumulada gerada a partir da mdia e do desvio padro supostamente conhecidos (populacionais). Esta comparao efetuada com base na maior diferena entre as freqncias observadas acumuladas e as freqncias esperadas acumuladas dessas duas curvas. O teste de Kolmogorov-Smirnov quando efetuado sob a suposio de que os parmetros populacionais da normal so desconhecidos, e utiliza a estimativa da mdia e desvio padro a partir da amostra, denominado de teste de Kolmogorov-Smirnov com a correo de Lilliefors. mais poderoso que o teste qui-quadrado para a bondade do ajustamento, uma vez que pode ser aplicado para pequenas amostras. O Teste de Shapiro-Wilk compara a distribuio de freqncia real dos dados da amostra com uma distribuio normal gerada a partir do clculo da mdia e do desvio padro obtidos a partir da amostra, utilizando assim a variante de Lilliefors do teste de Kolmogorov-Smirnov. um teste mais conservador do que o teste de Kolmogorov-Smirnov. Admitindo que a distribuio dos dados seja normal ou

aproximadamente normal, quando n < 30, so indicados os testes paramtricos para comparao entre grupos. O quadro 8 apresenta os principais testes utilizados para variveis quantitativas ou ordinais, que seguem a distribuio normal ou quando n 30 para cada grupo.

O Teste t de Student se baseia num tipo de distribuio de dados semelhante distribuio normal, conhecida como distribuio t de Student. uma distribuio simtrica, porm mais platicrtica, recomendada para pequenas amostras (n < 30). O teste t de Student pode ser utilizado para verificar se uma nica amostra provm ou no de uma populao cuja mdia conhecida. Normalmente empregado para testar a hiptese nula de que as mdias de duas amostras so iguais. Nesse tipo de teste, a primeira questo observar o tipo de experimento envolvido, ou seja, se as amostras so dependentes (emparelhadas) ou independentes (no-emparelhadas). O Teste t de Student para grupos Independentes utiliza para o seu clculo a diferena entre as duas mdias, o desvio padro dos grupos, o tamanho de cada amostra e o erro padro das diferenas das mdias entre os dois grupos.

Considerando a hiptese nula de que no h diferena entre as mdias dos grupos, aps a obteno de t calculado e a definio do nvel de significncia desejado, compara-se o valor de t calculado com o valor de t tabelado. Se o valor de t calculado for maior que o valor crtico fornecido pela tabela, rejeita-se a hiptese nula de igualdade de mdias entre os grupos, evidenciando diferena estatisticamente significante entre as mdias dos grupos. O teste t para grupos independentes somente deve ser aplicado quando a distribuio dos dados for normal ou a amostra de ambos os grupos for maior ou igual a 30. Quando as varincias das amostras no forem homogneas, uma modificao do teste t de Student, denominada correo para graus de liberdade de Aspin-Welch deve ser aplicada. Para avaliar se os grupos apresentam varincias homogneas pode ser utilizado o Teste de Homogeneidade de Varincias de Levene. O Teste de Homogeneidade de Varincias de Levene compara se os grupos analisados possuem variabilidades semelhantes ou diferentes. Quando as varincias so homogneas, as populaes so chamadas de homocedsticas, enquanto que no segundo caso as populaes so chamadas heterocedsticas. O valor do quociente entre a maior e a menor varincia amostral fornece a estatstica F de Snedecor. Evidentemente, se as variabilidades amostrais forem prximas, o valor de F torna-se mnimo e igual a um, conduzindo a aceitao da hiptese nula e consequentemente da homocedasticidade das populaes. O Teste t de Student para grupos dependentes aplicado para comparao das mdias de dois grupos emparelhados que utiliza para o seu clculo a mdia das diferenas entre cada um dos pares formados pelas duas amostras, o desvio padro das diferenas, o erro padro das diferenas e o tamanho da amostra das diferenas. Considerando a hiptese nula de que a diferena mdia entre os dois grupos zero, aps a obteno de t calculado e a definio do nvel de significncia desejado, compara-se o valor de t

calculado com o valor de t tabelado. Se o valor de t calculado for maior que o valor crtico fornecido pela tabela, rejeita-se a hiptese nula de igualdade de mdias entre os grupos, evidenciando diferena estatisticamente significante entre as mdias dos grupos. O teste t para grupos dependentes somente deve ser aplicado quando a distribuio das diferenas dos dados for normal ou a amostra de ambos os grupos for maior ou igual a 30. A Anlise de Varincia ANOVA, a um ou mais critrios de classificao, a estatstica indicada para a comparao de trs ou mais grupos de dados com escala pelo menos intervalar com distribuio normal ou aproximadamente normal. Constitui-se de um conjunto de tcnicas estatsticas para descobrir "fatores" que produzem mudanas sistemticas em alguma varivel de interesse. Os fatores propostos so atributos ou variveis qualitativas, enquanto que a varivel dependente quantitativa e observada dentro das classes dos fatores visando analisar se difere de forma significativa. Trata-se de uma generalizao do teste para a diferena entre duas mdias (teste t de Student), para o caso de compararmos simultaneamente K mdias (K > 2), supondo que as mesmas foram calculadas sobre amostras aleatrias extradas da populao. O problema est em concluir se algum, ou alguns desses K grupos so estatisticamente diferentes uns dos outros. Poderiam ser comparados os grupos, dois a dois, por meio do teste t de Student, o que poderia revelar uma diferena significante entre quaisquer dois grupos. Porm, proceder dessa forma seria incorrer num erro do tipo I, pois ao aceitar 5% de erro, a comparao de 4 grupos envolve a aplicao do teste t de Student seis vezes separadamente, incorrendo numa chance de 30% (6 x 5%) de encontrar, por mero acaso, uma diferena estatisticamente significante. Existem dois modelos de anlise de varincia: o de um critrio, em que h apenas uma varivel independente (ou fator), e o de dois ou mais critrios, com ou sem interao, em que h duas ou mais variveis independentes (ou fatores).

O termo um critrio indica que os dados foram avaliados segundo uma varivel independente, como por exemplo, a dureza de uma restaurao medida segundo trs materiais (resina hbrida, ionmero fotoativo e ionmero ativo). Como existe um fator de variao, material (com trs nveis), uma questo pode ser formulada: 1) h diferena nos valores mdios da resistncia entre os trs materiais, mantido todos os demais fatores constantes? O termo dois critrios indica que os dados foram avaliados segundo duas variveis independentes, como por exemplo, a dureza de uma restaurao medida segundo trs materiais (resina hbrida, ionmero fotoativo e ionmero ativo) e trs formas de irradiao (sem irradiao, irradiado com 30 Gy e irradiado com 50 Gy). Como existem dois fatores de variao, materiais (com trs nveis) e irradiao (com trs nveis), trs questes podem ser formuladas: 1) h diferena entre os trs materiais, independente da forma de irradiao?, 2) h diferena entre as trs formas de irradiao, independente do tipo de material?, e; 3) h interao entre tipo de material e forma de irradiao?. O segundo caso, quando todos os materiais esto na presena de todas as formas de irradiao, envolve o modelo de ANOVA a dois critrios, modelo fatorial completo. Para a aplicao do modelo de anlise de varincia, os dados das amostras devem cumprir trs pr-requisitos bsicos: a) os dados devem apresentar distribuio normal dentro de cada grupo quando n < 30; b) os dados devem apresentar homogeneidade de varincias entre os grupos; c) os dados de cada grupo devem ser aleatrios e independentes, ou seja, cada observao individual no deve ter qualquer relao com outra observao do grupo. No entanto, nem todos os pr-requisitos tm igual importncia. Na verdade, os resultados do teste so pouco afetados quando h desvios moderados em relao distribuio normal, especialmente quando o tamanho da cada grupo for de pelo menos n 30. Por outro lado, o teste noparamtrico de Kruskal-Wallis, correspondente anlise de varincia a um

critrio, indicado quando os dados apresentam uma distribuio com assimetria forte, principalmente quando o tamanho da amostra for menor que 30. Os requisitos de homogeneidade das varincias entre os grupos e independncia das observaes so de particular importncia. Para o controle desses problemas recomenda-se que o tamanho da amostra seja igual ou semelhante dentro de cada grupo e que se evite estudos envolvendo medidas repetidas na mesma unidade observacional, a menos que o pesquisador saiba que a ocorrncia de um valor independe da ocorrncia de qualquer outro valor. Quando os grupos apresentarem varincias heterogneas e o teste da ANOVA indicar diferenas entre os grupos, recomenda-se para identificar quais grupos diferem entre si, a utilizao de um teste de comparaes mltiplas paramtricas admitindo varincias heterogneas, como por exemplo, o teste de comparaes mltiplas paramtricas de Games-Howell ou o teste de Dunnetts T 3. A comparao dos grupos pelo mtodo da ANOVA feita aplicando-se a estatstica F de Snedecor, atravs do estudo das causas de variao. Essas causas provm basicamente de duas fontes. A primeira causa de variao devida ao fato dos tratamentos aplicados a cada grupo serem diferentes, ou seja, relacionada diferena das mdias dos grupos. A Segunda causa devida ao acaso (variabilidade residual), como resultado das diferenas no interior de cada grupo. A aplicao da estatstica F de Snedecor visando no rejeitar a hiptese nula de igualdade entre as mdias dos grupos consiste em mostrar que a varincia de cada grupo semelhante varincia entre os grupos. Essa anlise fornece um valor de F. Quanto maior for esse valor, maior ser a variao entre os grupos em relao variao dentro de cada grupo e, portanto, maior a probabilidade de se rejeitar a hiptese de igualdade entre os grupos. A partir dos dados do experimento, a valor calculado da estatstica F comparado com o valor tabelado. Para tanto, necessrio definir o nvel de significncia e calcular o nmero de graus de liberdade do teste.

Considerando a hiptese nula de que no h diferena entre as mdias dos grupos, aps a obteno de F calculado e a definio do nvel de significncia desejado, compara-se o valor de F calculado com o valor de F tabelado. Se o valor de F calculado for maior que o valor crtico fornecido pela tabela, rejeitase a hiptese nula de igualdade de mdias entre os grupos, evidenciando diferena estatisticamente significante entre as mdias dos grupos. A anlise de varincia serve para verificar se existe diferena significativa entre pelo menos dois grupos. Porm, se houver diferenas, no se sabe, atravs dela, quais grupos diferem entre si. A identificao de diferenas entre mdias, tomando-as duas a duas, deve ser feita usando um dos vrios testes de comparaes mltiplas entre mdias existentes na literatura. Estes testes so semelhantes ao teste t de Student, com a diferena de que controlam o nvel de significncia ao levar em conta o nmero de comparaes feitas no experimento. Alm disso, nesta tcnica estatstica, a varincia dentro dos grupos estimada usando o quadrado mdio do resduo, do quadro da ANOVA, que baseado em todas as amostras, enquanto em um teste t a varincia dentro dos grupos estimada com base em duas amostras apenas. Vrios procedimentos tm sido propostos para prosseguir na anlise dos dados, admitindo varincias homogneas e heterogneas entre os grupos, e diferem entre si quanto maior ou menor capacidade de reduzir erros do tipo I ou do tipo II. Sero descritos a seguir, cinco dos mais usados (Tukey HSD, SNK, Bonferroni, Scheff e Dunnett), os quais analisam todas as comparaes possveis, admitindo varincias homogneas entre os grupos e o teste de comparaes mltiplas paramtricas de Games-Howell, o qual analisa todas as comparaes possveis, admitindo varincias heterogneas entre os grupos.Tais procedimentos podem ser usados na condio de que o resultado do teste F do quadro da ANOVA seja estatisticamente significante. O Teste de Tukey HSD (Honestly Significant Difference) empregado para se determinarem as diferenas significantes entre as mdias de todos os grupos analisados no teste ANOVA, tomadas duas a duas, quando existir homogeneidade de varincias entre os grupos. O mtodo de Tukey HSD

protege os testes de um aumento no nvel de significncia devido ao grande nmero de comparaes efetuadas. Inicialmente, ordenam-se as mdias da maior menor. Se uma diferena entre duas mdias no significativa, no h razo para existir diferena entre as mdias compreendidas entre essas duas. Assim sendo, as diferenas englobadas por uma diferena estatisticamente no significante no devem ser testadas. fornecido um valor crtico e a diferena entre as mdias dos grupos comparados considerada significante quando exceder esse valor crtico. O Teste de Student-Newman-Keuls (SNK) empregado com o mesmo objetivo que o teste de Tukey HSD, com exceo de que o valor crtico depende no do nmero K de tratamentos envolvidos no experimento, mas do nmero K* de mdias includas na amplitude de mdias que est sendo testada. Deve ser utilizado quando existir homogeneidade de varincias entre os grupos. Baseia-se na ordenao das mdias e no estabelecimento do nmero de graus de liberdade que separam as mdias entre si. Se o valor calculado da estatstica do teste for maior do que o valor tabelado, rejeita-se a hiptese nula de igualdade entre as mdias dos dois grupos comparados. O Teste de Bonferroni baseia-se na estatstica t de Student, admitindo existir homogeneidade de varincias entre os grupos. Consiste em corrigir o nvel de significncia , devido ao fato de mltiplas comparaes estarem sendo realizadas, o que aumenta a possibilidade de erro tipo I (encontrar diferena significante devido ao acaso). necessrio que a escolha das comparaes se no forem todas seja feita a priori e no aps a inspeo dos resultados. O procedimento consiste em calcular uma diferena entre mdias denominada t de Bonferroni. Se o valor calculado t Bonf for maior do que o valor tabelado, rejeita-se a hiptese nula de igualdade das mdias entre os dois grupos comparados. O Teste de Scheff avalia todas as combinaes possveis entre os grupos e no apenas comparaes aos pares, admitindo existir homogeneidade de varincias entre os grupos. especialmente til no caso dos contrastes mltiplos, quando se quer comparar um grupo de tratamentos com outro, por exemplo, G2 + G3 contra G1. considerado um mtodo conservador pois, quando compara os grupos aos pares requer diferenas

maiores entre as mdias para estabelecer significncia estatstica. O procedimento consiste em calcular o mdulo da diferena entre mdias. Se o valor calculado for maior do que o valor tabelado, rejeita-se a hiptese nula de igualdade das mdias entre os dois grupos comparados. O Teste de Dunnett empregado quando se deseja comparar vrios tratamentos com um grupo controle, no sendo possvel a comparao dos tratamentos entre si. recomendado quando existir homogeneidade de varincias entre os tratamentos e o grupo controle. O Teste de Games-Howell empregado para se determinarem as diferenas estatisticamente significantes entre as mdias de todos os grupos analisados no teste ANOVA, tomadas duas a duas, quando no existir homogeneidade de varincias entre os grupos. fornecido um valor crtico e a diferena entre as mdias dos grupos comparados considerada significante quando exceder esse valor crtico. A Anlise de Covarincia ANCOVA, a um ou mais critrios de classificao, a estatstica indicada para a comparao de trs ou mais grupos de dados numricos com distribuio normal ou aproximadamente normal. Constitui-se de um conjunto de tcnicas estatsticas para descobrir "fatores" que produzem mudanas sistemticas em alguma varivel de interesse. Enquanto na ANOVA os fatores propostos so variveis qualitativas, na ANCOVA os fatores propostos podem ser variveis quantitativas ou atributos (qualitativas), enquanto que a varivel dependente quantitativa e observada dentro das classes dos fatores visando analisar se difere de forma significativa. O procedimento da ANCOVA ajusta a varivel dependente com base na varivel ou nas variveis contnuas independentes, realizando assim uma ANOVA a dois ou mais critrios sobre a varivel dependente ajustada. O procedimento ANCOVA remove o efeito da varivel ou das variveis independentes contnuas da anlise do efeito das variveis categricas sobre a varivel dependente. O controle para a varivel contnua independente significa que artificialmente todos os grupos estudados sero iguais com relao varivel ou variveis contnuas independentes, eliminando assim o efeito das variveis intervenientes.

Existem situaes em que um estudo feito visando no somente comparar grupos entre si, mas tambm avaliar o efeito de uma ou mais variveis sobre outra ou mesmo para se predizer o valor de uma caracterstica em funo de uma ou mais variveis. Testes estatsticos apropriados so empregados para se determinar se esse relacionamento entre variveis estatisticamente significante ou no, considerando o tipo de escala das variveis envolvidas: nominal, ordinal ou contnua. O Coeficiente de Correlao Linear de Pearson (r). uma medida de associao linear e varia de -1 r +1. Descreve a associao entre duas variveis, no fazendo julgamento sobre se uma causa ou conseqncia da outra. Para se explicar a influncia de uma varivel sobre a outra, um outro valor denominado Coeficiente de Determinao (r2), correspondente ao valor de r elevado ao quadrado, normalmente utilizado. O coeficiente de correlao linear de Pearson independente das unidades de medidas das variveis X e Y. Trata-se de um nmero desprovido de unidade de medida (adimensional). Se for igual a zero indica que no h associao linear entre as duas variveis envolvidas. Quando r = -1, tem-se correlao linear negativa perfeita, enquanto que para r = 1, a correlao linear positiva e perfeita. Para r = 0, no existe correlao linear entre as variveis, podendo existir associao de outro tipo. Se 0 < |r| < 0,30, existe fraca correlao linear. Se 0,30 |r| < 0,60, existe correlao linear regular. Se 0,60 |r| < 0,90, existe correlao linear forte. Finalmente, se 0,90 |r| < 1, existe correlao linear muito forte. Um valor de r = 0,90 apresenta um coeficiente de determinao r2 = 0,81, o que significa que as variaes da varivel independente X explicam 81% das variaes da varivel dependente Y, restando 19% para outras variveis no includas no modelo. O sinal do coeficiente de correlao de Pearson indica se as variveis caminham no mesmo sentido (correlao positiva), ou em sentidos opostos (correlao negativa). Quando calcula-se o coeficiente de correlao linear r, obtm-se a estimativa do coeficiente de correlao populacional , a partir de uma amostra de tamanho n.

Dessa forma possvel atravs de um teste de hiptese, utilizando o valor de r, concluir se a correlao linear entre as variveis X e Y estatisticamente diferente de zero. A Anlise de Regresso, ao contrrio do coeficiente de correlao, que indica apenas o grau de associao entre duas variveis, uma tcnica estatstica utilizada para investigar e modelar o relacionamento funcional entre as diversas variveis de um processo. O objetivo principal da anlise de regresso predizer o valor de uma varivel (a varivel resposta ou dependente), dado que seja conhecido o valor de uma ou mais variveis associadas (as variveis independentes ou explicativas). A Regresso Simples envolve a predio da varivel dependente com base em apenas uma varivel independente, enquanto a Regresso Mltipla diz respeito predio da varivel dependente em funo de duas ou mais variveis independentes. Basicamente, um problema de regresso envolve variveis que podem ser controladas, expressas no modelo de regresso pelas variveis independentes, e variveis que no podem ser controladas (variao aleatria), expressas no modelo pelo erro. A Regresso Logstica Binria uma tcnica estatstica utilizada para investigar e modelar o relacionamento funcional entre uma varivel dependente (nominal binria), dado que seja conhecido o valor de uma ou mais variveis associadas (as variveis independentes contnuas). A Regresso Logstica Multinomial uma tcnica estatstica utilizada para investigar e modelar o relacionamento funcional entre uma varivel dependente (nominal politmica), dado que seja conhecido o valor de uma ou mais variveis associadas (as variveis independentes ou explicativas, nominais ou contnuas). Basicamente, um problema de regresso envolve variveis que podem ser controladas, expressas no modelo de regresso pelas variveis independentes, e variveis que no podem ser controladas (variao aleatria), expressas no modelo pelo erro. ou explicativas, nominais ou

Em todos os casos em que os requisitos prvios para aplicao de testes paramtricos no forem satisfeitos pode-se optar pela utilizao de um teste noparamtrico equivalente. Os testes no-paramtricos so comumente empregados para dados ordinais, uma vez que na grande maioria das vezes no apresentam distribuio normal. Alm do no cumprimento do requisito de normalidade, a seleo do teste no-paramtrico adequado se baseia no nmero de grupos a serem comparados e na presena ou ausncia de independncia dos grupos. O quadro 9 a seguir apresenta os testes no-paramtricos para comparaes de grupos para variveis quantitativas ou ordinais, que no apresentam distribuio normal. A estatstica no-paramtrica se baseia na converso dos dados originais da amostra em postos (ranks) ou sinais positivos e negativos. Um posto considerado como sendo a posio de um determinado dado quando todos os valores que compem a amostra esto ordenados de forma crescente. O princpio da comparao entre grupos a partir de postos baseia-se na idia de que se as amostras a serem comparadas so iguais, a ordenao de todos os dados tende a mistur-los de maneira que a mdia dos postos tende a ser igual em todos os grupos. Porm, ao contrrio, se medida em que os valores ordenados das amostras separam os dados de cada grupo, a probabilidade de igualdade entre as mdias dos postos em cada grupo se torna pequena. O Teste U de Mann-Whitney serve para testar a hiptese de que os dois grupos em comparao tm a mesma distribuio de probabilidades. indicado para a comparao de dois grupos independentes (noemparelhados) cujos requisitos para aplicao do teste t de Student para amostras independentes no foram atendidos, ou porque os dados dos dois grupos no apresentam distribuio normal ou quando a mensurao atingida inferior da escala de intervalos. O valor de U calculado avalia o grau de entrelaamento dos dados dos dois grupos aps a ordenao, do menor para o maior, sem levar em considerao se as observaes so oriundas do primeiro grupo ou do segundo grupo. Em seguida, as n1 e n2 observaes dos grupos 1 e 2 so identificadas e a soma dos postos dos dois grupos calculada.

Para testar a diferena entre as somas dos postos, calcula-se a estatstica U1 e U2. Chama-se de U observado o menor dos valores obtidos para U1 e U2, o qual deve ser comparado com o U crtico, obtido em tabela especfica, a partir do tamanho da amostra e do nvel de significncia . Quanto maior a diferena entre a soma dos postos U1 e U2 maior ser a probabilidade de que as amostras sejam desiguais, rejeitando-se a hiptese de igualdade das duas populaes. O Teste de Wilcoxon indicado para comparao de dois grupos dependentes (emparelhados). usado na mesma situao que o teste t para amostras emparelhadas, quando os pressupostos para a aplicao do teste t de Student para amostras emparelhadas no so satisfeitos. O teste pressupe que a varivel dependente seja medida, para cada tratamento, pelo menos, em escala ordinal. O processo consiste em calcular os valores numricos da diferena entre cada par, podendo ocorrer: acrscimo (+), decrscimo (-) ou igualdade (=).Quando um par no acusa diferena (di = 0), o mesmo desprezado na anlise, reduzindose, assim, o tamanho da amostra n, que ser dada pelo nmero de pares excluindo aqueles cuja diferena nula. Pode ocorrer ainda outro tipo de empate. Quando duas ou mais diferenas apresentarem o mesmo valor. Neste caso cada posto ser

representado pela mdia aritmtica dos postos que teriam sido atribudos se as diferenas fossem diferentes. Uma vez obtido o vetor de todas as diferenas para cada par de dados, essas diferenas so ordenadas pelo seu valor absoluto (desprezando o sinal), substituindo-se ento os valores originais pelos postos que ocupam na escala ordenada. Em seguida, a cada posto atribui-se o sinal da diferena, indicando quais postos decorrem de diferenas negativas e quais postos decorem de diferenas positivas. O teste da hiptese de que as medidas feitas no mesmo par so iguais baseado na soma dos postos das diferenas negativas e positivas. Se a hiptese nula verdadeira, a soma dos escores positivos e escores negativos deve ser prxima de zero. Se, entretanto, a soma dos postos positivos muito diferente da soma dos postos negativos, o valor de p ser pequeno, e a hiptese nula ser rejeitada, concluindo assim que o tratamento A difere do tratamento B. O Teste de Kruskal-Wallis o equivalente no-paramtrico da ANOVA a um critrio, ou seja, serve para testar a hiptese de que vrios grupos independentes tm a mesma distribuio de probabilidades. um teste para comparao de trs ou mais grupos independentes, quando os requisitos para aplicao do teste de ANOVA no foram atendidos. A tcnica comprova a hiptese de nulidade de que k amostras provenham da mesma populao ou de populaes idnticas com relao a mdias. O teste pressupe que a varivel dependente tenha distribuio contnua, e exige mensurao, pelo menos, em escala ordinal. A aplicao do teste utiliza os valores numricos transformados em postos e agrupados num s vetor de dados. Quando ocorrer empates entre as observaes, deve-se atribuir a cada uma delas o valor mdio dos postos em que ocorreram os empates. A comparao dos grupos realizada utilizando a soma dos postos de cada amostra. O teste de Kruskal-Wallis mais eficiente do que o teste da mediana porque utiliza mais as informaes contidas nas observaes. Converte os escores em postos, enquanto que a prova da mediana converte os escores apenas em sinais mais e menos. Assim, a prova de Kruskal-Wallis preserva a magnitude dos escores, sendo mais sensvel para detectar diferenas entre

as K amostras de escores. a prova no-paramtrica mais eficiente. Tem poder-eficincia de 95,5% quando comparada com a ANOVA, quando os pressupostos para aplicao da ANOVA foram atendidos. Apesar do teste de Kruskal-Wallis ser indicado para apenas um fator de variao, pode-se utiliz-lo tambm quando h mais de um fator de variao, desde que se faa a combinao dos fatores e proceda a anlise isolada de cada uma das novas combinaes, comparando os grupos gerados a partir das combinaes realizadas anteriormente. Uma vez que esse procedimento no permite avaliar as significncias das interaes entre os fatores, tal anlise pode ser feita visualmente a partir da construo de grficos envolvendo os escores mdios segundo os fatores. O teste de Kruskal-Wallis, da mesma forma que a ANOVA, serve para verificar se existe diferena estatisticamente significante entre os escores mdios de pelo menos dois grupos. Porm, se houver diferenas, no se sabe, atravs dele, quais grupos diferem entre si. A identificao de diferenas entre escores mdios, tomando-os dois a dois, deve ser feita usando o teste de comparaes mltiplas noparamtricas de Dunn. Este teste semelhante ao teste de Tukey-Kramer HSD, o qual analisa todas as comparaes possveis, dois a dois, a partir dos postos mdios de cada um dos grupos. fornecido um valor crtico tabelado, e a diferena entre os postos mdios dos grupos comparados considerada significante quando exceder esse valor crtico. O Teste da Mediana serve para testar a hiptese de que dois ou mais grupos independentes tenham provindo de populaes com a mesma mediana. O teste da mediana til quando existem grupos que apresentam dados censurados (alguns dados ficam alm dos limites estabelecidos pelo procedimento definido no experimento). O teste pressupe que a varivel dependente seja medida, pelo menos, em escala ordinal. Para aplicar o teste da mediana, determina-se primeiro a mediana global a partir dos escores de todos os grupos. Em seguida, os escores de cada grupo so dicotomizados em dois conjuntos, obtendo-se o nmero de escores acima e abaixo da mediana global. Se os grupos comparados provem de populaes com a mesma mediana, de se esperar que cerca da metade dos

escores de cada grupo esteja acima da mediana global e cerca da metade abaixo. O Teste de Friedman um teste no-paramtrico equivalente ANOVA com medidas repetidas, para comparao de trs ou mais grupos dependentes (emparelhados), quando o mesmo indivduo avaliado mais de duas vezes. Serve para testar a hiptese de que trs ou mais grupos relacionados tm, todos, a mesma distribuio de probabilidades. Pressupe que a varivel dependente seja medida, pelo menos, em escala ordinal. O teste no utiliza os dados numricos diretamente, mas sim os postos ocupados pelas unidades observacionais, para cada um dos tratamentos. Aps a obteno dos postos para cada linha, testada a hiptese de igualdade das mdias dos postos dos grupos. O teste de Friedman, da mesma forma que o teste de Kruskal-Wallis, serve para verificar se existe diferena estatisticamente significante entre as mdias dos postos de pelo menos dois tratamentos. Porm, se houver diferenas, no se sabe, atravs dele, quais tratamentos diferem entre si. A identificao de diferenas entre as mdias dos postos, tomando-os dois a dois, deve ser feita usando o teste de comparaes mltiplas no-paramtricas modificado por Dunn para o teste de Friedman. Este teste semelhante ao teste de Tukey HSD, o qual analisa todas as comparaes possveis, dois a dois, a partir dos postos mdios de cada um dos grupos. fornecido um valor crtico tabelado, e a diferena entre os postos mdios dos grupos comparados considerada estatisticamente significante quando exceder esse valor crtico. O Teste de Kendall W indicado para se testar a hiptese de que as vrias condies experimentais tm o mesmo efeito sobre os elementos que compem a amostra. As variveis dependentes so contnuas ou ordinais e devem ser medidas sobre os mesmos indivduos. Alm da comparao entre as diferentes condies experimentais, o teste fornece o coeficiente de concordncia de Kendall, cujo objetivo avaliar o grau de associao entre os diferentes tratamentos. Quando se deseja avaliar a associao entre duas variveis em que n < 30 e os dados de uma ou de ambas as variveis no apresentam distribuio normal e/ou as variveis no so contnuas (ambas com escala ordinal ou uma

ordinal e outra contnua), existem outros coeficientes de correlao amostrais no-paramtricos como o de Spearman (rs) e o de Kendall (rt). O Coeficiente de Correlao de Spearman (rs) uma medida do grau de associao entre duas variveis quando os dados observados apresentam escala ordinal ou quando pelo menos uma das variveis no apresenta distribuio normal. Parte da obteno da diferena entre cada par de postos. Seu valor varia entre 1 e +1, sendo sua interpretao semelhante ao coeficiente de correlao de Pearson. Outra medida de associao entre variveis ordinais semelhante ao coeficiente de correlao de Spearman, o Coeficiente de Correlao de Kendall (rt). A correlao por postos de Spearman e kendall corresponde verso no-paramtrica da correlao linear de Pearson e apresenta cerca de 91% da eficincia do coeficiente de correlao linear de Pearson quando as pressuposies para a aplicao do mesmo so satisfeitas. O Coeficiente (gama) mede o grau de associao entre duas variveis categricas ordinais, organizadas em uma tabela de contingncia. Como o coeficiente varia entre 1 e +1, o resultado interpretado da mesma forma que o coeficiente de correlao de Pearson. Se o coeficiente = 0, indica que a associao nula. Quando || = 1, tem-se associao positiva ou negativa perfeita. Quanto mais prximo de 1, maior ser o grau de associao entre as variveis. se 0 < || < 0,30, existe fraca correlao linear. Se 0,30 ||< 0,60, existe correlao linear regular. Se 0,60 || < 0,90, existe correlao linear forte. Finalmente, se 0,90 || < 1, existe correlao linear muito forte.

4. REFERNCIAS BIBLIOGRFICAS ARANGO, H. G. Bioestatstica terica e computacional. Rio de Janeiro: Guanabara Koogan, 2001. 235p. CALLEGARI-JACQUES, S.M. Bioestatstica: princpios e aplicaes / Sdia M. Callegari-Jacques Porto Alegre : Artmed, 2003. 255p. COCHRAN, W.G. Sampling techniques. 3.ed. New York: John Wiley & Sons, 1953. 422p. CONOVER, W. J. Practical nonparametric statistics. 3.ed. New York: John Wiley & Sons, 1999. 584p. COSTA NETO, P.L..O. Estatstica. So Paulo: Edgar Blcher, 1977. 264p. DORIA FILHO, U. Introduo bioestatstica para simples mortais / Ulysses Doria Filho. So Paulo: Elsevier, 1999. 7a reimpresso. 158 p. ESTRELA, C. Metodologia cientfica. So Paulo: Artes Mdicas, 2001. 469 p. FILHO, N.A.; ROUQUAYROL, M.Z. Introduo epidemiologia. 3.ed. Rio de Janeiro: Guanabara Koogan S.A., 2002. 293p. GUERRA, M.J.; DONAIRE, D. Estatstica indutiva : teoria e aplicaes. 3.ed. So Paulo: Cincia e Tecnologia, 1986. 312p. DAHLBERG, G.. Statistical methods for medical and biological students. London: George Allen & Unwin LTD, 1990. 232 p. IGNCIO, S.A. Estatstica como ferramenta para anlise de dados quantitativos e qualitativos para Cincias biolgicas e da sade. 2008, 77p. JEKEL, J.F. Epidemiologia, bioestatstica e medicina preventiva / James F. Jakel, Joann G. Elmore e David L. Katz; trad. Ricardo savaris. Porto Alegre: Artes Mdicas Sul, 1999. 328 p. JERROLD, H.Z. Bioestatistical analysis. Prentce Hall: Upper Saddle River, New Jersey, 1996. 662 p.

SIEGEL, S. Estatstica no paramtrica para as cincias do comportamento. So Paulo: McGraw-Hill, 1975. 350p. SPIEGEL, M. R. Probabilidade e estatstica. So Paulo: Mc Graw-Hill, 1978. 518p. SUKHATME, P.V. et. al. Sampling theory of survey, with applications. Ames, Iowa, Iowa State College Press, 1984. 526 p. THOMPSON, S.K. Sampling. Pensylvania. John Wiley & Sons, Inc. 1992. 343p. TOLEDO, G.L.; OVALLE, I.I. Estatstica bsica. So Paulo: Atlas, 1991. 459p. TRIOLA, M.F. Introduo Estatstica. LTC Livros Tcnicos e Cientficos Editora, 1999. VIEIRA, S.M. Bioestatstica: tpicos avanados. 1.ed. So Paulo: Campus, 2003. 228p. VIEIRA, S.M. Introduo a bioestatstica. 3.ed. So Paulo: Campus, 1998. 296p. WERKEMA, M.C.C. Como estabelecer concluses com confiana: entendendo inferncia estatstica. Belo Horizonte, MG: Fundao Christiano Ottoni, Escola de Engenharia da UFMG, 1996. 279 p. (Srie Ferramentas da Qualidade). WONNACOTT, R.J.; WONNACOTT, T.H. Fundamentos de estatstica: descobrindo o poder da estatstica. Rio de Janeiro: Livros Tcnicos e Cientficos, 1985. 356p.

Vous aimerez peut-être aussi