Vous êtes sur la page 1sur 8

Estatística Não Paramétrica

Os testes paramétricos exigem suposições sobre a natureza ou forma da população


envolvida, porque se baseiam em amostragem de uma população com parâmetros específicos, tais
como a média , o desvio padrão  ou a proporção p. Esses métodos paramétricos usualmente
devem enquadrar-se em condições um tanto estritas, como a exigência de que os dados amostrais
provenham de uma população distribuída normalmente. Nesta disciplina, vamos introduzir métodos
não-paramétricos, que não dependem daquelas exigências.

VANTAGENS DESVANTAGENS
1. Podem ser aplicados a uma ampla 1. Os métodos não-paramétricos tendem
diversidade de situações, porque não a perder informação, porque os dados
dependem das exigências mais numéricos exatos são freqüentemente
rígidas próprias de seus reduzidos a uma forma qualitativa.
correspondentes paramétricos. 2. Os testes não-paramétricos não são
2. Podem freqüentemente ser aplicados tão eficientes quanto os testes
a dados não-numéricos, como sexo paramétricos.
dos entrevistados.
3. Os métodos não-paramétricos em
geral envolvem cálculos mais simples
do que seus correspondentes
paramétricos

Uma importante classe de teste não-paramétrico é constituída pelos chamados testes de


aderência, em que a hipótese testada refere-se à forma da distribuição da população. Nesses
testes, admitimos, por hipótese, que a distribuição da variável de interesse na população seja
descrita por determinado modelo de distribuição de probabilidade e testamos esse modelo, ou
seja, verificamos a boa ou má aderência dos dados da amostra ao modelo.

1.1 Teste do Qui-quadrado χ 2 de uma amostra

Para podermos comparar um grupo observado (dados amostrais) com um grupo esperado
(dados teóricos supondo H0 verdadeira), utilizaremos o Teste do Qui-quadrado χ 2 que baseia-
se na estatística
O  E 2
χ2   E
onde O = número de casos observados;
E = número de casos esperados, segundo o modelo testado;
 = indica somar todos os valores.

Valores Críticos
a. Na tabela do Qui-quadrado encontram-se os valores críticos, tomando-se k-1 graus
de liberdade, onde k é o número de categorias.
b. Os teste do Qui-quadrado é unilateral à direita.

1
1º Exemplo: Muitas pessoas acreditam que, quando um cavalo inicia uma corrida, tem mais
chance de ganhar se sua posição na linha de partida está mais próxima do limite interno da pista. A
posição 1 está mais próxima do limite interno, seguida pela posição 2, e assim por diante. A tabela
abaixo relaciona o número de vitórias de cavalos nas diferentes posições de partida. Teste a
afirmação de que as probabilidades de vitória não são as mesmas para as diferentes posições de
partida, com nível de significância  = 0,05.

Posições de partida de cavalos vencedores


Posição de Partida
1 2 3 4 5 6 7 8

Nº de 29 19 18 25 17 10 15 11
Vitórias

Solução:
Se a chance de vitória em cada posição de partida é a mesma, o número esperado de vitória teve ser
o mesmo em qualquer posição,
1
E  144.  18 para qualquer posição.
8
Passo 1: H0 : Todas as probabilidades de vitória são as mesmas.
H1 : Ao menos uma das probabilidades é diferente.

Passo 2:  = 0,05
O  E 2
Passo 3: Encontrar a estatística do teste χ 2
  E
Posição de O E O-E (O – E)2 (O - E) 2
Partida
E
1 29 18 11 121 6,7222
2 19 18 1 1 0,0556
3 18 18 0 0 0
4 25 18 7 49 2,7222
5 17 18 -1 1 0,0556
6 10 18 -8 64 3,5556
7 15 18 -3 9 0,5
8 11 18 -7 49 2,7222
Total 144 144 16,3334
Este é o valor do χ 2
Passo 4:
Na tabela do Qui-quadrado encontra-se o valore crítico χ 2 = 14,067, tomando-se 8-1 = 7 graus
de liberdade, e  = 0,05.

Passo 5: Como a estatística do teste está na região critica, rejeita-se a hipótese nula.

2
Passo 6: Conclusão
Há evidencia suficiente para apoiar a afirmação de que as probabilidades de vitória
são diferentes, conforme a posição de largada.

2 Exemplo: Mars, Inc. afirma que seus confeitos M&M apresentam a seguinte distribuição
de cores: 30% marrom, 20% amarelo, 20% vermelho, 10% laranja, 10% verde e10% azul. Com a
tabela abaixo e um nível de significância de 0,05, teste a afirmação de que a distribuição de cores é
a afirmada por Mars, Inc

Marrom Amarelo Vermelho Laranja Verde Azul Total


O 33 26 21 8 7 5 100
E 30 20 20 10 10 10 100

Solução
Passo 1: H0 : 30% marrom, 20% amarelo, 20% vermelho, 10% laranja, 10% verde e10% azul.
H1 : Ao menos uma das proporções acima é diferente do valor alegado.

Passo 2:  = 0,05
O  E 2
Passo 3: Encontrar a estatística do teste χ 2
  E
Cor O E O-E (O – E)2 (O - E) 2
E
Marrom 33 30 3 9 0,3
Amarelo 26 20 6 36 1,8
Vermelho 21 20 1 1 0,05
Laranja 8 10 -2 4 0,4
Verde 7 10 -3 9 0,9
Azul 5 10 -5 25 2,5
Total 100 100 5,95
Este é o valor do χ 2
Passo 4:
Na tabela do Qui-quadrado encontra-se o valore crítico χ 2 = 11,071, tomando-se 6-1 = 5 graus
de liberdade, e  = 0,05.

Passo 5: Como a estatística do teste não está na região critica, não rejeita-se a hipótese nula.

Passo 6: Conclusão: Não há evidencia suficiência para rejeitarmos a afirmação do


fabricante.

3
1.2 Teste do Qui-quadrado χ 2 de duas amostras

1.2.1 Teste de Independência

Um teste de independência testa a hipótese nula de que a variável linha e a variável coluna
em uma tabela de contingência não estão relacionadas, isto é, são independentes.
Ao testarmos a hipótese nula de independência entre as variáveis linha e coluna em uma
tabela de contingência, aplicam-se as seguintes suposições.
1. Os dados amostrais são selecionados aleatoriamente.
2. A hipótese nula H0 é a afirmação de que as variáveis linha e coluna são independentes;
a hipótese alternativa H1 afirma que as variáveis linha e coluna são dependentes.
3. Para cada célula na tabela, a freqüência esperada E é no mínimo 5.

No teste de independência entre as variáveis linha e coluna utiliza a seguinte estatística de


teste:
O  E 2
χ2   E
Valores Críticos
a. Na tabela do Qui-quadrado encontram-se os valores críticos, tomando-se (l -1)(c -1)
graus de liberdade, onde l é o nº de linhas e c é o nº de colunas.
b. Os teste do Qui-quadrado é unilateral à direita.

No teste com uma amostra, conhecíamos as probabilidades correspondentes e podíamos


facilmente determinar os valores esperados, mas a tabela de contingência não apresenta as
probabilidades de interesse. Assim, temos que estabelecer um método para obter os valores
esperados correspondentes.
A freqüência esperada E de cada célula da tabela pode ser calculada com auxilio da equação
abaixo:
E
Total de linhas Total de colunas 
Total Geral
1º Exemplo: Uma amostra de cem pessoas, que foram entrevistadas quanto a suas opiniões
sobre determinado projeto de lei, tendo sido obtidos os resultados dados abaixo. Teste a afirmação
que a opinião independe do sexo, com nível de 0,01 de significância.

Opinião
Sexo
Favorável Desfavorável Indiferente Totais
Homens 33 12 15 60
(24) (19,2) (16,8)
Mulheres 7 20 13 40
(16) (12,8) (11,2)
Totais 40 32 28 100

4
Solução
Passo 1: H0 : As variáveis são independentes;
H1 : As variáveis não são independentes.

Passo 2:  = 0,01
O  E 2
Passo 3: Encontrar a estatística do teste χ 2   E
O E O-E (O - E) 2
E
33 24 9 3,375
12 19,2 -7,2 2,7
15 16,8 -1,8 0,193
7 16 -9 5,063
20 12,8 7,2 4,05
13 11,2 1,8 0,289
100 100 15,67
Este é o valor do χ 2
Passo 4: Na tabela do Qui-quadrado encontra-se o valore crítico χ 2 = 9,21, tomando-se
(l-1)(c-1) = 1.2 = 2 graus de liberdade, e  = 0,01.

Passo 5: Como a estatística do teste está na região crítica, rejeita-se a hipótese nula.

Passo 6: Conclusão: Podemos rejeitar a hipótese de independência entre opinião e sexo.

1º Exemplo: Após as operações militares, no Golfo Pérsico, alegou-se um aumento


dramático da mortalidade entre as tropas americanas naquela região. Com os dados da tabela abaixo
e com o nível de significância de 0,05, teste a afirmação de que a causa de morte é independente de
a pessoa estar mobilizada em uma zona de combate.

Causa da Morte
Mobilização Ferimento Homicídio ou Totais
acidental Doença Suicídio
Em zona de 183 30 11 224
combate (137,09) (41,68) (45,23)

Fora da zona de 784 264 308 1356


combate (829,91) (252,32) (273,77)
Totais 967 294 319 1580

Solução Passo 1: H0 : As variáveis são independentes;


H1 : As variáveis não são independentes.

5
Passo 2:  = 0,05
O  E 2
Passo 3: Encontrar a estatística do teste χ 2   E
O E (O - E) 2
E
183 137,09 15,3748
30 41,68 3,2731
11 45,23 25,9052
784 829,91 2,5397
264 252,32 0,5407
308 273,77 4,2798
1580 1580 51,913
Este é o valor do χ 2
Passo 4:
Na tabela do Qui-quadrado encontra-se o valore crítico χ 2 = 5,991, tomando-se (l-1)(c-1) = 1.2 = 2
graus de liberdade, e  = 0,05.

Passo 5: Como a estatística do teste está na região crítica, rejeita-se a hipótese nula.

Passo 6: Conclusão: Parece haver uma relação entre a causa de morte e a de a pessoa
estar mobilizada em uma zona de combate.

Entregar a resolução dos exercícios abaixo:


EXERCÍCIOS

1. É comum crença de que ocorre um maior número de acidentes fatais com


automóveis em determinados dias da semana, como sexta ou sábado. Relacionam-se
abaixo os números de casos fatais para os diferentes dias da semana. No nível de
0,05 de significância, teste a afirmação de que a freqüência da ocorrência de
acidentes é a mesma em qualquer dia da semana.
Dia Dom Seg Ter Qua Qui Sex Sab
Nº de ocorrências fatais 31 20 20 22 22 29 36

2. A tabela abaixo mostra o resultado de um estudo de 147 acidentes industriais que


exigiram tratamento médico. Teste a afirmação de que os acidentes ocorrem com a
mesma proporção nos cinco dias da semana.
Dia Seg Ter Qua Qui Sex
Nº de acidentes 31 42 18 25 31

6
3. Em ano recente, houve 116 mortes por homicídios em Richmond, Virginia. Se as
freqüências de mortes nos diferentes dias se ajustam a uma distribuição de Poisson,
se apresentarão como na tabela a seguir. Com nível de 0,05 de significância, teste se
as freqüências observadas se ajustam a uma distribuição de Poisson. (Obs: nem
todas as freqüências esperadas são no mínimo 5.)
Número de Homicídios
0 1 2 3 4
Nº efetivos de dias 268 79 17 1 0
Nº esperados de dias 265,6 84,4 13,4 1,4 0,1

4. A seguir temos uma distribuição de freqüências observadas para uma amostra de


QI´s:
Escore de Qi Menos de 80 80-95 96-110 111-120 Mais de120 total
Freqüências observadas 20 20 80 40 40 200
Freqüências esperadas 17,173 59,245 75,189 31,22 17,173 200
Com nível de 0,01 de significância, teste se os escores de QI observados se ajustam a
uma distribuição normal com media 100 e desvio padrão 15.

5. A tabela a seguir relaciona resultados de uma pesquisa obtidos de uma amostra


aleatória de vitimas de diferentes crimes. Com o nível de 0,05 de significância, teste
a afirmação de que o tipo de crime é independente do fato de o criminoso ser um
estranho.
Homicídio Roubo Assalto Total
O criminoso era um estranho 12 379 727 1118
O criminoso era conhecido ou parente 39 106 642 787
Total 51 485 1369 1905

6. Um estudo de usuários e não-usuários do cinto de segurança resultou nos dados


amostrais aleatórios resumidos na tabela a seguir. Teste a afirmação de que a
quantidade de fumo é independente do uso do cinto de segurança, com o nível de
0,05 de significância. Uma teoria plausível é que as pessoas que fumam mais estão
menos preocupadas com a sua saúde e segurança, sendo, assim, menos propensas a
usar os cintos. Os dados amostrais apóiam esta teoria?
Nº de cigarros fumados por dia
0 1-14 15-34 35 ou mais Total
Usam cinto de segurança 175 20 42 6 243
Não usam cinto de segurança 149 17 41 9 216
Total 324 37 83 15 459

7. A tabela a seguir apresenta dados amostrais usados pelo estatístico Karl Pearson em
1909. o tipo de crime aparenta ter alguma relação com o fato de o criminoso beber
ou ser abstêmio?
Incêndio criminoso Estupro Violência Furto Falsificação Fraude
Bebedor 50 88 155 379 18 63
Abstêmio 43 62 110 300 14 144

7
8