Vous êtes sur la page 1sur 11

96

8. AMOSTRAGEM

8.1. Introdução

A estatística é uma ciência que, organiza, descreve, analisa e interpreta os dados


experimentais. O conjunto de todos os dados experimentais disponíveis sobre uma determinada
característica de interesse para o estudo estatístico recebe o nome de população.
Sempre que, se pretende realizar algum estudo que implique em tirar conclusões sobre
um elevado número de dados, utiliza-se uma parte desta população que é selecionada e usada
com o objetivo de obter informações sobre a mesma.
O processo pelo qual se estabelece critérios de seleção e análise da fração da população
que servirá para o estudo estatístico, recebe o nome de amostragem, e ao conjunto de dados
selecionados com o objetivo de obter informações sobre a população denomina-se amostra.
A teoria da amostragem é um estudo das relações existentes, entre uma população e as
amostras dela extraída, é de grande valor em muitas conjecturas. Por exemplo, é útil para a
avaliação de grandezas desconhecidas da população (como a média, a variância, o coeficiente
variação, etc.), freqüentemente denominamos parâmetros populacionais ou, abreviadamente,
parâmetros, através do conhecimento das grandezas correspondentes das amostras,
denominadas de estatísticas amostrais, abreviadamente, estatísticas.
A teoria da amostragem é também útil para determinar se as diferenças observadas entre
duas amostras são realmente devidas a uma variação casual ou se são verdadeiramente
significativas.
A fim de que as conclusões da teoria da amostragem e da inferência estatística sejam
válidas, as amostras devem ser escolhidas de modo a serem representativas de uma população. O
estudo dos métodos da amostragem e dos problemas correlatos que surgem, é denominado
planejamento experimental.

Prof. João Eduardo Pereira -ESTATÍSTICA BÁSICA - Dep. Estatístia


97

8.2. Tipos de amostragem

Pode-se dividir o processo de seleção de amostra em dois grandes grupos: amostragem


probabilística e amostragem não probabilística. Quando obtém-se uma amostra de uma
população, onde todos os elementos possuem uma probabilidade conhecida e diferente de zero
de fazer parte da amostra, diz-se que a amostragem é do tipo probabilística. Quando as
condições anteriores não são satisfeitas, a amostragem é dita não probabilística.
Um ponto a ser levado em consideração é que uma amostragem probabilística só pode
ser realizada, quando se dispõe de uma população finita e totalmente acessível, pelo fato de que
é necessário que todos os elementos da população possuam chance de fazer parte da amostra,
esta é uma pressuposição difícil de ser obtida, principalmente quando se trata de uma população
demasiadamente grande, ou ainda, quando a população é constituída de material contínuo.
As principais técnicas de amostragem probabilística são:
a) Amostragem aleatória simples;
b) Amostragem sistemática;
c) Amostragem estratificada;
d) Amostragem múltipla.
Os principais casos que nos levam a uma amostragem não probabilística são:
a) População não totalmente acessível;
b) Amostragem a esmo ou sem norma;
c) População formada por material contínuo;
d) Amostragem intencional.

8.3. Técnicas de seleção de amostras

8.3.1. Amostragem aleatória simples

Esse tipo de amostragem, também chamada simples ou ao acaso, casual, elementar,


randômica, etc., equivale a um sorteio lotérico. Nela, todos os elementos da população possuem

Prof. João Eduardo Pereira -ESTATÍSTICA BÁSICA - Dep. Estatístia


98

igual probabilidade de pertencer em à amostra, e todas as possíveis amostras de tamanho n,


também possuem igual probabilidade de ocorrer.
Sendo “N” o número de elementos da população e “n” o número de elementos da
amostra, cada elemento da população possui a mesma probabilidade (N) de fazer parte da
amostra. A relação “n/N” denomina-se fração de amostragem. Na prática a, amostragem
aleatória simples pode ser realizada numerando-se a população de 1 até N, sorteando-se a seguir,
por meio de um dispositivo aleatório qualquer, “n” números desta seqüência, aos quais
corresponderão aos elementos sorteados para a amostra.
Um instrumento útil para realizar o sorteio acima descrito é o uso da tabela de números
aleatórios.

Amostras com e sem reposição


Se um número é extraído de uma urna, deve-se decidir se ele será ou não reposto na
mesma antes de uma segunda extração. No primeiro caso, o número pode ocorrer várias vezes,
enquanto no segundo, ele só pode ocorrer uma vez. A amostra em que um elemento de uma
população pode ser escolhido mais de uma vez é denominada amostra com reposição, enquanto
que, se cada elemento só pode ser escolhido uma vez, é denominada amostra sem reposição.
As populações podem ser finitas ou infinitas. Se, por exemplo, extraem-se
sucessivamente 10 bolas, sem reposição, de uma urna que contém 100 bolas, está se tomando a
amostragem de uma população finita enquanto, se lança uma moeda 50 vezes e se conta o total
de caras, esta se considerando a amostra de uma população infinita.
Uma população finita, cuja amostragem é feita com reposição pode ser considerada
teoricamente, como infinita, visto que qualquer número de amostras pode ser extraído sem
exaurir a população.
Em uma população finita, onde se efetua uma amostragem aleatória simples sem
reposição existem Cn,N possíveis amostras, todas igualmente prováveis.

Amostragem Sistemática
Trata-se de uma variação da amostragem simples ao acaso, muito conveniente, quando
a população esta naturalmente ordenada, como fichas em um fichário, listas telefônicas, etc.
Procedimento:

Prof. João Eduardo Pereira -ESTATÍSTICA BÁSICA - Dep. Estatístia


99

Seja “N” o tamanho da população e “n” o tamanho da amostra. Então calcula-se o


intervalo de amostragem N/n ou inteiro mais próximo “a”. Sorteia-se utilizando-se a tábua dos
números aleatórios, um número “x” entre 1 e “a”, a partir disto forma-se a amostra com os
elementos correspondentes as ordens x, x + a, x + 2a,...., x + (n - 1)a (Termo geral de uma P.A.
de razão a) .

Amostragem Estratificada
Quando se tem uma população heterogênea, mas que quando dividida em
subpopulações, estas apresentam-se homogêneas, nesse caso tipo de amostragem mais indicado
é a amostragem estratificada. A amostragem estratificada divide uma população de “N”
elementos, em extratos compostos de N1, N2, ..., Nk elementos. Nesse caso considera-se cada
subconjunto da população como se fossem uma população em particular.
Os principais motivos para se usar a técnica de estratificação são:
a) Para obter-se maior precisão sobre certas subdivisões da população;
b) Porque os problemas de amostragem podem se apresentar sensivelmente diferentes
em partes diversas da população;
c) A estratificação pode proporcionar um aumento de precisão nas estimativas das
características da totalidade da população.
Tipos de Amostragem por Estratificação
a) Uniforme
A estratificação uniforme ocorre quando sorteia-se igual número de elementos em cada
estrato. Diga-se que:
NH = número de estratos;
Nh = número de unidades a serem observadas;
n = tamanho da amostra, então tem-se:
Nh = n /NH
Geralmente utilizada quando os estratos da população forem pelo menos
aproximadamente do mesmo tamanho.

Prof. João Eduardo Pereira -ESTATÍSTICA BÁSICA - Dep. Estatístia


100

b) Proporcional
A estratificação proporcional ocorre quando o número de unidades a serem sorteadas
por estrato é proporcional ao tamanho do estrato. Considerando-se:
N = tamanho da população;
n = tamanho da amostra;
Nh = tamanho do estrato;
nh = número de elementos a serem estudados, nesse caso temos
Nh
nh =  n
N
c) Ótima
Nesse tipo de amostragem, toma-se em cada estrato um número de elementos
proporcional ao número de elementos do estrato e, também, a variação da variável de interesse
dentro do estrato, medida por um desvio padrão. Assim:
Nh  h
nh =  n, onde  é o desvio padrão da variável em estudo dentro do estrato
 Nh  h
h.

8.4. Distribuições Amostrais

Dada uma amostra de uma população qualquer, as estatísticas calculadas para descrever
a amostra são variáveis aleatórias, pois dependem dos valores numéricos contidos na amostra. A
média da amostra, por exemplo, é a média aritmética de um grupo de observações aleatórias e
seu valor depende dos elementos que forem
selecionados para constituírem a amostra. Uma amostra diferente terá, em geral, uma média
diferente.
Como a média e outras estatísticas são variáveis aleatórias, deverão as mesmas possuir
distribuições teóricas de probabilidades, consistidos de todos os valores possíveis da estatística
em questão, cada um dos quais com a sua probabilidade de ocorrência e, que, correspondem a
todas as amostras possíveis do mesmo tamanho que podem ser tiradas da população original ou
paterna. Tais distribuições são chamadas distribuições amostrais.

Prof. João Eduardo Pereira -ESTATÍSTICA BÁSICA - Dep. Estatístia


101

8.4.1. Distribuição Amostral das Médias

Admita-se que todas as amostras possíveis de tamanho N são retiradas, sem reposição,
de uma população finita de tamanho Np > N. Se a média e o desvio padrão da distribuição
amostral das médias forem designados por  x e  x, e os valores correspondentes da
população o forem por  e  , respectivamente, então:
 Np  N
 x   e x  
n Np  1

Se população for infinita, ou se a amostragem for tomada com reposição, os resultados


acima reduzir-se-ão a:

x   e  
x n
Do cálculo das probabilidades sabemos:
a) multiplicando-se os valores de uma variável aleatória por uma constante, a média fica
multiplicada por uma constante;
b) a média de uma soma de variáveis aleatórias é igual a soma das médias das variáveis;
isto posto temos:
  xi   1
 x  E(x ) = E       ( x1   x 2  ...........   xn )
 n   n

 1
   (n  ) = 
 n
c) multiplicando-se os valores de uma variável aleatória por uma constante, a variância
fica multiplicada pelo quadrado da constante;
d) a variância de uma soma de variáveis aleatórias independentes é igual a soma das
variâncias:
2
  X i   1 1 2 ,
 x  V  x  V       ( x12   x22 .... xn2 ) = 2  n   2 
 n   n n n
se a amostragem for de população infinita ou com reposição.

Prof. João Eduardo Pereira -ESTATÍSTICA BÁSICA - Dep. Estatístia


102

8.4.2. Distribuição Amostral das Proporções

Seja X uma variável aleatória descrevendo uma população binomialmente distribuída e


seja P a proporção de elementos desta população que apresentam uma característica
considerada.
Seja (x1, x2, x3, .........., xn) uma amostra aleatória desta população e seja Y o número
de elementos, que apresentam a característica considerada, na amostra. Então Y/p = P’ é definida
como sendo a proporção amostral.
É imediato que Y é uma variável aleatória com distribuição binomial com parâmetros
“n” e “p”, consequentemente P’ também é uma variável aleatória cuja distribuição de
probabilidade é chamada distribuição amostral das proporções, sendo a média e variância dadas
por:
 Y  1 1
 p '  E ( P')  E      E ( Y)   n  p  p
 n   n n

 p'  p

 Y  1  1
 2p  V P'  V    2   V(Y)  2  n  p  (1  p)
 n n  n
p  (1  p)
 2p ' 
n

8.4.3. Distribuição Amostral da Variância

Uma amostra de tamanho (n)


2
Se s é a variância de uma amostra aleatória de tamanho n, tomada de uma população

normal, com variância  2 , então x 2 


 n  1 s 2 é um valor da variável x 2 , tendo uma
 2

distribuição de qui-quadrado com   n  1 graus de liberdade.


Exemplo:
Um fabricante de baterias para automóvel garante que as mesmas tem duração média de
3 anos e desvio padrão de 1 ano. Se 5 de suas baterias têm vida de 1,9; 2,2; 3,0; 3,5 e 4,2 anos
esta o fabricante ainda convencido que sua baterias tem um desvio padrão de 1 ano.

Prof. João Eduardo Pereira -ESTATÍSTICA BÁSICA - Dep. Estatístia


103

5.48,26  15 2 4.0,815
s2   0,815  x 2   3,26 é um valor da distribuição de x 2
5.4 1
com 4 graus de liberdade, caiam entre 0,484 e 11,143 quando  2 =1, o valor de x 2 calculado é
razoável. Portanto o fabricante, não tem razão para suspeitar que o desvio é diferente que 1 ano.

Duas amostras de tamanho (n1) e (n2)


Se s1 2 e s 2 2 são variâncias de amostras aleatórias independentes, de tamanhos n1 e n2

tiradas de populações normais, com variâncias  1 2 e  1 2 respectivamente, teremos:


2 2
 2 s1
F= 2 2
que é um valor da variável F, tendo uma distribuição F com  1  n1  1 e
 1 s2
 2  n2  1 graus de liberdade.

8.4.4. Distribuição Amostral da Diferença de Duas Médias

Seja uma população composta por 3, 4, e 5 então a média e a variância , serão:


3 45  2  2  2
 4 e  2  3 4  4 4  5 4  2
3 3 3
Uma segunda população com os valores 0 e 3 terão  e  2 dados por:
2 2
03 3  3  3
0    3  
  e 2  2  2 9
2 2   
2 4
Para a primeira população determina-se todas as amostras de tamanho n 1= 2 com

reposição e calcula-se suas médias  x1  . Para a segunda população n2= 3, com reposição e

calcula-se suas as suas médias  x  . As diferenças entre as médias  x1  x 2  será apresentada


abaixo.

Prof. João Eduardo Pereira -ESTATÍSTICA BÁSICA - Dep. Estatístia


104

n1 amostra x1 n2 amostra x2
1 3;3 3,0 1 0;0;0 0
2 3;4 3,5 2 0;0;3 1
3 3;5 4,0 3 0;3;0 1
4 4;3 3,5 4 3;0;0 1
5 4;4 4,0 5 0;3;3 2
6 4;5 4,5 6 3;0;3 2
7 5;3 4,0 7 3;3;0 2
8 5;4 4,5 8 3;3;3 3
9 5;5 5,0

A distribuição de x1  x 2 com reposição são:


x1  x 2 f
0;0 1
0;5 2
1;0 6
1;5 8
2;0 13
2;5 12
3;0 13
3;5 8
4;0 6
4;5 2
5;0 1
A diferença entre x1 e x 2 poderá ser obtida calculando-se

11

 f x i 1  x2 
 x1  x2  11
 2,5  4  1,5  1   2 ou pela propriedade das médias
f i 1
i

temos  x  x21  E  x1  x 2   E  x1    x 2   1   2 .

Também usando as propriedades das variâncias sobre diferenças de médias

2 2
1  2
independentes, tem-se:  2
x1  x2   x  x 
1
2
2
2

n1

n2
. Portanto no exemplo anterior tem-se:

2 9
  3  4  13 , sendo que esse resultado poderá ser facilmente verificado, calculando-
2
x1  x2
2 3 12

Prof. João Eduardo Pereira -ESTATÍSTICA BÁSICA - Dep. Estatístia


105

se a variância dos dados na distribuição de freqüência de x1  x 2 , e é aproximadamente normal

Z
 x1  x2    1   2 
1  2
2 2

com:  x  x  1   2 ,  x  x   então, 2
 1  22 sendo Z a variável
1 2 1 2
n1 n2 
n1 n2
normal reduzida.
 x1  x2    1   2 
Quando  1 2   1 2 , teremos Z = 1 1 desconhecendo-se a  2 , e quando
 2   
 n1 n2 

(n1, n2 <30), a mesma poderá ser substituída por uma combinação de s1 2 e s 2 2 dado por

2  n1  1 s1   n2  1 s 22
2

sp  . Se x1 e s12 são a média e a variância de uma amostra com n 1


n1  n2  2

elementos tirados de uma população N   , , 


2
1 e x 2 e s 22 com n2 elementos de uma

 x1  x2    1   2 
t
população N  2 ,   2
2  , se  2
1     , então
2
2
2
sp
1 1

é uma variável t de
n1 n2

Student com   n1  n2  2 graus de liberdade

8.5. Exercícios

1. Um dos concentrados protéicos de peixe (FPC) obtido pelo método experimental apresentou
para a traíra os seguintes teores de cinza (%):

3,57 3,45 3,90 3,75 3,75 3,70 3,75 3,95 4,00


3,90 3,70 3,72 3,60 3,85 3,25 3,65 3,80 3,88 3,81
3,66 3,65 3,49 3,48 3,15 3,12 3,32 3,47 3,46 3,40
3,67 3,72 3,68 3,75 3,70 3,18 3,46 3,55 3,49 3;73
3,89 3,90 3,91 3,94 3,45 3,52 3,50 3,56 3,38 3,37
3,29 3,16 3,20 3,19 3,43 3,48 3,56 3,59 3,67 3,77
a) Determinar as estimativas da média e variância.

Prof. João Eduardo Pereira -ESTATÍSTICA BÁSICA - Dep. Estatístia


106

b) Determinar o IC sendo alfa = 0,05, a partir de uma amostra de 15 valores das 59 observados.

2. Terneiros de sobreano manejados em pastagem nativa durante 12 meses, dosificados em julho


e janeiro com anti- helmíntico apresentaram os seguintes ganhos de peso em kg: 14,2; 13,8;
10,5; 11,7; 12,5. Considerar todas as amostras possíveis de tamanho 2, que podem ser
extraídas dessa população, com reposição. Determinar:
a) Média da população e desvio padrão da população.
b) Média da distribuição amostral das médias.
c) Desvio padrão da distribuição amostral das médias, isto é, o erro padrão das médias.

3. Resolver o problema anterior para o caso da amostragem sem reposição.

4. Duas rações devem ser comparadas em leitões, mantidos em baias individuais, sendo o
aumento de peso o atributo a ser medido. Quantos leitões devem ser usados nos dois grupos ?

5. Deseja-se retirar de um grupo de fazendas numeradas de 1 a 119 uma amostra sistemática de


17 delas. Foi sorteado o número 3 como começo casual. Pergunta-se:
a) Qual o intervalo dessa amostra sistemática ?
b) Quais os números correspondentes às fazendas sorteadas ?

Prof. João Eduardo Pereira -ESTATÍSTICA BÁSICA - Dep. Estatístia

Vous aimerez peut-être aussi