Vous êtes sur la page 1sur 9

Em um primeiro momento, procuramos, por meio de um recorte realizado na teoria da amostragem, pesquisar quais abordagens distintas se tm em relao ao tamanho

da amostra aleatria simples para a estimao de propores populacionais. Poucos estudiosos de Estatstica tratam do assunto, especialmente entre aqueles que destinam seu trabalho ao usurio de metodologias quantitativas aplicadas s diversas reas do conhecimento. Por outro lado, os livros tcnicos, especficos da Teoria da Amostragem, no apresentam esse contedo de forma acessvel grande maioria dos pesquisadores. Apresentamos, ento, uma anlise de diferentes procedimentos disponveis para a determinao do tamanho da amostra aleatria simples, destinada ao clculo de estimativas de propores e percentagens populacionais. Para tal, realizamos simulaes, utilizando planilhas do Excel, considerando-se diversos valores de parmetros determinantes do tamanho da amostra aleatria simples, de acordo com a equao analisada. Anlise dos Procedimentos Iniciamos com a anlise da situao em que no se pode determinar o tamanho da populao (N). Nesse caso, o tamanho mnimo da amostra aleatria simples pode ser determinado atravs do clculo de n0, considerado uma primeira aproximao para o clculo do tamanho da amostra, dado por: n0 = 1/ E02 , (I), sendo E0 o erro amostral tolervel.

A expresso acima apresentada mantm fixo o nvel de confiana de 95% e a varincia populacional no caso de maior heterogeneidade da populao, ou seja, quando a proporo do evento na populao em estudo de 0,5. A fixao da proporo populacional do evento em 0,5, deve-se ao fato de ser esta a pior situao possvel em termos de variabilidade populacional. Assim, pode-se considerar que a expresso (I) destina-se a trs situaes: uma primeira, na qual no se conhece uma estimativa da proporo do evento na populao em estudo, uma vez que qualquer que seja o valor da proporo, este d origem a uma variabilidade menor que aquela vinculada proporo 0,5. Observamos que neste caso preciso maior cuidado com a determinao da amostra e, consequentemente, a quantidade de elementos que a comporo. Uma segunda situao na qual o valor de uma estimativa preliminar para a proporo do evento estudado igual a 0,5 e, uma ltima, na qual o estudo destina-se estimao da proporo de vrios eventos da populao, com pelo menos um dos eventos sem presena de uma estimativa anterior de sua proporo na populao. A seguir, apresentamos uma tabela com aplicaes da frmula acima para alguns valores de erro amostral tolervel, a fim de se exemplificar a relao entre E 0 e uma primeira estimativa para o tamanho da amostra (n0). Tabela 1. Exemplos de tamanho de amostra (n0) em funo do erro amostral tolervel[3].

E0 0,010 0,015 0,020 0,025 0,030 0,035 0,040 0,045 0,050

n0 10000 4444 2500 1600 1111 816 625 494 400

Conforme podemos observar na tabela 1, quanto menor o erro amostral tolerado pelo pesquisador, maior o tamanho da amostra necessrio para se atend-lo. Considerando que o erro amostral tolervel representa o quanto o pesquisador admite errar na estimao dos parmetros de interesse, ou seja, especifica o intervalo em torno do valor que a estatstica acusa, dentro do qual encontra-se o verdadeiro valor do parmetro que se deseja estimar, quanto menor o erro amostral tolerado pelo pesquisador, maior ser o tamanho da amostra para que se possa obter essa maior preciso da estatstica. Assim, por exemplo, se o pesquisador tolerar no mximo um erro de 2%, i.e., que o verdadeiro valor do parmetro seja no mximo 2% menor ou 2% maior que o valor que a estatstica acusa na amostra, ele ter que trabalhar com uma amostra aleatria composta por 2500 indivduos da populao, ao passo que, se o pesquisador tolerar um erro amostral de 2,5%, ele ter que trabalhar com uma amostra aleatria composta por 1600 indivduos da populao e o verdadeiro valor do parmetro da populao estar no intervalo entre 2,5% a menos at 2,5% a mais do valor que a estatstica acusa na amostra, com 95% de probabilidade. Portanto, quanto maior a preciso que se deseja associar estimativa estatstica, maior o tamanho amostral necessrio para atend-la. Ainda sem conhecer o tamanho N da populao, considere-se a situao em que se conhece uma estimativa da variao populacional obtida por meio de um levantamento piloto ou em pesquisas prvias, e que deseja-se ter a opo de alterar o nvel de confiana associado ao tamanho da amostra. Nesse caso, a determinao do tamanho de uma amostra aleatria simples, n0, obtida atravs da seguinte expresso: n'0 = z2.p.(1- p)/ E02 , (II) ,

sendo z = valor da distribuio normal para o nvel de confiana desejado; p = estimativa da proporo do evento na populao; E0 = erro amostral tolervel. A tabela 2 apresenta aplicaes da frmula (II) para alguns valores de erro amostral tolervel, nvel de confiana e estimativa da proporo do evento na populao, a fim de se exemplificar a dependncia de n0 em relao a E0, p e o nvel de confiana. Tabela 2. Exemplos de tamanho de amostra (n 0) em funo da estimativa da proporo do evento na populao (p), do erro amostral tolervel (E 0) e do nvel de confiana.

P 0,50 0,50 0,40 0,40 0,30 0,30 0,20 0,20 0,10 0,10

E0 0,020 0,025 0,020 0,025 0,020 0,025 0,020 0,025 0,020 0,025

n0 com nvel de 90% n0 com nvel de 95% n0 com nvel de 99% de confiana de confiana de confiana 1691 2401 4128 1082 1537 2642 1624 2305 3963 1039 1475 2536 1421 2017 3468 909 1291 2219 1082 1537 2642 693 983 1691 609 864 1486 390 553 951

Conforme podemos observar na primeira linha da tabela 2, mantendo-se fixos o valor da estimativa da proporo do evento (p) e o erro amostral tolervel (E 0), quanto maior o nvel de confiana, maior o tamanho da amostra necessrio para atende-lo. Quanto maior a certeza (probabilidade) de o parmetro populacional pertencer ao intervalo construdo com base na estimativa estatstica da amostra e o erro amostral tolerado pelo pesquisador, maior o tamanho da amostra para garantir a probabilidade (nvel de confiana) desejada pelo pesquisador. Por exemplo, se o pesquisador desejar ter a garantia (probabilidade ) de 90% que o verdadeiro valor do parmetro populacional pertena ao intervalo determinado pela estimativa estatstica na amostra e o erro amostral tolervel de 2%, dever trabalhar com uma amostra de tamanho 1691, ao passo que se esse pesquisador desejar ter uma garantia maior, de 95%, que o verdadeiro valor do parmetro populacional pertena ao intervalo centrado na estimativa estatstica, com o mesmo erro amostral tolervel de 2%, para mais ou para menos, dever trabalhar com uma amostra aleatria composta por 2401 indivduos da populao. Por outro lado, fixando-se o nvel de confiana, i.e., observando-se cada coluna de n0 individualmente, quanto mais a estimativa de p se distancia de 0,5, menor o tamanho da amostra necessrio para se garantir a representatividade da populao. Como o valor de p determina a variabilidade populacional, quanto mais homognea for a populao (p mais distante de 0,5), menor o tamanho da amostra para represent-la, pois teremos uma menor variabilidade nas respostas. Por exemplo, conhecendo-se que a estimativa para p, na populao em estudo, de 0,1, pode-se trabalhar com uma amostra constituda por 553 elementos, para um nvel de 95% de confiana e E0 = 0,025 (ou 2,5%), a fim de se representar o comportamento geral da populao, ao passo que caso no se tenha uma estimativa de p, i.e., trabalha-se com p = 0,5 (ou, sabe que a estimativa de p 0,5 ambos os casos se equivalem), precisa-se de uma amostra de 1537 elementos, para se atingir o mesmo nvel de confiana e erro amostral, ou seja, uma amostra trs vezes maior que a primeira. Ainda, do mesmo modo que ocorre para o clculo de n 0 (tabela 1), observa-se na tabela 2 que quanto maior o valor do erro amostral tolervel, menor o tamanho de amostra associado.

Com base nas constataes acima descritas, pode-se observar que o tamanho da amostra diminui em funo do fato de a populao ser mais homognea (estimativa de p se distancia de 0,5), trabalhar-se com menores nveis de confiana e maiores erros amostrais tolerveis. Consideramos o clculo de n0 mais interessante que de n0, no sentido de possibilitar a fixao de outros nveis de confiana, mais severos ou no que 95%, conforme a necessidade do pesquisador, bem como propiciar o uso de estimativas da proporo do evento na populao, proporcionando tamanhos de amostra menores e mais fceis de serem atendidos, uma vez que, de modo geral, o custo financeiro da pesquisa , limita/dificulta o emprego de amostras grandes. Conhecendo-se o tamanho da populao N, pode-se corrigir o clculo de n 0, obtido por I ou II, para se ter o tamanho da amostra aleatria simples, n, atravs da expresso: n = N. n*0 / (N + n*0) , sendo n*0 = n0 ou n0. A tabela 3 exemplifica aplicaes da frmula (III) para alguns tamanhos de populao e determinados valores de n*0 obtidos nas tabelas anteriores, a fim de se observar a relao entre essas variveis. Tabela 3. Exemplos de tamanho de amostra (n) em funo do tamanho da populao (N) e da proporo populacional (p), tomando-se nvel de 95% de confiana e erro amostral tolervel igual a 0,025. (III),

N 1000 10000 100000 1000 10000 100000 1000 10000 100000

p 0,5 0,5 0,5 0,25 0,25 0,25 0,1 0,1 0,1

n0 1600 1600 1600 1600 1600 1600 1600 1600 1600

n = f(N, n0) 615 1379 1575 615 1379 1575 615 1379 1575

n0 1537 1537 1537 1152 1152 1152 553 553 553

n = f(N, n' 0) 606 1332 1513 535 1033 1139 356 524 550

Com base na simulao dos clculos para o tamanho de amostra aleatria simples, por meio das expresses I, II e III, observa-se que o valor de n sempre inferior ao valor de n0 e n0. Entretanto, a medida que o tamanho (N) da populao, cresce, o valor de n aproxima-se do valor de n0 e n0. Desse modo, para uma populao grande, quando no se tem uma estimativa prvia do valor de p, pode-se adotar o valor de n 0 como o tamanho n da amostra. Ento, n = n0 = 1/E02 , (IV),

sem necessariamente levar em conta o tamanho exato da populao. Nos casos em que estudos prvios ou anlogos apresentam uma aproximao para o valor de p, para uma populao grande, pode-se adotar o valor de n0 como o tamanho n da amostra. Desse modo, n = n0 , (V),sem precisar se levar em considerao o tamanho da populao.

Fixando-se o valor da estimativa da proporo do evento na populao igual a 0,5 e nvel de 95% de confiana na expresso II, obtm-se um valor para n 0 prximo e menor que o valor de n0 obtido pela expresso I. Podemos ento, considerando as expresses I, II e III, estabelecer as seguintes relaes: n0 n e n0 > n0

As relaes acima anunciadas podem ser ilustradas na figura abaixo.

Figura 1. Comparao entre as expresses I, II e III para o clculo do tamanho de uma amostra aleatria simples Conforme pode-se observar na figura 1, quanto menor for o tamanho da populao, mais importante ser conhecer seu valor exato. Em populaes pequenas, os valores de n0, n0 e n so diferentes, ao passo que para populaes grandes, a informao sobre o tamanho da populao irrelevante. . Uma aplicao na rea de Cincia da Informao A bibliotecas da ULP atende uma populao de 40416 usurios, entre docentes, graduandos e ps-graduandos, alm de demais usurios. A Coordenadoria Geral de

Bibliotecas da ULP, na pessoa de sua coordenadora, iniciou em janeiro de 2003 um projeto denominado "Implantao de modelo de referncia na biblioteca da ULP". Para isso, solicitou-nos a determinao do tamanho adequado de uma amostra aleatria simples para que a mesma seja representativa dessa populao referenciada, possibilitando a revalidao dos resultados amostrais para toda a populao de 40416 usurios. Admite-se um erro amostral tolervel de 2% (ou 0,02) nos resultados, i.e., que os parmetros populacionais em estudo se distanciem no mximo 2% para mais ou para menos, em relao s estimativas estatsticas obtidas, e estabelece-se uma probabilidade de acerto (nvel de confiana) de 95% (ou 0,95) para as estimativas estatsticas a serem obtidas. Com base no erro amostral tolervel estabelecido (2%), uma primeira aproximao para o tamanho da amostra aleatria (n0) a ser retirada dada pela equao (I): n0 = 1/(0,02)2 = 2500 usurios Assim, se no levarmos em conta o tamanho da populao em estudo (docentes, graduandos e ps-graduandos), uma amostra de tamanho adequado para captar-se as tendncias dessa populao em relao s variveis em estudo deve ser composta por 2500 usurios. Os parmetros populacionais em estudo possuiro seus valores verdadeiros at 2% para a mais ou 2% para menos em relao s estimativas proporcionais obtidas nessa amostra, i.e., o pesquisador estar admitindo uma margem de erro de at 2% para mais ou 2% para menos em relao aos verdadeiros valores populacionais. Como o tamanho da populao conhecido (40416 usurios), podemos utilizar a equao (III) e diminuir o tamanho da amostra que dever ser utilizada nesse projeto, obtendo ainda uma amostra representativa da populao. O tamanho da amostra aleatria simples (n) ser: n = 2500. 40416/(2500+40416) = 2354 usurios Uma amostra de tamanho 2354 usurio representa 5,82% da populao: 5,82% = (2354/40416).100% Observamos assim que, a indicao usual de que uma amostra deve abranger uma percentagem fixa da populao (entre 10 % e 20%), superestima o tamanho da amostra necessria para representar a populao em estudo, uma vez que indica uma amostra entre 4042 (10% dos usurios) e 8084 (20% dos usurios). Para coletar uma amostra aleatria para essa populao de usurios da biblioteca da ULP, basta retirar 5,82% de cada segmento (docente, graduando e ps-graduando) em cada uma das unidades universitrias que pertence rede de bibliotecas da ULP. Salientamos que o erro amostral tolervel de 2% estar associado estimativa geral dos parmetros e no s estimativas estatsticas por segmento. Caso se exija essa margem de erro (erro amostral tolervel) por segmento, o clculo do tamanho de amostra dever ser

feito para cada segmento (docente, graduando, ps-graduando), i.e., teremos trs clculos de tamanho de amostra, cada um relativo ao tamanho da populao do segmento. O tamanho total da amostra, quando exige-se a preciso do erro amostral por segmento, vai corresponder soma dos tamanhos das amostras de cada segmento, e representar uma amostra total maior que aquela em que no se exige a preciso do erro amostral nos segmentos, tolerando erros amostrais maiores para as estimativas por segmento. Consideraes finais Com base nas expresses analisadas para o clculo de determinao do tamanho de uma amostra aleatria simples para a estimao da proporo populacional de um evento, observa-se que quanto mais heterognea for a populao (p mais prximo de 0,5), maior ser o tamanho da amostra, a fim de que ela possa ser representativa das caractersticas gerais daquela populao. Essa constatao consolida a ideia intuitiva a cerca da composio de uma amostra em funo da heterogeneidade dos elementos da populao: quanto maior a heterogeneidade entre os elementos, maior a amostra a fim de captar essas diversidades. Assim, quando trabalha-se com Amostragem Estratificada e deseja-se que o erro amostral seja especfico para cada estrato, precisa-se retirar uma amostra aleatria simples para cada estrato, caso contrrio perde-se a determinao da preciso do erro amostral tolervel por estrato, sendo fixo apenas o erro amostral tolervel para a estimativa geral da proporo na populao. Observa-se ainda que a indicao de que uma amostra deve abranger uma porcentagem fixa, aproximadamente de 10 a 20%, dependendo do tamanho da populao, inadequada, uma vez que para populaes pequenas, esse percentual est aqum do necessrio. Por outro lado, para populaes grandes esse percentual para a determinao do tamanho da amostra muito maior que o necessrio, apontado pelos clculos. Assim, como mostra a figura 2, o percentual da populao que deve ser abrangido para que uma amostra seja representativa para a populao estudada, diminui a medida que cresce o tamanho da populao.

Figura 2. Comparao entre o tamanho da amostra determinado pelas expresses I e III e por uma percentagem fixa (10%) da populao. Salientamos que as frmulas analisadas para o clculo do tamanho amostral no levam em considerao as restries de natureza financeira, ainda que muitas vezes o tamanho de uma amostra fique condicionado disponibilidade desse recurso. Entretanto, como j mencionado, h a necessidade de se atingir um equilbrio entre os fatores: tamanho amostral, preciso das estimativas e recursos financeiros disponveis. Desse modo, a indicao impositiva dos clculos apresentados para a determinao do tamanho da amostra, durante o planeamento de uma pesquisa, sem levar em conta uma ponderao relativa aos recursos financeiros disponveis, pode colocar o pesquisador em uma "camisa-de-fora", impossibilitando-o de seguir adiante seu projeto de pesquisa. Esta situao, entretanto, no interessante para o pesquisador, nem tencionada pelos estatsticos. Notas
[1]

Erro amostral tolervel a diferena tolerada, pelo pesquisador, entre o valor que a estatstica acusa e o verdadeiro valor do parmetro que se deseja estimar (Barbetta, 1999).
[2]

Nvel de confiana a probabilidade de o valor do parmetro em estudo pertencer ao intervalo centrado na estimativa estatstica do parmetro e limites determinados pelo erro amostral tolerado. Neste caso, a probabilidade de 0,95 ou 95%. Por exemplo, trabalhando-se com um E0 igual 2%, se obtivermos uma estimativa percentual igual a 40% para o parmetro em estudo, teremos 95% de probabilidade de o valor verdadeiro do parmetro populacional pertencer ao intervalo de 38% a 42%.
[3]

A descrio do erro amostral , usualmente, feita em termos percentuais (por exemplo: 0,010 l-se 1%).

[4]

O desvio padro (variao populacional) do parmetro P (proporo do evento na populao) funo de p.(1-p), onde p a estimativa de P na amostra . Assim, por exemplo, para p = 0,5, p.(1-p) = 0,25; para p = 0,4, p.(1-p) = 0,24; para p=0,3, p.(1-p) = 0,21; para p=0,2, p.(1-p) = 0,16 e para p = 0,1, p.(1-p) = 0,09, i.e., quanto mais distante de 0,5 estiver o valor de p, menor ser a variao de p. Referncia Bibliogrfica BARNETT, V. Elements of Sampling Theory. London: The English Universities Press Ltd, 1974.

Vous aimerez peut-être aussi