Vous êtes sur la page 1sur 24

Amostragem com o Br.

Office Calc
1
Como gerar amostras aleatrias simples e estratificadas proporcionais com o Br.Office.org
Calc

Neste texto mostraremos como usar o Br.Office.org Calc para gerar uma amostra aleatria
simples e estratificada proporcional. Ao contrrio do Microsoft Excel , que tem um suplemento
estatstico, o Calc pode obter amostras aleatrias apenas de uma maneira: atravs da funo
ALEATRIOENTRE (). Nosso objetivo retirar uma amostra aleatria de 250 clientes da
montadora Toyord: primeiramente sem considerar a populao dividida em estratos, e
posteriormente levando em conta eventuais subdivises. De acordo com o arquivo Populao
Toyord h 6500 clientes disponveis. Alguns procedimentos adicionais, imprescindveis, sero
apresentados tambm. A seguir alguns detalhes sobre os dados.

A Megamontadora TOYORD regularmente conduz pesquisas de mercado com os clientes
que compraram carros zero km diretamente de suas concessionrias. O objetivo avaliar a
satisfao dos clientes em relao aos diferentes modelos, seu design, adequao ao perfil do
cliente. A ltima pesquisa foi terminada em julho de 20010: 5000 clientes foram entrevistados entre
o total de 30000 que compraram veculos novos entre maio de 2009 e maio de 2010. A pesquisa foi
restringida aos modelos mais vendidos, e que j esto no mercado h 10 anos. As seguintes
variveis foram obtidas:
1) Modelo comprado: o compacto Chiconaultla, o seda mdio DeltaForce3, a perua familiar
Valentiniana, a van SpaceShuttle ou o esportivo LuxuriousCar.
2) Opcionais: inexistentes (apenas os itens de srie); ar condicionado e direo hidrulica; ar
condicionado, direo hidrulica e trio eltrico; ar condicionado, direo hidrulica, trio eltrico e
freios ABS.
3) Opinio sobre o design: se os clientes consideram o design do veculo comprado ultrapassado,
atualizado, ou adiante dos concorrentes.
4) Opinio sobre a concessionria onde comprou o veculo (incluindo atendimento na venda,
manuteno programada e eventuais problemas imprevistos): muito insatisfatria, insatisfatria, no
causou impresso, satisfatria, bastante satisfatria.
5) Opinio geral sobre o veculo adquirido: muito insatisfeito, insatisfeito, satisfeito, bastante
satisfeito.
6) Renda declarada pelo cliente: em salrios mnimos.
7) Nmero de pessoas geralmente transportadas no veculo.
8) Quilometragem mensal mdia percorrida com o veculo.
9) Percepo do cliente de h quantos anos o veculo comprado teve a sua ltima remodelao de
design: em anos completos (se h menos de um ano o entrevistador anotou zero).
10) Idade do cliente em anos completos.

Apresentaremos os seguintes tpicos: procedimentos para preparao dos dados (necessria
para conhecer melhor a populao, permitindo identificar eventuais estratos), procedimentos para
retirada de uma amostra aleatria simples e procedimentos para retirada de uma amostra
estratificada proporcional.
Amostragem com o Br.Office Calc
2
ndice analtico
1. Preparao dos Dados .............................................................................................................................................. 4
1.1 Filtragem ....................................................................................................................................................... 4
1.1.1 Filtragem para variveis qualitativas ......................................................................................................... 4
1.1.2 Filtragem para variveis quantitativas ....................................................................................................... 6
1.2 Recodificao ................................................................................................................................................ 7
1.3 Classificao .................................................................................................................................................10
2. Amostragem ...........................................................................................................................................................13
2.1 Amostragem aleatria simples .......................................................................................................................13
2.2 Amostragem aleatria estratificada proporcional ............................................................................................16
2.2.1 Tamanho de amostra com erro amostral definido por estrato ....................................................................19
2.2.2 Tamanho de amostra com erro amostral definido para a populao ...........................................................21
2.2.3 Obteno da amostra estratificada proporcional .......................................................................................23

ndice de Figuras
Figura 1 - Menu AutoFiltro ......................................................................................................................................... 4
Figura 2 - Aplicao de AutoFiltro s variveis de PopulaoToyord ........................................................................... 4
Figura 3 - Filtro da varivel Modelo ............................................................................................................................ 5
Figura 4 - Varivel Modelo - Apenas clulas Vazias .................................................................................................... 5
Figura 5 - Modelo: registro incorreto Chic Figura 6 - Correo de registro incorreto ................................................. 5
Figura 7 - Correo de um dos erros de registro de Modelo .......................................................................................... 6
Figura 8 - Filtro de Renda - Menores Valores............................................................................................................... 6
Figura 9 - Filtro de Renda - Maiores Valores ............................................................................................................... 6
Figura 10 - Dados sobre o cliente com a maior renda ................................................................................................... 7
Figura 11 - Estrutura de recodificao da varivel Renda ............................................................................................. 8
Figura 12 - Funo de recodificao da varivel Renda em RendaC ............................................................................. 9
Figura 13 - Funo de recodificao da varivel Idade em IdadeC ................................................................................ 9
Figura 14 - Variveis RendaC e IdadeC ....................................................................................................................... 9
Figura 15 - Menu Dados - Opo Classificar ...............................................................................................................10
Figura 16 - Critrios de classificao: apenas por RendaC ...........................................................................................10
Figura 17 Opes de classificao............................................................................................................................11
Figura 18 - Resultados da Classificao em funo de RendaC e IdadeC .....................................................................11
Figura 19 - Modificao dos nmeros dos casos aps classificao .............................................................................12
Figura 20 - Amostragem aleatria simples- incio .......................................................................................................13
Figura 21 - Funo PROC para recuperar dados de Modelo.........................................................................................13
Figura 22 - Assistente de Funes do Calc ..................................................................................................................14
Figura 23 - Assistente de funes: ALEATRIOENTRE - 1a parte ............................................................................14
Figura 24 - Assistente de funes: ALEATRIOENTRE - 2a parte ............................................................................15
Figura 25 - Primeiro elemento da amostra aleatria simples ........................................................................................15
Figura 26 - Amostra aleatria simples de 250 elementos - parcial ................................................................................15
Figura 27 - Acrscimo de colunas com nmero dos casos............................................................................................16
Figura 28 - Caso com clulas vazias ...........................................................................................................................16
Figura 29 - Incio do estrato 1 a 4 s.m. - 18 a 25 anos Figura 30 - Final do estrato 1 a 4 s.m. - 18 a 25 anos ...........17
Figura 31 - Final dos estratos 1 a 4 s.m. - 25 a 40 anos e 1 a 4 s.m. - mais de 40 anos ..................................................17
Figura 32 - Final dos estratos 4 a 12 s.m. - 18 a 25 anos e 4 a 12 s.m. 25 a 40 anos ...................................................17
Figura 33 - Final do estrato 4 a 12 s.m. mais de 40 anos e clulas vazias ..................................................................18
Figura 34 - Final do estrato Mais de 12 s.m. 18 a 25 anos .........................................................................................18
Figura 35 - Final dos estratos Mais de 12 s.m. - 25 a 40 anos e Mais de 12 s.m. Mais de 40 anos ..............................18
Figura 36 - Estratos em funo de RendaC e IdadeC ...................................................................................................19
Figura 37 - Estratos em funo de RendaC e IdadeC sem Mais de 12 s.m. 18 a 25 anos .........................................19
Figura 38 Clculo de n
0
para o estrato 1 a 4 s.m. 18 a 25 anos com E
0
= 2,5% ........................................................20
Figura 39 Clculo de n para o estrato 1 a 4 s.m. 18 a 25 anos com E
0
= 2,5% .........................................................20
Figura 40 Funo ARREDONDAR.PARA.CIMA ...................................................................................................20
Figura 41 Funo ARREDONDAR.PARA.CIMA - Opes .....................................................................................21
Figura 42 Tamanhos de amostra para os estratos com E
0
= 2,5% ..............................................................................21
Figura 43 Clculo de n
0
para E
0
= 2,5% (toda a populao) ......................................................................................22
Figura 44 Clculo de n para E
0
= 2,5% (toda a populao)........................................................................................22
Figura 45 - Arredondamento para cima do valor de n ..................................................................................................22
Figura 46 - Arredondamento para cima do valor de n no primeiro estrato ....................................................................22
Figura 47 Tamanhos de amostra para cada estrato ....................................................................................................23
Figura 48 Colunas Ordem e Sorteado .......................................................................................................................23
Figura 49 Sorteio do primeiro elemento do primeiro estrato .....................................................................................23
Figura 50 - Resultados da amostra do primeiro estrato - final ......................................................................................24
Amostragem com o Br.Office Calc
3
Figura 51 Sorteio do primeiro elemento do segundo estrato ......................................................................................24
Figura 52 Resumo dos estratos (casos na populao) e ordem de sorteio (na amostra) ...............................................24

Amostragem com o Br.Office Calc
4
1. Preparao dos Dados

A preparao dos dados indispensvel para que possamos identificar as caractersticas da
populao que sero importantes para o processo de amostragem. Entre todos os procedimentos
disponveis vamos estudar Filtragem de variveis, Recodificao de variveis e Classificao do
arquivo de dados em funo de uma ou mais variveis

1.1 Filtragem

A filtragem uma ferramenta extremamente til para a anlise de dados. Permite realizar a
pr-anlise dos dados, realizar buscas especficas por uma informao e corrigir eventuais erros.
Vamos apresentar os procedimentos no Calc para executar filtragem de variveis qualitativas e
quantitativas, permitindo a identificao de valores perdidos e erros de registro (e sua correo),
valores discrepantes, entre outras informaes.

Abra o arquivo PopulaoToyord.ods e procure pela planilha Dados. Vamos trabalhar
com duas variveis: Modelo (qualitativa) e Renda (quantitativa contnua).

1.1.1 Filtragem para variveis qualitativas
Para acionar o filtro automtico do Calc, para todas as variveis, basta pr o cursor em
qualquer clula ocupada da planilha Dados. Depois, no menu Dados procure por Filtro e
depois pela opo AutoFiltro tal como na Figura 1.

Figura 1 - Menu AutoFiltro

Ao escolher AutoFiltro o Calc automaticamente aplica os botes de filtro a todas as variveis, e o
resultado est na Figura 2.


Figura 2 - Aplicao de AutoFiltro s variveis de PopulaoToyord
Amostragem com o Br.Office Calc
5

Figura 3 - Filtro da varivel Modelo


Figura 4 - Varivel Modelo - Apenas clulas Vazias

Para corrigir os erros basta selecionar um dos valores incorretamente registrados, como
Chic na Figura 3. Os resultados podem ser vistos na Figura 5

Figura 5 - Modelo: registro incorreto Chic Figura 6 - Correo de registro incorreto
O erro Chic (deveria ser Chiconaultla) aparece nas clulas B951, B962 e B2048. Para corrigi-los
precisamos digitar corretamente o valor: na Figura 6 corrige-se Chic para Chiconaultla. MUITO
IMPORTANTE: no Calc a correo dos erros precisa ser feita INDIVIDUALMENTE, no possvel
arrastar o valor corrigido para todas as clulas incorretas
1
. Se fizssemos isso na Figura 6 todas as
clulas entre B951 e B2048 seriam transformadas em Chiconaultla, o que no desejado.

1
O Microsoft Excel permite fazer isso sem modificar as outras clulas do intervalo.
Os valores corretos para a varivel Modelo so
Chiconaultla, Deltaforce3, Valentiniana, SpaceShuttle e
LuxuriousCar. Mas, h vrios registros incorretos para todos, em
que houve truncamento de letras. possvel ver tambm uma
linha em branco, que so as clulas vazias, se selecionada
permitir avaliar a quantidade de dados perdidos; 10 primeiros;
Filtro padro, na qual podemos construir o filtro de nosso
interesse.
Selecionando qualquer dos valores o Calc apresentar apenas as
clulas que o contm. Selecionando a linha em branco obtemos a
Figura 4.
Os dados perdidos encontram-se nas clulas B181, B264,
B806, B812, B1301, B1317, B2303 e B2417, totalizando 8
observaes.
Como so apenas 7 em 5000 registros, representando 0,16%,
bem abaixo de 5%, podemos considerar uma quantidade aceitvel.
Porm, se possvel, devemos investigar as causas deste sumio de
dados, e se possvel, descobrir seu contedo (deve haver algum
registro do cliente 180 (clula B181) em algum lugar, que diga qual o
modelo escolhido).
Amostragem com o Br.Office Calc
6
Precisamos ento corrigir todos os erros de registro, para todas as variveis quantitativas,
manualmente, como foi feito com Chic, resultando na Figura 7.

Figura 7 - Correo de um dos erros de registro de Modelo
Os dados sem erros esto no arquivo PopulaoToyordSemErros.ods, que ser usado de
agora em diante.

1.1.2 Filtragem para variveis quantitativas
Podemos usar o mesmo procedimento das variveis qualitativas nas quantitativas. Se
realizarmos o procedimento de filtragem com a varivel Renda, quantitativa contnua, vamos
observar a grande quantidade de valores possveis entre o mnimo (1 salrio mnimo), mostrado na
Figura 8, e o mximo (95,73 salrios mnimos), mostrado na Figura 9.

Figura 8 - Filtro de Renda - Menores Valores


Figura 9 - Filtro de Renda - Maiores Valores
Amostragem com o Br.Office Calc
7
Se quisermos saber mais sobre o cliente com a maior renda basta selecionar o valor 95,73 e
teremos a tela da Figura 10, com todas as informaes disponveis.

Figura 10 - Dados sobre o cliente com a maior renda

Trata-se de um cliente que optou pelo modelo SpaceShuttle, com todos os opcionais (ar
condicionado, direo hidrulica, trio eltrico e freios ABS), que considera os modelos da Toyord
ultrapassados, a concessionria no causou impresso nele, mas no geral est bastante satisfeito. Ele
costuma rodar com 6 pessoas a bordo (o que provavelmente explica a escolha pela van), roda em
mdia 470 km, acha que os veculos da Toyord foram remodelados h 3 anos, e tem 41 anos
completos de idade.

Poderamos repetir o procedimento para qualquer outro valor de Renda.


1.2 Recodificao

Em muitas situaes de anlise de dados pode haver interesse em criar novas variveis a
partir das existentes: com a finalidade de agrupar valores de uma varivel qualitativa ou
quantitativa, ou transformar uma varivel quantitativa em qualitativa. Com isso torna-se possvel
realizar novas anlises dos dados, sem modificar os dados originais.

Podemos fazer isso para variveis qualitativas ou quantitativas. Para as qualitativas
usualmente busca-se reduzir o nmero de opes. Por exemplo, poderamos agrupar as opinies
Bastante satisfeito e Satisfeito na varivel Geral e recodific-la em uma nova varivel como
Positiva, e as demais em Negativa.

A recodificao de variveis quantitativas pode ter duas finalidades:
- transform-la em outra varivel quantitativa (quando se chama transformao, mediante alguma
operao matemtica);
- transform-la em uma varivel qualitativa (quando se chama realmente recodificao, mediante a
aplicao de operaes lgicas, tal como as vistas para variveis qualitativas).
Em ambos os casos o objetivo obter uma nova varivel que facilite a anlise dos dados, tornando-
a mais resumida ou significativa. Por exemplo, vamos realizar uma recodificao das variveis
Renda e Idade, no arquivo PopulaoToyord:
- recodificar Renda em uma varivel qualitativa, criando faixas de valores que definiro clientes de
renda de 1 a 4 salrios mnimos, 4 a 12 salrios mnimos e de mais de 12 salrios mnimos.
- recodificar Idade em uma varivel qualitativa, criando faixas de valores que definiro clientes de
idade de 18 a 25 anos, 25 a 40 anos e de mais de 40 anos.

Neste momento importante uma pequena introduo sobre as funes lgicas do Calc. H
vrias disponveis, sendo as principais, com a sua sintaxe:
- SE(teste lgico; ao caso o teste lgico resulte verdadeiro; ao caso o teste lgico resulte falso).
possvel aninhar at sete funes SE como argumentos valor_se_verdadeiro e valor_se_falso para
construir testes mais elaborados.
Amostragem com o Br.Office Calc
8
- E(teste lgico1; teste lgico2; ...). Retornar VERDADEIRO se todos os testes lgicos resultarem
verdadeiros; retornar FALSO se um ou mais testes lgicos resultarem falsos. Teste lgico1; teste
lgico2;... so de 1 a 30 condies para testar e que podem ser VERDADEIRO ou FALSO.
- OU(teste lgico1; teste lgico2; ...). Retorna VERDADEIRO se pelo menos um dos testes lgicos
resultar verdadeiro; retorna FALSO se todos os testes lgicos resultarem FALSOS. Teste lgico1;
teste lgico2,... so de uma a 30 condies que voc deseja testar e que podem resultar em
VERDADEIRO ou FALSO.

Ao fazer recodificao ou transformao de variveis, preciso tomar cuidado com as
clulas vazias, pois vamos criar informaes ao codific-la em qualitativa, ou causar erro ao
transform-la.

Podemos agora pensar na recodificao de Renda em uma varivel qualitativa, que
chamaremos RendaC, que ocupar a coluna L. Vamos criar trs classes arbitrrias de renda: os
clientes com Renda de at 4 salrios mnimos sero chamados RendaC 1 a 4 s.m., os com Renda
entre 4 e 12 sero chamados RendaC 4 a 12 s.m., e os com Renda acima de 12 salrios mnimos
sero RendaC Mais de 12 s.m.. Trata-se de um caso que exige a utilizao de funes SE:
precisaremos de duas para a classificao da Renda, e mais uma para lidar com as clulas vazias.
Veja a estrutura na Figura 11.


Figura 11 - Estrutura de recodificao da varivel Renda

Vamos ver os passos:
Amostragem com o Br.Office Calc
9
1) Se a clula de Renda for vazia a clula de RendaC tambm ser, para evitar a criao de
informao.
2) Se a clula de Renda NO for vazia pode-se proceder fazer a recodificao propriamente dita.
3) Se a clula de Renda for menor ou igual a 4, a clula de RendaC ser igual 1 a (cliente com
renda baixa).
4) Se a clula de Renda NO for menor ou igual a 4, faz-se novo teste.
5) Se a clula de Renda for menor ou igual a 12 (j se sabe pelo teste anterior que maior do que 4
salrios mnimos), a clula de RendaC ser igual Mdia (cliente com renda mdia).
6) Se a clula de Renda NO for menor ou igual a 12, j que o teste anterior verificou que maior
do 4 salrios mnimos, s resta a possibilidade de ser maior do que 12. Ento a clula de RendaC
ser igual Alta (cliente com renda alta).

Observe a implementao da recodificao da varivel Renda no Calc (Figura 29), na
planilha Dados do arquivo PopulaoToyordSemErros.ods.

Figura 12 - Funo de recodificao da varivel Renda em RendaC

Ao arrastar a frmula at a clula L5001 completamos a recodificao da varivel, cujos
resultados podem ser vistos na Figura 14.

Podemos recodificar a varivel Idade tambm, de forma anloga vamos criar trs categorias:
18 a 25 anos, 25 a 40 anos e acima de 40 anos. A implementao est mostrada na Figura 13, e os
resultados tambm podem ser vistos na Figura 14.

Figura 13 - Funo de recodificao da varivel Idade em IdadeC


Figura 14 - Variveis RendaC e IdadeC


Agora h duas novas variveis
qualitativas, relacionadas s
variveis quantitativas de origem: as
informaes originais no foram
perdidas, e temos mais uma maneira
de caracterizar o conjunto de dados.
Amostragem com o Br.Office Calc
10
1.3 Classificao

Em muitos casos h interesse em reordenar o conjunto de dados de maneira a facilitar a
visualizao dos valores especficos de uma ou mais variveis. Isso ser extremamente til nas
prximas aulas quando construirmos tabelas para os dados. O Calc dispe de vrios mecanismos
automticos de classificao, que podem ser acessados pelo menu Dados, opo Classificar, como
na Figura 15, na planilha Dados do arquivo PopulaoToyordSemErros.ods.


Figura 15 - Menu Dados - Opo Classificar

Podemos classificar os dados em funo de at 3 variveis, de forma automtica. Se
desejssemos fazer a classificao apenas em funo de RendaC e depois por IdadeC bastaria
coloc-las na primeira e segunda opes da tela da Figura 16.


Figura 16 - Critrios de classificao: apenas por RendaC

Ao escolher a aba Opes podemos detalhar melhor o processo de classificao, o que
resulta na Figura 17.


Amostragem com o Br.Office Calc
11

Figura 17 Opes de classificao

Pressionando OK na Figura 17 os dados so classificados, e o resultado pode ser visto na
Figura 18, j salvo como arquivo PopulaoToyordSemErrosClassificado.ods



Figura 18 - Resultados da Classificao em funo de RendaC e IdadeC



O intervalo de A1 a M5001
contm todas as variveis,
incluindo a linha 1, com os
nomes, e as recodificadas
tambm. Podemos fazer
distines entre maisculas e
minsculas, copiar os
resultados de classificao
para um novo intervalo de
clulas (preservando o
conjunto de dados original).
Muito importante: no nosso
caso queremos que a direo
da classificao seja De
cima para baixo, para que
as linhas sejam classificadas.
Na tela imediatamente abaixo v-se que os
nmeros dos casos foram reordenados de acordo
com os resultados de RendaC e IdadeC. Na tela
ao lado esto os valores de RendaC: o mais
baixo a clula vazia, depois 1 a 4 s.m., etc.
Observe que h valores de IdadeC para as clulas
vazias de RendaC, e eles esto ordenados (18 a
25 anos, 25 a 40 anos, Mais de 40 anos). Todos
os outros valores esto ordenados em funo de
RendaC e IdadeC. Vamos modificar a
numerao dos casos, para que a amostragem
depois possa ser melhor realizada Figura 19.
Amostragem com o Br.Office Calc
12
Basta substituir os dois primeiros nmeros dos casos (ver Figura 18) por 1 e 2, como mostrado na
tela esquerda na Figura 19, e depois arrast-los at a clula A5001. O resultado pode ser visto na
tela direita Figura 19.


Figura 19 - Modificao dos nmeros dos casos aps classificao

Agora os dados esto classificados em funo de RendaC e IdadeC: na prtica temos 9
estratos possveis:
RendaC IdadeC
1 a 4 s.m. 18 a 25 anos
1 a 4 s.m. 25 a 40 anos
1 a 4 s.m. Mais de 40 anos
4 a 12 s.m. 18 a 25 anos
4 a 12 s.m. 25 a 40 anos
4 a 12 s.m. Mais de 40 anos
Mais de 12 s.m. 18 a 25 anos
Mais de 12 s.m. 25 a 40 anos
Mais de 12 s.m. Mais de 40 anos

Se imaginarmos que as duas variveis influenciam na escolha do modelo de automvel, ao
realizar uma pesquisa por amostragem precisamos considerar os nove estratos formados: elementos
dos nove estratos precisam fazer parte da amostra, na mesma proporo encontrada na populao, o
que configura uma amostra estratificada proporcional
2
. Portanto, precisamos identificar os casos na
populao, o que ser possvel devido reordenao dos nmeros mostrada na Figura 19.

Mas, antes de passarmos amostragem estratificada proporcional, vamos ver como
implementar a amostragem aleatria simples.




2
O tipo de amostragem que permite a melhor representatividade da populao.
Amostragem com o Br.Office Calc
13
2. Amostragem

Agora que j temos conhecimento sobre as principais caractersticas da populao podemos
passar a obteno das amostras propriamente ditas: por meio de amostragem aleatria simples e
amostragem aleatria estratificada proporcional.

2.1 Amostragem aleatria simples

Se for possvel considerar a populao homognea o procedimento simples. Basta definir
os nmeros mnimo e mximo dos casos na populao e usar a funo ALEATRIO.ENTRE para
selecionar a amostra, no intervalo de casos da populao e obter a amostra. Vamos usar o arquivo
PopulaoToyordSemErrosClassificado.ods, que tem os estratos definidos em funo das variveis
RendaC e IdadeC (recodificaes de Renda e Idade, respectivamente). Escolhendo a planilha
AmostraSimples, temos a Figura 20.

Figura 20 - Amostragem aleatria simples- incio

Na Figura 21 possvel avaliar a funo PROC que recupera o valor de Modelo (na planilha Dados)
a partir do caso sorteado na planilha AmostraSimples. Veja os detalhes:

Figura 21 - Funo PROC para recuperar dados de Modelo
- A2 a clula que tem o caso que ser sorteado;
- Dados a planilha de origem, onde esto os casos da populao, o intervalo $A$2:$A$5001
contm todos os casos da populao (usamos o $ antes das letras das colunas e nmeros das linhas
para manter as referncias absolutas);
- o intervalo $B$2:$B$5001 (tambm na planilha Dados) contm os valores de Modelo (novamente
usamos o $ para manter as referncias absolutas);
- de acordo com o caso sorteado, a funo varrer os 5000 casos da populao (no intervalo A2 a
A5001 na planilha Dados) e recuperar o valor de Modelo correspondente a ele (que est no
intervalo B2 a B5001, tambm na planilha Dados);
- para que PROC funcione o primeiro intervalo precisa estar em ordem crescente (o que nosso
caso, as clulas A2 a A5001 contm os casos 1 a 5000);
- podemos arrastar a funo at o fim da amostra, por exemplo, se a amostra tivesse 250 elementos,
A coluna A contm a varivel Caso, que
registrar os casos sorteados dentre aqueles
disponveis na planilha Dados. Observe que nas
clulas direita h os smbolos #N/A. Trata-se
de mensagens de erro, h uma funo que
recupera as informaes dos casos da planilha
Dados a partir dos casos sorteados. Como as
clulas da coluna A ainda esto vazias as
mensagens de erro aparecem. A funo em
questo a PROC, que descrevemos a seguir.
Amostragem com o Br.Office Calc
14
at a clula B251 (por isso importante o uso de referncias absolutas);
- para as outras variveis basta arrastar a clula B2 at a K2, e substituir o intervalo $B$2$B$5001
pelos correspondentes de cada varivel ($C$2:$C$5001, $D$2:$D$5001, etc.).

Imagine que queremos uma amostra de 250 elementos. Basta selecionar a clula A2, tal
como mostrado na Figura 21, e selecionar o Assistente de funes, que resulta na tela da Figura 22.


Figura 22 - Assistente de Funes do Calc

Ao pressionar o boto do Assistente de Funes surge a tela da Figura 23.


Figura 23 - Assistente de funes: ALEATRIOENTRE - 1a parte

H uma infinidade de funes disponveis. possvel escolher por categorias especficas
(opo Categoria), ou selecionar do conjunto de Todas as funes. Como queremos uma amostra
aleatria podemos escolher a funo ALEATRIOENTRE, que retorna um inteiro aleatrio entre
os nmeros especificados. Como queremos uma amostra aleatria simples, desconsiderando
eventuais estratos, basta pressionar Prximo na Figura 23 e chegar Figura 24.

Amostragem com o Br.Office Calc
15

Figura 24 - Assistente de funes: ALEATRIOENTRE - 2a parte
3




Figura 25 - Primeiro elemento da amostra aleatria simples


Figura 26 - Amostra aleatria simples de 250 elementos - parcial

3
IMPORTANTE: quando voc for retirar a amostra o Calc provavelmente selecionar um valor diferente, j que se
trata de um processo aleatrio.
Em Inferior posto
o nmero do primeiro
caso (1) e em
Superior o ltimo
(5000). Pressionando
OK seleciona-se o
primeiro integrante
da amostra, visto na
Figura 25, o caso
1673. As funes
PROC obtm as
informaes de todas
as variveis para o
caso 1673: o cliente
adquiriu um modelo
Chiconaultla, sem
opcionais, etc.
Se arrastarmos a clula A2 at a linha 251
vamos obter a amostra aleatria simples de
250 elementos que desejvamos, da qual uma
parte mostrada na Figura 26.
Amostragem com o Br.Office Calc
16
2.2 Amostragem aleatria estratificada proporcional

Se houver razo para suspeitar que subdivises na populao possam influenciar nos
resultados da pesquisa torna-se recomendvel lev-las em conta na amostragem, de maneira a
garantir a representatividade da amostra. No caso da pesquisa da Toyord, supomos que as variveis
Renda e Idade influenciam na escolha do modelo de automvel, ento precisamos consider-las na
amostragem. Nas sees 1.2 e 1.3 mostramos como recodificar as variveis e como classificar o
arquivo de dados em funo dos seus valores, resultando em nove estratos. Os elementos dos nove
estratos precisam fazer parte da amostra, na mesma proporo encontrada na populao, o que
configura uma amostra estratificada proporcional
4
. Portanto, precisamos identificar os casos na
populao, o que ser possvel devido reordenao dos nmeros mostrada na Figura 19 (ver seo
1.2). Para facilitar a identificao podemos acrescentar mais uma coluna com os nmeros dos casos
direita das colunas das variveis recodificadas, como mostrado na Figura 27.

Figura 27 - Acrscimo de colunas com nmero dos casos


Figura 28 - Caso com clulas vazias

4
Outras variveis poderiam ser consideradas na estratificao, teoricamente no h limite para o nmero de variveis
estratificadoras, mas, claro, h limites prticos para a segmentao.
Basta selecionar as clulas N2 e N3 e arrast-las at a
linha 5001, obtendo toda a seqncia. Na Figura 28
possvel observar que h um total de 14 casos com
clulas vazias de RendaC (casos 1 a 4) ou de IdadeC
(casos 5 a 14). Como no temos como recuperar as
informaes referentes a tais casos, e devido ao fato
que representam apenas 14 observaes dentre 5000
(0,28%), podemos desconsider-las, e comear a
amostragem a partir do caso 15, com os clientes de
renda de 1 a 4 s.m. e idade de 18 a 25 anos.
Amostragem com o Br.Office Calc
17
Temos que identificar os casos de cada estrato, que sero depois usados na funo
ALEATRIOENTRE. Se selecionarmos as clulas N15 e N16 (Figura 29) e formos descendo na
planilha vamos chegar at a linha 375, que indica que os casos do estrato 1 a 4 s.m. 18 a 25 anos
esto entre 15 e 374, e que o estrato seguinte (1 a 4 s.m. 25 a 40 anos) comea no caso 375, como
mostrado na Figura 30.


Figura 29 - Incio do estrato 1 a 4 s.m. - 18 a 25 anos Figura 30 - Final do estrato 1 a 4 s.m. - 18 a 25 anos

Ento o primeiro estrato vai do caso 15 ao 374, o segundo do 375 ao 2053, e o terceiro do
2054 ao 2406 (ver Figura 31)


Figura 31 - Final dos estratos 1 a 4 s.m. - 25 a 40 anos e 1 a 4 s.m. - mais de 40 anos

Observe que aps o estrato 1 a 4 s.m. Mais de 40 anos aparecem mais clulas vazias, que
tambm devero ser desconsideradas. O prximo estrato (4 a 12 s.m. 18 a 25 anos) comear no
caso 2412. Podemos ver a evoluo nas Figuras 32 e 33: quarto estrato de 2412 a 2486, quinto de
2487 a 3572 (Figura 32), sexto de 3573 a 4205, com mais algumas clulas vazias (Figura 33).

Figura 32 - Final dos estratos 4 a 12 s.m. - 18 a 25 anos e 4 a 12 s.m. 25 a 40 anos
Amostragem com o Br.Office Calc
18


Figura 33 - Final do estrato 4 a 12 s.m. mais de 40 anos e clulas vazias

Mais uma vez, desconsideraremos as clulas vazias. Observe que o estrato Mais de 12 s.m.
18 a 25 anos s tem dois casos (4209 e 4210), na Figura 34, e podemos ver a evoluo dos outros na
Figura 35: oitavo estrato de 4211 a 4551, e nono de 4552 a 5000.


Figura 34 - Final do estrato Mais de 12 s.m. 18 a 25 anos


Figura 35 - Final dos estratos Mais de 12 s.m. - 25 a 40 anos e Mais de 12 s.m. Mais de 40 anos

Um resumo dos estratos, com nmeros dos casos, e percentual em relao ao total de clulas
no vazias, pode ser visto na Figura 36.
Amostragem com o Br.Office Calc
19

Figura 36 - Estratos em funo de RendaC e IdadeC

Observe que o estrato Mais de 12 s.m. 18 a 25 anos representa apenas 0,04% da populao
de 4978 clientes, o que permite desconsider-lo na amostragem, resultando na tabela da Figura 37.


Figura 37 - Estratos em funo de RendaC e IdadeC sem Mais de 12 s.m. 18 a 25 anos

O estrato 1 a 4 s.m. 25 a 40 anos o mais numeroso, portanto deve ter o maior nmero de
elementos na amostra. J o estrato 4 a 12 s.m. 18 a 25 anos, representa apenas 1,51% da
populao, devendo ter a menor representao proporcional na amostra.

Agora podemos realizar a amostragem. Vamos usar dois procedimentos de clculo do
tamanho de amostra: calculando usando o erro amostral dentro de cada estrato, e desconsiderando
os estratos inicialmente e depois dividindo a amostra de forma proporcional.

2.2.1 Tamanho de amostra com erro amostral definido por estrato
Neste caso queremos que o erro amostral dentro de cada estrato seja o mesmo. Ento
precisamos realizar os clculos do tamanho de amostra por estrato: obtm-se a primeira estimativa
n
0
, corrige-se esta estimativa usando como tamanho de populao N o tamanho de cada estrato.

Para um erro amostral de 2,5% (0,025) podemos ver a frmula de n
0
para o primeiro estrato
na Figura 38: basta arrastar a frmula da clula AD5 a AD12. Os seus resultados (1600 para todos
os estratos) e a frmula de n para o primeiro estrato (usando n
0
e o tamanho do estrato) esto na
Figura 39. Arrastando a frmula da clula AE5 a AE12 temos todos os tamanhos de amostra, por
estrato.


Amostragem com o Br.Office Calc
20

Figura 38 Clculo de n
0
para o estrato 1 a 4 s.m. 18 a 25 anos com E
0
= 2,5%


Figura 39 Clculo de n para o estrato 1 a 4 s.m. 18 a 25 anos com E
0
= 2,5%

Mas, os valores de n so fracionrios (Figura 42), precisam ser inteiros. Em clculo de
tamanho de amostra sempre arredondamos para cima. Podemos usar a funo do Calc
ARREDONDAR.PARA.CIMA na clula AG5, atravs do assistente de funes, resultando na
Figura 40.


Figura 40 Funo ARREDONDAR.PARA.CIMA


Pressionando Prximo na Figura 40 chegamos s opes da Figura 41: em nmero
devemos pr a clula com o valor fracionrio de n (clula AF5, para o primeiro estrato) e em
contagem o nmero deve ser 0 (zero), indicando que o arredondamento ser para nmero inteiro.
Amostragem com o Br.Office Calc
21

Figura 41 Funo ARREDONDAR.PARA.CIMA - Opes

Arrastando a clula AG5 at a AG12 obtemos os tamanhos de amostra para todos os
estratos, e somando os valores chegamos ao tamanho total (Figura 42).


Figura 42 Tamanhos de amostra para os estratos com E
0
= 2,5%

Observe o tamanho total da amostra: 3210 elementos. Como a populao tem 5000
elementos, poderia ser cogitado aplicar um censo diretamente... Os custos seriam altos. Torna-se
atrativa a idia de calcular um tamanho geral de amostra e dividi-la proporcionalmente entre os
estratos.

2.2.2 Tamanho de amostra com erro amostral definido para a populao
Neste caso o n
0
calculado uma nica vez, para o erro amostral (E
0
definido). Corrige-se a
estimativa com o tamanho total da populao, e em seguida calculam-se os tamanhos de amostra de
cada estrato de forma proporcional. Por exemplo, o estrato 1 a 4 s.m. 18 a 25 anos corresponde a
7,23% da populao, ento ele corresponder a 7,23% da amostra.

O procedimento citado acima tem um inconveniente: o erro amostral dentro de cada estrato
ser maior do que o erro amostral geral usado na estimativa de n
0
. Se tivermos conscincia
disso ao calcular o tamanho de amostra e escrever um relatrio a respeito, no haver problema
algum.

O clculo de n
0
para E
0
igual a 2,5% (0,025) pode ser visto na Figura 43.
Amostragem com o Br.Office Calc
22

Figura 43 Clculo de n
0
para E
0
= 2,5% (toda a populao)

Na Figura 44 calcula-se n usando o tamanho da populao (4976).


Figura 44 Clculo de n para E
0
= 2,5% (toda a populao)

Novamente, precisamos arredondar o tamanho de amostra para cima (Figura 45), e
posteriormente obter os tamanhos proporcionais, j arredondando para cima tambm (Figura 46).

Figura 45 - Arredondamento para cima do valor de n


Figura 46 - Arredondamento para cima do valor de n no primeiro estrato

Amostragem com o Br.Office Calc
23
Arrastando a clula AF16 at a AF23 e posteriormente somando os tamanhos de amostra
chegamos Figura 47.


Figura 47 Tamanhos de amostra para cada estrato

Observe que o total da amostra de 1215 elementos, consideravelmente abaixo dos 3210
obtidos na seo 2.2.1. A reduo de custos pode compensar o aumento do erro amostral dentro de
cada estrato. Claro que se usarmos valores maiores de erro amostral o tamanho de amostra ser
menor, mas perderemos preciso. O pesquisador precisa balancear com cuidado custos de
amostragem e preciso necessria: admite-se um erro amostral mximo de 5% (que acarreta um
intervalo com 10% de extenso, o que pode ser demais em alguns casos).

Passaremos agora obteno da amostra propriamente dita.

2.2.3 Obteno da amostra estratificada proporcional
Vamos usar os tamanhos de amostra obtidos na seo 2.2.2 (1215 elementos no total). Na
planilha Amostra.Estrat.Proporcional do arquivo PopulaoToyordSemErrosClassificado.ods
possvel ver as colunas Ordem e Sorteado (Figura 48).


Figura 48 Colunas Ordem e Sorteado


Figura 49 Sorteio do primeiro elemento do primeiro estrato


Arrastando a clula B2 at a linha onde est ordem 88 chegamos Figura 50.




Na coluna Ordem vemos em diferentes cores os
componentes das amostras de cada estrato. Por exemplo, o
estrato 1 a 4 s.m. 18 a 25 anos compreende os sorteados
de Ordem 1 a 88, cujas respectivas clulas esto em verde.
Na clula B2 vamos pr o primeiro elemento sorteado,
atravs da funo ALEATRIOENTRE (Figura 49).
Na Figura 47 podemos ver que o primeiro estrato
est entre os casos 15 a 374 da planilha Dados do
arquivo PopulaoToyordSemErrosClassificado.ods
(que foi classificado na seo 1.3). Ento, o sorteio
precisa ser feito entre estes valores, como visto na
Figura 49 ao lado.
Amostragem com o Br.Office Calc
24

Figura 50 - Resultados da amostra do primeiro estrato - final
5


A amostra do primeiro estrato foi selecionada. Agora podemos passar para o segundo
estrato, por um procedimento anlogo. O segundo estrato (ver Figura 47) vai do caso 375 ao 2053, o
que resulta na Figura 51.


Figura 51 Sorteio do primeiro elemento do segundo estrato

Arrastando a clula B90 at a linha onde est a ordem 497 (497 = 88 + 409, onde 409 o
tamanho da amostra calculada para o segundo estrato Figura 47), clulas em azul celeste,
completa-se a amostra do segundo estrato.

Devemos prosseguir este procedimento, tomando o cuidado de observar a delimitao dos
casos de cada estrato em cada populao (para preencher os argumentos das funes
ALEATRIOENTRE) e a ordem dos elementos de cada estrato (para saber at onde arrastar as
clulas com a funo ALEATRIOENTRE). Veja o resumo dos casos e ordens dos estratos na
Figura 52.


Figura 52 Resumo dos estratos (casos na populao) e ordem de sorteio (na amostra)

Na planilha Amostra.Estrat.Proporcional do arquivo PopulaoToyordSemErros
Classificado.ods possvel ver que as clulas correspondentes s ordens das amostras de cada
estrato esto em cores diferentes para facilitar sua identificao.


5
Como o procedimento aleatrio o leitor pode obter resultados diferentes ao retirar sua amostra.

Vous aimerez peut-être aussi