Vous êtes sur la page 1sur 34

Estatstica Descritiva com Excel Complementos.

1. Noes bsicas sobre amostragem


1.1- Introduo 1
No uma tarefa simples definir o que a Estatstica. Por vezes define-se como sendo um conjunto de tcnicas de tratamento de dados, mas muito mais do que isso! A Estatstica uma "arte" e uma cincia que permite tirar concluses e de uma maneira geral fazer inferncias a partir de conjuntos de dados. At 1900, a Estatstica resumia-se ao que hoje em dia se chama Estatstica Descritiva ou Anlise de Dados. Apesar de tudo, deu contribuies muito positivas em vrias reas cientficas. A necessidade de uma maior formalizao nos mtodos utilizados, fez com que, nos anos seguintes, a Estatstica se desenvolvesse numa outra direco, nomeadamente no que diz respeito ao desenvolvimento de mtodos e tcnicas de Inferncia Estatstica. Assim, por volta de 1960 os textos de Estatstica debruam-se especialmente sobre mtodos de estimao e de testes de hipteses, assumindo determinadas famlias de modelos, descurando os aspectos prticos da anlise dos dados. Porm, na ltima dcada, em grande parte devido s facilidades computacionais postas sua disposio, os Estatsticos tm-se vindo a preocupar cada vez mais, com a necessidade de desenvolver mtodos de anlise e explorao dos dados, que dem uma maior importncia aos dados e que se traduz na seguinte frase "Devemos deixar os dados falar por si". Do que dissemos anteriormente, podemo-nos aperceber que a Estatstica uma cincia que trata de dados e que num procedimento estatstico esto envolvidas duas fases importantes, nomeadamente a fase que diz respeito organizao de dados Anlise de Dados, e a fase em que se procura retirar concluses a partir dos dados, dando ainda informao de qual a confiana que devemos atribuir a essas concluses Inferncia Estatstica. Existe, no entanto, uma fase pioneira, que diz respeito Produo ou Aquisio de Dados. Para realar a importncia desta fase consideremos, por analogia, o que se passa quando se pretende realizar um determinado cozinhado. Comea-se por seleccionar os ingredientes, que sero depois manipulados de acordo com determinada receita. O resultado do cozinhado pode ser desastroso, embora de aspecto agradvel. Efectivamente se os ingredientes no estiverem em condies, resulta um prato de aspecto semelhante ao que se obteria com ingredientes bons, mas de sabor intragvel. O mesmo se passa com o procedimento estatstico. Se os dados no forem bons, embora se aplique a tcnica correcta, o resultado pode ser desastroso, na medida em que se pode ser levado e retirar concluses erradas. Hoje em dia com a utilizao cada vez maior de dados nas mais variadas profisses e nas mais diversas situaes do dia a dia, torna-se necessrio acompanhar este processo de uma cultura

Este captulo segue de perto o texto Introduo Probabilidade e Estatstica Com complementos de Excel, de Maria

Eugnia Graa Martins, edio da Sociedade Portuguesa de Estatstica, 2005.

ALEADossis Didcticos

Estatstica Descritiva com Excel Complementos.

estatstica que cada vez mais abarque um maior nmero de pessoas, para que mais facilmente se consiga compreender o mundo que nos rodeia. Sendo a Estatstica a cincia que trata dos dados, gostaramos desde j de chamar a ateno para que fazer estatstica muito mais do que fazer clculos e manipular frmulas. Tambm no matemtica, embora utilize a matemtica. Efectivamente, ao fazer estatstica trabalhamos com dados, que so mais do que nmeros! Como diz David Moore (1997) " Data are numbers, but they are not "just numbers". Data are numbers with a context. The number 10.5, for example, carries no information by itself. But if we hear that a friend's new baby weighed 10.5 pounds at birth, we congratulate her on the healthy size of the child. The context engages our background knowledge and allows us to make judgements. We know that a baby weighing 10.5 pounds is quite large, and that it isn't possible for a human baby to weigh 10.5 ounces or 10.5 kilograms. The context makes the number informative". Da experincia que temos no dia a dia com os dados j conclumos, com certeza, que estes apresentam variabilidade. Por exemplo comum que um pacote de acar que na embalagem tenha escrito um quilograma, no pese exactamente um quilograma. Por outro lado ao pesar duas vezes o mesmo pacote possivelmente no obteremos o mesmo valor. Assim, ao dizermos que o peso do pacote um determinado valor, no podemos ter a certeza que esse valor seja correcto. Esta variabilidade est presente em todas as situaes do mundo que nos rodeia, pelo que as concluses que tiramos a partir dos dados que se nos apresentam, tm inerente um certo grau de incerteza. A Estatstica trata e estuda esta variabilidade apresentada pelos dados. Permite-nos a partir dos dados retirar concluses, mas tambm exprimir o grau de confiana que devemos ter nessas concluses. precisamente nesta particularidade que se manifesta toda a potencialidade da Estatstica. Podemos ento, e tal como refere David Moore em Perspectives on Contemporary Statistics, considerar trs grandes reas nesta cincia dos dados: 1. Aquisio de dados 2. Anlise dos dados 3. Inferncia a partir dos dados Neste captulo vamos abordar o primeiro tema considerado, ou seja o que diz respeito Aquisio de Dados, numa perspectiva de que pretendemos obter dados, a partir dos quais seria possvel responder a determinadas questes, isto , posteriormente retirar concluses para as Populaes a partir das quais esses dados so adquiridos contexto em que tem sentido fazer inferncia estatstica. Vamos assim, preocupar-nos em obter amostras representativas de Populaes que se pretendem estudar.

ALEADossis Didcticos

Estatstica Descritiva com Excel Complementos.

1.2 Aquisio de dados: sondagens e experimentaes. Populao e amostra. Parmetro e Estatstica.

O mundo que nos rodeia ser mais facilmente compreendido se puder ser quantificado. Em todas as reas do conhecimento necessrio saber o que medir e como medir. Na Estatstica ensina-se a recolher dados vlidos, assim como a interpret-los. Perante um conjunto de dados podem-se distinguir duas situaes: Aquela em que o estatstico confrontado com conjuntos de dados sem ter qualquer ideia preconcebida sobre o que que vai encontrar e ento procede a uma anlise exploratria de dados, quase sempre utilizando processos grficos, anlise esta que revelar aspectos do comportamento dos dados. Neste caso no se fala em amostras, mas sim conjuntos de dados (Murteira, 1993) e de uma maneira geral a anlise exploratria suficiente para os fins que se tm em vista; Uma outra em que procede anlise de dados com propsitos bem definidos no sentido de responder a questes especficas. Neste caso os dados tm que ser produzidos ou adquiridos por meio de tcnicas adequadas de forma a que resultem dados vlidos (amostras representativas). Estas tcnicas, em que fundamental a interveno do acaso, revolucionaram e fizeram progredir a maior parte dos campos da cincia aplicada. Pode-se dizer que hoje em dia no existe rea do conhecimento para cujo progresso no tenha contribudo a Estatstica.

Abordaremos de seguida algumas das tcnicas de aquisio de dados, que se enquadram nesta ltima situao, em que se distinguem as Sondagens e Experimentaes (aleatoriezadas) Gostaramos desde j de realar que o objectivo deste texto o de explorar, de uma forma simples, algumas das tcnicas de amostragem, com vista realizao de sondagens, situaes que se encontram de um modo geral nas Cincias Sociais, ao contrrio das Cincias experimentais, tais como Fsica ou Qumica, em que a recolha de dados se faz fundamentalmente recorrendo a experincias. Por exemplo, a populao constituda pelos eleitores, a populao constituda pela contas sedeadas num banco, etc., que s contm um nmero finito de elementos, ao contrrio da Populao conceptual de respostas geradas por um processo qumico. No demais realar a importncia desta fase, a que chamamos de Produo ou Aquisio de Dados. Como referido em Tannenbaum (1998), pgina 426: Behind every statistical statement there is a story, and like a story it has a beginning, a middle, an end, and a moral. In this first statistics chapter we begin with the beginning, which in statistics typically means the process of gathering or collecting data. Data are the raw material of which statistical information is made, and in order to get good statistical information one needs good data.

ALEADossis Didcticos

Estatstica Descritiva com Excel Complementos.

1.2.1 Sondagens. Populao e amostra. Parmetro e Estatstica. Estas noes, que j foram dadas num mdulo anterior, so aqui de novo apresentadas, unicamente com o objectivo de enquadrar o estudo seguinte, ou seja, o de introduzir algumas noes de Amostragem. O objectivo de uma sondagem o de recolher informao acerca de uma populao, seleccionando e observando um conjunto de elementos dessa populao. Sondagem Estudo estatstico de uma populao, feito atravs de uma amostra, destinado a estudar uma ou mais caractersticas tais como elas se apresentam nessa populao. Por exemplo, numa fbrica de parafusos o departamento de controlo de qualidade pretende saber qual a percentagem de parafusos defeituosos. Tempo, custos e outros inconvenientes impedem a inspeco de todos os parafusos. Assim, a informao pretendida ser obtida custa de uma parte do conjunto amostra, mas com o objectivo de tirar concluses para o conjunto todo populao. Se se observarem todos os elementos da populao tem-se um recenseamento. Por vezes confunde-se sondagem com amostragem. No entanto a amostragem diz respeito ao procedimento da recolha da amostra qualquer que seja o estudo estatstico que se pretenda fazer, pelo que a amostragem uma das fases das sondagens, j que estas devem incluir ainda o estudo dos dados recolhidos, assim como a elaborao do relatrio final. Populao, unidade, amostra Populao o conjunto de objectos, indivduos ou resultados experimentais acerca do qual se pretende estudar alguma caracterstica comum. As Populaes podem ser finitas ou infinitas, existentes ou conceptuais. Aos elementos da populao chamamos unidades estatsticas. Amostra uma parte da populao que observada com o objectivo de obter informao para estudar a caracterstica pretendida. Geralmente, h algumas quantidades numricas acerca da populao que se pretendem conhecer. A essas quantidades chamamos parmetros. Por exemplo, ao estudar a populao constituda por todos os potenciais eleitores para as legislativas, dois parmetros que podem ter interesse so: - idade mdia dos potenciais eleitores que esto decididos a votar; - percentagem de eleitores que esto decididos a votar. Para conhecer aqueles parmetros, teria de se perguntar a cada eleitor a sua idade, assim como a sua inteno no que diz respeito a votar ou no. Esta tarefa seria impraticvel, nomeadamente por questes de tempo e de dinheiro. Os parmetros so estimados por estatsticas, que so nmeros calculados a partir dos dados que constituem a amostra. No caso do exemplo anterior, se se tivesse recolhido uma amostra de dimenso 1000, caracterstica populacional "percentagem de eleitores que esto decididos a votar" corresponde a caracterstica amostral "percentagem dos 1000 eleitores, que interrogados disseram estar decididos a votar". Estas quantidades so conceptualmente distintas, pois
ALEADossis Didcticos

Estatstica Descritiva com Excel Complementos.

enquanto a caracterstica populacional (parmetro) pode ser considerada um valor exacto, embora desconhecido, a caracterstica amostral (estatstica) conhecida, embora difira de amostra para amostra, mas que todavia pode ser considerada uma estimativa til da caracterstica populacional respectiva. Um parmetro uma caracterstica numrica da populao, enquanto que a estatstica uma caracterstica numrica da amostra.

Populao Amostra

Parmetro

Estatstica

No entanto, para se poder utilizar as estatsticas, para estimar parmetros necessrio que as amostras sejam representativas das populaes de onde foram retiradas. Observao Anteriormente dissemos que uma estatstica um nmero calculado a partir dos dados da amostra, que se utiliza para estimar um parmetro. Como, de um modo geral, podemos recolher muitas amostras diferentes, embora da mesma dimenso, teremos muitas estatsticas diferentes, como estimativas do parmetro em estudo. Tantas as amostras diferentes (2 amostras da mesma dimenso sero diferentes se diferirem pelo menos num dos elementos) que se puderem obter da populao, tantas as estimativas eventualmente diferentes que se podem calcular para o parmetro. Ento podemos considerar que todas estas estimativas so os valores observados de uma funo dos elementos da amostra, a que se d o nome de estimador. A esta funo tambm se d o nome de estatstica, utilizando-se assim, indevidamente, o mesmo termo para a varivel e o valor observado da varivel. oportuno chamar a ateno para o seguinte: por vezes a Populao que se estuda, ou seja a Populao inquirida, no a objecto do estudo Populao alvo ou Populao objectivo. Por exemplo, se se pretende estudar a Populao constituda pelos indivduos adultos de nacionalidade portuguesa - Populao alvo, a Populao inquirida pode, no entanto, ser constituda pelos indivduos adultos de nacionalidade portuguesa e residentes no territrio portugus, data do inqurito. 1.2.1.1 Amostra enviesada. Amostra aleatria e amostra no aleatria. Uma amostra que no seja representativa da Populao diz-se enviesada e a sua utilizao pode dar origem a interpretaes erradas, como se sugere nos seguintes exemplos: utilizar uma amostra constituda por 10 benfiquistas, para prever o vencedor do prximo Benfica - Sporting! utilizar uma amostra constituda por leitores de determinada revista especializada, para tirar concluses sobre a opinio da populao em geral.

ALEADossis Didcticos

Estatstica Descritiva com Excel Complementos.

Um processo de amostragem diz-se enviesado quando tende sistematicamente a seleccionar elementos de alguns segmentos da Populao, e a no seleccionar sistematicamente elementos de outros segmentos da Populao. Surge assim, a necessidade de fazer um planeamento da amostragem, onde se decide quais e como devem ser seleccionados os elementos da Populao, com o fim de serem observados, relativamente caracterstica de interesse. De um modo geral, o trabalho do Estatstico deve comear antes de os dados serem recolhidos. Deve planear o modo de os recolher, de forma a que, posteriormente, se possa extrair o mximo de informao relevante para o problema em estudo, ou seja para a populao de onde os dados foram recolhidos e de modo a que os resultados obtidos possam ser considerados vlidos. Vem a propsito referir a seguinte frase de Fisher: "Ao pedir a um Estatstico que diagnostique dados j recolhidos, muitas vezes s se obtm uma autpsia". O planeamento de um estudo estatstico, que comea com a forma de seleccionar a amostra, deve ser feito de forma a evitar amostras enviesadas. Alguns processos que provocam quase sempre amostras enviesadas so, por exemplo, a amostragem por convenincia e a obteno de uma amostra por resposta voluntria. Este ltimo processo usado, com muita frequncia, pelas estaes de televiso ou jornais, com resultados por vezes contraditrios com os que se obtm quando se utiliza um processo correcto (aleatrio) de seleccionar a amostra. A utilizao de uma amostragem por convenincia tambm se realiza frequentemente, quando se selecciona a amostra a partir de uma listagem dos elementos de determinado clube ou grupo, como por exemplo a Ordem dos Engenheiros. A seguir apresentamos exemplos de ms amostras ou amostras enviesadas e resultado da sua aplicao: Amostra 1 A SIC pretende saber qual a percentagem de pessoas que a favor da despenalizao do aborto. Para isso indicou dois nmeros de telefone, um dos quais para as respostas SIM e o outro para a resposta NO. Resultado A utilizao da percentagem de respostas positivas como indicao da percentagem da populao portuguesa que a favor da despenalizao do aborto enganadora. Efectivamente s uma pequena percentagem da populao responde a estas questes e de um modo geral tendem a ser pessoas com a mesma opinio. Amostra 2 Uma estao de televiso preparou um debate sobre o aumento de criminalidade, onde enfatizou o facto de ter aumentado o nmero de crimes violentos. Ao mesmo tempo, e inserida no mesmo programa, decorria uma sondagem de opinio sobre se as pessoas eram a favor da implementao da pena de morte. Esta recolha de opinies era feita no molde descrito no exemplo anterior, isto , por resposta voluntria. Resultado A utilizao da percentagem de SIMs, que naturalmente se espera elevada, d uma indicao errada sobre a opinio da populao em geral. As pessoas influenciadas pelo debate e pelo medo da criminalidade sero levadas a telefonar dando indicao de estarem a favor da pena de morte. Amostra 3 Recolha de opinies de alguns leitores de determinada revista tcnica, para representar as opinies dos portugueses em geral.

ALEADossis Didcticos

Estatstica Descritiva com Excel Complementos.

Resultado Diferentes tipos de pessoas lem diferentes tipos de revistas, pelo que a amostra no representativa da populao. Basta pensar que, de um modo geral, a populao feminina ainda no adere s revistas tcnicas como a populao masculina. A amostra daria unicamente indicaes sobre a populao constituda pelos leitores da tal revista. Amostra 4 Utilizao de alguns alunos de uma turma, para tirar concluses sobre o aproveitamento de todos os alunos da escola. Resultado Poderamos concluir que o aproveitamento dos alunos pior ou melhor do que na realidade . As turmas de uma escola no so todas homogneas, pelo que a amostra no representativa dos alunos da escola. Poderia servir para tirar concluses sobre a populao constituda pelos alunos da turma. Amostra 5 Utilizao dos jogadores de uma equipa de basquete de uma determinada escola para estudar as alturas dos alunos dessa escola. Resultado O estudo concluiria que os estudantes so mais altos do que na realidade so. Os exemplos que apresentmos anteriormente so exemplos de amostras enviesadas porque tiveram a interveno do factor humano. Com o objectivo de minimizar o enviesamento, no planeamento da escolha da amostra deve ter-se presente o princpio da aleatoriedade de forma a obter uma amostra aleatria. Amostra aleatria e amostra no aleatria Dada uma populao, uma amostra aleatria uma amostra tal que qualquer elemento da populao tem alguma probabilidade de ser seleccionado para a amostra. Numa amostra no aleatria, alguns elementos da populao podem no poder ser seleccionados para a amostra. Quando se pretende recolher uma amostra de dimenso n, de uma Populao de dimenso N, podemos recorrer a vrios processos de amostragem. Como normalmente o objectivo , a partir das propriedades estudadas na amostra, inferir propriedades para a Populao, gostaramos de obter processos de amostragem que dem origem a bons estimadores. Embora a classificao de um estimador como bom ou no, saia fora do mbito deste trabalho, podemos adiantar que essa anlise s pode ser efectuada se conseguirmos estabelecer um plano de amostragem que atribua a cada amostra seleccionada uma determinada probabilidade, e esta atribuio s pode ser feita com planos de amostragem aleatrios. Assim, importante termos sempre presente o princpio da aleatoriedade, quando vamos proceder a um estudo em que procuramos alargar para a Populao as propriedades estudadas na amostra. Numa seco posterior apresentaremos tcnicas para obter amostras aleatrias. Exerccios Populao e Amostra Identifique, no que se segue, Populao e Amostra: a) Numa determinada empresa, pretende-se saber qual o salrio mdio dos seus empregados, pelo que se recolheu informao sobre os salrios mensais, auferidos pelos empregados dessa empresa;

ALEADossis Didcticos

Estatstica Descritiva com Excel Complementos.

b) Prendia-se saber a nota mdia obtida na prova global de Matemtica no ano lectivo 20002001, dos alunos do 10 ano da Escola Secundria Prof. Herculano de Carvalho, pelo que se recolheu informao sobre as notas obtidas nessa disciplina por todos os alunos da Escola; c) Pretendia-se averiguar a idade mdia dos alunos do 10 ano da Escola Secundria Prof. Herculano de Carvalho, pelo que se recolheu informao sobre a idade de 45 alunos do 10 ano dessa Escola; d) Pretendia-se averiguar a quantidade de vinho produzida no Alentejo, no ano de 1999, pelo que se recolheu informao sobre as quantidades de vinho produzidas por 10 agricultores da regio do Alentejo; e) Pretendia-se estudar o salrio mdio auferido pelos trabalhadores da indstria txtil, pelo que se recolheu informao sobre os salrios mensais auferidos por 250 desses trabalhadores; f) Pretendia-se averiguar a quantidade mensal de batata consumida nos lares portugueses, pelo que se recolheu informao sobre as quantidades de batata consumidas mensalmente em 100 lares portugueses; g) Pretendia-se estudar a eficcia de um medicamento novo para curar determinada doena, pelo que se seleccionaram 20 doentes padecendo dessa doena; h) Pretendia-se averiguar o n de carros vendidos num dia por um stand de automveis, pelo que se investigou junto de por cada um dos 5 empregados desse stand, quantos carros tinha vendido; i) Pretendia-se averiguar o nmero de leitores dos jornais dirios, pelo que se investigou junto de 6 jornais dirios, o nmero de leitores. j) Pretendia-se averiguar a percentagem de raparigas que frequentam o tronco comum de Matemtica Aplicada da FCUL, pelo que se seleccionaram 50 alunos do dito curso. Parmetro e Estatstica 1. Diga se so verdadeiras ou falsas as seguintes afirmaes: a) Uma estatstica um nmero que se calcula a partir da amostra; b) Os parmetros utilizam-se para estimar estatsticas; c) A mdia populacional um parmetro; d) Um parmetro uma caracterstica numrica da varivel que se est a estudar na Populao. 2. Identifique cada uma das quantidades seguintes, a negrito, como parmetro ou estatstica: a) Nas ltimas eleies para a Associao de Estudantes da Escola, 67% dos estudantes que votaram, fizeram-no na lista vencedora; b) Para obter uma estimativa do nmero de irmos dos alunos que frequentam o 4. ano de uma escola bsica, perguntou-se a 30 alunos, escolhidos ao acaso, quantos irmos tinham. Verificouse que em mdia, tinham 1.5 irmos. c) Dos 230 deputados que compem a VIII legislatura, 21.3% so mulheres. d) Perguntou-se a 80 deputados qual o partido que representavam, tendo-se concludo que 49% representavam o PS. e) Perguntou-se a 10 deputados qual a sua idade, tendo-se concludo que a idade mdia era de 45 anos.

ALEADossis Didcticos

Estatstica Descritiva com Excel Complementos.

Amostras enviesadas e amostras aleatrias 1. (Adaptado de Rossman, 2001) Considere a Populao constituda pelos deputados da VIII legislatura, que se encontra em anexo. Seleccione 5 deputados de que j tenha ouvido falar. a) Estes deputados constituem uma amostra ou uma populao? b) Quantos deputados, nos 5 seleccionados, pertencem ao crculo eleitoral da sua residncia? c) Suponha que est interessada em estudar o n. mdio de anos de servio dos deputados que constituem a VIII legislatura. Considera o conjunto de deputados seleccionados representativos da populao? Porqu? d) Se calculasse a mdia dos anos de servio dos deputados seleccionados esperava obter um valor superior ou inferior ao da mdia populacional? e) Se na sua aula ou outros colegas seleccionassem conjuntos de 5 deputados, pelo mesmo processo, isto , deputados que lhe sejam familiares, espera que a mdia dos anos de servio, tenha a mesma tendncia, de sistematicamente exibir um enviesamento em determinado sentido? Explique. f) Se tivesse seleccionado pelo mesmo processo 10 deputados, obteria uma amostra mais representativa do que a constituda pelos 5 deputados? Explique. *1.2.2 - Experimentaes Enquanto que o objectivo de uma sondagem o de recolher informao acerca de uma populao seleccionando e observando uma amostra da populao tal qual ela se apresenta, pelo contrrio, uma experimentao impe um tratamento s unidades experimentais com o fim de observar a resposta. O princpio base de uma experimentao o mtodo da comparao, em que se comparam os resultados obtidos na varivel resposta de um grupo de tratamento com um grupo de controlo. Exemplo 1.2.2.1 (Moore, 1997) Ser que a aspirina reduz o perigo de um ataque cardaco? O estudo conhecido por Physicians Health Study, foi uma experimentao mdica levada a cabo com o objectivo de responder a esta questo especfica. Metade de um grupo de 22000 mdicos (homens) foram escolhidos aleatoriamente para tomar uma aspirina todos os dias. A outra metade dos mdicos tomou um placebo, que tinha o mesmo aspecto e sabor da aspirina. Depois de vrios anos 239 mdicos do grupo que tomou placebo, contra 139 do grupo que tomou aspirina, tiveram ataques cardacos. Esta diferena suficientemente grande para evidenciar o efeito da aspirina na preveno dos ataques cardacos. Unidades experimentais, tratamento, varivel resposta, variveis explanatrias. Unidades experimentais so os objectos sobre os quais incide a experimentao e a quem aplicado uma condio experimental especfica, a que chamamos tratamento. Varivel resposta a varivel cujo comportamento pretendemos estudar. As variveis explanatrias so as variveis que explicam ou causam mudanas na varivel resposta. No estudo considerado anteriormente temos: Unidades experimentais 22000 mdicos

ALEADossis Didcticos

Estatstica Descritiva com Excel Complementos.

10

Tratamentos aspirina ou placebo Varivel explanatria se o indivduo tomou aspirina ou placebo Varivel resposta se o indivduo teve ou no ataque cardaco.

Sem a comparao de tratamentos os resultados de experimentaes em medicina e em cincias do comportamento, duas reas onde estes mtodos so largamente utilizados, poderiam ser muito influenciados pela seleco dos indivduos, o efeito do placebo, etc. O resultado poderia vir enviesado. Um estudo no controlado de uma nova terapia mdica quase sempre enviesado no sentido de dar ao tratamento um maior sucesso do que ele tem na realidade (efeito placebo). Exemplo 1.2.2.2 (Moore, 1997) - Um tratamento utilizado durante vrios anos para tratar lceras do estmago consistia em pr o doente a aspirar, durante uma hora, uma soluo refrigerada que era bombeada para dentro de um balo. Segundo o Journal of the American Medical Association, uma experimentao levada a efeito com este tratamento permitiu concluir que o arrefecimento gstrico reduzia a secreo de cido, diminuindo a propenso para as lceras. No entanto, veio-se a verificar mais tarde com um planeamento adequado, que a resposta dos doentes ao tratamento foi influenciada pelo efeito placebo efeito confounding. O que acontece que h doentes que respondem favoravelmente a qualquer tratamento, mesmo que seja um placebo, possivelmente pela confiana que depositam no mdico e pelas expectativas de cura que depositam no tratamento. Num planeamento adequado feito anos mais tarde, um grupo de doentes com lcera foi dividido em dois grupos, tratando-se um com a soluo refrigerada e o outro grupo com um placebo, constitudo por uma soluo temperatura ambiente. Os resultados desta experimentao permitiram concluir que dos 82 doentes sujeitos soluo refrigerada - grupo de tratamento, 34% apresentaram melhoras, enquanto que dos 78 doentes que receberam o placebo - grupo de controlo, 38% apresentaram melhoras. Num planeamento experimental, uma vez identificadas as variveis e estabelecido o protocolo dos tratamentos, segue-se uma segunda fase que consiste na atribuio de cada unidade experimental a um tratamento. Esta segunda fase deve ser regida pelo princpio da aleatoriedade. Este princpio tem como objectivo fazer com que os grupos que vo ser comparados, tenham partida constituio semelhante, de forma que as diferenas observadas na varivel resposta possam ser atribudas aos efeitos dos tratamentos. Assim, a atribuio de cada indivduo ao grupo de tratamento ou de controlo feita de forma aleatria. Combinando a comparao com a aleatoriedade, podemos esquematizar da seguinte forma o tipo de planeamento mais simples:
Tratamento Atribuio aleatria
Respostas ao tratamento 1

Grupo 1

Unidades experimentais

Comparao
Grupo 2
Respostas ao tratamento 2

ALEADossis Didcticos

Estatstica Descritiva com Excel Complementos.

11

Ao comparar os resultados temos de ter presente que haver sempre alguma diferena que se tem de atribuir ao facto de os grupos no serem perfeitamente idnticos e algumas diferenas que se atribuem ao acaso. O que se pretende averiguar se as diferenas encontradas no sero "demasiado grandes" para que se possam atribuir a essas causas, ou seja, verificar se no tendo em linha de conta a diferena entre os tratamentos, a probabilidade de obter as diferenas observadas no seria extremamente pequena. Se efectivamente esta probabilidade for inferior a um determinado valor (de que falaremos mais tarde) dizemos que a diferena estatisticamente significativa, sendo de admitir que foi provocada pelos diferentes tratamentos. Convm ainda observar que numa experimentao os indivduos seleccionados para cada grupo no devem saber qual o tipo de tratamento a que esto a ser sujeitos, nem o investigador que est a conduzir a experimentao e a medir os resultados deve saber qual o tipo de tratamento que cada indivduo seguiu. Temos o que se chama uma experimentao duplamente cega. Esta precauo uma forma de evitar o enviesamento, quer nas respostas, quer nas medies (um mdico ao observar o efeito de um tratamento que provoque, por exemplo, uma mancha vermelha na pele, pode estar condicionado na interpretao da gravidade dessa mancha se souber qual o tratamento a que o doente foi sujeito). Em muitas situaes os investigadores tm de se cingir aos estudos observveis, j que no possvel conduzir uma experimentao controlada. Por exemplo, para estudar o efeito do tabaco no cancro do pulmo, o investigador limita-se a observar grupos de indivduos que fumam ou no, no podendo ser ele prprio a seleccionar um conjunto de indivduos e depois p-los aleatoriamente a fumar tabaco ou um placebo. No captulo seguinte abordaremos de forma introdutria o estudo de alguns planos de amostragem, j que um estudo conveniente do planeamento das experincias, assim como da definio da amostra adequada para o estudo em vista contm, por si s, matria suficiente para ser objecto de vrias disciplinas num curso de Estatstica, nomeadamente as disciplinas de Planeamento de Experincias e Amostragem.

ALEADossis Didcticos

Estatstica Descritiva com Excel Complementos.

12

1.3 - Tcnicas de amostragem aleatria


Seguidamente apresentaremos alguns dos planeamentos mais utilizados para seleccionar amostras aleatrias. Dos vrios tipos de planeamento utilizados, destacam-se os que conduzem a amostras aleatrias simples, amostras aleatrias com reposio, amostras sistemticas e amostras estratificadas. 1.3.1 - Amostragem aleatria simples (sem reposio) e amostragem aleatria com reposio O plano de amostragem aleatria mais bsico o que permite obter a amostra aleatria simples: Amostra aleatria simples Dada uma populao, uma amostra aleatria simples de N dimenso n um conjunto de n unidades da populao, tal que qualquer outro conjunto dos n conjuntos diferentes de n unidades teria igual probabilidade de ser seleccionado. Se uma populao tem dimenso N e se pretende uma amostra aleatria simples de dimenso N N! = n, esta amostra recolhida aleatoriamente de entre todas as = n! (N - n)! n N(N - 1)(N - 2)...(N - n + 1) amostras distintas que se podem recolher da populao. Isto implica = n(n - 1)(n - 2)...1
N que cada amostra tenha a mesma probabilidade n
1

de ser seleccionada. Uma amostra destas

pode ser escolhida sequencialmente da populao, escolhendo um elemento de cada vez, sem reposio, pelo que em cada seleco cada elemento tem a mesma probabilidade de ser seleccionado. Um esquema de amostragem aleatria simples, conduz a que cada elemento da Populao tenha a mesma probabilidade de ser seleccionado para a amostra. No entanto existem outros esquemas de amostragem em que cada elemento tem igual probabilidade de ser seleccionado, sem que cada conjunto de n elementos tenha a mesma probabilidade de ser seleccionado. o que se passa com a amostragem aleatria sistemtica, de que falaremos adiante. Amostragem com reposio Na amostragem com reposio, sempre que um elemento seleccionado, ele reposto na populao, antes de seleccionar o seguinte, ao contrrio do que acontece na amostragem sem reposio. Intuitivamente conseguimos apercebermo-nos de que se a dimenso da populao for grande, quando comparada com a dimenso da amostra, estes dois tipos de amostragem podem ser considerados de certo modo equivalentes, j que a probabilidade de seleccionar o mesmo elemento duas vezes muito pequena. Dada uma populao de dimenso N, referir-nos-emos a uma amostra aleatria de dimenso n, com reposio, como um conjunto de n unidades da populao, tal que qualquer outro conjunto dos Nn conjuntos diferentes de n unidades, teria igual probabilidade de ser seleccionado.

ALEADossis Didcticos

Estatstica Descritiva com Excel Complementos.

13

A probabilidade de cada uma das amostras ser seleccionada igual a 1/Nn. Exemplificamos a seguir um processo de obter uma amostra aleatria simples. Exemplo 1.3.1.1 Consideremos a populao constituda pelos 18 alunos de uma turma do 10. ano de uma determinada Escola Secundria, em que a caracterstica de interesse a estudar a altura mdia desses alunos. Uma maneira possvel de recolher desta populao uma amostra aleatria, seria escrever cada um dos indicadores (n. do aluno, nome, ) dos elementos da populao num quadrado de papel, inserir todos esses bocados de papel numa caixa e depois seleccionar tantos quantos a dimenso da amostra desejada. A recolha tem de ser feita sem reposio pois quando se retira um papel (elemento da populao), ele no reposto enquanto a amostra no estiver completa (com a dimenso desejada). Qualquer conjunto de nmeros recolhidos desta forma dar origem a uma amostra aleatria simples, constituda pelas alturas dos alunos seleccionados (desde que se tenha o cuidado de cortar os bocadinhos de papel todos do mesmo tamanho, para ficarem semelhantes, e de os baralhar convenientemente). A partir de cada amostra, pode-se calcular o valor da estatstica mdia, que ser uma estimativa do parmetro a estudar valor mdio da altura dos alunos da turma. Obter-se-o tantas estimativas, quantas as amostras retiradas. Chama-se a ateno para o facto de nesta altura no se poder dizer qual das estimativas "melhor", isto , qual delas uma melhor aproximao do parmetro a estimar, j que esse parmetro desconhecido (obviamente que nesta populao to pequena seria possvel estudar exaustivamente todos os seus elementos, no sendo necessrio recolher nenhuma amostra este exemplo s serve para ilustrar uma situao)! 1.3.1.1 Nmeros aleatrios O processo que acabmos de descrever no prtico se a populao a estudar tiver dimenso elevada. Neste caso, um dos processos de seleccionar uma amostra aleatria simples consiste em utilizar uma tabela de nmeros aleatrios. Dgitos aleatrios Uma tabela de dgitos aleatrios uma listagem dos dgitos 0, 1, 2, 3, 4, 5, 6, 7, 8 ou 9 tal que: - qualquer um dos destes dgitos tem igual possibilidade de figurar em qualquer posio da lista; - a posio em que figura cada dgito independente das posies dos outros dgitos. Apresenta-se a seguir um extracto de uma tabela de nmeros aleatrios (Moore, 1997). O facto de os dgitos se apresentarem agrupados 5 a 5 s para facilidade de leitura. Linha
101 102 103 104 105 106 107 19223 73676 45467 52711 95592 68417 82739 95034 47150 71709 38889 94007 35013 57890 05756 99400 77558 93074 69971 15529 20807 28713 01927 00095 60227 91481 72765 47511 96409 27754 32863 40011 60779 85089 81676 12531 42648 29485 85848 53791 57067 55300 42544 82425 82226 48767 17297 50211 94383 82853 36290 90056 52573 59335 47487 14893

ALEADossis Didcticos

Estatstica Descritiva com Excel Complementos.

14

108 109

60940 36009

72024 19365

17868 15412

24943 39638

61790 85453

90656 46816

87964 83485

18883 41979

A partir da tabela de dgitos aleatrios podem-se obter nmeros aleatrios de 2 dgitos qualquer par dos 100 pares possveis 00, 01, 98, 99, tem igual probabilidade de ser seleccionado, de 3 dgitos - qualquer triplo dos 1000 triplos possveis 000, 001, 998, 999, tem igual probabilidade de ser seleccionado, etc., tomando os dgitos da tabela 2 a 2, 3 a 3, etc., a partir de uma linha qualquer e percorrendo-a da esquerda para a direita. Para seleccionar uma amostra de uma populao utilizando a tabela procede-se em duas etapas: atribui-se um nmero a cada elemento da populao. Esta atribuio ter de ser feita com as devidas precaues, de forma a que cada nmero tenha o mesmo nmero de dgitos, para ter igual probabilidade de ser seleccionado; a partir da tabela escolhe-se uma linha ao acaso e comea-se a percorr-la da esquerda para a direita, tomando de cada vez os dgitos necessrios.

Exemplo 1.3.1.1 (cont) - Considerando a populao do exemplo anterior, constituda por 18 elementos, vamos numer-los com os nmeros 01, 02, 03, , 17, 18 (podia ser utilizado qualquer outro conjunto de 18 nmeros de 2 dgitos). Para seleccionar uma amostra de dimenso 4 fixamo-nos numa linha qualquer da tabela, por exemplo a linha 107 e comeamos a seleccionar os nmeros de dois dgitos, tendo-se obtido: 82 67 07 73 65 20 95 53 24 78 00 17 90 94 86 20 38 82 80 31 49 74 48 43 75 93 61 11 60 79 81 94 09

Tivemos de ler 33 nmeros, dos quais s aproveitmos 4, pois os outros no correspondiam a elementos da populao. Como obter uma tabela de nmeros aleatrios? Um processo poder consistir em meter numa caixa 10 bolas numeradas de 0 a 9 e fazer vrias extraces de uma bola, tantas quantas os dgitos que se pretendem para constituir a tabela. De cada vez que se faz uma extraco, l-se o nmero da bola, aponta-se e repe-se a bola na caixa - extraco com reposio. Com este processo qualquer dgito tem igual probabilidade de ser seleccionado. Alm disso a sada de qualquer um dos dgitos em qualquer momento, independente dos dgitos que j saram anteriormente. Alm das tabelas de nmeros aleatrios tambm existe a possibilidade de utilizar o computador para os gerar ou uma simples mquina de calcular. Este o processo mais utilizado hoje em dia, mas convm ter presente que os nmeros que se obtm so pseudo-aleatrios, j que um mecanismo determinista que lhes d origem, embora se comportem como nmeros aleatrios (passam numa bateria de testes destinados a confirmar a sua aleatoriedade). No exemplo seguinte vamos utilizar o computador, mais precisamente o programa Excel, para fazer a seleco de uma amostra aleatria simples e de uma amostra aleatria com reposio.

ALEADossis Didcticos

Estatstica Descritiva com Excel Complementos.

15

1.3.1.2 - Utilizao do Excel para recolher uma amostra aleatria simples e uma amostra aleatria com reposio No exemplo seguinte, apresentamos uma forma simples de utilizar o Excel para seleccionar uma amostra aleatria simples e uma amostra aleatria, com reposio, de uma Populao finita, de que se tenha uma listagem dos elementos. Exemplo 1.3.1.2 Considere a populao constituda pelos 230 deputados da actual (X) legislatura e que se encontra em Anexo. Para obter esta tabela fomos ao site da Assembleia da Republica, onde est uma lista ordenada com o nome de todos os deputados (coluna B), o respectivo grupo parlamentar (coluna C) e o crculo eleitoral (coluna D). Este exemplo vai-nos servir para introduzir alguns conceitos importantes, pelo que fomos completar esta lista com a idade dos deputados, acedendo pgina de cada um e recolhendo a informao sobre a data de nascimento (coluna F). Nas situaes de interesse, que surgem na vida real, no se vai recolher a informao sobre determinada caracterstica, para a populao toda, mas unicamente para os elementos seleccionados para a amostra. Inserimos ainda uma coluna com identificao do sexo (coluna E). Apresentamos a seguir uma pequena parcela desse ficheiro, a que chammos Deputados.xls. Este ficheiro tem uma primeira coluna (coluna A), onde indicado o nmero do deputado, quando estes esto ordenados por ordem alfabtica:

Como dissemos anteriormente, vamos utiliz-lo para trabalhar alguns conceitos importantes, tais como: 1. Obteno de uma amostra aleatria simples e de uma amostra aleatria, com reposio, utilizando o Excel 2. Estatstica e parmetro 3. Variabilidade amostral 4. Preciso

ALEADossis Didcticos

Estatstica Descritiva com Excel Complementos.

16

1. Obteno de uma amostra aleatria simples e de uma amostra aleatria, com reposio, utilizando o Excel Amostra aleatria simples 1 passo - Utilizando a funo RAND(), atribuir um nmero aleatrio, entre 0 e 1, a cada deputado. Para isso basta inserir a funo na clula J2 e replic-la tantas vezes, quantos os deputados (ou seja, 230 vezes):

Para visualizar as frmulas na folha de Excel, bastou seleccionar:


Tools Options View Formulas Ok:

Uma vez que a funo RAND() uma funo voltil, isto , muda quando se recalcula a folha, no caso de pretendermos ficar com os valores gerados convm ir ao Edit e fazer um Paste Special Values, como se indica a seguir:

ALEADossis Didcticos

Estatstica Descritiva com Excel Complementos.

17

Colmos os valores na coluna K e fizemos o Save. Repare-se que os valores que estavam inicialmente na coluna J foram alterados, dando origem a novos valores (devido ao facto da funo RAND() ser voltil, como referimos anteriormente); 2 passo Ordenar o ficheiro, utilizando como critrio a coluna K; 3 passo Como pretendemos uma amostra de dimenso 10, seleccionar os primeiros 10 deputados do ficheiro ordenado:

Os deputados seleccionados foram os nmeros 110, 198, 225, 145, 128, 180, 222, 26 e 133. Nota: Embora os nmeros anteriores sejam referidos como aleatrios, convm ter presente que os nmeros que se obtm so pseudo-aleatrios, j que um mecanismo determinista que lhes d origem. No entanto comportam-se como nmeros aleatrios (passam uma bateria de testes destinados a confirmar a sua aleatoriedade) e da a sua utilizao como tal. Amostra aleatria com reposio a) Utilize a funo RANDBETWEEN(), para obter nmeros pseudo-aleatrios entre 1 e 230, para simular a extraco de uma amostra aleatria, da populao dos deputados.

ALEADossis Didcticos

Estatstica Descritiva com Excel Complementos.

18

Esta funo devolve um nmero pseudo-aleatrio entre os limites especificados nos argumentos. Como pretendemos seleccionar uma amostra de dimenso 10, replicamos a frmula anterior por 10 clulas, na coluna L, como se apresenta a seguir:

A amostra obtida constituda pelos deputados com os 10 nmeros nas clulas L2, ..., L11:

Uma vez que a funo RANDBETWEEN uma funo voltil, isto , muda quando se recalcula a folha, para ficar com os valores gerados fomos ao Edit Paste SpecialValues, como se indica a seguir:

ALEADossis Didcticos

Estatstica Descritiva com Excel Complementos.

19

Colmos os valores na coluna M e fizemos o Save. Repare-se que os valores que estavam inicialmente na coluna L foram alterados, dando origem a uma nova amostra (devido ao facto da funo RANDBETWEEN ser voltil, como referimos anteriormente): b) Da tabela dos deputados, seleccione o nome e o grupo parlamentar dos deputados cujo nmero seja um dos elementos da amostra obtida anteriormente. Para seleccionar o nome e o grupo parlamentar dos deputados correspondentes aos 10 nmeros obtidos, vamos utilizar uma funo do Excel, a funo VLOOKUP, do seguinte modo:

Esta funo vai tabela dos deputados, constituda pelas clulas (A2:C231) seleccionar o nome (2 coluna da tabela seleccionada) e o Grupo Parlamentar (3 coluna da tabela seleccionada) correspondente ao nmero que est na coluna M, obtendo-se a seguinte amostra:

2. Parmetro e Estatstica. c) Calcule a percentagem de deputados do grupo parlamentar PSD, na amostra obtida. Vamos comear por utilizar a funo COUNTIF, que inserimos na clula O12, e que conta o n de clulas, de entre um conjunto especificado de clulas, que satisfazem determinado critrio, sendo este critrio, no caso presente, o de serem iguais a PSD:

ALEADossis Didcticos

Estatstica Descritiva com Excel Complementos.

20

Obtivemos o valor 4 para a frequncia absoluta de deputados do PSD. Como o n de deputados da amostra era 10, a percentagem de deputados do grupo parlamentar do PSD, na amostra de 40%. Este valor uma estatstica caracterstica numrica da amostra. Utiliza-se como estimativa do parmetro percentagem de deputados do PSD na populao em estudo caracterstica numrica da populao. 3. Variabilidade amostral d) Repita 10 vezes o processo descrito nas alneas anteriores e registe numa tabela os resultados obtidos. Germos 10 amostras e obtivemos os seguintes resultados para a estatstica - percentagem de deputados PSD, em cada uma das amostras:
Amostra % PSD 1 40% 2 20% 3 30% 4 50% 5 20% 6 30% 7 40% 8 50% 9 0% 10 30%

ALEADossis Didcticos

Estatstica Descritiva com Excel Complementos.

21

Repare-se na variabilidade apresentada nos resultados obtidos para as diferentes amostras. Os 10 valores obtidos para a percentagem de deputados do PSD existentes em cada uma delas, representam outras tantas estimativas para a verdadeira proporo de deputados existentes na Populao. Iremos ilustrar esta variabilidade, representando os valores num diagrama de pontos, utilizando uma opo grfica do Excel, o Scatter. Para obter a representao grfica pretendida, necessrio comear por construir uma tabela adequada:
Para construir esta tabela, pode-se utilizar a seguinte metodologia: consideram-se duas colunas, onde na primeira coluna se representam todos os elementos do conjunto de dados, pela ordem em que aparecem, e na segunda coluna indica-se a frequncia absoluta com que cada elemento surge no conjunto de dados, medida que se vai percorrendo a coluna, de cima para baixo. Por exemplo, ao lado do primeiro elemento que o 60%, indicamos um 1, mas a segunda vez que aparece o 60%, indicamos um 2, etc. Se, partida, dispusssemos de uma tabela de frequncias, para construir esta nova tabela, bastaria repetir cada elemento da amostra, tantas vezes quantas a sua frequncia absoluta.

Na folha do Excel, seleccionam-se as duas colunas e no menu Chart selecciona-se Scatter e o primeiro subtipo desta representao. Obtm-se o diagrama de pontos com o seguinte aspecto:

Trabalhmos esteticamente esta representao, seguindo os seguintes passos: Seleccionar:


Legenda e carregar no boto Delete; As linhas e carregar no boto Delete; O fundo cinzento e carregar no boto Delete; O eixo dos YY e carregar no boto Delete;

Temos finalmente a seguinte representao:

ALEADossis Didcticos

Estatstica Descritiva com Excel Complementos.

22

Da representao grfica anterior comeamos a adivinhar que a distribuio das estimativas apresenta um padro com uma certa simetria relativamente ao valor de 30%. e) Considere agora 20 amostras de dimenso 10, calcule para cada uma o valor da estatstica em estudo, e construa o diagrama de pontos dos valores obtidos. Seleccionmos 20 amostras de dimenso 10, calculmos a percentagem de deputados do PSD em cada uma delas e com os resultados obtidos construmos a seguinte representao:

Esta representao mais elucidativa e refora a ideia avanada anteriormente, de que o valor do parmetro em estudo percentagem de deputados do PSD, se deve situar entre os valores 30% e 40%. Tendo em conta que a verdadeira percentagem de deputados do PSD na populao 32,6%, apesar de o valor apresentado pela estatstica variar de amostra para amostra variabilidade amostral, estes valores apresentam uma distribuio que nos d informao sobre o parmetro, j que essa distribuio se localiza ou est centrada em torno do parmetro. 4. Preciso f) Considere agora 20 amostras de dimenso 30, calcule para cada uma o valor da estatstica em estudo, e construa o diagrama de pontos dos valores obtidos. Compare a representao obtida, com a que obteve na alnea e).

ALEADossis Didcticos

Estatstica Descritiva com Excel Complementos.

23

Seguimos um processo idntico ao da alnea e), com a particularidade de as dimenses das amostras terem dimenso 30, em vez de 10. Com as percentagens de deputados do PSD existentes em cada uma delas construmos a seguinte representao grfica:

Comparando as duas representaes obtidas quando se consideram amostras de dimenso 10 ou de dimenso 30, verificamos que a variabilidade apresentada pelos valores da estatstica percentagem de deputados do PSD, no caso das amostras de maior dimenso, inferior apresentada pela estatstica no caso das amostras de menor dimenso, como se v na figura seguinte:
Percentagem de deputados do PSD em amostras de dimenso 10 Percentagem de deputados do PSD em amostras de dimenso 30

1 0

20

30 40

50 60

70 80

90 1 00

1 0

20

30 40

50 60

70 80

90 1 00

A preciso de um estimador caracterizada pela variabilidade apresentada pelas diferentes estimativas, obtidas quando se consideram diferentes amostras. Quanto menor for a variabilidade apresentada pelas diferentes estimativas, maior a preciso apresentada pelo estimador. De um modo geral, diz-se que uma estatstica um bom estimador de um certo parmetro, se a distribuio dos valores dessa estatstica, calculados para diversas amostras, revelar uma localizao em torno do parmetro e apresentar pequena variabilidade. Em alguns casos essa anlise pode fazer-se do ponto de vista terico. No entanto, hoje em dia, cada vez se recorre mais simulao para decidir se um estimador ou no, um bom estimador do parmetro de interesse.

ALEADossis Didcticos

Estatstica Descritiva com Excel Complementos.

24

Observao: Este exemplo que acabmos de apresentar tem como objectivo apresentar alguns conceitos importantes, como o da variabilidade e das propriedades de um estimador. Efectivamente, neste caso, j que temos informao sobre o grupo parlamentar de cada deputado, no teria muito sentido ir recolher uma amostra para obter a percentagem de deputados em cada grupo parlamentar. Repare-se, no entanto, que se o que estivesse em estudo fosse ter uma ideia sobre o nmero mdio de filhos dos deputados portugueses e suas idades, j faria sentido recolher uma amostra, pois para obter a informao desejada no seria necessrio interrogar todos os deputados e s se interrogariam os seleccionados para a amostra. 1.3.2 - Amostragem aleatria sistemtica Na prtica o processo de seleccionar uma amostra aleatria simples de uma populao com grande dimenso, no to simples como o descrito anteriormente. Se a dimenso da populao for grande o processo torna-se muito trabalhoso. Ento uma alternativa considerar uma amostra aleatria sistemtica os elementos so escolhidos de uma maneira regular percorrendo a lista. Amostra aleatria sistemtica Dada uma populao de dimenso N, ordenada por algum critrio, se se pretende uma amostra de dimenso n, escolhe-se aleatoriamente um elemento de entre os k primeiros, onde k a parte inteira do quociente N/n. A partir desse elemento escolhido, escolhem-se todos os k-simos elementos da populao para pertencerem amostra. A amostra aleatria sistemtica no uma amostra aleatria simples, j que nem todas as amostras possveis de dimenso n, tm a mesma probabilidade de serem seleccionadas. 1.3.2.1 - Utilizao do Excel para recolher uma amostra aleatria sistemtica No exemplo seguinte, apresentamos uma forma simples de utilizar o Excel para seleccionar uma amostra aleatria sistemtica de uma Populao finita, de que se tenha uma listagem dos elementos. Exemplo 1.3.2.1 Considere novamente o ficheiro Deputados.xls, que contm o nome, filiao partidria, sexo e data de nascimento dos 230 deputados da actual legislatura e que se encontra em Anexo. Utilizando o processo de amostragem sistemtica, obtenha uma amostra de 12 deputados, registando para cada um deles o sexo. Temos uma populao de dimenso 230 e pretendemos obter uma amostra de dimenso 12. Vamos utilizar a seguinte metodologia:
Passo 1 Dividindo 230 por 12 e retendo a parte inteira, obtemos o valor 19. Passo 2 Dos primeiros 19 elementos da lista ordenada dos deputados, vamos seleccionar um elemento ao acaso. Vimos na seco anterior que basta utilizar a funo Randbetween(1;19), que inserimos na clula K3. A utilizao desta funo devolveu-nos o deputado nmero 14. Passo 3 A amostra ser constituda pelos deputados nmeros 14, 33, 52, 71, 90, 109, 128, 147, 166, 185, 204, 223, que obtivemos adicionando sucessivamente 19, at obtermos 12 elementos (clulas K3:K14).

ALEADossis Didcticos

Estatstica Descritiva com Excel Complementos.

25

Passo 4 -

Utilizando a funo VLOOKUP(K3;$A$3:$E$232;5), replicada pelas 12 clulas L3:L14, obteve-se

finalmente a informao solicitada, constituda pelo sexo dos 12 deputados seleccionados para a amostra:

1.3.3 Amostragem estratificada Pode acontecer que a populao possa ser dividida em vrias subpopulaes ou estratos, mais ou menos homogneos, relativamente caracterstica a estudar. Nesta situao existe uma tcnica importante e apropriada, que a amostragem por estratificao. Apresentamos de seguida um exemplo em que privilegiaremos a exemplificao da tcnica, em detrimento da apresentao em Excel, uma vez que o tipo de amostragem utilizado, se resume a uma amostragem aleatria simples, j exemplificada anteriormente. Exemplo 1.3.3.1 (Ted Hodgson and John Borkowski in Getting the Best from Teaching Statistics) Consideremos uma populao constituda por 40 cartes numerados (20 vermelhos e 20 pretos) de acordo com a seguinte tabela:
N. Freq. Cor 6 4 Ver 7 4 Ver 8 4 Ver 9 4 Ver 10 4 Ver 26 4 Preto 27 4 Preto 28 4 Preto 29 4 Preto 30 4 Preto

A mdia dos nmeros inscritos nesta populao de 40 cartes de 18 valor mdio da caracterstica populacional em estudo. Pretende-se, atravs de uma amostra, obter alguma indicao sobre a mdia dos nmeros inscritos nos cartes (a qual neste exemplo fictcio conhecida). Colocam-se os cartes num saco e pede-se a cada aluno da turma que retire uma amostra de 4 cartes amostra aleatria simples, e que calcule a mdia dos nmeros dos cartes seleccionados. Numa turma de 34 alunos, obtiveram-se os seguintes resultados:
Amostra n 1 2 3 4 5 26 10 29 6 6 7 26 6 8 9 10 9 7 9 8 6 6 10 29 30 Mdia 12,25 12,75 13 13 13,25

ALEADossis Didcticos

Estatstica Descritiva com Excel Complementos.

26

6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34

9 7 9 9 9 10 6 7 28 7 6 9 26 7 27 6 8 6 26 8 26 30 8 10 29 28 27 30 29

8 7 9 8 10 9 27 7 8 6 29 6 9 10 6 29 29 8 9 11 27 26 26 26 6 9 26 10 30

7 30 10 8 8 29 6 26 6 29 26 26 8 26 30 28 26 30 30 28 6 27 29 26 30 30 30 29 7

29 9 26 30 29 9 26 27 26 26 8 29 28 29 9 10 10 30 10 30 27 6 28 30 27 26 10 26 30

13,25 13,25 13,5 13,75 14 14,25 16,25 16,75 17 17 17,25 17,5 17,75 18 18 18,25 18,25 18,5 18,75 19,25 21,5 22,25 22,75 23 23 23,25 23,25 23,75 24

Esta distribuio no nos ajuda muito a dizer qual a estimativa para o valor mdio da populao (mdia dos nmeros inscritos). Gostaramos de ter obtido para a amostra, cujos elementos so as diferentes mdias, uma distribuio com pouca variabilidade, para podermos argumentar que a mdia destes elementos era uma boa estimativa para o parmetro em estudo, ou seja, o valor mdio dos nmeros inscritos nos cartes (Ver seco seguinte). Diz-se ento aos alunos que estamos perante duas subpopulaes, a de cartes vermelhos e a de cartes pretos, embora no seja esta a caracterstica em estudo e sobre a qual seria importante haver diferena entre os estratos ou subpopulaes. De qualquer modo aqueles so informados que poder haver diferenas relativamente caracterstica de interesse e que um processo de amostragem adequado levaria em conta essas diferenas. Procede-se ento a uma seleco da amostra, de forma a obter 2 cartes vermelhos e 2 cartes pretos estes valores devem reflectir a dimenso dos estratos (que no nosso exemplo so iguais). Os resultados obtidos foram os seguintes:
Amostra n 1 2 3 4 Mdia 6 8 8 7 7 9 6 8 27 26 28 29 28 27 28 26 17 17,5 17,5 17,5

ALEADossis Didcticos

Estatstica Descritiva com Excel Complementos.

27

5 6 7 8 9 10 11 12 13 14 15

9 6 8 10 9 6 10 10 9 8 9

9 9 10 6 9 8 8 7 9 9 10

26 29 26 27 28 28 27 28 27 29 28

26 27 27 28 26 30 28 29 29 29 29

17,5 17,75 17,75 17,75 18 18 18,25 18,5 18,5 18,75 19

A partir dos dados obtidos para as amostras, confirma-se que efectivamente temos dois estratos distintos, relativamente caracterstica de interesse um estrato com cartes com nmeros mais pequenos e outro estrato com cartes com nmeros maiores. Estes resultados mostram que as mdias das amostras estratificadas esto consistentemente prximas do valor mdio da populao (o qual s deve ser dito aos alunos depois das simulaes serem feitas), podendo-se assim observar que a estratificao conduziu a um aumento da preciso. *1.3.4 Estimador centrado e no centrado. Preciso Uma vez escolhido um plano de amostragem aleatrio, ao pretendermos estimar um parmetro, pode ser possvel utilizar vrias estatsticas (estimadores) diferentes. Por exemplo, quando pretendemos estudar a variabilidade presente numa Populao, que pode ser medida pela varincia populacional 2, sabemos que podemos a partir de uma amostra, obter duas estimativas diferentes para essa varincia, a partir das expresses

s =

(x i x) 2
i =1

n 1

ou

s =

(x
i =1
2

x) 2
2

Quais as razes que nos podem levar a preferir s em vez de s ? Um critrio que costuma ser aplicado o de escolher um bom estimador como sendo aquele que centrado e que tem uma boa preciso. Escolhido um plano de amostragem, define-se: Estimador centrado Um estimador diz-se centrado quando a mdia das estimativas obtidas para todas as amostras possveis que se podem extrair da Populao, segundo o esquema

ALEADossis Didcticos

Estatstica Descritiva com Excel Complementos.

28

considerado, coincide com o parmetro a estimar. Quando se tem um estimador centrado, tambm se diz que no enviesado. A mdia das estimativas calculadas a partir da expresso s acima considerada, coincide com a 2 varincia . Para se evitar o enviesamento, necessrio estarmos atentos, primeiro na escolha do plano de amostragem e depois na escolha do estimador utilizado para estimar o parmetro desconhecido. O facto de utilizarmos um estimador centrado, no nos previne contra a obteno de ms estimativas, se o plano de amostragem utilizado sistematicamente favorecer uma parte da Populao (isto , fornecer amostras enviesadas). Preciso - Ao utilizar o valor de uma estatstica para estimar um parmetro, vimos que cada amostra fornece um valor para a estatstica que se utiliza como estimativa desse parmetro. Estas estimativas no so iguais devido variabilidade presente na amostra. Se, no entanto, os diferentes valores obtidos para a estatstica forem prximos, e o estimador for centrado, podemos ter confiana de que o valor calculado a partir da amostra recolhida (na prtica recolhese uma nica amostra) est prximo do valor do parmetro (desconhecido). A falta de preciso juntamente com o problema do enviesamento da amostra so dois tipos de erro com que nos defrontamos num processo de amostragem (mesmo que tenhamos escolhido um bom estimador). No se devem, contudo, confundir. Enquanto o enviesamento se manifesta por um desvio nos valores da estatstica, relativamente ao valor do parmetro a estimar, sempre no mesmo sentido, a falta de preciso manifesta-se por uma grande variabilidade nos valores da estatstica, uns relativamente aos outros. Por outro lado, enquanto o enviesamento se reduz com o recurso a amostras aleatrias, a preciso aumenta-se aumentando a dimenso da amostra. Exemplo 1.3.4.1 - Suponhamos que ao pretender estudar a percentagem de eleitores que votariam favoravelmente num candidato Cmara de determinada cidade, se recolhia uma amostra de 300 eleitores, dos quais 175 responderam que sim. Considerando como estimador, a proporo de elementos na amostra apoiantes do candidato, ento uma estimativa para a proporo pretendida seria 0.58. Se considerssemos outra amostra de 300 eleitores, suponhamos que o valor obtido para o nmero de sims tinha sido 183. Ento a estimativa obtida seria 0.61. A repetio deste processo 15 vezes permitiria obter 15 valores para o estimador, que seriam outras tantas estimativas do parmetro a estimar - percentagem de eleitores da cidade, potenciais apoiantes do tal candidato. Representando num eixo os valores obtidos e admitindo que o verdadeiro valor do parmetro era 0.60, poderamos deparar-nos com vrias situaes:
2

ALEADossis Didcticos

Estatstica Descritiva com Excel Complementos.

29

1) reflecte um pequeno ou ausncia de enviesamento, pois os valores para a estatstica (propores obtidas a partir das amostras) situam-se para um e outro lado do valor do parmetro, e verifica-se ainda a existncia de uma pequena variabilidade entre os resultados obtidos para as vrias amostras, que se traduz em grande preciso. 2) embora se mantenha a preciso, existe um grande enviesamento, pois os valores da estatstica situam-se sistematicamente para a direita do valor do parmetro. Presume-se que o esquema de amostragem no seja aleatrio, pelo que as amostras s reflectem parte da Populao. 3) voltamos a ter uma situao de pequeno enviesamento, mas de pequena preciso devido grande variabilidade apresentada pelos valores da estatstica. Presumimos que as amostras no tm a dimenso suficiente, de forma a garantir uma melhor preciso. 4) a falta de preciso da situao 3) acompanhada de um grande enviesamento. Como sugere Moore (1996), fazendo analogia com o que se passa com um atirador que aponta vrias setas a um alvo, em que procurava atingir o centro do alvo, teramos

O estudo de um estimador feito atravs da sua distribuio de amostragem, ou seja, da distribuio dos valores obtidos pelo estimador, quando se consideram todas as amostras possveis. Distribuio de amostragem Distribuio de amostragem de uma estatstica a distribuio dos valores que a estatstica assume para todas as possveis amostras, da mesma dimenso, da populao.

ALEADossis Didcticos

Estatstica Descritiva com Excel Complementos.

30

A forma da distribuio de amostragem, permite-nos verificar se esses valores se distribuem de forma tal, que a sua mdia coincide com o parmetro a estimar caso em que o estimador centrado, e alm disso se apresenta grande ou pequena variabilidade o que faz com que o estimador apresente, respectivamente, menor ou maior preciso. A maior parte das vezes no se consegue obter a distribuio de amostragem exacta, mas temse uma distribuio aproximada, considerando um nmero suficientemente grande de amostras da mesma dimenso e calculando para cada uma delas uma estimativa do parmetro em estudo. *1.3.5 - Qual a dimenso que se deve considerar para a amostra? Outro problema que se levanta com a recolha da amostra o de saber qual a dimenso desejada para a amostra a recolher. Este um problema para o qual, nesta fase, no possvel avanar nenhuma teoria, mas sobre o qual se podem tecer algumas consideraes gerais. Podese comear por dizer que, para se obter uma amostra que permita calcular estimativas suficientemente precisas dos parmetros a estudar, a sua dimenso depende muito da variabilidade da populao subjacente. Por exemplo, se relativamente populao constituda pelos alunos do 10 ano de uma escola secundria, estivermos interessados em estudar a sua idade mdia, a dimenso da amostra a recolher no necessita de ser muito grande j que a varivel idade apresenta valores muito semelhantes, numa classe etria muito restrita. No entanto se a caracterstica a estudar for o tempo mdio que os alunos levam a chegar de casa escola, de forma a obter a mesma preciso que no caso anterior, j a amostra ter de ter uma dimenso maior, uma vez que a variabilidade da populao muito maior. Cada aluno pode apresentar um valor diferente para esse tempo. Num caso extremo, se numa populao a varivel a estudar tiver o mesmo valor para todos os elementos, ento bastaria recolher uma amostra de dimenso 1 para se ter informao completa sobre a populao; se, no entanto, a varivel assumir valores diferentes para todos os elementos, para se ter o mesmo tipo de informao seria necessrio investigar todos os elementos. Chama-se a ateno para a existncia de tcnicas que permitem obter valores mnimos para as dimenses das amostras a recolher e que garantem estimativas com uma determinada preciso exigida partida. Uma vez garantida essa preciso, a opo por escolher uma amostra de maior dimenso, uma questo a ponderar entre os custos envolvidos e o ganho com o acrscimo de preciso. Vem a propsito a seguinte frase (Statistics: a Tool for the Social Sciences, Mendenhall et al., pag. 226): "Se a dimenso da amostra demasiado grande, desperdia-se tempo e talento; se a dimenso da amostra demasiado pequena, desperdia-se tempo e talento". Convm ainda observar que a dimenso da amostra a recolher no directamente proporcional dimenso da populao a estudar, isto , se por exemplo para uma populao de dimenso 1000 uma amostra de dimenso 100 for suficiente para o estudo de determinada caracterstica, no se exige necessariamente uma amostra de dimenso 200 para estudar a mesma caracterstica de uma populao anloga, mas de dimenso 2000, quando se pretende obter a mesma preciso. Como explicava George Gallup, um dos pais da consulta da opinio pblica (Tannenbaum, 1998),: Whether you poll the United States or New York State or Baton Rouge
ALEADossis Didcticos

Estatstica Descritiva com Excel Complementos.

31

(Louisiana) you need the same number of interviews or samples. Its no mystery really if a cook has two pots of soup on the stove, one far larger than the other, and thoroughly stirs them both, he doesnt have to take more spoonfuls from one than the other to sample the taste accurately. Finalmente chama-se a ateno para o facto de que se o processo de amostragem originar uma amostra enviesada, aumentar a dimenso no resolve nada, antes pelo contrrio! *1.3.6 Outros tipos de erros num processo de aquisio de dados Alm dos problemas relacionados com a amostragem e apontados anteriormente existem ainda outras fontes de erros que no esto relacionadas com o mtodo da recolha da amostra nem com a dimenso da amostra, que so os chamados erros de no amostragem. Se, por exemplo, seleccionarmos uma amostra aleatria simples a partir de uma listagem de elementos que no contenha todos os elementos da populao, poderemos obter uma amostra enviesada. Efectivamente, e como j foi referido anteriormente, muitas vezes a recolha da amostra faz-se de uma populao que no a populao que se pretende estudar populao alvo ou populao objectivo, mas sim de outra populao que se pensa representar a primeira populao inquirida. Por exemplo, se se pretende estudar uma determinada caracterstica dos residentes em Lisboa, comum recolher uma amostra seleccionando aleatoriamente alguns nmeros de telefones da lista telefnica de Lisboa, para representar a populao lisboeta. Este processo introduz algum enviesamento, pois existem zonas de Lisboa onde a percentagem de pessoas com telefone pequena. Alm disso, pode acontecer com alguma frequncia telefonarem para casa das pessoas quando elas esto ausentes, no trabalho, pelo que a amostra subestimar a percentagem dos lisboetas que trabalham fora de casa. O exemplo que acabmos de descrever refere-se a um erro de seleco. Na recolha da informao tambm se pode ainda verificar que a informao dada no seja verdadeira. Ao responder a um inqurito o inquirido pode sentir-se condicionado pelo inquiridor, face a determinadas perguntas. Isso poder lev-lo a mentir. Por exemplo ao perguntarem a um indivduo se ele racista, ele pode dizer que no, quando na verdade o . Finalmente, pode-se ter feito um planeamento adequado da amostra a recolher, mas ao recolher a informao de entre os elementos da amostra, a pessoa encarregada dessa recolha pode verse defrontada com a no resposta. Este problema acontece com frequncia quando a amostra constituda por pessoas, das quais algumas das seleccionadas no so encontradas para darem a informao sobre a varivel em estudo, ou ento se recusam a responder. Outro problema que pode surgir devido a erros de processamento que no tm nada a ver com o processo de recolha da amostra, mas que podem influenciar o resultado da estatstica, j que esta calculada com base na informao recolhida. Estes erros surgem com alguma frequncia, sendo muitas vezes detectados por serem outliers. Efectivamente, se ao digitar um conjunto de valores correspondentes a pesos de pessoas adultas aparecer 566 quilogramas, ao fazer uma representao grfica aparecer este valor como outlier e imediatamente se concluir que se trata de um problema de processamento: eventualmente ao carregar a tecla do 6 o tempo de apoio foi um pouco maior e apareceram dois 6.

ALEADossis Didcticos

Estatstica Descritiva com Excel Complementos.

32

1.4 - Estatstica Descritiva e Inferncia Estatstica


Uma vez recolhida a amostra procede-se ao seu estudo. Este consiste em resumir a informao contida na amostra construindo tabelas, grficos e calculando algumas caractersticas amostrais estatsticas. Este estudo descritivo dos dados o objectivo da Estatstica Descritiva. Esta fase a que depende mais da habilidade ou intuio do estatstico (dissemos no incio do captulo que a Estatstica alm de uma cincia, tambm uma arte!). Efectivamente ele vai tentar substituir o conjunto de dados, por um sumrio desses dados de forma a realar a informao que eles contm. Pense-se o que se passa, por analogia, com um texto comprido e repetitivo em que a pessoa se perde na leitura. Um sumrio bem feito do texto, em algumas linhas, dar a informao relevante sobre o texto, que ocupava muito mais linhas. Ao ler o sumrio a pessoa fica rapidamente informada sobre o assunto que trata. O mesmo se passa com os dados, sendo necessrio que o sumrio desses dados seja feito adequadamente de forma a no se perder muita informao, mas tambm de forma a no sumariar to pouco que a pessoa seja submergida por tanta informao! Por exemplo, suponha que perguntou a um aluno se ele foi bom aluno na licenciatura que tirou. Ele responde-lhe com as notas que teve durante os 4 anos que durou a licenciatura:
10 15 11 16 16 15 11 10 12 13 17 16 15 16 16 17 11 13 12 15 14 13 16 16 17 12 15 13 18 14 14 14

Perante estes dados hesitar um pouco, pois no se v facilmente qual o tipo de notas que predomina. No entanto se fizer uma representao grfica muito simples:

10 11 12 13 14 15 16 17 18

** *** *** **** **** ***** ******* *** *

imediatamente concluir que metade das notas so iguais ou superiores a 15, pelo que se pode considerar um aluno bom. Organizmos os dados atravs de uma representao grfica sugestiva, que permitiu realar a informao desejada. Outro processo seria resumir a informao sob a forma de uma medida que se calculava a partir dos dados (estatstica) - a mdia, que viria igual a 14.2. Seguidamente, o objectivo de um estudo estatstico, , de uma maneira geral, o de estimar uma quantidade ou testar uma hiptese, utilizando-se tcnicas estatsticas convenientes, as quais realam toda a potencialidade da Estatstica, na medida em que vo permitir tirar concluses

ALEADossis Didcticos

Estatstica Descritiva com Excel Complementos.

33

acerca de uma Populao, baseando-se numa pequena amostra, dando-nos ainda uma medida do erro cometido. A esta fase chamamos Inferncia Estatstica. Esta quantificao do erro cometido, ao transportar para a populao as propriedades verificadas na amostra, feita utilizando a Probabilidade. Efectivamente, nesta fase do processo estatstico que temos necessidade de entrar com este conceito, para quantificar a incerteza associada aos procedimentos aqui considerados. Repare-se que ao transportar para a populao uma propriedade verificada na amostra no podemos dizer que essa propriedade verdadeira porque no a verificamos em todos os elementos da populao, mas tambm no podemos dizer que falsa, pois a propriedade foi verificada por alguns elementos da populao a mostra. Assim, estamos numa situao entre o que verdadeiro e falso, caracterizada por uma incerteza, a qual medida com a utilizao da probabilidade. Exemplo 1.4.1 - O Senhor X, candidato Cmara da cidade do Porto, pretende saber, qual a percentagem de eleitores que pensam votar nele nas prximas eleies. Havendo algumas limitaes de tempo e dinheiro, a empresa encarregada de fazer o estudo pretendido decidiu recolher uma amostra de dimenso 1000, perguntando a cada eleitor se sim ou no pensava votar no Senhor X. Como resultado da amostragem obteve-se um conjunto de sim's e no's, cujo aspecto no muito agradvel, pois primeira vista no conseguimos concluir nada:

Sim No Sim Sim

No Sim

Procede-se reduo dos dados, resumindo a informao sobre quantos sim's se obtiveram, chegando-se concluso que nas 1000 respostas, 635 foram afirmativas. Ento dizemos que a percentagem de eleitores que pensam votar no candidato, de entre os inquiridos, de 63.5%. A funo da Estatstica Descritiva acabou aqui! (Se toda a Populao tivesse sido inquirida, este estudo descritivo dar-nos-ia a informao necessria para o fim em vista). Poderemos agora inferir que 63.5% dos eleitores da cidade do Porto pensam votar no Senhor X? A resposta a esta pergunta nem sim, nem no, mas talvez. agora que temos necessidade de utilizar o conceito de Probabilidade, para quantificar a incerteza associada inferncia. Assim, existem processos de inferncia estatstica que, do resultado obtido a partir da amostra, nos permitiro concluir que o intervalo [60.5%, 66.5%] contm o valor exacto para a percentagem de eleitores da cidade que pensam votar no Senhor X, com uma confiana de 95%. Observao - A confiana de 95% deve ser entendida no seguinte sentido: se se recolherem 100 amostras, cada uma de dimenso 1000, ento poderemos construir 100 intervalos; destes 100 intervalos esperamos que 95 contenham o verdadeiro valor da percentagem (desconhecida) de eleitores da cidade do Porto, que pensam votar no candidato. Como ao fazer um estudo s se recolhe uma amostra, no sabemos se a nossa uma das que deu origem a um dos intervalos que continha o parmetro. Estamos confiantes que sim! Recorde-se a forma como as previses so dadas, em noite de eleies, sob a forma de intervalos. Por vezes a guerra de audincias faz com que estas previses tenham pouco sentido,
ALEADossis Didcticos

Estatstica Descritiva com Excel Complementos.

34

por apresentarem intervalos com uma to grande amplitude que a sua preciso, como estimativas das percentagens pretendidas, muito pequena. Esta situao prende-se com o facto de as amostras utilizadas para a construo dos intervalos terem uma dimenso muito reduzida, havendo assim muito pouca informao disponvel (recorde-se o que dissemos anteriormente sobre o processo para aumentar a preciso). No entanto, medida que a noite vai avanando, os intervalos vo diminuindo de amplitude, estando esta diminuio da amplitude relacionada com a dimenso da amostra que entretanto vai aumentando, at finalmente estarem todos os votos contados. Nesta altura, os intervalos reduzem-se a pontos, que so as percentagens pretendidas - a amostra constituda por toda a populao. O seguinte esquema pretende resumir as diferentes etapas que normalmente so seguidas num procedimento estatstico:

Produo de dados Populao Amostra

Caractersticas populacionais parmetros

Estatstica Descritiva
Estudo da amostra:

Estatstica Indutiva

- tabelas - grficos - medidas -

Caractersticas amostrais estatsticas

No esquema anterior a necessidade de utilizar o conceito de probabilidade faz-se sentir ao passarmos das propriedades estudadas na amostra para as propriedades na populao, sendo aqui precisamente que vai ser necessrio invocar o princpio da aleatoriedade. Chama-se a ateno para que a compreenso do processo estatstico permitir-nos- interpretar melhor as notcias que, frequentemente, se lem nos jornais ou ouvem na televiso. Por vezes alguns estudos sobre os mesmos assuntos, apresentam resultados contraditrios! Isto acontece nomeadamente no estudo de certos aspectos do comportamento humano, utilizando testes psicolgicos, ou no estudo de certas doenas utilizando cobaias. Muitas das inferncias feitas so imperfeitas, a maior parte das vezes por terem como base dados imperfeitos.

ALEADossis Didcticos

Vous aimerez peut-être aussi