Vous êtes sur la page 1sur 14

Estatstica

1.Populao e Amostra. Censo e sondagem


"Cincia que dispe de processos apropriados para recolher, organizar, classificar, apresentar e interpretar
conjuntos de dados"

A estatstica fornece-nos as tcnicas para extrair informao de dados, os quais so


muitas vezes incompletos, na medida em que nos do informao til sobre o problema
em estudo, no realando, no entanto, aspectos importantes.
objectivo da Estatstica extrair informao dos dados para obter uma melhor
compreenso das situaes que representam.
Uma vez os dados recolhidos, sob a forma de uma amostra, faz-se a reduo e
representao desses dados, utilizando as tabelas e os diferentes tipos de grficos,
sendo um dos principais objectivos desta fase, a identificao da estrutura
subjacente aos dados, deixando de lado a aleatoriedade presente.
Seguidamente o objectivo do estudo estatstico pode ser o de estimar uma quantidade
ou testar uma hiptese, utilizando-se tcnicas estatsticas convenientes, as quais
realam toda a potencialidade da Estatstica, na medida em que vo permitir tirar
concluses acerca de uma populao, baseando-se numa pequena amostra, dando-nos
ainda uma medida do erro cometido.
1.1. Populao e Amostra
1.1.1. Populao

Coleco de unidades individuais, que podem ser pessoas ou resultados


experimentais, com uma ou mais caractersticas comuns, que se pretendem
estudar.
Exemplo 1: Relativamente populao constituda pelos alunos do 10 ano de
escolaridade matriculados na Escola Secundria dos Olivais n 2, podemos estar
interessados em estudar as seguintes caractersticas populacionais:

- Altura (em cm) dos alunos:


Depois de medir a altura de cada aluno, obteramos um conjunto de
dados com o seguinte aspecto:
145, 161, 158, 156, 146, ... ,140, 139, 162
- Notas obtidas na disciplina de Portugus, no 1 perodo:
10, 15, 13, 16, 9, 11, 10, ... , 18, 11, 13, 8

Exemplo 2: Conjunto das temperaturas (em graus), num


determinado dia s 9h, em todas as cidades da Europa:
12 ,8, 15, 4, 10, 11, 13, 12, ... , 14, 12, 10, 11

Por vezes, identifica-se Populao com a caracterstica


populacional que se pretende estudar.
Relativamente ao exemplo 1, falamos da
- Populao das alturas dos alunos do ...
- Populao das notas em Portugus no 1 ...
Relativamente ao exemplo 2, falamos da
- Populao das temperaturas s 9h ...

Nem sempre possvel estudar exaustivamente todos os elementos da


populao!
Porqu?
- Pode a populao ter dimenso infinita
Exemplo: Populao constituida pelas presses atmosfricas, nos
diferentes pontos de uma cidade.
- Pode o estudo da populao levar destruio da populao
Exemplo: Populao dos fsforos de uma caixa.
- Pode o estudo da populao ser muito dispendioso
Exemplo: Sondagens exaustivas de todos os eleitores, sobre determinado candidato

1.1.2. Amostra
Quando no possvel estudar, exaustivamente, todos os elementos da populao,
estudam-se s alguns elementos, a que damos o nome de Amostra.

Conjunto de dados ou observaes, recolhidos a partir de um subconjunto da


populao, que se estuda com o objectivo de tirar concluses para a populao de
onde foi recolhida.

importante a fase de recolha da amostra?


Sim, pois a amostra deve ser to representativa quanto possvel da Populao que se
pretende estudar, uma vez que vai ser a partir do estudo da amostra, que vamos tirar
concluses para a Populao.

Quando a amostra no representa corretamente a populao diz-se enviesada e a sua


utilizao pode dar origem a interpretaes erradas, como se sugere nos seguintes
exemplos:
- Utilizar uma amostra constituda por 10 benfiquistas, para prever o vencedor do
prximo Benfica-Sporting.
- Utilizar uma amostra constituda pelos leitores habituais de determinada revista
especializada, para tirar concluses sobre a populao geral.
1.2. Recenseamento e sondagem
1.2.1-Recenseamento
O termo recenseamento est, em regra geral, associado contagem oficial e peridica
dos indivduos de um Pas, ou parte de um Pas. Ele abrange, no entanto, um leque mais
vasto de situaes. Assim, pode definir-se recenseamento do seguinte modo:

estudo cientfico de um universo de pessoas, instituies ou objectos fsicos com


o propsito de adquirir conhecimentos, observando todos os seus elementos, e
fazer juzos quantitativos acerca de caractersticas importantes desse universo.

Para a maioria das pessoas a palavra recenseamento ou censo encontra-se associada


enumerao dos elementos da populao de um Pas. Em Portugal, de dez em dez anos,
realiza-se o Recenseamento Geral da Populao. O ltimo ocorreu em 2001,
encontrando-se disponveis na Internet (Infoline - Servio de Informao On Line do
INE) os resultados desses censos - Censos 2001.

1.2.2. Sondagem
Por vezes no vivel nem desejvel, principalmente quando o nmero de elementos da
populao muito elevado, inquirir todos os seus elementos sempre que se quer
estudar uma ou mais caractersticas particulares dessa populao.
Assim surge o conceito de sondagem, que se pode tentar definir como:

estudo cientfico de uma parte de uma populao com o objectivo de estudar


atitudes, hbitos e preferncias da populao relativamente a acontecimentos,
circunstncias e assuntos de interesse comum.

fundamental referir que, contrariamente ao recenseamento, as sondagens inquirem


ou analisam apenas uma parte da populao em estudo, isto , restrinjem-se a uma
amostra dessa populao, mas com o objectivo de extrapolar para todos os elementos
da populao os resultados observados na amostra.

2- Fases de um estudo estatstico.


2.1. Estatistica descritiva e estatistica indutiva
De acordo com o que dissemos anteriormente, numa anlise estatstica distinguem-se
essencialmente duas fases:
Uma primeira fase em que se procura descrever e estudar a amostra:
Estatstica Descritiva
e uma segunda fase em que se procura tirar concluses para a populao:
Estatstica Indutiva
Esquematicamente, temos:

Resumindo, podemos dizer que uma anlise estatstica envolve duas fases
fundamentais, com objectivos distintos:
1 Fase Estatstica Descritiva Procura-se descrever a amostra, pondo em evidncia
as caractersticas principais e as propriedades.
2 Fase Estatstica Indutiva ou Inferncia Estatstica Conhecidas certas
propriedades (obtidas a partir de uma anlise descritiva da amostra), expressas por
meio de proposies, imaginam-se proposies mais gerais, que exprimam a existncia
de leis (na populao).
No entanto, ao contrrio das proposies deduzidas, no podemos dizer que so falsas
ou verdadeiras, j que foram verificadas sobre um conjunto restrito de indivduos, e
portanto no so falsas, mas no foram verificadas para todos os indivduos da
Populao, pelo que tambm no podemos afirmar que so verdadeiras !
Existe, assim, um certo grau de incerteza (percentagem de erro) que medido em
termos de Probabilidade

2.2. Campos de aplicao

"Os campos de aplicao da Estatstica so muitos e os mais


variados."
Estudos de mercado
O gerente de uma fbrica de detergentes pretende lanar
um novo produto para lavar a loia, pelo que, encarrega
uma empresa especialista em estudos de mercado de
"estimar" a percentagem de potenciais compradores desse
produto.
Populao: conjunto de todos os agregados familiares do
Pas
Amostra: conjunto de alguns agregados familiares, inquiridos pela empresa
Problema: pretende-se, a partir da percentagem de respostas afirmativas, de entre
os inquiridos sobre a compra do novo produto, obter uma estimativa do nmero de
compradores na Populao.
Medicina
Pretende-se estudar o efeito de um novo medicamento para curar
determinada doena. seleccionado um grupo de 20 doentes,
administrando-se o novo medicamento a 10 desses doentes
escolhidos ao acaso e o medicamento habitual aos restantes.
Populao conjunto de todos os doentes com a doena que o medicamento a estudar
pretende tratar.
Amostra: conjunto dos 20 doentes seleccionados
Problema: pretende-se, a partir dos resultados obtidos, realizar um "teste de
hipteses" para tomar uma deciso sobre qual dos medicamentos melhor.

Controle de Qualidade
O administrador de uma fbrica de parafusos pretende assegurar-se de
que a percentagem de peas defeituosas no excede um determinado valor,
a partir do qual determinada encomenda poderia ser rejeitada.
Populao: conjunto de todos os parafusos fabricados ou a fabricar pela
fbrica, utilizando o mesmo processo.
Amostra: conjunto de parafusos escolhidos ao acaso de entre o lote de produzidos
Problema: pretende-se, a partir da percentagem de parafusos defeituosos presentes
na amostra, "estimar" a percentagem de defeituosos em toda a produo.
5

Pedagogia
Um conjunto de pedagogos desenvolveu uma tcnica nova para a
aprendizagem da leitura, na escola primria, a qual, segundo dizem,
encurta o tempo de aprendizagem relativamente ao mtodo
tradicional.
Populao: conjunto de todos os alunos que entram para a escola
primria, sem saber ler.
Amostra: conjunto de alunos de algumas escolas seleccionadas para este estudo. Os
alunos foram separados em dois grupos para se aplicarem as duas tcnicas em
confronto.
Problema: do estudo da amostra, decidir qual a tcnica melhor.

3. Organizao e apresentao de dados


Podemos classificar os dados que constituem a Amostra, ou dados amostrais, em dois
tipos fundamentais:
3.1.Dados qualitativos e dados quantitativos
3.1.1-Dados qualitativos Representam a informao que identifica alguma

qualidade, categoria ou caracterstica, no susceptvel de medida, mas de


classificao, assumindo vrias modalidades.
Exemplo: O estado civil de um indivduo um dado qualitativo, assumindo as
categorias: Solteiro, casado, vivo e divorciado.
Os dados qualitativos so organizados na forma de uma tabela de frequncias que
apresenta o nmero de elementos - frequncia absoluta (ou s frequncia) de cada
uma das categorias ou classes.
Numa tabela de frequncias, alm das frequncias absolutas, tambm se apresentam
as frequncias relativas, onde

Dimenso da amostra ? Nmero de elementos da amostra.

3.1.2-Dados quantitativos

Representam a informao resultante de caractersticas susceptveis de serem


medidas, apresentando-se com diferentes intensidades, que podem ser de
natureza discreta (descontnua) - dados discretos, ou contnua - dados contnuos.
Exemplo: Consideremos uma amostra constituda pelo n de irmos de 10 alunos de
uma determinada turma :
3, 4, 1, 1, 3, 1, 0, 2, 1, 2
Estes dados so de natureza discreta.
Se para os mesmos alunos considerarmos as alturas (cm):
153, 157, 161, 160, 158, 155, 162, 156, 152, 159
obteremos dados do tipo contnuo.

3.2. Dados discretos e dados contnuos


3.2.1. Dados discretos
Estes dados s podem tomar um nmero finito ou infinito numervel de valores distintos, apresentando vrios valores
repetidos - o caso, por exemplo, do n de filhos de uma famlia ou do n de acidentes, por dia, em determinado
cruzamento.

Os
dados
so
organizados na forma de
uma
tabela
de
frequncias, anloga construda para o caso dos dados
qualitativos. No entanto, em vez das categorias
apresentam-se os valores distintos da amostra, os quais
vo constituir as classes.
Como organizar os dados?

Representao grfica que consiste em marcar num sistema


de eixos coordenados, no eixo dos xx o valor das classes e
nesses pontos barras verticais de altura igual frequncia
absoluta ou frequncia relativa.
Diagrama de barras
ou
Distribuio de frequncias

Obter-se- um grfico com o aspecto seguinte:

A linha a tracejado, que une os extremos das barras, chama-se


Polgono de Frequncias
7

3.2.2. Dados contnuos


No caso de uma varivel contnua, esta pode tomar todos os valores numricos, inteiros ou no,
compreendidos no seu intervalo de variao - temos por exemplo o peso, a altura, etc...
Como organizar os dados?
Enquanto que no caso de dados discretos, a construo da tabela de frequncias no
apresenta qualquer dificuldade, no caso das variveis contnuas o processo um pouco
mais elaborado, distinguindo-se certas etapas principais, que se descrevem nas
pginas seguintes...
Construo da tabela de frequncias, de uma amostra de dados contnuos

Para exemplificar o processo descrito a seguir, utilizaremos a amostra de notas


obtidas num ponto de Matemtica de
uma determinada turma:
12.1 8.9 16.2 8.2 9.8 15.1 14.5 13.4 14.7 7.5 8.8 12.4 16.1
15.2 13.5 14.6 15.5 7.8 12.5 13.2 11.0 10.5
1 Definio das classes
a) Determinar a amplitude da amostra, isto , a diferena entre o valor mximo e o
valor mnimo
No caso da amostra considerada, amplitude = 16.2 - 7.5 = 8.7
b) Dividir essa amplitude pelo nmero k de classes pretendido; tomar para essa
amplitude de classe h um valor aproximado por excesso do valor anteriormente
obtido.
No caso da amostra considerada, k=5,
h = 8.7 / 5 = 1.74 1.8
c) Construir as classes de modo que tenham todas a mesma amplitude e cuja unio
contenha todos os elementos da amostra.
Uma metodologia a seguir para construir as classes Ci = [ci , ci+1[ poder ser a
seguinte:
A primeira classe C1

As outras classes Ci
sero

ser
C1 = [c1, c2[ = [mn. da
amostra, mn. da amostra + h[

Ci = [ mn. amostra + ( i - 1) x h , mn. amostra + i x h [


com i=1,2,...,k

No caso da amostra dada temos:


C1=[7.5, 9.3[ ; C2=[9.3, 11.1[ ; C3=[11.1, 12.9[ ; C4=[12.9, 14.7[ ; C5=[14.7, 16.5[
Conta-se o nmero de elementos da amostra, que pertencem a cada classe.
Analogamente ao que foi considerado no caso dos dados discretos, esses valores sero
as frequncias absolutas das classes. No caso da amostra dada

Classe

Freq Absoluta

[7.5, 9.3[

[9.3, 11.1[

[11.1, 12.9[

[12.9, 14.7[

[14.7, 16.5[

Quantas classes se devem considerar, para fazer a reduo de um conjunto de


dados?
Qual o valor de k ?
Existe uma regra emprica, que nos d um valor aproximado para o nmero de classes
que se devem considerar e que a seguinte:
2k

Para uma amostra de dimenso n, k o menor inteiro tal que:

Exemplo:
Os dados seguintes (que se encontram ordenados) referem-se ao tempo de vida (em
anos) de 50 doentes que nasceram com uma certa doena rara:
0.8

1.7

2.5

4.8

9.7

16.2

23.5

28.1

23.2

45.0

0.9

1.9

2.6

6.3

13.5

18.2

23.6

29.7

36.6

45.1

1.0

2.0

2.6

6.9

13.5

18.2

23.7

30.9

36.7

61.7

1.1

2.0

3.2

7.6

14.4

20.7

27.1

31.2

38.0

66.4

1.1

2.4

3.5

9.0

15.5

21.8

27.6

31.7

40.2

67.4

Dimenso da amostra: 50
De acordo com a regra emprica apresentada anteriormente teramos:

Podemos escolher para amplitude da classe h=10 ( mais sugestivo considerar


intervalos com amplitude de 10 anos do que um valor prximo do sugerido).
9

Representao grfica de dados contnuos


Histograma

Para a representao grfica de dados contnuos, usa-se um diagrama de reas ou


histograma, formado por uma sucesso de rectngulos adjacentes, tendo cada um por
base um intervalo de classe e por rea a frequncia relativa (ou a frequncia
absoluta).
Deste modo a rea total ser igual a 1 (resp. igual a n, a dimenso da amostra).
representao obtida ter o seguinte aspecto:

Funo Cumulativa
Para representar graficamente as frequncias acumuladas considera-se a funo
cumulativa cuja construo se exemplifica a seguir:

- Antes do limite inferior da 1 classe, isto o ponto 0, a frequncia acumulada nula,


pelo que se traa um segmento de recta sobre o eixo dos xx, at esse ponto.
- No limite inferior da 2 classe, isto o ponto 10, a frequncia acumulada a
frequncia da classe anterior, ou seja 0.42. Agora, admitindo que a frequncia se
distribui uniformemente sobre o intervalo da classe, unimos o ponto (0,0) com o ponto
(10, 0.42).
- No limite inferior da 3 classe, a frequncia acumulada a soma das frequncias das
duas classes anteriores, sendo portanto 0.56. Ento, unimos o ponto (10, 0.42) com o
ponto 20, 0.56).
- Quando chegarmos ltima classe, temos a garantia que a frequncia acumulada
correspondente ao seu limite superior igual a 1, pelo que nesse ponto marcamos 1 e
continuamos com um segmento de recta paralelo ao eixo dos xx.
Pode-se chamar a ateno para algumas propriedades da funo cumulativa, tal como
foi construda:

10

- Est definida para todo o x real;


- sempre no decrescente;
- S assume valores no intervalo [0, 1]
A partir da representao grfica anterior possvel, por exemplo, saber qual o valor
aproximado da varivel tempo de vida a que corresponde uma frequncia relativa
acumulada igual a 50%.

Uma vez que se admite que a frequncia se distribui uniformemente sobre a amplitude
de classe, isto , a frequncia 0.14 (=0.56-0.42) distribui-se uniformemente sobre o
intervalo de amplitude 10, atravs da resoluo de uma equao de proporcionalidade,
obtm-se o ponto que andvamos procura

Ento o valor procurado 10 + 5.71 = 15.71


Ao valor obtido anteriormente, a que corresponde uma frequncia acumulada de 50%,
chamamos mediana. A mediana divide a distribuio das frequncias em duas partes
iguais, j que 50% dos dados so menores ou iguais a ela e os restantes 50% so
maiores ou iguais a ela. Recordamos que a tcnica utilizada permitiu-nos obter um
valor aproximado para a mediana, e no o valor exacto da mediana do conjunto de
dados originais, antes de proceder ao agrupamento. Mais frente, quando falarmos de
medidas de localizao, veremos como determinar a mediana a partir dos dados, sem
estarem agrupados.

Diagrama de caule-e-folhas

um tipo de representao que se pode considerar entre a tabela e o grfico, uma vez que so apresentados os
verdadeiros valores da amostra, mas numa apresentao sugestiva, que faz lembrar um histograma.
Consiste em escrever do lado esquerdo de uma linha vertical o dgito (ou dgitos) da classe de
maior grandeza, seguidos dos restantes. A representao obtida ter o seguinte aspecto:

11

Exemplo: Num determinado teste realizado a 50 estudantes, obtiveram-se as


seguintes pontuaes:
75 98 42 75 84 87 65 59 63 86 78 37 99 66 90 79 80 89 68 57
95 55 79 88 76 60 77 49 92 83 71 78 53 81 77 58 93 85 70 62
80 74 69 90 62 84 64 73 48 72

Fazer uma representao em caule-e-folhas destes dados.

Por vezes, utiliza-se o "caule" horizontal, em vez de ser vertical. Este processo torna
mais aparente a semelhana entre um histograma e uma representao em caule-efolhas.
Caule
vertical

Caule
horizontal

Que caracterstica que se pretende realar, quando se representa um conjunto de dados sob a
forma de um histograma ou dum caule-e-folhas?

Dada uma amostra, o aspecto do histograma reflete a forma da distribuio da


Populao subjacente aos dados observados!
Este um dos aspectos da reduo dos dados, em que se perde alguma informao
contida nesses dados, mas em contrapartida obtemos a estrutura da Populao, que
eles pretendem representar.

12

Distribuies caractersticas
Alguns histogramas apresentam formas que, pela frequncia com que surgem,
merecem referncia especial. Assim, as distribuies mais comuns apresentadas
pelos dados so:
a. Distribuies simtricas A distribuio das frequncias faz-se de forma

aproximadamente simtrica, relativamente a uma classe mdia:

Caso especial de uma distribuio simtrica

Um caso especial de uma distribuio simtrica aquele que sugere a forma de um


"sino" e que apresentado por amostras provenientes de Populaes "Normais". O
significado deste termo ser explicado mais tarde, no mbito das Probabilidades
b. Distribuies enviesadas A distribuio das frequncias faz-se de forma

acentuadamente assimtrica, apresentando valores substancialmente mais


pequenos num dos lados, relativamente ao outro:

c. Distribuies com "caudas" longas

A distribuio das frequncias faz-se de tal forma que existe um grande


nmero de classes nos extremos, cujas frequncias so pequenas,
relativamente s classes centrais:

d. Distribuies com vrios "picos" ou modas

A distribuio das frequncias apresenta 2 ou mais "picos" a que chamamo


modas, sugerindo que os dados so constitudos por vrios grupos distintos:

13

Exemplos de distribuies caractersticas:

14

Vous aimerez peut-être aussi